8. Elementare Zeitreihenanalyse Situation: Die Stichprobenwerte yi eines Merkmals Y werden im Zeitablauf, also zu bestimmten Zeitpunkten ti , i = 1,…, n, beobachtet. → Zeitreihe In wirtschaftlichen Anwendungen wird häufig unterstellt, dass sich die Beobachtungswerte yi einer Zeitreihe aus vier Komponenten zusammensetzen: Trendkomponente Konjunkturkomponente (zyklische Komponente) Saisonkomponente Zufallskomponente (irreguläre Restkomponente) Häufig werden die Trendkomponente und die Konjunkturkomponente zusammengefasst zur so genannten glatten Komponente. 8. Elementare Zeitreihenanalyse - 68 - Die Komponenten einer Zeitreihe: mi = Trendkomponente zeigt die langfristige Entwicklung. Der Verlauf ist, bedingt durch langfristige Ursachen, entweder wachsend, gleich bleibend oder fallend. Beispiel: Das Bruttosozialprodukt ist in Deutschland tendenziell immer gestiegen. ki = Konjunkturkomponente besitzt einen wellenförmigen Verlauf, der in mehrjährigen Abständen wiederkehrt. Beispiel: Konjunkturschwankungen sind die Hauptursache für den unterschiedlich starken Zuwachs des Bruttosozialprodukts. gi = mi + ki = Glatte Komponente gibt den fiktiven Verlauf der Zeitreihe bei Fehlen saisonaler und Restschwankungen an. 8. Elementare Zeitreihenanalyse - 69 - si = Saisonkomponente besitzt ebenfalls einen wellenförmigen Verlauf, der meistens durch einen periodischen jahreszeitlichen Einfluss bedingt wird. Beispiel: Arbeitslosenzahlen, die durch witterungsbedingte Einschränkungen bestimmter Produktionstätigkeiten schwanken. zi = Zufallskomponente ist das Ergebnis kurzfristiger, sich unregelmäßig verändernder Ursachen. Beispiel: Streiks, Naturkatastrophen, plötzliche Erhöhung der Energiepreise, usw. Für das Zusammenwirken der einzelnen Komponenten einer Zeitreihe wird in der Regel ein additiver Ansatz gewählt. → Additive Zeitreihenmodell yi = mi + ki + si + zi , i = 1,..., n ( = g i + si + zi ) 8. Elementare Zeitreihenanalyse - 70 - Beispiel: Anzahl von erbeuteten Autoradios yi pro Arbeitstag eines Autoknackers über fünf Wochen: ti yi Wochentag ti yi Wochentag 1 2 3 4 5 6 7 8 9 10 3 6 8 7 3 7 9 7 5 10 Do. Fr. Sa. So. Do. Fr. Sa. So. Do. Fr. 11 12 13 14 15 16 17 18 19 20 13 10 6 12 12 8 10 15 16 14 Sa. So. Do. Fr. Sa. So. Do. Fr. Sa. So. Anzahl erbeutete Autoradios 20 15 10 5 0 0 5 10 15 20 Tag 8. Elementare Zeitreihenanalyse - 71 - Trendbestimmung durch gleitende Durchschnitte Voraussetzung: Die Zeitreihenwerte liegen in Form von p Perioden vor (z.B. Quartalsdaten: p = 4) Aus den Zeitreihenwerten yi werden durch Hinzunahme der jeweils „p/2“ linken und rechten Nachbarn von yi und anschließender Durchschnittsbildung neue Zeitreihenwerte konstruiert. Ist p = 2m + 1, also p ungerade, dann ist für i = m + 1,…, n – m der gleitende Durchschnitt der Ordnung p gegeben durch: y yi m 1 ... yi ... yi m 1 yi m ~ yi( 2 m 1) i m . 2m 1 Ist p = 2m, also p gerade, dann ist für i = m + 1,…, n – m der gleitende Durchschnitt der Ordnung p gegeben durch: ~ yi( 2 m ) 1 2 yi m yi m 1 ... yi ... yi m 1 12 yi m 2m . Beispiele: Gleitender 3er-Durchschnitt (Anwendung bei Dritteljahresdaten): y y yi 1 ~ yi(3) i 1 i . 3 Gleitender 4er-Durchschnitt (Anwendung bei Quartalsdaten): ~ yi( 4) 1 2 yi 2 yi 1 yi yi 1 12 yi 2 4 . Gleitender 12er-Durchschnitt (Anwendung bei Monatsdaten): ~ yi(12) 1 2 yi 6 yi 5 ... yi 5 12 yi 6 12 8. Elementare Zeitreihenanalyse . - 72 - Originaldaten und gleitende 4er- Durchschnitte ti yi ~ yi(4) ti yi ~ yi(4) 1 2 3 4 5 6 7 8 9 10 3 6 8 7 3 7 9 7 5 10 6,000 6,125 6,375 6,500 6,750 7,375 8,250 9,125 11 12 13 14 15 16 17 18 19 20 13 10 6 12 12 8 10 15 16 14 9,625 10,000 10,125 9,750 10,000 10,875 11,750 13,000 - Anzahl erbeutete Autoradios 20 Originalzeitreihe gleitender Viererdurchschnitt 15 10 5 0 0 5 10 15 20 Tag Die Differenz der Originaldaten und der gleitenden Durchschnitte yi ~ yi ~ si ~ bilden die trendbereinigte Zeitreihe ( si ). 8. Elementare Zeitreihenanalyse - 73 - Originaldaten, gleitende Durchschnitte und trendbereinigte Zeitreihe ti ~ yi(4) ~ si yi ~ yi( 4) ti yi ~ yi(4) ~ si yi ~ yi( 4) 6,000 6,125 6,375 6,500 6,750 7,375 8,250 9,125 2,000 0,875 -3,375 0,500 2,250 -0,375 -3,250 0,875 11 12 13 14 15 16 17 18 19 20 13 10 6 12 12 8 10 15 16 14 9,625 10,000 10,125 9,750 10,000 10,875 11,750 13,000 - 3,375 0,000 -4,125 2,250 2,000 -2,875 -1,750 2,000 - yi 1 3 2 6 3 8 4 7 5 3 6 7 7 9 8 7 9 5 10 10 Anzahl erbeutete Autoradios 20 Originalzeitreihe gleitender Viererdurchschnitt trendbereinigte Zeitreihe 15 10 5 0 -5 0 5 10 15 20 Tag Aus den trendbereinigten Daten der jeweiligen Periode j , j = 1,…, p, wird das arithmetische Mittel ( s j ) berechnet. Die typische Saisonfigur ist dann 1 p sˆ j s j s j . p j 1 8. Elementare Zeitreihenanalyse - 74 - Ermittlung der typischen Saisonbewegung (Saisonfigur) und der saisonbereinigten Zeitreihenwerte ~ si yi ~ yi( 4) yi ~ yi(4) Do. Fr. Sa. So. 3 6 8 7 6,000 6,125 Do. Fr. Sa. So. 3 7 9 7 6,375 -3,375 6,500 6,750 7,375 Do. Do. 5 8,250 -3,250 Fr. 10 9,125 Sa. 13 9,625 So. 10 10,000 Do. 6 10,125 -4,125 Fr. 12 9,750 Sa. 12 10,000 So. 8 10,875 Do. Fr. Sa. So. 10 11,750 -1,750 15 13,000 16 14 - sj Fr. Sa. So. ~ yi* yij sˆ j ŝ j 4 Perioden ( j = 1, 2, 3, 4 ) ŝ j sj 1 p sj ~ yi* yij sˆ j 0,875 -3,1484375 1,3828125 2,3828125 -0,6171875 6,1484375 4,6171875 5,6171875 7,6171875 -0,375 -3,1484375 1,3828125 2,3828125 -0,6171875 6,1484375 5,6171875 6,6171875 7,6171875 -3,1484375 1,3828125 2,3828125 8,1484375 8,6171875 10,6171875 0,000 -0,6171875 10,6171875 -2,875 -3,1484375 1,3828125 2,3828125 -0,6171875 9,1484375 10,6171875 9,6171875 8,6171875 -3,1484375 1,3828125 2,3828125 -0,6171875 13,1484375 13,6171875 13,6171875 14,6171875 2,000 0,500 2,250 0,875 3,375 2,250 2,000 2,000 : -3,125 1,40625 2,40625 -0,59375 8. Elementare Zeitreihenanalyse 14 s j = 0,0234375 - 75 - Originaldaten und saisonbereinigte Zeitreihe Anzahl erbeutete Autoradios 20 Originalzeitreihe saisonbereinigte Zeitreihe 15 10 5 0 0 5 10 15 20 Tag Trendbestimmung mittels linearer Regression ( ~yi* b0 b1ti ui ): ti ~y * i ti ~y * i ti ~y * i 1 2 6,1484375 4,6171875 6 7 5,6171875 6,6171875 11 12 10,6171875 10,6171875 3 5,6171875 8 7,6171875 13 4 7,6171875 9 8,1484375 14 9,1484375 10,6171875 5 6,1484375 10 8,6171875 15 9,6171875 ti ~y * i 16 8,6171875 17 13,1484375 18 13,6171875 19 13,6171875 20 14,6171875 Schätzung der KQ-Parameter: bˆ0 4,202 und bˆ1 0,462 ( R 2 0,841 ) KQ-Schätzung für die glatte Komponente: Geschätzte Zeitreihenwerte: gi 4,202 0,462 ti yˆ ij gˆ i sˆ j 8. Elementare Zeitreihenanalyse - 76 - Zusammenfassung Originalzeitreihe und gleitende Durchschnitte Originalzeitreihe 20 20 15 15 10 5 0 10 10 15 20 0 0 0 0 15 15 20 15 -5 0 5 5 10 15 15 Originalzeitreihe geschätzte Zeitreihe 10 5 20 20 Original und Schätzung 20 geschätzte glatte Komponente 10 10 0 Saisonbereinigte Zeitreihe und 20 10 5 5 -5 5 Typische Saisonfigur Trendbereinigte Zeitreihe 5 5 5 0 0 0 5 10 15 20 0 0 5 10 8. Elementare Zeitreihenanalyse 15 20 - 77 - Beliebter Fehler: 20 Originalzeitreihe gleitender Viererdurchschnitt trendbereinigte Zeitreihe saisonbereinigte Zeitreihe geschätzte Zeitreihe typische Saisonfigur 15 10 5 0 -5 0 5 10 15 8. Elementare Zeitreihenanalyse 20 - 78 - Ex-post-Analyse zur Überprüfung der Güte der Zeitreihenschätzung Beispiel: Monatlicher Bierausstoß einer Brauerei (in 1000 hl) von 1995 bis 1999 (also über fünf Jahre) Monat Jahr 1 2 3 4 5 6 7 8 9 10 11 12 1995 1996 1997 1998 1999 61 61 65 71 66 57 65 66 65 67 67 71 76 70 73 75 78 76 82 82 73 79 85 83 84 87 80 87 83 94 82 88 87 91 95 79 86 90 88 85 76 75 75 82 79 69 70 75 75 74 67 69 71 66 75 77 77 71 81 80 100 Monatlicher Bierausstoß 90 80 70 60 50 0 12 24 36 48 60 Monat Vorgehensweise: Schätze die Zeitreihe auf Basis der ersten vier Jahre und vergleiche die Prognose für das fünfte Jahr mit den Originaldaten. 8. Elementare Zeitreihenanalyse - 79 - Jahr Monat 1995 1996 1997 1998 yi ~ yi(12) yi ~ yi(12) yi ~ yi(12) yi ~ yi(12) 1 2 61 57 - 61 65 73,917 76,625 71 65 77,083 74,458 65 66 3 67 - 71 74,708 76 70 4 75 - 78 76 82 77,667 5 73 - 79 74,708 74,833 76,917 77,125 77,167 77,375 85 77,417 83 77,458 6 87 - 80 74,917 87 77,250 83 77,667 7 82 72,500 88 75,083 87 77,250 91 - 8 79 72,833 86 75,292 90 77,458 88 - 9 76 73,333 75 75,542 75 77,167 82 - 10 69 73,625 70 75,667 75 77,167 75 - 11 67 74,000 69 75,833 71 77,333 66 - 12 77 73,958 77 76,375 71 77,083 81 - 76,750 100 Monatlicher Bierausstoß Originalzeitreihe Gleitender 12-er Durchschnitt 90 80 70 60 50 0 12 24 36 48 Monat 8. Elementare Zeitreihenanalyse - 80 - Originaldaten – gleitende Durchschnitte = Trendbereinigte Zeitreihe 15 10 5 0 -5 -10 -15 0 12 24 36 48 Monat arithmetisches Mittel der trendbereinigten Daten je Monat – arithmetisches Mittel dieser arithmetischen Mittel = Typische Saisonfigur Typische Saisonfigur 15 10 5 0 0 -10 -5 -15 12 24 36 48 Monat 8. Elementare Zeitreihenanalyse - 81 - Originaldaten – typische Saisonfigur = Saisonbereinigte Zeitreihe Saisonbereini gte Zeitreihe 85 80 75 70 65 0 12 24 36 48 Monat Regression: Saisonbereinigte Zeitreihe in Abhängigkeit von der Zeit = lineare KQ-Schätzung der glatten Komponente 85 80 75 70 65 0 12 24 36 48 Monat 8. Elementare Zeitreihenanalyse - 82 - geschätzte glatte Komponente + typische Saisonfigur = geschätzte Zeitreihe Geschätzt e Zeitreihe 100 90 80 70 60 50 0 12 24 36 48 Monat Vergleich: Geschätzte Zeitreihe ↔ Originalzeitreihe Monatlicher Bierausstoß 100 Originalzeitreihe Geschätzte Zeitreihe 80 70 90 60 50 0 12 24 36 48 60 Monat 8. Elementare Zeitreihenanalyse - 83 - Vergleich: Prognose für das fünfte Jahr basierend auf der geschätzten Zeitreihe ↔ Originalzeitreihe 100 Direkter Vergleich Originalzeitreihe Prognose 90 80 70 60 49 50 51 52 53 54 55 56 57 58 59 60 Prognosezeitraum Residualanalyse: Residuen = Originaldaten – prognostizierte Werte 8 6 Residuen 4 2 0 -2 -4 -6 -8 49 50 51 52 53 54 55 56 57 58 59 60 Prognosezeitraum 8. Elementare Zeitreihenanalyse - 84 -