2. Zeitreihenzerlegung und Komponentenmodell 2.1 Komponenten ökonomischer Zeitreihen Ökonomische Zeitreihen lassen sich als Resultat eines Zusammenwirkens verschiedener Bewegungskomponenten auffassen. Übersicht 10. 1: Komponenten ökonomischer Zeitreihen Komponenten ökonomischer Zeitreihen Systematische Komponenten Glatte Komponente Trend Saisonkomponente Konjunkturkomponente Restkomponente Zeitreihe: y1, y2, ..., yn oder (yt), t=1,2,...n Zeitreihendiagramm: Lineare Verbindung der Wertepaare (t, yt) in einem t,ytKoordinatensystem (Zeitreihenpolygon) Abb.: Zeitreihendiagramm der systematischen Komponenten Zeitreihenzerlegung: Separierung der Komponenten einer Zeitreihe Komponentenmodelle Additives Grundmodell: (2.1a) yt= mt + ct + st + ut oder (2.1b) yt= gt + st + ut Annahme: Zyklische Schwankungen mit konstanter Amplitude Multipikatives Grundmodell: (2.2a) yt= mt · ct · st · ut oder (2.2b) yt= gt · st · ut Annahme: Zyklische Schwankungen mit proportional wachsender Amplitude Überführung in ein additives Modells durch Logarithmierung: Aus (2.2b): log yt= log gt + log st + log ut Gemischtes Modell: (2.3) yt= (mt + ct ) st + ut Abb.: Zeitreihendiagramm des Kfz-Bestands Abb.: Zeitreihendiagramm der Löhne und Gehälter je Beschäftigten 35 yt 160 34 33 32 31 30 29 28 27 26 25 150 yt 140 130 120 110 100 0 1 2 3 4 5 Zeit 6 7 8 9 10 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1986 1987 1988 1989 1990 Quar tal e 2.2 Trend und glatte Komponente 2.2.1 Trendfunktionen Wenn eine Zeitreihe in einem Zeitintervall keinen Strukturbruch aufweist, ist es oft möglich, ihre Entwicklungstendenz durch eine Funktion der Zeit t zu modellieren. Eine solche Funktion (2.4) mt = f(t), die mittels der Methode der kleinsten Quadrate geschätzt werden kann, heißt Trendfunktion. Es handelt sich dabei um eine Regressionsfunktion, in der die Zeit t als unabhängige Variable auftritt. Trendbestimmung beim einfachen Grundmodell (2.5) yt = mt + ut Lineare Trendfunktion (approx. konst. abs. Zuwächse): (2.6) mt = a0 + a1·t Kleinst-Quadrate-Kriterium: (2.7) n Q a 0 , a1 y t a 0 a1 t 2 Min! t 1 a 0 , a1 Notwendige Bedingungen für ein Minimum der Kriteriumsfunktion Q(a0,a1): (10.1) . Qa 0 , a1 n 2y t a 0 a1 t 1 0 a 0 t 1 Qa 0 , a1 n 2y t a 0 a1 t t 0 a1 t 1 Normalgleichungen: (2.8a) a 0 n a1Σt Σyt (2.8b) a 0Σt a1Σt 2 Σy t t Kleinst-Quadrate-Schätzer: (2.9a) (2.9b) â1 â 0 n yt t yt t n t 2 ( t )2 __ yt y t __ 2 t t2 yt t â1 y â1 t n n Beispiel: Wie aus der Abbildung hervorgegangen ist, wächst der Bestand an Kraftfahrzeugen relativ gleichmäßig an, wobei die jährlichen Zuwächse nicht zu stark variieren. Das Zeitreihendiagramm legt daher nahe, die Trendkomponente der Zeitreihe durch eine lineare Trendfunktion nachzubilden. Arbeitstabelle (mit originären Kfz-Bestandsdaten): t yt t² yt·t 1 27116 1 27116 2 27858 4 55716 3 28452 9 85356 4 29122 16 116488 5 29905 25 149525 6 30618 36 183708 7 31748 49 222236 8 32762 64 262096 9 33764 81 303876 45 271345 285 1406117 Koeffizienten der Trendgeraden (nicht-zentrierter Zeitindex) Steigungsmaß: n y t t y t t 9 1406117 271345 45 444528 â1 823,2 2 2 2 540 n t ( t ) 9 285 45 Achsenabschnitt: 45 yt t 271345 â 0 â1 823,2 30149,4 823,2 5 26033,4 n n 9 9 Trendgerade mt = 26033,4 + 823,2·t, t=1,2,...,n Zentrierter Zeitindex t‘: Einfache Lösung der Normalgleichungen durch Zentrierung des Zeitindex: t‘=...,-2,-1,0,1,2,... (n ungerade), t‘=...;-1,5;-0,5;0,5;1,5;... (n gerade) Es gilt dann: (2.10) Σt' 0 Normalgleichungen bei zentriertem Zeitindex: (2.11) a 0 n Σyt' (2.12) a1Σt'2 Σy t' t' Kleinst-Quadrate-Schätzer: Σy (2.13) â'0 t' n (2.14) â1( â1' ) Kleinst-Quadrate-Schätzer für a0: (2.15) â 0 â'0 â1 t Σy t' Σt â1 n n Σy t' t' Σt'2 Aus (2.15) ergibt sich aus der Umformung der linearen Trendgeraden mit dem Zeitindex t‘=t- t : mt â'0 â'1t' â'0 â'1 t t â'0 â'1t â'1t Güte der Anpassung der Trendgeraden (Bestimmtheitmaß, Determinationskoeffizient): (2.16a ) R 2 (2.16b) 2 R Varianz der Trendwerte (erklärte Varianz ) Varianz der Zeitreihe ( y t ) Σŷ2t n y2 Σy2t n y2 n Σŷ2t Σy t 2 n Σy2t Σy t 2 Beispiel: Wir bestimmen die lineare Trendfunktion der Zeitreihe Bestand an Kraftfahrzeugen jetzt unter Verwendung des zentrierten Arbeitstabelle (mit originären Kfz-Bestandsdaten): t t‘ t‘² yt‘ yt‘·t‘ 1 -4 16 27116 -108464 2 -3 9 27858 -83574 3 -2 4 28452 -56904 4 -1 1 29122 -29122 5 0 0 29905 0 6 1 1 30618 30618 7 2 4 31748 63496 8 3 9 32762 98286 9 4 16 33764 135056 45 0 60 271345 49392 Koeffizienten der Trendgeraden (zentrierter Zeitindex) Achsenabschnitt (extrapolierter Trendwert für t=0): Σyt' Σt 271345 45 â 0 â1 823,2 26 033,4 . 9 9 9 9 Steigungsmaß: â'1 Σyt't' 2 Σt' 49392 823,2 60 Trendgerade mt = 26033,4 + 823,2·t, t=1,2,...,n Bestimmtheitsmaß: R2 ŷ 2t 9 y 2 y 2t 9 y 2 Durchschnittl. Kfz-Bestand: y 8 222153 378 9 30149 2 8 222 015 601 9 30149 2 40 876 569 0,988 41355 792 271345 30149 9 Arbeitstabelle zur Berechnung des Bestimmtheitsmaßes: t yt 1 27116 26856,6 735277456 721276964 2 27858 27679,8 776068164 766171328 3 28452 28503,0 809516304 812421009 4 29122 29326,2 848090884 860026006 5 29905 30149,4 894309025 908986320 6 30618 30972,6 937461924 959301951 7 31748 31795,8 1007935505 1010972898 8 32762 32619,0 1073348644 1063999161 9 33764 33442,2 1140007696 1118380741 271345 271345,0 8222015601 8221536378 ŷ t y 2t ŷ 2t Prognose des Kfz-Bestands durch Trendextrapolation ŷ10 26 018,4 826,210 34 280,4 z.B. Jahr t=10: Abb.: Zeitreihendiagramm für den Kfz-Bestand mit Trendgerade yt 35 34 33 32 31 30 29 28 27 26 25 , 0 1 2 3 4 5 Zeit 6 7 8 9 10 Exponentialtrend Anwendung bei Wachstumsvorgängen, bei denen eine Variable in einem Zeitraum überproportional steigt Exponentielle Trendfunktion (approx. konst. rel. Zuwächse): (2.17) mt = a·bt Die Trendwerte verändern sich beim Exponentialtrend von Periode zu Periode um eine konstante Wachstumsrate b-1. Der konstante Faktor a gibt den Trendwert einer Zeitreihe für die Periode vor Beginn des Stützzeitraumes wieder. Linearisierung der exponentiellen Trendfunktion: (2.18) log mt = log a + t·log b n KQ-Kriterium: (2.19) Qa , b log y t log a t log b 2 Min! a ,b t 1 Kleinst-Quadrate-Schätzer: t nt log y t log y t t log y t (2.20) log b (2.21) log a log b 2 2 n n nt t Trendkoeffizienten: lg a (2.22) â 10 lg b (2.23) b̂ 10 Beispiel: Die Bruttolohn- und -gehaltssumme aus unselbständiger Arbeit ohne Arbeitgeberbeiträge zur Sozialversicherung ist in dem Zeitraum von 9 Jahren überproportional angestiegen (s. Abb.). Aus diesem Grund lässt sich die zeitliche Entwicklung nicht durch eine lineare Trendfunktion beschreiben. Vielmehr kann der Trend hier unter Verwendung einer konstanten Wachstumsrate modelliert werden, die einen Durchschnitt der jährlichen Wachstumsraten widerspiegelt. Abb.: Zeitreihendiagramm der Bruttolohn- und -gehaltssumme Mrd. DM 1100 1000 900 800 700 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 Jahre Berechnung der Trendkoeffizienten Arbeitstabelle (mit originären Bruttolohn- und –gehaltsdaten): t t² yt lg yt t·lg yt 1 1 764,44 2,883343 2,883343 2 4 777,42 2,890656 5,781312 3 9 802,93 2,904678 8,714034 4 16 833,78 2,921051 11,684204 5 25 876,63 2,942816 14,714080 6 36 912,81 2,960380 17,762280 7 49 948,85 2,977198 20,840386 8 64 993,19 2,997032 23,976256 9 81 1070,10 3,029424 27,264819 45 285 26,506578 133,620714 Kleinst-Quadrate-Schätzer: loĝ b loĝ a 9 133,620714 26,506578 45 9 285 452 0,018130 26,5065789 45 0,018130 2,854525 9 9 Trendkoeffizienten: â 102,854525 715,36 b̂ 100,018130 1,0426 Exponentielle Trendfunktion: m t 715,361,0426t Prognose: z.B. für das Jahr t=10: ŷ10 715,361,0426 1085,68 Güte der Anpassung (bei semi-logarithm. Skala): 10 Bestimmtheitsmaß: R² = 0,982 2.2.2 Methode der gleitenden Durchschnitte Flexible Methode zur Ermittlung der glatten Komponente, die ohne stren-ge Annahmen auskommt Methodischer Ansatz und Grundidee Mit der Methode der gleitenden Durchschnitte wird eine Zeitreihe geglättet, indem man sukzessive Mittelwerte aus einer feststehenden Anzahl benachbarter Zeitreihenwerte ermittelt (gleiche Länge der Stützbereiche), die jeweils der Mitte des betreffenden Zeitintervalls zugeordnet werden. Die Folge der Durchschnitte wird als gleitend bezeichnet, weil jeweils der älteste Zeitreihenwert durch den Zeitreihenwert ersetzt wird, der unmit-telbar am rechten Rand außerhalb des Stützbereichs liegt. Auf diese Art und Weise „gleiten“ die gebildeten Durchschnitte quasi entlang einer Zeitachse. Der Glättungseffekt ergibt sich dadurch, dass extreme Zeitreihenwerte nicht mehr voll zur Geltung kommen, sondern abgewichtet werden (Gewicht < 1). Ordnung des gleitenden Durchschnitts (Anz. der eingehenden Zeitreihenwerte): p p p-gliedriger gleitender Durchschnitt: y t Einfache p-gliedrige gleitende Durchschnitte (p ungerade) Ein p-gliedriger gleitender Durchschnitt setzt sich aus p=2q+1 Beobachtungswerten zusammen, wobei jeweils q Werte vor und nach seiner zeitlichen Zentrierung liegen. y1=1 y2=4 1 2 y3=7 3 y4=4 4 y5=7 y6=10 5 6 3 1 3-gliedrige gleitende Durchschnitte: y t y t 1 y t y t 1 3 1 3 t=2: y2 y1 y2 y3 = (1 + 4 + 7)/3 = 12/3 = 4 3 1 t=3: y3 3 3 y2 y3 y4 = (4 + 7 + 4)/3 = 15/3 = 5 3 1 t=4: y4 y3 y4 y5 = (7 + 4 + 7)/3 = 18/3 = 6 3 1 t=5: y3 y4 y5 y6 = (4 + 7 + 10)/3 = 21/3 = 7 5 3 t Allg. Formel für einf. p-gliedrigen gleitenden Durchschnitt (p ungerade): (2.21) y pt 1 y t q y t 1 y t y t 1 y t q p 1 q y t k ,t q 1, q 2,, n q . p k q In den Rändern lassen sich jeweils q gleitende Durchschnittswerte nicht berechnen. Z.B. p=5: 5-gliedriger gleitender Durchschnitt: 1 y5t y t 2 y t 1 y t y t 1 y t 2 5 Rekursionsformel: (2.22) ypt 1 ypt 1 y t q 1 y t q ,t q 1, q 2,, n q p Beispiel: Das Niveau der Auftragseingänge im Verarbeitenden Gewerbe (ohne Nahrungs- und Genussmittelgewerbe) wird vom Statistischen Bundesamt kalendermonatlich über einen Index gemessen. Quartalsmäßig hat sich der Index des Auftragseingangs in einem Zeitraum von drei Jahren wie folgt entwickelt: Jahr I. Quartal 1 II. Quartal 2 122,1 106,6 , 1238 3 130,7 124,9 4 137,7 III. Quartal IV. Quartal 108,6 115,9 117,8 125,4 128,5 133,7 Bei einer Glättung der Zeitreihe unter Verwendung eines 3-gliedrigen gleitenden Durchschnitts bleibt die erste und letzte Periode des Beobachtungszeitraums unbesetzt. Der erste gleitende Durchschnittswert, der dem III. Quartal des 1. Jahres zugeordnet wird, lautet 1 1 3 y1/III y1/II y1/III y1/IV 106,6 108,6 115,9 110,4 . 3 3 Der gleitende Durchschnittswert für das IV. Quartal des 1. Jahres ist durch 1 1 3 y1/IV y1/III y1/IV y2/I 108,6 115,9 122,1 115,5 3 3 gegeben. Zeit yt 1/II 106,6 1/III 108,6 110,4 1/IV 115,9 115,5 140 2/I 122,1 120,6 135 2/II 123,8 121,2 130 2/III 117,8 122,3 125 2/IV 125,4 124,6 120 y3t Abb.: Index des Auftragseingangs mit 3-gliedrigem gleitenden Durchschnitt yt 115 3/I 130,7 127,0 3/II 124,9 128,0 105 3/III 128,5 129,0 100 3/IV 133,7 4/I 137,7 133,3 110 2 3 4 1988 1 2 3 4 1 1989 2 3 1990 Quartale 4 1 1991 Zentrierte p-gliedrige gleitende Durchschnitte (p gerade) Wenn eine Zeitreihe saisonale Schwankungen aufweist, wird der Glättungseffekt im Allgemeinen durch einfache gleitende Durchschnitte ungerader Ordnung verzerrt. Der Grund liegt darin, dass ein bestimmter Jahreabschnitt (z.B. Monat, Quartal) hierbei in einem gleitenden Durchschnittwert unberücksichtigt bleibt. Um saisonale Schwankungen auszuschalten, müssen die gleitenden Durchschnitte so konzipiert werden, dass ihre Ordnung mit der Zykluslänge übereinstimmt. Bei Quartalsdaten mit regelmäßig wiederholenden saisonalen Schwankungen kommen für die glatte Komponente daher vorzugsweise 4-gliedrige gleitende Durchschnitte, bei Monatsdaten mit diesen Eigenschaften 12-gliedrige gleitende Durchschnitte in Betracht. Hierbei handelt sich um gleitende Durchschnitte gerader Ordnung. Ein gleitender Durchschnittswert gerader Ordnung lässt sich jedoch keiner Zeiteinheit eindeutig zuordnen, da er auf der Zeitachse genau zwischen den beiden mittleren Perioden oder Zeitpunkten liegt. Um dies zu vermeiden, zieht man p+1 Zeitreihenwerte zur Berechnung eines gleitenden Durchschnitts gerader Ordnung heran und gewichtet die beiden äußeren Zeitreihenwerte mit dem Faktor ½. Auf diese Weise werden die gleitenden Durchschnitte zentriert. Bei Zeitreihen mit saisonalen Schwankungen erfolgt die Glättung daher mittels zentrierter gleitender Durchschnitte. Zentrierte gleitende Durchschnitte bei Quartalsdaten (p=4): (2.23) 11 1 y4t y t 2 y t 1 y t y t 1 y t 2 4 2 2 Zentrierte gleitende Durchschnitte bei Monatsdaten (p=12): (2.24) y12 t 1 1 1 y y y y y y t 6 t 6 t 5 t 1 t t 1 12 2 2 Allg. Formel für zentrierte p-gliedrige gleitende Durchschnitte: q 1 1 p 1 1 y t q y t k y t q ,t q 1, q 2,..., n q (2.25) y t p 2 2 k q 1 An den Rändern des Beobachtungszeitraums lassen sich q=p/2 gleitende Durchschnittswerte nicht berechnen. Die zentrierten gleitenden Durchschnitte (2.25) entsprechen einer Mittelung jeweils zweier benachbarter unzentrierter gleitender Durchschnitte bei unveränderter Ordnung. Beispiel: Die Löhne und Gehälter je Beschäftigten weisen ein klares Saisonmuster auf. Im I. Quartal eines Jahres liegt der Tiefstand und nach den etwa gleichwertigen beiden mittleren Quartalen wird im IV. Quartal das saisonale Hoch erreicht. Die langfristig steigende Tendenz dieser Zeitreihe kann daher am besten durch 4-gliedrige gleitende Durchschnitte beschrieben werden. Jahr I. Quartal II. Quartal III. Quartal IV. Quartal 1 113,6 121,3 122,0 138,8 2 116,3 125,7 125,7 143,5 3 121,1 128,6 129,0 147,3 4 123,2 129,2 130,3 147,9 5 128,0 135,7 136,2 155,5 Berechnung 4-gliedriger gleitender Durchschnitte: 11 1 4 y y y y y y für 1/III: 1/I 1/II 1/III 1/IV 2/I 1/III 4 2 2 11 1 113,6 121,3 122,0 138,8 116,3 124,3 4 2 2 für 1/IV: y 4 y y y y y 1/III 1/IV 2/I 2/II 1/IV 4 2 1/II 2 1 1 1 11 1 121,3 122,0 138,8 116,3 125,7 125,2 4 2 2 Abb.: Löhne und Gehälter je Beschäftigten mit zentriertem 4-gliedrigem gleitenden Durchschnitt yt 160 150 140 130 120 110 100 1 2 3 1986 4 1 2 3 4 1 1987 Quartale 2 3 1988 4 1 2 3 1989 4 1 2 3 1990 4