zerlegung1

Werbung
2. Zeitreihenzerlegung und Komponentenmodell
2.1 Komponenten ökonomischer Zeitreihen
Ökonomische Zeitreihen lassen sich als Resultat eines Zusammenwirkens verschiedener Bewegungskomponenten auffassen.
Übersicht 10. 1:
Komponenten ökonomischer Zeitreihen
Komponenten ökonomischer Zeitreihen
Systematische Komponenten
Glatte Komponente
Trend
Saisonkomponente
Konjunkturkomponente
Restkomponente
Zeitreihe: y1, y2, ..., yn oder (yt), t=1,2,...n
Zeitreihendiagramm: Lineare Verbindung der Wertepaare (t, yt) in einem t,ytKoordinatensystem (Zeitreihenpolygon)
Abb.: Zeitreihendiagramm der systematischen Komponenten
Zeitreihenzerlegung: Separierung der Komponenten einer Zeitreihe
Komponentenmodelle
Additives Grundmodell:
(2.1a) yt= mt + ct + st + ut oder (2.1b) yt= gt + st + ut
Annahme: Zyklische Schwankungen mit konstanter Amplitude
Multipikatives Grundmodell:
(2.2a) yt= mt · ct · st · ut oder (2.2b) yt= gt · st · ut
Annahme: Zyklische Schwankungen mit proportional wachsender Amplitude
Überführung in ein additives Modells durch Logarithmierung:
Aus (2.2b): log yt= log gt + log st + log ut
Gemischtes Modell:
(2.3) yt= (mt + ct ) st + ut
Abb.: Zeitreihendiagramm des Kfz-Bestands
Abb.: Zeitreihendiagramm der Löhne und Gehälter je Beschäftigten
35 yt
160
34
33
32
31
30
29
28
27
26
25
150
yt
140
130
120
110
100
0
1
2
3
4
5
Zeit
6
7
8
9
10
1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4
1986
1987
1988
1989
1990
Quar tal e
2.2 Trend und glatte Komponente
2.2.1 Trendfunktionen
Wenn eine Zeitreihe in einem Zeitintervall keinen Strukturbruch aufweist, ist es oft möglich, ihre Entwicklungstendenz durch eine Funktion der Zeit t zu modellieren. Eine solche
Funktion
(2.4) mt = f(t),
die mittels der Methode der kleinsten Quadrate geschätzt werden kann, heißt Trendfunktion. Es handelt sich dabei um eine Regressionsfunktion, in der die Zeit t als unabhängige Variable auftritt.
Trendbestimmung beim einfachen Grundmodell
(2.5) yt = mt + ut
Lineare Trendfunktion (approx. konst. abs. Zuwächse):
(2.6) mt = a0 + a1·t
Kleinst-Quadrate-Kriterium:
(2.7)
n
Q a 0 , a1    y t  a 0  a1  t 2  Min!
t 1
a 0 , a1
Notwendige Bedingungen für ein Minimum der Kriteriumsfunktion Q(a0,a1):
(10.1)
.
Qa 0 , a1  n
  2y t  a 0  a1  t    1  0
a 0
t 1
Qa 0 , a1  n
  2y t  a 0  a1  t    t   0
a1
t 1
Normalgleichungen:
(2.8a) a 0  n  a1Σt  Σyt
(2.8b) a 0Σt  a1Σt 2  Σy t  t
Kleinst-Quadrate-Schätzer:
(2.9a)
(2.9b)
â1 
â 0 
n yt  t   yt   t
n  t 2  ( t )2
__

yt  y  t
__
2
t  t2
 yt
t
 â1
 y  â1  t
n
n
Beispiel: Wie aus der Abbildung hervorgegangen ist, wächst der Bestand an
Kraftfahrzeugen relativ gleichmäßig an, wobei die jährlichen Zuwächse nicht
zu stark variieren. Das Zeitreihendiagramm legt daher nahe, die Trendkomponente der Zeitreihe durch eine lineare Trendfunktion nachzubilden.
Arbeitstabelle (mit originären Kfz-Bestandsdaten):

t
yt
t²
yt·t
1
27116
1
27116
2
27858
4
55716
3
28452
9
85356
4
29122
16
116488
5
29905
25
149525
6
30618
36
183708
7
31748
49
222236
8
32762
64
262096
9
33764
81
303876
45
271345
285
1406117
Koeffizienten der Trendgeraden (nicht-zentrierter Zeitindex)
Steigungsmaß:
n  y t  t   y t  t 9  1406117  271345  45 444528
â1 


 823,2
2
2
2
540
n  t  ( t )
9  285  45
Achsenabschnitt:
45
 yt
 t 271345
â 0 
 â1 

 823,2   30149,4  823,2  5  26033,4
n
n
9
9
Trendgerade
mt = 26033,4 + 823,2·t, t=1,2,...,n
Zentrierter Zeitindex t‘:
Einfache Lösung der Normalgleichungen durch Zentrierung des Zeitindex:
t‘=...,-2,-1,0,1,2,... (n ungerade), t‘=...;-1,5;-0,5;0,5;1,5;... (n gerade)
Es gilt dann: (2.10) Σt' 0
Normalgleichungen bei zentriertem Zeitindex:
(2.11) a 0  n  Σyt'
(2.12) a1Σt'2  Σy t'  t'
Kleinst-Quadrate-Schätzer:
Σy
(2.13) â'0  t'
n
(2.14) â1( â1' ) 
Kleinst-Quadrate-Schätzer für a0:
(2.15) â 0  â'0 â1  t 
Σy t'
Σt
 â1
n
n
Σy t' t'
Σt'2
Aus (2.15) ergibt sich aus der Umformung der linearen Trendgeraden mit dem
Zeitindex t‘=t- t :
mt  â'0 â'1t'  â'0 â'1 t  t   â'0 â'1t   â'1t
Güte der Anpassung der Trendgeraden
(Bestimmtheitmaß, Determinationskoeffizient):
(2.16a ) R 2 
(2.16b)
2
R 
Varianz der Trendwerte (erklärte Varianz )
Varianz der Zeitreihe ( y t )
Σŷ2t  n  y2
Σy2t  n  y2

n  Σŷ2t  Σy t 2
n  Σy2t  Σy t 2
Beispiel:
Wir bestimmen die lineare Trendfunktion der Zeitreihe Bestand an Kraftfahrzeugen jetzt unter Verwendung des zentrierten
Arbeitstabelle (mit originären Kfz-Bestandsdaten):
t
t‘
t‘²
yt‘
yt‘·t‘
1
-4
16
27116
-108464
2
-3
9
27858
-83574
3
-2
4
28452
-56904
4
-1
1
29122
-29122
5
0
0
29905
0
6
1
1
30618
30618
7
2
4
31748
63496
8
3
9
32762
98286
9
4
16
33764
135056
45
0
60
271345
49392
Koeffizienten der Trendgeraden (zentrierter Zeitindex)
Achsenabschnitt (extrapolierter Trendwert für t=0):
Σyt'
Σt 271345
45
â 0 
 â1 
 823,2  26 033,4 .
9
9
9
9
Steigungsmaß:
â'1 
Σyt't'

2
Σt'
49392
 823,2
60
Trendgerade
mt = 26033,4 + 823,2·t, t=1,2,...,n
Bestimmtheitsmaß:
R2 
ŷ 2t  9  y 2
y 2t  9  y 2
Durchschnittl. Kfz-Bestand:
y

8 222153 378  9  30149 2
8 222 015 601  9  30149 2

40 876 569
 0,988
41355 792
271345
 30149
9
Arbeitstabelle zur Berechnung des Bestimmtheitsmaßes:
t
yt
1
27116
26856,6
735277456
721276964
2
27858
27679,8
776068164
766171328
3
28452
28503,0
809516304
812421009
4
29122
29326,2
848090884
860026006
5
29905
30149,4
894309025
908986320
6
30618
30972,6
937461924
959301951
7
31748
31795,8 1007935505 1010972898
8
32762
32619,0 1073348644 1063999161
9
33764
33442,2 1140007696 1118380741
271345
271345,0 8222015601 8221536378
ŷ t
y 2t
ŷ 2t
Prognose des Kfz-Bestands durch Trendextrapolation
ŷ10  26 018,4  826,210  34 280,4
z.B. Jahr t=10:
Abb.: Zeitreihendiagramm für den Kfz-Bestand
mit Trendgerade
yt
35
34
33
32
31
30
29
28
27
26
25
,
0
1
2
3
4
5
Zeit
6
7
8
9
10
Exponentialtrend
Anwendung bei Wachstumsvorgängen, bei denen eine Variable
in einem Zeitraum überproportional steigt
Exponentielle Trendfunktion (approx. konst. rel. Zuwächse):
(2.17) mt = a·bt
Die Trendwerte verändern sich beim Exponentialtrend von Periode zu Periode um
eine konstante Wachstumsrate b-1. Der konstante Faktor a gibt den Trendwert einer Zeitreihe für die Periode vor Beginn des Stützzeitraumes wieder.
Linearisierung der exponentiellen Trendfunktion:
(2.18) log mt = log a + t·log b
n
KQ-Kriterium: (2.19) Qa , b    log y t  log a  t  log b 2  Min!
a ,b
t 1
Kleinst-Quadrate-Schätzer:


 t
nt  log y t   log y t  t
 log y t
(2.20) log b 
(2.21) log a 
 log b
2
2
n
n
nt  t 
Trendkoeffizienten:
lg a
(2.22) â  10
lg  b
(2.23) b̂  10
Beispiel: Die Bruttolohn- und -gehaltssumme aus unselbständiger Arbeit ohne Arbeitgeberbeiträge zur Sozialversicherung ist in dem Zeitraum von 9 Jahren überproportional angestiegen (s. Abb.). Aus diesem Grund lässt sich die zeitliche Entwicklung nicht durch eine lineare Trendfunktion beschreiben. Vielmehr kann der Trend
hier unter Verwendung einer konstanten Wachstumsrate modelliert werden, die einen Durchschnitt der jährlichen Wachstumsraten widerspiegelt.
Abb.: Zeitreihendiagramm der Bruttolohn- und -gehaltssumme
Mrd. DM
1100
1000
900
800
700
1981 1982 1983 1984 1985 1986 1987 1988 1989 1990
Jahre
Berechnung der Trendkoeffizienten
Arbeitstabelle (mit originären Bruttolohn- und –gehaltsdaten):
t
t²
yt
lg yt
t·lg yt
1
1
764,44
2,883343
2,883343
2
4
777,42
2,890656
5,781312
3
9
802,93
2,904678
8,714034
4
16
833,78
2,921051
11,684204
5
25
876,63
2,942816
14,714080
6
36
912,81
2,960380
17,762280
7
49
948,85
2,977198
20,840386
8
64
993,19
2,997032
23,976256
9
81
1070,10
3,029424
27,264819
45
285
26,506578
133,620714
Kleinst-Quadrate-Schätzer:
loĝ b 
loĝ a 
9 133,620714 26,506578 45
9  285  452
 0,018130
26,5065789
45
 0,018130  2,854525
9
9
Trendkoeffizienten:
â  102,854525  715,36
b̂  100,018130  1,0426
Exponentielle Trendfunktion:
m t  715,361,0426t
Prognose:
z.B. für das Jahr t=10: ŷ10  715,361,0426  1085,68
Güte der Anpassung (bei semi-logarithm. Skala):
10
Bestimmtheitsmaß: R² = 0,982
2.2.2 Methode der gleitenden Durchschnitte
Flexible Methode zur Ermittlung der glatten Komponente, die ohne stren-ge
Annahmen auskommt
Methodischer Ansatz und Grundidee
Mit der Methode der gleitenden Durchschnitte wird eine Zeitreihe geglättet, indem man sukzessive Mittelwerte aus einer feststehenden Anzahl
benachbarter Zeitreihenwerte ermittelt (gleiche Länge der Stützbereiche), die jeweils der Mitte des betreffenden Zeitintervalls zugeordnet werden. Die Folge der Durchschnitte wird als gleitend bezeichnet, weil jeweils der
älteste Zeitreihenwert durch den Zeitreihenwert ersetzt wird, der unmit-telbar
am rechten Rand außerhalb des Stützbereichs liegt. Auf diese Art und Weise
„gleiten“ die gebildeten Durchschnitte quasi entlang einer Zeitachse. Der
Glättungseffekt ergibt sich dadurch, dass extreme Zeitreihenwerte nicht
mehr voll zur Geltung kommen, sondern abgewichtet werden (Gewicht < 1).
Ordnung des gleitenden Durchschnitts (Anz. der eingehenden Zeitreihenwerte): p
p
p-gliedriger gleitender Durchschnitt: y t
Einfache p-gliedrige gleitende Durchschnitte (p ungerade)
Ein p-gliedriger gleitender Durchschnitt setzt sich aus p=2q+1 Beobachtungswerten zusammen, wobei jeweils q Werte vor und nach seiner zeitlichen Zentrierung liegen.
y1=1
y2=4
1
2
y3=7
3
y4=4
4
y5=7
y6=10
5
6
3 1
3-gliedrige gleitende Durchschnitte: y t  y t 1  y t  y t 1 
3
1
3
t=2: y2  y1  y2  y3  = (1 + 4 + 7)/3 = 12/3 = 4
3
1
t=3: y3

3 3 y2  y3  y4  = (4 + 7 + 4)/3 = 15/3 = 5
3 1
t=4: y4  y3  y4  y5  = (7 + 4 + 7)/3 = 18/3 = 6
3
1
t=5: y3
y4  y5  y6  = (4 + 7 + 10)/3 = 21/3 = 7

5
3
t
Allg. Formel für einf. p-gliedrigen gleitenden Durchschnitt (p ungerade):
(2.21)
y pt 

1
y t q    y t 1  y t  y t 1    y t q
p

1 q

 y t  k ,t  q  1, q  2,, n  q .
p k q
In den Rändern lassen sich jeweils q gleitende Durchschnittswerte nicht
berechnen.
Z.B. p=5: 5-gliedriger gleitender Durchschnitt:
1
y5t  y t 2  y t 1  y t  y t 1  y t 2 
5
Rekursionsformel:
(2.22)
ypt 1  ypt 


1
y t q 1  y t q ,t  q  1, q  2,, n  q
p
Beispiel: Das Niveau der Auftragseingänge im Verarbeitenden Gewerbe (ohne Nahrungs- und Genussmittelgewerbe) wird vom Statistischen Bundesamt kalendermonatlich über einen Index gemessen. Quartalsmäßig hat sich der Index des Auftragseingangs in einem Zeitraum von drei Jahren wie folgt entwickelt:
Jahr
I. Quartal
1
II. Quartal
2
122,1
106,6
,
1238
3
130,7
124,9
4
137,7
III. Quartal
IV. Quartal
108,6
115,9
117,8
125,4
128,5
133,7
Bei einer Glättung der Zeitreihe unter Verwendung eines 3-gliedrigen gleitenden
Durchschnitts bleibt die erste und letzte Periode des Beobachtungszeitraums unbesetzt.
Der erste gleitende Durchschnittswert, der dem III. Quartal des 1. Jahres zugeordnet
wird, lautet
1
1
3
y1/III
 y1/II  y1/III  y1/IV   106,6  108,6  115,9  110,4
.
3
3
Der gleitende Durchschnittswert für das IV. Quartal des 1. Jahres ist durch
1
1
3
y1/IV
 y1/III  y1/IV  y2/I   108,6  115,9  122,1  115,5
3
3
gegeben.
Zeit
yt
1/II
106,6
1/III
108,6
110,4
1/IV
115,9
115,5
140
2/I
122,1
120,6
135
2/II
123,8
121,2
130
2/III
117,8
122,3
125
2/IV
125,4
124,6
120
y3t
Abb.: Index des Auftragseingangs mit 3-gliedrigem gleitenden Durchschnitt
yt
115
3/I
130,7
127,0
3/II
124,9
128,0
105
3/III
128,5
129,0
100
3/IV
133,7
4/I
137,7
133,3
110
2
3
4
1988
1
2
3
4
1
1989
2
3
1990
Quartale
4
1
1991
Zentrierte p-gliedrige gleitende Durchschnitte (p gerade)
Wenn eine Zeitreihe saisonale Schwankungen aufweist, wird der Glättungseffekt im Allgemeinen durch einfache gleitende Durchschnitte ungerader Ordnung verzerrt. Der Grund liegt
darin, dass ein bestimmter Jahreabschnitt (z.B. Monat, Quartal) hierbei in einem gleitenden
Durchschnittwert unberücksichtigt bleibt. Um saisonale Schwankungen auszuschalten, müssen
die gleitenden Durchschnitte so konzipiert werden, dass ihre Ordnung mit der Zykluslänge
übereinstimmt. Bei Quartalsdaten mit regelmäßig wiederholenden saisonalen Schwankungen
kommen für die glatte Komponente daher vorzugsweise 4-gliedrige gleitende Durchschnitte,
bei Monatsdaten mit diesen Eigenschaften 12-gliedrige gleitende Durchschnitte in Betracht.
Hierbei handelt sich um gleitende Durchschnitte gerader Ordnung.
Ein gleitender Durchschnittswert gerader Ordnung lässt sich jedoch keiner Zeiteinheit eindeutig zuordnen, da er auf der Zeitachse genau zwischen den beiden mittleren Perioden oder
Zeitpunkten liegt. Um dies zu vermeiden, zieht man p+1 Zeitreihenwerte zur Berechnung eines gleitenden Durchschnitts gerader Ordnung heran und gewichtet die beiden äußeren Zeitreihenwerte mit dem Faktor ½. Auf diese Weise werden die gleitenden Durchschnitte zentriert. Bei Zeitreihen mit saisonalen Schwankungen erfolgt die Glättung daher mittels zentrierter gleitender Durchschnitte.
Zentrierte gleitende Durchschnitte bei Quartalsdaten (p=4):
(2.23)
11
1

y4t   y t 2  y t 1  y t  y t 1  y t 2 
4 2
2

Zentrierte gleitende Durchschnitte bei Monatsdaten (p=12):
(2.24)
y12
t 
1 1
1

y

y



y

y

y



y t 6 
 t 6
t 5
t 1
t
t 1
12  2
2

Allg. Formel für zentrierte p-gliedrige gleitende Durchschnitte:
q 1

1
p 1  1
y t q   y t k  y t q ,t  q  1, q  2,..., n  q
(2.25) y t 

p  2
2
k q 1

An den Rändern des Beobachtungszeitraums lassen sich q=p/2 gleitende Durchschnittswerte nicht berechnen.
Die zentrierten gleitenden Durchschnitte (2.25) entsprechen einer Mittelung jeweils
zweier benachbarter unzentrierter gleitender Durchschnitte bei unveränderter Ordnung.
Beispiel: Die Löhne und Gehälter je Beschäftigten weisen ein klares Saisonmuster
auf. Im I. Quartal eines Jahres liegt der Tiefstand und nach den etwa gleichwertigen
beiden mittleren Quartalen wird im IV. Quartal das saisonale Hoch erreicht. Die langfristig steigende Tendenz dieser Zeitreihe kann daher am besten durch 4-gliedrige
gleitende Durchschnitte beschrieben werden.
Jahr
I.
Quartal
II.
Quartal
III.
Quartal
IV.
Quartal
1
113,6
121,3
122,0
138,8
2
116,3
125,7
125,7
143,5
3
121,1
128,6
129,0
147,3
4
123,2
129,2
130,3
147,9
5
128,0
135,7
136,2
155,5
Berechnung 4-gliedriger gleitender Durchschnitte:
11
1

4
y


y

y

y

y


y


für 1/III:
1/I
1/II
1/III
1/IV
2/I
1/III 4 2
2


11
1

   113,6  121,3  122,0  138,8   116,3   124,3
4 2
2



für 1/IV: y 4


y

y

y

y


y

1/III
1/IV
2/I
2/II 
1/IV 4 2 1/II
2


1 1
1
11
1

   121,3  122,0  138,8  116,3   125,7   125,2
4 2
2

Abb.: Löhne und Gehälter je Beschäftigten mit zentriertem
4-gliedrigem gleitenden Durchschnitt
yt
160
150
140
130
120
110
100
1
2
3
1986
4
1
2
3
4
1
1987
Quartale
2
3
1988
4
1
2
3
1989
4
1
2
3
1990
4
Herunterladen