Substitution: Bei Warenart n kommt von Jahr j = 0 zu Jahr j = 1 eine

Substitution: Bei Warenart n kommt von Jahr j = 0 zu Jahr j = 1 eine neue Qualität auf
den Markt, die die bisher gängige Qualität verdrängt (Beispiel: neues Kfz.-Modell). Dabei sollen
folgende Bezeichnungen für die Mengen bzw. Preise verwendet werden:
Jahr 0 :
Jahr 1 :
Jahr j(j ≥ 2) :
n Warenarten mit q0,k und p0,k (k = 1, . . . , n)
(n − 1) Warenarten mit q1,k und p1,k (k = 1, . . . , n − 1)
Warenart n in der alten Qualität mit q1,n und p1,n
Warenart n in der neuen Qualität mit q̂1,n und p̂1,n
(n − 1) Warenarten mit qj,k und pj,k (k = 1, . . . , n − 1)
Warenart n in der neuen Qualität mit q̂j,n und p̂j,n
Die durch die Qualitätsänderung bei ”n” verursachte Preisänderung soll bei der Preisberechnung
des Preisindexes eliminiert, also nicht als echte Preisänderung registriert werden.

n−1
P



p1,k qk + p1,n qn



k=1

· 100
für j = 1


n−1

P


p0,k qk + p0,n qn

(4.4.6)
k=1
P0,j =
n−1
P



pj,k qk + p̂j,n q̂n



k=1

· 100
für j = 2, 3, . . .


n−1
P


∗

p0,k qk + p̂0,n q̂n

k=1
q1 , . . . , qn bzw. q1 , . . . , qn−1 , q̂n sind feste Gewichtungsschemata mit qn als Bezugsmenge von Warenart n in der alten und q̂n in der neuen Qualität, die durch folgenden fiktiven Preis ergänzt
werden :
p0,n
(4.4.7)
p̂∗0,n := p̂1,n
p1,n
Diese Formel beruht hier auf der Annahme, dass die fiktive Preisentwicklung für die Warenart
n bei der neuen Qualität von 0 nach 1 genau gleich der (realen) Preisentwicklung bei der alten
Qualität ist, dass also gilt:
p̂1,n ! p1,n
=
p̂∗0,n
p0,n
Bei der Mengenentwicklung erscheint es wie oben zweckmäßig für q1 , . . . , qn die bisher verwendeten Gewichte beizubehalten und für q̂n die Menge von Warenart n in der neuen Qualität aus
einem Jahr nach Beendigung der Übergangsphase zu nehmen. Unter der gleichen Voraussetzungen wie oben ergibt das:
(4.4.8)
qk = q0,k
Beispiel 4.4.2: Vorgegebene Daten:
Produkt
A
B
B′
für k = 1, . . . , n;
2001
Preis/ME Menge
10.–
100
12.–
150
×
–
j=0
q̂n = q̂2,n
2002
Preis/ME Menge
11.–
120
13.–
50
15.–
130
j=1
2003
Preis/ME Menge
12.–
120
×
–
16
160
j=2
Bei der Preisentwicklung ist zu berücksichtigen, dass B′ nicht als neues Produkt hinzukommt,
sondern B ersetzt.
(∗)
35
Bezeichnungen:
A (k = 1):
B (k = 2):
(∗)
B′ (k = 2):
p0,1 = 10,
p1,1 = 11,
p2,1 = 12.
q0,1 = 100,
q1,1 = 120,
q2,1 = 120.
p0,2 = 12,
p1,2 = 13,
p2,2 sinnlos.
q0,2 = 150,
q1,2 = 50,
q2,2 = 0.
p̂0,2 sinnlos,
p̂1,2 = 15,
p̂2,2 = 16.
q̂0,2 = 0,
q̂1,2 = 130,
q̂2,2 = 160.
Gewichtung mit z.B. folgenden Mengen:
q1 = q0,1 = 100, q2 = q0,2 = 150 bei 0 → 1
q1 = q0,1 = 100, q̂2 = q̂2,2 = 160 bei 0 → 2
11 · 100 + 13 · 150
· 100 = 108.9.
10 · 100 + 12 · 150
12
p0,2
(∗)
= 15 ·
= 13.85 (Euro),
Fiktiver Preis von B′ für j = 0: p̂∗0,2 = p̂1,2 ·
p1,2
13
P0,1 =
P0,2 =
4.5
12 · 100 + 16 · 160
· 100 = 116.5 .
10 · 100 + 13.85 · 160
Einige regelmäßig veröffentlichte Indizes
a) Preisindex für die Lebenshaltung
Eine Berechnungsgrundlage dieses Indexes ist der Warenkorb. Das ist die Bezeichnung
für die Zusammenfassung aller Warenarten mit den zugehörigen durchschnittlichen Warenmengen bezogen auf einen Haushalt. Der Durchschnitt wird dabei über eine genau
festgelegte Verbrauchgruppe gebildet, z.B. über aller privaten Haushalte oder über alle
2-Personen-Haushalte von Renten- und Sozialhilfeempfängern.
Zur Ermittlung der Preise der Waren aus dem Warenkorb muss eine gesonderte statistische
Untersuchung durchgeführt werden.
b) Index der Großhandelspreise
c) Index der industriellen Bruttoproduktion
Bei diesem Index werden Mengen mit Bruttoproduktionswerten pro ME (= Mengeneinheit) gewichtet.
Bruttoproduktionswert =
wirtschaftl. Umsatz
+
− Bestandsveränderungen an Halbfertig- und Fertigerzeugnissen
+ selbsterstellte Anlagen
d) Index der industriellen Nettoproduktion
Hier werden Mengen mit Nettoproduktionswerten pro ME gewichtet.
Nettoproduktionswert = Bruttoproduktionswert − Materialverbrauch
− vergebene Lohnarbeiten − bezogene Handelsware
36
Ein noch bessere Maß für die Eigenleistung ist die Wertschöpfung, die aber wegen des
wesentlich höheren Erhebungsaufwandes in d) nicht verwendet wird.
Wertschöpfung =
4.6
Nettoproduktionnswert − sonst. Vorleistungen
− Abschreibung − indirekte Steuern zuzüglich Subventionen
Subindizes
Im Statistischen Jahrbuch für die BRD werden neben dem allgemeinen Preisindex für die Lebenshaltung Subindizes für einzelne Verbrauchsgruppen veröffentlicht, und zwar (nach einer
früheren Systematik) für Ernährung, Getränke und Tabakwaren, Wohnung, Heizung und Beleuchtung, Hausrat, Bekleidung, Reinigung und Körperpflege, Bildung und Unterhaltung, Verkehr. (Für die neue Systematik vgl. neuere Ausgaben des Stat. Jahrbuchs).
Mit diesen Subindizes kann die Berechnung des Gesamtindexes etwas vereinfacht werden, wenn
man die Anteile der einzelnen Verbrauchsgruppen an den Gesamtausgaben für die Lebenshaltung
kennt. Wie das geschieht, soll für die Aufteilung in zwei Verbrauchsgruppen I und II durchgeführt
werden, die die Warenarten 1, . . . , m bzw. (m + 1), . . . , n enthalten sollen. Mit dieser Aufteilung
kann der Gesamtpreisindex P0,j z.B. für j = 1 in folgender Weise umgerechnet werden, wobei
q1 , . . . , qn feste Bezugsmengen sein sollen.
1
P0,1 =
100
m
P
p1,k qk +
n
P
p1,k qk
k=m+1
k=1
n
P
k=1
p0,k qk
=
m
P
k=1
n
P
k=1
p0,k qk
p0,k qk
m
P
· k=1
m
P
p1,k qk
+
p0,k qk
k=1
n
P
p0,k qk
k=m+1
n
P
p0,k qk
k=1
n
P
k=m+1
· n
P
p1,k qk
p0,k qk
k=m+1
Die jeweils zweiten Brüche in den beiden Summanden sind gerade die Preisindizes für die Ver′ bzw. P ′′ bezeichnen. Sie sind also Subindizes. Die
brauchsgruppen I und II, die wir mit P0,1
0,1
jeweils ersten Brüche lassen sich als die Anteile der Verbrauchsgruppen I und II an den (u. U.
fiktiven) Gesamtausgaben deuten. Diese Anteile bezeichnen wir mit g′ bzw. g′′ . Das ergibt für
j = 1 und analog für allgemeine j:
(4.6.1)
′
′′
P0,j = g′ · P0,j
+ g′′ · P0,j
Wegen der Eigenschaften g′ , g′′ ≥ 0 und g′ + g′′ = 1 ist (4.6.1) ein gewogenes arithmetisches
Mittel (vgl (3.1.3)), mit dem man hier und analog für den Fall von mehr als zwei Verbrauchsgruppen aus den Subindizes und den Ausgabenanteilen den Gesamtindex berechnen kann.
Die Berechnung der Subindizes erfolgt z. T. deshalb, weil sie ein gewisses Interesse besitzen, z.
T. auch deshalb, weil gewisse Manipulationen (Änderungen im Gewichtungsschema, Substitutionen usw.) durch das Vorhandensein von Subindizes erleichtert werden. Subindizes sind nicht
auf die behandelte Anwendung beschränkt, sondern auch auf andere Bereiche anwendbar.
37
Kapitel 5
Zeitreihenanalyse
5.1
Einführung der Zeitreihen
Unter einer Zeitreihe versteht man die Entwicklung einer bestimmten Größe, deren Werte im
Zeitablauf zu bestimmten Zeitpunkten oder für bestimmte Zeitintervalle erfasst und dargestellt
werden.
Beispiel 5.1.1 (für Zeitreihen von zeitpunktbezogenen Merkmalen):
g 2
t sei die in der Zeit t zurückgelegte Fall2
strecke. Misst man t in Sekunden und s(t) in Metern, so gilt an der Erdoberfläche für die
Erdbeschleunigung g ≈ 9.81m sec−2 .
a) Weg-Zeit-Funktion beim freien Fall: s(t) =
Devisenkurse für US $ (Kassa Geld)
Tag
15.11.04 16.11.04 17.11.04
$ für 1 Euro 1.2914
1.2931
1.3000
b)
18.11.04
1.3003
19.11.04
1.2993
Für eine Analyse dieser Zeitreihe, wie sie dann in diesem Kapitel behandelt wird, wäre
eine “kompakte” Darstellung wie in Teil a) zweckmäßig, also y(t). Dabei wäre t in Tagen
zu messen, und zwar an Besten so, dass y(i) der Kurswert am i-te angegebene Tag ist,
also:
i
1
2
3
4
5
y(i) 1.2914 1.2931 1.3000 1.3003 1.2993
Die Funktion y(t) ist aber offensichtlich ohne weitere Informationen nur für die angegebenen Werte von t, nämlich 1, 2, 3, 4, 5 definiert. Allerdings wäre z.B. y(2.5) sinnvoll, wenn
noch genaue Uhrzeiten angegeben wären und der 12 Stunden später als y(2) abgefragte
Kurswert bekannt wäre. Die Zeitskala ließe sich also prinzipiell beliebig verfeinern.
Bsp. 5.1.2 (für eine Zeitreihe eines zeitintervallbezogenen Merkmals):
Jahr
i := Nummer des Zeitintervalls
Umsatz yi (in Mio. Euro)
Jahr
i
yi
1988
1989
1990
1991
1992
1
2
3
4
5
4.8
5.2
5.6
4.9
6.2
1993
1994
1995
1996
×
6
7
8
9
×
5.6
5.8
6.4
5.9
×
Eine Funktion y(t) ist bei Bsp 5.1.2 nur für t = 1, 2, . . . , sinnvoll zu interpretieren. Nicht sinnvoll
ist z.B. y(1.5). Um sich aber z.B. einen besseren Überblick über den Verlauf der Zeitreihe zu
38
verschaffen, ist es zweckmäßig, die Zeitreihe in einer Kurve darzustellen (Siehe die untenstehende Fig. 5-1). Dabei ist zu beachten, dass y(t) nur für bestimmte Werte von t sinnvoll zu
interpretieren ist.
y (Umsatz in Mio. Euro)
6
7
6
5
4
3
2
1
1
2
3
4
5
6
7
8
9
-t
Fig. 5-1
5.2
Komponenten einer Zeitreihe
Bei langen Zeitreihen (etwa über mehrere Jahrzehnte) ist eine Aufteilung in folgende 4 Komponenten sinnvoll:
a) Trend T (t): Grundrichtung, langfristige Entwicklung.
b) Zyklische Komponente Z(t): mittelfristige Entwicklung, z.B. Einflüsse von Konjunkturschwankungen.
c) Saisonkomponente S(t): kurzfristige Entwicklung innerhalb der einzelnen Jahre durch
saisonbedingte Schwankungen.
d) Restkomponente R(t): einmalige oder seltene Einflüsse und Zufallsschwankungen.
39
Bei kurzen Zeitreihen ist eine Trennung zwischen Trend und zyklischer Komponente nicht mehr
sinnvoll. Es bleibt eine Aufteilung in 3 Komponenten:
a) Trend T (t): Grundrichtung, b) S(t) vergl. o., c) R(t) vergl. o.
In diesem Kapitel werden nur solche Zeitreihen behandelt.
Additive Verknüpfung der Komponenten:
(5.2.1)
y(t) = T (t) + S(t) + R(t)
Multiplikative Verknüpfung der Komponenten:
(5.2.2)
y(t) = T (t) · S(t) · R(t)
Reduktion auf additiver Verknüpfung durch Logarithmeren (z.B. mit Basis ”e”)
(5.2.3)
5.3
5.3.1
ln y(t) = ln T (t) + ln S(t) + ln R(t)
Schätzung des Trends
Die Methode der gleitenden Durchschnitte
Gleitender Durchschnitt über eine ungerade Anzahl von Werten
(5.3.1)
T (i) ≈ D2m+1 (i) :=
yi−m + yi−m+1 + . . . + yi + yi+1 + . . . + yi+m
2m + 1
Rekursionsformel:
(5.3.2)
D2m+1 (i) = D2m+1 (i − 1) +
yi+m − yi−m−1
2m + 1
Eine Mittelbildung über eine gerade Anzahl von Werten würde eine Trendschätzung an einem
nicht sinnvollen Wert von t liefern. Wäre (wie etwa bei Monatswerten) doch eine Art Mittelbildung über eine gerade Anzahl wünschenswert, so kann man folgende Modifikation des gleitenden
Durchschnitts verwenden:
(5.3.3)
T (i) ≈ D2m (i) :=
0.5yi−m + yi−m+1 + . . . + yi+m−1 + 0.5yi+m
2m
Rekursionsformel:
(5.3.4)
D2m (i) = D2m (i − 1) +
(yi+m + yi+m−1 ) − (yi−m + yi−m−1 )
4m
40
Beispiel 5.3.1: Wir übernehmen die Eingangsdaten aus Beispiel 5.1.2 .
Jahr i yi Durchschnitt von Durchschnitt von
je 5 Werten
je 4 Werten
D5 (i)
D4 (i)
1988 1 4.8
×
×
×
1989 2 5.2
×
×
5.13
1990 3 5.6
5.34
5.30
5.48
1991 4 4.9
5.50
5.53
5.58
1992 5 6.2
5.62
5.60
5.62
1993 6 5.6
5.72
5.81
6.00
1994 7 5.8
5.98
5.96
5.92
1995 8 6.4
×
×
×
1996 9 5.9
×
×
Die vierte und die letzte Spalte liefern brauchbare Trendschätzungen, während die Wertefolge
in der fünften Spalte nicht immer als neue Zeitreihe sinnvoll zu interpretieren ist.
Nachteil des gleitenden Durchschnitts:
keine Trendschätzung für die ersten und letzten Werte von i.
5.3.2
Die Methode der exponentiellen Glättung
Rekursive Berechnung von T ∗ (i) als Schätzung für T (i) nach der Methode der exponentiellen
Glättung:
(5.3.5)
T ∗ (1) = y(1),
T ∗ (i) = α y(i) + (1 − α) T ∗ (i − 1)
(i ≥ 2)
Die Glättungskonstante α ist dabei eine vorher festzusetzende Zahl mit 0 ≤ α ≤ 1. Man
erhält eine starke Glättung, wenn α nahe bei 0 ist, und eine schwache Glättung, wenn α nahe
bei 1 ist.
Die Bezeichnung ”exponentielle” Glättung kommt daher, dass man aus (5.3.5) folgende Formel
herleiten kann:
(5.3.5 a)
T ∗ (i) = α
i−2
P
(1 − α)j y (i − j) + (1 − α)i−1 y(1)
j=0
Für die praktische Berechnung ist aber (5.3.5) vorzuziehen.
41
(i ≥ 2)
Beispiel 5.3.2: Wir übernehmen wieder die Eingangsdaten aus Beispiel 5.1.2 .
Jahr i
Trendschätzwerte
yi
nach der Methode
der exponentiellen
Glättung mit ...
...α = 0.2 ...α = 0.9
1988 1 4.8
4.80
4.80
1989 2 5.2
4.88
5.16
1990 3 5.6
5.02
5.56
1991 4 4.9
5.00
4.97
1992 5 6.2
5.24
6.08
1993 6 5.6
5.31
5.65
1994 7 5.8
5.41
5.78
1995 8 6.4
5.61
6.34
1996 9 5.9
5.67
5.94
T ∗ (1) ist immer = y1 , also hier = 4.80, wobei wir wie bei den nachfolgenden Werten eine Stelle
mehr als bei den Eingangsdaten angeben. Zwei weitere Ausrechnungsbeispiele:
T ∗ (2) = 0.2 · 5.20 + 0.8 · 4.80 = 4.88 bei α = 0.2
T ∗ (3) = 0.9 · 5.60 + 0.1 · 5.16 = 5.56 bei α = 0.9
5.3.3
Drei Funktionsansätze für die Trendschätzung
Linearer Ansatz:
T (t) ≈ a + bt
Parabolischer Ansatz:
T (t) ≈ a + bt + ct2
Exponentieller Ansatz:
T (t) ≈ a bt
(a, b ≥ 0)
Reduktion des exponentiellen auf den linearen Ansatz:
(5.3.6)
5.3.4
ln T (t) ≈ ln a + t ln b =: a∗ + t b∗
Die Freihandmethode
Anpassung einer Trendgerade (also linearer Ansatz) nach Augenmaß an die graphische Darstellung der Zeitreihe
42