Substitution: Bei Warenart n kommt von Jahr j = 0 zu Jahr j = 1 eine

Werbung
Substitution: Bei Warenart n kommt von Jahr j = 0 zu Jahr j = 1 eine neue Qualität auf
den Markt, die die bisher gängige Qualität verdrängt (Beispiel: neues Kfz.-Modell). Dabei sollen
folgende Bezeichnungen für die Mengen bzw. Preise verwendet werden:
Jahr 0 :
Jahr 1 :
Jahr j(j ≥ 2) :
n Warenarten mit q0,k und p0,k (k = 1, . . . , n)
(n − 1) Warenarten mit q1,k und p1,k (k = 1, . . . , n − 1)
Warenart n in der alten Qualität mit q1,n und p1,n
Warenart n in der neuen Qualität mit q̂1,n und p̂1,n
(n − 1) Warenarten mit qj,k und pj,k (k = 1, . . . , n − 1)
Warenart n in der neuen Qualität mit q̂j,n und p̂j,n
Die durch die Qualitätsänderung bei ”n” verursachte Preisänderung soll bei der Preisberechnung
des Preisindexes eliminiert, also nicht als echte Preisänderung registriert werden.

n−1
P



p1,k qk + p1,n qn



k=1

· 100
für j = 1


n−1

P


p0,k qk + p0,n qn

(4.4.6)
k=1
P0,j =
n−1
P



pj,k qk + p̂j,n q̂n



k=1

· 100
für j = 2, 3, . . .


n−1
P


∗

p0,k qk + p̂0,n q̂n

k=1
q1 , . . . , qn bzw. q1 , . . . , qn−1 , q̂n sind feste Gewichtungsschemata mit qn als Bezugsmenge von Warenart n in der alten und q̂n in der neuen Qualität, die durch folgenden fiktiven Preis ergänzt
werden :
p0,n
(4.4.7)
p̂∗0,n := p̂1,n
p1,n
Diese Formel beruht hier auf der Annahme, dass die fiktive Preisentwicklung für die Warenart
n bei der neuen Qualität von 0 nach 1 genau gleich der (realen) Preisentwicklung bei der alten
Qualität ist, dass also gilt:
p̂1,n ! p1,n
=
p̂∗0,n
p0,n
Bei der Mengenentwicklung erscheint es wie oben zweckmäßig für q1 , . . . , qn die bisher verwendeten Gewichte beizubehalten und für q̂n die Menge von Warenart n in der neuen Qualität aus
einem Jahr nach Beendigung der Übergangsphase zu nehmen. Unter der gleichen Voraussetzungen wie oben ergibt das:
(4.4.8)
qk = q0,k
Beispiel 4.4.2: Vorgegebene Daten:
Produkt
A
B
B′
für k = 1, . . . , n;
2001
Preis/ME Menge
10.–
100
12.–
150
×
–
j=0
q̂n = q̂2,n
2002
Preis/ME Menge
11.–
120
13.–
50
15.–
130
j=1
2003
Preis/ME Menge
12.–
120
×
–
16
160
j=2
Bei der Preisentwicklung ist zu berücksichtigen, dass B′ nicht als neues Produkt hinzukommt,
sondern B ersetzt.
(∗)
35
Bezeichnungen:
A (k = 1):
B (k = 2):
(∗)
B′ (k = 2):
p0,1 = 10,
p1,1 = 11,
p2,1 = 12.
q0,1 = 100,
q1,1 = 120,
q2,1 = 120.
p0,2 = 12,
p1,2 = 13,
p2,2 sinnlos.
q0,2 = 150,
q1,2 = 50,
q2,2 = 0.
p̂0,2 sinnlos,
p̂1,2 = 15,
p̂2,2 = 16.
q̂0,2 = 0,
q̂1,2 = 130,
q̂2,2 = 160.
Gewichtung mit z.B. folgenden Mengen:
q1 = q0,1 = 100, q2 = q0,2 = 150 bei 0 → 1
q1 = q0,1 = 100, q̂2 = q̂2,2 = 160 bei 0 → 2
11 · 100 + 13 · 150
· 100 = 108.9.
10 · 100 + 12 · 150
12
p0,2
(∗)
= 15 ·
= 13.85 (Euro),
Fiktiver Preis von B′ für j = 0: p̂∗0,2 = p̂1,2 ·
p1,2
13
P0,1 =
P0,2 =
4.5
12 · 100 + 16 · 160
· 100 = 116.5 .
10 · 100 + 13.85 · 160
Einige regelmäßig veröffentlichte Indizes
a) Preisindex für die Lebenshaltung
Eine Berechnungsgrundlage dieses Indexes ist der Warenkorb. Das ist die Bezeichnung
für die Zusammenfassung aller Warenarten mit den zugehörigen durchschnittlichen Warenmengen bezogen auf einen Haushalt. Der Durchschnitt wird dabei über eine genau
festgelegte Verbrauchgruppe gebildet, z.B. über aller privaten Haushalte oder über alle
2-Personen-Haushalte von Renten- und Sozialhilfeempfängern.
Zur Ermittlung der Preise der Waren aus dem Warenkorb muss eine gesonderte statistische
Untersuchung durchgeführt werden.
b) Index der Großhandelspreise
c) Index der industriellen Bruttoproduktion
Bei diesem Index werden Mengen mit Bruttoproduktionswerten pro ME (= Mengeneinheit) gewichtet.
Bruttoproduktionswert =
wirtschaftl. Umsatz
+
− Bestandsveränderungen an Halbfertig- und Fertigerzeugnissen
+ selbsterstellte Anlagen
d) Index der industriellen Nettoproduktion
Hier werden Mengen mit Nettoproduktionswerten pro ME gewichtet.
Nettoproduktionswert = Bruttoproduktionswert − Materialverbrauch
− vergebene Lohnarbeiten − bezogene Handelsware
36
Ein noch bessere Maß für die Eigenleistung ist die Wertschöpfung, die aber wegen des
wesentlich höheren Erhebungsaufwandes in d) nicht verwendet wird.
Wertschöpfung =
4.6
Nettoproduktionnswert − sonst. Vorleistungen
− Abschreibung − indirekte Steuern zuzüglich Subventionen
Subindizes
Im Statistischen Jahrbuch für die BRD werden neben dem allgemeinen Preisindex für die Lebenshaltung Subindizes für einzelne Verbrauchsgruppen veröffentlicht, und zwar (nach einer
früheren Systematik) für Ernährung, Getränke und Tabakwaren, Wohnung, Heizung und Beleuchtung, Hausrat, Bekleidung, Reinigung und Körperpflege, Bildung und Unterhaltung, Verkehr. (Für die neue Systematik vgl. neuere Ausgaben des Stat. Jahrbuchs).
Mit diesen Subindizes kann die Berechnung des Gesamtindexes etwas vereinfacht werden, wenn
man die Anteile der einzelnen Verbrauchsgruppen an den Gesamtausgaben für die Lebenshaltung
kennt. Wie das geschieht, soll für die Aufteilung in zwei Verbrauchsgruppen I und II durchgeführt
werden, die die Warenarten 1, . . . , m bzw. (m + 1), . . . , n enthalten sollen. Mit dieser Aufteilung
kann der Gesamtpreisindex P0,j z.B. für j = 1 in folgender Weise umgerechnet werden, wobei
q1 , . . . , qn feste Bezugsmengen sein sollen.
1
P0,1 =
100
m
P
p1,k qk +
n
P
p1,k qk
k=m+1
k=1
n
P
k=1
p0,k qk
=
m
P
k=1
n
P
k=1
p0,k qk
p0,k qk
m
P
· k=1
m
P
p1,k qk
+
p0,k qk
k=1
n
P
p0,k qk
k=m+1
n
P
p0,k qk
k=1
n
P
k=m+1
· n
P
p1,k qk
p0,k qk
k=m+1
Die jeweils zweiten Brüche in den beiden Summanden sind gerade die Preisindizes für die Ver′ bzw. P ′′ bezeichnen. Sie sind also Subindizes. Die
brauchsgruppen I und II, die wir mit P0,1
0,1
jeweils ersten Brüche lassen sich als die Anteile der Verbrauchsgruppen I und II an den (u. U.
fiktiven) Gesamtausgaben deuten. Diese Anteile bezeichnen wir mit g′ bzw. g′′ . Das ergibt für
j = 1 und analog für allgemeine j:
(4.6.1)
′
′′
P0,j = g′ · P0,j
+ g′′ · P0,j
Wegen der Eigenschaften g′ , g′′ ≥ 0 und g′ + g′′ = 1 ist (4.6.1) ein gewogenes arithmetisches
Mittel (vgl (3.1.3)), mit dem man hier und analog für den Fall von mehr als zwei Verbrauchsgruppen aus den Subindizes und den Ausgabenanteilen den Gesamtindex berechnen kann.
Die Berechnung der Subindizes erfolgt z. T. deshalb, weil sie ein gewisses Interesse besitzen, z.
T. auch deshalb, weil gewisse Manipulationen (Änderungen im Gewichtungsschema, Substitutionen usw.) durch das Vorhandensein von Subindizes erleichtert werden. Subindizes sind nicht
auf die behandelte Anwendung beschränkt, sondern auch auf andere Bereiche anwendbar.
37
Kapitel 5
Zeitreihenanalyse
5.1
Einführung der Zeitreihen
Unter einer Zeitreihe versteht man die Entwicklung einer bestimmten Größe, deren Werte im
Zeitablauf zu bestimmten Zeitpunkten oder für bestimmte Zeitintervalle erfasst und dargestellt
werden.
Beispiel 5.1.1 (für Zeitreihen von zeitpunktbezogenen Merkmalen):
g 2
t sei die in der Zeit t zurückgelegte Fall2
strecke. Misst man t in Sekunden und s(t) in Metern, so gilt an der Erdoberfläche für die
Erdbeschleunigung g ≈ 9.81m sec−2 .
a) Weg-Zeit-Funktion beim freien Fall: s(t) =
Devisenkurse für US $ (Kassa Geld)
Tag
15.11.04 16.11.04 17.11.04
$ für 1 Euro 1.2914
1.2931
1.3000
b)
18.11.04
1.3003
19.11.04
1.2993
Für eine Analyse dieser Zeitreihe, wie sie dann in diesem Kapitel behandelt wird, wäre
eine “kompakte” Darstellung wie in Teil a) zweckmäßig, also y(t). Dabei wäre t in Tagen
zu messen, und zwar an Besten so, dass y(i) der Kurswert am i-te angegebene Tag ist,
also:
i
1
2
3
4
5
y(i) 1.2914 1.2931 1.3000 1.3003 1.2993
Die Funktion y(t) ist aber offensichtlich ohne weitere Informationen nur für die angegebenen Werte von t, nämlich 1, 2, 3, 4, 5 definiert. Allerdings wäre z.B. y(2.5) sinnvoll, wenn
noch genaue Uhrzeiten angegeben wären und der 12 Stunden später als y(2) abgefragte
Kurswert bekannt wäre. Die Zeitskala ließe sich also prinzipiell beliebig verfeinern.
Bsp. 5.1.2 (für eine Zeitreihe eines zeitintervallbezogenen Merkmals):
Jahr
i := Nummer des Zeitintervalls
Umsatz yi (in Mio. Euro)
Jahr
i
yi
1988
1989
1990
1991
1992
1
2
3
4
5
4.8
5.2
5.6
4.9
6.2
1993
1994
1995
1996
×
6
7
8
9
×
5.6
5.8
6.4
5.9
×
Eine Funktion y(t) ist bei Bsp 5.1.2 nur für t = 1, 2, . . . , sinnvoll zu interpretieren. Nicht sinnvoll
ist z.B. y(1.5). Um sich aber z.B. einen besseren Überblick über den Verlauf der Zeitreihe zu
38
verschaffen, ist es zweckmäßig, die Zeitreihe in einer Kurve darzustellen (Siehe die untenstehende Fig. 5-1). Dabei ist zu beachten, dass y(t) nur für bestimmte Werte von t sinnvoll zu
interpretieren ist.
y (Umsatz in Mio. Euro)
6
7
6
5
4
3
2
1
1
2
3
4
5
6
7
8
9
-t
Fig. 5-1
5.2
Komponenten einer Zeitreihe
Bei langen Zeitreihen (etwa über mehrere Jahrzehnte) ist eine Aufteilung in folgende 4 Komponenten sinnvoll:
a) Trend T (t): Grundrichtung, langfristige Entwicklung.
b) Zyklische Komponente Z(t): mittelfristige Entwicklung, z.B. Einflüsse von Konjunkturschwankungen.
c) Saisonkomponente S(t): kurzfristige Entwicklung innerhalb der einzelnen Jahre durch
saisonbedingte Schwankungen.
d) Restkomponente R(t): einmalige oder seltene Einflüsse und Zufallsschwankungen.
39
Bei kurzen Zeitreihen ist eine Trennung zwischen Trend und zyklischer Komponente nicht mehr
sinnvoll. Es bleibt eine Aufteilung in 3 Komponenten:
a) Trend T (t): Grundrichtung, b) S(t) vergl. o., c) R(t) vergl. o.
In diesem Kapitel werden nur solche Zeitreihen behandelt.
Additive Verknüpfung der Komponenten:
(5.2.1)
y(t) = T (t) + S(t) + R(t)
Multiplikative Verknüpfung der Komponenten:
(5.2.2)
y(t) = T (t) · S(t) · R(t)
Reduktion auf additiver Verknüpfung durch Logarithmeren (z.B. mit Basis ”e”)
(5.2.3)
5.3
5.3.1
ln y(t) = ln T (t) + ln S(t) + ln R(t)
Schätzung des Trends
Die Methode der gleitenden Durchschnitte
Gleitender Durchschnitt über eine ungerade Anzahl von Werten
(5.3.1)
T (i) ≈ D2m+1 (i) :=
yi−m + yi−m+1 + . . . + yi + yi+1 + . . . + yi+m
2m + 1
Rekursionsformel:
(5.3.2)
D2m+1 (i) = D2m+1 (i − 1) +
yi+m − yi−m−1
2m + 1
Eine Mittelbildung über eine gerade Anzahl von Werten würde eine Trendschätzung an einem
nicht sinnvollen Wert von t liefern. Wäre (wie etwa bei Monatswerten) doch eine Art Mittelbildung über eine gerade Anzahl wünschenswert, so kann man folgende Modifikation des gleitenden
Durchschnitts verwenden:
(5.3.3)
T (i) ≈ D2m (i) :=
0.5yi−m + yi−m+1 + . . . + yi+m−1 + 0.5yi+m
2m
Rekursionsformel:
(5.3.4)
D2m (i) = D2m (i − 1) +
(yi+m + yi+m−1 ) − (yi−m + yi−m−1 )
4m
40
Beispiel 5.3.1: Wir übernehmen die Eingangsdaten aus Beispiel 5.1.2 .
Jahr i yi Durchschnitt von Durchschnitt von
je 5 Werten
je 4 Werten
D5 (i)
D4 (i)
1988 1 4.8
×
×
×
1989 2 5.2
×
×
5.13
1990 3 5.6
5.34
5.30
5.48
1991 4 4.9
5.50
5.53
5.58
1992 5 6.2
5.62
5.60
5.62
1993 6 5.6
5.72
5.81
6.00
1994 7 5.8
5.98
5.96
5.92
1995 8 6.4
×
×
×
1996 9 5.9
×
×
Die vierte und die letzte Spalte liefern brauchbare Trendschätzungen, während die Wertefolge
in der fünften Spalte nicht immer als neue Zeitreihe sinnvoll zu interpretieren ist.
Nachteil des gleitenden Durchschnitts:
keine Trendschätzung für die ersten und letzten Werte von i.
5.3.2
Die Methode der exponentiellen Glättung
Rekursive Berechnung von T ∗ (i) als Schätzung für T (i) nach der Methode der exponentiellen
Glättung:
(5.3.5)
T ∗ (1) = y(1),
T ∗ (i) = α y(i) + (1 − α) T ∗ (i − 1)
(i ≥ 2)
Die Glättungskonstante α ist dabei eine vorher festzusetzende Zahl mit 0 ≤ α ≤ 1. Man
erhält eine starke Glättung, wenn α nahe bei 0 ist, und eine schwache Glättung, wenn α nahe
bei 1 ist.
Die Bezeichnung ”exponentielle” Glättung kommt daher, dass man aus (5.3.5) folgende Formel
herleiten kann:
(5.3.5 a)
T ∗ (i) = α
i−2
P
(1 − α)j y (i − j) + (1 − α)i−1 y(1)
j=0
Für die praktische Berechnung ist aber (5.3.5) vorzuziehen.
41
(i ≥ 2)
Beispiel 5.3.2: Wir übernehmen wieder die Eingangsdaten aus Beispiel 5.1.2 .
Jahr i
Trendschätzwerte
yi
nach der Methode
der exponentiellen
Glättung mit ...
...α = 0.2 ...α = 0.9
1988 1 4.8
4.80
4.80
1989 2 5.2
4.88
5.16
1990 3 5.6
5.02
5.56
1991 4 4.9
5.00
4.97
1992 5 6.2
5.24
6.08
1993 6 5.6
5.31
5.65
1994 7 5.8
5.41
5.78
1995 8 6.4
5.61
6.34
1996 9 5.9
5.67
5.94
T ∗ (1) ist immer = y1 , also hier = 4.80, wobei wir wie bei den nachfolgenden Werten eine Stelle
mehr als bei den Eingangsdaten angeben. Zwei weitere Ausrechnungsbeispiele:
T ∗ (2) = 0.2 · 5.20 + 0.8 · 4.80 = 4.88 bei α = 0.2
T ∗ (3) = 0.9 · 5.60 + 0.1 · 5.16 = 5.56 bei α = 0.9
5.3.3
Drei Funktionsansätze für die Trendschätzung
Linearer Ansatz:
T (t) ≈ a + bt
Parabolischer Ansatz:
T (t) ≈ a + bt + ct2
Exponentieller Ansatz:
T (t) ≈ a bt
(a, b ≥ 0)
Reduktion des exponentiellen auf den linearen Ansatz:
(5.3.6)
5.3.4
ln T (t) ≈ ln a + t ln b =: a∗ + t b∗
Die Freihandmethode
Anpassung einer Trendgerade (also linearer Ansatz) nach Augenmaß an die graphische Darstellung der Zeitreihe
42
Herunterladen