Substitution: Bei Warenart n kommt von Jahr j = 0 zu Jahr j = 1 eine neue Qualität auf den Markt, die die bisher gängige Qualität verdrängt (Beispiel: neues Kfz.-Modell). Dabei sollen folgende Bezeichnungen für die Mengen bzw. Preise verwendet werden: Jahr 0 : Jahr 1 : Jahr j(j ≥ 2) : n Warenarten mit q0,k und p0,k (k = 1, . . . , n) (n − 1) Warenarten mit q1,k und p1,k (k = 1, . . . , n − 1) Warenart n in der alten Qualität mit q1,n und p1,n Warenart n in der neuen Qualität mit q̂1,n und p̂1,n (n − 1) Warenarten mit qj,k und pj,k (k = 1, . . . , n − 1) Warenart n in der neuen Qualität mit q̂j,n und p̂j,n Die durch die Qualitätsänderung bei ”n” verursachte Preisänderung soll bei der Preisberechnung des Preisindexes eliminiert, also nicht als echte Preisänderung registriert werden. n−1 P p1,k qk + p1,n qn k=1 · 100 für j = 1 n−1 P p0,k qk + p0,n qn (4.4.6) k=1 P0,j = n−1 P pj,k qk + p̂j,n q̂n k=1 · 100 für j = 2, 3, . . . n−1 P ∗ p0,k qk + p̂0,n q̂n k=1 q1 , . . . , qn bzw. q1 , . . . , qn−1 , q̂n sind feste Gewichtungsschemata mit qn als Bezugsmenge von Warenart n in der alten und q̂n in der neuen Qualität, die durch folgenden fiktiven Preis ergänzt werden : p0,n (4.4.7) p̂∗0,n := p̂1,n p1,n Diese Formel beruht hier auf der Annahme, dass die fiktive Preisentwicklung für die Warenart n bei der neuen Qualität von 0 nach 1 genau gleich der (realen) Preisentwicklung bei der alten Qualität ist, dass also gilt: p̂1,n ! p1,n = p̂∗0,n p0,n Bei der Mengenentwicklung erscheint es wie oben zweckmäßig für q1 , . . . , qn die bisher verwendeten Gewichte beizubehalten und für q̂n die Menge von Warenart n in der neuen Qualität aus einem Jahr nach Beendigung der Übergangsphase zu nehmen. Unter der gleichen Voraussetzungen wie oben ergibt das: (4.4.8) qk = q0,k Beispiel 4.4.2: Vorgegebene Daten: Produkt A B B′ für k = 1, . . . , n; 2001 Preis/ME Menge 10.– 100 12.– 150 × – j=0 q̂n = q̂2,n 2002 Preis/ME Menge 11.– 120 13.– 50 15.– 130 j=1 2003 Preis/ME Menge 12.– 120 × – 16 160 j=2 Bei der Preisentwicklung ist zu berücksichtigen, dass B′ nicht als neues Produkt hinzukommt, sondern B ersetzt. (∗) 35 Bezeichnungen: A (k = 1): B (k = 2): (∗) B′ (k = 2): p0,1 = 10, p1,1 = 11, p2,1 = 12. q0,1 = 100, q1,1 = 120, q2,1 = 120. p0,2 = 12, p1,2 = 13, p2,2 sinnlos. q0,2 = 150, q1,2 = 50, q2,2 = 0. p̂0,2 sinnlos, p̂1,2 = 15, p̂2,2 = 16. q̂0,2 = 0, q̂1,2 = 130, q̂2,2 = 160. Gewichtung mit z.B. folgenden Mengen: q1 = q0,1 = 100, q2 = q0,2 = 150 bei 0 → 1 q1 = q0,1 = 100, q̂2 = q̂2,2 = 160 bei 0 → 2 11 · 100 + 13 · 150 · 100 = 108.9. 10 · 100 + 12 · 150 12 p0,2 (∗) = 15 · = 13.85 (Euro), Fiktiver Preis von B′ für j = 0: p̂∗0,2 = p̂1,2 · p1,2 13 P0,1 = P0,2 = 4.5 12 · 100 + 16 · 160 · 100 = 116.5 . 10 · 100 + 13.85 · 160 Einige regelmäßig veröffentlichte Indizes a) Preisindex für die Lebenshaltung Eine Berechnungsgrundlage dieses Indexes ist der Warenkorb. Das ist die Bezeichnung für die Zusammenfassung aller Warenarten mit den zugehörigen durchschnittlichen Warenmengen bezogen auf einen Haushalt. Der Durchschnitt wird dabei über eine genau festgelegte Verbrauchgruppe gebildet, z.B. über aller privaten Haushalte oder über alle 2-Personen-Haushalte von Renten- und Sozialhilfeempfängern. Zur Ermittlung der Preise der Waren aus dem Warenkorb muss eine gesonderte statistische Untersuchung durchgeführt werden. b) Index der Großhandelspreise c) Index der industriellen Bruttoproduktion Bei diesem Index werden Mengen mit Bruttoproduktionswerten pro ME (= Mengeneinheit) gewichtet. Bruttoproduktionswert = wirtschaftl. Umsatz + − Bestandsveränderungen an Halbfertig- und Fertigerzeugnissen + selbsterstellte Anlagen d) Index der industriellen Nettoproduktion Hier werden Mengen mit Nettoproduktionswerten pro ME gewichtet. Nettoproduktionswert = Bruttoproduktionswert − Materialverbrauch − vergebene Lohnarbeiten − bezogene Handelsware 36 Ein noch bessere Maß für die Eigenleistung ist die Wertschöpfung, die aber wegen des wesentlich höheren Erhebungsaufwandes in d) nicht verwendet wird. Wertschöpfung = 4.6 Nettoproduktionnswert − sonst. Vorleistungen − Abschreibung − indirekte Steuern zuzüglich Subventionen Subindizes Im Statistischen Jahrbuch für die BRD werden neben dem allgemeinen Preisindex für die Lebenshaltung Subindizes für einzelne Verbrauchsgruppen veröffentlicht, und zwar (nach einer früheren Systematik) für Ernährung, Getränke und Tabakwaren, Wohnung, Heizung und Beleuchtung, Hausrat, Bekleidung, Reinigung und Körperpflege, Bildung und Unterhaltung, Verkehr. (Für die neue Systematik vgl. neuere Ausgaben des Stat. Jahrbuchs). Mit diesen Subindizes kann die Berechnung des Gesamtindexes etwas vereinfacht werden, wenn man die Anteile der einzelnen Verbrauchsgruppen an den Gesamtausgaben für die Lebenshaltung kennt. Wie das geschieht, soll für die Aufteilung in zwei Verbrauchsgruppen I und II durchgeführt werden, die die Warenarten 1, . . . , m bzw. (m + 1), . . . , n enthalten sollen. Mit dieser Aufteilung kann der Gesamtpreisindex P0,j z.B. für j = 1 in folgender Weise umgerechnet werden, wobei q1 , . . . , qn feste Bezugsmengen sein sollen. 1 P0,1 = 100 m P p1,k qk + n P p1,k qk k=m+1 k=1 n P k=1 p0,k qk = m P k=1 n P k=1 p0,k qk p0,k qk m P · k=1 m P p1,k qk + p0,k qk k=1 n P p0,k qk k=m+1 n P p0,k qk k=1 n P k=m+1 · n P p1,k qk p0,k qk k=m+1 Die jeweils zweiten Brüche in den beiden Summanden sind gerade die Preisindizes für die Ver′ bzw. P ′′ bezeichnen. Sie sind also Subindizes. Die brauchsgruppen I und II, die wir mit P0,1 0,1 jeweils ersten Brüche lassen sich als die Anteile der Verbrauchsgruppen I und II an den (u. U. fiktiven) Gesamtausgaben deuten. Diese Anteile bezeichnen wir mit g′ bzw. g′′ . Das ergibt für j = 1 und analog für allgemeine j: (4.6.1) ′ ′′ P0,j = g′ · P0,j + g′′ · P0,j Wegen der Eigenschaften g′ , g′′ ≥ 0 und g′ + g′′ = 1 ist (4.6.1) ein gewogenes arithmetisches Mittel (vgl (3.1.3)), mit dem man hier und analog für den Fall von mehr als zwei Verbrauchsgruppen aus den Subindizes und den Ausgabenanteilen den Gesamtindex berechnen kann. Die Berechnung der Subindizes erfolgt z. T. deshalb, weil sie ein gewisses Interesse besitzen, z. T. auch deshalb, weil gewisse Manipulationen (Änderungen im Gewichtungsschema, Substitutionen usw.) durch das Vorhandensein von Subindizes erleichtert werden. Subindizes sind nicht auf die behandelte Anwendung beschränkt, sondern auch auf andere Bereiche anwendbar. 37 Kapitel 5 Zeitreihenanalyse 5.1 Einführung der Zeitreihen Unter einer Zeitreihe versteht man die Entwicklung einer bestimmten Größe, deren Werte im Zeitablauf zu bestimmten Zeitpunkten oder für bestimmte Zeitintervalle erfasst und dargestellt werden. Beispiel 5.1.1 (für Zeitreihen von zeitpunktbezogenen Merkmalen): g 2 t sei die in der Zeit t zurückgelegte Fall2 strecke. Misst man t in Sekunden und s(t) in Metern, so gilt an der Erdoberfläche für die Erdbeschleunigung g ≈ 9.81m sec−2 . a) Weg-Zeit-Funktion beim freien Fall: s(t) = Devisenkurse für US $ (Kassa Geld) Tag 15.11.04 16.11.04 17.11.04 $ für 1 Euro 1.2914 1.2931 1.3000 b) 18.11.04 1.3003 19.11.04 1.2993 Für eine Analyse dieser Zeitreihe, wie sie dann in diesem Kapitel behandelt wird, wäre eine “kompakte” Darstellung wie in Teil a) zweckmäßig, also y(t). Dabei wäre t in Tagen zu messen, und zwar an Besten so, dass y(i) der Kurswert am i-te angegebene Tag ist, also: i 1 2 3 4 5 y(i) 1.2914 1.2931 1.3000 1.3003 1.2993 Die Funktion y(t) ist aber offensichtlich ohne weitere Informationen nur für die angegebenen Werte von t, nämlich 1, 2, 3, 4, 5 definiert. Allerdings wäre z.B. y(2.5) sinnvoll, wenn noch genaue Uhrzeiten angegeben wären und der 12 Stunden später als y(2) abgefragte Kurswert bekannt wäre. Die Zeitskala ließe sich also prinzipiell beliebig verfeinern. Bsp. 5.1.2 (für eine Zeitreihe eines zeitintervallbezogenen Merkmals): Jahr i := Nummer des Zeitintervalls Umsatz yi (in Mio. Euro) Jahr i yi 1988 1989 1990 1991 1992 1 2 3 4 5 4.8 5.2 5.6 4.9 6.2 1993 1994 1995 1996 × 6 7 8 9 × 5.6 5.8 6.4 5.9 × Eine Funktion y(t) ist bei Bsp 5.1.2 nur für t = 1, 2, . . . , sinnvoll zu interpretieren. Nicht sinnvoll ist z.B. y(1.5). Um sich aber z.B. einen besseren Überblick über den Verlauf der Zeitreihe zu 38 verschaffen, ist es zweckmäßig, die Zeitreihe in einer Kurve darzustellen (Siehe die untenstehende Fig. 5-1). Dabei ist zu beachten, dass y(t) nur für bestimmte Werte von t sinnvoll zu interpretieren ist. y (Umsatz in Mio. Euro) 6 7 6 5 4 3 2 1 1 2 3 4 5 6 7 8 9 -t Fig. 5-1 5.2 Komponenten einer Zeitreihe Bei langen Zeitreihen (etwa über mehrere Jahrzehnte) ist eine Aufteilung in folgende 4 Komponenten sinnvoll: a) Trend T (t): Grundrichtung, langfristige Entwicklung. b) Zyklische Komponente Z(t): mittelfristige Entwicklung, z.B. Einflüsse von Konjunkturschwankungen. c) Saisonkomponente S(t): kurzfristige Entwicklung innerhalb der einzelnen Jahre durch saisonbedingte Schwankungen. d) Restkomponente R(t): einmalige oder seltene Einflüsse und Zufallsschwankungen. 39 Bei kurzen Zeitreihen ist eine Trennung zwischen Trend und zyklischer Komponente nicht mehr sinnvoll. Es bleibt eine Aufteilung in 3 Komponenten: a) Trend T (t): Grundrichtung, b) S(t) vergl. o., c) R(t) vergl. o. In diesem Kapitel werden nur solche Zeitreihen behandelt. Additive Verknüpfung der Komponenten: (5.2.1) y(t) = T (t) + S(t) + R(t) Multiplikative Verknüpfung der Komponenten: (5.2.2) y(t) = T (t) · S(t) · R(t) Reduktion auf additiver Verknüpfung durch Logarithmeren (z.B. mit Basis ”e”) (5.2.3) 5.3 5.3.1 ln y(t) = ln T (t) + ln S(t) + ln R(t) Schätzung des Trends Die Methode der gleitenden Durchschnitte Gleitender Durchschnitt über eine ungerade Anzahl von Werten (5.3.1) T (i) ≈ D2m+1 (i) := yi−m + yi−m+1 + . . . + yi + yi+1 + . . . + yi+m 2m + 1 Rekursionsformel: (5.3.2) D2m+1 (i) = D2m+1 (i − 1) + yi+m − yi−m−1 2m + 1 Eine Mittelbildung über eine gerade Anzahl von Werten würde eine Trendschätzung an einem nicht sinnvollen Wert von t liefern. Wäre (wie etwa bei Monatswerten) doch eine Art Mittelbildung über eine gerade Anzahl wünschenswert, so kann man folgende Modifikation des gleitenden Durchschnitts verwenden: (5.3.3) T (i) ≈ D2m (i) := 0.5yi−m + yi−m+1 + . . . + yi+m−1 + 0.5yi+m 2m Rekursionsformel: (5.3.4) D2m (i) = D2m (i − 1) + (yi+m + yi+m−1 ) − (yi−m + yi−m−1 ) 4m 40 Beispiel 5.3.1: Wir übernehmen die Eingangsdaten aus Beispiel 5.1.2 . Jahr i yi Durchschnitt von Durchschnitt von je 5 Werten je 4 Werten D5 (i) D4 (i) 1988 1 4.8 × × × 1989 2 5.2 × × 5.13 1990 3 5.6 5.34 5.30 5.48 1991 4 4.9 5.50 5.53 5.58 1992 5 6.2 5.62 5.60 5.62 1993 6 5.6 5.72 5.81 6.00 1994 7 5.8 5.98 5.96 5.92 1995 8 6.4 × × × 1996 9 5.9 × × Die vierte und die letzte Spalte liefern brauchbare Trendschätzungen, während die Wertefolge in der fünften Spalte nicht immer als neue Zeitreihe sinnvoll zu interpretieren ist. Nachteil des gleitenden Durchschnitts: keine Trendschätzung für die ersten und letzten Werte von i. 5.3.2 Die Methode der exponentiellen Glättung Rekursive Berechnung von T ∗ (i) als Schätzung für T (i) nach der Methode der exponentiellen Glättung: (5.3.5) T ∗ (1) = y(1), T ∗ (i) = α y(i) + (1 − α) T ∗ (i − 1) (i ≥ 2) Die Glättungskonstante α ist dabei eine vorher festzusetzende Zahl mit 0 ≤ α ≤ 1. Man erhält eine starke Glättung, wenn α nahe bei 0 ist, und eine schwache Glättung, wenn α nahe bei 1 ist. Die Bezeichnung ”exponentielle” Glättung kommt daher, dass man aus (5.3.5) folgende Formel herleiten kann: (5.3.5 a) T ∗ (i) = α i−2 P (1 − α)j y (i − j) + (1 − α)i−1 y(1) j=0 Für die praktische Berechnung ist aber (5.3.5) vorzuziehen. 41 (i ≥ 2) Beispiel 5.3.2: Wir übernehmen wieder die Eingangsdaten aus Beispiel 5.1.2 . Jahr i Trendschätzwerte yi nach der Methode der exponentiellen Glättung mit ... ...α = 0.2 ...α = 0.9 1988 1 4.8 4.80 4.80 1989 2 5.2 4.88 5.16 1990 3 5.6 5.02 5.56 1991 4 4.9 5.00 4.97 1992 5 6.2 5.24 6.08 1993 6 5.6 5.31 5.65 1994 7 5.8 5.41 5.78 1995 8 6.4 5.61 6.34 1996 9 5.9 5.67 5.94 T ∗ (1) ist immer = y1 , also hier = 4.80, wobei wir wie bei den nachfolgenden Werten eine Stelle mehr als bei den Eingangsdaten angeben. Zwei weitere Ausrechnungsbeispiele: T ∗ (2) = 0.2 · 5.20 + 0.8 · 4.80 = 4.88 bei α = 0.2 T ∗ (3) = 0.9 · 5.60 + 0.1 · 5.16 = 5.56 bei α = 0.9 5.3.3 Drei Funktionsansätze für die Trendschätzung Linearer Ansatz: T (t) ≈ a + bt Parabolischer Ansatz: T (t) ≈ a + bt + ct2 Exponentieller Ansatz: T (t) ≈ a bt (a, b ≥ 0) Reduktion des exponentiellen auf den linearen Ansatz: (5.3.6) 5.3.4 ln T (t) ≈ ln a + t ln b =: a∗ + t b∗ Die Freihandmethode Anpassung einer Trendgerade (also linearer Ansatz) nach Augenmaß an die graphische Darstellung der Zeitreihe 42