(c) Projekt Neue Statistik 2003 - Lernmodul: Zeitreihenanalyse Der einfache gleitende Durchschnitt Zeitreihenanalyse Der einfache gleitende Durchschnitt Worum geht es in diesem Lernmodul? Einleitung Erläuterung der Methode Berechnung des einfachen gleitenden Durchschnitts Der einfache gleitende Durchschnitt mit gerader Länge Glättung von Zeitreihen mit Saisonfigur Verlust von Werten durch Glättung Weiterführende Links Worum geht es in diesem Lernmodul? In diesem Lernmodul werden wir uns mit dem Verfahren des einfachen gleitenden Durchschnitts befassen. Mit Hilfe von Beispielen werden die möglichen Anwendungen des Verfahrens und Ihre Grenzen aufgezeigt. Die rechnerische Grundlage des Verfahrens wird ausführlich erklärt. Im Rahmen der Übungen haben Sie Gelegenheit, das Verfahren zu erproben. Einleitung Neben der im vorherigen Kapitel besprochenen Methode, die Trendkomponente einer Zeitreihe durch eine Trendgerade oder ein Trendpolynom zu erfassen, gibt es die Möglichkeit, die glatte Komponente einer Reihe mit Hilfe eines gleitenden Durchschnittes zu bestimmen. Wir wollen uns dieses Verfahren an Hand eines Beispieles ansehen. Beispiel: Die Entwicklung der globalen Durchschnitts-temperatur Seit geraumer Zeit steht die globale Erwärmung, also der Anstieg der bodennahen Temperatur, im Mittelpunkt der öffentlichen Diskussion um die Veränderung unseres Klimas. Die nachfolgende Grafik zeigt die Entwicklung der bodennahen Jahresmitteltemperatur von 1866 bis 1996 in Grad Celsius. Abb. TEMPERATUR 1: Die globale Durchschnittstemperatur Quelle: Janacek, Gareth: Practical Time Series, London, Arnold 2001 Page 1 (c) Projekt Neue Statistik 2003 - Lernmodul: Zeitreihenanalyse Der einfache gleitende Durchschnitt Der Verlauf der Zeitreihe ist sehr unruhig. Möchten wir trotzdem auf der Basis dieser Daten die Frage beantworten, ob unser Klima wärmer geworden ist und wenn um wie viel Grad, so ist es sinnvoll, die Zeitreihe zu glätten. Beispiel: Glättung mit Hilfe des einfachen gleitenden Durchschnittes Zur Glättung der Reihe benutzen wir das arithmetische Mittel. Um nicht nur einen einzigen Wert zu erhalten, berechnen wir nicht den Mittelwert der gesamten Reihe, sondern bilden die Mittelwerte über gleichlange Teilstücke. In diesem Fall werden wir jeweils das Mittel über 21 Werte berechnen, d.h. wir berechnen den Mittelwert der ersten 21 Werte, dann den des 2. bis 22. Wertes, des 3. bis 23., des 4. bis 24. und sofort. Die arithmetischen Mittel werden jeweils dem zeitlichen Mittelpunkt des Teilstücks zugeordnet, d.h. der Mittelwert des ersten Teilstücks wird dem Zeitpunkt t=11, der des 2. Teilstücks dem Zeitpunkt t=12 , der des dritten Teilstücks dem Zeitpunkt t=13, usw. zugeordnet. Das Ergebnis ist die geglättet Zeitreihe der globalen Durchschnittstemperatur (roter Linienzug in Abb.: TEMPERATUR 2). Abb. TEMPERATUR 2: Ausgangsreihe (blau) und geglättete Reihe (rot) der globalen Durchschnittstemperatur Quelle: Janacek, Gareth: Practical Time Series, London, Arnold 2001 Die Relevanz der Temperaturdaten ist nicht unumstritten. Nehmen wir aber die vorliegenden Daten als Grundlage, so ist nach der Glättung deutlich eine Steigung von ca. 0.6 Grad abzulesen. Dies entspricht der Einschätzung namhafter Wissenschaftler auf dem Gebiet der Klimaforschung. [Kapala, 2002] Erläuterung der Methode Die im vorangegangenen Beispiel benutzte Methode des einfachen gleitenden Durchschnitts wird zur Glättung von Zeitreihen benutzt. Glättung meint die Ausschaltung von irregulären Schwankungen. Unter Annahme des klassischen Komponentenmodells kommt dies der näherungsweisen Bestimmung der glatten Komponente gleich. Bei der Anwendung des einfachen gleitenden Durchschnitts wird für gleich lange Zeitreihensegmente das zugehörige arithmetische Mittel berechnet und den jeweiligen zeitlichen Mittelpunkten der Segmente zugeordnet. Diesen Zusammenhang veranschaulicht die nachfolgende Animation. : Flashanimation ' Animation Der einfache gleitende Durchschnitt ' siehe Online-Version Berechnung des einfachen gleitenden Durchschnitts Die folgende Tabelle gibt einige Beispiele zur Berechnung einfacher gleitender Durchschnitte mit ungerader Länge wieder: Länge Page 2 Formel (c) Projekt Neue Statistik 2003 - Lernmodul: Zeitreihenanalyse Der einfache gleitende Durchschnitt 3 5 7 9 Die mathematische Formel zur Berechnung des einfachen gleitenden Durchschnitts lautet: Jeder Wert des Segmentes wird demzufolge gleich gewichtet, mit . Der Laufindex q lässt sich aus der für den einfachen gleitenden Durchschnitt gewählten Segmentlänge, also der Anzahl der zur Mittelwertsbildung einbezogenen Werte berechen: . In der Regel wird die Länge des einfachen gleitenden Durchschnittes ungerade gewählt. Beispiel: Jährliche Konkurse in den USA Die Ausgangszeitreihe in Abb. KONKURSE zeigt den prozentualen Anteil der jährlich in Konkurs gegangenen Unternehmen an allen Unternehmen in den USA von 1867 bis 1932 (blauer Linienzug). Die Zeitreihe (blauer Linienzug) wurde geglättet mit einfachen gleitenden Durchschnitten der Länge drei (dunkelroter Linienzug), sieben (orange) und dreizehn (türkis). Abb. KONKURSE Quelle: Rainer Schlittgen (1994) Sie haben hier die Möglichkeit, das Verfahren des einfachen gleitenden Durchschnitts an dem recht unruhigen Verlauf des Züricher Aktienindex zu erproben. Labordatei öffnen ( aa3.spf ) Der einfache gleitende Durchschnitt mit gerader Länge Wird der einfache gleitende Durchschnitt für eine gerade Anzahl von Werten bestimmt, liegt der Segmentmittelpunkt zwangsläufig zwischen zwei Zeitpunkten. So müsste beispielsweise der erste Wert, einer mit einem einfachen gleitenden Durchschnitt der Länge vier geglätteten Zeitreihe, dem Zeitpunkt 2.5 zugeordnet werden: Inhaltlich ist dies nicht sinnvoll, denn man enthält einen Wert für einen Zeitpunkt zu dem nie gemessen wurde. Um das Problem zu umgehen, behilft man sich mit einem kleinen Trick und erhöht die Segmentlänge um eins, lässt dafür aber die Randpunkte nur mit halbem Gewicht eingehen. Page 3 (c) Projekt Neue Statistik 2003 - Lernmodul: Zeitreihenanalyse Der einfache gleitende Durchschnitt Beispiele einfacher gleitender Durchschnitte mit gerader Länge Länge Formel 2 4 6 8 Den Laufindex berechnet sich in diesem Fall entsprechend aus der halben Länge . Glättung von Zeitreihen mit Saisonfigur Liegt eine Zeitreihe mit Saisonkomponente vor, empfiehlt es sich die Länge des einfachen gleitenden Durchschnitts entsprechend der einfachen oder mehrfachen Periodendauer der Saison zu wählen. Die geglättete Zeitreihe weist dann keine Saisonfigur mehr auf. Beispiel: Umsatzzahlen mit Saisonfigur Ein Einzelhändler hat 1987 ein Lebensmittelgeschäft übernommen. In den ersten drei Jahren lief der Verkauf in den unveränderten Räumen. 1990 entschloss sich der Händler zu einer Vergrößerung und Modernisierung der Verkaufräume. Jetzt liegen ihm die Umsätze der letzten 15 Jahre vor (Abb. UMSATZ: blauer Linienzug). Abb.UMSATZ Fragestellung Der Händler möchte die Entwicklung des Umsatzniveaus in den letzten 15 Jahren abschätzen. Außerdem will er wissen, ob sich der Umbau auf die Verkaufszahlen positiv ausgewirkt hat. Er plant zudem eine zweite Erweiterung seiner Ladenfläche und würde daher gerne den zu erwartenden Umsatz prognostizieren. Antwort Zur Beantwortung dieser Fragen wird die Zeitreihe des Umsatzes mit einem einfachen gleitenden Durchschnitt der Länge 24, der doppelten Periodenlänge, geglättet (Abb. UMSATZ: roter Linienzug) Wie in der Grafik gut zu sehen ist, wird dadurch die Saisonfigur beseitigt und die glatte Komponente herausgearbeitet. Im Jahre 1987 beträgt der Umsatz im Mittel ca. 28.000 Euro und wächst auf ein Niveau von ca. 35.000 Euro im Jahre 2000. Deutlich ist ein linearer Anstieg ab dem Jahr 1990/1991 zu erkennen. Wenn der steigende Umsatz nicht Page 4 (c) Projekt Neue Statistik 2003 - Lernmodul: Zeitreihenanalyse Der einfache gleitende Durchschnitt auf andere Einflüsse zurückgeführt werden kann, so war die Modernisierung der Verkaufsfläche offensichtlich eine gute Entscheidung. Zur Prognose der zukünftigen Umsätze ist der einfache gleitende Durchschnitt denkbar ungeeignet. Die geglättete Zeitreihe enthält nur Werte bis zum Juni 2000. Der Zeitpunkt zu dem der Händler die Zeitreihe betrachtet, ist aber der Juni 2001. Bedingt durch das Konzept des gleitenden Durchschnitts und die hier gewählte Länge 24, fehlen die letzten zwölf Werte. Auf dieser Grundlage eine Prognose zu wagen, wäre also eher spekulativ. Die Zeitreihe der Leistungsbilanz des Außenhandels zeigt deutlich eine Saisonfigur. Beseitigen Sie diese mit Hilfe eines einfachen gleitenden Durchschnittes. Labordatei öffnen ( b1e.spf ) Verlust von Werten durch Glättung Bei der Glättung durch einen einfachen gleitenden Durchschnitt gehen an beiden Rändern der Zeitreihe jeweils q Werte verloren. Das ist oft, wie im vorangegangenen Beispiel, speziell für den aktuellen Rand der Zeitreihe, nicht akzeptabel. Die folgende Animation im Statistiklabor verdeutlicht dieses Problem. Labordatei öffnen ( b26.spf ) Weiterführende Links Zeitreihen zum Üben und Ausprobieren: vergleiche : Chatfield, Christopher (1982). Analyse von Zeitreihen. München, Hanser. Janacek, Gareth (2001). Practical Time Series. London, Arnold. Schlittgen, Rainer (2001). Angewandte Zeitreihenanalyse. München; Wien, Oldenbourg. Schlittgen, R.; Streitberg, B.H.J. (2001).Zeitreihenanalyse . München; Wien, Oldenbourg. Kapala, A. (2002): Änderung der "globalen" Temperatur. Internet: (c) Projekt Neue Statistik 2003, Freie Universität Berlin, Center für Digitale Systeme Kontakt: http://www.neuestatistik.de Page 5