Vorlesung zur Wirtschaftspolitik Empirical Banking and Finance Wintersemester 2007/2008 Vorlesung 2, Teil 1 30. Oktober 2007 Prof. Dr. Isabel Schnabel Johannes Gutenberg-Universität Mainz II.2 Validität einer empirischen Studie (Wiederholung) Æ Stock/Watson, Kapitel 9, S. 312-340 9.1 Interne und externe Validität einer empirischen Studie 9.2 Einschränkungen der internen Validität 9.3 Interne und externe Validität bei Prognosen 2 Interne und externe Validität einer empirischen Studie • • • • Ziel der meisten empirischen Studien: Schätzung eines kausalen Effekts, z. B. Schätzung des kausalen Effekts der Klassengröße auf das Testergebnis Wie beurteilt man, ob eine empirische Studie zuverlässige Ergebnisse liefert? Was kann schiefgehen bei Verwendung des multiplen linearen Regressionsmodells? 2 Kriterien: 1. 2. Interne Validität: Gültigkeit der Studie für die gegebene Grundgesamtheit Externe Validität: Verallgemeinerbarkeit der Ergebnisse 3 Interne Validität (internal validity) • Mögliche Einschränkungen der internen Validität: 1. 2. OLS-Schätzer sind verzerrt / inkonsistent Æ Schätzer liefern im Schnitt den falschen Wert Standardfehler (= Schätzer der Standardabweichungen) der Schätzer sind verzerrt / inkonsistent Æ Hypothesentests liefern keine gültigen Ergebnisse 4 Externe Validität (external validity) Mögliche Einschränkung der externen Validität: • • • Verallgemeinerung auf andere Populationen oder auf ein anderes institutionelles Umfeld ist unzulässig, z. B. USA vs. Deutschland, Mäuse vs. Menschen (Laborexperimente), 1950 vs. 2007 Überprüfung der externen Validität: Wiederholung einer Studie mit anderen Daten und Vergleich der Ergebnisse 5 Einschränkungen der internen Validität • 5 Gründe für die Verzerrung / Inkonsistenz des OLSSchätzers: 1. 2. 3. 4. 5. • Ausgelassene Variablen Fehlspezifikation der funktionalen Form Messfehler in den erklärenden Variablen Stichprobenselektion Simultanität / umgekehrte Kausalität In all diesen Fällen sind die Regressoren mit dem Fehlerterm korreliert Æ Verletzung der zentralen OLS-Annahme MLR.4 6 (1) Ausgelassene Variablen • • Auslassen einer Variable, die eine Determinante von y ist und die mit einer der eingeschlossenen x-Variablen korreliert ist Lösungen: 1. 2. 3. 4. Einschließen der ausgelassenen Variable Einschließen einer Proxy-Variable Instrumentvariablenschätzung Paneldatenmethoden 7 (2) Fehlspezifikation der funktionalen Form Kann ebenfalls interpretiert werden als Problem ausgelassener Variablen • Beispiel: Schätzung einer linearen statt einer quadratischen Regressionsfunktion • • • Ausgelassene Variable = quadratischer Term Problem kann typischerweise leicht behoben werden, indem eine nicht-lineare Regressionsfunktion geschätzt wird 8 (3) Messfehler in den erklärenden Variablen Messfehler in den erklärenden Variablen (measurement error, errors in variables) führen zu einer Korrelation des Fehlerterms mit den xVariablen • Gründe für Messfehler: • • • • • Falsche Messungen Bewusst oder unbewusst falsche Angaben in Befragungen Tippfehler bei der Dateneingabe Verwendung von Proxy-Variablen 9 „Klassischer“ Messfehler Man spricht von einem Klassischen Messfehler, wenn die gemessene Variable sich durch einen zufälligen Störterm von der wahren Variable unterscheidet • In diesem Fall lässt sich zeigen, dass der interessierende Effekt tendenziell unterschätzt wird (sog. attenuation bias) • Die Unterschätzung ist ceteris paribus umso größer, je höher die Varianz des Störterms des Messfehlers ist • 10 Lösungen für Messfehlerprobleme • • Man sollte zunächst versuchen, Variablen mit geringeren Messfehlern zu finden Ökonometrische Lösungen: 1. 2. Instrumentvariablenschätzung Korrektur des Schätzers, falls die Form des Messfehlers bekannt ist 11 (4) Stichprobenselektion Stichprobenselektion (sample selection) liegt vor, wenn die Selektion in die Stichprobe von der abhängigen Variable (y) abhängt • Kann bei Ziehung einer echten Zufallsstichprobe nicht vorkommen • Lösung: Sog. Heckman-Korrektur • 12 (5) Simultanität / umgekehrte Kausalität Wir sind bislang davon ausgegangen, dass die Kausalität von x auf y ausgeht • Wenn die Kausalität in beide Richtungen verläuft, kommt es zu einer Korrelation von x und dem Fehlerterm und damit zu verzerrten/inkonsistenten Schätzern • 13 Lösung für Simultanitätsprobleme Wichtigster Lösungsansatz: Instrumentvariablenschätzung • Modell kann als Zweigleichungsmodell aufgeschrieben werden: • • • y ist eine Funktion von x x ist eine Funktion von y 14 Inkonsistenz der Standardfehler • • • • Bislang: Gründe für Verzerrung/Inkonsistenz des OLS-Schätzers Selbst wenn die OLS-Schätzer unverzerrt / konsistent sind, kann es sein, dass die Standardfehler inkonsistent geschätzt werden Folge: Hypothesentests führen zu ungültigen Ergebnissen 2 Gründe für Inkonsistenz der Standardfehler: 1. 2. Heteroskedastie Autokorrelation 15 Heteroskedastie Problem kann leicht gelöst werden, indem man Heteroskedastie-konsistente (robuste) Standardfehler verwendet • Schätzer sind allerdings nicht effizient (d. h., sie haben nicht die kleinste Varianz) • 16 Autokorrelation • Autokorrelation (autocorrelation, serial correlation) bedeutet, dass die Fehlerterme über verschiedene Beobachtungen hinweg korreliert sind • • Echte Zufallsstichprobe schließt Autokorrelation aus Aber: Übliches Phänomen in Zeitreihendaten und Paneldaten In diesem Fall sind auch die Heteroskedastiekonsistenten Standardfehler inkonsistent • Es gibt jedoch auch Autokorrelation-konsistente Standardfehler • 17 Interne und externe Validität bei Prognosen Soll ein Regressionsmodell nur zur Prognose verwendet werden, ist es nicht wichtig, ob das Modell tatsächlich kausale Effekte schätzt • Wichtig ist hingegen, dass… • • • • die Schätzung einen hohen Erklärungsgehalt hat, die Schätzung präzise ist, sich die Ergebnisse der Schätzung auf Populationen außerhalb der Stichprobe verallgemeinern lassen (externe Validität) 18 Fazit • Um zu beurteilen, wie zuverlässig die Ergebnisse einer empirischen Studie sind, ist es wichtig, die interne und externe Validität der Studie zu überprüfen 19