Prof. Regina T. Riphahn, Ph.D. WS 04/05 Abschlussklausur zur Veranstaltung "Einführung in die Ökonometrie" am 24. Februar 2005, 9.00-10.30 Uhr Erlaubte Hilfsmittel: Tabelle der statistischen Verteilungen, 4 DIN A4-Seiten eigene Notizen, Taschenrechner, Fremdwörterbuch. Bearbeitungszeit: 90 Minuten Die Klausur besteht aus 5 Aufgaben, in denen insgesamt 90 Punkte erworben werden können. Die Punktzahl je Aufgabe, bzw. je Teilaufgabe, ist in eckigen Klammern angegeben und entspricht der für die Aufgabe aufzuwendenden Zeit in Minuten. Das Team der Abteilung Statistik und Ökonometrie wünscht Ihnen viel Erfolg! Klausurergebnis: Aufgabe 1 2 3 4 5 Punkte: Aufgabe 1: [34] Als wissenschaftlicher Mitarbeiter eines Schlafinstituts versuchen Sie schon seit längerem, geeignete Determinanten zu finden, die menschliches Schlafverhalten erklären können. Nach jahrelanger Forschung und vielen schlaflosen Nächten sind Sie auf folgende Gleichung gekommen: SLEEP = β1 + β2 * TOTWRK + β3 * EDUC + β4 * AGE + β5 * MARR Um Ihre Gleichung schätzen zu können, nutzen Sie amerikanische Querschnittsdaten aus dem Jahre 1990 mit 532 Beobachtungen. Die Variablen sind wie folgt definiert: SLEEPi TOTWRKi EDUCi AGEi MARRi MALEi Schlaf pro Woche einer Person i, gemessen in Minuten Totale Arbeitszeit pro Woche der Person i , gemessen in Minuten Ausbildung der Person i , gemessen in Anzahl der Schuljahre Alter der Person i, gemessen in Jahren Dummy-Variable mit Ausprägung 1, wenn Person i verheiratet, sonst 0 Dummy-Variable mit Ausprägung 1, wenn Person i männlich, sonst 0 Gesamthaft führen Sie drei Schätzungen durch. Die erste (Tabelle 1) beinhaltet sämtliche 532 Beobachtungen. Da Sie der Überzeugung sind, dass das Schlafverhalten zwischen Männern und Frauen jedoch grundsätzlich anders ist, schätzen Sie erneut nur für Männer (Tabelle 2) und danach nur für Frauen (Tabelle 3). a) Interpretieren Sie den Regressionsparameter b5 der Tabelle 1 statistisch und inhaltlich.[2] b) Testen Sie H 0 : β 2 − β3 + β 4 = 10 für Tabelle 1 auf dem 5%-Signifikanzniveau zweiseitig. Stellen Sie die Alternativhypothese auf. Sie wissen, dass Cov(b2 , b3 ) = 0 , Cov(b2 , b4 ) = 0 und Cov(b3 , b4 ) = 0 . Geben Sie die korrekte Anzahl der Freiheitsgrade an, verwenden Sie jedoch DF = ∞ . [5] c) Die berechnete Durbin-Watson Statistik hat den Wert 1.917767 (Tabelle 1). Testen Sie H 0 : ρ ≥ 0 auf dem 5% Signifikanzniveau und erläutern Sie Ihre Vorgehensweise detailliert. Erläutern Sie die Alternativhypothese in Worten. [4] d) Sie vermuten, dass Sie entscheidende Variablen ausgelassen haben. Deshalb schätzen Sie Abschlussklausur "Einführung in die Ökonometrie", WS 04/05 1/7 Ihr Modell erneut, diesmal zusätzlich mit den prognostizierten Werten der abhängigen Variablen in zweiter und dritter Potenz. Warum kann das nützlich sein? Die nun berechnete Fehlerquadratsumme ist 85774437. Welchen Schluss können Sie daraus ziehen? Erläutern Sie Ihr Vorgehen (verwenden Sie Tabelle 1). [5] e) Sie glauben weiter, dass der Einfluss der Arbeitsstunden auf das Schlafbedürfnis mit der Ausbildung des Arbeitnehmers variiert. Wie können Sie diese Hypothese testen? [3] f) Führen Sie einen Chow-Test bei einem Signifikanzniveau von 5% durch, um zu prüfen, ob es signifikante Unterschiede in den Regressionsergebnissen für Männer und Frauen gibt. Zu welchem Ergebnis kommen Sie? Wie sieht das unrestringierte Modell formal aus? [8] g) Sie befürchten, dass die Variable TOTWRK mit dem Störterm korreliert. Was hätte das für Auswirkungen? Sie führen einen Hausman Test mit Hilfe von Instrument-Variablen durch. Erklären Sie genau Ihre Vorgehensweise. Welche Bedingungen müssen die Instrumente erfüllen? [7] Tabelle 1: Dependent Variable: SLEEP Method: Least Squares Sample (adjusted): 1 532: Included observations: 532 after adjustments Variable Coefficient Std. Error t-Statistic C TOTWRK EDUC AGE MARR R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat Tabelle 2: 0.113715 0.10529 407.6534 87411354 -3949.4 1.917767 138.3 0.2 7.2 1.6 41.9 R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat 3740.654 -0.193726 -9.834978 1.396035 56.52929 0.144577 0.129675 400.6014 46058189 -2168.657 1.800945 199.2318 0.029113 9.557494 2.299914 71.36427 R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat 3579.708 -0.119563 -10.32447 0.200901 70.98971 0.077318 0.057518 417.6626 40645002 -1778.375 1.950652 Abschlussklausur "Einführung in die Ökonometrie", WS 04/05 203.2932 0.030968 10.98434 2.485346 63.54732 Prob. 0 0 0.1651 0.539 0.0583 3259.466 430.9729 14.86993 14.91816 13.4977 0 t-Statistic Prob. 18.77538 -6.654264 -1.029033 0.606994 0.792123 0 0 0.3043 0.5443 0.4289 Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic) Dependent Variable: SLEEP Method: Least Squares Sample: 1 532 IF MALE=0: Included observations: 259 Variable Coefficient Std. Error C TOTWRK EDUC AGE MARR 26.1012292 -0.75 -1.38888889 0.9375 1.550358 Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic) Dependent Variable: SLEEP Method: Least Squares Sample: 1 532 IF MALE=1: Included observations: 273 Variable Coefficient Std. Error C TOTWRK EDUC AGE MARR Tabelle 3: 3609.8 -0.15 -10 1.5 64.96 3225.939 429.4095 14.84408 14.91944 9.70134 0 t-Statistic Prob. 17.6086 -3.860808 -0.939926 0.080834 1.117116 0 0.0001 0.3482 0.9356 0.2651 Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic) 3300.569 430.2185 14.93201 15.01928 3.904933 0.002033 2/7 Aufgabe 2: [21] In einem einfachen Regressionsmodell yt = $1 + $2 xt + et hat die Varianz des Störterms folgende Struktur: Ft2 = F2 xt3 a) Welche Auswirkungen hat dies auf die Eigenschaften des Kleinstquadrateschätzers? [2] b) Wie würden Sie vorgehen, um eine Schätzung mit homoskedastischen Fehlern zu erhalten? Erläutern Sie Ihre Vorgehensweise und zeigen Sie, dass der in Ihrem Verfahren resultierende Störterm homoskedastisch ist. [4] c) Gibt es ein alternatives Verfahren, das Problem anzugehen? Erläutern Sie dieses verbal und formal. [4] d) Erläutern Sie detailliert, wie man am Beispiel der oben genannten Störtermvarianz formal auf Heteroskedastie testen kann. [6] e) Wie lautet Ihr Schluss am 5 Prozent Signifikanzniveau für einen einseitigen Test der Homoskedastie als Nullhypothese, wenn die Teststatistik für den Test aus Aufgabe (d) den Wert 2,08 annimmt und Sie mit insgesamt 26 Beobachtungen gearbeitet haben? [2] f) Sie erfahren nachträglich, dass die Varianz des Störterms die Form Ft2 = F2 xt2 annimmt. Was bedeutet dies für Ihre Schätzergebnisse aus Teilaufgabe (b)? [3] Aufgabe 3: [5] Zeigen Sie, dass folgender Zusammenhang zwischen der Teststatistik des F-Tests (F) und dem Gütemass R2 gilt: R 2 /( k − 1) F= (1 − R 2 ) /(T − k ) wobei k die Anzahl der geschätzten Steigungsparameter und T die Anzahl der Beobachtungen angibt. Aufgabe 4: [15] Wahr oder Falsch? Tragen Sie für zutreffende Aussagen den Buchstaben w (für wahr), für nicht zutreffende f (für falsch) ein. (Für jede richtige Antwort gibt es 0,75 Punkte, für jede falsche Antwort werden 0,75 Punkte abgezogen. Die Gesamtpunktzahl kann nicht negativ werden.) Die Chi-Quadrat Verteilung ist eine einparametrige Verteilung. Bei immer grösser werdenden Stichproben tendiert die Varianz der mit dem Kleinstquadrateverfahren geschätzten Parameter gegen Null. Das Auslassen relevanter erklärender Variablen führt in manchen, aber nicht in allen Fällen zu verzerrten Koeffizientenschätzungen für die berücksichtigten erklärenden Variablen. Wenn die Standardfehler von Koeffizienten unterschätzt werden, sind die geschätzten Konfidenzintervalle der Koeffizienten zu breit. Bei gegebener Typ I Fehlerwahrscheinlichkeit ( α ) ist die Wahrscheinlichkeit eines Typ II Fehlers positiv mit der Stichprobengrösse korreliert. Regressiert man eine logarithmierte abhängige Variable (ln Y) auf eine logarithmierte erklärende Variable (ln X), so gibt der Koeffizient an, um wieviel Prozent sich Y ändert, wenn X um eine Einheit steigt. Das Gauss-Markov Theorem gilt nur für kleine Stichproben. Der Kleinstquadrateschätzer ist umso unverzerrter, je grösser die Stichprobe. Abschlussklausur "Einführung in die Ökonometrie", WS 04/05 3/7 Heteroskedastie führt zu ineffizienten aber unverzerrten Schätzergebnissen. Im Rahmen des "Two stage least squares" Verfahren wird im zweiten Schritt die abhängige Variable auf den vorhergesagten Wert einer oder mehrerer erklärender Variablen regressiert. Der Hausman Test vergleicht die Ergebnisse verschiedener Schätzverfahren. Um nichtlineare Zusammenhänge zwischen erklärenden und abhängigen Variablen abzubilden, muss mehr als eine erklärende Variable im Modell sein. Der Jarque-Bera Test prüft, ob eine Zufallsvariable standardnormalverteilt ist. Der k-te Moment einer Zufallsvariable (Y) entspricht dem Erwartungswert von Yk. Der Durbin-Watson Test ist nicht geeignet, um auf Autokorrelation zu testen, wenn der Störterm von mehr als einem seiner verzögerten Werte bestimmt wird. Es gibt Situationen in denen der Durbin-Watson Test nicht zu einem klaren Testergebnis führt. Der Goldfeld-Quandt Test prüft genau wie der Chow Test, ob zwei Teilstichproben mit dem gleichen Modell geschätzt werden sollten. Solange im Modell eine Konstante berücksichtigt ist, werden die Koeffizienten kategorischer erklärender Variablen hinsichtlich einer Referenzkategorie interpretiert. Das angepasste R2 sinkt, wenn die gleiche Erklärungsgüte mit weniger geschätzten Parametern erzielt werden kann. Bei Messfehlern in den erklärenden Variablen ist der Kleinstquadrateschätzer inkonsistent. Aufgabe 5: [15] Sind folgende Aussagen richtig? Erläutern Sie stichwortartig Ihre Auffassung (Bsp.: "Stimmt, weil..." bzw. "Stimmt nicht, weil..."). Nur bei korrekter Begründung wird die Antwort mit 1,5 Punkten pro Frage honoriert. Durch die Berücksichtigung externer Informationen im Rahmen eines restricted least squares Schätzers kann sich die Qualität der Schätzung verschlechtern. Der Lagrange Multiplier Test auf Autokorrelation ist nur bei Autokorrelation erster Ordnung anwendbar. Monte Carlo Simulationen nutzen vorliegende Datensätze, um zu überprüfen ob vorgegebene Beziehungen in den Daten gelten. Abschlussklausur "Einführung in die Ökonometrie", WS 04/05 4/7 Die Varianz des Vorhersagefehlers bei Vorhersagen auf Basis eines linearen Modells hängt nicht von der Kovarianz zwischen geschätzter Regressionskonstante und Steigungsparameter ab. Der Hausman Test kann in der Form eines F-Tests durchgeführt werden. Darstellungen der Residuen erlauben Rückschlüsse auf mögliche Autokorrelation, aber nicht auf mögliche Heteroskedastie. Beim RESET Test wird der vorhergesagte Wert des Störterms als zusätzlicher Regressor im Modell verwendet. Die Auswirkungen von Autokorrelation und Heteroskedastie auf den Kleinstquadrateschätzer sind gleich. Die Nullhypothese ρ ≤ 0 wird im Durbin-Watson Test verworfen, wenn die Durbin-Watson Teststatistik grösser ist als 4 - dL , wobei dL den unteren kritischen Wert des Durbin-Watson Tests angibt. Der Wert der geschätzten Koeffizienten ändert sich nicht, wenn alle Variablen des Modells (abhängige und unabhängige) durch einen Faktor 1'000 dividiert werden. Abschlussklausur "Einführung in die Ökonometrie", WS 04/05 5/7