Prof. Bernd Fitzenberger, Ph.D. Einführung in die empirische Wirtschaftsforschung Fragestunde: 10. Februar 2009 Studierender 1: Hier meine Fragen zu Empiwifo: Zu 5.2. Multivariate Regression - Warum kann man mit dem χ2 -Test nur zweiseitige Tests durchführen? Die Abb. 5.2. (S. 135) zeigt doch einen einseitigen Test. - Müssen wir die Formeln für die F- und χ2 -Teststatistiken genau angeben können? (also wie bei der t-Statistik?) Antwort: Nein Zu 5.4.Multikollinearität - Im Skript steht, das Modell eigne sich gut für Prognosezwecke, da man den gemeinsamen Effekt der Regressoren präziser schätzen kann (S. 167). Heißt das, dass man die Prognosefähigkeit erhöhen kann, indem man noch mehr Regressoren aufnimmt, die miteinander korreliert sind? Antwort: Ja, solange die Zahl der Regressoren klein ist im Vergleich zu den Beobachtungen - Wir haben im TSP-Programm herausgefunden, dass die Korrelation zwischen t und ln(K/L) fast 1 ist. (S. 179) Wie kann man das ökonomisch interpretieren? Dass die Kapitalintensität relativ zur Arbeitsintensität im Zeitablauf zunimmt? Antwort: Kapitalintensität folgt fast exakt einem positiven, linearen Trend - Könnten Sie die partitionierte Regression, ibs. die Umsetzung im TSPBeispiel (ab S. 172), nochmal erklären? Zu 6.1. - Könnten Sie nochmal die Formel des ADF-Tests erklären und wann man ihn anwendet (im Gegensatz zum normalen DF-Test)? (S. 211) Zu 6.2. Fehlerkorrekturmodell 1 - Warum geben die Variablen in ersten Differenzen (alpha) die kurzfristigen Beziehungen an? (S. 216 f.) Antwort: Weil hier die laufenden und verzögerten Veränderungen, nicht aber die Niveaus in Beziehung gebracht werden. Studierender 2: Im ersten Kapitel bei der Diskussion der Indizes steht im Skript auf S. 22: ” Der Laspeyres-Preisindex reagiert per Definition nicht auf eine Verschiebung des Warenkorbes.” Mir ist nicht klar, wie diese Aussage zu verstehen ist. Eine Veränderung des Basisjahres wäre doch (so wie ich es verstehe) eine Verschiebung des Warenkorbes, durch die Veränderung der Gewichtung ergibt sich dann aber doch auch eine Reaktion des Indexes (nach unten wenn Substitution weg von Gütern mit hoher Preissteigerung stattgefunden hat, nach oben wenn Preissteigerungen vor allem nachfragegetrieben waren). Antwort: Basisjahr definiert Warenkorb und es werden die Preisveränderungen für diesen Warenkorb analysiert ... In Kapitel vier im Beispielprogramm zur Varianzanalyse werden am Ende im mehrfaktoriellen Fall Tests durchgeführt. Dabei werden empirische F- Teststatistiken berechnet und mit kritischen Werten verglichen. Bei der Berechnung der kritische Werte werden jedoch bis auf den ersten Test immer die gleichen Freiheitsgrade verwendet, die sich auch von denen bei Berechnung der Teststatistik unterscheiden. Warum ist das so und wieso wird gerade diese Anzahl Freiheitsgrade gewählt? Antwort: Die Freiheitsgrade sollten immer denen entsprechen, die bei der Berechnung der F-Teststatistik verwendet werden. Wenn das nicht der Fall ist, dann liegt ein Fehler vor. Im Skript sind die TSP-Zeile 186-187, 195-196 und 204-205 redundant (Zeilen 187, 196, 205 sind falsch). Der Nenner umfasst immer die Within Fehlerquadratsumme dividiert durch dfden=G*H*(K-1) als Maß der durchschnittlichen Within–Varianz. 2 Frage an Frau Sommerfeld: Das Fehlerkorrekturmodell im Lehrbuch von Schröder berücksichtigt für deltaY(t) nicht den Wert von deltaX(t), sondern nur gelagte Werte sowohl von y als auch von x (bzw. bei Schröder von Y1 und Y2). Das Modell in der Vorlesung und in der Übung berücksichtigt jedoch diesen Term (das gilt auch für die Formel im Lehrbuch von Ronning), ich habe es sogar so verstanden, dass dieser Term auf jeden Fall berücksichtigt werden sollte. Die Anzahl der gelagten Werte J haben wir in den Übungsbeispielen ja erst noch ermittelt, diese kann ja durchaus 0 betragen. Da die Summe für X(t-j) aber über j=0 bis J läuft, wird der Wert von X(t) in jedem Fall berücksichtigt. Gerade dieser Term fehlt jedoch im Lehrbuch, hier läuft die Summe ab 1 (für X und Y und nicht nur wie bei unserer Formel für Y). Der Wert von dlnae fehlt dementsprechend auch in der Schätzung des Fehlerkorrekturmodells von dlnip (und umgekehrt umgekehrt). Das würde ja heißen, dass die Veränderung der Aufträgseingänge zum Zeitpunkt t keinen Einfluss auf die Veränderung der Industrieproduktion hat, sondern nur die Veränderungen der Vergangenheit sowie die Abweichung vom langfristigen Gleichgewicht eine Rolle spielen. Das scheint mir auch ökomomisch weniger Sinn zu machen. Bei Einbeziehung des Terms in die Schätzung (siehe Output) ergibt sich auch ein signifikanter Koeffezient. Ich kann also keinen Grund finden, warum er weggelassen werden sollte. Warum fehlt dieser Term trotzdem? Im Lehrbuch von Ronning habe ich auch gesehen, dass die Summen für X(t-j) und Y(t-j) nicht beide bis zum gleichen Wert J laufen, im Gegensatz zur Formel in der Übung. Gibt es einen Grund warum sinnvollerweise die Anzahl der verwendeten Lags gleich sein sollte? FYI: Die Zusatzaufgabe lautete übrigens wie folgt: ”Im Kursverzeichnis liegen die Daten für das Beispiel zur deutschen Industrieproduktion (schroekap5.xls) aus Kapitel V.1-V.5 in Schröder (2002). Replizieren Sie das Beispiel in TSP.” Die Daten behandel Auftragseingänge (AE) und Industrieproduktion (IP), daraus ergeben sich dnlae für die Differenz der gelagten AE und analog dnlip für die Differenz der gelagten IP. Antwort: Ob der nicht gelagte Werte von Delta X(t) verwendet wird, hängt davon ab, ob man den gleichzeitigen Zusammenhang von in Periode t untersuchen will oder nicht und ob es ein Endogenitätsproblem gibt. Lags von X(t-j) und Y(t-j) müssen nicht bis zum gleichen Wert J laufen. Es kommt auf Signifikanzen und öknomische Relevanz an. 3 Studierender 3: Ich habe eine Frage zum Bezug zwischen Endogenität und Multikollinearität: Um das Endogenitätsproblem in einer Gleichung j zu lösen, wird - wie ich es verstehe - die endogene erklärende Variable im ersten Schritt selber geschätzt, und zwar mit Hilfe der anderen erklärenden Variablen aus j sowie mindestens eines Instruments, das keinen direkten Einfluss auf die Erklärte in j hat. Wenn dies richtig ist und die endogene Variable auch durch andere erklärende Variablen aus j erklärt werden kann, müsste doch zwischen diesen Variablen in j Multikollinearität vorherrschen, oder? Antwort: Das ist richtig. Wenn das Instrument informativ ist, muss es aber über das Instrument eine Variation in den gefitteten Werten der reduzierten Form geben, die eine ausreichende Variation zur Bestimmung des Koeffizienten aufweist. Vielleicht ein Beispiel zur Veranschaulichung: Der Lohn wird auf das Geschlecht und die Dauer der Ausbildung regressiert. Dauer sei hier endogen, ein Instrument sei die Nähe zur nächsten Universitätsstadt. Wenn nun Dauer geschätzt wird durch die Entfernung und das Geschlecht und das Geschlecht erklärt tatsächlich die Ausbildungsdauer, liegt dann zwangsläufig Multikollinearität zwischen Geschlecht und Dauer vor? Antwort: Ja, aber Nähe zur nächsten Universitätsstadt sorgt dafür - hoffentlich, wenn es ein gutes Instrument ist - dass die Korrelation deutlich kleiner als 1 ist. 4 Studierender 4 (ab 11 Uhr): - Könnten Sie noch einmal kurz auf die Aussage/Bedeutung des Frisch-WaughTheorems eingehen. - Worin besteht der Unterschied zwischen Heteroskedastie und Endogenität? In beiden Fällen besteht ja eigentlich das Problem darin, dass die Cov(X,u) nicht null ist. Antwort: Hetoreoskedastie besagt, dass V ar(ui |Xi ) nicht konstant ist. Endogenität besagt, dass E(ui |Xi ) 6= 0. - Frage zur Interpretation der Regressionsparameter: Im Skript steht auf Seite 121, dass die Parameter die Korrelation zwischen dem entsprechenden X und dem Y angeben. Auf Seite 130 heißt es, dass die Koeffizienten den ceterisparibus Effekt angeben. Ich dachte Korrelation ist nicht gleichbedeutend mit dem ceteris paribus -Effekt. Antwort: Auf S. 121 betrachten Sie das bivariate Regressionsmodell, für dass der Steigungsparameter die Korrelation widerspiegelt. Hier geht es nicht um Ceteris Paribus Effekte, da kein weiterer Regressor verwendet wird. Bei der multivariaten Regression (S. 130) sind die Koeffizienten jedoch die Ceteris Paribus Effekte. - S.211 im Skript: zu welchem Zweck wurde der DF-Test zum ADF-Test weiterentwickelt ? Was bedeutet dabei das Problem ”Annahme nicht autokorrelierter Störgrößen bei DF” ? Antwort: Berücksichtigt Dynamik in erster Differenz der Zeitreihe. Ohne diese zu schätzen, könnte das Problem von Autokorrelation auftreten. - TSP berechnet stehts den p-Value für einen zweiseitigen Test. Wie kommt man von dem zweiseitigen nun auf den einseitigen p-Value ? Antwort: Das kommt darauf an, in welche Richtung die t-Teststatistik zeigt. Bei der Abweichung nach oben (unten), weist eine negative (positive) Teststatistik immer den P-Value 1.00 (=100%) auf. Im anderen Fall ist der P-Value jeweils zu halbieren. 5