Prof. Bernd Fitzenberger, Ph.D. Einführung in die empirische

Prof. Bernd Fitzenberger, Ph.D.
Einführung in die empirische Wirtschaftsforschung
Fragestunde: 10. Februar 2009
Studierender 1:
Hier meine Fragen zu Empiwifo:
Zu 5.2. Multivariate Regression
- Warum kann man mit dem χ2 -Test nur zweiseitige Tests durchführen? Die
Abb. 5.2. (S. 135) zeigt doch einen einseitigen Test.
- Müssen wir die Formeln für die F- und χ2 -Teststatistiken genau angeben
können? (also wie bei der t-Statistik?)
Antwort: Nein
Zu 5.4.Multikollinearität
- Im Skript steht, das Modell eigne sich gut für Prognosezwecke, da man den
gemeinsamen Effekt der Regressoren präziser schätzen kann (S. 167). Heißt
das, dass man die Prognosefähigkeit erhöhen kann, indem man noch mehr
Regressoren aufnimmt, die miteinander korreliert sind?
Antwort: Ja, solange die Zahl der Regressoren klein ist im Vergleich zu den
Beobachtungen
- Wir haben im TSP-Programm herausgefunden, dass die Korrelation zwischen
t und ln(K/L) fast 1 ist. (S. 179) Wie kann man das ökonomisch interpretieren?
Dass die Kapitalintensität relativ zur Arbeitsintensität im Zeitablauf zunimmt?
Antwort: Kapitalintensität folgt fast exakt einem positiven, linearen Trend
- Könnten Sie die partitionierte Regression, ibs. die Umsetzung im TSPBeispiel (ab S. 172), nochmal erklären?
Zu 6.1.
- Könnten Sie nochmal die Formel des ADF-Tests erklären und wann man ihn
anwendet (im Gegensatz zum normalen DF-Test)? (S. 211)
Zu 6.2. Fehlerkorrekturmodell
1
- Warum geben die Variablen in ersten Differenzen (alpha) die kurzfristigen
Beziehungen an? (S. 216 f.)
Antwort: Weil hier die laufenden und verzögerten Veränderungen, nicht aber
die Niveaus in Beziehung gebracht werden.
Studierender 2:
Im ersten Kapitel bei der Diskussion der Indizes steht im Skript auf S. 22: ”
Der Laspeyres-Preisindex reagiert per Definition nicht auf eine Verschiebung
des Warenkorbes.” Mir ist nicht klar, wie diese Aussage zu verstehen ist. Eine
Veränderung des Basisjahres wäre doch (so wie ich es verstehe) eine Verschiebung des Warenkorbes, durch die Veränderung der Gewichtung ergibt sich
dann aber doch auch eine Reaktion des Indexes (nach unten wenn Substitution
weg von Gütern mit hoher Preissteigerung stattgefunden hat, nach oben wenn
Preissteigerungen vor allem nachfragegetrieben waren).
Antwort: Basisjahr definiert Warenkorb und es werden die Preisveränderungen
für diesen Warenkorb analysiert ...
In Kapitel vier im Beispielprogramm zur Varianzanalyse werden am Ende im
mehrfaktoriellen Fall Tests durchgeführt. Dabei werden empirische F- Teststatistiken berechnet und mit kritischen Werten verglichen. Bei der Berechnung der kritische Werte werden jedoch bis auf den ersten Test immer die
gleichen Freiheitsgrade verwendet, die sich auch von denen bei Berechnung
der Teststatistik unterscheiden. Warum ist das so und wieso wird gerade diese
Anzahl Freiheitsgrade gewählt?
Antwort: Die Freiheitsgrade sollten immer denen entsprechen, die bei der
Berechnung der F-Teststatistik verwendet werden. Wenn das nicht der Fall
ist, dann liegt ein Fehler vor. Im Skript sind die TSP-Zeile 186-187, 195-196
und 204-205 redundant (Zeilen 187, 196, 205 sind falsch). Der Nenner umfasst
immer die Within Fehlerquadratsumme dividiert durch dfden=G*H*(K-1) als
Maß der durchschnittlichen Within–Varianz.
2
Frage an Frau Sommerfeld: Das Fehlerkorrekturmodell im Lehrbuch von Schröder
berücksichtigt für deltaY(t) nicht den Wert von deltaX(t), sondern nur gelagte
Werte sowohl von y als auch von x (bzw. bei Schröder von Y1 und Y2). Das
Modell in der Vorlesung und in der Übung berücksichtigt jedoch diesen Term
(das gilt auch für die Formel im Lehrbuch von Ronning), ich habe es sogar
so verstanden, dass dieser Term auf jeden Fall berücksichtigt werden sollte.
Die Anzahl der gelagten Werte J haben wir in den Übungsbeispielen ja erst
noch ermittelt, diese kann ja durchaus 0 betragen. Da die Summe für X(t-j)
aber über j=0 bis J läuft, wird der Wert von X(t) in jedem Fall berücksichtigt.
Gerade dieser Term fehlt jedoch im Lehrbuch, hier läuft die Summe ab 1 (für
X und Y und nicht nur wie bei unserer Formel für Y). Der Wert von dlnae fehlt
dementsprechend auch in der Schätzung des Fehlerkorrekturmodells von dlnip
(und umgekehrt umgekehrt). Das würde ja heißen, dass die Veränderung der
Aufträgseingänge zum Zeitpunkt t keinen Einfluss auf die Veränderung der Industrieproduktion hat, sondern nur die Veränderungen der Vergangenheit sowie
die Abweichung vom langfristigen Gleichgewicht eine Rolle spielen. Das scheint
mir auch ökomomisch weniger Sinn zu machen. Bei Einbeziehung des Terms in
die Schätzung (siehe Output) ergibt sich auch ein signifikanter Koeffezient. Ich
kann also keinen Grund finden, warum er weggelassen werden sollte. Warum
fehlt dieser Term trotzdem? Im Lehrbuch von Ronning habe ich auch gesehen,
dass die Summen für X(t-j) und Y(t-j) nicht beide bis zum gleichen Wert J
laufen, im Gegensatz zur Formel in der Übung. Gibt es einen Grund warum
sinnvollerweise die Anzahl der verwendeten Lags gleich sein sollte?
FYI: Die Zusatzaufgabe lautete übrigens wie folgt: ”Im Kursverzeichnis liegen
die Daten für das Beispiel zur deutschen Industrieproduktion (schroekap5.xls)
aus Kapitel V.1-V.5 in Schröder (2002). Replizieren Sie das Beispiel in TSP.”
Die Daten behandel Auftragseingänge (AE) und Industrieproduktion (IP), daraus ergeben sich dnlae für die Differenz der gelagten AE und analog dnlip für
die Differenz der gelagten IP.
Antwort: Ob der nicht gelagte Werte von Delta X(t) verwendet wird, hängt
davon ab, ob man den gleichzeitigen Zusammenhang von in Periode t untersuchen will oder nicht und ob es ein Endogenitätsproblem gibt. Lags von
X(t-j) und Y(t-j) müssen nicht bis zum gleichen Wert J laufen. Es kommt auf
Signifikanzen und öknomische Relevanz an.
3
Studierender 3:
Ich habe eine Frage zum Bezug zwischen Endogenität und Multikollinearität:
Um das Endogenitätsproblem in einer Gleichung j zu lösen, wird - wie ich es
verstehe - die endogene erklärende Variable im ersten Schritt selber geschätzt,
und zwar mit Hilfe der anderen erklärenden Variablen aus j sowie mindestens
eines Instruments, das keinen direkten Einfluss auf die Erklärte in j hat. Wenn
dies richtig ist und die endogene Variable auch durch andere erklärende Variablen aus j erklärt werden kann, müsste doch zwischen diesen Variablen in j
Multikollinearität vorherrschen, oder?
Antwort: Das ist richtig. Wenn das Instrument informativ ist, muss es aber
über das Instrument eine Variation in den gefitteten Werten der reduzierten
Form geben, die eine ausreichende Variation zur Bestimmung des Koeffizienten
aufweist.
Vielleicht ein Beispiel zur Veranschaulichung: Der Lohn wird auf das Geschlecht
und die Dauer der Ausbildung regressiert. Dauer sei hier endogen, ein Instrument sei die Nähe zur nächsten Universitätsstadt. Wenn nun Dauer geschätzt
wird durch die Entfernung und das Geschlecht und das Geschlecht erklärt
tatsächlich die Ausbildungsdauer, liegt dann zwangsläufig Multikollinearität
zwischen Geschlecht und Dauer vor?
Antwort: Ja, aber Nähe zur nächsten Universitätsstadt sorgt dafür - hoffentlich,
wenn es ein gutes Instrument ist - dass die Korrelation deutlich kleiner als 1
ist.
4
Studierender 4 (ab 11 Uhr):
- Könnten Sie noch einmal kurz auf die Aussage/Bedeutung des Frisch-WaughTheorems eingehen.
- Worin besteht der Unterschied zwischen Heteroskedastie und Endogenität?
In beiden Fällen besteht ja eigentlich das Problem darin, dass die Cov(X,u)
nicht null ist.
Antwort: Hetoreoskedastie besagt, dass V ar(ui |Xi ) nicht konstant ist. Endogenität besagt, dass E(ui |Xi ) 6= 0.
- Frage zur Interpretation der Regressionsparameter: Im Skript steht auf Seite
121, dass die Parameter die Korrelation zwischen dem entsprechenden X und
dem Y angeben. Auf Seite 130 heißt es, dass die Koeffizienten den ceterisparibus Effekt angeben. Ich dachte Korrelation ist nicht gleichbedeutend mit
dem ceteris paribus -Effekt.
Antwort: Auf S. 121 betrachten Sie das bivariate Regressionsmodell, für dass
der Steigungsparameter die Korrelation widerspiegelt. Hier geht es nicht um
Ceteris Paribus Effekte, da kein weiterer Regressor verwendet wird. Bei der
multivariaten Regression (S. 130) sind die Koeffizienten jedoch die Ceteris
Paribus Effekte.
- S.211 im Skript: zu welchem Zweck wurde der DF-Test zum ADF-Test weiterentwickelt ? Was bedeutet dabei das Problem ”Annahme nicht autokorrelierter
Störgrößen bei DF” ?
Antwort: Berücksichtigt Dynamik in erster Differenz der Zeitreihe. Ohne diese
zu schätzen, könnte das Problem von Autokorrelation auftreten.
- TSP berechnet stehts den p-Value für einen zweiseitigen Test. Wie kommt
man von dem zweiseitigen nun auf den einseitigen p-Value ?
Antwort: Das kommt darauf an, in welche Richtung die t-Teststatistik zeigt.
Bei der Abweichung nach oben (unten), weist eine negative (positive) Teststatistik immer den P-Value 1.00 (=100%) auf. Im anderen Fall ist der P-Value
jeweils zu halbieren.
5