Prof. Bernd Fitzenberger, Ph.D. Einführung in die empirische

Werbung
Prof. Bernd Fitzenberger, Ph.D.
Einführung in die empirische Wirtschaftsforschung
Fragestunde: 10. Februar 2009
Studierender 1:
Hier meine Fragen zu Empiwifo:
Zu 5.2. Multivariate Regression
- Warum kann man mit dem χ2 -Test nur zweiseitige Tests durchführen? Die
Abb. 5.2. (S. 135) zeigt doch einen einseitigen Test.
- Müssen wir die Formeln für die F- und χ2 -Teststatistiken genau angeben
können? (also wie bei der t-Statistik?)
Antwort: Nein
Zu 5.4.Multikollinearität
- Im Skript steht, das Modell eigne sich gut für Prognosezwecke, da man den
gemeinsamen Effekt der Regressoren präziser schätzen kann (S. 167). Heißt
das, dass man die Prognosefähigkeit erhöhen kann, indem man noch mehr
Regressoren aufnimmt, die miteinander korreliert sind?
Antwort: Ja, solange die Zahl der Regressoren klein ist im Vergleich zu den
Beobachtungen
- Wir haben im TSP-Programm herausgefunden, dass die Korrelation zwischen
t und ln(K/L) fast 1 ist. (S. 179) Wie kann man das ökonomisch interpretieren?
Dass die Kapitalintensität relativ zur Arbeitsintensität im Zeitablauf zunimmt?
Antwort: Kapitalintensität folgt fast exakt einem positiven, linearen Trend
- Könnten Sie die partitionierte Regression, ibs. die Umsetzung im TSPBeispiel (ab S. 172), nochmal erklären?
Zu 6.1.
- Könnten Sie nochmal die Formel des ADF-Tests erklären und wann man ihn
anwendet (im Gegensatz zum normalen DF-Test)? (S. 211)
Zu 6.2. Fehlerkorrekturmodell
1
- Warum geben die Variablen in ersten Differenzen (alpha) die kurzfristigen
Beziehungen an? (S. 216 f.)
Antwort: Weil hier die laufenden und verzögerten Veränderungen, nicht aber
die Niveaus in Beziehung gebracht werden.
Studierender 2:
Im ersten Kapitel bei der Diskussion der Indizes steht im Skript auf S. 22: ”
Der Laspeyres-Preisindex reagiert per Definition nicht auf eine Verschiebung
des Warenkorbes.” Mir ist nicht klar, wie diese Aussage zu verstehen ist. Eine
Veränderung des Basisjahres wäre doch (so wie ich es verstehe) eine Verschiebung des Warenkorbes, durch die Veränderung der Gewichtung ergibt sich
dann aber doch auch eine Reaktion des Indexes (nach unten wenn Substitution
weg von Gütern mit hoher Preissteigerung stattgefunden hat, nach oben wenn
Preissteigerungen vor allem nachfragegetrieben waren).
Antwort: Basisjahr definiert Warenkorb und es werden die Preisveränderungen
für diesen Warenkorb analysiert ...
In Kapitel vier im Beispielprogramm zur Varianzanalyse werden am Ende im
mehrfaktoriellen Fall Tests durchgeführt. Dabei werden empirische F- Teststatistiken berechnet und mit kritischen Werten verglichen. Bei der Berechnung der kritische Werte werden jedoch bis auf den ersten Test immer die
gleichen Freiheitsgrade verwendet, die sich auch von denen bei Berechnung
der Teststatistik unterscheiden. Warum ist das so und wieso wird gerade diese
Anzahl Freiheitsgrade gewählt?
Antwort: Die Freiheitsgrade sollten immer denen entsprechen, die bei der
Berechnung der F-Teststatistik verwendet werden. Wenn das nicht der Fall
ist, dann liegt ein Fehler vor. Im Skript sind die TSP-Zeile 186-187, 195-196
und 204-205 redundant (Zeilen 187, 196, 205 sind falsch). Der Nenner umfasst
immer die Within Fehlerquadratsumme dividiert durch dfden=G*H*(K-1) als
Maß der durchschnittlichen Within–Varianz.
2
Frage an Frau Sommerfeld: Das Fehlerkorrekturmodell im Lehrbuch von Schröder
berücksichtigt für deltaY(t) nicht den Wert von deltaX(t), sondern nur gelagte
Werte sowohl von y als auch von x (bzw. bei Schröder von Y1 und Y2). Das
Modell in der Vorlesung und in der Übung berücksichtigt jedoch diesen Term
(das gilt auch für die Formel im Lehrbuch von Ronning), ich habe es sogar
so verstanden, dass dieser Term auf jeden Fall berücksichtigt werden sollte.
Die Anzahl der gelagten Werte J haben wir in den Übungsbeispielen ja erst
noch ermittelt, diese kann ja durchaus 0 betragen. Da die Summe für X(t-j)
aber über j=0 bis J läuft, wird der Wert von X(t) in jedem Fall berücksichtigt.
Gerade dieser Term fehlt jedoch im Lehrbuch, hier läuft die Summe ab 1 (für
X und Y und nicht nur wie bei unserer Formel für Y). Der Wert von dlnae fehlt
dementsprechend auch in der Schätzung des Fehlerkorrekturmodells von dlnip
(und umgekehrt umgekehrt). Das würde ja heißen, dass die Veränderung der
Aufträgseingänge zum Zeitpunkt t keinen Einfluss auf die Veränderung der Industrieproduktion hat, sondern nur die Veränderungen der Vergangenheit sowie
die Abweichung vom langfristigen Gleichgewicht eine Rolle spielen. Das scheint
mir auch ökomomisch weniger Sinn zu machen. Bei Einbeziehung des Terms in
die Schätzung (siehe Output) ergibt sich auch ein signifikanter Koeffezient. Ich
kann also keinen Grund finden, warum er weggelassen werden sollte. Warum
fehlt dieser Term trotzdem? Im Lehrbuch von Ronning habe ich auch gesehen,
dass die Summen für X(t-j) und Y(t-j) nicht beide bis zum gleichen Wert J
laufen, im Gegensatz zur Formel in der Übung. Gibt es einen Grund warum
sinnvollerweise die Anzahl der verwendeten Lags gleich sein sollte?
FYI: Die Zusatzaufgabe lautete übrigens wie folgt: ”Im Kursverzeichnis liegen
die Daten für das Beispiel zur deutschen Industrieproduktion (schroekap5.xls)
aus Kapitel V.1-V.5 in Schröder (2002). Replizieren Sie das Beispiel in TSP.”
Die Daten behandel Auftragseingänge (AE) und Industrieproduktion (IP), daraus ergeben sich dnlae für die Differenz der gelagten AE und analog dnlip für
die Differenz der gelagten IP.
Antwort: Ob der nicht gelagte Werte von Delta X(t) verwendet wird, hängt
davon ab, ob man den gleichzeitigen Zusammenhang von in Periode t untersuchen will oder nicht und ob es ein Endogenitätsproblem gibt. Lags von
X(t-j) und Y(t-j) müssen nicht bis zum gleichen Wert J laufen. Es kommt auf
Signifikanzen und öknomische Relevanz an.
3
Studierender 3:
Ich habe eine Frage zum Bezug zwischen Endogenität und Multikollinearität:
Um das Endogenitätsproblem in einer Gleichung j zu lösen, wird - wie ich es
verstehe - die endogene erklärende Variable im ersten Schritt selber geschätzt,
und zwar mit Hilfe der anderen erklärenden Variablen aus j sowie mindestens
eines Instruments, das keinen direkten Einfluss auf die Erklärte in j hat. Wenn
dies richtig ist und die endogene Variable auch durch andere erklärende Variablen aus j erklärt werden kann, müsste doch zwischen diesen Variablen in j
Multikollinearität vorherrschen, oder?
Antwort: Das ist richtig. Wenn das Instrument informativ ist, muss es aber
über das Instrument eine Variation in den gefitteten Werten der reduzierten
Form geben, die eine ausreichende Variation zur Bestimmung des Koeffizienten
aufweist.
Vielleicht ein Beispiel zur Veranschaulichung: Der Lohn wird auf das Geschlecht
und die Dauer der Ausbildung regressiert. Dauer sei hier endogen, ein Instrument sei die Nähe zur nächsten Universitätsstadt. Wenn nun Dauer geschätzt
wird durch die Entfernung und das Geschlecht und das Geschlecht erklärt
tatsächlich die Ausbildungsdauer, liegt dann zwangsläufig Multikollinearität
zwischen Geschlecht und Dauer vor?
Antwort: Ja, aber Nähe zur nächsten Universitätsstadt sorgt dafür - hoffentlich,
wenn es ein gutes Instrument ist - dass die Korrelation deutlich kleiner als 1
ist.
4
Studierender 4 (ab 11 Uhr):
- Könnten Sie noch einmal kurz auf die Aussage/Bedeutung des Frisch-WaughTheorems eingehen.
- Worin besteht der Unterschied zwischen Heteroskedastie und Endogenität?
In beiden Fällen besteht ja eigentlich das Problem darin, dass die Cov(X,u)
nicht null ist.
Antwort: Hetoreoskedastie besagt, dass V ar(ui |Xi ) nicht konstant ist. Endogenität besagt, dass E(ui |Xi ) 6= 0.
- Frage zur Interpretation der Regressionsparameter: Im Skript steht auf Seite
121, dass die Parameter die Korrelation zwischen dem entsprechenden X und
dem Y angeben. Auf Seite 130 heißt es, dass die Koeffizienten den ceterisparibus Effekt angeben. Ich dachte Korrelation ist nicht gleichbedeutend mit
dem ceteris paribus -Effekt.
Antwort: Auf S. 121 betrachten Sie das bivariate Regressionsmodell, für dass
der Steigungsparameter die Korrelation widerspiegelt. Hier geht es nicht um
Ceteris Paribus Effekte, da kein weiterer Regressor verwendet wird. Bei der
multivariaten Regression (S. 130) sind die Koeffizienten jedoch die Ceteris
Paribus Effekte.
- S.211 im Skript: zu welchem Zweck wurde der DF-Test zum ADF-Test weiterentwickelt ? Was bedeutet dabei das Problem ”Annahme nicht autokorrelierter
Störgrößen bei DF” ?
Antwort: Berücksichtigt Dynamik in erster Differenz der Zeitreihe. Ohne diese
zu schätzen, könnte das Problem von Autokorrelation auftreten.
- TSP berechnet stehts den p-Value für einen zweiseitigen Test. Wie kommt
man von dem zweiseitigen nun auf den einseitigen p-Value ?
Antwort: Das kommt darauf an, in welche Richtung die t-Teststatistik zeigt.
Bei der Abweichung nach oben (unten), weist eine negative (positive) Teststatistik immer den P-Value 1.00 (=100%) auf. Im anderen Fall ist der P-Value
jeweils zu halbieren.
5
Herunterladen