Kap. 10: Regression mit Instrumentvariablen

Werbung
Kap. 10: Regression mit Instrumentvariablen
• Motivation
• Instrumentvariablen im Modell der linearen Einfachregression
• Instrumentvariablen im Modell der linearen Mehrfachregression
• Validität von Instrumenten
• Empirisches Beispiel
• Ausblick: Instrumentvariablen in der Praxis
10.1
Motivation
Validität einer OLS-Schätzung in
Yi = β0 + β1Xi + ui
gefährdet durch (unter anderem) Verletzung von (A1): E(ui|Xi) = 0.
Mögliche Ursachen von E(ui|Xi) 6= 0:
• Verzerrung durch vergessene Variablen
Ideale Lösung: baue benötigte Variable in Analyse ein – aber oft Variable nicht beschaffbar.
Wir wissen: Verzerrung durch zeitinvariante fehlende Variablen kann durch Paneldaten
eliminiert werden.
Aber: was tun, wenn auch Paneldaten nicht beschaffbar?
• Simultanität (X beeinflusst Y , Y beeinflusst X)
• Verzerrung durch Messfehler (X fehlerhaft gemessen)
Instrumentvariablen können Verzerrung in allen diesen Situationen eliminieren.
C. Kleiber: Ökonometrie 1
Kap. 10-1
U Basel, HS 2008
10.2
Instrumentvariablen in der linearen Einfachregression
Modell der linearen Einfachregression
Yi = β0 + β1Xi + ui
• Idee: wenn Cov(Xi, ui) 6= 0, zerfällt Xi in 2 Teile
– ein Teil ist korreliert mit ui
– ein Teil ist unkorreliert mit ui
Isoliert man den Teil von Xi, der nicht mit ui korreliert, kann man β1 schätzen.
• IV-Regression nutzt eine weitere Variable Zi, die nicht mit ui korreliert.
Dieses Zi heisst Instrumentvariable oder kurz Instrument.
• IV erkennt Änderungen in Xi, die nicht mit ui korrelieren, und nutzt diese zur Schätzung.
C. Kleiber: Ökonometrie 1
Kap. 10-2
U Basel, HS 2008
10.2
Instrumentvariablen in der linearen Einfachregression
Terminologie:
• Variable heisst endogen, falls sie mit ui korreliert
• Variable heisst exogen, falls sie nicht mit ui korreliert
• (vage) ein Parameter ist identifiziert, falls er sich aus den Daten (konsistent) schätzen
lässt.
In linearer Regression kann bei E(ui|Xi) 6= 0 der Parameter β1 nicht allein aus Daten zu
(Y, X) bestimmt werden, egal wie gross Stichprobe.
Bemerkungen:
• (historisch) “endogen” bedeutet “innerhalb des Systems bestimmt” (→ Simultanität).
Definition eng, IV-Methode funktioniert auch allgemeiner (Fehler in den Variablen, etc.)
• IV-Methoden sind eine Spezialität der Ökonometrie – in statistischer Literatur zu Regressionsmethoden kaum zu finden
C. Kleiber: Ökonometrie 1
Kap. 10-3
U Basel, HS 2008
10.2
Instrumentvariablen in der linearen Einfachregression
Damit eine Variable als Instrument in
Yi = β0 + β1Xi + ui
geeignet ist, müssen 2 Bedingungen erfüllt sein:
• Relevanz: Cov(Xi, Zi) 6= 0
• Exogenität: Cov(Zi, ui) = 0
Bleiben 2 Fragen . . .
• falls Instrument vorhanden, wie schätzt man?
• wie findet man Instrumente?
C. Kleiber: Ökonometrie 1
Kap. 10-4
U Basel, HS 2008
10.2
Instrumentvariablen in der linearen Einfachregression
IV-Schätzung – erste Erklärung:
Yi = β0 + β1Xi + ui
Es ist (Exogenität von Zi!)
Cov(Yi, Zi) = Cov(β0 + β1Xi + ui, Zi)
= Cov(β0, Zi) + Cov(β1Xi, Zi) + Cov(ui, Zi)
= 0 + β1Cov(Xi, Zi) + 0
also
Cov(Yi, Zi)
β1 =
Cov(Xi, Zi)
Ersetze nun Populationsgrössen durch Stichprobengrössen (→ Momentenmethode):
β̂1IV
C. Kleiber: Ökonometrie 1
sY Z
=
sXZ
Kap. 10-5
U Basel, HS 2008
10.2
Instrumentvariablen in der linearen Einfachregression
Rechtfertigung der Methode:
Wenn empirische Kovarianzen konsistent, d.h.
P
sXZ
−→
sY Z
−→
P
Cov(Xi, Zi)
Cov(Yi, Zi)
dann gilt auch
β̂1IV =
sY Z P Cov(Yi, Zi)
−→
= β1
sXZ
Cov(Xi, Zi)
Cov(Xi, Zi) 6= 0 (Relevanz des Instruments) garantiert, dass Nenner 6= 0.
C. Kleiber: Ökonometrie 1
Kap. 10-6
U Basel, HS 2008
10.2
Instrumentvariablen in der linearen Einfachregression
IV-Schätzung – zweite Erklärung: Two-stage least squares (TSLS, oder auch 2SLS)
• Isoliere den Teil von Xi, der nicht mit ui korreliert, durch Regression von Xi auf Zi:
Xi = π0 + π1Zi + vi
– Zi korreliert nicht mit ui, also korreliert auch π0 + π1Zi nicht mit ui.
π0, π1 unbekannt, können aber geschätzt werden
– verwende dann Prognosen πˆ0 + πˆ1Zi =: X̂i
• ersetzte nun Xi durch X̂i in eigentlich interessierender Regression:
Yi = β0 + β1X̂i + ui
– da X̂i unkorreliert mit ui (in grossen Stichproben), ist (A1) nicht mehr verletzt und
OLS wird anwendbar
– Schätzer ist unter geeigneten Annahmen konsistent
– resultierender Schätzer heisst zweistufiger KQ-Schätzer (TSLS).
Notation: β̂1T SLS oder β̂12SLS
• Mit einem X und einem Z gilt: β̂1IV = β̂1T SLS
C. Kleiber: Ökonometrie 1
Kap. 10-7
U Basel, HS 2008
10.2
Instrumentvariablen in der linearen Einfachregression
Beispiel: (Angebot und Nachfrage für Butter)
IV entwickelt für agrarökonomische Fragen in den 1920er Jahren.
Mehr zur Geschichte der Methode bei J. Stock
http://ksghome.harvard.edu/~JStock/wrights/index.htm
oder in
J. Stock und F. Trebbi (2003). Who invented IV regression? Journal of Economic Perspectives, 17, 177–194.
Schätze Preiselastizität für Butter als β1 in
log(QButter
) = β0 + β1 log(PiButter ) + ui
i
Daten seien Preise und Mengen für verschiedene Jahre.
Problem: Simultanität!
TSLS schätzt, in dem nur Veränderungen der Angebotskurve genutzt werden.
Frage: Welche Variable beeinflusst Angebots-, aber nicht Nachfragefunktion?
C. Kleiber: Ökonometrie 1
Kap. 10-8
U Basel, HS 2008
10.2
Instrumentvariablen in der linearen Einfachregression
Sei Zi Wetter (Regen?) in milchproduzierenden Regionen, dann
• Cov(Wetteri, ui) = 0 (Exogenität) plausibel
• Cov(Wetteri, log(PiButter )) 6= 0 (Relevanz) plausibel
Also
\
Butter )
• Schritt 1: regressiere log(PiButter ) auf Wetteri, ergibt log(P
i
– Änderungen in log(PiButter ), die von Angebotsseite kommen
\
Butter )
) auf log(P
• Schritt 2: regressiere log(QButter
i
i
– nutze Verschiebungen der Angebotskurve zur Schätzung der Nachfragekurve
C. Kleiber: Ökonometrie 1
Kap. 10-9
U Basel, HS 2008
10.2
Instrumentvariablen in der linearen Einfachregression
Inferenz mit TSLS/IV:
• in grossen Stichproben ist TSLS/IV approximativ normalverteilt
• damit Inferenz (Tests, Konfidenzintervalle) wie üblich
• Idee hinter approximativer Normalverteilung ist wieder, dass Schätzer als Mittel von u.i.v.
ZVen mit Erwartungswert Null darstellbar ist
Ergebnis: approximative Verteilung ist
a
β̂1IV ∼
Var{(Zi − µZ )ui}
N β1 ,
n{Cov(Zi, Xi)}2
!
All das gilt nur, wenn Instrumente valide sind – mehr später.
C. Kleiber: Ökonometrie 1
Kap. 10-10
U Basel, HS 2008
10.2
Instrumentvariablen in der linearen Einfachregression
Empirisches Beispiel:
Nachfrage nach Zigaretten
• wie stark reduziert Zigarettensteuer die Nachfrage?
• schätze Elastizität mittels
Zig
log(QZig
)
=
β
+
β
log(P
) + ui
0
1
i
i
• Ist OLS evtl. verzerrt?
Daten:
• Paneldaten für jährlichen Zigarettenverbrauch (Packungen pro Kopf) und Preise (inkl. Steuer) für 48 US-Bundesstaaten, 1985–1995.
• Instrument Zi: Mehrwertsteuer (sales tax) pro Packung. (relevant? exogen?)
C. Kleiber: Ökonometrie 1
Kap. 10-11
U Basel, HS 2008
10.2
Instrumentvariablen in der linearen Einfachregression
Variablen:
cpi
population
packs
income
tax
price
taxs
C. Kleiber: Ökonometrie 1
Consumer price index (für Inflationsbereinigung).
Bevölkerung.
Nachfrage nach Zigaretten (Anzahl Packungen pro Kopf).
Einkommen (Summe pro Staat).
Zigarettensteuer.
Zigarettenpreis (Jahresdurchschnitt) inkl. Steuer.
Zigarettensteuer inkl. Mehrwertsteuer.
Kap. 10-12
U Basel, HS 2008
10.2
Instrumentvariablen in der linearen Einfachregression
Regression mit Daten für 1995:
R>
R>
R>
R>
data("CigarettesSW", package = "AER")
Cig1995 <- subset(CigarettesSW, year == "1995")
fm_stufe1 <- lm(log(price/cpi) ~ I((taxs - tax)/cpi), data = Cig1995)
coef(fm_stufe1)
(Intercept) I((taxs - tax)/cpi)
4.61655
0.03073
R> fm_stufe2 <- lm(log(packs) ~ fitted(fm_stufe1), data = Cig1995)
R> coef(fm_stufe2)
(Intercept) fitted(fm_stufe1)
9.720
-1.084
Warnung: Standardfehler aus 2. Regression sind nicht gültig, da nicht verwendet wird, dass
Regressor Prognose aus anderer Gleichung!
C. Kleiber: Ökonometrie 1
Kap. 10-13
U Basel, HS 2008
10.2
Instrumentvariablen in der linearen Einfachregression
Es ist nicht nötig, beide Schritte “von Hand” zu rechnen.
Ökonometrische Software hat Funktionen für IV-Regressionen. – In R:
• Paket sem (“structural equation models”) hat Funktion tsls()
R>
R>
+
R>
library("sem")
fm_tsls <- tsls(log(packs) ~ log(price/cpi),
instruments = ~ I((taxs - tax)/cpi), data = Cig1995)
coef(fm_tsls)
(Intercept) log(price/cpi)
9.720
-1.084
• Paket AER (“Applied Econometrics with R”) hat Funktion ivreg()
R> fm_iv <- ivreg(log(packs) ~ log(price/cpi) | I((taxs - tax)/cpi),
+ data = Cig1995)
R> coef(fm_iv)
(Intercept) log(price/cpi)
9.720
-1.084
Nachfrage überrraschend elastisch . . . aber vergessene Variablen?
C. Kleiber: Ökonometrie 1
Kap. 10-14
U Basel, HS 2008
10.2
Instrumentvariablen in der linearen Einfachregression
R> summary(fm_iv) ## dies sind Standardfehler unter Homoskedastie!
Call:
ivreg(formula = log(packs) ~ log(price/cpi) | I((taxs - tax)/cpi),
data = Cig1995)
Residuals:
Min
1Q
-0.6462 -0.0773
Median
0.0298
3Q
0.1128
Max
0.4190
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept)
9.720
1.514
6.42 6.8e-08
log(price/cpi)
-1.084
0.317
-3.42
0.0013
Residual standard error: 0.19 on 46 degrees of freedom
Multiple R-Squared: 0.401,
Adjusted R-squared: 0.388
Wald test: 11.7 on 1 and 46 DF, p-value: 0.00131
C. Kleiber: Ökonometrie 1
Kap. 10-15
U Basel, HS 2008
10.2
Instrumentvariablen in der linearen Einfachregression
Mit Heteroskedastie-robusten Standardfehlern:
R> coeftest(fm_iv, vcov = sandwich)
t test of coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept)
9.720
1.496
6.50 5.2e-08
log(price/cpi)
-1.084
0.312
-3.47
0.0011
Hier nicht sehr verschieden von Standardfehlern unter Homoskedastie – dies muss aber nicht
so sein!
C. Kleiber: Ökonometrie 1
Kap. 10-16
U Basel, HS 2008
10.2
Instrumentvariablen in der linearen Einfachregression
Zusammenfassung für IV mit einem X und einem Z:
• valides Instrument Z muss 2 Bedingungen erfüllen:
– Relevanz: Cov(Xi, Zi) 6= 0
– Exogenität: Cov(Zi, ui) = 0
• TSLS/IV regressiert zunächst Xi auf Zi, dann Yi auf X̂i
• Idee: Stufe 1 isoliert den Teil von Xi, der nicht mit ui korreliert
• falls Instrument “gut”, ist TSLS approximativ normalverteilt
Ausblick: wir brauchen noch
• mehrere endogene Regressoren X1, . . . , Xk
• mehrere exogene Regressoren W1, . . . , Wr
→ Vorbeugen gegen Verzerrung durch vergessene Variablen
• mehrere Instrumentvariablen Z1, . . . , Zm
→ mehr “gute” Instrumente liefern kleinere Varianz von TSLS
C. Kleiber: Ökonometrie 1
Kap. 10-17
U Basel, HS 2008
10.3
Instrumentvariablen in der linearen Mehrfachregression
Notation und Terminologie:
Yi = β0 + β1Xi1 + . . . + βk Xik + βk+1Wi1 + . . . + βk+r Wir + ui
• Yi abhängige Variable
• X1, . . . , Xk endogene Regressoren
• W1, . . . , Wr exogene Regressoren
• Z1, . . . , Zm Instrumente
Neue Begriffe und Erweiterungen:
• Identifikation und Überidentifikation
• TSLS mit zusätzlichen exogenen Variablen und evtl. mehreren endogenen Regressoren
• Annahmen zur Gültigkeit von IV-Methoden?
C. Kleiber: Ökonometrie 1
Kap. 10-18
U Basel, HS 2008
10.3
Instrumentvariablen in der linearen Mehrfachregression
Identifikation:
• Ein Parameter ist identifiziert, falls er sich aus gegebenen Daten konsistent schätzen lässt.
• bei IV-Regression hängt Identifikation der Koeffizienten von Zahl der Instrumente m in
Relation zur Zahl der endogenen Regressoren k ab.
Intuition: bei weniger Instrumenten als endogenen Regressoren sind βs nicht konsistent
schätzbar.
β1, . . . , βk heissen
– exakt identifiziert, falls m = k
– überidentifiziert, falls m > k (→ Gültigkeit der Instrumente testbar)
– unteridentifiziert, falls m < k (→ brauchen mehr Instrumente)
C. Kleiber: Ökonometrie 1
Kap. 10-19
U Basel, HS 2008
10.3
Instrumentvariablen in der linearen Mehrfachregression
IV-Regression, allgemeiner Fall:
Yi = β0 + β1Xi1 + . . . + βk Xik + βk+1Wi1 + . . . + βk+r Wir + ui
Verfügbare Instrumente seien Z1, . . . , Zm.
• Stufe 1:
– regressiere jeden endogenen Regressor Xj auf alle exogenen Regressoren
W1, . . . , Wr , Z1, . . . , Zm mit OLS
– bestimme Prognosen X̂j , für alle endogenen Regressoren j = 1, . . . , k
• Stufe 2:
– regressiere nun Y auf X̂1, . . . , X̂k , W1, . . . , Wr mit OLS
– die Koeffizienten dieser 2. Stufe sind IV/TSLS-Schätzungen (aber Standardfehler noch
falsch)
• führe dies gleich mit IV/TSLS-Prozedur durch, um richtige Standardfehler zu erhalten
C. Kleiber: Ökonometrie 1
Kap. 10-20
U Basel, HS 2008
10.3
Instrumentvariablen in der linearen Mehrfachregression
Beispiel:
Nachfrage nach Zigaretten
• weitere Einflussgrösse ist Einkommen
• Nachfragefunktion mit einem X, einem W :
Zig
log(QZig
)
=
β
+
β
log(P
) + β2 log(Inci) + ui
0
1
i
i
mit Inci reales Pro-Kopf-Einkommen.
Es gibt 2 Instrumente Z1, Z2
– Zi1 allgemeine Mehrwertsteuer
– Zi2 Zigarettensteuer
• weitere exogene Regressoren W könnten Staaten- oder Jahreseffekte sein (in Paneldaten)
C. Kleiber: Ökonometrie 1
Kap. 10-21
U Basel, HS 2008
10.3
R>
+
+
+
R>
Instrumentvariablen in der linearen Mehrfachregression
fm_iv2 <- ivreg(log(packs) ~
log(price/cpi) + log(income/population/cpi) |
log(income/population/cpi) + I((taxs - tax)/cpi),
data = Cig1995)
coef(fm_iv2)
(Intercept)
9.4307
log(income/population/cpi)
0.2145
C. Kleiber: Ökonometrie 1
log(price/cpi)
-1.1434
Kap. 10-22
U Basel, HS 2008
10.3
Instrumentvariablen in der linearen Mehrfachregression
R> summary(fm_iv2)
Call:
ivreg(formula = log(packs) ~ log(price/cpi) + log(income/population/cpi) |
log(income/population/cpi) + I((taxs - tax)/cpi), data = Cig1995)
Residuals:
Min
1Q
-0.61100 -0.08607
Median
0.00942
3Q
0.10691
Max
0.39316
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept)
9.431
1.358
6.94 1.2e-08
log(price/cpi)
-1.143
0.359
-3.18
0.0027
log(income/population/cpi)
0.215
0.269
0.80
0.4287
Residual standard error: 0.19 on 45 degrees of freedom
Multiple R-Squared: 0.419,
Adjusted R-squared: 0.393
Wald test: 6.53 on 2 and 45 DF, p-value: 0.00323
C. Kleiber: Ökonometrie 1
Kap. 10-23
U Basel, HS 2008
10.3
R>
+
+
+
R>
Instrumentvariablen in der linearen Mehrfachregression
fm_iv3 <- ivreg(log(packs) ~
log(price/cpi) + log(income/population/cpi) |
log(income/population/cpi) + I((taxs - tax)/cpi) + I(tax/cpi),
data = Cig1995)
coeftest(fm_iv3, vcov = sandwich)
t test of coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept)
9.895
0.929
10.65 6.9e-14
log(price/cpi)
-1.277
0.242
-5.29 3.5e-06
log(income/population/cpi)
0.280
0.246
1.14
0.26
Fazit:
• kleinere Standardfehler bei m = 2 (mehr Instrumente = mehr Information)
• kleine Einkommenselastizität (Zigaretten kein Luxusgut)
• hohe Preiselastiziät (intuitiv . . . ?)
C. Kleiber: Ökonometrie 1
Kap. 10-24
U Basel, HS 2008
10.3
Instrumentvariablen in der linearen Mehrfachregression
Annahmen IV-Regression:
Yi = β0 + β1Xi1 + . . . + βk Xik + βk+1Wi1 + . . . + βk+r W ir + ui
(A1) E(ui|Wi1, . . . , Wir ) = 0
(A2) (Yi, Xi1, . . . , Xik , Wi1, . . . , Wir , Zi1, . . . , Zim), i = 1, . . . , n, sind u.i.v.
(A3) die X, W, Z, Y haben je 4 Momente
(A4) die Regressoren sind nicht linear abhängig (keine “perfekte Multikollinearität”)
(A5) die Instrumente erfüllen die Bedingungen, die für valide Instrumente gestellt wurden (Relevanz und Exogenität)
Dabei 2–4 bekannt, 5 wurde diskutiert, 1 besagt: “die exogenen Variablen sind exogen”.
Unter diesen Annahmen kann man zeigen, dass TSLS/IV approximativ normalverteilt ist.
C. Kleiber: Ökonometrie 1
Kap. 10-25
U Basel, HS 2008
10.4
Validität von Instrumenten
Problem: Kann man überprüfen, ob Instrumente relevant und/oder exogen sind?
1. Relevanz: sei zur Vereinfachung
Yi = β0 + β1Xi + β2Wi1 + . . . + βr+1Wir + ui
Regression Stufe 1 ist
Xi = π0 + π1Zi1 + . . . + πmZim + πm+1Wi1 + . . . + πm+r Wir + vi
• Instrumente relevant, falls mindestens ein π1, . . . , πm 6= 0
• Instrumente heissen schwach, falls alle π1, . . . , πm ≈ 0.
Schwache Instrumente erklären wenig Variation in X, die nicht schon durch die W s
erklärt wird – und sind eine Gefahr für jede IV-Regression!
• Intuition:
sY Z
sXZ
Bei schwachem Instrument ist Nenner klein – IV unzuverlässig (NV-Approximation schlecht)
β̂1IV =
C. Kleiber: Ökonometrie 1
Kap. 10-26
U Basel, HS 2008
10.4
Validität von Instrumenten
Beispiel: (Arbeitsmarktökonomie)
Neue Literatur zu schwachen Instrumenten gestartet durch
J. Angrist und A. Krueger (1991). Does compulsory school attendance affect schooling and earnings? Quarterly
Journal of Economics, 106, 979–1014.
• Ziel: Schätzung von Ausbildungserträgen (returns on education)
• Problem: in Regression von Lohn auf Ausbildungsjahre etc. fehlen Fähigkeiten (begabtere
Schüler haben höhere Schulabschlüsse – nicht exogen) – leider ist diese Variable nicht
beschaffbar.
• Welche Variable korreliert mit Ausbildungsjahren, aber nicht mit Fehlerterm in Ausgangsregression? Angrist und Krueger schlagen vor . . . Geburtstag! (-squartal)
• Problem: bei n > 3000000 war Corr(Ausbildung, Geburtsquartal) ≈ 0.03 . . .
C. Kleiber: Ökonometrie 1
Kap. 10-27
U Basel, HS 2008
10.4
Validität von Instrumenten
Wie kann man IV-Regression mit schwachen Instrumenten erkennen?
Betrachte in Stufe 1 von TSLS
Xi = π0 + π1Zi1 + . . . + πmZim + πm+1Wi1 + . . . + πm+r Wir + vi
und F -Test von H0 : π1 = . . . = πm = 0.
Bei schwachen Instrumenten ist Statistik “klein”. – Faustregel: F < 10 verdächtig.
Massnahmen:
• bessere Instrumente suchen
• schwächere Instrumente weglassen
• Wechsel des Schätzverfahrens (fortgeschrittene Ökonometrie . . . z.B. limited information
maximum likelihood (LIML))
• es gibt Methoden, um valide Konfidenzintervalle zu bekommen (z.B. Anderson-RubinMethode)
C. Kleiber: Ökonometrie 1
Kap. 10-28
U Basel, HS 2008
10.4
Validität von Instrumenten
2. Exogenität:
Falls mehr Instrumente als endogene Variablen verhanden (→ Überidentifikation), kann in
einem gewissen Umfang Exogenität getestet werden.
Idee: (k = 1, m = 2)
Yi = β0 + β1Xi + ui
verfügbar seien Instrumente Zi1, Zi2
Schätze nun mit TSLS unter Verwendung unterschiedlicher Instrumente.
Falls Schätzungen sehr verschieden, muss mindestens ein Instrument unbrauchbar sein.
C. Kleiber: Ökonometrie 1
Kap. 10-29
U Basel, HS 2008
10.4
Validität von Instrumenten
J-Test:
Intuition: Exogenität bedeutet Unkorreliertheit mit ui.
Prüfe dies durch Vergleich mit ûIV
i !
• schätze interessierende Gleichung mit TSLS und allen Instrumenten.
Bestimme damit Ŷi (für die wahren Xi, nicht die X̂i aus Stufe 1!)
• bestimme Residuen ûi = Yi − Ŷi
• regressiere ûi auf Wi1, . . . , Wir , Zi1, . . . , Zim
• bestimme F -Statistik für “alle Koeffizienten zu Zs = 0”
P
• J := mF −→ χ2m−k
C. Kleiber: Ökonometrie 1
(beachte Freiheitsgrade!)
Kap. 10-30
U Basel, HS 2008
10.5
Empirisches Beispiel
• untersuche nun Elastizität der Zigarettennachfrage mit Paneldaten. Verwende nur 2 Perioden, 1995 und 1985, bilde Differenzen
• teste auf schwache Instrumente
• teste auf Exogenität mit J-Test (falls möglich)
R>
R>
R>
R>
R>
+
R>
+
R>
R>
R>
R>
+
c1985 <- subset(CigarettesSW, year == "1985")
c1995 <- subset(CigarettesSW, year == "1995")
ydiff <- log(c1995$packs) - log(c1985$packs)
pricediff <- with(c1995, log(price/cpi)) - with(c1985,
incdiff <- with(c1995, log(income/population/cpi)) with(c1985, log(income/population/cpi))
taxsdiff <- with(c1995, (taxs - tax)/cpi) with(c1985, (taxs - tax)/cpi)
taxdiff <- with(c1995, tax/cpi) - with(c1985, tax/cpi)
fmdiff1 <- ivreg(ydiff ~ pricediff + incdiff | incdiff
fmdiff2 <- ivreg(ydiff ~ pricediff + incdiff | incdiff
fmdiff3 <- ivreg(ydiff ~ pricediff + incdiff | incdiff
taxdiff)
C. Kleiber: Ökonometrie 1
Kap. 10-31
log(price/cpi))
+ taxsdiff)
+ taxdiff)
+ taxsdiff +
U Basel, HS 2008
10.5
Empirisches Beispiel
Vergleiche Schätzungen mit 1 Instrument mit Schätzung mit 2 Instrumenten:
R> coef(fmdiff1) ## MWSt, ohne Zigarettensteuer!
(Intercept)
-0.1180
pricediff
-0.9380
incdiff
0.5260
R> coef(fmdiff2) ## Zigarettensteuer, ohne MWSt!
(Intercept)
-0.01705
pricediff
-1.34251
incdiff
0.42815
R> coef(fmdiff3) ## beide Steuern!
(Intercept)
-0.052
pricediff
-1.202
C. Kleiber: Ökonometrie 1
incdiff
0.462
Kap. 10-32
U Basel, HS 2008
10.5
Empirisches Beispiel
Haben wir schwache Instrumente? Berechne jeweils F -Statistik für Stufe 1 in TSLS:
R> fm_rel1 <- lm(pricediff ~ incdiff + taxsdiff)
R> fm_rel2 <- lm(pricediff ~ incdiff + taxdiff)
R> fm_rel3 <- lm(pricediff ~ incdiff + taxsdiff + taxdiff)
Für erste und zweite Regression reicht t-Test (warum?), für zweite muss F -Test benutzt
werden:
R> coeftest(fm_rel1, vcov = sandwich)[3,]
Estimate Std. Error
2.546e-02 4.248e-03
t value
5.993e+00
Pr(>|t|)
3.195e-07
R> coeftest(fm_rel2, vcov = sandwich)[3,]
Estimate Std. Error
1.010e-02 9.442e-04
C. Kleiber: Ökonometrie 1
t value
1.069e+01
Pr(>|t|)
6.125e-14
Kap. 10-33
U Basel, HS 2008
10.5
Empirisches Beispiel
Für dritte Regression:
R> fm_rel0 <- lm(pricediff ~ incdiff)
R> anova(fm_rel0, fm_rel3, test = "F")
Analysis of Variance Table
Model 1:
Model 2:
Res.Df
1
46
2
44
pricediff ~ incdiff
pricediff ~ incdiff + taxsdiff + taxdiff
RSS Df Sum of Sq
F Pr(>F)
0.367
0.083 2
0.284 75.7 5.8e-15
Alternativ mit robusten Standardfehlern:
R> waldtest(fm_rel0, fm_rel3, vcov = sandwich)
C. Kleiber: Ökonometrie 1
Kap. 10-34
U Basel, HS 2008
10.5
Empirisches Beispiel
Letzte IV-Regression ist überidentifiziert: Test auf überidentifizierende Restriktionen möglich
R> fm_or <- lm(resid(fmdiff3) ~ incdiff + taxsdiff + taxdiff)
R> fm_or0 <- lm(resid(fmdiff3) ~ incdiff)
R> anova(fm_or0, fm_or)
Analysis of Variance Table
Model 1:
Model 2:
Res.Df
1
46
2
44
resid(fmdiff3) ~ incdiff
resid(fmdiff3) ~ incdiff + taxsdiff + taxdiff
RSS Df Sum of Sq
F Pr(>F)
0.375
0.337 2
0.038 2.47 0.097
Aber ... falsche Freiheitsgrade in F -Statistik (warum?)
Richtiger Wert der Statistik ist hier (warum?)
2 · F = 4.93
C. Kleiber: Ökonometrie 1
>
3.841 = χ21,0.95,
Kap. 10-35
also ablehnen!
U Basel, HS 2008
10.5
Empirisches Beispiel
Fazit:
• J-Test lehnte ab, also mindestens ein Instrument nicht exogen (evtl auch beide!)
Test sagt nicht, welche(s) Instrument(e) problematisch!
Mehrwertsteuer eher exogen als Zigarettensteuer. (?)
Schätzung −0.94 plausibler.
• Preiselastizität überraschend hoch (aber: 10-Jahres-Differenzen)
• Elastizität über kürzere Zeiträume geringer
C. Kleiber: Ökonometrie 1
Kap. 10-36
U Basel, HS 2008
10.6
Ausblick: IV in der Praxis
• Hauptproblem bei IV-Regression: woher kommen Instrumente?
• Finden geeigneter Instrumente erfordert inhaltliches Verständnis der Fragestellung – Hauptprobleme sind nicht mathematisch-statistisch!
• ob Instrumente wirklich geeignet sind, kann nur in begrenztem Umfang überprüft werden,
nämlich wenn mehr potentielle Instrumente zur Verfügung stehen als endogene Regressoren
C. Kleiber: Ökonometrie 1
Kap. 10-37
U Basel, HS 2008
10.6
Ausblick: IV in der Praxis
Beispiele:
• Angrist und Krueger (1991): Löhne und Geburtsquartal (s.o.)
• Reduzieren Haftstrafen die Kriminalität?
S.D. Levitt (1996). The effect of prison population size on crime rates: Evidence from prison overcrowding
litigation. Quarterly Journal of Economics, 111, 319–351.
– regressiere Verbrechensquoten (pro 100’000 Einwohner) auf Prozentsatz Bevölkerung in
Haft (und weitere Regressoren)
– aber: Simultanität?
– Geeignetes Instrument für IV? (exogen, aber korreliert mit Bevölkerung in Haft)
. . . exogene Variation in Haftkapazität, z.B.
Zi: Gesetzgebung gegen Überfüllung von Gefängnissen
• Wachstum und Kolonialismus
D. Acemoglu, S. Johnson und J.A. Robinson (2001). The colonial origins of comparative development – An
empirical investigation. American Economic Review, 91, 1369–1401.
C. Kleiber: Ökonometrie 1
Kap. 10-38
U Basel, HS 2008
Herunterladen