Kap. 10: Regression mit Instrumentvariablen • Motivation • Instrumentvariablen im Modell der linearen Einfachregression • Instrumentvariablen im Modell der linearen Mehrfachregression • Validität von Instrumenten • Empirisches Beispiel • Ausblick: Instrumentvariablen in der Praxis 10.1 Motivation Validität einer OLS-Schätzung in Yi = β0 + β1Xi + ui gefährdet durch (unter anderem) Verletzung von (A1): E(ui|Xi) = 0. Mögliche Ursachen von E(ui|Xi) 6= 0: • Verzerrung durch vergessene Variablen Ideale Lösung: baue benötigte Variable in Analyse ein – aber oft Variable nicht beschaffbar. Wir wissen: Verzerrung durch zeitinvariante fehlende Variablen kann durch Paneldaten eliminiert werden. Aber: was tun, wenn auch Paneldaten nicht beschaffbar? • Simultanität (X beeinflusst Y , Y beeinflusst X) • Verzerrung durch Messfehler (X fehlerhaft gemessen) Instrumentvariablen können Verzerrung in allen diesen Situationen eliminieren. C. Kleiber: Ökonometrie 1 Kap. 10-1 U Basel, HS 2008 10.2 Instrumentvariablen in der linearen Einfachregression Modell der linearen Einfachregression Yi = β0 + β1Xi + ui • Idee: wenn Cov(Xi, ui) 6= 0, zerfällt Xi in 2 Teile – ein Teil ist korreliert mit ui – ein Teil ist unkorreliert mit ui Isoliert man den Teil von Xi, der nicht mit ui korreliert, kann man β1 schätzen. • IV-Regression nutzt eine weitere Variable Zi, die nicht mit ui korreliert. Dieses Zi heisst Instrumentvariable oder kurz Instrument. • IV erkennt Änderungen in Xi, die nicht mit ui korrelieren, und nutzt diese zur Schätzung. C. Kleiber: Ökonometrie 1 Kap. 10-2 U Basel, HS 2008 10.2 Instrumentvariablen in der linearen Einfachregression Terminologie: • Variable heisst endogen, falls sie mit ui korreliert • Variable heisst exogen, falls sie nicht mit ui korreliert • (vage) ein Parameter ist identifiziert, falls er sich aus den Daten (konsistent) schätzen lässt. In linearer Regression kann bei E(ui|Xi) 6= 0 der Parameter β1 nicht allein aus Daten zu (Y, X) bestimmt werden, egal wie gross Stichprobe. Bemerkungen: • (historisch) “endogen” bedeutet “innerhalb des Systems bestimmt” (→ Simultanität). Definition eng, IV-Methode funktioniert auch allgemeiner (Fehler in den Variablen, etc.) • IV-Methoden sind eine Spezialität der Ökonometrie – in statistischer Literatur zu Regressionsmethoden kaum zu finden C. Kleiber: Ökonometrie 1 Kap. 10-3 U Basel, HS 2008 10.2 Instrumentvariablen in der linearen Einfachregression Damit eine Variable als Instrument in Yi = β0 + β1Xi + ui geeignet ist, müssen 2 Bedingungen erfüllt sein: • Relevanz: Cov(Xi, Zi) 6= 0 • Exogenität: Cov(Zi, ui) = 0 Bleiben 2 Fragen . . . • falls Instrument vorhanden, wie schätzt man? • wie findet man Instrumente? C. Kleiber: Ökonometrie 1 Kap. 10-4 U Basel, HS 2008 10.2 Instrumentvariablen in der linearen Einfachregression IV-Schätzung – erste Erklärung: Yi = β0 + β1Xi + ui Es ist (Exogenität von Zi!) Cov(Yi, Zi) = Cov(β0 + β1Xi + ui, Zi) = Cov(β0, Zi) + Cov(β1Xi, Zi) + Cov(ui, Zi) = 0 + β1Cov(Xi, Zi) + 0 also Cov(Yi, Zi) β1 = Cov(Xi, Zi) Ersetze nun Populationsgrössen durch Stichprobengrössen (→ Momentenmethode): β̂1IV C. Kleiber: Ökonometrie 1 sY Z = sXZ Kap. 10-5 U Basel, HS 2008 10.2 Instrumentvariablen in der linearen Einfachregression Rechtfertigung der Methode: Wenn empirische Kovarianzen konsistent, d.h. P sXZ −→ sY Z −→ P Cov(Xi, Zi) Cov(Yi, Zi) dann gilt auch β̂1IV = sY Z P Cov(Yi, Zi) −→ = β1 sXZ Cov(Xi, Zi) Cov(Xi, Zi) 6= 0 (Relevanz des Instruments) garantiert, dass Nenner 6= 0. C. Kleiber: Ökonometrie 1 Kap. 10-6 U Basel, HS 2008 10.2 Instrumentvariablen in der linearen Einfachregression IV-Schätzung – zweite Erklärung: Two-stage least squares (TSLS, oder auch 2SLS) • Isoliere den Teil von Xi, der nicht mit ui korreliert, durch Regression von Xi auf Zi: Xi = π0 + π1Zi + vi – Zi korreliert nicht mit ui, also korreliert auch π0 + π1Zi nicht mit ui. π0, π1 unbekannt, können aber geschätzt werden – verwende dann Prognosen πˆ0 + πˆ1Zi =: X̂i • ersetzte nun Xi durch X̂i in eigentlich interessierender Regression: Yi = β0 + β1X̂i + ui – da X̂i unkorreliert mit ui (in grossen Stichproben), ist (A1) nicht mehr verletzt und OLS wird anwendbar – Schätzer ist unter geeigneten Annahmen konsistent – resultierender Schätzer heisst zweistufiger KQ-Schätzer (TSLS). Notation: β̂1T SLS oder β̂12SLS • Mit einem X und einem Z gilt: β̂1IV = β̂1T SLS C. Kleiber: Ökonometrie 1 Kap. 10-7 U Basel, HS 2008 10.2 Instrumentvariablen in der linearen Einfachregression Beispiel: (Angebot und Nachfrage für Butter) IV entwickelt für agrarökonomische Fragen in den 1920er Jahren. Mehr zur Geschichte der Methode bei J. Stock http://ksghome.harvard.edu/~JStock/wrights/index.htm oder in J. Stock und F. Trebbi (2003). Who invented IV regression? Journal of Economic Perspectives, 17, 177–194. Schätze Preiselastizität für Butter als β1 in log(QButter ) = β0 + β1 log(PiButter ) + ui i Daten seien Preise und Mengen für verschiedene Jahre. Problem: Simultanität! TSLS schätzt, in dem nur Veränderungen der Angebotskurve genutzt werden. Frage: Welche Variable beeinflusst Angebots-, aber nicht Nachfragefunktion? C. Kleiber: Ökonometrie 1 Kap. 10-8 U Basel, HS 2008 10.2 Instrumentvariablen in der linearen Einfachregression Sei Zi Wetter (Regen?) in milchproduzierenden Regionen, dann • Cov(Wetteri, ui) = 0 (Exogenität) plausibel • Cov(Wetteri, log(PiButter )) 6= 0 (Relevanz) plausibel Also \ Butter ) • Schritt 1: regressiere log(PiButter ) auf Wetteri, ergibt log(P i – Änderungen in log(PiButter ), die von Angebotsseite kommen \ Butter ) ) auf log(P • Schritt 2: regressiere log(QButter i i – nutze Verschiebungen der Angebotskurve zur Schätzung der Nachfragekurve C. Kleiber: Ökonometrie 1 Kap. 10-9 U Basel, HS 2008 10.2 Instrumentvariablen in der linearen Einfachregression Inferenz mit TSLS/IV: • in grossen Stichproben ist TSLS/IV approximativ normalverteilt • damit Inferenz (Tests, Konfidenzintervalle) wie üblich • Idee hinter approximativer Normalverteilung ist wieder, dass Schätzer als Mittel von u.i.v. ZVen mit Erwartungswert Null darstellbar ist Ergebnis: approximative Verteilung ist a β̂1IV ∼ Var{(Zi − µZ )ui} N β1 , n{Cov(Zi, Xi)}2 ! All das gilt nur, wenn Instrumente valide sind – mehr später. C. Kleiber: Ökonometrie 1 Kap. 10-10 U Basel, HS 2008 10.2 Instrumentvariablen in der linearen Einfachregression Empirisches Beispiel: Nachfrage nach Zigaretten • wie stark reduziert Zigarettensteuer die Nachfrage? • schätze Elastizität mittels Zig log(QZig ) = β + β log(P ) + ui 0 1 i i • Ist OLS evtl. verzerrt? Daten: • Paneldaten für jährlichen Zigarettenverbrauch (Packungen pro Kopf) und Preise (inkl. Steuer) für 48 US-Bundesstaaten, 1985–1995. • Instrument Zi: Mehrwertsteuer (sales tax) pro Packung. (relevant? exogen?) C. Kleiber: Ökonometrie 1 Kap. 10-11 U Basel, HS 2008 10.2 Instrumentvariablen in der linearen Einfachregression Variablen: cpi population packs income tax price taxs C. Kleiber: Ökonometrie 1 Consumer price index (für Inflationsbereinigung). Bevölkerung. Nachfrage nach Zigaretten (Anzahl Packungen pro Kopf). Einkommen (Summe pro Staat). Zigarettensteuer. Zigarettenpreis (Jahresdurchschnitt) inkl. Steuer. Zigarettensteuer inkl. Mehrwertsteuer. Kap. 10-12 U Basel, HS 2008 10.2 Instrumentvariablen in der linearen Einfachregression Regression mit Daten für 1995: R> R> R> R> data("CigarettesSW", package = "AER") Cig1995 <- subset(CigarettesSW, year == "1995") fm_stufe1 <- lm(log(price/cpi) ~ I((taxs - tax)/cpi), data = Cig1995) coef(fm_stufe1) (Intercept) I((taxs - tax)/cpi) 4.61655 0.03073 R> fm_stufe2 <- lm(log(packs) ~ fitted(fm_stufe1), data = Cig1995) R> coef(fm_stufe2) (Intercept) fitted(fm_stufe1) 9.720 -1.084 Warnung: Standardfehler aus 2. Regression sind nicht gültig, da nicht verwendet wird, dass Regressor Prognose aus anderer Gleichung! C. Kleiber: Ökonometrie 1 Kap. 10-13 U Basel, HS 2008 10.2 Instrumentvariablen in der linearen Einfachregression Es ist nicht nötig, beide Schritte “von Hand” zu rechnen. Ökonometrische Software hat Funktionen für IV-Regressionen. – In R: • Paket sem (“structural equation models”) hat Funktion tsls() R> R> + R> library("sem") fm_tsls <- tsls(log(packs) ~ log(price/cpi), instruments = ~ I((taxs - tax)/cpi), data = Cig1995) coef(fm_tsls) (Intercept) log(price/cpi) 9.720 -1.084 • Paket AER (“Applied Econometrics with R”) hat Funktion ivreg() R> fm_iv <- ivreg(log(packs) ~ log(price/cpi) | I((taxs - tax)/cpi), + data = Cig1995) R> coef(fm_iv) (Intercept) log(price/cpi) 9.720 -1.084 Nachfrage überrraschend elastisch . . . aber vergessene Variablen? C. Kleiber: Ökonometrie 1 Kap. 10-14 U Basel, HS 2008 10.2 Instrumentvariablen in der linearen Einfachregression R> summary(fm_iv) ## dies sind Standardfehler unter Homoskedastie! Call: ivreg(formula = log(packs) ~ log(price/cpi) | I((taxs - tax)/cpi), data = Cig1995) Residuals: Min 1Q -0.6462 -0.0773 Median 0.0298 3Q 0.1128 Max 0.4190 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 9.720 1.514 6.42 6.8e-08 log(price/cpi) -1.084 0.317 -3.42 0.0013 Residual standard error: 0.19 on 46 degrees of freedom Multiple R-Squared: 0.401, Adjusted R-squared: 0.388 Wald test: 11.7 on 1 and 46 DF, p-value: 0.00131 C. Kleiber: Ökonometrie 1 Kap. 10-15 U Basel, HS 2008 10.2 Instrumentvariablen in der linearen Einfachregression Mit Heteroskedastie-robusten Standardfehlern: R> coeftest(fm_iv, vcov = sandwich) t test of coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 9.720 1.496 6.50 5.2e-08 log(price/cpi) -1.084 0.312 -3.47 0.0011 Hier nicht sehr verschieden von Standardfehlern unter Homoskedastie – dies muss aber nicht so sein! C. Kleiber: Ökonometrie 1 Kap. 10-16 U Basel, HS 2008 10.2 Instrumentvariablen in der linearen Einfachregression Zusammenfassung für IV mit einem X und einem Z: • valides Instrument Z muss 2 Bedingungen erfüllen: – Relevanz: Cov(Xi, Zi) 6= 0 – Exogenität: Cov(Zi, ui) = 0 • TSLS/IV regressiert zunächst Xi auf Zi, dann Yi auf X̂i • Idee: Stufe 1 isoliert den Teil von Xi, der nicht mit ui korreliert • falls Instrument “gut”, ist TSLS approximativ normalverteilt Ausblick: wir brauchen noch • mehrere endogene Regressoren X1, . . . , Xk • mehrere exogene Regressoren W1, . . . , Wr → Vorbeugen gegen Verzerrung durch vergessene Variablen • mehrere Instrumentvariablen Z1, . . . , Zm → mehr “gute” Instrumente liefern kleinere Varianz von TSLS C. Kleiber: Ökonometrie 1 Kap. 10-17 U Basel, HS 2008 10.3 Instrumentvariablen in der linearen Mehrfachregression Notation und Terminologie: Yi = β0 + β1Xi1 + . . . + βk Xik + βk+1Wi1 + . . . + βk+r Wir + ui • Yi abhängige Variable • X1, . . . , Xk endogene Regressoren • W1, . . . , Wr exogene Regressoren • Z1, . . . , Zm Instrumente Neue Begriffe und Erweiterungen: • Identifikation und Überidentifikation • TSLS mit zusätzlichen exogenen Variablen und evtl. mehreren endogenen Regressoren • Annahmen zur Gültigkeit von IV-Methoden? C. Kleiber: Ökonometrie 1 Kap. 10-18 U Basel, HS 2008 10.3 Instrumentvariablen in der linearen Mehrfachregression Identifikation: • Ein Parameter ist identifiziert, falls er sich aus gegebenen Daten konsistent schätzen lässt. • bei IV-Regression hängt Identifikation der Koeffizienten von Zahl der Instrumente m in Relation zur Zahl der endogenen Regressoren k ab. Intuition: bei weniger Instrumenten als endogenen Regressoren sind βs nicht konsistent schätzbar. β1, . . . , βk heissen – exakt identifiziert, falls m = k – überidentifiziert, falls m > k (→ Gültigkeit der Instrumente testbar) – unteridentifiziert, falls m < k (→ brauchen mehr Instrumente) C. Kleiber: Ökonometrie 1 Kap. 10-19 U Basel, HS 2008 10.3 Instrumentvariablen in der linearen Mehrfachregression IV-Regression, allgemeiner Fall: Yi = β0 + β1Xi1 + . . . + βk Xik + βk+1Wi1 + . . . + βk+r Wir + ui Verfügbare Instrumente seien Z1, . . . , Zm. • Stufe 1: – regressiere jeden endogenen Regressor Xj auf alle exogenen Regressoren W1, . . . , Wr , Z1, . . . , Zm mit OLS – bestimme Prognosen X̂j , für alle endogenen Regressoren j = 1, . . . , k • Stufe 2: – regressiere nun Y auf X̂1, . . . , X̂k , W1, . . . , Wr mit OLS – die Koeffizienten dieser 2. Stufe sind IV/TSLS-Schätzungen (aber Standardfehler noch falsch) • führe dies gleich mit IV/TSLS-Prozedur durch, um richtige Standardfehler zu erhalten C. Kleiber: Ökonometrie 1 Kap. 10-20 U Basel, HS 2008 10.3 Instrumentvariablen in der linearen Mehrfachregression Beispiel: Nachfrage nach Zigaretten • weitere Einflussgrösse ist Einkommen • Nachfragefunktion mit einem X, einem W : Zig log(QZig ) = β + β log(P ) + β2 log(Inci) + ui 0 1 i i mit Inci reales Pro-Kopf-Einkommen. Es gibt 2 Instrumente Z1, Z2 – Zi1 allgemeine Mehrwertsteuer – Zi2 Zigarettensteuer • weitere exogene Regressoren W könnten Staaten- oder Jahreseffekte sein (in Paneldaten) C. Kleiber: Ökonometrie 1 Kap. 10-21 U Basel, HS 2008 10.3 R> + + + R> Instrumentvariablen in der linearen Mehrfachregression fm_iv2 <- ivreg(log(packs) ~ log(price/cpi) + log(income/population/cpi) | log(income/population/cpi) + I((taxs - tax)/cpi), data = Cig1995) coef(fm_iv2) (Intercept) 9.4307 log(income/population/cpi) 0.2145 C. Kleiber: Ökonometrie 1 log(price/cpi) -1.1434 Kap. 10-22 U Basel, HS 2008 10.3 Instrumentvariablen in der linearen Mehrfachregression R> summary(fm_iv2) Call: ivreg(formula = log(packs) ~ log(price/cpi) + log(income/population/cpi) | log(income/population/cpi) + I((taxs - tax)/cpi), data = Cig1995) Residuals: Min 1Q -0.61100 -0.08607 Median 0.00942 3Q 0.10691 Max 0.39316 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 9.431 1.358 6.94 1.2e-08 log(price/cpi) -1.143 0.359 -3.18 0.0027 log(income/population/cpi) 0.215 0.269 0.80 0.4287 Residual standard error: 0.19 on 45 degrees of freedom Multiple R-Squared: 0.419, Adjusted R-squared: 0.393 Wald test: 6.53 on 2 and 45 DF, p-value: 0.00323 C. Kleiber: Ökonometrie 1 Kap. 10-23 U Basel, HS 2008 10.3 R> + + + R> Instrumentvariablen in der linearen Mehrfachregression fm_iv3 <- ivreg(log(packs) ~ log(price/cpi) + log(income/population/cpi) | log(income/population/cpi) + I((taxs - tax)/cpi) + I(tax/cpi), data = Cig1995) coeftest(fm_iv3, vcov = sandwich) t test of coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 9.895 0.929 10.65 6.9e-14 log(price/cpi) -1.277 0.242 -5.29 3.5e-06 log(income/population/cpi) 0.280 0.246 1.14 0.26 Fazit: • kleinere Standardfehler bei m = 2 (mehr Instrumente = mehr Information) • kleine Einkommenselastizität (Zigaretten kein Luxusgut) • hohe Preiselastiziät (intuitiv . . . ?) C. Kleiber: Ökonometrie 1 Kap. 10-24 U Basel, HS 2008 10.3 Instrumentvariablen in der linearen Mehrfachregression Annahmen IV-Regression: Yi = β0 + β1Xi1 + . . . + βk Xik + βk+1Wi1 + . . . + βk+r W ir + ui (A1) E(ui|Wi1, . . . , Wir ) = 0 (A2) (Yi, Xi1, . . . , Xik , Wi1, . . . , Wir , Zi1, . . . , Zim), i = 1, . . . , n, sind u.i.v. (A3) die X, W, Z, Y haben je 4 Momente (A4) die Regressoren sind nicht linear abhängig (keine “perfekte Multikollinearität”) (A5) die Instrumente erfüllen die Bedingungen, die für valide Instrumente gestellt wurden (Relevanz und Exogenität) Dabei 2–4 bekannt, 5 wurde diskutiert, 1 besagt: “die exogenen Variablen sind exogen”. Unter diesen Annahmen kann man zeigen, dass TSLS/IV approximativ normalverteilt ist. C. Kleiber: Ökonometrie 1 Kap. 10-25 U Basel, HS 2008 10.4 Validität von Instrumenten Problem: Kann man überprüfen, ob Instrumente relevant und/oder exogen sind? 1. Relevanz: sei zur Vereinfachung Yi = β0 + β1Xi + β2Wi1 + . . . + βr+1Wir + ui Regression Stufe 1 ist Xi = π0 + π1Zi1 + . . . + πmZim + πm+1Wi1 + . . . + πm+r Wir + vi • Instrumente relevant, falls mindestens ein π1, . . . , πm 6= 0 • Instrumente heissen schwach, falls alle π1, . . . , πm ≈ 0. Schwache Instrumente erklären wenig Variation in X, die nicht schon durch die W s erklärt wird – und sind eine Gefahr für jede IV-Regression! • Intuition: sY Z sXZ Bei schwachem Instrument ist Nenner klein – IV unzuverlässig (NV-Approximation schlecht) β̂1IV = C. Kleiber: Ökonometrie 1 Kap. 10-26 U Basel, HS 2008 10.4 Validität von Instrumenten Beispiel: (Arbeitsmarktökonomie) Neue Literatur zu schwachen Instrumenten gestartet durch J. Angrist und A. Krueger (1991). Does compulsory school attendance affect schooling and earnings? Quarterly Journal of Economics, 106, 979–1014. • Ziel: Schätzung von Ausbildungserträgen (returns on education) • Problem: in Regression von Lohn auf Ausbildungsjahre etc. fehlen Fähigkeiten (begabtere Schüler haben höhere Schulabschlüsse – nicht exogen) – leider ist diese Variable nicht beschaffbar. • Welche Variable korreliert mit Ausbildungsjahren, aber nicht mit Fehlerterm in Ausgangsregression? Angrist und Krueger schlagen vor . . . Geburtstag! (-squartal) • Problem: bei n > 3000000 war Corr(Ausbildung, Geburtsquartal) ≈ 0.03 . . . C. Kleiber: Ökonometrie 1 Kap. 10-27 U Basel, HS 2008 10.4 Validität von Instrumenten Wie kann man IV-Regression mit schwachen Instrumenten erkennen? Betrachte in Stufe 1 von TSLS Xi = π0 + π1Zi1 + . . . + πmZim + πm+1Wi1 + . . . + πm+r Wir + vi und F -Test von H0 : π1 = . . . = πm = 0. Bei schwachen Instrumenten ist Statistik “klein”. – Faustregel: F < 10 verdächtig. Massnahmen: • bessere Instrumente suchen • schwächere Instrumente weglassen • Wechsel des Schätzverfahrens (fortgeschrittene Ökonometrie . . . z.B. limited information maximum likelihood (LIML)) • es gibt Methoden, um valide Konfidenzintervalle zu bekommen (z.B. Anderson-RubinMethode) C. Kleiber: Ökonometrie 1 Kap. 10-28 U Basel, HS 2008 10.4 Validität von Instrumenten 2. Exogenität: Falls mehr Instrumente als endogene Variablen verhanden (→ Überidentifikation), kann in einem gewissen Umfang Exogenität getestet werden. Idee: (k = 1, m = 2) Yi = β0 + β1Xi + ui verfügbar seien Instrumente Zi1, Zi2 Schätze nun mit TSLS unter Verwendung unterschiedlicher Instrumente. Falls Schätzungen sehr verschieden, muss mindestens ein Instrument unbrauchbar sein. C. Kleiber: Ökonometrie 1 Kap. 10-29 U Basel, HS 2008 10.4 Validität von Instrumenten J-Test: Intuition: Exogenität bedeutet Unkorreliertheit mit ui. Prüfe dies durch Vergleich mit ûIV i ! • schätze interessierende Gleichung mit TSLS und allen Instrumenten. Bestimme damit Ŷi (für die wahren Xi, nicht die X̂i aus Stufe 1!) • bestimme Residuen ûi = Yi − Ŷi • regressiere ûi auf Wi1, . . . , Wir , Zi1, . . . , Zim • bestimme F -Statistik für “alle Koeffizienten zu Zs = 0” P • J := mF −→ χ2m−k C. Kleiber: Ökonometrie 1 (beachte Freiheitsgrade!) Kap. 10-30 U Basel, HS 2008 10.5 Empirisches Beispiel • untersuche nun Elastizität der Zigarettennachfrage mit Paneldaten. Verwende nur 2 Perioden, 1995 und 1985, bilde Differenzen • teste auf schwache Instrumente • teste auf Exogenität mit J-Test (falls möglich) R> R> R> R> R> + R> + R> R> R> R> + c1985 <- subset(CigarettesSW, year == "1985") c1995 <- subset(CigarettesSW, year == "1995") ydiff <- log(c1995$packs) - log(c1985$packs) pricediff <- with(c1995, log(price/cpi)) - with(c1985, incdiff <- with(c1995, log(income/population/cpi)) with(c1985, log(income/population/cpi)) taxsdiff <- with(c1995, (taxs - tax)/cpi) with(c1985, (taxs - tax)/cpi) taxdiff <- with(c1995, tax/cpi) - with(c1985, tax/cpi) fmdiff1 <- ivreg(ydiff ~ pricediff + incdiff | incdiff fmdiff2 <- ivreg(ydiff ~ pricediff + incdiff | incdiff fmdiff3 <- ivreg(ydiff ~ pricediff + incdiff | incdiff taxdiff) C. Kleiber: Ökonometrie 1 Kap. 10-31 log(price/cpi)) + taxsdiff) + taxdiff) + taxsdiff + U Basel, HS 2008 10.5 Empirisches Beispiel Vergleiche Schätzungen mit 1 Instrument mit Schätzung mit 2 Instrumenten: R> coef(fmdiff1) ## MWSt, ohne Zigarettensteuer! (Intercept) -0.1180 pricediff -0.9380 incdiff 0.5260 R> coef(fmdiff2) ## Zigarettensteuer, ohne MWSt! (Intercept) -0.01705 pricediff -1.34251 incdiff 0.42815 R> coef(fmdiff3) ## beide Steuern! (Intercept) -0.052 pricediff -1.202 C. Kleiber: Ökonometrie 1 incdiff 0.462 Kap. 10-32 U Basel, HS 2008 10.5 Empirisches Beispiel Haben wir schwache Instrumente? Berechne jeweils F -Statistik für Stufe 1 in TSLS: R> fm_rel1 <- lm(pricediff ~ incdiff + taxsdiff) R> fm_rel2 <- lm(pricediff ~ incdiff + taxdiff) R> fm_rel3 <- lm(pricediff ~ incdiff + taxsdiff + taxdiff) Für erste und zweite Regression reicht t-Test (warum?), für zweite muss F -Test benutzt werden: R> coeftest(fm_rel1, vcov = sandwich)[3,] Estimate Std. Error 2.546e-02 4.248e-03 t value 5.993e+00 Pr(>|t|) 3.195e-07 R> coeftest(fm_rel2, vcov = sandwich)[3,] Estimate Std. Error 1.010e-02 9.442e-04 C. Kleiber: Ökonometrie 1 t value 1.069e+01 Pr(>|t|) 6.125e-14 Kap. 10-33 U Basel, HS 2008 10.5 Empirisches Beispiel Für dritte Regression: R> fm_rel0 <- lm(pricediff ~ incdiff) R> anova(fm_rel0, fm_rel3, test = "F") Analysis of Variance Table Model 1: Model 2: Res.Df 1 46 2 44 pricediff ~ incdiff pricediff ~ incdiff + taxsdiff + taxdiff RSS Df Sum of Sq F Pr(>F) 0.367 0.083 2 0.284 75.7 5.8e-15 Alternativ mit robusten Standardfehlern: R> waldtest(fm_rel0, fm_rel3, vcov = sandwich) C. Kleiber: Ökonometrie 1 Kap. 10-34 U Basel, HS 2008 10.5 Empirisches Beispiel Letzte IV-Regression ist überidentifiziert: Test auf überidentifizierende Restriktionen möglich R> fm_or <- lm(resid(fmdiff3) ~ incdiff + taxsdiff + taxdiff) R> fm_or0 <- lm(resid(fmdiff3) ~ incdiff) R> anova(fm_or0, fm_or) Analysis of Variance Table Model 1: Model 2: Res.Df 1 46 2 44 resid(fmdiff3) ~ incdiff resid(fmdiff3) ~ incdiff + taxsdiff + taxdiff RSS Df Sum of Sq F Pr(>F) 0.375 0.337 2 0.038 2.47 0.097 Aber ... falsche Freiheitsgrade in F -Statistik (warum?) Richtiger Wert der Statistik ist hier (warum?) 2 · F = 4.93 C. Kleiber: Ökonometrie 1 > 3.841 = χ21,0.95, Kap. 10-35 also ablehnen! U Basel, HS 2008 10.5 Empirisches Beispiel Fazit: • J-Test lehnte ab, also mindestens ein Instrument nicht exogen (evtl auch beide!) Test sagt nicht, welche(s) Instrument(e) problematisch! Mehrwertsteuer eher exogen als Zigarettensteuer. (?) Schätzung −0.94 plausibler. • Preiselastizität überraschend hoch (aber: 10-Jahres-Differenzen) • Elastizität über kürzere Zeiträume geringer C. Kleiber: Ökonometrie 1 Kap. 10-36 U Basel, HS 2008 10.6 Ausblick: IV in der Praxis • Hauptproblem bei IV-Regression: woher kommen Instrumente? • Finden geeigneter Instrumente erfordert inhaltliches Verständnis der Fragestellung – Hauptprobleme sind nicht mathematisch-statistisch! • ob Instrumente wirklich geeignet sind, kann nur in begrenztem Umfang überprüft werden, nämlich wenn mehr potentielle Instrumente zur Verfügung stehen als endogene Regressoren C. Kleiber: Ökonometrie 1 Kap. 10-37 U Basel, HS 2008 10.6 Ausblick: IV in der Praxis Beispiele: • Angrist und Krueger (1991): Löhne und Geburtsquartal (s.o.) • Reduzieren Haftstrafen die Kriminalität? S.D. Levitt (1996). The effect of prison population size on crime rates: Evidence from prison overcrowding litigation. Quarterly Journal of Economics, 111, 319–351. – regressiere Verbrechensquoten (pro 100’000 Einwohner) auf Prozentsatz Bevölkerung in Haft (und weitere Regressoren) – aber: Simultanität? – Geeignetes Instrument für IV? (exogen, aber korreliert mit Bevölkerung in Haft) . . . exogene Variation in Haftkapazität, z.B. Zi: Gesetzgebung gegen Überfüllung von Gefängnissen • Wachstum und Kolonialismus D. Acemoglu, S. Johnson und J.A. Robinson (2001). The colonial origins of comparative development – An empirical investigation. American Economic Review, 91, 1369–1401. C. Kleiber: Ökonometrie 1 Kap. 10-38 U Basel, HS 2008