3. Dynamische lineare Panelmodelle 3.1 Ansatz und Problemstellung → Die wesentliche Annahme bei fixed effects und random effects Schätzungen in linearen Panelmodellen ist, dass die erklärenden Variablen (zumindest in Bezug auf den idiosynkratischen Fehler vit) strikt exogen sind. Demnach ergeben sich hier keine konsistenten Schätzer, falls endogene erklärende Variablen wie z.B. im Fall verzögerter abhängiger Variablen vorliegen. Die Einbeziehung verzögerter abhängiger Variablen (z.B. yi,t-1) als erklärende Variablen erlaubt die Analyse, ob die abhängige Variable yit auch direkt von ihren Werten in der Vergangenheit abhängt. Dies ist z.B. für Politikmaßnahmen in Bezug auf die Persistenz von temporären Schocks auf individuelle Einkommen interessant. Dabei spricht man von „true state dependence“, die sich vom indirekten Effekt durch die unbeobachtete Heterogenität αi und vom direkten Effekt durch beobachtete Heterogenität in den erklärenden Variablen unterscheidet. Für den allgemeinsten Ansatz dynamischer linearer Panelmodelle mit unbeobachteter Heterogenität ergibt sich (für i = 1,…, n; t = p+1,…, T): y it = γ1y i,t-1 + = γ1y i,t-1 + + γ p y i,t-p + β1x it1 + + β k x itk + α i + v it + γ p y i,t-p + β'x it + α i + v it Dabei gilt xit = (xit1,…, xitk)‘ und β = (β1,…, βk)‘. 1 Dieser allgemeine Ansatz beinhaltet verschiedene Spezialfälle wie z.B. ein einfaches reines AR(1) Modell, ein reines AR(p) Modell oder ein AR(1) Modell unter zusätzlicher Einbeziehung von erklärenden Variablen in xit: y it = γy i,t-1 + α i + v it y it = γ1y i,t-1 + + γ p y i,t-p + α i + v it y it = γy i,t-1 + β'x it + α i + v it Konsequenzen der Einbeziehung von verzögerten abhängigen Variablen als erklärende Variablen, z.B. im Ansatz yit = γyi,t-1 + β‘xit + αi + vit: • Der konventionelle OLS-Schätzer ist nicht konsistent. In diesem Fall ist der Störterm αi+vit mit yi,t-1 korreliert, da der fixe Effekt αi mit yi,t-1 aufgrund von yi,t-1 = γyi,t-2 + β‘xi,t-1 + αi + vi,t-1 korreliert ist. • Bei der fixed effects Schätzung ergibt sich bei der within Transformation: y it - yi = γ(yi,t-1 - yi ) + β'(x it - x i ) + v it - v i Da yit von vit abhängt, hängt auch yi,t-1 von vi,t-1 ab, so dass yi,t-1 mit vi korreliert ist. Dies impliziert, dass bei der within Transformation die erklärende Variable yi,t-1-yi mit dem Störterm vit-vi korreliert ist. Somit ist auch der OLSSchätzer in diesem Ansatz inkonsistent. Die Konsistenz würde erfordern, dass vi im Vergleich zu vit klein ist. Dies erfordert T → ∞, was allerdings bei mikroökonometrischen Betrachtungen mit eher kleinen T nicht zutrifft. 2 • Bei der random effects Schätzung ergibt sich mit εit = αi + vit folgende Transformation: yit - λyi = γ(yi,t-1 - λyi ) + β'(x it - λx i ) + (ε it - λεi ) Durch die zuvor beschriebene Korrelation von αi mit yi,t-1 ergibt sich, dass die erklärende Variable yi,t-1-λyi mit dem Störterm εit-λεi korreliert ist, wodurch auch dieser Schätzer inkonsistent ist. Bei der Bildung der ersten Differenzen in allgemeinen dynamischen linearen Panelmodellen ergibt sich (für i = 1,…, n; t = p+1,…, T): y it - y i,t-1 = γ1 (y i,t-1 - y i,t-2 ) + Δy it = γ1Δy i,t-1 + + γ p (y i,t-p - y i,t-p-1 ) + β'(x it - x i,t-1 ) + v it - v i,t-1 + γ pΔy i,t-p + β'Δx it + Δv it Selbst mit der Annahme, dass die vit nicht autokorreliert sind, sind die OLSSchätzer in diesem first-differences Modell inkonsistent. Der Grund hierfür ist, dass yi,t-1 von vi,t-1 abhängt, so dass die erklärende Variable ∆yi,t-1 = yi,t-1 - yi,t-2 mit dem Störterm ∆vit = vit - vi,t-1 korreliert ist. → Endogenität in den erklärenden Variablen ist eines der wichtigsten Probleme nicht nur in Panelmodellen, sondern generell in ökonometrischen Modellen (z.B. bei vernachlässigten erklärenden Variablen, d.h. bei einem „omitted variable bias“). Einer der populärsten Ansätze zur Lösung von Endogenitätsproblemen ist die Anwendung von Instrumentalvariablenmethoden. 3 3.2 Einfache Instrumentalvariablenmethode Ausgangspunkt: Lineares Regressionsmodell mit Querschnittsdaten y i = β0 + β1x i1 + β 2 x i2 + + β k x ik + ε i für i =1,..., n Im Rahmen der Instrumentalvariablenanalyse wird dieses Ausgangsmodell mit E(εi) = 0 als Strukturmodell oder Strukturgleichung bezeichnet. Besonderheiten: • Die erklärenden Variablen xi1,…, xi,k-1 sind exogen • xik ist dagegen endogen und mit dem Fehlerterm εi korreliert, d.h. es gilt Cov(xik, εi) ≠ 0 • xik soll durch eine beobachtbare exogene Variable zi1 instrumentiert werden Voraussetzungen für geeignete (valide) Instrumentalvariablen zi1: • Instrument-Exogenität: - Die Instrumentalvariable ist unkorreliert mit dem Fehlerterm, d.h. es gilt Cov(zi1, εi) = 0 (diese Bedingung kann in der Regel nicht getestet werden, sondern muss z.B. auf theoretischen Überlegungen basieren) - Die Instrumentalvariable hat (bei vernachlässigten erklärenden Variablen) keinen partiellen Effekt auf yi und trägt somit nicht zur Erklärung von yi bei • Instrument-Relevanz, d.h. die Instrumentalvariable ist korreliert mit der en- 4 dogenen erklärenden Variablen, so dass Cov(zi1, xik) ≠ 0 Die Instrumentalvariablenschätzung (IV-Schätzung) ist eine spezifische Form einer einfachen Momentenschätzung: • Die Idee dabei ist, dass bei zufälligen Stichproben eine Stichprobenstatistik (wie z.B. ein Stichprobenmittel oder eine Stichprobenvarianz) stochastisch gegen eine Konstante konvergiert, die eine Funktion der unbekannten Parameter der zugrundeliegenden Verteilung ist • Zur Schätzung von m Parametern werden m solche Statistiken benötigt • Wenn nun ein System von m Momentengleichungen, die Stichprobenmomente (also Stichprobenstatistiken) mit den Momenten der zugrundeliegenden Verteilung (also den Konstanten, die eine Funktion der unbekannten Parameter sind) gleichsetzen, nach den m unbekannten Parametern gelöst wird, erhält man die entsprechenden einfachen Momentenschätzer • Falls mehr als m Momentenbedingungen zur Schätzung von m Parametern vorliegen, führt diese Schätzmethode oft zu keiner eindeutigen Lösung. In diesem Fall kann die Verallgemeinerte Momentenmethode (GMM) angewendet werden (siehe später). Durch unterschiedliche Momentenbedingungen erhält man unterschiedliche einfache Momentenschätzer. Bei der IV-Schätzung ergeben sich die Momentenbedingungen aus den Eigenschaften der Instrumentalvariablen. Die exogenen erklärenden Variablen fungieren dabei als ihr eigenes Instrument. Im zuvor spezifizierten linearen Regressionsmodell wird angenommen: 5 • E(εi) = E(yi - β0 - β1xi1 -…- βkxik) = 0 • Cov(xih, εi) = E(xihεi) - E(xih)E(εi) = E(xihεi) = 0 (h = 1,…, k-1) • Cov(zi1, εi) = E(zi1εi) - E(zi1)E(εi) = E(zi1εi) = 0 Durch das Gleichsetzen der entsprechenden Stichprobenmomente mit den Momenten der zugrundeliegenden Verteilung bzw. der Differenzen mit dem Wert null (die Momente der zugrundeliegenden Verteilung sind hier jeweils null) ergeben sich folgende k+1 Momentengleichungen für den IV- und damit spezifischen einfachen Momentenschätzer der k+1 unbekannten Regressionsparameter: 1 n (y i - βˆ 0 - βˆ 1x i1 n i=1 - βˆ k x ik ) = 0 1 n x i1 (y i - βˆ 0 - βˆ 1x i1 n i=1 1 n x i,k-1 (y i - βˆ 0 - βˆ 1x i1 n i=1 1 n z i1 (y i - βˆ 0 - βˆ 1x i1 n i=1 - βˆ k x ik ) = 0 - βˆ k x ik ) = 0 - βˆ k x ik ) = 0 6 Falls zi1 = xik, erhält man den OLS-Schätzer der unbekannten Regressionsparameter. Falls also xik exogen ist, kann auch diese erklärende Variable als eigenes Instrument fungieren, wodurch der IV-Schätzer identisch mit dem entsprechenden OLS-Schätzer ist. Die entsprechenden Momentengleichungen sind deshalb in diesem Fall identisch mit den Bedingungen erster Ordnung bei der OLS-Methode (bei der Lösung der Gleichungen nach den k+1 Parametern kann der Faktor 1/n jeweils vernachlässigt werden): n (y - βˆ - βˆ x i 0 1 i1 - βˆ 2 x i2 - - βˆ k x ik ) = 0 i=1 n x i1 (y i - βˆ 0 - βˆ 1x i1 - βˆ 2 x i2 - - βˆ k x ik ) = 0 ik (y i - βˆ 0 - βˆ 1x i1 - βˆ 2 x i2 - - βˆ k x ik ) = 0 i=1 n x i=1 Dies verdeutlicht, dass die OLS-Methode ein Spezialfall der IV-Methode sowie der einfachen Momentenmethode ist. Bei anderen Instrumentalvariablen sowie Momentengleichungen ergeben sich IV- und einfache Momentenschätzer, die vom OLS-Schätzer abweichen. 7 Eigenschaften des IV-Schätzers: • Falls Cov(zi1, εi) = 0 und Cov(zi1, xik) ≠ 0, ist der IV-Schätzer (als Spezialfall eines einfachen Momentenschätzers) für n → ∞ konsistent • Falls Cov(xik, εi) ≠ 0, so dass die IV-Schätzung im Hinblick auf die Konsistenz benötigt wird (da die OLS-Schätzung in diesem Fall ja inkonsistent ist), ist der IV-Schätzer niemals erwartungstreu • Dadurch kann der IV-Schätzer bei kleinen Stichprobenumfängen starke Verzerrungen aufweisen, weshalb bei der Anwendung dieser Schätzmethode große Stichprobenumfänge geboten sind • IV-Schätzer sind bei großen Stichprobenumfängen näherungsweise normalverteilt (Funktionen von IV-Schätzern sind asymptotisch normalverteilt), so dass Teststatistiken wie der t-Wert sowie Konfidenzintervalle konstruiert werden können • Die (geschätzte) Varianz der mit der IV-Methode geschätzten Parameter ist immer größer als bei der OLS-Methode (falls nicht zi1 = xik). Daraus ergibt sich, dass die IV-Methode im Hinblick auf Effizienz immer der OLS-Methode unterlegen ist, falls alle erklärenden Variablen exogen sind. • Falls Cov(zi1, xik) = 0, also die Instrument-Relevanz nicht gilt, kann dies zu sehr stark (asymptotisch) verzerrten IV-Schätzern führen, unabhängig davon ob zi1 und εi unkorreliert sind oder nicht • Bestimmtheitsmaße auf Basis von IV-Schätzungen können negativ werden 8 Schwache Instrumente (d.h. schwache Korrelationen zwischen der Instrumentalvariablen zi1 und der endogenen Variablen xik): • Die geschätzte Varianz der mit der IV-Methode geschätzten Parameter steigt mit sinkender Korrelation zwischen zi1 und xik und kann deshalb bei schwachen Instrumenten zi1 sehr groß werden • Selbst wenn zi1 und εi nur moderat korreliert sind, können schwache Instrumente zi1 zu sehr stark (asymptotisch) verzerrten IV-Schätzern führen Im Unterschied zur Instrument-Exogenität kann und sollte die Instrument-Relevanz grundsätzlich getestet werden. In multiplen linearen Regressionsmodellen ist dabei die partielle Korrelation zwischen zi1 und xik entscheidend. Zur Überprüfung der Instrument-Relevanz kann die endogene erklärende Variable auf alle exogenen Variablen sowie die Instrumentalvariable regressiert werden: x ik = δ0 + δ1x i1 + + δ k-1x ik-1 +δ k z i1 + ν i Diese Gleichung ist ein Beispiel einer reduzierten Form, bei der grundsätzlich endogene Variablen durch exogene Variablen ausgedrückt werden (der Name stammt aus der Betrachtung von simultanen Gleichungsmodellen). Auf Basis einer OLS-Schätzung wird mit einem t-Test die Nullhypothese überprüft, dass δk gleich null ist. Falls diese Hypothese bei kleinen Signifikanzniveaus verworfen wird, kann von Instrument-Relevanz ausgegangen werden. → Die IV-Methode kann ähnlich auch bei linearen Regressionsmodellen mit Zeitreihendaten sowie linearen Panelmodellen angewendet werden 9 --------------------------------------------------------------------------------------------------------Beispiel 1: Erklärung von Geburtsgewichten (I) Mit Hilfe eines linearen Regressionsmodells wird für n = 1191 Geburten wieder der Effekt der durchschnittlichen Anzahl der von der Mutter während der Schwangerschaft täglich gerauchten Zigaretten (cigs), der Geburtsrangfolge des Kindes (parity) sowie des jährlichen Familieneinkommens (faminc) in 1000 Dollar auf das Geburtsgewicht des Kindes (bwght) in ounces untersucht. Mit STATA haben sich dabei folgende OLS-Schätzergebnisse gezeigt: reg bwght cigs parity faminc Source | SS df MS -------------+-----------------------------Model | 17579.8997 3 5859.96658 Residual | 465166.792 1187 391.884408 -------------+-----------------------------Total | 482746.692 1190 405.669489 Number of obs F( 3, 1187) Prob > F R-squared Adj R-squared Root MSE = = = = = = 1191 14.95 0.0000 0.0364 0.0340 19.796 -----------------------------------------------------------------------------bwght | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------cigs | -.5978519 .1087701 -5.50 0.000 -.8112549 -.3844489 parity | 1.832274 .6575402 2.79 0.005 .5422035 3.122345 faminc | .0670618 .0323938 2.07 0.039 .0035063 .1306173 _cons | 115.4699 1.655898 69.73 0.000 112.2211 118.7187 ------------------------------------------------------------------------------ --------------------------------------------------------------------------------------------------------10 --------------------------------------------------------------------------------------------------------Beispiel 1: Erklärung von Geburtsgewichten (II) In einem nächsten Schritt soll die als endogen betrachtete erklärende Variable cigs durch den durchschnittlichen Preis von Zigaretten im jeweiligen Staat des Wohnsitzes (cigprice) instrumentiert werden. Mit STATA haben sich dabei zur Untersuchung der Instrument-Relevanz folgende OLS-Schätzergebnisse bei der Regression von cigs auf parity, faminc sowie cigprice gezeigt: reg cigs cigprice parity faminc Source | SS df MS -------------+-----------------------------Model | 873.397051 3 291.13235 Residual | 33108.1059 1187 27.8922543 -------------+-----------------------------Total | 33981.5029 1190 28.5558848 Number of obs F( 3, 1187) Prob > F R-squared Adj R-squared Root MSE = = = = = = 1191 10.44 0.0000 0.0257 0.0232 5.2813 -----------------------------------------------------------------------------cigs | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------cigprice | .0111199 .0148609 0.75 0.454 -.0180367 .0402765 parity | .2031177 .1753259 1.16 0.247 -.1408654 .5471008 faminc | -.0463081 .0085803 -5.40 0.000 -.0631424 -.0294738 _cons | 1.479846 1.965413 0.75 0.452 -2.376224 5.335917 ------------------------------------------------------------------------------ Damit kann die Instrument-Relevanz bei üblichen Signifikanzniveaus nicht nachgewiesen werden. Dies kann zu stark verzerrten IV-Schätzern führen. Deshalb sollte cigprice keinesfalls als Instrumentalvariable verwendet werden.11 --------------------------------------------------------------------------------------------------------- --------------------------------------------------------------------------------------------------------Beispiel 1: Erklärung von Geburtsgewichten (III) Falls cigprice aber dennoch eingesetzt wird, zeigen sich mit STATA folgende IV-Schätzergebnisse: ivreg bwght (cigs=cigprice) parity faminc Instrumental variables (2SLS) regression Source | SS df MS -------------+-----------------------------Model | -1399683.81 3 -466561.269 Residual | 1882430.5 1187 1585.87237 -------------+-----------------------------Total | 482746.692 1190 405.669489 Number of obs F( 3, 1187) Prob > F R-squared Adj R-squared Root MSE = = = = = = 1191 1.32 0.2655 . . 39.823 -----------------------------------------------------------------------------bwght | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------cigs | 5.943323 10.07713 0.59 0.555 -13.82766 25.7143 parity | .5076277 2.431501 0.21 0.835 -4.262891 5.278147 faminc | .3659014 .4648647 0.79 0.431 -.5461467 1.277949 _cons | 96.40724 29.54883 3.26 0.001 38.43349 154.381 -----------------------------------------------------------------------------Instrumented: cigs Instruments: parity faminc cigprice ------------------------------------------------------------------------------ Der geschätzte Parameter von cigs ist extrem hoch, aber unplausibel positiv. Die geschätzte Standardabweichung ist ebenfalls sehr groß, so dass kein signifikanter Effekt von cigs vorliegt. Allerdings sind die Schätzergebnisse bedeu12 tungslos, da die Instrument-Relevanz nicht nachgewiesen werden kann. --------------------------------------------------------------------------------------------------------Beispiel 1: Erklärung von Geburtsgewichten (IV) Nun soll cigs durch die Anzahl der Schuljahre der Mutter (motheduc), die keinen signifikanten Effekt auf bwght hat, instrumentiert werden. Mit STATA haben sich zur Untersuchung der Instrument-Relevanz folgende OLS-Schätzergebnisse gezeigt: reg cigs motheduc parity faminc Source | SS df MS -------------+-----------------------------Model | 1773.67058 3 591.223528 Residual | 32207.8324 1187 27.1338099 -------------+-----------------------------Total | 33981.5029 1190 28.5558848 Number of obs F( 3, 1187) Prob > F R-squared Adj R-squared Root MSE = = = = = = 1191 21.79 0.0000 0.0522 0.0498 5.209 -----------------------------------------------------------------------------cigs | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------motheduc | -.4026233 .0692999 -5.81 0.000 -.5385872 -.2666594 parity | .122423 .1734724 0.71 0.481 -.2179237 .4627697 faminc | -.022757 .0093017 -2.45 0.015 -.0410067 -.0045073 _cons | 7.589223 .911248 8.33 0.000 5.801387 9.377059 ------------------------------------------------------------------------------ Da der Parameter von motheduc hochsignifikant von null verschieden ist, kann die Instrument-Relevanz bei sehr kleinen Signifikanzniveaus nachgewiesen werden. Mit STATA haben sich dann folgende IV-Schätzergebnisse gezeigt: 13 --------------------------------------------------------------------------------------------------------- --------------------------------------------------------------------------------------------------------Beispiel 1: Erklärung von Geburtsgewichten (V) ivreg bwght (cigs=motheduc) parity faminc Instrumental variables (2SLS) regression Source | SS df MS -------------+-----------------------------Model | 16462.5014 3 5487.50045 Residual | 466284.191 1187 392.825771 -------------+-----------------------------Total | 482746.692 1190 405.669489 Number of obs F( 3, 1187) Prob > F R-squared Adj R-squared Root MSE = = = = = = 1191 5.00 0.0019 0.0341 0.0317 19.82 -----------------------------------------------------------------------------bwght | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------cigs | -.4141835 .6549049 -0.63 0.527 -1.699084 .8707167 parity | 1.79508 .6711933 2.67 0.008 .478222 3.111937 faminc | .0754529 .0438444 1.72 0.086 -.0105682 .161474 _cons | 114.9347 2.508082 45.83 0.000 110.0139 119.8554 -----------------------------------------------------------------------------Instrumented: cigs Instruments: parity faminc motheduc ------------------------------------------------------------------------------ Damit ist der geschätzte Parameter von cigs wieder negativ. Allerdings ist die geschätzte Standardabweichung jetzt sehr hoch (und zwingend höher als bei der OLS-Methode), so dass der Parameter bei üblichen Signifikanzniveaus nicht mehr von null verschieden ist. Für den Fall, dass cigs nicht endogen ist, wäre die Anwendung der OLS-Methode also eindeutig vorteilhaft. Zu beachten ist aber, dass „ivreg …“ kein aktueller STATA-Befehl (seit STATA 10) mehr ist. 14 --------------------------------------------------------------------------------------------------------Beispiel 1: Erklärung von Geburtsgewichten (VI) Die aktuellere Möglichkeit von IV-Schätzungen mit STATA ergibt sich durch „ivregress 2sls …“ (siehe später). Für die Gleichheit der Ergebnisse (für die geschätzten Standardabweichungen) muss allerdings eine Korrektur für kleine Stichprobenumfänge „…, small“ einbezogen werden. Falls nun cigs durch sich selbst instrumentiert wird, sind die IV-Schätzergebnisse identisch mit den OLSSchätzergebnissen (hier kann „ivregress 2sls …“ nicht angewendet werden): ivreg bwght (cigs=cigs) parity faminc Instrumental variables (2SLS) regression Source | SS df MS Number of obs = 1191 -------------+-----------------------------F( 3, 1187) = 14.95 Model | 17579.8997 3 5859.96658 Prob > F = 0.0000 Residual | 465166.792 1187 391.884408 R-squared = 0.0364 -------------+-----------------------------Adj R-squared = 0.0340 Total | 482746.692 1190 405.669489 Root MSE = 19.796 -----------------------------------------------------------------------------bwght | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------cigs | -.5978519 .1087701 -5.50 0.000 -.8112549 -.3844489 parity | 1.832274 .6575402 2.79 0.005 .5422035 3.122345 faminc | .0670618 .0323938 2.07 0.039 .0035063 .1306173 _cons | 115.4699 1.655898 69.73 0.000 112.2211 118.7187 -----------------------------------------------------------------------------Instrumented: cigs Instruments: parity faminc cigs ------------------------------------------------------------------------------ 15 --------------------------------------------------------------------------------------------------------- --------------------------------------------------------------------------------------------------------Beispiel 2: Erklärung von Löhnen (I) Mit Paneldaten für 545 dauerhaft berufstätige Männer von 1980 bis 1987 wird der Effekt des Familienstandes (married), der Anzahl der Arbeitsstunden im Jahr (hours) und der Gewerkschaftszugehörigkeit (union) unter Einbeziehung von Dummy-Variablen für die Jahre 1981 bis 1987 (d81,…, d87) auf den Logarithmus von Löhnen (logwage) untersucht. Im linearen gepoolten Regressionsmodell zeigen sich mit STATA folgende cluster-robuste OLS-Schätzergebnisse: reg logwage married hours union d81 d82 d83 d84 d85 d86 d87, cluster(nr) Linear regression Number of obs F( 10, 544) Prob > F R-squared Root MSE = = = = = 4360 53.77 0.0000 0.1177 .50087 (Std. Err. adjusted for 545 clusters in nr) -----------------------------------------------------------------------------| Robust logwage | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------married | .1535825 .0273828 5.61 0.000 .0997936 .2073714 hours | -.0000647 .0000257 -2.51 0.012 -.0001152 -.0000142 union | .171543 .0292259 5.87 0.000 .1141335 .2289525 d81 | .1110592 .0249218 4.46 0.000 .0621045 .1600139 ⋮ | ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ d87 | .4313674 .0299395 14.41 0.000 .3725563 .4901785 _cons | 1.448043 .0586549 24.69 0.000 1.332825 1.563261 ------------------------------------------------------------------------------ 16 --------------------------------------------------------------------------------------------------------- --------------------------------------------------------------------------------------------------------Beispiel 2: Erklärung von Löhnen (II) Trotz des signifikant positiven Effektes wird nun (unvernüntigerweise) married als Instrument für hours neben der weiterhin als exogen betrachteten Variablen union einbezogen. Mit STATA haben sich zur Untersuchung der Instrument-Relevanz von married folgende OLS-Schätzergebnisse gezeigt: reg hours married union d81 d82 d83 d84 d85 d86 d87 Source | SS df MS -------------+-----------------------------Model | 106628086 9 11847565.1 Residual | 1.2915e+09 4350 296906.356 -------------+-----------------------------Total | 1.3982e+09 4359 320754.929 Number of obs F( 9, 4350) Prob > F R-squared Adj R-squared Root MSE = = = = = = 4360 39.90 0.0000 0.0763 0.0744 544.89 -----------------------------------------------------------------------------hours | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------married | 171.6739 17.35696 9.89 0.000 137.6454 205.7023 union | -71.59145 19.24862 -3.72 0.000 -109.3285 -33.85436 d81 | 92.51316 33.05681 2.80 0.005 27.70497 157.3213 d82 | 127.2632 33.14374 3.84 0.000 62.28456 192.2418 d83 | 212.6108 33.32211 6.38 0.000 147.2825 277.9391 d84 | 256.6938 33.45999 7.67 0.000 191.0951 322.2924 d85 | 267.2558 33.59064 7.96 0.000 201.401 333.1105 d86 | 290.4834 33.71481 8.62 0.000 224.3852 356.5816 d87 | 331.9686 33.83779 9.81 0.000 265.6293 398.3079 _cons | 1936.016 24.02197 80.59 0.000 1888.921 1983.112 ------------------------------------------------------------------------------ 17 --------------------------------------------------------------------------------------------------------- --------------------------------------------------------------------------------------------------------Beispiel 2: Erklärung von Löhnen (III) Im linearen gepoolten Regressionsmodell zeigen sich mit STATA folgende cluster-robuste IV-Schätzergebnisse (ohne Vorliegen von Instrument-Exogenität): ivreg logwage (hours=married)union d81 d82 d83 d84 d85 d86 d87, cluster(nr) Instrumental variables (2SLS) regression Number of obs F( 9, 544) Prob > F R-squared Root MSE = = = = = 4360 29.45 0.0000 . .69889 (Std. Err. adjusted for 545 clusters in nr) -----------------------------------------------------------------------------| Robust logwage | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------hours | .0008299 .0002097 3.96 0.000 .0004179 .0012419 union | .23559 .0394924 5.97 0.000 .1580138 .3131662 d81 | .0282952 .041873 0.68 0.499 -.0539573 .1105478 d82 | .0470283 .0509571 0.92 0.356 -.0530685 .1471251 d83 | .0129228 .0667894 0.19 0.847 -.118274 .1441196 d84 | .038818 .078931 0.49 0.623 -.1162289 .193865 d85 | .0782651 .0810056 0.97 0.334 -.080857 .2373872 d86 | .1165923 .0865149 1.35 0.178 -.053352 .2865365 d87 | .1343824 .0950868 1.41 0.158 -.0523999 .3211647 _cons | -.2839519 .4114966 -0.69 0.490 -1.092269 .5243649 -----------------------------------------------------------------------------Instrumented: hours Instruments: union d81 d82 d83 d84 d85 d86 d87 married ------------------------------------------------------------------------------ 18 --------------------------------------------------------------------------------------------------------- --------------------------------------------------------------------------------------------------------Beispiel 2: Erklärung von Löhnen (IV) Nun wird die IV-Methode für den Fall von endogen betrachteten erklärenden Variablen auf lineare Panelmodelle mit unbeobachteter Heterogenität angewendet. Dabei können im Rahmen der IV-Methode z.B. first-differenced, fixed effects und random effects Schätzungen durchgeführt werden. Die entsprechenden Instrumentalvariablen beziehen sich nun aber nicht mehr auf die ursprünglichen (idiosynkratischen) Störterme, sondern auf die jeweils transformierten Störterme. Im Rahmen einer fixed effects IV-Schätzung zur Erklärung von logwage wird erneut married (bzw. die within Transformation von married) als Instrument für die als endogen betrachtete Variable hours (bzw. die within Transformation von hours) neben der weiterhin als exogen betrachteten Variablen union (bzw. die within Transformation von union) und den Dummy-Variablen für die Jahre 1981 bis 1987 einbezogen. Mit STATA haben sich folgende fixed effects IV-Schätzergebnisse der Strukturgleichung sowie konventionellen fixed effects Schätzergebnisse zur Untersuchung der Instrument-Relevanz der within Transformation von married gezeigt: --------------------------------------------------------------------------------------------------------19 --------------------------------------------------------------------------------------------------------Beispiel 2: Erklärung von Löhnen (V) xtivreg logwage (hours=married) union d81 d82 d83 d84 d85 d86 d87, fe Fixed-effects (within) IV regression Group variable: nr Number of obs Number of groups = = 4360 545 R-sq: Obs per group: min = avg = max = 8 8.0 8 within = . between = 0.0013 overall = 0.0002 corr(u_i, Xb) = -0.6302 Wald chi2(9) Prob > chi2 = = 9490.25 0.0000 -----------------------------------------------------------------------------logwage | Coef. Std. Err. z P>|z| [95% Conf. Interval] -------------+---------------------------------------------------------------hours | .0023894 .0023891 1.00 0.317 -.0022932 .0070719 union | .2003905 .1307263 1.53 0.125 -.0558283 .4566093 d81 | -.1437506 .2719068 -0.53 0.597 -.6766781 .3891768 ⋮ | ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ d87 | -.4966293 .9709756 -0.51 0.609 -2.399707 1.406448 _cons | -3.315743 4.687597 -0.71 0.479 -12.50326 5.871778 -------------+---------------------------------------------------------------sigma_u | .97765837 sigma_e | 1.1223442 rho | .43142759 (fraction of variance due to u_i) -----------------------------------------------------------------------------F test that all u_i=0: F(544,3806) = 0.93 Prob > F = 0.8467 -----------------------------------------------------------------------------Instrumented: hours Instruments: union d81 d82 d83 d84 d85 d86 d87 married ------------------------------------------------------------------------------ 20 --------------------------------------------------------------------------------------------------------- --------------------------------------------------------------------------------------------------------Beispiel 2: Erklärung von Löhnen (VI) xtreg hours married union d81 d82 d83 d84 d85 d86 d87, fe Fixed-effects (within) regression Group variable: nr Number of obs Number of groups = = 4360 545 R-sq: Obs per group: min = avg = max = 8 8.0 8 within = 0.0988 between = 0.0339 overall = 0.0610 corr(u_i, Xb) = 0.0188 F(9,3806) Prob > F = = 46.34 0.0000 -----------------------------------------------------------------------------hours | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------married | 24.41547 22.10335 1.10 0.269 -18.92009 67.75102 union | -48.97593 23.39144 -2.09 0.036 -94.83689 -3.114962 d81 | 107.6858 25.86334 4.16 0.000 56.97845 158.3931 d82 | 152.5374 26.0436 5.86 0.000 101.4766 203.5981 d83 | 251.3737 26.40911 9.52 0.000 199.5963 303.1511 d84 | 303.168 26.69097 11.36 0.000 250.838 355.4979 d85 | 320.2968 26.95098 11.88 0.000 267.457 373.1366 d86 | 348.9487 27.19795 12.83 0.000 295.6247 402.2727 d87 | 394.9461 27.4543 14.39 0.000 341.1196 448.7727 _cons | 1957.622 19.54105 100.18 0.000 1919.31 1995.933 -------------+---------------------------------------------------------------sigma_u | 378.86952 sigma_e | 425.28933 rho | .44246703 (fraction of variance due to u_i) -----------------------------------------------------------------------------F test that all u_i=0: F(544, 3806) = 6.13 Prob > F = 0.0000 21 --------------------------------------------------------------------------------------------------------- --------------------------------------------------------------------------------------------------------Beispiel 2: Erklärung von Löhnen (VII) Die Instrument-Relevanz kann also bei üblichen Signifikanzniveaus nicht nachgewiesen werden. Die konventionellen fixed effects Schätzergebnisse lauten: xtreg logwage married hours union d81 d82 d83 d84 d85 d86 d87, fe Fixed-effects (within) regression Group variable: nr Number of obs Number of groups = = 4360 545 R-sq: Obs per group: min = avg = max = 8 8.0 8 within = 0.1857 between = 0.0281 overall = 0.1006 corr(u_i, Xb) = 0.0097 F(10,3805) Prob > F = = 86.78 0.0000 -----------------------------------------------------------------------------logwage | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------married | .0612226 .0181875 3.37 0.001 .0255645 .0968807 hours | -.0001182 .0000133 -8.86 0.000 -.0001443 -.000092 union | .0775818 .0192554 4.03 0.000 .0398299 .1153336 d81 | .1262751 .0213263 5.92 0.000 .0844629 .1680872 ⋮ | ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ d87 | .4937113 .0231927 21.29 0.000 .4482398 .5391827 _cons | 1.593058 .030659 51.96 0.000 1.532949 1.653168 -------------+---------------------------------------------------------------sigma_u | .38539792 sigma_e | .34988805 rho | .54818158 (fraction of variance due to u_i) -----------------------------------------------------------------------------F test that all u_i=0: F(544, 3805) = 9.39 Prob > F = 0.0000 22 --------------------------------------------------------------------------------------------------------- --------------------------------------------------------------------------------------------------------Beispiel 3: Erklärung der Nachfrage nach Flugreisen (I) Für die Analyse der Determinanten des Logarithmus der durchschnittlichen Passagierzahlen (logpassenger) werden Paneldaten für 1149 Flugstrecken für die Jahre von 1997 bis 2000 betrachtet. Im Hinblick auf fixed effects Schätzungen wird der Logarithmus des durchschnittlichen Flugpreises für eine einfache Strecke in US-Dollar (logfare) als zeitvariante erklärende Variable betrachtet. Darüber hinaus werden drei Dummy-Variablen y98, y99 und y00 für die drei Jahre 1998, 1999 und 2000 einbezogen. Der Flugpreis kann dabei einerseits von weiteren Faktoren beeinflusst werden (z.B. exogene Ereignisse im Zielgebiet), die nicht ins Strukturmodell einbezogen werden (können), aber ebenfalls einen Einfluss auf die Nachfrage nach Flugreisen haben (und deshalb im Störterm vorliegen). Andererseits beeinflussen sich Flugpreis und Flugnachfrage gegenseitig, so dass die Vermutung nahe liegt, dass logfare endogen ist. Deshalb soll logfare durch eine Kennzahl für die Streckenkonzentration, d.h. durch den Marktanteil der größten Fluggesellschaft (concen) instrumentiert werden. Bei der konventionellen cluster-robusten fixed effects Schätzung, der konventionellen fixed effects Schätzung zur Untersuchung der Instrument-Relevanz sowie der fixed effects IV-Schätzung (eine cluster-robuste Schätzung ist hier 23 nicht möglich) haben sich mit STATA folgende Ergebnisse gezeigt: --------------------------------------------------------------------------------------------------------- --------------------------------------------------------------------------------------------------------Beispiel 3: Erklärung der Nachfrage nach Flugreisen (II) xtreg logpassenger logfare y98 y99 y00, fe cluster(id) Fixed-effects (within) regression Group variable: id Number of obs Number of groups = = 4596 1149 R-sq: Obs per group: min = avg = max = 4 4.0 4 within = 0.4507 between = 0.0487 overall = 0.0574 corr(u_i, Xb) = -0.3249 F(4,1148) Prob > F = = 121.85 0.0000 (Std. Err. adjusted for 1149 clusters in id) -----------------------------------------------------------------------------| Robust logpassenger | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------logfare | -1.155039 .1086574 -10.63 0.000 -1.368228 -.9418496 y98 | .0464889 .0049119 9.46 0.000 .0368516 .0561262 y99 | .1023612 .0063141 16.21 0.000 .0899727 .1147497 y00 | .1946548 .0097099 20.05 0.000 .1756036 .213706 _cons | 11.81677 .55126 21.44 0.000 10.73518 12.89836 -------------+---------------------------------------------------------------sigma_u | .89829067 sigma_e | .14295339 rho | .9753002 (fraction of variance due to u_i) ------------------------------------------------------------------------------ --------------------------------------------------------------------------------------------------------24 --------------------------------------------------------------------------------------------------------Beispiel 3: Erklärung der Nachfrage nach Flugreisen (III) xtreg logfare concen y98 y99 y00, fe cluster(id) Fixed-effects (within) regression Group variable: id Number of obs Number of groups = = 4596 1149 R-sq: Obs per group: min = avg = max = 4 4.0 4 within = 0.1352 between = 0.0576 overall = 0.0083 corr(u_i, Xb) = -0.2033 F(4,1148) Prob > F = = 120.06 0.0000 (Std. Err. adjusted for 1149 clusters in id) -----------------------------------------------------------------------------| Robust logfare | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------concen | .168859 .0494587 3.41 0.001 .0718194 .2658985 y98 | .0228328 .004163 5.48 0.000 .0146649 .0310007 y99 | .0363819 .0051275 7.10 0.000 .0263215 .0464422 y00 | .0977717 .0055054 17.76 0.000 .0869698 .1085735 _cons | 4.953331 .0296765 166.91 0.000 4.895104 5.011557 -------------+---------------------------------------------------------------sigma_u | .43389176 sigma_e | .10651186 rho | .94316439 (fraction of variance due to u_i) ------------------------------------------------------------------------------ --------------------------------------------------------------------------------------------------------25 --------------------------------------------------------------------------------------------------------Beispiel 3: Erklärung der Nachfrage nach Flugreisen (IV) xtivreg logpassenger (logfare=concen) y98 y99 y00, fe Fixed-effects (within) IV regression Group variable: id Number of obs Number of groups = = 4596 1149 R-sq: Obs per group: min = avg = max = 4 4.0 4 within = 0.2265 between = 0.0487 overall = 0.0574 corr(u_i, Xb) = 0.0708 Wald chi2(4) Prob > chi2 = = 5.78e+06 0.0000 -----------------------------------------------------------------------------logpassenger | Coef. Std. Err. z P>|z| [95% Conf. Interval] -------------+---------------------------------------------------------------logfare | -.3015761 .2774005 -1.09 0.277 -.8452711 .242119 y98 | .0257147 .0097819 2.63 0.009 .0065426 .0448869 y99 | .0724166 .0120342 6.02 0.000 .04883 .0960031 y00 | .1127914 .0275332 4.10 0.000 .0588273 .1667556 _cons | 7.501008 1.402758 5.35 0.000 4.751653 10.25036 -------------+---------------------------------------------------------------sigma_u | .8493153 sigma_e | .16964171 rho | .96163479 (fraction of variance due to u_i) -----------------------------------------------------------------------------F test that all u_i=0: F(1148,3443) = 99.70 Prob > F = 0.0000 -----------------------------------------------------------------------------Instrumented: logfare Instruments: y98 y99 y00 concen ------------------------------------------------------------------------------ --------------------------------------------------------------------------------------------------------26 3.3 Zweistufige Methode der kleinsten Quadrate Bisher wurde jeweils eine einzige endogene erklärende Variable xik und eine einzige Instrumentalvariable zi1 betrachtet. Allerdings liegen manchmal mehrere (valide) Instrumentalvariablen zi1,…, zir vor: • Wenn alle diese r Instrumente (bei einem linearen Regressionsmodell mit Querschnittsdaten) keinen Erklärungsgehalt für die abhängige Variable yi haben sowie zusätzlich exogen sind, also unkorreliert mit dem Fehlerterm εi, können prinzipiell r verschiedene IV-Schätzungen durchgeführt werden • Allerdings ist keiner dieser IV-Schätzer effizient • Die beste IV-Schätzung kann durch die Betrachtung einer Linearkombination der k-1 exogenen erklärenden Variablen und der r Instrumente, die selbst ein valides Instrument darstellt, abgeleitet werden Hierzu wird folgende reduzierte Form für xik betrachtet: x ik = δ0 + δ1x i1 + + δ k-1x ik-1 + γ1z i1 + + γ r z ir + ν i Die beste Instrumentalvariable ist nun genau folgende Linearkombination: x *ik = δ0 + δ1x i1 + + δ k-1x ik-1 + γ1z i1 + + γ r z ir Allerdings ist xik* nicht bekannt und kann deshalb nicht als Instrument verwendet werden. Durch eine OLS-Schätzung der Parameter in der obigen reduzierten Form kann aber xik geschätzt und als Instrument für xik verwendet werden. 27 Damit ergeben sich folgende k+1 Momentengleichungen für den IV-Schätzer: 1 n (y i - βˆ 0 - βˆ 1x i1 n i=1 - βˆ k x ik ) = 0 1 n x i1 (y i - βˆ 0 - βˆ 1x i1 n i=1 1 n x i,k-1 (y i - βˆ 0 - βˆ 1x i1 n i=1 1 n x̂ ik (y i - βˆ 0 - βˆ 1x i1 n i=1 - βˆ k x ik ) = 0 - βˆ k x ik ) = 0 - βˆ k x ik ) = 0 Die IV-Methode mit der Verwendung von xik als Instrument wird als zweistufige Methode der kleinsten Quadrate (2SLS) bezeichnet, da die geschätzten Parameter alternativ durch ein zweistufiges Verfahren ermittelt werden können: • Erste Stufe: OLS-Schätzung in der reduzierten Form, also bei der Regression von xik auf alle k-1 exogenen erklärenden Variablen und r Instrumente • Zweite Stufe: OLS-Schätzung bei der Regression von yi auf xik und alle exogenen erklärenden Variablen In der Praxis sollten aber diese zwei Stufen nicht durchgeführt werden, da die in der zweiten Stufe geschätzten Standardabweichungen nicht korrekt sind. 28 Programmpakete wie z.B. STATA ermöglichen korrekte 2SLS-Schätzungen. Eigenschaften der 2SLS-Schätzung: • Da bei der 2SLS-Methode xik anstatt xik einbezogen wird, kann der 2SLSSchätzer durchaus stark vom OLS-Schätzer abweichen • Falls nur eine Instrumentalvariable zi1 vorliegt, ist der 2SLS-Schätzer identisch mit dem zuvor betrachteten einfachen IV-Schätzer • Voraussetzung für die Durchführung der 2SLS-Schätzung ist, dass mindestens einer der Parameter γ1,…, γr ungleich null ist, d.h. dass mindestens eine exogene Variable (also ein Instrument) einbezogen wird, die keinen Erklärungsgehalt für yi hat • Diese Rangbedingung (siehe später) kann auf Basis der OLS-Schätzung in der reduzierten Form mit einem F-Test zur Überprüfung der Nullhypothese H0: γ1 =…= γr = 0 gegen die Alternativhypothese, dass mindestens einer der Parameter γ1,…, γr ungleich null ist, getestet werden • Falls diese Nullhypothese nicht bei sehr kleinen Signifikanzniveaus verworfen werden kann, sollte keine 2SLS-Schätzung durchgeführt werden, da die betrachteten Instrumente nicht die Minimalanforderung erfüllen • Wenn r > 1, ist das zugrundeliegende Strukturmodell überidentifiziert mit r-1 überidentifizierenden Restriktionen (somit ist das Strukturmodell beim zuvor betrachteten einfachen IV-Schätzer mit r = 1 genau identifiziert) • Bei der Betrachtung von mehr als einer endogenen erklärenden Variablen, muss die Anzahl der einbezogenen Instrumente mindestens so groß sein 29 Annahmen für die Betrachtung von asymptotischen Eigenschaften bei 2SLSSchätzern in linearen ökonometrischen Modellen mit einer oder mehreren endogenen erklärenden Variablen: • Annahme F1: Linearität in den Parametern (hier bei Querschnittsdaten) yi = β0 + β1xi1 +…+ βkxik + εi • Annahme F2: Zufallsstichprobe (bei Querschnitts- und Paneldaten) Es liegt eine Stichprobe vom Umfang n aus der Grundgesamtheit für die abhängige Variable, für die (exogenen und endogenen) erklärenden Variablen sowie für die Instrumentalvariablen vor • Annahme F3: Rangbedingung Es besteht keine exakte lineare Beziehung zwischen den Instrumenten und die Rangbedingung wird eingehalten, d.h. der Vektor der r Instrumente ist hinreichend linear verknüpft mit dem Vektor der k erklärenden Variablen, so dass die Erwartungsmatrix des Produktes der beiden Vektoren den vollen Spaltenrang besitzt. Eine notwendige Bedingung hierfür ist r ≥ k. • Annahme F4: Exogene Instrumentalvariablen Der Fehlerterm εi hat einen Erwartungswert von null und alle Instrumentalvariablen sind mit εi unkorreliert Unter diesen Annahmen F1 bis F4 sind die 2SLS-Schätzer der Regressionsparameter für n → ∞ konsistent. 30 Weitere Annahmen: • Annahme F5: Homoskedastizität Die bedingte Varianz des Fehlerterms unter der Bedingung der Instrumentalvariablen ist konstant • Annahme F6: Keine Autokorrelation (bei linearen Regressionsmodellen mit Zeitreihendaten sowie linearen Panelmodellen) Unter der Bedingung der Instrumentalvariablen sind die Störterme für beliebige Zeitperioden unkorreliert Unter den sechs Annahmen F1 bis F6 (bei Zeitreihenanalysen muss zusätzlich für alle Zeitreihen angenommen werden, dass sie schwach abhängig sind) sind Funktionen des 2SLS-Schätzers asymptotisch normalverteilt. Zudem ist der 2SLS-Schätzer asymptotisch effizient in der Klasse aller IV-Schätzer, die Linearkombinationen der exogenen Variablen als Instrumente verwendet. Tests auf Endogenität: • Der 2SLS-Schätzer kann wie jeder IV-Schätzer sehr große geschätzte Varianzen der geschätzten Parameter aufweisen und ist insbesondere weniger effizient als OLS-Schätzer, wenn die erklärenden Variablen exogen sind • Aus diesem Grund sind Tests auf Endogenität zur Überprüfung, ob die Anwendung der 2SLS-Methode überhaupt notwendig ist, sicherlich nützlich 31 • Die Nullhypothese dabei ist, dass eine erklärende Variable exogen sind In STATA sind (mit der Anweisung „estat endogenous“) mehrere Tests auf Basis von 2SLS-Schätzungen implementiert: • Nach einer 2SLS-Schätzung ohne robuste Schätzung von Standardabweichungen werden ein Durbin Test sowie der Wu-Hausman Test ausgewiesen • Die Idee beim (Wu-)Hausman Test ist wieder der Vergleich der geschätzten Parameter bei einem Schätzer (hier der OLS-Schätzer), der unter der Nullhypothese effizient und unter der Alternativhypothese inkonsistent ist, sowie einem Schätzer (hier der 2SLS-Schätzer), der unter der Null- und Alternativhypothese konsistent, aber unter der Nullhypothese ineffizient ist. Falls sich die OLS- und 2SLS-Schätzer signifikant unterscheiden, deutet dies auf die Endogenität der getesteten erklärenden Variablen hin. • Nach einer 2SLS-Schätzung mit robuster Schätzung von Standardabweichungen werden der robuste Score Test nach Wooldridge sowie ein robuster Regressionstest ausgewiesen, die im Gegensatz zu den obigen Tests nicht annehmen müssen, dass der Störterm unabhängig identisch verteilt ist • Bei Regressionstests werden die verdächtigen endogenen erklärenden Variablen auf alle exogenen erklärenden Variablen und die Instrumente regressiert. Auf Basis der OLS-Schätzung werden die Residuen abgeleitet, die dann als erklärende Variablen neben den anderen erklärenden Variablen in die Strukturgleichung einbezogen werden. Falls auf Basis dieser OLSSchätzung der Parameter der Residuen signifikant von null verschieden ist, 32 deutet dies auf Endogenität der getesteten erklärenden Variablen hin. Tests auf überidentifizierende Restriktionen: • Für die Validität der Instrumentalvariablen in 2SLS-Schätzungen müssen die Instrumente mit den endogenen erklärenden Variablen korreliert und mit dem Störterm im Strukturmodell unkorreliert sein • Falls das Strukturmodell überidentifiziert ist, kann getestet werden, ob die Instrumente unkorreliert mit dem Störterm sind • Wenn das Strukturmodell genau identifiziert ist, kann kein entsprechender Test durchgeführt werden (wenngleich selbst im überidentifizierenden Fall die Validität von Instrumenten eher auf theoretischen Argumenten sowie Kenntnissen aus früheren empirischen Untersuchungen beruhen sollte) • Tests auf überidentifizierende Restriktionen überprüfen letztlich, dass die Instrumente unkorreliert mit dem Störterm im Strukturmodell sind sowie simultan dass das Strukturmodell fehlspezifiziert ist. Falls die Nullhypothese (der Gültigkeit der einbezogenen Momentenbedingungen) verworfen wird, deutet dies somit auf invalide Instrumente oder Modellfehlspezifikationen hin. In STATA sind (mit der Anweisung „estat overid“) mehrere Tests auf Basis von 2SLS-Schätzungen implementiert: • Nach einer 2SLS-Schätzung ohne robuste Schätzung von Standardabweichungen werden die χ2-Tests nach Sargan sowie Basmann ausgewiesen • Nach einer 2SLS-Schätzung mit robuster Schätzung von Standardabwei33 chungen wird der robuste Score Test nach Wooldridge ausgewiesen --------------------------------------------------------------------------------------------------------Beispiel: Erklärung von Löhnen (I) Wie zuvor werden mit Paneldaten für 545 dauerhaft berufstätige Männer von 1980 bis 1987 die Determinanten des Logarithmus von Löhnen (logwage) untersucht. Dabei werden jetzt folgende erklärende Variablen betrachtet: • Hispanische Herkunft (hispan) • Beschäftigungsstatus „operative“ (Arbeiter, Facharbeiter) (occ6) • Ausbildungszeit in Jahren (educ) • Familienstand (married) • Anzahl der Arbeitsstunden im Jahr (hours) • Gewerkschaftszugehörigkeit (union) • Dummy-Variablen für die Jahre 1981 bis 1987 Dabei soll educ als verdächtige endogene erklärende Variable durch hispan und occ6 instrumentiert werden. Zunächst wird eine (cluster-robuste) OLSSchätzung im linearen gepoolten Regressionsmodell durchgeführt. Danach wird die Instrument-Relevanz von hispan und occ6 als Grundlage für die darauf folgenden 2SLS-Schätzungen (ohne robuste Schätzungen von Standardabweichungen) überprüft (dabei wird jeweils eine Korrektur der Schätzung der Standardabweichungen für kleine Stichprobenumfänge betrachtet). Schließlich werden Tests auf Endogenität und überidentifizierende Restriktionen durchgeführt.34 --------------------------------------------------------------------------------------------------------- --------------------------------------------------------------------------------------------------------Beispiel: Erklärung von Löhnen (II) reg logwage hispan occ6 educ married hours union d81 d82 d83 d84 d85 d86 d87, cluster(nr) Linear regression Number of obs F( 13, 544) Prob > F R-squared Root MSE = = = = = 4360 48.16 0.0000 0.1816 .48254 (Std. Err. adjusted for 545 clusters in nr) -----------------------------------------------------------------------------| Robust logwage | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------hispan | .0382675 .0382403 1.00 0.317 -.0368494 .1133843 occ6 | .0125775 .0271893 0.46 0.644 -.0408314 .0659864 educ | .0787436 .0090722 8.68 0.000 .0609229 .0965644 married | .1484002 .0255352 5.81 0.000 .0982406 .1985598 hours | -.0000696 .000025 -2.78 0.006 -.0001186 -.0000205 union | .1711894 .0276634 6.19 0.000 .1168492 .2255296 d81 | .1124035 .0248105 4.53 0.000 .0636673 .1611397 d82 | .1628128 .0246559 6.60 0.000 .1143803 .2112453 d83 | .2062007 .0258632 7.97 0.000 .1553968 .2570046 d84 | .2728061 .0296468 9.20 0.000 .2145697 .3310424 d85 | .321373 .0284351 11.30 0.000 .265517 .377229 d86 | .3808025 .0302742 12.58 0.000 .3213337 .4402712 d87 | .4367857 .0293247 14.89 0.000 .3791822 .4943892 _cons | .5229031 .1259353 4.15 0.000 .275524 .7702821 ------------------------------------------------------------------------------ 35 --------------------------------------------------------------------------------------------------------- --------------------------------------------------------------------------------------------------------Beispiel: Erklärung von Löhnen (III) reg educ hispan occ6 married hours union d81 d82 d83 d84 d85 d86 d87, cluster(nr) Linear regression Number of obs = 4360 F( 12, 544) = 3.38 Prob > F = 0.0001 R-squared = 0.0602 Root MSE = 1.6951 (Std. Err. adjusted for 545 clusters in nr) -----------------------------------------------------------------------------| Robust educ | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------hispan | -.9449266 .2165839 -4.36 0.000 -1.37037 -.5194835 occ6 | -.6093683 .1132788 -5.38 0.000 -.8318858 -.3868509 married | .0647464 .1239926 0.52 0.602 -.1788167 .3083094 hours | .0000923 .0000894 1.03 0.302 -.0000833 .0002678 union | .0656635 .104804 0.63 0.531 -.1402066 .2715337 d81 | -.0301252 .0189896 -1.59 0.113 -.0674271 .0071767 ⋮ | ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ d87 | -.1251397 .0631306 -1.98 0.048 -.2491493 -.0011301 _cons | 11.85688 .2049273 57.86 0.000 11.45434 12.25943 -----------------------------------------------------------------------------test hispan occ6 ( 1) ( 2) hispan = 0 occ6 = 0 F( 2, 544) = Prob > F = 19.23 0.0000 Damit ist die Minimalanforderung für eine 2SLS-Schätzung erfüllt. 36 --------------------------------------------------------------------------------------------------------Beispiel: Erklärung von Löhnen (IV) Zunächst wird educ lediglich durch occ6 instrumentiert, wodurch bei dieser 2SLS-Schätzung eine einfache IV-Schätzung vorliegt (und die Anweisung „ivreg …“ zu denselben Schätzergebnissen führt): ivregress 2sls logwage (educ=occ6) married hours union d81 d82 d83 d84 d85 d86 d87, small Instrumental variables (2SLS) regression Source | SS df MS -------------+-----------------------------Model | 218.602949 11 19.8729953 Residual | 1017.92667 4348 .23411377 -------------+-----------------------------Total | 1236.52962 4359 .283672774 Number of obs F( 11, 4348) Prob > F R-squared Adj R-squared Root MSE = = = = = = 4360 56.85 0.0000 0.1768 0.1747 .48385 -----------------------------------------------------------------------------logwage | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------educ | .0571581 .028858 1.98 0.048 .0005818 .1137345 married | .1498293 .0156998 9.54 0.000 .1190498 .1806089 hours | -.0000672 .0000135 -4.97 0.000 -.0000937 -.0000407 union | .1730137 .0171357 10.10 0.000 .1394191 .2066084 d81 | .1117219 .0293821 3.80 0.000 .0541179 .1693259 ⋮ | ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ d87 | .43397 .0304063 14.27 0.000 .3743581 .4935818 _cons | .7806417 .3386367 2.31 0.021 .1167411 1.444542 -----------------------------------------------------------------------------Instrumented: educ Instruments: married hours union d81 d82 d83 d84 d85 d86 d87 occ6 37 --------------------------------------------------------------------------------------------------------- --------------------------------------------------------------------------------------------------------Beispiel: Erklärung von Löhnen (V) Nun wird educ durch occ6 und hispan instrumentiert: ivregress 2sls logwage (educ=occ6 hispan) married hours union d81 d82 d83 d84 d85 d86 d87, small Instrumental variables (2SLS) regression Source | SS df MS -------------+-----------------------------Model | 210.284019 11 19.116729 Residual | 1026.2456 4348 .236027048 -------------+-----------------------------Total | 1236.52962 4359 .283672774 Number of obs F( 11, 4348) Prob > F R-squared Adj R-squared Root MSE = = = = = = 4360 56.65 0.0000 0.1701 0.1680 .48583 -----------------------------------------------------------------------------logwage | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------educ | .0449597 .0172642 2.60 0.009 .011113 .0788064 married | .1506303 .0156896 9.60 0.000 .1198708 .1813899 hours | -.0000667 .0000135 -4.92 0.000 -.0000932 -.0000401 union | .1726999 .0171951 10.04 0.000 .1389887 .206411 d81 | .1115804 .0295007 3.78 0.000 .053744 .1694169 ⋮ | ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ d87 | .4334145 .0305119 14.20 0.000 .3735956 .4932335 _cons | .9230755 .2044014 4.52 0.000 .5223445 1.323807 -----------------------------------------------------------------------------Instrumented: educ Instruments: married hours union d81 d82 d83 d84 d85 d86 d87 occ6 hispan --------------------------------------------------------------------------------------------------------38 --------------------------------------------------------------------------------------------------------Beispiel: Erklärung von Löhnen (VI) estat endogenous Tests of endogeneity Ho: variables are exogenous Durbin (score) chi2(1) Wu-Hausman F(1,4347) = = 3.6588 3.65095 (p = 0.0558) (p = 0.0561) estat overid Tests of overidentifying restrictions: Sargan (score) chi2(1) = Basmann chi2(1) = .275536 .274732 (p = 0.5996) (p = 0.6002) Interpretation: • Die Nullhypothese der Exogenität von educ kann somit auf Basis beider Tests zwar bei einem 10%-Signifikanzniveau, nicht aber bei einem 5%-Signifikanzniveau zugunsten der Alternativhypothese der Endogenität verworfen werden • Die Nullhypothese der Gültigkeit der einbezogenen Momentenbedingungen kann bei üblichen Signifikanzniveaus nicht verworfen werden, so dass es keinen Hinweis auf invalide Instrumente oder Modellfehlspezifikationen gibt, wodurch eine Minimalanforderung der 2SLS-Schätzung erfüllt ist --------------------------------------------------------------------------------------------------------39 3.4 Verallgemeinerte Momentenmethode (GMM) Ausgangspunkt (bei linearen Panelmodellen): Mit yi = (yi1,…, yiT)’, xit = (xit1,…, xitk)‘ und xi = (xi1‘,…, xiT‘)‘ werden ausgehend von einem Beobachtungsbefund (yi, xi) (i = 1,…, n) die unbekannten Parameter im Vektor θ = (θ1, θ2,…, θm)‘ der bedingten Verteilung von yi, d.h. der bedingten Wahrscheinlichkeits- oder Dichtefunktion fi(yi; xi, θ), gesucht. Im Gegensatz insbesondere zur Maximum-Likelihood Methode (siehe später) muss dabei die Verteilung von yi nicht vollständig spezifiziert sein. Grundlage der Verallgemeinerten Momentenmethode (GMM, Generalized Method of Moments) sind auf den wahren unbekannten Parametervektor θ bezogene Momentenbedingungen. Mit einer (g×1) Funktion mi(yi; xi, θ) und unter der Einbeziehung einer (l×g) Instrumentenmatrix Ai (mit l ≥ dimθ) gilt dabei: E A i m i (y i ; x i , θ) = 0 Die Idee der GMM besteht darin, diese Momentenbedingungen der zugrundeliegenden Verteilung durch die Minimierung der quadratischen Form folgender l-dimensionaler Stichprobenmomente nachzuahmen: 1 n A i m i (y i ; x i , θ) n i=1 40 Somit erhält man den GMM-Schätzer: ' 1 n 1 n θ̂ = arg min A i m i (y i ; x i , θ) Wn A i m i (y i ; x i , θ) θ n i=1 n i=1 Dabei stellt Wn eine positiv definite l×l Gewichtungsmatrix dar (die stochastisch gegen eine Matrix W konvergiert). Anmerkungen: • In exakt identifizierten Ansätzen, d.h. wenn die Anzahl der Momentenbedingungen der Anzahl der Parameter entspricht (d.h. für l = dimθ), spielt die Wahl von Wn keine Rolle. In diesem Fall gelangt man durch das Gleichsetzen der Stichprobenmomente 1/n ni=1 Aimi(yi; xi, θ) mit dem Nullvektor zu GMM-Schätzern. Man erhält als Spezialfall einfache IV-Schätzer (einschließlich OLS-Schätzer). • Im allgemeinen Fall von überidentifizierten ökonometrischen Modellen (d.h. mit l > dimθ) gelangt man mit unterschiedlichen Gewichtungsmatrizen Wn bzw. unterschiedlichen Instrumentenmatrizen Ai mit diesem Minimierungsansatz zu verschiedenen GMM-Schätzern (einschließlich 2SLS-Schätzern) • Darüber hinaus spielt bei einem GMM-Schätzer die Ausgestaltung der Funktion mi(yi; xi, θ) eine entscheidende Rolle, die insbesondere von den jeweiligen ökonometrischen Modellen abhängt (z.B. lineare Regressionsmodelle 41 mit Querschnittsdaten, lineare Panelmodelle) Einstufige und zweistufige GMM-Schätzungen: • Bei einem einstufigen GMM-Schätzer basiert die Schätzung auf einer anfänglichen Gewichtungsmatrix Wn, die im Minimierungsansatz nicht aktualisiert wird • Bei einem zweistufigen GMM-Schätzer wird in der ersten Stufe mit einer anfänglichen Gewichtungsmatrix Wn eine GMM-Schätzung durchgeführt. Auf dieser Basis wird eine neue Gewichtungsmatrix geschätzt, die dann bei der GMM-Schätzung in der zweiten Stufe verwendet wird. • Da bei exakt identifizierten Ansätzen die Wahl von Wn keine Rolle spielt, handelt es sich bei einfachen IV-Schätzern (und damit auch OLS-Schätzern) um einstufige GMM-Schätzer • Bei der 2SLS-Schätzung wird im Rahmen des GMM-Ansatzes eine spezifische Gewichtungsmatrix Wn verwendet, so dass es sich auch hierbei um einen einstufigen GMM-Schätzer handelt Asymptotische Eigenschaften von GMM-Schätzern (unter einer Reihe von recht allgemeinen Annahmen): • Konsistenz: plim(θ) = θ • Asymptotische Normalverteilung für Funktionen von θ: n(θˆ - θ) a N 0; V bzw. d n(θˆ - θ) N 0; V 42 Dabei ist V = (G‘WG)-1G‘WPWG(G‘WG)-1, wobei für die (l×dimθ) Matrix G und die (l×l) Matrix P gilt: mi (y i ; x i , θ) G = E Ai θ' P = E A i m i (y i ; x i , θ)mi (y i ; x i , θ)' A i' Zur Überprüfung statistischer Hypothesen ist es notwendig, V und damit die unbekannten Komponenten G und P zu schätzen (eine Schätzung für W ergibt sich aus dem GMM-Ansatz mit der Gewichtungsmatrix Wn). Zur asymptotischen Effizienz: • Die asymptotische Effizienz von GMM-Schätzern hängt von der asymptotischen Varianz-Kovarianzmatrix V und damit von der Gewichtungsmatrix Wn, von der Funktion mi(yi; xi, θ) sowie von der Instrumentenmatrix Ai ab • Bei gegebenen mi(yi; xi, θ) und Ai ergibt sich als optimale Gewichtungsmatrix P-1. Daraus folgt V = (G‘P-1 G)-1. Da P-1 unbekannt ist, muss sie in der ersten Stufe konsistent geschätzt werden. Der Schätzer P-1 kann dann in die zweite Stufe einbezogen werden, wodurch sich folgender optimaler (zweistufiger) GMM-Schätzer ergibt: ' n 1 n 1 -1 θˆ = arg min Ai mi (y i ; x i , θ) Pˆ A i mi (y i ; x i , θ) θ n i=1 n i=1 43 • Allerdings kann dieser optimale GMM-Schätzer bei endlichen Stichprobenumfängen sehr starke Verzerrungen aufweisen • (Asymptotische) Effizienzgewinne mit einzelnen Instrumentenmatrizen Ai (siehe später die Anwendung in dynamischen linearen Panelmodellen) beziehen sich lediglich auf die Klasse der GMM-Schätzer, für die bestimmte Momentenbedingungen zugrunde liegen. Dies unterscheidet die GMM grundsätzlich insbesondere von der Maximum-Likelihood Methode (siehe später). Zur sinnvollen Einbeziehung von Instrumenten in der Instrumentenmatrix Ai: • Wie schon bei der Betrachtung von IV-Schätzungen diskutiert muss bei den verwendeten Instrumenten im GMM-Ansatz Instrument-Exogenität und Instrument-Relevanz vorliegen • Zudem ist auch beim GMM-Ansatz eine starke Korrelation zwischen einem Instrument und der instrumentierten Variablen erforderlich, da die Verwendung von schwachen Instrumenten zu höheren geschätzten Standardabweichungen der geschätzten Parameter und damit zu kleineren t-Werten führt. Zudem können sich dann bei endlichen Stichprobenumfängen sehr starke Verzerrungen ergeben. • Zusätzliche Instrumente führen generell zu einer Erhöhung, zumindest aber nicht zu einer Abnahme der asymptotischen Effizienz, oft aber auch zu star44 ken Verzerrungen bei endlichen Stichprobenumfängen --------------------------------------------------------------------------------------------------------Beispiel 1: Lineares Regressionsmodell mit Querschnittsdaten (I) Modellansatz mit zwei erklärenden Variablen und einer Konstanten: y i = β0 + β1x i1 + β 2 x i2 + ε i für i = 1,..., n Falls die erklärenden Variablen in xi = (1, xi1, xi2)‘ exogen sind, ergibt sich E(εi|xi) = 0 bzw. E(xiεi) = 0. Mit dem (3×1) Vektor Ai = xi bzw. dem (1×1) Vektor mi(yi; xi, θ) = εi und somit Aimi(yi; xi, θ) = (εi, xi1εi, xi2εi)‘ können folgende Momentenbedingungen abgeleitet werden: E[A i m i (y i ; x i , θ)] = E x iε i 1 = E x i1 ε i = 0 bzw. x i2 (y i - β0 - β1x i1 - β 2 x i2 ) E x i1 (y i - β0 - β1x i1 - β2 x i2 ) = 0 x i2 (y i - β0 - β1x i1 - β 2 x i2 ) Da in diesem exakt identifizierten Ansatz die Anzahl der Momentenbedingungen (l = 3) der Anzahl der Parameter β0, β1 und β2 entspricht, kann man durch das Gleichsetzen der Stichprobenmomente 1/n ni=1 Aimi(yi; xi, θ) = 1/n ni=1 xiεi 45 mit dem Nullvektor einen GMM-Schätzer ableiten. --------------------------------------------------------------------------------------------------------- --------------------------------------------------------------------------------------------------------Beispiel 1: Lineares Regressionsmodell mit Querschnittsdaten (II) Damit ergibt sich (der Faktor 1/n kann bei der Lösung der Gleichungen nach den drei Parametern wieder vernachlässigt werden): n (y - βˆ - βˆ x i 0 1 i1 - βˆ 2 x i2 ) = 0 i=1 n x i1 (y i - βˆ 0 - βˆ 1x i1 - βˆ 2 x i2 ) = 0 i2 (y i - βˆ 0 - βˆ 1x i1 - βˆ 2 x i2 ) = 0 i=1 n x i=1 Damit zeigen sich hier erneut die Bedingungen erster Ordnung bei der OLSMethode. Der spezifische GMM-Schätzer (bzw. einfache Momentenschätzer), der diese Momentenbedingungen erfüllt, ist also identisch mit dem entsprechenden OLS-Schätzer. Dies verdeutlicht, dass die OLS-Methode nicht nur ein Spezialfall der einfachen Momentenmethode, sondern eben auch der GMM ist. Bei anderen Momentenbedingungen in diesem linearen Regressionsmodell mit Querschnittsdaten würden sich GMM-Schätzer ergeben, die vom OLS-Schätzer abweichen. 46 --------------------------------------------------------------------------------------------------------- --------------------------------------------------------------------------------------------------------Beispiel 2: Lineares Panelmodell ohne unbeobachtete Heterogenität (I) Modellansatz mit zwei erklärenden Variablen und einer Konstanten: yit = β0 + β1x it1 + β2x it2 + εit für i = 1,..., n; t = 1,..., T Dabei ergeben sich mit dem (T×1) Vektor mi(yi; xi, θ) = εi = (εi1, εi2,…, εiT)‘ folgende Momentenbedingungen: E A i m i (y i ; x i , θ) = E A iε i = 0 Falls die erklärenden Variablen in xit = (1, xit1, xit2)‘ kontemporär exogen sind mit E(εit|xit) = 0 bzw. E(xitεit) = 0, kann für die Instrumentenmatrix Ai die (3×T) Matrix Xi der erklärenden Variablen eingesetzt werden: 1 1 A i = X i = x i11 x i21 x i12 x i22 1 x iT1 x iT2 Daraus folgt: E X iε i ε i1 + ε i2 + + ε iT = E x i11ε i1 + x i21ε i2 + + x iT1ε iT = 0 x i12ε i1 + x i22ε i2 + + x iT2ε iT 47 --------------------------------------------------------------------------------------------------------- --------------------------------------------------------------------------------------------------------Beispiel 2: Lineares Panelmodell ohne unbeobachtete Heterogenität (II) Auch in diesem exakt identifizierten Ansatz entspricht die Anzahl der Momentenbedingungen (l = 3) der Anzahl der zu schätzenden Regressionsparameter β0, β1 und β2, so dass man durch das Gleichsetzen der Stichprobenmomente 1/n ni=1 Xiεi mit dem Nullvektor einen GMM-Schätzer ableiten kann. Damit ergibt sich: n (y i1 i=1 n x - βˆ 0 - βˆ 1x i11 - βˆ 2 x i12 ) + + (y iT - βˆ 0 - βˆ 1x iT1 - βˆ 2 x iT2 ) = 0 i11 (y i1 - βˆ 0 - βˆ 1x i11 - βˆ 2 x i12 ) + + x iT1 (y iT - βˆ 0 - βˆ 1x iT1 - βˆ 2 x iT2 ) = 0 i12 (y i1 - βˆ 0 - βˆ 1x i11 - βˆ 2 x i12 ) + + x iT2 (y iT - βˆ 0 - βˆ 1x iT1 - βˆ 2 x iT2 ) = 0 i=1 n x i=1 Genauso wie im Fall des linearen Regressionsmodells mit Querschnittsdaten ergeben sich hier dieselben Bedingungen erster Ordnung wie bei der OLS-Methode. Somit liegt hier eine OLS-Schätzung im linearen gepoolten Regressionsmodell vor. Der spezifische GMM-Schätzer (bzw. einfache Momentenschätzer), der diese Momentenbedingungen erfüllt, ist also identisch mit dem entsprechenden OLS-Schätzer. 48 --------------------------------------------------------------------------------------------------------- --------------------------------------------------------------------------------------------------------Beispiel 2: Lineares Panelmodell ohne unbeobachtete Heterogenität (III) Für den Fall, dass (valide) Instrumente in zit = (1, zit1, zit2)‘ kontemporär exogen sind mit E(zitεit) = 0, kann eine (3×T) Instrumentenmatrix Ai betrachtet werden, die nicht der Matrix Xi der erklärenden Variablen entspricht: 1 1 A i = z i11 z i21 z i12 z i22 1 z iT1 z iT2 Da auch hier l = 3, kann erneut durch das Gleichsetzen von 1/n ni=1 Aiεi mit dem Nullvektor ein GMM-Schätzer abgeleitet werden. Man gelangt in diesem speziellen Fall zu einem einfachen IV-Schätzer. Allerdings lassen sich auch viele überidentifizierte Ansätze mit l > 3 ableiten. Bei der Einbeziehung eines zusätzlichen Instruments in zit = (1, zit1, zit2, zit3)‘ mit E(zitεit) = 0 ergibt sich die (4×T) Instrumentenmatrix Ai: 1 z i11 Ai = z i12 z i13 1 z i21 z i22 z i23 1 z iT1 z iT2 z iT3 49 --------------------------------------------------------------------------------------------------------- --------------------------------------------------------------------------------------------------------Beispiel 2: Lineares Panelmodell ohne unbeobachtete Heterogenität (IV) Durch eine komplette Ausnutzung von kontemporär exogenen Instrumenten in zit = (1, zit1, zit2)‘ mit E(zitεit) = 0 kann die Anzahl der Momentenbedingungen in Panelmodellen weiter erhöht werden. Im maximalen Fall ergibt sich folgende (3T×T) Instrumentenmatrix Ai: 1 z i11 z i12 0 0 Ai = 0 0 0 0 0 0 0 0 0 0 0 1 0 z i21 0 z i22 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 z iT1 z iT2 50 --------------------------------------------------------------------------------------------------------- --------------------------------------------------------------------------------------------------------Beispiel 3: Erklärung von Löhnen (I) Für die Analyse der Determinanten von logwage werden wieder die Paneldaten für 545 dauerhaft berufstätige Männer von 1980 bis 1987 betrachtet. Es werden erneut hispan, occ6, educ, married, hours und union zusammen mit den Dummy-Variablen für 1981 bis 1987 (d81,…, d87) als erklärende Variablen einbezogen. Dabei sollen zunächst folgende bereits zuvor betrachteten Schätzungen mit GMM-Schätzungen repliziert werden: • Cluster-robuste OLS-Schätzung im linearen gepoolten Regressionsmodell (bei der OLS-Schätzung in STATA wird standardmäßig eine Korrektur der Schätzung der Standardabweichungen für kleine Stichprobenumfänge einbezogen, nicht aber bei der GMM-Schätzung) • Einfache IV-Schätzung, bei der educ durch occ6 instrumentiert und hispan nicht als erklärende Variable einbezogen werden • 2SLS-Schätzung, bei der educ durch occ6 und hispan instrumentiert wird Bei der GMM-Schätzung mit STATA werden ohne zusätzliche Anweisungen standardmäßig heteroskedastizitäts-robuste Schätzungen der Standardabweichungen sowie zweistufige Ansätze ausgewiesen, die bei exakt identifizierten Ansätzen wie z.B. der OLS-Schätzung zu denselben Ergebnissen führen wie bei einstufigen GMM-Schätzungen (STATA-Anweisung „…, onestep“). Es ha51 ben sich dabei folgende Schätzergebnisse gezeigt: --------------------------------------------------------------------------------------------------------- --------------------------------------------------------------------------------------------------------Beispiel 3: Erklärung von Löhnen (II) gmm (logwage-{hispan}*hispan-{occ6}*occ6-{educ}*educ-{married}*married-{hours}*hours{union}*union-{d81}*d81-{d82}*d82-{d83}*d83-{d84}*d84-{d85}*d85-{d86}*d86-{d87}*d87{const}), instruments(hispan occ6 educ married hours union d81 d82 d83 d84 d85 d86 d87) vce(cluster nr) GMM estimation Number of parameters = 14 Number of moments = 14 Initial weight matrix: Unadjusted Number of obs = 4360 (Std. Err. adjusted for 545 clusters in nr) -----------------------------------------------------------------------------| Robust | Coef. Std. Err. z P>|z| [95% Conf. Interval] -------------+---------------------------------------------------------------/hispan | .0382675 .0381482 1.00 0.316 -.0365017 .1130366 /occ6 | .0125775 .0271238 0.46 0.643 -.0405842 .0657392 /educ | .0787436 .0090503 8.70 0.000 .0610053 .0964819 /married | .1484002 .0254737 5.83 0.000 .0984727 .1983277 /hours | -.0000696 .0000249 -2.79 0.005 -.0001184 -.0000207 /union | .1711894 .0275968 6.20 0.000 .1171007 .2252781 /d81 | .1124035 .0247508 4.54 0.000 .0638929 .1609141 ⋮ | ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ /d87 | .4367857 .0292541 14.93 0.000 .3794488 .4941226 /const | .5229031 .125632 4.16 0.000 .2766689 .7691372 -----------------------------------------------------------------------------Instruments for equation 1: hispan occ6 educ married hours union d81 d82 d83 d84 d85 d86 d87 _cons --------------------------------------------------------------------------------------------------------52 --------------------------------------------------------------------------------------------------------Beispiel 3: Erklärung von Löhnen (III) gmm (logwage-{educ}*educ-{married}*married-{hours}*hours-{union}*union-{d81}*d81{d82}*d82-{d83}*d83-{d84}*d84-{d85}*d85-{d86}*d86-{d87}*d87-{const}), instruments(occ6 married hours union d81 d82 d83 d84 d85 d86 d87) vce(unadjusted) GMM estimation Number of parameters = 12 Number of moments = 12 Initial weight matrix: Unadjusted GMM weight matrix: Unadjusted Number of obs = 4360 -----------------------------------------------------------------------------| Coef. Std. Err. z P>|z| [95% Conf. Interval] -------------+---------------------------------------------------------------/educ | .0571581 .0288182 1.98 0.047 .0006754 .1136408 /married | .1498293 .0156782 9.56 0.000 .1191007 .180558 /hours | -.0000672 .0000135 -4.98 0.000 -.0000937 -.0000407 /union | .1730137 .0171121 10.11 0.000 .1394747 .2065528 /d81 | .1117219 .0293417 3.81 0.000 .0542132 .1692305 ⋮ | ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ /d87 | .43397 .0303644 14.29 0.000 .3744567 .4934832 /const | .7806417 .3381704 2.31 0.021 .1178399 1.443443 -----------------------------------------------------------------------------Instruments for equation 1: occ6 married hours union d81 d82 d83 d84 d85 d86 d87 _cons → Die alternative STATA-Anweisung für die einfache IV-Schätzung lautet: „ivregress 2sls logwage (educ=occ6) married hours union d81 d82 d83 d84 d85 d86 d87” 53 --------------------------------------------------------------------------------------------------------- --------------------------------------------------------------------------------------------------------Beispiel 3: Erklärung von Löhnen (IV) gmm (logwage-{educ}*educ-{married}*married-{hours}*hours-{union}*union-{d81}*d81{d82}*d82-{d83}*d83-{d84}*d84-{d85}*d85-{d86}*d86-{d87}*d87-{const}), instruments(occ6 hispan married hours union d81 d82 d83 d84 d85 d86 d87) vce(unadjusted) GMM estimation Number of parameters = 12 Number of moments = 13 Initial weight matrix: Unadjusted GMM weight matrix: Unadjusted Number of obs = 4360 -----------------------------------------------------------------------------| Coef. Std. Err. z P>|z| [95% Conf. Interval] -------------+---------------------------------------------------------------/educ | .0449597 .0172405 2.61 0.009 .011169 .0787504 /married | .1506303 .015668 9.61 0.000 .1199217 .181339 /hours | -.0000667 .0000135 -4.93 0.000 -.0000932 -.0000402 /union | .1726999 .0171714 10.06 0.000 .1390445 .2063553 /d81 | .1115804 .0294601 3.79 0.000 .0538397 .1693212 ⋮ | ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ /d87 | .4334145 .0304699 14.22 0.000 .3736946 .4931345 /const | .9230755 .20412 4.52 0.000 .5230078 1.323143 -----------------------------------------------------------------------------Instruments for equation 1: occ6 hispan married hours union d81 d82 d83 d84 d85 d86 d87 _cons → Die alternative STATA-Anweisung für die 2SLS-Schätzung lautet: „ivregress 2sls logwage (educ=occ6 hispan) married hours union d81 d82 d83 d84 d85 d86 d87” 54 --------------------------------------------------------------------------------------------------------- --------------------------------------------------------------------------------------------------------Beispiel 3: Erklärung von Löhnen (V) Alternative STATA-Anweisungen: • Bei beiden GMM-Schätzungen führt die zusätzliche Einbeziehung der Anweisung „onestep“ zu denselben Ergebnissen, d.h. die einstufige und zweistufige GMM-Schätzung mit der hier implizit einbezogenen Gewichtungsmatrix, die unabhängig identisch verteilte Störterme annimmt, ist identisch • Auch die zusätzliche Anweisung „wmatrix(unadjusted)“ führt zu denselben Schätzergebnissen. wmatrix(…)“ spezifiziert die Gewichtungsmatrix auf der zweiten Stufe einer zweistufigen GMM-Schätzung. „wmatrix(unadjusted)“ unterstellt homoskedastische Störterme, wohingegen „wmatrix(robust)“ und „wmatrix(cluster nr)“ heteroskedastizitäts- und cluster-robuste Gewichtungsmatrizen einbeziehen. • Bei einer allgemeinen zweistufigen GMM-Schätzung werden standardmäßig heteroskedastizitäts-robuste Gewichtungsmatrizen und heteroskedastizitätsrobuste Schätzungen der Standardabweichungen einbezogen Im Folgenden wird eine zweistufige GMM-Schätzung mit cluster-robusten Gewichtungsmatrizen und Schätzungen der Standardabweichungen betrachtet. Mit STATA haben sich folgende Schätzergebnisse gezeigt: --------------------------------------------------------------------------------------------------------- 55 --------------------------------------------------------------------------------------------------------Beispiel 3: Erklärung von Löhnen (VI) gmm (logwage-{educ}*educ-{married}*married-{hours}*hours-{union}*union-{d81}*d81-{d82}* d82-{d83}*d83-{d84}*d84-{d85}*d85-{d86}*d86-{d87}*d87-{const}), instruments(occ6 hispan married hours union d81 d82 d83 d84 d85 d86 d87) vce(cluster nr) wmatrix(cluster nr) GMM estimation Number of parameters = 12 Number of moments = 13 Initial weight matrix: Unadjusted GMM weight matrix: Cluster (nr) Number of obs = 4360 (Std. Err. adjusted for 545 clusters in nr) -----------------------------------------------------------------------------| Robust | Coef. Std. Err. z P>|z| [95% Conf. Interval] -------------+---------------------------------------------------------------/educ | .0469644 .0288653 1.63 0.104 -.0096104 .1035393 /married | .1505866 .0260713 5.78 0.000 .0994879 .2016853 /hours | -.0000665 .0000253 -2.63 0.009 -.000116 -.000017 /union | .1729321 .0279348 6.19 0.000 .1181809 .2276832 /d81 | .1117559 .0248297 4.50 0.000 .0630905 .1604213 ⋮ | ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ /d87 | .4331002 .0295921 14.64 0.000 .3751008 .4910995 /const | .899418 .3352741 2.68 0.007 .2422928 1.556543 -----------------------------------------------------------------------------Instruments for equation 1: occ6 hispan married hours union d81 d82 d83 d84 d85 d86 d87 _cons → Alternative STATA-Anweisung: „ivregress gmm logwage (educ=occ6 hispan) married hours union d81 d82 d83 d84 d85 d86 d87, cluster(nr)” 56 --------------------------------------------------------------------------------------------------------- --------------------------------------------------------------------------------------------------------Beispiel 3: Erklärung von Löhnen (VII) Auch nach zweistufigen GMM-Schätzungen können mit der STATA-Anweisung „estat overid“ Tests auf überidentifizierende Restriktionen durchgeführt werden. In diesem Fall wird der Sargan, Hansen oder Hansen-Sargan Test durchgeführt. Er basiert auf der Zielfunktion des optimalen GMM-Schätzers. Bei Gültigkeit der Momentenbedingungen E[Aimi(yi; xi, θ)] = 0 und damit der Validität der Instrumente ist die Prüfgröße χ2-verteilt mit l-dimθ Freiheitsgraden (dies entspricht der Anzahl der überidentifizierenden Restriktionen). Hohe Werte der Prüfgröße sprechen gegen die Nullhypothese der Gültigkeit der Momentenbedingungen. Die Nullhypothese wird bei einem Signifikanzniveau von α verworfen, falls die Prüfgröße größer ist als χ2l-dimθ;1-α. Nach der vorherigen zweistufigen GMM-Schätzung zeigen sich mit STATA folgende Testergebnisse: estat overid Test of overidentifying restriction: Hansen's J chi2(1) = .105451 (p = 0.7454) Die Nullhypothese kann also bei üblichen Signifikanzniveaus nicht verworfen werden, wodurch eine Minimalanforderung der (zweistufigen) GMM-Schätzung erfüllt ist. 57 --------------------------------------------------------------------------------------------------------- 3.5 Arellano/Bond Schätzung Ausgangspunkt sind die ersten Differenzen in allgemeinen dynamischen linearen Panelmodellen, d.h. (für i = 1,…, n; t = p+1,…, T): Δyit = γ1Δy i,t-1 + + γ pΔy i,t-p + β'Δx it + Δv it Wie bereits diskutiert, ist ∆yi,t-1 = yi,t-1 - yi,t-2 zwangsläufig mit ∆vit = vit - vi,t-1 korreliert, so dass eine OLS-Schätzung inkonsistent ist. Mit der Annahme, dass (die idiosynkratischen Fehler) vit nicht autokorreliert sind, können aber konsistente IV-Schätzungen (bzw. allgemein 2SLS-Schätzungen) abgeleitet werden. Dabei schlagen Anderson und Hsiao (1981) yi,t-2 oder aber ∆yi,t-2 als Instrumente für ∆yi,t-1 vor, da diese nicht mit ∆vit, aber mit ∆yi,t-1 korreliert sind. Mit der Betrachtung von yi,t-2 als Instrument für ∆yi,t-1 sind mindestens drei Zeitperioden notwendig. Falls allerdings mehr als drei Zeitperioden im Paneldatensatz vorliegen, sind zusätzliche Instrumente verfügbar: • Für t = 3 ist yi1 das einzig verfügbare Instrument im first-differenced Modell • Für t = 4 können yi1 und yi2 als Instrumente verwendet werden • Für t = T können yi1, yi2,…, yi,T-2 als Instrumente eingesetzt werden Die darauf aufbauenden IV- bzw. 2SLS-Schätzer sind zwar konsistent, aber nicht notwendigerweise asymptotisch effizient, da nicht alle verfügbaren Momentenbedingungen verwendet werden. Daher sind günstigere Schätzungen mit dem GMM-Ansatz anwendbar. 58 Betrachtet wird ein AR(1) Modell unter Einbeziehung von erklärenden Variablen in xit entsprechend Arellano und Bond (1991), das implizit auch unbeobachtete Heterogenität einbezieht: Δyit = γΔyi,t-1 + β'x it + Δv it für i = 1,..., n; t = 3,..., T Mit der (T-2)-dimensionalen Funktion mi(yi; xi, θ) = ∆vi = (∆vi3, ∆vi4,…, ∆viT )‘ ergeben sich folgende Momentenbedingungen: E A iΔv i = 0 für i = 1,..., n Dabei kann eine (l×[T-2]) Instrumentenmatrix Ai mit ausschließlich verzögerten abhängigen Variablen als Instrumente betrachtet werden. Nach Transponierung ergibt sich dabei für die ([T-2]×l) Matrix Ai‘: y i1 0 Ai' = 0 0 0 0 0 0 0 0 0 y i1 y i2 0 0 0 0 0 0 0 y i1 y i2 y i3 0 0 0 0 0 0 0 0 y i1 y i2 y i3 0 0 0 y i,T-2 Dabei gilt in diesem Fall der maximalen Einbeziehung aller möglichen Instrumente für deren Anzahl l = 1 + 2 + 3 + ⋯ + T-2 = ½(T-2)(T-1), so dass dann z.B. l = 6 für T = 5 oder l = 36 für T = 10. Die (l×[T-2]) Instrumentenmatrix Ai hat 59 folgendes Aussehen: y i1 0 0 y i1 0 y i2 0 0 0 0 0 0 Ai = 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 y i1 y i2 y i3 0 0 0 0 0 0 0 0 0 0 0 0 y i1 y i2 y i3 y i,T-2 0 Zusätzlich zu diesen verzögerten abhängigen Variablen als Instrumente können auch externe Instrumente sowie strikt exogene und prädeterminierte erklärende Variablen als Instrumente einbezogen werden. 60 Typen von erklärenden Variablen: • Eine kontemporär endogene erklärende Variable xith ist mit vit in der gleichen Periode sowie vorherigen Perioden, nicht aber in zukünftigen Perioden korreliert, d.h. E(xithvis) ≠ 0 für s ≤ t und E(xithvis) = 0 für s > t. Solche Variablen werden genauso behandelt wie verzögerte abhängige Variablen. Mögliche Instrumente für xith sind xi,t-2,h, xi,t-3,h,…, nicht aber xi,t-1,h. • Eine prädeterminierte (oder schwach exogene) erklärende Variable xith ist mit vit in vorherigen Perioden, nicht aber derselben oder in zukünftigen Perioden korreliert, d.h. E(xithvis) ≠ 0 für s < t und E(xithvis) = 0 für s ≥ t. Mögliche Instrumente für xith sind hier xi,t-1,h ,xi,t-2,h, xi,t-3,h usw. • Strikt exogene erklärende Variablen xith sind mit vit in allen Perioden unkorreliert, so dass alle xi1h,…, xiTh als Instrumente verwendet werden können Falls eine prädeterminierte erklärende Variable xith einbezogen wird, ergibt sich für die transponierte Instrumentenmatrix: y i1 x i1h x i2h 0 0 0 0 0 0 0 0 0 y y x x x 0 i1 i2 i1h i2h i3h Ai' = 0 0 0 0 0 0 0 0 0 y i1 y i2 y i,T-2 x i1h x i2h 0 0 x i,T-1,h Mit m als Anzahl der prädeterminierten erklärenden Variablen ergeben sich hier 61 2 maximal m/2(T -T-2) zusätzliche Instrumente (z.B. 18 mit m = 2 und T = 5). Falls eine strikt exogene erklärende Variable xith einbezogen wird, ergibt sich für die transponierte Instrumentenmatrix: y i1 x i1h x i2h 0 0 0 Ai' = 0 0 0 x iTh 0 0 0 0 y i1 y i2 x i1h x i2h x iTh 0 0 0 0 0 0 0 0 0 0 y i1 y i2 y i,T-2 x i1h x i2h x iTh Wenn m die Anzahl der strikt exogenen erklärenden Variablen ist, ergeben sich maximal m∙T(T-2) zusätzliche Instrumente (z.B. mit m = 2 und T = 5 also 30). Anmerkungen: • Die Einbeziehung von kontemporär endogenen, prädeterminierten und strikt exogenen erklärenden Variablen kann auch gemischt werden. Zudem können zusätzliche Instrumente einbezogen werden. • Bei allgemeinen dynamischen linearen Panelmodellen mit p > 1 lags für die abhängige Variable als erklärende Variablen ist zu beachten, dass lediglich T-p-1 Perioden einbezogen werden können (z.B. können mit p = 2 bei der Einbeziehung des ersten und zweiten lags der abhängigen Variablen lediglich die Perioden t = 4,…, T betrachtet werden) mit entsprechend weniger möglichen Instrumenten 62 Falls nun eine spezifische Instrumentenmatrix Ai sowie mi(yi; xi, θ) = ∆vi einbezogen werden, ergibt sich folgender GMM- bzw. Arellano/Bond Schätzer: ' 1 n 1 n θ̂ = arg min A iΔv i Wn A iΔv i θ n i=1 n i=1 Bei der Gewichtungsmatrix kann folgender Ansatz betrachtet werden: 1 Wn1 = (A i HA i' ) n i=1 n -1 Dabei ist H im Falle von AR(1) Modellen eine ([T-2]×[T-2]) Matrix mit den Zahlen 2 auf der Hauptdiagonale, -1 auf den ersten Diagonalen außerhalb der Hauptdiagonale und 0 sonst. Die Verwendung von Wn1 führt zu einem einstufigen GMM-Schätzer, wobei Wn1 nicht von geschätzten Parametern abhängt und deshalb leichter abzuleiten ist. Wie zuvor diskutiert, kann jedoch (bei den vorliegenden Momentenbedingungen) auch ein optimaler zweistufiger GMMSchätzer mit folgender Gewichtungsmatrix abgeleitet werden: ' 1 n 2 Wn = A i Δv i Δv i A i' n i=1 -1 Dieser Schätzer erfordert eine konsistente Parameterschätzung in der ersten Stufe zur konsistenten Schätzung ∆vi von ∆vi. In der zweiten Stufe wird dann die entsprechende GMM-Schätzung durchgeführt. Dabei ist der einstufige 63 GMM-Schätzer mit Wn1 ein Kandidat für die erste Stufe im zweistufigen Ansatz. Die bisher betrachteten Momentenbedingungen bei AR(1) Modellen mit ausschließlich verzögerten abhängigen Variablen als Instrumente bestehen aus der (l×1) Funktion Ai∆vi mit folgenden Komponenten (i = 1,…, n): E y i1Δv i3 = 0, E y i1Δv i4 = 0, E y i2Δv i4 = 0, E y i1Δv i5 = 0, E y i2Δv i5 = 0, E y i3Δv i5 = 0, E y i1Δv iT = 0, E y i2Δv iT = 0, , , E y i,T-2Δv iT = 0 Zusammengefasst basiert der Arellano/Bond Schätzer damit auf der Annahme: E y isΔv it = 0 für s T-2 Im Hinblick auf GMM-Schätzer mit besseren Eigenschaften in endlichen Stichprobenumfängen haben verschiedene Studien zusätzliche Momentenbedingungen entwickelt. Arellano und Bover (1995) betrachten dabei neben den obigen Annahmen zusätzlich folgende Momentenbedingungen: E Δy i,t-1v it = 0 Damit können in der entsprechenden Arellano/Bover Schätzung zusätzlich die Differenzen ∆yi,t-1 als Instrumente eingesetzt werden (für die Levels, da sich die Momentenbedingungen auf die vit und nicht auf die ∆vit beziehen, so dass sich dadurch auch die Anzahl der betrachteten Perioden um eins erhöhen lässt). 64 Sargan Test: Bei den Arellano/Bond Ansätzen für allgemeine dynamische lineare Panelmodelle kann eine sehr hohe Anzahl an Instrumenten einbezogen werden, so dass sich gerade hier Tests auf überidentifizierende Restriktionen anbieten. Mit l ≥ dimθ ergeben sich l-dimθ überidentifizierende Restriktionen. Die Prüfgröße des Sargan Tests auf Basis der Zielfunktion des optimalen GMM-Schätzers lautet hier: -1 n n ' ' n ' ' SG = Δv i A i A i Δv i Δv i A i A i Δv i i=1 i=1 i=1 Bei Gültigkeit der Nullhypothese ist die Prüfgröße SG χ2-verteilt mit l-dimθ Freiheitsgraden, so dass sie bei einem Signifikanzniveau von α verworfen wird, falls SG > χ2l-dimθ;1-α. Autokorrelationstest nach Arellano/Bond: Die konsistente GMM-Schätzung erfordert, dass die vit nicht autokorreliert sind. In diesem Fall ist ∆vit zwar mit ∆vi,t-1, nicht aber mit ∆vi,t-2, ∆vi,t-3,… korreliert. Ein entsprechender Test basiert auf der Betrachtung der Korrelation der Schätzer ∆vit von ∆vit. Falls die Nullhypothese, dass ∆vit nicht mit ∆vi,t-2, ∆vi,t-3,… korreliert ist und damit keine Autokorrelation in vit vorliegt, verworfen wird, sollte das Modell anders spezifiziert werden, z.B. durch Einbeziehung von zusätzlichen um mehrere Perioden verzögerten abhängigen Variablen als erklärende Variablen.65 --------------------------------------------------------------------------------------------------------Beispiel: Erklärung von Löhnen (I) Für die Analyse der Determinanten von logwage werden erneut die Paneldaten für 545 dauerhaft berufstätige Männer von 1980 bis 1987 betrachtet. Es werden wieder die zeitvarianten erklärenden Variablen married, hours und union zusammen mit Dummy-Variablen für einzelne Jahre einbezogen. Darüber hinaus wird jetzt aber in einem dynamischen AR(1) Ansatz auch der um ein Jahr verzögerte Wert von logwage als erklärende Variable betrachtet. In einem ersten Schritt soll aber zunächst ein reines AR(1) Modell ohne zusätzliche Einbeziehung der anderen erklärenden Variablen untersucht werden. Dabei werden folgende Schätzungen durchgeführt: • Einstufige Arellano/Bond Schätzung mit maximaler Instrumentenzahl • Zweistufige Arellano/Bond Schätzung mit verminderter Instrumentenzahl • Zweistufige Arellano/Bover Schätzung mit verminderter Instrumentenzahl Die Standardabweichungen der geschätzten Parameter werden jeweils robust geschätzt. Nach einer einstufigen Arellano/Bond Schätzung wird dabei mit STATA eine Korrektur nach Arellano/Bond einbezogen, wohingegen nach einer zweistufigen Schätzung die Korrektur nach Windmeijer (2005) verwendet wird, die die generell starken Verzerrungen bei zweistufigen Schätzungen eindämmen soll. Mit STATA haben sich dabei folgende Schätzergebnisse gezeigt: 66 --------------------------------------------------------------------------------------------------------- --------------------------------------------------------------------------------------------------------Beispiel: Erklärung von Löhnen (II) xtabond logwage, vce(robust) Arellano-Bond dynamic panel-data estimation Group variable: nr Time variable: year Number of obs Number of groups Obs per group: Number of instruments = 22 Wald chi2(1) Prob > chi2 = = 3270 545 min = avg = max = 6 6 6 = = 41.65 0.0000 One-step results (Std. Err. adjusted for clustering on nr) -----------------------------------------------------------------------------| Robust logwage | Coef. Std. Err. z P>|z| [95% Conf. Interval] -------------+---------------------------------------------------------------logwage | L1. | .3285465 .0509062 6.45 0.000 .2287723 .4283208 | _cons | 1.15405 .0816987 14.13 0.000 .9939241 1.314177 -----------------------------------------------------------------------------Instruments for differenced equation GMM-type: L(2/.).logwage Instruments for level equation Standard: _cons --------------------------------------------------------------------------------------------------------67 --------------------------------------------------------------------------------------------------------Beispiel: Erklärung von Löhnen (III) xtabond logwage, twostep artests(3) maxldep(2) vce(robust) Arellano-Bond dynamic panel-data estimation Group variable: nr Time variable: year Number of obs Number of groups Obs per group: Number of instruments = 12 Wald chi2(1) Prob > chi2 = = 3270 545 min = avg = max = 6 6 6 = = 30.15 0.0000 Two-step results (Std. Err. adjusted for clustering on nr) -----------------------------------------------------------------------------| WC-Robust logwage | Coef. Std. Err. z P>|z| [95% Conf. Interval] -------------+---------------------------------------------------------------logwage | L1. | .6899301 .1256559 5.49 0.000 .4436491 .9362111 | _cons | .570906 .2001271 2.85 0.004 .178664 .963148 -----------------------------------------------------------------------------Instruments for differenced equation GMM-type: L(2/3).logwage Instruments for level equation Standard: _cons --------------------------------------------------------------------------------------------------------68 --------------------------------------------------------------------------------------------------------Beispiel: Erklärung von Löhnen (IV) xtdpdsys logwage, twostep artests(3) maxldep(2) vce(robust) System dynamic panel-data estimation Group variable: nr Time variable: year Number of obs Number of groups Obs per group: Number of instruments = 18 Wald chi2(1) Prob > chi2 = = 3815 545 min = avg = max = 7 7 7 = = 24.57 0.0000 Two-step results -----------------------------------------------------------------------------| WC-Robust logwage | Coef. Std. Err. z P>|z| [95% Conf. Interval] -------------+---------------------------------------------------------------logwage | L1. | .3486333 .0703321 4.96 0.000 .2107849 .4864818 | _cons | 1.111213 .1090005 10.19 0.000 .8975761 1.32485 -----------------------------------------------------------------------------Instruments for differenced equation GMM-type: L(2/3).logwage Instruments for level equation GMM-type: LD.logwage Standard: _cons --------------------------------------------------------------------------------------------------------69 --------------------------------------------------------------------------------------------------------Beispiel: Erklärung von Löhnen (V) Interpretation: • Bei der einstufigen Arellano/Bond Schätzung ergibt sich aufgrund von T = 8 die maximal mögliche Anzahl von l = ½(T-2)(T-1)+1 = ½∙6∙7+1 = 22 Instrumenten, wobei sich die Addition von 1 auf die Konstante als Instrument bezieht. Der Ausdruck L(2/.).logwage besagt, dass yi,t-2, yi,t-3,…, yi1 als Instrumente für die Perioden t = 3,…, 8 verwendet werden. • Im Hinblick auf die Einschränkung der Anzahl der Instrumente bewirkt die STATA-Anweisung maxldep(2) im zweiten und dritten Ansatz, dass jeweils höchstens zwei lags für die abhängige Variable als Instrumente verwendet werden. Der Ausdruck L(2/3).logwage besagt somit, dass yi,t-2 und yi,t-3 als Instrumente für Periode t verwendet werden. Damit ergeben sich für t = 3 ein Instrument und für t = 4,…, 8 jeweils zwei Instrumente, so dass sich unter Berücksichtigung der Konstante als Instrument in der zweistufigen Arellano/Bond Schätzung l = 1+2+2+2+2+2+1 =12 ergibt. • In der zweistufigen Arellano/Bover Schätzung werden dann zusätzlich für t = 3,…, 8 die sechs Differenzen ∆yi,t-1 als Instrumente einbezogen • Die STATA-Anweisung artests(3) bezieht sich im Hinblick auf den Autokorrelationstest nach Arellano/Bond auf die Betrachtung von drei lags von ∆vit, 70 also von ∆vi,t-1, ∆vi,t-2 und ∆vi,t-3 --------------------------------------------------------------------------------------------------------- --------------------------------------------------------------------------------------------------------Beispiel: Erklärung von Löhnen (VI) In einem nächsten Schritt werden nun die erläuterten erklärenden Variablen mit einbezogen. Dabei werden folgende Schätzungen betrachtet: • Zweistufige robuste Arellano/Bond Schätzung im AR(1) Modell mit verminderter Instrumentenzahl sowie mit married, hours, union und der maximalen Anzahl an Dummy-Variablen für einzelne Jahre als erklärende Variablen, wobei diese als exogen angenommen werden • Zweistufige robuste Arellano/Bond Schätzung im AR(2) Modell (d.h. mit den um ein sowie zwei Jahren verzögerten Werten von logwage) mit verminderter Instrumentenzahl sowie mit married, hours, union und der maximalen Anzahl an Dummy-Variablen für einzelne Jahre als erklärende Variablen, wobei married und union als endogen angenommen und deshalb mit verzögerten Werten instrumentiert werden Darüber hinaus wird jeweils der Autokorrelationstest nach Arellano/Bond sowie der Sargan Test betrachtet. Zu beachten ist dabei, dass der Sargan Test nicht nach einer robusten Schätzung der Standardabweichungen der geschätzten Parameter angewendet werden kann, weshalb vorher die entsprechenden alternativen Arellano/Bond Schätzungen durchgeführt werden müssen. Mit STATA haben sich dabei folgende Schätz- und Testergebnisse gezeigt: 71 --------------------------------------------------------------------------------------------------------- --------------------------------------------------------------------------------------------------------Beispiel: Erklärung von Löhnen (VII) xtabond logwage married hours union d82 d83 d84 d85 d86 d87, twostep artests(3) maxldep(2) vce(robust) Arellano-Bond dynamic panel-data estimation Group variable: nr Time variable: year Number of obs Number of groups Obs per group: Number of instruments = 21 Wald chi2(10) Prob > chi2 = = 3270 545 min = avg = max = 6 6 6 = = 467.94 0.0000 Two-step results (Std. Err. adjusted for clustering on nr) -----------------------------------------------------------------------------| WC-Robust logwage | Coef. Std. Err. z P>|z| [95% Conf. Interval] -------------+---------------------------------------------------------------logwage | L1. | .1535282 .0372487 4.12 0.000 .0805221 .2265344 married | .0372547 .0221723 1.68 0.093 -.0062021 .0807115 hours | -.0002519 .0000262 -9.63 0.000 -.0003032 -.0002006 union | .0360395 .0234096 1.54 0.124 -.0098425 .0819215 d82 | .0531625 .0212889 2.50 0.013 .011437 .094888 ⋮ | ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ d87 | .3458777 .027473 12.59 0.000 .2920316 .3997239 _cons | 1.801073 .082497 21.83 0.000 1.639382 1.962764 -----------------------------------------------------------------------------Instruments for differenced equation GMM-type: L(2/3).logwage Standard: D.married D.hours D.union D.d82 D.d83 D.d84 D.d85 D.d86 D.d87 Instruments for level equation Standard: _cons 72 --------------------------------------------------------------------------------------------------------- --------------------------------------------------------------------------------------------------------Beispiel: Erklärung von Löhnen (VIII) Interpretation: • Aufgrund der Einbeziehung der um ein Jahr verzögerten abhängigen Variablen sowie der Differenzierung können maximal sechs Dummy-Variablen für die einzelnen Jahre verwendet werden • Wegen maxldep(2) werden höchstens zwei lags für die abhängige Variable als Instrumente verwendet. Somit ergeben sich für t = 3 ein Instrument und für t = 4,…, 8 jeweils zwei Instrumente und damit insgesamt zunächst 1+2+2+2+2+2 =11 Instrumente • Darüber hinaus werden die neun als exogen angenommenen erklärenden Variablen sowie die Konstante durch sich selbst instrumentiert, so dass letztlich l = 11+9+1 = 21 estat abond Arellano-Bond test for zero autocorrelation in first-differenced errors +-----------------------+ |Order | z Prob > z| |------+----------------| | 1 |-6.6061 0.0000 | | 2 | 2.0941 0.0363 | | 3 | .4064 0.6844 | +-----------------------+ H0: no autocorrelation 73 --------------------------------------------------------------------------------------------------------- --------------------------------------------------------------------------------------------------------Beispiel: Erklärung von Löhnen (IX) Interpretation: • Falls die vit nicht autokorreliert sind, müssen die ∆vit mit ∆vi,t-1 korreliert sein. Deshalb muss für diesen Fall die entsprechende Nullhypothese im Autokorrelationstest nach Arellano/Bond wie in diesem Beispiel verworfen werden. Dies ist bei Order 1 für ∆vi,t-1 ersichtlich. • Jedoch dürfen die ∆vit nicht mit ∆vi,t-2, ∆vi,t-3,… korreliert sein. Somit darf die entsprechende Nullhypothese für diese verzögerten Werte nicht verworfen werden. Im Beispiel werden die drei lags ∆vi,t-1, ∆vi,t-2 und ∆vi,t-3 betrachtet. Für ∆vi,t-2 (Order 2) ergibt sich hier eine hochsignifikante Ablehnung. • Somit ist von einer Autokorrelation in vit auszugehen und somit von invaliden Momentenbedingungen (der Sargan Test kommt zu demselben Ergebnis). Damit ist aber der Arellano/Bond Schätzer inkonsistent, weshalb andere Modellspezifikationen betrachtet werden sollten, z.B. durch die zusätzliche Einbeziehung verzögerter abhängiger Variablen als erklärende Variablen. estat sargan Sargan test of overidentifying restrictions H0: overidentifying restrictions are valid chi2(10) Prob > chi2 = = 21.3385 0.0189 74 --------------------------------------------------------------------------------------------------------- --------------------------------------------------------------------------------------------------------Beispiel: Erklärung von Löhnen (X) xtabond logwage hours d83 d84 d85 d86 d87, lags(2) twostep artests(3) maxldep(2) vce(robust) endogenous(married, lag(0,2)) endogenous(union, lag(0,2)) Arellano-Bond dynamic panel-data estimation Group variable: nr Time variable: year Number of obs Number of groups Obs per group: Number of instruments = 37 Wald chi2(10) Prob > chi2 = = 2725 545 min = avg = max = 5 5 5 = = 490.97 0.0000 Two-step results (Std. Err. adjusted for clustering on nr) -----------------------------------------------------------------------------| WC-Robust logwage | Coef. Std. Err. z P>|z| [95% Conf. Interval] -------------+---------------------------------------------------------------logwage | L1. | .2327599 .0399373 5.83 0.000 .1544841 .3110356 L2. | .0817093 .0239738 3.41 0.001 .0347216 .1286971 married | .2273964 .0555331 4.09 0.000 .1185536 .3362392 union | .0381822 .1376204 0.28 0.781 -.2315489 .3079132 hours | -.000285 .0000267 -10.67 0.000 -.0003373 -.0002326 d83 | .0307297 .0184227 1.67 0.095 -.0053782 .0668375 ⋮ | ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ d87 | .210727 .0289251 7.29 0.000 .1540348 .2674191 _cons | 1.619214 .1024318 15.81 0.000 1.418451 1.819977 -----------------------------------------------------------------------------Instruments for differenced equation GMM-type: L(2/3).logwage L(2/3).married L(2/3).union Standard: D.hours D.d83 D.d84 D.d85 D.d86 D.d87 Instruments for level equation Standard: _cons 75 --------------------------------------------------------------------------------------------------------Beispiel: Erklärung von Löhnen (XI) Interpretation: • Aufgrund der Einbeziehung der um ein sowie zwei Jahre verzögerten abhängigen Variablen sowie der Differenzierung können lediglich die fünf Perioden t = 4,…, 8 sowie maximal fünf Dummy-Variablen für die einzelnen Jahre untersucht werden • Wegen maxldep(2) ergeben sich für t = 4,…, 8 zwei Instrumente für die beiden verzögerten abhängigen Variablen (d.h. yi,t-2, yi,t-3) und somit in diesem Fall 2+2+2+2+2 = 10 Instrumente. Darüber hinaus werden die sechs als exogen angenommenen erklärenden Variablen sowie die Konstante durch sich selbst instrumentiert. • Die 0 bei den beiden STATA-Anweisungen endogenous(married,lag(0,2)) und endogenous(union,lag(0,2)) bedeutet, dass married und union lediglich als kontemporäre erklärende Variable (und nicht als verzögerte erklärende Variable) einbezogen werden. Die 2 bedeutet, dass maximal zwei lags dieser erklärenden Variablen als Instrumente betrachtet werden. Somit werden bei married und union für t = 4,…, 8 die um zwei sowie um drei Perioden verzögerten Werte (d.h. xi,t-2,h, xi,t-3,h) als Instrumente einbezogen (also jeweils 2+2+2+2+2 = 10 Instrumente). 76 • Damit ergeben sich insgesamt 10+6+1+10+10 = 37 Instrumente --------------------------------------------------------------------------------------------------------- --------------------------------------------------------------------------------------------------------Beispiel: Erklärung von Löhnen (XII) estat abond Arellano-Bond test for zero autocorrelation in first-differenced errors +-----------------------+ |Order | z Prob > z| |------+----------------| | 1 |-5.5893 0.0000 | | 2 |-.09516 0.9242 | | 3 | .65267 0.5140 | +-----------------------+ H0: no autocorrelation estat sargan Sargan test of overidentifying restrictions H0: overidentifying restrictions are valid chi2(26) Prob > chi2 = = 23.57944 0.6000 Weder der Autokorrelationstest nach Arellano/Bond noch der Sargan Test weisen somit auf invalide Momentenbedingungen hin, wodurch eine Minimalanforderung für die Arellano/Bond Schätzung erfüllt ist. --------------------------------------------------------------------------------------------------------- 77