3. Dynamische lineare Panelmodelle

Werbung
3. Dynamische lineare Panelmodelle
3.1 Ansatz und Problemstellung
→ Die wesentliche Annahme bei fixed effects und random effects Schätzungen
in linearen Panelmodellen ist, dass die erklärenden Variablen (zumindest in
Bezug auf den idiosynkratischen Fehler vit) strikt exogen sind. Demnach ergeben sich hier keine konsistenten Schätzer, falls endogene erklärende Variablen wie z.B. im Fall verzögerter abhängiger Variablen vorliegen.
Die Einbeziehung verzögerter abhängiger Variablen (z.B. yi,t-1) als erklärende
Variablen erlaubt die Analyse, ob die abhängige Variable yit auch direkt von ihren Werten in der Vergangenheit abhängt. Dies ist z.B. für Politikmaßnahmen
in Bezug auf die Persistenz von temporären Schocks auf individuelle Einkommen interessant. Dabei spricht man von „true state dependence“, die sich vom
indirekten Effekt durch die unbeobachtete Heterogenität αi und vom direkten
Effekt durch beobachtete Heterogenität in den erklärenden Variablen unterscheidet. Für den allgemeinsten Ansatz dynamischer linearer Panelmodelle mit
unbeobachteter Heterogenität ergibt sich (für i = 1,…, n; t = p+1,…, T):
y it = γ1y i,t-1 +
= γ1y i,t-1 +
+ γ p y i,t-p + β1x it1 +
+ β k x itk + α i + v it
+ γ p y i,t-p + β'x it + α i + v it
Dabei gilt xit = (xit1,…, xitk)‘ und β = (β1,…, βk)‘.
1
Dieser allgemeine Ansatz beinhaltet verschiedene Spezialfälle wie z.B. ein einfaches reines AR(1) Modell, ein reines AR(p) Modell oder ein AR(1) Modell unter zusätzlicher Einbeziehung von erklärenden Variablen in xit:
y it = γy i,t-1 + α i + v it
y it = γ1y i,t-1 +
+ γ p y i,t-p + α i + v it
y it = γy i,t-1 + β'x it + α i + v it
Konsequenzen der Einbeziehung von verzögerten abhängigen Variablen als
erklärende Variablen, z.B. im Ansatz yit = γyi,t-1 + β‘xit + αi + vit:
• Der konventionelle OLS-Schätzer ist nicht konsistent. In diesem Fall ist der
Störterm αi+vit mit yi,t-1 korreliert, da der fixe Effekt αi mit yi,t-1 aufgrund von
yi,t-1 = γyi,t-2 + β‘xi,t-1 + αi + vi,t-1 korreliert ist.
• Bei der fixed effects Schätzung ergibt sich bei der within Transformation:
y it - yi = γ(yi,t-1 - yi ) + β'(x it - x i ) + v it - v i
Da yit von vit abhängt, hängt auch yi,t-1 von vi,t-1 ab, so dass yi,t-1 mit vi korreliert ist. Dies impliziert, dass bei der within Transformation die erklärende
Variable yi,t-1-yi mit dem Störterm vit-vi korreliert ist. Somit ist auch der OLSSchätzer in diesem Ansatz inkonsistent. Die Konsistenz würde erfordern,
dass vi im Vergleich zu vit klein ist. Dies erfordert T → ∞, was allerdings bei
mikroökonometrischen Betrachtungen mit eher kleinen T nicht zutrifft.
2
• Bei der random effects Schätzung ergibt sich mit εit = αi + vit folgende Transformation:
yit - λyi = γ(yi,t-1 - λyi ) + β'(x it - λx i ) + (ε it - λεi )
Durch die zuvor beschriebene Korrelation von αi mit yi,t-1 ergibt sich, dass
die erklärende Variable yi,t-1-λyi mit dem Störterm εit-λεi korreliert ist, wodurch auch dieser Schätzer inkonsistent ist.
Bei der Bildung der ersten Differenzen in allgemeinen dynamischen linearen
Panelmodellen ergibt sich (für i = 1,…, n; t = p+1,…, T):
y it - y i,t-1 = γ1 (y i,t-1 - y i,t-2 ) +
Δy it = γ1Δy i,t-1 +
+ γ p (y i,t-p - y i,t-p-1 ) + β'(x it - x i,t-1 ) + v it - v i,t-1
+ γ pΔy i,t-p + β'Δx it + Δv it
Selbst mit der Annahme, dass die vit nicht autokorreliert sind, sind die OLSSchätzer in diesem first-differences Modell inkonsistent. Der Grund hierfür ist,
dass yi,t-1 von vi,t-1 abhängt, so dass die erklärende Variable ∆yi,t-1 = yi,t-1 - yi,t-2
mit dem Störterm ∆vit = vit - vi,t-1 korreliert ist.
→ Endogenität in den erklärenden Variablen ist eines der wichtigsten Probleme
nicht nur in Panelmodellen, sondern generell in ökonometrischen Modellen
(z.B. bei vernachlässigten erklärenden Variablen, d.h. bei einem „omitted
variable bias“). Einer der populärsten Ansätze zur Lösung von Endogenitätsproblemen ist die Anwendung von Instrumentalvariablenmethoden.
3
3.2 Einfache Instrumentalvariablenmethode
Ausgangspunkt: Lineares Regressionsmodell mit Querschnittsdaten
y i = β0 + β1x i1 + β 2 x i2 +
+ β k x ik + ε i für i =1,..., n
Im Rahmen der Instrumentalvariablenanalyse wird dieses Ausgangsmodell mit
E(εi) = 0 als Strukturmodell oder Strukturgleichung bezeichnet.
Besonderheiten:
• Die erklärenden Variablen xi1,…, xi,k-1 sind exogen
• xik ist dagegen endogen und mit dem Fehlerterm εi korreliert, d.h. es gilt
Cov(xik, εi) ≠ 0
• xik soll durch eine beobachtbare exogene Variable zi1 instrumentiert werden
Voraussetzungen für geeignete (valide) Instrumentalvariablen zi1:
• Instrument-Exogenität:
- Die Instrumentalvariable ist unkorreliert mit dem Fehlerterm, d.h. es gilt
Cov(zi1, εi) = 0 (diese Bedingung kann in der Regel nicht getestet werden,
sondern muss z.B. auf theoretischen Überlegungen basieren)
- Die Instrumentalvariable hat (bei vernachlässigten erklärenden Variablen)
keinen partiellen Effekt auf yi und trägt somit nicht zur Erklärung von yi bei
• Instrument-Relevanz, d.h. die Instrumentalvariable ist korreliert mit der en- 4
dogenen erklärenden Variablen, so dass Cov(zi1, xik) ≠ 0
Die Instrumentalvariablenschätzung (IV-Schätzung) ist eine spezifische Form
einer einfachen Momentenschätzung:
• Die Idee dabei ist, dass bei zufälligen Stichproben eine Stichprobenstatistik
(wie z.B. ein Stichprobenmittel oder eine Stichprobenvarianz) stochastisch
gegen eine Konstante konvergiert, die eine Funktion der unbekannten Parameter der zugrundeliegenden Verteilung ist
• Zur Schätzung von m Parametern werden m solche Statistiken benötigt
• Wenn nun ein System von m Momentengleichungen, die Stichprobenmomente (also Stichprobenstatistiken) mit den Momenten der zugrundeliegenden Verteilung (also den Konstanten, die eine Funktion der unbekannten
Parameter sind) gleichsetzen, nach den m unbekannten Parametern gelöst
wird, erhält man die entsprechenden einfachen Momentenschätzer
• Falls mehr als m Momentenbedingungen zur Schätzung von m Parametern
vorliegen, führt diese Schätzmethode oft zu keiner eindeutigen Lösung. In
diesem Fall kann die Verallgemeinerte Momentenmethode (GMM) angewendet werden (siehe später).
Durch unterschiedliche Momentenbedingungen erhält man unterschiedliche
einfache Momentenschätzer. Bei der IV-Schätzung ergeben sich die Momentenbedingungen aus den Eigenschaften der Instrumentalvariablen. Die exogenen erklärenden Variablen fungieren dabei als ihr eigenes Instrument. Im zuvor
spezifizierten linearen Regressionsmodell wird angenommen:
5
• E(εi) = E(yi - β0 - β1xi1 -…- βkxik) = 0
• Cov(xih, εi) = E(xihεi) - E(xih)E(εi) = E(xihεi) = 0 (h = 1,…, k-1)
• Cov(zi1, εi) = E(zi1εi) - E(zi1)E(εi) = E(zi1εi) = 0
Durch das Gleichsetzen der entsprechenden Stichprobenmomente mit den
Momenten der zugrundeliegenden Verteilung bzw. der Differenzen mit dem
Wert null (die Momente der zugrundeliegenden Verteilung sind hier jeweils null)
ergeben sich folgende k+1 Momentengleichungen für den IV- und damit spezifischen einfachen Momentenschätzer der k+1 unbekannten Regressionsparameter:
1 n
(y i - βˆ 0 - βˆ 1x i1 
n i=1
- βˆ k x ik ) = 0
1 n
x i1 (y i - βˆ 0 - βˆ 1x i1 
n i=1
1 n
x i,k-1 (y i - βˆ 0 - βˆ 1x i1 
n i=1
1 n
z i1 (y i - βˆ 0 - βˆ 1x i1 
n i=1
- βˆ k x ik ) = 0
- βˆ k x ik ) = 0
- βˆ k x ik ) = 0
6
Falls zi1 = xik, erhält man den OLS-Schätzer der unbekannten Regressionsparameter. Falls also xik exogen ist, kann auch diese erklärende Variable als eigenes Instrument fungieren, wodurch der IV-Schätzer identisch mit dem entsprechenden OLS-Schätzer ist. Die entsprechenden Momentengleichungen sind
deshalb in diesem Fall identisch mit den Bedingungen erster Ordnung bei der
OLS-Methode (bei der Lösung der Gleichungen nach den k+1 Parametern
kann der Faktor 1/n jeweils vernachlässigt werden):
n
 (y - βˆ - βˆ x
i
0
1 i1
- βˆ 2 x i2 -
- βˆ k x ik ) = 0
i=1
n
x
i1
(y i - βˆ 0 - βˆ 1x i1 - βˆ 2 x i2 -
- βˆ k x ik ) = 0
ik
(y i - βˆ 0 - βˆ 1x i1 - βˆ 2 x i2 -
- βˆ k x ik ) = 0
i=1
n
x
i=1
Dies verdeutlicht, dass die OLS-Methode ein Spezialfall der IV-Methode sowie
der einfachen Momentenmethode ist. Bei anderen Instrumentalvariablen sowie
Momentengleichungen ergeben sich IV- und einfache Momentenschätzer, die
vom OLS-Schätzer abweichen.
7
Eigenschaften des IV-Schätzers:
• Falls Cov(zi1, εi) = 0 und Cov(zi1, xik) ≠ 0, ist der IV-Schätzer (als Spezialfall
eines einfachen Momentenschätzers) für n → ∞ konsistent
• Falls Cov(xik, εi) ≠ 0, so dass die IV-Schätzung im Hinblick auf die Konsistenz benötigt wird (da die OLS-Schätzung in diesem Fall ja inkonsistent ist),
ist der IV-Schätzer niemals erwartungstreu
• Dadurch kann der IV-Schätzer bei kleinen Stichprobenumfängen starke Verzerrungen aufweisen, weshalb bei der Anwendung dieser Schätzmethode
große Stichprobenumfänge geboten sind
• IV-Schätzer sind bei großen Stichprobenumfängen näherungsweise normalverteilt (Funktionen von IV-Schätzern sind asymptotisch normalverteilt), so
dass Teststatistiken wie der t-Wert sowie Konfidenzintervalle konstruiert
werden können
• Die (geschätzte) Varianz der mit der IV-Methode geschätzten Parameter ist
immer größer als bei der OLS-Methode (falls nicht zi1 = xik). Daraus ergibt
sich, dass die IV-Methode im Hinblick auf Effizienz immer der OLS-Methode
unterlegen ist, falls alle erklärenden Variablen exogen sind.
• Falls Cov(zi1, xik) = 0, also die Instrument-Relevanz nicht gilt, kann dies zu
sehr stark (asymptotisch) verzerrten IV-Schätzern führen, unabhängig davon
ob zi1 und εi unkorreliert sind oder nicht
• Bestimmtheitsmaße auf Basis von IV-Schätzungen können negativ werden 8
Schwache Instrumente (d.h. schwache Korrelationen zwischen der Instrumentalvariablen zi1 und der endogenen Variablen xik):
• Die geschätzte Varianz der mit der IV-Methode geschätzten Parameter
steigt mit sinkender Korrelation zwischen zi1 und xik und kann deshalb bei
schwachen Instrumenten zi1 sehr groß werden
• Selbst wenn zi1 und εi nur moderat korreliert sind, können schwache Instrumente zi1 zu sehr stark (asymptotisch) verzerrten IV-Schätzern führen
Im Unterschied zur Instrument-Exogenität kann und sollte die Instrument-Relevanz grundsätzlich getestet werden. In multiplen linearen Regressionsmodellen
ist dabei die partielle Korrelation zwischen zi1 und xik entscheidend. Zur Überprüfung der Instrument-Relevanz kann die endogene erklärende Variable auf
alle exogenen Variablen sowie die Instrumentalvariable regressiert werden:
x ik = δ0 + δ1x i1 +
+ δ k-1x ik-1 +δ k z i1 + ν i
Diese Gleichung ist ein Beispiel einer reduzierten Form, bei der grundsätzlich
endogene Variablen durch exogene Variablen ausgedrückt werden (der Name
stammt aus der Betrachtung von simultanen Gleichungsmodellen). Auf Basis
einer OLS-Schätzung wird mit einem t-Test die Nullhypothese überprüft, dass
δk gleich null ist. Falls diese Hypothese bei kleinen Signifikanzniveaus verworfen wird, kann von Instrument-Relevanz ausgegangen werden.
→ Die IV-Methode kann ähnlich auch bei linearen Regressionsmodellen mit
Zeitreihendaten sowie linearen Panelmodellen angewendet werden
9
--------------------------------------------------------------------------------------------------------Beispiel 1: Erklärung von Geburtsgewichten (I)
Mit Hilfe eines linearen Regressionsmodells wird für n = 1191 Geburten wieder
der Effekt der durchschnittlichen Anzahl der von der Mutter während der
Schwangerschaft täglich gerauchten Zigaretten (cigs), der Geburtsrangfolge
des Kindes (parity) sowie des jährlichen Familieneinkommens (faminc) in 1000
Dollar auf das Geburtsgewicht des Kindes (bwght) in ounces untersucht. Mit
STATA haben sich dabei folgende OLS-Schätzergebnisse gezeigt:
reg bwght cigs parity faminc
Source |
SS
df
MS
-------------+-----------------------------Model | 17579.8997
3 5859.96658
Residual | 465166.792 1187 391.884408
-------------+-----------------------------Total | 482746.692 1190 405.669489
Number of obs
F( 3, 1187)
Prob > F
R-squared
Adj R-squared
Root MSE
=
=
=
=
=
=
1191
14.95
0.0000
0.0364
0.0340
19.796
-----------------------------------------------------------------------------bwght |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------cigs | -.5978519
.1087701
-5.50
0.000
-.8112549
-.3844489
parity |
1.832274
.6575402
2.79
0.005
.5422035
3.122345
faminc |
.0670618
.0323938
2.07
0.039
.0035063
.1306173
_cons |
115.4699
1.655898
69.73
0.000
112.2211
118.7187
------------------------------------------------------------------------------
--------------------------------------------------------------------------------------------------------10
--------------------------------------------------------------------------------------------------------Beispiel 1: Erklärung von Geburtsgewichten (II)
In einem nächsten Schritt soll die als endogen betrachtete erklärende Variable
cigs durch den durchschnittlichen Preis von Zigaretten im jeweiligen Staat des
Wohnsitzes (cigprice) instrumentiert werden. Mit STATA haben sich dabei zur
Untersuchung der Instrument-Relevanz folgende OLS-Schätzergebnisse bei
der Regression von cigs auf parity, faminc sowie cigprice gezeigt:
reg cigs cigprice parity faminc
Source |
SS
df
MS
-------------+-----------------------------Model | 873.397051
3
291.13235
Residual | 33108.1059 1187 27.8922543
-------------+-----------------------------Total | 33981.5029 1190 28.5558848
Number of obs
F( 3, 1187)
Prob > F
R-squared
Adj R-squared
Root MSE
=
=
=
=
=
=
1191
10.44
0.0000
0.0257
0.0232
5.2813
-----------------------------------------------------------------------------cigs |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------cigprice |
.0111199
.0148609
0.75
0.454
-.0180367
.0402765
parity |
.2031177
.1753259
1.16
0.247
-.1408654
.5471008
faminc | -.0463081
.0085803
-5.40
0.000
-.0631424
-.0294738
_cons |
1.479846
1.965413
0.75
0.452
-2.376224
5.335917
------------------------------------------------------------------------------
Damit kann die Instrument-Relevanz bei üblichen Signifikanzniveaus nicht
nachgewiesen werden. Dies kann zu stark verzerrten IV-Schätzern führen.
Deshalb sollte cigprice keinesfalls als Instrumentalvariable verwendet werden.11
---------------------------------------------------------------------------------------------------------
--------------------------------------------------------------------------------------------------------Beispiel 1: Erklärung von Geburtsgewichten (III)
Falls cigprice aber dennoch eingesetzt wird, zeigen sich mit STATA folgende
IV-Schätzergebnisse:
ivreg bwght (cigs=cigprice) parity faminc
Instrumental variables (2SLS) regression
Source |
SS
df
MS
-------------+-----------------------------Model | -1399683.81
3 -466561.269
Residual |
1882430.5 1187 1585.87237
-------------+-----------------------------Total | 482746.692 1190 405.669489
Number of obs
F( 3, 1187)
Prob > F
R-squared
Adj R-squared
Root MSE
=
=
=
=
=
=
1191
1.32
0.2655
.
.
39.823
-----------------------------------------------------------------------------bwght |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------cigs |
5.943323
10.07713
0.59
0.555
-13.82766
25.7143
parity |
.5076277
2.431501
0.21
0.835
-4.262891
5.278147
faminc |
.3659014
.4648647
0.79
0.431
-.5461467
1.277949
_cons |
96.40724
29.54883
3.26
0.001
38.43349
154.381
-----------------------------------------------------------------------------Instrumented: cigs
Instruments:
parity faminc cigprice
------------------------------------------------------------------------------
Der geschätzte Parameter von cigs ist extrem hoch, aber unplausibel positiv.
Die geschätzte Standardabweichung ist ebenfalls sehr groß, so dass kein signifikanter Effekt von cigs vorliegt. Allerdings sind die Schätzergebnisse bedeu12
tungslos, da die Instrument-Relevanz nicht nachgewiesen werden kann.
--------------------------------------------------------------------------------------------------------Beispiel 1: Erklärung von Geburtsgewichten (IV)
Nun soll cigs durch die Anzahl der Schuljahre der Mutter (motheduc), die keinen signifikanten Effekt auf bwght hat, instrumentiert werden. Mit STATA haben
sich zur Untersuchung der Instrument-Relevanz folgende OLS-Schätzergebnisse gezeigt:
reg cigs motheduc parity faminc
Source |
SS
df
MS
-------------+-----------------------------Model | 1773.67058
3 591.223528
Residual | 32207.8324 1187 27.1338099
-------------+-----------------------------Total | 33981.5029 1190 28.5558848
Number of obs
F( 3, 1187)
Prob > F
R-squared
Adj R-squared
Root MSE
=
=
=
=
=
=
1191
21.79
0.0000
0.0522
0.0498
5.209
-----------------------------------------------------------------------------cigs |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------motheduc | -.4026233
.0692999
-5.81
0.000
-.5385872
-.2666594
parity |
.122423
.1734724
0.71
0.481
-.2179237
.4627697
faminc |
-.022757
.0093017
-2.45
0.015
-.0410067
-.0045073
_cons |
7.589223
.911248
8.33
0.000
5.801387
9.377059
------------------------------------------------------------------------------
Da der Parameter von motheduc hochsignifikant von null verschieden ist, kann
die Instrument-Relevanz bei sehr kleinen Signifikanzniveaus nachgewiesen
werden. Mit STATA haben sich dann folgende IV-Schätzergebnisse gezeigt:
13
---------------------------------------------------------------------------------------------------------
--------------------------------------------------------------------------------------------------------Beispiel 1: Erklärung von Geburtsgewichten (V)
ivreg bwght (cigs=motheduc) parity faminc
Instrumental variables (2SLS) regression
Source |
SS
df
MS
-------------+-----------------------------Model | 16462.5014
3 5487.50045
Residual | 466284.191 1187 392.825771
-------------+-----------------------------Total | 482746.692 1190 405.669489
Number of obs
F( 3, 1187)
Prob > F
R-squared
Adj R-squared
Root MSE
=
=
=
=
=
=
1191
5.00
0.0019
0.0341
0.0317
19.82
-----------------------------------------------------------------------------bwght |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------cigs | -.4141835
.6549049
-0.63
0.527
-1.699084
.8707167
parity |
1.79508
.6711933
2.67
0.008
.478222
3.111937
faminc |
.0754529
.0438444
1.72
0.086
-.0105682
.161474
_cons |
114.9347
2.508082
45.83
0.000
110.0139
119.8554
-----------------------------------------------------------------------------Instrumented: cigs
Instruments:
parity faminc motheduc
------------------------------------------------------------------------------
Damit ist der geschätzte Parameter von cigs wieder negativ. Allerdings ist die
geschätzte Standardabweichung jetzt sehr hoch (und zwingend höher als bei
der OLS-Methode), so dass der Parameter bei üblichen Signifikanzniveaus
nicht mehr von null verschieden ist. Für den Fall, dass cigs nicht endogen ist,
wäre die Anwendung der OLS-Methode also eindeutig vorteilhaft. Zu beachten
ist aber, dass „ivreg …“ kein aktueller STATA-Befehl (seit STATA 10) mehr ist. 14
--------------------------------------------------------------------------------------------------------Beispiel 1: Erklärung von Geburtsgewichten (VI)
Die aktuellere Möglichkeit von IV-Schätzungen mit STATA ergibt sich durch
„ivregress 2sls …“ (siehe später). Für die Gleichheit der Ergebnisse (für die geschätzten Standardabweichungen) muss allerdings eine Korrektur für kleine
Stichprobenumfänge „…, small“ einbezogen werden. Falls nun cigs durch sich
selbst instrumentiert wird, sind die IV-Schätzergebnisse identisch mit den OLSSchätzergebnissen (hier kann „ivregress 2sls …“ nicht angewendet werden):
ivreg bwght (cigs=cigs) parity faminc
Instrumental variables (2SLS) regression
Source |
SS
df
MS
Number of obs =
1191
-------------+-----------------------------F( 3, 1187) =
14.95
Model | 17579.8997
3 5859.96658
Prob > F
= 0.0000
Residual | 465166.792 1187 391.884408
R-squared
= 0.0364
-------------+-----------------------------Adj R-squared = 0.0340
Total | 482746.692 1190 405.669489
Root MSE
= 19.796
-----------------------------------------------------------------------------bwght |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------cigs | -.5978519
.1087701
-5.50
0.000
-.8112549
-.3844489
parity |
1.832274
.6575402
2.79
0.005
.5422035
3.122345
faminc |
.0670618
.0323938
2.07
0.039
.0035063
.1306173
_cons |
115.4699
1.655898
69.73
0.000
112.2211
118.7187
-----------------------------------------------------------------------------Instrumented: cigs
Instruments:
parity faminc cigs
------------------------------------------------------------------------------
15
---------------------------------------------------------------------------------------------------------
--------------------------------------------------------------------------------------------------------Beispiel 2: Erklärung von Löhnen (I)
Mit Paneldaten für 545 dauerhaft berufstätige Männer von 1980 bis 1987 wird
der Effekt des Familienstandes (married), der Anzahl der Arbeitsstunden im
Jahr (hours) und der Gewerkschaftszugehörigkeit (union) unter Einbeziehung
von Dummy-Variablen für die Jahre 1981 bis 1987 (d81,…, d87) auf den Logarithmus von Löhnen (logwage) untersucht. Im linearen gepoolten Regressionsmodell zeigen sich mit STATA folgende cluster-robuste OLS-Schätzergebnisse:
reg logwage married hours union d81 d82 d83 d84 d85 d86 d87, cluster(nr)
Linear regression
Number of obs
F( 10,
544)
Prob > F
R-squared
Root MSE
=
=
=
=
=
4360
53.77
0.0000
0.1177
.50087
(Std. Err. adjusted for 545 clusters in nr)
-----------------------------------------------------------------------------|
Robust
logwage |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------married |
.1535825
.0273828
5.61
0.000
.0997936
.2073714
hours | -.0000647
.0000257
-2.51
0.012
-.0001152
-.0000142
union |
.171543
.0292259
5.87
0.000
.1141335
.2289525
d81 |
.1110592
.0249218
4.46
0.000
.0621045
.1600139
⋮ |
⋮
⋮
⋮
⋮
⋮
⋮
d87 |
.4313674
.0299395
14.41
0.000
.3725563
.4901785
_cons |
1.448043
.0586549
24.69
0.000
1.332825
1.563261
------------------------------------------------------------------------------
16
---------------------------------------------------------------------------------------------------------
--------------------------------------------------------------------------------------------------------Beispiel 2: Erklärung von Löhnen (II)
Trotz des signifikant positiven Effektes wird nun (unvernüntigerweise) married
als Instrument für hours neben der weiterhin als exogen betrachteten Variablen
union einbezogen. Mit STATA haben sich zur Untersuchung der Instrument-Relevanz von married folgende OLS-Schätzergebnisse gezeigt:
reg hours married union d81 d82 d83 d84 d85 d86 d87
Source |
SS
df
MS
-------------+-----------------------------Model |
106628086
9 11847565.1
Residual | 1.2915e+09 4350 296906.356
-------------+-----------------------------Total | 1.3982e+09 4359 320754.929
Number of obs
F( 9, 4350)
Prob > F
R-squared
Adj R-squared
Root MSE
=
=
=
=
=
=
4360
39.90
0.0000
0.0763
0.0744
544.89
-----------------------------------------------------------------------------hours |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------married |
171.6739
17.35696
9.89
0.000
137.6454
205.7023
union | -71.59145
19.24862
-3.72
0.000
-109.3285
-33.85436
d81 |
92.51316
33.05681
2.80
0.005
27.70497
157.3213
d82 |
127.2632
33.14374
3.84
0.000
62.28456
192.2418
d83 |
212.6108
33.32211
6.38
0.000
147.2825
277.9391
d84 |
256.6938
33.45999
7.67
0.000
191.0951
322.2924
d85 |
267.2558
33.59064
7.96
0.000
201.401
333.1105
d86 |
290.4834
33.71481
8.62
0.000
224.3852
356.5816
d87 |
331.9686
33.83779
9.81
0.000
265.6293
398.3079
_cons |
1936.016
24.02197
80.59
0.000
1888.921
1983.112
------------------------------------------------------------------------------
17
---------------------------------------------------------------------------------------------------------
--------------------------------------------------------------------------------------------------------Beispiel 2: Erklärung von Löhnen (III)
Im linearen gepoolten Regressionsmodell zeigen sich mit STATA folgende cluster-robuste IV-Schätzergebnisse (ohne Vorliegen von Instrument-Exogenität):
ivreg logwage (hours=married)union d81 d82 d83 d84 d85 d86 d87, cluster(nr)
Instrumental variables (2SLS) regression
Number of obs
F( 9,
544)
Prob > F
R-squared
Root MSE
=
=
=
=
=
4360
29.45
0.0000
.
.69889
(Std. Err. adjusted for 545 clusters in nr)
-----------------------------------------------------------------------------|
Robust
logwage |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------hours |
.0008299
.0002097
3.96
0.000
.0004179
.0012419
union |
.23559
.0394924
5.97
0.000
.1580138
.3131662
d81 |
.0282952
.041873
0.68
0.499
-.0539573
.1105478
d82 |
.0470283
.0509571
0.92
0.356
-.0530685
.1471251
d83 |
.0129228
.0667894
0.19
0.847
-.118274
.1441196
d84 |
.038818
.078931
0.49
0.623
-.1162289
.193865
d85 |
.0782651
.0810056
0.97
0.334
-.080857
.2373872
d86 |
.1165923
.0865149
1.35
0.178
-.053352
.2865365
d87 |
.1343824
.0950868
1.41
0.158
-.0523999
.3211647
_cons | -.2839519
.4114966
-0.69
0.490
-1.092269
.5243649
-----------------------------------------------------------------------------Instrumented: hours
Instruments:
union d81 d82 d83 d84 d85 d86 d87 married
------------------------------------------------------------------------------
18
---------------------------------------------------------------------------------------------------------
--------------------------------------------------------------------------------------------------------Beispiel 2: Erklärung von Löhnen (IV)
Nun wird die IV-Methode für den Fall von endogen betrachteten erklärenden
Variablen auf lineare Panelmodelle mit unbeobachteter Heterogenität angewendet. Dabei können im Rahmen der IV-Methode z.B. first-differenced, fixed
effects und random effects Schätzungen durchgeführt werden. Die entsprechenden Instrumentalvariablen beziehen sich nun aber nicht mehr auf die ursprünglichen (idiosynkratischen) Störterme, sondern auf die jeweils transformierten Störterme.
Im Rahmen einer fixed effects IV-Schätzung zur Erklärung von logwage wird
erneut married (bzw. die within Transformation von married) als Instrument für
die als endogen betrachtete Variable hours (bzw. die within Transformation von
hours) neben der weiterhin als exogen betrachteten Variablen union (bzw. die
within Transformation von union) und den Dummy-Variablen für die Jahre 1981
bis 1987 einbezogen. Mit STATA haben sich folgende fixed effects IV-Schätzergebnisse der Strukturgleichung sowie konventionellen fixed effects Schätzergebnisse zur Untersuchung der Instrument-Relevanz der within Transformation
von married gezeigt:
--------------------------------------------------------------------------------------------------------19
--------------------------------------------------------------------------------------------------------Beispiel 2: Erklärung von Löhnen (V)
xtivreg logwage (hours=married) union d81 d82 d83 d84 d85 d86 d87, fe
Fixed-effects (within) IV regression
Group variable: nr
Number of obs
Number of groups
=
=
4360
545
R-sq:
Obs per group: min =
avg =
max =
8
8.0
8
within =
.
between = 0.0013
overall = 0.0002
corr(u_i, Xb)
= -0.6302
Wald chi2(9)
Prob > chi2
=
=
9490.25
0.0000
-----------------------------------------------------------------------------logwage |
Coef.
Std. Err.
z
P>|z|
[95% Conf. Interval]
-------------+---------------------------------------------------------------hours |
.0023894
.0023891
1.00
0.317
-.0022932
.0070719
union |
.2003905
.1307263
1.53
0.125
-.0558283
.4566093
d81 | -.1437506
.2719068
-0.53
0.597
-.6766781
.3891768
⋮ |
⋮
⋮
⋮
⋮
⋮
⋮
d87 | -.4966293
.9709756
-0.51
0.609
-2.399707
1.406448
_cons | -3.315743
4.687597
-0.71
0.479
-12.50326
5.871778
-------------+---------------------------------------------------------------sigma_u | .97765837
sigma_e | 1.1223442
rho | .43142759
(fraction of variance due to u_i)
-----------------------------------------------------------------------------F test that all u_i=0:
F(544,3806) =
0.93
Prob > F
= 0.8467
-----------------------------------------------------------------------------Instrumented:
hours
Instruments:
union d81 d82 d83 d84 d85 d86 d87 married
------------------------------------------------------------------------------
20
---------------------------------------------------------------------------------------------------------
--------------------------------------------------------------------------------------------------------Beispiel 2: Erklärung von Löhnen (VI)
xtreg hours married union d81 d82 d83 d84 d85 d86 d87, fe
Fixed-effects (within) regression
Group variable: nr
Number of obs
Number of groups
=
=
4360
545
R-sq:
Obs per group: min =
avg =
max =
8
8.0
8
within = 0.0988
between = 0.0339
overall = 0.0610
corr(u_i, Xb)
= 0.0188
F(9,3806)
Prob > F
=
=
46.34
0.0000
-----------------------------------------------------------------------------hours |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------married |
24.41547
22.10335
1.10
0.269
-18.92009
67.75102
union | -48.97593
23.39144
-2.09
0.036
-94.83689
-3.114962
d81 |
107.6858
25.86334
4.16
0.000
56.97845
158.3931
d82 |
152.5374
26.0436
5.86
0.000
101.4766
203.5981
d83 |
251.3737
26.40911
9.52
0.000
199.5963
303.1511
d84 |
303.168
26.69097
11.36
0.000
250.838
355.4979
d85 |
320.2968
26.95098
11.88
0.000
267.457
373.1366
d86 |
348.9487
27.19795
12.83
0.000
295.6247
402.2727
d87 |
394.9461
27.4543
14.39
0.000
341.1196
448.7727
_cons |
1957.622
19.54105
100.18
0.000
1919.31
1995.933
-------------+---------------------------------------------------------------sigma_u | 378.86952
sigma_e | 425.28933
rho | .44246703
(fraction of variance due to u_i)
-----------------------------------------------------------------------------F test that all u_i=0:
F(544, 3806) =
6.13
Prob > F = 0.0000
21
---------------------------------------------------------------------------------------------------------
--------------------------------------------------------------------------------------------------------Beispiel 2: Erklärung von Löhnen (VII)
Die Instrument-Relevanz kann also bei üblichen Signifikanzniveaus nicht nachgewiesen werden. Die konventionellen fixed effects Schätzergebnisse lauten:
xtreg logwage married hours union d81 d82 d83 d84 d85 d86 d87, fe
Fixed-effects (within) regression
Group variable: nr
Number of obs
Number of groups
=
=
4360
545
R-sq:
Obs per group: min =
avg =
max =
8
8.0
8
within = 0.1857
between = 0.0281
overall = 0.1006
corr(u_i, Xb)
= 0.0097
F(10,3805)
Prob > F
=
=
86.78
0.0000
-----------------------------------------------------------------------------logwage |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------married |
.0612226
.0181875
3.37
0.001
.0255645
.0968807
hours | -.0001182
.0000133
-8.86
0.000
-.0001443
-.000092
union |
.0775818
.0192554
4.03
0.000
.0398299
.1153336
d81 |
.1262751
.0213263
5.92
0.000
.0844629
.1680872
⋮ |
⋮
⋮
⋮
⋮
⋮
⋮
d87 |
.4937113
.0231927
21.29
0.000
.4482398
.5391827
_cons |
1.593058
.030659
51.96
0.000
1.532949
1.653168
-------------+---------------------------------------------------------------sigma_u | .38539792
sigma_e | .34988805
rho | .54818158
(fraction of variance due to u_i)
-----------------------------------------------------------------------------F test that all u_i=0:
F(544, 3805) =
9.39
Prob > F = 0.0000
22
---------------------------------------------------------------------------------------------------------
--------------------------------------------------------------------------------------------------------Beispiel 3: Erklärung der Nachfrage nach Flugreisen (I)
Für die Analyse der Determinanten des Logarithmus der durchschnittlichen
Passagierzahlen (logpassenger) werden Paneldaten für 1149 Flugstrecken für
die Jahre von 1997 bis 2000 betrachtet. Im Hinblick auf fixed effects Schätzungen wird der Logarithmus des durchschnittlichen Flugpreises für eine einfache
Strecke in US-Dollar (logfare) als zeitvariante erklärende Variable betrachtet.
Darüber hinaus werden drei Dummy-Variablen y98, y99 und y00 für die drei
Jahre 1998, 1999 und 2000 einbezogen.
Der Flugpreis kann dabei einerseits von weiteren Faktoren beeinflusst werden
(z.B. exogene Ereignisse im Zielgebiet), die nicht ins Strukturmodell einbezogen werden (können), aber ebenfalls einen Einfluss auf die Nachfrage nach
Flugreisen haben (und deshalb im Störterm vorliegen). Andererseits beeinflussen sich Flugpreis und Flugnachfrage gegenseitig, so dass die Vermutung nahe liegt, dass logfare endogen ist. Deshalb soll logfare durch eine Kennzahl für
die Streckenkonzentration, d.h. durch den Marktanteil der größten Fluggesellschaft (concen) instrumentiert werden.
Bei der konventionellen cluster-robusten fixed effects Schätzung, der konventionellen fixed effects Schätzung zur Untersuchung der Instrument-Relevanz
sowie der fixed effects IV-Schätzung (eine cluster-robuste Schätzung ist hier
23
nicht möglich) haben sich mit STATA folgende Ergebnisse gezeigt:
---------------------------------------------------------------------------------------------------------
--------------------------------------------------------------------------------------------------------Beispiel 3: Erklärung der Nachfrage nach Flugreisen (II)
xtreg logpassenger logfare y98 y99 y00, fe cluster(id)
Fixed-effects (within) regression
Group variable: id
Number of obs
Number of groups
=
=
4596
1149
R-sq:
Obs per group: min =
avg =
max =
4
4.0
4
within = 0.4507
between = 0.0487
overall = 0.0574
corr(u_i, Xb)
= -0.3249
F(4,1148)
Prob > F
=
=
121.85
0.0000
(Std. Err. adjusted for 1149 clusters in id)
-----------------------------------------------------------------------------|
Robust
logpassenger |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------logfare | -1.155039
.1086574
-10.63
0.000
-1.368228
-.9418496
y98 |
.0464889
.0049119
9.46
0.000
.0368516
.0561262
y99 |
.1023612
.0063141
16.21
0.000
.0899727
.1147497
y00 |
.1946548
.0097099
20.05
0.000
.1756036
.213706
_cons |
11.81677
.55126
21.44
0.000
10.73518
12.89836
-------------+---------------------------------------------------------------sigma_u | .89829067
sigma_e | .14295339
rho |
.9753002
(fraction of variance due to u_i)
------------------------------------------------------------------------------
--------------------------------------------------------------------------------------------------------24
--------------------------------------------------------------------------------------------------------Beispiel 3: Erklärung der Nachfrage nach Flugreisen (III)
xtreg logfare concen y98 y99 y00, fe cluster(id)
Fixed-effects (within) regression
Group variable: id
Number of obs
Number of groups
=
=
4596
1149
R-sq:
Obs per group: min =
avg =
max =
4
4.0
4
within = 0.1352
between = 0.0576
overall = 0.0083
corr(u_i, Xb)
= -0.2033
F(4,1148)
Prob > F
=
=
120.06
0.0000
(Std. Err. adjusted for 1149 clusters in id)
-----------------------------------------------------------------------------|
Robust
logfare |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------concen |
.168859
.0494587
3.41
0.001
.0718194
.2658985
y98 |
.0228328
.004163
5.48
0.000
.0146649
.0310007
y99 |
.0363819
.0051275
7.10
0.000
.0263215
.0464422
y00 |
.0977717
.0055054
17.76
0.000
.0869698
.1085735
_cons |
4.953331
.0296765
166.91
0.000
4.895104
5.011557
-------------+---------------------------------------------------------------sigma_u | .43389176
sigma_e | .10651186
rho | .94316439
(fraction of variance due to u_i)
------------------------------------------------------------------------------
--------------------------------------------------------------------------------------------------------25
--------------------------------------------------------------------------------------------------------Beispiel 3: Erklärung der Nachfrage nach Flugreisen (IV)
xtivreg logpassenger (logfare=concen) y98 y99 y00, fe
Fixed-effects (within) IV regression
Group variable: id
Number of obs
Number of groups
=
=
4596
1149
R-sq:
Obs per group: min =
avg =
max =
4
4.0
4
within = 0.2265
between = 0.0487
overall = 0.0574
corr(u_i, Xb)
= 0.0708
Wald chi2(4)
Prob > chi2
=
=
5.78e+06
0.0000
-----------------------------------------------------------------------------logpassenger |
Coef.
Std. Err.
z
P>|z|
[95% Conf. Interval]
-------------+---------------------------------------------------------------logfare | -.3015761
.2774005
-1.09
0.277
-.8452711
.242119
y98 |
.0257147
.0097819
2.63
0.009
.0065426
.0448869
y99 |
.0724166
.0120342
6.02
0.000
.04883
.0960031
y00 |
.1127914
.0275332
4.10
0.000
.0588273
.1667556
_cons |
7.501008
1.402758
5.35
0.000
4.751653
10.25036
-------------+---------------------------------------------------------------sigma_u |
.8493153
sigma_e | .16964171
rho | .96163479
(fraction of variance due to u_i)
-----------------------------------------------------------------------------F test that all u_i=0:
F(1148,3443) =
99.70
Prob > F
= 0.0000
-----------------------------------------------------------------------------Instrumented:
logfare
Instruments:
y98 y99 y00 concen
------------------------------------------------------------------------------
--------------------------------------------------------------------------------------------------------26
3.3 Zweistufige Methode der kleinsten Quadrate
Bisher wurde jeweils eine einzige endogene erklärende Variable xik und eine
einzige Instrumentalvariable zi1 betrachtet. Allerdings liegen manchmal mehrere (valide) Instrumentalvariablen zi1,…, zir vor:
• Wenn alle diese r Instrumente (bei einem linearen Regressionsmodell mit
Querschnittsdaten) keinen Erklärungsgehalt für die abhängige Variable yi
haben sowie zusätzlich exogen sind, also unkorreliert mit dem Fehlerterm εi,
können prinzipiell r verschiedene IV-Schätzungen durchgeführt werden
• Allerdings ist keiner dieser IV-Schätzer effizient
• Die beste IV-Schätzung kann durch die Betrachtung einer Linearkombination der k-1 exogenen erklärenden Variablen und der r Instrumente, die
selbst ein valides Instrument darstellt, abgeleitet werden
Hierzu wird folgende reduzierte Form für xik betrachtet:
x ik = δ0 + δ1x i1 +
+ δ k-1x ik-1 + γ1z i1 +
+ γ r z ir + ν i
Die beste Instrumentalvariable ist nun genau folgende Linearkombination:
x *ik = δ0 + δ1x i1 +
+ δ k-1x ik-1 + γ1z i1 +
+ γ r z ir
Allerdings ist xik* nicht bekannt und kann deshalb nicht als Instrument verwendet werden. Durch eine OLS-Schätzung der Parameter in der obigen reduzierten Form kann aber xik geschätzt und als Instrument für xik verwendet werden.
27
Damit ergeben sich folgende k+1 Momentengleichungen für den IV-Schätzer:
1 n
(y i - βˆ 0 - βˆ 1x i1 
n i=1
- βˆ k x ik ) = 0
1 n
x i1 (y i - βˆ 0 - βˆ 1x i1 
n i=1
1 n
x i,k-1 (y i - βˆ 0 - βˆ 1x i1 
n i=1
1 n
x̂ ik (y i - βˆ 0 - βˆ 1x i1 
n i=1
- βˆ k x ik ) = 0
- βˆ k x ik ) = 0
- βˆ k x ik ) = 0
Die IV-Methode mit der Verwendung von xik als Instrument wird als zweistufige
Methode der kleinsten Quadrate (2SLS) bezeichnet, da die geschätzten Parameter alternativ durch ein zweistufiges Verfahren ermittelt werden können:
• Erste Stufe: OLS-Schätzung in der reduzierten Form, also bei der Regression von xik auf alle k-1 exogenen erklärenden Variablen und r Instrumente
• Zweite Stufe: OLS-Schätzung bei der Regression von yi auf xik und alle exogenen erklärenden Variablen
In der Praxis sollten aber diese zwei Stufen nicht durchgeführt werden, da die
in der zweiten Stufe geschätzten Standardabweichungen nicht korrekt sind. 28
Programmpakete wie z.B. STATA ermöglichen korrekte 2SLS-Schätzungen.
Eigenschaften der 2SLS-Schätzung:
• Da bei der 2SLS-Methode xik anstatt xik einbezogen wird, kann der 2SLSSchätzer durchaus stark vom OLS-Schätzer abweichen
• Falls nur eine Instrumentalvariable zi1 vorliegt, ist der 2SLS-Schätzer identisch mit dem zuvor betrachteten einfachen IV-Schätzer
• Voraussetzung für die Durchführung der 2SLS-Schätzung ist, dass mindestens einer der Parameter γ1,…, γr ungleich null ist, d.h. dass mindestens eine exogene Variable (also ein Instrument) einbezogen wird, die keinen Erklärungsgehalt für yi hat
• Diese Rangbedingung (siehe später) kann auf Basis der OLS-Schätzung in
der reduzierten Form mit einem F-Test zur Überprüfung der Nullhypothese
H0: γ1 =…= γr = 0 gegen die Alternativhypothese, dass mindestens einer der
Parameter γ1,…, γr ungleich null ist, getestet werden
• Falls diese Nullhypothese nicht bei sehr kleinen Signifikanzniveaus verworfen werden kann, sollte keine 2SLS-Schätzung durchgeführt werden, da die
betrachteten Instrumente nicht die Minimalanforderung erfüllen
• Wenn r > 1, ist das zugrundeliegende Strukturmodell überidentifiziert mit r-1
überidentifizierenden Restriktionen (somit ist das Strukturmodell beim zuvor
betrachteten einfachen IV-Schätzer mit r = 1 genau identifiziert)
• Bei der Betrachtung von mehr als einer endogenen erklärenden Variablen,
muss die Anzahl der einbezogenen Instrumente mindestens so groß sein 29
Annahmen für die Betrachtung von asymptotischen Eigenschaften bei 2SLSSchätzern in linearen ökonometrischen Modellen mit einer oder mehreren endogenen erklärenden Variablen:
• Annahme F1: Linearität in den Parametern (hier bei Querschnittsdaten)
yi = β0 + β1xi1 +…+ βkxik + εi
• Annahme F2: Zufallsstichprobe (bei Querschnitts- und Paneldaten)
Es liegt eine Stichprobe vom Umfang n aus der Grundgesamtheit für die abhängige Variable, für die (exogenen und endogenen) erklärenden Variablen
sowie für die Instrumentalvariablen vor
• Annahme F3: Rangbedingung
Es besteht keine exakte lineare Beziehung zwischen den Instrumenten und
die Rangbedingung wird eingehalten, d.h. der Vektor der r Instrumente ist
hinreichend linear verknüpft mit dem Vektor der k erklärenden Variablen, so
dass die Erwartungsmatrix des Produktes der beiden Vektoren den vollen
Spaltenrang besitzt. Eine notwendige Bedingung hierfür ist r ≥ k.
• Annahme F4: Exogene Instrumentalvariablen
Der Fehlerterm εi hat einen Erwartungswert von null und alle Instrumentalvariablen sind mit εi unkorreliert
Unter diesen Annahmen F1 bis F4 sind die 2SLS-Schätzer der Regressionsparameter für n → ∞ konsistent.
30
Weitere Annahmen:
• Annahme F5: Homoskedastizität
Die bedingte Varianz des Fehlerterms unter der Bedingung der Instrumentalvariablen ist konstant
• Annahme F6: Keine Autokorrelation (bei linearen Regressionsmodellen mit
Zeitreihendaten sowie linearen Panelmodellen)
Unter der Bedingung der Instrumentalvariablen sind die Störterme für beliebige Zeitperioden unkorreliert
Unter den sechs Annahmen F1 bis F6 (bei Zeitreihenanalysen muss zusätzlich
für alle Zeitreihen angenommen werden, dass sie schwach abhängig sind) sind
Funktionen des 2SLS-Schätzers asymptotisch normalverteilt. Zudem ist der
2SLS-Schätzer asymptotisch effizient in der Klasse aller IV-Schätzer, die Linearkombinationen der exogenen Variablen als Instrumente verwendet.
Tests auf Endogenität:
• Der 2SLS-Schätzer kann wie jeder IV-Schätzer sehr große geschätzte Varianzen der geschätzten Parameter aufweisen und ist insbesondere weniger
effizient als OLS-Schätzer, wenn die erklärenden Variablen exogen sind
• Aus diesem Grund sind Tests auf Endogenität zur Überprüfung, ob die Anwendung der 2SLS-Methode überhaupt notwendig ist, sicherlich nützlich
31
• Die Nullhypothese dabei ist, dass eine erklärende Variable exogen sind
In STATA sind (mit der Anweisung „estat endogenous“) mehrere Tests auf Basis von 2SLS-Schätzungen implementiert:
• Nach einer 2SLS-Schätzung ohne robuste Schätzung von Standardabweichungen werden ein Durbin Test sowie der Wu-Hausman Test ausgewiesen
• Die Idee beim (Wu-)Hausman Test ist wieder der Vergleich der geschätzten
Parameter bei einem Schätzer (hier der OLS-Schätzer), der unter der Nullhypothese effizient und unter der Alternativhypothese inkonsistent ist, sowie
einem Schätzer (hier der 2SLS-Schätzer), der unter der Null- und Alternativhypothese konsistent, aber unter der Nullhypothese ineffizient ist. Falls sich
die OLS- und 2SLS-Schätzer signifikant unterscheiden, deutet dies auf die
Endogenität der getesteten erklärenden Variablen hin.
• Nach einer 2SLS-Schätzung mit robuster Schätzung von Standardabweichungen werden der robuste Score Test nach Wooldridge sowie ein robuster Regressionstest ausgewiesen, die im Gegensatz zu den obigen Tests
nicht annehmen müssen, dass der Störterm unabhängig identisch verteilt ist
• Bei Regressionstests werden die verdächtigen endogenen erklärenden Variablen auf alle exogenen erklärenden Variablen und die Instrumente regressiert. Auf Basis der OLS-Schätzung werden die Residuen abgeleitet, die
dann als erklärende Variablen neben den anderen erklärenden Variablen in
die Strukturgleichung einbezogen werden. Falls auf Basis dieser OLSSchätzung der Parameter der Residuen signifikant von null verschieden ist,
32
deutet dies auf Endogenität der getesteten erklärenden Variablen hin.
Tests auf überidentifizierende Restriktionen:
• Für die Validität der Instrumentalvariablen in 2SLS-Schätzungen müssen die
Instrumente mit den endogenen erklärenden Variablen korreliert und mit
dem Störterm im Strukturmodell unkorreliert sein
• Falls das Strukturmodell überidentifiziert ist, kann getestet werden, ob die
Instrumente unkorreliert mit dem Störterm sind
• Wenn das Strukturmodell genau identifiziert ist, kann kein entsprechender
Test durchgeführt werden (wenngleich selbst im überidentifizierenden Fall
die Validität von Instrumenten eher auf theoretischen Argumenten sowie
Kenntnissen aus früheren empirischen Untersuchungen beruhen sollte)
• Tests auf überidentifizierende Restriktionen überprüfen letztlich, dass die Instrumente unkorreliert mit dem Störterm im Strukturmodell sind sowie simultan dass das Strukturmodell fehlspezifiziert ist. Falls die Nullhypothese (der
Gültigkeit der einbezogenen Momentenbedingungen) verworfen wird, deutet
dies somit auf invalide Instrumente oder Modellfehlspezifikationen hin.
In STATA sind (mit der Anweisung „estat overid“) mehrere Tests auf Basis von
2SLS-Schätzungen implementiert:
• Nach einer 2SLS-Schätzung ohne robuste Schätzung von Standardabweichungen werden die χ2-Tests nach Sargan sowie Basmann ausgewiesen
• Nach einer 2SLS-Schätzung mit robuster Schätzung von Standardabwei33
chungen wird der robuste Score Test nach Wooldridge ausgewiesen
--------------------------------------------------------------------------------------------------------Beispiel: Erklärung von Löhnen (I)
Wie zuvor werden mit Paneldaten für 545 dauerhaft berufstätige Männer von
1980 bis 1987 die Determinanten des Logarithmus von Löhnen (logwage) untersucht. Dabei werden jetzt folgende erklärende Variablen betrachtet:
• Hispanische Herkunft (hispan)
• Beschäftigungsstatus „operative“ (Arbeiter, Facharbeiter) (occ6)
• Ausbildungszeit in Jahren (educ)
• Familienstand (married)
• Anzahl der Arbeitsstunden im Jahr (hours)
• Gewerkschaftszugehörigkeit (union)
• Dummy-Variablen für die Jahre 1981 bis 1987
Dabei soll educ als verdächtige endogene erklärende Variable durch hispan
und occ6 instrumentiert werden. Zunächst wird eine (cluster-robuste) OLSSchätzung im linearen gepoolten Regressionsmodell durchgeführt. Danach
wird die Instrument-Relevanz von hispan und occ6 als Grundlage für die darauf
folgenden 2SLS-Schätzungen (ohne robuste Schätzungen von Standardabweichungen) überprüft (dabei wird jeweils eine Korrektur der Schätzung der Standardabweichungen für kleine Stichprobenumfänge betrachtet). Schließlich werden Tests auf Endogenität und überidentifizierende Restriktionen durchgeführt.34
---------------------------------------------------------------------------------------------------------
--------------------------------------------------------------------------------------------------------Beispiel: Erklärung von Löhnen (II)
reg logwage hispan occ6 educ married hours union d81 d82 d83 d84 d85 d86 d87,
cluster(nr)
Linear regression
Number of obs
F( 13,
544)
Prob > F
R-squared
Root MSE
=
=
=
=
=
4360
48.16
0.0000
0.1816
.48254
(Std. Err. adjusted for 545 clusters in nr)
-----------------------------------------------------------------------------|
Robust
logwage |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------hispan |
.0382675
.0382403
1.00
0.317
-.0368494
.1133843
occ6 |
.0125775
.0271893
0.46
0.644
-.0408314
.0659864
educ |
.0787436
.0090722
8.68
0.000
.0609229
.0965644
married |
.1484002
.0255352
5.81
0.000
.0982406
.1985598
hours | -.0000696
.000025
-2.78
0.006
-.0001186
-.0000205
union |
.1711894
.0276634
6.19
0.000
.1168492
.2255296
d81 |
.1124035
.0248105
4.53
0.000
.0636673
.1611397
d82 |
.1628128
.0246559
6.60
0.000
.1143803
.2112453
d83 |
.2062007
.0258632
7.97
0.000
.1553968
.2570046
d84 |
.2728061
.0296468
9.20
0.000
.2145697
.3310424
d85 |
.321373
.0284351
11.30
0.000
.265517
.377229
d86 |
.3808025
.0302742
12.58
0.000
.3213337
.4402712
d87 |
.4367857
.0293247
14.89
0.000
.3791822
.4943892
_cons |
.5229031
.1259353
4.15
0.000
.275524
.7702821
------------------------------------------------------------------------------
35
---------------------------------------------------------------------------------------------------------
--------------------------------------------------------------------------------------------------------Beispiel: Erklärung von Löhnen (III)
reg educ hispan occ6 married hours union d81 d82 d83 d84 d85 d86 d87, cluster(nr)
Linear regression
Number of obs =
4360
F( 12,
544) =
3.38
Prob > F
= 0.0001
R-squared
= 0.0602
Root MSE
= 1.6951
(Std. Err. adjusted for 545 clusters in nr)
-----------------------------------------------------------------------------|
Robust
educ |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------hispan | -.9449266
.2165839
-4.36
0.000
-1.37037
-.5194835
occ6 | -.6093683
.1132788
-5.38
0.000
-.8318858
-.3868509
married |
.0647464
.1239926
0.52
0.602
-.1788167
.3083094
hours |
.0000923
.0000894
1.03
0.302
-.0000833
.0002678
union |
.0656635
.104804
0.63
0.531
-.1402066
.2715337
d81 | -.0301252
.0189896
-1.59
0.113
-.0674271
.0071767
⋮ |
⋮
⋮
⋮
⋮
⋮
⋮
d87 | -.1251397
.0631306
-1.98
0.048
-.2491493
-.0011301
_cons |
11.85688
.2049273
57.86
0.000
11.45434
12.25943
-----------------------------------------------------------------------------test hispan occ6
( 1)
( 2)
hispan = 0
occ6 = 0
F(
2,
544) =
Prob > F =
19.23
0.0000
Damit ist die Minimalanforderung für eine 2SLS-Schätzung erfüllt.
36
--------------------------------------------------------------------------------------------------------Beispiel: Erklärung von Löhnen (IV)
Zunächst wird educ lediglich durch occ6 instrumentiert, wodurch bei dieser
2SLS-Schätzung eine einfache IV-Schätzung vorliegt (und die Anweisung
„ivreg …“ zu denselben Schätzergebnissen führt):
ivregress 2sls logwage (educ=occ6) married hours union d81 d82 d83 d84 d85 d86 d87,
small
Instrumental variables (2SLS) regression
Source |
SS
df
MS
-------------+-----------------------------Model | 218.602949
11 19.8729953
Residual | 1017.92667 4348
.23411377
-------------+-----------------------------Total | 1236.52962 4359 .283672774
Number of obs
F( 11, 4348)
Prob > F
R-squared
Adj R-squared
Root MSE
=
=
=
=
=
=
4360
56.85
0.0000
0.1768
0.1747
.48385
-----------------------------------------------------------------------------logwage |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------educ |
.0571581
.028858
1.98
0.048
.0005818
.1137345
married |
.1498293
.0156998
9.54
0.000
.1190498
.1806089
hours | -.0000672
.0000135
-4.97
0.000
-.0000937
-.0000407
union |
.1730137
.0171357
10.10
0.000
.1394191
.2066084
d81 |
.1117219
.0293821
3.80
0.000
.0541179
.1693259
⋮ |
⋮
⋮
⋮
⋮
⋮
⋮
d87 |
.43397
.0304063
14.27
0.000
.3743581
.4935818
_cons |
.7806417
.3386367
2.31
0.021
.1167411
1.444542
-----------------------------------------------------------------------------Instrumented: educ
Instruments:
married hours union d81 d82 d83 d84 d85 d86 d87 occ6
37
---------------------------------------------------------------------------------------------------------
--------------------------------------------------------------------------------------------------------Beispiel: Erklärung von Löhnen (V)
Nun wird educ durch occ6 und hispan instrumentiert:
ivregress 2sls logwage (educ=occ6 hispan) married hours union d81 d82 d83 d84 d85 d86
d87, small
Instrumental variables (2SLS) regression
Source |
SS
df
MS
-------------+-----------------------------Model | 210.284019
11
19.116729
Residual |
1026.2456 4348 .236027048
-------------+-----------------------------Total | 1236.52962 4359 .283672774
Number of obs
F( 11, 4348)
Prob > F
R-squared
Adj R-squared
Root MSE
=
=
=
=
=
=
4360
56.65
0.0000
0.1701
0.1680
.48583
-----------------------------------------------------------------------------logwage |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------educ |
.0449597
.0172642
2.60
0.009
.011113
.0788064
married |
.1506303
.0156896
9.60
0.000
.1198708
.1813899
hours | -.0000667
.0000135
-4.92
0.000
-.0000932
-.0000401
union |
.1726999
.0171951
10.04
0.000
.1389887
.206411
d81 |
.1115804
.0295007
3.78
0.000
.053744
.1694169
⋮ |
⋮
⋮
⋮
⋮
⋮
⋮
d87 |
.4334145
.0305119
14.20
0.000
.3735956
.4932335
_cons |
.9230755
.2044014
4.52
0.000
.5223445
1.323807
-----------------------------------------------------------------------------Instrumented: educ
Instruments:
married hours union d81 d82 d83 d84 d85 d86 d87 occ6 hispan
--------------------------------------------------------------------------------------------------------38
--------------------------------------------------------------------------------------------------------Beispiel: Erklärung von Löhnen (VI)
estat endogenous
Tests of endogeneity
Ho: variables are exogenous
Durbin (score) chi2(1)
Wu-Hausman F(1,4347)
=
=
3.6588
3.65095
(p = 0.0558)
(p = 0.0561)
estat overid
Tests of overidentifying restrictions:
Sargan (score) chi2(1) =
Basmann chi2(1)
=
.275536
.274732
(p = 0.5996)
(p = 0.6002)
Interpretation:
• Die Nullhypothese der Exogenität von educ kann somit auf Basis beider
Tests zwar bei einem 10%-Signifikanzniveau, nicht aber bei einem 5%-Signifikanzniveau zugunsten der Alternativhypothese der Endogenität verworfen werden
• Die Nullhypothese der Gültigkeit der einbezogenen Momentenbedingungen
kann bei üblichen Signifikanzniveaus nicht verworfen werden, so dass es
keinen Hinweis auf invalide Instrumente oder Modellfehlspezifikationen gibt,
wodurch eine Minimalanforderung der 2SLS-Schätzung erfüllt ist
--------------------------------------------------------------------------------------------------------39
3.4 Verallgemeinerte Momentenmethode (GMM)
Ausgangspunkt (bei linearen Panelmodellen):
Mit yi = (yi1,…, yiT)’, xit = (xit1,…, xitk)‘ und xi = (xi1‘,…, xiT‘)‘ werden ausgehend
von einem Beobachtungsbefund (yi, xi) (i = 1,…, n) die unbekannten Parameter
im Vektor θ = (θ1, θ2,…, θm)‘ der bedingten Verteilung von yi, d.h. der bedingten Wahrscheinlichkeits- oder Dichtefunktion fi(yi; xi, θ), gesucht. Im Gegensatz
insbesondere zur Maximum-Likelihood Methode (siehe später) muss dabei die
Verteilung von yi nicht vollständig spezifiziert sein.
Grundlage der Verallgemeinerten Momentenmethode (GMM, Generalized Method of Moments) sind auf den wahren unbekannten Parametervektor θ bezogene Momentenbedingungen. Mit einer (g×1) Funktion mi(yi; xi, θ) und unter
der Einbeziehung einer (l×g) Instrumentenmatrix Ai (mit l ≥ dimθ) gilt dabei:
E  A i m i (y i ; x i , θ) = 0
Die Idee der GMM besteht darin, diese Momentenbedingungen der zugrundeliegenden Verteilung durch die Minimierung der quadratischen Form folgender
l-dimensionaler Stichprobenmomente nachzuahmen:
1 n
A i m i (y i ; x i , θ)

n i=1
40
Somit erhält man den GMM-Schätzer:
'
  1 n

1 n
 
θ̂ = arg min    A i m i (y i ; x i , θ)  Wn   A i m i (y i ; x i , θ)  
θ

 n i=1
 
  n i=1
Dabei stellt Wn eine positiv definite l×l Gewichtungsmatrix dar (die stochastisch
gegen eine Matrix W konvergiert).
Anmerkungen:
• In exakt identifizierten Ansätzen, d.h. wenn die Anzahl der Momentenbedingungen der Anzahl der Parameter entspricht (d.h. für l = dimθ), spielt die
Wahl von Wn keine Rolle. In diesem Fall gelangt man durch das Gleichsetzen der Stichprobenmomente 1/n ni=1 Aimi(yi; xi, θ) mit dem Nullvektor zu
GMM-Schätzern. Man erhält als Spezialfall einfache IV-Schätzer (einschließlich OLS-Schätzer).
• Im allgemeinen Fall von überidentifizierten ökonometrischen Modellen (d.h.
mit l > dimθ) gelangt man mit unterschiedlichen Gewichtungsmatrizen Wn
bzw. unterschiedlichen Instrumentenmatrizen Ai mit diesem Minimierungsansatz zu verschiedenen GMM-Schätzern (einschließlich 2SLS-Schätzern)
• Darüber hinaus spielt bei einem GMM-Schätzer die Ausgestaltung der Funktion mi(yi; xi, θ) eine entscheidende Rolle, die insbesondere von den jeweiligen ökonometrischen Modellen abhängt (z.B. lineare Regressionsmodelle
41
mit Querschnittsdaten, lineare Panelmodelle)
Einstufige und zweistufige GMM-Schätzungen:
• Bei einem einstufigen GMM-Schätzer basiert die Schätzung auf einer anfänglichen Gewichtungsmatrix Wn, die im Minimierungsansatz nicht aktualisiert wird
• Bei einem zweistufigen GMM-Schätzer wird in der ersten Stufe mit einer anfänglichen Gewichtungsmatrix Wn eine GMM-Schätzung durchgeführt. Auf
dieser Basis wird eine neue Gewichtungsmatrix geschätzt, die dann bei der
GMM-Schätzung in der zweiten Stufe verwendet wird.
• Da bei exakt identifizierten Ansätzen die Wahl von Wn keine Rolle spielt,
handelt es sich bei einfachen IV-Schätzern (und damit auch OLS-Schätzern)
um einstufige GMM-Schätzer
• Bei der 2SLS-Schätzung wird im Rahmen des GMM-Ansatzes eine spezifische Gewichtungsmatrix Wn verwendet, so dass es sich auch hierbei um einen einstufigen GMM-Schätzer handelt
Asymptotische Eigenschaften von GMM-Schätzern (unter einer Reihe von
recht allgemeinen Annahmen):
• Konsistenz: plim(θ) = θ
• Asymptotische Normalverteilung für Funktionen von θ:
n(θˆ - θ)
a
N  0; V  bzw.
d
n(θˆ - θ)  N  0; V 
42
Dabei ist V = (G‘WG)-1G‘WPWG(G‘WG)-1, wobei für die (l×dimθ) Matrix G und
die (l×l) Matrix P gilt:
 mi (y i ; x i , θ) 
G = E  Ai

θ'


P = E  A i m i (y i ; x i , θ)mi (y i ; x i , θ)' A i' 
Zur Überprüfung statistischer Hypothesen ist es notwendig, V und damit die
unbekannten Komponenten G und P zu schätzen (eine Schätzung für W ergibt
sich aus dem GMM-Ansatz mit der Gewichtungsmatrix Wn).
Zur asymptotischen Effizienz:
• Die asymptotische Effizienz von GMM-Schätzern hängt von der asymptotischen Varianz-Kovarianzmatrix V und damit von der Gewichtungsmatrix Wn,
von der Funktion mi(yi; xi, θ) sowie von der Instrumentenmatrix Ai ab
• Bei gegebenen mi(yi; xi, θ) und Ai ergibt sich als optimale Gewichtungsmatrix P-1. Daraus folgt V = (G‘P-1 G)-1. Da P-1 unbekannt ist, muss sie in der
ersten Stufe konsistent geschätzt werden. Der Schätzer P-1 kann dann in die
zweite Stufe einbezogen werden, wodurch sich folgender optimaler (zweistufiger) GMM-Schätzer ergibt:
'
n
  1 n

1



-1
θˆ = arg min    Ai mi (y i ; x i , θ)  Pˆ   A i mi (y i ; x i , θ)  
θ

 n i=1
 
  n i=1
43
• Allerdings kann dieser optimale GMM-Schätzer bei endlichen Stichprobenumfängen sehr starke Verzerrungen aufweisen
• (Asymptotische) Effizienzgewinne mit einzelnen Instrumentenmatrizen Ai
(siehe später die Anwendung in dynamischen linearen Panelmodellen) beziehen sich lediglich auf die Klasse der GMM-Schätzer, für die bestimmte
Momentenbedingungen zugrunde liegen. Dies unterscheidet die GMM
grundsätzlich insbesondere von der Maximum-Likelihood Methode (siehe
später).
Zur sinnvollen Einbeziehung von Instrumenten in der Instrumentenmatrix Ai:
• Wie schon bei der Betrachtung von IV-Schätzungen diskutiert muss bei den
verwendeten Instrumenten im GMM-Ansatz Instrument-Exogenität und Instrument-Relevanz vorliegen
• Zudem ist auch beim GMM-Ansatz eine starke Korrelation zwischen einem
Instrument und der instrumentierten Variablen erforderlich, da die Verwendung von schwachen Instrumenten zu höheren geschätzten Standardabweichungen der geschätzten Parameter und damit zu kleineren t-Werten führt.
Zudem können sich dann bei endlichen Stichprobenumfängen sehr starke
Verzerrungen ergeben.
• Zusätzliche Instrumente führen generell zu einer Erhöhung, zumindest aber
nicht zu einer Abnahme der asymptotischen Effizienz, oft aber auch zu star44
ken Verzerrungen bei endlichen Stichprobenumfängen
--------------------------------------------------------------------------------------------------------Beispiel 1: Lineares Regressionsmodell mit Querschnittsdaten (I)
Modellansatz mit zwei erklärenden Variablen und einer Konstanten:
y i = β0 + β1x i1 + β 2 x i2 + ε i für i = 1,..., n
Falls die erklärenden Variablen in xi = (1, xi1, xi2)‘ exogen sind, ergibt sich
E(εi|xi) = 0 bzw. E(xiεi) = 0. Mit dem (3×1) Vektor Ai = xi bzw. dem (1×1) Vektor
mi(yi; xi, θ) = εi und somit Aimi(yi; xi, θ) = (εi, xi1εi, xi2εi)‘ können folgende Momentenbedingungen abgeleitet werden:
E[A i m i (y i ; x i , θ)] = E  x iε i 
 1  


= E  x i1  ε i  = 0 bzw.
 x i2  
(y i - β0 - β1x i1 - β 2 x i2 ) 
E  x i1 (y i - β0 - β1x i1 - β2 x i2 )  = 0


 x i2 (y i - β0 - β1x i1 - β 2 x i2 ) 
Da in diesem exakt identifizierten Ansatz die Anzahl der Momentenbedingungen (l = 3) der Anzahl der Parameter β0, β1 und β2 entspricht, kann man durch
das Gleichsetzen der Stichprobenmomente 1/n ni=1 Aimi(yi; xi, θ) = 1/n ni=1 xiεi
45
mit dem Nullvektor einen GMM-Schätzer ableiten.
---------------------------------------------------------------------------------------------------------
--------------------------------------------------------------------------------------------------------Beispiel 1: Lineares Regressionsmodell mit Querschnittsdaten (II)
Damit ergibt sich (der Faktor 1/n kann bei der Lösung der Gleichungen nach
den drei Parametern wieder vernachlässigt werden):
n
 (y - βˆ - βˆ x
i
0
1 i1
- βˆ 2 x i2 ) = 0
i=1
n
x
i1
(y i - βˆ 0 - βˆ 1x i1 - βˆ 2 x i2 ) = 0
i2
(y i - βˆ 0 - βˆ 1x i1 - βˆ 2 x i2 ) = 0
i=1
n
x
i=1
Damit zeigen sich hier erneut die Bedingungen erster Ordnung bei der OLSMethode. Der spezifische GMM-Schätzer (bzw. einfache Momentenschätzer),
der diese Momentenbedingungen erfüllt, ist also identisch mit dem entsprechenden OLS-Schätzer. Dies verdeutlicht, dass die OLS-Methode nicht nur ein
Spezialfall der einfachen Momentenmethode, sondern eben auch der GMM ist.
Bei anderen Momentenbedingungen in diesem linearen Regressionsmodell mit
Querschnittsdaten würden sich GMM-Schätzer ergeben, die vom OLS-Schätzer abweichen.
46
---------------------------------------------------------------------------------------------------------
--------------------------------------------------------------------------------------------------------Beispiel 2: Lineares Panelmodell ohne unbeobachtete Heterogenität (I)
Modellansatz mit zwei erklärenden Variablen und einer Konstanten:
yit = β0 + β1x it1 + β2x it2 + εit für i = 1,..., n; t = 1,..., T
Dabei ergeben sich mit dem (T×1) Vektor mi(yi; xi, θ) = εi = (εi1, εi2,…, εiT)‘ folgende Momentenbedingungen:
E  A i m i (y i ; x i , θ) = E  A iε i  = 0
Falls die erklärenden Variablen in xit = (1, xit1, xit2)‘ kontemporär exogen sind mit
E(εit|xit) = 0 bzw. E(xitεit) = 0, kann für die Instrumentenmatrix Ai die (3×T) Matrix Xi der erklärenden Variablen eingesetzt werden:
 1 1
A i = X i =  x i11 x i21

 x i12 x i22
1 
x iT1 

x iT2 
Daraus folgt:
E  X iε i 
ε i1 + ε i2 + + ε iT


= E  x i11ε i1 + x i21ε i2 + + x iT1ε iT  = 0


 x i12ε i1 + x i22ε i2 + + x iT2ε iT 
47
---------------------------------------------------------------------------------------------------------
--------------------------------------------------------------------------------------------------------Beispiel 2: Lineares Panelmodell ohne unbeobachtete Heterogenität (II)
Auch in diesem exakt identifizierten Ansatz entspricht die Anzahl der Momentenbedingungen (l = 3) der Anzahl der zu schätzenden Regressionsparameter
β0, β1 und β2, so dass man durch das Gleichsetzen der Stichprobenmomente
1/n ni=1 Xiεi mit dem Nullvektor einen GMM-Schätzer ableiten kann. Damit ergibt sich:
n
 (y
i1
i=1
n
  x
- βˆ 0 - βˆ 1x i11 - βˆ 2 x i12 ) +
+ (y iT - βˆ 0 - βˆ 1x iT1 - βˆ 2 x iT2 )  = 0
i11
(y i1 - βˆ 0 - βˆ 1x i11 - βˆ 2 x i12 ) +
+ x iT1 (y iT - βˆ 0 - βˆ 1x iT1 - βˆ 2 x iT2 )  = 0
i12
(y i1 - βˆ 0 - βˆ 1x i11 - βˆ 2 x i12 ) +
+ x iT2 (y iT - βˆ 0 - βˆ 1x iT1 - βˆ 2 x iT2 )  = 0
i=1
n
  x
i=1
Genauso wie im Fall des linearen Regressionsmodells mit Querschnittsdaten
ergeben sich hier dieselben Bedingungen erster Ordnung wie bei der OLS-Methode. Somit liegt hier eine OLS-Schätzung im linearen gepoolten Regressionsmodell vor. Der spezifische GMM-Schätzer (bzw. einfache Momentenschätzer), der diese Momentenbedingungen erfüllt, ist also identisch mit dem
entsprechenden OLS-Schätzer.
48
---------------------------------------------------------------------------------------------------------
--------------------------------------------------------------------------------------------------------Beispiel 2: Lineares Panelmodell ohne unbeobachtete Heterogenität (III)
Für den Fall, dass (valide) Instrumente in zit = (1, zit1, zit2)‘ kontemporär exogen
sind mit E(zitεit) = 0, kann eine (3×T) Instrumentenmatrix Ai betrachtet werden,
die nicht der Matrix Xi der erklärenden Variablen entspricht:
 1 1
A i =  z i11 z i21

 z i12 z i22
1 
z iT1 

z iT2 
Da auch hier l = 3, kann erneut durch das Gleichsetzen von 1/n ni=1 Aiεi mit
dem Nullvektor ein GMM-Schätzer abgeleitet werden. Man gelangt in diesem
speziellen Fall zu einem einfachen IV-Schätzer.
Allerdings lassen sich auch viele überidentifizierte Ansätze mit l > 3 ableiten.
Bei der Einbeziehung eines zusätzlichen Instruments in zit = (1, zit1, zit2, zit3)‘ mit
E(zitεit) = 0 ergibt sich die (4×T) Instrumentenmatrix Ai:
 1
z
i11
Ai = 
 z i12

 z i13
1
z i21
z i22
z i23
1 
z iT1 

z iT2 

z iT3 
49
---------------------------------------------------------------------------------------------------------
--------------------------------------------------------------------------------------------------------Beispiel 2: Lineares Panelmodell ohne unbeobachtete Heterogenität (IV)
Durch eine komplette Ausnutzung von kontemporär exogenen Instrumenten in
zit = (1, zit1, zit2)‘ mit E(zitεit) = 0 kann die Anzahl der Momentenbedingungen in
Panelmodellen weiter erhöht werden. Im maximalen Fall ergibt sich folgende
(3T×T) Instrumentenmatrix Ai:
1
z
 i11
 z i12

0
0

Ai =  0
0


0

0
0

0 0
0 0
0 0
1 0
z i21 0
z i22 0
0
0
0
0
0
0
0
0
0 
0 

0 

0 
0 

0 
0 


1 

z iT1 
z iT2 
50
---------------------------------------------------------------------------------------------------------
--------------------------------------------------------------------------------------------------------Beispiel 3: Erklärung von Löhnen (I)
Für die Analyse der Determinanten von logwage werden wieder die Paneldaten
für 545 dauerhaft berufstätige Männer von 1980 bis 1987 betrachtet. Es werden erneut hispan, occ6, educ, married, hours und union zusammen mit den
Dummy-Variablen für 1981 bis 1987 (d81,…, d87) als erklärende Variablen einbezogen. Dabei sollen zunächst folgende bereits zuvor betrachteten Schätzungen mit GMM-Schätzungen repliziert werden:
• Cluster-robuste OLS-Schätzung im linearen gepoolten Regressionsmodell
(bei der OLS-Schätzung in STATA wird standardmäßig eine Korrektur der
Schätzung der Standardabweichungen für kleine Stichprobenumfänge einbezogen, nicht aber bei der GMM-Schätzung)
• Einfache IV-Schätzung, bei der educ durch occ6 instrumentiert und hispan
nicht als erklärende Variable einbezogen werden
• 2SLS-Schätzung, bei der educ durch occ6 und hispan instrumentiert wird
Bei der GMM-Schätzung mit STATA werden ohne zusätzliche Anweisungen
standardmäßig heteroskedastizitäts-robuste Schätzungen der Standardabweichungen sowie zweistufige Ansätze ausgewiesen, die bei exakt identifizierten
Ansätzen wie z.B. der OLS-Schätzung zu denselben Ergebnissen führen wie
bei einstufigen GMM-Schätzungen (STATA-Anweisung „…, onestep“). Es ha51
ben sich dabei folgende Schätzergebnisse gezeigt:
---------------------------------------------------------------------------------------------------------
--------------------------------------------------------------------------------------------------------Beispiel 3: Erklärung von Löhnen (II)
gmm (logwage-{hispan}*hispan-{occ6}*occ6-{educ}*educ-{married}*married-{hours}*hours{union}*union-{d81}*d81-{d82}*d82-{d83}*d83-{d84}*d84-{d85}*d85-{d86}*d86-{d87}*d87{const}), instruments(hispan occ6 educ married hours union d81 d82 d83 d84 d85 d86 d87)
vce(cluster nr)
GMM estimation
Number of parameters = 14
Number of moments
= 14
Initial weight matrix: Unadjusted
Number of obs
=
4360
(Std. Err. adjusted for 545 clusters in nr)
-----------------------------------------------------------------------------|
Robust
|
Coef.
Std. Err.
z
P>|z|
[95% Conf. Interval]
-------------+---------------------------------------------------------------/hispan |
.0382675
.0381482
1.00
0.316
-.0365017
.1130366
/occ6 |
.0125775
.0271238
0.46
0.643
-.0405842
.0657392
/educ |
.0787436
.0090503
8.70
0.000
.0610053
.0964819
/married |
.1484002
.0254737
5.83
0.000
.0984727
.1983277
/hours | -.0000696
.0000249
-2.79
0.005
-.0001184
-.0000207
/union |
.1711894
.0275968
6.20
0.000
.1171007
.2252781
/d81 |
.1124035
.0247508
4.54
0.000
.0638929
.1609141
⋮ |
⋮
⋮
⋮
⋮
⋮
⋮
/d87 |
.4367857
.0292541
14.93
0.000
.3794488
.4941226
/const |
.5229031
.125632
4.16
0.000
.2766689
.7691372
-----------------------------------------------------------------------------Instruments for equation 1: hispan occ6 educ married hours union d81 d82 d83 d84 d85
d86 d87 _cons
--------------------------------------------------------------------------------------------------------52
--------------------------------------------------------------------------------------------------------Beispiel 3: Erklärung von Löhnen (III)
gmm (logwage-{educ}*educ-{married}*married-{hours}*hours-{union}*union-{d81}*d81{d82}*d82-{d83}*d83-{d84}*d84-{d85}*d85-{d86}*d86-{d87}*d87-{const}), instruments(occ6
married hours union d81 d82 d83 d84 d85 d86 d87) vce(unadjusted)
GMM estimation
Number of parameters = 12
Number of moments
= 12
Initial weight matrix: Unadjusted
GMM weight matrix:
Unadjusted
Number of obs
=
4360
-----------------------------------------------------------------------------|
Coef.
Std. Err.
z
P>|z|
[95% Conf. Interval]
-------------+---------------------------------------------------------------/educ |
.0571581
.0288182
1.98
0.047
.0006754
.1136408
/married |
.1498293
.0156782
9.56
0.000
.1191007
.180558
/hours | -.0000672
.0000135
-4.98
0.000
-.0000937
-.0000407
/union |
.1730137
.0171121
10.11
0.000
.1394747
.2065528
/d81 |
.1117219
.0293417
3.81
0.000
.0542132
.1692305
⋮ |
⋮
⋮
⋮
⋮
⋮
⋮
/d87 |
.43397
.0303644
14.29
0.000
.3744567
.4934832
/const |
.7806417
.3381704
2.31
0.021
.1178399
1.443443
-----------------------------------------------------------------------------Instruments for equation 1: occ6 married hours union d81 d82 d83 d84 d85 d86 d87 _cons
→ Die alternative STATA-Anweisung für die einfache IV-Schätzung lautet:
„ivregress 2sls logwage (educ=occ6) married hours union d81 d82 d83 d84
d85 d86 d87”
53
---------------------------------------------------------------------------------------------------------
--------------------------------------------------------------------------------------------------------Beispiel 3: Erklärung von Löhnen (IV)
gmm (logwage-{educ}*educ-{married}*married-{hours}*hours-{union}*union-{d81}*d81{d82}*d82-{d83}*d83-{d84}*d84-{d85}*d85-{d86}*d86-{d87}*d87-{const}), instruments(occ6
hispan married hours union d81 d82 d83 d84 d85 d86 d87) vce(unadjusted)
GMM estimation
Number of parameters = 12
Number of moments
= 13
Initial weight matrix: Unadjusted
GMM weight matrix:
Unadjusted
Number of obs
=
4360
-----------------------------------------------------------------------------|
Coef.
Std. Err.
z
P>|z|
[95% Conf. Interval]
-------------+---------------------------------------------------------------/educ |
.0449597
.0172405
2.61
0.009
.011169
.0787504
/married |
.1506303
.015668
9.61
0.000
.1199217
.181339
/hours | -.0000667
.0000135
-4.93
0.000
-.0000932
-.0000402
/union |
.1726999
.0171714
10.06
0.000
.1390445
.2063553
/d81 |
.1115804
.0294601
3.79
0.000
.0538397
.1693212
⋮ |
⋮
⋮
⋮
⋮
⋮
⋮
/d87 |
.4334145
.0304699
14.22
0.000
.3736946
.4931345
/const |
.9230755
.20412
4.52
0.000
.5230078
1.323143
-----------------------------------------------------------------------------Instruments for equation 1: occ6 hispan married hours union d81 d82 d83 d84 d85 d86 d87
_cons
→ Die alternative STATA-Anweisung für die 2SLS-Schätzung lautet: „ivregress
2sls logwage (educ=occ6 hispan) married hours union d81 d82 d83 d84 d85
d86 d87”
54
---------------------------------------------------------------------------------------------------------
--------------------------------------------------------------------------------------------------------Beispiel 3: Erklärung von Löhnen (V)
Alternative STATA-Anweisungen:
• Bei beiden GMM-Schätzungen führt die zusätzliche Einbeziehung der Anweisung „onestep“ zu denselben Ergebnissen, d.h. die einstufige und zweistufige GMM-Schätzung mit der hier implizit einbezogenen Gewichtungsmatrix, die unabhängig identisch verteilte Störterme annimmt, ist identisch
• Auch die zusätzliche Anweisung „wmatrix(unadjusted)“ führt zu denselben
Schätzergebnissen. wmatrix(…)“ spezifiziert die Gewichtungsmatrix auf der
zweiten Stufe einer zweistufigen GMM-Schätzung. „wmatrix(unadjusted)“
unterstellt homoskedastische Störterme, wohingegen „wmatrix(robust)“ und
„wmatrix(cluster nr)“ heteroskedastizitäts- und cluster-robuste Gewichtungsmatrizen einbeziehen.
• Bei einer allgemeinen zweistufigen GMM-Schätzung werden standardmäßig
heteroskedastizitäts-robuste Gewichtungsmatrizen und heteroskedastizitätsrobuste Schätzungen der Standardabweichungen einbezogen
Im Folgenden wird eine zweistufige GMM-Schätzung mit cluster-robusten Gewichtungsmatrizen und Schätzungen der Standardabweichungen betrachtet.
Mit STATA haben sich folgende Schätzergebnisse gezeigt:
---------------------------------------------------------------------------------------------------------
55
--------------------------------------------------------------------------------------------------------Beispiel 3: Erklärung von Löhnen (VI)
gmm (logwage-{educ}*educ-{married}*married-{hours}*hours-{union}*union-{d81}*d81-{d82}*
d82-{d83}*d83-{d84}*d84-{d85}*d85-{d86}*d86-{d87}*d87-{const}), instruments(occ6 hispan
married hours union d81 d82 d83 d84 d85 d86 d87) vce(cluster nr) wmatrix(cluster nr)
GMM estimation
Number of parameters = 12
Number of moments
= 13
Initial weight matrix: Unadjusted
GMM weight matrix:
Cluster (nr)
Number of obs
=
4360
(Std. Err. adjusted for 545 clusters in nr)
-----------------------------------------------------------------------------|
Robust
|
Coef.
Std. Err.
z
P>|z|
[95% Conf. Interval]
-------------+---------------------------------------------------------------/educ |
.0469644
.0288653
1.63
0.104
-.0096104
.1035393
/married |
.1505866
.0260713
5.78
0.000
.0994879
.2016853
/hours | -.0000665
.0000253
-2.63
0.009
-.000116
-.000017
/union |
.1729321
.0279348
6.19
0.000
.1181809
.2276832
/d81 |
.1117559
.0248297
4.50
0.000
.0630905
.1604213
⋮ |
⋮
⋮
⋮
⋮
⋮
⋮
/d87 |
.4331002
.0295921
14.64
0.000
.3751008
.4910995
/const |
.899418
.3352741
2.68
0.007
.2422928
1.556543
-----------------------------------------------------------------------------Instruments for equation 1: occ6 hispan married hours union d81 d82 d83 d84 d85 d86 d87
_cons
→ Alternative STATA-Anweisung: „ivregress gmm logwage (educ=occ6 hispan)
married hours union d81 d82 d83 d84 d85 d86 d87, cluster(nr)”
56
---------------------------------------------------------------------------------------------------------
--------------------------------------------------------------------------------------------------------Beispiel 3: Erklärung von Löhnen (VII)
Auch nach zweistufigen GMM-Schätzungen können mit der STATA-Anweisung
„estat overid“ Tests auf überidentifizierende Restriktionen durchgeführt werden.
In diesem Fall wird der Sargan, Hansen oder Hansen-Sargan Test durchgeführt. Er basiert auf der Zielfunktion des optimalen GMM-Schätzers. Bei Gültigkeit der Momentenbedingungen E[Aimi(yi; xi, θ)] = 0 und damit der Validität der
Instrumente ist die Prüfgröße χ2-verteilt mit l-dimθ Freiheitsgraden (dies entspricht der Anzahl der überidentifizierenden Restriktionen). Hohe Werte der
Prüfgröße sprechen gegen die Nullhypothese der Gültigkeit der Momentenbedingungen. Die Nullhypothese wird bei einem Signifikanzniveau von α verworfen, falls die Prüfgröße größer ist als χ2l-dimθ;1-α.
Nach der vorherigen zweistufigen GMM-Schätzung zeigen sich mit STATA folgende Testergebnisse:
estat overid
Test of overidentifying restriction:
Hansen's J chi2(1) = .105451 (p = 0.7454)
Die Nullhypothese kann also bei üblichen Signifikanzniveaus nicht verworfen
werden, wodurch eine Minimalanforderung der (zweistufigen) GMM-Schätzung
erfüllt ist.
57
---------------------------------------------------------------------------------------------------------
3.5 Arellano/Bond Schätzung
Ausgangspunkt sind die ersten Differenzen in allgemeinen dynamischen linearen Panelmodellen, d.h. (für i = 1,…, n; t = p+1,…, T):
Δyit = γ1Δy i,t-1 +
+ γ pΔy i,t-p + β'Δx it + Δv it
Wie bereits diskutiert, ist ∆yi,t-1 = yi,t-1 - yi,t-2 zwangsläufig mit ∆vit = vit - vi,t-1 korreliert, so dass eine OLS-Schätzung inkonsistent ist. Mit der Annahme, dass
(die idiosynkratischen Fehler) vit nicht autokorreliert sind, können aber konsistente IV-Schätzungen (bzw. allgemein 2SLS-Schätzungen) abgeleitet werden.
Dabei schlagen Anderson und Hsiao (1981) yi,t-2 oder aber ∆yi,t-2 als Instrumente für ∆yi,t-1 vor, da diese nicht mit ∆vit, aber mit ∆yi,t-1 korreliert sind. Mit der Betrachtung von yi,t-2 als Instrument für ∆yi,t-1 sind mindestens drei Zeitperioden
notwendig. Falls allerdings mehr als drei Zeitperioden im Paneldatensatz vorliegen, sind zusätzliche Instrumente verfügbar:
• Für t = 3 ist yi1 das einzig verfügbare Instrument im first-differenced Modell
• Für t = 4 können yi1 und yi2 als Instrumente verwendet werden
• Für t = T können yi1, yi2,…, yi,T-2 als Instrumente eingesetzt werden
Die darauf aufbauenden IV- bzw. 2SLS-Schätzer sind zwar konsistent, aber
nicht notwendigerweise asymptotisch effizient, da nicht alle verfügbaren Momentenbedingungen verwendet werden. Daher sind günstigere Schätzungen
mit dem GMM-Ansatz anwendbar.
58
Betrachtet wird ein AR(1) Modell unter Einbeziehung von erklärenden Variablen
in xit entsprechend Arellano und Bond (1991), das implizit auch unbeobachtete
Heterogenität einbezieht:
Δyit = γΔyi,t-1 + β'x it + Δv it für i = 1,..., n; t = 3,..., T
Mit der (T-2)-dimensionalen Funktion mi(yi; xi, θ) = ∆vi = (∆vi3, ∆vi4,…, ∆viT )‘ ergeben sich folgende Momentenbedingungen:
E  A iΔv i  = 0 für i = 1,..., n
Dabei kann eine (l×[T-2]) Instrumentenmatrix Ai mit ausschließlich verzögerten
abhängigen Variablen als Instrumente betrachtet werden. Nach Transponierung ergibt sich dabei für die ([T-2]×l) Matrix Ai‘:
 y i1

0
Ai' =  0


0

0 0 0 0 0 0
0
y i1 y i2 0 0 0 0
0
0 0 y i1 y i2 y i3 0
0
0 0 0 0 0 0
y i1 y i2 y i3
0 

0 
0 


y i,T-2 
Dabei gilt in diesem Fall der maximalen Einbeziehung aller möglichen Instrumente für deren Anzahl l = 1 + 2 + 3 + ⋯ + T-2 = ½(T-2)(T-1), so dass dann
z.B. l = 6 für T = 5 oder l = 36 für T = 10. Die (l×[T-2]) Instrumentenmatrix Ai hat
59
folgendes Aussehen:
 y i1 0
0 y
i1

 0 y i2

0 0
0 0

0 0
Ai =  0 0


0 0

0 0

0 0
0 0

 0 0
0
0
0
y i1
y i2
y i3
0
0
0
0
0
0

0 
0 

0 
0 

0 
0 


y i1 

y i2 

y i3 


y i,T-2 
0
Zusätzlich zu diesen verzögerten abhängigen Variablen als Instrumente können auch externe Instrumente sowie strikt exogene und prädeterminierte erklärende Variablen als Instrumente einbezogen werden.
60
Typen von erklärenden Variablen:
• Eine kontemporär endogene erklärende Variable xith ist mit vit in der gleichen
Periode sowie vorherigen Perioden, nicht aber in zukünftigen Perioden korreliert, d.h. E(xithvis) ≠ 0 für s ≤ t und E(xithvis) = 0 für s > t. Solche Variablen
werden genauso behandelt wie verzögerte abhängige Variablen. Mögliche
Instrumente für xith sind xi,t-2,h, xi,t-3,h,…, nicht aber xi,t-1,h.
• Eine prädeterminierte (oder schwach exogene) erklärende Variable xith ist
mit vit in vorherigen Perioden, nicht aber derselben oder in zukünftigen Perioden korreliert, d.h. E(xithvis) ≠ 0 für s < t und E(xithvis) = 0 für s ≥ t. Mögliche
Instrumente für xith sind hier xi,t-1,h ,xi,t-2,h, xi,t-3,h usw.
• Strikt exogene erklärende Variablen xith sind mit vit in allen Perioden unkorreliert, so dass alle xi1h,…, xiTh als Instrumente verwendet werden können
Falls eine prädeterminierte erklärende Variable xith einbezogen wird, ergibt sich
für die transponierte Instrumentenmatrix:
 y i1 x i1h x i2h 0 0 0 0 0 0
0 0 0 y y x x x 0
i1
i2
i1h
i2h
i3h
Ai' = 


0 0 0 0 0 0 0 0 0
y i1 y i2
y i,T-2 x i1h x i2h
0 
0 



x i,T-1,h 
Mit m als Anzahl der prädeterminierten erklärenden Variablen ergeben sich hier
61
2
maximal m/2(T -T-2) zusätzliche Instrumente (z.B. 18 mit m = 2 und T = 5).
Falls eine strikt exogene erklärende Variable xith einbezogen wird, ergibt sich
für die transponierte Instrumentenmatrix:
 y i1 x i1h x i2h
0 0 0
Ai' = 


0 0 0
x iTh 0
0
0
0 y i1 y i2 x i1h x i2h
x iTh
0
0
0
0
0
0
0
0
0
0
y i1 y i2
y i,T-2 x i1h x i2h
x iTh
Wenn m die Anzahl der strikt exogenen erklärenden Variablen ist, ergeben sich
maximal m∙T(T-2) zusätzliche Instrumente (z.B. mit m = 2 und T = 5 also 30).
Anmerkungen:
• Die Einbeziehung von kontemporär endogenen, prädeterminierten und strikt
exogenen erklärenden Variablen kann auch gemischt werden. Zudem können zusätzliche Instrumente einbezogen werden.
• Bei allgemeinen dynamischen linearen Panelmodellen mit p > 1 lags für die
abhängige Variable als erklärende Variablen ist zu beachten, dass lediglich
T-p-1 Perioden einbezogen werden können (z.B. können mit p = 2 bei der
Einbeziehung des ersten und zweiten lags der abhängigen Variablen lediglich die Perioden t = 4,…, T betrachtet werden) mit entsprechend weniger
möglichen Instrumenten
62






Falls nun eine spezifische Instrumentenmatrix Ai sowie mi(yi; xi, θ) = ∆vi einbezogen werden, ergibt sich folgender GMM- bzw. Arellano/Bond Schätzer:
'
  1 n

1 n
 
θ̂ = arg min    A iΔv i  Wn   A iΔv i  
θ

 n i=1
 
  n i=1
Bei der Gewichtungsmatrix kann folgender Ansatz betrachtet werden:
1

Wn1 =   (A i HA i' ) 
 n i=1

n
-1
Dabei ist H im Falle von AR(1) Modellen eine ([T-2]×[T-2]) Matrix mit den Zahlen 2 auf der Hauptdiagonale, -1 auf den ersten Diagonalen außerhalb der
Hauptdiagonale und 0 sonst. Die Verwendung von Wn1 führt zu einem einstufigen GMM-Schätzer, wobei Wn1 nicht von geschätzten Parametern abhängt und
deshalb leichter abzuleiten ist. Wie zuvor diskutiert, kann jedoch (bei den vorliegenden Momentenbedingungen) auch ein optimaler zweistufiger GMMSchätzer mit folgender Gewichtungsmatrix abgeleitet werden:


'
1 n

2
Wn =   A i Δv i Δv i A i' 
 n i=1

-1
Dieser Schätzer erfordert eine konsistente Parameterschätzung in der ersten
Stufe zur konsistenten Schätzung ∆vi von ∆vi. In der zweiten Stufe wird dann
die entsprechende GMM-Schätzung durchgeführt. Dabei ist der einstufige
63
GMM-Schätzer mit Wn1 ein Kandidat für die erste Stufe im zweistufigen Ansatz.
Die bisher betrachteten Momentenbedingungen bei AR(1) Modellen mit ausschließlich verzögerten abhängigen Variablen als Instrumente bestehen aus
der (l×1) Funktion Ai∆vi mit folgenden Komponenten (i = 1,…, n):
E  y i1Δv i3  = 0,
E  y i1Δv i4  = 0, E  y i2Δv i4  = 0,
E  y i1Δv i5  = 0, E  y i2Δv i5  = 0, E  y i3Δv i5  = 0,
E  y i1Δv iT  = 0, E  y i2Δv iT  = 0,
,
, E  y i,T-2Δv iT  = 0
Zusammengefasst basiert der Arellano/Bond Schätzer damit auf der Annahme:
E  y isΔv it  = 0 für s  T-2
Im Hinblick auf GMM-Schätzer mit besseren Eigenschaften in endlichen Stichprobenumfängen haben verschiedene Studien zusätzliche Momentenbedingungen entwickelt. Arellano und Bover (1995) betrachten dabei neben den obigen Annahmen zusätzlich folgende Momentenbedingungen:
E Δy i,t-1v it  = 0
Damit können in der entsprechenden Arellano/Bover Schätzung zusätzlich die
Differenzen ∆yi,t-1 als Instrumente eingesetzt werden (für die Levels, da sich die
Momentenbedingungen auf die vit und nicht auf die ∆vit beziehen, so dass sich
dadurch auch die Anzahl der betrachteten Perioden um eins erhöhen lässt).
64
Sargan Test:
Bei den Arellano/Bond Ansätzen für allgemeine dynamische lineare Panelmodelle kann eine sehr hohe Anzahl an Instrumenten einbezogen werden, so
dass sich gerade hier Tests auf überidentifizierende Restriktionen anbieten. Mit
l ≥ dimθ ergeben sich l-dimθ überidentifizierende Restriktionen. Die Prüfgröße
des Sargan Tests auf Basis der Zielfunktion des optimalen GMM-Schätzers
lautet hier:


-1
n
n
'
'
 n

'
'  
SG =   Δv i A i    A i Δv i Δv i A i    A i Δv i 
 i=1
  i=1
  i=1

Bei Gültigkeit der Nullhypothese ist die Prüfgröße SG χ2-verteilt mit l-dimθ Freiheitsgraden, so dass sie bei einem Signifikanzniveau von α verworfen wird,
falls SG > χ2l-dimθ;1-α.
Autokorrelationstest nach Arellano/Bond:
Die konsistente GMM-Schätzung erfordert, dass die vit nicht autokorreliert sind.
In diesem Fall ist ∆vit zwar mit ∆vi,t-1, nicht aber mit ∆vi,t-2, ∆vi,t-3,… korreliert. Ein
entsprechender Test basiert auf der Betrachtung der Korrelation der Schätzer
∆vit von ∆vit. Falls die Nullhypothese, dass ∆vit nicht mit ∆vi,t-2, ∆vi,t-3,… korreliert
ist und damit keine Autokorrelation in vit vorliegt, verworfen wird, sollte das Modell anders spezifiziert werden, z.B. durch Einbeziehung von zusätzlichen um
mehrere Perioden verzögerten abhängigen Variablen als erklärende Variablen.65
--------------------------------------------------------------------------------------------------------Beispiel: Erklärung von Löhnen (I)
Für die Analyse der Determinanten von logwage werden erneut die Paneldaten
für 545 dauerhaft berufstätige Männer von 1980 bis 1987 betrachtet. Es werden wieder die zeitvarianten erklärenden Variablen married, hours und union
zusammen mit Dummy-Variablen für einzelne Jahre einbezogen. Darüber hinaus wird jetzt aber in einem dynamischen AR(1) Ansatz auch der um ein Jahr
verzögerte Wert von logwage als erklärende Variable betrachtet.
In einem ersten Schritt soll aber zunächst ein reines AR(1) Modell ohne zusätzliche Einbeziehung der anderen erklärenden Variablen untersucht werden. Dabei werden folgende Schätzungen durchgeführt:
• Einstufige Arellano/Bond Schätzung mit maximaler Instrumentenzahl
• Zweistufige Arellano/Bond Schätzung mit verminderter Instrumentenzahl
• Zweistufige Arellano/Bover Schätzung mit verminderter Instrumentenzahl
Die Standardabweichungen der geschätzten Parameter werden jeweils robust
geschätzt. Nach einer einstufigen Arellano/Bond Schätzung wird dabei mit
STATA eine Korrektur nach Arellano/Bond einbezogen, wohingegen nach einer
zweistufigen Schätzung die Korrektur nach Windmeijer (2005) verwendet wird,
die die generell starken Verzerrungen bei zweistufigen Schätzungen eindämmen soll. Mit STATA haben sich dabei folgende Schätzergebnisse gezeigt:
66
---------------------------------------------------------------------------------------------------------
--------------------------------------------------------------------------------------------------------Beispiel: Erklärung von Löhnen (II)
xtabond logwage, vce(robust)
Arellano-Bond dynamic panel-data estimation
Group variable: nr
Time variable: year
Number of obs
Number of groups
Obs per group:
Number of instruments =
22
Wald chi2(1)
Prob > chi2
=
=
3270
545
min =
avg =
max =
6
6
6
=
=
41.65
0.0000
One-step results
(Std. Err. adjusted for clustering on nr)
-----------------------------------------------------------------------------|
Robust
logwage |
Coef.
Std. Err.
z
P>|z|
[95% Conf. Interval]
-------------+---------------------------------------------------------------logwage |
L1. |
.3285465
.0509062
6.45
0.000
.2287723
.4283208
|
_cons |
1.15405
.0816987
14.13
0.000
.9939241
1.314177
-----------------------------------------------------------------------------Instruments for differenced equation
GMM-type: L(2/.).logwage
Instruments for level equation
Standard: _cons
--------------------------------------------------------------------------------------------------------67
--------------------------------------------------------------------------------------------------------Beispiel: Erklärung von Löhnen (III)
xtabond logwage, twostep artests(3) maxldep(2) vce(robust)
Arellano-Bond dynamic panel-data estimation
Group variable: nr
Time variable: year
Number of obs
Number of groups
Obs per group:
Number of instruments =
12
Wald chi2(1)
Prob > chi2
=
=
3270
545
min =
avg =
max =
6
6
6
=
=
30.15
0.0000
Two-step results
(Std. Err. adjusted for clustering on nr)
-----------------------------------------------------------------------------|
WC-Robust
logwage |
Coef.
Std. Err.
z
P>|z|
[95% Conf. Interval]
-------------+---------------------------------------------------------------logwage |
L1. |
.6899301
.1256559
5.49
0.000
.4436491
.9362111
|
_cons |
.570906
.2001271
2.85
0.004
.178664
.963148
-----------------------------------------------------------------------------Instruments for differenced equation
GMM-type: L(2/3).logwage
Instruments for level equation
Standard: _cons
--------------------------------------------------------------------------------------------------------68
--------------------------------------------------------------------------------------------------------Beispiel: Erklärung von Löhnen (IV)
xtdpdsys logwage, twostep artests(3) maxldep(2) vce(robust)
System dynamic panel-data estimation
Group variable: nr
Time variable: year
Number of obs
Number of groups
Obs per group:
Number of instruments =
18
Wald chi2(1)
Prob > chi2
=
=
3815
545
min =
avg =
max =
7
7
7
=
=
24.57
0.0000
Two-step results
-----------------------------------------------------------------------------|
WC-Robust
logwage |
Coef.
Std. Err.
z
P>|z|
[95% Conf. Interval]
-------------+---------------------------------------------------------------logwage |
L1. |
.3486333
.0703321
4.96
0.000
.2107849
.4864818
|
_cons |
1.111213
.1090005
10.19
0.000
.8975761
1.32485
-----------------------------------------------------------------------------Instruments for differenced equation
GMM-type: L(2/3).logwage
Instruments for level equation
GMM-type: LD.logwage
Standard: _cons
--------------------------------------------------------------------------------------------------------69
--------------------------------------------------------------------------------------------------------Beispiel: Erklärung von Löhnen (V)
Interpretation:
• Bei der einstufigen Arellano/Bond Schätzung ergibt sich aufgrund von T = 8
die maximal mögliche Anzahl von l = ½(T-2)(T-1)+1 = ½∙6∙7+1 = 22 Instrumenten, wobei sich die Addition von 1 auf die Konstante als Instrument bezieht. Der Ausdruck L(2/.).logwage besagt, dass yi,t-2, yi,t-3,…, yi1 als Instrumente für die Perioden t = 3,…, 8 verwendet werden.
• Im Hinblick auf die Einschränkung der Anzahl der Instrumente bewirkt die
STATA-Anweisung maxldep(2) im zweiten und dritten Ansatz, dass jeweils
höchstens zwei lags für die abhängige Variable als Instrumente verwendet
werden. Der Ausdruck L(2/3).logwage besagt somit, dass yi,t-2 und yi,t-3 als
Instrumente für Periode t verwendet werden. Damit ergeben sich für t = 3
ein Instrument und für t = 4,…, 8 jeweils zwei Instrumente, so dass sich unter Berücksichtigung der Konstante als Instrument in der zweistufigen Arellano/Bond Schätzung l = 1+2+2+2+2+2+1 =12 ergibt.
• In der zweistufigen Arellano/Bover Schätzung werden dann zusätzlich für
t = 3,…, 8 die sechs Differenzen ∆yi,t-1 als Instrumente einbezogen
• Die STATA-Anweisung artests(3) bezieht sich im Hinblick auf den Autokorrelationstest nach Arellano/Bond auf die Betrachtung von drei lags von ∆vit,
70
also von ∆vi,t-1, ∆vi,t-2 und ∆vi,t-3
---------------------------------------------------------------------------------------------------------
--------------------------------------------------------------------------------------------------------Beispiel: Erklärung von Löhnen (VI)
In einem nächsten Schritt werden nun die erläuterten erklärenden Variablen mit
einbezogen. Dabei werden folgende Schätzungen betrachtet:
• Zweistufige robuste Arellano/Bond Schätzung im AR(1) Modell mit verminderter Instrumentenzahl sowie mit married, hours, union und der maximalen
Anzahl an Dummy-Variablen für einzelne Jahre als erklärende Variablen,
wobei diese als exogen angenommen werden
• Zweistufige robuste Arellano/Bond Schätzung im AR(2) Modell (d.h. mit den
um ein sowie zwei Jahren verzögerten Werten von logwage) mit verminderter Instrumentenzahl sowie mit married, hours, union und der maximalen Anzahl an Dummy-Variablen für einzelne Jahre als erklärende Variablen, wobei
married und union als endogen angenommen und deshalb mit verzögerten
Werten instrumentiert werden
Darüber hinaus wird jeweils der Autokorrelationstest nach Arellano/Bond sowie
der Sargan Test betrachtet. Zu beachten ist dabei, dass der Sargan Test nicht
nach einer robusten Schätzung der Standardabweichungen der geschätzten
Parameter angewendet werden kann, weshalb vorher die entsprechenden alternativen Arellano/Bond Schätzungen durchgeführt werden müssen. Mit
STATA haben sich dabei folgende Schätz- und Testergebnisse gezeigt:
71
---------------------------------------------------------------------------------------------------------
--------------------------------------------------------------------------------------------------------Beispiel: Erklärung von Löhnen (VII)
xtabond logwage married hours union d82 d83 d84 d85 d86 d87, twostep artests(3)
maxldep(2) vce(robust)
Arellano-Bond dynamic panel-data estimation
Group variable: nr
Time variable: year
Number of obs
Number of groups
Obs per group:
Number of instruments =
21
Wald chi2(10)
Prob > chi2
=
=
3270
545
min =
avg =
max =
6
6
6
=
=
467.94
0.0000
Two-step results
(Std. Err. adjusted for clustering on nr)
-----------------------------------------------------------------------------|
WC-Robust
logwage |
Coef.
Std. Err.
z
P>|z|
[95% Conf. Interval]
-------------+---------------------------------------------------------------logwage |
L1. |
.1535282
.0372487
4.12
0.000
.0805221
.2265344
married |
.0372547
.0221723
1.68
0.093
-.0062021
.0807115
hours | -.0002519
.0000262
-9.63
0.000
-.0003032
-.0002006
union |
.0360395
.0234096
1.54
0.124
-.0098425
.0819215
d82 |
.0531625
.0212889
2.50
0.013
.011437
.094888
⋮
|
⋮
⋮
⋮
⋮
⋮
⋮
d87 |
.3458777
.027473
12.59
0.000
.2920316
.3997239
_cons |
1.801073
.082497
21.83
0.000
1.639382
1.962764
-----------------------------------------------------------------------------Instruments for differenced equation
GMM-type: L(2/3).logwage
Standard: D.married D.hours D.union D.d82 D.d83 D.d84 D.d85 D.d86 D.d87
Instruments for level equation
Standard: _cons
72
---------------------------------------------------------------------------------------------------------
--------------------------------------------------------------------------------------------------------Beispiel: Erklärung von Löhnen (VIII)
Interpretation:
• Aufgrund der Einbeziehung der um ein Jahr verzögerten abhängigen Variablen sowie der Differenzierung können maximal sechs Dummy-Variablen für
die einzelnen Jahre verwendet werden
• Wegen maxldep(2) werden höchstens zwei lags für die abhängige Variable
als Instrumente verwendet. Somit ergeben sich für t = 3 ein Instrument und
für t = 4,…, 8 jeweils zwei Instrumente und damit insgesamt zunächst
1+2+2+2+2+2 =11 Instrumente
• Darüber hinaus werden die neun als exogen angenommenen erklärenden
Variablen sowie die Konstante durch sich selbst instrumentiert, so dass
letztlich l = 11+9+1 = 21
estat abond
Arellano-Bond test for zero autocorrelation in first-differenced errors
+-----------------------+
|Order | z
Prob > z|
|------+----------------|
|
1 |-6.6061 0.0000 |
|
2 | 2.0941 0.0363 |
|
3 | .4064 0.6844 |
+-----------------------+
H0: no autocorrelation
73
---------------------------------------------------------------------------------------------------------
--------------------------------------------------------------------------------------------------------Beispiel: Erklärung von Löhnen (IX)
Interpretation:
• Falls die vit nicht autokorreliert sind, müssen die ∆vit mit ∆vi,t-1 korreliert sein.
Deshalb muss für diesen Fall die entsprechende Nullhypothese im Autokorrelationstest nach Arellano/Bond wie in diesem Beispiel verworfen werden.
Dies ist bei Order 1 für ∆vi,t-1 ersichtlich.
• Jedoch dürfen die ∆vit nicht mit ∆vi,t-2, ∆vi,t-3,… korreliert sein. Somit darf die
entsprechende Nullhypothese für diese verzögerten Werte nicht verworfen
werden. Im Beispiel werden die drei lags ∆vi,t-1, ∆vi,t-2 und ∆vi,t-3 betrachtet.
Für ∆vi,t-2 (Order 2) ergibt sich hier eine hochsignifikante Ablehnung.
• Somit ist von einer Autokorrelation in vit auszugehen und somit von invaliden
Momentenbedingungen (der Sargan Test kommt zu demselben Ergebnis).
Damit ist aber der Arellano/Bond Schätzer inkonsistent, weshalb andere Modellspezifikationen betrachtet werden sollten, z.B. durch die zusätzliche Einbeziehung verzögerter abhängiger Variablen als erklärende Variablen.
estat sargan
Sargan test of overidentifying restrictions
H0: overidentifying restrictions are valid
chi2(10)
Prob > chi2
=
=
21.3385
0.0189
74
---------------------------------------------------------------------------------------------------------
--------------------------------------------------------------------------------------------------------Beispiel: Erklärung von Löhnen (X)
xtabond logwage hours d83 d84 d85 d86 d87, lags(2) twostep artests(3) maxldep(2)
vce(robust) endogenous(married, lag(0,2)) endogenous(union, lag(0,2))
Arellano-Bond dynamic panel-data estimation
Group variable: nr
Time variable: year
Number of obs
Number of groups
Obs per group:
Number of instruments =
37
Wald chi2(10)
Prob > chi2
=
=
2725
545
min =
avg =
max =
5
5
5
=
=
490.97
0.0000
Two-step results
(Std. Err. adjusted for clustering on nr)
-----------------------------------------------------------------------------|
WC-Robust
logwage |
Coef.
Std. Err.
z
P>|z|
[95% Conf. Interval]
-------------+---------------------------------------------------------------logwage |
L1. |
.2327599
.0399373
5.83
0.000
.1544841
.3110356
L2. |
.0817093
.0239738
3.41
0.001
.0347216
.1286971
married |
.2273964
.0555331
4.09
0.000
.1185536
.3362392
union |
.0381822
.1376204
0.28
0.781
-.2315489
.3079132
hours |
-.000285
.0000267
-10.67
0.000
-.0003373
-.0002326
d83 |
.0307297
.0184227
1.67
0.095
-.0053782
.0668375
⋮
|
⋮
⋮
⋮
⋮
⋮
⋮
d87 |
.210727
.0289251
7.29
0.000
.1540348
.2674191
_cons |
1.619214
.1024318
15.81
0.000
1.418451
1.819977
-----------------------------------------------------------------------------Instruments for differenced equation
GMM-type: L(2/3).logwage L(2/3).married L(2/3).union
Standard: D.hours D.d83 D.d84 D.d85 D.d86 D.d87
Instruments for level equation
Standard: _cons
75
--------------------------------------------------------------------------------------------------------Beispiel: Erklärung von Löhnen (XI)
Interpretation:
• Aufgrund der Einbeziehung der um ein sowie zwei Jahre verzögerten abhängigen Variablen sowie der Differenzierung können lediglich die fünf Perioden t = 4,…, 8 sowie maximal fünf Dummy-Variablen für die einzelnen
Jahre untersucht werden
• Wegen maxldep(2) ergeben sich für t = 4,…, 8 zwei Instrumente für die beiden verzögerten abhängigen Variablen (d.h. yi,t-2, yi,t-3) und somit in diesem
Fall 2+2+2+2+2 = 10 Instrumente. Darüber hinaus werden die sechs als
exogen angenommenen erklärenden Variablen sowie die Konstante durch
sich selbst instrumentiert.
• Die 0 bei den beiden STATA-Anweisungen endogenous(married,lag(0,2))
und endogenous(union,lag(0,2)) bedeutet, dass married und union lediglich
als kontemporäre erklärende Variable (und nicht als verzögerte erklärende
Variable) einbezogen werden. Die 2 bedeutet, dass maximal zwei lags dieser erklärenden Variablen als Instrumente betrachtet werden. Somit werden
bei married und union für t = 4,…, 8 die um zwei sowie um drei Perioden
verzögerten Werte (d.h. xi,t-2,h, xi,t-3,h) als Instrumente einbezogen (also jeweils 2+2+2+2+2 = 10 Instrumente).
76
• Damit ergeben sich insgesamt 10+6+1+10+10 = 37 Instrumente
---------------------------------------------------------------------------------------------------------
--------------------------------------------------------------------------------------------------------Beispiel: Erklärung von Löhnen (XII)
estat abond
Arellano-Bond test for zero autocorrelation in first-differenced errors
+-----------------------+
|Order | z
Prob > z|
|------+----------------|
|
1 |-5.5893 0.0000 |
|
2 |-.09516 0.9242 |
|
3 | .65267 0.5140 |
+-----------------------+
H0: no autocorrelation
estat sargan
Sargan test of overidentifying restrictions
H0: overidentifying restrictions are valid
chi2(26)
Prob > chi2
=
=
23.57944
0.6000
Weder der Autokorrelationstest nach Arellano/Bond noch der Sargan Test weisen somit auf invalide Momentenbedingungen hin, wodurch eine Minimalanforderung für die Arellano/Bond Schätzung erfüllt ist.
---------------------------------------------------------------------------------------------------------
77
Herunterladen