4 4.1 Endogenität, Simultanität, IV und GMM Fälle, in denen OLS konsistent bleibt Die OLS-Schätzung für das lineare Regressionsmodell y = Xβ + ε, ε ∼ IN D(0, σ 2 I) ist erwartungstreu (d.h. nicht verzerrt), wenn X und ε gemeinsam voneinander unabhängig sind, E {X ′ ε} = 0, impliziert E {ε|X} = 0. Dies ist bei exogenen Regressoren gegeben. Gerade bei Zeitreihen kann es allerdings vorkommen, dass yt von der eigenen Vergangenheit abhängt, die Matrix X also eine endogene Variable enthält: yt = βyt−1 + εt Angewandte Ökonometrie, Sylvia Kaufmann, FS09 43 Die Eigenschaft E {ε|X} = 0 ist dann nicht mehr gegeben, da yt−1 selbst ein geometrisch gewichteter Durchschnitt vergangener Fehlerterme enthält. yt kann ja dargestellt werden als: t yt = β y0 + t X β j εt−j j=0 Wenn die mildere Anforderung xt (hier yt−1 ) und εt unabhängig verteilt, also E {xt εt } = 0 ∀t mit εt ∼ IID(0, σ 2 ) erfüllt ist, dann ist der OLS-Schätzer b konsistent und asymptotisch normalverteilt mit Kovarianzmatrix σ 2 Σ−1 XX , wobei ΣXX Formal: √ T 1X xt x′t = p limT →∞ T t=1 ¡ ¢ T (b − β) −→ N 0, σ 2 Σ−1 XX Angewandte Ökonometrie, Sylvia Kaufmann, FS09 44 Bei beschränkter Beobachtungsanzahl gilt approximativ: a ´ ³ −1 2 ′ ∼ b N β, σ (X X) Für Zeitreihen ist dies ein wichtiges Resultat. Der OLS-Schätzer für β kann zwar in kleinen Stichproben verzerrt sein, die Verzerrung verschwindet aber mit steigender Beobachtungsanzahl. Die Konsistenz bringt es mit sich, dass herkömmliche Teststatistiken ihren Standardverteilungen folgen. Daraus ergibt sich auch, dass bei Verdacht auf Heteroskedastizität und Autokorrelation die Parameterkovarianzmatrix nach White und Newey-West geschätzt werden kann. Angewandte Ökonometrie, Sylvia Kaufmann, FS09 45 Beispiel: Die Effizienzhypothese besagt, dass Aktienrenditen nicht prognostizierbar sind. Die Hypothese kann überprüft werden aufgrund der Schätzung: yt = β1 + β2 yt−1 + β3 yt−2 + εt , εt ∼ N (0, σt2 ) H0 : β2 = β3 = 0 Angewandte Ökonometrie, Sylvia Kaufmann, FS09 46 Abbildung 8: Regression der Aktienrendite auf zwei verzögerte Werte Dependent Variable: DLCH_SPI Method: Least Squares Date: 02/26/09 Time: 14:30 Sample (adjusted): 1989Q4 2008Q4 Included observations: 77 after adjustments Newey-West HAC Standard Errors & Covariance (lag truncation=3) Variable Coefficient Std. Error t-Statistic Prob. DLCH_SPI(-1) DLCH_SPI(-2) C 0.345221 -0.003157 1.051967 0.092283 0.120096 0.961634 3.740892 -0.026284 1.093936 0.0004 0.9791 0.2775 R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood F-statistic Prob(F-statistic) 0.108920 0.084837 7.519583 4184.265 -263.0766 4.522647 0.014025 Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion Hannan-Quinn criter. Durbin-Watson stat 1.817669 7.860397 6.911080 7.002397 6.947606 1.842117 Angewandte Ökonometrie, Sylvia Kaufmann, FS09 4.2 47 Fälle, in denen OLS inkonsistent ist Falls die mildere Annahme E{xt εt } 6= 0 nicht erfüllt ist, dann ist OLS inkonsistent, d.h. die Schätzung des Koeffizienten ist verzerrt und bleibt es auch bei steigender Beobachtungsanzahl. 4.2.1 Residuenautokorrelation bei endogenen Regressoren Nehmen wir an, im Modell mit verzögerter abhängiger Variable seien die Residuen autokorreliert: ¢ ¡ yt = β1 + β2 xt + β3 yt−1 + εt , εt ∼ N 0, σε2 ¢ ¡ εt = ρεt−1 + νt , νt ∼ N 0, σν2 Angewandte Ökonometrie, Sylvia Kaufmann, FS09 48 yt−1 ist zwangsläufig mit εt korreliert: yt = β1 + β2 xt + β3 yt−1 + ρεt−1 + νt yt−1 = β1 + β2 xt−1 + β3 yt−2 + εt−1 Cov{yt−1 , εt } = E {εt−1 (ρεt−1 + νt )} = ρσ 2 In diesem Fall ist auch der Durbin-Watson Test nicht mehr gültig, man wendet den Durbin-h Test an. Beim Breusch-Godfrey LM -Test müssen in der Hilfsregression der Residuen auf eigene verzögerte Werte auch alle Rechthandvariablen einbezogen werden. Die Statistik ist χ2 -verteilt mit p Freiheitsgraden, wobei p die Anzahl verzögerter Residuen ist. 4.2.2 Messfehler in den Variablen Messfehler führen auch zu Korrelation zwischen Regressor und Fehlerterm und daher zu einer verzerrten Schätzung. Nehmen wir Angewandte Ökonometrie, Sylvia Kaufmann, FS09 49 an, yt sei von der Variablen wt abhängig, welche allerdings nur mit einem Fehler gemessen werden kann: yt = β1 + β2 wt + νt xt = wt + ut In der Regression mit beobachteten Variablen wird der Fehlerterm den Messfehler in wt aufnehmen: yt → = β1 + β2 xt + εt = β1 + β2 (wt + ut ) + νt − β2 ut Cov {xt , εt } = −β2 σu2 Wenn β2 > 0 sind also xt und εt negativ korreliert. Wenn wir die Variablen um ihren Mittelwert bereinigen, y = Y − Ȳ und x = X − X̄, dann erhalten wir eine Gleichung ohne Konstante: yt − Ȳ = β2 (xt − X̄) + εt Angewandte Ökonometrie, Sylvia Kaufmann, FS09 50 Die OLS-Schätzung b2 von β2 ist inkonsistent: b2 = p lim b2 = E{xt εt } = V {xt } = p lim b2 = −1 −1 (x′ x) x′ y = β2 + (x′ x) E{xt εt } β2 + V {xt } x′ ε −β2 σu2 2 σw + σu2 µ β2 1 − σu2 2 + σ2 σw u ¶ Je grösser die Varianz der Messfehler umso grösser fällt die Verzerrung der Schätzung aus. Die Verzerrung überträgt sich auch auf die übrigen Koeffizienten. Für b1 = Ȳ − b2 X̄ erhalten wir ¡ ¢ p lim (b1 − β1 ) = p lim Ȳ − b2 X̄ − E{yt } + β2 E{xt } = −p lim (b2 − β2 ) E{xt } Eine Überschätzung des Steigungskoeffizienten geht einher mit Angewandte Ökonometrie, Sylvia Kaufmann, FS09 51 einer Unterschätzung des Achsenabschnitts. 4.2.3 Simultaneität, invertierte Kausalität Diese Situation tritt oft auf, wenn Regressand und Regressoren gleichzeitig determiniert sind. Beispiele sind: Keynesianische Konsumfunktion: Das Volkseinkommen bestimmt den Konsum, während der Konsum ein Bestandteil des Volkseinkommens ist. Das BIP-Wachstum wird durch das Zinsniveau bestimmt, während die Geldpolitik auf Inflationsrisken durch Konjunkturüberhitzung reagiert. Wir nehmen folgende Strukturform an: yt = β1 + β2 xt + εyt xt = γ1 + γ2 yt + γ3 zt + εxt Angewandte Ökonometrie, Sylvia Kaufmann, FS09 52 wobei die Variable zt als exogen betrachtet wird. Im Konsumfunktionsbeispiel wäre sie z.B. die Investitionen oder die Staatsausgaben. Daher ist sie auch unkorreliert mit εyt , E{zt εyt } = 0. Durch entsprechende Umformung erhalten wir die reduzierte Form des Systems, in dem die endogenen Variablen nur noch durch die exogene erklärt werden: Angewandte Ökonometrie, Sylvia Kaufmann, FS09 yt = = yt = xt = = xt = 53 β1 + β2 (γ1 + γ2 yt + γ3 zt + εxt ) + εyt β 2 γ3 β2 β1 + β2 γ1 + zt + εxt + εyt 1 − β2 γ2 1 − β2 γ2 1 − β2 γ2 φ0 + φ1 zt + ν1t γ1 + γ2 (β1 + β2 xt + εyt ) + γ3 zt + εxt γ1 + γ2 β 1 γ3 γ2 + zt + εyt + εxt 1 − γ2 β2 1 − γ2 β2 1 − γ2 β2 ψ0 + ψ1 zt + ν2t Daraus ergibt sich Cov {xt , εyt } = = E ½µ ¶ ¾ γ2 εyt + εxt εyt 1 − γ2 β2 γ2 σy2 1 − γ2 β2 Angewandte Ökonometrie, Sylvia Kaufmann, FS09 54 Zudem können aus der reduzierten Form, in der 4 Parameter geschätzt werden, nicht die strukturellen Parameter, 5 an der Zahl, abgeleitet werden. Sie brauchen dazu noch eine Restriktion, z.B. γ2 = 1. Wenn yt auf xt ohne Berücksichtigung der Simultaneität regressiert wird, ist OLS inkonsistent: p lim b2 = β2 + cov{xt , εt } V {xt } Angewandte Ökonometrie, Sylvia Kaufmann, FS09 4.3 55 Instrumentalvariablenschätzung Aus der Strukturform des letzten Abschnitts (wobei x1t = 1 eingesetzt wurde) yt = β1 x1t + β2 x2t + εt x2t = γ1 + γ2 yt + γ3 z1t + εxt ist ersichtlich, dass x2t mit z1t korreliert, dass z1t als exogene Variable jedoch nicht mit εt korreliert. Wir können diese Variable also als Instrument für x2t einsetzen. Der Kleinsquadratschätzer b für β = (β1 , β2 )′ ist konsistent, wenn die Momentbedingungen E {xjt εt } = 0, j = 1, 2 erfüllt sind. Er kann hergeleitet werden, wenn die Populationsmomente mit den Angewandte Ökonometrie, Sylvia Kaufmann, FS09 56 Stichprobenmomenten substituiert werden. E {xt εt } = X ′ (y − Xb) = −→ b = 0 0 (X ′ X) −1 X ′y Wenn eine Variable mit dem Fehlerterm korreliert, dann ist eine der Momentbedingungen verletzt, E {xjt εt } 6= 0, für ein j. Sie wird deshalb durch ein Instrument ersetzt, in unserem Beispiel durch z1t , was zur Instrumentenmatrix Z mit den Beobachtungen zt = (x1t , z1t )′ führt. Z′ ³ E {zt εt } = 0 ´ y − X β̂IV = 0 −→ β̂IV −1 = (Z ′ X) Z ′y Angewandte Ökonometrie, Sylvia Kaufmann, FS09 57 Im multiplen Regressionsmodell muss für jede Variable, die mit dem Fehlerterm korreliert ist, mindestens ein Instrument eingesetzt werden, die Dimension der Instrumentenmatrix ist dann gleich der Anzahl Parameter, die geschätzt werden (R = K). In diesem Fall, sind die Momentbedingungen der Stichprobe exakt erfüllt. Angewandte Ökonometrie, Sylvia Kaufmann, FS09 58 4.4 Generalisierte IV-Schätzung Diese Schätzung wird angewandt, wenn die Instrumentenanzahl grösser ist als die Anzahl der mit dem Fehlerterm korrelierten Variablen (R > K). Zur Schätzung von β können die Populationsmomente E {zt ε} = 0 nicht durch die Stichprobenmomente ersetzt werden, da mehr Gleichungen als Parameter vorhanden sind. Von den R Stichprobenmomenten Z ′ (y − Xβ) werden höchstens K null sein, während die restlichen R − K, auch wenn minimal, verschieden von null sein werden. Damit alle Instrumente berücksichtigt werden können, wird β so festgelegt, dass die gewichtete Quadratform der Stichprobenmomente minimiert wird. Dies führt zum generalisierten Kleinstquadratschätzer: Angewandte Ökonometrie, Sylvia Kaufmann, FS09 min Q(β) β −→ β̂IV = 59 ′ (Z ′ (y − Xβ)) W Z ′ (y − Xβ) = (X ′ ZW Z ′ X) −1 X ′ ZW Z ′ y Verschiedene Gewichtungsmatrizen W führen zu unterschiedlichen (konsistenten) Schätzungen für β, mit unterschiedlichen asymptotischen Kovarianzmatrizen. Die optimale Gewichtungsmatrix berücksichtigt die (Ko)Varianz in den Stichprobenmomenten. Momente mit hoher Varianz, welche die Schätzung unpräziser machen, werden dementsprechend heruntergewichtet, Momente mit geringer Varianz werden stärker gewichtet. Angewandte Ökonometrie, Sylvia Kaufmann, FS09 60 W opt = = −→ β̂IV = −1 (E {Z ′ εε′ Z}) µ ¶−1 2 1 ′ σ ZZ T ³ ´−1 −1 ′ −1 ′ ′ X Z (Z Z) Z X X ′ Z (Z ′ Z) Z ′ y Die Kovarianzmatrix der Parameter ist o ³ ´−1 n −1 ′ ′ ′ ˆ 2 V̂ β̂IV = σ X Z (Z Z) Z X wobei σˆ2 die Varianz der IV-Residuen, ε̂t = yt − x′t β̂IV , ist : T 1X 2 ˆ 2 ε̂ σ = T t=1 t Bei homoskedastischen Residuen, ist die GIV-Schätzung gleich der Zwei-Schritt-Kleinstquadratschätzung (siehe unten). Bei Angewandte Ökonometrie, Sylvia Kaufmann, FS09 61 heteroskedastischen und/oder autokorrelierten Fehlern werden die Gewichtungsmatrix und die Kovarianzmatrix der Parameter nach White oder Newey-West geschätzt. Angewandte Ökonometrie, Sylvia Kaufmann, FS09 62 4.5 Diagnose der Instrumentengüte Die Konsistenz des GIV-Schätzers und dessen asymptotische Verteilung hängen davon ab, ob die Momentbedingungen tatsächlich erfüllt sind. Im Falle exakter Identifikation (R = K) PT sind die Stichprobenmomente 1/T t=1 zt ε̂t = 0, konstruktionsmässig bedingt, erfüllt. Die Güte der Instrumente kann somit nicht überprüft werden. Anders im Falle der Überidentifikation, R > K. Ohne genau zu wissen welche, sind in dem Falle K Momentbedingungen erfüllt. Falls die Güte der Instrumente hoch ist, sollten die restlichen Momentbedingungen ebenfalls nahe null sein. Auf dieser Basis lässt sich ein Test herleiten, welcher die Güte der überidentifizierten Momentbedingungen (Restriktionen) testet (overidentifying restrictions test, Sargan test). Die Statistik ¢−1 ′ ′¡ (Z ε̂) ξ = (Z ′ ε̂) σ̂ 2 Z ′ Z Angewandte Ökonometrie, Sylvia Kaufmann, FS09 63 is asymptotisch χ2 -verteilt mit R − K Freiheitsgraden. Eine Möglichkeit, die Teststatistik einfach zu berechnen, basiert auf dem R2 der Hilfsregression (H) ε̂t = zt γ + νt 2,(0.05) Die Teststatistik berechnet sich als ξ = T R2 . Falls ξ > χR−K , wird die Modellspezifikation verworfen. Das heisst, dass die Instrumente (Datenevidenz) die Momentbedingungen nicht erfüllen. Der Test sagt allerdings nichts darüber aus, welche Instrumente ungültig bzw. schlecht sind. Der Test kann benützt werden, um zusätzliche Instrumente (R − R1 ) zu validieren, falls wir mindestens R1 ≥ K gültige Instrumente kennen. Dazu berechnen wir die Statistiken ξ und ξR1 für die Modelle mit R bzw. R1 Instrumenten und bilden die Differenz ξ − ξR1 . Diese Grösse ist approximativ χ2 -verteilt mit R − R1 Freiheitsgraden. Angewandte Ökonometrie, Sylvia Kaufmann, FS09 64 4.6 Relation zur Zwei-Schritt-Kleinstquadratschätzung Die GIV-Schätzung ist bei homoskedastischen Fehlern mit der Zwei-Schritt-Kleinsquadratschätzung identisch. Im ersten Schritt werden die endogenen Regressoren auf die Instrumente regressiert, aus der wir die gefitteten Werte für die Regressoren erhalten. Mit diesem Schritt extrahieren wir aus X denjenigen Teil, der mit Z korreliert und mit ε unkorreliert ist, X̂. Im zweiten Schritt regressieren wir die abhängige Variable y auf X̂ und erhalten damit β̂IV . Angewandte Ökonometrie, Sylvia Kaufmann, FS09 (I) xk = Zγk + νk , k = 1, . . . , K −→ x̂k = Z γ̂k = Z (Z ′ Z) (II) = X̂β + ε ³ ´−1 ′ X̂ ′ y = X̂ X̂ y −→ β̂IV 65 −1 Z ′ xk −1 wobei X̂ = Z (Z ′ Z) Z ′ X, die Projektion der Datenmatrix X in den Raum, der durch die Instrumente aufgespannt wird, ist. Angewandte Ökonometrie, Sylvia Kaufmann, FS09 66 4.7 GMM – Generalisierte Momentbedingungen-Methode IV und GIV sind Spezialfälle von GMM (Generalized Method of Moments), da die Momentbedingungen linear in den Parametern sind. GMM verallgemeinert das Prinzip auf nichtlineare Momentbedingungen. Die GMM-Schätzung minimiert die gewichtete Quadratform der Momentbedingungen, wobei die optimale Gewichtung gleich der Inversen der Kovarianzmatrix der Stichprobenmomente ist. Da diese im nicht-linearen Fall von den Parametern abhängen kann, muss zuerst eine “naive” Gewichtungsmatrix angenommen werden, um einen ersten konsistenten Schätzer zu erhalten. Mit diesem kann die optimale Gewichtungsmatrix aktualisiert werden. Die asymptotische Angewandte Ökonometrie, Sylvia Kaufmann, FS09 67 Verteilung des Schätzers ist ´ √ ³ T β̂GMM − β −→ N (0, V ) wobei V mittels der Delta-Methode berechnet wird ¡ ¢−1 V = DW opt D′ In D finden sich die K × R Ableitungen der K Momentbedingungen nach den R Parametern. Angewandte Ökonometrie, Sylvia Kaufmann, FS09 68 4.8 Beispiel: Taylor-Regel für die Schweiz Die Taylor-Regel ist eine einfache Darstellung, um das Zinsfestsetzungsverhalten der Schweizerischen Nationalbank zu beschreiben. Zinsen reagieren demnach auf Abweichungen der Inflation von ihrem Zielniveau und, je nach Gewichtung in der Verlustfunktion der Nationalbank, auf Abweichungen der Produktion von ihrem langfristigen Trend. r∗ + πt + β1∗ (πt − π ∗ ) + β2∗ (yt − yt∗ ) + εt it = it = (r∗ − β1∗ π ∗ ) + (1 + β1∗ ) πt + β2∗ (yt − yt∗ ) + εt Da die Auswirkungen geldpolitischer Aktionen, d.h. von Zinsänderungen, erst nach einer gewissen Zeit eintreten, integriert eine vorausschauende Geldpolitik Inflationserwartungen und erwartete Produktionsschwankungen in ihre Politikmassnahmen. ¢ ¡ ∗ it = (r∗ − β1∗ π ∗ ) + (1 + β1∗ ) E (πt+4 |Ωt ) + β2∗ E yt+4 − yt+4 |Ωt + εt Angewandte Ökonometrie, Sylvia Kaufmann, FS09 69 Um die Volatilität in den Zinssätzen gering zu halten, werden Zinsänderungen meist in kleinen Schritten durchgeführt, it = (1 − ρ)i∗t + ρit−1 Dies führt zu einer Persistenz in der Zinsdynamik, die in die Schätzgleichung eingebunden wird: it it it = (1 − ρ) (r∗ − β1∗ π ∗ ) + (1 − ρ) (1 + β1∗ ) E (πt+4 |Ωt ) + . . . ¢ ¡ ∗ +(1 − ρ)β2∗ E yt+4 − yt+4 |Ωt + ρit−1 + εt ¢ ¡ ∗ = β0 + β1 E (πt+4 |Ωt ) + β2 E yt+4 − yt+4 |Ωt + ρit−1 + εt ¢ ¡ ∗ + ρit−1 + εt = β0 + β1 πt+4 + β2 yt+4 − yt+4 wobei wir die erwarteten Werte durch die aktuellen ersetzen können, wenn wir den Marktteilnehmern rationale Erwartungen unterstellen. Da die Rechthandvariablen mit dem Fehlerterm korrelieren (eine Angewandte Ökonometrie, Sylvia Kaufmann, FS09 70 unerwartete Zinsänderung wirkt sich auf Inflations- und Produktionserwartungen aus), muss die Gleichung mit GIV oder mit GMM geschätzt werden. Angewandte Ökonometrie, Sylvia Kaufmann, FS09 71 Abbildung 9: Taylor-Regel für Kleinstquadratschätzung (2SLS) die SNB, Zwei-Schritt- Dependent Variable: CH_IR3M Method: Two-Stage Least Squares Date: 03/26/09 Time: 10:40 Sample (adjusted): 1989Q3 2007Q3 Included observations: 73 after adjustments Instrument list: C CH_IR3M(-1) CH_IR3M(-2) LCH_CPI-LCH_CPI(-4) LCH_CPI(-1)-LCH_CPI(-5) LCH_GDPRGAP-LCH_GDPRGAP(-4) LCH_GDPRGAP(-1)-LCH_GDPRGAP(-5) Variable Coefficient Std. Error t-Statistic Prob. LCH_CPI(4)-LCH_CPI LCH_GDPRGAP(4)-LCH_GDPRGAP CH_IR3M(-1) C 0.376328 -0.259966 0.750703 0.117744 0.126070 0.148349 0.060773 0.132288 2.985069 -1.752391 12.35251 0.890061 0.0039 0.0841 0.0000 0.3765 R-squared Adjusted R-squared S.E. of regression F-statistic Prob(F-statistic) Angewandte Ökonometrie, Sylvia Kaufmann, FS09 0.959788 0.958040 0.562834 562.2330 0.000000 Mean dependent var S.D. dependent var Sum squared resid Durbin-Watson stat Second-Stage SSR 3.278785 2.747652 21.85797 0.907282 9.254481 72 Abbildung 10: Taylor-Regel für die SNB, generalisierte Momentenschätzung (GMM) Dependent Variable: CH_IR3M Method: Generalized Method of Moments Date: 03/26/09 Time: 10:42 Sample (adjusted): 1989Q3 2007Q3 Included observations: 73 after adjustments Kernel: Bartlett, Bandwidth: Fixed (3), No prewhitening Simultaneous weighting matrix & coefficient iteration Convergence achieved after: 9 weight matrices, 10 total coef iterations Instrument list: C CH_IR3M(-1) CH_IR3M(-2) LCH_CPI-LCH_CPI(-4) LCH_CPI(-1)-LCH_CPI(-5) LCH_GDPRGAP-LCH_GDPRGAP(-4) LCH_GDPRGAP(-1)-LCH_GDPRGAP(-5) Variable Coefficient Std. Error t-Statistic Prob. LCH_CPI(4)-LCH_CPI LCH_GDPRGAP(4)-LCH_GDPRGAP CH_IR3M(-1) C 0.455253 -0.221883 0.722691 0.009436 0.127969 0.113001 0.071514 0.140683 3.557539 -1.963542 10.10553 0.067072 0.0007 0.0536 0.0000 0.9467 R-squared Adjusted R-squared S.E. of regression Durbin-Watson stat Angewandte Ökonometrie, Sylvia Kaufmann, FS09 0.958020 0.956195 0.575073 0.857066 Mean dependent var S.D. dependent var Sum squared resid J-statistic 3.278785 2.747652 22.81894 0.030281 73