Statistik II V. Asymptotische Eigenschaften von OLS Martin Huber 1/9 Übersicht Konsistenz Asymptotische Normalität 2/9 Konsistenz Bisher haben wir über die Eigenschaften des OLS Schätzers in begrenzten/kleinen Stichproben (Grösse N) gesprochen, in welchen besagte Eigenschaften von der Stichprobengrösse abhängen. Nachfolgend beschäftigen wir uns mit den Eigenschaften in grossen Stichproben: asymptotische Eigenschaften wenn N → ∞ Konsistenz: P(|β̂j − βj | > ) → 0 für irgendein > 0 wenn N → ∞ plim(β̂j ) = βj 3/9 4/9 Unter Annahme von MLR.1-MLR.4 ist der OLS Schätzer β̂j ein konsistenter Schätzer für βj für alle j = 0, 1, ..., k. PN rˆij ui plim(β̂j ) = βj + plim Pi=1 N 2 i=1 rˆij wobei rˆij das (geschätzte) Residuum der Regression von xj auf alle anderen Regressoren und Konstante in der Stichprobe ist Gesetz der grossen Zahl (Law of large numbers) plim a = α, wobei a dem Schätzer in der Stichprobe für das Moment α in der Population entspricht. Annahme MLR.4 E (u|x1 , x2 , ..., xk ) = 0 impliziert: E (u) = 0 und Cov (rj , u) = 0 ∀ j = 0, 1, ..., k - wobei rj das Residuum der Regression von xj auf alle anderen Regressoren und Konstante in der Population ist ⇒ plim(β̂j ) = βj + Cov (rj , u) = βj Var (rj ) 5/9 Inkonsistenz des OLS Schätzers β̂j : plim(β̂j − βj ) = Cov (rj , u) wenn Cov (rj , u) 6= 0 Var (rj ) Asymptotisches Analog zur Verzerrung aufgrund unberücksichtigter Kontrollvariablen (“omitted variable bias”): Populationsmodell: y = β0 + β1 x1 + β2 x2 + u Geschätztes Modell: y̌ = β̌0 + β̌1 x1 (x1 ,x2 ) Inkonsistenz: plim(β̌1 ) = β1 + δ1 β2 wobei δ1 = Cov Var (x1 ) ⇒ Richtung der Inkonsistenz hängt von δ1 und β2 ab. 6/9 Asymptotische Normalität (1) Y1 , Y2 , Y3 , . . . sei eine Folge von unabhängigen Zufallsvariablen mit identischer Verteilung (u.i.v. = unabhängig und identisch verteilt, i.i.d. = independent and identically distributed), deren Erwartungswert E (Y ) und Varianz var (Y ) existieren und endlich sind. Sei SN die n-te Teilsumme dieser Zufallsvariablen (bestehend aus n Zufallsvariablen), SN = Y1 + Y2 + · · · + YN . Der Erwartungswert von SN ist N · E (Y ) und die Varianz ist N · var (Y ). 7/9 Asymptotische Normalität (2) Zentraler Grenzwertsatz (Central Limit Theorem): SN − N · E (Y ) a √ ∼ N(0, 1), ZN = p Var (Y ) N d.h., Verteilungsfunktion von ZN konvergiert zur Standardnormalverteilung, wenn N gegen ∞ geht. Dies impliziert: ZN = SN N√− E (Y ) Var (Y ) √ N ∼a N(0, 1), SN N√ der Mittelwert von Y in der Stichprobe der N Zufallsvariablen Var (Y ) und √N die Standardabweichung des Mittelwerts. wobei ist Dies impliziert: SN N ∼a N E (Y ), VarN(Y ) 8/9 Asymptotische Normalität (3) Der zentrale Grenzwertsatz lässt sich auch auf den OLS Schätzer übertragen, der wie der Mittelwert eine Funktion von Zufallsvariablen ist: β̂j − βj q ∼a N(0, 1) ∀j = 1, 2, ..., k, wobei Var (β̂j ) q Var (β̂j ) = se(β̂j ) β̂j ∼a N βj , Var (β̂j ) Var (β̂j ) = σ2 σ2 ≈ SSTj (1 − Rj2 ) N · Var (xj ) · (1 − Rj2 ) P SSTj = ni=1 (xij − x̄j )2 und Rj2 = R 2 der Regression von xj auf alle anderen Regressoren und Konstante Var (β̂j ) geht mit der Rate 1 N, se(β̂j ) mit der Rate √1 N gegen Null Grössere Stichproben führen zu effizienteren Schätzern 9/9