Ist der OLS-Schätzer der beste unverzerrte lineare Schätzer? Rafael Weißbach Institut für Wirtschafts- und Sozialstatistik, Fakultät Statistik Technische Universität Dortmund Exkurs zu „Statistische Methoden“ Mai 2008 Überblick Das Beispiel: Textilkonsum zwischen den Weltkriegen Die lineare Regression Der OLS-Schätzer ◮ Linearität ◮ Unverzerrtheit ◮ Effizienz Interpretation Beispiel: Konsumforschung Ökonomische Theorie: Einkommen und Preise haben Einfluss auf den Konsum. Empirische Basis: Textilkonsum, reale Einkommen und Textilpreisindex Statistische Masse: Volkwirtschaftsdaten der Niederlande 1923-1939 Beispiel Textilkonsum Jahr 1923 1924 1925 1926 1927 1928 1929 1930 1931 1932 1933 1934 1935 1936 1937 1938 1939 Textilkonsum 99,2 99,0 100,0 111,6 122,2 117,6 121,1 136,0 154,2 153,6 158,5 140,6 136,2 168,0 154,3 149,0 165,5 Einkommen 96,7 98,1 100,0 104,9 104,9 109,5 110,8 112,3 109,3 105,3 101,7 95,4 96,4 97,6 102,4 101,6 103,8 Textilpreisindex 101,0 100,1 100,0 90,6 86,5 89,7 90,6 82,8 70,1 65,4 61,3 62,5 63,6 52,6 59,7 59,5 61,3 Notation der linearen Regression Lineare Regression: t y = β0 + β1 xt1 + β2 xt2 + εt , t = 1, . . . , T Der OLS-Schätzer Matrix-Schreibweise: y = X β + ε, OLS-Schätzer für β: X ∈ R17×3 , E (ε) = 0 b = (X ′ X )−1 X ′ y Beispiel Textilkonsum Textilkonsum: Textilkonsum ≈ 3, 16 + 1, 14 · Einkommen − 0, 83 · Preis a) Steigt Einkommen um 1%, so steigt Textilkonsum um 1,14%. b) Fallen Textilpreise um 1%, so steigt Textilkonsum um 0,83%. c) Steigt Einkommen um 1% und fallen Textilpreise um 2%, so steigt Textilkonsum um 1, 14 − 2 · (−0, 83) ≈ 2, 8%. Eigenschaften des OLS-Schätzers 1. Linearität: b = My 2. Unverzerrtheit: mit M = (X ′ X )−1 X ′ ∈ R3×17 E (b − β) = 0 Schätzung der Textilkonsum-Elastizitäten 1, 5 Einkommen β1 - @ −1, 0 Preis ? β2 Wahrer Wert (β1 , β2 ) = (1, 5; −1, 0) Schätzung der Textilkonsum-Elastizitäten 1, 5 Einkommen β1 - (1,14;-0,83) b −1, 0 @ Preis ? β2 Unsere OLS-Schätzung (b1 , b2 ) = (1, 14; −0, 83) Schätzung der Textilkonsum-Elastizitäten 1, 5 Einkommen β1 - (1,14;-0,83) b (b1neu , b2neu ) −1, 0 b @ Preis ? β2 Eine OLS-Schätzung (b1neu , b2neu ) aus neuen Daten (z. B. Niederlande 1945-1961) Schätzung der Textilkonsum-Elastizitäten 1, 5 Einkommen β1 - b bb bb bbb b bb b @ b b bb bb b b b b b b bb −1, 0 Preis ? β2 OLS-Schätzungen b für eine Vielzahl von Datensätzen Schätzung der Textilkonsum-Elastizitäten 1, 5 Einkommen β1 - r r r r −1, 0 rr r r r r rr r r r r @r r rr r r r r r r Preis ? β2 Ein anderer linearer und unverzerrter Schätzer β̂ (selbe Datensätze) Schätzung der Textilkonsum-Elastizitäten 1, 5 Einkommen β1 - r r r rb r b bb r −1, 0 bb b rr b r r r Preis ? β2 brb b rb r r b brb rb @ b b rr bb bb b br rb b r r r r r Unterschied β̂ ↔ b (OLS) ??? Schätzung der Textilkonsum-Elastizitäten 1, 5 Einkommen β1 - r r r rb r b bb r −1, 0 bb b rr b r r r brb b br r r b b rb rb @ b b rr bb bb b br br b r r r r r Preis ? β2 1. Streuung Einkommenselastizität-Schätzung b1 kleiner als bei β̂1 Schätzung der Textilkonsum-Elastizitäten 1, 5 Einkommen β1 - r r r rb r b bb r −1, 0 bb b rr b r r r brb b br r r b b rb rb @ b b rr bb bb b br br b r r r r r Preis ? β2 2. Streuung Preiselastizität-Schätzung b2 kleiner als bei β̂2 Schätzung der Textilkonsum-Elastizitäten 1, 5 Einkommen β1 - r r r rb −1, 0 r brb b rr b b bb r r b r brb b r bb b b b @ b rr b bb br bbr br b r r r r r r r r Preis ? β2 3. Streuung bei OLS-Schätzung einer Kombination aus beiden Elastizitäten g1 b1 + g2 b2 kleiner als bei g1 β̂1 + g2 β̂2 Schätzung der Textilkonsum-Elastizitäten pp``p ``p`pp p p` ` ``pp`p p p ?p p Satz von Gauß-Markoff (grafisch): „Der OLS-Schätzer b hat unter allen linearen und unverzerrten Schätzern die kleinste Varianz.“ Satz von Gauß-Markoff (ökonomisch): „Mit dem OLS-Schätzer b werden Elastizitäten und der Trend (sowie Kombinationen) unverzerrt und mit minimaler Streuung geschätzt.“ Schätzung der Textilkonsum-Elastizitäten pp``p ``p`pp p p` ` ``pp`p p p ?p p Bemerkungen: a) Varianz-Kovarianz-Matrix von b: σ 2 (X ′ X )−1 ∈ R3 × 3 b) Sei Z 3-dim Zufallsvariable mit Varianz-Kovarianz-Matrix Σ ∈ R3 × 3 : ◮ Dann ist für g ∈ R3 : Var (g ′ Z ) = g ′ Σg c) Für Varianz-Kovarianz-Matrix des Schätzers β̂ gilt: Σ = σ 2 (X ′ X )−1 + B Schätzung der Textilkonsum-Elastizitäten pp``p ``p`pp p p` ` ``pp`p p p ?p p Theorem (Gauß-Markoff) Für jeden linearen und unverzerrten Schätzer gilt, dass seine Varianz-Kovarianzmatrix die des OLS-Schätzers b = (X ′ X )−1 X ′ y um eine positiv-semidefinite Matrix B übertrifft. D. h. g ′ Bg ≥ 0 ∀g ∈ R3 .