Kapitel 3: Intervallschätzung, Hypothesentests, Prognose 3 Intervallschätzung, Hypothesentests und Prognose 3.1 Intervallschätzer • Bisher: Punktschätzung von Parametern, d.h. mit Hilfe der Daten wird ein wahrscheinlicher Wert für den unbekannten Parameter geschätzt. • Bei der Intervallschätzung wird ein Wertebereich geschätzt, der mit einer gewissen Wahrscheinlichkeit den wahren Parameter einschließt. • Die Verteilung der Parameter ist hier besonders wichtig. Wir treffen im Folgenden Annahme SR6, da daraus die Normalverteilung des KQ-Schätzers folgt. • Durch Umformung gewinnt man aus b2 eine standardnormalverteilte Zufallsvariable Z mit Erwartungswert 0 und Varianz 1: Z= b2 − β2 σ 2 / ∑ (x i − x) 2 ~ N(0, 1) (3.1.1) • Wir suchen die kritischen Werte Zc, so dass P(Z ≥ Zc) = P(Z ≤ -Zc) = α/2 bzw. P(- Zc ≤ Z ≤ Zc)= 1 - α. Lehrstuhl für Wirtschaftspolitik - SS 2011 1 Kapitel 3: Intervallschätzung, Hypothesentests, Prognose Abbildung 3.1a: Dichtefunktion der Standardnormalverteilung; Quelle: http://campus.unimuenster.de/fileadmin/einrichtung/imib/lehre/skripte/biomathe/bio/script7.html • Problem: Wir kennen σ² nicht, aber wir können es schätzen, σˆ 2 ∑ ê = 2 i N−2 . • Wir ersetzen σ² in (3.1.1) durch σ̂ und erhalten damit eine t-verteilte Wahrscheinlichkeitsverteilung 2 mit N-2 Freiheitsgraden: Lehrstuhl für Wirtschaftspolitik - SS 2011 2 Kapitel 3: Intervallschätzung, Hypothesentests, Prognose t= • Allgemein: b2 − β2 σˆ 2 / ∑ ( x i − x ) 2 = t= b2 − β2 vâr(b 2 ) = b2 − β2 se(b 2 ) ~t (N-2) b k − βk se(b k ) ~t (N-2) (3.1.2) (3.1.3) • Suche nach kritischen t-Werten, tc, so dass gilt P(t ≥ tc) = P(t ≤ -tc) = α/2 bzw. P(- tc ≤ t ≤ tc)= 1 – α (3.1.4) Quelle: Hill, Griffths, Lim (2008), S. 51. Lehrstuhl für Wirtschaftspolitik - SS 2011 3 Kapitel 3: Intervallschätzung, Hypothesentests, Prognose • Setzt man (3.1.2) in die Gleichung (3.1.4) ein, ergibt sich: b 2 − β2 P(- tc ≤ se(b ) ≤ tc) = 1 – α 2 P(b 2 − t c ⋅ se(b 2 ) ≤ β 2 ≤ b 2 + t c ⋅ se(b 2 )) = 1 − α (3.1.5) (3.1.6) Beispiel Lebensmittelausgaben: • Wir haben N=40 Beobachtungen, also N-2=40-2=38 Freiheitsgrade, b2=10,21 und se(b2) = 2,09. • Gesucht wird ein 95%-Konfidenzintervall, also α=0,05. • Tabellen 3.1 und 3.2 zeigen Ergebnisse wiederholter Stichproben. Lehrstuhl für Wirtschaftspolitik - SS 2011 4 Kapitel 3: Intervallschätzung, Hypothesentests, Prognose Quelle: Hill, Griffths, Lim (2008), S. 53. Lehrstuhl für Wirtschaftspolitik - SS 2011 5 Kapitel 3: Intervallschätzung, Hypothesentests, Prognose Quelle: Hill, Griffths, Lim (2008), S. 54. Lehrstuhl für Wirtschaftspolitik - SS 2011 6 Kapitel 3: Intervallschätzung, Hypothesentests, Prognose 3.2 Hypothesentests 3.2.1 Bestandteile eines Hypothesentests 1. Eine Nullhypothese H0 2. Eine Alternativhypothese H1 3. Eine Teststatistik 4. Ein Ablehnungsbereich 5. Eine Schlussfolgerung Lehrstuhl für Wirtschaftspolitik - SS 2011 7 Kapitel 3: Intervallschätzung, Hypothesentests, Prognose 3.2.2 Ablehnungsbereiche für die verschiedenen Alternativhypothesen a) Einseitiger Test – Alternativhypothese „größer als“ (>) • H0: ßk=c wird gegen die Alternativhypothese H1: ßk>c getestet. Ist H1 wahr, dann wird der Wert der tStatistik eher größer sein, als der unter der t-Verteilung erwartete. • Der kritische t-Wert tc, der die Wahrscheinlichkeit α am rechten Rand abgrenzt, entspricht dem (1α)-Perzentil t(1-α,N-2). Quelle: Hill, Griffths, Lim (2008), S. 57. Lehrstuhl für Wirtschaftspolitik - SS 2011 8 Kapitel 3: Intervallschätzung, Hypothesentests, Prognose Testentscheidung: bk − c = ≥ t (1− α , N − 2 ) t H0 kann abgelehnt werden, wenn se(b k ) b) Einseitiger Test – Alternativhypothese „kleiner als“ (<) • Ist H1: ßk<c wahr, dann wird der Wert der t-Statistik eher kleiner sein als der unter der t-Verteilung erwartete. Die Nullhypothese wird abgelehnt, wenn die Teststatistik kleiner ist als der kritische t-Wert für das Signifikanzniveau α. • Der kritische t-Wert tc, der die Wahrscheinlichkeit α am linken Rand abgrenzt, entspricht dem αPerzentil t(α,N-2). Da die t-Verteilung symmetrisch um Null ist, entspricht das α-Perzentil t(α,N-2) dem negativen Wert des (1-α)-Perzentils t(1-α,N-2). Lehrstuhl für Wirtschaftspolitik - SS 2011 9 Kapitel 3: Intervallschätzung, Hypothesentests, Prognose Quelle: Hill, Griffths, Lim (2008), S. 58. Testentscheidung: bk − c = ≤ t ( α , N −2) . t H0 kann abgelehnt werden, wenn se(b k ) Lehrstuhl für Wirtschaftspolitik - SS 2011 10 Kapitel 3: Intervallschätzung, Hypothesentests, Prognose c) Zweiseitiger Test – Alternativhypothese „ungleich“ (≠) • Ist H1: ßk≠c wahr, dann wird der Wert der t-Statistik im Vergleich zum erwarteten Wert unter der tVerteilung entweder sehr groß oder sehr klein sein. • Die kritischen t-Werte sind so definiert, dass die Wahrscheinlichkeit für die t-Statistik in einen der beiden Ränder zu fallen jeweils α/2 ist. Quelle: Hill, Griffths, Lim (2008), S. 58. Lehrstuhl für Wirtschaftspolitik - SS 2011 11 Kapitel 3: Intervallschätzung, Hypothesentests, Prognose Testentscheidung: bk − c bk − c t t = ≤ t = ≥ t (1−α / 2, N −2 ) . ( / 2 , N 2 ) α − oder H0 kann abgelehnt werden, wenn se(b k ) se(b k ) 3.2.3 Typ I und Typ II Fehler • Die Testentscheidung ist korrekt, wenn − die Nullhypothese falsch ist und verworfen wird, − die Nullhypothese wahr ist und nicht verworfen wird. • Die Testentscheidung ist nicht korrekt, wenn − die Nullhypothese wahr ist und verworfen wird (Typ I Fehler). Der Typ I Fehler geschieht mit Wahrscheinlichkeit α, dem Signifikanzniveau; − die Nullhypothese falsch ist und nicht verworfen wird (Typ II Fehler). Diese Fehlerwahrscheinlichkeit hängt vom wahren, unbeobachteten Parameterwert ab und kann deshalb nicht von uns direkt kontrolliert werden. Lehrstuhl für Wirtschaftspolitik - SS 2011 12 Kapitel 3: Intervallschätzung, Hypothesentests, Prognose 3.2.4 Der p-Wert • Alternativ kann auch der p-Wert für einen Hypothesentest herangezogen werden. • Der p-Wert eines Tests beschreibt die Wahrscheinlichkeit, dass die t-Verteilung einen Wert annimmt, der mindestens so groß (einseitig „>“), höchstens so groß (einseitig „<“) oder mindestens so groß wie der absolute Wert (zweiseitig) des Stichprobenwerts der t-Statistik ist. • Die Berechnung des p-Werts ist also abhängig von der Alternativhypothese: • falls H1: ßk > c, p = Wahrscheinlichkeit rechts von t • falls H1: ßk < c, p = Wahrscheinlichkeit links von t • falls H1: ßk ≠ c, p = Summe der Wahrscheinlichkeiten rechts von t und links von -t Für alle gilt die Testentscheidung: Wenn der p-Wert kleiner ist als das gewählte α, dann kann H0 abgelehnt werden. Beispiel Lebensmittelausgaben: Einseitiger Test „<“ • Wie in 3.2 testen wir: H0: ß2=15 vs. H1: ß2<15. Lehrstuhl für Wirtschaftspolitik - SS 2011 13 Kapitel 3: Intervallschätzung, Hypothesentests, Prognose Figure 3.6: The p-value for a left-tail test Quelle: Hill, Griffiths, Lim (2008), S. 66 Beispiel Lebensmittelausgaben: Zweiseitiger Signifikanztest • H0: ß2=0 vs. H1: ß2≠0 Lehrstuhl für Wirtschaftspolitik - SS 2011 14 Kapitel 3: Intervallschätzung, Hypothesentests, Prognose • Bei Schätzungen mit statistischen Programmen wird standardmäßig der p-Wert für den zweiseitigen Signifikanztest angegeben. Regressionsoutput: (Datensatz: food.dta) Source SS df MS Model Residual 190626.98 304505.173 1 38 190626.98 8013.29403 Total 495132.153 39 12695.6962 food_exp Coef. income _cons 10.20964 83.41601 Number of obs F( 1, 38) Prob > F R-squared Adj R-squared Root MSE Std. Err. t P>|t| 2.093263 43.41016 4.88 1.92 0.000 0.062 = = = = = = 40 23.79 0.0000 0.3850 0.3688 89.517 [95% Conf. Interval] 5.972052 -4.463272 14.44723 171.2953 Quelle: Eigene Berechnung Lehrstuhl für Wirtschaftspolitik - SS 2011 15 Kapitel 3: Intervallschätzung, Hypothesentests, Prognose 3.3 Prognosen mit dem KQ-Schätzer • Wir möchten für einen bestimmten Wert der erklärenden Variable, x0, den dazugehörigen Wert der abhängigen Variable, y0, wissen. • Wir nehmen an, dass SR1-SR6 gelten, so dass y0=ß1+ß2x0+e0 (3.3.1) • Die KQ-Vorhersage, ŷ0 , basiert auf der angepassten Regressionsgerade: ŷ= b1 + b 2 x 0 0 (3.3.2) • Um die Güte der Vorhersage einschätzen zu können, betrachten wir den Vorhersagefehler, der möglichst klein gehalten werden soll: f = y0 − yˆ 0 = (β1 + β2 x 0 + e0 ) − (b1 + b 2 x 0 ) (3.3.3) • Der Erwartungswert von f ist: E(f ) = β1 + β 2 x 0 + E(e 0 ) − [E(b1 ) + E(b 2 ) x 0 ] = β1 + β 2 x 0 + 0 − [β1 + β 2 x 0 ] =0 Lehrstuhl für Wirtschaftspolitik - SS 2011 (3.3.4) 16 Kapitel 3: Intervallschätzung, Hypothesentests, Prognose • Außerdem gilt: 1 (x 0 − x) 2 var(f ) = var( y 0 − ŷ 0 ) = var( ŷ 0 ) + var(e 0 ) = σ 1 + + 2 N ( x x ) − ∑ i 2 (3.3.5) • Die Varianz des Vorhersagefehlers kann geschätzt werden, indem σ2 durch den Schätzwert σ̂ 2 ersetzt wird: 1 (x 0 − x) 2 vâr(f ) = σˆ 1 + + 2 − N ( x x ) ∑ i 2 σˆ 2 = σˆ + + ( x 0 − x ) 2 vâr(b 2 ) N (3.3.6) 2 • Analog zum Intervallschätzer können wir mithilfe der t-Verteilung ein Vorhersageintervall bestimmen. ŷ0 ± t c ⋅ se(f ) Lehrstuhl für Wirtschaftspolitik - SS 2011 (3.3.7) 17 Kapitel 3: Intervallschätzung, Hypothesentests, Prognose Quelle: Hill, Griffths, Lim (2008), S. 78. Lehrstuhl für Wirtschaftspolitik - SS 2011 18