b) Einseitiger Test – Alternativhypothese - WiSo

Werbung
Kapitel 3: Intervallschätzung, Hypothesentests, Prognose
3 Intervallschätzung, Hypothesentests und Prognose
3.1 Intervallschätzer
• Bisher: Punktschätzung von Parametern, d.h. mit Hilfe der Daten wird ein wahrscheinlicher Wert für
den unbekannten Parameter geschätzt.
• Bei der Intervallschätzung wird ein Wertebereich geschätzt, der mit einer gewissen
Wahrscheinlichkeit den wahren Parameter einschließt.
• Die Verteilung der Parameter ist hier besonders wichtig. Wir treffen im Folgenden Annahme SR6, da
daraus die Normalverteilung des KQ-Schätzers folgt.
• Durch Umformung gewinnt man aus b2 eine standardnormalverteilte Zufallsvariable Z mit
Erwartungswert 0 und Varianz 1:
Z=
b2 − β2
σ 2 / ∑ (x i − x) 2
~ N(0, 1)
(3.1.1)
• Wir suchen die kritischen Werte Zc, so dass P(Z ≥ Zc) = P(Z ≤ -Zc) = α/2 bzw. P(- Zc ≤ Z ≤ Zc)= 1 - α.
Lehrstuhl für Wirtschaftspolitik - SS 2011
1
Kapitel 3: Intervallschätzung, Hypothesentests, Prognose
Abbildung 3.1a: Dichtefunktion der Standardnormalverteilung; Quelle: http://campus.unimuenster.de/fileadmin/einrichtung/imib/lehre/skripte/biomathe/bio/script7.html
• Problem: Wir kennen σ² nicht, aber wir können es schätzen, σˆ
2
∑ ê
=
2
i
N−2
.
• Wir ersetzen σ² in (3.1.1) durch σ̂ und erhalten damit eine t-verteilte Wahrscheinlichkeitsverteilung
2
mit N-2 Freiheitsgraden:
Lehrstuhl für Wirtschaftspolitik - SS 2011
2
Kapitel 3: Intervallschätzung, Hypothesentests, Prognose
t=
• Allgemein:
b2 − β2
σˆ 2 / ∑ ( x i − x ) 2
=
t=
b2 − β2
vâr(b 2 )
=
b2 − β2
se(b 2 ) ~t (N-2)
b k − βk
se(b k ) ~t (N-2)
(3.1.2)
(3.1.3)
• Suche nach kritischen t-Werten, tc, so dass gilt P(t ≥ tc) = P(t ≤ -tc) = α/2 bzw.
P(- tc ≤ t ≤ tc)= 1 – α
(3.1.4)
Quelle: Hill, Griffths, Lim (2008), S. 51.
Lehrstuhl für Wirtschaftspolitik - SS 2011
3
Kapitel 3: Intervallschätzung, Hypothesentests, Prognose
• Setzt man (3.1.2) in die Gleichung (3.1.4) ein, ergibt sich:
b 2 − β2
P(- tc ≤ se(b ) ≤ tc) = 1 – α
2
P(b 2 − t c ⋅ se(b 2 ) ≤ β 2 ≤ b 2 + t c ⋅ se(b 2 )) = 1 − α
(3.1.5)
(3.1.6)
Beispiel Lebensmittelausgaben:
• Wir haben N=40 Beobachtungen, also N-2=40-2=38 Freiheitsgrade, b2=10,21 und se(b2) = 2,09.
• Gesucht wird ein 95%-Konfidenzintervall, also α=0,05.
• Tabellen 3.1 und 3.2 zeigen Ergebnisse wiederholter Stichproben.
Lehrstuhl für Wirtschaftspolitik - SS 2011
4
Kapitel 3: Intervallschätzung, Hypothesentests, Prognose
Quelle: Hill, Griffths, Lim (2008), S. 53.
Lehrstuhl für Wirtschaftspolitik - SS 2011
5
Kapitel 3: Intervallschätzung, Hypothesentests, Prognose
Quelle: Hill, Griffths, Lim (2008), S. 54.
Lehrstuhl für Wirtschaftspolitik - SS 2011
6
Kapitel 3: Intervallschätzung, Hypothesentests, Prognose
3.2 Hypothesentests
3.2.1 Bestandteile eines Hypothesentests
1. Eine Nullhypothese H0
2. Eine Alternativhypothese H1
3. Eine Teststatistik
4. Ein Ablehnungsbereich
5. Eine Schlussfolgerung
Lehrstuhl für Wirtschaftspolitik - SS 2011
7
Kapitel 3: Intervallschätzung, Hypothesentests, Prognose
3.2.2 Ablehnungsbereiche für die verschiedenen Alternativhypothesen
a) Einseitiger Test – Alternativhypothese „größer als“ (>)
• H0: ßk=c wird gegen die Alternativhypothese H1: ßk>c getestet. Ist H1 wahr, dann wird der Wert der tStatistik eher größer sein, als der unter der t-Verteilung erwartete.
• Der kritische t-Wert tc, der die Wahrscheinlichkeit α am rechten Rand abgrenzt, entspricht dem (1α)-Perzentil t(1-α,N-2).
Quelle: Hill, Griffths, Lim (2008), S. 57.
Lehrstuhl für Wirtschaftspolitik - SS 2011
8
Kapitel 3: Intervallschätzung, Hypothesentests, Prognose
Testentscheidung:
bk − c
=
≥ t (1− α , N − 2 )
t
H0 kann abgelehnt werden, wenn
se(b k )
b) Einseitiger Test – Alternativhypothese „kleiner als“ (<)
• Ist H1: ßk<c wahr, dann wird der Wert der t-Statistik eher kleiner sein als der unter der t-Verteilung
erwartete. Die Nullhypothese wird abgelehnt, wenn die Teststatistik kleiner ist als der kritische t-Wert
für das Signifikanzniveau α.
• Der kritische t-Wert tc, der die Wahrscheinlichkeit α am linken Rand abgrenzt, entspricht dem αPerzentil t(α,N-2). Da die t-Verteilung symmetrisch um Null ist, entspricht das α-Perzentil t(α,N-2) dem
negativen Wert des (1-α)-Perzentils t(1-α,N-2).
Lehrstuhl für Wirtschaftspolitik - SS 2011
9
Kapitel 3: Intervallschätzung, Hypothesentests, Prognose
Quelle: Hill, Griffths, Lim (2008), S. 58.
Testentscheidung:
bk − c
=
≤ t ( α , N −2) .
t
H0 kann abgelehnt werden, wenn
se(b k )
Lehrstuhl für Wirtschaftspolitik - SS 2011
10
Kapitel 3: Intervallschätzung, Hypothesentests, Prognose
c) Zweiseitiger Test – Alternativhypothese „ungleich“ (≠)
• Ist H1: ßk≠c wahr, dann wird der Wert der t-Statistik im Vergleich zum erwarteten Wert unter der tVerteilung entweder sehr groß oder sehr klein sein.
• Die kritischen t-Werte sind so definiert, dass die Wahrscheinlichkeit für die t-Statistik in einen der
beiden Ränder zu fallen jeweils α/2 ist.
Quelle: Hill, Griffths, Lim (2008), S. 58.
Lehrstuhl für Wirtschaftspolitik - SS 2011
11
Kapitel 3: Intervallschätzung, Hypothesentests, Prognose
Testentscheidung:
bk − c
bk − c
t
t
=
≤
t
=
≥ t (1−α / 2, N −2 ) .
(
/
2
,
N
2
)
α
−
oder
H0 kann abgelehnt werden, wenn
se(b k )
se(b k )
3.2.3 Typ I und Typ II Fehler
• Die Testentscheidung ist korrekt, wenn
−
die Nullhypothese falsch ist und verworfen wird,
−
die Nullhypothese wahr ist und nicht verworfen wird.
• Die Testentscheidung ist nicht korrekt, wenn
−
die Nullhypothese wahr ist und verworfen wird (Typ I Fehler). Der Typ I Fehler geschieht
mit Wahrscheinlichkeit α, dem Signifikanzniveau;
−
die Nullhypothese falsch ist und nicht verworfen wird (Typ II Fehler). Diese
Fehlerwahrscheinlichkeit hängt vom wahren, unbeobachteten Parameterwert ab und kann
deshalb nicht von uns direkt kontrolliert werden.
Lehrstuhl für Wirtschaftspolitik - SS 2011
12
Kapitel 3: Intervallschätzung, Hypothesentests, Prognose
3.2.4 Der p-Wert
• Alternativ kann auch der p-Wert für einen Hypothesentest herangezogen werden.
• Der p-Wert eines Tests beschreibt die Wahrscheinlichkeit, dass die t-Verteilung einen Wert annimmt,
der mindestens so groß (einseitig „>“), höchstens so groß (einseitig „<“) oder mindestens so groß wie
der absolute Wert (zweiseitig) des Stichprobenwerts der t-Statistik ist.
• Die Berechnung des p-Werts ist also abhängig von der Alternativhypothese:
• falls H1: ßk > c, p = Wahrscheinlichkeit rechts von t
• falls H1: ßk < c, p = Wahrscheinlichkeit links von t
• falls H1: ßk ≠ c, p = Summe der Wahrscheinlichkeiten rechts von t und links von -t
Für alle gilt die Testentscheidung:
Wenn der p-Wert kleiner ist als das gewählte α, dann kann H0 abgelehnt werden.
Beispiel Lebensmittelausgaben: Einseitiger Test „<“
• Wie in 3.2 testen wir: H0: ß2=15 vs. H1: ß2<15.
Lehrstuhl für Wirtschaftspolitik - SS 2011
13
Kapitel 3: Intervallschätzung, Hypothesentests, Prognose
Figure 3.6: The p-value for a left-tail test
Quelle: Hill, Griffiths, Lim (2008), S. 66
Beispiel Lebensmittelausgaben: Zweiseitiger Signifikanztest
• H0: ß2=0 vs. H1: ß2≠0
Lehrstuhl für Wirtschaftspolitik - SS 2011
14
Kapitel 3: Intervallschätzung, Hypothesentests, Prognose
• Bei Schätzungen mit statistischen Programmen wird standardmäßig der p-Wert für den zweiseitigen
Signifikanztest angegeben.
Regressionsoutput: (Datensatz: food.dta)
Source
SS
df
MS
Model
Residual
190626.98
304505.173
1
38
190626.98
8013.29403
Total
495132.153
39
12695.6962
food_exp
Coef.
income
_cons
10.20964
83.41601
Number of obs
F( 1,
38)
Prob > F
R-squared
Adj R-squared
Root MSE
Std. Err.
t
P>|t|
2.093263
43.41016
4.88
1.92
0.000
0.062
=
=
=
=
=
=
40
23.79
0.0000
0.3850
0.3688
89.517
[95% Conf. Interval]
5.972052
-4.463272
14.44723
171.2953
Quelle: Eigene Berechnung
Lehrstuhl für Wirtschaftspolitik - SS 2011
15
Kapitel 3: Intervallschätzung, Hypothesentests, Prognose
3.3 Prognosen mit dem KQ-Schätzer
• Wir möchten für einen bestimmten Wert der erklärenden Variable, x0, den dazugehörigen Wert der
abhängigen Variable, y0, wissen.
• Wir nehmen an, dass SR1-SR6 gelten, so dass
y0=ß1+ß2x0+e0
(3.3.1)
• Die KQ-Vorhersage, ŷ0 , basiert auf der angepassten Regressionsgerade:
ŷ=
b1 + b 2 x 0
0
(3.3.2)
• Um die Güte der Vorhersage einschätzen zu können, betrachten wir den Vorhersagefehler, der
möglichst klein gehalten werden soll:
f = y0 − yˆ 0 = (β1 + β2 x 0 + e0 ) − (b1 + b 2 x 0 )
(3.3.3)
• Der Erwartungswert von f ist:
E(f ) = β1 + β 2 x 0 + E(e 0 ) − [E(b1 ) + E(b 2 ) x 0 ]
= β1 + β 2 x 0 + 0 − [β1 + β 2 x 0 ]
=0
Lehrstuhl für Wirtschaftspolitik - SS 2011
(3.3.4)
16
Kapitel 3: Intervallschätzung, Hypothesentests, Prognose
• Außerdem gilt:
 1
(x 0 − x) 2 
var(f ) = var( y 0 − ŷ 0 ) = var( ŷ 0 ) + var(e 0 ) = σ 1 + +
2 
N
(
x
x
)
−
∑ i


2
(3.3.5)
• Die Varianz des Vorhersagefehlers kann geschätzt werden, indem σ2 durch den Schätzwert
σ̂ 2 ersetzt wird:
 1
(x 0 − x) 2 
vâr(f ) = σˆ 1 + +
2
−
N
(
x
x
)
∑ i


2
σˆ 2
= σˆ +
+ ( x 0 − x ) 2 vâr(b 2 )
N
(3.3.6)
2
• Analog zum Intervallschätzer können wir mithilfe der t-Verteilung ein Vorhersageintervall
bestimmen.
ŷ0 ± t c ⋅ se(f )
Lehrstuhl für Wirtschaftspolitik - SS 2011
(3.3.7)
17
Kapitel 3: Intervallschätzung, Hypothesentests, Prognose
Quelle: Hill, Griffths, Lim (2008), S. 78.
Lehrstuhl für Wirtschaftspolitik - SS 2011
18
Herunterladen