7. Hypothesentests - wiwi.uni

Werbung
7. Hypothesentests
Ausgangssituation erneut:
• ZV X repräsentiere einen Zufallsvorgang
• X habe die unbekannte VF FX (x)
• Interessieren uns für einen unbekannten Parameter θ der Verteilung von X
350
Bisher:
• Versuch, unbekannten Parameter θ mit einer Stichprobe
X1, . . . , Xn zu schätzen
(Punktschätzung, Intervallschätzung)
Jetzt:
• Testen von Hypothesen über unbekanntes θ anhand einer
Stichprobe X1, . . . , Xn
Man beachte:
• Testprobleme spielen in der empirischen Wirtschaftsforschung
eine zentrale Rolle
351
Beispiel 1:
• In einer Studentenkneipe sollen geeichte Biergläser im Ausschank 0.4 Liter Bier enthalten. Wir haben die Vermutung,
dass der Wirt häufig ’zu wenig’ ausschenkt.
• X repräsentiere den Zufallsvorgang ’Füllen eines 0.4-Liter
Bierglases durch den Wirt’
• Es bezeichne θ = E(X) die erwartete Füllmenge eines Glases
• Durch eine Stichprobe X1, . . . , Xn soll getestet werden
θ = 0.4
gegen
θ < 0.4
352
Beispiel 2:
• Wir wissen aus der Vergangenheit, dass das Risiko einer Aktie
(die Standardabweichung der Aktienrenditen) bei 25 % lag.
Im Unternehmen wird nun das Management ausgetauscht.
Verändert sich dadurch das Risiko der Aktie?
• X sei die Aktienrendite
• θ = σ(X) sei die Standardabweichung der Renditen
• Durch eine Stichprobe X1, . . . , Xn soll getestet werden
θ = 0.25
gegen
θ 6= 0.25
353
7.1 Grundbegriffe des Testens
Definition 7.1: (Parametertest)
Es sei X eine Zufallsvariable und θ ein unbekannter Parameter
der Verteilung von X. Ein Parametertest ist ein statistisches
Verfahren, mit dem eine Hypothese über den unbekannten Parameter θ anhand einer einfachen Zufallsstichprobe X1, . . . , Xn
aus X überprüft wird.
Formulierung eines statistischen Testproblems: [I]
• Es sei Θ die Menge aller möglichen Parameterwerte
(d.h. θ ∈ Θ)
• Es sei Θ0 ⊂ Θ eine Teilmenge der Parametermenge
354
Formulierung eines statistischen Testproblems: [II]
• Betrachte folgende Aussagen:
H0 : θ ∈ Θ0
gegen
H1 : θ ∈ Θ/Θ0 = Θ1
• H0 heißt Nullhypothese, H1 Gegenhypothese oder Alternative
Wichtig:
• Bei der Formulierung eines Testproblems müssen sich Nullhypothese und Alternative gegenseitig ausschließen
355
Arten von Hypothesen:
• Sind |Θ0| = 1 (d.h. Θ0 = {θ0}) und H0 : θ = θ0, so nennt
man H0 einfach
• Andernfalls bezeichnet man H0 als zusammengesetzt
• Analoge Bezeichnungen gelten für H1
356
Arten von Testproblemen:
• Es sei θ0 ∈ Θ eine feste reelle Zahl. Dann heißt
H0 : θ = θ 0
gegen
H1 : θ =
6 θ0
H0 : θ ≤ θ 0
gegen
H1 : θ > θ0
H0 : θ ≥ θ 0
gegen
H1 : θ < θ0
zweiseitiges Testproblem
• Die Testprobleme
bzw.
heißen einseitig (rechts- bzw. linksseitig)
357
Jetzt:
• Betrachte das allgemeine Testproblem
H 0 : θ ∈ Θ0
gegen
H1 : θ ∈ Θ1 = Θ/Θ0
Allgemeine Vorgehensweise:
• Entscheide anhand einer Stichprobe X1, . . . , Xn aus X, ob H0
zugunsten von H1 abgelehnt wird oder nicht
358
Explizites Vorgehen:
• Wähle ’geeignete’ Teststatistik T (X1, . . . , Xn) und bestimme
einen ’geeigneten’ kritischen Bereich K ⊂ R
• Testentscheidung:
T (X1, . . . , Xn) ∈ K =⇒ H0 wird abgelehnt
/ K =⇒ H0 wird nicht abgelehnt
T (X1, . . . , Xn) ∈
Man beachte:
• T (X1, . . . , Xn) ist eine ZV (Stichprobenfunktion)
−→ Die Testentscheidung ist zufällig
−→ Fehlentscheidungen sind möglich
359
Mögliche Fehlentscheidungen:
Realität
H0 richtig
H0 falsch
Testergebnis
H0 ablehnen H0 nicht ablehnen
Fehler 1. Art
kein Fehler
Fehler 2. Art
kein Fehler
Fazit:
• Fehler 1. Art: Test lehnt H0 ab, obwohl H0 richtig
• Fehler 2. Art: Test lehnt H0 nicht ab, obwohl H0 falsch
360
Wann treten die Fehlentscheidungen auf?
• Der Fehler 1. Art tritt auf, falls
T (X1, . . . , Xn) ∈ K,
obwohl für den wahren Parameter gilt θ ∈ Θ0
• Der Fehler 2. Art tritt auf, falls
/ K,
T (X1, . . . , Xn) ∈
obwohl für den wahren Parameter gilt θ ∈ Θ1
361
Frage:
• Wann besitzt ein statistischer Test für das Problem
H0 : θ ∈ Θ 0
’gute’ Eigenschaften?
gegen
H1 : θ ∈ Θ1 = Θ/Θ0
Intuitive Vorstellung:
• Test ist ’gut’, wenn er möglichst geringe Wahrscheinlichkeiten
für die Fehler 1. und 2. Art aufweist
Jetzt:
• Formales Instrument zur Messung der Fehlerwahrscheinlichkeiten 1. und 2. Art
362
Definition 7.2: (Gütefunktion eines Tests)
Man betrachte einen statistischen Test für das obige Testproblem mit der Teststatistik T (X1, . . . , Xn) und einem ’geeignet gewählten’ kritischen Bereich K. Unter der Gütefunktion des Tests
versteht man die Funktion G, die, in Abhängigkeit des wahren
Parameters θ ∈ Θ, die Wahrscheinlichkeit dafür angibt, dass der
Test H0 ablehnt:
G : Θ −→ [0, 1]
mit
G(θ) = P (T (X1, . . . , Xn) ∈ K).
363
Bemerkung:
• Mit der Gütefunktion sind die Wahrscheinlichkeiten für den
Fehler 1. Art gegeben durch
G(θ)
für alle θ ∈ Θ0
sowie für den Fehler 2. Art durch
1 − G(θ)
für alle θ ∈ Θ1
Intuitive Vorstellung eines idealen Tests:
• Ein Test ist ideal, wenn die Fehlerwahrscheinlichkeiten 1. und
2. Art stets (konstant) gleich Null sind
−→ Test trifft mit Wskt. 1 die richtige Entscheidung
364
Beispiel:
• Es sei θ0 ∈ Θ. Betrachte das Testproblem
H 0 : θ ≤ θ0
gegen
H1 : θ > θ 0
Gütefunktion eines idealen Tests
365
Leider:
• Es kann mathematisch gezeigt werden, dass ein solcher idealer Test im allgemeinen nicht existiert
Praktische Vorgehnsweise: [I]
• Betrachte für eine geeignete Teststatistik T (X1, . . . , Xn) die
maximale Fehlerwahrscheinlichkeit 1. Art
α = max {P (T (X1, . . . , Xn) ∈ K)} = max {G(θ)}
θ∈Θ0
θ∈Θ0
• Lege den kritischen Bereich K dann so fest, dass α einen
vorgegebenen kleinen Wert animmt
366
Praktische Vorgehnsweise: [II]
−→ Alle Fehlerwahrscheinlichkeiten 1. Art sind dann durch α begrenzt (d.h. kleiner oder gleich α)
• Häufig benutzte α-Werte sind α = 0.01, α = 0.05, α = 0.1
Definition 7.3: (Signifikanzniveau eines Tests)
Man betrachte einen statistischen Test für das Testproblem auf
Folie 358 mit der Teststatistik T (X1, . . . , Xn) und einem geeignet
gewählten kritischen Bereich K. Dann bezeichnet man die maximale Fehlerwahrscheinlichkeit 1. Art
α = max {P (T (X1, . . . , Xn) ∈ K)} = max {G(θ)}
θ∈Θ0
θ∈Θ0
als das Signifikanzniveau des Tests.
367
Konsequenzen dieser Testkonstruktion: [I]
• Die Wskt., H0 aufgrund des Tests abzulehmen, obwohl H0
richtig ist (d.h. die Wskt. für den Fehler 1. Art) ist höchstens
α (mit α = 0.01, 0.05, 0.1)
−→ Wird H0 aufgrund einer Testrealisation abgelehnt, so kann
man ziemlich sicher davon ausgehen, dass H0 tatsächlich
falsch ist
(Man sagt auch: H1 ist statistisch gesichert)
368
Konsequenzen dieser Testkonstruktion: [II]
• Die Wskt. für den Fehler 2. Art (d.h. H0 nicht abzulehnen,
obwohl H0 falsch ist), kann man dagegen nicht kontrollieren
−→ Wird H0 aufgrund einer Testrealisation nicht abgelehnt,
so hat man keinerlei Wahrscheinlichkeitsaussage über eine
mögliche Fehlentscheidung
(Nichtablehung von H0 heißt nur: Die Daten sind nicht
unvereinbar mit H0)
Wichtig deshalb:
• Es ist entscheidend, wie man H0 und H1 formuliert
• Das, was man zu zeigen hofft, formuliert man in H1
(in der Hoffnung, H0 anhand des konkreten Tests ablehnen
zu können)
369
Beispiel:
• Betrachte Beispiel 1 auf Folie 352
• Kann man anhand eines konkreten Tests H0 verwerfen, so
kann man ziemlich sicher sein, dass der Wirt in der Regel zu
wenig ausschenkt
• Kann man H0 nicht verwerfen, so kann man nichts explizites
über die Ausschankgewohnheiten des Wirtes sagen.
(Die Daten stehen lediglich nicht im Widerspruch zu H0)
370
7.2 Tests für Erwartungswerte
Situation:
• Der interessierende Zufallsvorgang X sei normalverteilt, d.h.
X ∼ N (µ, σ 2),
wobei µ unbekannt und σ 2 bekannt sein sollen
(vgl. Konfindenzintervall 1, Folie 338)
• Betrachte für gegebenes µ0 ∈ R das Testproblem:
H0 : µ = µ0
gegen
H1 : µ 6= µ0
371
Testkonstruktion:
• Suche eine geeignete Teststatistik T (X1, . . . , Xn)
• Lege den kritischen Bereich K fest
Geeignete Teststatistik lautet:
T (X1, . . . , Xn) =
√
X − µ0
n·
σ
Begründungen:
• T (X1, . . . , Xn) schätzt im wesentlichen den Abstand zwischen
dem unbekannten Parameter µ und dem Vergleichswert µ0
• Wenn H0 gültig ist (d.h. falls µ = µ0), dann gilt
T (X1, . . . , Xn) ∼ N (0, 1)
(vgl. Satz 5.5(b), Folie 310)
372
N (0, 1)-Dichte der Teststatistik T (X1 , . . . , Xn ) im Falle der Gültigkeit von H0
N(0,1)-Dichte von T unter H0
α/2
α/2
uα / 2
(= − u1−α / 2)
0
u1−α / 2
373
Explizite Testregel:
• Lege das Signifikanzniveau α fest
• Wähle den kritischen Bereich als
K = (−∞, −u1−α/2) ∪ (u1−α/2, +∞) = {t ∈ R : |t| > u1−α/2}
d.h.
Lehne H0 ab, falls T (X1, . . . , Xn) ∈ K
/K
Lehne H0 nicht ab, falls T (X1, . . . , Xn) ∈
374
Beispiel: [I]
• Es sei X ∼ N (µ, 4) das tatsächliche Gewicht (in Gramm)
einer 200g-Tafel Schokolade
(vgl. Beispiel auf Folie 342)
• Statistisches Testproblem
H0 : µ = 200
gegen
H1 : µ =
6 200
• Wert der Teststatistik:
√ 200.7625 − 200
√ x − µ0
= 8·
= 1.078
T (x1, . . . , xn) = n ·
σ
2
375
Beispiel: [II]
• Für das Signifikanzniveau α = 0.05 gilt:
u1−α/2 = u0.975 = 1.96
• Offensichtlich ist
T (x1, . . . , xn) = 1.078 ∈
/ (−∞, −1.96) ∪ (1.96, +∞) = K
−→ Für α = 0.05 wird H0 nicht abgelehnt
(Daten sind nicht unvereinbar mit H0)
376
Gütefunktion des Tests zum Signifikanzniveau α = 0.05
1.0
n = 1000
0.8
n = 20
0.6
G(µ)
0.4
0.2
0.0
198
n=8
199
200
201
202
µ
Bemerkungen:
• Test wird mit zunehmendem n immer trennschärfer
• Der vorgestellte Test heißt zweiseitiger Gaußtest
377
Jetzt:
• 2 zweiseitige Tests für den Erwartungswert in der Situation
X ∼ N (µ, σ 2), bei bekannter Varianz σ 2
(ohne Herleitung)
1. Rechtsseitiger Gaußtest: [I] (µ0 ∈ R fest gegeben)
H0 : µ ≤ µ0
gegen
H1 : µ > µ 0
• Teststatistik ist erneut
√ X − µ0
T (X1, . . . , Xn) = n ·
σ
378
1. Rechtsseitiger Gaußtest: [II]
• Kritischer Bereich zum Signifikanzniveau α ist
K = (u1−α, +∞)
(u1−α ist (1 − α)-Quantil der N (0, 1)-Verteilung)
−→ Lehne H0 zum Signifikanzniveau α ab, falls
T (X1, . . . , Xn) > u1−α
379
2. Linksseitiger Gaußtest: (µ0 ∈ R fest gegeben)
H0 : µ ≥ µ0
gegen
H1 : µ < µ0
• Teststatistik ist wiederum
√ X − µ0
T (X1, . . . , Xn) = n ·
σ
• Kritischer Bereich zum Signifikanzniveau α ist
K = (−∞, −u1−α)
(−u1−α = uα ist α-Quantil der N (0, 1)-Verteilung)
−→ Lehne H0 zum Signifikanzniveau α ab, falls
T (X1, . . . , Xn) < −u1−α = uα
380
Beispiel: [I]
• Es sei X ∼ N (µ, 4) das tatsächliche Gewicht (in Gramm)
einer 200g-Tafel Schokolade mit der konkreten Stichprobe
von Folie 342
• Statistisches Testproblem:
H0 : µ ≤ 198
gegen
H1 : µ > 198
• Für die konkrete Stichprobe gilt
√ 200.7625 − 198
√ x − µ0
T (x1, . . . , xn) = n ·
= 8·
= 3.9068
σ
2
381
Beispiel: [II]
• Zum Signifikanzniveau α = 0.05 ergibt sich der kritische
Bereich als
K = (u0.95, +∞) = (1.6449, +∞)
• Also folgt
T (x1, . . . , xn) = 3.9068 > 1.6449 = u0.95
−→ Lehne H0 zum Signifikanzniveau α = 0.05 ab
382
Jetzt:
• Tests für den Erwartungswert einer Normalverteilung bei unbekannter Varianz, d.h.
X ∼ N (µ, σ 2)
mit unbekannten µ und σ 2
• Betrachte für µ0 ∈ R zunächst den 2-seitigen Test
H 0 : µ = µ0
gegen
H1 : µ 6= µ0
383
Geeignete Teststatistik:
T (X1, . . . , Xn) =
√
X − µ0
n−1·
S
Begründungen:
• T (X1, . . . , Xn) schätzt im wesentlichen den Abstand zwischen
unbekanntem µ und dem Vergleichswert µ0
• Wenn H0 richtig ist (d.h. falls µ = µ0), dann gilt
T (X1, . . . , Xn) ∼ t(n − 1)
(vgl. Satz 5.5(c), Folie 311)
384
Herleitung des kritischen Bereiches:
• Analoges Vorgehen wie beim zweiseitigen Gaußtest, nur mit
t(n − 1)- anstatt mit der N (0, 1)-Verteilung
• Kritischer Bereich ist
K = (−∞, −tn−1,1−α/2) ∪ (tn−1,1−α/2, +∞)
= {t ∈ R : |t| > tn−1,1−α/2}
d.h.
Lehne H0 ab, falls T (X1, . . . , Xn) ∈ K
Lehne H0 nicht ab, falls T (X1, . . . , Xn) ∈
/K
385
Bemerkungen: [I]
• Dieser Test heißt zweiseitiger t-Test
• Für den rechtsseitigen t-Test
H0 : µ ≤ µ0
gegen
H1 : µ > µ 0
ergibt sich bei Benutzung der Teststatistik
√
X − µ0
T (X1, . . . , Xn) = n − 1 ·
S
zum Signifikanzniveau α der kritische Bereich
K = (tn−1,1−α, +∞)
386
Bemerkungen: [II]
• Für den linksseitigen t-Test
H0 : µ ≥ µ 0
gegen
H1 : µ < µ 0
ergibt sich bei Benutzung der Teststatistik
√
X − µ0
T (X1, . . . , Xn) = n − 1 ·
S
zum Signifikanzniveau α der kritische Bereich
K = (−∞, −tn−1,1−α)
387
Beispiel:
• Es sei X ∼ N (µ, σ 2) mit unbekannten µ und σ 2
• Betrachte zweiseitigen t-Test mit µ0 = 6 z.N. α = 0.05
• Einfache Stichprobe mit n = 8 Werten ergibt:
1.6611
3.6215
4.5674
7.6635
1.2770
2.6660
5.3406
3.8029
• Wert der Teststatistik:
√ 3.8250 − 6
√
x − µ0
= −2.9633
= 7·
t= n−1·
s
1.9411
• Es gilt: |t| = 2.9633 > 2.3646 = t7,0.975
−→ Ablehnung von H0
388
7.3 Tests für Varianzen
Situation:
• Der interessierende Zufallsvorgang sei normalverteilt, d.h.
X ∼ N (µ, σ 2),
wobei sowohl µ als auch σ 2 unbekannt sein sollen
• Betrachte für geg. σ02 ∈ R das zweiseitige Testproblem
H0 : σ 2 = σ02
gegen
H1 : σ 2 6= σ02
389
Geeignete Teststatistik lautet:
T (X1, . . . , Xn) =
n · S2
σ02
=
!2
n X
Xi − X
i=1
σ0
Begründungen:
• T (X1, . . . , Xn) schätzt im wesentlichen das Verhältnis zwischen unbekannter Varianz σ 2 und dem Vergleichswert σ02
• Wenn H0 gültig ist (d.h. falls σ 2 = σ02), dann gilt:
T (X1, . . . , Xn) ∼ χ2(n − 1)
(vgl. Satz 5.5(e), Folie 311)
390
χ2(3)-Dichte von T (X1, . . . , Xn) bei Gültigkeit von H0
0.25
0.20
χ2-Dichte von T unter H0
0.15
0.10
0.05
0.00
0
2
4
6
8
10
12
14
391
Bezeichnung:
• Das p-Quantil der χ2(ν)-Verteilung wird in Mosler / Schmid
mit χ2
ν,p bezeichnet
• Kritischer Bereich ist
2
K = [0, χ2
∪
)
(χ
n−1,α/2
n−1,1−α/2 , +∞)
d.h.
2
oder
Lehne H0 ab, falls T < χ2
T
>
χ
n−1,1−α/2
n−1,α/2
2
Lehne H0 nicht ab, falls T ∈ [χ2
,
χ
n−1,α/2 n−1,1−α/2 ]
392
Bemerkungen: [I]
• Die Dichte der χ2(ν)-Verteilung ist nicht symmetrisch, d.h.
2
χ2
ν,p 6= −χν,1−p
• Für den rechtsseitigen Varianztest
H0 : σ 2 ≤ σ02
gegen
H1 : σ 2 > σ02
ergibt sich bei Benutzung der Teststatistik
T (X1, . . . , Xn) =
n · S2
σ02
=
!2
n X
Xi − X
i=1
σ0
zum Signifikanzniveau α der kritische Bereich
2
, +∞)
K = (χn−1,1−α
(d.h. verwerfe H0, falls T > χ2
n−1,1−α)
393
Bemerkungen: [II]
• Für den linksseitigen Varianztest
H0 : σ 2 ≥ σ02
H1 : σ 2 < σ02
gegen
ergibt sich bei Benutzung der Teststatistik
T (X1, . . . , Xn) =
n · S2
σ02
=
!2
n X
Xi − X
i=1
σ0
zum Signifikanzniveau α der kritische Bereich
2
)
K = [0, χn−1,α
(d.h. verwerfe H0, falls T < χ2
n−1,α)
394
Bemerkungen: [III]
• Falls der E-Wert µ der Normalverteilung bekannt ist, verwende die Teststatistik
T (X1, . . . , Xn) =
!2
n
X Xi − µ
i=1
σ0
und die Quantile der χ2(n)-Verteilung
(vgl. Satz 5.5(d), Folie 311)
395
Beispiel: [I]
• Gegeben seien folgende Messungen aus einer Normalverteilung
(µ, σ 2 unbekannt):
1001, 1003, 1035, 998, 1010, 1007, 1012
• Man betrachte den folgenden Test z.N. α = 0.05:
H0 : σ 2 ≤ 100
• Es gilt:
gegen
H1 : σ 2 > 100
n · S2
7 · 129.96
T (x1, . . . , xn) =
=
= 9.0972
2
100
σ0
396
Beispiel: [II]
• Für α = 0.05 findet man das Quantil χ2
6,0.95 = 12.592
• Es folgt:
T (x1, . . . , xn) = 9.0972 < 12.592 = χ2
6,0.95
−→ H0 kann nicht verworfen werden
397
Herunterladen