7. Hypothesentests - wiwi.uni

7. Hypothesentests
Ausgangssituation erneut:
• ZV X repräsentiere einen Zufallsvorgang
• X habe die unbekannte VF FX (x)
• Interessieren uns für einen unbekannten Parameter θ der Verteilung von X
350
Bisher:
• Versuch, unbekannten Parameter θ mit einer Stichprobe
X1, . . . , Xn zu schätzen
(Punktschätzung, Intervallschätzung)
Jetzt:
• Testen von Hypothesen über unbekanntes θ anhand einer
Stichprobe X1, . . . , Xn
Man beachte:
• Testprobleme spielen in der empirischen Wirtschaftsforschung
eine zentrale Rolle
351
Beispiel 1:
• In einer Studentenkneipe sollen geeichte Biergläser im Ausschank 0.4 Liter Bier enthalten. Wir haben die Vermutung,
dass der Wirt häufig ’zu wenig’ ausschenkt.
• X repräsentiere den Zufallsvorgang ’Füllen eines 0.4-Liter
Bierglases durch den Wirt’
• Es bezeichne θ = E(X) die erwartete Füllmenge eines Glases
• Durch eine Stichprobe X1, . . . , Xn soll getestet werden
θ = 0.4
gegen
θ < 0.4
352
Beispiel 2:
• Wir wissen aus der Vergangenheit, dass das Risiko einer Aktie
(die Standardabweichung der Aktienrenditen) bei 25 % lag.
Im Unternehmen wird nun das Management ausgetauscht.
Verändert sich dadurch das Risiko der Aktie?
• X sei die Aktienrendite
• θ = σ(X) sei die Standardabweichung der Renditen
• Durch eine Stichprobe X1, . . . , Xn soll getestet werden
θ = 0.25
gegen
θ 6= 0.25
353
7.1 Grundbegriffe des Testens
Definition 7.1: (Parametertest)
Es sei X eine Zufallsvariable und θ ein unbekannter Parameter
der Verteilung von X. Ein Parametertest ist ein statistisches
Verfahren, mit dem eine Hypothese über den unbekannten Parameter θ anhand einer einfachen Zufallsstichprobe X1, . . . , Xn
aus X überprüft wird.
Formulierung eines statistischen Testproblems: [I]
• Es sei Θ die Menge aller möglichen Parameterwerte
(d.h. θ ∈ Θ)
• Es sei Θ0 ⊂ Θ eine Teilmenge der Parametermenge
354
Formulierung eines statistischen Testproblems: [II]
• Betrachte folgende Aussagen:
H0 : θ ∈ Θ0
gegen
H1 : θ ∈ Θ/Θ0 = Θ1
• H0 heißt Nullhypothese, H1 Gegenhypothese oder Alternative
Wichtig:
• Bei der Formulierung eines Testproblems müssen sich Nullhypothese und Alternative gegenseitig ausschließen
355
Arten von Hypothesen:
• Sind |Θ0| = 1 (d.h. Θ0 = {θ0}) und H0 : θ = θ0, so nennt
man H0 einfach
• Andernfalls bezeichnet man H0 als zusammengesetzt
• Analoge Bezeichnungen gelten für H1
356
Arten von Testproblemen:
• Es sei θ0 ∈ Θ eine feste reelle Zahl. Dann heißt
H0 : θ = θ 0
gegen
H1 : θ =
6 θ0
H0 : θ ≤ θ 0
gegen
H1 : θ > θ0
H0 : θ ≥ θ 0
gegen
H1 : θ < θ0
zweiseitiges Testproblem
• Die Testprobleme
bzw.
heißen einseitig (rechts- bzw. linksseitig)
357
Jetzt:
• Betrachte das allgemeine Testproblem
H 0 : θ ∈ Θ0
gegen
H1 : θ ∈ Θ1 = Θ/Θ0
Allgemeine Vorgehensweise:
• Entscheide anhand einer Stichprobe X1, . . . , Xn aus X, ob H0
zugunsten von H1 abgelehnt wird oder nicht
358
Explizites Vorgehen:
• Wähle ’geeignete’ Teststatistik T (X1, . . . , Xn) und bestimme
einen ’geeigneten’ kritischen Bereich K ⊂ R
• Testentscheidung:
T (X1, . . . , Xn) ∈ K =⇒ H0 wird abgelehnt
/ K =⇒ H0 wird nicht abgelehnt
T (X1, . . . , Xn) ∈
Man beachte:
• T (X1, . . . , Xn) ist eine ZV (Stichprobenfunktion)
−→ Die Testentscheidung ist zufällig
−→ Fehlentscheidungen sind möglich
359
Mögliche Fehlentscheidungen:
Realität
H0 richtig
H0 falsch
Testergebnis
H0 ablehnen H0 nicht ablehnen
Fehler 1. Art
kein Fehler
Fehler 2. Art
kein Fehler
Fazit:
• Fehler 1. Art: Test lehnt H0 ab, obwohl H0 richtig
• Fehler 2. Art: Test lehnt H0 nicht ab, obwohl H0 falsch
360
Wann treten die Fehlentscheidungen auf?
• Der Fehler 1. Art tritt auf, falls
T (X1, . . . , Xn) ∈ K,
obwohl für den wahren Parameter gilt θ ∈ Θ0
• Der Fehler 2. Art tritt auf, falls
/ K,
T (X1, . . . , Xn) ∈
obwohl für den wahren Parameter gilt θ ∈ Θ1
361
Frage:
• Wann besitzt ein statistischer Test für das Problem
H0 : θ ∈ Θ 0
’gute’ Eigenschaften?
gegen
H1 : θ ∈ Θ1 = Θ/Θ0
Intuitive Vorstellung:
• Test ist ’gut’, wenn er möglichst geringe Wahrscheinlichkeiten
für die Fehler 1. und 2. Art aufweist
Jetzt:
• Formales Instrument zur Messung der Fehlerwahrscheinlichkeiten 1. und 2. Art
362
Definition 7.2: (Gütefunktion eines Tests)
Man betrachte einen statistischen Test für das obige Testproblem mit der Teststatistik T (X1, . . . , Xn) und einem ’geeignet gewählten’ kritischen Bereich K. Unter der Gütefunktion des Tests
versteht man die Funktion G, die, in Abhängigkeit des wahren
Parameters θ ∈ Θ, die Wahrscheinlichkeit dafür angibt, dass der
Test H0 ablehnt:
G : Θ −→ [0, 1]
mit
G(θ) = P (T (X1, . . . , Xn) ∈ K).
363
Bemerkung:
• Mit der Gütefunktion sind die Wahrscheinlichkeiten für den
Fehler 1. Art gegeben durch
G(θ)
für alle θ ∈ Θ0
sowie für den Fehler 2. Art durch
1 − G(θ)
für alle θ ∈ Θ1
Intuitive Vorstellung eines idealen Tests:
• Ein Test ist ideal, wenn die Fehlerwahrscheinlichkeiten 1. und
2. Art stets (konstant) gleich Null sind
−→ Test trifft mit Wskt. 1 die richtige Entscheidung
364
Beispiel:
• Es sei θ0 ∈ Θ. Betrachte das Testproblem
H 0 : θ ≤ θ0
gegen
H1 : θ > θ 0
Gütefunktion eines idealen Tests
365
Leider:
• Es kann mathematisch gezeigt werden, dass ein solcher idealer Test im allgemeinen nicht existiert
Praktische Vorgehnsweise: [I]
• Betrachte für eine geeignete Teststatistik T (X1, . . . , Xn) die
maximale Fehlerwahrscheinlichkeit 1. Art
α = max {P (T (X1, . . . , Xn) ∈ K)} = max {G(θ)}
θ∈Θ0
θ∈Θ0
• Lege den kritischen Bereich K dann so fest, dass α einen
vorgegebenen kleinen Wert animmt
366
Praktische Vorgehnsweise: [II]
−→ Alle Fehlerwahrscheinlichkeiten 1. Art sind dann durch α begrenzt (d.h. kleiner oder gleich α)
• Häufig benutzte α-Werte sind α = 0.01, α = 0.05, α = 0.1
Definition 7.3: (Signifikanzniveau eines Tests)
Man betrachte einen statistischen Test für das Testproblem auf
Folie 358 mit der Teststatistik T (X1, . . . , Xn) und einem geeignet
gewählten kritischen Bereich K. Dann bezeichnet man die maximale Fehlerwahrscheinlichkeit 1. Art
α = max {P (T (X1, . . . , Xn) ∈ K)} = max {G(θ)}
θ∈Θ0
θ∈Θ0
als das Signifikanzniveau des Tests.
367
Konsequenzen dieser Testkonstruktion: [I]
• Die Wskt., H0 aufgrund des Tests abzulehmen, obwohl H0
richtig ist (d.h. die Wskt. für den Fehler 1. Art) ist höchstens
α (mit α = 0.01, 0.05, 0.1)
−→ Wird H0 aufgrund einer Testrealisation abgelehnt, so kann
man ziemlich sicher davon ausgehen, dass H0 tatsächlich
falsch ist
(Man sagt auch: H1 ist statistisch gesichert)
368
Konsequenzen dieser Testkonstruktion: [II]
• Die Wskt. für den Fehler 2. Art (d.h. H0 nicht abzulehnen,
obwohl H0 falsch ist), kann man dagegen nicht kontrollieren
−→ Wird H0 aufgrund einer Testrealisation nicht abgelehnt,
so hat man keinerlei Wahrscheinlichkeitsaussage über eine
mögliche Fehlentscheidung
(Nichtablehung von H0 heißt nur: Die Daten sind nicht
unvereinbar mit H0)
Wichtig deshalb:
• Es ist entscheidend, wie man H0 und H1 formuliert
• Das, was man zu zeigen hofft, formuliert man in H1
(in der Hoffnung, H0 anhand des konkreten Tests ablehnen
zu können)
369
Beispiel:
• Betrachte Beispiel 1 auf Folie 352
• Kann man anhand eines konkreten Tests H0 verwerfen, so
kann man ziemlich sicher sein, dass der Wirt in der Regel zu
wenig ausschenkt
• Kann man H0 nicht verwerfen, so kann man nichts explizites
über die Ausschankgewohnheiten des Wirtes sagen.
(Die Daten stehen lediglich nicht im Widerspruch zu H0)
370
7.2 Tests für Erwartungswerte
Situation:
• Der interessierende Zufallsvorgang X sei normalverteilt, d.h.
X ∼ N (µ, σ 2),
wobei µ unbekannt und σ 2 bekannt sein sollen
(vgl. Konfindenzintervall 1, Folie 338)
• Betrachte für gegebenes µ0 ∈ R das Testproblem:
H0 : µ = µ0
gegen
H1 : µ 6= µ0
371
Testkonstruktion:
• Suche eine geeignete Teststatistik T (X1, . . . , Xn)
• Lege den kritischen Bereich K fest
Geeignete Teststatistik lautet:
T (X1, . . . , Xn) =
√
X − µ0
n·
σ
Begründungen:
• T (X1, . . . , Xn) schätzt im wesentlichen den Abstand zwischen
dem unbekannten Parameter µ und dem Vergleichswert µ0
• Wenn H0 gültig ist (d.h. falls µ = µ0), dann gilt
T (X1, . . . , Xn) ∼ N (0, 1)
(vgl. Satz 5.5(b), Folie 310)
372
N (0, 1)-Dichte der Teststatistik T (X1 , . . . , Xn ) im Falle der Gültigkeit von H0
N(0,1)-Dichte von T unter H0
α/2
α/2
uα / 2
(= − u1−α / 2)
0
u1−α / 2
373
Explizite Testregel:
• Lege das Signifikanzniveau α fest
• Wähle den kritischen Bereich als
K = (−∞, −u1−α/2) ∪ (u1−α/2, +∞) = {t ∈ R : |t| > u1−α/2}
d.h.
Lehne H0 ab, falls T (X1, . . . , Xn) ∈ K
/K
Lehne H0 nicht ab, falls T (X1, . . . , Xn) ∈
374
Beispiel: [I]
• Es sei X ∼ N (µ, 4) das tatsächliche Gewicht (in Gramm)
einer 200g-Tafel Schokolade
(vgl. Beispiel auf Folie 342)
• Statistisches Testproblem
H0 : µ = 200
gegen
H1 : µ =
6 200
• Wert der Teststatistik:
√ 200.7625 − 200
√ x − µ0
= 8·
= 1.078
T (x1, . . . , xn) = n ·
σ
2
375
Beispiel: [II]
• Für das Signifikanzniveau α = 0.05 gilt:
u1−α/2 = u0.975 = 1.96
• Offensichtlich ist
T (x1, . . . , xn) = 1.078 ∈
/ (−∞, −1.96) ∪ (1.96, +∞) = K
−→ Für α = 0.05 wird H0 nicht abgelehnt
(Daten sind nicht unvereinbar mit H0)
376
Gütefunktion des Tests zum Signifikanzniveau α = 0.05
1.0
n = 1000
0.8
n = 20
0.6
G(µ)
0.4
0.2
0.0
198
n=8
199
200
201
202
µ
Bemerkungen:
• Test wird mit zunehmendem n immer trennschärfer
• Der vorgestellte Test heißt zweiseitiger Gaußtest
377
Jetzt:
• 2 zweiseitige Tests für den Erwartungswert in der Situation
X ∼ N (µ, σ 2), bei bekannter Varianz σ 2
(ohne Herleitung)
1. Rechtsseitiger Gaußtest: [I] (µ0 ∈ R fest gegeben)
H0 : µ ≤ µ0
gegen
H1 : µ > µ 0
• Teststatistik ist erneut
√ X − µ0
T (X1, . . . , Xn) = n ·
σ
378
1. Rechtsseitiger Gaußtest: [II]
• Kritischer Bereich zum Signifikanzniveau α ist
K = (u1−α, +∞)
(u1−α ist (1 − α)-Quantil der N (0, 1)-Verteilung)
−→ Lehne H0 zum Signifikanzniveau α ab, falls
T (X1, . . . , Xn) > u1−α
379
2. Linksseitiger Gaußtest: (µ0 ∈ R fest gegeben)
H0 : µ ≥ µ0
gegen
H1 : µ < µ0
• Teststatistik ist wiederum
√ X − µ0
T (X1, . . . , Xn) = n ·
σ
• Kritischer Bereich zum Signifikanzniveau α ist
K = (−∞, −u1−α)
(−u1−α = uα ist α-Quantil der N (0, 1)-Verteilung)
−→ Lehne H0 zum Signifikanzniveau α ab, falls
T (X1, . . . , Xn) < −u1−α = uα
380
Beispiel: [I]
• Es sei X ∼ N (µ, 4) das tatsächliche Gewicht (in Gramm)
einer 200g-Tafel Schokolade mit der konkreten Stichprobe
von Folie 342
• Statistisches Testproblem:
H0 : µ ≤ 198
gegen
H1 : µ > 198
• Für die konkrete Stichprobe gilt
√ 200.7625 − 198
√ x − µ0
T (x1, . . . , xn) = n ·
= 8·
= 3.9068
σ
2
381
Beispiel: [II]
• Zum Signifikanzniveau α = 0.05 ergibt sich der kritische
Bereich als
K = (u0.95, +∞) = (1.6449, +∞)
• Also folgt
T (x1, . . . , xn) = 3.9068 > 1.6449 = u0.95
−→ Lehne H0 zum Signifikanzniveau α = 0.05 ab
382
Jetzt:
• Tests für den Erwartungswert einer Normalverteilung bei unbekannter Varianz, d.h.
X ∼ N (µ, σ 2)
mit unbekannten µ und σ 2
• Betrachte für µ0 ∈ R zunächst den 2-seitigen Test
H 0 : µ = µ0
gegen
H1 : µ 6= µ0
383
Geeignete Teststatistik:
T (X1, . . . , Xn) =
√
X − µ0
n−1·
S
Begründungen:
• T (X1, . . . , Xn) schätzt im wesentlichen den Abstand zwischen
unbekanntem µ und dem Vergleichswert µ0
• Wenn H0 richtig ist (d.h. falls µ = µ0), dann gilt
T (X1, . . . , Xn) ∼ t(n − 1)
(vgl. Satz 5.5(c), Folie 311)
384
Herleitung des kritischen Bereiches:
• Analoges Vorgehen wie beim zweiseitigen Gaußtest, nur mit
t(n − 1)- anstatt mit der N (0, 1)-Verteilung
• Kritischer Bereich ist
K = (−∞, −tn−1,1−α/2) ∪ (tn−1,1−α/2, +∞)
= {t ∈ R : |t| > tn−1,1−α/2}
d.h.
Lehne H0 ab, falls T (X1, . . . , Xn) ∈ K
Lehne H0 nicht ab, falls T (X1, . . . , Xn) ∈
/K
385
Bemerkungen: [I]
• Dieser Test heißt zweiseitiger t-Test
• Für den rechtsseitigen t-Test
H0 : µ ≤ µ0
gegen
H1 : µ > µ 0
ergibt sich bei Benutzung der Teststatistik
√
X − µ0
T (X1, . . . , Xn) = n − 1 ·
S
zum Signifikanzniveau α der kritische Bereich
K = (tn−1,1−α, +∞)
386
Bemerkungen: [II]
• Für den linksseitigen t-Test
H0 : µ ≥ µ 0
gegen
H1 : µ < µ 0
ergibt sich bei Benutzung der Teststatistik
√
X − µ0
T (X1, . . . , Xn) = n − 1 ·
S
zum Signifikanzniveau α der kritische Bereich
K = (−∞, −tn−1,1−α)
387
Beispiel:
• Es sei X ∼ N (µ, σ 2) mit unbekannten µ und σ 2
• Betrachte zweiseitigen t-Test mit µ0 = 6 z.N. α = 0.05
• Einfache Stichprobe mit n = 8 Werten ergibt:
1.6611
3.6215
4.5674
7.6635
1.2770
2.6660
5.3406
3.8029
• Wert der Teststatistik:
√ 3.8250 − 6
√
x − µ0
= −2.9633
= 7·
t= n−1·
s
1.9411
• Es gilt: |t| = 2.9633 > 2.3646 = t7,0.975
−→ Ablehnung von H0
388
7.3 Tests für Varianzen
Situation:
• Der interessierende Zufallsvorgang sei normalverteilt, d.h.
X ∼ N (µ, σ 2),
wobei sowohl µ als auch σ 2 unbekannt sein sollen
• Betrachte für geg. σ02 ∈ R das zweiseitige Testproblem
H0 : σ 2 = σ02
gegen
H1 : σ 2 6= σ02
389
Geeignete Teststatistik lautet:
T (X1, . . . , Xn) =
n · S2
σ02
=
!2
n X
Xi − X
i=1
σ0
Begründungen:
• T (X1, . . . , Xn) schätzt im wesentlichen das Verhältnis zwischen unbekannter Varianz σ 2 und dem Vergleichswert σ02
• Wenn H0 gültig ist (d.h. falls σ 2 = σ02), dann gilt:
T (X1, . . . , Xn) ∼ χ2(n − 1)
(vgl. Satz 5.5(e), Folie 311)
390
χ2(3)-Dichte von T (X1, . . . , Xn) bei Gültigkeit von H0
0.25
0.20
χ2-Dichte von T unter H0
0.15
0.10
0.05
0.00
0
2
4
6
8
10
12
14
391
Bezeichnung:
• Das p-Quantil der χ2(ν)-Verteilung wird in Mosler / Schmid
mit χ2
ν,p bezeichnet
• Kritischer Bereich ist
2
K = [0, χ2
∪
)
(χ
n−1,α/2
n−1,1−α/2 , +∞)
d.h.
2
oder
Lehne H0 ab, falls T < χ2
T
>
χ
n−1,1−α/2
n−1,α/2
2
Lehne H0 nicht ab, falls T ∈ [χ2
,
χ
n−1,α/2 n−1,1−α/2 ]
392
Bemerkungen: [I]
• Die Dichte der χ2(ν)-Verteilung ist nicht symmetrisch, d.h.
2
χ2
ν,p 6= −χν,1−p
• Für den rechtsseitigen Varianztest
H0 : σ 2 ≤ σ02
gegen
H1 : σ 2 > σ02
ergibt sich bei Benutzung der Teststatistik
T (X1, . . . , Xn) =
n · S2
σ02
=
!2
n X
Xi − X
i=1
σ0
zum Signifikanzniveau α der kritische Bereich
2
, +∞)
K = (χn−1,1−α
(d.h. verwerfe H0, falls T > χ2
n−1,1−α)
393
Bemerkungen: [II]
• Für den linksseitigen Varianztest
H0 : σ 2 ≥ σ02
H1 : σ 2 < σ02
gegen
ergibt sich bei Benutzung der Teststatistik
T (X1, . . . , Xn) =
n · S2
σ02
=
!2
n X
Xi − X
i=1
σ0
zum Signifikanzniveau α der kritische Bereich
2
)
K = [0, χn−1,α
(d.h. verwerfe H0, falls T < χ2
n−1,α)
394
Bemerkungen: [III]
• Falls der E-Wert µ der Normalverteilung bekannt ist, verwende die Teststatistik
T (X1, . . . , Xn) =
!2
n
X Xi − µ
i=1
σ0
und die Quantile der χ2(n)-Verteilung
(vgl. Satz 5.5(d), Folie 311)
395
Beispiel: [I]
• Gegeben seien folgende Messungen aus einer Normalverteilung
(µ, σ 2 unbekannt):
1001, 1003, 1035, 998, 1010, 1007, 1012
• Man betrachte den folgenden Test z.N. α = 0.05:
H0 : σ 2 ≤ 100
• Es gilt:
gegen
H1 : σ 2 > 100
n · S2
7 · 129.96
T (x1, . . . , xn) =
=
= 9.0972
2
100
σ0
396
Beispiel: [II]
• Für α = 0.05 findet man das Quantil χ2
6,0.95 = 12.592
• Es folgt:
T (x1, . . . , xn) = 9.0972 < 12.592 = χ2
6,0.95
−→ H0 kann nicht verworfen werden
397

Zugehörige Unterlagen

σ signifikanzniveau

6. Statistische Hypothesentests

Klausur - Universität Tübingen

7. Hypothesentests - wiwi.uni

Zugehörige Unterlagen

Produkte

Unterstützung

7. Hypothesentests - wiwi.uni

Zugehörige Unterlagen

Dieses Dokument Sammlung (en)

Dieses Dokument gespeichert

Schlagen Sie uns vor, wie wir StudyLib verbessern können