Testen statistischer Hypothesen

Werbung
Kapitel 9
Testen statistischer Hypothesen
9.1
Einführung, Signifikanztests
Signifikanztest für µ bei der Normalverteilung bei bekanntem σ = σ0 :
Xi seien unabhängig und N (µ, σ0 )–verteilt, µ sei unbekannt.
Stelle eine Hypothese über µ auf, in diesem Fall:
Hypothese H0 : µ = µ0 .
Lege das Signifikanzniveau (= Irrtumswahrscheinlichkeit) α und den Stichprobenumfang
n vor der Untersuchung der Stichprobe fest. Bestimme q > 0 aus
α
!
(9.1.1)
Φ(q)=1 − .
2
q
Setze d := √ σ0 .
n
Untersuche Stichprobe vom Umfang n. Das Ergebnis sei der Schätzwert µ̂ = x für µ.
Falls |µ̂ − µ0 | ≥ d ist, ist H0 abzulehnen.
Falls |µ̂ − µ0 | < d ist, ist H0 (mit Vorbehalt) anzunehmen.
Begründung der Entscheidungsregel:
Für die Wahrscheinlichkeit für eine irrtümliche Ablehnung von H0 gilt nach Satz 7.6.6 v), da X
eine stetige ZV ist:
!
α = P (H0 wird (auf Grund des Testergebnisses) abgelehnt|H0 ) = P |X − µ0 | ≥ d H0
√ √ = P |X − µ0 | > σ0 q/ n H0 = 1 − P |X − µ0 | ≤ σ0 q/ n H0 = 1 − (2Φ(q) − 1)
= 2(1 − Φ(q)) ⇐⇒ Φ(q) = 1 − α/2
Bem.:
a) X, x u. s. w. haben diesselbe Bedeutung wie im ersten Teil von Abschnitt 8.4.
b) α hat eine andere Bedeutung als γ im Abschnitt 8.4. α liegt nahe bei 0, z. B. α =
0.1, 0.05, 0.01 o. ä.
c) P (. . . |H0 ) ist die Wahrscheinlichkeit für das interessierende Ereignis, wenn H0 richtig wäre.
Beispiel 9.1.1: Eine Abfüllmaschine soll 500 g Zucker in jede Tüte einfüllen.
Abweichungen sind in beiden Richtungen unerwünscht.
Die Menge in der Tüte ist zufallsabhängig.
111
Wir gehen von drei Annahmen aus, die hier noch nicht durch einen Test geprüft werden:
1.) Es liege eine Normalverteilung N (µ, σ) vor.
2.) σ = 5 =: σ0 (in g) sei bekannt.
3.) Bei einwandfrei arbeitender Maschine gelte: µ = 500 (in g).
Die Wahrscheinlichkeit, dass wir irrtümlich die Maschine für defekt halten, sei ≤ α.
Festlegung: α = 0.05
Stichprobe vom Unfang 4: x1 = 495, x2 = 496, x3 = 499, x4 = 494
Dies seien Realisierungen von ZV X1 , X2 , X3 , X4 , die alle die gleiche Verteilung N (µ, σ) haben.
Schätzwert für µ: µ̂ = x = 496
Hypothese H0 :
µ = 500 =: µ0
Bestimme q > 0 aus:
!
0.05
= 0.975 ⇐⇒ q = 1.96
2
q
1.96
d := √ σ0 = √ · 5 = 4.90
n
4
Φ(q) = 1 −
µ̂ = 496 =⇒ |µ̂ − µ0 | = |496 − 500| = +4 < d = 4.90
Testergebnis: H0 wird mit Vorbehalt angenommen.
Zweite Stichprobe vom Umfang 8:
494,
=⇒ µ̂ = x̄ = 494.75
Testergebnis:
492,
=⇒
495,
495,
496,
499,
496,
491
1.96
|µ̂ − µ0 | = |494.75 − 500| = 5.25 ≥ √ · 5 = 3.46
8
Ablehnung von H0
Interpretation des Testergebnisses: Es gibt nach einem Test 4 verschiedene Situationen, die
in nachstehender schematischer Übersicht dargestellt sind:
112
Tabelle 9-1
H0 wird
angenommen
abgelehnt
richtig
richtige Entscheidung
Fehler 1. Art
falsch
Fehler 2. Art
richtige Entscheidung
unter der Bedingung ↓:
H0 ist
Allgemein wird gefordert:
(9.1.2)
P(Fehler 1. Art) = P(H0 wird abgelehnt|H0 ) ≤ α
Die Wahrscheinlichkeit für einen Fehler 2. Art ist erst dann in gleicher Weise durch eine Zahl < 1
abzuschätzen, wenn man H0 eine geeignete Alternativhypothese H1 gegenüberstellt und evtl. das
Testverfahren ändert. Ohne geeignete Alternativhypothese gilt also nur P (Fehler 2. Art) ≤ 1,
d. h. man hat den Fehler 2. Art nicht unter Kontrolle. Scheint die Annahme von H0 nur durch
einen zu kleinen Stichprobenumfang zustande gekommen zu sein (was aus o. g. Gründen nicht
präzise fassbar ist), so ist der Test u. U. mit größerem Stichprobenumfang zu wiederholen.
Signifikanztest für µ bei der Normalverteilung bei unbekanntem σ:
Xi seien unabhängig und N (µ, σ)–verteilt, µ und σ seien unbekannt.
Stelle eine Hypothese über µ auf, in diesem Fall:
Hypothese H0 : µ = µ0 .
Lege das Signifikanzniveau α und den Stichprobenumfang n vor der Untersuchung der Stichprobe fest. Bestimme q > 0 aus
α
!
(9.1.3)
Ft (q)=1 − ,
2
wobei Ft (y) die Verteilungsfunktion der t–Verteilung mit r = (n − 1) Freiheitsgraden ist.
Untersuche Stichprobe vom Umfang n. Diese liefert die Mess– oder Beobachtungswerte x1 , x2 , . . . xn .
Daraus gewinnen wir den Schätzwert µ̂ = x für µ und die Testgröße
sP
n
2
i=1 (xi − x)
d := q
n(n − 1)
Falls |µ̂ − µ0 | ≥ d ist, ist H0 abzulehnen.
Falls |µ̂ − µ0 | < d ist, ist H0 (mit Vorbehalt) anzunehmen.
Begründung der Entscheidungsregel:
Für die Wahrscheinl. für eine irrtümliche Ablehnung von H0 gilt, da nur stetige ZV beteiligt
s P sind:
!
n
2
X)
(X
−
!
i
i=1
α = P (H0 wird (auf Grund des Testergebnisses) abgelehnt|H0 ) = P |X − µ0 | ≥ q ·
H0
n(n − 1)


sP
!


√
n
2


|X − µ0 | n
i=1 (Xi − X) 
H0 
s
= P |X − µ0 | > q ·
=
P
H
>
q
0


Pn
n(n − 1)
2


X)
(X
−
i
i=1
n−1
113



√

 Satz 8.4.8a
|X − µ0 | n

= 1 − P  sP
≤ q H0 
=
1 − (2Ft (q) − 1) = 2 − 2Ft (q)

n
2


(X
−
X)
i
i=1
n−1
α
!
⇐⇒ Ft (q)=1 −
2

9.2
Einseitige Tests
9.2.1
Ein einseitiger Test bei der Normalverteilung
X1 , . . . , Xn seien unabhängige N (µ, σ)–verteilte ZV mit bekanntem σ = σ0 . Über dem unbekannten Parameter µ werden 2 Hypothesen aufgestellt :
H 0 : µ ≤ µ0 ,
H 1 : µ > µ0
(Alternativhypothese)
Fehler 1. Art : Entscheidung gegen H0 (und damit für H1 ), obwohl H0 richtig ist.
Fehler 2. Art : Entscheidung gegen H1 (und damit für H0 ), obwohl H1 richtig ist.
Durchführung des Tests:
Schritt 1: Lege die Höchstgrenze α für die Wahrsch. für einen Fehler 1. Art und die Höchstgrenze β für die Wahrsch. für einen Fehler 2. Art fest.
Schritt 2: Lege den Stichprobenumfang n fest und berechne d0 und d1 aus n, α und β nach der
folgenden Formel:
(9.2.1)
√
d0 = q0 σ0 / n
√
d1 = q1 σ0 / n
mit
mit
Φ(q0 ) = 1 − α
Φ(q1 ) = 1 − β
Schritt 3: Werte eine Stichprobe vom Umfang n aus. x ist dann eine Realisierung von X(:=
n−1 (X1 + · · · + Xn )):
x ≥ µ0 + d0 ⇒ Entscheidung für H1
x ≤ µ0 − d1 ⇒ Entscheidung für H0
µ0 − d1 < x < µ0 + d0 ⇒ keine Entscheidung (u. U. den Test mit größerem Stichprobenumfang
wiederholen)
Begründung für (9.2.1): Aus der Tatsache, dass
Φ(x) monotonwachsend ist, folgt:
d0 √
µ0 − µ + d0 √ n n ≤α
≤ 1−Φ
P (Fehler 1. Art) = P (X ≥ µ0 + d0 |H0 ) = 1 − Φ
σ0
σ0
µ≤µ
0
−d1 √
µ0 − µ − d1 √ n ≤Φ
P (Fehler 2. Art) = P (X ≤ µ0 − d1 |H1 ) = Φ
n
σ0
σ0
µ>µ0
d1 √
n ≤β
=1−Φ
σ0
Bem.:
a) Manchmal ist von der praktischen Fragestellung her folgende Gegenüberstellung zweckmäßig:
H0 : µ ≤ µ0 , H1 : µ ≥ µ1 (> µ0 ). Der Test ist dann wie oben durchzuführen, wobei aber
folgende Änderungen zu beachten sind:
x ≥ µ0 + d0 ⇒ Entscheidung gegen H0 (nicht unbedingt für H1 )
114
x ≤ µ1 − d1 ⇒ Entscheidung gegen H1 (nicht unbedingt für H0 )
µ1 − d1 < x < µ0 + d0 ⇒ keine Entscheidung
Durch genügend großen Stichprobenumfang n kann man erreichen, dass µ1 − d1 ≥ µ0 + d0
und damit das 3. Intervall leer ist. Man kommt dann immer zu einer Entscheidung.
b) Ist auch σ unbekannt, so kann man ähnlich wie bei den Konfidenzintervallen (vgl. Satz
8.4.8) oder bei dem Signifikanztest die einseitigen Tests mit folgenden Veränderungen
durchführen: (9.2.1) wird ersetzt durch
(9.2.2)
d0 = q0
d1 = q1
sP
n
i=1 (xi
sP
− x)2
n(n − 1)
n
i=1 (xi
− x)2
n(n − 1)
mit
Ft (q0 ) = 1 − α,
mit
Ft (q1 ) = 1 − β,
wobei Ft (y) die Verteilungsfunktion der t–Verteilung mit r = (n − 1) Freiheitsgraden ist.
c) Anstelle des Tests auf
H0 : µ ≤ µ0 gegen H1 : µ > µ0
findet man in der Literatur oft Tests auf
H0 : µ = µ0 gegen H1 : µ > µ0 oder
H0 : µ < µ0 gegen H1 : µ ≥ µ0 oder
H0 : µ < µ0 gegen H1 : µ = µ0 .
Alle diese Tests sind rechnerisch gleichwertig.
Beispiel 9.2.1: Lieferung von Garn
Die Reißfestigkeit ist N (µ, σ)-verteilt, µ unbekannt, σ = 0.5 =: σ0 (aus früheren Untersuchungen) bekannt.
Behauptung des Lieferanten: µ > 20
Hypothese H0 ≤ 20 =: µ0
Alternativhypothese: H1 : µ > 20
Schritt 1: Wahl der Irrtumswahrscheinlichkeiten:
α = 0.05
,
β = 0.10
Schritt 2: Wahl des Stichprobenumfangs: n = 16
!
⇐⇒
q0 = 1.645
!
⇐⇒
q1 = 1.282
Φ(q0 ) = 1 − α = 0.95
Φ(q1 ) = 1 − β = 0.90
1.645 · 0.5
q 0 σ0
= 0.206
d0 := √ =
4
n
q 1 σ0
1.282 · 0.5
d1 := √ =
= 0.160
4
n
Schritt 3: Die Untersuchung einer Stichprobe von Umfang 16 liefere das Ergebnis: x̄ = 20.88
x̄ ≥ µ0 + d0 (= 20.21) =⇒ Entscheidung für H1 : µ > 20
Ergebnis bei der Prüfung einer anderen Lieferung: x̄ = 19.88
µ0 − d1 = 19.84 < x̄ < µ0 + d0 = 20.21 =⇒ Keine Entscheidung
115
Änderung:
H0 : µ ≤ 20 =: µ0
H1 (neu) : µ ≥ 20.5 =: µ1 (> 20)
α, β, n wie oben
=⇒ d0 , d1 wie oben
x̄ ≥ µ0 + d0 = 20.21 =⇒ Entscheidung gegen H0
x̄ ≤ µ1 − d1 = 20.34 =⇒ Entscheidung gegen H1
Der Fall µ1 − d1 < x̄ < µ0 + d0 ist nicht möglich, da jetzt µ1 − d1 ≥ µ0 + d0 ist.
1. Lieferung: x̄ = 20.88 =⇒ Entscheidung gegen H0
1. Lieferung: x̄ = 19.88 =⇒ Entscheidung gegen H1
Es kann vorkommen, dass x̄ beide Bedingungen erfüllt, z.B. bei x̄ = 20.30
20.30 ≥ 20.21
20.30 ≤ 20.34
Wir können sowohl H0 als auch H1 ablehnen. Das ist auch vernünftig; denn µ kann zwischen µ0
und µ1 liegen. Tatsächlich ist die Entscheidung dann offen. Es wohl naheliegend, in diesem Fall
eine Entscheidung zugunsten des Lieferanten zu treffen:
Zusätzliche Entscheidungsregel (etwas zugunsten des Lieferanten):
Wenn n so groß ist , dass µ1 − d1 ≥ µ0 + d0 ist:
Annahme der Lieferung bei Ablehnung von Hypothese H0
9.2.2
Ein einseitiger Test bei der Binomialverteilung
X sei eine binomial–verteilte ZV mit den Parametern n (wird noch festgelegt) und p (unbekannt). X ist damit selbst schon mit einer Stichprobe vom Umfang n verbunden, d. h. X in
9.2.2 entspricht abgesehen von den verschiedenen Verteilungen der ZV nX in 9.2.1.
Hypothesen über p :
H 0 : 0 ≤ p ≤ p0 ,
H1 : p1 ≤ p ≤ 1,
0 < p0 ≤ p1 < 1.
Sonderfälle:
H0 : p = 0: x > 0 ⇒ Ablehnung von H0 ; H1 : p = 1: x < n ⇒ Ablehnung von H1
Fehler 1. Art: Entscheidung gegen H0 (und damit für p > p0 ), obwohl H0 richtig ist.
Fehler 2. Art: Entscheidung gegen H1 (und damit für p < p1 ), obwohl H1 richtig ist.
Durchführung des Tests:
Schritt 1: Lege die Höchstgrenze α für die Wahrscheinlichkeit für einen Fehler 1. Art und die
Höchstgrenze β für die Wahrscheinlichkeit für einen Fehler 2. Art fest.
Schritt 2: Lege n fest.
Schritt 3: Werte eine Stichprobe vom Umfang n aus, die eine Realisierung x von X liefert.
Fall 1: x/n < p1 .
Falls
k
x X
β
n
p1
≤
1 − p1
(1 − p1 )n
k
k=0
116
gilt, ist die Hypothese H1 mit ausreichender Sicherheit abzulehnen. Anderenfalls kann die Hypothese H1 auf Grund der vorliegenden Daten nicht mit ausreichender Sicherheit abgelehnt werden.
Begründung: x/n < p1 spricht gegen die Hypothese H1 . Um aber H1 mit ausreichender Sicherheit ablehnen zu können, müssen wir prüfen, ob die die Wahrscheinlichkeit für einen Fehler 2.
Art ≤ β ist, d.h. ob die Wahrscheinlichkeit dafür, dass die ZV X den vorliegenden Wert x oder
Werte annimmt, die noch mehr gegen die Hypothese H1 sprechen, ≤ β ist:
P (X ≤ x|H1 ) ≤ P (X ≤ x|p = p1 ) =
x X
n
k
k=0
pk1 (1 − p1 )n−k = (1 − p1 )n
k
x X
?
n
p1
≤ β.
1 − p1
k
k=0
Die erste Ungleichung gilt, weil die Wahrscheinlichkeit für X ≤ x(< np1 ) für p > p1 noch kleiner
ist als für p = p1 .
Fall 2: x/n > p0 .
Falls
x−1
X
k=0
n
k
p0
1 − p0
k
≥
1−α
(1 − p0 )n
gilt, ist die Hypothese H0 mit ausreichender Sicherheit abzulehnen. Anderenfalls kann die Hypothese H0 auf Grund der vorliegenden Daten nicht mit ausreichender Sicherheit abgelehnt werden.
Begründung: x/n > p0 spricht gegen die Hypothese H0 . Um aber H0 mit ausreichender Sicherheit ablehnen zu können, müssen wir prüfen, ob die die Wahrscheinlichkeit für einen Fehler 1.
Art ≤ α ist, d.h. ob die Wahrscheinlichkeit dafür, dass die ZV X den vorliegenden Wert x oder
Werte annimmt, die noch mehr gegen die Hypothese H0 sprechen, ≤ α ist:
P (X ≥ x|H0 ) ≤ P (X ≥ x|p = p0 ) =
n X
n
k
k=x
pk0 (1− p0 )n−k
k
n X
?
n
p0
≤ α.
= (1− p0 )
1 − p0
k
n
k=x
Die erste Ungleichung gilt, weil die Wahrscheinlichkeit für X ≥ x(> np0 ) für p < p0 noch kleiner
ist als für p = p0 . Da x nur ganzzahlige Werte annehmen kann, ergibt sich die obige Ungleichung
schließlich aus:
k
k
k
n x−1 n X
X
X
n
n
p0
p0
n
p0
n
n
n
= (1 − p0 )
− (1 − p0 )
(1 − p0 )
1 − p0
1 − p0
1 − p0
k
k
k
k=0
k=x
n
= 1 − (1 − p0 )
⇐⇒
x−1
X
k=0
n
k
k=0
x−1
X
k=0
n
k
p0
1 − p0
k
p0
1 − p0
?
≥
k
?
≤α
1−α
(1 − p0 )n
Wenn Fall 1 und Fall 2 nicht zutrifft, also x/n ≥ p1 und x/n ≤ p0 gilt, so folgt daraus p0 ≥ p1 .
Da aber p0 ≤ p1 vorausgesetzt war, gilt schließlich p0 = p1 .
Fall 3: x/n = p0 = p1 .
Es kann weder die Hypothese H0 noch die Hypothese H1 auf Grund der vorliegenden Daten mit
ausreichender Sicherheit abgelehnt werden.
Begründung: x/n = p0 = p1 spricht weder gegen die Hypothese H0 noch gegen die Hypothese
H1 . Eine Annahme von H0 oder von H1 auf Grund der vorliegenden Daten ist mit ausreichender
Sicherheit aber auch nicht gerechtfertigt; denn eine eine Annahme von z.B. H0 bedeutet eine
117
Ablehnung von p > p1 , und dies ist rechnerisch gleichwertig mit einer Ablehnung von H1 .
Bemerkung: Die obige Summenbildung ist speziell bei dem in der Vorlesung und Übung behandelten Fall, dass p1 deutlich näher bei 0 als bei 1 ist, günstig. Trifft dies nicht zu, kann es
besser sein, im Test die Ungleichung
k
x X
β
n
p1
≤
1 − p1
(1 − p1 )n
k
k=0
durch die äquivalente Ungleichung
k
n
X
n
p1
1−β
≥
k
1 − p1
(1 − p1 )n
k=x+1
oder die Ungleichung
x−1
X
k=0
n
k
p0
1 − p0
k
≥
1−α
(1 − p0 )n
durch die äquivalente Ungleichung
k
n X
α
n
p0
≤
1 − p0
(1 − p0 )n
k
k=x
zu ersetzen.
Aus der ”Ablehnungsungleichung” von H1 folgt:
k 0
x X
β
n
p1
n
p1
≥
= 1 ⇒ β ≥ (1 − p1 )n ⇒ ln β ≥ n ln(1 − p1 ).
≥
0
(1 − p1 )n
1 − p1
1 − p1
k
k=0
Damit muss für der Stichprobenumfang
n≥
ln β
ln(1 − p1 )
gelten. Sonst wird kein Ziehungsergebnis zur Ablehnung von H1 führen.
Aus der ”Ablehnungsungleichung” von H0 folgt:
k n
n X
n
α
n
p0
pn0
p0
≥
≥
=
⇒ α ≥ pn0 ⇒ ln α ≥ n ln p0 .
n
(1 − p0 )n
k
1 − p0
1 − p0
(1 − p0 )n
k=x
Damit muss für der Stichprobenumfang
n≥
ln α
ln p0
gelten. Sonst wird kein Ziehungsergebnis zur Ablehnung von H0 führen.
Beispiel 9.2.1: X sei eine binomialverteilte Zufallsvariable mit Parametern n, p.
Wir testen
H0 : 0 ≤ p ≤ 0.1(=: p0 )
gegen
H1 :
(p1 :=)0.2 ≤ p ≤ 1
118
Schritt 1: Lege fest: α = 0.01, β = 0.05
Schritt 2: Lege fest: n = 30
Schritt 3: Auswertung einer Stichprobe vom Umfang 30, also von 30 Ziehungen m.(wegen Binomialverteilung)Z.
Ergebnis: 2 Erfolge, also x = 2
2
x
=
= 0.067 < p1 ,
also Fall 1
n
30
x
2
=
= 0.067 6> p0 ,
also nicht Fall 2
n
30
1 − p1 = 0.8, (1 − p1 )/p1 = 0.2/0.8 = 0.25
2 k
k
X
X
p1
30
30
30
30
n
k
0
1
=
0.25 =
· 0.25 +
· 0.25 +
· 0.252
k
0
0
0
k
1 − p1
k=0
k=0
30 · 29
30
· 0.25 +
· 0.252
1
1·2
?
0.05
β
=
= 40.39
= 35.69 ≤
n
(1 − p1 )
0.830
=1+
↑
Ja =⇒ H1 ist mit ausreichender Sicherh. (95%) abzulehnen.
Also ist p < p1 := 0.2 mit 95prozentiger Sicherheit richtig.
Eine zweite Stichprobe vom Umfang 30 m.Z. (etwa aus einer anderen Lieferung) ergebe x = 4 .
4
x
=
= 0.133 > p0 , also Fall 2 . Es gilt aber auch < p1 , d.h. es liegt auch Fall 1 vor. Dies
n
30
werden wir später behandeln. Zunächst führen wir also die Rechnung für Fall 2 durch:
1 − p0 = 0.9,
(1 − p0 )/p0 = 0.1/0.9 = 1/9
k X
k
3 x−1 X
1
p0
30
n
=
k
k
1 − p0
9
k=0
k=0
=
0 1
1
1
1
30
30
30
30
·
+
· +
· 2+
· 3
0
1
2
3
9
9
9
9
30 · 29
30 · 29 · 28
1
+
+
9 1 · 2 · 92 1 · 2 · 3 · 93
?
0.99
1−α
=
= 23.35
= 15.27 ≥
n
(1 − p0 )
0.930
= 1 + 30 ·
↑
Nein
H0 kann also nicht mit ausreichender Sicherheit abgelehnt werden.
Rechnung für Fall 1:
1 − p1 = 0.8
0.2
p1
=
= 0.25
(1 − p1 )
0.8
k X
x−1 3 X
p1
30
n
· 0.25k
=
k
k
1 − p1
k=0
k=0
119
=
30
0
0
0.25 +
= 1 + 30 · 25 +
30
1
1
0.25 +
30
2
2
0.25 +
30
3
3
0.25 +
30
4
0.254
30 · 29 · 28
30 · 29 · 28 · 27
30 · 29
· 0.252 +
· 0.253 +
· 0.254
1·2
1·2·3
1·2·3·4
?
β
= 206.18 ≤
= 40.39
(1 − p1 )n
↑
Nein
H1 kann also (auch) nicht mit ausreichender Sicherheit abgelehnt werden.
Bei der zweiten Stichprobe können wir also keine Entscheidung mit ausreichender Sicherheit
treffen.
9.2.3
Ein einseitiger Test bei der hypergeometrischen Verteilung
X sei eine hypergeometrisch verteilte ZV mit den Parametern n (wird noch festgelegt), M (unbekannt) und N . Bei der Qualitätskontrolle wäre N die Zahl der Stücke in der Lieferung, M die
Zahl der Stücke in der Lieferung und n der Umfang einer Stichprobe o.Z. X ist also selbst schon
mit einer Stichprobe vom Umfang n verbunden, d. h. X in 9.2.3 entspricht abgesehen von den
verschiedenen Verteilungen der ZV nX in 9.2.1.
Hypothesen über M :
H0 : 0 ≤ M ≤ M0 ,
H1 : M1 ≤ M ≤ N,
0 < M0 ≤ M1 < N.
Fehler 1. Art: Entscheidung gegen H0 (und damit für M > M0 ), obwohl H0 richtig ist.
Fehler 2. Art: Entscheidung gegen H1 (und damit für M < M1 ), obwohl H1 richtig ist.
Durchführung des Tests:
Schritt 1: Lege die Höchstgrenze α für die Wahrscheinlichkeit für einen Fehler 1. Art und die
Höchstgrenze β für die Wahrscheinlichkeit für einen Fehler 2. Art fest.
Schritt 2: Lege n fest.
Schritt 3: Werte eine Stichprobe vom Umfang n aus, die eine Realisierung x von X liefert.
Fall 1: x/n < M1 /N .
Falls
x X
M1
N − M1
N
≤
β
k
n−k
n
k=0
gilt, ist die Hypothese H1 mit ausreichender Sicherheit abzulehnen. Anderenfalls kann die Hypothese H1 auf Grund der vorliegenden Daten nicht mit ausreichender Sicherheit abgelehnt werden.
Begründung: x/n < M1 /N spricht gegen die Hypothese H1 . Um aber H1 mit ausreichender Sicherheit ablehnen zu können, müssen wir prüfen, ob die die Wahrscheinlichkeit für einen Fehler
2. Art ≤ β ist, d.h. ob die Wahrscheinlichkeit dafür, dass die ZV X den vorliegenden Wert x
oder Werte annimmt, die noch mehr gegen die Hypothese H1 sprechen, ≤ β ist:
M1 N −M1 x x
X
1 X M1
N − M1 ?
k
n−k
= N
≤ β.
P (X ≤ x|H1 ) ≤ P (X ≤ x|M = M1 ) =
N
k
n−k
n
n
k=0
k=0
120
Die erste Ungleichung gilt, weil die Wahrscheinlichkeit für X ≤ x(< nM1 /N ) für M > M1 noch
kleiner ist als für M = M1 .
Fall 2: x/n > M0 /N .
Falls
x−1
X
k=0
M1
k
N − M1
n−k
N
≥
(1 − α)
n
gilt, ist die Hypothese H0 mit ausreichender Sicherheit abzulehnen. Anderenfalls kann die Hypothese H0 auf Grund der vorliegenden Daten nicht mit ausreichender Sicherheit abgelehnt werden.
Begründung: x/n > M0 /N spricht gegen die Hypothese H0 . Um aber H0 mit ausreichender Sicherheit ablehnen zu können, müssen wir prüfen, ob die die Wahrscheinlichkeit für einen Fehler
1. Art ≤ α ist, d.h. ob die Wahrscheinlichkeit dafür, dass die ZV X den vorliegenden Wert x
oder Werte annimmt, die noch mehr gegen die Hypothese H0 sprechen, ≤ α ist:
M1 N −M1 n
X
?
k
n−k
≤ α.
P (X ≥ x|H0 ) ≤ P (X ≥ x|M = M0 ) =
N
k=x
n
Die erste Ungleichung gilt, weil die Wahrscheinlichkeit für X ≥ x(> nM0 /N ) für M < M0 noch
kleiner ist als für M = M0 . Da x nur ganzzahlige Werte annehmen kann, ergibt sich die obige
Ungleichung schließlich aus:
M1 N −M1 M1 N −M1 n
n
x−1 M1 N −M1
x−1 M1 N −M1
X
X
X
X
?
k
n−k
k
k
k
n−k
n−k
n−k
≤α
=
−
=1−
N
N
N
N
k=x
n
n
k=0
⇐⇒
x−1 X
k=0
n
k=0
M1
k
N − M1
n−k
k=0
n
?
N
≥
(1 − α).
n
Fall 3: x/n = M0 /N = M1 /N .
Es kann weder die Hypothese H0 noch die Hypothese H1 auf Grund der vorliegenden Daten mit
ausreichender Sicherheit abgelehnt werden.
Begründung: x/n = M0 /N = M1 /N spricht weder gegen die Hypothese H0 noch gegen die
Hypothese H1 . Eine Annahme von H0 oder von H1 auf Grund der vorliegenden Daten ist mit
ausreichender Sicherheit aber auch nicht gerechtfertigt; denn eine eine Annahme von z.B. H0
bedeutet eine Ablehnung von M > M0 , und dies ist rechnerisch gleichwertig mit einer Ablehnung von H1 .
Bemerkung: Die obige Summenbildung ist speziell bei dem in der Vorlesung und Übung behandelten Fall, dass M1 deutlich näher bei 0 als bei N ist, günstig. Trifft dies nicht zu, kann es
besser sein, im Test die Ungleichung
x X
M1
N − M1
N
≤
β
k
n−k
n
k=0
durch die äquivalente Ungleichung
n
X
k=x+1
M1
k
N − M1
n−k
N
≥
(1 − β)
n
oder die Ungleichung
x−1
X
k=0
M1
k
N − M1
n−k
121
N
≥
(1 − α)
n
durch die äquivalente Ungleichung
n X
M1
N − M1
N
≤
α
k
n−k
n
k=x
zu ersetzen.
122
Herunterladen