Testen statistischer Hypothesen

Werbung
Kapitel 9
Testen statistischer Hypothesen
9.1
Einführung, Signifikanztests
Signifikanztest für µ bei der Normalverteilung bei bekanntem σ = σ0 :
Xi seien unabhängig und N (µ, σ0 )–verteilt, µ sei unbekannt.
Stelle eine Hypothese über µ auf, in diesem Fall:
Hypothese H0 : µ = µ0 .
Lege das Signifikanzniveau α und den Stichprobenumfang n vor der Untersuchung der Stichprobe fest. Bestimme ε > 0 aus
(9.1.1)
!
|X − µ0 | √
α
Satz 8.4.3a
!
!
P
n ≥ ε H0
=
2(1 − Φ(ε))=α ⇐⇒ Φ(ε)=1 − .
σ0
2
Setze d :=
√ε σ0
n
.
Untersuche Stichprobe vom Umfang n. Das Ergebnis sei der Schätzwert µ̂ = x für µ.
Falls |µ̂ − µ0 | ≥ d ist, ist H0 abzulehnen.
Falls |µ̂ − µ0 | < d ist, ist H0 (mit Vorbehalt) anzunehmen.
Begründung der Entscheidungsregel:
Nach (9.1.1) gilt für die Wahrscheinlichkeit für eine irrtümliche Ablehnung von
H0:
P (H0 wird (auf Grund des Testergebnisses) abgelehnt|H0 ) = P |X − µ0 | ≥ d H0
√ √
0|
H0 = α
n
≥
ε
= P |X − µ0 | ≥ σ0 ε/ n H0 = P |X−µ
σ0
Bem.:
a) X, x u. s. w. haben diesselbe Bedeutung wie im ersten Teil von Abschnitt 8.4.
b) α hat eine andere Bedeutung als γ im Abschnitt 8.4. α liegt nahe bei 0, z. B. α =
0.1, 0.05, 0.01 o. ä.
c) P (. . . |H0 ) in (9.1.1) bedeutet: (9.1.1) bestimmt die Wahrsch. für das interessierende Ereignis, wenn H0 richtig wäre.
Interpretation des Testergebnisses: Es gibt nach einem Test 4 verschiedene Situationen, die
in nachstehender schematischer Übersicht dargestellt sind (Siehe Tabelle 8-1):
65
Tabelle 9-1
H0 wird
angenommen
abgelehnt
richtig
richtige Entscheidung
Fehler 1. Art
falsch
Fehler 2. Art
richtige Entscheidung
unter der Bedingung ↓:
H0 ist
Allgemein wird gefordert:
(9.1.2)
P(Fehler 1. Art) = P(H0 wird abgelehnt|H0 ) ≤ α
Die Wahrscheinlichkeit für einen Fehler 2. Art ist erst dann in gleicher Weise durch eine Zahl < 1
abzuschätzen, wenn man H0 eine geeignete Alternativhypothese H1 gegenüberstellt und evtl. das
Testverfahren ändert. Ohne geeignete Alternativhypothese gilt also nur P (Fehler 2. Art) ≤ 1,
d. h. man hat den Fehler 2. Art nicht unter Kontrolle. Scheint die Annahme von H0 nur durch
einen zu kleinen Stichprobenumfang zustande gekommen zu sein (was aus o. g. Gründen nicht
präzise fassbar ist), so ist der Test u. U. mit größerem Stichprobenumfang zu wiederholen.
Signifikanztest für µ bei der Normalverteilung bei unbekanntem σ:
Xi seien unabhängig und N (µ, σ)–verteilt, µ und σ seien unbekannt.
Stelle eine Hypothese über µ auf, in diesem Fall:
Hypothese H0 : µ = µ0 .
Lege das Signifikanzniveau α und den Stichprobenumfang n vor der Untersuchung der Stichprobe fest. Bestimme ε > 0 aus
(9.1.3)

√
 |X − µ0 | n

P  r Pn
(Xi −X)2
n−1
i=1

 Satz 8.4.8a
α
!
!
≥ ε H0 
=
2(1 − Ft (ε))=α ⇐⇒ Ft (ε)=1 − ,

2
wobei Ft (y) die Verteilungsfunktion der t–Verteilung mit r = (n − 1) Freiheitsgraden ist.
Untersuche Stichprobe vom Umfang n. Diese liefert die Meß– oder Beobachtungswerte x1 , x2 , . . . xn .
Daraus gewinnen wir den Schätzwert µ̂ = x für µ und die Testgröße
sP
d := ε
n
i=1 (xi
− x)2
n(n − 1)
Falls |µ̂ − µ0 | ≥ d ist, ist H0 abzulehnen.
Falls |µ̂ − µ0 | < d ist, ist H0 (mit Vorbehalt) anzunehmen.
66
9.2
Einseitige Tests
9.2.1
Ein einseitiger Test bei der Normalverteilung
X1 , . . . , Xn seien unabhängige N (µ, σ)–verteilte ZV mit bekanntem σ = σ0 . Über dem unbekannten Parameter µ werden 2 Hypothesen aufgestellt :
H 0 : µ ≤ µ0 ,
H 1 : µ > µ0
(Alternativhypothese)
Fehler 1. Art : Entscheidung gegen H0 (und damit für H1 ), obwohl H0 richtig ist.
Fehler 2. Art : Entscheidung gegen H1 (und damit für H0 ), obwohl H1 richtig ist.
Durchführung des Tests:
Schritt 1: Lege die Höchstgrenze α für die Wahrsch. für einen Fehler 1. Art und die Höchstgrenze β für die Wahrsch. für einen Fehler 2. Art fest.
Schritt 2: Lege den Stichprobenumfang n fest und berechne d0 und d1 aus n, α und β nach der
folgenden Formel:
(9.2.1)
√
d0 = ε0 σ0 / n
√
d1 = ε1 σ0 / n
mit
mit
Φ(ε0 ) = 1 − α
Φ(ε1 ) = 1 − β
Schritt 3: Werte eine Stichprobe vom Umfang n aus. x ist dann eine Realisierung von X(:=
n−1 (X1 + . . . + Xn )):
x ≥ µ0 + d0 ⇒ Entscheidung für H1
x ≤ µ0 − d1 ⇒ Entscheidung für H0
µ0 − d1 < x < µ0 + d0 ⇒ keine Entscheidung (u. U. den Test mit größerem Stichprobenumfang
wiederholen)
Begründung für (9.2.1): Aus der Tatsache, dass
wachsend ist, folgt:
Φ(x) monoton
µ0 −µ+d0 √
d0 √
n
|
≤
1
−
Φ
n
≤α
P (Fehler 1. Art) = P (X ≥ µ0 + d0 |H0 ) = 1 − Φ
µ≤µ
0
σ0 σ0
√ √
µ0 −µ−d1 √
1
P (Fehler 2. Art) = P (X ≤ µ0 −d1 |H1 ) = Φ
n |µ>µ0 ≤ Φ −d
n = 1−Φ σd10 n ≤
σ0
σ0
β
Bem.:
a) Manchmal ist von der praktischen Fragestellung her folgende Gegenüberstellung zweckmäßig:
H0 : µ ≤ µ0 , H1 : µ ≥ µ1 (> µ0 ). Der Test ist dann wie oben durchzuführen, wobei aber
folgende Änderungen zu beachten sind:
x ≥ µ0 + d0 ⇒ Entscheidung gegen H0 (nicht unbedingt für H1 )
x ≤ µ1 − d1 ⇒ Entscheidung gegen H1 (nicht unbedingt für H0 )
µ1 − d1 < x < µ0 + d0 ⇒ keine Entscheidung
Durch genügend großen Stichprobenumfang n kann man erreichen, dass µ1 − d1 ≥ µ0 + d0
und damit das 3. Intervall leer ist. Man kommt dann immer zu einer Entscheidung.
b) Ist auch σ unbekannt, so kann man ähnlich wie bei den Konfidenzintervallen (vgl. Satz
8.4.8) oder bei dem Signifikanztest die einseitigen Tests mit folgenden Veränderungen
durchführen: (9.2.1) wird ersetzt durch
67
(9.2.2)
d0 = ε0
d1 = ε1
r Pn
(xi −x)2
n(n−1)
i=1
r Pn
(xi −x)2
n(n−1)
i=1
mit
Ft (ε0 ) = 1 − α,
mit
Ft (ε1 ) = 1 − β,
wobei Ft (y) die Verteilungsfunktion der t–Verteilung mit r = (n − 1) Freiheitsgraden ist.
c) Anstelle des Tests auf
H0 : µ ≤ µ0 gegen H1 : µ > µ0
findet man in der Literatur oft Tests auf
H0 : µ = µ0 gegen H1 : µ > µ0 oder
H0 : µ < µ0 gegen H1 : µ ≥ µ0 oder
H0 : µ < µ0 gegen H1 : µ = µ0 .
Alle diese Tests sind rechnerisch gleichwertig.
9.2.2
Ein einseitiger Test bei der Binomialverteilung
X sei eine binomial–verteilte ZV mit den Parametern n (wird noch festgelegt) und p (unbekannt). X ist damit selbst schon mit einer Stichprobe vom Umfang n verbunden, d. h. X in
9.2.2 entspricht abgesehen von den verschiedenen Verteilungen der ZV nX in 9.2.1.
Hypothesen über p :
H 0 : 0 ≤ p ≤ p0 ,
H1 : p1 ≤ p ≤ 1,
0 < p0 ≤ p1 < 1.
Fehler 1. Art: Entscheidung gegen H0 (und damit für p > p0 ), obwohl H0 richtig ist.
Fehler 2. Art: Entscheidung gegen H1 (und damit für p < p1 ), obwohl H1 richtig ist.
Durchführung des Tests:
Schritt 1: Lege die Höchstgrenze α für die Wahrscheinlichkeit für einen Fehler 1. Art und die
Höchstgrenze β für die Wahrscheinlichkeit für einen Fehler 2. Art fest.
Schritt 2: Lege n fest.
Schritt 3: Werte eine Stichprobe vom Umfang n aus, die eine Realisierung x von X liefert.
Fall 1: x/n < p1 .
Setze q1 := 1 − p1 .
Falls
x
X
k=0
n
k
!
p1
q1
k
≤
β
q1n
gilt, ist die Hypothese H1 mit ausreichender Sicherheit abzulehnen. Anderenfalls kann die Hypothese H1 auf Grund der vorliegenden Daten nicht mit ausreichender Sicherheit abgelehnt werden.
Begründung: x/n < p1 spricht gegen die Hypothese H1 . Um aber H1 mit ausreichender Sicherheit ablehnen zu können, müssen wir prüfen, ob die die Wahrscheinlichkeit für einen Fehler 2.
Art ≤ β ist, d.h. ob die Wahrscheinlichkeit dafür, dass die ZV X den vorliegenden Wert x oder
68
Werte annimmt, die noch mehr gegen die Hypothese H1 sprechen, ≤ β ist:
P (X ≤ x|H1 ) ≤ P (X ≤ x|p = p1 ) =
x
X
n
n k n−k
p1 q1 = q1n
k
k
k=0
x
X
!
k=0
!
p1
q1
k
?
≤ β.
Die erste Ungleichung gilt, weil die Wahrscheinlichkeit für X ≤ x(< np1 ) für p > p1 noch kleiner
ist als für p = p1 .
Fall 2: x/n > p0 .
Setze q0 := 1 − p0 .
Falls
x−1
X
!
n
k
k=0
p0
q0
k
1−α
q0n
≥
gilt, ist die Hypothese H0 mit ausreichender Sicherheit abzulehnen. Anderenfalls kann die Hypothese H0 auf Grund der vorliegenden Daten nicht mit ausreichender Sicherheit abgelehnt werden.
Begründung: x/n > p0 spricht gegen die Hypothese H0 . Um aber H0 mit ausreichender Sicherheit ablehnen zu können, müssen wir prüfen, ob die die Wahrscheinlichkeit für einen Fehler 1.
Art ≤ α ist, d.h. ob die Wahrscheinlichkeit dafür, dass die ZV X den vorliegenden Wert x oder
Werte annimmt, die noch mehr gegen die Hypothese H0 sprechen, ≤ α ist:
n
X
P (X ≥ x|H0 ) ≤ P (X ≥ x|p = p0 ) =
n
X
n k n−k
n
p0 q0 = q0n
k
k
k=x
!
k=x
!
p0
q0
k
?
≤ α.
Die erste Ungleichung gilt, weil die Wahrscheinlichkeit für X ≥ x(> np0 ) für p < p0 noch kleiner
ist als für p = p0 . Da x nur ganzzahlige Werte annehmen kann, ergibt sich die obige Ungleichung
schliesslich aus:
q0n
n
X
k=x
!
n
k
p0
q0
k
=
q0n
n
X
k=0
n
k
!
p0
q0
⇐⇒
k
x−1
X
k=0
x−1
X
q0n
−
k=0
!
n
k
p0
q0
n
k
k
!
?
≥
p0
q0
k
=1−
q0n
x−1
X
k=0
n
k
!
p0
q0
k
?
≤α
1−α
q0n
Fall 3: x/n = p0 = p1 .
Es kann weder die Hypothese H0 noch die Hypothese H1 auf Grund der vorliegenden Daten mit
ausreichender Sicherheit abgelehnt werden.
Begründung: x/n = p0 = p1 spricht weder gegen die Hypothese H0 noch gegen die Hypothese
H1 . Eine Annahme von H0 oder von H1 auf Grund der vorliegenden Daten ist mit ausreichender
Sicherheit aber auch nicht gerechtfertigt; denn eine eine Annahme von z.B. H0 bedeutet eine
Ablehnung von p > p0 , und dies ist rechnerisch gleichwertig mit einer Ablehnung von H1 .
Bemerkung: Die obige Summenbildung ist speziell bei dem in der Vorlesung und Übung behandelten Fall, dass p1 deutlich näher bei 0 als bei 1 ist, günstig. Trifft dies nicht zu, kann es
besser sein, im Test die Ungleichung
x
X
k=0
n
k
!
k
≤
β
q1n
k
≥
1−β
q1n
p1
q1
durch die äquivalente Ungleichung
n
X
k=x+1
!
n
k
p1
q1
69
oder die Ungleichung
x−1
X
!
n
k
k=0
p0
q0
k
≥
1−α
q0n
durch die äquivalente Ungleichung
n
X
k=x
n
k
!
k
p0
q0
≤
α
q0n
zu ersetzen.
Aus der ”Ablehnungsungleichung” von H1 folgt:
x
X
n
β
≥
n
q1
k
k=0
!
p1
q1
k
n
0
≥
!
p1
q1
0
= 1 ⇒ β ≥ q1n ⇒ ln β ≥ n ln q1 .
Damit muss für der Stichprobenumfang
n≥
ln β
ln q1
gelten. Sonst wird kein Ziehungsergebnis zur Ablehnung von H1 führen.
Aus der ”Ablehnungsungleichung” von H0 folgt:
n
X
α
n
≥
n
q0
k
k=x
!
p0
q0
k
≥
n
n
!
p0
q0
n
=
pn0
⇒ α ≥ pn0 ⇒ ln α ≥ n ln p0 .
q0n
Damit muss für der Stichprobenumfang
n≥
ln α
ln p0
gelten. Sonst wird kein Ziehungsergebnis zur Ablehnung von H0 führen.
9.2.3
Ein einseitiger Test bei der hypergeometrischen Verteilung
X sei eine hypergeometrisch verteilte ZV mit den Parametern n (wird noch festgelegt), M (unbekannt) und N . Bei der Qualitätskontrolle wäre N die Zahl der Stücke in der Lieferung, M die
Zahl der Stücke in der Lieferung und n der Umfang einer Stichprobe o.Z. X ist also selbst schon
mit einer Stichprobe vom Umfang n verbunden, d. h. X in 9.2.3 entspricht abgesehen von den
verschiedenen Verteilungen der ZV nX in 9.2.1.
Hypothesen über M :
H0 : 0 ≤ M ≤ M0 ,
H1 : M1 ≤ M ≤ N,
0 < M0 ≤ M1 < N.
Fehler 1. Art: Entscheidung gegen H0 (und damit für M > M0 ), obwohl H0 richtig ist.
Fehler 2. Art: Entscheidung gegen H1 (und damit für M < M1 ), obwohl H1 richtig ist.
Durchführung des Tests:
Schritt 1: Lege die Höchstgrenze α für die Wahrscheinlichkeit für einen Fehler 1. Art und die
70
Höchstgrenze β für die Wahrscheinlichkeit für einen Fehler 2. Art fest.
Schritt 2: Lege n fest.
Schritt 3: Werte eine Stichprobe vom Umfang n aus, die eine Realisierung x von X liefert.
Fall 1: x/n < M1 /N .
Falls
x
X
k=0
M1
k
!
N − M1
n−k
!
!
N
≤
β
n
gilt, ist die Hypothese H1 mit ausreichender Sicherheit abzulehnen. Anderenfalls kann die Hypothese H1 auf Grund der vorliegenden Daten nicht mit ausreichender Sicherheit abgelehnt werden.
Begründung: x/n < M1 /N spricht gegen die Hypothese H1 . Um aber H1 mit ausreichender Sicherheit ablehnen zu können, müssen wir prüfen, ob die die Wahrscheinlichkeit für einen Fehler
2. Art ≤ β ist, d.h. ob die Wahrscheinlichkeit dafür, dass die ZV X den vorliegenden Wert x
oder Werte annimmt, die noch mehr gegen die Hypothese H1 sprechen, ≤ β ist:
P (X ≤ x|H1 ) ≤ P (X ≤ x|M = M1 ) =
M1 N −M1 k
n−k
N
k=0
n
x
X
x
M1
1 X
= N
k
n k=0
!
N − M1
n−k
!
?
≤ β.
Die erste Ungleichung gilt, weil die Wahrscheinlichkeit für X ≤ x(< nM1 /N ) für M > M1 noch
kleiner ist als für M = M1 .
Fall 2: x/n > M0 /N .
Falls
x−1
X
k=0
M1
k
!
N − M1
n−k
!
!
N
(1 − α)
n
≥
gilt, ist die Hypothese H0 mit ausreichender Sicherheit abzulehnen. Anderenfalls kann die Hypothese H0 auf Grund der vorliegenden Daten nicht mit ausreichender Sicherheit abgelehnt werden.
Begründung: x/n > M0 /N spricht gegen die Hypothese H0 . Um aber H0 mit ausreichender Sicherheit ablehnen zu können, müssen wir prüfen, ob die die Wahrscheinlichkeit für einen Fehler
1. Art ≤ α ist, d.h. ob die Wahrscheinlichkeit dafür, dass die ZV X den vorliegenden Wert x
oder Werte annimmt, die noch mehr gegen die Hypothese H0 sprechen, ≤ α ist:
P (X ≥ x|H0 ) ≤ P (X ≥ x|M = M0 ) =
M1 N −M1 ?
k
n−k
≤
N
k=x
n
n
X
α.
Die erste Ungleichung gilt, weil die Wahrscheinlichkeit für X ≥ x(> nM0 /N ) für M < M0 noch
kleiner ist als für M = M0 . Da x nur ganzzahlige Werte annehmen kann, ergibt sich die obige
Ungleichung schliesslich aus:
M1 N −M1 k
n−k
N
k=x
n
n
X
=
M1 N −M1 k
n−k
N
k=0
n
n
X
⇐⇒
x−1
X
k=0
M1
k
!
−
−M1 x−1
X Mk1 Nn−k
N
k=0
n
N − M1
n−k
!
!
=1−
−M1 x−1
X Mk1 Nn−k
?
≤
N
k=0
n
α
N
≥
(1 − α).
n
?
Fall 3: x/n = M0 /N = M1 /N .
Es kann weder die Hypothese H0 noch die Hypothese H1 auf Grund der vorliegenden Daten mit
ausreichender Sicherheit abgelehnt werden.
Begründung: x/n = M0 /N = M1 /N spricht weder gegen die Hypothese H0 noch gegen die
71
Hypothese H1 . Eine Annahme von H0 oder von H1 auf Grund der vorliegenden Daten ist mit
ausreichender Sicherheit aber auch nicht gerechtfertigt; denn eine eine Annahme von z.B. H0
bedeutet eine Ablehnung von M > M0 , und dies ist rechnerisch gleichwertig mit einer Ablehnung von H1 .
Bemerkung: Die obige Summenbildung ist speziell bei dem in der Vorlesung und Übung behandelten Fall, dass M1 deutlich näher bei 0 als bei N ist, günstig. Trifft dies nicht zu, kann es
besser sein, im Test die Ungleichung
x
X
k=0
M1
k
!
N − M1
n−k
!
!
N
≤
β
n
durch die äquivalente Ungleichung
n
X
M1
k
k=x+1
!
N − M1
n−k
!
≥
!
N
(1 − β)
n
oder die Ungleichung
x−1
X
k=0
!
N − M1
n−k
M1
k
!
M1
k
!
≥
!
N
(1 − α)
n
durch die äquivalente Ungleichung
n
X
k=x
N − M1
n−k
zu ersetzen.
72
!
!
N
≤
α
n
Herunterladen