Testen statistischer Hypothesen

Werbung
Kapitel 9
Testen statistischer Hypothesen
9.1
Einführung, Signifikanztests
Signifikanztest für µ bei der Normalverteilung bei bekanntem σ = σ 0 :
Xi seien unabhängig und N (µ, σ0 )–verteilt, µ sei unbekannt.
Stelle eine Hypothese über µ auf, in diesem Fall:
Hypothese H0 : µ = µ0 .
Lege das Signifikanzniveau α und den Stichprobenumfang n vor der Untersuchung der Stichprobe fest. Bestimme ε > 0 aus
(9.1.1)
!
α
|X − µ0 | √
Satz 8.4.3a
!
!
n ≥ ε H0
=
2(1 − Φ(ε))=α ⇐⇒ Φ(ε)=1 − .
P
σ0
2
Setze d :=
√ε σ0
n
.
Untersuche Stichprobe vom Umfang n. Das Ergebnis sei der Schätzwert µ̂ = x für µ.
Falls |µ̂ − µ0 | ≥ d ist, ist H0 abzulehnen.
Falls |µ̂ − µ0 | < d ist, ist H0 (mit Vorbehalt) anzunehmen.
Begründung der Entscheidungsregel:
Nach (9.1.1) gilt für die Wahrscheinlichkeit für eine irrtümliche Ablehnung von
H
0:
P (H0 wird (aufgrund des Testergebnisses) abgelehnt|H 0 ) = P |X − µ0 | ≥ d H0
√ √
0|
H0 = α
= P |X − µ0 | ≥ σ0 ε/ n H0 = P |X−µ
n
≥
ε
σ0
Bem.:
a) X, x u. s. w. haben diesselbe Bedeutung wie im ersten Teil von Abschnitt 8.4.
b) α hat eine andere Bedeutung als γ im Abschnitt 8.4. α liegt nahe bei 0, z. B. α =
0.1, 0.05, 0.01 o. ä.
c) P (. . . |H0 ) in (9.1.1) bedeutet: (9.1.1) bestimmt die Wahrsch. für das interessierende Ereignis, wenn H0 richtig wäre.
Interpretation des Testergebnisses: Es gibt nach einem Test 4 verschiedene Situationen, die
in nachstehender schematischer Übersicht dargestellt sind (Siehe Tabelle 8-1):
65
Tabelle 9-1
H0 wird
angenommen
abgelehnt
richtig
richtige Entscheidung
Fehler 1. Art
falsch
Fehler 2. Art
richtige Entscheidung
unter der Bedingung ↓:
H0 ist
Allgemein wird gefordert:
(9.1.2)
P(Fehler 1. Art) = P(H0 wird abgelehnt|H0 ) ≤ α
Die Wahrscheinlichkeit für einen Fehler 2. Art ist erst dann in gleicher Weise durch eine Zahl < 1
abzuschätzen, wenn man H0 eine geeignete Alternativhypothese H 1 gegenüberstellt und evtl. das
Testverfahren ändert. Ohne geeignete Alternativhypothese gilt also nur P (Fehler 2. Art) ≤ 1,
d. h. man hat den Fehler 2. Art nicht unter Kontrolle. Scheint die Annahme von H 0 nur durch
einen zu kleinen Stichprobenumfang zustande gekommen zu sein (was aus o. g. Gründen nicht
präzise fassbar ist), so ist der Test u. U. mit größerem Stichprobenumfang zu wiederholen.
Signifikanztest für µ bei der Normalverteilung bei unbekanntem σ:
Xi seien unabhängig und N (µ, σ)–verteilt, µ und σ seien unbekannt.
Stelle eine Hypothese über µ auf, in diesem Fall:
Hypothese H0 : µ = µ0 .
Lege das Signifikanzniveau α und den Stichprobenumfang n vor der Untersuchung der Stichprobe fest. Bestimme ε > 0 aus
(9.1.3)

√
 |X − µ0 | n

P  r Pn
(Xi −X)2
n−1
i=1

 Satz 8.4.8a
α
!
!
=
2(1 − Ft (ε))=α ⇐⇒ Ft (ε)=1 − ,
≥ ε H0 

2
wobei Ft (y) die Verteilungsfunktion der t–Verteilung mit r = (n − 1) Freiheitsgraden ist.
Untersuche Stichprobe vom Umfang n. Diese liefert die Meß– oder Beobachtungswerte x 1 , x2 , . . . xn .
Daraus gewinnen wir den Schätzwert µ̂ = x für µ und die Testgröße
d := ε
sP
n
i=1 (xi
− x)2
n(n − 1)
Falls |µ̂ − µ0 | ≥ d ist, ist H0 abzulehnen.
Falls |µ̂ − µ0 | < d ist, ist H0 (mit Vorbehalt) anzunehmen.
66
9.2
Einseitige Tests
9.2.1
Ein einseitiger Test bei der Normalverteilung
X1 , . . . , Xn seien unabhängige N (µ, σ)–verteilte ZV mit bekanntem σ = σ 0 . Über dem unbekannten Parameter µ werden 2 Hypothesen aufgestellt :
H0 : µ ≤ µ 0 ,
H1 : µ > µ 0
(Alternativhypothese)
Fehler 1. Art : Entscheidung gegen H 0 (und damit für H1 ), obwohl H0 richtig ist.
Fehler 2. Art : Entscheidung gegen H 1 (und damit für H0 ), obwohl H1 richtig ist.
Durchführung des Tests:
Schritt 1: Lege die Höchstgrenze α für die Wahrsch. für einen Fehler 1. Art und die Höchstgrenze β für die Wahrsch. für einen Fehler 2. Art fest.
Schritt 2: Lege den Stichprobenumfang n fest und berechne d 0 und d1 aus n, α und β nach der
folgenden Formel:
(9.2.1)
√
d0 = ε 0 σ0 / n
√
d1 = ε 1 σ0 / n
mit
mit
Φ(ε0 ) = 1 − α
Φ(ε1 ) = 1 − β
Schritt 3: Werte eine Stichprobe vom Umfang n aus. x ist dann eine Realisierung von X(:=
n−1 (X1 + . . . + Xn )):
x ≥ µ0 + d0 ⇒ Entscheidung für H1
x ≤ µ0 − d1 ⇒ Entscheidung für H0
µ0 − d1 < x < µ0 + d0 ⇒ keine Entscheidung (u. U. den Test mit größerem Stichprobenumfang
wiederholen)
Begründung für (9.2.1): Aus der Tatsache, dass
wachsend ist, folgt:
Φ(x) monoton
µ0 −µ+d0 √
d0 √
≤
1
−
Φ
n
|
n
≤α
P (Fehler 1. Art) = P (X ≥ µ0 + d0 |H0 ) = 1 − Φ
µ≤µ
0
σ0 σ0
√ √
µ0 −µ−d1 √
1
P (Fehler 2. Art) = P (X ≤ µ0 −d1 |H1 ) = Φ
n |µ>µ0 ≤ Φ −d
n = 1−Φ σd10 n ≤
σ0
σ0
β
Bem.:
a) Manchmal ist von der praktischen Fragestellung her folgende Gegenüberstellung zweckmäßig:
H0 : µ ≤ µ0 , H1 : µ ≥ µ1 (> µ0 ). Der Test ist dann wie oben durchzuführen, wobei aber
folgende Änderungen zu beachten sind:
x ≥ µ0 + d0 ⇒ Entscheidung gegen H0 (nicht unbedingt für H1 )
x ≤ µ1 − d1 ⇒ Entscheidung gegen H1 (nicht unbedingt für H0 )
µ1 − d1 < x < µ0 + d0 ⇒ keine Entscheidung
Durch genügend großen Stichprobenumfang n kann man erreichen, dass µ 1 − d1 ≥ µ0 + d0
und damit das 3. Intervall leer ist. Man kommt dann immer zu einer Entscheidung.
b) Ist auch σ unbekannt, so kann man ähnlich wie bei den Konfidenzintervallen (vgl. Satz
8.4.8) oder bei dem Signifikanztest die einseitigen Tests mit folgenden Veränderungen
durchführen: (9.2.1) wird ersetzt durch
67
(9.2.2)
d0 = ε 0
d1 = ε 1
r Pn
(xi −x)2
n(n−1)
i=1
r Pn
(xi −x)2
n(n−1)
i=1
mit
Ft (ε0 ) = 1 − α,
mit
Ft (ε1 ) = 1 − β,
wobei Ft (y) die Verteilungsfunktion der t–Verteilung mit r = (n − 1) Freiheitsgraden ist.
c) Anstelle des Tests auf
H0 : µ ≤ µ0 gegen H1 : µ > µ0
findet man in der Literatur oft Tests auf
H0 : µ = µ0 gegen H1 : µ > µ0 oder
H0 : µ < µ0 gegen H1 : µ ≥ µ0 oder
H0 : µ < µ0 gegen H1 : µ = µ0 .
Alle diese Tests sind rechnerisch gleichwertig.
9.2.2
Ein einseitiger Test bei der Binomialverteilung
X sei eine binomial–verteilte ZV mit den Parametern n (wird noch festgelegt) und p (unbekannt). X ist damit selbst schon mit einer Stichprobe vom Umfang n verbunden, d. h. X in
9.2.2 entspricht abgesehen von den verschiedenen Verteilungen der ZV nX in 9.2.1.
Hypothesen über p :
H0 : 0 ≤ p ≤ p 0 ,
H1 : p1 ≤ p ≤ 1,
0 ≤ p0 ≤ p1 < 1.
Fehler 1. Art: Entscheidung gegen H 0 (und damit für p > p0 ), obwohl H0 richtig ist.
Fehler 2. Art: Entscheidung gegen H 1 (und damit für p < p1 ), obwohl H1 richtig ist.
Durchführung des Tests:
Schritt 1: Lege die Höchstgrenze α für die Wahrscheinlichkeit für einen Fehler 1. Art und die
Höchstgrenze β für die Wahrscheinlichkeit für einen Fehler 2. Art fest.
Schritt 2: Lege n fest.
Schritt 3: Werte eine Stichprobe vom Umfang n aus, die eine Realisierung x von X liefert.
Fall 1: x/n < p1 .
Setze q1 := 1 − p1 .
Falls
x
X
k=0
n
k
!
p1
q1
k
≤
β
q1n
gilt, ist die Hypothese H1 mit ausreichender Sicherheit abzulehnen. Anderenfalls kann die Hypothese H1 auf Grund der vorliegenden Daten nicht mit ausreichender Sicherheit abgelehnt werden.
Begründung: x/n < p1 spricht gegen die Hypothese H1 . Um aber H1 mit ausreichender Sicherheit ablehnen zu können, müssen wir prüfen, ob die die Wahrscheinlichkeit für einen Fehler 2.
Art ≤ β ist, d.h. ob die Wahrscheinlichkeit dafür, dass die ZV X den vorliegenden Wert x oder
68
Werte annimmt, die noch mehr gegen die Hypothese H 1 sprechen, ≤ β ist:
P (X ≤ x|H1 ) ≤ P (X ≤ x|p = p1 ) =
x
X
x
X
n k n−k
n
p1 q1 = q1n
k
k
k=0
!
k=0
!
p1
q1
k
?
≤ β.
Die erste Ungleichung gilt, weil die Wahrscheinlichkeit für X ≤ x(< np1 ) für p > p1 noch kleiner
ist als für p = p1 .
Fall 2: x/n > p0 .
Setze q0 := 1 − p0 .
Falls
n
X
k=x
!
n
k
p0
q0
k
α
≤ n
q0
x−1
X
⇐⇒
k=0
n
k
!
p0
q0
k
1−α
≥
q0n
!
gilt, ist die Hypothese H0 mit ausreichender Sicherheit abzulehnen. Anderenfalls kann die Hypothese H0 auf Grund der vorliegenden Daten nicht mit ausreichender Sicherheit abgelehnt werden.
Begründung: x/n > p0 spricht gegen die Hypothese H0 . Um aber H0 mit ausreichender Sicherheit ablehnen zu können, müssen wir prüfen, ob die die Wahrscheinlichkeit für einen Fehler 1.
Art ≤ α ist, d.h. ob die Wahrscheinlichkeit dafür, dass die ZV X den vorliegenden Wert x oder
Werte annimmt, die noch mehr gegen die Hypothese H 0 sprechen, ≤ α ist:
P (X ≥ x|H0 ) ≤ P (X ≥ x|p = p0 ) =
n
X
n
n k n−k
p0 q0 = q0n
k
k
k=x
n
X
!
k=x
!
p0
q0
k
?
≤ α.
Die erste Ungleichung gilt, weil die Wahrscheinlichkeit für X ≥ x(> np0 ) für p < p0 noch kleiner
ist als für p = p0 , und die zweite Gleichung, weil X nur ganzzahlige Werte annehmen kann.
Fall 3: x/n = p0 = p1 .
Es kann weder die Hypothese H0 noch die Hypothese H1 auf Grund der vorliegenden Daten mit
ausreichender Sicherheit abgelehnt werden.
Begründung: x/n = p0 = p1 spricht weder gegen die Hypothese H 0 noch gegen die Hypothese
H1 . Eine Annahme von H0 oder von H1 auf Grund der vorliegenden Daten ist mit ausreichender
Sicherheit aber auch nicht gerechtfertigt; denn eine eine Annahme von z.B. H 0 bedeutet eine
Ablehnung von p > p0 , und dies ist rechnerisch gleichwertig mit einer Ablehnung von H 1 .
Aus der ”Ablehnungsungleichung” von H 1 folgt:
x
X
n
β
≥
q1n k=0 k
!
p1
q1
k
n
0
≥
!
p1
q1
0
= 1 ⇒ β ≥ q1n ⇒ ln β ≥ n ln q1 .
Damit muss für der Stichprobenumfang
ln β
ln q1
gelten. Sonst wird kein Ziehungsergebnis zur Ablehnung von H 1 führen.
Aus der ”Ablehnungsungleichung” von H 0 folgt:
n≥
n
X
α
n
≥
n
q0
k
k=x
!
p0
q0
k
≥
n
n
!
p0
q0
n
=
pn0
⇒ α ≥ pn0 ⇒ ln α ≥ n ln p0 .
q0n
Damit muss für der Stichprobenumfang
ln α
ln p0
gelten. Sonst wird kein Ziehungsergebnis zur Ablehnung von H 0 führen.
n≥
69
9.2.3
Ein einseitiger Test bei der hypergeometrischen Verteilung
X sei eine hypergeometrisch verteilte ZV mit den Parametern n (wird noch festgelegt), M (unbekannt) und N . Bei der Qualitätskontrolle wäre N die Zahl der Stücke in der Lieferung, M die
Zahl der Stücke in der Lieferung und n der Umfang einer Stichprobe o.Z. X ist also selbst schon
mit einer Stichprobe vom Umfang n verbunden, d. h. X in 9.2.3 entspricht abgesehen von den
verschiedenen Verteilungen der ZV nX in 9.2.1.
Hypothesen über M :
H0 : 0 ≤ M ≤ M 0 ,
H1 : M1 ≤ M ≤ N,
0 ≤ M0 ≤ M1 ≤ N.
Fehler 1. Art: Entscheidung gegen H 0 (und damit für M > M0 ), obwohl H0 richtig ist.
Fehler 2. Art: Entscheidung gegen H 1 (und damit für M < M1 ), obwohl H1 richtig ist.
Durchführung des Tests:
Schritt 1: Lege die Höchstgrenze α für die Wahrscheinlichkeit für einen Fehler 1. Art und die
Höchstgrenze β für die Wahrscheinlichkeit für einen Fehler 2. Art fest.
Schritt 2: Lege n fest.
Schritt 3: Werte eine Stichprobe vom Umfang n aus, die eine Realisierung x von X liefert.
Fall 1: x/n < M1 /N .
Falls
x
X
k=0
M1
k
!
N − M1
n−k
!
!
N
β
≤
n
gilt, ist die Hypothese H1 mit ausreichender Sicherheit abzulehnen. Anderenfalls kann die Hypothese H1 auf Grund der vorliegenden Daten nicht mit ausreichender Sicherheit abgelehnt werden.
Begründung: x/n < M1 /N spricht gegen die Hypothese H1 . Um aber H1 mit ausreichender Sicherheit ablehnen zu können, müssen wir prüfen, ob die die Wahrscheinlichkeit für einen Fehler
2. Art ≤ β ist, d.h. ob die Wahrscheinlichkeit dafür, dass die ZV X den vorliegenden Wert x
oder Werte annimmt, die noch mehr gegen die Hypothese H 1 sprechen, ≤ β ist:
P (X ≤ x|H1 ) ≤ P (X ≤ x|M = M1 ) =
M1 N −M1 n−k
k
N
k=0
n
x
X
x
M1
1 X
= N
k
n k=0
!
N − M1
n−k
!
?
≤ β.
Die erste Ungleichung gilt, weil die Wahrscheinlichkeit für X ≤ x(< nM1 /N ) für M > M1 noch
kleiner ist als für M = M1 .
Fall 2: x/n > M0 /N .
Falls
n
X
k=x
M1
k
!
N − M1
n−k
!
!
N
α
≤
n
⇐⇒
x−1
X
k=0
M1
k
!
N − M1
n−k
!
!
N
(1 − α)
≥
n
!
gilt, ist die Hypothese H0 mit ausreichender Sicherheit abzulehnen. Anderenfalls kann die Hypothese H0 auf Grund der vorliegenden Daten nicht mit ausreichender Sicherheit abgelehnt werden.
Begründung: x/n > M0 /N spricht gegen die Hypothese H0 . Um aber H0 mit ausreichender Sicherheit ablehnen zu können, müssen wir prüfen, ob die die Wahrscheinlichkeit für einen Fehler
70
1. Art ≤ α ist, d.h. ob die Wahrscheinlichkeit dafür, dass die ZV X den vorliegenden Wert x
oder Werte annimmt, die noch mehr gegen die Hypothese H 0 sprechen, ≤ α ist:
P (X ≥ x|H0 ) ≤ P (X ≥ x|M = M0 ) =
M1 N −M1 ?
k
n−k
≤
N
k=x
n
n
X
α.
Die erste Ungleichung gilt, weil die Wahrscheinlichkeit für X ≥ x(> nM0 /N ) für M < M0 noch
kleiner ist als für M = M0 , und die zweite Gleichung, weil X nur ganzzahlige Werte annehmen
kann.
Fall 3: x/n = M0 /N = M1 /N .
Es kann weder die Hypothese H0 noch die Hypothese H1 auf Grund der vorliegenden Daten mit
ausreichender Sicherheit abgelehnt werden.
Begründung: x/n = M0 /N = M1 /N spricht weder gegen die Hypothese H 0 noch gegen die
Hypothese H1 . Eine Annahme von H0 oder von H1 auf Grund der vorliegenden Daten ist mit
ausreichender Sicherheit aber auch nicht gerechtfertigt; denn eine eine Annahme von z.B. H 0
bedeutet eine Ablehnung von M > M0 , und dies ist rechnerisch gleichwertig mit einer Ablehnung von H1 .
71
Herunterladen