Kapitel 9 Testen statistischer Hypothesen 9.1 Einführung, Signifikanztests Signifikanztest für µ bei der Normalverteilung bei bekanntem σ = σ0 : Xi seien unabhängig und N (µ, σ0 )–verteilt, µ sei unbekannt. Stelle eine Hypothese über µ auf, in diesem Fall: Hypothese H0 : µ = µ0 . Lege das Signifikanzniveau α und den Stichprobenumfang n vor der Untersuchung der Stichprobe fest. Bestimme ε > 0 aus (9.1.1) ! |X − µ0 | √ α Satz 8.4.3a ! ! P n ≥ ε H0 = 2(1 − Φ(ε))=α ⇐⇒ Φ(ε)=1 − . σ0 2 Setze d := √ε σ0 n . Untersuche Stichprobe vom Umfang n. Das Ergebnis sei der Schätzwert µ̂ = x für µ. Falls |µ̂ − µ0 | ≥ d ist, ist H0 abzulehnen. Falls |µ̂ − µ0 | < d ist, ist H0 (mit Vorbehalt) anzunehmen. Begründung der Entscheidungsregel: Nach (9.1.1) gilt für die Wahrscheinlichkeit für eine irrtümliche Ablehnung von H0: P (H0 wird (auf Grund des Testergebnisses) abgelehnt|H0 ) = P |X − µ0 | ≥ d H0 √ √ 0| H0 = α n ≥ ε = P |X − µ0 | ≥ σ0 ε/ n H0 = P |X−µ σ0 Bem.: a) X, x u. s. w. haben diesselbe Bedeutung wie im ersten Teil von Abschnitt 8.4. b) α hat eine andere Bedeutung als γ im Abschnitt 8.4. α liegt nahe bei 0, z. B. α = 0.1, 0.05, 0.01 o. ä. c) P (. . . |H0 ) in (9.1.1) bedeutet: (9.1.1) bestimmt die Wahrsch. für das interessierende Ereignis, wenn H0 richtig wäre. Interpretation des Testergebnisses: Es gibt nach einem Test 4 verschiedene Situationen, die in nachstehender schematischer Übersicht dargestellt sind (Siehe Tabelle 8-1): 65 Tabelle 9-1 H0 wird angenommen abgelehnt richtig richtige Entscheidung Fehler 1. Art falsch Fehler 2. Art richtige Entscheidung unter der Bedingung ↓: H0 ist Allgemein wird gefordert: (9.1.2) P(Fehler 1. Art) = P(H0 wird abgelehnt|H0 ) ≤ α Die Wahrscheinlichkeit für einen Fehler 2. Art ist erst dann in gleicher Weise durch eine Zahl < 1 abzuschätzen, wenn man H0 eine geeignete Alternativhypothese H1 gegenüberstellt und evtl. das Testverfahren ändert. Ohne geeignete Alternativhypothese gilt also nur P (Fehler 2. Art) ≤ 1, d. h. man hat den Fehler 2. Art nicht unter Kontrolle. Scheint die Annahme von H0 nur durch einen zu kleinen Stichprobenumfang zustande gekommen zu sein (was aus o. g. Gründen nicht präzise fassbar ist), so ist der Test u. U. mit größerem Stichprobenumfang zu wiederholen. Signifikanztest für µ bei der Normalverteilung bei unbekanntem σ: Xi seien unabhängig und N (µ, σ)–verteilt, µ und σ seien unbekannt. Stelle eine Hypothese über µ auf, in diesem Fall: Hypothese H0 : µ = µ0 . Lege das Signifikanzniveau α und den Stichprobenumfang n vor der Untersuchung der Stichprobe fest. Bestimme ε > 0 aus (9.1.3) √ |X − µ0 | n P r Pn (Xi −X)2 n−1 i=1 Satz 8.4.8a α ! ! ≥ ε H0 = 2(1 − Ft (ε))=α ⇐⇒ Ft (ε)=1 − , 2 wobei Ft (y) die Verteilungsfunktion der t–Verteilung mit r = (n − 1) Freiheitsgraden ist. Untersuche Stichprobe vom Umfang n. Diese liefert die Meß– oder Beobachtungswerte x1 , x2 , . . . xn . Daraus gewinnen wir den Schätzwert µ̂ = x für µ und die Testgröße sP d := ε n i=1 (xi − x)2 n(n − 1) Falls |µ̂ − µ0 | ≥ d ist, ist H0 abzulehnen. Falls |µ̂ − µ0 | < d ist, ist H0 (mit Vorbehalt) anzunehmen. 66 9.2 Einseitige Tests 9.2.1 Ein einseitiger Test bei der Normalverteilung X1 , . . . , Xn seien unabhängige N (µ, σ)–verteilte ZV mit bekanntem σ = σ0 . Über dem unbekannten Parameter µ werden 2 Hypothesen aufgestellt : H 0 : µ ≤ µ0 , H 1 : µ > µ0 (Alternativhypothese) Fehler 1. Art : Entscheidung gegen H0 (und damit für H1 ), obwohl H0 richtig ist. Fehler 2. Art : Entscheidung gegen H1 (und damit für H0 ), obwohl H1 richtig ist. Durchführung des Tests: Schritt 1: Lege die Höchstgrenze α für die Wahrsch. für einen Fehler 1. Art und die Höchstgrenze β für die Wahrsch. für einen Fehler 2. Art fest. Schritt 2: Lege den Stichprobenumfang n fest und berechne d0 und d1 aus n, α und β nach der folgenden Formel: (9.2.1) √ d0 = ε0 σ0 / n √ d1 = ε1 σ0 / n mit mit Φ(ε0 ) = 1 − α Φ(ε1 ) = 1 − β Schritt 3: Werte eine Stichprobe vom Umfang n aus. x ist dann eine Realisierung von X(:= n−1 (X1 + . . . + Xn )): x ≥ µ0 + d0 ⇒ Entscheidung für H1 x ≤ µ0 − d1 ⇒ Entscheidung für H0 µ0 − d1 < x < µ0 + d0 ⇒ keine Entscheidung (u. U. den Test mit größerem Stichprobenumfang wiederholen) Begründung für (9.2.1): Aus der Tatsache, dass wachsend ist, folgt: Φ(x) monoton µ0 −µ+d0 √ d0 √ n | ≤ 1 − Φ n ≤α P (Fehler 1. Art) = P (X ≥ µ0 + d0 |H0 ) = 1 − Φ µ≤µ 0 σ0 σ0 √ √ µ0 −µ−d1 √ 1 P (Fehler 2. Art) = P (X ≤ µ0 −d1 |H1 ) = Φ n |µ>µ0 ≤ Φ −d n = 1−Φ σd10 n ≤ σ0 σ0 β Bem.: a) Manchmal ist von der praktischen Fragestellung her folgende Gegenüberstellung zweckmäßig: H0 : µ ≤ µ0 , H1 : µ ≥ µ1 (> µ0 ). Der Test ist dann wie oben durchzuführen, wobei aber folgende Änderungen zu beachten sind: x ≥ µ0 + d0 ⇒ Entscheidung gegen H0 (nicht unbedingt für H1 ) x ≤ µ1 − d1 ⇒ Entscheidung gegen H1 (nicht unbedingt für H0 ) µ1 − d1 < x < µ0 + d0 ⇒ keine Entscheidung Durch genügend großen Stichprobenumfang n kann man erreichen, dass µ1 − d1 ≥ µ0 + d0 und damit das 3. Intervall leer ist. Man kommt dann immer zu einer Entscheidung. b) Ist auch σ unbekannt, so kann man ähnlich wie bei den Konfidenzintervallen (vgl. Satz 8.4.8) oder bei dem Signifikanztest die einseitigen Tests mit folgenden Veränderungen durchführen: (9.2.1) wird ersetzt durch 67 (9.2.2) d0 = ε0 d1 = ε1 r Pn (xi −x)2 n(n−1) i=1 r Pn (xi −x)2 n(n−1) i=1 mit Ft (ε0 ) = 1 − α, mit Ft (ε1 ) = 1 − β, wobei Ft (y) die Verteilungsfunktion der t–Verteilung mit r = (n − 1) Freiheitsgraden ist. c) Anstelle des Tests auf H0 : µ ≤ µ0 gegen H1 : µ > µ0 findet man in der Literatur oft Tests auf H0 : µ = µ0 gegen H1 : µ > µ0 oder H0 : µ < µ0 gegen H1 : µ ≥ µ0 oder H0 : µ < µ0 gegen H1 : µ = µ0 . Alle diese Tests sind rechnerisch gleichwertig. 9.2.2 Ein einseitiger Test bei der Binomialverteilung X sei eine binomial–verteilte ZV mit den Parametern n (wird noch festgelegt) und p (unbekannt). X ist damit selbst schon mit einer Stichprobe vom Umfang n verbunden, d. h. X in 9.2.2 entspricht abgesehen von den verschiedenen Verteilungen der ZV nX in 9.2.1. Hypothesen über p : H 0 : 0 ≤ p ≤ p0 , H1 : p1 ≤ p ≤ 1, 0 < p0 ≤ p1 < 1. Fehler 1. Art: Entscheidung gegen H0 (und damit für p > p0 ), obwohl H0 richtig ist. Fehler 2. Art: Entscheidung gegen H1 (und damit für p < p1 ), obwohl H1 richtig ist. Durchführung des Tests: Schritt 1: Lege die Höchstgrenze α für die Wahrscheinlichkeit für einen Fehler 1. Art und die Höchstgrenze β für die Wahrscheinlichkeit für einen Fehler 2. Art fest. Schritt 2: Lege n fest. Schritt 3: Werte eine Stichprobe vom Umfang n aus, die eine Realisierung x von X liefert. Fall 1: x/n < p1 . Setze q1 := 1 − p1 . Falls x X k=0 n k ! p1 q1 k ≤ β q1n gilt, ist die Hypothese H1 mit ausreichender Sicherheit abzulehnen. Anderenfalls kann die Hypothese H1 auf Grund der vorliegenden Daten nicht mit ausreichender Sicherheit abgelehnt werden. Begründung: x/n < p1 spricht gegen die Hypothese H1 . Um aber H1 mit ausreichender Sicherheit ablehnen zu können, müssen wir prüfen, ob die die Wahrscheinlichkeit für einen Fehler 2. Art ≤ β ist, d.h. ob die Wahrscheinlichkeit dafür, dass die ZV X den vorliegenden Wert x oder 68 Werte annimmt, die noch mehr gegen die Hypothese H1 sprechen, ≤ β ist: P (X ≤ x|H1 ) ≤ P (X ≤ x|p = p1 ) = x X n n k n−k p1 q1 = q1n k k k=0 x X ! k=0 ! p1 q1 k ? ≤ β. Die erste Ungleichung gilt, weil die Wahrscheinlichkeit für X ≤ x(< np1 ) für p > p1 noch kleiner ist als für p = p1 . Fall 2: x/n > p0 . Setze q0 := 1 − p0 . Falls x−1 X ! n k k=0 p0 q0 k 1−α q0n ≥ gilt, ist die Hypothese H0 mit ausreichender Sicherheit abzulehnen. Anderenfalls kann die Hypothese H0 auf Grund der vorliegenden Daten nicht mit ausreichender Sicherheit abgelehnt werden. Begründung: x/n > p0 spricht gegen die Hypothese H0 . Um aber H0 mit ausreichender Sicherheit ablehnen zu können, müssen wir prüfen, ob die die Wahrscheinlichkeit für einen Fehler 1. Art ≤ α ist, d.h. ob die Wahrscheinlichkeit dafür, dass die ZV X den vorliegenden Wert x oder Werte annimmt, die noch mehr gegen die Hypothese H0 sprechen, ≤ α ist: n X P (X ≥ x|H0 ) ≤ P (X ≥ x|p = p0 ) = n X n k n−k n p0 q0 = q0n k k k=x ! k=x ! p0 q0 k ? ≤ α. Die erste Ungleichung gilt, weil die Wahrscheinlichkeit für X ≥ x(> np0 ) für p < p0 noch kleiner ist als für p = p0 . Da x nur ganzzahlige Werte annehmen kann, ergibt sich die obige Ungleichung schliesslich aus: q0n n X k=x ! n k p0 q0 k = q0n n X k=0 n k ! p0 q0 ⇐⇒ k x−1 X k=0 x−1 X q0n − k=0 ! n k p0 q0 n k k ! ? ≥ p0 q0 k =1− q0n x−1 X k=0 n k ! p0 q0 k ? ≤α 1−α q0n Fall 3: x/n = p0 = p1 . Es kann weder die Hypothese H0 noch die Hypothese H1 auf Grund der vorliegenden Daten mit ausreichender Sicherheit abgelehnt werden. Begründung: x/n = p0 = p1 spricht weder gegen die Hypothese H0 noch gegen die Hypothese H1 . Eine Annahme von H0 oder von H1 auf Grund der vorliegenden Daten ist mit ausreichender Sicherheit aber auch nicht gerechtfertigt; denn eine eine Annahme von z.B. H0 bedeutet eine Ablehnung von p > p0 , und dies ist rechnerisch gleichwertig mit einer Ablehnung von H1 . Bemerkung: Die obige Summenbildung ist speziell bei dem in der Vorlesung und Übung behandelten Fall, dass p1 deutlich näher bei 0 als bei 1 ist, günstig. Trifft dies nicht zu, kann es besser sein, im Test die Ungleichung x X k=0 n k ! k ≤ β q1n k ≥ 1−β q1n p1 q1 durch die äquivalente Ungleichung n X k=x+1 ! n k p1 q1 69 oder die Ungleichung x−1 X ! n k k=0 p0 q0 k ≥ 1−α q0n durch die äquivalente Ungleichung n X k=x n k ! k p0 q0 ≤ α q0n zu ersetzen. Aus der ”Ablehnungsungleichung” von H1 folgt: x X n β ≥ n q1 k k=0 ! p1 q1 k n 0 ≥ ! p1 q1 0 = 1 ⇒ β ≥ q1n ⇒ ln β ≥ n ln q1 . Damit muss für der Stichprobenumfang n≥ ln β ln q1 gelten. Sonst wird kein Ziehungsergebnis zur Ablehnung von H1 führen. Aus der ”Ablehnungsungleichung” von H0 folgt: n X α n ≥ n q0 k k=x ! p0 q0 k ≥ n n ! p0 q0 n = pn0 ⇒ α ≥ pn0 ⇒ ln α ≥ n ln p0 . q0n Damit muss für der Stichprobenumfang n≥ ln α ln p0 gelten. Sonst wird kein Ziehungsergebnis zur Ablehnung von H0 führen. 9.2.3 Ein einseitiger Test bei der hypergeometrischen Verteilung X sei eine hypergeometrisch verteilte ZV mit den Parametern n (wird noch festgelegt), M (unbekannt) und N . Bei der Qualitätskontrolle wäre N die Zahl der Stücke in der Lieferung, M die Zahl der Stücke in der Lieferung und n der Umfang einer Stichprobe o.Z. X ist also selbst schon mit einer Stichprobe vom Umfang n verbunden, d. h. X in 9.2.3 entspricht abgesehen von den verschiedenen Verteilungen der ZV nX in 9.2.1. Hypothesen über M : H0 : 0 ≤ M ≤ M0 , H1 : M1 ≤ M ≤ N, 0 < M0 ≤ M1 < N. Fehler 1. Art: Entscheidung gegen H0 (und damit für M > M0 ), obwohl H0 richtig ist. Fehler 2. Art: Entscheidung gegen H1 (und damit für M < M1 ), obwohl H1 richtig ist. Durchführung des Tests: Schritt 1: Lege die Höchstgrenze α für die Wahrscheinlichkeit für einen Fehler 1. Art und die 70 Höchstgrenze β für die Wahrscheinlichkeit für einen Fehler 2. Art fest. Schritt 2: Lege n fest. Schritt 3: Werte eine Stichprobe vom Umfang n aus, die eine Realisierung x von X liefert. Fall 1: x/n < M1 /N . Falls x X k=0 M1 k ! N − M1 n−k ! ! N ≤ β n gilt, ist die Hypothese H1 mit ausreichender Sicherheit abzulehnen. Anderenfalls kann die Hypothese H1 auf Grund der vorliegenden Daten nicht mit ausreichender Sicherheit abgelehnt werden. Begründung: x/n < M1 /N spricht gegen die Hypothese H1 . Um aber H1 mit ausreichender Sicherheit ablehnen zu können, müssen wir prüfen, ob die die Wahrscheinlichkeit für einen Fehler 2. Art ≤ β ist, d.h. ob die Wahrscheinlichkeit dafür, dass die ZV X den vorliegenden Wert x oder Werte annimmt, die noch mehr gegen die Hypothese H1 sprechen, ≤ β ist: P (X ≤ x|H1 ) ≤ P (X ≤ x|M = M1 ) = M1 N −M1 k n−k N k=0 n x X x M1 1 X = N k n k=0 ! N − M1 n−k ! ? ≤ β. Die erste Ungleichung gilt, weil die Wahrscheinlichkeit für X ≤ x(< nM1 /N ) für M > M1 noch kleiner ist als für M = M1 . Fall 2: x/n > M0 /N . Falls x−1 X k=0 M1 k ! N − M1 n−k ! ! N (1 − α) n ≥ gilt, ist die Hypothese H0 mit ausreichender Sicherheit abzulehnen. Anderenfalls kann die Hypothese H0 auf Grund der vorliegenden Daten nicht mit ausreichender Sicherheit abgelehnt werden. Begründung: x/n > M0 /N spricht gegen die Hypothese H0 . Um aber H0 mit ausreichender Sicherheit ablehnen zu können, müssen wir prüfen, ob die die Wahrscheinlichkeit für einen Fehler 1. Art ≤ α ist, d.h. ob die Wahrscheinlichkeit dafür, dass die ZV X den vorliegenden Wert x oder Werte annimmt, die noch mehr gegen die Hypothese H0 sprechen, ≤ α ist: P (X ≥ x|H0 ) ≤ P (X ≥ x|M = M0 ) = M1 N −M1 ? k n−k ≤ N k=x n n X α. Die erste Ungleichung gilt, weil die Wahrscheinlichkeit für X ≥ x(> nM0 /N ) für M < M0 noch kleiner ist als für M = M0 . Da x nur ganzzahlige Werte annehmen kann, ergibt sich die obige Ungleichung schliesslich aus: M1 N −M1 k n−k N k=x n n X = M1 N −M1 k n−k N k=0 n n X ⇐⇒ x−1 X k=0 M1 k ! − −M1 x−1 X Mk1 Nn−k N k=0 n N − M1 n−k ! ! =1− −M1 x−1 X Mk1 Nn−k ? ≤ N k=0 n α N ≥ (1 − α). n ? Fall 3: x/n = M0 /N = M1 /N . Es kann weder die Hypothese H0 noch die Hypothese H1 auf Grund der vorliegenden Daten mit ausreichender Sicherheit abgelehnt werden. Begründung: x/n = M0 /N = M1 /N spricht weder gegen die Hypothese H0 noch gegen die 71 Hypothese H1 . Eine Annahme von H0 oder von H1 auf Grund der vorliegenden Daten ist mit ausreichender Sicherheit aber auch nicht gerechtfertigt; denn eine eine Annahme von z.B. H0 bedeutet eine Ablehnung von M > M0 , und dies ist rechnerisch gleichwertig mit einer Ablehnung von H1 . Bemerkung: Die obige Summenbildung ist speziell bei dem in der Vorlesung und Übung behandelten Fall, dass M1 deutlich näher bei 0 als bei N ist, günstig. Trifft dies nicht zu, kann es besser sein, im Test die Ungleichung x X k=0 M1 k ! N − M1 n−k ! ! N ≤ β n durch die äquivalente Ungleichung n X M1 k k=x+1 ! N − M1 n−k ! ≥ ! N (1 − β) n oder die Ungleichung x−1 X k=0 ! N − M1 n−k M1 k ! M1 k ! ≥ ! N (1 − α) n durch die äquivalente Ungleichung n X k=x N − M1 n−k zu ersetzen. 72 ! ! N ≤ α n