Kapitel 9 Testen statistischer Hypothesen 9.1 Einführung, Signifikanztests Signifikanztest für µ bei der Normalverteilung bei bekanntem σ = σ 0 : Xi seien unabhängig und N (µ, σ0 )–verteilt, µ sei unbekannt. Stelle eine Hypothese über µ auf, in diesem Fall: Hypothese H0 : µ = µ0 . Lege das Signifikanzniveau α und den Stichprobenumfang n vor der Untersuchung der Stichprobe fest. Bestimme ε > 0 aus (9.1.1) ! α |X − µ0 | √ Satz 8.4.3a ! ! n ≥ ε H0 = 2(1 − Φ(ε))=α ⇐⇒ Φ(ε)=1 − . P σ0 2 Setze d := √ε σ0 n . Untersuche Stichprobe vom Umfang n. Das Ergebnis sei der Schätzwert µ̂ = x für µ. Falls |µ̂ − µ0 | ≥ d ist, ist H0 abzulehnen. Falls |µ̂ − µ0 | < d ist, ist H0 (mit Vorbehalt) anzunehmen. Begründung der Entscheidungsregel: Nach (9.1.1) gilt für die Wahrscheinlichkeit für eine irrtümliche Ablehnung von H 0: P (H0 wird (aufgrund des Testergebnisses) abgelehnt|H 0 ) = P |X − µ0 | ≥ d H0 √ √ 0| H0 = α = P |X − µ0 | ≥ σ0 ε/ n H0 = P |X−µ n ≥ ε σ0 Bem.: a) X, x u. s. w. haben diesselbe Bedeutung wie im ersten Teil von Abschnitt 8.4. b) α hat eine andere Bedeutung als γ im Abschnitt 8.4. α liegt nahe bei 0, z. B. α = 0.1, 0.05, 0.01 o. ä. c) P (. . . |H0 ) in (9.1.1) bedeutet: (9.1.1) bestimmt die Wahrsch. für das interessierende Ereignis, wenn H0 richtig wäre. Interpretation des Testergebnisses: Es gibt nach einem Test 4 verschiedene Situationen, die in nachstehender schematischer Übersicht dargestellt sind (Siehe Tabelle 8-1): 65 Tabelle 9-1 H0 wird angenommen abgelehnt richtig richtige Entscheidung Fehler 1. Art falsch Fehler 2. Art richtige Entscheidung unter der Bedingung ↓: H0 ist Allgemein wird gefordert: (9.1.2) P(Fehler 1. Art) = P(H0 wird abgelehnt|H0 ) ≤ α Die Wahrscheinlichkeit für einen Fehler 2. Art ist erst dann in gleicher Weise durch eine Zahl < 1 abzuschätzen, wenn man H0 eine geeignete Alternativhypothese H 1 gegenüberstellt und evtl. das Testverfahren ändert. Ohne geeignete Alternativhypothese gilt also nur P (Fehler 2. Art) ≤ 1, d. h. man hat den Fehler 2. Art nicht unter Kontrolle. Scheint die Annahme von H 0 nur durch einen zu kleinen Stichprobenumfang zustande gekommen zu sein (was aus o. g. Gründen nicht präzise fassbar ist), so ist der Test u. U. mit größerem Stichprobenumfang zu wiederholen. Signifikanztest für µ bei der Normalverteilung bei unbekanntem σ: Xi seien unabhängig und N (µ, σ)–verteilt, µ und σ seien unbekannt. Stelle eine Hypothese über µ auf, in diesem Fall: Hypothese H0 : µ = µ0 . Lege das Signifikanzniveau α und den Stichprobenumfang n vor der Untersuchung der Stichprobe fest. Bestimme ε > 0 aus (9.1.3) √ |X − µ0 | n P r Pn (Xi −X)2 n−1 i=1 Satz 8.4.8a α ! ! = 2(1 − Ft (ε))=α ⇐⇒ Ft (ε)=1 − , ≥ ε H0 2 wobei Ft (y) die Verteilungsfunktion der t–Verteilung mit r = (n − 1) Freiheitsgraden ist. Untersuche Stichprobe vom Umfang n. Diese liefert die Meß– oder Beobachtungswerte x 1 , x2 , . . . xn . Daraus gewinnen wir den Schätzwert µ̂ = x für µ und die Testgröße d := ε sP n i=1 (xi − x)2 n(n − 1) Falls |µ̂ − µ0 | ≥ d ist, ist H0 abzulehnen. Falls |µ̂ − µ0 | < d ist, ist H0 (mit Vorbehalt) anzunehmen. 66 9.2 Einseitige Tests 9.2.1 Ein einseitiger Test bei der Normalverteilung X1 , . . . , Xn seien unabhängige N (µ, σ)–verteilte ZV mit bekanntem σ = σ 0 . Über dem unbekannten Parameter µ werden 2 Hypothesen aufgestellt : H0 : µ ≤ µ 0 , H1 : µ > µ 0 (Alternativhypothese) Fehler 1. Art : Entscheidung gegen H 0 (und damit für H1 ), obwohl H0 richtig ist. Fehler 2. Art : Entscheidung gegen H 1 (und damit für H0 ), obwohl H1 richtig ist. Durchführung des Tests: Schritt 1: Lege die Höchstgrenze α für die Wahrsch. für einen Fehler 1. Art und die Höchstgrenze β für die Wahrsch. für einen Fehler 2. Art fest. Schritt 2: Lege den Stichprobenumfang n fest und berechne d 0 und d1 aus n, α und β nach der folgenden Formel: (9.2.1) √ d0 = ε 0 σ0 / n √ d1 = ε 1 σ0 / n mit mit Φ(ε0 ) = 1 − α Φ(ε1 ) = 1 − β Schritt 3: Werte eine Stichprobe vom Umfang n aus. x ist dann eine Realisierung von X(:= n−1 (X1 + . . . + Xn )): x ≥ µ0 + d0 ⇒ Entscheidung für H1 x ≤ µ0 − d1 ⇒ Entscheidung für H0 µ0 − d1 < x < µ0 + d0 ⇒ keine Entscheidung (u. U. den Test mit größerem Stichprobenumfang wiederholen) Begründung für (9.2.1): Aus der Tatsache, dass wachsend ist, folgt: Φ(x) monoton µ0 −µ+d0 √ d0 √ ≤ 1 − Φ n | n ≤α P (Fehler 1. Art) = P (X ≥ µ0 + d0 |H0 ) = 1 − Φ µ≤µ 0 σ0 σ0 √ √ µ0 −µ−d1 √ 1 P (Fehler 2. Art) = P (X ≤ µ0 −d1 |H1 ) = Φ n |µ>µ0 ≤ Φ −d n = 1−Φ σd10 n ≤ σ0 σ0 β Bem.: a) Manchmal ist von der praktischen Fragestellung her folgende Gegenüberstellung zweckmäßig: H0 : µ ≤ µ0 , H1 : µ ≥ µ1 (> µ0 ). Der Test ist dann wie oben durchzuführen, wobei aber folgende Änderungen zu beachten sind: x ≥ µ0 + d0 ⇒ Entscheidung gegen H0 (nicht unbedingt für H1 ) x ≤ µ1 − d1 ⇒ Entscheidung gegen H1 (nicht unbedingt für H0 ) µ1 − d1 < x < µ0 + d0 ⇒ keine Entscheidung Durch genügend großen Stichprobenumfang n kann man erreichen, dass µ 1 − d1 ≥ µ0 + d0 und damit das 3. Intervall leer ist. Man kommt dann immer zu einer Entscheidung. b) Ist auch σ unbekannt, so kann man ähnlich wie bei den Konfidenzintervallen (vgl. Satz 8.4.8) oder bei dem Signifikanztest die einseitigen Tests mit folgenden Veränderungen durchführen: (9.2.1) wird ersetzt durch 67 (9.2.2) d0 = ε 0 d1 = ε 1 r Pn (xi −x)2 n(n−1) i=1 r Pn (xi −x)2 n(n−1) i=1 mit Ft (ε0 ) = 1 − α, mit Ft (ε1 ) = 1 − β, wobei Ft (y) die Verteilungsfunktion der t–Verteilung mit r = (n − 1) Freiheitsgraden ist. c) Anstelle des Tests auf H0 : µ ≤ µ0 gegen H1 : µ > µ0 findet man in der Literatur oft Tests auf H0 : µ = µ0 gegen H1 : µ > µ0 oder H0 : µ < µ0 gegen H1 : µ ≥ µ0 oder H0 : µ < µ0 gegen H1 : µ = µ0 . Alle diese Tests sind rechnerisch gleichwertig. 9.2.2 Ein einseitiger Test bei der Binomialverteilung X sei eine binomial–verteilte ZV mit den Parametern n (wird noch festgelegt) und p (unbekannt). X ist damit selbst schon mit einer Stichprobe vom Umfang n verbunden, d. h. X in 9.2.2 entspricht abgesehen von den verschiedenen Verteilungen der ZV nX in 9.2.1. Hypothesen über p : H0 : 0 ≤ p ≤ p 0 , H1 : p1 ≤ p ≤ 1, 0 ≤ p0 ≤ p1 < 1. Fehler 1. Art: Entscheidung gegen H 0 (und damit für p > p0 ), obwohl H0 richtig ist. Fehler 2. Art: Entscheidung gegen H 1 (und damit für p < p1 ), obwohl H1 richtig ist. Durchführung des Tests: Schritt 1: Lege die Höchstgrenze α für die Wahrscheinlichkeit für einen Fehler 1. Art und die Höchstgrenze β für die Wahrscheinlichkeit für einen Fehler 2. Art fest. Schritt 2: Lege n fest. Schritt 3: Werte eine Stichprobe vom Umfang n aus, die eine Realisierung x von X liefert. Fall 1: x/n < p1 . Setze q1 := 1 − p1 . Falls x X k=0 n k ! p1 q1 k ≤ β q1n gilt, ist die Hypothese H1 mit ausreichender Sicherheit abzulehnen. Anderenfalls kann die Hypothese H1 auf Grund der vorliegenden Daten nicht mit ausreichender Sicherheit abgelehnt werden. Begründung: x/n < p1 spricht gegen die Hypothese H1 . Um aber H1 mit ausreichender Sicherheit ablehnen zu können, müssen wir prüfen, ob die die Wahrscheinlichkeit für einen Fehler 2. Art ≤ β ist, d.h. ob die Wahrscheinlichkeit dafür, dass die ZV X den vorliegenden Wert x oder 68 Werte annimmt, die noch mehr gegen die Hypothese H 1 sprechen, ≤ β ist: P (X ≤ x|H1 ) ≤ P (X ≤ x|p = p1 ) = x X x X n k n−k n p1 q1 = q1n k k k=0 ! k=0 ! p1 q1 k ? ≤ β. Die erste Ungleichung gilt, weil die Wahrscheinlichkeit für X ≤ x(< np1 ) für p > p1 noch kleiner ist als für p = p1 . Fall 2: x/n > p0 . Setze q0 := 1 − p0 . Falls n X k=x ! n k p0 q0 k α ≤ n q0 x−1 X ⇐⇒ k=0 n k ! p0 q0 k 1−α ≥ q0n ! gilt, ist die Hypothese H0 mit ausreichender Sicherheit abzulehnen. Anderenfalls kann die Hypothese H0 auf Grund der vorliegenden Daten nicht mit ausreichender Sicherheit abgelehnt werden. Begründung: x/n > p0 spricht gegen die Hypothese H0 . Um aber H0 mit ausreichender Sicherheit ablehnen zu können, müssen wir prüfen, ob die die Wahrscheinlichkeit für einen Fehler 1. Art ≤ α ist, d.h. ob die Wahrscheinlichkeit dafür, dass die ZV X den vorliegenden Wert x oder Werte annimmt, die noch mehr gegen die Hypothese H 0 sprechen, ≤ α ist: P (X ≥ x|H0 ) ≤ P (X ≥ x|p = p0 ) = n X n n k n−k p0 q0 = q0n k k k=x n X ! k=x ! p0 q0 k ? ≤ α. Die erste Ungleichung gilt, weil die Wahrscheinlichkeit für X ≥ x(> np0 ) für p < p0 noch kleiner ist als für p = p0 , und die zweite Gleichung, weil X nur ganzzahlige Werte annehmen kann. Fall 3: x/n = p0 = p1 . Es kann weder die Hypothese H0 noch die Hypothese H1 auf Grund der vorliegenden Daten mit ausreichender Sicherheit abgelehnt werden. Begründung: x/n = p0 = p1 spricht weder gegen die Hypothese H 0 noch gegen die Hypothese H1 . Eine Annahme von H0 oder von H1 auf Grund der vorliegenden Daten ist mit ausreichender Sicherheit aber auch nicht gerechtfertigt; denn eine eine Annahme von z.B. H 0 bedeutet eine Ablehnung von p > p0 , und dies ist rechnerisch gleichwertig mit einer Ablehnung von H 1 . Aus der ”Ablehnungsungleichung” von H 1 folgt: x X n β ≥ q1n k=0 k ! p1 q1 k n 0 ≥ ! p1 q1 0 = 1 ⇒ β ≥ q1n ⇒ ln β ≥ n ln q1 . Damit muss für der Stichprobenumfang ln β ln q1 gelten. Sonst wird kein Ziehungsergebnis zur Ablehnung von H 1 führen. Aus der ”Ablehnungsungleichung” von H 0 folgt: n≥ n X α n ≥ n q0 k k=x ! p0 q0 k ≥ n n ! p0 q0 n = pn0 ⇒ α ≥ pn0 ⇒ ln α ≥ n ln p0 . q0n Damit muss für der Stichprobenumfang ln α ln p0 gelten. Sonst wird kein Ziehungsergebnis zur Ablehnung von H 0 führen. n≥ 69 9.2.3 Ein einseitiger Test bei der hypergeometrischen Verteilung X sei eine hypergeometrisch verteilte ZV mit den Parametern n (wird noch festgelegt), M (unbekannt) und N . Bei der Qualitätskontrolle wäre N die Zahl der Stücke in der Lieferung, M die Zahl der Stücke in der Lieferung und n der Umfang einer Stichprobe o.Z. X ist also selbst schon mit einer Stichprobe vom Umfang n verbunden, d. h. X in 9.2.3 entspricht abgesehen von den verschiedenen Verteilungen der ZV nX in 9.2.1. Hypothesen über M : H0 : 0 ≤ M ≤ M 0 , H1 : M1 ≤ M ≤ N, 0 ≤ M0 ≤ M1 ≤ N. Fehler 1. Art: Entscheidung gegen H 0 (und damit für M > M0 ), obwohl H0 richtig ist. Fehler 2. Art: Entscheidung gegen H 1 (und damit für M < M1 ), obwohl H1 richtig ist. Durchführung des Tests: Schritt 1: Lege die Höchstgrenze α für die Wahrscheinlichkeit für einen Fehler 1. Art und die Höchstgrenze β für die Wahrscheinlichkeit für einen Fehler 2. Art fest. Schritt 2: Lege n fest. Schritt 3: Werte eine Stichprobe vom Umfang n aus, die eine Realisierung x von X liefert. Fall 1: x/n < M1 /N . Falls x X k=0 M1 k ! N − M1 n−k ! ! N β ≤ n gilt, ist die Hypothese H1 mit ausreichender Sicherheit abzulehnen. Anderenfalls kann die Hypothese H1 auf Grund der vorliegenden Daten nicht mit ausreichender Sicherheit abgelehnt werden. Begründung: x/n < M1 /N spricht gegen die Hypothese H1 . Um aber H1 mit ausreichender Sicherheit ablehnen zu können, müssen wir prüfen, ob die die Wahrscheinlichkeit für einen Fehler 2. Art ≤ β ist, d.h. ob die Wahrscheinlichkeit dafür, dass die ZV X den vorliegenden Wert x oder Werte annimmt, die noch mehr gegen die Hypothese H 1 sprechen, ≤ β ist: P (X ≤ x|H1 ) ≤ P (X ≤ x|M = M1 ) = M1 N −M1 n−k k N k=0 n x X x M1 1 X = N k n k=0 ! N − M1 n−k ! ? ≤ β. Die erste Ungleichung gilt, weil die Wahrscheinlichkeit für X ≤ x(< nM1 /N ) für M > M1 noch kleiner ist als für M = M1 . Fall 2: x/n > M0 /N . Falls n X k=x M1 k ! N − M1 n−k ! ! N α ≤ n ⇐⇒ x−1 X k=0 M1 k ! N − M1 n−k ! ! N (1 − α) ≥ n ! gilt, ist die Hypothese H0 mit ausreichender Sicherheit abzulehnen. Anderenfalls kann die Hypothese H0 auf Grund der vorliegenden Daten nicht mit ausreichender Sicherheit abgelehnt werden. Begründung: x/n > M0 /N spricht gegen die Hypothese H0 . Um aber H0 mit ausreichender Sicherheit ablehnen zu können, müssen wir prüfen, ob die die Wahrscheinlichkeit für einen Fehler 70 1. Art ≤ α ist, d.h. ob die Wahrscheinlichkeit dafür, dass die ZV X den vorliegenden Wert x oder Werte annimmt, die noch mehr gegen die Hypothese H 0 sprechen, ≤ α ist: P (X ≥ x|H0 ) ≤ P (X ≥ x|M = M0 ) = M1 N −M1 ? k n−k ≤ N k=x n n X α. Die erste Ungleichung gilt, weil die Wahrscheinlichkeit für X ≥ x(> nM0 /N ) für M < M0 noch kleiner ist als für M = M0 , und die zweite Gleichung, weil X nur ganzzahlige Werte annehmen kann. Fall 3: x/n = M0 /N = M1 /N . Es kann weder die Hypothese H0 noch die Hypothese H1 auf Grund der vorliegenden Daten mit ausreichender Sicherheit abgelehnt werden. Begründung: x/n = M0 /N = M1 /N spricht weder gegen die Hypothese H 0 noch gegen die Hypothese H1 . Eine Annahme von H0 oder von H1 auf Grund der vorliegenden Daten ist mit ausreichender Sicherheit aber auch nicht gerechtfertigt; denn eine eine Annahme von z.B. H 0 bedeutet eine Ablehnung von M > M0 , und dies ist rechnerisch gleichwertig mit einer Ablehnung von H1 . 71