Kapitel 10: Testtheorie Kapitel 10: Testtheorie Statistische Tests • In vielen praktischen Situationen sind keine Schätzwerte gefragt, sondern es müssen JA-NEIN-Entscheidungen getroffen werden, z.B. über Medikamentenzulassung. • Solche Entscheidungsverfahren können mit Hilfe statistischer Tests durchgeführt werden. (Test oder Signifikanztest) • Es handelt sich dabei um “Entscheidungen unter Unsicherheit”, bei denen Fehler nicht ausgeschlossen werden können. Die Wahrscheinlichkeit für das Auftreten solcher Fehler soll dabei aber klein gehalten werden. • Ziele: Experimente kompetent auswerten, Hypothesen statistisch absichern. PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014 295 Kapitel 10: Testtheorie Tests bei binomialverteilten Beobachtungen Zur Motivation betrachten wir folgendes Beispiel: Beispiel 10.1 (Nebenwirkung eines Medikaments): Bei 60 Patienten wird nach Einnahme eines bestimmten Medikaments in k = 12 Fällen eine Nebenwirkung festgestellt. Toleriert werden kann das Auftreten einer Nebenwirkung mit einer Wahrscheinlichkeit p ≤ 0.1. Frage: Ist das Ergebnis k = 12 – durch zufällige Schwankungen einer B60,p -Verteilung mit p ≤ 0.1 oder – durch eine systematische Abweichung p > 0.1 des unbekannten Parameters p hervorgerufen worden oder erklärbar? PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014 296 Kapitel 10: Testtheorie Tests bei binomialverteilten Beobachtungen Binomialmodell: 1 Nebenwirkung beim i-ten Patienten Xi = 0 keine Nebenwirkung beim i-ten Patienten X = 60 X Xi Anzahl Patienten mit Nebenwirkungen i=1 PX = B60,p = Pp mit p ∈ (0, 1) unbekannt Setze p0 = 0.1 PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014 297 Kapitel 10: Testtheorie Tests bei binomialverteilten Beobachtungen Ziel: Eine Verbraucherorganisation möchte aufgrund der Datenlage z.B. vor Gericht mit großer Sicherheit“ behaupten können, dass ” der Grenzwert p0 überschritten wird. Man möchte “absichern” , ob p > p0 gilt.(Eine zufällig entstandene zu große Anzahl von Nebenwirkungen soll also mit großer Wahrscheinlichkeit ausgeschlossen werden). PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014 298 Kapitel 10: Testtheorie Testen von Hypothesen • Dazu betrachtet man die Gegenhypothese H1 : p > p 0 (auch Alternative oder Alternativhypothese genannt) und testet hierzu die Nullhypothese H0 : p ≤ p0 . • Intuitive Entscheidungsvorschrift: Falls X > c (kritischer Wert c) ist, entscheidet man sich für H1 (oder genauer gegen H0 , H0 wird verworfen) PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014 299 Kapitel 10: Testtheorie Testentscheidung Fragen: Wie muss c gewählt werden? • Zur Beantwortung lege folgende Priorität fest: Begrenze Fehlentscheidungen zugunsten von H1 , falls p ∈ H0 vorliegt. d.h. die Verbraucherorganisation muss sichere Daten“ ” vorliegen haben, bevor vor Gericht behauptet wird, der Grenzwert p0 wird nicht eingehalten“. ” • Somit soll die Wahrscheinlichkeit einer Fehlentscheidung zugunsten von H1 , also einer fälschlichen Ablehnung von H0 , kontrolliert klein gehalten werden. Hier: Pp (X > c) ≤ α für p ≤ p0 PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014 300 Kapitel 10: Testtheorie Testentscheidung • Dabei ist α ∈ (0, 1) ein vorgegebenes Sicherheitsrisiko, das man bereit ist zu tragen. Man nennt α das (Signikanz-) Niveau des Tests. • Üblicherweise wählt man α = 0.05 oder α = 0.01, so dass die Wahrscheinlichkeit, die H0 fälschlicherweise abzulehnen, kleiner als 0.05 bzw. 0.01 ist. • Damit das Verfahren leistungsfähig ist, wählt man für den kritischen Wert c den kleinsten Wert, für den Pp (X > c) ≤ α für p ≤ p0 gilt. Es kann gezeigt werden, dass hier bei Binomialverteilungen die Bedingung nur für p = p0 nachzuweisen ist. PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014 301 Kapitel 10: Testtheorie Durchführung eines Tests Beispiel 10.1 (Fortsetzung): Für α = 0.05 und p0 = 0.1 gilt: 60 X 60 k P(X > c) = p (1 − p0 )60−k Auszug aus einer Tabelle der k B(n, 0p)-Verteilung n P k=c + 1 n i n−i ) ( Angegeben sind jeweils die Werte von |{z} i p (1 − p) r i=r n r p = 0.09 p = 0.10 p = 0.11 p = 0.12 p = 1/8 p = 0.13 p = 0.14 p = 0.15 p = 0.16 p = 1/6 60 0 1 2 3 4 1.00000 0.99651 0.97582 0.91544 0.80000 1.00000 0.99820 0.98622 0.94695 0.86260 1.00000 0.99908 0.99226 0.96741 0.90802 1.00000 0.99953 0.99572 0.98036 0.93987 1.00000 0.99967 0.99683 0.98485 0.95178 1.00000 0.99976 0.99766 0.98837 0.96153 1.00000 0.99988 0.99874 0.99323 0.97588 1.00000 0.99994 0.99933 0.99612 0.98517 1.00000 0.99997 0.99964 0.99781 0.99104 1.00000 0.99998 0.99977 0.99851 0.99365 5 6 7 8 9 0.63730 0.45708 0.29370 0.16904 0.08737 0.72904 0.56283 0.39355 0.24845 0.14164 0.80343 0.65864 0.49461 0.33821 0.21014 0.86119 0.74103 0.59083 0.43282 0.29008 0.88445 0.77673 0.63567 0.48021 0.33308 0.90439 0.80876 0.67778 0.52679 0.37732 0.93566 0.86231 0.75286 0.61542 0.46718 0.95763 0.90320 0.81516 0.69530 0.55518 0.97266 0.93346 0.86502 0.76445 0.63754 0.97981 0.94879 0.89193 0.80420 0.68795 10 11 12 13 14 0.04069 0.01715 0.00657 0.00229 0.00073 0.07307 0.03421 0.01458 0.00568 0.00203 0.11869 0.06105 0.02866 0.01232 0.00486 0.17762 0.09940 0.05092 0.02393 0.01034 0.21163 0.12315 0.06570 0.03219 0.01451 0.24828 0.14993 0.08314 0.04239 0.01990 0.32776 0.21200 0.12635 0.06941 0.03519 0.41230 0.28371 0.18057 0.10625 0.05782 0.49788 0.36220 0.24474 0.15337 0.08912 0.55363 0.41661 0.29206 0.19033 0.11522 15 16 0.00022 0.00006 0.00067 0.00020 0.00176 0.00059 0.00411 0.00151 0.00603 0.00232 0.00862 0.00345 0.01649 0.00715 0.00287 0.02913 0.01360 0.00589 0.04803 0.02403 0.01117 0.06478 0.03385 0.01645 PD Dr. M. Pauly17, Mathematik für Pharmazeuten, WS 2013/2014 0.00001 0.00006 0.00018 0.00051 0.00082 0.00128 302 Kapitel 10: Testtheorie Durchführung eines Tests • Aus der Tabelle für die B60,0.1 -Verteilung folgt für c = r − 1: ... ... c =9 0.07307 c = 10 0.03421 ... ... • Somit ist c = 10 die kleinste natürliche Zahl, so dass P(X > c) ≤ α = 0.05 eingehalten wird. • Da X = 12 Patienten Nebenwirkungen zeigen, lehnen wir die Nullhypothese H0 : p ≤ 0.1 zum Niveau α = 0.05 ab (die Entscheidung wird also zugunsten der H1 getroffen). • D.h. wir gehen davon aus, dass eine systematische Abweichung von H0 vorliegt. PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014 303 Kapitel 10: Testtheorie Testvorschrift Definition 10.1 (Test): Ein Test ist eine Entscheidungsvorschrift d, die in Abhängigkeit von Daten x1 , . . . , xn für H1 oder H0 getroffen wird: dH0 : Entscheidung zugunsten von H0 dH1 : Entscheidung zugunsten von H1 P Beispiel 10.1 (Fortsetzung): In unserem Beispiel ist k = 60 i=1 xi die Anzahl der Patienten mit Nebenwirkung. Somit ist hier die Entscheidungsvorschrift: P dH1 falls 60 i=1 xi > c = 10 d(x1 , . . . , x60 ) = P60 dH0 falls i=1 xi ≤ c = 10 PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014 304 Kapitel 10: Testtheorie Fehler 1. und 2. Art Definition 10.2 (Fehler 1. und 2. Art): Bei jeder Entscheidung können folgende Fehler auftreten: (a) Fehler 1. Art: Entscheidung dH1 für H1 , obwohl H0 vorliegt. (b) Fehler 2. Art: Entscheidung dH0 für H0 , obwohl H1 vorliegt. ``` ``` ``` Entscheidung ``` realer Sachverhalt `` ` dH0 dH1 H0 Richtig Fehler 1. Art H1 Fehler 2. Art Richtig PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014 305 Kapitel 10: Testtheorie Fehler 1. und 2. Art • Konvention: Das Testproblem H0 gegen H1 wird so formuliert, dass ein Fehler 1. Art schwerer wiegt. Diesen kontrollieren wir durch die Angabe einer Irrtumswahrscheinlichkeit α ∈ (0, 1). In diesem Fall heißt d ein Test zum Niveau α. Also P(d = dH1 ) ≤ α, falls H0 vorliegt. Die Hypothese, die statistisch abgesichert werden soll, muss als H1 gewählt werden. • Besonderheit beim Binomialtest: Das Niveau α wird im Allgmeinen nicht voll ausgeschöpft. Man nennt α0 = Bn,p0 (d = dH1 ) die effektive Irrtumswahrscheinlichkeit. PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014 306 Kapitel 10: Testtheorie Testprobleme beim Binomialtest Gegeben sind n unabhängige B1,p -verteilte ZV X1 , . . . , Xn mit unbekanntem Parameter p ∈ (0, 1). Ferner sei p0 ∈ (0, 1) und α ∈ (0, 1) vorgegeben. Seien die Werte x1 , . . . , xn Realisierungen der ZV X1 , . . . , Xn . Dann gibt es drei Testprobleme: 1. Möchte man überprüfen (und jeweils absichern), ob p größer als p0 ist, so testet man H0 : p ≤ p0 gegen H 1 : p > p0 . 2. Möchte man überprüfen, ob p kleiner als p0 ist, so testet man H0 : p ≥ p0 gegen H 1 : p < p0 . 3. Möchte man testen, ob p und p0 ungleich sind, so testet man H0 : p = p0 gegen PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014 H1 : p 6= p0 . 307 Kapitel 10: Testtheorie Binomialtests für den Erwartungswert binomialverteilter Zufallsvariab Testprobleme beim Binomialtest Situation: Gegeben sind unabhängige B(1, p)-verteilte ZV X1 , . . . , Xn mit unbekanntem Parame ]0, 1[. Ferner sei p0 ∈]0, 1[ und α ∈]0, 1[ vorgegeben. Die Werte x1 , . . . , xn seien Realisierungen X1 , . . . , Xn . 1. Testproblem: H0 : p ≤ p0 gegen H1 : p > p0 . Testverfahren: Einseitiger (oberer) Binomialtest zum Niveau α: d(x1 , . . . , xn ) := dH1 falls dH0 Pn i=1 >c xi ≤c Die Konstante c ist dabei so zu wählen, dass gilt: α0 := µ ¶ n n µ ¶ X X n k n k p0 (1 − p0 )n−k ≤ α und p (1 − p0 )n−k > α k k 0 k=c+1 k=c 2. Testproblem: H0 : p ≥ p0 gegen H1 : p < p0 . Testverfahren: Binomialtest zum Niveau α: Dabei ist α0 dieEinseitiger effektive (unterer) Irrtumswahrscheinlichkeit. dH1 d(x1 , .WS . . ,2013/2014 xn ) := PD Dr. M. Pauly , Mathematik für Pharmazeuten, falls Pn i=1 <c xi 308 Die Konstante c ist dabei soKapitel zu wählen, dass gilt: 10: Testtheorie µ ¶ n n µ ¶ X X n k beim n k Testprobleme Binomialtest α0 := p0 (1 − p0 )n−k ≤ α und p0 (1 − p0 )n−k > α k=c+1 k k=c k 2. Testproblem: H0 : p ≥ p0 gegen H1 : p < p0 . Testverfahren: Einseitiger (unterer) Binomialtest zum Niveau α: d(x1 , . . . , xn ) := dH1 falls dH0 Pn <c i=1 xi ≥c Die Konstante c ist dabei so zu wählen, dass gilt: α0 := c−1 µ ¶ c µ ¶ X X n k n k p0 (1 − p0 )n−k ≤ α und p (1 − p0 )n−k > α k k 0 k=0 k=0 3. Testproblem: H0 : p = p0 gegen H1 : p 6= p0 . Testverfahren: Zweiseitiger α/2 − α/2-Binomialtest zum Niveau α : Dabei ist α0 die effektive Irrtumswahrscheinlichkeit. d(x1 , . . . , xn ) := ½ dH1 dH0 falls sonst Pn i=1 xi < c1 oder > c2 Die Konstanten c1 und c2 sind dabei so zu wählen, dass gilt: PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014 309 α0 := Kapitel 10: Testtheorie c−1 µ ¶ c µ ¶ X X n k n k p0 (1 − p0 )n−k ≤ α und p (1 − p0 )n−k > α k k 0 k=0 k=0 Testprobleme beim Binomialtest 3. Testproblem: H0 : p = p0 gegen H1 : p 6= p0 . Testverfahren: Zweiseitiger α/2 − α/2-Binomialtest zum Niveau α : d(x1 , . . . , xn ) := ½ dH1 dH0 falls sonst Pn i=1 xi < c1 oder > c2 Die Konstanten c1 und c2 sind dabei so zu wählen, dass gilt: cX 1 −1 µ ¶ c1 µ ¶ X n k n k p0 (1 − p0 )n−k ≤ α/2 und p (1 − p0 )n−k > α/2 k k 0 k=0 k=0 µ ¶ n n µ ¶ X X n k n k n−k p0 (1 − p0 ) ≤ α/2 und p (1 − p0 )n−k > α/2 k k 0 k=c2 +1 k=c2 Hierbei setzt man α0 := cX 1 −1 µ k=0 ¶ µ ¶ n X n k n k p0 (1 − p0 )n−k + p (1 − p0 )n−k . k k 0 k=c2 +1 α0 heisst in allen 3 Fällen die effektive Irrtumswahrscheinlichkeit. Hinweis: Im zweiseitigen Fall werden zwei einseitige Tests zum Niveau α/2 durchgeführt. PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014 310 Kapitel 10: Testtheorie Durchführung eines Binomialtests (Zusammenfassung) Beispiel 10.1 (Fortsetzung): Formalisierung von Beispiel 10.1: • n = 60 Patienten • p0 = 0.1 (Toleranzgrenze für die Nebenwirkung) • Testproblem: H0 : p ≤ p0 gegen H1 : p > p0 • (Signifikanz-)Niveau: α = 0.05 • Entscheidungsregel: P60 dH1 , falls i=1 xi > c d(x1 , . . . , x60 ) = P60 dH0 , falls i=1 xi ≤ c PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014 311 Kapitel 10: Testtheorie Durchführung eines Binomialtests • Bestimmung des kritischen Werts: Bestimme kleinstes c mit ! 60 60 X X 60 k P Xi > c = p0 (1 − p0 )60−k ≤ 0.05 k i=1 k=c+1 • Aus der Binomialtabelle für B60,0.1 ermittelt: c = 10 • Effektive Irrtumswahrscheinlichkeit: k 60−k 60 X 60 1 1 α0 = 1− = 0.03421 k 10 10 k=11 • Beobachtung: X = 12 Patienten mit Nebenwirkung • Entscheidung: Zum Niveau α = 5% haben wir signifikant nachgewiesen, dass die Toleranzgrenze überschritten wurde. Die (Null-)Hypothese, dass die beobachteten Nebenwirkungen noch tolerabel sind, muss verworfen werden. PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014 312 Kapitel 10: Testtheorie Vorgehen bei Testproblem Motivation des unteren Binomialtests: • Bei der Zulassung von Medikamenten muss ein Pharma-Unternehmen nachweisen, dass der Grenzwert p < p0 eingehalten wird. • Daher muss zur Absicherung das umgekehrte Testproblem H0 : p ≥ p 0 gegen H1 : p < p0 betrachtet werden. • Die Alternative H1 wird damit statistisch abgesichert, da wir nur den Fehler 1. Art kontrollieren. PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014 313 Kapitel 10: Testtheorie Praktische Anweisungen zur Testtheorie 1. Aufstellen des wahrscheinlichkeitstheoretischen Modells für ein Zufallsexperiment, in dem ein oder mehrere unbekannte Parameter auftreten. 2. Formulierung der Nullhypothese H0 und der Gegenhypothese/ Alternative H1 (über die unbekannten Parameter) sowie Festlegung eines Signifikanzniveaus α mit dem Ziel der “Absicherung” der Alternative H1 zum Niveau α, siehe auch 5. 3. Festlegung des Entscheidungsverfahrens, d.h. des Tests, für das Testproblem (mit dem Ziel, dass die Fehlerwahrscheinlichkeit 1. Art ≤ α ist und die Fehlerwahrscheinlichkeit 2. Art klein wird). 4. Durchführung des Zufallsexperiments und der Entscheidungsfindung gemäß Punkt 3 mit den ermittelten Daten. PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014 314 Kapitel 10: Testtheorie Praktische Anweisungen zur Testtheorie 5. Interpretation: • Gelangt man zur Entscheidung für H1 , so hat man H1 signifikant zum Niveau α nachgewiesen. Man sagt auch: “Die Hypothese H0 wird verworfen.” • Eine Entscheidung für H0 liefert hingegen kein brauchbares Ergebnis. Man kann höchstens sagen: “H0 kann zum Niveau α nicht verworfen werden.” Damit ist H0 aber keinesfalls abgesichert. 6. Zu beachten ist, dass die Ergebnisse eines Zufallsexperiments nur für ein Testproblem und nicht für eine Folge von mehreren Testproblemen verwendet werden dürfen, da sich sonst die Irrtumswahrscheinlichkeiten addieren und man das Niveau α nicht einhält. PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014 315 Kapitel 10: Testtheorie Normalapproximation beim Binomialtest Liegt keine Tabelle für Bn,p0 vor, so lässt sich aufgrund des Zentralen Grenzwertsatzes für großes n der kritische Wert mithilfe einer Normalapproximation berechnen: Satz 10.1 (Normalapproximation): Für den Binomialtest H0 : p ≤ p0 gegen H1 : p > p0 gilt unter der Voraussetzung n · p0 · (1 − p0 ) ≥ 9 (Faustregel für die Normalapproximation) für den kritischen Wert c, dass p c ≈ n · p0 + n · p0 · (1 − p0 ) · u1−α , wobei u1−α das 100 · (1 − α)%-Quantil der N (0, 1)-Verteilung ist, d.h. φ(u1−α ) = 1 − α. PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014 316 Kapitel 10: Testtheorie Normalapproximation beim Binomialtest P Begründung: Sei X = ni=1 Xi Bn,p0 -verteilt. Nach dem Zentralen Grenzwertsatz gilt p P X > n · p0 + n · p0 · (1 − p0 ) · u1−α p = P X − n · p0 > n · p0 · (1 − p0 ) · u1−α =P X − n · p0 p > u1−α n · p0 · (1 − p0 ) ! ≈ 1 − φ(u1−α ) = 1 − (1 − α) = α Für kleine Werte von n kann die Normalanpassung durch die Stetigkeitskorrektur verbessert werden. PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014 317 Kapitel 10: Testtheorie Normalapproximation beim Binomialtest Ähnlich kann auch bei den beiden anderen Testproblemen eine Normalapproximation vorgenommen werden: Ersetze in Satz 10.1 u1−α durch • −u1−α , falls der untere Test H0 : p ≥ p0 vs. H1 : p < p0 , • ±u1−α/2 , falls der zweiseitige Test H0 : p = p0 vs. H1 : p 6= p0 0.2 α 2 0.0 0.1 f(x) 0.3 0.4 betrachtet wird. −4 α 2 − u1−α2 0 x PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014 u1−α2 4 318 Kapitel 10: Testtheorie Quantile der Standardnormalverteilung Der (ungefähre) Wert des 100 · (1 − α)%-Quantils u1−α = Φ−1 (1 − α) kann aus derselben Tabelle abgelesen werden wie die Werte von Φ(u). Diesen Wert erhält man, indem man innerhalb der Tabelle nach dem Wert sucht, der 1 − α am nächsten kommt. Die dazugehörigen Randwerte geben dann den (ungefähren) Wert von u1−α an. PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014 319 Kapitel 10: Testtheorie Normalapproximation beim Binomialtest Beispiel 10.2 (Simulation des 2-fachen Würfelns): In mehreren Vorlesungen wurden Studenten gebeten, dass zweifache Werfen eines Würfels zu simulieren, indem sie jeweils Paare von Zahlen zwischen 1 und 6 aufschreiben sollten. Die folgende Grafik zeigt die Differenzen der Zahlenpaare in diesem Experiment. PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014 320 Kapitel 10: Testtheorie Normalapproximation beim Binomialtest • Eine Differenz von 0 bedeutet ein Pasch, d.h. eine identische Augenzahl bei beiden Würfen. • Es gibt nun sechs Möglichkeiten für einen Pasch und insgesamt 36 mögliche Paare von Augenzahlen, so dass die Wahrscheinlichkeit für eine Differenz von 0 eigentlich 6/36 = 1/6 ist. • Im Vorfeld trat (aus Erfahrung) die Vermutung auf, dass bei den Studierenden das Ereignis Pasch“, d.h. die Differenz 0, ” zu selten auftritt. • Dies wollen wir nun überprüfen. PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014 321 Kapitel 10: Testtheorie Normalapproximation beim Binomialtest • Hinweis: Die Hypothesen müssen vor Gewinnung der Daten festgelegt werden. Wird aus der Darstellung der Daten eine Hypothese generiert, so muss das Experiment wiederholt werden und der Test wird dann mit neuen Daten ausgeführt. PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014 322 Kapitel 10: Testtheorie Normalapproximation beim Binomialtest • Testproblem: 1 1 gegen H1 : p < p0 = 6 6 • Wir nehmen an, dass die n = 1628 Augenpaare unabhängig voneinander aufgeschrieben wurden. H0 : p ≥ p 0 = • Falls X die Anzahl der Päsche ist, ist X B1628, 1 -verteilt unter 6 der Annahme, dass die Wahrscheinlichkeit für einen Pasch ist. 1 6 • Festlegung des Signifikanzniveaus: α = 0.01. • Testentscheidung: d(x1 , . . . , x1628 ) = dH1 . falls x = dH0 , falls x = PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014 P1628 i=1 xi < c i=1 xi ≥ c P1628 323 Kapitel 10: Testtheorie Normalapproximation beim Binomialtest Mit der Normalapproximation für den unteren Binomialtest folgt, dass p c ≈ n · p0 − n · p0 · (1 − p0 ) · u1−α | {z } u0.99 = 1628 · 1 − 6 r 1628 · 1 5 · · 2.3263 | {z } ≈ 236.35 6 6 PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014 aus Tabelle 324 Kapitel 10: Testtheorie Normalapproximation beim Binomialtest Der untere Binomialtest verwirft die Hypothese H0 : p ≥ 16 , da im Beispiel 10.2 nur 154 mal ein Pasch“ auftritt, 154 < 236. ” PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014 325 Kapitel 10: Testtheorie Normalapproximation beim Binomialtest Der untere Binomialtest verwirft die Hypothese H0 : p ≥ 16 , da im Beispiel 10.2 nur 154 mal ein Pasch“ auftritt, 154 < 236. ” Pn Sei X = i=1 Xi die Summe aus n unabhängigen B1,p0 -verteilten ZVs X1 , . . . , Xn mit Erwartungswert E (Xi ) = µ und Varianz Var (Xi ) = σ2 . P n = 1 n Xi ist dann die zugehörige standardisierte Mit X i=1 n Summenvariable darstellbar als Pn 1 Xi − p0 n n p = √ · p i=1 n n · p0 · (1 − p0 ) p0 · (1 − p0 ) X − n · p0 = √ n· n − µ X . σ Dies führt uns direkt zum Gaußtest für den Erwartungswert normalverteilter Zufallsvariablen. PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014 325 Kapitel 10: Testtheorie Gaußtest Definition 10.3 (Gaußtest): Gegeben seien n unabhängige N µ, σ20 -verteilte ZVs X1 , . . . , Xn mit unbekanntem Parameter µ ∈ R und bekannter Varianz σ20 > 0. Ferner seien µ0 ∈ R und das Signifikanzniveau α ∈ (0, 1) vorgegeben. Seien x1 , . . . , xn die P n = 1 n Xi . Dann wird der Realisierungen der ZVs X1 , . . . , Xn und X i=1 n Test für den unbekannten Erwartungswert µ basierend auf der Teststatistik n − µ0 √ X Z = n· , σ0 die unter N(µ0 , σ20 ) standardnormalverteilt ist, Gaußtest genannt. Die Testentscheidung trifft man dabei basierend auf dem beobachteten Wert z= √ n· xn − µ0 σ0 von Z und dem 100 · (1 − α)%-Quantil u1−α der N (0, 1)- Verteilung. Hinweis: xn ist der Schätzwert für den Erwartungswert µ. Darauf wird ein Test aufgebaut. PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014 326 Kapitel 10: Testtheorie Gaußtest Analog zum Binomialtest betrachtet man beim Gaußtest auch drei unterschiedliche Testprobleme: (z wie oben) 1. Testproblem: H0 : µ ≤ µ0 gegen H1 : µ > µ0 Testverfahren: Einseitiger (oberer) Gaußtest zum Niveau α: d x1 , . . . , xn = dH1 , dH0 , falls z > u1−α falls z ≤ u1−α 2. Testproblem: H0 : µ ≥ µ0 gegen H1 : µ < µ0 Testverfahren: Einseitiger (unterer) Gaußtest zum Niveau α: d x1 , . . . , xn = dH1 , dH0 , PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014 falls z < −u1−α falls z ≥ −u1−α 327 Kapitel 10: Testtheorie Gaußtest 3. Testproblem: H0 : µ = µ0 gegen H1 : µ 6= µ0 Testverfahren: Zweiseitiger Gaußtest zum Niveau α: falls z > u1−α/2 dH1 , d x1 , . . . , xn = falls z ≤ u1−α/2 dH , 0 Begründung: Da Z unter N(µ0 , σ20 ) standardnormal ist, ist jeder Test ein Test mit dem Fehlerniveau α 1.Art. PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014 328 Kapitel 10: Testtheorie Gaußtest 3. Testproblem: H0 : µ = µ0 gegen H1 : µ 6= µ0 Testverfahren: Zweiseitiger Gaußtest zum Niveau α: falls z > u1−α/2 dH1 , d x1 , . . . , xn = falls z ≤ u1−α/2 dH , 0 Begründung: Da Z unter N(µ0 , σ20 ) standardnormal ist, ist jeder Test ein Test mit dem Fehlerniveau α 1.Art. Problem: Im Gaußtest wird vorausgesetzt, dass die Varianz σ2 bekannt ist. In einer realen Situation ist dies aber häufig nicht der Fall. Lösung: Ersetze σ2 durch die Schätzung n 1 X n 2 . Sn2 = Xi − X n−1 i=1 PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014 328 Kapitel 10: Testtheorie t-Test Definition 10.4 (t-Test): Gegeben seien n ≥ 2 unabhängige N µ, σ2 -verteilte ZVs X1 , . . . , Xn mit unbekannten Parametern µ ∈ R und σ2 > 0. Ferner seien µ0 ∈ R und α ∈ (0, 1) vorgegeben. Die Werte x1 , . . . , xn seien Realisierungen der ZVs X1 , . . . , Xn und X n = 1 X Xi n n 1 X n 2 . Xi − X n−1 n sowie Sn2 = i=1 i=1 Dann wird der Test für den unbekannten Erwartungswert µ basierend auf der Teststatistik n − µ0 X Sn t-Test genannt. Unter der Annahme, dass µ = µ0 , folgt T einer (Studentischen) t-Verteilung mit n − 1 Freiheitsgraden (man schreibt auch tn−1 -Verteilung). T = √ n· PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014 329 Kapitel 10: Testtheorie t-Test N(0,1) t1 t5 t10 t20 0.2 0.0 0.1 Dichte 0.3 0.4 Pn 1 Sind nicht alle Werte xi gleich, so ist sn2 = n−1 n − xi )2 positiv. i=1 (x Die Testentscheidung trifft man somit basierend auf dem beobachteten Wert √ xn − µ0 t = n· sn der Teststatistik T und dem 100 · (1 − α)%-Quantil tn−1,1−α der tn−1 -Verteilung. −4 −2 0 2 4 u PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014 330 Kapitel 10: Testtheorie t-Test Die tn−1 -Verteilung ist eine spezielle Verteilung deren Verteilungsfunktion bzw. Quantile vertafelt oder in einem Statistikprogramm enthalten sind. PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014 331 Kapitel 10: Testtheorie t-Test Analog zum Binomial- und Gaußtest betrachtet man beim t-Test auch drei unterschiedliche Testprobleme: 1. Testproblem: H0 : µ ≤ µ0 gegen H1 : µ > µ0 Testverfahren: Einseitiger (oberer) t-Test zum Niveau α: d x1 , . . . , xn = dH1 , dH0 , falls t > tn−1,1−α falls t ≤ tn−1,1−α 2. Testproblem: H0 : µ ≥ µ0 gegen H1 : µ < µ0 Testverfahren: Einseitiger (unterer) t-Test zum Niveau α: d x1 , . . . , xn = dH1 , dH0 , PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014 falls t < −tn−1,1−α falls t ≥ −tn−1,1−α 332 Kapitel 10: Testtheorie t-Test 3. Testproblem: H0 : µ = µ0 gegen Testverfahren: Zweiseitiger t-Test dH1 , d x1 , . . . , xn = dH0 , H1 : µ 6= µ0 zum Niveau α: falls t > tn−1,1−α/2 falls t ≤ tn−1,1−α/2 Auch die Tabelle: 100 · (1t − α)%-Quantile der tq -Verteilung sind tabelliert. -Verteilung (Student Verteilung) (q) q α = 0.1 α = 0.05 1 3.078 2 1.886 3 1.638 4 1.533 5 1.476 6 1.440 7 1.415 8 1.397 9 1.383 10 1.372 11 1.363 12 1.356 13 1.350 14 1.345 15 1.341 16 1.337 PD Dr. M. Pauly , Mathematik für Pharmazeuten, α = 0.025 α = 0.01 α = 0.005 6.314 12.706 2.920 4.303 2.353 3.182 2.132 2.776 2.015 2.571 1.943 2.447 1.895 2.365 1.860 2.306 1.833 2.262 1.812 2.228 1.796 2.201 1.782 2.179 1.771 2.160 1.761 2.145 1.753 2.131 1.7462013/2014 2.120 WS 31.821 6.965 4.541 3.747 3.365 3.143 2.998 2.896 2.821 2.764 2.718 2.681 2.650 2.624 2.602 2.583 63.657 9.925 5.841 4.604 4.032 3.707 3.499 3.355 3.250 3.169 3.106 3.055 3.012 2.977 2.947 2.921 333 Kapitel 10: Testtheorie t-Test Beispiel 10.3 (Arzeiwirkstoff): Bei 9 Messungen der Wirkstoffmenge in einer Arznei haben sich folgende Werte (in mg) ergeben: 2.9 3.1 2.2 3.8 2.7 2.3 2.4 2.3 2.6 Laut Packungsbeilage soll der mittlere Wirksoffanteil mehr als 2.4 mg betragen. Wir gehen von Realisierungen von normalverteilten Zufallsvariablen mit unbekanntem Erwartungswert µ und unbekannter Varianz σ2 aus. Als Schätzer für µ und σ2 erhalten wir aus obiger Stichprobe 1X xi = 2.7 9 9 x9 = 1X (xi − 2.7)2 = 0.26. 8 9 und s92 = i=1 PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014 i=1 334 Kapitel 10: Testtheorie t-Test Wir wollen nun zum Niveau α = 0.05 testen (und gegebenenfalls signifikant nachweisen), ob der wahre Wirkstoffanteil größer als 2.4 mg ist. • Testproblem zum Niveau α = 0.05: H0 : µ ≤ 2.4 • Unter N (2.4, σ2 ) ist T = gegen √ 9· t8 -verteilt. • Testentscheidung: d(x1 , . . . , x9 ) = dH1 , dH0 , H1 : µ > 2.4 9 − 2.4 X q S92 falls t > t8,1−0.05 = t8,0.95 falls t ≤ t8,1−0.05 = t8,0.95 PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014 335 Kapitel 10: Testtheorie t-Test • In unserem Beispiel ist √ x9 − 2.4 √ 2.7 − 2.4 = 9· √ ≈ 1.765. s9 0.26 • Außerdem ist t8,0.95 = t8,1−0.05 = 1.860 (siehe Tabelle). t= 9· • Da somit t = 1.765 < 1.860 = t8,0.95 , kann die Nullhypothese, dass die wahre Wirkstoffmenge geringer als 2.4 mg ist, zum 5%-Niveau nicht(Student verworfen werden. Tabelle: t(q) -Verteilung Verteilung) q PD Dr. α = 0.1 α = 0.05 α = 0.025 α = 0.01 α = 0.005 1 3.078 6.314 12.706 2 1.886 2.920 4.303 3 1.638 2.353 3.182 4 1.533 2.132 2.776 5 1.476 2.015 2.571 6 1.440 1.943 2.447 7 1.415 1.895 2.365 8 1.397 1.860 2.306 9 1.383 1.833 2.262 M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014 31.821 6.965 4.541 3.747 3.365 3.143 2.998 2.896 2.821 63.657 9.925 5.841 4.604 4.032 3.707 3.499 3.355 3.250 336 Kapitel 10: Testtheorie p-Wert • Alternativ kann diese Testentscheidung auch basierend auf dem p-Wert des t-Tests getroffen werden (analog können auch bei den anderen Tests p-Werte betrachtet werden). • Die Angabe von p-Werten ist z.B. in wissenschaftlichen Publikationen von Interesse, wenn häufig nur ein Ergebnis mitgeteilt wird aber nicht unmittelbar eine Ja/Nein Entscheidung getroffen wird. • Hierzu berechnet man für den obigen Wert t der Teststatistik und den Wert Fn−1 (t) der zur Teststatistik gehörenden Verteilungsfunktion Fn−1 an der Stelle t. PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014 337 Kapitel 10: Testtheorie p-Wert • Wichtige Werte von Fn sind vertafelt. Für die exakte Berechnung von Fn (t) benötigt man aber meistens statistische Software. x\n 1.00 1.05 1.10 1.15 1.20 1 .75000 .75776 .76515 .77217 .77886 2 .78868 .79806 .80698 .81545 .82350 3 .80450 .81458 .82416 .83325 .84187 4 .81305 .82352 .83346 .84289 .85182 5 .81839 .82910 .83927 .84892 .85805 6 .82204 .83292 .84325 .85305 .86232 7 .82469 .83569 .84614 .85604 .86541 8 .82670 .83780 .84834 .85832 .86777 9 .82828 .83945 .85006 .86011 .86961 14 .83286 .84425 .85506 .86530 .87497 19 .83506 .84655 .85746 .86779 .87756 1.25 1.30 1.35 1.40 1.45 .78522 .79129 .79706 .80257 .80782 .83113 .83838 .84525 .85176 .85794 .85004 .85777 .86508 .87200 .87853 .86028 .86827 .87582 .88295 .88967 .86669 .87485 .88255 .88980 .89663 .87108 .87935 .88714 .89448 .90138 .87427 .88262 .89048 .89788 .90483 .87669 .88510 .89302 .90046 .90745 .87859 .88705 .89501 .90249 .90950 .88410 .89270 .90078 .90836 .91545 .88676 .89542 .90356 .91118 .91832 1.50 1.55 1.60 1.65 1.70 .81283 .81762 .82219 .82656 .83075 .86380 .86936 .87463 .87964 .88438 .88471 .89054 .89605 .90125 .90615 .89600 .90196 .90758 .91286 .91782 .90305 .90908 .91475 .92007 .92506 .90786 .91394 .91964 .92498 .92998 .91135 .91746 .92318 .92854 .93354 .91400 .92013 .92587 .93122 .93622 .91607 .92222 .92797 .93333 .93833 .92209 .92828 .93404 .93940 .94439 .92498 .93118 .93695 .94231 .94728 1.75 1.80 1.85 1.90 1.95 .83475 .83859 .84226 .84579 .84917 .88889 .89317 .89723 .90109 .90476 .91079 .91516 .91929 .92318 .92686 .92249 .92688 .93101 .93488 .93852 .92974 .93412 .93823 .94207 .94566 .93465 .93902 .94310 .94692 .95047 .93820 .94256 .94662 .95040 .95392 .94088 .94522 .94926 .95302 .95650 .94298 .94730 .95132 .95506 .95852 .94900 .95328 .95723 .96089 .96425 .95187 .95612 .96004 .96364 .96696 PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014 338 Kapitel 10: Testtheorie p-Wert • Der p-Wert p des t-Tests berechnet sich zum Stichprobenumfang n und dem ermittelten Wert t für die drei Testproblem wie folgt: 1. H0 : µ ≤ µ0 gegen H1 : µ > µ0 : p = 1 − Fn−1 (t) 2. H0 : µ ≥ µ0 gegen H1 : µ < µ0 : p = Fn−1 (t) 3. H0 : µ = µ0 gegen H1 : µ 6= µ0 : p = 2 · 1 − Fn−1 |t| • Ist nun p ≤ α, so lehnt man die Nullhypothese H0 zum Niveau α ab. PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014 339 Kapitel 10: Testtheorie p-Wert Beispiel 10.2 (Fortsetzung): X 1 1 xi . vs. H1 : p < p0 = , X = 6 6 960 H 0 : p ≥ p0 = i=1 Sei F960, 61 die Verteilungsfunktion der B960, 16 -Verteilung, dann ist der p-Wert gegeben durch p = F960, 16 (X ) = 0.0000009133 < α = 0.05 (Berechnet mit dem Statistikprogramm R). Somit kann die Nullhypothese verworfen und die Alternative signifikant bestätigt werden. PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014 340 Kapitel 10: Testtheorie p-Wert Beispiel 10.3 (Fortsetzung): In unserem Beispiel ist t = 1.765 und nach der Fn -Tabelle ist 0.94088 < F8 (1.765) < 0.94522. Genauer ist F8 (1.765) = 0.9422, so dass p = 1 − 0.9422 = 0.0578 ist. Da somit p > 0.05 = α, kann die Nullhypothese nicht verworfen werden. x\n 1.00 1.05 1.10 1.15 1.20 1 .75000 .75776 .76515 .77217 .77886 2 .78868 .79806 .80698 .81545 .82350 3 .80450 .81458 .82416 .83325 .84187 4 .81305 .82352 .83346 .84289 .85182 5 .81839 .82910 .83927 .84892 .85805 6 .82204 .83292 .84325 .85305 .86232 7 .82469 .83569 .84614 .85604 .86541 8 .82670 .83780 .84834 .85832 .86777 9 .82828 .83945 .85006 .86011 .86961 14 .83286 .84425 .85506 .86530 .87497 19 .83506 .84655 .85746 .86779 .87756 1.25 1.30 1.35 1.40 1.45 .78522 .79129 .79706 .80257 .80782 .83113 .83838 .84525 .85176 .85794 .85004 .85777 .86508 .87200 .87853 .86028 .86827 .87582 .88295 .88967 .86669 .87485 .88255 .88980 .89663 .87108 .87935 .88714 .89448 .90138 .87427 .88262 .89048 .89788 .90483 .87669 .88510 .89302 .90046 .90745 .87859 .88705 .89501 .90249 .90950 .88410 .89270 .90078 .90836 .91545 .88676 .89542 .90356 .91118 .91832 1.50 1.55 1.60 1.65 1.70 .81283 .81762 .82219 .82656 .83075 .86380 .86936 .87463 .87964 .88438 .88471 .89054 .89605 .90125 .90615 .89600 .90196 .90758 .91286 .91782 .90305 .90908 .91475 .92007 .92506 .90786 .91394 .91964 .92498 .92998 .91135 .91746 .92318 .92854 .93354 .91400 .92013 .92587 .93122 .93622 .91607 .92222 .92797 .93333 .93833 .92209 .92828 .93404 .93940 .94439 .92498 .93118 .93695 .94231 .94728 1.75 1.80 1.85 1.90 1.95 .83475 .83859 .84226 .84579 .84917 .88889 .89317 .89723 .90109 .90476 .91079 .91516 .91929 .92318 .92686 .92249 .92688 .93101 .93488 .93852 .92974 .93412 .93823 .94207 .94566 .93465 .93902 .94310 .94692 .95047 .93820 .94256 .94662 .95040 .95392 .94088 .94522 .94926 .95302 .95650 .94298 .94730 .95132 .95506 .95852 .94900 .95328 .95723 .96089 .96425 .95187 .95612 .96004 .96364 .96696 PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014 341 Kapitel 10: Testtheorie Tests Bemerkungen: 1. Alle angegebenen Tests sind so ausgelegt, dass für die Alternative H1 die Wahrscheinlichkeit für den Fehler 2. Art möglichst gering unter allen Niveau-α-Tests wird. 2. Einmal getestete Daten dürfen nicht weiter verwendet werden, da dies sonst zur Verfälschung des Signifikanzniveaus führt. 3. Falsch ist auch die Suche nach “optischen” Unregelmäßigkeiten in den Daten, um Hypothesen zu generieren. D.h. insb., dass die Datenerhebung erst nach Aufstellung der Hypothese und Festlegung des Niveaus erfolgen soll. 4. Wollen wir bei einer diskreten Verteilung nicht einen unbekannten Parameter dieser gegebenen Verteilung testen, sondern direkt die Verteilungsannahme überprüfen, so führt uns das zum χ2 -Anpassungstest. PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014 342 Kapitel 10: Testtheorie χ2 -Anpassungstest • Ein Experiment habe r ≥ 2 verschiedene Ausgänge, wobei das i-te Pr Ereignis mit Wahrscheinlichkeit pi auftrete, 1 ≤ i ≤ r , i=1 pi = 1. • In n unabhängigen Versuchswiederholungen sei ki die absolute Häufigkeit des i-ten Ereignisses, k1 + . . . + kr = n • Es besteht der Verdacht, dass die angegebenen Parameter nicht einer vorgegebenen mit den Besetzungswahrscheinlichkeiten (0) (0) p1 , . . . , pr folgen. • Testproblem: (0) p1 , . . . , pr = p1 , . . . , pr(0) gegen (0) H1 : p1 , . . . , pr 6= p1 , . . . , pr(0) . H0 : PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014 343 Kapitel 10: Testtheorie χ2 -Anpassungstest • Zum Testen dieser Hypothese verwendet man die χ2 -Statistik χ2 = (0) 2 r ki − n · pi X (0) i=1 . n · pi • Testentscheidung: Zum vorgegebenen Niveau α erfolgt die Entscheidung nach dem χ2 -Test mit r − 1 Freiheitsgraden, falls n genügend groß ist, durch dH1 , falls χ2 > χ2r −1,1−α d(k1 . . . , kr ) = , dH0 , falls χ2 ≤ χ2r −1,1−α wobei χ2r −1,1−α das 100 · (1 − α)%-Quantil der χ2r −1 -Verteilung ist. PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014 344 Kapitel 10: Testtheorie χ2 -Anpassungstest (0) (0) • Liegt unter H0 der Parameter (p1 , . . . , pr ) vor, so kann gezeigt werden, dass die angegebene χ2 -Statistik für große Stichprobenumfänge n einer sogenannten χ2r −1 -Verteilung mit r − 1 Freiheitsgraden folgt. • Auch die (100 · α)%-Quantile χ2n,α der χ2 -Verteilung mit n Freiheitsgraden sind für wichtige Werte vertafelt (und für alle T5 der χ -Verteilung Werte Quantile in Statistik-Softwaren implementiert). Tabelliert ist das α-Quantil χ2n; α der χ2 -Verteilung mit n Freiheitsgraden. n\α 1 2 3 4 5 0.01 .0002 .0201 .1148 .2971 .5543 0.025 .0010 .0507 .2158 .4844 .8312 0.050 .0039 .1026 .3518 .7107 1.145 0.100 .0158 .2107 .5844 1.064 1.610 0.250 .1015 .5754 1.213 1.923 2.675 0.500 .4549 1.386 2.366 3.357 4.351 0.750 1.323 2.773 4.108 5.385 6.626 0.900 2.706 4.605 6.251 7.779 9.236 0.950 3.841 5.991 7.815 9.488 11.07 0.975 5.024 7.378 9.348 11.14 12.83 0.990 6.635 9.210 11.34 13.28 15.09 0.995 7.879 10.60 12.84 14.86 16.75 6 7 8 9 10 .8721 1.239 1.646 2.088 2.558 1.237 1.690 2.180 2.700 3.247 1.635 2.167 2.733 3.325 3.940 2.204 2.833 3.490 4.168 4.865 3.455 4.255 5.071 5.899 6.737 5.348 6.346 7.344 8.343 9.342 7.841 9.037 10.22 11.39 12.55 10.64 12.02 13.36 14.68 15.99 12.59 14.07 15.51 16.92 18.31 14.45 16.01 17.53 19.02 20.48 16.81 18.48 20.09 21.67 23.21 18.55 20.28 21.95 23.59 25.19 7.584 10.34 13.70 8.438 11.34 14.85 9.299 12.34 15.98 10.17 13.34 17.12 WS 2013/2014 17.28 18.55 19.81 21.06 19.68 21.03 22.36 23.68 21.92 23.34 24.74 26.12 24.72 26.22 27.69 29.14 26.76 28.30 29.82 31.32 11 3.053 3.816 4.575 5.578 12 3.571 4.404 5.226 6.304 13 4.107 5.009 5.892 7.042 14 4.660 5.629 6.571 7.790 PD Dr. M. Pauly , Mathematik für Pharmazeuten, 345 Kapitel 10: Testtheorie χ2 -Anpassungstest Beispiel 10.4 (Randkreuze beim Lotto): Besitzen alle Lotto-Tips die gleiche Wahrscheinlichkeit, so ist die Anzahl der Kreuze in den Randfeldern eines 7 × 7 Lottoblocks, wie in Beispiel 4.5 bestimmt, hypergeometrisch verteilt. Es wurde nun ein Experiment durchgeführt, in dem 59 Personen unabhängig voneinander jeweils einen Lottoblock ausgefüllt haben. Die relativen Häufigkeiten der Anzahlen angekreuzter Randfelder in diesem Experiment und die zugehörigen theoretischen Wahrscheinlichkeiten sind gegeben durch Randzahlen 0 1 2 3 4 5 6 Insgesamt relative Häufigkeit 0.01 0.14 0.35 0.33 0.15 0.02 0 PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014 theoretische W-keit 0.01 0.09 0.25 0.33 0.23 0.08 0.01 59 346 Kapitel 10: Testtheorie χ2 -Anpassungstest • Wir wollen nun zum Niveau α = 0.05 testen, ob die erhobenen Daten von dieser hypergeometrischen Verteilung abweichen (und somit ob Randfelder mit einer anderen Wahrscheinlichkeit angekreuzt werden als zentrale Felder). • Aus den erhobenen Daten ergibt sich für die Teststatistik der Wert χ2 = (0) 2 r ki − n · pi X (0) i=1 n · pi = 59 · 7 X i=1 ki n (0) 2 − pi (0) pi = 20.1033. • Da nun das 95%-Quantil χ26,0.95 = 12.59 ist (siehe Tabelle), kann die Nullypothese zum Niveau 5% verworfen werden. PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014 347 Kapitel 10: Testtheorie Zufallsexperiment: Zufallszahlen Ziffern Anzahl 0 4 1 2 2 4 3 7 4 9 5 8 6 9 7 14 8 5 9 1 Wir wollen nun zum Niveau α = 0.05 testen, ob die erhobenen Daten von der Gleichverteilung abweichen. (0) 2 k −n·p P i i χ2 = ri=1 = 21.6032 (0) n·pi Da das 95%-Quantil χ29,0.95 = 16.91898 ist kann die Nullhypothese zum Niveau α = 0.05 verworfen werden. PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014 348 Kapitel 10: Testtheorie 1-faktorielle Varianzanalyse (ANOVA) • Bisher: Nur Tests für ein oder zwei Stichproben. • Häufig hat man aber mehr als zwei Stichproben vorliegen. Für die statistische Auswertung solcher Fälle gibt es selbstverständlich auch Testverfahren. Wir stellen exemplarisch eines vor, die ANOVA: • Gegeben seien also k > 2 Stichproben mit Beobachtungen xi,1 , . . . , xi,ni in Gruppe i, i = 1, . . . , k. PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014 349 Kapitel 10: Testtheorie Modell • Wir nehmen an, dass die Beobachtungen Realisierungen von unabhängigen ZVen Xi,1 , . . . , Xi,ni ∼ N(µi , σ2 ), i = 1, . . . , k sind. • Das Testproblem von Interesse ist H0 : {µ1 = . . . = µk } gegen H1 : {µi 6= µj für eine Kombination 1 ≤ i 6= j ≤ k}. • n = n1 + . . . + nk = b Gesamtstichprobenumfang. PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014 350 Kapitel 10: Testtheorie Bemerkungen • Die Varianz wird in allen Gruppen als gleich angenommen (Varianzhomogenität = Homoskedastizität). • Alle Stichproben sind unabhängig. • Die ZVen einer Gruppe (=Faktorstufen) sind i.i.d. N(µi , σ2 )-verteilt. Diese Voraussetzungen sind in praktischen Situationen zu überprüfen (später mehr). PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014 351 Kapitel 10: Testtheorie Sei xij die j-te Beobachtung der i-ten Stichprobe und x das Gesamtmittel, sowie xi das i-te Gruppenmittel. Dann gilt : xij = x + (xi − x) | {z } Abweichung Gruppenmittel vom Gesamtmittel + (xij − xi ) | {z } Abweichung Beobachtung vom Gruppenmittel Idee: Gilt H0 nicht, wird die Abweichung der Gruppenmittel zum Gesamtmittel hoch sein im Vergleich zur Abweichung der Beobachtungen zum Gruppenmittel. PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014 352 Kapitel 10: Testtheorie • Hieraus folgt: SStotal = SSwithin + SSbetween X X X (xij − x)2 = (xij − xi. )2 + ni (xi. − x)2 i,j i,j i und die vorangegangenen Überlegungen motivieren die Teststatistik des F-Tests F = 1 k−1 SSbetween 1 n−k SSwithin welche mit dem (1 − α)-Quantil einer Fk−1,n−k - Verteilung verglichen wird. PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014 353 Kapitel 10: Testtheorie Diskussion Je weiter die Mittelwerte der einzelnen Faktorstufen vom Gesamtmittel abweichen, desto größer wird der Wert für SSbetween , im Vergleich zum Wert für SSwithin . Unter H0 sollte also der between Quotient SS SSwithin nahe bei Null liegen. Je größer SSbetween wird und somit auch je größer der Quotient wird - desto unwahrscheinlicher ist die Gültigkeit von H0 . Bei Werten von F größer Fk−1,n−k,(1−α) wird H0 verworfen. PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014 354 Kapitel 10: Testtheorie Beispiel Vier verschiedene Lehrmethoden sollen untersucht werden. Dazu werden 32 Personen zufällig auf vier Gruppen á 8 Personen aufgeteilt. Am Ende des Kurses wird eine Abschlussprüfung durchgeführt und die Punkte jedes Teilnehmers dokumentiert : Gruppe 1 Gruppe 2 Gruppe 3 Gruppe 4 x1,1 x1,2 x1,3 x1,4 x1,5 x1,6 x1,7 x1,8 x2,1 x2,2 x2,3 x2,4 x2,5 x2,6 x2,7 x2,8 x3,1 = 2 x3,2 = 10 x3,3 = 9 x3,4 = 10 x3,5 = 11 x3,6 = 9 x3,7 = 10 x3,8 = 9 x4,1 = 5 x4,2 = 8 x4,3 = 8 x4,4 = 11 x4,5 = 1 x4,6 = 9 x4,7 = 5 x4,8 = 9 x3 = 8.75 x4 = 7.00 = 16 = 18 = 20 = 15 = 20 = 15 = 23 = 19 x1 = 18.25 = 16 = 12 = 10 = 14 = 18 = 15 = 12 = 13 x2 = 13.75 Gibt es siginifikante Unterschiede zwischen den Gruppen ? PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014 355 Kapitel 10: Testtheorie • Gruppenmittel: x1 = 1 8 P i x1,i = 18.25, x2 = 13.75, x3 = 8.75, x4 = 7 • Gesamtmittel: x = 18.25+13.75+8.75+7 = 11.9375 4 P4 − x)2 = 318.7812 + 26.28125 + 81.28125 + 195.0312 = 621.375 P • SSwithin = i,j (xij − xi. )2 = (16−18.25)2 +. . .+(19−18.25)2 +(16−13.75)2 +. . . = 226.5 • SSbetween = • Also F = i=1 ni (xi 1 SSbetween k−1 1 SSwithin n−k = 1 621.375 4−1 1 226.5 32−4 = 25.60486 > 2.946685 = F0.95,3,28 . D.h. wir können die Nullhypothese zum Niveau α = 0.05 verwerfen. PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014 356 Kapitel 10: Testtheorie Eine Auswahl von Statistikprogrammen R • freie Software(GNU GPL), • Programmiersprache, kann mittels eines Editors komfortabel verwendet werden, • erhältlich unter http://www.r-project.org, Editoren/graphische Oberfläche unter http://www.sciviews.org/rgui/ • häufige Verwendung an Hochschulen. SPSS • kommerzielles Programm, • (meist) Menü-basierte Steuerung, • weit verbreitet, z.B. in der Medizin, Psychologie und in den Sozialwissenschaften, • Lizenzen sind im Hochschul-Rechenzentrum (ZIM) vorhanden. PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014 357 Kapitel 10: Testtheorie SAS • kommerzielles Programm • Menü-basierte Steuerung, eigene Programmiersprache • weit verbreitet, z.B. in der Medizin, Biometrie, erfüllt industrielle Standards, • Lizenzen sind im Hochschul-Rechenzentrum (ZIM) vorhanden. Alle Statistikprogramme verfügen über umfangreiche Bibliotheken. PD Dr. M. Pauly , Mathematik für Pharmazeuten, WS 2013/2014 358