Mathematik für Biologen Prof. Dr. Rüdiger W. Braun http://blog.ruediger-braun.net Heinrich-Heine-Universität Düsseldorf 14. Januar 2015 Binomialtests 1 Binomialtests Allgemeines Einseitiger unterer Binomialtest Einseitiger oberer Binomialtest Zweiseitiger Binomialtest Binomialtests Testverfahren: Fehler erster und zweiter Art Ein Test besteht aus einer Vorschrift, die zu jedem möglichen Versuchsausgang festlegt, ob die Nullhypothese H0 angenommen oder abgelehnt wird. Dabei kann es zu zwei verschiedenen Fehlentscheidungen kommen: H0 trifft zu H1 trifft zu H0 wird angenommen richtige Entscheidung Fehler 2. Art H0 wird abgelehnt Fehler 1. Art richtige Entscheidung Binomialtests Signifikanztests Für den Fall, dass H0 zutrifft, bezeichnet man die Wahrscheinlichkeit, dass H0 trotzdem abgelehnt wird, als Fehlerwahrscheinlichkeit erster Art Ein Test heißt Signifikanztest zum Niveau α, wenn alle Fehlerwahrscheinlichkeiten erster Art ≤ α sind Das übliche Niveau ist 0.05 Für den Fall, dass H0 nicht zutrifft, bezeichnet man die Wahrscheinlichkeit, dass H0 trotzdem nicht abgelehnt wird, als Fehlerwahrscheinlichkeit zweiter Art Binomialtests Ein- und zweiseitige Tests für Erfolgswahrscheinlichkeiten Ein ja/nein-Experiment mit unbekannter Erfolgswahrscheinlichkeit p wird n-mal wiederholt Ziel: Aussage über p relativ zu einem Referenzwert p0 verschiedene Nullhypothesen sind denkbar H0 : p ≥ p0 einseitiger unterer Test H0 : p ≤ p0 einseitiger oberer Test H0 : p = p 0 zweiseitiger Test Die Nullhypothese H0 : p 6= p0 macht keinen Sinn Binomialtests Einseitiger unterer Binomialtest zum Niveau α Gegeben sind unabhängige B(1, p)-verteilte Zufallsvariable X1 , . . . , Xn mit unbekanntem p sowie ein Signifikanzniveau α Verglichen werden soll mit einem Referenzwert p0 Getestet wird die Nullhypothese H0 = {p ≥ p0 } gegen die Alternative H1 = {p < p0 } Der Wert c ist so zu wählen, dass c−1 X n · p0k · (1 − p0 )n−k ≤ α k k=0 c X n · p0k · (1 − p0 )n−k > α k k=0 c heißt kritischer Wert Binomialtests Einseitiger unterer Binomialtest zum Niveau α Entscheidungsregel: Die Nullhypothese wird abgelehnt, falls die Anzahl der Erfolge echt kleiner als c ist Die Nullhypothese wird beibehalten, falls die Anzahl der Erfolge mindestens c ist Binomialtests Beispiel L-Bakterien Letztes Mal war die Frage Schädigt das Pestizid L-Bakterien mehr als R-Bakterien? zum Signifikanzniveau α = 0.05 zu beantworten In unbelastetem Boden waren 75% aller Bakterien L-Bakterien Die Nullhypothese ist, dass der Anteil in belastetem Boden mindestens genauso groß ist Also H0 : p ≥ p0 für p0 = 0.75 Tabelle: kritischer Wert c = 16 Bei 15 oder weniger Erfolgen wird die Nullhypothese abgelehnt Binomialtests Tabelle der Werte Pr r 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 k=0 Bn, p (k) p 0. 0.75 00001 00003 00016 00067 00245 00778 02162 05278 11325 21405 35729 52917 70105 84168 93340 97926 99577 99958 für n = 27 0.76 0.77 0.78 0.79 00002 00010 00042 00161 00538 01573 04031 09067 17927 31217 48050 65819 81165 91729 97305 99423 99939 00001 00006 00026 00103 00364 01119 03016 07126 14769 26889 43120 61232 77770 89806 96521 99219 99914 00001 00003 00015 00065 00240 00777 02208 05488 11951 22804 38195 56385 73973 87530 95540 98948 99878 00002 00009 00039 00153 00526 01577 04136 09483 19012 33350 51330 69777 84864 94322 98592 99828 Binomialtests Einseitiger oberer Binomialtest zum Niveau α Gegeben sind unabhängige B(1, p)-verteilte Zufallsvariable X1 , . . . , Xn mit unbekanntem p sowie ein Signifikanzniveau α Verglichen werden soll mit einem Referenzwert p0 Getestet wird die Nullhypothese H0 = {p ≤ p0 } gegen die Alternative H1 = {p > p0 } Der kritische Wert c ist so zu wählen, dass c X n · p0k · (1 − p0 )n−k ≥ 1 − α k k=0 c−1 X n · p0k · (1 − p0 )n−k < 1 − α k k=0 Entscheidungsregel: Die Nullhypothese wird abgelehnt, falls die Anzahl der Erfolge echt größer als c ist Die Nullhypothese wird beibehalten, falls die Anzahl der Erfolge höchstens c ist Binomialtests Beispiel zum oberen Binomialtest Zuchtlachsen wird Fischabfall und vegetarisches Futter zur Auswahl angboten 11% aller Lachse bevorzugen das Gemüse Die Lachse werden stufenweise an vegetarische Kost gewöhnt Die Frage Bevorzugen sie das Gemüse nach der Umgewöhnung mit höherer Wahrscheinlichkeit als vorher? soll zum Signifikanzniveau α = 0.05 beantwortet werden Einseitiger, oberer Binomialtest mit Nullhypothese H0 = {p ≤ 0.11} Stichprobenumfang n = 38 Binomialtests Tabelle der Werte r 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 Pr k=0 Bn, p (k) p 0. 0.10 01825 09530 25367 46484 67014 82525 92005 96819 98893 99660 99908 99978 99995 99999 für n = 38 0.11 01193 06799 19616 38625 59183 76460 88205 94841 98020 99329 99798 99946 99987 99997 99999 0.12 00777 04802 14958 31576 51404 69790 83579 92175 96717 98782 99599 99882 99969 99993 99998 0.13 00503 03360 11259 25421 43938 62753 78216 88779 94895 97941 99261 99763 99932 99982 99996 99999 0.14 00324 02330 08372 20174 36986 55596 72258 84658 92480 96724 98728 99558 99862 99962 99990 99998 0.15 00208 01602 06154 15794 30680 48542 65879 79865 89428 95054 97933 99227 99740 99922 99979 99995 99999 Binomialtests Beispiel Lachse, Fortsetzung die Tabelle zeigt c = 8 die Nullhypothese wird abgelehnt, wenn die Zahl der Erfolge mindestens 9 beträgt bei 8 oder weniger Erfolgen wird sie beibehalten Binomialtests Beispiel Lachs: Power des Tests Was ist die Power des Tests, wenn tatsächlich nach der Umgewöhnungsphase 15% der Lachse vegetarische Kost bevorzugen? Die Power ist die Wahrscheinlichkeit, bei Vorliegen der Alternative die Nullhypothese auch tatsächlich abzulehnen Die Power hängt davon ab, wie kleine Abweichungen von der Nullhypothese man entdecken will: kleine Abweichungen ⇒ kleine Power H0 wird abgelehnt bei mindestens 9 Erfolgen Im Beispiel p = 0.15 Also ist die Power gleich 38 X k=9 B38,0.15 (k) = 1 − 8 X B38,0.15 (k) = 1 − 0.89428 = 0.10572 k=0 Die Power beträgt nur ungefähr 10% Binomialtests B38, 0.15(k) B38, 0.11(k) Power, Fortsetzung 0.25 0.20 0.15 0.10 0.05 0.00 0 0.25 0.20 0.15 0.10 0.05 0.00 0 5 10 15 20 25 5 10 15 20 25 Rote Balken zeigen Fehlentscheidungen k Binomialtests Zweiseitiger Binomialtest zum Niveau α Gegeben sind unabhängige B(1, p)-verteilte Zufallsvariable X1 , . . . , Xn mit unbekanntem p sowie ein Signifikanzniveau α Verglichen werden soll mit einem Referenzwert p0 Getestet wird die Nullhypothese H0 = {p = p0 } gegen die Alternative H1 = {p 6= p0 } Idee: Man testet {p ≤ p0 } zum Signifikanzniveau Signifikanzniveau α2 α 2 und dann {p ≥ p0 } zum H0 wird abgelehnt, wenn einer der beiden Tests zur Ablehnung führt Binomialtests Zweiseitiger Binomialtest zum Niveau α Die kritischen Werte c1 und c2 sind so zu wählen, dass cX 1 −1 α n · p0k · (1 − p0 )n−k ≤ k 2 k=0 c1 X α n · p0k · (1 − p0 )n−k > k 2 k=0 c2 X α n · p0k · (1 − p0 )n−k ≥ 1 − k 2 k=0 cX 2 −1 α n · p0k · (1 − p0 )n−k < 1 − k 2 k=0 Binomialtests Entscheidungsregel: Die Nullhypothese wird abgelehnt, wenn die Anzahl der Erfolge echt kleiner als c1 oder echt größer als c2 ist Die Nullhypothese wird beibehalten, wenn die Anzahl der Erfolge c1 nicht unterund c2 nicht überschreitet Binomialtests Zweiseitiger Binomialtest, Beispiel Bei 250 Würfen eines Würfels fiel 55 mal eine Sechs. Kann man zu 95% sicher sein, dass der Würfel gezinkt ist? Sei p die unbekannte Wahrscheinlichkeit des Würfels für eine Sechs Zweiseitiger Binomialtest mit Nullhypothese: H0 = p = 61 Alternative: H1 = p 6= 16 Signifikanzniveau ist α = 0.05 Binomialtests Tabelle von Pn k=0 B250, 1/6 (k) r 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 p 0. 1 6 00005 00011 00024 00050 00100 00189 00343 00598 01005 01628 02546 03849 05632 07989 10997 14709 19143 24273 30023 36275 r 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 p 0. 1 6 42870 49627 56351 62856 68977 74581 79576 83912 87579 90603 93034 94941 96400 97491 98286 98853 99248 99517 99696 99812 Binomialtests Beispiel, Fortsetzung c1 = 30 und c2 = 54 Die Nullhypothese kann zum Niveau α = 0.05 abgelehnt werden, wenn höchstens 29 oder mindestens 55 Sechsen fallen Bei 55 Sechsen kann die Nullhypothese also abgelehnt werden Wir können mit 95% Sicherheit sagen, dass der Würfel gezinkt ist Binomialtests B250,1/6(k) Beispiel, Fortsetzung 0.07 0.06 0.05 0.04 0.03 0.02 0.01 0.00 0 20 Rote Balken zeigen Fehlentscheidungen 40 k 60 80