Beurteilende Statistik Alternativtest Hypothesentests Bei vielen Anwendungen ist die wirkliche Wahrscheinlichkeit für ein Ereignis nicht bekannt. In diesen Fällen kann man Hypothesen aufstellen und durch Stichproben beurteilen, mit welcher Wahrscheinlichkeit diese zutreffen. Einfachster Test ist der Alternativtest für binomial verteilte Zufallsgrößen. Beispiel 1 Ein Gartenfachmarkt verkauft Tulpenzwiebeln in Packungen mit jeweils 20 Stück. Er gibt eine 90%ige „Blühgarantie“. Ein Käufer beschwert sich und behauptet, dass in seinem Blumenbeet nur 75% Prozent der Tulpen blühen würden. Wurde beim Hersteller die Packung eventuell nicht richtig beschriftet und handelt es sich in Wirklichkeit um Ware „zweiter Wahl“? (nach: Schroedel – Elemente der Mathematik – Niedersachsen Kl. 10, Seite 237) Beispiel 1 - Bedingungen Wir gehen beim Alternativtest davon aus, dass eine der beiden Möglichkeiten wirklich zutrifft. Anzahl der Zwiebeln (Pckg.) n = 20 Es sei p1 = 0,9 und p2 = 0,75. H(p1) Es blühen 90% der Zwiebeln. H(p2) Es blühen 75% der Zwiebeln. Beispiel 1 - Erwartungswerte n = 20 E1 = 0,9 · 20 = 18 Bei einer Blühgarantie von 90% wären 18 blühende Tulpen zu erwarten. E2 = 0,75 · 20 = 15 Bei einer Blühgarantie von 75% wären 15 blühende Tulpen zu erwarten. P(X=k) bei n = 20 und p = 0,9 0,30 0,25 0,20 0,15 0,10 0,05 In dieser Darstellung ist zu sehen, dass auch wenn es sich um eine Packung mit Blumenzwiebeln handelt, die zu 90% blühen, Packungen existieren, in denen 15 und weniger Tulpen blühen werden. 0,00 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 P(X=k) bei n = 20 und p = 0,75 0,30 0,25 0,20 0,15 0,10 0,05 In dieser Darstellung ist zu sehen, dass auch wenn es sich um eine Packung mit Blumenzwiebeln handelt, die zu 75% blühen, Packungen existieren, in denen 18 und mehr Tulpen blühen werden. 0,00 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Beispiel 1 - Entscheidungsregel Es soll geprüft werden, ob p1=0,9 zutrifft. Durch einen Test wird ein Ergebnis für das Blühen der Tulpen ermittelt. Entscheidungsregel: Die Variante 1 wird als richtig angenommen, wenn mehr als 16 Tulpen blühen. P(X=k) bei n = 20 und p = 0,9 0,30 0,25 0,20 Die Entscheidungsregel teilt die Verteilung in zwei Bereiche: k > 16 Annahmebereich (blau) 0,15 0,10 0,05 k ≤ 16 Verwerfungsbereich (rot) 0,00 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Achtung – häufiger Irrtum „Liegt ein Versuchsergebnis im Annahmebereich einer Hypothese, dann bedeutet dies nicht, dass die Hypothese damit bestätigt ist. Vielmehr haben wir uns aufgrund der Entscheidungsregel dazu entschlossen, die betreffende Hypothese weiter als richtig anzusehen. Wir können nur sagen, dass das Versuchsergebnis keinen Anlass gibt, die Hypothese abzulehnen.“ Schroedel – Elemente der Mathematik – Niedersachsen Kl. 10, Seite 235 Fehler beim Testen von Hypothesen Das Stichprobenergebnis liegt im Annahmebereich. (mind. 17 blühende Zwiebeln) Die Hypothese p1=0,9 ist richtig. Die Hypothese p1=0,9 ist falsch. Das Stichprobenergebnis liegt im Verwerfungsbereich. (weniger als 17 blühende Zwiebeln) Fehler beim Testen von Hypothesen Das Stichprobenergebnis liegt im Annahmebereich. (mind. 17 blühende Zwiebeln) Die Hypothese Die Entscheidung p1=0,9 ist ist richtig. richtig. Die Hypothese p1=0,9 ist falsch. Das Stichprobenergebnis liegt im Verwerfungsbereich. (weniger als 17 blühende Zwiebeln) Fehler beim Testen von Hypothesen Das Stichprobenergebnis liegt im Annahmebereich. (mind. 17 blühende Zwiebeln) Das Stichprobenergebnis liegt im Verwerfungsbereich. (weniger als 17 blühende Zwiebeln) Die Hypothese Die Entscheidung p1=0,9 ist ist richtig. richtig. Die Hypothese p1=0,9 ist falsch. Die Entscheidung ist richtig. Fehler beim Testen von Hypothesen Das Stichprobenergebnis liegt im Annahmebereich. (mind. 17 blühende Zwiebeln) Das Stichprobenergebnis liegt im Verwerfungsbereich. (weniger als 17 blühende Zwiebeln) Die Hypothese Die Entscheidung Die Entscheidung ist falsch. p1=0,9 ist ist richtig. richtig. Fehler 1. Art Die Hypothese p1=0,9 ist falsch. Die Entscheidung ist richtig. Fehler beim Testen von Hypothesen Das Stichprobenergebnis liegt im Annahmebereich. (mind. 17 blühende Zwiebeln) Das Stichprobenergebnis liegt im Verwerfungsbereich. (weniger als 17 blühende Zwiebeln) Die Hypothese Die Entscheidung Die Entscheidung ist falsch. p1=0,9 ist ist richtig. richtig. Fehler 1. Art Die Hypothese Die Entscheidung Die Entscheidung p1=0,9 ist ist falsch. ist richtig. falsch. Fehler 2. Art Fehler 1. Art Ein Fehler 1. Art liegt vor, wenn eine wahre Hypothese verworfen wird. Die Wahrscheinlichkeit für den Fehler 1. Art wird mit bezeichnet. Für Beispiel 1 ist dies bezüglich p1=0,9 : = P 0,9 (X≤16)=0,133 Fehler 1. Art Für unser Beispiel würde ein Fehler 1. Art bedeuten, dass es sich tatsächlich um Blumenzwiebeln handelt, die mit einer Wahrscheinlichkeit von 90% blühen. Bei unserem Test haben wir jedoch eine Packung ausgewählt, in der zu wenige Blumen blühen. Deshalb beginnen wir zu zweifeln. (Die wahre Hypothese wird verworfen.) Fehler 2. Art Ein Fehler 2. Art liegt vor, wenn eine falsche Hypothese nicht verworfen wird. Die Wahrscheinlichkeit für den Fehler 2. Art wird mit bezeichnet. Für Beispiel 1 ist dies: = P0,75 (X≥17)=1-P0,75 (X≤16) =1-0,7748=0,2252 Fehler 2. Art Für unser Beispiel würde ein Fehler 2. Art bedeuten, dass es sich doch um Blumenzwiebeln handelt, die nur mit einer Wahrscheinlichkeit von 75% blühen. Bei unserem Test haben wir jedoch eine Packung ausgewählt, in der mehr Blumen als erwartet blühen. Deshalb zweifeln wir nicht daran, dass es sich um die bessere Sorte handelt. (Die falsche Hypothese wird nicht verworfen.) Der Fehler 1. Art bei der Hypothese für p1=0,9 ist bei der Hypothese für p2=0,75 der Fehler 2. Art und umgekehrt. Zusammenfassung Beim Testen von Hypothesen unterscheidet man Annahmebereich und Verwerfungsbereich einer Hypothese. Liegt das Ergebnis eines Zufallsexperiments im Verwerfungsbereich, dann hält man die Annahme für falsch; liegt es im Annahmebereich, dann hat man dazu keinen Anlass. Bei Hypothesentests können zweierlei Fehler unterlaufen, deren Wahrscheinlichkeit sich bestimmen lässt. Fehler 1. bzw. 2. Art Beispiel 2 (Aufgabe) An einem Spielautomaten dreht sich ein Glücksrad mit 20 Sektoren, von denen nur einer sichtbar ist, wenn die Scheibe stehen bleibt. Man gewinnt, wenn ein rotes Feld erscheint. Der Betreiber behauptet, dass 6 Felder rot gefärbt sind. Wir argwöhnen, dass nur 4 Felder Gewinnfelder sind und können wegen Geldmangels nur 20 Spiele durchführen. (Schroedel – Elemente der Mathematik – Niedersachsen Kl. 10, Seite 237) Beispiel 2 (Aufträge) Formuliere eine Entscheidungsregel zur Hypothese p=0,2. Welche Bedeutung haben die Fehler 1. und 2. Art? Bestimme die Fehlerwahrscheinlichkeiten. P(X=k) bei n = 20 und p = 0,2 0,25 0,20 0,15 0,10 In dieser Darstellung ist zu sehen, dass auch wenn es sich um ein Glücksrad mit p=0,2 handelt, Versuche auftreten, bei denen mehr als 4 mal ein rotes Feld erdreht wird. 0,05 0,00 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 P(X=k) bei n = 20 und p = 0,3 0,25 0,20 0,15 0,10 In dieser Darstellung ist zu sehen, dass auch wenn es sich um ein Glücksrad mit p=0,3 handelt, Versuche auftreten, bei denen weniger als 6 mal ein rotes Feld erdreht wird. 0,05 0,00 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Beispiel 2 (Vorüberlegung I) Wir wollen dem Betreiber glauben, wenn bei unserem Versuch 5 und mehr Gewinnfelder auftreten. Die Verteilung zu unserer Hypothese mit p = 0,2 wird • in einen Annahmebereich für k < 5 Gewinnfelder und • in einen Verwerfungsbereich bei k ≥ 5 Gewinnfelder geteilt. Beispiel 2 (Vorüberlegung II) Wenn wir unsere Hypothese mit p = 0,2 testen können zweierlei Fehler auftreten. Fehler 1. Art: Es handelt sich wirklich um ein Glücksrad mit nur 4 Gewinnfeldern, aber wir haben Glück und erdrehen mehr als 4 mal ein Gewinnfeld. Fehler 2. Art: Das Rad hat – wie der Betreiber behauptet – wirklich 6 Gewinnfelder, aber wir haben Pech und erhalten trotzdem weniger als 5 Gewinnfelder. Beispiel 2 (Berechnung) Fehlerwahrscheinlichkeit für einen Fehler 1. Art: P0,2(k>4) = 1- P0,2(k≤4) = 1-0,6296 = 0,3704 = 37,04% Fehlerwahrscheinlichkeit für einen Fehler 2. Art: P0,3(k≤4) = 0,2375 = 23,75% Beispiel 2 (Ergebnis) Die Fehlerwahrscheinlichkeiten sind für dieses Beispiel sehr groß, weil die beiden Annahmen sich nicht erheblich voneinander unterscheiden und nur sehr wenig Versuche zum Testen der Hypothesen durchgeführt wurden. Die Fehlerwahrscheinlichkeiten werden kleiner, wenn mehr Versuche durchgeführt werden. Beispiel 2 (mit 40 Versuchen) Wie verändert sich die Fehlerwahrscheinlichkeit wenn die Anzahl der Versuche verdoppelt wird? Neue Entscheidungsregel: Dem Betreiber soll geglaubt werden, wenn bei 40 Versuchen 10 und mehr Gewinnfelder erdreht werden. 0,16 Verteilung für n = 40 Versuche 0,14 0,12 Fehler 1. Art 0,10 0,08 0,06 0,04 0,02 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 0,00 Verteilung für n = 40 Versuche 0,16 0,14 0,12 Fehler 2. Art 0,10 0,08 0,06 0,04 0,02 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 0,00 Beispiel 2 (Berechnung für n=40) Fehlerwahrscheinlichkeit für einen Fehler 1. Art bei 40 Versuchen: P0,2(k≥10) = 1- P0,2(k≤9) = 1-0,7318 = 0,2682 = 26,82% Fehlerwahrscheinlichkeit für einen Fehler 2. Art: P0,3(k≤9) = 0,1959 = 19,59% Die Fehlerwahrscheinlichkeiten sind gesunken. Je mehr Versuche möglich sind, umso sicherer ist es, dass eine richtige Entscheidung getroffen wird. Beispiel 3 (Aufgabe) Angeblich kennen 70% aller Jugendlichen die Schokoriegel-Marke „Schoko-Choc“. Skeptische Marktbeobachter schätzen den Anteil auf 50%. Durch eine Befragung von 100 zufällig ausgewählten Jugendlichen soll zwischen beiden Standpunkten entschieden werden. Beschreibe mögliche Fehlentscheidungen. Schroedel – Elemente der Mathematik – Niedersachsen Kl. 10, Seite 235 Verteilungen für 100 befragte Personen p1 = 0,5 p2 = 0,7 In dieser Darstellung ist deutlich zu sehen, welcher Wert für die Festlegung der Entscheidungsregel sinnvoll ist, um die Fehler zu minimieren. k = 60 Verteilungen für 100 befragte Personen In dieser Darstellung ist zu sehen, dass auch wenn 70% der Jugendlichen „Schoko-Choc“ kennen, Befragungen zustande kommen können, bei denen 70 und weniger Jugendliche Die Marke kennen. p1 = 0,5 k = 60 p2 = 0,7 Fehler 1. Art P0,7(X≤60)=0,021 Verteilungen für 100 befragte Personen In dieser Darstellung ist zu sehen, dass auch wenn 70% der Jugendlichen „Schoko-Choc“ kennen, Befragungen zustande Fehler 2. Art bei denen kommen können, P0,5(X>60)=0,018 70 und weniger Jugendliche Die Marke kennen. p1 = 0,5 k = 60 p2 = 0,7 Weiter üben? In einer Veröffentlichung war zu lesen, dass 50% aller Haushalte eine Tageszeitung abonniert haben oder täglich kaufen. In einer anderen Publikation wurde dieser Anteil mit 30% beziffert. Es soll angenommen werden, dass genau eine der Aussagen zutrifft. Es sollen 100 Haushalte befragt werden. Schroedel – Elemente der Mathematik – Niedersachsen Kl. 10, Seite 240 • Stellen Sie eine sinnvolle Entscheidungsregel auf, damit man sich zwischen den beiden Aussagen entscheiden kann. • Welche Fehler treten auf, wenn man sich an diese Entscheidungsregel hält? • Bestimmen Sie die Fehlerwahrscheinlichkeiten.