Testen von Hypothesen Julia Antoniuk Jessica Gottschalk Susana de Miguel Die beiliegende Aufgabe wurde in Mecklenburg-Vorpommern als Beispielaufgabe für das Abitur 2008 für einen Leistungskurs veröffentlicht. 1. Lösen Sie die Aufgabenteile 3.3 und 3.4 unter Verwendung des Ergebnisses der Teilaufgabe 3.2 vollständig. Diskutieren Sie die Formulierung von Aufgabenteil 3.4 kritisch. 2. a) Entwerfen Sie einen Erwartungshorizont zur Bewertung der Schülerleistungen für diese beiden Teilaufgaben. Verteilen Sie insgesamt 20 Punkte und ordnen Sie die erwarteten Leistungen den Anforderungsbereichen I bis III zu. b) Worin sehen Sie die größten Schwierigkeiten dieser Aufgabe? c) Mit welchen Schülerfehlern rechnen Sie? Lösung 3.1: a) P(" Zahl endet mit 111" ) P("3 - mal Erfolg mit pErfolg 0,7" ) (0,7)3 b) P(" Zahl ist größer als 6661666" ) P(" Zahl beginnt mit 6666" ) P("4 - mal Erfolg mit pErfolg 0,3" ) (0,3) 4 Mögliche Fehler: a) b) Sch. erkennen nicht, dass die ersten vier Ziffern keine Rolle spielen und versuchen mit allen Ziffern zu rechnen. Sch. erkennen nicht, dass die Zahlen, bei denen die ersten vier Ziffern 6 sind, größer als 6 661 666 sind. Sch. erkennen nicht, dass nur die ersten vier Ziffern eine Rolle spielen. Lösung 3.2: Das kann als Bernoulli-Kette interpretiert werden. P (Gewinnlos ) P (" mehr als 3 - mal Erfolg mit pErfolg 0,3 und 7 Versuchen" ) ... 0,126 Mögliche Fehler: • Sch. erkennen nicht, dass die Anzahl der Sechsen k { 4 ,5,6 ,7 } , aber nicht k { 3 ,4 ,5,6 ,7 } • Sch. interpretieren das Spiel nicht als Bernouli-Kette. Lösung 3.3: Hypothese { " Anzahl der Gewinnlose ok" } { " Wahrschein lichkeit für Gewinnlos 0,126 } Ablehnungsbereich { " mehr als k Gewinnlose unter den 200 untersucht en Losen" } 1 P ( " Fehler 1. Art" ) 10 Fehler 1. Art = Ablehnen, obwohl die Hypothese richtig ist. 1 P ( " Fehler 1. Art" ) P ( " Ablehnung mit pGewinn 0,126" ) 10 P ( " mehr als k - mal Erfolg bei 200 Versuchen und pErfolg 0,126" ) X Anzahl Gewinnlose Erwartungs wert : E ( X ) n p 200 0 ,126 25,2 Nach Tabelle gilt dies für k = 31 Mögliche Fehler: • • Sch. erkennen nicht, dass es sich hier um Fehler 1.Art handelt. Sch. verwechseln die Wahrscheinlichkeiten 0,1 und 0,126. Aufgabenstellung 3.4: Formulierung ist schwer verständlich Besser: Angenommen der Automat gibt Gewinnlose mit einer Wahrscheinlichkeit p=0,15 aus. Nutzen Sie die Entscheidungsregel aus 3.3, um die Wahrscheinlichkeit zu berechnen, dass dieser Fehler nicht erkannt wird. Oder : Berechnen Sie den Fehler 2. Art, falls die tatsächliche Gewinnwahrscheinlichkeit p=0,15 ist (unter der Entscheidungsregel aus 3.3). Lösung 3.4: Bernoulli-Kette Anzahl überprüfte Lose Neue Gewinnwahrscheinlichkeit n=200 p=0.15 X= Anzahl Gewinnlose E(X)=n·p=200·0,15=30 Berechnung des Erwartungswerts Wahrscheinlichkeit, dass fehlerhafte Gewinnwahrscheinlichkeit nicht erkannt wird (Fehler 2. Art) mit Entscheidungsregel aus 3.3 („0 bis 31 Treffer“ bilden Annahmebereich) : aufsummierte Wahrscheinlichkeit (s.Tabelle) 62.47% Aufsummierte Wahrscheinlichkeiten für p=0.15 und n=200 k 28 29 30 P( X k ) 0.3914 0.4697 0.5485 31 32 33 34 0.6247 0.6958 0.7596 0.8150 Beurteilung des Tests Anzahlen im Bereich des Erwartungswerts (z.B. 29, 30, 31) sind wahrscheinlich. Entscheidungsregel aus 3.3 („0 bis 31 Treffer“ bilden Annahmebereich) Werte liegen alle im Annahmebereich Bei Ausgabe von fehlerhaften Gewinnlosen, deren Wahrscheinlichkeit sich nur geringfügig von der angestrebten Wahrscheinlichkeit unterscheidet, ist die gewählte Entscheidungsregel nicht geeignet. Verbesserung des Testergebnis durch Erhöhung der Anzahl der geprüften Lose Mögliche Fehler: • • Sch. verwechseln Fehler 1. Art und Fehler 2. Art. Sch. verwenden die Irrtumswahrscheinlichkeit von 10% aus dem Aufgabeteil 3.3. Lösung 3.5: Wahrscheinlichkeit für das Ergebnis „Sonderlos“: Modell: Bernoulli-Kette. n 4; p 0,7; k 2 4 P( Sonderlos ) 0,7 2 0,32 0,2646 26,5% 2 Mögliche Fehler: • Sch. erkennen nicht, dass nur die ersten vier Ziffern eine Rolle spielen. Lösung 3.6: Wahrscheinlichkeit für das Ergebnis „Gewinnlos und zugleich Sonderlos“: 3 P(" Zwei _"6" _ auf _ den _ letzten _ drei _ Stellen" ) 0,32 0,7 0,189 18,9% 2 3 P(" Drei _"6" _ auf _ den _ letzten _ drei _ Stellen" ) 0,33 0,7 0 0,027 2,7% 3 P(" Gewinlos _ und _ zugleich _ Sonderlos" ) 0,265 0,216 0,05724 5,7% Mögliche Fehler: • • Sch. denken, dass es sich hier um bedingte Wahrscheinlichkeiten handelt und lösen die Aufgabe dementsprechend. Sch. vergessen eine der beiden Möglichkeiten (dass die „6“ zwei oder drei mal auf den letzten 3 Stellen auftreten darf) Erwartungshorizont zur Bewertung Aufgabe BE 3.1 1 1 3.2 1 1 1 3.3 1 1 1 1 1 Summe 10 Anforderung P („Zahl endet mit 111“) berechnen P („Zahl ist größer als 6661666“) berechnen Modell festlegen Modellparameter bestimmen P („Gewinnlos“) berechnen Modell festlegen Annahmebereich bestimmen Erwartungswert berechnen kritischen Wert mit Tabelle bestimmen Formulierung der Entscheidungsregel Erwartungshorizont zur Bewertung Aufgabe BE Anforderung 3.4 1 Modell festlegen 1 Erwartungswert berechnen 1 Fehler 2. Art mit Tabelle bestimmen 1 Beurteilung des Test 1 Verbesserungsvorschlag für den Test 3.5 1 Modell festlegen 1 P („Sonderlos“) berechnen 3.6 1 Zwischenwerte berechnen P(„2-mal 6“); P(„3-mal 6“) 1 Berechnung unter Verwendung der Summenregel 1 Berechnung unter Verwendung des Multiplikationssatz Summe 10 Summe insgesamt: 20 BE Zuordnung der Anforderungsbereiche I-III 3.1 I 3.2 II 3.3 II 3.4 II+III 3.5 3.6 I II Reproduktion: Anwendung von Wahrscheinlichkeiten im Baumdiagramm Zusammenhang herstellen: Spiel mit Gewinnlos als Bernoullikette erkennen Zusammenhang herstellen: Versuch kann als Bernoullikette gesehen werden Zusammenhang herstellen: Fehler 2. Art mit neuem Modellparameter Reflektion/ Interpretation des gewählten Test Reproduktion: Anwendung Bernoullikette Zusammenhang herstellen: 2-stufiges Zufallsexperiment; Pfadwahrscheinlichkeiten mit Bernoullikette berechnen Worin sehen Sie die größten Schwierigkeiten dieser Aufgabe? 1. 2. 3. 4. Bei Aufgabe 3.1 kann es sein, dass die Schüler alle Ziffern betrachten wollen. Die gegebene Tabelle kann für Schüler schwierig zu verstehen sein. (Tabelle unklar, man muss erraten, dass hier die Binomialverteilung gemeint ist.) Die Hypothese und den Ablehnungsbereich richtig festlegen. Aufgabe 3.4 ist sehr schwer verständlich (siehe oben).