Humboldt-Universität zu Berlin Mathematisch-Naturwissenschaftliche Fakultät II Seminar: Didaktik der Stochastik Dozentin: Frau Dr. Warmuth Referenten: Nils Dörholt Patrik Strauch Andreas Walz Übungsserie 7 , Aufgabe 3 1. Informieren Sie sich zum Thema Stichprobenentnahme bei Wahlhochrechnungen. 2. Lösen Sie die Aufgaben 3 bis 6 aus dem Lehrbuchauszug. Führen Sie dazu geeignete Zufallsgrößen ein. Erläutern Sie, welche Modellannahmen Ihrer Lösung zugrunde liegen. 3. Legen Sie in der Kurzfassung eines Stundenentwurfs dar, wie Sie das Testen von Hypothesen im Zusammenhang mit Wahlen in einer 12. Klasse behandeln würden. Der Kursentwurf soll (mindestens) drei kognitive Ziele beinhalten, die Sie mit der Unterrichtsstunde anstreben. Aufgabe 7.3.1 • Informieren Sie [...] zum Thema Stichprobenentnahmen bei Wahlhochrechnungen. 18-Uhr-Prognose • Grundlage: Wahltagsbefragung (Befragung von Wählern beim Verlassen des Wahllokals) • Wichtig: Statistisch sinnvolle Anzahl repräsentativ ausgewählter Stimmbezirke (bei Landtagswahlen ca. 250, bei Bundestagswahlen etwa 400) Repräsentativität • Stichprobe: unter statistischen Gesichtspunkten ein verkleinertes Abbild des jeweiligen Gebietes • Beachtung der wichtigen Merkmale: Region, Ortsgrösse, Altersverteilung, Haushaltsgrößen, Berufsgruppen, Bildungsstruktur in etwa gleichen Anteilen wie in der Gesamtbevölkerung. Weitere Angaben: • Erfassung statistischer Angaben: Alter, Geschlecht, Berufstätigkeit und Ausbildung, Motive für die Wahlentscheidung 1) Einschätzung der Stichprobenqualität 2) Grundlage für weitere Analysen „Hochrechnung “ • • • • Mitarbeiter bei öffentlichen Stimmenauszählungen Ergebnis telefonisch ans Institut Wenn Mindestanzahl an Stimmbezirksergebnissen vorliegt 1. Hochrechnung ca. 18.30 Uhr Varianz („Hochrechnung) < 0,01 Problem • Grenzen der Exaktheit Beispiel: knappe Entscheidungen um wenige 100 Stimmen Quelle • Siehe Aufgabenblatt (Aufg. 7.3.1) (http://www.awv-net.de/cms/upload/awv-info/pdf/info024Thema-ExakteWahlprognosen-3S.pdf) Aufgabe 7.3.2 • Lösen Sie die Aufgaben 3 bis 6 aus dem Lehrbuch. Führen sie dazu geeignete Zufallsgrößen ein. Erläutern Sie, welche Modellannahmen Ihrer Lösung zugrunde liegen. Aufgabe • Eine Partei erreichte bei der letzten Wahl nur 3% der Stimmen. Man vermutet, dass es möglich ist, den Stimmenanteil zu verdoppeln. Bei einer Umfrage gaben von 1000 Wählern 41 an, diese Partei wählen zu wollen. • (Lehrbuch „Mathematik – Stochastik“ vom Cornelsen Verlag, 2006, S. 207) Zufallsgröße: Sn- Anzahl der Personen die für Partei stimmen mit Sn= X1+…+Xn 1, Stimme für die Partei wobei Xi = 0, keine Stimme für der Partei mit i= 1,2,3,….., n und Xi- Merkmalsausprägung der i-ten Person Modellannahmen: • • • • • • Diskreter Wahrscheinlichkeitsraum W- Raum ( Ω,F, P) Binomialverteilung B (n,p) n unabhängige Teilexperimente mit konstanter Trefferwahrscheinlichkeit p n - Stichprobenumfang, Anzahl der unabhängigen Teilexperimente p - Trefferwahrscheinlichkeit k - Anzahl der Treffer Aufgabe 3: • Wie groß ist die Wahrscheinlichkeit, dass 41 oder mehr Personen diese Partei wählen wollen, wenn sich der Stimmenanteil nicht verändert hat? Modell: Binomialverteilung • • n= 1000 p=0,03 k –Trefferanzahl ( 41 oder mehr) • P( Sn=k)= • gesucht: • P(Sn≥41)= Problem • P(Sn≥41)= 1- P(Sn<41)= 1- P(Sn≤40) Berechnung mit Taschenrechner nicht möglich aufgrund des sehr großen „n“. Lösungsmöglichkeiten: 1. 2. Excel Approximation der Binomialverteilung zur Normalverteilung mithilfe des ZGWS des Moivre -Laplace 1. Lösung: Excel •Wert in der Tabelle: •P(Sn≥41) = 1- P(Sn<41)= 1- P(Sn≤40) = 1- 0,96977918 ≈ 0,03 Somit P(Sn≥41) ≈ 0,03 2. Lösung: Normalverteilung/ stetige Verteilung • Zentraler Grenzwertsatz von de Moivre- Laplace: Die Zufallsvariable Sn besitze eine Binomialverteilung mit Parametern n und p, wobei 0<p<1 vorausgesetzt ist. Dann gilt für jede Wahl reeller Zahlen a, b mit a<b: a.) P b.) P Faustregel zur Approximation der Binomialverteilung zur Normalverteilung • np(1-p) ≥9 • Test: n=1000; p= 0,03 • 1000*0,03*0,97=29,1 ≥ 9 Folglich Approximation benutzbar Anwendung • P(Sn≥41) = 1- P(Sn<41)= 1- P(Sn≤40) • P(Sn ≤k)= • P(Sn≤40) = • Somit ist P( Sn ≥41)= 1- 0,967843= 0,032. • Es handelt sich somit um eine gute Näherung für die Binomialverteilung. (geringe Abweichung der Werte) ≈ = 0,967843 Aufgabe • • Welche kritischen Zahlen ergeben sich für : = 0,1 und = 0,05 bei H0: p=0,03 und H1: p= 0,06 ? Geben Sie jeweils die Fehlerwahrscheinlichkeiten für einen Fehler 1. Art und 2. Art an. Hypothesentest Hypothesentest • Teste Ho gegen Alternative H1 1. Festlegung des Signifikanzniveaus 2. Berechnung des Verwerfungsbereichs/ kritische Zahlen 3. Entscheidungsregel aufstellen 4. Fehler 1. Art und 2. Art berechnen • Handelt sich um rechtsseitigen Hypothesentest Rechtsseitiger Hypothesentest • Ho: p=0,03 H1: p=0,06 1. = 0,1 und = 0,05 2. P(Sn ≥ k) ≤ P(Sn≥k)= 1- P(Sn≤k-1) ≤ P( Sn≤k-1) ≥ 1- Lösung • = 0,1 P( Sn≤k-1) ≥0,9 P( Sn≤37) ≥0,9 = 0,05 P( Sn≤k-1) ≥ 0,95 P( Sn≤39) ≥0,95 V0= (38, 39, …, 1000) V1= (40, 41, …, 1000) Lösung Stichprobe V Entscheidung für Ho Stichprobe V Entscheidung für H1 Ho richtig Entscheidung richtig Entscheidung falsch Fehler 1. Art H1 richtig Entscheidung falsch Fehler 2. Art Entscheidung richtig Aufgabentext • 41 von 1000 gaben an die Partei wählen zu wollen. 41 41 Nullhypothese Ho wird abgelehnt und H1 wird angenommen. Fehler 1. Art berechnen ( Ho abgelehnt, obwohl richtig) V₀: k=( 38,…, 1000) V₁: k=(40, …, 1000) Fehler 1.Art • • • = 0,1 Excel: P(Sn>37)= 0,0857 N-Verteilung P(Sn>37)= 0,09 Fehler 1. Art ist ca. 8,5%. =0,05 P(Sn>39)=0,043 P(Sn>39)=0,0474 Fehler 1. Art ist ca. 4,3%. Fehler 2.Art • Ho angenommen und H1 abgelehnt, obwohl H1 richtig ist. • Stichprobe 41 eigentlich nicht nötig, da man sich für die Alternative H1 entscheidet und Ho ablehnt. • Annahme: 41 nicht repräsentativ und nehmen ein Stichprobenergebnis von unter 38 an. In diesem Fall lehnen wir die Alternative ab und stützen uns weiter auf die Nullhypothese H0. Somit ist ein Fehler 2. Art möglich, falls H1 richtig ist. Neuer Fall • • • • • Stichprobe ergab 37 Wähler 37 V₀ und V₁ lehnen Alternative ab Fehler 2. Art lässt sich nur bei Kenntnis des richtigen p berechnen Ho:p=0,03 ( Nullhypothese) H1:p=0,06 (Alternative) Annahme: H1 mit p=0,06 ist richtig Mit welcher Wahrscheinlichkeit mache ich Fehler 2. Art, wenn p=0,06 der richtige Wert ist? Lösung • Berechnung des Fehlers 2. Art: n=1000; p (neu)=0,06 = 0,1 • • Normalverteilung P(Sn<38)= 0,001 Fehler 2. Art bei 0,1% =0,05 P(Sn<40)= 0,001 Lösung • Fehler 2. Art bei Annahme p=0,04 richtiger Wert =0,1 • =0,05 Normalverteilung P(X<38)= 0,315 P(X<40)= 0,4403 Fehler 2.Art liegt bei 31,5% Fehler 2. Art liegt bei 44% Gütefunktion • Gütefunktion des Tests gibt die Wahrscheinlichkeit für das Ablehnen der Nullhypothese in Abhängigkeit von p an. G(p)=Pp(V) 0≤p≤1 • Die Operationscharakteristik des Tests gibt den Fehler 2. Art in Abhängigkeit von p an O(p)=Pp(A)=1-G(p) 0≤p≤1 mit A:= Annahmebereich Aufgabe • Für den Einzug ins Parlament sind 5% der Stimmen nötig. Wie ist die Nullhypothese Ho=: p= 0,05 zu bewerten? • • • zweiseitiger Hypothesentest für =0,1 Ho testen gegen Alternative H1: p = 0,05 Berechnung mit Normalverteilung P(Sn ≤k) ≥0,95 bei k= 61 P(Sn ≤k) ≤0,05 bei k= 39 Verwerfungsbereich V=(0,1,…, 39)U( 62,…, 1000) Bei Stichprobe von 41 behalten wir die Nullhypothese bei und lehnen Alternative ab Fehler 2.Art • • • • Für Nullhypothese entschieden, obwohl Alternative richtig ist. Annahme: p= 0,06 p= 0,04 p= 0,03 P(39 ≤Sn≤ 61)= 0,89/ 0,56/ 0,037 Fehler 2. Art beträgt 89%/ 56%/ 3,7% Fehler 2.Art • Fehler 2. Art wird umso kleiner , je weiter der tatsächlich zugrunde liegende Modellparameter von dem Modellparameter unter Ho entfernt liegt sehr unwahrscheinlich, dass wir uns für Ho entscheiden, obwohl p=0,03 gilt große Wahrscheinlichkeit, dass wir uns für Ho entscheiden, obwohl p=0,06 richtig ist 56% Wahrscheinlichkeit, dass wir uns für Ho entscheiden, obwohl p= 0,04 richtig ist Bezug zur 5% Klausel Aufgabe 7.3.3 • Legen Sie in der Kurzfassung eines Stundenentwurfs dar, wie Sie das Testen von Hypothesen im Zusammenhang mit Wahlen in einer 12. Klasse behandeln würden. Der Kurzentwurf soll (mindestens) drei kognitive Ziele beinhalten, die Sie mit der Unterrichtsstunde anstreben. Lehrplan Berlin Sek. II Leistungskurs -Zufallsexperimente -Wahrscheinlichkeitsbegriff -Rechnen mit Wahrscheinlichkeiten -bedingte Wahrscheinlichkeit und Unabhängigkeit -Satz von BAYES -Zufallsgrößen und deren Wahrscheinlichkeitsverteilung -E(X), Var(X) und Standardabweichung -Binomialverteilung (Formel von BERNOULLI, E(X), Var(X) und Standardabweichung) -Normalverteilung als Grenzfall einer Binomialverteilung -zweiseitige Hypothesentests bei Binomialvert. /Normvert. -Signifikanzbegriff, Fehler 1. und 2. Art „Jahrgangsübergreifende Leistungskurse können eingerichtet werden. Für einen Teil der Schülerinnen und Schüler ergibt sich die Reihenfolge MA-3, MA-4, MA-1, MA-2. In diesem Fall ist die Stochastik vollständig im Kurs MA-4“(Rahmenlehrplan Mathematik, Sek II, 1. Auflage 2006, S.43) Vorhaben • Approximation der Binomialverteilung durch die Standardnormalverteilung • Benötigt: Satz von Moivre-Laplace • Grund: sehr großes n (Stichprobenumfang) Vorkenntnisse: • • • • • • Unabhängigkeit Zufallsgrößen und deren Wahrscheinlichkeitsverteilung E(X), Var(X) und Standardabweichung Binomialverteilung (Formel von BERNOULLI, E(X), Var(X) und Standardabweichung) Normalverteilung Standardisierung der Normalverteilung Lernziele: • Die Schüler sollen die Probleme der Anwendbarkeit der Binomialverteilung bei großen Stichprobenumfängen erkennen. • Die Schüler sollen den Satz von Moivre-Laplace verstehen und anwenden können. • Die Schüler sollen prüfen können, ob der Satz von Moivre-Laplace in einer bestimmten Situation anwendbar ist. Stundenentwurf • Leistungskurs, 12. Klasse • Doppelstunde/ zwei Einzelstunden 1. Einführung • • • • einführendes Gespräch über Wahlprognosen (außermathematische Motivation, Brücke zur Lebenswelt) Aufgabe: Eine Partei erreichte bei der letzten Wahl nur 3% der Stimmen. Man vermutet, dass es möglich ist, den Stimmenanteil zu verdoppeln. Bei einer Umfrage gaben von 1000 Wählern 41 an, diese Partei wählen zu wollen. Wie groß ist die Wkt., dass 41 oder mehr Personen diese Partei wählen wollen, wenn sich der Stimmenanteil nicht verändert hat? Frage: Wo tauchen bei dieser Aufgabe Probleme auf? Lasst uns bitte diese gemeinsam besprächen. 15-20 Min. Erwartungen • • X~B(n,p) Parameter: n=1000, p=0,03 Ergebnis: ohne Computer zu aufwendig • Satz von Moivre-Laplace • • frei Recherche zum Satz (PC, Bücher usw.) 20-25 Min. Erwartungen • Satz von Moivre-Laplace: Es sei eine binomialverteilte Zufallsvariable mit den Parametern n und p: 0<p<1, dann gilt . • Verständnis bzw. konkrete Fragen bezüglich der Argumente. • Faustregel: np(1-p) > 9 bzw. Besprechung • • • Besprechung des Satzes in seiner Bedeutung bzw. der Faustregel an der Tafel (möglichst Schülergespräch) kurze wiederholende Besprechung der N(0,1)-Verteilung 10-15 Min. Umsetzung der Aufgabe • • Die Schüler sollen die Aufgabe nun in kleinen Gruppen (2-4 Schüler) rechnen. 10-15 Min. Präsentation • • Vorstellung der Aufgabe von einer der Gruppen 10 Min. Fragen, Diskussion • • Form: Unterrichtsgespräch/Schülergespräch (wenn möglich, sonst geleitetes Unterrichtsgespräch/ Lehrergespräch) 10 Min.