Ursula Schmidt T3-Tagung Leverkusen 2011 Stochastik mit dem TI-NSpire, v. 2.1 1. Kombinatorische Grundmodelle n Elemente n Ziehungen n! Möglichkeiten k Ziehungen mit Zurücklegen und mit Beachtung der Reihenfolge nk k Ziehungen ohne Zurücklegen und mit Beachtung der Reihenfolge n . (n-1) . (n-2) . (n-k+1) = n! (n k)! k Ziehungen ohne Zurücklegen und ohne Beachtung der Reihenfolge n k = Beispiel Bei einem Pferderennen laufen acht Pferde. Wie viele verschiedene Reihenfolgen sind für den Zieleinlauf möglich? Eingabe auf dem NSpire ! : graue Taste neben dem G, aus den angezeigten Symbolen das ! auswählen Ein Multiple-choice-Test besteht aus zehn Fragen mit jeweils drei Antwortmöglichkeiten. Bei jeder Frage wird eine Antwort angekreuzt. Wie viele Möglichkeiten des Ankreuzens gibt es? Auf der Weihnachtsfeier eines Gesangsvereins mit 20 Mitgliedern werden drei (acht) verschiedene Konzertkarten verlost. Wie viele Möglichkeiten gibt es, die Gewinne zu verteilen, wenn niemand mehr als eine Karte bekommen soll? 3 ^ 10 Lotto: 6 aus 49 Wie viele Möglichkeiten gibt es, ein Feld auf dem Tippschein auszufüllen? ncr (49,6) 5 Äpfel werden auf drei Kinder verteilt. Wie viele Arten der Verteilung gibt es? ncr(7,5) 8 20 . 19 . 18 = 20! / 17! bzw. 20! / 12! = npr(20,8) n! (n k)! k! k Ziehungen mit Zurücklegen und ohne Beachtung der Reihenfolge n k 1 k = 1 Ursula Schmidt T3-Tagung Leverkusen 2011 2. Stichproben Vergleichen Sie die Situationen. Suchen Sie Gemeinsamkeiten und Unterschiede. Situation 1 Ein kleiner Supermarkt bezieht eine Lieferung von 20 Energiesparlampen. Davon sind 5 defekt. Ein Kunde kauft 3 Energiesparlampen. Mit welcher Wahrscheinlichkeit sind 2 davon defekt? Situation 2 Ein großer Baumarkt bezieht eine Lieferung von 200 Energiesparlampen. Davon sind 50 defekt. Zur Überprüfung entnimmt ein Angestellter 3 Energiesparlampen. Mit welcher Wahrscheinlichkeit sind 2 davon defekt? Situation 3 Eine Lampenfirma stellt Energiesparlampen her. Davon ist 1/4 Ausschuss. In der Fertigungskontrolle wird eine Stichprobe von 3 Energiesparlampen entnommen. Mit welcher Wahrscheinlichkeit sind 2 davon defekt? Situation 3b Eine Lampenfirma stellt Energiesparlampen her. Davon ist 1/4 Ausschuss. In der Fertigungskontrolle wird eine Stichprobe von 3 Energiesparlampen entnommen. Mit welcher Wahrscheinlichkeit sind höchstens (mindestens) 2 davon defekt? 2 Ursula Schmidt T3-Tagung Leverkusen 2011 3. Übungsaufgabe: Dart Zehn Pfeile werden auf eine Zielscheibe geworfen. Gezählt wird, wie viele Pfeile den innersten Kreis treffen. Ein Spieler weiß aus Erfahrung, dass er den inneren Kreis mit einer Wahrscheinlichkeit von 35 % trifft. a) Bestimmen Sie die Wahrscheinlichkeit, dass er bei 10 Würfen genau 7mal trifft. b) Untersuchen Sie die Wahrscheinlichkeitsverteilung für dieses Experiment. c) Untersuchen Sie, wie sich die Wahrscheinlichkeitsverteilung ändert, wenn sich die Trefferwahrscheinlichkeit ändert. Lösungshinweise: Erzeugen Sie eine neue Karte mit Lists & Spreadsheet. Geben Sie in Spalte A in der -Zeile den seq-Befehl ein, um eine Folge von 0 bis 10 zu erzeugen. Bezeichnen Sie die Spalte mit zwei Buchstaben, z. B. xk. Geben Sie in Spalte B in der -Zeile den Befehl für die Binomialverteilung ein. Bezeichnen Sie die Spalte z. B. mit pk. 3 Ursula Schmidt T3-Tagung Leverkusen 2011 Wählen Sie: menu, 3: Daten, 5: Häufigkeitsplot. Nehmen Sie die angegebenen Einstellungen vor. Sollte das Histogramm nicht so aussehen, kann man unter menu, Plot-Eigenschaften, Histogramm-Eigenschaften, Säuleneinstellungen die Breite 1 und die Ausrichtung -0.5 wählen. Fenstereinstellungen verändern über menu: Fenster/Zoomen, Fensterparameter, xmin = -2 xmax = 22 ymax =0.5 Danach unter menu: Aktionen den Punkt 4: Schieberegler auswählen Die Variable mit pp überschreiben. Mit ctrl+menu die Schiebereglereinstelllungen verändern: Anfangswert = 0.35 Minimum 0 Maximum 1 In der Tabelle in der Formel in Spalte B 0.35 durch pp ersetzen. Den Schieberegler greifen und die Verteilung beobachten. 4 Ursula Schmidt T3-Tagung Leverkusen 2011 4. Berechnung von Erwartungswert und Varianz In der Tabelle: menu 4: Statistik, 1: statistische Berechnungen, 1: Statistik mit einer Variablen Anzahl der Listen: 1, ok für die x1-Liste xk auswählen, mit tab zur Häufigkeitsliste, dort pk auswählen mit tab auf Ergebnisspalte und ggf. den Spaltennamen ändern In D2 steht hier der Mittelwert (hier: Erwartungswert), in D6 die Standardabweichung. Mittelwert und Standardabweichung lassen sich mit als eigene Variablen abspeichern. Dazu D2 auswählen, mit ctrl c kopieren, in E2 mit ctrl v einfügen, die Taste var drücken und den Variablennamen, hier xquer, eingeben. Entsprechend D6 unter sigma speichern. Damit kann man dann die Grenzen der Intervalle für die Sigma-Regeln berechnen Übungsaufgabe: Zeichnen Sie das Histogramm einer Binomialverteilung mit den Parametern n = 60 und p = 1/3. Bestimmen Sie den Erwartungswert und die Standardabweichung einerseits über die „Statistik mit einer Variablen“ und andererseits mit den Ihnen bekannten Formeln E(X) = np und npq . Berechnen Sie damit die Intervalle der Sigma-Regeln und deren Wahrscheinlichkeiten. Vergleichen Sie mit der folgenden Tabelle. 5 Ursula Schmidt T3-Tagung Leverkusen 2011 Sigmaregeln Quelle: Elemente der Mathematik, LK Stochastik, Schroedel 2003 Schluss von der Grundgesamtheit auf die Stichprobe [Hier wäre ein Übergang zur Normalverteilung möglich, indem die Binomialverteilung aus der Übungsaufgabe (und andere) standardisiert wird. 6 Ursula Schmidt T3-Tagung Leverkusen 2011 4. Simulationen Zufallszahlen zwischen 0 und 1 RandSeed Zahl setzt die Ausgangsbasis für den Zufallszahlengenerator Ganzzahlige Zufallszahlen z. B. : 10 mal würfeln randInt(untere Grenze, obere Grenze, Anzahl der Versuche) eine Möglichkeit, die Häufigkeiten der gefallenen 6en zu zählen: die 6en durch 1en ersetzen, alle anderen Ergebnisse durch 0 Alle Listenbefehle sind auch in lists & spreadsheet möglich: Weitere „Random“-Befehle: randBin(n,p,versuche) erzeugt eine Liste aus reellen Zufallszahlen nach einer Binomialverteilung randSamp(Liste, Versuche,[zurück]) erzeugt eine Liste (simuliert das Ziehen aus einer Urne; zurück =1 für „ohne Zurücklegen“) 7 Ursula Schmidt T3-Tagung Leverkusen 2011 Schluss von der Stichprobe auf die Grundgesamtheit Beispiel: Intelligenzquotient – Schätzen eines Mittelwerts (Simulation) Bei einer Population von 100 Kindern soll der Mittelwert des Intelligenzquotienten geschätzt werden. Dazu wird aus der Population eine Stichprobe von 20 Kindern gezogen und deren Mittelwert gebildet. Untersuchen Sie, wie sich die Mittelwerte verteilen, wenn das Ziehen der Stichprobe (sehr oft) wiederholt wird. Lösung: Erzeugen Sie auf einem Rechner ein neues Dokument mit einem Calculator-Blatt. Die Intelligenzquotienten der Gesamtpopulation werden simuliert durch eine Liste von 100 Zufallszahlen zwischen 70 und 130. Speichern Sie die Liste unter popiq. (Die Liste wird absichtlich im Calculator angelegt, weil die Darstellung unübersichtlich ist. Wir müssen zwar eine Grundgesamtheit erzeugen, sollten aber nicht durch „Hingucken“ die Parameter der Verteilung erkennen können.) Legen Sie für die Stichprobe mit 20 Kindern jetzt eine weitere Karte mit Lists & Spreadsheet an. In Spalte A werden die 20 Kinder (genauer: ihre Intelligenzquotienten) ausgelost, damit keiner doppelt gezogen wird, bietet sich dieser Befehl an: = randsamp(„Name einer Liste“, 20, 1) (Der letzte Parameter 1 steht für „ohne Zurücklegen“, wenn man „mit Zurücklegen“ ziehen will, trägt man 0 ein oder lässt ihn weg.) Nennen Sie die Spalte z. B stpiq („Stichproben-IQ“) Bilden Sie den Mittelwert (miwe:= mean (stpiq)), hier in B1. Mit ctrl R (= neu berechnen) kann eine neue Stichprobe gezogen werden. 8 Ursula Schmidt T3-Tagung Leverkusen 2011 Sammeln Sie die Mittelwerte aller ihrer Stichproben in Spalte : Ordnen Sie dazu dem Mittelwert in B1 einen Variablennamen zu (s. oben miwe), dann menu 3: Daten, 2: Datenerfassung, 1: Automatische Datenerfassung, für die Variable miwe eintragen. Mit jedem ctrl R wird jetzt automatisch der Mittelwert der neuen Stichprobe angefügt. In Spalte D runden Sie noch die Stichprobenmittelwerte auf ganze Zahlen = round (stpmw, 0). Einfachere Alternative (ohne automatische Datenerfassung): Sie arbeiten zu zweit. Auf dem zweiten Rechner legen Sie ein Dokument mit lists & spreadsheet an. Füllen Sie Spalte A mit den Zahlen 1 bis …. Nummer des Versuchs (stpnr) und tragen Sie in Spalte B die jeweiligen Stichprobenmittelwerte (stpmw) ein. Führen Sie ca. 50 Versuche durch. Danach öffnen Sie eine neue Karte mit Data & Statistics und lassen sich die Verteilung z. B. als Punkteplot zeichnen. Was beobachten Sie, wenn Sie wirklich 50 Versuche haben? 9 Ursula Schmidt T3-Tagung Leverkusen 2011 INFOS: Die Verteilung der arithmetischen Mittel ist annähernd normalverteilt, wenn der Stichprobenumfang groß genug ist. Nach vielen Versuchen nähert sich der Erwartungswert der Stichprobenmittelwert-Verteilung dem Erwartungswert der Population an. Die Streuung der Stichprobenverteilung heißt Standardfehler. Wenn die Standardabweichung der Gesamtpopulation bekannt ist, gilt: MW GesPop n , wobei n der Stichprobenumfang ist. Sonst muss der Standardfehler aus der Standardabweichung der Stichprobe geschätzt werden: MW Stp n 1 Je größer die Anzahl der Stichproben, desto geringer der Standardfehler. Es gelten die Sigma-Regeln der Normalverteilung, z.B. ca. 68,3 % der arithmetischen Mittel liegen im Intervall: MW ; MW . 10 Ursula Schmidt T3-Tagung Leverkusen 2011 Würfel – Wahrscheinlichkeiten schätzen / Konfidenzintervalle Auftrag: Würfeln Sie 50 mal mit dem Quaderwürfel und zählen Sie, wie viele Fünfen dabei sind. Auswertung mit der ganzen Gruppe: Beim Würfeln mit dem Quaderwürfel erhalten wir bei n = ____ Würfen X = _____ Fünfen. Untersuchen Sie, welche Wahrscheinlichkeiten mit der beobachteten relativen Häufigkeit h X .... n vereinbar sind. Nach den Sigma-Regeln gehört zu einem Vertrauensintervall zum Konfidenzniveau von 90 % ein Radius von 1,64 um den Erwartungswert, also 1, 64 X 1, 64 np 1, 64 npq X np 1, 64 npq Dividiert man durch n folgt: p 1,64 p(1 p) p(1 p) . h p 1,64 n n Wir kennen die wirkliche Wahrscheinlichkeit po nicht. Wir können aber zu jedem p zwischen 0 und 1 die Grenzen des Vertrauensintervalls berechnen. Legen Sie dazu eine Tabelle an und stellen Sie die Ergebnisse als Streuplots dar (p auf der Rechtsachse, die Intervallgrenzen auf der Hochachse). Zeichnen Sie die relative Häufigkeit h als Parallele zur p-Achse ein. Erklären Sie am Diagramm, welche Wahrscheinlichkeiten mit h vereinbar sind. Berechnen Sie die „Grenzwahrscheinlichkeiten“. Sie haben damit das 90 %-Vertrauensintervall gefunden: __________________________ Übungsaufgabe: Um die Anzahl der Forellen in einem großen Teich zu schätzen, wurden 200 Forellen gefangen, markiert und wieder ausgesetzt. Nach einiger Zeit wurden aus dem Teich wieder Fische gefangen. Von 150 Forellen waren 35 markiert. 11 Ursula Schmidt T3-Tagung Leverkusen 2011 Punktschätzungen - Maximum-Likelihood-Methode Aufgabe: In einer Lieferung von 100 Taschenrechnern sind drei defekt. Annahme: Binomialverteilung 100 3 97 P( X 3) p (1 p) 3 Welches p soll man wählen? Ansatz: Stehen in einer bestimmten Situation verschiedene wahrscheinlichkeitstheoretische Modelle zur Konkurrenz, wird das Modell für am „glaubwürdigsten“ gehalten, das bei vorliegenden beobachteten Daten die größte Wahrscheinlichkeit des Auftretens besitzt. Die unterschiedlichen Modelle sind hier die verschiedenen Binomialverteilungen zu festen n und k, aber unterschiedlichen p! 100 3 97 p (1 p) definiert, die Likelihoodfunktion 3 Für den Parameter k wird eine Funktion Lk 3 ( p) zur Beobachtung k = 3. Zeichnen Sie den Graphen dieser Funktion und bestimmen Sie den Maximalwert. Zeigen Sie: Werden in n Versuchen k Treffer beobachtet, so ist es am wahrscheinlichsten, dass die Zufallsvariable X (Anzahl der Treffer) B(n, k/n) verteilt ist. Es ist aber nicht sicher, also könnte es auch eine andere Wahrscheinlichkeit in der Nähe von k/n sein. 12