Stochastik mit dem TI

Werbung
Ursula Schmidt
T3-Tagung Leverkusen 2011
Stochastik mit dem TI-NSpire, v. 2.1
1. Kombinatorische Grundmodelle
n Elemente
n Ziehungen
n! Möglichkeiten
k Ziehungen mit Zurücklegen
und mit Beachtung der
Reihenfolge
nk
k Ziehungen ohne Zurücklegen und mit Beachtung der
Reihenfolge
n . (n-1) . (n-2) . (n-k+1)
=
n!
(n  k)!
k Ziehungen ohne Zurücklegen und ohne Beachtung
der Reihenfolge
n
k
=  
Beispiel
Bei einem Pferderennen
laufen acht Pferde. Wie viele
verschiedene Reihenfolgen
sind für den Zieleinlauf
möglich?
Eingabe auf dem NSpire
! : graue Taste neben dem
G, aus den angezeigten
Symbolen das ! auswählen
Ein Multiple-choice-Test
besteht aus zehn Fragen mit
jeweils drei Antwortmöglichkeiten. Bei jeder Frage
wird eine Antwort angekreuzt.
Wie viele Möglichkeiten des
Ankreuzens gibt es?
Auf der Weihnachtsfeier eines
Gesangsvereins mit 20 Mitgliedern werden drei (acht)
verschiedene Konzertkarten
verlost. Wie viele Möglichkeiten gibt es, die Gewinne zu
verteilen, wenn niemand mehr
als eine Karte bekommen soll?
3 ^ 10
Lotto: 6 aus 49
Wie viele Möglichkeiten gibt
es, ein Feld auf dem
Tippschein auszufüllen?
ncr (49,6)
5 Äpfel werden auf drei
Kinder verteilt. Wie viele
Arten der Verteilung gibt es?
ncr(7,5)
8
20 . 19 . 18
= 20! / 17!
bzw.
20! / 12!
= npr(20,8)
n!
(n  k)! k!
k Ziehungen mit Zurücklegen
und ohne Beachtung der
Reihenfolge
 n  k  1

 k 
=
1
Ursula Schmidt
T3-Tagung Leverkusen 2011
2. Stichproben
Vergleichen Sie die Situationen. Suchen Sie Gemeinsamkeiten und Unterschiede.
Situation 1
Ein kleiner Supermarkt bezieht eine
Lieferung von 20 Energiesparlampen.
Davon sind 5 defekt.
Ein Kunde kauft 3 Energiesparlampen.
Mit welcher Wahrscheinlichkeit sind 2
davon defekt?
Situation 2
Ein großer Baumarkt bezieht eine
Lieferung von 200 Energiesparlampen.
Davon sind 50 defekt.
Zur Überprüfung entnimmt ein Angestellter 3 Energiesparlampen. Mit welcher
Wahrscheinlichkeit sind 2 davon defekt?
Situation 3
Eine Lampenfirma stellt Energiesparlampen her. Davon ist 1/4 Ausschuss.
In der Fertigungskontrolle wird eine
Stichprobe von 3 Energiesparlampen
entnommen. Mit welcher Wahrscheinlichkeit sind 2 davon defekt?
Situation 3b
Eine Lampenfirma stellt Energiesparlampen her. Davon ist 1/4 Ausschuss.
In der Fertigungskontrolle wird eine
Stichprobe von 3 Energiesparlampen
entnommen. Mit welcher Wahrscheinlichkeit sind höchstens (mindestens) 2 davon
defekt?
2
Ursula Schmidt
T3-Tagung Leverkusen 2011
3. Übungsaufgabe: Dart
Zehn Pfeile werden auf eine Zielscheibe geworfen. Gezählt wird, wie viele Pfeile den innersten Kreis
treffen.
Ein Spieler weiß aus Erfahrung, dass er den inneren Kreis mit einer Wahrscheinlichkeit von 35 % trifft.
a) Bestimmen Sie die Wahrscheinlichkeit, dass
er bei 10 Würfen genau 7mal trifft.
b) Untersuchen Sie die Wahrscheinlichkeitsverteilung für dieses Experiment.
c) Untersuchen Sie, wie sich die Wahrscheinlichkeitsverteilung ändert, wenn sich die
Trefferwahrscheinlichkeit ändert.
Lösungshinweise:
Erzeugen Sie eine neue Karte mit Lists &
Spreadsheet.
Geben Sie in Spalte A in der -Zeile den
seq-Befehl ein, um eine Folge von 0 bis
10 zu erzeugen.
Bezeichnen Sie die Spalte mit zwei
Buchstaben, z. B. xk.
Geben Sie in Spalte B in der -Zeile den
Befehl für die Binomialverteilung ein.
Bezeichnen Sie die Spalte z. B. mit pk.
3
Ursula Schmidt
T3-Tagung Leverkusen 2011
Wählen Sie: menu, 3: Daten, 5:
Häufigkeitsplot.
Nehmen Sie die angegebenen
Einstellungen vor.
Sollte das Histogramm nicht so aussehen,
kann man unter menu, Plot-Eigenschaften,
Histogramm-Eigenschaften,
Säuleneinstellungen die Breite 1 und die
Ausrichtung -0.5 wählen.
Fenstereinstellungen verändern über
menu: Fenster/Zoomen, Fensterparameter,
xmin = -2
xmax = 22
ymax =0.5
Danach unter menu: Aktionen den Punkt
4: Schieberegler auswählen
Die Variable mit pp überschreiben.
Mit ctrl+menu die Schiebereglereinstelllungen verändern:
Anfangswert = 0.35
Minimum 0
Maximum 1
In der Tabelle in der Formel in Spalte B
0.35 durch pp ersetzen.
Den Schieberegler greifen und die Verteilung
beobachten.
4
Ursula Schmidt
T3-Tagung Leverkusen 2011
4. Berechnung von Erwartungswert und Varianz
In der Tabelle: menu 4: Statistik, 1:
statistische Berechnungen, 1: Statistik mit
einer Variablen
Anzahl der Listen: 1, ok
für die x1-Liste xk auswählen,
mit tab zur Häufigkeitsliste, dort pk
auswählen
mit tab auf Ergebnisspalte und ggf. den
Spaltennamen ändern
In D2 steht hier der Mittelwert (hier:
Erwartungswert), in D6 die Standardabweichung.
Mittelwert und Standardabweichung
lassen sich mit als eigene Variablen
abspeichern. Dazu D2 auswählen, mit
ctrl c kopieren, in E2 mit ctrl v einfügen,
die Taste var drücken und den
Variablennamen, hier xquer, eingeben.
Entsprechend D6 unter sigma speichern.
Damit kann man dann die Grenzen der
Intervalle für die Sigma-Regeln berechnen
Übungsaufgabe:
Zeichnen Sie das Histogramm einer Binomialverteilung mit den Parametern n = 60 und p = 1/3.
Bestimmen Sie den Erwartungswert und die Standardabweichung einerseits über die „Statistik mit einer
Variablen“ und andererseits mit den Ihnen bekannten Formeln E(X) = np und   npq .
Berechnen Sie damit die Intervalle der Sigma-Regeln und deren Wahrscheinlichkeiten. Vergleichen Sie
mit der folgenden Tabelle.
5
Ursula Schmidt
T3-Tagung Leverkusen 2011
Sigmaregeln
Quelle: Elemente der Mathematik, LK Stochastik, Schroedel 2003
Schluss von der Grundgesamtheit
auf die Stichprobe
[Hier wäre ein Übergang zur Normalverteilung möglich, indem die Binomialverteilung aus der
Übungsaufgabe (und andere) standardisiert wird.
6
Ursula Schmidt
T3-Tagung Leverkusen 2011
4. Simulationen
Zufallszahlen zwischen 0 und 1
RandSeed Zahl setzt die Ausgangsbasis
für den Zufallszahlengenerator
Ganzzahlige Zufallszahlen
z. B. : 10 mal würfeln
randInt(untere Grenze, obere Grenze,
Anzahl der Versuche)
eine Möglichkeit, die Häufigkeiten der
gefallenen 6en zu zählen:
die 6en durch 1en ersetzen, alle anderen
Ergebnisse durch 0
Alle Listenbefehle sind auch in lists & spreadsheet möglich:
Weitere „Random“-Befehle:

randBin(n,p,versuche) erzeugt eine Liste aus reellen Zufallszahlen nach einer Binomialverteilung

randSamp(Liste, Versuche,[zurück]) erzeugt eine Liste (simuliert das Ziehen aus einer Urne; zurück
=1 für „ohne Zurücklegen“)
7
Ursula Schmidt
T3-Tagung Leverkusen 2011
Schluss von der Stichprobe
auf die Grundgesamtheit
Beispiel: Intelligenzquotient – Schätzen eines Mittelwerts (Simulation)
Bei einer Population von 100 Kindern soll der Mittelwert des Intelligenzquotienten geschätzt werden.
Dazu wird aus der Population eine Stichprobe von 20 Kindern gezogen und deren Mittelwert gebildet.
Untersuchen Sie, wie sich die Mittelwerte verteilen, wenn das Ziehen der Stichprobe (sehr oft) wiederholt
wird.
Lösung:
Erzeugen Sie auf einem Rechner ein neues Dokument mit einem Calculator-Blatt. Die
Intelligenzquotienten der Gesamtpopulation werden simuliert durch eine Liste von 100 Zufallszahlen
zwischen 70 und 130. Speichern Sie die Liste unter popiq.
(Die Liste wird absichtlich im Calculator angelegt, weil die Darstellung unübersichtlich ist. Wir müssen
zwar eine Grundgesamtheit erzeugen, sollten aber nicht durch „Hingucken“ die Parameter der Verteilung
erkennen können.)
Legen Sie für die Stichprobe mit 20 Kindern jetzt eine weitere Karte mit Lists & Spreadsheet an.
In Spalte A werden die 20 Kinder (genauer: ihre Intelligenzquotienten) ausgelost, damit keiner doppelt
gezogen wird, bietet sich dieser Befehl an: = randsamp(„Name einer Liste“, 20, 1)
(Der letzte Parameter 1 steht für „ohne Zurücklegen“, wenn man „mit Zurücklegen“ ziehen will, trägt man
0 ein oder lässt ihn weg.)
Nennen Sie die Spalte z. B stpiq („Stichproben-IQ“)
Bilden Sie den Mittelwert (miwe:= mean (stpiq)), hier in B1.
Mit ctrl R (= neu berechnen) kann eine neue Stichprobe gezogen werden.
8
Ursula Schmidt
T3-Tagung Leverkusen 2011
Sammeln Sie die Mittelwerte aller ihrer Stichproben in Spalte :
Ordnen Sie dazu dem Mittelwert in B1 einen Variablennamen zu (s. oben miwe), dann
menu 3: Daten, 2: Datenerfassung, 1: Automatische Datenerfassung, für die Variable miwe eintragen.
Mit jedem ctrl R wird jetzt automatisch der Mittelwert der neuen Stichprobe angefügt.
In Spalte D runden Sie noch die Stichprobenmittelwerte auf ganze Zahlen = round (stpmw, 0).
Einfachere Alternative (ohne automatische Datenerfassung):
Sie arbeiten zu zweit. Auf dem zweiten Rechner legen Sie ein Dokument mit lists & spreadsheet an.
Füllen Sie Spalte A mit den Zahlen 1 bis …. Nummer des Versuchs (stpnr) und tragen Sie in Spalte B die
jeweiligen Stichprobenmittelwerte (stpmw) ein. Führen Sie ca. 50 Versuche durch.
Danach öffnen Sie eine neue Karte mit Data & Statistics und lassen sich die Verteilung z. B. als
Punkteplot zeichnen.
Was beobachten Sie, wenn Sie wirklich 50 Versuche haben?
9
Ursula Schmidt
T3-Tagung Leverkusen 2011
INFOS:

Die Verteilung der arithmetischen Mittel ist annähernd normalverteilt, wenn der Stichprobenumfang
groß genug ist.

Nach vielen Versuchen nähert sich der Erwartungswert der Stichprobenmittelwert-Verteilung dem
Erwartungswert der Population an.

Die Streuung der Stichprobenverteilung heißt Standardfehler.
Wenn die Standardabweichung der Gesamtpopulation bekannt ist, gilt:  MW 
 GesPop
n
, wobei n der
Stichprobenumfang ist. Sonst muss der Standardfehler aus der Standardabweichung der Stichprobe
geschätzt werden:  MW 
 Stp
n 1

Je größer die Anzahl der Stichproben, desto geringer der Standardfehler.

Es gelten die Sigma-Regeln der Normalverteilung, z.B.
ca. 68,3 % der arithmetischen Mittel liegen im Intervall:     MW ;    MW  .
10
Ursula Schmidt
T3-Tagung Leverkusen 2011
Würfel – Wahrscheinlichkeiten schätzen / Konfidenzintervalle
Auftrag: Würfeln Sie 50 mal mit dem Quaderwürfel und zählen Sie, wie viele Fünfen dabei sind.
Auswertung mit der ganzen Gruppe:
Beim Würfeln mit dem Quaderwürfel erhalten wir bei n = ____ Würfen X = _____ Fünfen.
Untersuchen Sie, welche Wahrscheinlichkeiten mit der beobachteten relativen Häufigkeit
h
X
 ....
n
vereinbar sind.
Nach den Sigma-Regeln gehört zu einem Vertrauensintervall zum Konfidenzniveau von 90 % ein Radius
von 1,64  um den Erwartungswert, also
  1, 64  X    1, 64
np  1, 64 npq  X  np  1, 64 npq
Dividiert man durch n folgt:
p  1,64
p(1  p)
p(1  p)
.
 h  p  1,64
n
n
Wir kennen die wirkliche Wahrscheinlichkeit po nicht. Wir können aber zu jedem p zwischen 0 und 1 die
Grenzen des Vertrauensintervalls berechnen.
Legen Sie dazu eine Tabelle an und stellen Sie die Ergebnisse als Streuplots dar (p auf der Rechtsachse,
die Intervallgrenzen auf der Hochachse).
Zeichnen Sie die relative Häufigkeit h als Parallele zur p-Achse ein.
Erklären Sie am Diagramm, welche Wahrscheinlichkeiten mit h vereinbar sind.
Berechnen Sie die „Grenzwahrscheinlichkeiten“.
Sie haben damit das 90 %-Vertrauensintervall gefunden:
__________________________
Übungsaufgabe:
Um die Anzahl der Forellen in einem großen Teich zu schätzen, wurden 200 Forellen gefangen, markiert
und wieder ausgesetzt. Nach einiger Zeit wurden aus dem Teich wieder Fische gefangen. Von 150
Forellen waren 35 markiert.
11
Ursula Schmidt
T3-Tagung Leverkusen 2011
Punktschätzungen - Maximum-Likelihood-Methode
Aufgabe: In einer Lieferung von 100 Taschenrechnern sind drei defekt.
Annahme: Binomialverteilung
100  3
97
P( X  3)  
  p  (1  p)
 3 
Welches p soll man wählen?
Ansatz:
Stehen in einer bestimmten Situation verschiedene wahrscheinlichkeitstheoretische Modelle zur
Konkurrenz, wird das Modell für am „glaubwürdigsten“ gehalten, das bei vorliegenden beobachteten
Daten die größte Wahrscheinlichkeit des Auftretens besitzt.
Die unterschiedlichen Modelle sind hier die verschiedenen Binomialverteilungen zu festen n und k, aber
unterschiedlichen p!
100  3
97
  p  (1  p) definiert, die Likelihoodfunktion
 3 
Für den Parameter k wird eine Funktion Lk 3 ( p)  
zur Beobachtung k = 3.
Zeichnen Sie den Graphen dieser Funktion und bestimmen Sie den Maximalwert.
Zeigen Sie: Werden in n Versuchen k Treffer beobachtet, so ist es am wahrscheinlichsten, dass die
Zufallsvariable X (Anzahl der Treffer) B(n, k/n) verteilt ist.
Es ist aber nicht sicher, also könnte es auch eine andere Wahrscheinlichkeit in der Nähe von k/n sein.
12
Herunterladen