Wahrscheinlichkeitsrechnung

Werbung
Wahrscheinlichkeitsrechnung
Kapitel 7: Diskrete Wahrscheinlichkeiten und ihre Darstellung
Statistik: Zusammenfassung und Darstellung von Daten.
Jedes Zufallsexperiment hat den Stichprobenraum OMEGA. Eine Zufallsvariable X wird
definiert = ordnet jedem Elementarereignis im Stichprobenraum eine Zahl zu. Diese Zahlen
werden durch x1, x2, etc. dargestellt. IR = reelle Zahlen (warum das? Bislang haben wir nur
mit ganzen Zahlen gearbeitet. Bei stetigen Variablen sind reelle Zahlen nötig).
Zufallsvariablen treten mit bestimmten Wahrscheinlichkeiten p(x) auf. Das Gesetz der grossen
Zahlen gibt uns Messungen machen, zählen und aufsummieren. Das Gesetz entspricht
ungefähr der theoretischen Wahrscheinlichkeit dieser diskretenVariable. Die
Wahrscheinlichkeit ist nicht mehr exakt = dies ist der Übergang zwischen Theorie und Praxis.
Abzählbare Werte > Diskrete Zufallsvariable. Diese Werte bewegen sich in Schritten, aber
nicht in unendlich vielen. In einem Experiment wurde X = x13 > „4“. > p(X=x13)=p(4) = die
Wahrscheinlichkeit p dafür das die Variable X den konkreten numerischen Messwert x
annimmt. Dies ist die Punktwahrscheinlichkeit p(X=xi).
Wahrscheinlichkeitsverteilung = p(x) = p(x1): …, p(x2): …, etc. ::: eigentlich total simpel: denke
Kuchen!
Jeder Kuchen ist die Wahrscheinlichkeit des Stichprobenraums OMEGA. Die
Elementarereignisse sind die 5 unterschiedlichen Kuchenstücke, die jeweils auf einen Teller
gelegt werden.
Intervallwahrscheinlichkeiten = mehrere benachbarte Punktwahrscheinlichkeiten
zusammengezählt. Beim Würfelwurf haben wir von den Augenzahlen die relative
Wahrscheinlichkeit abgeschätzt. Ein Ereignis wie „höchstens 2“ wäre p(1)+p(2) =
0,05+0,07=0,12.
P(x<=2)=p(höchstens 2). Gegenwahrscheinlichkeit: p(x>2) = 1-p(x<=2).
p(Augenzahl zwischen 2 und 4): p(2)+p(3)+p(4) = 0,07+0,21+0,08=0,36
Benachbarte Realisationen von Zufallswahrscheinlichkeiten. „Gerade Zahl“ ist keine
Intervallwahrscheinlichkeit. Mit > oder < geschrieben = Intervallwahrscheinlichkeit.
Relative Häufigkeiten : f(x<=2) oder f(x>2).
Absolute Intervallhäufigkeit = h(x<=x2).
Unterschreitungswahrscheinlichkeit: Wahrscheinlichkeit, dass eine Variable höchstens einen
Wert annimmt. <=
Überschreitungswahrscheinlichkeit: >
Zurück zum Würfelwurf.
Unterschreitung: p(x<=x2) = p(x<x3). Konvention: <= wird bevorzugt.
Punktwahrscheinlichkeiten: pi oder p(xi) oder p(X=xi). Wie unterscheiden wir Punkt- und
Intervallwahrscheinlichkeit? P H F = Unterschreitungswahrscheinlichkeit. 1-P =
Überschreitungswahrscheinlichkeit. p h f = Punktwahrscheinlichkeit.
Verteilungsfunktion. Sammlung der Unterschreitungswahrscheinlichkeiten (Würfelwurf):
P(x1) = p(x1)
P(x2) = p(x1)+p(x2), etc.
P(x6) = 1
Absolute Häufigkeit von x = h(x) [theoretisch: gibt’s nicht]
Relative Häufigkeit von x =f(x) =h(x)/n = Häufigkeitsverteilung [theoretisch: p(x) =
Wahrscheinlichkeitsverteilung] Beziehung zwischen beiden: Gesetz der grossen Zahlen
Häufigkeit <> Wahrscheinlichkeit
Verteilung ist deshalb strikt zu trennen. Theoretische Verteilung ist fix und gibt an, was bei
einem Experiment als Ergebnis zu erwarten ist.
P und p werden nicht immer exakt eingehalten. Oft werden F und f verwendet. Ab jetzt : f
und F können sowohl theoretisch als gemessene Häufigkeiten sein.
F für Unterschreitung-, f für Punkt-.
VERANSCHAULICHUNG VON DATEN:
Tabellen
Erste Zeile Überschrift; Spalten: Messwerte, gefolgt von verschiedenen Häufigkeiten
Realisation der Zufallsvariable: Augenzahl des Würfels
Punkthäufigkeiten, Unter- und Überschreitungshäufigkeiten
Punktwahrscheinlichkeiten, Unterschreitungsw., Überschreitungsw.
Verbundwahrscheinlichkeiten = Kreuztabellen=Kontingenztabellen
OMEGA = k1 k2 k3 k4 k5 k6 z1 z2 z3 z4 z5 z6
Kreuztabelle: k und z in den Spaltenkopf, 1 bis 6 in den Zeilenkopf
Hieraus kann man absolute Häufigkeiten bestimmen (einfach zählen). Münze zeigt Kopf =
Summe der Spalte „k“. Würfel zeigt 1 = Summe der Zeile „1“ Die Schnittmenge zeigt „Kopf“
und Würfel = „1“ = Verbundwahrscheinlichkeit. Jede Zelle ist im Prinzip eine Schnittmenge.
Die relativen Häufigkeiten funktionieren genauso. (= Wahrscheinlichkeiten). Summe muss
immer 1 sein. Der Stichprobenraum ist vollständig abgebildet. Ausserdem ist alles auch noch
disjunkt, denn jedes Ergebnis kann nur in einer Zelle stehen.
Die Summen jeder Spalte und jeder Zeile sind jeweils eine Grundwahrscheinlichkeit. Auch
gerne Randwahrscheinlichkeit genannt.
Bedingte Wahrscheinlichkeiten für p(A|B) = p(A  B)/p(B) . Summen von Bedingten
Wahrscheinlichkeiten sind jeweils „1“. Aber nur in einer Richtung, denn die Bedingten
Wahrscheinlichkeiten sind NICHT gleich p(A|B) <> p(B|A). In diesen Kreuztabellen lässt man
üblicherweise die Randwahrscheinlichkeiten weg. Gerne dann aber die
Grundwahrscheinlichkeiten, denn die sind nützlich. Man kann damit ja zurückrechnen.
Der Punkt steht für jedes Teilereignis, das addiert wurde = das Summenzeichen.
Grafiken:
Kreisdiagramm (Torte): Öffnungswinkel = 360°* f(x1) > alle Kreissegmente bilden wieder „1“.
Aufpassen: nicht mit Prozenten, sondern mit Dezimalen zwischen 0 und 1, gell?
Gute Idee: Zahlen reinschreiben. Rein oder mit Legende.
Balken-/Säulendiagramm: Länge der Säulen entspricht der Häufigkeit oder Wahrscheinlichkeit.
Balken sollen immer gleich breit sein. Y-Achse = Wahrscheinlichkeit, X-Achse = Realisationen
Bei einer Verteilungsfunktion wird die inhaltliche Bedeutung betont. Dann kann man auch gut
den Abstand zwischen den Säulen auf Null verkleinern.
Variationen: nur Umrisse der Säulen, kein Füller. Oder nur die Oberseiten bleiben stehen, mit
einem Punt am Anfang > Unterstützt die Idee der Diskretheit.
Wie macht man Verbund-? 3D Säulendiagramm oder verschiedene Farben?
Herunterladen