Wahrscheinlichkeitsrechnung Kapitel 7: Diskrete Wahrscheinlichkeiten und ihre Darstellung Statistik: Zusammenfassung und Darstellung von Daten. Jedes Zufallsexperiment hat den Stichprobenraum OMEGA. Eine Zufallsvariable X wird definiert = ordnet jedem Elementarereignis im Stichprobenraum eine Zahl zu. Diese Zahlen werden durch x1, x2, etc. dargestellt. IR = reelle Zahlen (warum das? Bislang haben wir nur mit ganzen Zahlen gearbeitet. Bei stetigen Variablen sind reelle Zahlen nötig). Zufallsvariablen treten mit bestimmten Wahrscheinlichkeiten p(x) auf. Das Gesetz der grossen Zahlen gibt uns Messungen machen, zählen und aufsummieren. Das Gesetz entspricht ungefähr der theoretischen Wahrscheinlichkeit dieser diskretenVariable. Die Wahrscheinlichkeit ist nicht mehr exakt = dies ist der Übergang zwischen Theorie und Praxis. Abzählbare Werte > Diskrete Zufallsvariable. Diese Werte bewegen sich in Schritten, aber nicht in unendlich vielen. In einem Experiment wurde X = x13 > „4“. > p(X=x13)=p(4) = die Wahrscheinlichkeit p dafür das die Variable X den konkreten numerischen Messwert x annimmt. Dies ist die Punktwahrscheinlichkeit p(X=xi). Wahrscheinlichkeitsverteilung = p(x) = p(x1): …, p(x2): …, etc. ::: eigentlich total simpel: denke Kuchen! Jeder Kuchen ist die Wahrscheinlichkeit des Stichprobenraums OMEGA. Die Elementarereignisse sind die 5 unterschiedlichen Kuchenstücke, die jeweils auf einen Teller gelegt werden. Intervallwahrscheinlichkeiten = mehrere benachbarte Punktwahrscheinlichkeiten zusammengezählt. Beim Würfelwurf haben wir von den Augenzahlen die relative Wahrscheinlichkeit abgeschätzt. Ein Ereignis wie „höchstens 2“ wäre p(1)+p(2) = 0,05+0,07=0,12. P(x<=2)=p(höchstens 2). Gegenwahrscheinlichkeit: p(x>2) = 1-p(x<=2). p(Augenzahl zwischen 2 und 4): p(2)+p(3)+p(4) = 0,07+0,21+0,08=0,36 Benachbarte Realisationen von Zufallswahrscheinlichkeiten. „Gerade Zahl“ ist keine Intervallwahrscheinlichkeit. Mit > oder < geschrieben = Intervallwahrscheinlichkeit. Relative Häufigkeiten : f(x<=2) oder f(x>2). Absolute Intervallhäufigkeit = h(x<=x2). Unterschreitungswahrscheinlichkeit: Wahrscheinlichkeit, dass eine Variable höchstens einen Wert annimmt. <= Überschreitungswahrscheinlichkeit: > Zurück zum Würfelwurf. Unterschreitung: p(x<=x2) = p(x<x3). Konvention: <= wird bevorzugt. Punktwahrscheinlichkeiten: pi oder p(xi) oder p(X=xi). Wie unterscheiden wir Punkt- und Intervallwahrscheinlichkeit? P H F = Unterschreitungswahrscheinlichkeit. 1-P = Überschreitungswahrscheinlichkeit. p h f = Punktwahrscheinlichkeit. Verteilungsfunktion. Sammlung der Unterschreitungswahrscheinlichkeiten (Würfelwurf): P(x1) = p(x1) P(x2) = p(x1)+p(x2), etc. P(x6) = 1 Absolute Häufigkeit von x = h(x) [theoretisch: gibt’s nicht] Relative Häufigkeit von x =f(x) =h(x)/n = Häufigkeitsverteilung [theoretisch: p(x) = Wahrscheinlichkeitsverteilung] Beziehung zwischen beiden: Gesetz der grossen Zahlen Häufigkeit <> Wahrscheinlichkeit Verteilung ist deshalb strikt zu trennen. Theoretische Verteilung ist fix und gibt an, was bei einem Experiment als Ergebnis zu erwarten ist. P und p werden nicht immer exakt eingehalten. Oft werden F und f verwendet. Ab jetzt : f und F können sowohl theoretisch als gemessene Häufigkeiten sein. F für Unterschreitung-, f für Punkt-. VERANSCHAULICHUNG VON DATEN: Tabellen Erste Zeile Überschrift; Spalten: Messwerte, gefolgt von verschiedenen Häufigkeiten Realisation der Zufallsvariable: Augenzahl des Würfels Punkthäufigkeiten, Unter- und Überschreitungshäufigkeiten Punktwahrscheinlichkeiten, Unterschreitungsw., Überschreitungsw. Verbundwahrscheinlichkeiten = Kreuztabellen=Kontingenztabellen OMEGA = k1 k2 k3 k4 k5 k6 z1 z2 z3 z4 z5 z6 Kreuztabelle: k und z in den Spaltenkopf, 1 bis 6 in den Zeilenkopf Hieraus kann man absolute Häufigkeiten bestimmen (einfach zählen). Münze zeigt Kopf = Summe der Spalte „k“. Würfel zeigt 1 = Summe der Zeile „1“ Die Schnittmenge zeigt „Kopf“ und Würfel = „1“ = Verbundwahrscheinlichkeit. Jede Zelle ist im Prinzip eine Schnittmenge. Die relativen Häufigkeiten funktionieren genauso. (= Wahrscheinlichkeiten). Summe muss immer 1 sein. Der Stichprobenraum ist vollständig abgebildet. Ausserdem ist alles auch noch disjunkt, denn jedes Ergebnis kann nur in einer Zelle stehen. Die Summen jeder Spalte und jeder Zeile sind jeweils eine Grundwahrscheinlichkeit. Auch gerne Randwahrscheinlichkeit genannt. Bedingte Wahrscheinlichkeiten für p(A|B) = p(A B)/p(B) . Summen von Bedingten Wahrscheinlichkeiten sind jeweils „1“. Aber nur in einer Richtung, denn die Bedingten Wahrscheinlichkeiten sind NICHT gleich p(A|B) <> p(B|A). In diesen Kreuztabellen lässt man üblicherweise die Randwahrscheinlichkeiten weg. Gerne dann aber die Grundwahrscheinlichkeiten, denn die sind nützlich. Man kann damit ja zurückrechnen. Der Punkt steht für jedes Teilereignis, das addiert wurde = das Summenzeichen. Grafiken: Kreisdiagramm (Torte): Öffnungswinkel = 360°* f(x1) > alle Kreissegmente bilden wieder „1“. Aufpassen: nicht mit Prozenten, sondern mit Dezimalen zwischen 0 und 1, gell? Gute Idee: Zahlen reinschreiben. Rein oder mit Legende. Balken-/Säulendiagramm: Länge der Säulen entspricht der Häufigkeit oder Wahrscheinlichkeit. Balken sollen immer gleich breit sein. Y-Achse = Wahrscheinlichkeit, X-Achse = Realisationen Bei einer Verteilungsfunktion wird die inhaltliche Bedeutung betont. Dann kann man auch gut den Abstand zwischen den Säulen auf Null verkleinern. Variationen: nur Umrisse der Säulen, kein Füller. Oder nur die Oberseiten bleiben stehen, mit einem Punt am Anfang > Unterstützt die Idee der Diskretheit. Wie macht man Verbund-? 3D Säulendiagramm oder verschiedene Farben?