Einführung in die Wahrscheinlichkeitsrechnung Sven Garbade Fakultät für Angewandte Psychologie SRH Hochschule Heidelberg [email protected] Statistik 1 S. Garbade (SRH Heidelberg) Wahrscheinlichkeitsrechnung Statistik 1 1 / 38 Agenda Wahrscheinlichkeit Theoreme der Wahrscheinlichkeitsrechnung Permutationen und Kombinationen Binomialverteilung S. Garbade (SRH Heidelberg) Wahrscheinlichkeitsrechnung Statistik 1 2 / 38 Wahrscheinlichkeit Wahrscheinlichkeit Wahrscheinlichkeit Definition Relative Häufigkeiten Bedingte Wahrscheinlichkeit Eigenschaften der Wahrscheinlichkeit Einteilung S. Garbade (SRH Heidelberg) Wahrscheinlichkeitsrechnung Statistik 1 3 / 38 Wahrscheinlichkeit Definition Definition Wahrscheinlichkeit Wahrscheinlichkeiten (engl.: probability) ergeben sich aus dem Verhältnis günstiger Ereignisse zu möglichen Ereignissen: p= günstige Ereignisse mögliche Ereignisse (1) wobei günstig auch negative Ereignisse sein können, z. B. Patient stirbt, man besteht die Prüfung nicht, erkrankt etc. S. Garbade (SRH Heidelberg) Wahrscheinlichkeitsrechnung Statistik 1 4 / 38 Wahrscheinlichkeit Relative Häufigkeiten Relative Häufigkeiten Eine Wahrscheinlichkeit wird über die relative Häufigkeit geschätzt: p(A) = nA n Beispiel Bei Wurf eines Würfels können folgende mögliche Ereignisse auftreten: Ω = {1, 2, 3, 4, 5, 6}, also n = 6. Die Wahrscheinlichkeit eine 2 zu würfeln ist damit p(2) = 1/6. Ω wird auch der Ereignisraum genannt. S. Garbade (SRH Heidelberg) Wahrscheinlichkeitsrechnung Statistik 1 5 / 38 Wahrscheinlichkeit Bedingte Wahrscheinlichkeit Bedingte Wahrscheinlichkeit Wenn das Auftreten eines günstigen Ereignisses an Bedingungen geknüpft ist, beispielsweise der Besitz eines Autos (günstiges Ereignis) unter der Bedingung, auf dem Land zu wohnen, spricht man von bedingter Wahrscheinlichkeit. Definition Die bedingte Wahrscheinlichkeit p(A|B) (sprich A unter der Bedingung B) kennzeichnet die Wahrscheinlichkeit des Ereignisses A unter der Bedingung B. S. Garbade (SRH Heidelberg) Wahrscheinlichkeitsrechnung Statistik 1 6 / 38 Wahrscheinlichkeit Eigenschaften der Wahrscheinlichkeit Eigenschaften der Wahrscheinlichkeit • Liegt immer zwischen 0 und 1. • Kann als Prozent ausgedrückt werden, wenn Multiplikation mit 100 erfolgt: → 0% bis 100%. • 0.05 ≡ 5%. • Die Gegenwahrscheinlichkeit zu einem Ereignis A ist p(Ā). Dabei gilt p(A) + p(Ā) = 1. Beispiel: Wenn es morgen mit 30% Wahrscheinlichkeit regnet, regnet es mit einer Wahrscheinlichkeit von 70% nicht. S. Garbade (SRH Heidelberg) Wahrscheinlichkeitsrechnung Statistik 1 7 / 38 Wahrscheinlichkeit Einteilung Einteilung 0 - 0.1 0.1 - 0.3 0.3 - 0.7 0.7 - 1 S. Garbade (SRH Heidelberg) unbedeutende Wahrscheinlichkeit geringe Wahrscheinlichkeit mittlere Wahrscheinlichkeit hohe Wahrscheinlichkeit Wahrscheinlichkeitsrechnung Statistik 1 8 / 38 Theoreme der Wahrscheinlichkeitsrechnung Theoreme der Wahrscheinlichkeitsrechnung Theoreme der Wahrscheinlichkeitsrechnung Additionstheorem Multiplikationstheorem Sicheres & und unmögliches Ereignis Stochastische Abhängigkeit S. Garbade (SRH Heidelberg) Wahrscheinlichkeitsrechnung Statistik 1 9 / 38 Theoreme der Wahrscheinlichkeitsrechnung Additionstheorem Additionstheorem für unabhängige Ereignisse Wie wahrscheinlich ist es, mit einem Würfel bei einem Versuch eine 1 oder eine 2 zu würfeln? Mögliche Ereignisse: Sechs, nämlich die Zahlen 1 bis 6 Günstige Ereignisse: Zwei, nämlich die Zahlen 1 oder 2 p(1 ∪ 2) = 1/6 + 1/6 = 2/6 = 1/3 wobei ∪ die Vereinigung bedeuted. Additionstheorem für unabhängige Ereignisse Sind günstige disjunkte Ereignisse durch ein ODER verknüpft, werden die Einzelwahrscheinlichkeiten addiert: p(A ∪ B) = p(A) + p(B) (2) . S. Garbade (SRH Heidelberg) Wahrscheinlichkeitsrechnung Statistik 1 10 / 38 Theoreme der Wahrscheinlichkeitsrechnung Additionstheorem Additionstheorem • Wie wahrscheinlich ist es, eine gerade Augenzahl oder eine 1,2 oder 3 zu würfeln? • 5/6, da die Zahl 5 die einzige Zahl ist, die nach obiger Definition nicht abgedeckt ist. • Da die Zahl 2 nach obiger Definition doppelt vorkommt, muss die Wahrscheinlichkeit eine 2 zu würfeln, bei der Berechnung vermindert werden. S. Garbade (SRH Heidelberg) Wahrscheinlichkeitsrechnung Statistik 1 11 / 38 Theoreme der Wahrscheinlichkeitsrechnung Additionstheorem Allgemeine Form des Additionstheorems Additionstheorem Die Wahrscheinlichkeit, dass wenigstens eins der Ereignisse A, B, C , D, · · · eintrifft, ergibt sich aus der Summe der Wahrscheinlichkeiten p(A) und p(B) abzüglich der Wahrscheinlichkeit, dass A und B gemeinsam auftreten: p(A ∪ B) = p(A) + p(B) − p(A ∩ B) p(gerade ∪ {1, 2, 3}) = S. Garbade (SRH Heidelberg) 3 6 + Wahrscheinlichkeitsrechnung 3 6 − 1 6 = (3) 5 6 Statistik 1 12 / 38 Theoreme der Wahrscheinlichkeitsrechnung Multiplikationstheorem Multiplikationstheorem für unabhängige Ereignisse Wie hoch ist die Wahrscheinlichkeit, beim ersten Versuch eine 1 und beim zweiten Versuch eine 2 zu würfeln? Multiplikationstheorem für unabhängige Ereignisse Sind günstige disjunkte Ereignisse durch ein UND verknüpft, werden die Einzelwahrscheinlichkeiten multipliziert: p(A ∩ B) = p(A) · p(B) (4) Angewendet auf das Beispiel: p(1.1 ∩ 2.2) = p(1.1) · p(2.2) = 1 1 1 · = 6 6 36 wobei ∩ das logische Produkt ist. Die Bedeutung ist sowohl als auch und entspricht dem Durchschnitt. S. Garbade (SRH Heidelberg) Wahrscheinlichkeitsrechnung Statistik 1 13 / 38 Theoreme der Wahrscheinlichkeitsrechnung Sicheres & und unmögliches Ereignis Sicheres & und unmögliches Ereignis • Ein sicheres Ereignis tritt immmer ein, z. B. fällt beim Würfeln immer eine Zahl zwischen 1 und 6. • Ein unmögliches Ereignis kann nicht eintreten, z. B. kann man mit einem normalen Würfel keine 7 würfeln. Sicheres & und unmögliches Ereignis Die Wahrscheinlichkeit für ein sicheres und für das unmögliche Erreignis beträgt p(Ω) = 1; p(∅) = 0 S. Garbade (SRH Heidelberg) Wahrscheinlichkeitsrechnung Statistik 1 14 / 38 Theoreme der Wahrscheinlichkeitsrechnung Stochastische Abhängigkeit Schätzung von Häufigkeiten mit Stern ohne Stern Σ rot grün blau 120 90 90 Σ 200 100 300 Wie groß ist die Wahrscheinlichkeit dafür, einen grünen Ball ohne Stern zu ziehen? Mögliche Ereignisse: 300 Günstige Ereignisse: ? Schätzung über die Randwahrscheinlichkeiten und Multiplikationstheorem: 90 100 p(grün ∩ ohne Stern) = · 300 300 9 9 1 · = = 30 3 90 1 = 10 S. Garbade (SRH Heidelberg) Wahrscheinlichkeitsrechnung Statistik 1 15 / 38 Theoreme der Wahrscheinlichkeitsrechnung Stochastische Abhängigkeit Erwartete Häufigkeiten • Die Wahrscheinlichkeit p(grün ∩ ohne Stern) beträgt 0.1 bzw. 10%. Damit sind 30 vom 300 Bällen wahrscheinlich grün und ohne Stern. • Unter Berücksichtigung der Randsummen ergeben sich damit folgende erwartete Häufigkeiten: rot mit Stern 80 ohne Stern 40 Σ 120 z. B. Anzahl rot ∩ ohne Stern = S. Garbade (SRH Heidelberg) grün 60 30 90 120 300 · 100 300 Wahrscheinlichkeitsrechnung blau 60 30 90 Σ 200 100 300 · 300 = 40 Statistik 1 16 / 38 Theoreme der Wahrscheinlichkeitsrechnung Stochastische Abhängigkeit Beobachtete vs. erwartete Häufigkeit • Die erwarteten Häufigkeiten sind: mit Stern ohne Stern Σ rot 80 40 120 grün 60 30 90 blau 60 30 90 Σ 200 100 300 • Diese müssen nicht mit den beobachteten Häufigkeiten übereinstimmen, z. B.: mit Stern ohne Stern Σ S. Garbade (SRH Heidelberg) rot 70 50 120 grün 80 10 90 Wahrscheinlichkeitsrechnung blau 50 40 90 Σ 200 100 300 Statistik 1 17 / 38 Theoreme der Wahrscheinlichkeitsrechnung Stochastische Abhängigkeit Stochastische Unabhängigkeit Stochastische Unabhängigkeit Entspricht die erwartete Verteilung der beobachteten Verteilung, spricht man von stochastischer Unabhängigkeit. Entspricht die erwartete Verteilung nicht der beobachteten, spricht man von stochastischer Abhängigkeit. Mathematisch ist die erwartete Häufigkeit das Produkt der jeweiligen Einzelwahrscheinlichkeiten der Ereignisse. • Später werden wir Verfahren kennen lernen, die eine erwartete Häufigkeitsverteilung mit einer beobachteten vergleichen. • Eine Möglichkeit besteht z. B. in χ2 -Verfahren. S. Garbade (SRH Heidelberg) Wahrscheinlichkeitsrechnung Statistik 1 18 / 38 Permutationen und Kombinationen Permutationen und Kombinationen Permutationen und Kombinationen Permutationsregel Kombinationsregeln S. Garbade (SRH Heidelberg) Wahrscheinlichkeitsrechnung Statistik 1 19 / 38 Permutationen und Kombinationen Permutationsregel Permutationsregel Auf wieviele Arten können 4 Items eines Fragebogens angeordnet werden? • I1, I2, I3, I4 • I2, I1, I3, I4 • ... Permutationsregel n verschiedene Objekte können in n! = 1 · . . . · (n − 1) · n verschiedenen Abfolgen angeordnet werden. n! bedeutet dabei n Fakultät. Dabei gilt 0! = 1! = 1. Angewendet auf das Beispiel: 4! = 1 · 2 · 3 · 4 = 24 und für eine beliebige Kombination p = 1/24 ≈ 0.042. S. Garbade (SRH Heidelberg) Wahrscheinlichkeitsrechnung Statistik 1 20 / 38 Permutationen und Kombinationen Kombinationsregeln 1. Kombinationsregel In einem psychologischen Test werden den Testteilnehmern aus 7 Items per Zufall 3 zugewiesen. Wie wahrscheinlich ist die Kombination zuerst Item 1, dann Item 2 und zuletzt Item 6? 1. Kombinationsregel Wählt man aus n verschiedenen Objekten k zufällig mit einer bestimmten Reihenfolge aus, so ergeben sich sich n! (n − k)! (5) mögliche Kombinationen für die k Objekte. Bezogen auf das Beispiel: 7! = 7 · 6 · 5 = 210, damit p = 1/210 ≈ 0.0048 bzw. 0.48% 4! S. Garbade (SRH Heidelberg) Wahrscheinlichkeitsrechnung Statistik 1 21 / 38 Permutationen und Kombinationen Kombinationsregeln Gedankengang zur 2. Kombinationsregel Wenn die Reihenfolge der Items keine Rolle spielt, wie groß ist dann die Wahrscheinlichkeit, die Items 1, 2 und 6 in beliebiger Reihenfolge zu erhalten? • Die Wahrscheinlichkeit für eine bestimmte Reihenfolge von drei Items ist 1/210. • Nach der Permutationsregel ergeben sich 3! = 1 · 2 · 3 = 6 Möglichkeiten, 3 Items anzuordnen. • Damit ergibt sich p = 6/210 ≈ 0.029 bzw. 2.9%. S. Garbade (SRH Heidelberg) Wahrscheinlichkeitsrechnung Statistik 1 22 / 38 Permutationen und Kombinationen Kombinationsregeln 2. Kombinationsregel 2. Kombinationsregel Wählt man aus n verschiedenen Objekten ohne Berücksichtigung der Reihenfolge k zufällig aus, ergeben sich n n! = k! · (n − k)! k mögliche Kombinationen (sprich: n über k). kn wird auch als n Binomialkoeffizient bezeichnet. Wenn n < k, dann ist k = 0. (6) Fortführung des Beispiels mit n = 7, k = 3: 7! 7·6·5 210 7 7! = = = = 35 = 3! · (7 − 3)! 3! · 4! 3·2 6 3 und damit p = 1/35 ≈ 0.029 bzw. 2.9%. S. Garbade (SRH Heidelberg) Wahrscheinlichkeitsrechnung Statistik 1 23 / 38 Permutationen und Kombinationen Kombinationsregeln Beispiel Lotto: 6 aus 49 Mit dem Binomialkoeffizient kann die Anzahl der Kombinationen von 6 zufälligen Ziehungen aus 49 Zahlen bestimmt werden: 49 49 · 48 · 47 · 46 · 45 · 44 = = 13983816 6 6·5·4·3·2·1 und damit p = 1/13983816 = 7.151124 · 10−8 . • Hinweis: Die Wahrscheinlichkeit 5 Richtige zu erhalten, kann nicht mit dem Binomialkoeffizienten bestimmt werden. Dafür wird die hypergeometrische Verteilung benötigt. • Frage: Warum nicht? S. Garbade (SRH Heidelberg) Wahrscheinlichkeitsrechnung Statistik 1 24 / 38 Permutationen und Kombinationen Kombinationsregeln 3. Kombinationsregel 10 Items eines Test sollen in 2 Blöcken zu jeweils 3 Items und einem Block zu 4 Items gruppiert werden. Wieviele Kombinationen sind möglich und wie groß ist die Wahrscheinlichkeit für eine dieser Kombinationen? 3. Kombinationsregel Sollen n Objekte in k Gruppen der größe n1 , n2 , . . . , nk eingeteilt werden (wobei n1 + n2 + . . . + nk = n), ergeben sich n! n1 ! · n2 ! · . . . · nk ! (7) mögliche Kombinationen. Angewendet auf das Beispiel: 10! 10 · 9 · 8 · 7 · 6 · 5 151200 = = = 4200, 3! · 3! · 4! 6·6 36 und damit p = 1/4200 ≈ 0.00024 bzw. 0.024%. S. Garbade (SRH Heidelberg) Wahrscheinlichkeitsrechnung Statistik 1 25 / 38 Binomialverteilung Binomialverteilung Binomialverteilung Herleitung der Binomialverteilung Definition der Binomialverteilung Bernoulli Prozesse S. Garbade (SRH Heidelberg) Wahrscheinlichkeitsrechnung Statistik 1 26 / 38 Binomialverteilung Herleitung der Binomialverteilung Herleitung der Binomialverteilung Wie groß ist die Wahrscheinlichkeit dafür, dass bei dreimaligem Münzwurf genau einmal Kopf fällt? • Die Wahrscheinlichkeit für ein günstiges Ereignis, z. B. {Z , Z , K }, ist p(Z ∩ Z ∩ K ) = p(k = Z ) · p(k = Z ) · p(k = K ) = 0.52 · 0.51 = 0.125. • Die Anzahl an möglichen Kombinationen, einmal Kopf bei 3 Würfen zu erhalten, ist n k = 3 1 = 3! 2!·1! = 3·2·1 2·1 = 6 2 = 3. • Damit ist p(1 einmal K |3 Würfen) = 3 · 0.125 = 0.375. • Das Zeichen | bedeutet unter der Bedingung. S. Garbade (SRH Heidelberg) Wahrscheinlichkeitsrechnung Statistik 1 27 / 38 Binomialverteilung Herleitung der Binomialverteilung Allgemeine Herleitung • Die Wahrscheinlichkeit, für ein günstiges Ereignis X = k mit der Einzelwahrscheinlichkeit p (und Gegenwahrscheinlichkeit q = 1 − p) in einem Zufallsexperiment mit n Versuchen ist: p(X = k) = p · p · . . . · p · q · q · . . . · q {z } | {z } | k-mal k =p ·q (n−k)−mal n−k = p k · (1 − p)n−k • Anzahl der möglichen Kombinationen, ohne Berücksichtigung der Reihenfolge k Objekte aus n Objekten auszuwählen, ist kn . • Nach dem Additionstheorem werden die Einzelwahrscheinlichkeiten addiert: (kn) X n n−k k pi · qi = · p k · q n−k . k i=1 S. Garbade (SRH Heidelberg) Wahrscheinlichkeitsrechnung Statistik 1 28 / 38 Binomialverteilung Definition der Binomialverteilung Binomialverteilung Definition der Binomialverteilung Die Wahrscheinlichkeit B(k|p, n), dass ein Ereignis mit einer konstanten Auftretenswahrscheinlichkeit p genau k-mal auftritt, unter der Bedingung, dass n Versuche durchgeführt werden, lautet: n B(k|p, n) = · p k · q n−k (8) k mit: n Anzahl der Versuche k Anzahl günstiger Ereignisse p Wahrscheinlichkeit für ein günstiges Ereignis q Gegenwahrscheinlichkeit 1 − p S. Garbade (SRH Heidelberg) Wahrscheinlichkeitsrechnung Statistik 1 29 / 38 Binomialverteilung Definition der Binomialverteilung Beispiel • Beispiel von eben: Wie groß ist die Wahrscheinlichkeit dafür, dass bei dreimaligem Münzwurf genau einmal Kopf fällt? • Damit k = 1, n = 3, p = 0.5: 3 B(1|0.5, 3) = · 0.51 · 0.52 1 3! = · 0.5 · 0.25 1! · 2! = 3 · 0.5 · 0.25 = 0.375 • Damit beträgt die gesuchte Wahrscheinlichkeit 37.5%. S. Garbade (SRH Heidelberg) Wahrscheinlichkeitsrechnung Statistik 1 30 / 38 Binomialverteilung Bernoulli Prozesse Bernoulli Prozess • Abfolge zufälliger, unabhängiger Ereignisse mit konstanter Wahrscheinlichkeit p (bzw. 1 − p) werden Bernoulli Prozess genannt. • Die Binomialverteilung wird daher auch als Bernoulli-Verteilung bezeichnet. S. Garbade (SRH Heidelberg) Wahrscheinlichkeitsrechnung Statistik 1 31 / 38 Binomialverteilung Bernoulli Prozesse Bernoulli Prozesse und Binomialverteilung • Ein einfaches Beispiel für einen Bernoulli-Prozesse ist ein mehrfacher Münzwurf. • Z. B. Wie wahrscheinlich ist es, bei zwei Münzwürfen genau einmal Kopf zu erhalten? • Damit: k = 1, n = 2, p = 0.5: 2 B(k = 1|n = 2, p = 0.5) = · 0.51 · 0.52−1 1 = 2 · 0.5 · 0.5 = 0.5 S. Garbade (SRH Heidelberg) Wahrscheinlichkeitsrechnung Statistik 1 32 / 38 Binomialverteilung Bernoulli Prozesse Bernoulli Prozesse und Binomialverteilung • Nun wird eine falsche Münze verwendet, z. B. für Kopf p = 0.7. • Damit:p = 0.7, k = 1, n = 2, p = 0.7: 2 B(1|2, 0.7) = · 0.71 · 0.32−1 1 = 2 · 0.7 · 0.3 = 0.42 S. Garbade (SRH Heidelberg) Wahrscheinlichkeitsrechnung Statistik 1 33 / 38 Binomialverteilung Bernoulli Prozesse Multiple Choice Test • Ein Multiple-Choice Test besteht aus 20 Fragen mit jeweils 4 Antwortmöglichkeiten. • Wie groß ist die Wahrscheinlichkeit, per raten genau 5 richtige Antworten zu erhalten? • Damit:n = 20, k = 5, p = .25: 5 15 3 20 1 · B(k = 5|p = 0.25, n = 20) = · 4 4 5 20! = · 0.000977 · 0.013363 5! · (20 − 5)! 20 · 19 · 18 · 17 · 16 = · 0.000013 5·4·3·2 = 0.20 • Die Wahrscheinlichkeit beträgt also 20%. S. Garbade (SRH Heidelberg) Wahrscheinlichkeitsrechnung Statistik 1 34 / 38 Binomialverteilung Bernoulli Prozesse Beispiele für Binomialverteilungen, n=20 0.15 0.10 0.00 10 15 20 0 5 10 k k p = 0.75 p = 0.33 15 20 15 20 0.15 0.10 0.05 0.00 0.00 0.05 0.10 0.15 Wahrscheinlichkeit [0, 1] 0.20 5 0.20 0 Wahrscheinlichkeit [0, 1] 0.05 Wahrscheinlichkeit [0, 1] 0.15 0.10 0.05 0.00 Wahrscheinlichkeit [0, 1] 0.20 p = 0.25 0.20 p = 0.5 0 5 10 15 20 0 5 k S. Garbade (SRH Heidelberg) 10 k Wahrscheinlichkeitsrechnung Statistik 1 35 / 38 Binomialverteilung Bernoulli Prozesse Lösungsskizzen für weitere Beispiele Wie groß ist die Wahrscheinlichkeit dafür, dass jemand per Zufall höchstens 5 Antworten ankreuzt? Lösungsskizze: • Höchstens fünf heißt 0, 1, 2, 3, 4 oder 5 richtige Antworten. • Es müssen also die Werte für k = {0, 1, 2, 3, 4, 5} mit n = 20 und p = .25 anhand der Binomialverteilung berechnet werden. • Die so errechneten Wahrscheinlichkeiten sind zu addieren. • Lösung: 0.6135 bzw. 61%. Die Einzelwahrscheinlichkeiten: B(k = 0|p = 0.25, n = 20) = 0.003171, B(1|0.25, 20) = 0.02114, B(2|0.25, 20) = 0.06688, B(3|0.25, 20) = 0.13338, B(4|0.25, 20) = 0.188955, B(5|0.25, 20) = 0.2 S. Garbade (SRH Heidelberg) Wahrscheinlichkeitsrechnung Statistik 1 36 / 38 Binomialverteilung Bernoulli Prozesse Lösungsskizzen für weitere Beispiele Wie groß ist die Wahrscheinlichkeit dafür, dass jemand per Zufall mindestens 6 Antworten ankreuzt? • Man könnte jetzt anhand der Binomialverteilung für k = {6, . . . , 20} wieder die Einzelwahrscheinlichkeiten bestimmen und addieren. • Aber: Mindestens 6 ist die Gegenwahrscheinlichkeit von maximal 5. • Also: 100% - 61% = 39%. S. Garbade (SRH Heidelberg) Wahrscheinlichkeitsrechnung Statistik 1 37 / 38 Binomialverteilung Bernoulli Prozesse Literaturverzeichnis Bortz, J. & Schuster, C. (2010). Statistik für Human- und Sozialwissenschaftler (7. Auflage). Berlin: Springer. S. Garbade (SRH Heidelberg) Wahrscheinlichkeitsrechnung Statistik 1 38 / 38