Universität Erfurt Sommersemester 2012 - Statistik Teil B: Wahrscheinlichkeitsrechnung Dr. Matthias Arnold 157 Universität Erfurt Sommersemester 2012 - Statistik Kapitel 7: Zufällige Ereignisse und ihre Wahrscheinlichkeiten Motivation Bisher: Beschreibung/Komprimierung/Vereinfachung von Datensätzen (beobachteten Merkmalsausprägungen) durch • Grafiken • Tabellen • Kennzahlen Jetzt: Treffe auf Basis beobachteter Merkmalsausprägungen Aussagen über zukünftige, unsichere“ Beobachtungen ” Dr. Matthias Arnold 158 Universität Erfurt Sommersemester 2012 - Statistik Die Theorie der Wahrscheinlichkeit ist ein System, ” das uns beim Raten hilft.“ R. Feynman, US-amerikanischer Physiker und Nobelpreisträger (1918 – 1988) Dr. Matthias Arnold 159 Universität Erfurt Sommersemester 2012 - Statistik Beispiel 7.1 Ein Investitionsprojekt ist in Gefahr, wenn es während der Bauphase zu viel regnet oder der Dollarkurs steigt. Bekannt sei: Regenwahrscheinlichkeit Wahrscheinlichkeit dass Dollar steigt = = 10% 40% → wie wahrscheinlich ist Gefährdung des Investitionsprojekts? Dr. Matthias Arnold 160 Universität Erfurt Sommersemester 2012 - Statistik Definition 7.1 Ein Zufallsexperiment ist ein Vorgang, der mehrere, sich gegenseitig ausschließende mögliche Ausgänge besitzt dessen Ausgang nicht mit Sicherheit vorhergesagt werden kann → Zufall“ ” der unter identischen Rahmenbedingungen beliebig oft wiederholbar ist → Experiment“ ” Dr. Matthias Arnold 161 Universität Erfurt Sommersemester 2012 - Statistik Definition 7.1 (Fortsetzung) Die n möglichen Ausgänge ω1 , ω2 , . . . , ωn eines Zufallsexperiments heißen Elementarereignisse Die Menge Ω = {ω1 , ω2 , . . . , ωn } aller Elementarereignisse heißt Ergebnismenge Teilmengen A, B ⊆ Ω der Ergebnismenge heißen Ereignisse Dr. Matthias Arnold 162 Universität Erfurt Sommersemester 2012 - Statistik Beispiel 7.2 a) Einmaliges Würfeln entspricht Zufallsexperiment mit Ausgängen 1,...,6 Ergebnismenge Ω Elementarereignisse Ereignis A : gerade Zahl“ ” Ereignis B : ungerade Zahl“ ” Ereignis C : Primzahl“ ” Ereignis D : Zahl größer 3“ ” Dr. Matthias Arnold {1, 2, 3, 4, 5, 6} {1}, {2}, {3}, {4}, {5}, {6} {2, 4, 6} {1, 3, 5} {2, 3, 5} {4, 5, 6} 163 Universität Erfurt Sommersemester 2012 - Statistik Beispiel 7.2 (Fortsetzung) b) Zweimaliges Würfeln → Elementarereignisse jetzt Zahlenpaare, die sich aus {1, ..., 6} zusammensetzen Ω = {(1, 1), (1, 2), (1, 3), (1, 4), (1, 5), (1, 6), (2, 1), (2, 2), (2, 3), (2, 4), (2, 5), (2, 6), (3, 1), (3, 2), (3, 3), (3, 4), (3, 5), (3, 6), (4, 1), (4, 2), (4, 3), (4, 4), (4, 5), (4, 6), (5, 1), (5, 2), (5, 3), (5, 4), (5, 5), (5, 6), (6, 1), (6, 2), (6, 3), (6, 4), (6, 5), (6, 6)} = {1, 2, 3, 4, 5, 6} ⊗ {1, 2, 3, 4, 5, 6} (⊗ =Kartesisches Produkt=Menge aller geordneten Paare (a, b) mit a ∈ A, b ∈ B) Dr. Matthias Arnold 164 Universität Erfurt Sommersemester 2012 - Statistik Beispiel 7.2 (Fortsetzung) b) Zweimaliges Würfeln (Fortsetzung) Ergebnismenge Ω Elementarereignisse Ereignis A : Augensumme=10“ ” B : nur ungerade Zahlen“ ” C : gerade Zahl in Wurf 1“ ” Dr. Matthias Arnold {(1, 1), (1, 2), ..., (1, 6), (2, 1), ..., (6, 5), (6, 6)} {(1, 1)}, ..., {(6, 6)} {(4, 6), (5, 5), (6, 4)} {(1, 1), (1, 3), (1, 5), (3, 1), ..., (5, 3), (5, 5)} {(2, 1), (2, 2), ..., (2, 6), (4, 1), ..., (6, 5), (6, 6)} 165 Universität Erfurt Sommersemester 2012 - Statistik Definition 7.2 Betrachte Zufallsexperiment mit Ergebnismenge Ω und Ereignisse A, B ⊆ Ω. Die Menge derjenigen Elementarereignisse ωi , die a) sowohl in A als auch in B liegen, heißt Schnittmenge von A und B (kurz: A ∩ B) b) in A oder in B liegen, heißt Vereinigungsmenge von A und B (kurz: A ∪ B) c) in A aber nicht in B liegen, heißt Differenzmenge von A und B (kurz: A \ B) d) nicht in A liegen, heißt Komplementärmenge zu A (kurz: Ā); Weiterhin heißen A und B disjunkt, falls ihre Schnittmenge die leere Menge ist (A ∩ B = ∅) Dr. Matthias Arnold 166 Universität Erfurt Sommersemester 2012 - Statistik Schnittmenge a) Venn-Diagramm: A ∩ B, vgl. Definition 7.2 a) Dr. Matthias Arnold 167 Universität Erfurt Sommersemester 2012 - Statistik Vereinigungsmenge b) Venn-Diagramm: A ∪ B, vgl. Definition 7.2 b) Dr. Matthias Arnold 168 Universität Erfurt Sommersemester 2012 - Statistik Differenzmenge c) Venn-Diagramm: A \ B, vgl. Definition 7.2 c) Dr. Matthias Arnold 169 Universität Erfurt Sommersemester 2012 - Statistik Komplementärmenge d) Venn-Diagramm: Ā, vgl. Definition 7.2 d) Dr. Matthias Arnold 170 Universität Erfurt Sommersemester 2012 - Statistik Disjunkte Mengen e) Venn-Diagramm: A und B disjunkt, vgl. Definition 7.2 Dr. Matthias Arnold 171 Universität Erfurt Sommersemester 2012 - Statistik Beispiel 7.3 a) Einmaliges Würfeln, vgl. Beispiel 7.2 a); Für die betrachteten Ereignisse ergibt sich: A ∩ B = gerade und ungerade Zahl = ∅ A ∩ C = gerade Zahl und Primahl = {2} B ∪ D = ungerade Zahl oder Zahl größer als 3 = {1, 3, 4, 5, 6} C \ D = Primzahl, die nicht größer als 3 ist Ā = ungerade Zahl Dr. Matthias Arnold = {2, 3} = B 172 Universität Erfurt Sommersemester 2012 - Statistik Beispiel 7.3 (Fortsetzung) b) Zweimaliges Würfeln, vgl. Beispiel 7.2 b); Für die betrachteten Ereignisse ergibt sich: A ∩ B = Augensumme=10 +nur ungerade Zahlen = {(5, 5)} A ∩ C = Augensumme=10 +gerade Zahl in Wurf 1 = {(4, 6), (6, 4)} B ∩ C = nur ungerade Zahlen +gerade Zahl in Wurf 1 = ∅ A ∪ C = Augensumme=10 oder gerade Zahl in Wurf 1 = {C, (5, 5)} A \ B = Augensumme=10 +mindestens eine gerade Zahl = {(4, 6), (6, 4)} Dr. Matthias Arnold 173 Universität Erfurt Sommersemester 2012 - Statistik Bemerkung a) Wiederhole Zufallsexperiment mit K Elementarereignissen n-mal → das zusammengesetzte Zufallsexperiment besitzt K n Elementarereignisse Betrachte etwa Beispiel 7.2 b), n = 2maliges Würfeln (K = 6) → {1, 2, 3, 4, 5, 6} ⊗ {1, 2, 3, 4, 5, 6} Elementarereignisse: (1, 1), ..., (1, 6), (2, 1), ..., (2, 6), ..., (6, 1), ..., (6, 6) 6 Ereignisse 6 Ereignisse 6 Ereignisse =6×6=62 =K n Elementarereignisse → Ω enthält 36 Elementarereignisse Dr. Matthias Arnold Bezeichnung: | Ω | = 36 174 Universität Erfurt Sommersemester 2012 - Statistik Bemerkung (Fortsetzung) b) Bisher: Definition von Ereignissen, Mengen, Vereinigungen, Schnitten,... → Jetzt von Interesse: Wie wahrscheinlich ist Eintritt eines bestimmten Ereignisses? Dr. Matthias Arnold Beispiel 7.2 b), zweimaliges Würfeln: Wahrscheinlichkeit des Eintritts von Ereignis A (Augensumme 10), B (nur ungerade Zahlen), A ∪ B,...? 175 Universität Erfurt Sommersemester 2012 - Statistik Definition 7.3 Ein Zufallsexperiment, bei dem alle Elementarereignisse mit gleicher Wahrscheinlichkeit eintreten, heißt Laplace-Experiment. In einem solchen Experiment ist die Wahrscheinlichkeit für das Eintreten eines Ereignisses A ⊆ Ω gegeben durch P (A) = = Dr. Matthias Arnold |A| |Ω| Anzahl der in A enthaltenen Elementarereignisse Anzahl aller möglichen Elementarereignisse 176 Universität Erfurt Sommersemester 2012 - Statistik Beispiel 7.4 Zweimaliges Würfeln wie in Beispiel 7.2 b) entspricht einem Laplace-Experiment, da jedes Elementarereignis mit Wahrscheinlichkeit 1/36 eintritt Ereignis |·| 3 P (·) 3/36 {(1, 1), ..., (5, 5)} 9 9/36 {(2, 1), ..., (6, 6)} 18 18/36 verbal A : Augensumme=10 “ ” mengentheoretisch {(4, 6), (5, 5), (6, 4)} B : nur ungerade Zahlen “ ” C : gerade Zahl in Wurf 1 “ ” Einmaliges Würfeln, vgl. Beispiel 7.2 a): Analog Dr. Matthias Arnold 177 Universität Erfurt Sommersemester 2012 - Statistik Bemerkung Problem: Nicht immer liegt Laplace-Experiment vor Beispiel: Gezinkter Würfel mit P(Augenzahl=6) = 1/3 und P(Augenzahl=i) = 2/3 = 2/15, i = 1, ..., 5 5 → allgemeinerer Wahrscheinlichkeitsbegriff notwendig Dr. Matthias Arnold 178 Universität Erfurt Sommersemester 2012 - Statistik Definition 7.4 Eine Abbildung P, die allen Ereignissen A ⊆ Ω eines Zufallsexperiments eine Zahl P (A) zuordnet und die Kolmogoroff’schen Axiome 0 ≤ P (A) ≤ 1 für alle A ⊆ Ω P (Ω) = 1 P (A ∪ B) = P (A) + P (B) für alle A, B ⊆ Ω mit A ∩ B = ∅ erfüllt, heißt Wahrscheinlichkeitsmaß. Dr. Matthias Arnold 179 Universität Erfurt Sommersemester 2012 - Statistik Bemerkung Rechenregeln für Wahrscheinlichkeiten (ergeben sich aus Kolmogoroff’schen Axiomen) P (∅) = 0 P (Ā) = 1 − P (A) P (A ∪ B) = P (A) + P (B) − P (A ∩ B) P (A) Dr. Matthias Arnold = ωi ∈A P ({ωi }) 180 Universität Erfurt Sommersemester 2012 - Statistik Beispiel 7.5 Landtag NRW (Zusammensetzung nach Partei und Geschlecht) CDU SPD Grüne FDP Linke männlich 57 48 11 11 5 132 weiblich 10 19 12 2 6 49 67 67 23 13 11 181 zufällige Auswahl eines Landtagsmitglieds → LaplaceExperiment, jedes Elementarereignis (=Landtagsmitglied) kann mit gleicher Wahrscheinlichkeit ausgewählt werden Ω = Alle Mitglieder des Landtags“ → |Ω| = 181 ” Dr. Matthias Arnold 181 Universität Erfurt Sommersemester 2012 - Statistik Beispiel 7.5 (Fortsetzung) Definiere nun Ereignisse • A = weibliche Person“ ” • B = SPD-zugehörig“ ” P (B) = 67/181 ≈ 0, 37 P (A ∪ B) = 97/181 ≈ 0, 54 P (A ∩ B) = 19/181 ≈ 0, 1 Dr. Matthias Arnold 182 Universität Erfurt Sommersemester 2012 - Statistik bedingte Wahrscheinlichkeiten andere Frage: Wie wahrscheinlich ist SPD-Zugehörigkeit bei weiblichen Landtagsmitgliedern? Formell: → P (B gegeben A) bzw. P (B | A) → bedingte Wahrscheinlichkeit: Beschränkung der möglichen Ereignisse auf eine Teilmenge von Ω (hier: A) Dr. Matthias Arnold 183 Universität Erfurt Sommersemester 2012 - Statistik Beispiel 7.5 (Fortsetzung) Venn-Diagramm: Bedingte Wahrscheinlichkeit • Hellgrau: Reduzierte Ergebnismenge (hier: weibliche Personen) • Dunkelgrau: Teilmenge der reduzierten Ergebnismenge, dessen Eintrittswahrscheinlichkeit gesucht wird (hier: SPD-Mitgl., w.) • Rest (weißer Bereich): Uninteressant Dr. Matthias Arnold 184 Universität Erfurt Sommersemester 2012 - Statistik Definition 7.5 Sei P (A) > 0. Dann heißt P (B | A) = P (A ∩ B) P (A) bedingte Wahrscheinlichkeit von B gegeben A. Beispiel 7.6 (Landtag NRW, vgl. Beispiel 7.5) P (SPD | weiblich) = P (B | A) = = Dr. Matthias Arnold 19 = 0, 388 49 P (A ∩ B) 19/181 = P (A) 49/181 185 Universität Erfurt Sommersemester 2012 - Statistik Beispiel 7.7 a) Dreimaliger Münzwurf : Kopf (K) oder Zahl (Z) Ω = {(Z, Z, Z), (Z, Z, K), (Z, K, Z), (K, Z, Z), (K, K, K), (K, K, Z), (K, Z, K), (Z, K, K)} Ereignis A : Mindestens 1× Zahl Ereignis B : Mindestens 2× Kopf Gesucht: P (B | A) → reduzierte Ergebnismenge A A = {(Z, Z, Z), (Z, Z, K), (Z, K, Z), (K, Z, Z), (K, K, Z), (K, Z, K), (Z, K, K)} Ereignisse mit 2× Kopf → P (B | A) = 3/7 (da |A| = 7) Dr. Matthias Arnold 186 Universität Erfurt Sommersemester 2012 - Statistik Beispiel 7.7 (Fortsetzung) a) Dreimaliger Münzwurf (Fortsetzung) Alternative Berechnung von P (B | A) mit Def. 7.5 • |Ω| = 8 • P (A) = 7/8 • A ∩ B = {(K, K, Z), (K, Z, K), (Z, K, K)} → P (A ∩ B) = 3/8 → P (B | A) = Dr. Matthias Arnold 3/8 3 = 7/8 7 187 Universität Erfurt Sommersemester 2012 - Statistik Beispiel 7.7 (Fortsetzung) b) Zweimaliges Würfeln, vergleiche Beispiel 7.2 b) Neben Ereignissen A − C definiere D = ungerade Zahl in Wurf 2“ ” Zur Erinnerung: C = gerade Zahl in Wurf 1“ ” C = {(2, 1), ..., (2, 6), (4, 1), ..., (6, 6)} → |C| = 18 → P(C) = 1/2 (|Ω| = 36) D = {(1, 1), ..., (1, 5), (2, 1), ..., (6, 5)} → |D| = 18 → P(D) = 1/2 C ∩D = {(2, 1), (2, 3), (2, 5), (4, 1), ..., (6, 5)} → |C ∩ D| = 9 → P(C ∩ D) = 1/4 Dr. Matthias Arnold 188 Universität Erfurt Sommersemester 2012 - Statistik Beispiel 7.7 (Fortsetzung) b) Zweimaliges Würfeln (Fortsetzung) Gesucht: P( Wurf 2 ungerade“| Wurf 1 gerade“) : ” ” P (D | C) = P (D ∩ C) 1/4 1 = = = P (D) P (C) 1/2 2 → Ereignis C hat keinen Einfluss auf Ereignis D, beide Ereignisse hängen nicht voneinander ab Dr. Matthias Arnold 189 Universität Erfurt Sommersemester 2012 - Statistik Definition 7.6 Gilt für zwei Ereignisse A und B mit P (A) > 0 und P (B) > 0 P (A | B) = P (A) und P (B | A) = P (B), so heißen diese stochastisch unabhängig. Bemerkung Die Aussage A und B stochastisch unabhängig“ ist äquivalent zu ” P (A ∩ B) = P (A) · P (B) Dr. Matthias Arnold 190 Universität Erfurt Sommersemester 2012 - Statistik Beispiel 7.8 (Investitionsprojekt, vergleiche Beispiel 7.1) A = zuviel Regen“ mit P (A) = 0, 1 ” B = Dollarkurs steigt“ mit P (B) = 0, 4 ” → P (Investitionsprojekt in Gefahr) = P (A ∪ B) P (A ∪ B) = P (A) + P (B) − P (A ∩ B) = P (A) + P (B) − P (A) · P (B) = 0, 1 + 0, 4 − 0, 1 · 0, 4 = 0, 46 Zu : Siehe Bemerkung nach Definition 7.4 Zu : A und B stochastisch unabhängig (plausible Annahme) → wende Bemerkung nach Definition 7.6 an Dr. Matthias Arnold 191 Universität Erfurt Sommersemester 2012 - Statistik Beispiel 7.9 a) Stochastische Unabhängigkeit in der Öffentlichkeit: Mann für Millionen (Westdeutsche Allgemeine Zeitung, 30.09.2010) Bereits zum zweiten Mal in diesem Jahr hat ein Mann aus ” dem US-Staat Missouri einen Millionengewinn mit Rubbellosen einkassiert. Im Juni hatte der 57-Jährige beim ’100 Million Dollar Blockbuster’ eine Million gewonnen. Nun gelang ihm die Sensation erneut, diesmal waren es gleich zwei Millionen, die er beim ’Mega Monopoly’ gewann. Die Chancen, bei einem der beiden Spiele den Höchstbetrag zu gewinnen, lägen bei 1:2,28 Millionen, heißt es. Die Chancen, gleich bei beiden Spielen abzusahnen, seien kaum zu berechnen, da sie unabhängig voneinander seien.“ Dr. Matthias Arnold 192 Universität Erfurt Sommersemester 2012 - Statistik Beispiel 7.9 (Fortsetzung) a) Mann für Millionen (Fortsetzung) Definiere A = Gewinn beim 100 Million Dollar Blockbuster“ ” B = Gewinn beim Mega Monopoly“ ” Bekannt: P (A) = P (B) = 1 : 2, 28 Mio. und A und B unabhängig → P (Gewinn bei beiden Spielen) = P (A ∩ B) = P (A) · P (B) ≈ 1 : 5, 2 Billionen Dr. Matthias Arnold 193 Universität Erfurt Sommersemester 2012 - Statistik Beispiel 7.9 (Fortsetzung) b) Bedingte Wahrscheinlichkeiten in der Öffentlichkeit 1: Prozess gegen O. J. Simpson (1995) • M. Dershowitz (Strafverteidiger): ...an infinitesimal ” percentage - certainly fewer than 1 out of 2.500 - of men who slap or beat their domestic partners go on to murder them“: → P (M |S) < 1/2.500 (M= Mann ermordet Ehefrau“, S= Mann schlägt Ehefrau“) ” ” • Prozessurteil: Freispruch Dr. Matthias Arnold 194 Universität Erfurt Sommersemester 2012 - Statistik Beispiel 7.9 (Fortsetzung) • Aber: Definiere zusätzlich m= Ehefrau wird ermordet“ ” → P (M |{S ∩ m}) ≈ 0, 9 (vgl. Good, 1996) • In Worten: Nur wenige schlagende Ehemänner bringen ihre Frau um, aber wenn eine ermordete Frau von ihrem Mann geschlagen wurde, dann ist der Mann mit hoher Wahrscheinlichkeit auch der Täter • Details: Dershowitz (1996), Reasonable Doubts: The O.J. Simpson Case and the Criminal Justice System, New York, 1996; Good (1996), When batterer becomes murderer, Nature 381 Dr. Matthias Arnold 195 Universität Erfurt Sommersemester 2012 - Statistik Beispiel 7.9 (Fortsetzung) c) Bedingte Wahrscheinlichkeiten in der Öffentlichkeit 2: Schäferhund besonders bissig (US-Studie) Vorsicht, Schäferhund-Besitzer! Eine US-Studie fand heraus: ” Am häufigsten werden Schäferhund-Herrchen von ihren Tieren gebissen. Dann folgen Chow-Chows und Collies. Die friedlichsten Hunde sind Pudel und Golden Retriever. Hunde, die in einem Haushalt mit Kindern leben, beißen eher zu als Hunde von Singles.“ → Aussage: P ( Schäferhund“| Biss“) > P ( Chow-Chow (etc.)“| Biss“) ” ” ” ” Eigentlich jedoch von Interesse: P ( Biss“| Schäferhund“) > P ( Biss“| Chow-Chow (etc.)“) ” ” ” ” Dr. Matthias Arnold 196 Universität Erfurt Sommersemester 2012 - Statistik Bemerkung Fazit/Zusammenfassung Kapitel 7 Zufallsexperiment, Ergebnismenge, Ereignisse klassischer (Laplace) und axiomatischer (Kolmogoroff) Wahrscheinlichkeitsbegriff bedingte Wahrscheinlichkeit und stochastische Unabhängigkeit Vorsicht bei der Interpretation bedingter Wahrscheinlichkeiten Dr. Matthias Arnold 197 Universität Erfurt Sommersemester 2012 - Statistik Kapitel 8: Zufallsvariablen Kapitel 7: Betrachtung von Ereignissen ωi , ωj , A, B, ... ⊂ Ω Jetzt: Ordne Ereignissen Zahlen zu Dr. Matthias Arnold 198 Universität Erfurt Sommersemester 2012 - Statistik Definition 8.1 Eine Abbildung X, deren mögliche Werte vom Ausgang eines Zufallsexperiments abhängen, heißt Zufallsvariable. Formell: X:Ω→R X ordnet somit jedem Elementarereignis eine reelle Zahl zu. Die möglichen Werte ω → X(ω) einer Zufallsvariablen nennt man Realisationen. Weiterhin heißt X diskrete Zufallsvariable, falls sie nur endlich viele oder abzählbar viele Werte annehmen kann stetige Zufallsvariable, wenn sie - eventuell innerhalb gewisser Grenzen - alle möglichen reellen Zahlen als Werte annehmen kann Dr. Matthias Arnold 199 Universität Erfurt Sommersemester 2012 - Statistik Beispiel 8.1 a) Zweimaliger Münzwurf → Ω = {(Z, K), (K, Z), (K, K), (Z, Z)} Definiere Zufallsvariable X = Anzahl Würfe mit Kopf“ ” → X(Z, K) = X(K, Z) = 1, X(K, K) = 2, X(Z, Z) = 0 → X ∈ {0, 1, 2} diskrete Zufallsvariable Dr. Matthias Arnold 200 Universität Erfurt Sommersemester 2012 - Statistik Beispiel 8.1 (Fortsetzung) b) Verschiedene Zufallsvariablen+Typ (stetig/diskret) Zufallsvariable Augensumme zweimaliges Würfeln Wertebereich {2, 3, 4, . . . , 12} Typ diskret Lebensdauer eines Prozessors [0, ∞) stetig Anzahl erfolgloser Lottotipps bis zum ersten Hauptgewinn {0, 1, 2, 3, . . .} diskret Logarithmierte Aktienrendite an einem Börsentag (−∞, ∞) stetig Dr. Matthias Arnold 201 Universität Erfurt Sommersemester 2012 - Statistik Bemerkung a) Funktionen von Zufallsvariablen sind wieder Zufallsvariablen. Betrachte etwa zweimaligen Würfelwurf (vgl. Beispiel 7.2 b)) und definiere Zufallsvariablen: X1 = Augenzahl Wurf 1“; ” X2 = Augenzahl Wurf 2“. Dann sind ” Z1 = min {X1 , X2 } Z2 = max {X1 , X2 } Z 3 = X1 + X2 ebenfalls Zufallsvariablen. b) Im Folgenden von Interesse: Wie lassen sich Wahrscheinlichkeiten angeben, dass Zufallsvariable X Wert xi annimmt? Zunächst lediglich Betrachtung diskreter Zufallsvariablen. Dr. Matthias Arnold 202 Universität Erfurt Sommersemester 2012 - Statistik Definition 8.2 Sei X diskrete Zufallsvariable mit möglichen Realisationen x1 , x2 , ..., xk . Dann heißt die Funktion f (·), die angibt, mit welcher Wahrscheinlichkeit X die Realisation xi annimmt, f (xi ) = P (X = xi ), i = 1, . . . , k, Wahrscheinlichkeitsfunktion von X. Dr. Matthias Arnold 203 Universität Erfurt Sommersemester 2012 - Statistik Beispiel 8.2 (Zweimaliges Würfeln, vgl. Beispiel 7.2 b)) Definiere X =Augensumme beider Würfe 7.2 b) bzw. 7.4: Zweimaliges Würfeln entspricht Laplace Experiment mit |Ω| = 36 X(ω) = xi X=2 X=3 X=4 .. . X = 12 Dr. Matthias Arnold {zugehörige ω} {(1, 1)} {(1, 2), (2, 1)} {(1, 3), (2, 2), (3, 1)} .. . ⇒ ⇒ ⇒ ⇒ P (X P (X P (X P (X .. . = xi ) = 2) = 1/36 = 3) = 2/36 = 4) = 3/36 {(6, 6)} ⇒ P (X = 12) = 1/36 204 Universität Erfurt Sommersemester 2012 - Statistik Beispiel 8.2 (Fortsetzung) Realisation xi P (X = xi ) 2 1/36 3 2/36 4 3/36 5 4/36 6 5/36 Realisation xi P (X = xi ) 8 5/36 9 4/36 10 3/36 11 2/36 12 1/36 ⇒ i 7 6/36 P (X = xi ) = 1 (klar, da sich eine Augensumme zwischen 2 und 12 auf jeden Fall realisieren wird!) Dr. Matthias Arnold 205 Universität Erfurt Sommersemester 2012 - Statistik 0 1/36 2/36 3/36 P(X = xi) 4/36 5/36 6/36 Beispiel 8.2 (Fortsetzung) 2 Dr. Matthias Arnold 3 4 5 6 7 xi 8 9 10 11 12 206 Universität Erfurt Sommersemester 2012 - Statistik Beispiel 8.2 (Fortsetzung) Frage: Wie wahrscheinlich überschreitet die Zufallsvariable einen bestimmten Wert nicht? Hier etwa: Mit welcher Wahrscheinlichkeit ist die Augensumme kleiner oder gleich Drei? P(X ≤ 3) = P(X = 2) + P(X = 3) = P({(1, 1)}) + P({(1, 2), (2, 1)}) Dr. Matthias Arnold = 1 2 + 36 36 = 3 1 = 36 12 207 Universität Erfurt Sommersemester 2012 - Statistik Definition 8.3 Für eine Zufallsvariable X heißt die Funktion F (·), die angibt, mit welcher Wahrscheinlichkeit X einen Wert x nicht überschreitet, F (x) = P (X ≤ x), x ∈ R, Verteilungsfunktion von X. Bemerkung Für eine diskrete Zufallsvariable X gilt f (xi ), x ∈ R F (x) = xi ≤x (vergleiche Definition 2.2: F (x) theoretisches Gegenstück“ zu ” empirischer Verteilungsfunktion Fn (x)) Dr. Matthias Arnold 208 Universität Erfurt Sommersemester 2012 - Statistik Beispiel 8.3 (Zweimaliges Würfeln, vgl. Beispiel 8.2) Weiterhin sei X =Augensumme beider Würfe In Bsp. 8.2 berechnet: F (3) = P(X = 2) + P(X = 3) = 3 36 Bem. nach Def. 8.3: 6 , F (4) = P(X = 2) + P(X = 3) + P(X = 4) = 36 F (5) = P(X = 2)+P(X = 3)+P(X = 4)+P(X = 5) = 10 36 , ... x∈ F (x) (−∞, 2) 0 [2, 3) 1/36 [3, 4) 3/36 [4, 5) 6/36 [5, 6) 10/36 [6, 7) 15/36 x∈ F (x) [7, 8) 21/36 [8, 9) 26/36 [9, 10) 30/36 [10, 11) 33/36 [11, 12) 35/36 [12, ∞) 1 Dr. Matthias Arnold 209 Universität Erfurt Sommersemester 2012 - Statistik 1 Beispiel 8.3 (Fortsetzung) ● ● ● 5/6 ● 2/3 ● 1/2 P(X ≤ x) ● 1/3 ● ● 1/6 ● 0 ● −1 0 1 2 ● 3 4 5 6 7 8 9 10 11 12 13 x → F (x) Treppenfunktion; Sprungstellen x = 2, 3, ..., 12, Sprunghöhen den Werten der Wahrscheinlichkeitsfunktion entsprechend (1/36, 2/36, 3/36, ..., 1/36) Dr. Matthias Arnold 210 Universität Erfurt Sommersemester 2012 - Statistik Verteilungsfunktion Vergleich mit empirischer Verteilungsfunktion Fn (x) aus Definition 2.2: • Formal starke Ähnlichkeit, inhaltlicher Unterschied: • Fn (x) beschreibt n Zahlen, Sprunghöhen entsprechen den relativen Häufigkeiten h(ai ) • F (x) beschreibt eine Wahrscheinlichkeitsverteilung, die Sprunghöhen entsprechen den Wahrscheinlichkeiten Dr. Matthias Arnold 211 Universität Erfurt Sommersemester 2012 - Statistik Bemerkung Betrachte nun stetige Zufallsvariable X; Hier Definition der Wahrscheinlichkeitsfunktion durch f (xi ) = P(X = xi ) analog zu Definition 8.2 nicht sinnvoll Grund: X stetig → Sämtliche xi ∈ R können sich realisieren (zumindest auf Intervall, vergleiche Definition 8.1) Stetigkeit in Praxis jedoch Idealisierung, da Messungen diskret Sei etwa X = Körpergewicht (in kg) einer zufällig ausgewählten Person i → P(X = 82, 514367842312) ??? → deswegen (und aufgrund weiterer, technischer Aspekte) P(X = x) = 0 für alle x ∈ R Dr. Matthias Arnold 212 Universität Erfurt Sommersemester 2012 - Statistik Definition 8.4 Sei X stetige Zufallsvariable mit möglichen Realisationen im Intervall (a, b), a = −∞ und/oder b = ∞ erlaubt, und differenzierbarer Verteilungsfunktion F (x) = P(X ≤ x). Dann heißt die erste Ableitung f (x) = F (x), x ∈ R, Dichtefunktion (kurz Dichte) von X. Dr. Matthias Arnold 213 Universität Erfurt Sommersemester 2012 - Statistik Bemerkung 1 a) Zusammenhang zwischen Verteilungs- und Dichtefunktion x f (t) dt f (x) = F (x) (vgl. Def. 8.4) und F (x) = −∞ b) Interpretation der Dichtefunktion schraffiert: a −∞ f (t) dt = F (a) = P(X ≤ a) → gesamter Flächeninhalt unter der Dichte=1 Dr. Matthias Arnold 214 Universität Erfurt Sommersemester 2012 - Statistik Bemerkung 2 a) Eigenschaften der Verteilungsfunktion ( Gegenstück“ zur ” Bemerkung nach Beispiel 2.3): Sei X beliebige Zufallsvariable mit Verteilungsfunktion F (x). Dann gilt F (x) ist monoton nicht fallend 0 ≤ F (x) ≤ 1 für alle x ∈ R Dr. Matthias Arnold lim F (x) = 0 und x→−∞ lim F (x) = 1 x→∞ P (a < X ≤ b) = F (b) − F (a) 215 Universität Erfurt Sommersemester 2012 - Statistik Bemerkung 2 (Fortsetzung) b) Eigenschaften der Wahrscheinlichkeits-/Dichtefunktion: Sei f (x) die der Zufallsvariablen X aus a) zugehörige Wahrscheinlichkeits-/Dichtefunktion. Dann gilt f (x) ≥ 0 i f (xi ) = 1, ∞ −∞ Dr. Matthias Arnold falls X diskret f (x) dx = 1, F (b) − F (a) = b a falls X stetig f (x) dx, falls X stetig 216 Universität Erfurt Sommersemester 2012 - Statistik Beispiel 8.4 a) Gleich-/Rechteckverteilung (einfachste stetige Verteilung) X gleichverteilt auf Intervall [a, b] → 1 x ∈ [a, b] b−a f (x) = 0 sonst → Werte auf Intervall gleichmäßig“ verteilt ” Dr. Matthias Arnold 217 Universität Erfurt Sommersemester 2012 - Statistik Beispiel 8.4 (Fortsetzung) 0.00 0.01 0.02 f(x) 0.03 0.04 0.05 b) Sei X = Verspätung der S-Bahn an der Haltestelle Universität ” Dortmund“; Annahme: X auf Intervall [0, 20] gleichverteilt 1 x ∈ [0, 20] 20 → f (x) = 0 sonst −5 0 5 10 15 20 25 Verspätung x in Minuten Dr. Matthias Arnold 218 Universität Erfurt Sommersemester 2012 - Statistik Beispiel 8.4 (Fortsetzung) b) (Fortsetzung) Frage: Mit welcher Wahrscheinlichkeit beträgt die Verspätung zwischen fünf und zehn Minuten? P (5 < X ≤ 10) = F (10) − F (5) (vgl. Bem. 2 a) nach Def. 8.4) → Berechnung von F (x) : x F (x) = x f (t) dt = 0 → Insgesamt: F (x) Dr. Matthias Arnold = 0 ⎧ ⎪ ⎨0, x 20 ⎪ ⎩ 1, , x 1 1 x dt = t = 20 20 0 20 x<0 0 ≤ x ≤ 20 x > 20 219 Universität Erfurt Sommersemester 2012 - Statistik Beispiel 8.4 (Fortsetzung) b) (Fortsetzung) P (5 < X ≤ 10) = F (10) − F (5) = 10 20 − 5 20 = 0, 25 F(x) 0 0.25=F(5) 0.5=F(10) 0.75 1 → P(fünf bis zehn Minuten zu spät)=25 % −5 0 5 10 15 20 25 Verspätung x in Minuten Dr. Matthias Arnold 220 Universität Erfurt Sommersemester 2012 - Statistik Definition 8.5 Gilt für zwei Zufallsvariablen X und Y und alle x, y ∈ R P (X ≤ x, Y ≤ y) = P (X ≤ x) · P (Y ≤ y) = FX (x) · FY (y), so heißen X und Y stochastisch unabhängig. Beispiel 8.5 (zweimaliges Würfeln, vgl. u.a. Beispiel 8.2) X =Augenzahl erster Wurf Y =Augenzahl zweiter Wurf Dr. Matthias Arnold 221 Universität Erfurt Sommersemester 2012 - Statistik Beispiel 8.5 (Fortsetzung) P (X ≤ 3, Y ≤ 5) = P (X ≤ 3 und Y ≤ 5) = P ( {(1, 1), (1, 2), ..., (1, 6), (2, 1), ..., (3, 6)} A mit |A|=18 und {(1, 1), ..., (1, 5), (2, 1), ..., (6, 5)} ) B mit |B|=30 = P (A ∩ B) = P ({(1, 1), (1, 2), ..., (1, 5), (2, 1), ..., (3, 5)}) C mit |C|=15 = Dr. Matthias Arnold 15 5 = 36 12 222 Universität Erfurt Sommersemester 2012 - Statistik Beispiel 8.5 (Fortsetzung) Außerdem gilt: P (X ≤ 3) = P (A) = 18 1 = 36 2 P (Y ≤ 5) = P(B) = 30 5 = 36 6 Und somit P (X ≤ 3) · P (Y ≤ 5) = 1 5 5 · = = P (X ≤ 3, Y ≤ 5) 2 6 12 Für alle (x, y) ∈ Ω nachweisbar → X und Y stochastisch unabhängig Dr. Matthias Arnold 223 Universität Erfurt Sommersemester 2012 - Statistik Bemerkung Fazit/Zusammenfassung Kapitel 8 Zufallsvariablen zur vereinfachten Berechnung von Wahrscheinlichkeiten; Quantifizierung von Ereignissen Diskrete Zufallsvariablen besitzen Wahrscheinlichkeits- und Verteilungsfunktion stetige Zufallsvariablen besitzen Dichte und Verteilungsfunktion Dr. Matthias Arnold 224