Statistisches Lernen Einheit 3: Wahrscheinlichkeitsrechnung Dr. rer. nat. Fabian Schwarzenberger Institut für Medizinische Informatik, Statistik und Epidemiologie Universität Leipzig WS 2014/2015 1 / 50 Einleitung - Ziele und Motivation Übersicht 1 Einleitung - Ziele und Motivation 2 Axiomatische Einführung des Begriffes “Wahrscheinlichkeit” Was ist dieses P? 3 Kombinatorik 4 Bedingte Wahrscheinlichkeit 5 Unabhängigkeit und Unkorreliertheit 6 Zufallsvariablen 7 Spezielle Verteilungen 8 Grenzwertsätze der Wahrscheinlichkeitsrechnung 9 Aufgaben 2 / 50 Einleitung - Ziele und Motivation Ziele und Motivation Auffrischung des Wissens aus dem Bachelor-Studium Beschreibung von Zufallssituationen mit Hilfe von Ereignissen/ Berechnung der zugehörigen Wahrscheinlichkeiten Umgang mit Zufallsvariablen und ihren Verteilungen Wichtige Verteilungen kennen lernen Grenzwertsätze - Warum brauche ich große Fallzahlen? Gefühl für Wahrscheinlichkeiten entwickeln: “Young man, in mathematics you don’t understand things. You just get used to them.” - John von Neumann 3 / 50 Einleitung - Ziele und Motivation Zufallsexperiment Ein Zufallsexperiment ist ein Vorgang der einem genau festgelegtem Plan folgt, bei dem alle möglichen Ergebnisse vorab bekannt sind, dessen Ausgang nicht vorhergesagt werden kann. (hier steckt der Zufall) Beispiele: Wurf eines Würfel Ziehung der Lottozahlen Anzahl der Notrufe pro Jahr in Leipzig Ergebnis eines Schwangerschaftstests Dauer einer Blinddram-OP 4 / 50 Einleitung - Ziele und Motivation Ereignisraum I Definition Die Menge aller möglichen Ergebnisse eines Zufallsexperiments wird Ereignisraum genannt und mit Ω bezeichent. Beispiele: Wurf eines Würfel: Ω = {1, 2, 3, 4, 5, 6} Ziehung der Lottozahlen: n Ω = {1, 2, 3, 4, 5, 6}, {1, 2, 3, 4, 5, 7}, . . . , {1, 2, 3, 4, 5, 49}, {1, 2, 3, 4, 6, 7}, . . . , {1, 2, 3, 4, 6, 49}, . . . , {44, 45, 46, 47, 48, 49} o Anzahl der Notrufe pro Jahr in Leipzig: Ω = {0, 1, 2, . . . } = N0 Ergebnis eines Schwangerschaftstests: Ω = {0, 1} Dauer einer Blinddram-OP: Ω = (0, ∞) 5 / 50 Einleitung - Ziele und Motivation Ereignisraum II 3 grundlegende verschiedene Fälle 1 Ω ist endlich, z.B. Ω = {0, 1} 2 Ω ist unendlich, aber abzählbar, z.B. Ω = N0 3 Ω ist unendlich und überabzählbar, z.B. Ω = (0, 10) Beachte Eine Menge M heißt abzählbar wenn es eine Bijektion zwischen M und den natürlichen Zahlen N gibt. (d.h. man kann die Elemente der Menge M “durchnummerieren”) Abzählbare Mengen: N, Z, Q, 2N = {2, 4, 6, 8, . . . }, . . . Überabzählbare Mengen: R, C, (0, 1), . . . 6 / 50 Einleitung - Ziele und Motivation Rechnen mit (Teil-)mengen Sind A und B Teilmengen aus Ω, also A, B ⊆ Ω dann enthält die Vereinigung A ∪ B alle Elemente aus Ω die entweder in A oder B oder in beiden Mengen liegen enthält der Schnitt A ∩ B alle Elemente aus Ω die sowohl in A als auch in B liegen enthält die Differenz A \ B alle Elemente aus Ω die A aber nicht in B liegen enthält Ā alle Elemente aus Ω die nicht in A liegen Abkürzenden Schreibweisen: Tn Ai = A1 ∩ A2 ∩ · · · ∩ An Si=1 n i=1 Ai = A1 ∪ A2 ∪ · · · ∪ An 7 / 50 Einleitung - Ziele und Motivation Rechenregeln für (Teil-)mengen Kommutativgesetze: A ∩ B = B ∩ A, und A ∪ B = B ∪ A Assoziativgesetze: A ∩ (B ∩ C ) = (A ∩ B) ∩ C A ∪ (B ∪ C ) = (A ∪ B) ∪ C Distributivgesetze: A ∩ (B ∪ C ) = (A ∩ B) ∪ (A ∩ C ) A ∪ (B ∩ C ) = (A ∪ B) ∩ (A ∪ C ) De Morgansche Regeln: A ∩ B = A ∪ B, und A ∪ B = A ∩ B aus A ⊂ B folgt B ⊂ A und A \ B = A ∩ B 8 / 50 Einleitung - Ziele und Motivation Ereignissystem, σ-Algebra Definition Eine Menge A von Teilmengen von Ω wird σ-Alegebra genannt, falls Ω∈A falls A ∈ A dann auch Ā ∈ A falls A1 , A2 , A3 , · · · ∈ A dann auch S∞ i=1 Ai ∈A Beispiele: P(Ω) = die Menge aller Teilmengen von Ω Bei uns wird das fast immer die richtige Wahl sein. Würfel: Ω = {1, 2, 3, 4, 5, 6}, A = {∅, {1, 2}, {3, 4, 5, 6}, {1, 2, 3, 4, 5, 6}} Beachte: Im folgenden werden wir (der Einfachkeit halber) die σ-Algebra oft nicht explizit erwähnen. 9 / 50 Einleitung - Ziele und Motivation Ereignisse Definition Ein A ∈ A wird Ereignis genannt. Damit ist jedes Ereignis eine Teilmenge von Ω. Beispiele: Würfel: Ω = {1, 2, 3, 4, 5, 6}, A = {2, 4, 6} = b “Würfeln einer geraden Zahl” Blinddarm-OP: Ω = (0, ∞), A = (0, 20) = b “Die OP dauert weniger als 20 min” Spezialfälle: A = {ω} für ein ω ∈ Ω, dann heißt A Elementarereignis A = ∅ unmögliches Ereignis A = Ω sicheres Ereignis für A ⊆ Ω heißt Ā := Ω \ A Gegenereignis 10 / 50 Einleitung - Ziele und Motivation Rechnen mit Ereignissen UND: A ∩ B - heißt A und B treten gleichzeitig ein ODER: A ∪ B - heißt entweder A oder B oder beide treten ein MINUS: A \ B - heißt es tritt A aber nicht B ein Da Ereignisse Teilmengen von Ω sind gelten die die die die Kommutativgesetze Assoziativgesetze Distributivgesetze und De Morganschen Regeln. 11 / 50 Axiomatische Einführung Was ist dieses P? Ziel: Jedem Ereignis A soll eine Wahrscheinlichkeit zugeordnet werden. Diese soll die Chance beurteilen, dass das Ereignis A eintritt. Definition Sei Ω ein Ereignisraum und A eine σ-Alegebra über Ω. Sei P eine Abbildung die jedem A ∈ A eine Zahl aus [0, 1] zuordnet und die folgenden Eigenschaften erfüllt: 1 2 P(Ω) = 1 P S = ∞ P ∞ A i i=1 i=1 P(Ai ) falls alle A1 , A2 , · · · ∈ A und für alle i 6= j gilt Ai ∩ Aj = ∅ Dann nennen wir P Wahrscheinlichkeitsmaß auf Ω und P(A) die Wahrscheinlichkeit eines Ereignis A ∈ A. Das Tripel (Ω, A, P) heißt dann Wahrscheinlichkeitsraum oder Wahrscheinlichkeitsmodell. 12 / 50 Axiomatische Einführung Rechnen mit Wahrscheinlichkeiten Sei (Ω, A, P) ein Wahrscheinlichkeitsraum und A, B ∈ A, dann gilt: P(∅) = 0, P(A ∪ B) = P(A) + P(B), falls A ∩ B = ∅, P(Ā) = 1 − P(A), P(A) ≤ 1, P(A) ≤ P(B) falls A ⊆ B P(A ∪ B) = P(A) + P(B) − P(A ∩ B) und P(A) = P(A ∩ B̄) + P(A ∩ B) P(B \ A) = P(B) − P(A) falls A ⊆ B 13 / 50 Axiomatische Einführung Aufgabe 1 zu Wahrscheinlichkeiten Ansteckend oder nicht? In einem Krankenhaus sei bekannt, dass der Anteil der Patienten die an Rückenbeschwerden leiden und gleichzeitig eine ansteckende Krankheit besitzen bei 5% liegt. Außerdem weiß man dass 10% der Patienten des Krankenhauses an Rückenbeschwerden leiden, aber keine ansteckende Krankheit besitzen. Weiter ist bekannt, dass 19% der Patienten mindestens eins der beiden Krankeitsbilder aufweisen. Wie groß ist die Wahrscheinlichkeit, dass ein zufällig ausgewählter Patient eine ansteckende Krankheit besitzt? Wie groß ist der Anteil der Patienten mit Rückenbeschwerden? 14 / 50 Axiomatische Einführung Laplacesches Modell Definition Ein Wahrscheinlichkeitsmodell heißt Laplacesches Modell, falls Ω endlich ist (also Ω = {ω1 , . . . , ωn }) und P({ω1 }) = · · · = P({ωn }) = 1 . n In dieser Situation kann man für ein beliebiges A ∈ P(Ω) die Wahrscheinlichkeit wie folgt bestimmen: P(A) = |A| m = , |Ω| n wobei m = |A| die Anzahl der Elemente in A ist. Es gilt also: P(A) = Anzahl günstiger Elementarereignisse . Anzahl aller Elementarereignisse Man sagt dann: P ist die Gleichverteilung auf Ω. 15 / 50 Axiomatische Einführung Aufgabe 2 zu Wahrscheinlichkeiten Zwei Würfel Bestimme die Wahrscheinlichkeit beim Wurf mit 2 Wüfeln mindestens die Augensumme 10 zu erreichen! 16 / 50 Kombinatorik Kombinatorik Fragestellung Wieviele Möglichkeiten gibt es aus einer n-elementigen Menge k Elemente auszuwählen? Dabei sind die Spielregeln zu klären! Insbesondere ist wichtig: Spielt die Reihefolge eine ein Rolle? Dürfen Elemente mehrfach ausgewählt werden (Ziehen mit zurück legen oder nicht)? 17 / 50 Kombinatorik Reihfolge wichtig Reihefolge wichtig, Wiederholung möglich Variation von n Elementen zur k-ten Klasse mit Wiederholungen v̄nk = nk Reihefolge wichtig, Wiederholung nicht möglich Variation von n Elementen zur k-ten Klasse ohne Wiederholungen vnk = n · (n − 1) · ... · (n − (k − 1)) = n! (n − k)! Beachte: n! = n · (n − 1) · ... · 2 · 1 Wichtiger Spezialfall: n = k dann vnk = n! Dies beschreibt die Anzahl der möglichen Anordnungen von n Elementen (=Permutationen). 18 / 50 Kombinatorik Reihfolge nicht wichtig Reihefolge nicht wichtig, Wiederholung möglich Kombination von n Elementen zur k-ten Klasse mit Wiederholungen n+k −1 (n + k − 1)! k c̄n = = k!(n − 1)! k Reihefolge nicht wichtig, Wiederholung nicht möglich Kombination von n Elementen zur k-ten Klasse ohne Wiederholungen n n! k = cn = k k!(n − k)! Wichtiger Spezialfall: n = k dann cnk = 1 19 / 50 Bedingte Wahrscheinlichkeit Bedingte Wahrscheinlichkeit, Wozu brauchen wir das? Frage Wie verändert sich die Wahrscheinlichkeit eines Ereignisses, falls ich Zusatzwissen mit einfließen lasse? Ereignisse können sich gegenseitig beeinflussen falls bekannt ist, dass ein Ereignis eingetreten ist, kann sich die Wahrscheinlichkeit für das Eintreten eines anderen Ereignisses ändern 20 / 50 Bedingte Wahrscheinlichkeit Bedingte Wahrscheinlichkeit, Wozu brauchen wir das? Beispiel 1 HIV Prävalenz liegt weltweit bei 0, 8%, also P1 ({zufällig ausgewählte Person ist HIV positiv}) = 0.008. Modell 1: Ω = {0, 1}, P1 ({1}) = 0.008, P1 ({0}) = 0.992 Zusatzwissen: ausgewählte Person ist Europäer und HIV Prävalenz in Europa liegt bei 0, 2%. Jetzt gilt also P2 ({zufällig ausgewählte Person ist HIV positiv}) = 0.002. Modell 2: Ω = {0, 1}, P2 ({1}) = 0.002, P2 ({0}) = 0.998 Problem Wie kombiniert man die beiden Modelle? Wir wollen nicht gleichzeitig mit 2 verschiedenen P’s rechnen! WK für HIV positiv unter nicht-Europäern? 21 / 50 Bedingte Wahrscheinlichkeit Bedingte Wahrscheinlichkeit, Wozu brauchen wir das? Beispiel 2 Wurf mit zwei Würfeln: Wie groß ist die Wahrscheinlichkeit, dass die Augensumme mindestens 10 ergibt, falls man schon weiß dass ein Würfel (a) eine 1 zeigt, oder (b) eine 6 zeigt? 22 / 50 Bedingte Wahrscheinlichkeit Bedingte Wahrscheinlichkeit, Definition Definition Sei (Ω, A, P) ein Wahrscheinlichkeitsraum und seien A, B ∈ A zwei Ereinisse mit P(B) > 0. Dann definieren wir P(A | B) := P(A ∩ B) P(B) und nennen P(A | B) die Wahrscheinlichkeit von A bedingt auf B. Interpretation: “Wie groß ist die Wahrscheinlichkeit von A, wenn ich schon weiß dass B eingetreten ist” 23 / 50 Bedingte Wahrscheinlichkeit Bedingte Wahrscheinlichkeit, Aufgabe Aufgabe Wurf mit zwei Würfeln: Wie groß ist die Wahrscheinlichkeit, dass die Augensumme mindestens 10 ergibt, falls man schon weiß dass ein Würfel (a) eine 1 zeigt, oder (b) eine 6 zeigt? 24 / 50 Bedingte Wahrscheinlichkeit Rechnen mit bedingten Wahrscheinlichkeiten Sei (Ω, A, P) ein Wahrscheinlichkeitsraum und A, A1 , A2 , B ∈ A Ereignisse mit P(B) > 0. Dann gilt P(B | B) = 1 und P(∅ | B) = 0 falls A ∩ B = ∅ dann P(A | B) = 0 P(Ā | B) = 1 − P(A | B) P(A1 ∪ A2 | B) = P(A1 | B) + P(A2 | B) − P(A1 ∩ A2 | B) falls B ⊂ A dann P(A | B) = 1 falls A ⊂ B dann P(A | B) = P(A) P(B) 25 / 50 Bedingte Wahrscheinlichkeit Formel von der totalen Wahrscheinlichkeit Formel von der totalen Wahrscheinlichkeit Seien B1 , . . . , Bn ∈ A mit Sn i=1 Bi = Ω und Bi ∩ Bj = ∅ falls i 6= j (paarweise disjunkt) P(Bi ) > 0 für alle i = 1, . . . , n dann gilt für beliebiges A ∈ A P(A) = n X P(A | Bi ) · P(Bi ) i=1 26 / 50 Bedingte Wahrscheinlichkeit Formel von Bayes Formel von Bayes Seien B1 , . . . , Bn ∈ A mit Sn i=1 Bi = Ω und Bi ∩ Bj = ∅ falls i 6= j (paarweise disjunkt) P(Bi ) > 0 für alle i = 1, . . . , n dann gilt für beliebiges A ∈ A mit P(A) > 0 und j ∈ {1, . . . , n} P(Bj | A) = P(A | Bj ) · P(Bj ) P(A | Bj ) · P(Bj ) = Pn P(A) i=1 P(A | Bi ) · P(Bi ) 27 / 50 Bedingte Wahrscheinlichkeit Aufgabe 1 zur bedingten Wahrscheinlichkeit Aufgabe zur Prävalenz von HIV HIV Prävalenz liegt weltweit bei 0, 8% und in Europa bei 0.2%. Es gibt etwa 7 Milliarden Menschen auf der Erde und etwa 740 Mio davon leben in Europa. Wie groß ist die Wahrscheinlichkeit, dass ein zufällig ausgewählter Europäer HIV-positiv ist? Wie groß ist die Wahrscheinlichkeit, dass ein zufällig ausgewählter Nicht-Europäer HIV-positiv ist? 28 / 50 Bedingte Wahrscheinlichkeit Zuverlässigkeit von Tests Definition Sensitivität := Wahrscheinlichkeit, dass Test “positiv” anzeigt, wenn richtig-positiv man tatsächlich “positiv” ist. Spezifität := Wahrscheinlichkeit, dass Test “negativ” anzeigt, wenn richtig-negativ man tatsächlich “negativ” ist. Übersicht Test positiv Test negativ krank richtig-positiv falsch-negativ gesund falsch-positiv richtig-negativ 29 / 50 Bedingte Wahrscheinlichkeit Aufgabe 2 zur bedingten Wahrscheinlichkeit Aufgabe zur Zuverlässigkeit von HIV Speicheltests Für einen HIV Speicheltest werden folgende Werte angegeben: Sensitivität = 0.98, Spezifität = 0.997. Außerdem wissen wir: Einwohner in Deutschland = 80, 8 Mio, HIV Infizierte in Deutschland = 78000. Wie hoch ist die Wahrscheinlichkeit, dass eine positiv geteste Person tatsächlich kein HIV-Träger ist? Wie hoch ist die Wahrscheinlichkeit, dass eine negativ geteste Person tatsächlich HIV-Träger ist? 30 / 50 Bedingte Wahrscheinlichkeit zur Lösung Ereignisse: K := {Patient krank}, P := {Test ist positiv} Gegeben: P(P | K ) = 0.98 und P(P̄ | K̄ ) = 0.997 und 78000 P(K ) = 80800000 ≈ 0.001 Gesucht: P(K̄ | P) und P(K | P̄) Bayes sagt: P(K̄ | P) = P(P | K̄ )P(K̄ ) 0.003 · 0.999 = 0.003 · 0.999 + 0.98 · 0.001 P(P | K̄ )P(K̄ ) + P(P | K )P(K ) = 0.7535831 (absolut krass!) und P(K | P̄) = P(P̄ | K )P(K ) 0.02 · 0.001 = 0.02 · 0.001 + 0.997 · 0.999 P(P̄ | K )P(K ) + P(P̄ | K̄ )P(K̄ ) = 0.00002008 31 / 50 Unabhängigkeit und Unkorreliertheit Unabhängigkeit Definition Zwei Ereignisse A, B ∈ A heißen stochastisch unabhängig wenn P(A ∩ B) = P(A) · P(B). Sind A und B unabhängig und P(B) > 0, dann gilt P(A | B) = P(A ∩ B) P(A)P(B) = = P(A). P(B) P(B) 32 / 50 Unabhängigkeit und Unkorreliertheit Eigenschaften unabhängiger Ereignisse A und B disjunkt und P(A) > 0 und P(B) > 0 ⇒ A und B stochastisch abhängig Sind A und B stochastisch unabhängig, so sind A und B̄ stochastisch unabhängig Ā und B stochastisch unabhängig Ā und B̄ stochastisch unabhängig ∅ und Ω sind zu jedem A ∈ A stochastisch unabhängig 33 / 50 Unabhängigkeit und Unkorreliertheit Beispiel - Münze und Würfel Wir werfen eine faire Münze (Werte 0 oder 1) und einen fairen Würfel (Werte 1, . . . , 6). Untersuchen Sie die folgenden Ereignisse auf Unabhängigkeit 1 A = {Wert der Münze ist 1} und B = {Wert des Würfel > 4} 2 A = {Wert der Münze ist 1} und C = {Wert des Würfel + Wert der Münze > 4} Möglichkeiten: (0, 1), (0, 2), (0, 3), (0, 4), (0, 5), (0, 6), (1, 1), (1, 2), (1, 3), (1, 4), (1, 5), (1, 6), Laplace-Experiment (alle haben WK 1/12) 1 P(A) = 6/12, P(B) = 4/12, P(A ∩ B) = 2/12 also P(A ∩ B) = 1/6 = 1/2 · 1/3 = P(A) · P(B) ⇒ unabhängig 2 P(A) = 6/12, P(C ) = 5/12, P(A ∩ C ) = 3/12 also P(A ∩ C ) = 1/4 6= 1/2 · 5/12 = P(A) · P(C ) ⇒ abhängig 34 / 50 Zufallsvariablen Zufallsvariablen Definition Sei (Ω, A, P) ein Wahrscheinlichkeitsraum. Dann heißt eine Abbildung X : Ω → R Zufallsvariable (oder Zufallsgröße) (Ω, A, P) falls für alle Intervalle I ⊆ R gilt: {ω ∈ Ω | X (ω) ∈ I } ∈ A (1) Eine ZV ordent also jedem Elementarereignis ein Zahl aus R zu. Oft interessiert man sich für Wahrscheinlichkeiten P({ω ∈ Ω | X (ω) ∈ I }) bzw. in Kurzschreibweise P(X ∈ I ) Bedingung (1) stellt sicher, dass solche Wahrscheinlichkeiten berechnet werden können 35 / 50 Zufallsvariablen Beispiel Zufallsvariable Würfelspiel Christine und Fabian spielen ein Würfelspiel. Jeder hat einen Würfel. Gewürfelt wird gleichzeitig. Das Ergebnis von Christines Würfel sagt wieviel Euro sie von Fabian bekommt. Das Ergebnis von Fabians Würfel sagt wieviel Euro er von Christine bekommt. Stellen Sie ein passendes wahrscheinlichkeitstheoretisches Modell auf und definieren Sie eine Zufallsvariable, die Christines (Netto-)Gewinn wiedergibt. Ω = {(i, j) | i, j ∈ {1, . . . , 6}} (1.Koord = Christines Würfel, 2.Koord = Fabians Würfel) A = P(Ω) (= Potenzmenge = {alle Teilengen von Ω }), P = Gleichverteilung auf Ω, da Laplace-Experiment Christines Gewinn ist z.B für Ergebnis (4, 1) gerade 4 − 1 = 3 Euro. Also definieren wir X : Ω → R, X ((i, j)) := i − j. 36 / 50 Zufallsvariablen Beispiel Zufallsvariable Würfelspiel, reloaded Christine und Fabian spielen wieder ihr Würfelspiel. Heute hat Christine nur 3 Euro dabei. Sie fragt sich, wie groß die Wahrscheinlichkeit ist, dass sie (netto) mehr als 3 Euro Verlust hat. Helfen Sie ihr! Gesucht P(X < −3). P(X < −3) = P({(i, j) ∈ Ω | i − j < −3}) = P({(1, 5), (1, 6), (2, 6)}) |{(1, 5), (1, 6), (2, 6)}| 3 1 = = = |Ω| 36 12 37 / 50 Zufallsvariablen Verteilungsfunktion Definition Sei (Ω, A, P) ein Wahrscheinlichkeitsraum und X eine Zufallsvariable. Die Funktion FX : R → R mit FX (x) := P(X ≤ x) heißt Verteilungsfunktion der Zufallsvariable X . Beispiel: Würfel, Ω = {1, . . . , 6}, X (ω) := ω dann 1 1/2 0 1 2 3 4 5 6 38 / 50 Zufallsvariablen Eigenschaften der Verteilungsfunktion Sei (Ω, A, P) ein Wahrscheinlichkeitsraum und X eine Zufallsvariable mit Verteilungsfunktion F . Dann gilt 0 ≤ F (x) ≤ 1 für alle x ∈ R für a ∈ R: P(X > a) = 1 − F (a) für a < b: P(a < X ≤ b) = F (b) − F (a) F ist monoton wachsend limx→−∞ F (x) = 0 limx→∞ F (x) = 1 für x0 ∈ R: limx&x0 F (x) = F (x0 ) (F ist rechtsstetig) 39 / 50 Zufallsvariablen Stetige vs. diskrete Zufallsvariablen Wichtige Unterscheidung: Diskrete Zufallsvariable: Eine ZV X heißt diskret, falls X nur endlich viele oder abzählbar unendlich viele Werte annehmen kann. Stetige Zufallsvariable: Eine ZV X heißt stetig, falls eine integrierbare Funktion f : R → R existiert, so dass für die Verteilungsfunktion F gilt Z x F (x) = f (y )dy . −∞ Diese Funktion f heißt Dichtefunktion der Zufallsvariable X . Die Art einer ZV (stetig oder diskret) entscheidet über Methoden zur Berechnung wichtiger Kenngrößen wie etwa dem Erwartungswert und der Varianz. 40 / 50 Zufallsvariablen Diskrete Zufallsvariablen Ist X eine diskrete ZV an, so nimmt X nur abzählbar viel Werte an (oder endlich viele), etwa x1 , x2 , x3 , . . . . Wir definieren damit für jedes i pi := P(X = xi ). Dann gilt für die Verteilungsfunktion X X F (x) = P(X ≤ x) = P(X = xi ) = pi i:xi ≤x Der Erwartungswert ist E(X ) := ∞ X i:xi ≤x xi pi i=1 Die Varianz ist ∞ X Var(X ) := (xi − E(X ))2 pi i=1 (nimmt X nur endlich (n ∈ N) viele Werte an, gehen die Summen jeweils bis n) 41 / 50 Zufallsvariablen Stetige Zufallsvariablen Ist X eine stetige ZV an mit Dichte f so gilt (nach Definition) für die Verteilungsfunktion Z x F (x) = P(X ≤ x) = f (y )dy −∞ Der Erwartungswert ist Z ∞ E(X ) := yf (y ) dy −∞ Die Varianz ist Z ∞ Var(X ) := (y − E(X ))2 f (y ) dy −∞ 42 / 50 Spezielle Verteilungen Spezielle Verteilungen siehe letzte Woche 43 / 50 Grenzwertsätze der Wahrscheinlichkeitsrechnung Was sind Grenzwertsätze? Kennt man die Verteilung einer ZV nicht, so kann man mittels vieler Wiederholungen des Experimentes mehr Informationen über die ZV sammeln Diese Experimente sollten (nach Möglichkeit) immer gleich ablaufen und sich gegenseitig nicht beeinflussen Die Grundlage dass man mit Hilfe vieler einzelner Experimente zu einer Aussage über die Tatsächliche Verteilung gelangt, bilden die Grenzwertsätze der Wahrscheinlichkeitsrechnung 44 / 50 Grenzwertsätze der Wahrscheinlichkeitsrechnung Beispiel Münzwurf Wir werfen eine Münze wieder und wieder (z.B 1000 mal) und notieren die Werte z.B. 0, 0, 1, 0, 1, 1, 1, . . . , 0, 0, 1 Wir erwarten dann 0 + 0 + 1 + 0 + 1 + 1 + 1 + ··· + 0 + 0 + 1 ≈ 0.5 1000 Warum erwarten wir das? Weil unsere Münze fair ist und in etwa der Hälfte der Fälle 1 erscheinen sollte. Die Formalisierung dieser Idee nennt sich Gesetz der großen Zahlen 45 / 50 Grenzwertsätze der Wahrscheinlichkeitsrechnung Weitere wichtige Gesetze/Sätze zum Nachschlagen Gesetz der Großen Zahlen Sagt, dass empirische Mittelwerte gegen den Erwartungswert konvergieren. Zentraler Grenzwertsatz Beantwortet die Frage warum die Normalverteilung so “normal” ist und sie hinter jeder Ecke lauert. Der Satz von Glivenko–Cantelli wird auch der “Hauptsatz der Statistik” genannt. WICHTIG! Sagt, dass die empirischen Verteilungsfunktionen gegen die tatsächliche Verteilungsfunktion konvergiert. Grenzwertsatz von Moivre/Laplace Ist ein Spezialfall des Zentralen Grenzwertsatz. Beantwortet die Frage warum sich die (diskrete) Binomialverteilung für große n fast wie die Normalverteilung verhält. Grenzwertsatz von Poisson Beantwortet die Frage warum die Binomialverteilung bei großem n auch manchmal der Poisson-Verteilung sehr ähnlich sein kann. 46 / 50 Aufgaben DNA Die menschliche DNA besteht aus etwa 3,2 Mrd Bausteinen, die sich jeweils nur um eine Base unterscheiden. Als Basen kommen nur Adenin, Guanin, Cytosin, und Thymin in Frage. Wieviel Möglichkeiten gibt es (theoretisch) eine DNA aus diesen Basen herzustellen? Elfmeterschießen I Für das Elfmeterschießen muß der Trainer 5 der 11 Spieler auf dem Platz benennen. Wie viele Möglichkeiten hat er bei der Bestimmung der Kandidaten? der Bestimmung der Reihenfolge der Schützen, nachdem die Kandidaten gewählt wurden? 47 / 50 Aufgaben Würfelspiel, rereloaded Geben Sie die Verteilungfunktion zur Zufallsvariable X (die Christines Nettogewinn beim Würfelspiel beschreibt) an. Ziegenproblem Nehme Sie an, Sie wären in einer Spielshow und hätten die Wahl zwischen drei Toren. Hinter einem der Tore ist ein Auto, hinter den anderen sind Ziegen. Sie wählen ein Tor, sagen wir, Tor Nummer 1, und der Showmaster, der weiß was hinter den Toren ist, öffnet ein anderes Tor, sagen wir, Nummer 3, hinter dem eine Ziege steht. Er fragt Sie nun: “Möchten Sie jetzt lieber das Tor Nummer Zwei?” Ist es von Vorteil, die Wahl des Tores zu ändern? 48 / 50 Aufgaben Grippeschutz In einer Gruppe von 900 Personen haben sich 600 prophylaktisch gegen Grippe impfen lassen. Nach einer bestimmten Zeit wurde jedes Gruppenmitglied danach befragt, wer an einer Grippe erkrankte. Die Ergebnisse werden in einer 4-Feldertafel dargestellt. mit Impfung ohne Impfung Summe erkrankt 60 120 180 nicht erkrankt 540 180 720 Summe 600 300 900 Das Ereignis A sei “Person ist geimpft” und das Ereignis B sei “Person ist erkrankt”. Berechnen Sie: P(A), P(B), P(A ∩ B), P(B | A), P(A | B), P(Ā ∩ B), P(B | Ā) Geben Sie die Bedeutung der einzelnen Ergebnisse an. 49 / 50 Aufgaben Schafe Das Schlachtgewicht von Schafen sei normalverteilt mit Mittelwert 60 kg und Standardabweichung 10 kg. Wie groß ist die Wahrscheinlichkeit, dass das Schlachtgewicht eines Schafes über 70 kg ist Elfmeterschießen II Die Wahrscheinlichkeit dass eine Spieler einen Elfmeter im Tor versenkt liegt bei 0, 82. Wie groß ist die Wahrscheinlichkeit dass von 5 Elefmeterschüzten mindestens 2 treffen. 50 / 50