Einleitung - Ziele und Motivation Übersicht Statistisches Lernen 1 Einleitung - Ziele und Motivation 2 Axiomatische Einführung des Begriffes “Wahrscheinlichkeit” Was ist dieses P? 3 Kombinatorik 4 Bedingte Wahrscheinlichkeit 5 Unabhängigkeit und Unkorreliertheit 6 Zufallsvariablen 7 Spezielle Verteilungen 8 Grenzwertsätze der Wahrscheinlichkeitsrechnung 9 Aufgaben Einheit 3: Wahrscheinlichkeitsrechnung Dr. rer. nat. Fabian Schwarzenberger Institut für Medizinische Informatik, Statistik und Epidemiologie Universität Leipzig WS 2014/2015 1 / 50 2 / 50 Einleitung - Ziele und Motivation Einleitung - Ziele und Motivation Ziele und Motivation Zufallsexperiment Ein Zufallsexperiment ist ein Vorgang Auffrischung des Wissens aus dem Bachelor-Studium der einem genau festgelegtem Plan folgt, bei dem alle möglichen Ergebnisse vorab bekannt sind, Beschreibung von Zufallssituationen mit Hilfe von Ereignissen/ Berechnung der zugehörigen Wahrscheinlichkeiten dessen Ausgang nicht vorhergesagt werden kann. (hier steckt der Zufall) Umgang mit Zufallsvariablen und ihren Verteilungen Beispiele: Wichtige Verteilungen kennen lernen Grenzwertsätze - Warum brauche ich große Fallzahlen? Wurf eines Würfel Gefühl für Wahrscheinlichkeiten entwickeln: Ziehung der Lottozahlen “Young man, in mathematics you don’t understand things. You just get used to them.” - John von Neumann Anzahl der Notrufe pro Jahr in Leipzig Ergebnis eines Schwangerschaftstests Dauer einer Blinddram-OP 3 / 50 4 / 50 Einleitung - Ziele und Motivation Einleitung - Ziele und Motivation Ereignisraum I Ereignisraum II Definition Die Menge aller möglichen Ergebnisse eines Zufallsexperiments wird Ereignisraum genannt und mit Ω bezeichent. 3 grundlegende verschiedene Fälle Beispiele: Wurf eines Würfel: Ω = {1, 2, 3, 4, 5, 6} Ziehung der Lottozahlen: n Ω = {1, 2, 3, 4, 5, 6}, {1, 2, 3, 4, 5, 7}, . . . , {1, 2, 3, 4, 5, 49}, {1, 2, 3, 4, 6, 7}, . . . , {1, 2, 3, 4, 6, 49}, . . . , {44, 45, 46, 47, 48, 49} o 1 Ω ist endlich, z.B. Ω = {0, 1} 2 Ω ist unendlich, aber abzählbar, z.B. Ω = N0 3 Ω ist unendlich und überabzählbar, z.B. Ω = (0, 10) Beachte Eine Menge M heißt abzählbar wenn es eine Bijektion zwischen M und den natürlichen Zahlen N gibt. (d.h. man kann die Elemente der Menge M “durchnummerieren”) Anzahl der Notrufe pro Jahr in Leipzig: Ω = {0, 1, 2, . . . } = N0 Abzählbare Mengen: N, Z, Q, 2N = {2, 4, 6, 8, . . . }, . . . Ergebnis eines Schwangerschaftstests: Ω = {0, 1} Überabzählbare Mengen: R, C, (0, 1), . . . Dauer einer Blinddram-OP: Ω = (0, ∞) 5 / 50 Einleitung - Ziele und Motivation 6 / 50 Einleitung - Ziele und Motivation Rechnen mit (Teil-)mengen Rechenregeln für (Teil-)mengen Kommutativgesetze: Sind A und B Teilmengen aus Ω, also A, B ⊆ Ω dann enthält die Vereinigung A ∪ B alle Elemente aus Ω die entweder in A oder B oder in beiden Mengen liegen A ∩ B = B ∩ A, und A ∪ B = B ∪ A Assoziativgesetze: A ∩ (B ∩ C ) = (A ∩ B) ∩ C enthält der Schnitt A ∩ B alle Elemente aus Ω die sowohl in A als auch in B liegen A ∪ (B ∪ C ) = (A ∪ B) ∪ C enthält die Differenz A \ B alle Elemente aus Ω die A aber nicht in B liegen Distributivgesetze: A ∩ (B ∪ C ) = (A ∩ B) ∪ (A ∩ C ) enthält Ā alle Elemente aus Ω die nicht in A liegen A ∪ (B ∩ C ) = (A ∪ B) ∩ (A ∪ C ) Abkürzenden Schreibweisen: Tn Ai = A1 ∩ A2 ∩ · · · ∩ An Si=1 n i=1 Ai = A1 ∪ A2 ∪ · · · ∪ An De Morgansche Regeln: A ∩ B = A ∪ B, und A ∪ B = A ∩ B aus A ⊂ B folgt B ⊂ A und A \ B = A ∩ B 7 / 50 8 / 50 Einleitung - Ziele und Motivation Einleitung - Ziele und Motivation Ereignissystem, σ-Algebra Ereignisse Definition Ein A ∈ A wird Ereignis genannt. Definition Eine Menge A von Teilmengen von Ω wird σ-Alegebra genannt, falls Damit ist jedes Ereignis eine Teilmenge von Ω. Ω∈A falls A ∈ A dann auch Ā ∈ A falls A1 , A2 , A3 , · · · ∈ A dann auch S∞ i=1 Ai ∈A Beispiele: P(Ω) = die Menge aller Teilmengen von Ω Bei uns wird das fast immer die richtige Wahl sein. Würfel: Ω = {1, 2, 3, 4, 5, 6}, A = {∅, {1, 2}, {3, 4, 5, 6}, {1, 2, 3, 4, 5, 6}} Beachte: Im folgenden werden wir (der Einfachkeit halber) die σ-Algebra oft nicht explizit erwähnen. Beispiele: Würfel: Ω = {1, 2, 3, 4, 5, 6}, A = {2, 4, 6} = b “Würfeln einer geraden Zahl” Blinddarm-OP: Ω = (0, ∞), A = (0, 20) = b “Die OP dauert weniger als 20 min” Spezialfälle: A = {ω} für ein ω ∈ Ω, dann heißt A Elementarereignis A = ∅ unmögliches Ereignis A = Ω sicheres Ereignis für A ⊆ Ω heißt Ā := Ω \ A Gegenereignis 10 / 50 9 / 50 Einleitung - Ziele und Motivation Axiomatische Einführung Rechnen mit Ereignissen Was ist dieses P? Ziel: Jedem Ereignis A soll eine Wahrscheinlichkeit zugeordnet werden. Diese soll die Chance beurteilen, dass das Ereignis A eintritt. UND: A ∩ B - heißt A und B treten gleichzeitig ein Definition Sei Ω ein Ereignisraum und A eine σ-Alegebra über Ω. Sei P eine Abbildung die jedem A ∈ A eine Zahl aus [0, 1] zuordnet und die folgenden Eigenschaften erfüllt: ODER: A ∪ B - heißt entweder A oder B oder beide treten ein MINUS: A \ B - heißt es tritt A aber nicht B ein Da Ereignisse Teilmengen von Ω sind gelten 1 die die die die Kommutativgesetze Assoziativgesetze Distributivgesetze und De Morganschen Regeln. 2 P(Ω) = 1 S P ∞ P ∞ A i=1 i = i=1 P(Ai ) falls alle A1 , A2 , · · · ∈ A und für alle i 6= j gilt Ai ∩ Aj = ∅ Dann nennen wir P Wahrscheinlichkeitsmaß auf Ω und P(A) die Wahrscheinlichkeit eines Ereignis A ∈ A. Das Tripel (Ω, A, P) heißt dann Wahrscheinlichkeitsraum oder Wahrscheinlichkeitsmodell. 11 / 50 12 / 50 Axiomatische Einführung Axiomatische Einführung Rechnen mit Wahrscheinlichkeiten Aufgabe 1 zu Wahrscheinlichkeiten Sei (Ω, A, P) ein Wahrscheinlichkeitsraum und A, B ∈ A, dann gilt: Ansteckend oder nicht? In einem Krankenhaus sei bekannt, dass der Anteil der Patienten die an Rückenbeschwerden leiden und gleichzeitig eine ansteckende Krankheit besitzen bei 5% liegt. Außerdem weiß man dass 10% der Patienten des Krankenhauses an Rückenbeschwerden leiden, aber keine ansteckende Krankheit besitzen. Weiter ist bekannt, dass 19% der Patienten mindestens eins der beiden Krankeitsbilder aufweisen. P(∅) = 0, P(A ∪ B) = P(A) + P(B), falls A ∩ B = ∅, P(Ā) = 1 − P(A), P(A) ≤ 1, P(A) ≤ P(B) falls A ⊆ B P(A ∪ B) = P(A) + P(B) − P(A ∩ B) und P(A) = P(A ∩ B̄) + P(A ∩ B) Wie groß ist die Wahrscheinlichkeit, dass ein zufällig ausgewählter Patient eine ansteckende Krankheit besitzt? P(B \ A) = P(B) − P(A) falls A ⊆ B Wie groß ist der Anteil der Patienten mit Rückenbeschwerden? 14 / 50 13 / 50 Axiomatische Einführung Axiomatische Einführung Laplacesches Modell Aufgabe 2 zu Wahrscheinlichkeiten Definition Ein Wahrscheinlichkeitsmodell heißt Laplacesches Modell, falls Ω endlich ist (also Ω = {ω1 , . . . , ωn }) und P({ω1 }) = · · · = P({ωn }) = 1 . n Zwei Würfel Bestimme die Wahrscheinlichkeit beim Wurf mit 2 Wüfeln mindestens die Augensumme 10 zu erreichen! In dieser Situation kann man für ein beliebiges A ∈ P(Ω) die Wahrscheinlichkeit wie folgt bestimmen: P(A) = |A| m = , |Ω| n wobei m = |A| die Anzahl der Elemente in A ist. Es gilt also: P(A) = Anzahl günstiger Elementarereignisse . Anzahl aller Elementarereignisse Man sagt dann: P ist die Gleichverteilung auf Ω. 15 / 50 16 / 50 Kombinatorik Kombinatorik Kombinatorik Reihfolge wichtig Reihefolge wichtig, Wiederholung möglich Variation von n Elementen zur k-ten Klasse mit Wiederholungen Fragestellung Wieviele Möglichkeiten gibt es aus einer n-elementigen Menge k Elemente auszuwählen? Dabei sind die Spielregeln zu klären! Insbesondere ist wichtig: v̄nk = nk Reihefolge wichtig, Wiederholung nicht möglich Variation von n Elementen zur k-ten Klasse ohne Wiederholungen Spielt die Reihefolge eine ein Rolle? vnk = n · (n − 1) · ... · (n − (k − 1)) = Dürfen Elemente mehrfach ausgewählt werden (Ziehen mit zurück legen oder nicht)? n! (n − k)! Beachte: n! = n · (n − 1) · ... · 2 · 1 Wichtiger Spezialfall: n = k dann vnk = n! Dies beschreibt die Anzahl der möglichen Anordnungen von n Elementen (=Permutationen). 17 / 50 Kombinatorik 18 / 50 Bedingte Wahrscheinlichkeit Reihfolge nicht wichtig Bedingte Wahrscheinlichkeit, Wozu brauchen wir das? Reihefolge nicht wichtig, Wiederholung möglich Kombination von n Elementen zur k-ten Klasse mit Wiederholungen n+k −1 (n + k − 1)! k c̄n = = k!(n − 1)! k Frage Wie verändert sich die Wahrscheinlichkeit eines Ereignisses, falls ich Zusatzwissen mit einfließen lasse? Reihefolge nicht wichtig, Wiederholung nicht möglich Kombination von n Elementen zur k-ten Klasse ohne Wiederholungen n n! k cn = = k k!(n − k)! Ereignisse können sich gegenseitig beeinflussen falls bekannt ist, dass ein Ereignis eingetreten ist, kann sich die Wahrscheinlichkeit für das Eintreten eines anderen Ereignisses ändern Wichtiger Spezialfall: n = k dann cnk = 1 19 / 50 20 / 50 Bedingte Wahrscheinlichkeit Bedingte Wahrscheinlichkeit Bedingte Wahrscheinlichkeit, Wozu brauchen wir das? Bedingte Wahrscheinlichkeit, Wozu brauchen wir das? Beispiel 1 HIV Prävalenz liegt weltweit bei 0, 8%, also P1 ({zufällig ausgewählte Person ist HIV positiv}) = 0.008. Beispiel 2 Wurf mit zwei Würfeln: Wie groß ist die Wahrscheinlichkeit, dass die Augensumme mindestens 10 ergibt, falls man schon weiß dass ein Würfel Modell 1: Ω = {0, 1}, P1 ({1}) = 0.008, P1 ({0}) = 0.992 Zusatzwissen: ausgewählte Person ist Europäer und HIV Prävalenz in Europa liegt bei 0, 2%. Jetzt gilt also (a) eine 1 zeigt, oder (b) eine 6 zeigt? P2 ({zufällig ausgewählte Person ist HIV positiv}) = 0.002. Modell 2: Ω = {0, 1}, P2 ({1}) = 0.002, P2 ({0}) = 0.998 Problem Wie kombiniert man die beiden Modelle? Wir wollen nicht gleichzeitig mit 2 verschiedenen P’s rechnen! WK für HIV positiv unter nicht-Europäern? 21 / 50 22 / 50 Bedingte Wahrscheinlichkeit Bedingte Wahrscheinlichkeit Bedingte Wahrscheinlichkeit, Definition Bedingte Wahrscheinlichkeit, Aufgabe Definition Sei (Ω, A, P) ein Wahrscheinlichkeitsraum und seien A, B ∈ A zwei Ereinisse mit P(B) > 0. Dann definieren wir P(A | B) := Aufgabe Wurf mit zwei Würfeln: Wie groß ist die Wahrscheinlichkeit, dass die Augensumme mindestens 10 ergibt, falls man schon weiß dass ein Würfel P(A ∩ B) P(B) (a) eine 1 zeigt, oder und nennen P(A | B) die Wahrscheinlichkeit von A bedingt auf B. (b) eine 6 zeigt? Interpretation: “Wie groß ist die Wahrscheinlichkeit von A, wenn ich schon weiß dass B eingetreten ist” 23 / 50 24 / 50 Bedingte Wahrscheinlichkeit Bedingte Wahrscheinlichkeit Rechnen mit bedingten Wahrscheinlichkeiten Formel von der totalen Wahrscheinlichkeit Sei (Ω, A, P) ein Wahrscheinlichkeitsraum und A, A1 , A2 , B ∈ A Ereignisse mit P(B) > 0. Dann gilt Formel von der totalen Wahrscheinlichkeit Seien B1 , . . . , Bn ∈ A mit Sn i=1 Bi = Ω und P(B | B) = 1 und P(∅ | B) = 0 falls A ∩ B = ∅ dann P(A | B) = 0 Bi ∩ Bj = ∅ falls i 6= j (paarweise disjunkt) P(Ā | B) = 1 − P(A | B) P(Bi ) > 0 für alle i = 1, . . . , n P(A1 ∪ A2 | B) = P(A1 | B) + P(A2 | B) − P(A1 ∩ A2 | B) dann gilt für beliebiges A ∈ A falls B ⊂ A dann P(A | B) = 1 falls A ⊂ B dann P(A | B) = P(A) = P(A) P(B) n X P(A | Bi ) · P(Bi ) i=1 26 / 50 25 / 50 Bedingte Wahrscheinlichkeit Bedingte Wahrscheinlichkeit Formel von Bayes Aufgabe 1 zur bedingten Wahrscheinlichkeit Formel von Bayes Seien B1 , . . . , Bn ∈ A mit Sn i=1 Bi = Ω und Aufgabe zur Prävalenz von HIV HIV Prävalenz liegt weltweit bei 0, 8% und in Europa bei 0.2%. Es gibt etwa 7 Milliarden Menschen auf der Erde und etwa 740 Mio davon leben in Europa. Bi ∩ Bj = ∅ falls i 6= j (paarweise disjunkt) P(Bi ) > 0 für alle i = 1, . . . , n Wie groß ist die Wahrscheinlichkeit, dass ein zufällig ausgewählter Europäer HIV-positiv ist? dann gilt für beliebiges A ∈ A mit P(A) > 0 und j ∈ {1, . . . , n} Wie groß ist die Wahrscheinlichkeit, dass ein zufällig ausgewählter Nicht-Europäer HIV-positiv ist? P(A | Bj ) · P(Bj ) P(A | Bj ) · P(Bj ) P(Bj | A) = = Pn P(A) i=1 P(A | Bi ) · P(Bi ) 27 / 50 28 / 50 Bedingte Wahrscheinlichkeit Bedingte Wahrscheinlichkeit Zuverlässigkeit von Tests Aufgabe 2 zur bedingten Wahrscheinlichkeit Definition Sensitivität := Wahrscheinlichkeit, dass Test “positiv” anzeigt, wenn man tatsächlich “positiv” ist. richtig-positiv Aufgabe zur Zuverlässigkeit von HIV Speicheltests Für einen HIV Speicheltest werden folgende Werte angegeben: Sensitivität = 0.98, Spezifität = 0.997. Außerdem wissen wir: Einwohner in Deutschland = 80, 8 Mio, HIV Infizierte in Deutschland = 78000. Spezifität := Wahrscheinlichkeit, dass Test “negativ” anzeigt, wenn richtig-negativ man tatsächlich “negativ” ist. Übersicht Test positiv Test negativ krank richtig-positiv falsch-negativ Wie hoch ist die Wahrscheinlichkeit, dass eine positiv geteste Person tatsächlich kein HIV-Träger ist? gesund falsch-positiv richtig-negativ Wie hoch ist die Wahrscheinlichkeit, dass eine negativ geteste Person tatsächlich HIV-Träger ist? 29 / 50 Bedingte Wahrscheinlichkeit 30 / 50 Unabhängigkeit und Unkorreliertheit zur Lösung Unabhängigkeit Ereignisse: K := {Patient krank}, P := {Test ist positiv} Gegeben: P(P | K ) = 0.98 und P(P̄ | K̄ ) = 0.997 und 78000 P(K ) = 80800000 ≈ 0.001 Gesucht: P(K̄ | P) und P(K | P̄) Definition Zwei Ereignisse A, B ∈ A heißen stochastisch unabhängig wenn Bayes sagt: P(P | K̄ )P(K̄ ) 0.003 · 0.999 P(K̄ | P) = = 0.003 · 0.999 + 0.98 · 0.001 P(P | K̄ )P(K̄ ) + P(P | K )P(K ) = 0.7535831 (absolut krass!) und P(K | P̄) = P(A ∩ B) = P(A) · P(B). Sind A und B unabhängig und P(B) > 0, dann gilt P(A | B) = P(A ∩ B) P(A)P(B) = = P(A). P(B) P(B) P(P̄ | K )P(K ) 0.02 · 0.001 = 0.02 · 0.001 + 0.997 · 0.999 P(P̄ | K )P(K ) + P(P̄ | K̄ )P(K̄ ) = 0.00002008 31 / 50 32 / 50 Unabhängigkeit und Unkorreliertheit Unabhängigkeit und Unkorreliertheit Eigenschaften unabhängiger Ereignisse Beispiel - Münze und Würfel Wir werfen eine faire Münze (Werte 0 oder 1) und einen fairen Würfel (Werte 1, . . . , 6). Untersuchen Sie die folgenden Ereignisse auf Unabhängigkeit A und B disjunkt und P(A) > 0 und P(B) > 0 ⇒ A und B stochastisch abhängig Sind A und B stochastisch unabhängig, so sind A und B̄ stochastisch unabhängig Ā und B stochastisch unabhängig Ā und B̄ stochastisch unabhängig 1 A = {Wert der Münze ist 1} und B = {Wert des Würfel > 4} 2 A = {Wert der Münze ist 1} und C = {Wert des Würfel + Wert der Münze > 4} Möglichkeiten: (0, 1), (0, 2), (0, 3), (0, 4), (0, 5), (0, 6), (1, 1), (1, 2), (1, 3), (1, 4), (1, 5), (1, 6), Laplace-Experiment (alle haben WK 1/12) ∅ und Ω sind zu jedem A ∈ A stochastisch unabhängig 1 P(A) = 6/12, P(B) = 4/12, P(A ∩ B) = 2/12 also P(A ∩ B) = 1/6 = 1/2 · 1/3 = P(A) · P(B) ⇒ unabhängig 2 P(A) = 6/12, P(C ) = 5/12, P(A ∩ C ) = 3/12 also P(A ∩ C ) = 1/4 6= 1/2 · 5/12 = P(A) · P(C ) ⇒ abhängig 33 / 50 Zufallsvariablen 34 / 50 Zufallsvariablen Zufallsvariablen Beispiel Zufallsvariable Definition Sei (Ω, A, P) ein Wahrscheinlichkeitsraum. Dann heißt eine Abbildung X : Ω → R Zufallsvariable (oder Zufallsgröße) (Ω, A, P) falls für alle Intervalle I ⊆ R gilt: {ω ∈ Ω | X (ω) ∈ I } ∈ A (1) Eine ZV ordent also jedem Elementarereignis ein Zahl aus R zu. Ω = {(i, j) | i, j ∈ {1, . . . , 6}} (1.Koord = Christines Würfel, 2.Koord = Fabians Würfel) A = P(Ω) (= Potenzmenge = {alle Teilengen von Ω }), P = Gleichverteilung auf Ω, da Laplace-Experiment Christines Gewinn ist z.B für Ergebnis (4, 1) gerade 4 − 1 = 3 Euro. Also definieren wir X : Ω → R, X ((i, j)) := i − j. Oft interessiert man sich für Wahrscheinlichkeiten P({ω ∈ Ω | X (ω) ∈ I }) bzw. in Kurzschreibweise Würfelspiel Christine und Fabian spielen ein Würfelspiel. Jeder hat einen Würfel. Gewürfelt wird gleichzeitig. Das Ergebnis von Christines Würfel sagt wieviel Euro sie von Fabian bekommt. Das Ergebnis von Fabians Würfel sagt wieviel Euro er von Christine bekommt. Stellen Sie ein passendes wahrscheinlichkeitstheoretisches Modell auf und definieren Sie eine Zufallsvariable, die Christines (Netto-)Gewinn wiedergibt. P(X ∈ I ) Bedingung (1) stellt sicher, dass solche Wahrscheinlichkeiten berechnet werden können 35 / 50 36 / 50 Zufallsvariablen Zufallsvariablen Beispiel Zufallsvariable Verteilungsfunktion Würfelspiel, reloaded Christine und Fabian spielen wieder ihr Würfelspiel. Heute hat Christine nur 3 Euro dabei. Sie fragt sich, wie groß die Wahrscheinlichkeit ist, dass sie (netto) mehr als 3 Euro Verlust hat. Helfen Sie ihr! Definition Sei (Ω, A, P) ein Wahrscheinlichkeitsraum und X eine Zufallsvariable. Die Funktion FX : R → R mit FX (x) := P(X ≤ x) heißt Verteilungsfunktion der Zufallsvariable X . Gesucht P(X < −3). Beispiel: Würfel, Ω = {1, . . . , 6}, X (ω) := ω dann P(X < −3) = P({(i, j) ∈ Ω | i − j < −3}) = P({(1, 5), (1, 6), (2, 6)}) |{(1, 5), (1, 6), (2, 6)}| 3 1 = = = |Ω| 36 12 1 1/2 0 1 2 3 4 5 6 38 / 50 37 / 50 Zufallsvariablen Zufallsvariablen Eigenschaften der Verteilungsfunktion Stetige vs. diskrete Zufallsvariablen Wichtige Unterscheidung: Sei (Ω, A, P) ein Wahrscheinlichkeitsraum und X eine Zufallsvariable mit Verteilungsfunktion F . Dann gilt 0 ≤ F (x) ≤ 1 für alle x ∈ R Diskrete Zufallsvariable: Eine ZV X heißt diskret, falls X nur endlich viele oder abzählbar unendlich viele Werte annehmen kann. Stetige Zufallsvariable: Eine ZV X heißt stetig, falls eine integrierbare Funktion f : R → R existiert, so dass für die Verteilungsfunktion F gilt Z für a ∈ R: P(X > a) = 1 − F (a) für a < b: P(a < X ≤ b) = F (b) − F (a) x F ist monoton wachsend F (x) = f (y )dy . −∞ limx→−∞ F (x) = 0 Diese Funktion f heißt Dichtefunktion der Zufallsvariable X . limx→∞ F (x) = 1 Die Art einer ZV (stetig oder diskret) entscheidet über Methoden zur Berechnung wichtiger Kenngrößen wie etwa dem Erwartungswert und der Varianz. für x0 ∈ R: limx&x0 F (x) = F (x0 ) (F ist rechtsstetig) 39 / 50 40 / 50 Zufallsvariablen Zufallsvariablen Diskrete Zufallsvariablen Stetige Zufallsvariablen Ist X eine diskrete ZV an, so nimmt X nur abzählbar viel Werte an (oder endlich viele), etwa x1 , x2 , x3 , . . . . Wir definieren damit für jedes i pi := P(X = xi ). Dann gilt für die Verteilungsfunktion X X F (x) = P(X ≤ x) = P(X = xi ) = pi i:xi ≤x Der Erwartungswert ist E(X ) := ∞ X −∞ Der Erwartungswert ist i:xi ≤x Z ∞ E(X ) := xi pi yf (y ) dy −∞ i=1 Die Varianz ist Ist X eine stetige ZV an mit Dichte f so gilt (nach Definition) für die Verteilungsfunktion Z x F (x) = P(X ≤ x) = f (y )dy Die Varianz ist ∞ X Var(X ) := (xi − E(X ))2 pi Z ∞ Var(X ) := (y − E(X ))2 f (y ) dy −∞ i=1 (nimmt X nur endlich (n ∈ N) viele Werte an, gehen die Summen jeweils bis n) 41 / 50 Spezielle Verteilungen 42 / 50 Grenzwertsätze der Wahrscheinlichkeitsrechnung Spezielle Verteilungen Was sind Grenzwertsätze? Kennt man die Verteilung einer ZV nicht, so kann man mittels vieler Wiederholungen des Experimentes mehr Informationen über die ZV sammeln siehe letzte Woche Diese Experimente sollten (nach Möglichkeit) immer gleich ablaufen und sich gegenseitig nicht beeinflussen Die Grundlage dass man mit Hilfe vieler einzelner Experimente zu einer Aussage über die Tatsächliche Verteilung gelangt, bilden die Grenzwertsätze der Wahrscheinlichkeitsrechnung 43 / 50 44 / 50 Grenzwertsätze der Wahrscheinlichkeitsrechnung Grenzwertsätze der Wahrscheinlichkeitsrechnung Beispiel Münzwurf Wir werfen eine Münze wieder und wieder (z.B 1000 mal) und notieren die Werte z.B. 0, 0, 1, 0, 1, 1, 1, . . . , 0, 0, 1 Wir erwarten dann 0 + 0 + 1 + 0 + 1 + 1 + 1 + ··· + 0 + 0 + 1 ≈ 0.5 1000 Warum erwarten wir das? Weil unsere Münze fair ist und in etwa der Hälfte der Fälle 1 erscheinen sollte. Die Formalisierung dieser Idee nennt sich Gesetz der großen Zahlen Weitere wichtige Gesetze/Sätze zum Nachschlagen Gesetz der Großen Zahlen Sagt, dass empirische Mittelwerte gegen den Erwartungswert konvergieren. Zentraler Grenzwertsatz Beantwortet die Frage warum die Normalverteilung so “normal” ist und sie hinter jeder Ecke lauert. Der Satz von Glivenko–Cantelli wird auch der “Hauptsatz der Statistik” genannt. WICHTIG! Sagt, dass die empirischen Verteilungsfunktionen gegen die tatsächliche Verteilungsfunktion konvergiert. Grenzwertsatz von Moivre/Laplace Ist ein Spezialfall des Zentralen Grenzwertsatz. Beantwortet die Frage warum sich die (diskrete) Binomialverteilung für große n fast wie die Normalverteilung verhält. Grenzwertsatz von Poisson Beantwortet die Frage warum die Binomialverteilung bei großem n auch manchmal der Poisson-Verteilung sehr ähnlich sein kann. 45 / 50 46 / 50 Aufgaben Aufgaben DNA Die menschliche DNA besteht aus etwa 3,2 Mrd Bausteinen, die sich jeweils nur um eine Base unterscheiden. Als Basen kommen nur Adenin, Guanin, Cytosin, und Thymin in Frage. Wieviel Möglichkeiten gibt es (theoretisch) eine DNA aus diesen Basen herzustellen? Elfmeterschießen I Für das Elfmeterschießen muß der Trainer 5 der 11 Spieler auf dem Platz benennen. Wie viele Möglichkeiten hat er bei der Bestimmung der Kandidaten? der Bestimmung der Reihenfolge der Schützen, nachdem die Kandidaten gewählt wurden? 47 / 50 Würfelspiel, rereloaded Geben Sie die Verteilungfunktion zur Zufallsvariable X (die Christines Nettogewinn beim Würfelspiel beschreibt) an. Ziegenproblem Nehme Sie an, Sie wären in einer Spielshow und hätten die Wahl zwischen drei Toren. Hinter einem der Tore ist ein Auto, hinter den anderen sind Ziegen. Sie wählen ein Tor, sagen wir, Tor Nummer 1, und der Showmaster, der weiß was hinter den Toren ist, öffnet ein anderes Tor, sagen wir, Nummer 3, hinter dem eine Ziege steht. Er fragt Sie nun: “Möchten Sie jetzt lieber das Tor Nummer Zwei?” Ist es von Vorteil, die Wahl des Tores zu ändern? 48 / 50 Aufgaben Aufgaben Grippeschutz In einer Gruppe von 900 Personen haben sich 600 prophylaktisch gegen Grippe impfen lassen. Nach einer bestimmten Zeit wurde jedes Gruppenmitglied danach befragt, wer an einer Grippe erkrankte. Die Ergebnisse werden in einer 4-Feldertafel dargestellt. mit Impfung ohne Impfung Summe erkrankt 60 120 180 nicht erkrankt 540 180 720 Schafe Das Schlachtgewicht von Schafen sei normalverteilt mit Mittelwert 60 kg und Standardabweichung 10 kg. Wie groß ist die Wahrscheinlichkeit, dass das Schlachtgewicht eines Schafes über 70 kg ist Summe 600 300 900 Das Ereignis A sei “Person ist geimpft” und das Ereignis B sei “Person ist erkrankt”. Berechnen Sie: Elfmeterschießen II Die Wahrscheinlichkeit dass eine Spieler einen Elfmeter im Tor versenkt liegt bei 0, 82. Wie groß ist die Wahrscheinlichkeit dass von 5 Elefmeterschüzten mindestens 2 treffen. P(A), P(B), P(A ∩ B), P(B | A), P(A | B), P(Ā ∩ B), P(B | Ā) Geben Sie die Bedeutung der einzelnen Ergebnisse an. 49 / 50 50 / 50