Mathematik für Biologen Prof. Dr. Rüdiger W. Braun Heinrich-Heine-Universität Düsseldorf 14. Dezember 2011 Binomialverteilung Bedingte Wahrscheinlichkeit Diskrete Zufallsvariable und ihre Verteilungen 1 Binomialverteilung Tabellen 2 Bedingte Wahrscheinlichkeit Definition Unabhängigkeit Satz von der totalen Wahrscheinlichkeit Bayessche Formel 3 Diskrete Zufallsvariable und ihre Verteilungen Grundprinzipien Binomialverteilung Geometrische Verteilung Poissonverteilung 4 Erwartungswert und Varianz Erwartungswert Varianz und Streuung Rechenregeln Erwartungswert und Varianz Binomialverteilung Bedingte Wahrscheinlichkeit Diskrete Zufallsvariable und ihre Verteilungen Erwartungswert und Varianz Beispiel Pharmapräparat Beispiel: 47 Mäuse sind erkrankt Ein Präparat mit Heilungswahrscheinlichkeit 88% wird eingesetzt Mit welcher Wahrscheinlichkeit werden mindestens 40 Mäuse geheilt? Die Wahrscheinlichkeit, dass genau 40 Mäuse geheilt werden, wird gegeben durch die Binomialverteilung B47, 0.88 (40) Die Wahrscheinlichkeit, dass mindestens 40 Mäuse geheilt werden, beträgt 47 X k=40 B47, 0.88 (k) = 1 − 39 X k=0 B47, 0.88 (k) Binomialverteilung Bedingte Wahrscheinlichkeit Diskrete Zufallsvariable und ihre Verteilungen B47, 0.88(k) Graph von B47, 0.88 0.18 0.16 0.14 0.12 0.10 0.08 0.06 0.04 0.02 0.00 0 10 20 k 30 40 Erwartungswert und Varianz Binomialverteilung Bedingte Wahrscheinlichkeit Tabelle der Werte r 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 p 0. Pr Diskrete Zufallsvariable und ihre Verteilungen k=0 Bn, p (k) 0.85 00001 00002 00008 00029 00093 00274 00742 01832 04128 08463 15768 26660 40904 57047 72665 85309 93639 97931 99552 99952 Erwartungswert und Varianz für n = 47 0.86 0.87 0.88 0.89 00001 00003 00012 00043 00137 00398 01060 02571 05663 11311 20441 33384 49285 65962 80597 91050 96887 99278 99917 00001 00005 00018 00063 00199 00573 01503 03578 07707 14978 26208 41238 58411 74830 87606 95379 98847 99856 00002 00007 00026 00091 00286 00817 02115 04946 10408 19651 33208 50182 67964 83128 93236 98178 99754 00001 00002 00010 00038 00130 00408 01156 02957 06792 13952 25538 41543 60042 77447 90248 97153 99582 Binomialverteilung Bedingte Wahrscheinlichkeit Diskrete Zufallsvariable und ihre Verteilungen Erwartungswert und Varianz Pharmapräparat, Fortsetzung Die Wahrscheinlichkeit, dass mindestens 40 Mäuse geheilt werden, ist 39 X 1− B47, 0.88 (k) = 1 − 0.19651 = 0.80349 k=0 Binomialverteilung Bedingte Wahrscheinlichkeit Diskrete Zufallsvariable und ihre Verteilungen Erwartungswert und Varianz Nutzung von Zusatzinfo Die bedingte Wahrscheinlichkeit ist eine Wahrscheinlichkeit unter Berücksichtigung von Zusatzinformationen Beispielsweise ist für einen 50-jährigen die Wahrscheinlichkeit, 80 Jahre zu werden, (etwas) höher als für ein Neugeborenes Allgemein wird mit P(A|B) die Wahrscheinlichkeit von A bezeichnet, wenn bereits bekannt ist, dass B eingetreten ist Binomialverteilung Bedingte Wahrscheinlichkeit Diskrete Zufallsvariable und ihre Verteilungen Erwartungswert und Varianz Bedingte Wahrscheinlichkeit P(A|B) = P(A ∩ B) P(B) bezeichnet man als bedingte Wahrscheinlichkeit von A unter der Hypothese B Die Hypothese B ist also vorausgesetzt (im Beispiel ist jemand bereits 50 Jahre alt geworden) Das Ereignis A ist das Ereignis, dessen Wahrscheinlichkeit interessiert (im Beispiel ist A das Ereignis, älter als 80 zu werden) Man bezeichnet P(A) auch als totale Wahrscheinlichkeit, wenn man den Unterschied zu einer bedingten Wahrscheinlichkeit verdeutlichen will Binomialverteilung Bedingte Wahrscheinlichkeit Diskrete Zufallsvariable und ihre Verteilungen Erwartungswert und Varianz Rechenregeln P(A|B) ist eine Wahrscheinlichkeit für A, erfüllt also die Rechenregeln für Wahrscheinlichkeiten die wichtigste ist die Regel für die Wahrscheinlichkeit des Komplementärereignisses P(Ac |B) = 1 − P(A|B) Binomialverteilung Bedingte Wahrscheinlichkeit Diskrete Zufallsvariable und ihre Verteilungen Erwartungswert und Varianz Heuristische Begründung der Formel P(A|B) = P(A ∩ B) P(B) unter der Hypothese B ist B sicher, also P(B|B) = 1; daher wird durch P(B) geteilt unter der Hypothese B sind diejenigen Elementarereignisse von A, die nicht in B liegen, irrelevant; daher steht im Zähler P(A ∩ B) und nicht P(A) Binomialverteilung Bedingte Wahrscheinlichkeit Diskrete Zufallsvariable und ihre Verteilungen Erwartungswert und Varianz Begriffsklärung Im Wattenmeer kommen Europäische Austern und Chinesische Austern vor. Kurgäste können die beiden Arten nur schwer auseinander halten. Ein zufällig ausgewählter Kurgast findet zufällig eine Auster. Zwei Ereignisse interessieren A : “es handelt sich um eine europäische Auster” B : “der Finder hält sie für eine europäische Auster” Dann ist P(B|A) die Wahrscheinlichkeit, dass eine zufällig gefundene europäische Auster auch als solche erkannt wird, und P(A|B) ist die Wahrscheinlichkeit, dass man dem Finder glauben kann, wenn er behauptet, eine europäische Auster gefunden zu haben Binomialverteilung Bedingte Wahrscheinlichkeit Diskrete Zufallsvariable und ihre Verteilungen Erwartungswert und Varianz Beispiel zur bedingten Wahrscheinlichkeit Sei Em50 das Ereignis, dass ein männliches Neugeborenes ein Alter von mindestens 50 Jahren erreichen wird; laut (österreichischer) Sterbetafel ist P(Em50 ) = 0.919 für 80 Jahre P(Em80 ) = 0.365 für weibliche Neugeborene P(Ew 50 ) = 0.958 und P(Ew 80 ) = 0.566 dann wegen Em50 ∩ Em80 = Em80 P(Em80 |Em50 ) = 0.365 = 0.397 0.919 P(Ew 80 |Ew 50 ) = 0.566 = 0.591 0.958 und Binomialverteilung Bedingte Wahrscheinlichkeit Diskrete Zufallsvariable und ihre Verteilungen Erwartungswert und Varianz Produktformel P(A ∩ B) = P(A|B) · P(B) Insbesondere sind A und B genau dann unabhängig, wenn P(A|B) = P(A) Binomialverteilung Bedingte Wahrscheinlichkeit Diskrete Zufallsvariable und ihre Verteilungen Erwartungswert und Varianz Satz von der totalen Wahrscheinlichkeit Bekannt: totale Wahrscheinlichkeit P(B) und damit auch P(B c ) bedingte Wahrscheinlichkeiten P(A|B) und P(A|B c ) Gesucht: totale Wahrscheinlichkeit P(A) P(A) = P(A ∩ B) + P(A ∩ B c ) = P(A|B) · P(B) + P(A|B c ) · P(B c ) = P(A|B) · P(B) + P(A|B c ) · (1 − P(B)) Binomialverteilung Bedingte Wahrscheinlichkeit Diskrete Zufallsvariable und ihre Verteilungen Erwartungswert und Varianz Röntgenreihenuntersuchung auf TB In den 1960-er Jahren wurden Röntgenreihenuntersuchungen durchgeführt. Beispielhafte Daten: bei 94% aller Erkrankten schlägt der Test an bei 1% der Gesunden schlägt der Test an 99.8% aller Probanden sind gesund Welches Ereignis nennen wir A und welches B? B ist das Ereignis, dessen totale Wahrscheinlichkeit bekannt ist Zufällig herausgegriffener Proband A : “Verdacht auf TB” B : “an TB erkrankt” Binomialverteilung Bedingte Wahrscheinlichkeit Diskrete Zufallsvariable und ihre Verteilungen Erwartungswert und Varianz Röntgenreihenuntersuchungen, Fortsetzung P(B) = 0.002 (totale Wahrscheinlichkeit) P(A|B) = 0.94 (bedingte Wahrscheinlichkeit) P(A|B c ) = 0.01 (bedingte Wahrscheinlichkeit) Satz von der totalen Wahrscheinlichkeit P(A) = P(A|B) · P(B) + P(A|B c ) · P(B c ) = 0.94 · 0.002 + 0.01 · 0.998 = 0.00188 + 0.00998 = 0.01186 1.186% aller Probanden verlassen die Untersuchung mit einem Verdacht Binomialverteilung Bedingte Wahrscheinlichkeit Diskrete Zufallsvariable und ihre Verteilungen Erwartungswert und Varianz Bayessche Formel Bekannt: totale Wahrscheinlichkeit P(B) bedingte Wahrscheinlichkeiten P(A|B) und P(A|B c ) totale Wahrscheinlichkeit P(A) aus dem Satz von der totalen Wahrscheinlichkeit Gesucht: bedingte Wahrscheinlichkeit P(B|A) P(B|A) = P(A|B) · P(B) P(A) Binomialverteilung Bedingte Wahrscheinlichkeit Diskrete Zufallsvariable und ihre Verteilungen Erwartungswert und Varianz Röntgenreihenuntersuchung, Fortsetzung Mit welcher Wahrscheinlichkeit wird ein Kranker nicht endeckt? Mit welcher Wahrscheinlichkeit ist eine Verdachtsdiagnose falsch? Mit welcher Wahrscheinlichkeit wird eine falsche Diagnose gestellt? Binomialverteilung Bedingte Wahrscheinlichkeit Diskrete Zufallsvariable und ihre Verteilungen Erwartungswert und Varianz erste Frage Mit welcher Wahrscheinlichkeit wird ein Kranker nicht endeckt? P(Ac |B) = 1 − P(A|B) = 1 − 0.94 = 0.06 Die Wahrscheinlichkeit, dass ein Kranker für gesund gehalten wird, beträgt 6% Binomialverteilung Bedingte Wahrscheinlichkeit Diskrete Zufallsvariable und ihre Verteilungen Erwartungswert und Varianz zweite Frage Mit welcher Wahrscheinlichkeit ist eine Verdachtsdiagnose falsch? P(B c |A) = 1 − P(B|A) P(A|B) · P(B) =1− P(A) 0.94 · 0.002 =1− 0.01186 = 1 − 0.1585 = 0.8415 Wer mit Verdachtsdiagnose aus der Röntgenreihenuntersuchung kam, war mit nahezu 85% Wahrscheinlichkeit gesund. Binomialverteilung Bedingte Wahrscheinlichkeit Diskrete Zufallsvariable und ihre Verteilungen Erwartungswert und Varianz dritte Frage Mit welcher Wahrscheinlichkeit kommt es zu einer Fehldiagnose? Das ist eine totale Wahrscheinlichkeit, nämlich P(A ∩ B c ) + P(Ac ∩ B) = P(A|B c ) · P(B c ) + P(Ac |B) · P(B) = 0.06 · 0.002 + 0.01 · 0.998 = 0.0101 Die Wahrscheinlichkeit einer Fehldiagnose beträgt 1.01% Binomialverteilung Bedingte Wahrscheinlichkeit Diskrete Zufallsvariable und ihre Verteilungen Erwartungswert und Varianz Zufallsvariable Zufallsexperiment wird durchgeführt, dessen Ergebnis ein Wert ist Das ist der Wert der Zufallsvariablen Zufallsvariablen heißen meist X , Y Mathematisch ausgedrückt: Eine Zufallsvariable ordnet jedem Elementarereignis ω eine Zahl X (ω) zu Beispiel 10-facher Wurf eines fairen Würfels: Die Anzahl der Sechsen definiert eine Zufallsvariable X Zufallsvariable lenken den Blick auf die interessanten Daten, indem sie die Elementarereignisse ausblenden Eine Zufallsvariable heißt diskret, wenn alle ihre Werte ganze Zahlen sind Binomialverteilung Bedingte Wahrscheinlichkeit Diskrete Zufallsvariable und ihre Verteilungen Erwartungswert und Varianz Interpretation Wahrscheinlichkeitstheorie Zufallsvariable X Ereignisraum Ω Elementarereignis ω Wert X (ω) Experiment Messvorrichtung Menge aller möglichen Versuchsabläufe beobachteter Versuchsablauf beobachteter Messwert Binomialverteilung Bedingte Wahrscheinlichkeit Diskrete Zufallsvariable und ihre Verteilungen Erwartungswert und Varianz Schreibweisen X eine Zufallsvariable auf Ω. Wir schreiben zur Abkürzung (hierbei sind a und b irgendwelche Zahlen): {X = a} = {alle Elementarereignisse ω, für die X (ω) = a} {X ≤ a} = {alle Elementarereignisse ω, für die X (ω) ≤ a} {a < X ≤ b} = {alle Elementarereignisse ω, für die a < X (ω) ≤ b} usw. Binomialverteilung Bedingte Wahrscheinlichkeit Diskrete Zufallsvariable und ihre Verteilungen Erwartungswert und Varianz Beispiel zur Schreibweise Dreifacher Wurf einer fairen Münze, also Ω = {A, Z }3 X bezeichne die Anzahl der Würfe mit “Adler”. Dann kann X die Zahlen 0,1,2 und 3 annehmen {X = 2} = {(A, A, Z ), (A, Z , A), (Z , A, A)} 3 P(X = 2) = = 0.375 8 Statt P(X = 2) schreibt man auch PX (2) Dann ist PX eine Verteilung auf den ganzen Zahlen Binomialverteilung Bedingte Wahrscheinlichkeit Diskrete Zufallsvariable und ihre Verteilungen Erwartungswert und Varianz Binomialverteilung als PX Beispiel Ω = “Serien von n ja/nein-Experimenten” Erfolgswahrscheinlichkeit im Einzelfall sei p X zählt die Zahl der Erfolge P(X = k) = PX (k) = Bn,p (k) Binomialverteilung Bedingte Wahrscheinlichkeit Diskrete Zufallsvariable und ihre Verteilungen Erwartungswert und Varianz Geometrische Verteilung Die geometrische Verteilung modelliert Wartezeiten in getakteten Modellen Binomialverteilung Bedingte Wahrscheinlichkeit Diskrete Zufallsvariable und ihre Verteilungen Erwartungswert und Varianz Geometrische Verteilung, Beispiel Wurf eines fairen Würfels: Erfolgswahrscheinlichkeit im Einzelfall p = 1 6 Die Wahrscheinlichkeit, dass im ersten Wurf eine Sechs fällt, ist 1 = 0.1667 6 Die Wahrscheinlichkeit, dass die erste Sechs im zweiten Wurf fällt, ist 5 1 · = 0.1389 6 6 Binomialverteilung Bedingte Wahrscheinlichkeit Diskrete Zufallsvariable und ihre Verteilungen Erwartungswert und Varianz Beispiel, Fortsetzung Wurf eines fairen Würfels: Die Wahrscheinlichkeit, dass die erste Sechs im dritten Wurf fällt, ist 2 1 5 · = 0.1157 6 6 Die Wahrscheinlichkeit, dass die erste Sechs im k-ten Wurf fällt, ist k−1 5 1 · 6 6 Binomialverteilung Bedingte Wahrscheinlichkeit Diskrete Zufallsvariable und ihre Verteilungen Erwartungswert und Varianz Geometrische Verteilung: Definition Die geometrische Verteilung zum Parameter p wird gegeben durch Gp (k) = (1 − p)k−1 · p In einem ja/nein-Experiments, bei dem die Erfolgswahrscheinlichkeit im Einzelfall gleich p ist, gebe die Zufallsvariable X die Nummer des Zugs mit dem ersten Erfolg an. Dann ist X verteilt gemäß Gp . Binomialverteilung Bedingte Wahrscheinlichkeit Diskrete Zufallsvariable und ihre Verteilungen Erwartungswert und Varianz G1/6(k) Stabdiagramm von G1/6 0.18 W'keit für erste 6 im k-ten Wurf 0.16 0.14 0.12 0.10 0.08 0.06 0.04 0.02 0.000 2 4 6 8 10 12 14 k Binomialverteilung Bedingte Wahrscheinlichkeit Diskrete Zufallsvariable und ihre Verteilungen Erwartungswert und Varianz Poissonverteilung Die Poissonverteilung modelliert seltene Ereignisse Selten bedeutet, dass sich die Einzelereignisse nicht beeinflussen Es sei λ > 0. Die Poissonverteilung zum Parameter λ ist definiert durch λk −λ ·e Pλ (k) = k! Binomialverteilung Bedingte Wahrscheinlichkeit Diskrete Zufallsvariable und ihre Verteilungen Erwartungswert und Varianz Poissonverteilung, Bedeutung Unter den folgenden Voraussetzungen ist eine Zufallsvariable X poissonverteilt zum Parameter λ: X zählt das Auftreten eines Ereignisses pro Zähleinheit Im Mittel treten λ Ereignisse pro Zähleinheit auf Die Ereignisse beeinflussen sich nicht gegenseitig Binomialverteilung Bedingte Wahrscheinlichkeit Diskrete Zufallsvariable und ihre Verteilungen Erwartungswert und Varianz Beispiel: α-Strahlung Versuchsaufbau: Wir beobachten die Einschläge von α-Teilchen in eine Zelle Im Mittel gebe es einen Einschlag alle 10 Minuten, also 6 Einschläge pro Stunde. Welcher Prozentsatz der Zellen übersteht eine Stunde ohne Einschlag? Es ist λ = 6, und wir suchen den Wert von Pλ für k = 0 Pλ (0) = λ0 −λ e = e −6 = 0.002479 0! Nur ungefähr jede 400-te Zelle bleibt unbeschädigt Binomialverteilung Bedingte Wahrscheinlichkeit Diskrete Zufallsvariable und ihre Verteilungen Erwartungswert und Varianz P 6 ( k) Stabdiagramm von P6 0.18 0.16 0.14 0.12 0.10 0.08 0.06 0.04 0.02 0.00 0 2 4 6 k 8 10 12 14 Binomialverteilung Bedingte Wahrscheinlichkeit Diskrete Zufallsvariable und ihre Verteilungen Erwartungswert und Varianz Erwartungswert Der Erwartungswert ist derjenige Wert, den man im Mittel beobachten würde, wenn man das Experiment sehr oft wiederholt. Bei einer Lotterie ist der Erwartungswert der Betrag, bei dem die Lotterie fair wäre, bei dem also weder der Spieler noch der Betreiber langfristig Geld verdienen würde. Binomialverteilung Bedingte Wahrscheinlichkeit Diskrete Zufallsvariable und ihre Verteilungen Erwartungswert und Varianz Spiel 77 Klasse I II III IV V VI VII Ziffern 7 6 5 4 3 2 1 Gewinn 177 777.00e 77 777.00e 7 777.00e 777.00e 77.00e 17.00e 5.00e P(X = k) 0.000 000 1 0.000 001 0 0.000 010 0 0.000 100 0 0.001 000 0 0.010 000 0 0.100 000 0 E (X ) = 0.998e k · P(X = k) 0.018e 0.078e 0.078e 0.078e 0.077e 0.170e 0.500e Binomialverteilung Bedingte Wahrscheinlichkeit Diskrete Zufallsvariable und ihre Verteilungen Erwartungswert und Varianz Variante des Spiels 77 Der Einsatz beträgt 2.50e. Bei welchem Hauptgewinn wäre das Spiel fair? Hauptgewinn sei J. Dann E (X ) = 0.000 000 1 · J + 0.000 001 · 77 7777 + 0.000 01 · 7 777 + 0.000 1 · 777 + 0.001 · 77 + 0.01 · 17 + 0.1 · 5 = 0.000 000 1 · J + 0.980 Das soll gleich 2.50 sein. Also 0.000 000 1 · J = 1.52 J= 1.52 = 15 200 000 0.000 000 1 Spiel 77 ist fair bei einem Hauptgewinn von 15.2 Millionen e Binomialverteilung Bedingte Wahrscheinlichkeit Diskrete Zufallsvariable und ihre Verteilungen Erwartungswert X eine diskrete Zufallsvariable Der Erwartungswert von X ist X E (X ) = P(X = k) · k k Die Summe läuft über alle Werte k von X Erwartungswert und Varianz Binomialverteilung Bedingte Wahrscheinlichkeit Diskrete Zufallsvariable und ihre Verteilungen Erwartungswert und Varianz Beispiel: Würfel Sei X die Augenzahl eines fairen Würfels. 1 1 1 1 1 1 ·1+ ·2+ ·3+ ·4+ ·5+ ·6 6 6 6 6 6 6 21 7 = = = 3.5 6 2 E (X ) = Im Mittel zeigt ein fairer Würfel 3.5 Augen Binomialverteilung Bedingte Wahrscheinlichkeit Diskrete Zufallsvariable und ihre Verteilungen Erwartungswert und Varianz Varianz und Streuung Die Varianz einer Zufallsvariablen X ist definiert als Var (X ) = ∞ X (k − µ)2 · P(X = k) k=0 wobei µ = E (X ). Die Standardabweichung oder Streuung von X ist definiert als die Wurzel aus der Varianz p σ = Var (X ) Binomialverteilung Bedingte Wahrscheinlichkeit Diskrete Zufallsvariable und ihre Verteilungen Erwartungswert und Varianz Gleicher Erwartungswert, unterschiedliche Streuung 0 10 20 30 40 0 10 20 30 40 k Links: Verteilung X1 mit E (X1 ) = 16 und σ = 4 Rechts: Verteilung X2 mit E (X2 ) = 16 und σ = 1.26 Binomialverteilung Bedingte Wahrscheinlichkeit Diskrete Zufallsvariable und ihre Verteilungen Modell vs. Datensatz Datensatz arithmetisches Mittel empirische Varianz Stichprobenstreuung Modell Erwartungswert Varianz Streuung Erwartungswert und Varianz Binomialverteilung Bedingte Wahrscheinlichkeit Diskrete Zufallsvariable und ihre Verteilungen Erwartungswert und Varianz Rechenregeln Rechenregeln für den Erwartungswert Für jede Zahl c und jede Zufallsvariable X ist E (c · X ) = c · E (X ) Für Zufallsvariablen X1 , . . . , Xn ist E (X1 + · · · + Xn ) = E (X1 ) + · · · + E (Xn ) Rechenregeln für die Varianz Für jede Zahl a und jede Zufallsvariable X gilt Var (a + X ) = Var (X ) Für Zahl c und jede Zufallsvariable X gilt Var (c · X ) = c 2 · Var (X ) Für jede Zufallsvariable X gilt Var (X ) = E (X 2 ) − E (X )2 Binomialverteilung Bedingte Wahrscheinlichkeit Diskrete Zufallsvariable und ihre Verteilungen Erwartungswert und Varianz Unabhängigkeit von Zufallsvariablen Zwei diskrete Zufallsvariable X und Y sind stochastisch unabhängig, wenn für alle möglichen Werte k und m P(X = k, Y = m) = P(X = k) · P(Y = m) Die Unabhängigkeit muss durch die Versuchsplanung gesichert werden Binomialverteilung Bedingte Wahrscheinlichkeit Diskrete Zufallsvariable und ihre Verteilungen Erwartungswert und Varianz Zusätzliche Rechenregeln für unabhängige Zufallsvariable Produktformel für den Erwartungswert: X und Y seien unabhängige Zufallsvariable. Dann E (X · Y ) = E (X ) · E (Y ) Summenformel für die Varianz: X und Y seien unabhängige Zufallsvariable. Dann Var (X + Y ) = Var (X ) + Var (Y )