Diskrete Zufallsvariable und ihre Verteilungen Erwartungswert und Varianz Mathematik für Biologen Prof. Dr. Rüdiger W. Braun Heinrich-Heine-Universität Düsseldorf 19. Dezember 2012 Diskrete Zufallsvariable und ihre Verteilungen 1 Diskrete Zufallsvariable und ihre Verteilungen Grundprinzipien Binomialverteilung Geometrische Verteilung Poissonverteilung 2 Erwartungswert und Varianz Erwartungswert Erwartungswert und Varianz Diskrete Zufallsvariable und ihre Verteilungen Diskrete Zufallsvariable und ihre Verteilungen Erwartungswert und Varianz Diskrete Zufallsvariable und ihre Verteilungen Erwartungswert und Varianz Zufallsvariable Zufallsexperiment wird durchgeführt, dessen Ergebnis ein Wert ist Das ist der Wert der Zufallsvariablen Zufallsvariablen heißen meist X , Y Mathematisch ausgedrückt: Eine Zufallsvariable ordnet jedem Elementarereignis ω eine Zahl X (ω) zu Beispiel 10-facher Wurf eines fairen Würfels: Die Anzahl der Sechsen definiert eine Zufallsvariable X Zufallsvariable lenken den Blick auf die interessanten Daten, indem sie die Elementarereignisse ausblenden Eine Zufallsvariable heißt diskret, wenn alle ihre Werte ganze Zahlen sind Diskrete Zufallsvariable und ihre Verteilungen Erwartungswert und Varianz Interpretation Wahrscheinlichkeitstheorie Zufallsvariable X Ereignisraum Ω Elementarereignis ω Wert X (ω) Experiment Messvorrichtung Menge aller möglichen Versuchsabläufe beobachteter Versuchsablauf beobachteter Messwert Diskrete Zufallsvariable und ihre Verteilungen Erwartungswert und Varianz Schreibweisen X eine Zufallsvariable auf Ω. Wir schreiben zur Abkürzung (hierbei sind a und b irgendwelche Zahlen): {X = a} = {alle Elementarereignisse ω, für die X (ω) = a} {X ≤ a} = {alle Elementarereignisse ω, für die X (ω) ≤ a} {a < X ≤ b} = {alle Elementarereignisse ω, für die a < X (ω) ≤ b} usw. Diskrete Zufallsvariable und ihre Verteilungen Erwartungswert und Varianz Beispiel zur Schreibweise Dreifacher Wurf einer fairen Münze, also Ω = {A, Z }3 X bezeichne die Anzahl der Würfe mit “Adler”. Dann kann X die Zahlen 0,1,2 und 3 annehmen {X = 2} = {(A, A, Z ), (A, Z , A), (Z , A, A)} 3 P(X = 2) = = 0.375 8 Statt P(X = 2) schreibt man auch PX (2) Dann ist PX eine Verteilung auf den ganzen Zahlen Diskrete Zufallsvariable und ihre Verteilungen Erwartungswert und Varianz Binomialverteilung als PX Beispiel Ω = “Serien von n ja/nein-Experimenten” Erfolgswahrscheinlichkeit im Einzelfall sei p X zählt die Zahl der Erfolge P(X = k) = PX (k) = Bn,p (k) Diskrete Zufallsvariable und ihre Verteilungen Erwartungswert und Varianz Geometrische Verteilung Die geometrische Verteilung modelliert Wartezeiten in getakteten Modellen Diskrete Zufallsvariable und ihre Verteilungen Erwartungswert und Varianz Geometrische Verteilung, Beispiel Wurf eines fairen Würfels: Erfolgswahrscheinlichkeit im Einzelfall p = 1 6 Die Wahrscheinlichkeit, dass im ersten Wurf eine Sechs fällt, ist 1 = 0.1667 6 Die Wahrscheinlichkeit, dass die erste Sechs im zweiten Wurf fällt, ist 5 1 · = 0.1389 6 6 Diskrete Zufallsvariable und ihre Verteilungen Erwartungswert und Varianz Beispiel, Fortsetzung Wurf eines fairen Würfels: Die Wahrscheinlichkeit, dass die erste Sechs im dritten Wurf fällt, ist 2 1 5 · = 0.1157 6 6 Die Wahrscheinlichkeit, dass die erste Sechs im k-ten Wurf fällt, ist k−1 5 1 · 6 6 Diskrete Zufallsvariable und ihre Verteilungen Erwartungswert und Varianz Geometrische Verteilung: Definition Die geometrische Verteilung zum Parameter p wird gegeben durch Gp (k) = (1 − p)k−1 · p In einem ja/nein-Experiments, bei dem die Erfolgswahrscheinlichkeit im Einzelfall gleich p ist, gebe die Zufallsvariable X die Nummer des Zugs mit dem ersten Erfolg an. Dann ist X verteilt gemäß Gp . Diskrete Zufallsvariable und ihre Verteilungen Erwartungswert und Varianz G1/6(k) Stabdiagramm von G1/6 0.18 W'keit für erste 6 im k-ten Wurf 0.16 0.14 0.12 0.10 0.08 0.06 0.04 0.02 0.000 2 4 6 8 10 12 14 k Diskrete Zufallsvariable und ihre Verteilungen Erwartungswert und Varianz Geometrische Verteilung: Beispiel In einer bestimmten Bucht beträgt im Juli die Wahrscheinlichkeit einer Walbeobachtung an einem zufällig ausgewählte Tag 15% Mit welcher Wahrscheinlichkeit sieht man 7 Tage lang keinen einzigen Wal? Wie groß ist die Wahrscheinlichkeit, dass man seinen ersten Wal am siebten Tag sieht? Diskrete Zufallsvariable und ihre Verteilungen Erwartungswert und Varianz Walbeobachtung, Fortsetzung Erste Frage: Mit welcher Wahrscheinlichkeit sieht man 7 Tage lang keinen einzigen Wal? 7 unabhängige ja/nein-Experimente: Binomialverteilung Erfolgswahrscheinlichkeit im Einzelfall p = 0.15 gesucht: Wahrscheinlichkeit von 0 Erfolgen 7 0 B7 0.15 (0) = p (1 − p)7 = 0.857 = 0.3206 0 Die Wahrscheinlichkeit, dass 7 Tage lang kein einziger Wal beobachtet wird, beträgt 32% Diskrete Zufallsvariable und ihre Verteilungen Erwartungswert und Varianz Walbeobachtung, Fortsetzung Zweite Frage Wie groß ist die Wahrscheinlichkeit, dass man seinen ersten Wal am siebten Tag sieht? Wartezeit in getaktetem Modell: Geometrische Verteilung gesucht: Wahscheinlichkeit, dass erster Erfolgt im siebten Versuch eintritt, wenn Erfolgswahrscheinlichkeit im Einzelfall p = 0.15 G0.15 (7) = 0.856 · 0.15 = 0.0566 Die Wahrscheinlichkeit, dass die erste Walbeobachtung am siebten Tag statt findet, beträgt 5.7% Diskrete Zufallsvariable und ihre Verteilungen Erwartungswert und Varianz Poissonverteilung Die Poissonverteilung modelliert seltene Ereignisse Selten bedeutet, dass sich die Einzelereignisse nicht beeinflussen Es sei λ > 0. Die Poissonverteilung zum Parameter λ ist definiert durch λk −λ ·e Pλ (k) = k! Diskrete Zufallsvariable und ihre Verteilungen Erwartungswert und Varianz Poissonverteilung, Bedeutung Unter den folgenden Voraussetzungen ist eine Zufallsvariable X poissonverteilt zum Parameter λ: X zählt das Auftreten eines Ereignisses pro Zähleinheit Im Mittel treten λ Ereignisse pro Zähleinheit auf Die Ereignisse beeinflussen sich nicht gegenseitig Diskrete Zufallsvariable und ihre Verteilungen Erwartungswert und Varianz Beispiel: α-Strahlung Versuchsaufbau: Wir beobachten die Einschläge von α-Teilchen in eine Zelle Im Mittel gebe es einen Einschlag alle 10 Minuten, also 6 Einschläge pro Stunde. Welcher Prozentsatz der Zellen übersteht eine Stunde ohne Einschlag? Es ist λ = 6, und wir suchen den Wert von Pλ für k = 0 Pλ (0) = λ0 −λ e = e −6 = 0.002479 0! Nur ungefähr jede 400-te Zelle bleibt unbeschädigt Diskrete Zufallsvariable und ihre Verteilungen Erwartungswert und Varianz P 6 ( k) Stabdiagramm von P6 0.18 0.16 0.14 0.12 0.10 0.08 0.06 0.04 0.02 0.00 0 2 4 6 k 8 10 12 14 Diskrete Zufallsvariable und ihre Verteilungen Erwartungswert und Varianz Erwartungswert und Varianz Diskrete Zufallsvariable und ihre Verteilungen Erwartungswert und Varianz Erwartungswert Der Erwartungswert ist derjenige Wert, den man im Mittel beobachten würde, wenn man das Experiment sehr oft wiederholt. Bei einer Lotterie ist der Erwartungswert der Betrag, bei dem die Lotterie fair wäre, bei dem also weder der Spieler noch der Betreiber langfristig Geld verdienen würde. Diskrete Zufallsvariable und ihre Verteilungen Erwartungswert und Varianz Spiel 77 Klasse I II III IV V VI VII Ziffern 7 6 5 4 3 2 1 Gewinn 177 777.00e 77 777.00e 7 777.00e 777.00e 77.00e 17.00e 5.00e P(X = k) 0.000 000 1 0.000 001 0 0.000 010 0 0.000 100 0 0.001 000 0 0.010 000 0 0.100 000 0 E (X ) = 0.998e k · P(X = k) 0.018e 0.078e 0.078e 0.078e 0.077e 0.170e 0.500e Diskrete Zufallsvariable und ihre Verteilungen Erwartungswert und Varianz Variante des Spiels 77 Der Einsatz beträgt 2.50e. Bei welchem Hauptgewinn wäre das Spiel fair? Hauptgewinn sei J. Dann E (X ) = 0.000 000 1 · J + 0.000 001 · 77 7777 + 0.000 01 · 7 777 + 0.000 1 · 777 + 0.001 · 77 + 0.01 · 17 + 0.1 · 5 = 0.000 000 1 · J + 0.980 Das soll gleich 2.50 sein. Also 0.000 000 1 · J = 1.52 J= 1.52 = 15 200 000 0.000 000 1 Spiel 77 ist fair bei einem Hauptgewinn von 15.2 Millionen e