Erwartungswert Gesetz der seltenen Ereignisse und Gesetz der großen Zahl Mathematik für Biologen Prof. Dr. Rüdiger W. Braun Heinrich-Heine-Universität Düsseldorf 21. Dezember 2012 Erwartungswert Gesetz der seltenen Ereignisse und Gesetz der großen Zahl 1 Erwartungswert Erwartungswert Varianz und Streuung Rechenregeln Binomialverteilung Geometrische Verteilung Poissonverteilung 2 Gesetz der seltenen Ereignisse und Gesetz der großen Zahl Das Gesetz der seltenen Ereignisse Das schwache Gesetz der großen Zahl Erwartungswert Erwartungswert Gesetz der seltenen Ereignisse und Gesetz der großen Zahl Erwartungswert Gesetz der seltenen Ereignisse und Gesetz der großen Zahl Erwartungswert Der Erwartungswert ist derjenige Wert, den man im Mittel beobachten würde, wenn man das Experiment sehr oft wiederholt. Bei einer Lotterie ist der Erwartungswert der Betrag, bei dem die Lotterie fair wäre, bei dem also weder der Spieler noch der Betreiber langfristig Geld verdienen würde. Erwartungswert Gesetz der seltenen Ereignisse und Gesetz der großen Zahl Spiel 77 Klasse I II III IV V VI VII Ziffern 7 6 5 4 3 2 1 Gewinn k 177 777.00e 77 777.00e 7 777.00e 777.00e 77.00e 17.00e 5.00e P(X = k) 0.000 000 1 0.000 001 0 0.000 010 0 0.000 100 0 0.001 000 0 0.010 000 0 0.100 000 0 E (X ) = 0.998e k · P(X = k) 0.018e 0.078e 0.078e 0.078e 0.077e 0.170e 0.500e Erwartungswert Gesetz der seltenen Ereignisse und Gesetz der großen Zahl Erwartungswert X eine diskrete Zufallsvariable Der Erwartungswert von X ist X E (X ) = P(X = k) · k k Die Summe läuft über alle Werte k von X Erwartungswert Gesetz der seltenen Ereignisse und Gesetz der großen Zahl Beispiel: Würfel Sei X die Augenzahl eines fairen Würfels. 1 1 1 1 1 1 ·1+ ·2+ ·3+ ·4+ ·5+ ·6 6 6 6 6 6 6 21 7 = = = 3.5 6 2 E (X ) = Im Mittel zeigt ein fairer Würfel 3.5 Augen Erwartungswert Gesetz der seltenen Ereignisse und Gesetz der großen Zahl Varianz und Streuung Die Varianz einer Zufallsvariablen X ist definiert als Var (X ) = ∞ X (k − µ)2 · P(X = k) k=0 wobei µ = E (X ). Die Standardabweichung oder Streuung von X ist definiert als die Wurzel aus der Varianz p σ = Var (X ) Erwartungswert Gesetz der seltenen Ereignisse und Gesetz der großen Zahl Gleicher Erwartungswert, unterschiedliche Streuung 0 10 20 30 40 0 10 20 30 40 Links: Verteilung X1 mit E (X1 ) = 16 und σ = 4 Rechts: Verteilung X2 mit E (X2 ) = 16 und σ = 1.26 Erwartungswert Gesetz der seltenen Ereignisse und Gesetz der großen Zahl Modell vs. Datensatz Datensatz arithmetisches Mittel empirische Varianz Stichprobenstreuung Modell Erwartungswert Varianz Streuung Erwartungswert Gesetz der seltenen Ereignisse und Gesetz der großen Zahl Rechenregeln Rechenregeln für den Erwartungswert Für jede Zahl c und jede Zufallsvariable X ist E (c · X ) = c · E (X ) Für Zufallsvariablen X1 , . . . , Xn ist E (X1 + · · · + Xn ) = E (X1 ) + · · · + E (Xn ) Rechenregeln für die Varianz Für jede Zahl a und jede Zufallsvariable X gilt Var (a + X ) = Var (X ) Für Zahl c und jede Zufallsvariable X gilt Var (c · X ) = c 2 · Var (X ) Für jede Zufallsvariable X gilt Var (X ) = E (X 2 ) − E (X )2 Erwartungswert Gesetz der seltenen Ereignisse und Gesetz der großen Zahl Unabhängigkeit von Zufallsvariablen Zwei diskrete Zufallsvariable X und Y sind stochastisch unabhängig, wenn für alle möglichen Werte k und m P(X = k, Y = m) = P(X = k) · P(Y = m) Die Unabhängigkeit muss durch die Versuchsplanung gesichert werden Erwartungswert Gesetz der seltenen Ereignisse und Gesetz der großen Zahl Zusätzliche Rechenregeln für unabhängige Zufallsvariable Produktformel für den Erwartungswert: X und Y seien unabhängige Zufallsvariable. Dann E (X · Y ) = E (X ) · E (Y ) Summenformel für die Varianz: X und Y seien unabhängige Zufallsvariable. Dann Var (X + Y ) = Var (X ) + Var (Y ) Erwartungswert Gesetz der seltenen Ereignisse und Gesetz der großen Zahl Einzelnes ja/nein-Experiment Zufallsvariable X nimmt mit Wahrscheinlichkeit p den Wert 1 und mit Wahrscheinlichkeit 1 − p den Wert 0 an E (X ) = 1 X k · P(X = k) k=0 = 0 · (1 − p) + 1 · p =p Var (X ) = 1 X (k − E (X ))2 · P(X = k) k=0 2 = p · (1 − p) + (1 − p)2 · p = p · (1 − p) · (p + (1 − p)) = p · (1 − p) Erwartungswert Gesetz der seltenen Ereignisse und Gesetz der großen Zahl Erwartungswert der Binomialverteilung X1 , X2 , . . . , Xn seien Zufallsvariable jedes Xj nimmt mit Wahrscheinlichkeit p den Wert 1 und mit Wahrscheinlichkeit 1 − p den Wert 0 an Interpretation Xj = 1 ist “Erfolg” Y = X1 + X2 + · · · + Xn ist die Anzahl der Erfolge Y ist verteilt gemäß Bn,p E (X1 ) = E (X2 ) = · · · = E (Xn ) = p also E (Y ) = n · p Der Erwartungswert einer Bn,p -verteilten Zufallsvariable beträgt n · p Erwartungswert Gesetz der seltenen Ereignisse und Gesetz der großen Zahl Varianz der Binomialverteilung X1 , X2 , . . . , Xn seien unabhängige Zufallsvariable jedes Xj nimmt mit Wahrscheinlichkeit p den Wert 1 und mit Wahrscheinlichkeit 1 − p den Wert 0 an Y = X1 + X2 + · · · + Xn ist verteilt gemäß Bn,p Var (X1 ) = Var (X2 ) = · · · = Var (Xn ) = p · (1 − p) also Var (Y ) = n · p · (1 − p) Die Varianz einer Bn,p -verteilten Zufallsvariable beträgt n · p · (1 − p) Erwartungswert Gesetz der seltenen Ereignisse und Gesetz der großen Zahl B40,0.4(k) Stabdiagramm der Binomialverteilung 0.12 0.10 0.08 0.06 0.04 0.02 0.000 5 10 15 20 25 30 35 40 k Der Erwartungswert ist blau, alles innerhalb der Standardabweichung ist grün Erwartungswert Gesetz der seltenen Ereignisse und Gesetz der großen Zahl Erwartungswert und Varianz für die geometrische Verteilung Die Zufallsvariable X sei Gp -verteilt. Dann 1 p 1−p Var (X ) = p2 E (X ) = Erwartungswert Gesetz der seltenen Ereignisse und Gesetz der großen Zahl Stabdiagramm geometrische Verteilung 0.05 G0.05(k) 0.04 0.03 0.02 0.01 0.00 0 20 40 k 60 80 100 Geometrische Verteilung G0.05 . Der Erwartungswert ist blau, alles innerhalb der Standardabweichung ist grün. Erwartungswert Gesetz der seltenen Ereignisse und Gesetz der großen Zahl Beispiel: Walbeobachtung In einer bestimmten Bucht beträgt im Juli die Wahrscheinlichkeit einer Walbeobachtung an einem zufällig ausgewählte Tag 15% Wie viele Tage mit Walbeobachtung gibt es im Mittel in einer Woche? An welchem Tag sieht man im Mittel den ersten Wal? Erwartungswert Gesetz der seltenen Ereignisse und Gesetz der großen Zahl Walbeobachtung: Erste Frage Wie viele Tage mit Walbeobachtung gibt es im Mittel in einer Woche? Die Zufallsvariable X zählt die Tage mit Walbeobachtung in einer Woche X ist Bn, p -verteilt für n = 7 und p = 0.15 Also E (X ) = n · p = 7 · 0.15 = 1.05 Im Mittel gibt es pro Woche 1.05 Tage mit Walbeobachtung Erwartungswert Gesetz der seltenen Ereignisse und Gesetz der großen Zahl Walbeobachtung: Zweite Frage An welchem Tag sieht man im Mittel den ersten Wal? Die Zufallsvariable Y gibt den ersten Tag mit Walbeobachtung an. Y ist Gp -verteilt für p = 0.15 1 1 Also E (Y ) = = = 6.667 p 0.15 Im Mittel ist der siebte Tag der erste mit Walbeobachtung Erwartungswert Gesetz der seltenen Ereignisse und Gesetz der großen Zahl Erwartungswert und Varianz für die Poissonverteilung Die Zufallsvariable X sei Pλ -verteilt. Dann E (X ) = λ Var (X ) = λ Erwartungswert Gesetz der seltenen Ereignisse und Gesetz der großen Zahl P16(k) Stabdiagramm Poissonverteilung 0.12 0.10 0.08 0.06 0.04 0.02 0.000 5 10 15 20 25 30 35 40 k Poissonverteilung P16 . Der Erwartungswert ist blau, alles innerhalb der Standardabweichung ist grün. Erwartungswert Gesetz der seltenen Ereignisse und Gesetz der großen Zahl Gesetz der seltenen Ereignisse und Gesetz der großen Zahl Erwartungswert Gesetz der seltenen Ereignisse und Gesetz der großen Zahl Poissonverteilung Es sei λ > 0. Die Poissonverteilung zum Parameter λ ist definiert durch λk −λ Pλ (k) = ·e k! Unter den folgenden Voraussetzungen ist eine Zufallsvariable X poissonverteilt zum Parameter λ: X zählt das Auftreten eines Ereignisses pro Zähleinheit Im Mittel treten λ Ereignisse pro Zähleinheit auf Die Ereignisse beeinflussen sich nicht gegenseitig Erwartungswert Gesetz der seltenen Ereignisse und Gesetz der großen Zahl Beispiel Tumor Ein Tumor aus 160 Zellen wird bestrahlt Im Mittel stirbt jede Minute ein Zehntel aller Tumorzellen Mit welcher Wahrscheinlichkeit sterben 10 Zellen in der ersten Minute? Zwei Modelle sind angemessen Binomialverteilung Poissonverteilung Erwartungswert Gesetz der seltenen Ereignisse und Gesetz der großen Zahl Beispiel Tumor: Rechnung mit Binomialverteilung Modell: 160 unabhängige ja/nein-Experimente Erfolg : Tod der Tumorzelle Erfolgswahrscheinlichkeit im Einzelfall p = 0.1 Anzahl der Erfolge verteilt gemäß B160, 0.1 Antwort: 160 B160, 0.1 (10) = · 0.110 · 0.9150 = 0.03113 10 Erwartungswert Gesetz der seltenen Ereignisse und Gesetz der großen Zahl Beispiel Tumor: Rechnung mit Poissonverteilung Modell: seltenes Ereignis, das im Mittel 16 mal pro Minute auftritt Was ist hier selten? Für die einzelne Zelle sind Treffer selten Parameter der Poissonverteilung ist λ = 16 Anzahl der Ereignisse pro Zähleinheit ist verteilt gemäß P16 Antwort 1610 −16 e = 0.03410 10! Zum Vergleich B160, 0.1 (10) = 0.03113 P16 (10) = Erwartungswert Gesetz der seltenen Ereignisse und Gesetz der großen Zahl 0.12 0.10 0.08 0.06 0.04 0.02 0.000 5 10 15 20 25 30 35 40 k P16(k) B160,0.1(k) Vergleich Binomial- und Poissonverteilung 0.12 0.10 0.08 0.06 0.04 0.02 0.000 5 10 15 20 25 30 35 40 k Beide beschreiben einen Prozess mit 16 Erfolgen im Mittel. Der Unterschied ist, dass beim Poissonprozess die Anzahl der Erfolge potenziell unbeschränkt ist. Erwartungswert Gesetz der seltenen Ereignisse und Gesetz der großen Zahl Vergleich Binomial- und Poissonverteilung, Fortsetzung 0.12 0.10 0.08 0.06 0.04 0.02 0.000 5 10 15 20 25 30 35 40 k P16(k) B40,0.4(k) B40, 0.4 und P16 besitzen ebenfalls beide den Erwartungswert 16 0.12 0.10 0.08 0.06 0.04 0.02 0.000 5 10 15 20 25 30 35 40 k Erwartungswert Gesetz der seltenen Ereignisse und Gesetz der großen Zahl Gesetz der seltenen Ereignisse Die Poisson-Verteilung Pλ mit λ = n · p ist eine sehr gute Annäherung an die Binomialverteilung Bn,p , falls n ≥ 100 und n · p ≤ 10. Im Beispiel waren n = 160 p = 0.1 Die Annäherung ist daher nicht wirklich gut Erwartungswert Gesetz der seltenen Ereignisse und Gesetz der großen Zahl Messwiederholungen Warum erhöhen mehrere Messungen die Genauigkeit? Warum braucht man 100-mal so viele Messungen, um die Genauigkeit zu verzehnfachen? Erwartungswert Gesetz der seltenen Ereignisse und Gesetz der großen Zahl Rechenregeln für den Erwartungswert Für jede Zahl c und jede Zufallsvariable X ist E (c · X ) = c · E (X ) Für Zufallsvariablen X1 , . . . , Xn ist E (X1 + · · · + Xn ) = E (X1 ) + · · · + E (Xn ) X und Y unabhängige Zufallsvariable. Dann E (X · Y ) = E (X ) · E (Y ) Erwartungswert Gesetz der seltenen Ereignisse und Gesetz der großen Zahl Rechenregeln für die Varianz Für jede Zahl a und jede Zufallsvariable X gilt Var (a + X ) = Var (X ) Für Zahl c und jede Zufallsvariable X gilt Var (c · X ) = c 2 · Var (X ) X und Y unabhängige Zufallsvariable. Dann Var (X + Y ) = Var (X ) + Var (Y ) Erwartungswert Gesetz der seltenen Ereignisse und Gesetz der großen Zahl Zwei unabhängige, identisch verteilte Zufallsvariable X1 und X2 seien unabhängige Zufallsvariable, die derselben Verteilung gehorchen (also z. B. Messwiederholungen). Sei Y = 21 (X1 + X2 ) der Durchschnittswert Der Erwartungswert von X1 heiße µ, also E (X1 ) = E (X2 ) = µ Die Streuung von X1 heiße σ, also Var (X1 ) = Var (X2 ) = σ2 E (Y ) = 21 (E (X1 ) + E (X2 )) = µ 2 2 Var (Y ) = 12 Var (X1 ) + 12 Var (X2 ) = 14 σ2 + 14 σ2 = 12 σ2 σ Also ist √ die Streuung von Y 2 Erwartungswert Gesetz der seltenen Ereignisse und Gesetz der großen Zahl Das schwache Gesetz der großen Zahl “Mit ausreichend vielen Messwiederholungen lässt sich jede Genauigkeit erreichen” Präziser: X1 , . . . , Xn unabhängig, alle mit derselben Verteilung µ = E (X1 ) = · · · = E (Xn ) und σ2 = Var (X1 ) = · · · = Var (Xn ) 1 Y = (X1 + · · · + Xn ) n Y ist das arithmetische Mittel der X1 , X2 , . . . , Xn Dann E (Y ) = µ und die Streuung von Y beträgt σ σY = √ n Erwartungswert Gesetz der seltenen Ereignisse und Gesetz der großen Zahl Messwiederholungen: Beispiel 0 10 20 30 40 0 10 20 30 40 Links: Poissonverteilung P16 , Streuung ist 4 Rechts: Durchschnittswerte aus zehn P16 -verteilten 4 Zufallsvariablen, Streuung ist √ = 1.26 10 Erwartungswert Gesetz der seltenen Ereignisse und Gesetz der großen Zahl Versuchsplanung: α-Strahler Ein Geigerzähler registriert pro Sekunde ungefähr 25 α-Teilchen Dieser Wert soll so genau bestimmt werden, dass die Streuung des Mittelwerts Y unter 0.25 liegt Wie viele Einzelversuche von einer Sekunde Dauer sind erforderlich? Zur Versuchsplanung genügt eine grobe Schätzung von λ. Wir verwenden λ = 25 Var √ (Pλ ) = λ. Also hat jeder Einzelversuch die Streuung 25 = 5.0 Gleichung 5.0 √ = 0.25 n Also √ n = 20 und n = 400