Gesetze Verteilungsfunktionen Mathematik für Biologen Prof. Dr. Rüdiger W. Braun Heinrich-Heine-Universität Düsseldorf 17. November 2010 Stetige Zufallsvariable Gesetze Verteilungsfunktionen 1 Gesetze Das Gesetz der seltenen Ereignisse Das schwache Gesetz der großen Zahl 2 Verteilungsfunktionen Definition Binomialverteilung Geometrische Verteilung Poissonverteilung 3 Stetige Zufallsvariable Standardisierte Verteilung Standard-Normalverteilung Stetige Zufallsvariable Gesetze Verteilungsfunktionen Stetige Zufallsvariable Poissonverteilung Es sei λ > 0. Die Poissonverteilung zum Parameter λ ist definiert durch λk −λ Pλ (k) = ·e k! Unter den folgenden Voraussetzungen ist eine Zufallsvariable X poissonverteilt zum Parameter λ: X zählt das Auftreten eines Ereignisses pro Zähleinheit Im Mittel treten λ Ereignisse pro Zähleinheit auf Die Ereignisse beeinflussen sich nicht gegenseitig Gesetze Verteilungsfunktionen Stetige Zufallsvariable Beispiel Tumor Ein Tumor aus 160 Zellen wird bestrahlt Im Mittel sterben 16 Tumorzellen pro Minute Mit welcher Wahrscheinlichkeit sterben 10 Zellen in der ersten Minute? Zwei Modelle sind angemessen Binomialverteilung Poissonverteilung Gesetze Verteilungsfunktionen Stetige Zufallsvariable Beispiel Tumor: Rechnung mit Binomialverteilung Modell: 160 unabhängige ja/nein-Experimente Erfolg : Tod der Tumorzelle Erfolgswahrscheinlichkeit im Einzelfall p = 0.1 Anzahl der Erfolge verteilt gemäß B160, 0.1 Antwort: B160, 0.1 (10) = 0.03113 Gesetze Verteilungsfunktionen Stetige Zufallsvariable Beispiel Tumor: Rechnung mit Poissonverteilung Modell: seltenes Ereignis, das im Mittel 16 mal pro Minute auftritt Parameter der Poissonverteilung ist λ = 16 Anzahl der Ereignisse pro Zähleinheit verteilt gemäß P16 Antwort 1610 −16 e = 0.03410 10! Zum Vergleich B160, 0.1 (10) = 0.03113 P16 (10) = Gesetze Verteilungsfunktionen Stetige Zufallsvariable Vergleich Binomial- und Poissonverteilung Poissonverteilung mit λ =16 Binomialverteilung mit n=160, p=0.1 0.12 0.12 0.10 0.10 0.08 0.08 0.06 0.06 0.04 0.04 0.02 0.02 0.000 0.000 5 10 15 20 25 30 35 40 5 10 15 20 25 30 35 40 Beide beschreiben einen Prozess mit 16 Erfolgen im Mittel. Der Unterschied ist, dass beim Poissonprozess die Anzahl der Erfolge potenziell unbeschränkt ist. Gesetze Verteilungsfunktionen Stetige Zufallsvariable Vergleich Binomial- und Poissonverteilung, Fortsetzung B40, 0.4 und P16 besitzen ebenfalls beide den Erwartungswert 16 Poissonverteilung mit λ =16 Binomialverteilung mit n=40, p=0.4 0.12 0.12 0.10 0.10 0.08 0.08 0.06 0.06 0.04 0.04 0.02 0.000 0.02 5 10 15 20 25 30 35 40 0.000 5 10 15 20 25 30 35 40 Gesetze Verteilungsfunktionen Stetige Zufallsvariable Gesetz der seltenen Ereignisse Die Poisson-Verteilung Pλ mit λ = n · p ist eine sehr gute Annäherung an die Binomialverteilung Bn,p , falls n ≥ 100 und n · p ≤ 10. Im Beispiel waren n = 160 p = 0.1 Die Annäherung ist daher nur gut Gesetze Verteilungsfunktionen Stetige Zufallsvariable Messwiederholungen Warum erhöhen mehrere Messungen die Genauigkeit? Warum braucht man 100-mal so viele Messungen, um die Genauigkeit zu verzehnfachen? Gesetze Verteilungsfunktionen Rechenregeln für den Erwartungswert Für jede Zahl c und jede Zufallsvariable X ist E (c · X ) = c · E (X ) Für Zufallsvariablen X1 , . . . , Xn ist E (X1 + · · · + Xn ) = E (X1 ) + · · · + E (Xn ) X und Y unabhängige Zufallsvariable. Dann E (X · Y ) = E (X ) · E (Y ) Stetige Zufallsvariable Gesetze Verteilungsfunktionen Rechenregeln für die Varianz Für jede Zahl a und jede Zufallsvariable X gilt Var (a + X ) = Var (X ) Für Zahl c und jede Zufallsvariable X gilt Var (c · X ) = c 2 · Var (X ) X und Y unabhängige Zufallsvariable. Dann Var (X + Y ) = Var (X ) + Var (Y ) Stetige Zufallsvariable Gesetze Verteilungsfunktionen Stetige Zufallsvariable Zwei unabhängige, identisch verteilte Zufallsvariable X1 und X2 seien unabhängige Zufallsvariable, die derselben Verteilung gehorchen (also z. B. Messwiederholungen). Sei Y = 21 (X1 + X2 ) der Durchschnittswert Der Erwartungswert von X1 heiße µ, also E (X1 ) = E (X2 ) = µ Die Streuung von X1 heiße σ, also Var (X1 ) = Var (X2 ) = σ2 E (Y ) = 21 (E (X1 ) + E (X2 )) = µ 2 2 Var (Y ) = 12 Var (X1 ) + 12 Var (X2 ) = 14 σ2 + 14 σ2 = 12 σ2 σ Also ist √ die Streuung von Y 2 Gesetze Verteilungsfunktionen Stetige Zufallsvariable Das schwache Gesetz der großen Zahl “Mit ausreichend vielen Messwiederholungen lässt sich jede Genauigkeit erreichen” Präziser: X1 , . . . , Xn unabhängig, alle mit derselben Verteilung µ = E (X1 ) = · · · = E (Xn ) und σ2 = Var (X1 ) = · · · = Var (Xn ) 1 Y = (X1 + · · · + Xn ) n Y ist das arithmetische Mittel der X1 , X2 , . . . , Xn Dann E (Y ) = µ und die Streuung von Y beträgt σ σY = √ n Gesetze Verteilungsfunktionen Stetige Zufallsvariable Messwiederholungen: Beispiel 0 5 10 15 20 25 30 35 40 0 5 10 15 20 25 30 Links: Poissonverteilung P16 , Streuung ist 4 Rechts: Durchschnittswerte aus zehn P16 -verteilten Zufallsvariablen, Streuung ist 4 √ = 1.26 10 35 40 Gesetze Verteilungsfunktionen Stetige Zufallsvariable Beispiel: α-Strahler Ein Geigerzähler registriert pro Sekunde ungefähr 25 α-Teilchen Dieser Wert soll so genau bestimmt werden, dass die Streuung des Mittelwerts Y unter 2.0 liegt Wie viele Einzelversuche von einer Sekunde Dauer sind erforderlich? Var √ (Pλ ) = λ. Also hat jeder Einzelversuch die Streuung 25 = 5 Gleichung 5 √ = 2.0 n Also √ ∼6 n = 2.5 und n = Gesetze Verteilungsfunktionen Stetige Zufallsvariable Verteilungsfunktion X sei eine Zufallsvariable. Die Funktion F (x) = P(X ≤ x) ist die Verteilungsfunktion von X Die Verteilungsfunktion F (x) gibt an, mit welcher Wahrscheinlichkeit ein kleinerer Wert als x angenommen wird (x eingeschlossen) Datensatz empirische Häufigkeitsverteilung empirische Verteilungsfunktion Zufallsvariable Verteilung Verteilungsfunktion Gesetze Verteilungsfunktionen Stetige Zufallsvariable Beispiel: Verteilungsfunktion von B6,1/3 0.35 1.0 0.30 0.8 0.25 0.20 0.6 0.15 0.4 0.10 0.2 0.05 0.00 0 1 2 3 4 5 6 0.0 1 0 1 2 3 4 5 6 Stabdiagramm und Graph der Verteilungsfunktion für B6,1/3 7 Gesetze Verteilungsfunktionen Stetige Zufallsvariable Kumulierte Tabellen Kumulierte Tabellen der Binomialverteilung zeigen die Verteilungsfunktion Beispiel: 47 Versuche mit Erfolgswahrscheinlichkeit p = 0.88 im Einzelfall wurden gemacht. Mit welcher Wahrscheinlichkeit gelingen weniger als 44, aber mehr als 39, beide Grenzen eingeschlossen? P(39 ≤ X ≤ 44) = P(X ≤ 44) − P(X ≤ 38) = F (44) − F (38) = 0.93236 − 0.10408 = 0.82828 Gesetze Verteilungsfunktionen Tabelle der Werte r 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 p 0. Pr Stetige Zufallsvariable k=0 Bn, p (k) 0.85 00001 00002 00008 00029 00093 00274 00742 01832 04128 08463 15768 26660 40904 57047 72665 85309 93639 97931 99552 99952 für n = 47 0.86 0.87 0.88 0.89 00001 00003 00012 00043 00137 00398 01060 02571 05663 11311 20441 33384 49285 65962 80597 91050 96887 99278 99917 00001 00005 00018 00063 00199 00573 01503 03578 07707 14978 26208 41238 58411 74830 87606 95379 98847 99856 00002 00007 00026 00091 00286 00817 02115 04946 10408 19651 33208 50182 67964 83128 93236 98178 99754 00001 00002 00010 00038 00130 00408 01156 02957 06792 13952 25538 41543 60042 77447 90248 97153 99582 Gesetze Verteilungsfunktionen Stetige Zufallsvariable Geometrische Verteilung Die Verteilungsfunktion der geometrischen Verteilung kann man ausrechnen Sie beträgt für x ≥ 0 F (x) = 1 − (1 − p)j falls j ≤ x < j + 1 Beispiel: Mit welcher Wahrscheinlichkeit fällt beim Wurf eines fairen Würfels die erste 6 spätestens im fünften Wurf? Antwort: 1 F (5) = 1 − 1 − 6 5 5 5 =1− = 0.5981 6 Gesetze Verteilungsfunktionen Stetige Zufallsvariable Verteilungsfunktion einer geometrischen Verteilung Wahrscheinlichkeit, dass erste 6 im k-ten Wurf auftritt 0.18 W'keit, dass erste 6 im k-ten Wurf oder frueher auftritt 1.0 0.16 0.8 0.14 0.12 0.6 0.10 0.08 0.4 0.06 0.04 0.2 0.02 0.000 2 4 6 8 10 12 14 0.00 5 10 15 20 Gesetze Verteilungsfunktionen Stetige Zufallsvariable Verteilungsfunktion einer Poissonverteilung Die Verteilungsfunktion einer Poissonverteilung kann man nicht geschlossen ausdrücken 1.0 0.8 0.6 0.4 0.2 0 5 10 15 20 25 30 35 40 0.00 5 10 15 20 25 30 35 Verteilung und Verteilungsfunktion der Poissonverteilung P16 Gesetze Verteilungsfunktionen Stetige Zufallsvariable Die standardisierte Verteilung Die Zufallsvariable X besitze den Erwartungswert E (X ) = µ und die Varianz Var (X ) = σ2 Setze X −µ σ Dann E (Y ) = 0 und Var (Y ) = 1 Y = Y ist die standardisierte Zufallsvariable zu X Gesetze Verteilungsfunktionen Stetige Zufallsvariable Standardisierte Binomialverteilungen 1.0 1.0 1.0 0.8 0.8 0.8 0.6 0.6 0.6 0.4 0.4 0.4 0.2 0.2 0.2 0.0 0.0 0.0 3 2 1 0 1 2 3 1.0 3 2 1 0 1 2 3 1.0 0.8 0.8 0.8 0.6 0.6 0.6 0.4 0.4 0.4 0.2 0.2 0.0 3 2 1 0 1 2 3 0.0 3 2 1 0 1 2 3 3 2 1 0 1 2 3 1.0 0.2 3 2 1 0 1 2 3 0.0 Verteilungsfunktionen der Standardisierungen von Bn,p für p = 0.2 und n = 40, 80, 160, 320, 640 und 1280 Gesetze Verteilungsfunktionen Stetige Zufallsvariable Zentraler Grenzwertsatz Für jeden Parameterwert p konvergiert der Grenzprozess auf der letzten Folie gegen dieselbe Funktion. Diese Funktion heißt Verteilungsfunktion der Standard-Normalverteilung Sie wird mit Φ bezeichnet. Gesetze Verteilungsfunktionen Stetige Zufallsvariable Verteilungsfunktion der Standard-Normalverteilung 1.0 0.8 0.6 0.4 0.2 0.0 3 2 1 0 1 2 3 Gesetze Verteilungsfunktionen Stetige Zufallsvariable Standard-normalverteilte Zufallsvariable X ist standard-normalverteilt, wenn P(X ≤ x) = Φ(x) für alle x in diesem Fall P(x < X ≤ y ) = Φ(y ) − Φ(x) für alle x < y Gesetze Verteilungsfunktionen Stetige Zufallsvariable Eigenschaften von Φ 0 < Φ(x) < 1 für alle Zahlen x Für x → ∞ strebt Φ(x) gegen 1 Für x → −∞ strebt Φ(x) gegen 0 Φ(0) = 1 2 Der Graph von Φ ist punktsymmetrisch am Punkt (0, 12 ), d. h. Φ(−x) = 1 − Φ(x) Die Verteilungsfunktion der Standard-Normalverteilung ist vertafelt Gesetze Verteilungsfunktionen Stetige Zufallsvariable Tabelle der Standard-Normalverteilung, linke Seite u 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 1.1 1.2 1.3 1.4 0.00 0,500000 ,539828 ,579260 ,617911 ,655422 ,691462 ,725747 ,758036 ,788145 ,815940 ,841345 ,864334 ,884930 ,903200 0,919243 0.01 0,503989 ,543795 ,583166 ,621720 ,659097 ,694974 ,729069 ,761148 ,791030 ,818589 ,843752 ,866500 ,886861 ,904902 0,920730 0.02 0,507978 ,547758 ,587064 ,625516 ,662757 ,698468 ,732371 ,764238 ,793892 ,821214 ,846136 ,868643 ,888768 ,906582 0,922196 0.03 0,511966 ,551717 ,590954 ,629300 ,666402 ,701944 ,735653 ,767305 ,796731 ,823814 ,848495 ,870762 ,890651 ,908241 0,923641 0.04 0,515953 ,555670 ,594835 ,633072 ,670031 ,705401 ,738914 ,770350 ,799546 ,826391 ,850830 ,872857 ,892512 ,909877 0,925066 Gesetze Verteilungsfunktionen Stetige Zufallsvariable Tabelle der Standard-Normalverteilung, rechte Seite u 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 1.1 1.2 1.3 1.4 0.05 0,519939 ,559618 ,598706 ,636831 ,673645 ,708840 ,742154 ,773373 ,802337 ,828944 ,853141 ,874928 ,894350 ,911492 0,926471 0.06 0,523922 ,563559 ,602568 ,640576 ,677242 ,712260 ,745373 ,776373 ,805105 ,831472 ,855428 ,876976 ,896165 ,913085 0,927855 0.07 0,527903 ,567495 ,606420 ,644309 ,680822 ,715661 ,748571 ,779350 ,807850 ,833977 ,857690 ,879000 ,897958 ,914657 0,929219 0.08 0,531881 ,571424 ,610261 ,648027 ,684386 ,719043 ,751748 ,782305 ,810570 ,836457 ,859929 ,881000 ,899727 ,916207 0,930563 0.09 0,535856 ,575345 ,614092 ,651732 ,687933 ,722405 ,754903 ,785236 ,813267 ,838913 ,862143 ,882977 ,901475 ,917736 0,931888 Gesetze Verteilungsfunktionen Stetige Zufallsvariable Lesehinweise Auf dem Weblog gibt es die komplette Tabelle im Format A4 unter http://www.math.uni-duesseldorf.de/~braun/ bio1011/tabNorm.pdf Beispiel Φ(0.31) = 0.621720 Wegen der Punktsymmetrie, also wegen Φ(−x) = 1 − Φ(x) kann man die Tabelle auch für negative Argumente verwenden. Also beispielsweise Φ(−1.34) = 1 − Φ(1.34) = 1 − 0.909877 = 0.090123 Durch Aufsuchen des Funktionswertes erhält man die Umkehrfunktion: Gesucht u mit Φ(u) = 0.79. Man liest ab: u = 0.81 Gesetze Verteilungsfunktionen Stetige Zufallsvariable Tabelle der Standard-Normalverteilung, linke Seite u 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 1.1 1.2 1.3 1.4 0.00 0,500000 ,539828 ,579260 ,617911 ,655422 ,691462 ,725747 ,758036 ,788145 ,815940 ,841345 ,864334 ,884930 ,903200 0,919243 0.01 0,503989 ,543795 ,583166 ,621720 ,659097 ,694974 ,729069 ,761148 ,791030 ,818589 ,843752 ,866500 ,886861 ,904902 0,920730 0.02 0,507978 ,547758 ,587064 ,625516 ,662757 ,698468 ,732371 ,764238 ,793892 ,821214 ,846136 ,868643 ,888768 ,906582 0,922196 0.03 0,511966 ,551717 ,590954 ,629300 ,666402 ,701944 ,735653 ,767305 ,796731 ,823814 ,848495 ,870762 ,890651 ,908241 0,923641 0.04 0,515953 ,555670 ,594835 ,633072 ,670031 ,705401 ,738914 ,770350 ,799546 ,826391 ,850830 ,872857 ,892512 ,909877 0,925066 Gesetze Verteilungsfunktionen Stetige Zufallsvariable Beispiel Normalverteilungen werden beispielsweise zur Modellierung von Messfehlern benutzt Beispiel: Die Wirkstoffkonzentration in einem Heilmittel soll 4g/l betragen. Herstellungsabhängig beträgt die Streuung 100mg/l Mit welcher Wahrscheinlichkeit liegt die Konzentration über 4.12g/l? Y sei die Konzentration in g/l Dann Y = 4 + 0.1 · X , wobei X standard-normalverteilt ist Gesucht P(Y > 4.12) Das ist P(X > 1.2) = 1 − P(X ≤ 1.2) = 1 − Φ(1.2) = 1 − 0.884930 = 0.115070