Mathematik für Biologen Prof. Dr. Rüdiger W. Braun Heinrich-Heine-Universität Düsseldorf 21. Dezember 2011 Verteilungsfunktionen 1 Verteilungsfunktionen Definition Binomialverteilung Geometrische Verteilung Poissonverteilung 2 Stetige Zufallsvariable, Normalverteilung Standardisierte Verteilung Standard-Normalverteilung Normalverteilung Stetige Zufallsvariable, Normalverteilung Verteilungsfunktionen Stetige Zufallsvariable, Normalverteilung Verteilungsfunktion X sei eine Zufallsvariable. Die Funktion F (x) = P(X ≤ x) ist die Verteilungsfunktion von X Die Verteilungsfunktion F (x) gibt an, mit welcher Wahrscheinlichkeit ein kleinerer Wert als x angenommen wird (x eingeschlossen) Verteilungsfunktionen Stetige Zufallsvariable, Normalverteilung 0.35 0.30 0.25 0.20 0.15 0.10 0.05 0.00 0 1 2 3 k 4 5 6 Verteilungsfunktion von B6,1/3 B6,1/3(k) Beispiel: Verteilungsfunktion von B6,1/3 1.0 0.8 0.6 0.4 0.2 0.0 1 0 1 2 3 4 k 5 Stabdiagramm und Graph der Verteilungsfunktion für B6,1/3 6 7 Verteilungsfunktionen Stetige Zufallsvariable, Normalverteilung Kumulierte Tabellen Kumulierte Tabellen der Binomialverteilung zeigen die Verteilungsfunktion Beispiel: 47 Versuche mit Erfolgswahrscheinlichkeit p = 0.88 im Einzelfall wurden gemacht. Mit welcher Wahrscheinlichkeit gelingen weniger als 44, aber mehr als 39, beide Grenzen eingeschlossen? P(39 ≤ X ≤ 44) = P(X ≤ 44) − P(X ≤ 38) = F (44) − F (38) = 0.93236 − 0.10408 = 0.82828 Verteilungsfunktionen Tabelle der Werte r 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 p 0. Stetige Zufallsvariable, Normalverteilung Pr k=0 Bn, p (k) 0.85 00001 00002 00008 00029 00093 00274 00742 01832 04128 08463 15768 26660 40904 57047 72665 85309 93639 97931 99552 99952 für n = 47 0.86 0.87 0.88 0.89 00001 00003 00012 00043 00137 00398 01060 02571 05663 11311 20441 33384 49285 65962 80597 91050 96887 99278 99917 00001 00005 00018 00063 00199 00573 01503 03578 07707 14978 26208 41238 58411 74830 87606 95379 98847 99856 00002 00007 00026 00091 00286 00817 02115 04946 10408 19651 33208 50182 67964 83128 93236 98178 99754 00001 00002 00010 00038 00130 00408 01156 02957 06792 13952 25538 41543 60042 77447 90248 97153 99582 Verteilungsfunktionen Stetige Zufallsvariable, Normalverteilung Geometrische Verteilung Die Verteilungsfunktion der geometrischen Verteilung kann man ausrechnen Sie beträgt für x ≥ 0 F (x) = 1 − (1 − p)j falls j ≤ x < j + 1 Beispiel: Mit welcher Wahrscheinlichkeit fällt beim Wurf eines fairen Würfels die erste 6 spätestens im fünften Wurf? Antwort: 5 5 1 5 =1− = 0.5981 F (5) = 1 − 1 − 6 6 Verteilungsfunktionen Stetige Zufallsvariable, Normalverteilung 0.18 W'keit für erste 6 im k-ten Wurf 0.16 0.14 0.12 0.10 0.08 0.06 0.04 0.02 0.000 2 4 6 8 10 12 14 k Verteilungsfunktion von G6 G1/6(k) Verteilungsfunktion einer geometrischen Verteilung 1.0 0.8 0.6 0.4 0.2 0.0 0 5 10 k 15 20 Verteilungsfunktionen Stetige Zufallsvariable, Normalverteilung Verteilungsfunktion einer Poissonverteilung P16(k) Die Verteilungsfunktion einer Poissonverteilung kann man nicht geschlossen ausdrücken 0.10 0.08 0.06 0.04 0.02 0.00 0 10 20 k 30 40 1.0 0.8 0.6 0.4 0.2 0.0 0 10 20 k 30 Verteilung und Verteilungsfunktion der Poissonverteilung P16 40 Verteilungsfunktionen Stetige Zufallsvariable, Normalverteilung Die standardisierte Verteilung Die Zufallsvariable X besitze den Erwartungswert E (X ) = µ und die Varianz Var (X ) = σ2 Setze X −µ σ Dann E (Y ) = 0 und Var (Y ) = 1 Y = Y ist die standardisierte Zufallsvariable zu X Verteilungsfunktionen Stetige Zufallsvariable, Normalverteilung Standardisierte Binomialverteilungen 1.0 1.0 1.0 0.8 0.8 0.8 0.6 0.6 0.6 0.4 0.4 0.4 0.2 0.0 0.2 3 2 1 1.0 0 k 1 2 3 0.0 0.2 3 2 1 1.0 0 k 1 2 3 0.0 0.8 0.8 0.8 0.6 0.6 0.6 0.4 0.4 0.4 0.2 0.2 0.0 3 2 1 0 k 1 2 3 0.0 3 2 1 3 2 1 1.0 0 1 2 3 0 1 2 3 k 0.2 3 2 1 0 k 1 2 3 0.0 k Verteilungsfunktionen der Standardisierungen von Bn,p für p = 0.2 und n = 40, 80, 160, 320, 640 und 1280 Verteilungsfunktionen Stetige Zufallsvariable, Normalverteilung Zentraler Grenzwertsatz Für jeden Parameterwert p konvergiert der Grenzprozess auf der letzten Folie gegen dieselbe Funktion. Diese Funktion heißt Verteilungsfunktion der Standard-Normalverteilung Sie wird mit Φ bezeichnet. Verteilungsfunktionen Stetige Zufallsvariable, Normalverteilung Verteilungsfunktion der Standard-Normalverteilung 1.0 Φ(x) 0.8 0.6 0.4 0.2 0.0 3 2 1 0 x 1 2 3 Verteilungsfunktionen Stetige Zufallsvariable, Normalverteilung Gaußsche Glockenkurve 0.40 0.35 0.30 0.25 0.20 0.15 0.10 0.05 0.00 3 exp ³ 2 −x2 ´ p / 2π 2 1 x f (x) = √ exp − 2 2π heißt Gaußsche Glockenkurve 2 1 0 x 1 2 3 Verteilungsfunktionen Stetige Zufallsvariable, Normalverteilung Standard-Normalverteilung als Fläche Φ(x) ist die Fläche links von x unter der Gaußschen Glockenkurve 1.0 Glocke 0.8 Φ 0.6 0.4 0.2 0.0 3 2 1 0 x 1 2 3 Verteilungsfunktionen Stetige Zufallsvariable, Normalverteilung Standard-Normalverteilung als Integral 1 Φ(x) = √ 2π Zx 2 t exp − dt 2 −∞ Für dieses Integral existiert keine geschlossene Form in Termen klassischer Funktionen Verteilungsfunktionen Stetige Zufallsvariable, Normalverteilung Stetige Zufallsvariable Eine Zufallsvariable X , deren Verteilungsfunktion von der Gestalt Zx P(X ≤ x) = f (t)dt −∞ ist, heißt stetig. Dann bezeichnet man f als die Dichte von X . Die Gaußsche Glockenkurve ist die Dichte der Standard-Normalverteilung. Zy P(x < X ≤ y ) = f (t)dt x P(X = x) = 0 Zy P(x ≤ X ≤ y ) = f (t)dt x Verteilungsfunktionen Stetige Zufallsvariable, Normalverteilung Standard-normalverteilte Zufallsvariable X ist standard-normalverteilt, wenn P(X ≤ x) = Φ(x) für alle x in diesem Fall P(x < X ≤ y ) = Φ(y ) − Φ(x) für alle x < y Verteilungsfunktionen Stetige Zufallsvariable, Normalverteilung Eigenschaften von Φ 0 < Φ(x) < 1 für alle Zahlen x Für x → ∞ strebt Φ(x) gegen 1 Für x → −∞ strebt Φ(x) gegen 0 Φ(0) = 1 2 Der Graph von Φ ist punktsymmetrisch am Punkt (0, 12 ), d. h. Φ(−x) = 1 − Φ(x) Die Verteilungsfunktion der Standard-Normalverteilung ist vertafelt Verteilungsfunktionen Stetige Zufallsvariable, Normalverteilung Tabelle der Standard-Normalverteilung, linke Seite u 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 1.1 1.2 1.3 1.4 0.00 0,500000 ,539828 ,579260 ,617911 ,655422 ,691462 ,725747 ,758036 ,788145 ,815940 ,841345 ,864334 ,884930 ,903200 0,919243 0.01 0,503989 ,543795 ,583166 ,621720 ,659097 ,694974 ,729069 ,761148 ,791030 ,818589 ,843752 ,866500 ,886861 ,904902 0,920730 0.02 0,507978 ,547758 ,587064 ,625516 ,662757 ,698468 ,732371 ,764238 ,793892 ,821214 ,846136 ,868643 ,888768 ,906582 0,922196 0.03 0,511966 ,551717 ,590954 ,629300 ,666402 ,701944 ,735653 ,767305 ,796731 ,823814 ,848495 ,870762 ,890651 ,908241 0,923641 0.04 0,515953 ,555670 ,594835 ,633072 ,670031 ,705401 ,738914 ,770350 ,799546 ,826391 ,850830 ,872857 ,892512 ,909877 0,925066 Verteilungsfunktionen Stetige Zufallsvariable, Normalverteilung Tabelle der Standard-Normalverteilung, rechte Seite u 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 1.1 1.2 1.3 1.4 0.05 0,519939 ,559618 ,598706 ,636831 ,673645 ,708840 ,742154 ,773373 ,802337 ,828944 ,853141 ,874928 ,894350 ,911492 0,926471 0.06 0,523922 ,563559 ,602568 ,640576 ,677242 ,712260 ,745373 ,776373 ,805105 ,831472 ,855428 ,876976 ,896165 ,913085 0,927855 0.07 0,527903 ,567495 ,606420 ,644309 ,680822 ,715661 ,748571 ,779350 ,807850 ,833977 ,857690 ,879000 ,897958 ,914657 0,929219 0.08 0,531881 ,571424 ,610261 ,648027 ,684386 ,719043 ,751748 ,782305 ,810570 ,836457 ,859929 ,881000 ,899727 ,916207 0,930563 0.09 0,535856 ,575345 ,614092 ,651732 ,687933 ,722405 ,754903 ,785236 ,813267 ,838913 ,862143 ,882977 ,901475 ,917736 0,931888 Verteilungsfunktionen Stetige Zufallsvariable, Normalverteilung Lesehinweise Auf dem Weblog gibt es die komplette Tabelle im Format A4 unter http://www.math.uni-duesseldorf.de/~braun/ bio1112/tabNorm.pdf Beispiel Φ(0.31) = 0.621720 Wegen der Punktsymmetrie, also wegen Φ(−x) = 1 − Φ(x) kann man die Tabelle auch für negative Argumente verwenden. Also beispielsweise Φ(−1.34) = 1 − Φ(1.34) = 1 − 0.909877 = 0.090123 Durch Aufsuchen des Funktionswertes erhält man die Umkehrfunktion: Gesucht u mit Φ(u) = 0.79. Man liest ab: u = 0.81 Verteilungsfunktionen Stetige Zufallsvariable, Normalverteilung Tabelle der Standard-Normalverteilung, linke Seite u 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 1.1 1.2 1.3 1.4 0.00 0,500000 ,539828 ,579260 ,617911 ,655422 ,691462 ,725747 ,758036 ,788145 ,815940 ,841345 ,864334 ,884930 ,903200 0,919243 0.01 0,503989 ,543795 ,583166 ,621720 ,659097 ,694974 ,729069 ,761148 ,791030 ,818589 ,843752 ,866500 ,886861 ,904902 0,920730 0.02 0,507978 ,547758 ,587064 ,625516 ,662757 ,698468 ,732371 ,764238 ,793892 ,821214 ,846136 ,868643 ,888768 ,906582 0,922196 0.03 0,511966 ,551717 ,590954 ,629300 ,666402 ,701944 ,735653 ,767305 ,796731 ,823814 ,848495 ,870762 ,890651 ,908241 0,923641 0.04 0,515953 ,555670 ,594835 ,633072 ,670031 ,705401 ,738914 ,770350 ,799546 ,826391 ,850830 ,872857 ,892512 ,909877 0,925066 Verteilungsfunktionen Stetige Zufallsvariable, Normalverteilung Beispiel Normalverteilungen werden beispielsweise zur Modellierung von Messfehlern benutzt Beispiel: Die Wirkstoffkonzentration in einem Heilmittel soll 4g/l betragen. Herstellungsabhängig beträgt die Streuung 100mg/l Mit welcher Wahrscheinlichkeit liegt die Konzentration über 4.12g/l? Y sei die Konzentration in g/l Dann Y = 4 + 0.1 · X , wobei X standard-normalverteilt ist Gesucht P(Y > 4.12) Das ist P(X > 1.2) = 1 − P(X ≤ 1.2) = 1 − Φ(1.2) = 1 − 0.884930 = 0.115070 Verteilungsfunktionen Stetige Zufallsvariable, Normalverteilung Normalverteilungen Die Zufallsvariable X heißt normalverteilt zum Erwartungswert µ und der Varianz σ2 , wenn Y = X −µ σ standard-normalverteilt ist. Man sagt dann, X sei N(µ, σ2 )-verteilt X =µ+σ·Y Y ist die Standardisierung von X Verteilungsfunktionen Stetige Zufallsvariable, Normalverteilung Erwartungswert, Varianz und Streuung stetiger Zufallsvariablen Die Zufallsvariable X besitze die Dichte f Z∞ Dann ist t · f (t)dt E (X ) = −∞ der Erwartungswert von X Z∞ und Var (X ) = (t − E (X ))2 · f (t)dt −∞ ist die Varianz. Die Streuung ist die Quadratwurzel der Varianz p σ = Var (X ) Verteilungsfunktionen Stetige Zufallsvariable, Normalverteilung Analogie zu diskreten Zufallsvariablen Für diskrete Zufallsvariablen X E (X ) = k · P(X = k) k Var (X ) = X k (k − E (X ))2 · P(X = k) Verteilungsfunktionen Stetige Zufallsvariable, Normalverteilung Erwartungswert und Varianz von Normalverteilungen Wenn X verteilt ist gemäß N(µ, σ2 ), dann E (X ) = µ Var (X ) = σ2 Verteilungsfunktionen Stetige Zufallsvariable, Normalverteilung Normalverteilungen für verschiedene Erwartungswerte 1.0 µ =0 µ =1 µ =2 F(x) 0.8 0.6 0.4 0.2 0.0 4 3 2 1 0 x 1 2 3 Verteilungsfunktionen für N(µ, 1)-verteilte Zufallsvariable 4 Verteilungsfunktionen Stetige Zufallsvariable, Normalverteilung Normalverteilungen für verschiedene Streuungen 1.0 σ =1 σ =1/2 σ =2 F(x) 0.8 0.6 0.4 0.2 0.0 4 3 2 1 0 x 1 2 3 Verteilungsfunktionen für N(0, σ2 )-verteilte Zufallsvariable 4 Verteilungsfunktionen Stetige Zufallsvariable, Normalverteilung Umrechnung auf Standardnormalverteilung Die Zufallsvariable X sei N(µ, σ2 )-verteilt. Dann gelten für a < b b−µ a−µ P(a < X ≤ b) = Φ −Φ σ σ a−µ P(a < X ) = 1 − Φ σ b−µ P(X ≤ b) = Φ σ Verteilungsfunktionen Stetige Zufallsvariable, Normalverteilung Beispiel: natürliche Variabilitäten Roggenpflanzen erreichen eine mittlere Höhe von 1m. Dabei streut die Höhe um 20cm. Welcher Prozentsatz aller Pflanzen erreicht mindestens 1.10m Höhe? X = Höhe der Pflanze Wir rechnen in Metern. Dann E (X ) = 1 und Var (X ) = 0.04 X = 1 + 0.2 · Y für standard-normalverteiltes Y X ≥ 1.10 bedeutet Y ≥ 0.5 P(Y ≥ 0.5) = 1 − P(Y ≤ 0.5) = 1 − Φ(0.5) = 1 − 0.6915 = 0.3085 ca 31% der Pflanzen sind mindestens 1.10m hoch Verteilungsfunktionen Stetige Zufallsvariable, Normalverteilung Kritische Betrachtung des Modells Das Modell erlaubt auch den unsinnigen Fall, dass Roggenpflanzen eine negative Höhe aufweisen Mit welcher Wahrscheinlichkeit geschieht das? X ≤ 0 bedeutet Y ≤ −5 P(Y ≤ −5) = Φ(−5) = 1 − Φ(5) = 1 − (1 − 2.867 · 10−7 ) = 2.867 · 10−7 Das Modell sagt für weniger als eine unter 3 Millionen Pflanzen eine negative Höhe voraus Damit können wir leben Verteilungsfunktionen Stetige Zufallsvariable, Normalverteilung Beispiel: IQ-Tests IQ-Tests sind so skaliert, dass die Werte in der Population normalverteilt mit Erwartungswert µ = 100 und Streuung σ = 15 sind Welcher Anteil der Bevölkerung hat einen IQ über 130? X messe den IQ X ist N(100, 225)-verteilt. Also 130 − 100 P(130 < X ) = 1 − Φ 15 = 1 − Φ(2) = 1 − 0.977250 = 0.02275 Ungefähr 2.3% der Population weist einen IQ von mindestens 130 auf