Biostatistik, Winter 2011/12 Wahrscheinlichkeitstheorie: Verteilungen, Kenngrößen Prof. Dr. Achim Klenke http://www.aklenke.de 7. Vorlesung: 09.12.2011 1/58 Inhalt 1 Verteilungen Stetige 2 Kenngrößen von Verteilungen Lagemaße 2/58 Verteilungen Stetige Verteilungen mit Dichte Normalverteilung Die Verteilung mit Dichte 1 2 f (t) = √ e−t /2 , 2π t ∈ R, heißt Standardnormalverteilung N0,1 . 3/58 Verteilungen Stetige 0.3 0.4 Standardnormalverteilung P[Z ≤ 1.55] = 0.9394 0.0 0.1 0.2 1 −4 −3 −2 −1 0 1 2 3 4 4/58 Verteilungen Stetige Verteilungen mit Dichte Normalverteilung Die Verteilung mit Dichte 1 2 f (t) = √ e−t /2 , t ∈ R, 2π heißt Standardnormalverteilung N0,1 . Ist Z standardnormalverteilt, dann ist Z x 1 2 e−t /2 dt. P[Z ≤ x] = Φ(x) := √ 2π −∞ Die Werte der Verteilungsfunktion Φ(x) = P[Z ≤ x], x ∈ R, sind tabelliert für x ≥ 0. Z.B. im Skript, das online steht. Für x < 0 benutzt man Φ(x) = 1 − Φ(−x). 5/58 Verteilungen Stetige Verteilungen mit Dichte Normalverteilung Sei Z standardnormalverteilt. Satz P[Z ≤ x] = Φ(x) = 1 − Φ(−x). P[Z ≥ x] = 1 − Φ(x) = Φ(−x). P[x1 ≤ Z ≤ x2 ] = Φ(x2 ) − Φ(x1 ) für x1 < x2 . 6/58 Verteilungen Stetige Verteilungen mit Dichte Normalverteilung Beispiel Sei Z standardnormalverteilt. P[Z ≤ 1.55] = Φ(1.55) = . 7/58 Tabelle Normalverteilung Φ x 0.00 0.10 0.20 0.30 0.40 0 .5000 .5398 .5793 .6179 .6554 1 .5040 .5438 .5832 .6217 .6591 2 .5080 .5478 .5871 .6255 .6628 3 .5120 .5517 .5910 .6293 .6664 4 .5160 .5557 .5948 .6331 .6700 5 .5199 .5596 .5987 .6368 .6736 6 .5239 .5636 .6026 .6406 .6772 7 .5279 .5675 .6064 .6443 .6808 8 .5319 .5714 .6103 .6480 .6844 9 .5359 .5753 .6141 .6517 .6879 0.50 0.60 0.70 0.80 0.90 .6915 .7257 .7580 .7881 .8159 .6950 .7291 .7611 .7910 .8186 .6985 .7324 .7642 .7939 .8212 .7019 .7357 .7673 .7967 .8238 .7054 .7389 .7704 .7995 .8264 .7088 .7422 .7734 .8023 .8289 .7123 .7454 .7764 .8051 .8315 .7157 .7486 .7794 .8079 .8340 .7190 .7517 .7823 .8106 .8365 .7224 .7549 .7852 .8133 .8389 1.00 1.10 1.20 1.30 1.40 .8413 .8643 .8849 .9032 .9192 .8438 .8665 .8869 .9049 .9207 .8461 .8686 .8888 .9066 .9222 .8485 .8708 .8907 .9082 .9236 .8508 .8729 .8925 .9099 .9251 .8531 .8749 .8944 .9115 .9265 .8554 .8770 .8962 .9131 .9279 .8577 .8790 .8980 .9147 .9292 .8599 .8810 .8997 .9162 .9306 .8621 .8830 .9015 .9177 .9319 1.50 1.60 1.70 1.80 1.90 .9332 .9452 .9554 .9641 .9713 .9345 .9463 .9564 .9649 .9719 .9357 .9474 .9573 .9656 .9726 .9370 .9485 .9582 .9664 .9732 .9382 .9495 .9591 .9671 .9738 .9394 .9505 .9599 .9678 .9744 .9406 .9515 .9608 .9686 .9750 .9418 .9525 .9616 .9693 .9756 .9429 .9535 .9625 .9699 .9762 .9441 .9545 .9633 .9706 .9767 2.00 2.10 2.20 2.30 2.40 .9773 .9821 .9861 .9893 .9918 .9778 .9826 .9865 .9896 .9920 .9783 .9830 .9868 .9898 .9922 .9788 .9834 .9871 .9901 .9925 .9793 .9838 .9875 .9904 .9927 .9798 .9842 .9878 .9906 .9929 .9803 .9846 .9881 .9909 .9931 .9808 .9850 .9884 .9911 .9932 .9812 .9854 .9887 .9913 .9934 .9817 .9857 .9890 .9916 .9936 2.50 2.60 2.70 2.80 2.90 .9938 .9953 .9965 .9974 .9981 .9940 .9955 .9966 .9975 .9982 .9941 .9956 .9967 .9976 .9983 .9943 .9957 .9968 .9977 .9983 .9945 .9959 .9969 .9977 .9984 .9946 .9960 .9970 .9978 .9984 .9948 .9961 .9971 .9979 .9985 .9949 .9962 .9972 .9980 .9985 .9951 .9963 .9973 .9980 .9986 .9952 .9964 .9974 .9981 .9986 Verteilungen Stetige Tabelle Normalverteilung Φ x 1.00 1.10 1.20 1.30 1.40 0 .8413 .8643 .8849 .9032 .9192 1 .8438 .8665 .8869 .9049 .9207 2 .8461 .8686 .8888 .9066 .9222 3 .8485 .8708 .8907 .9082 .9236 4 .8508 .8729 .8925 .9099 .9251 5 .8531 .8749 .8944 .9115 .9265 6 .8554 .8770 .8962 .9131 .9279 7 .8577 .8790 .8980 .9147 .9292 8 .8599 .8810 .8997 .9162 .9306 9 .8621 .8830 .9015 .9177 .9319 1.50 1.60 1.70 1.80 1.90 .9332 .9452 .9554 .9641 .9713 .9345 .9463 .9564 .9649 .9719 .9357 .9474 .9573 .9656 .9726 .9370 .9485 .9582 .9664 .9732 .9382 .9495 .9591 .9671 .9738 .9394 .9505 .9599 .9678 .9744 .9406 .9515 .9608 .9686 .9750 .9418 .9525 .9616 .9693 .9756 .9429 .9535 .9625 .9699 .9762 .9441 .9545 .9633 .9706 .9767 2.00 2.10 2.20 2.30 2.40 .9773 .9821 .9861 .9893 .9918 .9778 .9826 .9865 .9896 .9920 .9783 .9830 .9868 .9898 .9922 .9788 .9834 .9871 .9901 .9925 .9793 .9838 .9875 .9904 .9927 .9798 .9842 .9878 .9906 .9929 .9803 .9846 .9881 .9909 .9931 .9808 .9850 .9884 .9911 .9932 .9812 .9854 .9887 .9913 .9934 .9817 .9857 .9890 .9916 .9936 2.50 2.60 2.70 2.80 2.90 .9938 .9953 .9965 .9974 .9981 .9940 .9955 .9966 .9975 .9982 .9941 .9956 .9967 .9976 .9983 .9943 .9957 .9968 .9977 .9983 .9945 .9959 .9969 .9977 .9984 .9946 .9960 .9970 .9978 .9984 .9948 .9961 .9971 .9979 .9985 .9949 .9962 .9972 .9980 .9985 .9951 .9963 .9973 .9980 .9986 .9952 .9964 .9974 .9981 .9986 Also: Φ(1.55) = 0.9394. 9/58 Verteilungen Stetige Verteilungen mit Dichte Normalverteilung Beispiel Sei Z standardnormalverteilt. P[Z ≤ 1.55] = Φ(1.55) = 0.9394 10/58 Verteilungen Stetige 0.3 0.4 Standardnormalverteilung P[Z ≤ 1.55] = 0.9394 0.0 0.1 0.2 1 −4 −3 −2 −1 0 1 2 3 4 11/58 Verteilungen Stetige Verteilungen mit Dichte Normalverteilung Beispiel Sei Z standardnormalverteilt. P[−1.23 ≤ Z ≤ 2.04] = Φ(2.04) − Φ(−1.23). Φ(2.04) = Φ(−1.23) = 1 − Φ(1.23) = 12/58 Verteilungen Stetige Tabelle Normalverteilung Φ x 1.00 1.10 1.20 1.30 1.40 0 .8413 .8643 .8849 .9032 .9192 1 .8438 .8665 .8869 .9049 .9207 2 .8461 .8686 .8888 .9066 .9222 3 .8485 .8708 .8907 .9082 .9236 4 .8508 .8729 .8925 .9099 .9251 5 .8531 .8749 .8944 .9115 .9265 6 .8554 .8770 .8962 .9131 .9279 7 .8577 .8790 .8980 .9147 .9292 8 .8599 .8810 .8997 .9162 .9306 9 .8621 .8830 .9015 .9177 .9319 1.50 1.60 1.70 1.80 1.90 .9332 .9452 .9554 .9641 .9713 .9345 .9463 .9564 .9649 .9719 .9357 .9474 .9573 .9656 .9726 .9370 .9485 .9582 .9664 .9732 .9382 .9495 .9591 .9671 .9738 .9394 .9505 .9599 .9678 .9744 .9406 .9515 .9608 .9686 .9750 .9418 .9525 .9616 .9693 .9756 .9429 .9535 .9625 .9699 .9762 .9441 .9545 .9633 .9706 .9767 2.00 2.10 2.20 2.30 2.40 .9773 .9821 .9861 .9893 .9918 .9778 .9826 .9865 .9896 .9920 .9783 .9830 .9868 .9898 .9922 .9788 .9834 .9871 .9901 .9925 .9793 .9838 .9875 .9904 .9927 .9798 .9842 .9878 .9906 .9929 .9803 .9846 .9881 .9909 .9931 .9808 .9850 .9884 .9911 .9932 .9812 .9854 .9887 .9913 .9934 .9817 .9857 .9890 .9916 .9936 2.50 2.60 2.70 2.80 2.90 .9938 .9953 .9965 .9974 .9981 .9940 .9955 .9966 .9975 .9982 .9941 .9956 .9967 .9976 .9983 .9943 .9957 .9968 .9977 .9983 .9945 .9959 .9969 .9977 .9984 .9946 .9960 .9970 .9978 .9984 .9948 .9961 .9971 .9979 .9985 .9949 .9962 .9972 .9980 .9985 .9951 .9963 .9973 .9980 .9986 .9952 .9964 .9974 .9981 .9986 Also: Φ(2.04) = 0.9793. 13/58 Verteilungen Stetige Tabelle Normalverteilung Φ x 1.00 1.10 1.20 1.30 1.40 0 .8413 .8643 .8849 .9032 .9192 1 .8438 .8665 .8869 .9049 .9207 2 .8461 .8686 .8888 .9066 .9222 3 .8485 .8708 .8907 .9082 .9236 4 .8508 .8729 .8925 .9099 .9251 5 .8531 .8749 .8944 .9115 .9265 6 .8554 .8770 .8962 .9131 .9279 7 .8577 .8790 .8980 .9147 .9292 8 .8599 .8810 .8997 .9162 .9306 9 .8621 .8830 .9015 .9177 .9319 1.50 1.60 1.70 1.80 1.90 .9332 .9452 .9554 .9641 .9713 .9345 .9463 .9564 .9649 .9719 .9357 .9474 .9573 .9656 .9726 .9370 .9485 .9582 .9664 .9732 .9382 .9495 .9591 .9671 .9738 .9394 .9505 .9599 .9678 .9744 .9406 .9515 .9608 .9686 .9750 .9418 .9525 .9616 .9693 .9756 .9429 .9535 .9625 .9699 .9762 .9441 .9545 .9633 .9706 .9767 2.00 2.10 2.20 2.30 2.40 .9773 .9821 .9861 .9893 .9918 .9778 .9826 .9865 .9896 .9920 .9783 .9830 .9868 .9898 .9922 .9788 .9834 .9871 .9901 .9925 .9793 .9838 .9875 .9904 .9927 .9798 .9842 .9878 .9906 .9929 .9803 .9846 .9881 .9909 .9931 .9808 .9850 .9884 .9911 .9932 .9812 .9854 .9887 .9913 .9934 .9817 .9857 .9890 .9916 .9936 2.50 2.60 2.70 2.80 2.90 .9938 .9953 .9965 .9974 .9981 .9940 .9955 .9966 .9975 .9982 .9941 .9956 .9967 .9976 .9983 .9943 .9957 .9968 .9977 .9983 .9945 .9959 .9969 .9977 .9984 .9946 .9960 .9970 .9978 .9984 .9948 .9961 .9971 .9979 .9985 .9949 .9962 .9972 .9980 .9985 .9951 .9963 .9973 .9980 .9986 .9952 .9964 .9974 .9981 .9986 Also: Φ(1.23) = 0.8907. 14/58 Verteilungen Stetige Verteilungen mit Dichte Normalverteilung Beispiel Sei Z standardnormalverteilt. P[−1.23 ≤ Z ≤ 2.04] = Φ(2.04) − Φ(−1.23). Φ(2.04) = 0.9793 Φ(−1.23) = 1 − Φ(1.23) = 1 − 0.8907 = 0.1093. Und damit P[−1.23 ≤ Z ≤ 2.04] = 0.9793 − 0.1093 = 0.87. 15/58 Verteilungen Stetige 0.3 0.4 Standardnormalverteilung P[−1.23 ≤ Z ≤ 2.04] = 0.87 0.0 0.1 0.2 1 −4 −3 −2 −1 0 1 2 3 4 16/58 Verteilungen Stetige Verteilungen mit Dichte Normalverteilung Beispiel Sei Z standardnormalverteilt. P[Z ≥ 2] = 1 − Φ(2) = 1 − 0.9773 = 0.0227. 17/58 Verteilungen Stetige 0.3 0.4 Standardnormalverteilung P[Z ≥ 2] = 0.0227 0.0 0.1 0.2 1 −4 −3 −2 −1 0 1 2 3 4 18/58 Verteilungen Stetige Verteilungen mit Dichte Normalverteilung Die Verteilung mit Dichte 1 2 f (x) = √ e−x /2 , 2π x ∈ R, heißt Standardnormalverteilung N0,1 . Ist X standardnormalverteilt und µ ∈ R, σ > 0, so hat Y := µ + σX die Dichte 1 2 2 fY (x) = √ e−(x−µ) /2σ . 2πσ 2 Die Verteilung von Y heißt Normalverteilung Nµ,σ2 . 19/58 Verteilungen Stetige 0.08 0.10 Dichte der Normalverteilung 110 + 4Z 0.00 0.02 0.04 0.06 4 94 98 102 106 110 114 118 122 126 20/58 Verteilungen Stetige Verteilungen mit Dichte Normalverteilung Sei X ∼ Nµ,σ2 . Dann ist X = µ + σZ mit Z standardnormalverteilt. Also ist X ≤ x ⇔ µ + σZ ≤ x ⇔ Z ≤ x −µ . σ Satz P[X ≤ x] = Φ((x − µ)/σ) = 1 − Φ(−(x − µ)/σ). P[X ≥ x] = 1 − Φ((x − µ)/σ) = Φ(−(x − µ)/σ). P[x1 ≤ X ≤ x2 ] = Φ((x2 − µ)/σ) − Φ((x1 − µ)/σ) für x1 < x2 . 21/58 Verteilungen Stetige Verteilungen mit Dichte Normalverteilung Beispiel Die Größe von fünfjährigen Mädchen ist im Mittel 110cm mit einer Standardabweichung von 4cm. Wie groß ist die Wahrscheinlichkeit, dass ein zufällig ausgewähltes Mädchen mindestens 103cm aber höchstens 120cm groß ist? Annahme: Größe ist normalverteilt, also X ∼ Nµ,σ2 mit µ = 110 und σ = 4. P[103 ≤ X ≤ 120] = Φ((120 − 110)/4) − Φ((103 − 110)/4) = Φ(2.5) − Φ(−1.75) = Φ(2.5) − 1 + Φ(1.75) = 0.9938 − 1 + 0.9599 = 0.9537. Die gesuchte Wahrscheinlichkeit ist 95%. 22/58 Verteilungen Stetige 0.08 0.10 Normalverteilung P[103 ≤ 110 + 4Z ≤ 120] = 0.9537 0.00 0.02 0.04 0.06 4 94 98 102 106 110 114 118 122 126 23/58 Verteilungen Stetige Verteilungen mit Dichte Normalverteilung Satz Seien X1 , X2 , . . . unabhängig und normalverteilt mit Parametern (µ1 , σ12 ), (µ2 , σ22 ), . . . und sei Sn = X1 + . . . + Xn . Dann ist Sn normalverteilt mit Parametern (µ, σ 2 ), wobei µ= n X i=1 µi und σ 2 = n X σi2 . i=1 24/58 Verteilungen Stetige Normalapproximation der Binomialverteilung Ist Z binomialverteilt bn,p mit np(1 − p) groß (mindestens 9), so ist Z − np p np(1 − p) ungefähr N0,1 -verteilt. Anders gesagt: Zpist ungefähr normalverteilt mit Parametern µ = np und σ = np(1 − p). Ähnliche Aussage gilt viel universeller (sehen wir später). 25/58 Verteilungen Stetige 0.00 0.05 0.10 0.15 0.20 0.25 Binomialverteilung b10,0.4 und Normalapprox. 0 1 2 3 4 5 6 7 8 9 10 26/58 Verteilungen Stetige 0.00 0.05 0.10 0.15 Binomialverteilung b20,0.4 und Normalapprox. 0 2 4 6 Verteilungen 8 10 12 14 16 18 27/58 Stetige 0.00 0.04 0.08 0.12 Binomialverteilung b50,0.4 und Normalapprox. 5 10 15 20 25 30 35 28/58 Verteilungen Stetige 0.00 0.02 0.04 0.06 0.08 Binomialverteilung b100,0.4 und Normalapprox. 15 20 25 30 35 Verteilungen 40 45 50 55 60 29/58 Stetige 0.000 0.010 0.020 Binomialverteilung b1000,0.4 und Normalappr. 340 360 380 400 420 440 460 30/58 Verteilungen Stetige 0.00 0.02 0.04 0.06 0.08 0.10 Gartenkresse b100,0.2 und Normalapprox. 0 5 10 15 Verteilungen 20 25 30 35 31/58 Stetige 0.00 0.02 0.04 0.06 0.08 Gartenkresse b100,0.5 und Normalapprox. 25 30 35 40 45 50 55 60 65 70 32/58 Verteilungen Stetige 0.00 0.02 0.04 0.06 0.08 0.10 Gartenkresse b100,0.8 und Normalapprox. 60 65 70 75 80 Verteilungen 85 90 95 33/58 Stetige 0.00 0.10 0.20 0.30 Gartenkresse b100,0.98 und Normalapprox. 90 91 92 93 94 95 96 97 98 99 100 34/58 Verteilungen Stetige Normalapproximation Sei X binomialverteilt bn,p und k = 0, . . . , n. Satz (Normalapproximation mit Korrekturterm 0.5) Ist np(1 − p) > 9, so gelten k + 0.5 − np p np(1 − p) P[X ≤ k] ≈ Φ ! und P[X ≥ k] ≈ 1 − Φ k − 0.5 − np p np(1 − p) ! . 35/58 Verteilungen Stetige Normalapproximation Beispiel Angenommen, die Samen der Gartenkresse keimen mit Wahrscheinlichkeit p = 0.8. Sei X die Anzahl der gekeimten Samen. Wie groß ist die Wahrscheinlichkeit w = P[X ≤ 74], dass höchstens 74 Samen gekeimt sind? w= 74 X b100,0.8 (k). k=0 Sehr langwierig auszurechnen (aber mit dem Computer im Prinzip machbar). 36/58 Verteilungen Stetige Normalapproximation Beispiel (Fortsetzung) Normalapproximation P[X ≤ 74] ≈ Φ k + 0.5 − np p np(1 − p) ! =Φ 74 + 0.5 − 80 √ 100 · 0.2 · 0.8 = Φ(−1.375) = 1 − Φ(1.375) 37/58 Verteilungen Stetige Tabelle Normalverteilung Φ x 1.00 1.10 1.20 1.30 1.40 0 .8413 .8643 .8849 .9032 .9192 1 .8438 .8665 .8869 .9049 .9207 2 .8461 .8686 .8888 .9066 .9222 3 .8485 .8708 .8907 .9082 .9236 4 .8508 .8729 .8925 .9099 .9251 5 .8531 .8749 .8944 .9115 .9265 6 .8554 .8770 .8962 .9131 .9279 7 .8577 .8790 .8980 .9147 .9292 8 .8599 .8810 .8997 .9162 .9306 9 .8621 .8830 .9015 .9177 .9319 1.50 1.60 1.70 1.80 1.90 .9332 .9452 .9554 .9641 .9713 .9345 .9463 .9564 .9649 .9719 .9357 .9474 .9573 .9656 .9726 .9370 .9485 .9582 .9664 .9732 .9382 .9495 .9591 .9671 .9738 .9394 .9505 .9599 .9678 .9744 .9406 .9515 .9608 .9686 .9750 .9418 .9525 .9616 .9693 .9756 .9429 .9535 .9625 .9699 .9762 .9441 .9545 .9633 .9706 .9767 2.00 2.10 2.20 2.30 2.40 .9773 .9821 .9861 .9893 .9918 .9778 .9826 .9865 .9896 .9920 .9783 .9830 .9868 .9898 .9922 .9788 .9834 .9871 .9901 .9925 .9793 .9838 .9875 .9904 .9927 .9798 .9842 .9878 .9906 .9929 .9803 .9846 .9881 .9909 .9931 .9808 .9850 .9884 .9911 .9932 .9812 .9854 .9887 .9913 .9934 .9817 .9857 .9890 .9916 .9936 2.50 2.60 2.70 2.80 2.90 .9938 .9953 .9965 .9974 .9981 .9940 .9955 .9966 .9975 .9982 .9941 .9956 .9967 .9976 .9983 .9943 .9957 .9968 .9977 .9983 .9945 .9959 .9969 .9977 .9984 .9946 .9960 .9970 .9978 .9984 .9948 .9961 .9971 .9979 .9985 .9949 .9962 .9972 .9980 .9985 .9951 .9963 .9973 .9980 .9986 .9952 .9964 .9974 .9981 .9986 Also: Φ(1.38) = 0.9162. 38/58 Verteilungen Stetige Normalapproximation Beispiel (2). Normalapproximation mit n = 100, p = 0.8, k = 74 ! 74 + 0.5 − 80 k + 0.5 − np =Φ √ P[X ≤ 74] ≈ Φ p 100 · 0.8 · 0.2 np(1 − p) = Φ(−1.375) = 1 − Φ(1.375) ≈ 1 − 0.9162 = 0.0838. Vergleich mit exakter Rechnung w= 74 X b100,0.8 (k) = 0.0875. k=0 Approximation nicht präzis, aber o.k. 39/58 Verteilungen Stetige Normalapproximation Beispiel Angenommen, die Samen der Gartenkresse keimen mit Wahrscheinlichkeit p = 0.98. Sei X die Anzahl der gekeimten Samen. Wie groß ist die Wahrscheinlichkeit w = P[X ≤ 99], dass höchstens 99 Samen gekeimt sind? Normalapproximation 99 + 0.5 − 98 P[X ≤ 99] ≈ Φ √ = Φ(1.07) = 100 · 0.98 · 0.02 40/58 Verteilungen Stetige Normalverteilung Φ x 1.00 1.10 1.20 1.30 1.40 0 .8413 .8643 .8849 .9032 .9192 1 .8438 .8665 .8869 .9049 .9207 2 .8461 .8686 .8888 .9066 .9222 3 .8485 .8708 .8907 .9082 .9236 4 .8508 .8729 .8925 .9099 .9251 5 .8531 .8749 .8944 .9115 .9265 6 .8554 .8770 .8962 .9131 .9279 7 .8577 .8790 .8980 .9147 .9292 8 .8599 .8810 .8997 .9162 .9306 9 .8621 .8830 .9015 .9177 .9319 1.50 1.60 1.70 1.80 1.90 .9332 .9452 .9554 .9641 .9713 .9345 .9463 .9564 .9649 .9719 .9357 .9474 .9573 .9656 .9726 .9370 .9485 .9582 .9664 .9732 .9382 .9495 .9591 .9671 .9738 .9394 .9505 .9599 .9678 .9744 .9406 .9515 .9608 .9686 .9750 .9418 .9525 .9616 .9693 .9756 .9429 .9535 .9625 .9699 .9762 .9441 .9545 .9633 .9706 .9767 2.00 2.10 2.20 2.30 2.40 .9773 .9821 .9861 .9893 .9918 .9778 .9826 .9865 .9896 .9920 .9783 .9830 .9868 .9898 .9922 .9788 .9834 .9871 .9901 .9925 .9793 .9838 .9875 .9904 .9927 .9798 .9842 .9878 .9906 .9929 .9803 .9846 .9881 .9909 .9931 .9808 .9850 .9884 .9911 .9932 .9812 .9854 .9887 .9913 .9934 .9817 .9857 .9890 .9916 .9936 2.50 2.60 2.70 2.80 2.90 .9938 .9953 .9965 .9974 .9981 .9940 .9955 .9966 .9975 .9982 .9941 .9956 .9967 .9976 .9983 .9943 .9957 .9968 .9977 .9983 .9945 .9959 .9969 .9977 .9984 .9946 .9960 .9970 .9978 .9984 .9948 .9961 .9971 .9979 .9985 .9949 .9962 .9972 .9980 .9985 .9951 .9963 .9973 .9980 .9986 .9952 .9964 .9974 .9981 .9986 Also: Φ(1.07) = 0.8577. 41/58 Verteilungen Stetige Normalapproximation Beispiel Angenommen, die Samen der Gartenkresse keimen mit Wahrscheinlichkeit p = 0.98. Sei X die Anzahl der gekeimten Samen. Wie groß ist die Wahrscheinlichkeit w = P[X ≤ 99], dass höchstens 99 Samen gekeimt sind? Normalapproximation 99 + 0.5 − 98 P[X ≤ 99] ≈ Φ √ = Φ(1.07) = 0.8577. 100 · 0.98 · 0.02 Exakte Rechnung: P[X ≤ 99] = 0.8674. Fehler 0.01. Das ist für viele Zwecke zu groß. Normalapproximation nicht so gut, weil np(1 − p) = 1.96 < 9 ist. 42/58 Verteilungen Stetige Normalapproximation Beispiel Normalapproximation 99 + 0.5 − 98 P[X ≤ 99] ≈ Φ √ = Φ(1.07) = 0.8577. 100 · 0.98 · 0.02 Exakte Rechnung: P[X ≤ 99] = 0.8674, Fehler 0.01. Poissonapproximation: 100 − X ist ungefähr Poi2 verteilt, also P[X ≤ 99] = P[100 − X ≥ 1] = 1 − P[100 − X = 0] = 1 − e−2 20 = 0.8647. 0! Fehler < 0.003. Schon besser. 43/58 Verteilungen Stetige Fehler durch Normalapproximation der Binomialverteilung np(1 − p) Max. Fehler max. Fehler für W’keiten > 0.95 oder < 0.05 5 0.03 0.019 9 0.022 0.013 15 0.017 0.010 50 0.01 0.005 200 0.005 0.0022 1000 0.0022 0.001 44/58 Verteilungen Stetige Fehler durch Poissonapproximation der Binomialverteilung λ = np = mittlere Anz. Erfolge. Theoretische Fehlergrenze: λ/n. Tatsächlicher maximaler Fehler für einige Werte: λ 1 5 1 5 10 20 5 10 10 n Max. Fehler Max. Fehler für W’keiten > 0.95 oder < 0.05 10 0.02 0.007 10 0.1 0.06 100 0.002 0.0007 100 0.008 0.004 100 0.015 0.009 100 0.03 0.02 1000 0.0007 0.0004 1000 0.002 0.0009 6 −6 10 2 · 10 10−6 45/58 Verteilungen Stetige Exponentialverteilung Die Exponentialverteilung mit Parameter θ ist die Verteilung auf [0, ∞) mit Dichte f (x) = θe−θx , x ≥ 0. Bedeutung wie geometrische Verteilung: Wartezeit auf Ereignisse. Beispiel Radioaktive Zerfälle mit Rate 2.7 Becquerel. Also im Mittel 2.7 Zerfälle pro Sekunde. X Wartezeit auf nächsten Zerfall. Dann ist X exponentialverteilt mit θ = 2.7. Also Z ∞ P[X > x] = 2.7 e−2.7 t dt = e−2.7 x . x 46/58 Kenngrößen von Verteilungen Kenngrößen von Verteilungen Wie für Messdaten in der beschreibenden Statistik: Lagemaße geben an, wo die Verteilung konzentriert ist, Streumaße geben an, wie groß die Variabilität der Werte ist. 47/58 Kenngrößen von Verteilungen Lagemaße Median und Quantile Sei X Zufallsvariable mit reellen Werten. Definition (Median) Wir nennen jede Zahl m ∈ R mit P[X ≤ m] ≥ 1 2 und P[X ≥ m] ≥ 1 2 einen Median der Verteilung von X . 48/58 Kenngrößen von Verteilungen Lagemaße Median und Quantile Sei X Zufallsvariable mit reellen Werten. Definition (Quantile) Sei α ∈ (0, 1). Jede Zahl mα ∈ R mit der Eigenschaft P[X ≤ mα ] ≥ α und P[X ≥ mα ] ≥ 1 − α heißt ein α–Quantil der Verteilung von X . Speziell ist m1/2 ein Median. Ein (1 − α)–Quantil wird auch α–Fraktil genannt. 49/58 Kenngrößen von Verteilungen Lagemaße Median und Quantile Für viele Verteilungen gibt es Tabellen der Quantile. Z.B. für zα , das α-Quantil der Standardnormalverteilung. Beispiel Sei X normalverteilt mit Parametern µ = 2 und σ 2 = 1.8. Für welche Zahl x gilt P[X ≥ x] = 0.05? x ist ein 5%-Fraktil von N2,1.8 , bzw. ein 95%-Quantil. Tabelliert sind die Quantile von N0,1 (Standardnormalverteilung). √ (X − 2)/ 1.8 ist standardnormalverteilt, also ist √ (x − 2)/ 1.8 = z0.95 = 50/58 Kenngrößen von Verteilungen Lagemaße Quantile der Normalverteilung α zα α zα 0.8 0.84162 0.995 2.57583 0.9 1.28155 0.9975 2.80703 0.95 1.64485 0.998 2.87816 0.975 1.95996 0.999 3.09023 0.98 2.05375 0.9995 3.29053 0.99 2.32635 51/58 Kenngrößen von Verteilungen Lagemaße Median und Quantile Für viele Verteilungen gibt es Tabellen der Quantile. Z.B. für das zα , das α-Quantil der Standardnormalverteilung. Beispiel Sei X normalverteilt mit Parametern µ = 2 und σ 2 = 1.8. Für welche Zahl x gilt P[X ≥ x] = 0.05? x ist ein 5%-Fraktil von N2,1.8 , bzw. ein 95%-Quantil. Tabelliert sind die Quantile von N0,1 (Standardnormalverteilung). √ (X − 2)/ 1.8 ist standardnormalverteilt, also ist √ (x − 2)/ 1.8 = z0.95 = 1.64485. Auflösen nach x x =2+ √ 1.8 · 1.64485 = 4.2068. 52/58 Kenngrößen von Verteilungen Lagemaße Median und Quantile Änderung durch Verschieben und Strecken Sei X eine reelle Zufallsvariable und Y := a + bX . Seien mαX und mαY die α-Quantile von X und Y . Satz Es gilt mαY = a + bmαX . 53/58 Kenngrößen von Verteilungen Lagemaße Erwartungswert Definition Sei X eine Zufallsvariable mit Wertebereich W ⊂ R. Ist W ⊂ R diskret, so definieren wir den Erwartungswert von X durch X E[X ] := w P[X = w]. w∈W Ist W ⊂ R ein Intervall (möglicherweise ganz R), und hat X die Dichte f , so setzen wir Z ∞ E[X ] := x f (x) dx. −∞ Erwartungswert entspricht dem arithmetischen Mittel von Daten. 54/58 Kenngrößen von Verteilungen Lagemaße Erwartungswert Beispiel Würfelwurf X . E[X ] = P[X = 1] · 1 + P[X = 2] · 2 + . . . + P[X = 6] · 6 1 1 1 = · 1 + · 2 + ... + · 6 6 6 6 1 = (1 + 2 + 3 + 4 + 5 + 6) = 3.5. 6 X Wartezeit auf ersten Erfolg, Erfolg mit Wahrscheinlichkeit p. Also X geometrisch mit Parameter p. E[X ] = ∞ X P[X = k] · k = k=0 ∞ X p(1 − p)k k = k=0 1−p . p 55/58 Kenngrößen von Verteilungen Lagemaße Erwartungswert Beispiel X binomialverteilt mit Parametern n, p: n X n k E[X ] = p (1 − p)n−k k = np. k k=0 X hypergeometrisch verteilt mit Parametern N, K , n: E[X ] = Kn . N 56/58 Kenngrößen von Verteilungen Lagemaße Erwartungswert Beispiel X exponentialverteilt mit Parameter θ: Z ∞ 1 E[X ] = θe−θx x dx = . θ 0 X normalverteilt mit Parametern µ, σ 2 : Z ∞ 1 2 2 E[X ] = √ x e−(x−µ) /(2σ ) dx = µ. 2πσ 2 −∞ 57/58 Kenngrößen von Verteilungen Lagemaße Linearität des Erwartungswertes Satz Es seien X und Y reelle Zufallsvariablen mit Erwartungswert sowie a, b ∈ R. Dann gelten E[a + bX ] = a + b E[X ], E[X + Y ] = E[X ] + E[Y ]. Erste Regel gilt auch für Median, zweite Regel nicht. 58/58