Verteilungen, Kenngrößen - staff.uni

Biostatistik, Winter 2011/12
Wahrscheinlichkeitstheorie: Verteilungen, Kenngrößen
Prof. Dr. Achim Klenke
http://www.aklenke.de
7. Vorlesung: 09.12.2011
1/58
Inhalt
1
Verteilungen
Stetige
2
Kenngrößen von Verteilungen
Lagemaße
2/58
Verteilungen
Stetige
Verteilungen mit Dichte
Normalverteilung
Die Verteilung mit Dichte
1
2
f (t) = √ e−t /2 ,
2π
t ∈ R,
heißt Standardnormalverteilung N0,1 .
3/58
Verteilungen
Stetige
0.3
0.4
Standardnormalverteilung P[Z ≤ 1.55] = 0.9394
0.0
0.1
0.2
1
−4
−3
−2
−1
0
1
2
3
4
4/58
Verteilungen
Stetige
Verteilungen mit Dichte
Normalverteilung
Die Verteilung mit Dichte
1
2
f (t) = √ e−t /2 ,
t ∈ R,
2π
heißt Standardnormalverteilung N0,1 .
Ist Z standardnormalverteilt, dann ist
Z x
1
2
e−t /2 dt.
P[Z ≤ x] = Φ(x) := √
2π −∞
Die Werte der Verteilungsfunktion
Φ(x) = P[Z ≤ x],
x ∈ R,
sind tabelliert für x ≥ 0. Z.B. im Skript, das online steht.
Für x < 0 benutzt man
Φ(x) = 1 − Φ(−x).
5/58
Verteilungen
Stetige
Verteilungen mit Dichte
Normalverteilung
Sei Z standardnormalverteilt.
Satz
P[Z ≤ x] = Φ(x) = 1 − Φ(−x).
P[Z ≥ x] = 1 − Φ(x) = Φ(−x).
P[x1 ≤ Z ≤ x2 ] = Φ(x2 ) − Φ(x1 )
für x1 < x2 .
6/58
Verteilungen
Stetige
Verteilungen mit Dichte
Normalverteilung
Beispiel
Sei Z standardnormalverteilt.
P[Z ≤ 1.55] = Φ(1.55) = .
7/58
Tabelle Normalverteilung Φ
x
0.00
0.10
0.20
0.30
0.40
0
.5000
.5398
.5793
.6179
.6554
1
.5040
.5438
.5832
.6217
.6591
2
.5080
.5478
.5871
.6255
.6628
3
.5120
.5517
.5910
.6293
.6664
4
.5160
.5557
.5948
.6331
.6700
5
.5199
.5596
.5987
.6368
.6736
6
.5239
.5636
.6026
.6406
.6772
7
.5279
.5675
.6064
.6443
.6808
8
.5319
.5714
.6103
.6480
.6844
9
.5359
.5753
.6141
.6517
.6879
0.50
0.60
0.70
0.80
0.90
.6915
.7257
.7580
.7881
.8159
.6950
.7291
.7611
.7910
.8186
.6985
.7324
.7642
.7939
.8212
.7019
.7357
.7673
.7967
.8238
.7054
.7389
.7704
.7995
.8264
.7088
.7422
.7734
.8023
.8289
.7123
.7454
.7764
.8051
.8315
.7157
.7486
.7794
.8079
.8340
.7190
.7517
.7823
.8106
.8365
.7224
.7549
.7852
.8133
.8389
1.00
1.10
1.20
1.30
1.40
.8413
.8643
.8849
.9032
.9192
.8438
.8665
.8869
.9049
.9207
.8461
.8686
.8888
.9066
.9222
.8485
.8708
.8907
.9082
.9236
.8508
.8729
.8925
.9099
.9251
.8531
.8749
.8944
.9115
.9265
.8554
.8770
.8962
.9131
.9279
.8577
.8790
.8980
.9147
.9292
.8599
.8810
.8997
.9162
.9306
.8621
.8830
.9015
.9177
.9319
1.50
1.60
1.70
1.80
1.90
.9332
.9452
.9554
.9641
.9713
.9345
.9463
.9564
.9649
.9719
.9357
.9474
.9573
.9656
.9726
.9370
.9485
.9582
.9664
.9732
.9382
.9495
.9591
.9671
.9738
.9394
.9505
.9599
.9678
.9744
.9406
.9515
.9608
.9686
.9750
.9418
.9525
.9616
.9693
.9756
.9429
.9535
.9625
.9699
.9762
.9441
.9545
.9633
.9706
.9767
2.00
2.10
2.20
2.30
2.40
.9773
.9821
.9861
.9893
.9918
.9778
.9826
.9865
.9896
.9920
.9783
.9830
.9868
.9898
.9922
.9788
.9834
.9871
.9901
.9925
.9793
.9838
.9875
.9904
.9927
.9798
.9842
.9878
.9906
.9929
.9803
.9846
.9881
.9909
.9931
.9808
.9850
.9884
.9911
.9932
.9812
.9854
.9887
.9913
.9934
.9817
.9857
.9890
.9916
.9936
2.50
2.60
2.70
2.80
2.90
.9938
.9953
.9965
.9974
.9981
.9940
.9955
.9966
.9975
.9982
.9941
.9956
.9967
.9976
.9983
.9943
.9957
.9968
.9977
.9983
.9945
.9959
.9969
.9977
.9984
.9946
.9960
.9970
.9978
.9984
.9948
.9961
.9971
.9979
.9985
.9949
.9962
.9972
.9980
.9985
.9951
.9963
.9973
.9980
.9986
.9952
.9964
.9974
.9981
.9986
Verteilungen
Stetige
Tabelle Normalverteilung Φ
x
1.00
1.10
1.20
1.30
1.40
0
.8413
.8643
.8849
.9032
.9192
1
.8438
.8665
.8869
.9049
.9207
2
.8461
.8686
.8888
.9066
.9222
3
.8485
.8708
.8907
.9082
.9236
4
.8508
.8729
.8925
.9099
.9251
5
.8531
.8749
.8944
.9115
.9265
6
.8554
.8770
.8962
.9131
.9279
7
.8577
.8790
.8980
.9147
.9292
8
.8599
.8810
.8997
.9162
.9306
9
.8621
.8830
.9015
.9177
.9319
1.50
1.60
1.70
1.80
1.90
.9332
.9452
.9554
.9641
.9713
.9345
.9463
.9564
.9649
.9719
.9357
.9474
.9573
.9656
.9726
.9370
.9485
.9582
.9664
.9732
.9382
.9495
.9591
.9671
.9738
.9394
.9505
.9599
.9678
.9744
.9406
.9515
.9608
.9686
.9750
.9418
.9525
.9616
.9693
.9756
.9429
.9535
.9625
.9699
.9762
.9441
.9545
.9633
.9706
.9767
2.00
2.10
2.20
2.30
2.40
.9773
.9821
.9861
.9893
.9918
.9778
.9826
.9865
.9896
.9920
.9783
.9830
.9868
.9898
.9922
.9788
.9834
.9871
.9901
.9925
.9793
.9838
.9875
.9904
.9927
.9798
.9842
.9878
.9906
.9929
.9803
.9846
.9881
.9909
.9931
.9808
.9850
.9884
.9911
.9932
.9812
.9854
.9887
.9913
.9934
.9817
.9857
.9890
.9916
.9936
2.50
2.60
2.70
2.80
2.90
.9938
.9953
.9965
.9974
.9981
.9940
.9955
.9966
.9975
.9982
.9941
.9956
.9967
.9976
.9983
.9943
.9957
.9968
.9977
.9983
.9945
.9959
.9969
.9977
.9984
.9946
.9960
.9970
.9978
.9984
.9948
.9961
.9971
.9979
.9985
.9949
.9962
.9972
.9980
.9985
.9951
.9963
.9973
.9980
.9986
.9952
.9964
.9974
.9981
.9986
Also: Φ(1.55) = 0.9394.
9/58
Verteilungen
Stetige
Verteilungen mit Dichte
Normalverteilung
Beispiel
Sei Z standardnormalverteilt.
P[Z ≤ 1.55] = Φ(1.55) = 0.9394
10/58
Verteilungen
Stetige
0.3
0.4
Standardnormalverteilung P[Z ≤ 1.55] = 0.9394
0.0
0.1
0.2
1
−4
−3
−2
−1
0
1
2
3
4
11/58
Verteilungen
Stetige
Verteilungen mit Dichte
Normalverteilung
Beispiel
Sei Z standardnormalverteilt.
P[−1.23 ≤ Z ≤ 2.04] = Φ(2.04) − Φ(−1.23).
Φ(2.04) =
Φ(−1.23) = 1 − Φ(1.23) =
12/58
Verteilungen
Stetige
Tabelle Normalverteilung Φ
x
1.00
1.10
1.20
1.30
1.40
0
.8413
.8643
.8849
.9032
.9192
1
.8438
.8665
.8869
.9049
.9207
2
.8461
.8686
.8888
.9066
.9222
3
.8485
.8708
.8907
.9082
.9236
4
.8508
.8729
.8925
.9099
.9251
5
.8531
.8749
.8944
.9115
.9265
6
.8554
.8770
.8962
.9131
.9279
7
.8577
.8790
.8980
.9147
.9292
8
.8599
.8810
.8997
.9162
.9306
9
.8621
.8830
.9015
.9177
.9319
1.50
1.60
1.70
1.80
1.90
.9332
.9452
.9554
.9641
.9713
.9345
.9463
.9564
.9649
.9719
.9357
.9474
.9573
.9656
.9726
.9370
.9485
.9582
.9664
.9732
.9382
.9495
.9591
.9671
.9738
.9394
.9505
.9599
.9678
.9744
.9406
.9515
.9608
.9686
.9750
.9418
.9525
.9616
.9693
.9756
.9429
.9535
.9625
.9699
.9762
.9441
.9545
.9633
.9706
.9767
2.00
2.10
2.20
2.30
2.40
.9773
.9821
.9861
.9893
.9918
.9778
.9826
.9865
.9896
.9920
.9783
.9830
.9868
.9898
.9922
.9788
.9834
.9871
.9901
.9925
.9793
.9838
.9875
.9904
.9927
.9798
.9842
.9878
.9906
.9929
.9803
.9846
.9881
.9909
.9931
.9808
.9850
.9884
.9911
.9932
.9812
.9854
.9887
.9913
.9934
.9817
.9857
.9890
.9916
.9936
2.50
2.60
2.70
2.80
2.90
.9938
.9953
.9965
.9974
.9981
.9940
.9955
.9966
.9975
.9982
.9941
.9956
.9967
.9976
.9983
.9943
.9957
.9968
.9977
.9983
.9945
.9959
.9969
.9977
.9984
.9946
.9960
.9970
.9978
.9984
.9948
.9961
.9971
.9979
.9985
.9949
.9962
.9972
.9980
.9985
.9951
.9963
.9973
.9980
.9986
.9952
.9964
.9974
.9981
.9986
Also: Φ(2.04) = 0.9793.
13/58
Verteilungen
Stetige
Tabelle Normalverteilung Φ
x
1.00
1.10
1.20
1.30
1.40
0
.8413
.8643
.8849
.9032
.9192
1
.8438
.8665
.8869
.9049
.9207
2
.8461
.8686
.8888
.9066
.9222
3
.8485
.8708
.8907
.9082
.9236
4
.8508
.8729
.8925
.9099
.9251
5
.8531
.8749
.8944
.9115
.9265
6
.8554
.8770
.8962
.9131
.9279
7
.8577
.8790
.8980
.9147
.9292
8
.8599
.8810
.8997
.9162
.9306
9
.8621
.8830
.9015
.9177
.9319
1.50
1.60
1.70
1.80
1.90
.9332
.9452
.9554
.9641
.9713
.9345
.9463
.9564
.9649
.9719
.9357
.9474
.9573
.9656
.9726
.9370
.9485
.9582
.9664
.9732
.9382
.9495
.9591
.9671
.9738
.9394
.9505
.9599
.9678
.9744
.9406
.9515
.9608
.9686
.9750
.9418
.9525
.9616
.9693
.9756
.9429
.9535
.9625
.9699
.9762
.9441
.9545
.9633
.9706
.9767
2.00
2.10
2.20
2.30
2.40
.9773
.9821
.9861
.9893
.9918
.9778
.9826
.9865
.9896
.9920
.9783
.9830
.9868
.9898
.9922
.9788
.9834
.9871
.9901
.9925
.9793
.9838
.9875
.9904
.9927
.9798
.9842
.9878
.9906
.9929
.9803
.9846
.9881
.9909
.9931
.9808
.9850
.9884
.9911
.9932
.9812
.9854
.9887
.9913
.9934
.9817
.9857
.9890
.9916
.9936
2.50
2.60
2.70
2.80
2.90
.9938
.9953
.9965
.9974
.9981
.9940
.9955
.9966
.9975
.9982
.9941
.9956
.9967
.9976
.9983
.9943
.9957
.9968
.9977
.9983
.9945
.9959
.9969
.9977
.9984
.9946
.9960
.9970
.9978
.9984
.9948
.9961
.9971
.9979
.9985
.9949
.9962
.9972
.9980
.9985
.9951
.9963
.9973
.9980
.9986
.9952
.9964
.9974
.9981
.9986
Also: Φ(1.23) = 0.8907.
14/58
Verteilungen
Stetige
Verteilungen mit Dichte
Normalverteilung
Beispiel
Sei Z standardnormalverteilt.
P[−1.23 ≤ Z ≤ 2.04] = Φ(2.04) − Φ(−1.23).
Φ(2.04) = 0.9793
Φ(−1.23) = 1 − Φ(1.23) = 1 − 0.8907 = 0.1093.
Und damit
P[−1.23 ≤ Z ≤ 2.04] = 0.9793 − 0.1093 = 0.87.
15/58
Verteilungen
Stetige
0.3
0.4
Standardnormalverteilung P[−1.23 ≤ Z ≤ 2.04] = 0.87
0.0
0.1
0.2
1
−4
−3
−2
−1
0
1
2
3
4
16/58
Verteilungen
Stetige
Verteilungen mit Dichte
Normalverteilung
Beispiel
Sei Z standardnormalverteilt.
P[Z ≥ 2] = 1 − Φ(2) = 1 − 0.9773 = 0.0227.
17/58
Verteilungen
Stetige
0.3
0.4
Standardnormalverteilung P[Z ≥ 2] = 0.0227
0.0
0.1
0.2
1
−4
−3
−2
−1
0
1
2
3
4
18/58
Verteilungen
Stetige
Verteilungen mit Dichte
Normalverteilung
Die Verteilung mit Dichte
1
2
f (x) = √ e−x /2 ,
2π
x ∈ R,
heißt Standardnormalverteilung N0,1 .
Ist X standardnormalverteilt und µ ∈ R, σ > 0, so hat
Y := µ + σX die Dichte
1
2
2
fY (x) = √
e−(x−µ) /2σ .
2πσ 2
Die Verteilung von Y heißt Normalverteilung Nµ,σ2 .
19/58
Verteilungen
Stetige
0.08
0.10
Dichte der Normalverteilung 110 + 4Z
0.00
0.02
0.04
0.06
4
94
98
102
106
110
114
118
122
126
20/58
Verteilungen
Stetige
Verteilungen mit Dichte
Normalverteilung
Sei X ∼ Nµ,σ2 . Dann ist X = µ + σZ mit Z
standardnormalverteilt. Also ist
X ≤ x ⇔ µ + σZ ≤ x ⇔ Z ≤
x −µ
.
σ
Satz
P[X ≤ x] = Φ((x − µ)/σ) = 1 − Φ(−(x − µ)/σ).
P[X ≥ x] = 1 − Φ((x − µ)/σ) = Φ(−(x − µ)/σ).
P[x1 ≤ X ≤ x2 ] = Φ((x2 − µ)/σ) − Φ((x1 − µ)/σ)
für x1 < x2 .
21/58
Verteilungen
Stetige
Verteilungen mit Dichte
Normalverteilung
Beispiel
Die Größe von fünfjährigen Mädchen ist im Mittel 110cm mit
einer Standardabweichung von 4cm. Wie groß ist die
Wahrscheinlichkeit, dass ein zufällig ausgewähltes Mädchen
mindestens 103cm aber höchstens 120cm groß ist?
Annahme: Größe ist normalverteilt, also X ∼ Nµ,σ2 mit µ = 110
und σ = 4.
P[103 ≤ X ≤ 120] = Φ((120 − 110)/4) − Φ((103 − 110)/4)
= Φ(2.5) − Φ(−1.75) = Φ(2.5) − 1 + Φ(1.75)
= 0.9938 − 1 + 0.9599 = 0.9537.
Die gesuchte Wahrscheinlichkeit ist 95%.
22/58
Verteilungen
Stetige
0.08
0.10
Normalverteilung P[103 ≤ 110 + 4Z ≤ 120] = 0.9537
0.00
0.02
0.04
0.06
4
94
98
102
106
110
114
118
122
126
23/58
Verteilungen
Stetige
Verteilungen mit Dichte
Normalverteilung
Satz
Seien X1 , X2 , . . . unabhängig und normalverteilt mit Parametern
(µ1 , σ12 ), (µ2 , σ22 ), . . . und sei Sn = X1 + . . . + Xn . Dann ist Sn
normalverteilt mit Parametern (µ, σ 2 ), wobei
µ=
n
X
i=1
µi
und σ 2 =
n
X
σi2 .
i=1
24/58
Verteilungen
Stetige
Normalapproximation der Binomialverteilung
Ist Z binomialverteilt bn,p mit np(1 − p) groß (mindestens 9), so
ist
Z − np
p
np(1 − p)
ungefähr N0,1 -verteilt.
Anders gesagt: Zpist ungefähr normalverteilt mit Parametern
µ = np und σ = np(1 − p).
Ähnliche Aussage gilt viel universeller (sehen wir später).
25/58
Verteilungen
Stetige
0.00 0.05 0.10 0.15 0.20 0.25
Binomialverteilung b10,0.4 und Normalapprox.
0
1
2
3
4
5
6
7
8
9
10
26/58
Verteilungen
Stetige
0.00
0.05
0.10
0.15
Binomialverteilung b20,0.4 und Normalapprox.
0
2
4
6
Verteilungen
8
10
12
14
16
18
27/58
Stetige
0.00
0.04
0.08
0.12
Binomialverteilung b50,0.4 und Normalapprox.
5
10
15
20
25
30
35
28/58
Verteilungen
Stetige
0.00
0.02
0.04
0.06
0.08
Binomialverteilung b100,0.4 und Normalapprox.
15
20
25
30
35
Verteilungen
40
45
50
55
60
29/58
Stetige
0.000
0.010
0.020
Binomialverteilung b1000,0.4 und Normalappr.
340
360
380
400
420
440
460
30/58
Verteilungen
Stetige
0.00 0.02 0.04 0.06 0.08 0.10
Gartenkresse b100,0.2 und Normalapprox.
0
5
10
15
Verteilungen
20
25
30
35
31/58
Stetige
0.00
0.02
0.04
0.06
0.08
Gartenkresse b100,0.5 und Normalapprox.
25
30
35
40
45
50
55
60
65
70
32/58
Verteilungen
Stetige
0.00 0.02 0.04 0.06 0.08 0.10
Gartenkresse b100,0.8 und Normalapprox.
60
65
70
75
80
Verteilungen
85
90
95
33/58
Stetige
0.00
0.10
0.20
0.30
Gartenkresse b100,0.98 und Normalapprox.
90
91
92
93
94
95
96
97
98
99
100
34/58
Verteilungen
Stetige
Normalapproximation
Sei X binomialverteilt bn,p und k = 0, . . . , n.
Satz (Normalapproximation mit Korrekturterm 0.5)
Ist np(1 − p) > 9, so gelten
k + 0.5 − np
p
np(1 − p)
P[X ≤ k] ≈ Φ
!
und
P[X ≥ k] ≈ 1 − Φ
k − 0.5 − np
p
np(1 − p)
!
.
35/58
Verteilungen
Stetige
Normalapproximation
Beispiel
Angenommen, die Samen der Gartenkresse keimen mit
Wahrscheinlichkeit p = 0.8. Sei X die Anzahl der gekeimten
Samen. Wie groß ist die Wahrscheinlichkeit w = P[X ≤ 74],
dass höchstens 74 Samen gekeimt sind?
w=
74
X
b100,0.8 (k).
k=0
Sehr langwierig auszurechnen (aber mit dem Computer im
Prinzip machbar).
36/58
Verteilungen
Stetige
Normalapproximation
Beispiel (Fortsetzung)
Normalapproximation
P[X ≤ 74] ≈ Φ
k + 0.5 − np
p
np(1 − p)
!
=Φ
74 + 0.5 − 80
√
100 · 0.2 · 0.8
= Φ(−1.375) = 1 − Φ(1.375)
37/58
Verteilungen
Stetige
Tabelle Normalverteilung Φ
x
1.00
1.10
1.20
1.30
1.40
0
.8413
.8643
.8849
.9032
.9192
1
.8438
.8665
.8869
.9049
.9207
2
.8461
.8686
.8888
.9066
.9222
3
.8485
.8708
.8907
.9082
.9236
4
.8508
.8729
.8925
.9099
.9251
5
.8531
.8749
.8944
.9115
.9265
6
.8554
.8770
.8962
.9131
.9279
7
.8577
.8790
.8980
.9147
.9292
8
.8599
.8810
.8997
.9162
.9306
9
.8621
.8830
.9015
.9177
.9319
1.50
1.60
1.70
1.80
1.90
.9332
.9452
.9554
.9641
.9713
.9345
.9463
.9564
.9649
.9719
.9357
.9474
.9573
.9656
.9726
.9370
.9485
.9582
.9664
.9732
.9382
.9495
.9591
.9671
.9738
.9394
.9505
.9599
.9678
.9744
.9406
.9515
.9608
.9686
.9750
.9418
.9525
.9616
.9693
.9756
.9429
.9535
.9625
.9699
.9762
.9441
.9545
.9633
.9706
.9767
2.00
2.10
2.20
2.30
2.40
.9773
.9821
.9861
.9893
.9918
.9778
.9826
.9865
.9896
.9920
.9783
.9830
.9868
.9898
.9922
.9788
.9834
.9871
.9901
.9925
.9793
.9838
.9875
.9904
.9927
.9798
.9842
.9878
.9906
.9929
.9803
.9846
.9881
.9909
.9931
.9808
.9850
.9884
.9911
.9932
.9812
.9854
.9887
.9913
.9934
.9817
.9857
.9890
.9916
.9936
2.50
2.60
2.70
2.80
2.90
.9938
.9953
.9965
.9974
.9981
.9940
.9955
.9966
.9975
.9982
.9941
.9956
.9967
.9976
.9983
.9943
.9957
.9968
.9977
.9983
.9945
.9959
.9969
.9977
.9984
.9946
.9960
.9970
.9978
.9984
.9948
.9961
.9971
.9979
.9985
.9949
.9962
.9972
.9980
.9985
.9951
.9963
.9973
.9980
.9986
.9952
.9964
.9974
.9981
.9986
Also: Φ(1.38) = 0.9162.
38/58
Verteilungen
Stetige
Normalapproximation
Beispiel (2).
Normalapproximation mit n = 100, p = 0.8, k = 74
!
74 + 0.5 − 80
k + 0.5 − np
=Φ √
P[X ≤ 74] ≈ Φ p
100 · 0.8 · 0.2
np(1 − p)
= Φ(−1.375) = 1 − Φ(1.375) ≈ 1 − 0.9162 = 0.0838.
Vergleich mit exakter Rechnung
w=
74
X
b100,0.8 (k) = 0.0875.
k=0
Approximation nicht präzis, aber o.k.
39/58
Verteilungen
Stetige
Normalapproximation
Beispiel
Angenommen, die Samen der Gartenkresse keimen mit
Wahrscheinlichkeit p = 0.98. Sei X die Anzahl der gekeimten
Samen. Wie groß ist die Wahrscheinlichkeit w = P[X ≤ 99],
dass höchstens 99 Samen gekeimt sind?
Normalapproximation
99 + 0.5 − 98
P[X ≤ 99] ≈ Φ √
= Φ(1.07) =
100 · 0.98 · 0.02
40/58
Verteilungen
Stetige
Normalverteilung Φ
x
1.00
1.10
1.20
1.30
1.40
0
.8413
.8643
.8849
.9032
.9192
1
.8438
.8665
.8869
.9049
.9207
2
.8461
.8686
.8888
.9066
.9222
3
.8485
.8708
.8907
.9082
.9236
4
.8508
.8729
.8925
.9099
.9251
5
.8531
.8749
.8944
.9115
.9265
6
.8554
.8770
.8962
.9131
.9279
7
.8577
.8790
.8980
.9147
.9292
8
.8599
.8810
.8997
.9162
.9306
9
.8621
.8830
.9015
.9177
.9319
1.50
1.60
1.70
1.80
1.90
.9332
.9452
.9554
.9641
.9713
.9345
.9463
.9564
.9649
.9719
.9357
.9474
.9573
.9656
.9726
.9370
.9485
.9582
.9664
.9732
.9382
.9495
.9591
.9671
.9738
.9394
.9505
.9599
.9678
.9744
.9406
.9515
.9608
.9686
.9750
.9418
.9525
.9616
.9693
.9756
.9429
.9535
.9625
.9699
.9762
.9441
.9545
.9633
.9706
.9767
2.00
2.10
2.20
2.30
2.40
.9773
.9821
.9861
.9893
.9918
.9778
.9826
.9865
.9896
.9920
.9783
.9830
.9868
.9898
.9922
.9788
.9834
.9871
.9901
.9925
.9793
.9838
.9875
.9904
.9927
.9798
.9842
.9878
.9906
.9929
.9803
.9846
.9881
.9909
.9931
.9808
.9850
.9884
.9911
.9932
.9812
.9854
.9887
.9913
.9934
.9817
.9857
.9890
.9916
.9936
2.50
2.60
2.70
2.80
2.90
.9938
.9953
.9965
.9974
.9981
.9940
.9955
.9966
.9975
.9982
.9941
.9956
.9967
.9976
.9983
.9943
.9957
.9968
.9977
.9983
.9945
.9959
.9969
.9977
.9984
.9946
.9960
.9970
.9978
.9984
.9948
.9961
.9971
.9979
.9985
.9949
.9962
.9972
.9980
.9985
.9951
.9963
.9973
.9980
.9986
.9952
.9964
.9974
.9981
.9986
Also: Φ(1.07) = 0.8577.
41/58
Verteilungen
Stetige
Normalapproximation
Beispiel
Angenommen, die Samen der Gartenkresse keimen mit
Wahrscheinlichkeit p = 0.98. Sei X die Anzahl der gekeimten
Samen. Wie groß ist die Wahrscheinlichkeit w = P[X ≤ 99],
dass höchstens 99 Samen gekeimt sind?
Normalapproximation
99 + 0.5 − 98
P[X ≤ 99] ≈ Φ √
= Φ(1.07) = 0.8577.
100 · 0.98 · 0.02
Exakte Rechnung: P[X ≤ 99] = 0.8674.
Fehler 0.01. Das ist für viele Zwecke zu groß.
Normalapproximation nicht so gut, weil np(1 − p) = 1.96 < 9 ist.
42/58
Verteilungen
Stetige
Normalapproximation
Beispiel
Normalapproximation
99 + 0.5 − 98
P[X ≤ 99] ≈ Φ √
= Φ(1.07) = 0.8577.
100 · 0.98 · 0.02
Exakte Rechnung: P[X ≤ 99] = 0.8674, Fehler 0.01.
Poissonapproximation: 100 − X ist ungefähr Poi2 verteilt, also
P[X ≤ 99] = P[100 − X ≥ 1] = 1 − P[100 − X = 0]
= 1 − e−2
20
= 0.8647.
0!
Fehler < 0.003. Schon besser.
43/58
Verteilungen
Stetige
Fehler durch Normalapproximation der
Binomialverteilung
np(1 − p) Max. Fehler max. Fehler für W’keiten
> 0.95 oder < 0.05
5 0.03
0.019
9 0.022
0.013
15 0.017
0.010
50 0.01
0.005
200 0.005
0.0022
1000 0.0022
0.001
44/58
Verteilungen
Stetige
Fehler durch Poissonapproximation der Binomialverteilung
λ = np = mittlere Anz. Erfolge. Theoretische Fehlergrenze: λ/n.
Tatsächlicher maximaler Fehler für einige Werte:
λ
1
5
1
5
10
20
5
10
10
n Max. Fehler Max. Fehler für W’keiten
> 0.95 oder < 0.05
10 0.02
0.007
10 0.1
0.06
100 0.002
0.0007
100 0.008
0.004
100 0.015
0.009
100 0.03
0.02
1000 0.0007
0.0004
1000 0.002
0.0009
6
−6
10 2 · 10
10−6
45/58
Verteilungen
Stetige
Exponentialverteilung
Die Exponentialverteilung mit Parameter θ ist die Verteilung auf
[0, ∞) mit Dichte
f (x) = θe−θx ,
x ≥ 0.
Bedeutung wie geometrische Verteilung: Wartezeit auf
Ereignisse.
Beispiel
Radioaktive Zerfälle mit Rate 2.7 Becquerel. Also im Mittel 2.7
Zerfälle pro Sekunde. X Wartezeit auf nächsten Zerfall. Dann ist
X exponentialverteilt mit θ = 2.7. Also
Z ∞
P[X > x] = 2.7
e−2.7 t dt = e−2.7 x .
x
46/58
Kenngrößen von Verteilungen
Kenngrößen von Verteilungen
Wie für Messdaten in der beschreibenden Statistik:
Lagemaße geben an, wo die Verteilung konzentriert ist,
Streumaße geben an, wie groß die Variabilität der Werte
ist.
47/58
Kenngrößen von Verteilungen
Lagemaße
Median und Quantile
Sei X Zufallsvariable mit reellen Werten.
Definition (Median)
Wir nennen jede Zahl m ∈ R mit
P[X ≤ m] ≥
1
2
und
P[X ≥ m] ≥
1
2
einen Median der Verteilung von X .
48/58
Kenngrößen von Verteilungen
Lagemaße
Median und Quantile
Sei X Zufallsvariable mit reellen Werten.
Definition (Quantile)
Sei α ∈ (0, 1). Jede Zahl mα ∈ R mit der Eigenschaft
P[X ≤ mα ] ≥ α
und
P[X ≥ mα ] ≥ 1 − α
heißt ein α–Quantil der Verteilung von X . Speziell ist m1/2 ein
Median.
Ein (1 − α)–Quantil wird auch α–Fraktil genannt.
49/58
Kenngrößen von Verteilungen
Lagemaße
Median und Quantile
Für viele Verteilungen gibt es Tabellen der Quantile. Z.B. für zα ,
das α-Quantil der Standardnormalverteilung.
Beispiel
Sei X normalverteilt mit Parametern µ = 2 und σ 2 = 1.8. Für
welche Zahl x gilt P[X ≥ x] = 0.05?
x ist ein 5%-Fraktil von N2,1.8 , bzw. ein 95%-Quantil. Tabelliert
sind die Quantile von N0,1 (Standardnormalverteilung).
√
(X − 2)/ 1.8 ist standardnormalverteilt, also ist
√
(x − 2)/ 1.8 = z0.95 =
50/58
Kenngrößen von Verteilungen
Lagemaße
Quantile der Normalverteilung
α
zα
α
zα
0.8
0.84162
0.995
2.57583
0.9
1.28155
0.9975 2.80703
0.95
1.64485
0.998
2.87816
0.975 1.95996
0.999
3.09023
0.98
2.05375
0.9995 3.29053
0.99
2.32635
51/58
Kenngrößen von Verteilungen
Lagemaße
Median und Quantile
Für viele Verteilungen gibt es Tabellen der Quantile. Z.B. für das
zα , das α-Quantil der Standardnormalverteilung.
Beispiel
Sei X normalverteilt mit Parametern µ = 2 und σ 2 = 1.8. Für
welche Zahl x gilt P[X ≥ x] = 0.05?
x ist ein 5%-Fraktil von N2,1.8 , bzw. ein 95%-Quantil. Tabelliert
sind die Quantile
von N0,1 (Standardnormalverteilung).
√
(X − 2)/ 1.8 ist standardnormalverteilt, also ist
√
(x − 2)/ 1.8 = z0.95 = 1.64485.
Auflösen nach x
x =2+
√
1.8 · 1.64485 = 4.2068.
52/58
Kenngrößen von Verteilungen
Lagemaße
Median und Quantile
Änderung durch Verschieben und Strecken
Sei X eine reelle Zufallsvariable und
Y := a + bX .
Seien mαX und mαY die α-Quantile von X und Y .
Satz
Es gilt
mαY = a + bmαX .
53/58
Kenngrößen von Verteilungen
Lagemaße
Erwartungswert
Definition
Sei X eine Zufallsvariable mit Wertebereich W ⊂ R.
Ist W ⊂ R diskret, so definieren wir den Erwartungswert von
X durch
X
E[X ] :=
w P[X = w].
w∈W
Ist W ⊂ R ein Intervall (möglicherweise ganz R), und hat X
die Dichte f , so setzen wir
Z ∞
E[X ] :=
x f (x) dx.
−∞
Erwartungswert entspricht dem arithmetischen Mittel von Daten.
54/58
Kenngrößen von Verteilungen
Lagemaße
Erwartungswert
Beispiel
Würfelwurf X .
E[X ] = P[X = 1] · 1 + P[X = 2] · 2 + . . . + P[X = 6] · 6
1
1
1
= · 1 + · 2 + ... + · 6
6
6
6
1
= (1 + 2 + 3 + 4 + 5 + 6) = 3.5.
6
X Wartezeit auf ersten Erfolg, Erfolg mit Wahrscheinlichkeit
p. Also X geometrisch mit Parameter p.
E[X ] =
∞
X
P[X = k] · k =
k=0
∞
X
p(1 − p)k k =
k=0
1−p
.
p
55/58
Kenngrößen von Verteilungen
Lagemaße
Erwartungswert
Beispiel
X binomialverteilt mit Parametern n, p:
n X
n k
E[X ] =
p (1 − p)n−k k = np.
k
k=0
X hypergeometrisch verteilt mit Parametern N, K , n:
E[X ] =
Kn
.
N
56/58
Kenngrößen von Verteilungen
Lagemaße
Erwartungswert
Beispiel
X exponentialverteilt mit Parameter θ:
Z ∞
1
E[X ] =
θe−θx x dx = .
θ
0
X normalverteilt mit Parametern µ, σ 2 :
Z ∞
1
2
2
E[X ] = √
x e−(x−µ) /(2σ ) dx = µ.
2πσ 2 −∞
57/58
Kenngrößen von Verteilungen
Lagemaße
Linearität des Erwartungswertes
Satz
Es seien X und Y reelle Zufallsvariablen mit Erwartungswert
sowie a, b ∈ R. Dann gelten
E[a + bX ] = a + b E[X ],
E[X + Y ] = E[X ] + E[Y ].
Erste Regel gilt auch für Median, zweite Regel nicht.
58/58