Verteilungen, Kenngrößen - staff.uni

Werbung
Biostatistik, Winter 2011/12
Wahrscheinlichkeitstheorie: Verteilungen, Kenngrößen
Prof. Dr. Achim Klenke
http://www.aklenke.de
7. Vorlesung: 09.12.2011
1/58
Inhalt
1
Verteilungen
Stetige
2
Kenngrößen von Verteilungen
Lagemaße
2/58
Verteilungen
Stetige
Verteilungen mit Dichte
Normalverteilung
Die Verteilung mit Dichte
1
2
f (t) = √ e−t /2 ,
2π
t ∈ R,
heißt Standardnormalverteilung N0,1 .
3/58
Verteilungen
Stetige
0.3
0.4
Standardnormalverteilung P[Z ≤ 1.55] = 0.9394
0.0
0.1
0.2
1
−4
−3
−2
−1
0
1
2
3
4
4/58
Verteilungen
Stetige
Verteilungen mit Dichte
Normalverteilung
Die Verteilung mit Dichte
1
2
f (t) = √ e−t /2 ,
t ∈ R,
2π
heißt Standardnormalverteilung N0,1 .
Ist Z standardnormalverteilt, dann ist
Z x
1
2
e−t /2 dt.
P[Z ≤ x] = Φ(x) := √
2π −∞
Die Werte der Verteilungsfunktion
Φ(x) = P[Z ≤ x],
x ∈ R,
sind tabelliert für x ≥ 0. Z.B. im Skript, das online steht.
Für x < 0 benutzt man
Φ(x) = 1 − Φ(−x).
5/58
Verteilungen
Stetige
Verteilungen mit Dichte
Normalverteilung
Sei Z standardnormalverteilt.
Satz
P[Z ≤ x] = Φ(x) = 1 − Φ(−x).
P[Z ≥ x] = 1 − Φ(x) = Φ(−x).
P[x1 ≤ Z ≤ x2 ] = Φ(x2 ) − Φ(x1 )
für x1 < x2 .
6/58
Verteilungen
Stetige
Verteilungen mit Dichte
Normalverteilung
Beispiel
Sei Z standardnormalverteilt.
P[Z ≤ 1.55] = Φ(1.55) = .
7/58
Tabelle Normalverteilung Φ
x
0.00
0.10
0.20
0.30
0.40
0
.5000
.5398
.5793
.6179
.6554
1
.5040
.5438
.5832
.6217
.6591
2
.5080
.5478
.5871
.6255
.6628
3
.5120
.5517
.5910
.6293
.6664
4
.5160
.5557
.5948
.6331
.6700
5
.5199
.5596
.5987
.6368
.6736
6
.5239
.5636
.6026
.6406
.6772
7
.5279
.5675
.6064
.6443
.6808
8
.5319
.5714
.6103
.6480
.6844
9
.5359
.5753
.6141
.6517
.6879
0.50
0.60
0.70
0.80
0.90
.6915
.7257
.7580
.7881
.8159
.6950
.7291
.7611
.7910
.8186
.6985
.7324
.7642
.7939
.8212
.7019
.7357
.7673
.7967
.8238
.7054
.7389
.7704
.7995
.8264
.7088
.7422
.7734
.8023
.8289
.7123
.7454
.7764
.8051
.8315
.7157
.7486
.7794
.8079
.8340
.7190
.7517
.7823
.8106
.8365
.7224
.7549
.7852
.8133
.8389
1.00
1.10
1.20
1.30
1.40
.8413
.8643
.8849
.9032
.9192
.8438
.8665
.8869
.9049
.9207
.8461
.8686
.8888
.9066
.9222
.8485
.8708
.8907
.9082
.9236
.8508
.8729
.8925
.9099
.9251
.8531
.8749
.8944
.9115
.9265
.8554
.8770
.8962
.9131
.9279
.8577
.8790
.8980
.9147
.9292
.8599
.8810
.8997
.9162
.9306
.8621
.8830
.9015
.9177
.9319
1.50
1.60
1.70
1.80
1.90
.9332
.9452
.9554
.9641
.9713
.9345
.9463
.9564
.9649
.9719
.9357
.9474
.9573
.9656
.9726
.9370
.9485
.9582
.9664
.9732
.9382
.9495
.9591
.9671
.9738
.9394
.9505
.9599
.9678
.9744
.9406
.9515
.9608
.9686
.9750
.9418
.9525
.9616
.9693
.9756
.9429
.9535
.9625
.9699
.9762
.9441
.9545
.9633
.9706
.9767
2.00
2.10
2.20
2.30
2.40
.9773
.9821
.9861
.9893
.9918
.9778
.9826
.9865
.9896
.9920
.9783
.9830
.9868
.9898
.9922
.9788
.9834
.9871
.9901
.9925
.9793
.9838
.9875
.9904
.9927
.9798
.9842
.9878
.9906
.9929
.9803
.9846
.9881
.9909
.9931
.9808
.9850
.9884
.9911
.9932
.9812
.9854
.9887
.9913
.9934
.9817
.9857
.9890
.9916
.9936
2.50
2.60
2.70
2.80
2.90
.9938
.9953
.9965
.9974
.9981
.9940
.9955
.9966
.9975
.9982
.9941
.9956
.9967
.9976
.9983
.9943
.9957
.9968
.9977
.9983
.9945
.9959
.9969
.9977
.9984
.9946
.9960
.9970
.9978
.9984
.9948
.9961
.9971
.9979
.9985
.9949
.9962
.9972
.9980
.9985
.9951
.9963
.9973
.9980
.9986
.9952
.9964
.9974
.9981
.9986
Verteilungen
Stetige
Tabelle Normalverteilung Φ
x
1.00
1.10
1.20
1.30
1.40
0
.8413
.8643
.8849
.9032
.9192
1
.8438
.8665
.8869
.9049
.9207
2
.8461
.8686
.8888
.9066
.9222
3
.8485
.8708
.8907
.9082
.9236
4
.8508
.8729
.8925
.9099
.9251
5
.8531
.8749
.8944
.9115
.9265
6
.8554
.8770
.8962
.9131
.9279
7
.8577
.8790
.8980
.9147
.9292
8
.8599
.8810
.8997
.9162
.9306
9
.8621
.8830
.9015
.9177
.9319
1.50
1.60
1.70
1.80
1.90
.9332
.9452
.9554
.9641
.9713
.9345
.9463
.9564
.9649
.9719
.9357
.9474
.9573
.9656
.9726
.9370
.9485
.9582
.9664
.9732
.9382
.9495
.9591
.9671
.9738
.9394
.9505
.9599
.9678
.9744
.9406
.9515
.9608
.9686
.9750
.9418
.9525
.9616
.9693
.9756
.9429
.9535
.9625
.9699
.9762
.9441
.9545
.9633
.9706
.9767
2.00
2.10
2.20
2.30
2.40
.9773
.9821
.9861
.9893
.9918
.9778
.9826
.9865
.9896
.9920
.9783
.9830
.9868
.9898
.9922
.9788
.9834
.9871
.9901
.9925
.9793
.9838
.9875
.9904
.9927
.9798
.9842
.9878
.9906
.9929
.9803
.9846
.9881
.9909
.9931
.9808
.9850
.9884
.9911
.9932
.9812
.9854
.9887
.9913
.9934
.9817
.9857
.9890
.9916
.9936
2.50
2.60
2.70
2.80
2.90
.9938
.9953
.9965
.9974
.9981
.9940
.9955
.9966
.9975
.9982
.9941
.9956
.9967
.9976
.9983
.9943
.9957
.9968
.9977
.9983
.9945
.9959
.9969
.9977
.9984
.9946
.9960
.9970
.9978
.9984
.9948
.9961
.9971
.9979
.9985
.9949
.9962
.9972
.9980
.9985
.9951
.9963
.9973
.9980
.9986
.9952
.9964
.9974
.9981
.9986
Also: Φ(1.55) = 0.9394.
9/58
Verteilungen
Stetige
Verteilungen mit Dichte
Normalverteilung
Beispiel
Sei Z standardnormalverteilt.
P[Z ≤ 1.55] = Φ(1.55) = 0.9394
10/58
Verteilungen
Stetige
0.3
0.4
Standardnormalverteilung P[Z ≤ 1.55] = 0.9394
0.0
0.1
0.2
1
−4
−3
−2
−1
0
1
2
3
4
11/58
Verteilungen
Stetige
Verteilungen mit Dichte
Normalverteilung
Beispiel
Sei Z standardnormalverteilt.
P[−1.23 ≤ Z ≤ 2.04] = Φ(2.04) − Φ(−1.23).
Φ(2.04) =
Φ(−1.23) = 1 − Φ(1.23) =
12/58
Verteilungen
Stetige
Tabelle Normalverteilung Φ
x
1.00
1.10
1.20
1.30
1.40
0
.8413
.8643
.8849
.9032
.9192
1
.8438
.8665
.8869
.9049
.9207
2
.8461
.8686
.8888
.9066
.9222
3
.8485
.8708
.8907
.9082
.9236
4
.8508
.8729
.8925
.9099
.9251
5
.8531
.8749
.8944
.9115
.9265
6
.8554
.8770
.8962
.9131
.9279
7
.8577
.8790
.8980
.9147
.9292
8
.8599
.8810
.8997
.9162
.9306
9
.8621
.8830
.9015
.9177
.9319
1.50
1.60
1.70
1.80
1.90
.9332
.9452
.9554
.9641
.9713
.9345
.9463
.9564
.9649
.9719
.9357
.9474
.9573
.9656
.9726
.9370
.9485
.9582
.9664
.9732
.9382
.9495
.9591
.9671
.9738
.9394
.9505
.9599
.9678
.9744
.9406
.9515
.9608
.9686
.9750
.9418
.9525
.9616
.9693
.9756
.9429
.9535
.9625
.9699
.9762
.9441
.9545
.9633
.9706
.9767
2.00
2.10
2.20
2.30
2.40
.9773
.9821
.9861
.9893
.9918
.9778
.9826
.9865
.9896
.9920
.9783
.9830
.9868
.9898
.9922
.9788
.9834
.9871
.9901
.9925
.9793
.9838
.9875
.9904
.9927
.9798
.9842
.9878
.9906
.9929
.9803
.9846
.9881
.9909
.9931
.9808
.9850
.9884
.9911
.9932
.9812
.9854
.9887
.9913
.9934
.9817
.9857
.9890
.9916
.9936
2.50
2.60
2.70
2.80
2.90
.9938
.9953
.9965
.9974
.9981
.9940
.9955
.9966
.9975
.9982
.9941
.9956
.9967
.9976
.9983
.9943
.9957
.9968
.9977
.9983
.9945
.9959
.9969
.9977
.9984
.9946
.9960
.9970
.9978
.9984
.9948
.9961
.9971
.9979
.9985
.9949
.9962
.9972
.9980
.9985
.9951
.9963
.9973
.9980
.9986
.9952
.9964
.9974
.9981
.9986
Also: Φ(2.04) = 0.9793.
13/58
Verteilungen
Stetige
Tabelle Normalverteilung Φ
x
1.00
1.10
1.20
1.30
1.40
0
.8413
.8643
.8849
.9032
.9192
1
.8438
.8665
.8869
.9049
.9207
2
.8461
.8686
.8888
.9066
.9222
3
.8485
.8708
.8907
.9082
.9236
4
.8508
.8729
.8925
.9099
.9251
5
.8531
.8749
.8944
.9115
.9265
6
.8554
.8770
.8962
.9131
.9279
7
.8577
.8790
.8980
.9147
.9292
8
.8599
.8810
.8997
.9162
.9306
9
.8621
.8830
.9015
.9177
.9319
1.50
1.60
1.70
1.80
1.90
.9332
.9452
.9554
.9641
.9713
.9345
.9463
.9564
.9649
.9719
.9357
.9474
.9573
.9656
.9726
.9370
.9485
.9582
.9664
.9732
.9382
.9495
.9591
.9671
.9738
.9394
.9505
.9599
.9678
.9744
.9406
.9515
.9608
.9686
.9750
.9418
.9525
.9616
.9693
.9756
.9429
.9535
.9625
.9699
.9762
.9441
.9545
.9633
.9706
.9767
2.00
2.10
2.20
2.30
2.40
.9773
.9821
.9861
.9893
.9918
.9778
.9826
.9865
.9896
.9920
.9783
.9830
.9868
.9898
.9922
.9788
.9834
.9871
.9901
.9925
.9793
.9838
.9875
.9904
.9927
.9798
.9842
.9878
.9906
.9929
.9803
.9846
.9881
.9909
.9931
.9808
.9850
.9884
.9911
.9932
.9812
.9854
.9887
.9913
.9934
.9817
.9857
.9890
.9916
.9936
2.50
2.60
2.70
2.80
2.90
.9938
.9953
.9965
.9974
.9981
.9940
.9955
.9966
.9975
.9982
.9941
.9956
.9967
.9976
.9983
.9943
.9957
.9968
.9977
.9983
.9945
.9959
.9969
.9977
.9984
.9946
.9960
.9970
.9978
.9984
.9948
.9961
.9971
.9979
.9985
.9949
.9962
.9972
.9980
.9985
.9951
.9963
.9973
.9980
.9986
.9952
.9964
.9974
.9981
.9986
Also: Φ(1.23) = 0.8907.
14/58
Verteilungen
Stetige
Verteilungen mit Dichte
Normalverteilung
Beispiel
Sei Z standardnormalverteilt.
P[−1.23 ≤ Z ≤ 2.04] = Φ(2.04) − Φ(−1.23).
Φ(2.04) = 0.9793
Φ(−1.23) = 1 − Φ(1.23) = 1 − 0.8907 = 0.1093.
Und damit
P[−1.23 ≤ Z ≤ 2.04] = 0.9793 − 0.1093 = 0.87.
15/58
Verteilungen
Stetige
0.3
0.4
Standardnormalverteilung P[−1.23 ≤ Z ≤ 2.04] = 0.87
0.0
0.1
0.2
1
−4
−3
−2
−1
0
1
2
3
4
16/58
Verteilungen
Stetige
Verteilungen mit Dichte
Normalverteilung
Beispiel
Sei Z standardnormalverteilt.
P[Z ≥ 2] = 1 − Φ(2) = 1 − 0.9773 = 0.0227.
17/58
Verteilungen
Stetige
0.3
0.4
Standardnormalverteilung P[Z ≥ 2] = 0.0227
0.0
0.1
0.2
1
−4
−3
−2
−1
0
1
2
3
4
18/58
Verteilungen
Stetige
Verteilungen mit Dichte
Normalverteilung
Die Verteilung mit Dichte
1
2
f (x) = √ e−x /2 ,
2π
x ∈ R,
heißt Standardnormalverteilung N0,1 .
Ist X standardnormalverteilt und µ ∈ R, σ > 0, so hat
Y := µ + σX die Dichte
1
2
2
fY (x) = √
e−(x−µ) /2σ .
2πσ 2
Die Verteilung von Y heißt Normalverteilung Nµ,σ2 .
19/58
Verteilungen
Stetige
0.08
0.10
Dichte der Normalverteilung 110 + 4Z
0.00
0.02
0.04
0.06
4
94
98
102
106
110
114
118
122
126
20/58
Verteilungen
Stetige
Verteilungen mit Dichte
Normalverteilung
Sei X ∼ Nµ,σ2 . Dann ist X = µ + σZ mit Z
standardnormalverteilt. Also ist
X ≤ x ⇔ µ + σZ ≤ x ⇔ Z ≤
x −µ
.
σ
Satz
P[X ≤ x] = Φ((x − µ)/σ) = 1 − Φ(−(x − µ)/σ).
P[X ≥ x] = 1 − Φ((x − µ)/σ) = Φ(−(x − µ)/σ).
P[x1 ≤ X ≤ x2 ] = Φ((x2 − µ)/σ) − Φ((x1 − µ)/σ)
für x1 < x2 .
21/58
Verteilungen
Stetige
Verteilungen mit Dichte
Normalverteilung
Beispiel
Die Größe von fünfjährigen Mädchen ist im Mittel 110cm mit
einer Standardabweichung von 4cm. Wie groß ist die
Wahrscheinlichkeit, dass ein zufällig ausgewähltes Mädchen
mindestens 103cm aber höchstens 120cm groß ist?
Annahme: Größe ist normalverteilt, also X ∼ Nµ,σ2 mit µ = 110
und σ = 4.
P[103 ≤ X ≤ 120] = Φ((120 − 110)/4) − Φ((103 − 110)/4)
= Φ(2.5) − Φ(−1.75) = Φ(2.5) − 1 + Φ(1.75)
= 0.9938 − 1 + 0.9599 = 0.9537.
Die gesuchte Wahrscheinlichkeit ist 95%.
22/58
Verteilungen
Stetige
0.08
0.10
Normalverteilung P[103 ≤ 110 + 4Z ≤ 120] = 0.9537
0.00
0.02
0.04
0.06
4
94
98
102
106
110
114
118
122
126
23/58
Verteilungen
Stetige
Verteilungen mit Dichte
Normalverteilung
Satz
Seien X1 , X2 , . . . unabhängig und normalverteilt mit Parametern
(µ1 , σ12 ), (µ2 , σ22 ), . . . und sei Sn = X1 + . . . + Xn . Dann ist Sn
normalverteilt mit Parametern (µ, σ 2 ), wobei
µ=
n
X
i=1
µi
und σ 2 =
n
X
σi2 .
i=1
24/58
Verteilungen
Stetige
Normalapproximation der Binomialverteilung
Ist Z binomialverteilt bn,p mit np(1 − p) groß (mindestens 9), so
ist
Z − np
p
np(1 − p)
ungefähr N0,1 -verteilt.
Anders gesagt: Zpist ungefähr normalverteilt mit Parametern
µ = np und σ = np(1 − p).
Ähnliche Aussage gilt viel universeller (sehen wir später).
25/58
Verteilungen
Stetige
0.00 0.05 0.10 0.15 0.20 0.25
Binomialverteilung b10,0.4 und Normalapprox.
0
1
2
3
4
5
6
7
8
9
10
26/58
Verteilungen
Stetige
0.00
0.05
0.10
0.15
Binomialverteilung b20,0.4 und Normalapprox.
0
2
4
6
Verteilungen
8
10
12
14
16
18
27/58
Stetige
0.00
0.04
0.08
0.12
Binomialverteilung b50,0.4 und Normalapprox.
5
10
15
20
25
30
35
28/58
Verteilungen
Stetige
0.00
0.02
0.04
0.06
0.08
Binomialverteilung b100,0.4 und Normalapprox.
15
20
25
30
35
Verteilungen
40
45
50
55
60
29/58
Stetige
0.000
0.010
0.020
Binomialverteilung b1000,0.4 und Normalappr.
340
360
380
400
420
440
460
30/58
Verteilungen
Stetige
0.00 0.02 0.04 0.06 0.08 0.10
Gartenkresse b100,0.2 und Normalapprox.
0
5
10
15
Verteilungen
20
25
30
35
31/58
Stetige
0.00
0.02
0.04
0.06
0.08
Gartenkresse b100,0.5 und Normalapprox.
25
30
35
40
45
50
55
60
65
70
32/58
Verteilungen
Stetige
0.00 0.02 0.04 0.06 0.08 0.10
Gartenkresse b100,0.8 und Normalapprox.
60
65
70
75
80
Verteilungen
85
90
95
33/58
Stetige
0.00
0.10
0.20
0.30
Gartenkresse b100,0.98 und Normalapprox.
90
91
92
93
94
95
96
97
98
99
100
34/58
Verteilungen
Stetige
Normalapproximation
Sei X binomialverteilt bn,p und k = 0, . . . , n.
Satz (Normalapproximation mit Korrekturterm 0.5)
Ist np(1 − p) > 9, so gelten
k + 0.5 − np
p
np(1 − p)
P[X ≤ k] ≈ Φ
!
und
P[X ≥ k] ≈ 1 − Φ
k − 0.5 − np
p
np(1 − p)
!
.
35/58
Verteilungen
Stetige
Normalapproximation
Beispiel
Angenommen, die Samen der Gartenkresse keimen mit
Wahrscheinlichkeit p = 0.8. Sei X die Anzahl der gekeimten
Samen. Wie groß ist die Wahrscheinlichkeit w = P[X ≤ 74],
dass höchstens 74 Samen gekeimt sind?
w=
74
X
b100,0.8 (k).
k=0
Sehr langwierig auszurechnen (aber mit dem Computer im
Prinzip machbar).
36/58
Verteilungen
Stetige
Normalapproximation
Beispiel (Fortsetzung)
Normalapproximation
P[X ≤ 74] ≈ Φ
k + 0.5 − np
p
np(1 − p)
!
=Φ
74 + 0.5 − 80
√
100 · 0.2 · 0.8
= Φ(−1.375) = 1 − Φ(1.375)
37/58
Verteilungen
Stetige
Tabelle Normalverteilung Φ
x
1.00
1.10
1.20
1.30
1.40
0
.8413
.8643
.8849
.9032
.9192
1
.8438
.8665
.8869
.9049
.9207
2
.8461
.8686
.8888
.9066
.9222
3
.8485
.8708
.8907
.9082
.9236
4
.8508
.8729
.8925
.9099
.9251
5
.8531
.8749
.8944
.9115
.9265
6
.8554
.8770
.8962
.9131
.9279
7
.8577
.8790
.8980
.9147
.9292
8
.8599
.8810
.8997
.9162
.9306
9
.8621
.8830
.9015
.9177
.9319
1.50
1.60
1.70
1.80
1.90
.9332
.9452
.9554
.9641
.9713
.9345
.9463
.9564
.9649
.9719
.9357
.9474
.9573
.9656
.9726
.9370
.9485
.9582
.9664
.9732
.9382
.9495
.9591
.9671
.9738
.9394
.9505
.9599
.9678
.9744
.9406
.9515
.9608
.9686
.9750
.9418
.9525
.9616
.9693
.9756
.9429
.9535
.9625
.9699
.9762
.9441
.9545
.9633
.9706
.9767
2.00
2.10
2.20
2.30
2.40
.9773
.9821
.9861
.9893
.9918
.9778
.9826
.9865
.9896
.9920
.9783
.9830
.9868
.9898
.9922
.9788
.9834
.9871
.9901
.9925
.9793
.9838
.9875
.9904
.9927
.9798
.9842
.9878
.9906
.9929
.9803
.9846
.9881
.9909
.9931
.9808
.9850
.9884
.9911
.9932
.9812
.9854
.9887
.9913
.9934
.9817
.9857
.9890
.9916
.9936
2.50
2.60
2.70
2.80
2.90
.9938
.9953
.9965
.9974
.9981
.9940
.9955
.9966
.9975
.9982
.9941
.9956
.9967
.9976
.9983
.9943
.9957
.9968
.9977
.9983
.9945
.9959
.9969
.9977
.9984
.9946
.9960
.9970
.9978
.9984
.9948
.9961
.9971
.9979
.9985
.9949
.9962
.9972
.9980
.9985
.9951
.9963
.9973
.9980
.9986
.9952
.9964
.9974
.9981
.9986
Also: Φ(1.38) = 0.9162.
38/58
Verteilungen
Stetige
Normalapproximation
Beispiel (2).
Normalapproximation mit n = 100, p = 0.8, k = 74
!
74 + 0.5 − 80
k + 0.5 − np
=Φ √
P[X ≤ 74] ≈ Φ p
100 · 0.8 · 0.2
np(1 − p)
= Φ(−1.375) = 1 − Φ(1.375) ≈ 1 − 0.9162 = 0.0838.
Vergleich mit exakter Rechnung
w=
74
X
b100,0.8 (k) = 0.0875.
k=0
Approximation nicht präzis, aber o.k.
39/58
Verteilungen
Stetige
Normalapproximation
Beispiel
Angenommen, die Samen der Gartenkresse keimen mit
Wahrscheinlichkeit p = 0.98. Sei X die Anzahl der gekeimten
Samen. Wie groß ist die Wahrscheinlichkeit w = P[X ≤ 99],
dass höchstens 99 Samen gekeimt sind?
Normalapproximation
99 + 0.5 − 98
P[X ≤ 99] ≈ Φ √
= Φ(1.07) =
100 · 0.98 · 0.02
40/58
Verteilungen
Stetige
Normalverteilung Φ
x
1.00
1.10
1.20
1.30
1.40
0
.8413
.8643
.8849
.9032
.9192
1
.8438
.8665
.8869
.9049
.9207
2
.8461
.8686
.8888
.9066
.9222
3
.8485
.8708
.8907
.9082
.9236
4
.8508
.8729
.8925
.9099
.9251
5
.8531
.8749
.8944
.9115
.9265
6
.8554
.8770
.8962
.9131
.9279
7
.8577
.8790
.8980
.9147
.9292
8
.8599
.8810
.8997
.9162
.9306
9
.8621
.8830
.9015
.9177
.9319
1.50
1.60
1.70
1.80
1.90
.9332
.9452
.9554
.9641
.9713
.9345
.9463
.9564
.9649
.9719
.9357
.9474
.9573
.9656
.9726
.9370
.9485
.9582
.9664
.9732
.9382
.9495
.9591
.9671
.9738
.9394
.9505
.9599
.9678
.9744
.9406
.9515
.9608
.9686
.9750
.9418
.9525
.9616
.9693
.9756
.9429
.9535
.9625
.9699
.9762
.9441
.9545
.9633
.9706
.9767
2.00
2.10
2.20
2.30
2.40
.9773
.9821
.9861
.9893
.9918
.9778
.9826
.9865
.9896
.9920
.9783
.9830
.9868
.9898
.9922
.9788
.9834
.9871
.9901
.9925
.9793
.9838
.9875
.9904
.9927
.9798
.9842
.9878
.9906
.9929
.9803
.9846
.9881
.9909
.9931
.9808
.9850
.9884
.9911
.9932
.9812
.9854
.9887
.9913
.9934
.9817
.9857
.9890
.9916
.9936
2.50
2.60
2.70
2.80
2.90
.9938
.9953
.9965
.9974
.9981
.9940
.9955
.9966
.9975
.9982
.9941
.9956
.9967
.9976
.9983
.9943
.9957
.9968
.9977
.9983
.9945
.9959
.9969
.9977
.9984
.9946
.9960
.9970
.9978
.9984
.9948
.9961
.9971
.9979
.9985
.9949
.9962
.9972
.9980
.9985
.9951
.9963
.9973
.9980
.9986
.9952
.9964
.9974
.9981
.9986
Also: Φ(1.07) = 0.8577.
41/58
Verteilungen
Stetige
Normalapproximation
Beispiel
Angenommen, die Samen der Gartenkresse keimen mit
Wahrscheinlichkeit p = 0.98. Sei X die Anzahl der gekeimten
Samen. Wie groß ist die Wahrscheinlichkeit w = P[X ≤ 99],
dass höchstens 99 Samen gekeimt sind?
Normalapproximation
99 + 0.5 − 98
P[X ≤ 99] ≈ Φ √
= Φ(1.07) = 0.8577.
100 · 0.98 · 0.02
Exakte Rechnung: P[X ≤ 99] = 0.8674.
Fehler 0.01. Das ist für viele Zwecke zu groß.
Normalapproximation nicht so gut, weil np(1 − p) = 1.96 < 9 ist.
42/58
Verteilungen
Stetige
Normalapproximation
Beispiel
Normalapproximation
99 + 0.5 − 98
P[X ≤ 99] ≈ Φ √
= Φ(1.07) = 0.8577.
100 · 0.98 · 0.02
Exakte Rechnung: P[X ≤ 99] = 0.8674, Fehler 0.01.
Poissonapproximation: 100 − X ist ungefähr Poi2 verteilt, also
P[X ≤ 99] = P[100 − X ≥ 1] = 1 − P[100 − X = 0]
= 1 − e−2
20
= 0.8647.
0!
Fehler < 0.003. Schon besser.
43/58
Verteilungen
Stetige
Fehler durch Normalapproximation der
Binomialverteilung
np(1 − p) Max. Fehler max. Fehler für W’keiten
> 0.95 oder < 0.05
5 0.03
0.019
9 0.022
0.013
15 0.017
0.010
50 0.01
0.005
200 0.005
0.0022
1000 0.0022
0.001
44/58
Verteilungen
Stetige
Fehler durch Poissonapproximation der Binomialverteilung
λ = np = mittlere Anz. Erfolge. Theoretische Fehlergrenze: λ/n.
Tatsächlicher maximaler Fehler für einige Werte:
λ
1
5
1
5
10
20
5
10
10
n Max. Fehler Max. Fehler für W’keiten
> 0.95 oder < 0.05
10 0.02
0.007
10 0.1
0.06
100 0.002
0.0007
100 0.008
0.004
100 0.015
0.009
100 0.03
0.02
1000 0.0007
0.0004
1000 0.002
0.0009
6
−6
10 2 · 10
10−6
45/58
Verteilungen
Stetige
Exponentialverteilung
Die Exponentialverteilung mit Parameter θ ist die Verteilung auf
[0, ∞) mit Dichte
f (x) = θe−θx ,
x ≥ 0.
Bedeutung wie geometrische Verteilung: Wartezeit auf
Ereignisse.
Beispiel
Radioaktive Zerfälle mit Rate 2.7 Becquerel. Also im Mittel 2.7
Zerfälle pro Sekunde. X Wartezeit auf nächsten Zerfall. Dann ist
X exponentialverteilt mit θ = 2.7. Also
Z ∞
P[X > x] = 2.7
e−2.7 t dt = e−2.7 x .
x
46/58
Kenngrößen von Verteilungen
Kenngrößen von Verteilungen
Wie für Messdaten in der beschreibenden Statistik:
Lagemaße geben an, wo die Verteilung konzentriert ist,
Streumaße geben an, wie groß die Variabilität der Werte
ist.
47/58
Kenngrößen von Verteilungen
Lagemaße
Median und Quantile
Sei X Zufallsvariable mit reellen Werten.
Definition (Median)
Wir nennen jede Zahl m ∈ R mit
P[X ≤ m] ≥
1
2
und
P[X ≥ m] ≥
1
2
einen Median der Verteilung von X .
48/58
Kenngrößen von Verteilungen
Lagemaße
Median und Quantile
Sei X Zufallsvariable mit reellen Werten.
Definition (Quantile)
Sei α ∈ (0, 1). Jede Zahl mα ∈ R mit der Eigenschaft
P[X ≤ mα ] ≥ α
und
P[X ≥ mα ] ≥ 1 − α
heißt ein α–Quantil der Verteilung von X . Speziell ist m1/2 ein
Median.
Ein (1 − α)–Quantil wird auch α–Fraktil genannt.
49/58
Kenngrößen von Verteilungen
Lagemaße
Median und Quantile
Für viele Verteilungen gibt es Tabellen der Quantile. Z.B. für zα ,
das α-Quantil der Standardnormalverteilung.
Beispiel
Sei X normalverteilt mit Parametern µ = 2 und σ 2 = 1.8. Für
welche Zahl x gilt P[X ≥ x] = 0.05?
x ist ein 5%-Fraktil von N2,1.8 , bzw. ein 95%-Quantil. Tabelliert
sind die Quantile von N0,1 (Standardnormalverteilung).
√
(X − 2)/ 1.8 ist standardnormalverteilt, also ist
√
(x − 2)/ 1.8 = z0.95 =
50/58
Kenngrößen von Verteilungen
Lagemaße
Quantile der Normalverteilung
α
zα
α
zα
0.8
0.84162
0.995
2.57583
0.9
1.28155
0.9975 2.80703
0.95
1.64485
0.998
2.87816
0.975 1.95996
0.999
3.09023
0.98
2.05375
0.9995 3.29053
0.99
2.32635
51/58
Kenngrößen von Verteilungen
Lagemaße
Median und Quantile
Für viele Verteilungen gibt es Tabellen der Quantile. Z.B. für das
zα , das α-Quantil der Standardnormalverteilung.
Beispiel
Sei X normalverteilt mit Parametern µ = 2 und σ 2 = 1.8. Für
welche Zahl x gilt P[X ≥ x] = 0.05?
x ist ein 5%-Fraktil von N2,1.8 , bzw. ein 95%-Quantil. Tabelliert
sind die Quantile
von N0,1 (Standardnormalverteilung).
√
(X − 2)/ 1.8 ist standardnormalverteilt, also ist
√
(x − 2)/ 1.8 = z0.95 = 1.64485.
Auflösen nach x
x =2+
√
1.8 · 1.64485 = 4.2068.
52/58
Kenngrößen von Verteilungen
Lagemaße
Median und Quantile
Änderung durch Verschieben und Strecken
Sei X eine reelle Zufallsvariable und
Y := a + bX .
Seien mαX und mαY die α-Quantile von X und Y .
Satz
Es gilt
mαY = a + bmαX .
53/58
Kenngrößen von Verteilungen
Lagemaße
Erwartungswert
Definition
Sei X eine Zufallsvariable mit Wertebereich W ⊂ R.
Ist W ⊂ R diskret, so definieren wir den Erwartungswert von
X durch
X
E[X ] :=
w P[X = w].
w∈W
Ist W ⊂ R ein Intervall (möglicherweise ganz R), und hat X
die Dichte f , so setzen wir
Z ∞
E[X ] :=
x f (x) dx.
−∞
Erwartungswert entspricht dem arithmetischen Mittel von Daten.
54/58
Kenngrößen von Verteilungen
Lagemaße
Erwartungswert
Beispiel
Würfelwurf X .
E[X ] = P[X = 1] · 1 + P[X = 2] · 2 + . . . + P[X = 6] · 6
1
1
1
= · 1 + · 2 + ... + · 6
6
6
6
1
= (1 + 2 + 3 + 4 + 5 + 6) = 3.5.
6
X Wartezeit auf ersten Erfolg, Erfolg mit Wahrscheinlichkeit
p. Also X geometrisch mit Parameter p.
E[X ] =
∞
X
P[X = k] · k =
k=0
∞
X
p(1 − p)k k =
k=0
1−p
.
p
55/58
Kenngrößen von Verteilungen
Lagemaße
Erwartungswert
Beispiel
X binomialverteilt mit Parametern n, p:
n X
n k
E[X ] =
p (1 − p)n−k k = np.
k
k=0
X hypergeometrisch verteilt mit Parametern N, K , n:
E[X ] =
Kn
.
N
56/58
Kenngrößen von Verteilungen
Lagemaße
Erwartungswert
Beispiel
X exponentialverteilt mit Parameter θ:
Z ∞
1
E[X ] =
θe−θx x dx = .
θ
0
X normalverteilt mit Parametern µ, σ 2 :
Z ∞
1
2
2
E[X ] = √
x e−(x−µ) /(2σ ) dx = µ.
2πσ 2 −∞
57/58
Kenngrößen von Verteilungen
Lagemaße
Linearität des Erwartungswertes
Satz
Es seien X und Y reelle Zufallsvariablen mit Erwartungswert
sowie a, b ∈ R. Dann gelten
E[a + bX ] = a + b E[X ],
E[X + Y ] = E[X ] + E[Y ].
Erste Regel gilt auch für Median, zweite Regel nicht.
58/58
Herunterladen