Mathematik für Biologen - Universität Düsseldorf: Mathematik

Werbung
Mathematik für Biologen
Prof. Dr. Rüdiger W. Braun
Heinrich-Heine-Universität Düsseldorf
21. Dezember 2011
Verteilungsfunktionen
1
Verteilungsfunktionen
Definition
Binomialverteilung
Geometrische Verteilung
Poissonverteilung
2
Stetige Zufallsvariable, Normalverteilung
Standardisierte Verteilung
Standard-Normalverteilung
Normalverteilung
Stetige Zufallsvariable, Normalverteilung
Verteilungsfunktionen
Stetige Zufallsvariable, Normalverteilung
Verteilungsfunktion
X sei eine Zufallsvariable. Die Funktion
F (x) = P(X ≤ x)
ist die Verteilungsfunktion von X
Die Verteilungsfunktion F (x) gibt an, mit welcher
Wahrscheinlichkeit ein kleinerer Wert als x angenommen wird
(x eingeschlossen)
Verteilungsfunktionen
Stetige Zufallsvariable, Normalverteilung
0.35
0.30
0.25
0.20
0.15
0.10
0.05
0.00 0
1
2
3
k
4
5
6
Verteilungsfunktion von B6,1/3
B6,1/3(k)
Beispiel: Verteilungsfunktion von B6,1/3
1.0
0.8
0.6
0.4
0.2
0.0
1 0
1
2
3 4
k
5
Stabdiagramm und Graph der Verteilungsfunktion für B6,1/3
6
7
Verteilungsfunktionen
Stetige Zufallsvariable, Normalverteilung
Kumulierte Tabellen
Kumulierte Tabellen der Binomialverteilung zeigen die
Verteilungsfunktion
Beispiel: 47 Versuche mit Erfolgswahrscheinlichkeit p = 0.88
im Einzelfall wurden gemacht. Mit welcher Wahrscheinlichkeit
gelingen weniger als 44, aber mehr als 39, beide Grenzen
eingeschlossen?
P(39 ≤ X ≤ 44) = P(X ≤ 44) − P(X ≤ 38)
= F (44) − F (38)
= 0.93236 − 0.10408
= 0.82828
Verteilungsfunktionen
Tabelle der Werte
r
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
p
0.
Stetige Zufallsvariable, Normalverteilung
Pr
k=0 Bn, p (k)
0.85
00001
00002
00008
00029
00093
00274
00742
01832
04128
08463
15768
26660
40904
57047
72665
85309
93639
97931
99552
99952
für n = 47
0.86
0.87
0.88
0.89
00001
00003
00012
00043
00137
00398
01060
02571
05663
11311
20441
33384
49285
65962
80597
91050
96887
99278
99917
00001
00005
00018
00063
00199
00573
01503
03578
07707
14978
26208
41238
58411
74830
87606
95379
98847
99856
00002
00007
00026
00091
00286
00817
02115
04946
10408
19651
33208
50182
67964
83128
93236
98178
99754
00001
00002
00010
00038
00130
00408
01156
02957
06792
13952
25538
41543
60042
77447
90248
97153
99582
Verteilungsfunktionen
Stetige Zufallsvariable, Normalverteilung
Geometrische Verteilung
Die Verteilungsfunktion der geometrischen Verteilung kann
man ausrechnen
Sie beträgt für x ≥ 0
F (x) = 1 − (1 − p)j
falls j ≤ x < j + 1
Beispiel: Mit welcher Wahrscheinlichkeit fällt beim Wurf eines
fairen Würfels die erste 6 spätestens im fünften Wurf?
Antwort:
5
5
1 5
=1−
= 0.5981
F (5) = 1 − 1 −
6
6
Verteilungsfunktionen
Stetige Zufallsvariable, Normalverteilung
0.18 W'keit für erste 6 im k-ten Wurf
0.16
0.14
0.12
0.10
0.08
0.06
0.04
0.02
0.000 2 4 6 8 10 12 14
k
Verteilungsfunktion von G6
G1/6(k)
Verteilungsfunktion einer geometrischen Verteilung
1.0
0.8
0.6
0.4
0.2
0.0
0
5
10
k
15
20
Verteilungsfunktionen
Stetige Zufallsvariable, Normalverteilung
Verteilungsfunktion einer Poissonverteilung
P16(k)
Die Verteilungsfunktion einer Poissonverteilung kann man nicht
geschlossen ausdrücken
0.10
0.08
0.06
0.04
0.02
0.00 0
10
20
k
30
40
1.0
0.8
0.6
0.4
0.2
0.0
0
10
20
k
30
Verteilung und Verteilungsfunktion der Poissonverteilung P16
40
Verteilungsfunktionen
Stetige Zufallsvariable, Normalverteilung
Die standardisierte Verteilung
Die Zufallsvariable X besitze den Erwartungswert E (X ) = µ
und die Varianz Var (X ) = σ2
Setze
X −µ
σ
Dann E (Y ) = 0 und Var (Y ) = 1
Y =
Y ist die standardisierte Zufallsvariable zu X
Verteilungsfunktionen
Stetige Zufallsvariable, Normalverteilung
Standardisierte Binomialverteilungen
1.0
1.0
1.0
0.8
0.8
0.8
0.6
0.6
0.6
0.4
0.4
0.4
0.2
0.0
0.2
3
2
1
1.0
0
k
1
2
3
0.0
0.2
3
2
1
1.0
0
k
1
2
3
0.0
0.8
0.8
0.8
0.6
0.6
0.6
0.4
0.4
0.4
0.2
0.2
0.0
3
2
1
0
k
1
2
3
0.0
3
2
1
3
2
1
1.0
0
1
2
3
0
1
2
3
k
0.2
3
2
1
0
k
1
2
3
0.0
k
Verteilungsfunktionen der Standardisierungen von Bn,p für p = 0.2
und n = 40, 80, 160, 320, 640 und 1280
Verteilungsfunktionen
Stetige Zufallsvariable, Normalverteilung
Zentraler Grenzwertsatz
Für jeden Parameterwert p konvergiert der Grenzprozess auf der
letzten Folie gegen dieselbe Funktion.
Diese Funktion heißt
Verteilungsfunktion der Standard-Normalverteilung
Sie wird mit Φ bezeichnet.
Verteilungsfunktionen
Stetige Zufallsvariable, Normalverteilung
Verteilungsfunktion der Standard-Normalverteilung
1.0
Φ(x)
0.8
0.6
0.4
0.2
0.0
3
2
1
0
x
1
2
3
Verteilungsfunktionen
Stetige Zufallsvariable, Normalverteilung
Gaußsche Glockenkurve
0.40
0.35
0.30
0.25
0.20
0.15
0.10
0.05
0.00 3
exp
³
2
−x2
´ p
/ 2π
2
1
x
f (x) = √ exp −
2
2π
heißt Gaußsche Glockenkurve
2
1
0
x
1
2
3
Verteilungsfunktionen
Stetige Zufallsvariable, Normalverteilung
Standard-Normalverteilung als Fläche
Φ(x) ist die Fläche links von x unter der Gaußschen Glockenkurve
1.0
Glocke
0.8
Φ
0.6
0.4
0.2
0.0 3
2
1
0
x
1
2
3
Verteilungsfunktionen
Stetige Zufallsvariable, Normalverteilung
Standard-Normalverteilung als Integral
1
Φ(x) = √
2π
Zx
2
t
exp −
dt
2
−∞
Für dieses Integral existiert keine geschlossene Form in Termen
klassischer Funktionen
Verteilungsfunktionen
Stetige Zufallsvariable, Normalverteilung
Stetige Zufallsvariable
Eine Zufallsvariable X , deren Verteilungsfunktion von der Gestalt
Zx
P(X ≤ x) =
f (t)dt
−∞
ist, heißt stetig. Dann bezeichnet man f als die Dichte von X .
Die Gaußsche Glockenkurve ist die Dichte der
Standard-Normalverteilung.
Zy
P(x < X ≤ y ) = f (t)dt
x
P(X = x) = 0
Zy
P(x ≤ X ≤ y ) =
f (t)dt
x
Verteilungsfunktionen
Stetige Zufallsvariable, Normalverteilung
Standard-normalverteilte Zufallsvariable
X ist standard-normalverteilt, wenn
P(X ≤ x) = Φ(x)
für alle x
in diesem Fall
P(x < X ≤ y ) = Φ(y ) − Φ(x)
für alle x < y
Verteilungsfunktionen
Stetige Zufallsvariable, Normalverteilung
Eigenschaften von Φ
0 < Φ(x) < 1 für alle Zahlen x
Für x → ∞ strebt Φ(x) gegen 1
Für x → −∞ strebt Φ(x) gegen 0
Φ(0) =
1
2
Der Graph von Φ ist punktsymmetrisch am Punkt (0, 12 ), d. h.
Φ(−x) = 1 − Φ(x)
Die Verteilungsfunktion der Standard-Normalverteilung ist
vertafelt
Verteilungsfunktionen
Stetige Zufallsvariable, Normalverteilung
Tabelle der Standard-Normalverteilung, linke Seite
u
0.0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1.0
1.1
1.2
1.3
1.4
0.00
0,500000
,539828
,579260
,617911
,655422
,691462
,725747
,758036
,788145
,815940
,841345
,864334
,884930
,903200
0,919243
0.01
0,503989
,543795
,583166
,621720
,659097
,694974
,729069
,761148
,791030
,818589
,843752
,866500
,886861
,904902
0,920730
0.02
0,507978
,547758
,587064
,625516
,662757
,698468
,732371
,764238
,793892
,821214
,846136
,868643
,888768
,906582
0,922196
0.03
0,511966
,551717
,590954
,629300
,666402
,701944
,735653
,767305
,796731
,823814
,848495
,870762
,890651
,908241
0,923641
0.04
0,515953
,555670
,594835
,633072
,670031
,705401
,738914
,770350
,799546
,826391
,850830
,872857
,892512
,909877
0,925066
Verteilungsfunktionen
Stetige Zufallsvariable, Normalverteilung
Tabelle der Standard-Normalverteilung, rechte Seite
u
0.0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1.0
1.1
1.2
1.3
1.4
0.05
0,519939
,559618
,598706
,636831
,673645
,708840
,742154
,773373
,802337
,828944
,853141
,874928
,894350
,911492
0,926471
0.06
0,523922
,563559
,602568
,640576
,677242
,712260
,745373
,776373
,805105
,831472
,855428
,876976
,896165
,913085
0,927855
0.07
0,527903
,567495
,606420
,644309
,680822
,715661
,748571
,779350
,807850
,833977
,857690
,879000
,897958
,914657
0,929219
0.08
0,531881
,571424
,610261
,648027
,684386
,719043
,751748
,782305
,810570
,836457
,859929
,881000
,899727
,916207
0,930563
0.09
0,535856
,575345
,614092
,651732
,687933
,722405
,754903
,785236
,813267
,838913
,862143
,882977
,901475
,917736
0,931888
Verteilungsfunktionen
Stetige Zufallsvariable, Normalverteilung
Lesehinweise
Auf dem Weblog gibt es die komplette Tabelle im Format A4
unter http://www.math.uni-duesseldorf.de/~braun/
bio1112/tabNorm.pdf
Beispiel Φ(0.31) = 0.621720
Wegen der Punktsymmetrie, also wegen
Φ(−x) = 1 − Φ(x)
kann man die Tabelle auch für negative Argumente
verwenden. Also beispielsweise
Φ(−1.34) = 1 − Φ(1.34) = 1 − 0.909877 = 0.090123
Durch Aufsuchen des Funktionswertes erhält man die
Umkehrfunktion: Gesucht u mit Φ(u) = 0.79. Man liest ab:
u = 0.81
Verteilungsfunktionen
Stetige Zufallsvariable, Normalverteilung
Tabelle der Standard-Normalverteilung, linke Seite
u
0.0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1.0
1.1
1.2
1.3
1.4
0.00
0,500000
,539828
,579260
,617911
,655422
,691462
,725747
,758036
,788145
,815940
,841345
,864334
,884930
,903200
0,919243
0.01
0,503989
,543795
,583166
,621720
,659097
,694974
,729069
,761148
,791030
,818589
,843752
,866500
,886861
,904902
0,920730
0.02
0,507978
,547758
,587064
,625516
,662757
,698468
,732371
,764238
,793892
,821214
,846136
,868643
,888768
,906582
0,922196
0.03
0,511966
,551717
,590954
,629300
,666402
,701944
,735653
,767305
,796731
,823814
,848495
,870762
,890651
,908241
0,923641
0.04
0,515953
,555670
,594835
,633072
,670031
,705401
,738914
,770350
,799546
,826391
,850830
,872857
,892512
,909877
0,925066
Verteilungsfunktionen
Stetige Zufallsvariable, Normalverteilung
Beispiel
Normalverteilungen werden beispielsweise zur Modellierung
von Messfehlern benutzt
Beispiel: Die Wirkstoffkonzentration in einem Heilmittel soll
4g/l betragen. Herstellungsabhängig beträgt die Streuung
100mg/l
Mit welcher Wahrscheinlichkeit liegt die Konzentration über
4.12g/l?
Y sei die Konzentration in g/l
Dann Y = 4 + 0.1 · X , wobei X standard-normalverteilt ist
Gesucht P(Y > 4.12)
Das ist P(X > 1.2) = 1 − P(X ≤ 1.2) = 1 − Φ(1.2) =
1 − 0.884930 = 0.115070
Verteilungsfunktionen
Stetige Zufallsvariable, Normalverteilung
Normalverteilungen
Die Zufallsvariable X heißt normalverteilt zum
Erwartungswert µ und der Varianz σ2 , wenn
Y =
X −µ
σ
standard-normalverteilt ist. Man sagt dann, X sei
N(µ, σ2 )-verteilt
X =µ+σ·Y
Y ist die Standardisierung von X
Verteilungsfunktionen
Stetige Zufallsvariable, Normalverteilung
Erwartungswert, Varianz und Streuung stetiger
Zufallsvariablen
Die Zufallsvariable X besitze die Dichte f
Z∞
Dann ist
t · f (t)dt
E (X ) =
−∞
der Erwartungswert von X
Z∞
und
Var (X ) =
(t − E (X ))2 · f (t)dt
−∞
ist die Varianz.
Die Streuung ist die Quadratwurzel der Varianz
p
σ = Var (X )
Verteilungsfunktionen
Stetige Zufallsvariable, Normalverteilung
Analogie zu diskreten Zufallsvariablen
Für diskrete Zufallsvariablen
X
E (X ) =
k · P(X = k)
k
Var (X ) =
X
k
(k − E (X ))2 · P(X = k)
Verteilungsfunktionen
Stetige Zufallsvariable, Normalverteilung
Erwartungswert und Varianz von Normalverteilungen
Wenn X verteilt ist gemäß N(µ, σ2 ), dann
E (X ) = µ
Var (X ) = σ2
Verteilungsfunktionen
Stetige Zufallsvariable, Normalverteilung
Normalverteilungen für verschiedene Erwartungswerte
1.0
µ =0
µ =1
µ =2
F(x)
0.8
0.6
0.4
0.2
0.0 4
3
2
1 0
x
1
2
3
Verteilungsfunktionen für N(µ, 1)-verteilte Zufallsvariable
4
Verteilungsfunktionen
Stetige Zufallsvariable, Normalverteilung
Normalverteilungen für verschiedene Streuungen
1.0
σ =1
σ =1/2
σ =2
F(x)
0.8
0.6
0.4
0.2
0.0 4
3
2
1 0
x
1
2
3
Verteilungsfunktionen für N(0, σ2 )-verteilte Zufallsvariable
4
Verteilungsfunktionen
Stetige Zufallsvariable, Normalverteilung
Umrechnung auf Standardnormalverteilung
Die Zufallsvariable X sei N(µ, σ2 )-verteilt. Dann gelten für a < b
b−µ
a−µ
P(a < X ≤ b) = Φ
−Φ
σ
σ
a−µ
P(a < X ) = 1 − Φ
σ
b−µ
P(X ≤ b) = Φ
σ
Verteilungsfunktionen
Stetige Zufallsvariable, Normalverteilung
Beispiel: natürliche Variabilitäten
Roggenpflanzen erreichen eine mittlere Höhe von 1m. Dabei
streut die Höhe um 20cm. Welcher Prozentsatz aller Pflanzen
erreicht mindestens 1.10m Höhe?
X = Höhe der Pflanze
Wir rechnen in Metern. Dann E (X ) = 1 und Var (X ) = 0.04
X = 1 + 0.2 · Y für standard-normalverteiltes Y
X ≥ 1.10 bedeutet Y ≥ 0.5
P(Y ≥ 0.5) = 1 − P(Y ≤ 0.5) = 1 − Φ(0.5) = 1 − 0.6915 =
0.3085
ca 31% der Pflanzen sind mindestens 1.10m hoch
Verteilungsfunktionen
Stetige Zufallsvariable, Normalverteilung
Kritische Betrachtung des Modells
Das Modell erlaubt auch den unsinnigen Fall, dass
Roggenpflanzen eine negative Höhe aufweisen
Mit welcher Wahrscheinlichkeit geschieht das?
X ≤ 0 bedeutet Y ≤ −5
P(Y ≤ −5) = Φ(−5) = 1 − Φ(5) = 1 − (1 − 2.867 · 10−7 ) =
2.867 · 10−7
Das Modell sagt für weniger als eine unter 3 Millionen
Pflanzen eine negative Höhe voraus
Damit können wir leben
Verteilungsfunktionen
Stetige Zufallsvariable, Normalverteilung
Beispiel: IQ-Tests
IQ-Tests sind so skaliert, dass die Werte in der Population
normalverteilt mit Erwartungswert µ = 100 und Streuung
σ = 15 sind
Welcher Anteil der Bevölkerung hat einen IQ über 130?
X messe den IQ
X ist N(100, 225)-verteilt.
Also
130 − 100
P(130 < X ) = 1 − Φ
15
= 1 − Φ(2) = 1 − 0.977250 = 0.02275
Ungefähr 2.3% der Population weist einen IQ von mindestens
130 auf
Herunterladen