Ausgewählte spezielle Verteilungen

Werbung
Ausgewählte spezielle Verteilungen
In Anwendungen werden oft Zufallsvariablen betrachtet, deren
Verteilung einem Standardmodell entspricht. Zu den
wichtigsten dieser Modelle gehören:
diskrete Verteilungen:
I Binomialverteilung
I hypergeometrische Verteilung
I PoissonVerteilung
I geometrische Verteilung
stetige Verteilungen:
I Normalverteilung
I Exponentialverteilung
I
χ2 , t und
F Verteilung
verteilungen.pdf, Seite 1
Bemerkung
Die in der Praxis betrachteten Wahrscheinlichkeitsverteilungen
enthalten in der Regel einen oder mehrere
Parameter,
deren
Wert an die jeweilige Anwendung angepasst werden kann.
Diese Parameter werden beispielsweise so gewählt, dass
Erwartungswert und/oder Varianz mit beobachteten Daten
übereinstimmen.
verteilungen.pdf, Seite 2
Ein BernoulliExperiment
ist ein Zufallsexperiment mit zwei möglichen Ausgängen
Erfolg
Ist
= 1
und Misserfolg
= 0.
Erfolgswahrscheinlichkeit einer
X (d. h. p = P(X = 1)),
P(X = 0) = 1 − p
p ∈ (0; 1)
die
Bernoulliverteilten Zufallsvariable
so gilt
Für den Erwartungswert erhält man
EX = P(X = 1) · 1 + P(X = 0) · 0 = p .
Aus
X = X2
folgt
(da
X
nur die Werte 0 und 1 annimmt)
E (X 2 ) = EX = p .
Damit ist die Varianz
V (X ) = E (X 2 ) − (EX )2 = p − p 2 = p · (1 − p).
verteilungen.pdf, Seite 3
Die Binomialverteilung
mit Parametern
n∈N
und
p ∈ (0, 1)
erhält man, wenn man
n
unabhängige BernoulliExperimente mit
Erfolgswahrscheinlichkeit
X
p
ausführt.
ist dann die Zahl der Erfolge, also
X = X1 + X2 + ... + Xn =
n
X
Xi ,
i=1
X1 , ..., Xn unabhängige Zufallsvariablen
P(Xi = 1) = p und P(Xi = 0) = 1 − p .
wobei
Man schreibt
X ∼ Bi(n, p), X ∼ b(n, p)
( X ist binomialverteilt mit Parametern
oder
n
und
sind mit
X ∼ bn;p
p ).
verteilungen.pdf, Seite 4
Anwendung/Interpretation
X
n
beschreibt die Zahl der Erfolge in
Versuchen, wenn in
jedem einzelnen Versuch die Erfolgswahrscheinlichkeit gleich
p
ist.
Beispiele
I
nfacher
p = 0, 5
bei n maligem
Münzwurf,
I Zahl der Sechsen
Würfeln,
p=
1
6
I Meinungsumfragen: Zahl der Befragten, die angeben, eine
bestimmte Partei zu wählen
I Zahl der Patienten, bei denen ein Medikament wirksam ist
I Zahl der gebuchten Flugpassagiere, die tatsächlich am
Flughafen erscheinen
I Qualitätskontrolle: Zahl der entdeckten fehlerhaften
Artikel bei einer Stichprobe von
n
Artikeln
verteilungen.pdf, Seite 5
Eigenschaften der Binomialverteilung
Aus
EXi = p
und
V (Xi ) = p · (1 − p)
folgt
EX = EX1 + ... + EXn = n · p
und
und
V (X ) = V (X1 ) + ... + V (Xn ) = n · p · (1 − p)
p
p
V (X ) = np(1 − p).
damit σX =
Für
k = 0, ..., n
gilt
n
P(X = k) = bn;p (k) =
· p k · (1 − p)n−k
k
(Wahrscheinlichkeit für
genau k Erfolge bei n Versuchen)
Begründung: Es gibt kn Möglichkeiten, die k Erfolge und
n − k Misserfolge auf n Versuche zu verteilen. Jede einzelne
k
n−k
dieser Möglichkeiten hat die Wahrscheinlichkeit p · (1 − p)
.
verteilungen.pdf, Seite 6
Beispiel
Wahrscheinlichkeit von zwei Sechsen bei fünfmal Würfeln
Es gibt folgende Möglichkeiten:
66XXX
6X 6XX
6XX 6X
6XXX 6
X 66XX
X 6X 6X
X 6XX 6
XX 66X
XX 6X 6
XXX 66
Dabei steht
X
Wahrscheinlichkeit
Wahrscheinlichkeit
Wahrscheinlichkeit
Wahrscheinlichkeit
Wahrscheinlichkeit
Wahrscheinlichkeit
Wahrscheinlichkeit
Wahrscheinlichkeit
Wahrscheinlichkeit
Wahrscheinlichkeit
1
6
1
6
1
6
1
6
5
6
5
6
5
6
5
6
5
6
5
6
·
·
·
·
·
·
·
·
·
·
1
6
5
6
5
6
5
6
1
6
1
6
1
6
5
6
5
6
5
6
5
·
·
·
·
·
·
·
·
·
·
6
1
6
5
6
5
6
1
6
5
6
5
6
1
6
1
6
5
6
·
·
·
·
·
·
·
·
·
·
5
6
5
6
1
6
5
6
5
6
1
6
5
6
1
6
5
6
1
6
·
·
·
·
·
·
·
·
·
·
5
6
5
6
5
6
1
6
5
6
5
6
1
6
5
6
1
6
1
6
für eine Augenzahl zwischen 1 und 5.
Zusammen gibt es also 10
5
2
=
(5 über 2) Möglichkeiten,
von denen jede die Wahrscheinlichkeit
1 2
6
5 3
hat.
6
·
Die Wahrscheinlichkeit, dass eine dieser Möglichkeiten eintritt,
liegt insgesamt bei
5
2
·
1 2
6
·
5 3
6
= 10 ·
1
36
·
125
216
≈ 16%.
verteilungen.pdf, Seite 7
Beispiel: Wahrscheinlichkeit für ...
I 6 mal Wappen bei 10 Münzwürfen:
b10;0,5 (6) =
10
6
·
1 6
2
·
1 4
2
= 210 ·
1 10
2
≈ 21%,
I 3 Sechsen bei 10 mal Würfeln:
b10;1/6 (3) =
10
3
·
1 3
6
·
I 30 Sechsen bei 100 mal
5 7
6
≈ 16%,
Würfeln: b100;1/6 (30) ≈ 0, 038%,
I zwischen 25 und 34 Sechsen bei 100 Würfen:
P(X
P = 25) + P(X = 26) + ... + P(X = 34)
= 34
k=25 b100;1/6 (k) ≈ 2, 2%,
I zwischen 11 und 20 Sechsen bei 100 Würfen:
≈ 80, 5%.
verteilungen.pdf, Seite 8
Beispiel
Binomialverteilung mit
n = 20, p = 0, 7,
die die typische
Form einer Glockenkurve hat.
verteilungen.pdf, Seite 9
Beispiel
Binomialverteilung mit
n = 200, p = 0, 7
verteilungen.pdf, Seite 10
Weitere Eigenschaften der Binomialverteilung
I Ist
X ∼ b(n, p)
Y ∼ b(m, p) und sind X
X + Y ∼ b(n + m, p).
und
unabhängig, so ist
und
Y
Dies folgt unmittelbar aus der Denition. Dabei ist
wichtig, dass
X
und
Y
die gleiche
p haben.
n − X ∼ b(n, 1 − p)
Erfolgswahrscheinlichkeit
I Ist
X ∼ b(n, p),
so ist
(Zahl der Misserfolge).
Bemerkung
Es handelt sich tatsächlich um eine
Wahrscheinlichkeitsverteilung, denn nach der binomischen
Formel gilt
1
=1
n
n n X
n
· p k · (1 − p)n−k
= p + (1 − p) =
k
k=0
verteilungen.pdf, Seite 11
Hypergeometrische Verteilung
Beispiel:
Von
N = 50
Artikeln sind
K =5
fehlerhaft.
Wie groÿ ist dann die Wahrscheinlichkeit, bei einer Stichprobe
von
n = 10
Artikeln
k =2
fehlerhafte zu entdecken?
Die Binomialverteilung gibt hier die Wahrscheinlichkeiten nicht
korrekt wieder, da z. B. die Wahrscheinlichkeit
p2 ,
dass der
zweite geprüfte Artikel defekt ist, davon abhängt, ob der erste
defekt war oder nicht (p2 ist entweder 4/49 oder 5/49).
Ähnliche Fragestellung
Wie groÿ ist die Wahrscheinlichkeit, dass ein Skatspieler genau
zwei Buben bekommt?
(hier ist
N = 32, n = 10, K = 4
und
k = 2).
verteilungen.pdf, Seite 12
Antwort zum Skatbeispiel
32
10
Es gibt insgesamt
= 64.512.240
verschiedene Skatblätter
(10 Karten von 32), die alle (Annahme einer
LaplaceVerteilung!) gleich wahrscheinlich sind.
4
2
Für die zwei Buben gibt es
=6
Möglichkeiten (zwei von
vier), für die übrigen 8 Karten (NichtBuben) gibt es
28
8
= 3.108.105
Möglichkeiten.
4
2
Folglich gibt es insgesamt
·
28
8
= 18.648.630
verschiedene
Skatblätter mit genau zwei Buben.
Die Wahrscheinlichkeit, eines davon zu bekommen, liegt bei
K
k
N−K
n−k
·
N
n
=
4
2
28
8
·
32
10
=
18.648.630
64.512.240
≈ 28, 9%
verteilungen.pdf, Seite 13
Denition
Eine Zufallsvariable
X
mit
P(X = k) = H(k|n; K ; N) =
K
k
N−K
n−k
·
N
n
k ∈ Z mit k ≥ 0, k ≤ n und k ≤ K heiÿt
hypergeometrisch verteilt mit den Parametern n, K , N ∈ N,
für alle
Notation
X ∼ H(n; K ; N).
Dabei muss gelten
n≤N
K ≤ N.
und
Anwendung/Interpretation
Von
N
Objekten, von denen
haben, werden
n
Verteilung gibt für 0
unter den
n
K
eine besondere Eigenschaft
zufällig ausgewählt. Die hypergeometrische
≤k ≤n
die Wahrscheinlichkeit an, dass
ausgewählten Objekten
k
die besondere
Eigenschaft haben.
verteilungen.pdf, Seite 14
Zum Skatbeispiel
Hier ist
K =4
N = 32
die Gesamtzahl der Karten. Davon haben
die Eigenschaft Bube.
Zufällig ausgewählt werden
n = 10
Karten (die ein Spieler
ausgeteilt bekommt).
Die Zahl
X
der darin enthaltenen Buben wird dann durch die
hypergeometrische Verteilung
X ∼ H(10; 4; 32)
beschrieben.
Es ist
P(X = 0) ≈ 0, 203 = 20, 3%,
P(X = 1) ≈ 0, 428 = 42, 8%,
P(X = 2) ≈ 0, 289 = 28, 9%,
P(X = 3) ≈ 0, 073 = 7, 3%
und
P(X = 4) ≈ 0, 006 = 0, 6%.
verteilungen.pdf, Seite 15
Verteilung H(6; 6; 49)
Zahl der Richtigen beim Lotto: Von
n=6
N = 49
Kugeln werden
gezogen. Auf dem eigenen Tippschein sind
K =6
Gewinnzahlen angekreuzt.
Bemerkung: P(X = 4) ≈ 0, 1%, P(X = 5) ≈ 0, 002%
und
P(X = 6) ≈ 0, 000007%
verteilungen.pdf, Seite 16
Erwartungswert und Varianz
Ist
EX = n · KN = n · p und
· 1 − KN · N−n
= n · p · (1 − p) ·
N−1
X ∼ H(n; K ; N),
V (X ) = n ·
mit
p=
K
N
so ist
N−n
N−1
K
.
N
Bemerkung
Ist N im Vergleich zu n sehr groÿ (in der Praxis etwa
N ≥ 20n), so kann die hypergeometrische Verteilung durch
die
Binomialverteilung approximiert werden, d. h.
H(k|n; K ; N) ≈ bn;p (k)
mit
p=
K
.
N
verteilungen.pdf, Seite 17
PoissonVerteilung
X
Eine Zufallsvariable
λ ∈ R, λ > 0,
heiÿt
Poissonverteilt
mit Parameter
wenn
P(X = k) =
λk −λ
·e
k!
für
k = 0, 1, 2, ...
Berechnungen der PoissonVerteilung führen auf die
Exponentialreihe (Taylorreihe der eFunktion):
Um zu zeigen, dass es sich tatsächlich um eine
Wahrscheinlichkeitsverteilung handelt, betrachtet man
P∞
P
λk
= e−λ · ∞
k=0 k!
= e−λ · 1 + λ + 12 λ2 + 16 λ3 + ... = e−λ · eλ = 1
k=0
P(X = k) =
P∞
λk −λ
k=0 k! e
verteilungen.pdf, Seite 18
Approximation der Binomialverteilung
Die PoissonVerteilung kann benutzt werden, um die
Binomialverteilung für sehr kleine
p
und groÿe
approximieren (in der Praxis etwa für
Dann ist
bn;p (k) ≈
λk
k!
e
−λ
mit
n
p ≤ 0, 01
zu
und
n ≥ 50).
λ = np .
Anwendungen
I Zahl der Schadensfälle einer Versicherung
I Zahl der Anrufer einer Hotline oder Kunden in einem
Geschäft
I Zahl der Aufrufe einer Internetseite
I Zahl von Meteoriten- oder Blitzeinschlägen
I Zahl der fehlerhaften Artikel in einer Produktion
jeweils innerhalb eines festgelegten Zeitraums
verteilungen.pdf, Seite 19
Beispiel 1
Die Zahl
X
der Schadensfälle einer Versicherung an einem Tag
sei Poissonverteilt mit Paramater
λ = 5.
Dann ist
50
−5
= e−5 ≈ 0, 67%
0! · e
51
−5
= 5e−5 ≈ 3, 37%
1) =
1! · e
52
−5
2) =
= 12, 5 · e−5 ≈ 8, 42%
2! · e
55
−5
−5
= 625
≈ 17, 55%
5) =
5! · e
24 · e
510
−5
10) =
≈ 1, 81%
10! · e
I
P(X = 0) =
I
P(X =
I
P(X =
I
P(X =
I
P(X =
P(X ≤ 2) = P(X = 0)+P(X = 1)+P(X = 2) ≈ 12, 47%
P(4 ≤ X ≤ 6)
= P(X = 4)+P(X = 5)+P(X = 6) ≈ 49, 72%
I
I
verteilungen.pdf, Seite 20
PoissonVerteilung mit λ = 5
verteilungen.pdf, Seite 21
Beispiel 2
Ein Unternehmen unterbreitet 100.000 potentiellen Kunden ein
Angebot und geht davon aus, dass dieses in 0, 2
%
der Fälle
angenommen wird.
Die Zahl
X
der Kunden, die das Angebot annehmen, kann
dann als binomialverteilt mit den Parametern
p = 0, 002
n = 100.000
und
angenommen werden.
Diese Binomialverteilung kann durch eine PoissonVerteilung
mit Parameter
λ = n · p = 200
approximiert werden.
Somit gilt z. B. für dei Wahrscheinlichkeit, dass genau 190
Kunden das Angebot annehmen
P(X = 190) ≈
200190
190!
Zum Vergleich:
Der mit der Binomialverteilung berechnete
· e−200 ≈ 2, 243 %.
exakte Wert liegt bei 2, 244
%.
verteilungen.pdf, Seite 22
Erwartungswert und Varianz
werden mit Hilfe der Exponentialreihe berechnet: Für den
Erwartungswert einer Poissonverteilten Zufallsvariable
Parameter
λ
X
mit
gilt
∞
X
λk−1
λk
= λ · e−λ
k!
(k − 1)!
k=1
k=0
= λ · e−λ · 1 + λ + 21 λ2 + 16 λ3 + ... = λ · e−λ · eλ = λ.
EX =
∞
X
k · e−λ
Analog berechnet man die Varianz
V (X ) = λ
Summationseigenschaft
Y unabhängig und Poissonverteilt mit
Parametern λ bzw. µ, so ist X + Y Poissonverteilt
Parameter λ + µ.
Sind
X
und
mit
verteilungen.pdf, Seite 23
Erweiterung: PoissonProzess
Ein
PoissonProzess
modelliert die Anzahl zufällig eintretender
Ereignisse (wie Anrufe bei einer Telefonzentrale, Kunden in
einem Geschäft, Meteoriteneinschläge etc.) als Funktion der
Zeit.
Er besteht aus einer Familie von Zufallsvariablen
für jeden Zeitpunkt
t>0
(Xt )t>0 ,
d. h.
ist eine Zufallsvariable deniert,
welche die Zahl der zwischen den Zeitpunkten 0 und
t
eingetretenen Ereingnisse beschreibt.
Ein PoissonProzess mit Parameter
λ>0
ist dabei durch
folgende Eigenschaften charakterisiert:
t > 0 ist Xt Poissonverteilt mit Parameter tλ
für 0 < t < s ist die Zufallsvariable Xs − Xt unabhängig
von Xt und Poissonverteilt mit Parameter (s − t)λ
I für festes
I
verteilungen.pdf, Seite 24
Die geometrische Verteilung
gibt bei einem Versuch mit Erfolgswahrscheinlichkeit
Zahl der Versuche bis zum ersten Erfolg wieder. Für
p die
n≥1
ist
P(X = n) = p · (1 − p)n−1
(n
−1
Fehlversuche gefolgt von einem erfolgreichen Versuch).
q = 1 − p erhält man mit Hilfe
P∞
P∞ k−1
k=1 P(X = k) = p ·
k=1 q
Mit
der geometrischen Reihe
= p · (1 + q + q 2 + ...) = p ·
1
1−q
=
p
p
= 1,
also liegt tatsächlich eine Wahrscheinlichkeitsverteilung vor.
verteilungen.pdf, Seite 25
Geometrische Verteilung mit Parameter p =
1
6
verteilungen.pdf, Seite 26
Eigenschaften
I Ist
X
geometrisch verteilt mit Parameter
Erwartungswert und Varianz
EX = p1 und V (X ) = 1p−p
⇒
2
σX =
1
p
·
√
p,
1
so gilt für
− p.
I Die geometrische Verteilung ist gedächtnislos, denn für
n, m ∈ N gilt
P(X > n + m|X > n) = P(X > m)
(der linke Term bezeichnet die bedingte
Wahrscheinlichkeit, dass nach
n
n
Misserfolgen weitere
Misserfolge folgen),
d. h. die Wahrscheinlichkeit, dass die nächsten
m
Versuche Misserfolge sind, hängt nicht davon ab, wie
viele Versuche man schon vorher gemacht hat.
Die Berechnung von Erwartungswert und Varianz sowie der
Nachweis der Gedächtnislosigkeit erfolgt mit Hilfe von
Potenzreihen.
verteilungen.pdf, Seite 27
Beispiel
Die Zahl der Würfe, die man benötigt, um eine Sechs zu
bekommen, ist geometrisch verteilt mit Parameter
Ihr Erwartungswert ist
1
p
= 6,
p=
1
6.
d. h. im Durchschnitt werden 6
Würfe benötigt.
Die Varianz beträgt
σ2 =
die Standardabweichung
1−p
p2
σ=
=
√
5/6
(1/6)2
30
=
5·36
6
= 30,
≈ 5, 5.
P(X ≤ 5) = 1 − (1 − p)5 ≈ 0, 598, d. h. benötigt man
knapp 60% der Fälle maximal 5 Würfe, also weniger als im
Es gilt
in
Durchschnitt.
Anderseits werden nur in etwa
benötigt, da
1
der Fälle mehr als 6 Würfe
6 3
P(X > 6) = 56 ≈ 0, 335.
verteilungen.pdf, Seite 28
Herunterladen