Kapitel 4 Diskrete Verteilungen

Werbung
Kapitel 4
Diskrete Verteilungen
4.1 Bernoulli-Verteilung
Definition 4.1 Die Wahrscheinlichkeitsfunktion der Bernoulli-Verteilung ist gegeben
durch
8
>
< 1 für x = 0
für x = 1
PX (x) = > : 0
sonst :
Die Bernoulli-Verteilung hat einen Parameter , für den gelten muss
0<<1:
Wir schreiben
X
Ber() ;
wenn eine Zufallsvariable X eine Bernoulli-Verteilung besitzt. Eine Bernoulli-verteilte Zufallsvariable X nimmt nur die zwei Werte 0 und 1 an. Dabei spricht man von einem Erfolg,
wenn X = 1 ist und von einem Misserfolg, wenn X = 0 ist, wobei mit Erfolg nicht immer
ein ,,positives” Ereignis im gewöhnlichen Sprachgebrauch gemeint ist.
π
1−π
0
Misserfolg
1
Erfolg
Abbildung 4.1: Wahrscheinlichkeitsfunktion der Bernoulli-Verteilung
60
4.2. BINOMIALVERTEILUNG
61
Satz 4.1 Es gelte
Ber() :
X
Dann gilt für den Erwartungswert und die Varianz
EX = V ar(X ) = und
= (1
2
) :
In Anwendungen der Bernoulli-Verteilung ist die Erfolgswahrscheinlichkeit gleich einem
Anteil in einer Grundgesamtheit (z.B. Besitzt einen Fernseher, kauft ein Produkt, ist krank,
wählt ,,Ja” usw.).
4.2 Binomialverteilung
Definition 4.2 Die Wahrscheinlichkeitsfunktion der Binomialverteilung ist gegeben
durch
( n
x
x = 0; 1; 2; :::; n
0
sonst :
Die Binomialverteilung hat zwei Parameter n und , für die gelten muss
PX (x) =
x (1
n 2 IN
Wir schreiben
)n
und
X
x
0<<1:
b(n; ) ;
wenn die Zufallsvariable X eine Binomialverteilung besitzt.
Satz 4.2 Es gelte
X
b(n; ) :
Dann gilt für den Erwartungswert und die Varianz
EX = n
und
V arX = n (1
) :
Die Abbildungen 4.2 - 4.4 zeigen einige Wahrscheinlichkeitsfunktionen der Binomialverteilung. Achten Sie auf die Symmetrie und die Annäherung an die Normalverteilung mit
wachsendem n.
62
KAPITEL 4. DISKRETE VERTEILUNGEN
b( 10 ; 0.5 )
0.4
0.3
0.3
P(x)
P(x)
b( 10 ; 0.1 )
0.4
0.2
0.2
0.1
0.1
0.0
0.0
0 1 2 3 4 5 6 7 8 9 10
0 1 2 3 4 5 6 7 8 9 10
x
x
b( 10 ; 0.9 )
0.4
0.3
0.3
P(x)
P(x)
b( 10 ; 0.7 )
0.4
0.2
0.2
0.1
0.1
0.0
0.0
0 1 2 3 4 5 6 7 8 9 10
0 1 2 3 4 5 6 7 8 9 10
x
x
Abbildung 4.2: Wahrscheinlichkeitsfunktionen der Binomialverteilung mit n
0:1; 0:5; 0:7; 0:9
b( 60 ; 0.5 )
0.20
0.20
0.15
0.15
P(x)
P(x)
b( 60 ; 0.1 )
0.10
0.10
0.05
0.05
0.0
0.0
0
10 20 30 40 50 60
0
x
b( 60 ; 0.9 )
0.20
0.15
0.15
P(x)
P(x)
b( 60 ; 0.7 )
0.10
0.05
0.05
0.0
0.0
0
10 20 30 40 50 60
x
10 20 30 40 50 60
x
0.20
0.10
0
10 20 30 40 50 60
x
Abbildung 4.3: Wahrscheinlichkeitsfunktionen der Binomialverteilung mit n
0:1; 0:5; 0:7; 0:9
= 10; =
= 60; =
4.2. BINOMIALVERTEILUNG
63
b( 150 ; 0.1 )
b( 150 ; 0.5 )
0.10
P(x)
P(x)
0.10
0.05
0.0
0.0
0
30
60
90 120 150
0
30
60
90 120 150
x
x
b( 150 ; 0.7 )
b( 150 ; 0.9 )
0.10
P(x)
0.10
P(x)
0.05
0.05
0.0
0.05
0.0
0
30
60
90 120 150
0
x
30
60
90 120 150
x
Abbildung 4.4: Wahrscheinlichkeitsfunktionen der Binomialverteilung mit n
0:1; 0:5; 0:7; 0:9
= 150; =
Die charakteristische Eigenschaft einer Binomialverteilung wird durch den folgenden Satz
ausgedrückt:
Satz 4.3 Wenn X1 ; X2 ; :::; Xn unabhängig und identisch Bernoulli-verteilt sind mit dem
Parameter , dann gilt
n
X
X=
i=1
Xi b(n; ) :
Typischerweise erhält man in der folgenden Situation eine Binomialverteilung:
Beispiel 4.1 (Anzahl der Erfolge) Der Anteil der Erfolge in einer Grundgesamtheit sei . Die
Zufallsvariable X sei die Anzahl der Erfolge in einer Stichprobe der Größe n. Dann gilt nach Satz
4.3
X
b(n; ) :
R-Befehle zur Binomialverteilung:
dbinom(x, size, prob) berechnet die Wahrscheinlichkeitsfunktion der Binomialverteilung mit den Parametern n =size und =prob an der Stelle x. Dabei
kann x ein Vektor sein.
64
KAPITEL 4. DISKRETE VERTEILUNGEN
pbinom(q, size, prob) berechnet die Verteilungsfunktion der Binomialverteilung mit den Parametern n =size und =prob an der Stelle q . Dabei kann q ein
Vektor sein.
qbinom(p, size, prob) berechnet die Umkehrfunktion der Verteilungsfunktion der Binomialverteilung mit den Parametern n =size und =prob an der Stelle
p. Dabei muss p ein Vektor von Wahrscheinlichkeiten, d.h. von Zahlen zwischen 0 und
1 sein.
rbinom(n, size, prob) erzeugt n binomialverteilte Zufallszahlen mit den Parametern n =size und =prob.
choose(n,k) berechnet den Binomialkoeffizienten nx .
4.3 Geometrische Verteilung
Definition 4.3 Die Wahrscheinlichkeitsfunktion der geometrischen Verteilung ist gegeben durch
(
PX (x) =
(1 )x x = 0; 1; 2; :::
0
sonst :
Die geometrische Verteilung hat einen Parameter , für den gelten muss 0 < < 1.
Wir schreiben
X
Ge() ;
wenn die Zufallsvariable X eine geometrische Verteilung besitzt.
Satz 4.4 Es gelte X
Ge() : Dann gilt für den Erwartungswert und die Varianz
EX =
1 und
V arX =
1 2
:
Beispiel 4.2 (Anzahl der Misserfolge vor dem ersten Erfolg) Unabhängige Bernoulli-Experimente
werden solange durchgeführt, bis der erste Erfolg eintritt. Die Zufallsvariable X sei die Anzahl der
Misserfolge vor dem ersten Erfolg bei diesen Bernoulli-Experimenten. Dann gilt
X
Ge() :
In der anschließenden Berechnung der Wahrscheinlichkeitsfunktion werde ein Erfolg mit ,,E” und ein
Misserfolg mit ,,M” bezeichnet.
4.3. GEOMETRISCHE VERTEILUNG
X
65
Wahrscheinlichkeit
0
1
2
P (E ) = P (ME ) = P (M )P (E ) = (1 )
P (MME ) = P (M )P (M )P (E ) = (1
..
.
..
.
)(1
) = (1
P (MM:::M
| {z } E ) = P (M ) : : : P (M ) P (E ) = (1
x
|
x
{z
}
x
) 2
)x
Die Wahrscheinlichkeitsfunktion der geometrischen Verteilung kann also als Antwort auf die
Frage
Wieviele Versuche muss man abwarten, bis man Erfolg hat?
aufgefasst werden.
Ge( 0.5 )
1.0
0.8
0.8
0.6
0.6
P(x)
P(x)
Ge( 0.1 )
1.0
0.4
0.4
0.2
0.2
0.0
0.0
0 2 4 6 8 101214161820
0 2 4 6 8 101214161820
x
x
Ge( 0.9 )
1.0
0.8
0.8
0.6
0.6
P(x)
P(x)
Ge( 0.7 )
1.0
0.4
0.4
0.2
0.2
0.0
0.0
0 2 4 6 8 101214161820
0 2 4 6 8 101214161820
x
x
Abbildung 4.5: Wahrscheinlichkeitsfunktionen der geometrischen Verteilung mit 0:1; 0:5; 0:7; 0:9
=
Die geometrische Verteilung hat eine charakteristische Eigenschaft, die analog ist zu der
Charakterisierung der Exponentialverteilung in Gleichung (3.8). Dort haben wir von einer
Verteilung ohne Gedächtnis gesprochen.
66
KAPITEL 4. DISKRETE VERTEILUNGEN
Satz 4.5 (Markoffsche Eigenschaft) Die geometrische Verteilung ist charakterisiert
durch die Eigenschaft
P (fX = x + x
0
gjfX x g) = P (fX = xg) :
0
Egal, wie viele Misserfolge man beim Warten auf den ersten Erfolg schon erlebt hat, die
Verteilung der noch folgenden Misserfolge vor dem ersten Erfolg ändert sich dadurch nicht.
R-Befehle zur geometrischen Verteilung:
dgeom(x, prob) berechnet die Wahrscheinlichkeitsfunktion der geometrischen Verteilung mit dem Parameter =prob an der Stelle x. Dabei kann x ein Vektor sein.
pgeom(q, prob) berechnet die Verteilungsfunktion der geometrischen Verteilung
mit dem Parameter =prob an der Stelle q . Dabei kann q ein Vektor sein.
qgeom(p, prob) berechnet die Umkehrfunktion der Verteilungsfunktion der geometrischen Verteilung mit dem Parameter =prob an der Stelle p. Dabei muss p ein
Vektor von Wahrscheinlichkeiten, d.h. von Zahlen zwischen 0 und 1 sein.
rgeom(n, prob) erzeugt n geometrisch verteilte Zufallszahlen mit dem Parameter
=prob.
4.4 Die negative Binomialverteilung
Definition 4.4 Die Wahrscheinlichkeitsfunktion der negativen Binomialverteilung ist
gegeben durch
( x+r 1 r
x
PX (x) =
0
r
1
(1
)
x = 0; 1; 2; : : :
sonst :
Die negative Binomialverteilung hat zwei Parameter r und , für die gelten muss
r 2 IN
und
Wir schreiben
X
0<<1:
NB (r; ) ;
wenn X eine negative Binomialverteilung mit den Parametern r und besitzt.
Die negative Binomialverteilung tritt typischerweise in der folgenden Situation auf.
4.4. DIE NEGATIVE BINOMIALVERTEILUNG
67
NB( 5 ; 0.3 )
NB( 5 ; 0.5 )
0.4
0.4
P(x)
0.6
P(x)
0.6
0.2
0.2
0.0
0.0
0 2 4 6 8 101214161820
0 2 4 6 8 101214161820
x
x
NB( 5 ; 0.7 )
NB( 5 ; 0.9 )
0.4
0.4
P(x)
0.6
P(x)
0.6
0.2
0.2
0.0
0.0
0 2 4 6 8 101214161820
0 2 4 6 8 101214161820
x
x
Abbildung 4.6: Wahrscheinlichkeitsfunktionen der negativen Binomialverteilung mit r
5; = 0:9; 0:7; 0:5; 0:3
=
Beispiel 4.3 (Anzahl der Misserfolge vor dem r -ten Erfolg) Unabhängige Bernoulli-Experimente
werden solange durchgeführt, bis der r -te Erfolg eintritt. Die Zufallsvariable X sei die Anzahl der
Misserfolge vor dem r -ten Erfolg bei diesen Bernoulli-Experimenten. Dann gilt
NB (r; ) :
X
Wir wollen die Wahrscheinlichkeitsfunktion von X bestimmen. Die Zufallsvariable X nimmt genau
dann den Wert x an, wenn es vor dem r -ten Erfolg x Misserfolge und r 1 Erfolge gibt. Nun kann
man diese x Misserfolge und r 1 Erfolge auf verschiedene Weisen (Reihenfolgen) anordnen. Jede
Möglichkeit hat die Wahrscheinlichkeit
r (1
Die Anzahl der Möglichkeiten, r
1
)x :
Erfolge und x Misserfolge auf x + r
x+r
r
1
Stellen anzuordnen, ist
!
1
1
:
Damit gilt
P (fX
=
xg)
=
=
P (fr 1 Erfolge und x Misserfolge vor r-tem Erfolg)g
!
x+r 1 r
(1 )x x = 0; 1; 2; ::: :
r 1
68
KAPITEL 4. DISKRETE VERTEILUNGEN
NB( 2 ; 0.5 )
NB( 5 ; 0.5 )
0.2
0.2
P(x)
0.3
P(x)
0.3
0.1
0.1
0.0
0.0
0
5 10 15 20 25 30
0
5 10 15 20 25 30
x
x
NB( 10 ; 0.5 )
NB( 15 ; 0.5 )
0.2
0.2
P(x)
0.3
P(x)
0.3
0.1
0.1
0.0
0.0
0
5 10 15 20 25 30
0
5 10 15 20 25 30
x
x
Abbildung 4.7: Wahrscheinlichkeitsfunktionen der negativen Binomialverteilung mit r
2; 5; 10; 15; = 0:5
Satz 4.6 Es gelte X
von X
=
NB (r; ). Dann gilt für den Erwartungswert und die Varianz
EX = r
1 und
V arX = r
1 2
:
Satz 4.7 Seien X1 ; X2 ; :::; Xr unabhängig und identisch Ge( )-verteilt sind, dann gilt
X + X + ::: + Xr NB (r; ) :
1
2
Beweis:
Sei
X
X
X
1
2
..
.
3
die Anzahl der Misserfolge bis zum 1. Erfolg
die Anzahl der Misserfolge zwischen dem 1. und dem 2. Erfolg
die Anzahl der Misserfolge zwischen dem 2. und dem 3. Erfolg
1)-ten und dem r-ten Erfolg.
Die einzelnen Zufallsvariablen Xi ; i = 1; 2; : : : ; r besitzen eine Ge( )-Verteilung, da man
Xr
die Anzahl der Misserfolge zwischen dem (r
sie jeweils als Anzahl der Misserfolge vor dem ersten Erfolg auffassen kann. Die Summe die-
4.4. DIE NEGATIVE BINOMIALVERTEILUNG
69
ser Zufallsvariablen ist die Anzahl der Misserfolge bis zum r -ten Erfolg und besitzt demnach
eine NB (r ; )-Verteilung.
}
Beispiel 4.4 Sei r
= 3.
Vor dem dritten Erfolg gebe es die folgende Anordnung von Erfolgen und
Misserfolgen.
000 1 0000
0 1
|{z}
| {z } 1 |{z}
X1
X2
X3
Dann ist die Anzahl der Misserfolge bis zum dritten Erfolg
X
=3+4+1=8
:
Die Abbildungen 4.6 und 4.7 zeigen die Vielseitigkeit der Gestalt der negativen Binomialverteilung, die sich daher in Anwendungen gut zum Anpassen an gegebene Daten eignet (siehe
Johnson, Kotz und Kemp (1992), dort werden auch Literaturangaben zu Anwendungen aus
dem ökonomischen Bereich gegeben). Sie weist im Vergleich zur Poissonverteilung größere
Flexibilität auf. Dabei braucht r keine ganze Zahl zu sein. Man kann die negative Binomialverteilung für beliebiges positives reelles r definieren. Dazu muss man die in der Definition
der Binomialkoeffizienten auftretenden Fakultäten durch die Gammaverteilung definieren.
Wenn n keine ganze Zahl ist, so definiert man aufgrund des Satzes 3.9
n! = (n + 1) :
Als weitere Anwendung werden wir die negative Binomialverteilung im Zusammenhang
mit Mischverteilungen (siehe Kapitel 9.3.2) und Bayes’schen Verfahren kennenlernen, denn
sie ist die prädiktive Verteilung einer Poissonverteilung, deren Parameter gammaverteilt ist
(siehe Satz 10.8).
R-Befehle zur negativen Binomialverteilung:
dnbinom(x, size, prob) berechnet die Wahrscheinlichkeitsfunktion der negativen Binomialverteilung mit den Parametern r =size und =prob an der Stelle x.
Dabei kann x ein Vektor sein.
pnbinom(q, size, prob) berechnet die Verteilungsfunktion der negativen Binomialverteilung mit den Parametern r =size und =prob an der Stelle q . Dabei
kann q ein Vektor sein.
qnbinom(p, size, prob) berechnet die Umkehrfunktion der Verteilungsfunktion der negativen Binomialverteilung mit den Parametern r =size und =prob
an der Stelle p. Dabei muss p ein Vektor von Wahrscheinlichkeiten, d.h. von Zahlen
zwischen 0 und 1 sein.
rnbinom(n, size, prob) erzeugt n binomialverteilte Zufallszahlen mit den
Parametern r =size und =prob.
70
KAPITEL 4. DISKRETE VERTEILUNGEN
4.5 Poissonverteilung
Definition 4.5 Die Wahrscheinlichkeitsfunktion der Poissonverteilung ist definiert
durch
( x PX (x) =
e
x!
0
x = 0; 1; 2; :::
sonst.
Die Poissonverteilung hat einen Parameter , für den gelten muss > 0.
Wir schreiben
X
P o() ;
wenn X eine Poissonverteilung mit dem Parameter besitzt.
Abbildung 4.8 zeigt einige Wahrscheinlichkeitsfunktionen der Poissonverteilung. Man beachte, dass die Poissonverteilung mit wachsendem Parameter immer mehr die Gestalt der
Dichte einer Normalverteilung annimmt. Daher hat man in der Vorcomputerzeit die Poissonverteilung für große durch eine Normalverteilung approximiert.
Satz 4.8 Es gelte X
X
P o(). Dann gilt für den Erwartungswert und die Varianz von
EX = und
V arX = :
Der Poissonverteilung kommt in Anwendungen eine ähnliche Bedeutung unter den diskreten Verteilungen zu wie der Normalverteilung unter den stetigen Verteilungen. Sie wird
gebraucht als
Approximation der Binomialverteilung (siehe Satz 4.9) und anderer Verteilungen,
wenn Ereignisse zufällig in der Zeit oder allgemeiner auf der reellen Zahlenachse
(Poissonprozess) oder im Raum (räumliche Poissonprozesse) auftreten (siehe Beispiel
4.6),
in Modellen für die Analyse von Häufigkeitstabellen,
in der empirischen Analyse von Zähldaten.
4.5. POISSONVERTEILUNG
71
Po( 0.5 )
Po( 2.5 )
0.4
0.4
P(x)
0.6
P(x)
0.6
0.2
0.2
0.0
0.0
0
4
8
12
16
20
0
4
8
x
12
16
20
16
20
x
Po( 5 )
Po( 9 )
0.4
0.4
P(x)
0.6
P(x)
0.6
0.2
0.2
0.0
0.0
0
4
8
12
16
20
0
x
4
8
12
x
Abbildung 4.8: Wahrscheinlichkeitsfunktionen der Poissonverteilung mit = 0:5; 2:5; 5; 9
Satz 4.9 (Approximation der Binomialverteilung) Sei
X
b(n; ) :
Wenn ,,klein” ist und n ,,groß” ist, so gilt asymptotisch
X _ P o()
mit = n .
Dieser Satz wird durch Abbildung 4.9 veranschaulicht, in der die Wahrscheinlichkeitsfunktionen der P o(5)-Verteilung und einiger Binomialverteilungen, für die n = 5 mit wachsendem n und fallendem gilt, dargestellt ist.
Beispiel 4.5 Ein typisches Beispiel für die Anwendung dieses Satzes findet man in der Versiche-
rungswirtschaft. Die Anzahl n der Versicherten ist groß, die Wahrscheinlichkeit eines Schadenfalles
ist klein. Sei X die Anzahl der Versicherten, die in einem bestimmten Zeitraum (z.B. ein Jahr) einen
Schaden anmelden. Wenn man annimmt, dass die Wahrscheinlichkeit eines Schadensfalles für jeden
Versicherten gleich groß ist, so gilt
X
b(n; ) :
Als Approximation kann unter den obigen Voraussetzungen die Poissonverteilung verwendet werden:
X _ P o()
= n :
72
KAPITEL 4. DISKRETE VERTEILUNGEN
0.3
b( 10 ; 0.5 )
Po( 5 )
b( 50 ; 0.1 )
Po( 5 )
0.2
P(x)
P(x)
0.2
0.3
0.1
0.1
0.0
0.0
0 2 4 6 8 10 12 14
x
0 2 4 6 8 10 12 14
x
0.3
b( 100 ; 0.05 )
Po( 5 )
0.2
b( 1000 ; 0.005 )
Po( 5 )
P(x)
P(x)
0.2
0.3
0.1
0.1
0.0
0.0
0 2 4 6 8 10 12 14
x
0 2 4 6 8 10 12 14
x
Abbildung 4.9: Wahrscheinlichkeitsfunktionen der Binomialverteilung und Poissonverteilung
mit = n = 5
Beispiel 4.6 Auch in der Qualitätskontrolle wird die Poissonverteilung häufig als Modell verwendet,
z.B. für
die Anzahl der fehlerhaften Teile (die Wahrscheinlichkeit eines Fehlers sei klein) in einem
großen Los.
die Anzahl der Fehler pro Einheit in einem lackierten Draht, dessen Fehlstellen zufällig über
die gesamte Länge verteilt seien (eindimensionaler Poissonprozess).
Anzahl der Astlöcher pro Flächeneinheit in einer Holzplatte oder Anzahl der Bläschen pro
Flächeneinheit in einer Glasplatte (räumlicher Poissonprozess).
Wir hatten schon in Kapitel 3 einen Poissonprozess definiert (Definition 3.6). Der folgende
Satz gibt eine Begründung des Namens ,,Poissonprozess” an.
Satz 4.10 Sei N (t) die Anzahl der Ereignisse in dem Zeitintervall
prozesses mit Intensität (Ereignisse pro Zeiteinheit), dann gilt
(0; t℄ eines Poisson-
N (t) P o(t) ;
d.h.
8
< (t)n e t
P (fN (t) = ng) = :
n!
0
für n = 0; 1; :::
sonst.
4.5. POISSONVERTEILUNG
73
Beispiel 4.7 Unterbrechungen am Fließband tauchen wie ein Poissonprozess auf mit Intensität =
0:1
pro Stunde. Sei X die Anzahl der Unterbrechungen in 8 Stunden. Dann gilt:
X
P o((0:1) 8) = P o(0:8)
Dann gilt z.B.
P (fX
=0 )=
P (fX
=1 )=
P (fX
=2 )=
P (fX
=3 )=
0 e 0:8
g
(0 8)
g
(0 8)
g
(0 8)
g
(0 8)
:
0!
1 e 0:8
:
1!
2 e 0:8
:
2!
:
3 e 0:8
3!
: = 0:449
=
e
=
::: = 0:359 ;
=
::: = 0:144 ;
=
::: = 0:038 :
0 8
;
R-Befehle zur Poissonverteilung:
dpois(x, lambda) berechnet die Wahrscheinlichkeitsfunktion der Poissonverteilung mit dem Parameter =lambda an der Stelle x. Dabei kann x ein Vektor sein.
ppois(q, lambda) berechnet die Verteilungsfunktion der Poissonverteilung mit
dem Parameter =lambda an der Stelle q . Dabei kann q ein Vektor sein.
qpois(p, lambda) berechnet die Umkehrfunktion der Verteilungsfunktion der
Poissonverteilung mit dem Parameter =lambda an der Stelle p. Dabei muss p ein
Vektor von Wahrscheinlichkeiten, d.h. von Zahlen zwischen 0 und 1 sein.
rpois(n, lambda) erzeugt n poissonverteilte Zufallszahlen mit dem Parameter
=lambda.
Herunterladen