Diskrete Zufallsvariablen

Werbung
Diskrete Zufallsvariablen
Erste Beispiele diskreter Verteilungen
Bernoulli-Verteilung
Eine diskrete Zufallsvariable X heißt bernoulliverteilt mit Parameter p,
falls sie die Wahrscheinlichkeitsfunktion
x = 1,
 p,

f ( x ) = P( X = x ) =  1 − p, x = 0,
 0,
sonst

besitzt.
Bedeutung?
Beispiel?
Bemerkung
Bei einem Zufallsvorgang oft von Interesse ob ein Ereignis A eintritt oder nicht
Kodierung durch „Bernoulli-Variable“
Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
407
Diskrete Zufallsvariablen
Diskrete Gleichverteilung
Eine diskrete Zufallsvariable X heißt gleichverteilt auf dem Träger
T = { a1 , a2 , K, ak } , falls sie die Wahrscheinlichkeitsfunktion
f ( x ) = P (X = a j ) =
besitzt.
Bedeutung?
1
, j = 1, K , k
k
Beispiel?
Geometrische Verteilung
Eine diskrete Zufallsvariable X heißt geometrisch verteilt mit Parameter p,
kurz X ~ G(p), falls sie die Wahrscheinlichkeitsfunktion
 (1 − p )x −1 p, x = 1, 2, K ,
f (x ) = P( X = x ) = 
0,
sonst

besitzt.
Wie lautet die Summe aller Wahrscheinlichkeiten?
Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
408
Diskrete Zufallsvariablen
Modell der geometrischen Verteilung
Bei einem Zufallsvorgang sei nur von Interesse, ob ein bestimmtes Ereignis A
eintritt oder nicht, wobei P(A) = p mit 0 < p < 1. Der Zufallsvorgang wird nun
unabhängig voneinander so oft wiederholt, bis zum ersten Mal A eintritt.
Definiere Zufallsvariable
X = „Anzahl der Versuche bis zum ersten Mal A eintritt“
!
Gelegentlich auch alternative Definition:
X = „Anzahl der Fehlerversuche bis zum ersten Mal A eintritt“
P( X = 1) = P( A1 ) = p,
Warum geht das?
P( X = 2 ) = P (A1 ∩ A2 ) = P (A ) P( A) = (1 − P ( A)) P ( A) = (1 − p ) p,
P( X = 3) = P (A1 ∩ A2 ∩ A3 ) = P (A ) P (A ) P( A) = (1 − P ( A)) P ( A) = (1 − p ) p,
2
2
M
k −1
P( X = k ) = P (A1 ∩ K ∩ Ak −1 ∩ Ak ) = P (A )⋅ K ⋅ P (A ) P ( A) = (1 − p ) p.
Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
409
Diskrete Zufallsvariablen
Geometrische Verteilung mit p =0.1
Geometrische Verteilung mit p =0.5
Träger?
Anwendungsmöglichkeiten:
Lebensdauer- und Wartezeitmodelle
Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
410
Diskrete Zufallsvariablen
Unabhängigkeit von diskreten Zufallsvariablen
Zur Erinnerung:
Postulat der empirischen Unabhängigkeit zweier Merkmale (vgl. S. 214):
fij
f i•
= f• j
fij = f• j fi•
für i = 1, ..., k und j = 1, ..., l
Übertragung auf Zufallsvariablen
Unabhängigkeit von zwei diskreten Zufallsvariablen
Zwei diskrete Zufallsvariablen X und Y mit Trägern TX = { a1 , a2 ,K, ak ,K} und
TY = { b1 , b2 ,K, bl ,K} heißen unabhängig, falls für beliebige x ∈ TX und y ∈ TY
P( X = x, Y = y ) = P( X = x ) P(Y = y )
gilt.
Analogie zur Unabhängigkeit von zwei Ereignissen?
Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
411
Diskrete Zufallsvariablen
Bemerkung:
Sind zwei Zufallsvariablen X und Y gemäß dieser Definition unabhängig, so folgt
sogar allgemeiner die Unabhängigkeit von zwei Ereignissen der Form
{X ∈A}
und { Y ∈ B }, wobei A und B zulässige Bereiche auf der Menge der reellen Zahlen
sind (vgl. S. 399).
Beispiel: Zweimaliger Würfelwurf
X = „Augenzahl im ersten Wurf“, Y = „Augenzahl im zweiten Wurf“
Klar:
P( X = 1, Y = 2) = P( X = 1) P(Y = 2) = 1 / 6 ×1 / 6 = 1 / 36.
Es gilt aber auch P( X ≤ 2, Y = 1) = P( X ≤ 2) P(Y = 1) = 1 / 3 ×1 / 6 = 1 / 18,
da
P( X ≤ 2, Y = 1) = P( X = 1, Y = 1) + P( X = 2, Y = 1)
= P( X = 1) P(Y = 1) + P( X = 2) P(Y = 1)
= [P( X = 1) + P( X = 2)] P(Y = 1) = P( X ≤ 2) P(Y = 1) .
Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
412
Diskrete Zufallsvariablen
Unabhängigkeit von mehreren diskreten Zufallsvariablen
Die diskreten Zufallsvariablen X1, X2, ..., Xn heißen unabhängig, falls für beliebige
Werte x1, x2, ..., xn aus den jeweiligen Trägern
P( X 1 = x1 , X 2 = x2 ,K, X n = xn ) = P( X 1 = x1 ) P( X 2 = x2 ) ⋅K⋅ P( X n = xn )
gilt.
Analogie zur Unabhängigkeit von mehreren Ereignissen?
Bemerkung:
Beachte: Aus der Unabhängigkeit gemäß dieser Definition lässt sich wiederum
die Unabhängigkeit von mehreren Ereignissen ableiten.
Beispiel: Dreimaliger Würfelwurf
Xi = „Augenzahl im i-ten Wurf“, i = 1, 2, 3.
Dann gilt z.B.: P( X 1 ≤ 2, X 2 = 1) = P( X 1 ≤ 2) P( X 2 = 1) = 1 / 3 ×1 / 6 = 1 / 18, da
Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
413
Diskrete Zufallsvariablen
6
6
i =1
i =1
P( X 1 ≤ 2, X 2 = 1) = ∑ P( X 1 = 1, X 2 = 1, X 3 = i ) + ∑ P( X 1 = 2, X 2 = 1, X 3 = i )
6
6
i =1
i =1
= ∑ P( X 1 = 1)P( X 2 = 1)P( X 3 = i ) + ∑ P( X 1 = 2)P( X 2 = 1)P( X 3 = i )
6
6
i =1
i =1
= P( X 1 = 1)P( X 2 = 1)∑ P( X 3 = i ) + P( X1 = 2)P( X 2 = 1)∑ P( X 3 = i )
= P( X 1 = 1) P( X 2 = 1) + P( X 1 = 2) P( X 2 = 1)
= [P( X1 = 1) + P( X1 = 2)]P( X 2 = 1)
= P( X 1 ≤ 2) P( X 2 = 1) .
„Unabhängige Zufallsvariablen erzeugen unabhängige Ereignisse“.
Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
414
Diskrete Zufallsvariablen
Berechnung von Lageparametern
Berechnung von Erwartungswerten
Erwartungswert einer diskreten Zufallsvariablen
Der Erwartungswert E ( X ) einer diskreten Zufallsvariable X ist gegeben durch
E ( X ) = a1 p1 + K + ak pk + K = ∑ a j p j = ∑ a j P(X = a j ) = ∑ a j f (a j ).
j ≥1
j ≥1
j ≥1
Anstelle von E ( X ) wird auch häufig das Symbol µ X oder einfach µ verwendet.
Analogie in deskriptiver Statistik? Interpretation?
!
Erwartungswert kann bereits vor Ablauf des Zufallsvorgangs berechnet
werden. Die Berechnung beruht also nicht auf vorliegenden Daten!
Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
!
415
Wie ist der
Erwartungswert
zu interpretieren?
416
Was unterscheidet
arithmetisches Mittel
und Erwartungswert?
417
Diskrete Zufallsvariablen
Beispiel: Würfelwurf
Sei X = „Augenzahl“ beim einmaligen Würfelwurf.
1
1
1
1
1
1
E( X ) = a1 p1 + K + a6 p6 = 1⋅ + 2 ⋅ + 3 ⋅ + 4 ⋅ + 5 ⋅ + 6 ⋅ = 3.5
6
6
6
6
6
6
Angenommen, ein Würfel werde fünfmal unabhängig voneinander geworfen.
Sei nun X i die Augenzahl beim i-ten Würfelwurf für i = 1, ..., 5.
Dann sind die Zufallsvariablen X 1 , X 2 ,K, X 5 stochastisch unabhängig und identisch
verteilt wie X. Lauten die Ergebnisse der Zufallsexperimente (Realisationen)
x1 = 4, x2 = 3, x3 = 1, x4 = 3, x5 = 6,
so ergibt sich für das arithmetische Mittel der Realisationen (Beobachtungswerte)
1 5
x = ∑ xi = 3.2.
n i =1
Was ist bei einer 1000-maligen Wiederholung des Experiments zu erwarten?
!
Beachte:
Zufallsvariablen werden i.d.R. groß, Realisationen klein geschrieben.
Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
418
Diskrete Zufallsvariablen
Transformationsregel für Erwartungswerte
Sei X eine diskrete Zufallsvariable und g(x) eine reelle Funktion.
Dann gilt für Y = g(X):
E(Y ) = E (g ( X )) = ∑ g (a j ) p j = ∑ g (a j ) f (a j ).
j ≥1
Beispiel:
j ≥1
Sei X = „Augenzahl“ beim einmaligen Würfelwurf
( )= ∑ j
6
EX
2
j =1
2
1
1
1
1
1
1
1
⋅ = 12 ⋅ + 22 ⋅ + 32 ⋅ + 42 ⋅ + 52 ⋅ + 66 ⋅ = 15.167
6
6
6
6
6
6
6
Erwartungswert bei Lineartransformation
Sei X eine diskrete Zufallsvariable. Dann gilt für Y = a + bX:
E (Y ) = a + b E ( X ) .
Analogie in deskriptiver Statistik?
Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
419
Diskrete Zufallsvariablen
Beachte:
E (Y ) = ∑ b j p j = ∑ (a + ba j ) p j = ∑ ap j + b∑ a j p j
j
j
j
j
= a∑ p j + bE( X ) = a + bE( X )
j
für b j = a + ba j .
Erwartungswert der Summe von Zufallsvariablen
Für zwei diskrete Zufallsvariablen X und Y gilt:
E( X + Y ) = E( X ) + E (Y ) .
Für n diskrete Zufallsvariablen X 1 , X 2 ,K, X n und n Konstanten c1 , c2 ,K, cn gilt:
E(c1 X1 + c2 X 2 + K + cn X n ) = c1E( X1 ) + c2 E( X 2 ) + K + cn E( X n ) .
Ohne formalen Beweis
Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
420
Diskrete Zufallsvariablen
Produktregel für unabhängige Zufallsvariablen
Für zwei unabhängige(!) diskrete Zufallsvariablen X und Y gilt:
E( X ⋅ Y ) = E( X ) E(Y ) .
Ohne formalen Beweis
Beispiel:
Beim zweimaligen Würfeln gilt für das Produkt der Augenzahl X und Y
E( X ⋅Y ) = 3.5 ⋅ 3.5 = 12.25 .
Wie würden Sie ohne Produktregel E( X ⋅ Y ) berechnen?
Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
421
Diskrete Zufallsvariablen
Berechnung von Quantilen
Quantile und Median einer diskreten Zufallsvariable
Sei X eine diskrete Zufallsvariable mit Verteilungsfunktion F(x).
Dann heißt qα mit 0 < α < 1 α-Quantil von X, falls
F (qα ) = P( X ≤ qα ) ≥ α und
F (qα − ε ) < α für ε > 0 .
Interpretation?
Analogie in deskriptiver Statistik?
Für α = 0.5 heißt q0.5 Median.
Beispiel: Einmaliger Würfelwurf
aj
1
f (a j ) 1/6
F (a j ) 1/6
2
3
4
5
6
1/6
1/6
1/6
1/6
1/6
2/6
3/6
4/6
5/6
1
Fortsetzung
auf Folgeseite ...
Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
422
Diskrete Zufallsvariablen
Übung:
Zeichnen Sie die Verteilungsfunktion der diskreten Zufallsvariablen X, wobei
X = „Augensumme beim einmaligen Würfelwurf“.
Bestimmen Sie anschließend das 0.25-, das 0.5- und das 0.75-Quantil von X.
Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
423
Diskrete Zufallsvariablen
Aufgabe 48
Gegeben sei die Situation des viermaligen Münzwurfs (vgl. S. 395 und 405).
Die Zufallsvariable X gebe die Anzahl von „Zahl“ an.
R
F
Der Erwartungswert von X ist gleich 2.
Der Median von X ist gleich 2.5.
Das 0.25-Quantil ist gleich 1.5.
Das 0.75-Quantil ist gleich 3.
Der Erwartungswert von X3 ist gleich 8.
Der Erwartungswert von Y mit Y = 2X2 - 8 ist gleich 0.
Würde die Münze 5 mal geworfen, so wäre der Erwartungswert
für die Anzahl von „Zahl“ gleich 2.5.
Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
424
Diskrete Zufallsvariablen
Berechnung von Streuungsparametern
Varianz und Standardabweichung einer diskreten Zufallsvariable
Die Varianz Var( X ) einer diskreten Zufallsvariable X ist gegeben durch
(
) ( )
Var( X ) = E ( X − µ ) = E X 2 − µ 2
2
= ∑ (a j − µ ) f (a j )
2
j ≥1
2


= ∑ a 2j f (a j ) −  ∑ a j f (a j ) .
j ≥1
 j ≥1

Anstelle von Var( X ) wird auch häufig das Symbol σ X2 oder einfach σ 2 verwendet.
Die Standardabweichung ist σ = σ 2 = Var( X ) .
Analogie in deskriptiver Statistik? Interpretation?
Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
425
Diskrete Zufallsvariablen
Beachte:
(
) (
E ( X − µ ) = E X 2 − 2 Xµ + µ 2
2
( )
= E ( X ) − 2µ
= E (X ) − µ
)
( )
= E X 2 − 2µ E ( X ) + E µ 2
2
2
2
+ µ2
2
Die anderen Gleichungen in der Definition folgen aus den Rechenregeln für
Erwartungswerte.
Beispiel: Würfelwurf
Sei X = „Augenzahl“ beim einmaligen Würfelwurf.
( )
Var( X ) = E X 2 − µ 2
1
1
1
1
1
1
= 12 ⋅ + 22 ⋅ + 32 ⋅ + 42 ⋅ + 52 ⋅ + 62 ⋅ − 3.52
6
6
6
6
6
6
= 15.167 − 12.25 = 2.917
Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
426
Diskrete Zufallsvariablen
Angenommen, ein Würfel werde fünfmal unabhängig voneinander geworfen.
Sei nun X i die Augenzahl beim i-ten Würfelwurf für i = 1, ..., 5.
Dann sind die Zufallsvariablen X 1 , X 2 ,K, X 5 stochastisch unabhängig und identisch
verteilt wie X. Lauten die Ergebnisse der Zufallsexperimente (Realisationen)
x1 = 4, x2 = 3, x3 = 1, x4 = 3, x5 = 6,
so ergibt sich für die (empirische) Varianz der Realisationen (Beobachtungswerte)
1 5
1 5 2
2
2
s = ∑ (xi − x ) = ∑ xi − x 2 = 14.2 − 3.22 = 3.96 .
n i =1
n i =1
Was ist bei einer 1000-maligen Wiederholung des Experiments zu erwarten?
Weitaus schwierigere Frage:
Angenommen, der fünfmalige Würfelwurf werde 1000 mal wiederholt und
jedes mal die empirische Varianz berechnet. Würde das arithmetische Mittel
der einzelnen Varianzen dann der Varianz von X (nahezu) entsprechen?
Problemfeld der schließenden Statistik:
„Erwartungstreue Schätzung“ der Parameter
von Verteilungen durch endliche Stichproben.
Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
427
Diskrete Zufallsvariablen
Varianz bei Lineartransformation
Sei X eine diskrete Zufallsvariable. Dann gilt für Y = a + bX:
Var(Y ) = b 2Var( X ) und σ Y = b σ X .
Analogie in deskriptiver Statistik?
(
) (
Beweis: Var(Y ) = σ Y2 = Var(a + bX ) = E (a + bX − E (a + bX )) = E (a + bX − a − bµ )
(
)
(
2
)
= E b 2 ( X − µ ) = b 2 E ( X − µ ) = b 2Var( X ) = b 2σ X2
2
2
2
)
Varianz der Summe von unabhängigen Zufallsvariablen
Für unabhängige diskrete Zufallsvariablen X und Y bzw. X 1 , X 2 ,K, X n gilt:
Var( X + Y ) = Var( X ) + Var(Y )
und mit beliebigen Konstanten c1 , c2 ,K, cn
Var(c1 X 1 + c2 X 2 + K + cn X n ) = c12Var( X 1 ) + c22Var( X 2 ) + K + cn2Var( X n ) .
Ohne formalen Beweis
Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
428
Diskrete Zufallsvariablen
Übung:
Berechnen Sie die Varianz für X, falls X einer Bernoulli-Verteilung genügt.
Wahrscheinlichkeitsfunktion der Bernoulli-Verteilung
x = 1,
 p,

f ( x ) = P( X = x ) =  1 − p, x = 0,
 0,
sonst

Var ( X ) =
Für welchen Wert von p ist die Varianz von X maximal?
Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
429
Diskrete Zufallsvariablen
Aufgabe 49
Gegeben sei eine diskrete Zufallsvariable X. Dann gilt stets:
R
F
Var ( X ) = 0, falls E ( X ) = 0,
( )
E X 2 ≥ (E ( X )) = µ X2 ,
2
Var ( X + a ) = Var ( X ) für jede beliebige Konstante a,
Var (− X ) = − Var ( X ) .
Aufgabe 50
Gegeben sei die Situation des viermaligen Münzwurfs (vgl. S. 395 und 405).
Die Zufallsvariable X gebe die Anzahl von „Zahl“ an.
R
F
Die Varianz von X ist gleich 2.
Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
430
Diskrete Zufallsvariablen
Aufgabe 51
Für zwei unabhängige diskrete Zufallsvariablen X und Y gilt stets:
R
F
Var ( X − Y ) = Var ( X + Y ) ,
Var ( X − Y ) = Var ( X ) − Var (Y ) ,
Var (2 X + 2Y ) = 4 Var ( X + Y ) .
Aufgabe 52
Seien X 1 , X 2 ,K, X n stochastisch unabhängig und identisch verteilt mit
E ( X i ) = µ und Var ( X i ) = σ 2 für i = 1, ..., n. Dann gilt:
R
F
1 n

E ∑ X i  = µ
 n i =1 
1 n
 σ2
Var  ∑ X i  =
 n i =1  n
Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
431
Diskrete Zufallsvariablen
Spezielle diskrete Verteilungsmodelle
Ziel: Lösung bestimmter Problemstellungen durch parametrische Verteilungen.
Parametrische Verteilung:
Wahrscheinlichkeitsfunktion wird durch einen oder mehrere Parameter bestimmt,
z.B. Bernoulli-Verteilung und Geometrische Verteilung (jeweils einparametrige
Verteilungen mit Parameter p)
Binomialverteilung
Urnenmodell:
Aus einer Urne mit N Kugeln, darunter M schwarze
und N-M weiße Kugeln, werden n Kugeln mit Zurücklegen gezogen.
Die Zufallsvariable X gebe gerade die Anzahl der
schwarzen Kugeln in der Stichprobe an.
Wie sieht die Verteilung von X aus?
Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
432
Diskrete Zufallsvariablen
Realisation könnte z.B. so aussehen:
x=2
Wie groß ist die Wahrscheinlichkeit für dieses Ergebnis?
Wahrscheinlichkeit für Ereignis A = „schwarze Kugel“ ist bei jedem Zug p = M/N = 1/3.
Die Wahrscheinlichkeit für dieses spezielle Ergebnis errechnet sich dann durch
1  1 1  1 4
P ( A ∩ A ∩ A ∩ A ) = P ( A) P ( A ) P ( A ) P ( A ) = ⋅ 1 −  ⋅ ⋅ 1 −  = .
3  3  3  3  81
Allerdings folgt daraus nicht
P( X = 2) = 4 / 81 , da z.B. auch das Ergebnis
{X =2}
A ∩ A ∩ A ∩ A das Ereignis
impliziert.
 4
Nach kombinatorischen Überlegungen (vgl. S. 363) gibt es hier genau   = 6
 2
mögliche Ergebnisse (Elementarereignisse) , die das Ereignis { X = 2 } implizieren.
Damit gilt:
 4  1 
P( X = 2) =   ⋅  
 2  3 
2
2
4 24
 1
⋅ 1 −  = 6 ⋅ =
= 0.2963 .
81 81
 3
Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
433
Diskrete Zufallsvariablen
Binomialverteilung
Eine Zufallsvariable X heißt binomialverteilt mit den Parametern n und p, kurz
X ~ B(n, p), wenn sie die Wahrscheinlichkeitsfunktion


f (x ) = 


 n x
  p (1 − p )n− x , x = 0, 1, K, n
 x
Bedeutung?
0,
sonst
besitzt. Die Verteilung heißt Binomialverteilung oder kurz B(n, p)-Verteilung.
Binomialverteilung und Bernoulli-Verteilung
Die B(1, p)-Verteilung entspricht gerade einer Bernoulli-Verteilung mit Parameter p.
Sind X 1 , X 2 ,K, X n stochastisch unabhängig B(1, p)-verteilt, so ist die Summe
n
X = ∑ Xi
B(n, p)-verteilt.
i =1
Damit folgt unmittelbar:
Sind X ~ B(n, p) und Y ~ B(m, p) unabhängig, so ist X + Y ~ B (n+ m, p).
Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
434
Diskrete Zufallsvariablen
Betrachte nochmals das vorige Urnenmodell.
Das Ereignis A = „schwarze Kugel“ wird nun mit der Zahl 1 kodiert und das Gegenereignis mit 0. Dann ist X bernoulliverteilt mit Parameter p = 1/3, falls nur einmal
gezogen wird. Da nun aber n mal unabhängig (mit Zurücklegen) gezogen wird, entspricht X gerade der Summe von n unabhängigen Bernoulli-Variablen.
x1=0 x2=1 x3=0 x4=1
x = x1 + x2 + x3 + x4 = 2
Erwartungswert und Varianz der Binomialverteilung
a) Falls X ~ B(1, p)-verteilt, so gilt:
E ( X ) = p, Var ( X ) = p (1 − p ) .
b) Falls X ~ B(n, p)-verteilt, so gilt:
E( X ) = n p, Var ( X ) = n p (1 − p ) .
Beweis von a) ist klar (vgl. auch Übung S. 429).
Teil b) folgt aus dem Zusammenhang von Binomial- und Bernoulli-Verteilung.
Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
435
Diskrete Zufallsvariablen
Beispiele :Wahrscheinlichkeitsfunktionen der Binomialverteilung für n = 10
Schief oder symmetrisch?
Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
436
Diskrete Zufallsvariablen
Beispiele :Wahrscheinlichkeitsfunktionen der Binomialverteilung für p = 0.1
Bedeutung?
Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
437
Diskrete Zufallsvariablen
Hypergeometrische Verteilung
Urnenmodell:
Aus einer Urne mit N Kugeln, darunter M schwarze
und N-M weiße Kugeln, werden n Kugeln ohne Zurücklegen gezogen.
Die Zufallsvariable X gebe gerade die Anzahl der
schwarzen Kugeln in der Stichprobe an.
4
5
1
2
6
3
Wie sieht die Verteilung von X aus?
Realisation könnte z.B. so aussehen:
1
6
3
5
x=2
Wie groß ist die Wahrscheinlichkeit für dieses Ergebnis?
Klar: Die Ergebnisse der einzelnen Züge sind nicht mehr unabhängig voneinander.
Weshalb? Was passiert, falls n/N (Auswahlsatz) sehr klein ist?
Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
438
Diskrete Zufallsvariablen
Verteilung von X durch rein kombinatorische Überlegungen ermitteln
Wir beachten folgende „kombinatorischen Fakten“ für das Ziehen
ohne Zurücklegen und ohne Berücksichtigung der Anordnung.
 6
1. Es gibt genau   = 15 Möglichkeiten, 4 Kugeln aus 6 Kugeln zu ziehen.
 4
 2
2. Es gibt genau   = 1
2
 
Möglichkeit, aus den 2 schwarzen Kugeln 2 zu ziehen.
 4
3. Es gibt genau   = 12 Möglichkeiten, aus den 4 weißen Kugeln 2 zu ziehen.
 2
Die Wahrscheinlichkeit aus einer Urne mit 4 weißen und 2 schwarzen Kugeln
in vier Zügen genau 2 schwarze und 2 weiße Kugeln zu ziehen beträgt damit
 2  4
P( X = 2 ) =   ⋅  
 2  2
 6  12
  =
= 0.75 .
4
15
 
Weshalb?
Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
439
Diskrete Zufallsvariablen
Hypergeometrische Verteilung
Eine Zufallsvariable X heißt hypergeometrisch verteilt mit den Parametern n, M
und N, kurz X ~ H(n, M, N), falls sie die Wahrscheinlichkeitsfunktion




f (x ) = 




M N − M 
  

x
n
x
−
 
,
N
 
n
x ∈T
0,
sonst
Bedeutung?
Was soll denn das?
besitzt. Dabei ist T durch T = { max(0, n − ( N − M )), K, min (n, M ) } gegeben.
Es gilt:
E(X ) = n
M
M
, Var ( X ) = n
N
N
 M  N −n
.
1 − 
N  N −1

Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
Interpretation?
Beweis?
440
Diskrete Zufallsvariablen
Poisson-Verteilung
Eine Zufallsvariable X, die zählt, wie oft ein relativ seltenes Ereignis in einem festen,
vorgegebenen Zeitintervall auftritt, kann oft als poissonverteilt angenommen werden.
Ebenso erhält man die Poisson-Verteilung als Grenzverteilung der B(n, p)-Verteilung,
falls p sehr klein und n sehr groß ist (vgl. Seite 443).
Poisson-Verteilung
Eine Zufallsvariable X heißt poissonverteilt mit Parameter λ > 0, kurz X ~ Po(λ),
falls sie die Wahrscheinlichkeitsfunktion
 λx − λ
e , x ∈ { 0, 1, 2, K }

f (x ) =  x !


0,
sonst
Bedeutung?
besitzt. Es gilt: E ( X ) = λ , Var ( X ) = λ .
Sind X ~ Po(λ1) und Y ~ Po(λ2) unabhängig, so ist X + Y ~ Po (λ1+λ2).
Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
441
Diskrete Zufallsvariablen
Beispiele :Wahrscheinlichkeitsfunktionen der Poisson-Verteilung
Bedeutung?
Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
442
Diskrete Zufallsvariablen
Verteilungskonvergenz der Binomialverteilung gegen die Poisson-Verteilung
Sei X binomialverteilt mit Parametern n und p. Für np = λ gilt dann:
 n x
n  λ   λ   λ 
n− x


(
)
(
)
=     1 −  1 − 
P X = x =   p 1− p
 x
 x  n   n   n 
x
n
−x
n ⋅ (n − 1) ⋅K ⋅ (n − x + 1) λx  λ   λ 
=
⋅ ⋅  1 −  1 −  .
x
n
x!  n   n 
−x
n
Damit folgt für festes x und festes λ für n → ∞
n−x+ j
→ 1,
n
1 ≤ j ≤ x,
 λ
1 −  → 1
 n
x
Daraus folgt
P( X = x ) →
Bedeutung?
 λ
−λ
1 −  → e .
 n
n
und
λx
x!
e −λ für n → ∞ .
Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
443
Diskrete Zufallsvariablen
Beispiel: Anzahl von Schadensmeldungen bei einer Sachversicherung
Die Wahrscheinlichkeit für einen Versicherungsfall eines Versicherungsnehmers bei
einer Sachversicherung bezogen auf einen Zeitraum von einem Jahr beträgt p = 0.0001.
Angenommen, die Anzahl der Versicherungsnehmer ist n = 10000. Im Falle von mehr
als 30 Versicherungsfällen wäre das Versicherungsunternehmen ruiniert. Es interessiert
nun die Frage, mit welcher Wahrscheinlichkeit mehr als 30 Versicherungsfälle
eintreten. Zur Vereinfachung sei angenommen, dass die einzelnen Versicherungsfälle
stets unabhängig voneinander eintreten.
Für X = „Anzahl der Versicherungsfälle“ gilt X ~ B(10000, 0.0001). Weshalb?
n
n− x
1 − P( X ≤ 30) = 1 − ∑   p x (1 − p )
x =0  x 
30
Exakte Lösung wäre also:
Probleme?
Da nun p „klein“ und n „groß“, kann X ~ Po(λ) mit λ = np = 1 angenommen werden.
30
Damit gilt:
1 − P( X ≤ 30 ) ≈ 1 − ∑
x =0
λx
x!
e
−λ
30
1 −1
1 30 1
= 1− ∑ e = 1− ∑ ≈ 0
e x =0 x !
x =0 x !
Wann ist p „klein“ und wann ist n „groß“?
Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
444
Diskrete Zufallsvariablen
Diskrete Verteilungen im Überblick
Verteilung
Wahrscheinlichkeitsfunktion
X ~ B(n, p )


f (x ) = 


 n x
  p (1 − p )n − x , x = 0, 1, K, n
 x
0,
sonst
X ~ H (n, M , N )


f (x ) = 


M N − M 
  

 x  n− x 
0,
(n, M, N „sinnvoll“)
N
  , x ∈ T
n
sonst
E(X)
Var(X)
np
np(1 − p )
M
N
siehe
Seite 440
n
X ~ Po(λ )
 λx − λ

f ( x ) =  x ! e , x ∈ { 0, 1, 2, K },

0,
sonst
λ
λ
X ~ G (λ )
 (1 − p )x −1 p, x = 1, 2, K ,
f (x ) = 
0,
sonst

1
p
1− p
p2
(λ > 0)
Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
445
Diskrete Zufallsvariablen
Diskrete Verteilungsmodelle und Approximationsregeln
Anzahl des Eintretens von A in n
Versuchen (n mal Ziehen)
B(n, p)
Modell mit Zurücklegen
unabhängige Wiederholungen
n/N klein
p = M/N
p klein, n groß
np = λ
G(p)
Anzahl der Versuche
bis zum Eintreten
von A
Po(λ)
Anzahl der beobachteten Ereignisse in
einem Zeitintervall
H(n, M, N)
Modell ohne
Zurücklegen
n/N klein,
M/N klein, N groß
nM/N = λ
Approximationsregeln
n/N klein:
< 0.05
p bzw. M/N klein: < 0.05
n bzw. N groß:
Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
> 30
446
Diskrete Zufallsvariablen
Aufgabe 53
Beim Lotto 6 aus 49 (Ziehen ohne Zurücklegen und ohne Berücksichtigung der
Anordnung) ist die Wahrscheinlichkeit
R
F
für 6 gerade Zahlen größer als 2%,
für mindestens 1 Richtige größer als 50%,
für genau 1 Richtige größer als 40%,
für mindestens 3 Richtige größer als 2%,
Aufgabe 54
Ein Versicherungsvertreter schließt mit 5 Kunden, die alle das gleiche Alter
besitzen, Lebensversicherungsverträge ab. Nach der Sterbetafel beträgt die
Wahrscheinlichkeit, die nächsten 30 Jahre zu überleben, für jeden Versicherungsnehmer 0.65. Die Wahrscheinlichkeit dafür, dass nach 30 Jahren
Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
447
Diskrete Zufallsvariablen
R
F
alle Kunden noch leben, ist größer als 0.1,
wenigstens 3 Kunden noch leben, ist größer als 0.8,
genau 2 Kunden noch leben, ist kleiner als 0.2,
höchstens 1 Kunde noch lebt, ist kleiner als 0.05,
Aufgabe 55
Folgende Verteilungsapproximationen sind zulässig:
R
F
H(4, 50, 100)-Verteilung durch B(4, 0.5)-Verteilung,
B(0.03, 100)-Verteilung durch Po(3)-Verteilung,
H(4, 10, 100)-Verteilung durch Po(0.4)-Verteilung.
Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
448
Herunterladen