2 - Universität Rostock

Werbung
Verteilungen eindimensionaler
diskreter Zufallsvariablen
• Einführung
• Diskrete Verteilungen
¾Diskrete Gleichverteilung
¾Bernoulli-Verteilung
¾Binomialverteilung
Prof. Kück / S. Winterfeldt
Lehrstuhl Statistik
1
Zufallsvariablen II
Bibliografie:
¾ Prof. Dr. Kück
Universität Rostock
Statistik, Vorlesungsskript, Abschnitt 5.2
¾ Bleymüller / Gehlert
Verlag Vahlen 2003
Statistische Formeln, Tabellen und Programme
¾ Bleymüller / Gehlert / Gülicher
Verlag Vahlen 2004
Statistik für Wirtschaftswissenschaftler
¾ Hartung
Oldenbourg Verlag 2002
Statistik
Prof. Kück / S. Winterfeldt
Lehrstuhl Statistik
2
Zufallsvariablen II
1
Einführung
Die Verteilungen der Zufallsvariablen sind grundsätzlich als
Wahrscheinlichkeitsverteilungen aufzufassen. Alle Werte,
die eine Zufallsvariable X annehmen kann, bilden zusammen
mit ihren Wahrscheinlichkeiten W die Wahrscheinlichkeitsverteilung (das Verteilungsgesetz) der Zufallsvariablen.
Notation: X:
W:
x1, x2, ..., xi
W(X=x1), W(X=x2), ..., W(X=xi)
Kann die diskrete Zufallsvariable endlich
viele (n viele) Werte annehmen, so gilt:
n
∑W(X = x ) = 1
i =1
Kann die Zufallsvariable unendlich
viele (∞ viele) Werte annehmen, so gilt:
i
∞
∑W(X = x ) = 1
i =1
Prof. Kück / S. Winterfeldt
Lehrstuhl Statistik
(i=1, 2, ...)
(i=1, 2, ...)
i
3
Zufallsvariablen II
Einführung
Die Verteilung der Wahrscheinlichkeiten wird mit Hilfe der
Wahrscheinlichkeitsfunktion dargestellt:
f(xi) = W(X=xi), wobei: f(xi)≥0 und Σf(xi)=1.
⇒ Es besteht eine Analogie zur Häufigkeitsverteilung und ihrer Beschreibung durch Häufigkeits- und Verteilungsfunktion (vgl. Abschnitt 4).
¾ Die Wahrscheinlichkeitsfunktion einer diskreten
Zufallsvariablen ordnet jeder möglichen Realisation die
Wahrscheinlichkeit ihres Auftretens zu.
¾ Handelt es sich bei der Wahrscheinlichkeitsfunktion wirklich
um eine mathematische Funktion (=>eine Formel!), so erhält
sie dadurch einen eigenständigen analytischen Gehalt.
¾ Grafisch dargestellt wird die Wahrscheinlichkeitsfunktion
einer diskreten Zufallsvariablen durch ein Stabdiagramm.
Prof. Kück / S. Winterfeldt
Lehrstuhl Statistik
4
Zufallsvariablen II
2
Einführung
Ist die Zahl der Ausprägungen einer diskreten
Zufallsvariablen groß, so rücken die einzelnen
Stäbchen enger zusammen, das Stabdiagramm
nähert sich dann dem Bild einer Fläche unter einer
stetigen Kurve an und kann auch gut durch eine
solche approximiert werden:
Prof. Kück / S. Winterfeldt
Lehrstuhl Statistik
5
Zufallsvariablen II
Einführung
Die Verteilungsfunktion der Wahrscheinlichkeitsverteilung ist bei einer diskreten Zufallsvariablen die
Summenfunktion (Wahrscheinlichkeitssumme)
der Wahrscheinlichkeitsfunktion. Sie gibt die
Wahrscheinlichkeit dafür an, dass die Zufallsvariable
X höchstens den Wert x annimmt. Es ist:
F(x) = W(X ≤ x)
Aus der Wahrscheinlichkeitsfunktion lässt sich
folgende Beziehung ableiten:
F(x) = W(X ≤ x) =
∑ f (x )
x i ≤x
Prof. Kück / S. Winterfeldt
Lehrstuhl Statistik
i
6
Zufallsvariablen II
3
Einführung
T reppenkurv e (am Beispiel einer
Binomialv erteilung mit n=1 0
Versuchen)
W(X<=x)
Die grafische
Darstellung
der Verteilungsfunktion einer
diskreten
Zufallsvariablen
liefert eine
Treppenkurve:
1 ,2
1
0 ,8
0 ,6
0 ,4
0 ,2
0
0
1
2
3
4
5
6
7
8
9
10 11
x
Prof. Kück / S. Winterfeldt
Lehrstuhl Statistik
7
Zufallsvariablen II
Einführung
Fragt man nach der Wahrscheinlichkeit, dass die
Zufallsvariable einen Wert in einem Intervall [a,b]
annimmt, so ist:
W (a ≤ X ≤ b ) =
∑ f (x )
a≤ xi ≤b
i
Intervalle werden danach unterschieden, ob die
Intervallgrenzen zum Intervall gehören oder nicht.
Eine Übersicht gebräuchlicher Intervallangaben, ihrer Symbolik und ihrer verbalen
Beschreibung findet sich in der folgenden Tabelle:
Prof. Kück / S. Winterfeldt
Lehrstuhl Statistik
8
Zufallsvariablen II
4
Einführung
Symbolik x liegt im Mathematische
für das
Intervall, Bezeichnung des
Intervall wenn
Intervalls
Umgangssprachliche
Beschreibung
[ a, b ]
a≤ x≤ b
abgeschlossen
mind. a und höchstens b
[ a, b [
a≤ x<b
halboffen
mindestens a und kleiner b
] a, b ]
a<x≤ b
halboffen
größer a und höchstens b
] a, b [
a<x<b
offen
größer a und kleiner b
[ a, ∞ [
x≥a
nach oben unbeschränkt
mindestens a
] a, ∞ [
x>a
nach oben unbeschränkt
größer a
] -∞, b ]
x≤b
nach unten unbeschränkt
höchstens b
] -∞, b [
x<b
nach unten unbeschränkt
kleiner b
Prof. Kück / S. Winterfeldt
Lehrstuhl Statistik
9
Zufallsvariablen II
Einführung
Erwartungswert
Wahrscheinlichkeitsverteilungen von Zufallsvariablen werden durch Maßzahlen/ Parameter
charakterisiert. Der Erwartungswert E(X)
charakterisiert als sogenannter Lokationsparameter
das mittlere Niveau der Merkmalsausprägungen. Für
eine diskrete Zufallsvariable ist er definiert als:
E(X) = ∑ xi ⋅ W(X = xi ) =∑ xi ⋅ f (xi )
i
Prof. Kück / S. Winterfeldt
Lehrstuhl Statistik
i
10
Zufallsvariablen II
5
Einführung
Varianz
Als Streuungsparameter findet die Varianz Var(X)
Verwendung. Die Streuung einer Verteilung gibt an, wie stark
Merkmalsausprägungen vom Erwartungswert abweichen. Die
Varianz ist der Erwartungswert des Abweichungsquadrates
einer Zufallsvariablen und wird definiert durch:
Var(X) = E[(X-E(X))²] = E(X²)-[E(X)]²
Durch Einsetzen erhält man:
⎡
⎤
2
2
Var( X) = ∑ [x i − E( X)] ⋅ f (x i ) = ⎢∑ x i2 ⋅ f (x i )⎥ − [E( X)]
i
⎣ i
⎦
Prof. Kück / S. Winterfeldt
Lehrstuhl Statistik
11
Zufallsvariablen II
Diskrete Verteilungen
Wir werden uns nun mit einigen diskreten
Verteilungen befassen und diese in folgender
Reihenfolge darstellen:
Diskrete Gleichverteilung
Bernoulli-Verteilung
Binomialverteilung
Hypergeometrische Verteilung
Poissonverteilung
Prof. Kück / S. Winterfeldt
Lehrstuhl Statistik
12
Zufallsvariablen II
6
Diskrete Gleichverteilung
Ein Versuch hat n mögliche gleichwahrscheinliche
Versuchsergebnisse x1, ..., xn mit x1<...<xn.
Wahrscheinlichkeitsfunktion:
f(xi) = W(X=xi) = 1/n
für i=1, ..., n
Verteilungsfunktion:
⎧ 0 für
x < x1
⎪
F(x) = W(X ≤ x) = ⎨j / n für x j ≤ x < x j+1 mit j = 1,...,n − 1
⎪ 1 für
x ≥ xn
⎩
Prof. Kück / S. Winterfeldt
Lehrstuhl Statistik
13
Zufallsvariablen II
Diskrete Gleichverteilung
Erwartungswert:
n
n
E( X ) = ∑ x i ⋅ f (x i ) = ⋅ ∑ x i
1
n
i =1
i =1
Varianz:
n
⎛
⎞
Var ( X) = E( X ) − [E( X) ] = ⋅ ∑ x − ⎜ n1 ⋅ ∑ x i ⎟
i =1
⎝ i =1 ⎠
2
Prof. Kück / S. Winterfeldt
Lehrstuhl Statistik
2
n
1
n
2
2
i
14
Zufallsvariablen II
7
Diskrete Gleichverteilung
Beispiel:
Würfel mit den Augenzahlen 1, 2, 3, 4, 5, 6
X
einmaliges Würfeln
xi=i
für i = 1, ..., 6
Augenzahl
f(xi)=1/6
für i = 1, ..., 6
Wahrscheinlichkeit, i Augen zu würfeln
⎧ 0 für
⎪
Verteilungsfunktion: F( X) = ⎨ j / 6 für
⎪ 1 für
⎩
x<1
j ≤ x < j + 1 mit
x≥6
Erwartungswert:
E(X)
Varianz:
Var(X) = (12+22+32+42+52+62)/6 – 3,52
= 91/6 - 12,25
≈ 2,92
Prof. Kück / S. Winterfeldt
Lehrstuhl Statistik
= (1+2+3+4+5+6)/6
j = 1,...,5
= 3,5
15
Zufallsvariablen II
Diskrete Gleichverteilung
Grafische Darstellungen:
Wahrscheinlichkeitsfunktion
f(x)
0,18
1/6
1/6
1/6
1/6
1/6
Verteilungsfunktion
1/6
1,2
F(x)
0,15
1
0,12
0,8
0,09
0,6
0,06
0,4
0,03
0,2
0,00
1
2
3
4
5
0
0
6
x
Prof. Kück / S. Winterfeldt
Lehrstuhl Statistik
1
2
3
4
5
6
7
x
16
Zufallsvariablen II
8
Bernoulli-Verteilung
Es wird ein Versuch mit den möglichen Versuchsergebnissen A und
Ā durchgeführt. Als Wahrscheinlichkeit für das Eintreten von A
wird W(A) = θ festgelegt. Damit ist W(Ā) = 1-θ.
Die Zufallsgröße X, die durch die Zahl des Eintretens von A in
einem Versuch gekennzeichnet ist, kann als Realisierungen die
Werte 0 und 1 annehmen (=>Null-Eins-Verteilung).
Wahrscheinlichkeitsfunktion:
Verteilungsfunktion:
Prof. Kück / S. Winterfeldt
Lehrstuhl Statistik
⎧ θ
f (x) = W (X = x) = ⎨
⎩1 − θ
für
für
⎧ 0
⎪
F (x ) = ⎨1 − θ
⎪ 1
⎩
x < 0
0 ≤ x < 1
x ≥ 1
für
für
für
x=1
x=0
17
Zufallsvariablen II
Bernoulli-Verteilung
Erwartungswert:
Varianz:
E(X) = 0·(1-θ)+1·θ = θ
Var(X) = E(X2)-[E(X)]2 = 02·(1-θ)+12·θ-θ2
= θ-θ2 = θ·(1- θ)
Für θ=0,5 ist die Bernoulli-Verteilung mit der diskreten
Gleichverteilung mit n=2, x1=0 und x2=1 identisch.
Eine Bernoulli-Verteilung liegt u.a. für folgende Sachverhalte vor:
• einmaliges Werfen einer präparierten Münze (Zahl oder Wappen)
• Geschlecht einer zufällig ausgewählten Person
• Funktionsfähigkeit einer zufällig ausgewählten Energiesparlampe
Prof. Kück / S. Winterfeldt
Lehrstuhl Statistik
18
Zufallsvariablen II
9
Bernoulli-Verteilung
Beispiel:
Bei der Auslosung der Halbfinale eines DFB-Pokals mit den
Mannschaften M, N, O und P wird M als Heimmannschaft des
ersten Spiels gezogen. Das Ereignis A sei die Auslosung der
Mannschaft P als Spielgegner von M mit W(A)=1/3. X sei die
Zufallsgröße für die Zahl der erfolgreichen Versuche bei obigem
Vorgehen mit den möglichen Realisationen x1=0 und x2=1. Die
Werte der Wahrscheinlichkeitsfunktion sind f(0)=2/3 und
f(1)=1/3.
⎧ 0 für
⎪
F(X) = ⎨2/3 für
⎪ 1 für
⎩
Verteilungsfunktion:
Erwartungswert:
Varianz:
x<0
0 ≤ x <1
x ≥1
E(X) = 1/3
Var(X) = 1/3 · 2/3 = 2/9
Prof. Kück / S. Winterfeldt
Lehrstuhl Statistik
19
Zufallsvariablen II
Bernoulli-Verteilung
Grafische Darstellungen:
Wahrscheinlichkeitsfunktion
Verteilungsfunktion
1 1/3
1 1/3
F(x)
f(x)
1
1
2/3
2/3
1/3
1/3
0
0
-0,5
0
0,5
1
1,5
x
Prof. Kück / S. Winterfeldt
Lehrstuhl Statistik
-0,5
0
0,5
1
1,5
x
20
Zufallsvariablen II
10
Binomialverteilung
Es werden n Versuche (Bernoulli-Experimente) mit den möglichen Versuchsergebnissen A und Ā durchgeführt (dichotome
Merkmale). In jedem Versuch ist W(A) = θ gleich, das ist zum Beispiel beim Ziehen von Kugeln aus einer Urne durch Zurücklegen
erreichbar. f(x) = W(X=x) ist die Wahrscheinlichkeit für das x-ma⎛n⎞
lige Eintreten von A bei n Versuchen. Es gibt ⎜⎜⎝ x ⎟⎟⎠ Versuchsserien
aus n Versuchen, in denen A x-mal eintritt. In einer Versuchsserie
aus n Versuchen ergibt sich die Wahrscheinlichkeit für das x-malige Eintreten von A durch θx•(1-θ)n-x (entsprechend Multiplikationssatz).
Wahrscheinlichkeitsfunktion:
⎛n⎞
f B ( x ) = ⎜⎜ ⎟⎟ ⋅ θ x ⋅ (1 − θ ) n − x für
⎝x⎠
Prof. Kück / S. Winterfeldt
Lehrstuhl Statistik
x = 0 ,..., n
21
Zufallsvariablen II
Binomialverteilung
Verteilungsfunktion:
0
für
x<0
⎧
⎪⎪ j ⎛ n⎞ ν
FB (x) = ⎨∑⎜⎜ ⎟⎟ ⋅ θ ⋅ (1 − θ)n−ν für j ≤ x < j + 1 mit j = 0,...,n − 1
⎪ν=0 ⎝ ν ⎠
⎪⎩
1
für
x≥n
Erwartungswert:
E(X) = n·θ
Varianz:
Var(X) = n·θ·(1- θ)
Prof. Kück / S. Winterfeldt
Lehrstuhl Statistik
22
Zufallsvariablen II
11
Binomialverteilung
¾ Eine Binomialverteilung mit n = 1 Versuch ist eine
Bernoulli-Verteilung.
¾ Grundmodell der Binomialverteilung ist das Ziehen von
Kugeln aus einer Urne mit schwarzen und weißen
Kugeln mit Zurücklegen.
¾ Rechenregeln zur Berechnung von
Binomialkoeffizienten und eine Wertetabelle findet
man in der Formelsammlung (Bleymüller/ Gehlert).
¾ Für einige ausgewählte θ-Werte und n-Werte sind auch
die Wahrscheinlichkeits- und Verteilungsfunktion der
Binomialverteilung tabelliert (Bleymüller/ Gehlert).
Prof. Kück / S. Winterfeldt
Lehrstuhl Statistik
23
Zufallsvariablen II
Binomialverteilung
Beispiel:
Mit 5 Würfeln mit der Augenzahl 1, 2, ..., 6 wird
gleichzeitig gewürfelt. Gesucht sind die Wahrscheinlichkeitsfunktion und die Verteilungsfunktion für die
Anzahl der Sechsen (n=5; θ=1/6).
Man erhält folgende Werte dieser Funktionen:
x
0
fB(x)
0,40188 0,40188 0,16075
FB(x)
0,40188 0,80376 0,96451 0,99666 0,99987 1,00000
Prof. Kück / S. Winterfeldt
Lehrstuhl Statistik
1
2
3
4
5
0,03215 0,00321 0,00013
24
Zufallsvariablen II
12
Binomialverteilung
Grafische Darstellungen:
Wahrscheinlichkeitsfunktion
Verteilungsfunktion
1,2
F(x)
0,5
f(x)
1
0,4
0,8
0,3
0,6
0,2
0,4
0,1
0,2
0
0
-1
0
1
2
3
4
5
-1
6
0
1
2
x
Prof. Kück / S. Winterfeldt
Lehrstuhl Statistik
3
4
5
6
x
25
Zufallsvariablen II
Binomialverteilung
Beispiel:
Das demografische Maß der Sexualproportion
bezeichnet den Quotienten aus männlichen und
weiblichen Geburten (SP=GM/GW). In Deutschland
beträgt die Sexualproportion etwa 1,06. Berechnen Sie
a) den Anteil männlicher Geburten an allen Geburten und
b) die Wahrscheinlichkeits- und Verteilungsfunktion für
die Anzahl der Söhne in einer Familie mit drei Kindern.
Lösung:
a)
GM
θ=
GM
=
GM + G W
Prof. Kück / S. Winterfeldt
Lehrstuhl Statistik
GW
GM
GW
+ GG WW
=
SP
1,06
=
= 0,5146
SP + 1 1,06 + 1
26
Zufallsvariablen II
13
Binomialverteilung
Lösung (Fortsetzung):
b) Wahrscheinlichkeitsfunktion:
⎛ 3⎞
f B ( x ) = ⎜⎜ ⎟⎟ ⋅ 0,5146 x ⋅ (0,4854)3 − x für x = 0,...,3
⎝ x⎠
Verteilungsfunktion:
0
⎧
⎪⎪ j ⎛ 3 ⎞
FB ( x ) = ⎨∑ ⎜⎜ ⎟⎟ ⋅ 0,5146 ν ⋅ 0,4854 3− ν
⎪ ν =0 ⎝ ν ⎠
1
⎩⎪
x<0
für
j ≤ x < j + 1 mit
für
j = 0,1,2
x≥3
für
x
0
1
2
3
fB(x)
0,11437
0,36374
0,38562
0,13627
FB(x)
0,11437
0,47811
0,86373
1,00000
Prof. Kück / S. Winterfeldt
Lehrstuhl Statistik
27
Zufallsvariablen II
Binomialverteilung
Die grafische Darstellung der Wahrscheinlichkeitsfunktion zeigt u.a.,
dass die Wahrscheinlichkeit, drei Söhne zu haben, sichtbar größer ist als
die Wahrscheinlichkeit, drei Töchter zu haben:
Wahrscheinlichkeitsfunktion
Verteilungsfunktion
1,2
F(x) 1
0,5
f(x)
0,36374
0,4
0,8
0,385621
0,3
0,6
0,2
0,4
0,136273
0,114367
0,2
0,1
0
0
-1
0
1
2
3
4
x
Prof. Kück / S. Winterfeldt
Lehrstuhl Statistik
-1
0
1
2
3
4
x
28
Zufallsvariablen II
14
Herunterladen