3. Spezielle diskrete Wahrscheinlichkeitsmodelle

Werbung
Lehrstuhl für Empirische Wirtschaftsforschung und Ökonometrie
Dr. Roland Füss ● Statistik II: Schließende Statistik ● SS 2007
3. Spezielle diskrete Wahrscheinlichkeitsmodelle
3.1 Gleichverteilung
• Gleichverteilung: Bei der Gleichverteilung hat jedes Ereignis die gleiche Eintrittswahrscheinlichkeit:
Wahrscheinlichkeitsfunktion:
Verteilungsfunktion:
f (x i ) =
1
für i = 1,2,..., n
n
⎧0 , x < x1
⎪i
⎪
F ( xi ) = ⎨
, xi ≤ x ≤ xi +1
n
⎪
⎪⎩1 , xn ≤ x
1
Lehrstuhl für Empirische Wirtschaftsforschung und Ökonometrie
Dr. Roland Füss ● Statistik II: Schließende Statistik ● SS 2007
• z.B. Würfel:
3.2 Bernoulliverteilung
Bernoulliverteilung: Bei einem Bernoulliexperiment können nur die Ereignisse A
und
A
mit den Wahrscheinlichkeiten
P ( A) = p und
P(A ) = 1 − P( A) = 1 − p = q
eintreffen. Dem Eintreffen der Ereignisse A und A werden oft die Werte 0 und 1
zugeordnet (z.B. Stück ist defekt, oder nicht defekt mit den Wahrscheinlichkeiten p
= 0,4 und q = 0,6):
2
Lehrstuhl für Empirische Wirtschaftsforschung und Ökonometrie
Dr. Roland Füss ● Statistik II: Schließende Statistik ● SS 2007
3.3 Binomialverteilung
• Wird das Bernoulli Experiment n mal wiederholt und sucht man die Wahrscheinlichkeit, dass das Ereignis A mit P ( A ) = p x mal vorkommt, so ist die
Zufallsvariable X binomialverteilt mit den Parametern n und p: X ~ B (x n; p ) ,
x
d.h. x-mal soll das Ereignis A eintreffen: P(x − mal A) = P( A)P( A)...P( A) = P( A) = p
x
3
Lehrstuhl für Empirische Wirtschaftsforschung und Ökonometrie
Dr. Roland Füss ● Statistik II: Schließende Statistik ● SS 2007
und die restlichen n-x mal das andere Ereignis A :
P((n − x ) − mal A ) = P(A )P(A )....P(A ) = P (A )
n− x
= (1 − p )
• bei n unabhängigen Wiederholungen gibt es
⎛n⎞
⎜⎜ ⎟⎟
⎝ x⎠
n− x
mögliche Anordnungen bei denen
das Ereignis A x-mal auftritt. Die Wahrscheinlichkeitsfunktion berechnet sich dann
als:
⎛ n⎞
n− x
f ( x ) = ⎜⎜ ⎟⎟ p x (1 − p )
⎝ x⎠
⎧0 , x < 0
⎪int ( x )
⎪ ⎛ n⎞
n−k
F (x ) = ⎨ ∑ ⎜⎜ ⎟⎟ p k (1 − p ) , 0 ≤ x ≤ n
• Die Verteilungsfunktion ist dann:
⎪ k =0 ⎝ k ⎠
⎪⎩1 , 1 ≤ n
4
Lehrstuhl für Empirische Wirtschaftsforschung und Ökonometrie
Dr. Roland Füss ● Statistik II: Schließende Statistik ● SS 2007
• Da p < 0,5 ist, weist die Verteilung eine positive Schiefe auf. Falls p > 0,5 besitzt
die Verteilung eine negative Schiefe.
• Erwartungswert: Hat die Zufallsvariable die beiden möglichen Werte 1 (Ereignis A
tritt ein) und 0 (Ereignis A tritt nicht ein), so ist der Erwartungswert der i-ten
5
Lehrstuhl für Empirische Wirtschaftsforschung und Ökonometrie
Dr. Roland Füss ● Statistik II: Schließende Statistik ● SS 2007
Ausprägung von X gegeben durch: E (x i ) = 1 ⋅ p + 0 ⋅ (1 − p ) = p . Die Zufallsvariable X
n
erhält man dann durch Addition der einzelnen x i : X = ∑ xi
i =1
⎛ n ⎞ n
Dadurch ist der Erwartungswert von: E ( X ) = E ⎜ ∑ xi ⎟ = ∑ E ( xi ) = n ⋅ p
⎝ i =1 ⎠ i =1
• Varianz: Die Varianz der i-ten Ausprägung von X ist:
2
σ = ∑ (xi − E (xi ))2 ⋅ f (xi ) = (1 − p )2 p + (0 − p )2 (1 − p ) was nach etwas Umformen p (1 − p )
2
i
i =1
ergibt. Für die Varianz von X ergibt sich dann σ 2 = n ⋅ p(1 − p )
⎛ n ⎞ x n− x n ⎛ n ⎞ t x n− x
• Momenterzeugende Funktion: MEF (t ) = ∑ e ⎜⎜ x ⎟⎟ p q = ∑ ⎜⎜ x ⎟⎟( pe ) q .
x =0
x =0 ⎝ ⎠
⎝ ⎠
n
xt
Unter Berücksichtigung der binomischen Formel kann man auch schreiben:
6
Lehrstuhl für Empirische Wirtschaftsforschung und Ökonometrie
Dr. Roland Füss ● Statistik II: Schließende Statistik ● SS 2007
n
⎛ n ⎞ x n− x
⎛ n ⎞ t x n− x
t
n
⎟
⎜
⎜⎜ ⎟⎟ pe q
a
b
pe
q
a
b
(
)
(
+
)
=
+
=
∑
Allg.:
und im konkreten Fall:
⎜ x⎟
x =0 ⎝ x ⎠
⎝ ⎠
( )
n
• MEF ' (t ) = n( pet + q ) pet
n −1
• MEF ' ' (t ) = n(n − 1)( pet + q )
n−2
pe t pe t + n( pe t + q )
n −1
pe t
• Reproduktivitätseigenschaft: Besteht eine Zufallsvariable Z aus zwei (oder
mehreren) stochastisch unabhängigen Zufallsvariablen X und Y die beide dieselbe
Wahrscheinlichkeit p haben, X ~ B(n, p ) und Y ~ B(m, p ) , dann ist Z auch
binomialverteilt mit Z ~ B(n + m, p ) .
• Rekursionsformel: Hat man die Wahrscheinlichkeit f ( x ) für ein bestimmtes x
schon berechnet, kann man die Wahrscheinlichkeiten für x+1 relativ einfach mit der
7
Lehrstuhl für Empirische Wirtschaftsforschung und Ökonometrie
Dr. Roland Füss ● Statistik II: Schließende Statistik ● SS 2007
Rekursionsformel berechnen:
⎛ n ⎞
⎜⎜
⎟⎟
⎝ x + 1⎠
⎛ n⎞
⎜⎜ ⎟⎟
⎝ x⎠
⎛ n ⎞ x +1 n − x −1
⎜
⎟p q
f ( x + 1) ⎜⎝ x + 1⎟⎠
=
=
f (x )
⎛ n ⎞ x n− x
⎜⎜ ⎟⎟ p q
⎝ x⎠
⎛ n ⎞
⎜⎜
⎟⎟ p
1
+
x
⎝
⎠
⎛n⎞
⎜⎜ ⎟⎟ q
⎝ x⎠
. Nach Kürzen geht
in (n − x ) über. Damit lautet die Wahrscheinlichkeit für x+1:
(x + 1)
f ( x + 1) =
(n − x ) p ⋅ f (x )
(x + 1)q
• Die Binomialverteilung darf nur beim Fall „mit Zurücklegen“ angewendet
werden, also nur dann, wenn die Wahrscheinlichkeiten p immer gleich bleiben
oder aber, wenn die Änderung der Wahrscheinlichkeiten hinreichend klein ist
(n / N ) < 0,05 .
8
Lehrstuhl für Empirische Wirtschaftsforschung und Ökonometrie
Dr. Roland Füss ● Statistik II: Schließende Statistik ● SS 2007
3.4 Hypergeometrische Verteilung
• Hypergeometrische Verteilung: Ähnliche Situation wie bei der Binomialverteilung, nur dass die Kugeln jetzt nicht zurückgelegt werden und sich so die
Wahrscheinlichkeiten bei jeder weiteren Ziehung verändern.
Bezeichnungen und Bsp.:
N = Anzahl der Elemente in der Grundgesamtheit (weiße und schwarze Kugeln)
M = Anzahl der Elemente mit einem bestimmten alternativen Merkmal (z.B. weiße
Kugeln).
n = Anzahl der Elemente der Stichprobe (ohne Zurücklegen).
x = Anzahl der Ereignisträger in der Stichprobe (wie viele weiße Kugeln wurden
gezogen).
9
Lehrstuhl für Empirische Wirtschaftsforschung und Ökonometrie
Dr. Roland Füss ● Statistik II: Schließende Statistik ● SS 2007
• Beim ersten Ziehen beträgt die Wahrscheinlichkeit für das Ziehen einer weißen
M
Kugel noch p = N , verändert sich aber von da an für jedes weitere Ziehen so
dass die Binomialverteilung nicht angewendet werden darf.
⎛M ⎞
• Aus insgesamt M weißen Kugeln können x weiße Kugeln auf ⎜⎜ x ⎟⎟ Arten
⎝ ⎠
gezogen werden.
• Die übrigen n − x schwarze Kugeln können dann aus insgesamt N-M schwarzen
Kugeln auf
⎛N −M ⎞
⎜⎜
⎟⎟
⎝ n−x ⎠
Arten gezogen werden.
1
• Da jede Ergebnisfolge mit der Wahrscheinlichkeit ⎛ N ⎞ eintritt, ergibt sich:
⎜⎜ ⎟⎟
⎝n⎠
10
Lehrstuhl für Empirische Wirtschaftsforschung und Ökonometrie
Dr. Roland Füss ● Statistik II: Schließende Statistik ● SS 2007
• Wahrscheinlichkeitsfunktion:
⎛M ⎞ ⎛N − M ⎞
⎟
⎜ ⎟⋅⎜
⎜ x⎟ ⎜ n − x⎟
⎝ ⎠ ⎝
⎠
f ( x )=
⎛N⎞
⎜ ⎟
⎜ n⎟
⎝ ⎠
Die Hypergeometrische Verteilung hängt von den 3 Parametern N, M und n ab.
Die Bezeichnung für die Zufallsvariable X ist dann: X ~ H ( x | n ; M ; N )
• Verteilungsfunktion:
⎛M ⎞ ⎛N − M ⎞
⎟
⎜ ⎟⋅⎜
⎟ ⎜ n − k⎟
int ( x ) ⎜
k
⎝ ⎠ ⎝
⎠
F( x ) = ∑
⎛N⎞
k =a
⎜ ⎟
⎜ n⎟
⎝ ⎠
M
• Erwartungswert: μ = n ⋅ N = np
11
Lehrstuhl für Empirische Wirtschaftsforschung und Ökonometrie
Dr. Roland Füss ● Statistik II: Schließende Statistik ● SS 2007
2
• Varianz: σ =
(N − n ) ⋅ n
N −1
⋅
N −n
M ⎛ M⎞
⋅ ⎜1 − ⎟ = np (1 − p )
.
N −1
N⎠
N ⎝
Bis auf den Term
N −n
N −1
stimmt die Varianz mit der Varianz der Binomialverteilung überein. Dieser
Term ist daher der Korrekturfaktor für endliche Gesamtheiten.
12
Lehrstuhl für Empirische Wirtschaftsforschung und Ökonometrie
Dr. Roland Füss ● Statistik II: Schließende Statistik ● SS 2007
• Rekursionsformel:
f ( x + 1| n ; M ; N ) =
(n − x ) ⋅ (M − x )
⋅ f ( x | n ; M; N )
(x + 1) ⋅ (N − M − n + x +1)
Die Rekursionsformel ist nur bedingt empfehlenswert, da sie ähnlich aufwendig
wie eine neue Berechnung für den Fall x+1 ist.
3.5 Geometrische Verteilung
• Geometrische Verteilung: Ein Bernoulli Experiment wird beliebig oft wiederholt.
Gesucht ist die Zufallsvariable X, die angibt, wie oft das Zufallsexperiment
wiederholt werden muss bis zum ersten Mal das Ereignis A auftritt.
• Wahrscheinlichkeitsfunktion: Die Wahrscheinlichkeit, dass beim x-ten Versuchen
zum ersten Mal A auftritt berechnet sich als:
P (([x − 1] − mal A ) ∩ A) = P (A )
x −1
P( A) = p(1 − p )
x −1
13
Lehrstuhl für Empirische Wirtschaftsforschung und Ökonometrie
Dr. Roland Füss ● Statistik II: Schließende Statistik ● SS 2007
Manchmal definiert man X auch als die Anzahl der Misserfolge, bis zum ersten Mal A
x
auftritt. Dann lautet die Wahrscheinlichkeitsfunktion: f (x ) = p(1 − p )
x
k −1
• Verteilungsfunktion: Fg (x ) = ∑ p ⋅ q (1. Erfolg)
k =1
Fg (x ) = 1 − (1 − p )
int [ x ]
= 1 − q x +1 (Anzahl Mißerfolge)
1− p
1
• Erwartungswert: E ( X ) = p (1. Erfolg) und E ( X ) = p
(Anzahl Mißerfolge)
1− p
• Varianz: p 2
t
t
• MEF (t ) = ∑ e pq = p ∑ (e q ) = 1 − e t q = p ⋅ (1 − e q )
x =0
x =0
∞
∞
xt
x
x
• MEF ' (t ) = − p ⋅ (1 − e q ) ⋅ (− e q ) = p
t
−2
t
p
−1
et q
(1 − e q )
t
2
14
Lehrstuhl für Empirische Wirtschaftsforschung und Ökonometrie
Dr. Roland Füss ● Statistik II: Schließende Statistik ● SS 2007
(
)
⎡ e t (− 2) − e t q
⎤
et
+
3
2⎥
• MEF ' ' (t ) = pq ⎢
t
t
1 − e q ⎥⎦
⎣⎢ 1 − e q
(
)
(
)
• Je grösser p ist desto schneller konvergiert f (x ) gegen 0 und F ( x ) gegen 1.
15
Lehrstuhl für Empirische Wirtschaftsforschung und Ökonometrie
Dr. Roland Füss ● Statistik II: Schließende Statistik ● SS 2007
3.6. Negative Binomialverteilung
• Negative Binomialverteilung: Ähnlich wie bei der geometrischen Verteilung
wird jetzt nach der Zufallsvariablen X gesucht, die angibt, wie oft man das
Bernoulli Experiment wiederholen muss bis das Ereignis A genau r mal
eingetreten ist.
• X= 0 bedeutet, dass bei jedem der r Durchführungen das Ereignis A eingetreten ist
• X= 1 bedeutet, dass der r-te Erfolg nach der (r+1)-ten Durchführungen eintritt.
• Bevor der r-te Erfolg eintritt müssen in (x + r − 1) Durchführungen bereits r-1
Erfolge realisiert worden sein. Bei der letzten (also bei der (x + r ) -ten)
Wiederholung beträgt die Wahrscheinlichkeit des Eintretens von A (= Erfolg)
P ( A) = p . Daraus ergibt sich die:
⎛ x + r − 1⎞
x
r
• Wahrscheinlichkeitsfunktion: f (x ) = ⎜⎜ r − 1 ⎟⎟ p (1 − p ) mit (r −1) = x
⎝
⎠
16
Lehrstuhl für Empirische Wirtschaftsforschung und Ökonometrie
Dr. Roland Füss ● Statistik II: Schließende Statistik ● SS 2007
Die Verteilung der Zufallsvariable X bezeichnet man kompakt als:
X ~ NB (r , p )
• Verteilungsfunktion: F (x ) =
int ( x )
⎛ k + r − 1⎞ r
k
⎟⎟ p (1 − p )
k =0 ⎝ r − 1 ⎠
∑ ⎜⎜
17
Lehrstuhl für Empirische Wirtschaftsforschung und Ökonometrie
Dr. Roland Füss ● Statistik II: Schließende Statistik ● SS 2007
• Erwartungswert: E (x ) = μ =
2
• Varianz: σ =
r (1 − p )
p
r (1 − p )
p2
• Rekursionsformel: Die Formel lässt sich ähnlich herleiten wie für den Fall der
Binomialverteilung: f (x + 1) = (1 − p )
x+r
f ( x ) mit f (x = 0) = p r
x +1
• Die Geometrische Verteilung ergibt sich als Spezialfall mir r =1.
3.7 Poissonverteilung
•
Poissonverteilung: Grenzverteilung der Binomialverteilung wenn p sehr klein (z.B.
p
λ
≤
0,1) und wenn n sehr gross ist (z.B. n
konstant: p =
λ
n
≥
100). Dabei bleibt der Erwartungswert
→ λ = pn .
18
Lehrstuhl für Empirische Wirtschaftsforschung und Ökonometrie
Dr. Roland Füss ● Statistik II: Schließende Statistik ● SS 2007
• Herleitung der Poissonverteilung aus der Binomialverteilung bei n → ∞ :
⎛ n ⎞⎛ λ ⎞ ⎛ λ ⎞
f ( x ) = ⎜⎜ ⎟⎟⎜ ⎟ ⎜1 − ⎟
n⎠
⎝ x ⎠⎝ n ⎠ ⎝
x
n− x
λ
wobei p durch n ersetzt wird.
1 x⎛ λ ⎞ ⎛ λ ⎞
n!
=
λ ⎜1 − ⎟ ⎜1 − ⎟
x!(n − x )! n x ⎝ n ⎠ ⎝ n ⎠
n
1 n(n − 1)(n − 2) ⋅ ... ⋅ (n − x + 1)(n − x )! x ⎛ λ ⎞ ⎛ λ ⎞
λ ⎜1 − ⎟ ⎜1 − ⎟
=
x!
(n − x )! n x
⎝ n⎠ ⎝ n⎠
n
−x
−x
man kann jetzt die (n − x )! aus Zähler
und Nenner kürzen.
Die einzelnen Terme konvergieren dann für n → ∞ gegen:
lim
n →∞
n(n − 1)(n − 2) ⋅ ... ⋅ (n − x + 1)(n − x )!
=1
(n − x )! n x
⎛ λ⎞
lim ⎜1 − ⎟
n →∞
⎝ n⎠
−x
⎛ λ⎞
lim ⎜1 − ⎟ = e −λ
n →∞
n⎠
⎝
n
=1
19
Lehrstuhl für Empirische Wirtschaftsforschung und Ökonometrie
Dr. Roland Füss ● Statistik II: Schließende Statistik ● SS 2007
lim f ( x ) = e
n →∞
−λ
λx
x!
• Die Wahrscheinlichkeitsfunktion ist also:
• Verteilungsfunktion:
⎧ −λ λ x
, x = 0,1,2,...
⎪e
f (x ) = ⎨
x!
⎪0 , sonst
⎩
⎧0 , x < 0
⎪
F (x ) = ⎨ x −λ λk
⎪∑ e k!
⎩k =0
20
Lehrstuhl für Empirische Wirtschaftsforschung und Ökonometrie
Dr. Roland Füss ● Statistik II: Schließende Statistik ● SS 2007
• Mittelwert: E (x ) = np = λ
2
• Varianz: σ = λ
• Falls eine Binomialverteilung also gleiche Werte für Mittelwert und Varianz hat, ist
das ein Hinweis, dass sie durch die Poissonverteilung approximiert werden kann.
21
Lehrstuhl für Empirische Wirtschaftsforschung und Ökonometrie
Dr. Roland Füss ● Statistik II: Schließende Statistik ● SS 2007
λ x +1
λ x ⋅ λ1
• Rekursionsformel: f (x + 1) = e (x + 1)! = e (x + 1)x!
−λ
=
λ
x +1
e
−λ
λx
x!
−λ
→
f (x + 1) =
λ
x +1
⋅ f (x )
22
Herunterladen