Kursthemen 11. Sitzung Spezielle diskrete Verteilungen

Werbung
Universität Hamburg - Institut für Statistik und Ökonometrie - Dr. S. Kindermann - Methodenlehre der Statistik I - Sitzung 11
Folie I - 11 - 1
Kursthemen 11. Sitzung
Spezielle diskrete
diskrete Verteilungen:
Verteilungen: Auswahlexperimente
Auswahlexperimente
Spezielle
A)
A)
Kombinatorik (Folien
(Folien 22 bis
bis 5)
5)
Kombinatorik
B)
B)
Die diskrete
diskrete Gleichverteilung
Gleichverteilung (Folie
(Folie 6)
6)
Die
C)
C)
Die Bernoulliverteilung
Bernoulliverteilung (Folien
(Folien 77 bis
bis 9)
9)
Die
D)
D)
Die Binomialverteilung
Binomialverteilung (Folien
(Folien 10
10 bis
bis 19)
19)
Die
E)
Die Hypergeometrische Verteilung (Folien 20 bis 23)
Universität Hamburg - Institut für Statistik und Ökonometrie - Dr. S. Kindermann - Methodenlehre der Statistik I - Sitzung 11
Folie I - 11 - 2
Kombinatorik 1 / 2
Gänsemarschproblem I: Wie viele Möglichkeiten gibt es, n Gänse in
verschiedener Reihenfolge anzuordnen?
Es gibt n! Möglichkeiten, n Gänse in verschiedener Reihenfolge
anzuordnen.
Definition:
n ! = 1 ⋅ 2 ⋅ ... ⋅ n, n ∈ »
(sprich: "n Fakultät")
und
0! = 1
Universität Hamburg - Institut für Statistik und Ökonometrie - Dr. S. Kindermann - Methodenlehre der Statistik I - Sitzung 11
Folie I - 11 - 3
Kombinatorik 1 / 2
Gänsemarschproblem II: Wie viele Möglichkeiten gibt es, n Gänse in
verschiedener Reihenfolge anzuordnen, wenn jeweils n1, n2,
nicht unterscheidbar sind (bzw. es auf ihre Reihenfolge nicht
ankommt)?
Nun gibt es nur noch
n!
n1 !⋅ n2 !⋅ ... ⋅ nk !
unterscheidbare Anordnungen.
..., nk
Universität Hamburg - Institut für Statistik und Ökonometrie - Dr. S. Kindermann - Methodenlehre der Statistik I - Sitzung 11
Folie I - 11 - 4
Kombinatorik 2 / 2
Abgeleitete Regeln
Es werden n Elemente aus N gezogen. Wie viele mögliche Ergebnisse kann
dieser Auswahlprozess haben?
Wenn es auf die Auswahlreihenfolge ankommt:
- mit Zurücklegen (Bsp.: Lotto Super 6, Spiel 77):
Nn
N!
- ohne Zurücklegen (Bsp.: Platzwette, Toto):
( N − n)!
Wenn es auf die Auswahlreihenfolge nicht ankommt:
- mit Zurücklegen:
( N + n − 1) !  ( N + n − 1) 
=: 

n
n !⋅ ( N − 1) ! 

N
N!
=
:
- ohne Zurücklegen (Bsp.: Lotto 6 aus 49):
n !( N − n)!  n 
Universität Hamburg - Institut für Statistik und Ökonometrie - Dr. S. Kindermann - Methodenlehre der Statistik I - Sitzung 11
Folie I - 11 - 5
Definition:
Binomialkoeffizient
 n
n!
n ⋅ ( n − 1) ⋅ ... ⋅ ( n − k + 1)
=
=
 k  ( n − k )!⋅ k !
1 ⋅ 2 ⋅ ... ⋅ k
 
(sprich: "n über k")
Universität Hamburg - Institut für Statistik und Ökonometrie - Dr. S. Kindermann - Methodenlehre der Statistik I - Sitzung 11
Folie I - 11 - 6
Die Gleichverteilung
Ausgangssituation:
Sie ziehen zufällig ein Objekte aus 1 bis n durchgehend numerierten
Objekten heraus. Dann ist die Zufallsvariable
X = "Nummer des gezogenen Objektes"
gleichverteilt mit dem Parameter n, d. h. sie folgt der Verteilung GLV ( n ) .
Mögliche Werte von X:
k = 1, 2, ..., n
Erwartungswert von X:
E( X ) =
n +1
2
Häufigkeitsfunktion:
1 Y?
Wie groß ist die Varianz von
f (k ) = P ( X = k ) =
n
Varianz von X:
Wie groß ist die Varianz
n2 − 1 von Y?
Var ( X ) =
12
Universität Hamburg - Institut für Statistik und Ökonometrie - Dr. S. Kindermann - Methodenlehre der Statistik I - Sitzung 11
Folie I - 11 - 7
Das Urnenmodell 1 / 4
In einer Urne liegen:
-
20 (N) Kugeln;
-
ein Anteil von 25% (p) ist schwarz,
-
ein Anteil von 75% (1-p) ist weiß.
Die Urne enthält somit 5 (N·p) schwarze und 15 (N·(1-p)) weiße Kugeln
Nehmen wir an, man zieht blind eine Kugel aus der Urne. Dann ist die
Wahrscheinlichkeitsverteilung für die Anzahl der schwarzen Kugeln:
0,75
1-p=0,75
0,25
p=0,25
0
1
Anzahl schwarze Kugeln
Universität Hamburg - Institut für Statistik und Ökonometrie - Dr. S. Kindermann - Methodenlehre der Statistik I - Sitzung 11
Folie I - 11 - 8
Das Urnenmodell 1 / 4
0,75
1-p=0,75
0,25
p=0,25
0
1
Anzahl schwarze Kugeln
Die Verteilung heißt Zweipunktverteilung mit dem Parameter p=0,25
oder
Binomialverteilung B(n, p) mit den Parametern n=1 und p=0,25.
Erwartungswert:
µ = p = 0, 25
Standardabweichung:
σ=
p ⋅ (1 − p ) = 0, 43
Universität Hamburg - Institut für Statistik und Ökonometrie - Dr. S. Kindermann - Methodenlehre der Statistik I - Sitzung 11
Folie I - 11 - 9
Die Zweipunktverteilung
(Bernoulliverteilung)
Ausgangssituation:
Sie ziehen zufällig ein Objekt aus N Objekten heraus, die sich in bezug auf ein
Merkmal mit zwei Ausprägungen A und A unterscheiden. Dann ist die ZV
X = "Anzahl der gezogenen Objekte mit A"
NA
, wobei N A die Anzahl der Objekte
N
mit A ist. D. h. die ZV folgt der Verteilung ZPV ( p ).
bernoulliverteilt mit dem Parameter p =
Mögliche Werte von X:
k = 0,1
Erwartungswert von X:
E( X ) = p
Häufigkeitsfunktion:
Wie groß ist die Varianz von
Y?
k
1− k
f ( k ) = P ( X = k ) = p (1 − p )
Varianz von X:
Wie groß ist die Varianz von Y?
Var ( X ) = p(1 − p )
Universität Hamburg - Institut für Statistik und Ökonometrie - Dr. S. Kindermann - Methodenlehre der Statistik I - Sitzung 11
Folie I - 11 - 10
Das Urnenmodell 2 / 4
Nehmen wir an, man zieht blind eine Kugel, notiert die Farbe, legt die Kugel
zurück, mischt und zieht ein zweites Mal.
Mögliche
Ergebnisse
W-keit
Anzahl
schwarze K.
WW
WS
SW
SS
(1 − p ) 2 = 0,5625
(1 − p ) ⋅ p = 0,1875
0
1
1
2
p ⋅ (1 − p ) = 0,1875
p 2 = 0,0625
W-keit
(1 − p ) 2 = 0,5625
2 ⋅ (1 − p ) ⋅ p = 0,3750
p 2 = 0,0625
Universität Hamburg - Institut für Statistik und Ökonometrie - Dr. S. Kindermann - Methodenlehre der Statistik I - Sitzung 11
Folie I - 11 - 11
Das Urnenmodell 2 / 4
Mögliche
Ergebnisse
W-keit
Anzahl
schwarze K.
WW
WS
SW
SS
(1 − p ) 2 = 0,5625
(1 − p ) ⋅ p = 0,1875
p ⋅ (1 − p ) = 0,1875
0
1
1
2
p 2 = 0,0625
0,75
W-keit
(1 − p ) 2 = 0,5625
2 ⋅ (1 − p ) ⋅ p = 0,3750
p 2 = 0,0625
(1 − p )2
2 ⋅ p ⋅ (1 − p )
0,25
p2
0
1
2
Anzahl schwarze Kugeln
µ = 2 ⋅ p = 0, 5
σ = 2 ⋅ p ⋅ (1 − p ) = 0, 61
Universität Hamburg - Institut für Statistik und Ökonometrie - Dr. S. Kindermann - Methodenlehre der Statistik I - Sitzung 11
Folie I - 11 - 12
Das Urnenmodell 3 / 4
Nun wird dreimal mit Zurücklegen gezogen.
Mögliche
Ergebnisse
W-keit
Anzahl
schwarze K.
WWW
WWS
WSW
SWW
WSS
SWS
SSW
SSS
(1 − p )3 = 0,420
(1 − p ) 2 ⋅ p = 0,140
(1 − p ) 2 ⋅ p = 0,140
(1 − p ) 2 ⋅ p = 0,140
(1 − p ) ⋅ p 2 = 0,047
(1 − p ) ⋅ p 2 = 0,047
(1 − p ) ⋅ p 2 = 0,047
0
1
1
1
2
2
2
3
p 3 = 0,016
W-kei
(1 − p )3 = 0,42
3 ⋅ (1 − p ) 2 ⋅ p = 0,42
3 ⋅ (1 − p ) ⋅ p 2 = 0,14
p 3 = 0,02
Universität Hamburg - Institut für Statistik und Ökonometrie - Dr. S. Kindermann - Methodenlehre der Statistik I - Sitzung 11
Folie I - 11 - 13
Das Urnenmodell 3 / 4
Anzahl
schwarze K.
0
1
1
1
2
2
2
3
W-keit
(1 − p )3 = 0,42
3 ⋅ (1 − p ) 2 ⋅ p = 0,42
0,75
(1 − p )3 3 ⋅ p ⋅ (1 − p )2
3 ⋅ p 2 ⋅ (1 − p )
0,25
3 ⋅ (1 − p ) ⋅ p = 0,14
2
0
p 3 = 0,02
µ = 3 ⋅ p = 0, 75
σ = 3 ⋅ p ⋅ (1 − p) = 0, 75
1
2
p3
3
Anzahl schwarze Kugeln
Universität Hamburg - Institut für Statistik und Ökonometrie - Dr. S. Kindermann - Methodenlehre der Statistik I - Sitzung 11
Folie I - 11 - 14
Das Urnenmodell 4 / 4
Die Binomialverteilung
Verallgemeinerung: Es wird n-mal gezogen.
Allgemeine Binomialverteilung: B(n,p)
 n k
P ( k ) =   ⋅ p ⋅ (1 − p )n − k
k
 n
n!
n ⋅ ( n − 1) ⋅ ... ⋅ ( n − k + 1)
mit   =
=
1 ⋅ 2 ⋅ ... ⋅ k
 k  ( n − k )!⋅ k !
(Binomialkoeffizient)
Erwartungswert:
µ = n⋅ p
Standardabweichung:
σ = n ⋅ p ⋅ (1 − p )
Universität Hamburg - Institut für Statistik und Ökonometrie - Dr. S. Kindermann - Methodenlehre der Statistik I - Sitzung 11
Folie I - 11 - 15
Die Binomialverteilung
Ausgangssituation:
Sie ziehen nacheinander zufällig n Objekte aus N Objekten heraus,
die sich in bezug auf ein Merkmal mit zwei Ausprägungen A und A
unterscheiden. Die Objekte werden zurückgelegt. Dann ist die ZV
X = "Anzahl der gezogenen Objekte mit A"
NA
, wobei N A die
N
Anzahl der Objekte mit A ist. D. h. die ZV folgt der Verteilung BV ( n, p ) .
binomialverteilt mit den Parametern n und p =
Mögliche Werte von X:
k = 0,1, ..., n
Erwartungswert von X:
E( X ) = n ⋅ p
Wie groß ist die Varianz von Y?
Häufigkeitsfunktion:
 n
P ( k ) = f ( k ) =   ⋅ p k ⋅ (1 − p )n−k
k
Wie großvon
ist X:
die Varianz von Y?
Varianz
Var ( X ) = n ⋅ p ⋅ (1 − p )
Universität Hamburg - Institut für Statistik und Ökonometrie - Dr. S. Kindermann - Methodenlehre der Statistik I - Sitzung 11
Folie I - 11 - 16
Aufgaben zur Binomialverteilung 1 / 4
Die Lostrommel
Die Lostrommel...
In einem Behälter befinden sich 20 Lose, von denen 5 Gewinne sind. Nach
gutem Mischen wird ein Los gezogen, angeschaut und wieder zurückgelegt.
a)
Wie groß ist die Wahrscheinlichkeit, einen Gewinn zu ziehen?
b)
Wie groß ist die Wahrscheinlichkeit, dass drei nacheinander gezogene
Lose Gewinne sind?
c)
Wie groß ist die Wahrscheinlichkeit, dass drei nacheinander gezogene
Lose Nieten sind?
Universität Hamburg - Institut für Statistik und Ökonometrie - Dr. S. Kindermann - Methodenlehre der Statistik I - Sitzung 11
Folie I - 11 - 17
Aufgaben zur Binomialverteilung 2 / 4
„Mensch ärgere Dich nicht“ und Therapieversager
Mensch ärgere Dich nicht...
Sie würfeln 6 mal hintereinander mit einem fairen Würfel.
Wie groß ist die Wahrscheinlichkeit, dass keine 6 dabei ist?
Therapieversager....
Sie behandeln 95 Patienten mit einem zu 95% sicheren Medikament.
Wie groß ist die Wahrscheinlichkeit, keinen Therapieversager zu erleben?
Universität Hamburg - Institut für Statistik und Ökonometrie - Dr. S. Kindermann - Methodenlehre der Statistik I - Sitzung 11
Folie I - 11 - 18
Aufgaben zur Binomialverteilung 3 / 4
In der Manege
Manege frei!
Sie verteilen Handzettel an auf der Straße spielende Kinder, die zum Besuch
Ihres Wanderzirkusses einladen. Aus Erfahrung wissen Sie, dass jedes 5. Kind
kommt. Sie verteilen zufällig 50 Handzettel.
a)
Wie groß ist die Wahrscheinlichkeit, dass weniger als drei Kinder kommen
(dann fällt die Vorstellung aus)?
b)
Wie groß ist die Wahrscheinlichkeit, dass mehr als 46 Kinder kommen
(dann bricht das Zelt zusammen)?
c)
Wieviele Kinder werden im Schnitt zu erwarten sein?
Universität Hamburg - Institut für Statistik und Ökonometrie - Dr. S. Kindermann - Methodenlehre der Statistik I - Sitzung 11
Folie I - 11 - 19
Aufgaben zur Binomialverteilung 4 / 4
Die Schraubenfabrik
In der Schraubenfabrik...
Bei der Massenproduktion von Schrauben eines bestimmten Typs sei die
Ausschussquote 10%.
a)
Wieviele defekte Schrauben sind in einem 50er-Pack zu erwarten?
b)
Wie groß ist jeweils die Wahrscheinlichkeit, dass in einem 4er-Pack
c)
i.
keine defekte Schraube ist?
ii.
eine defekte Schraube ist?
iii.
zwei defekte Schrauben sind?
Wieviele Schrauben muß man sicherheitshalber zum 4er-Pack dazugeben,
damit die Wahrscheinlichkeit, dass mindestens 4 Schrauben in Ordnung
sind, mehr als 95% beträgt?
Universität Hamburg - Institut für Statistik und Ökonometrie - Dr. S. Kindermann - Methodenlehre der Statistik I - Sitzung 11
Folie I - 11 - 20
Die hypergeometrische Verteilung
Ausgangssituation:
Sie ziehen nacheinander zufällig n Objekte aus N Objekten heraus,
die sich in bezug auf ein Merkmal mit zwei Ausprägungen A und A
unterscheiden. Die Objekte werden nicht zurückgelegt. Dann ist die ZV
X = "Anzahl der Objekte mit A"
hypergeometrisch verteilt mit den Parametern ( N , N A , n ) , wobei N A die
Anzahl der Objekte mit A ist. D. h. die ZV folgt der Verteilung HV ( N , N A , n ) .
Mögliche Werte von X:
k = 0,1, ...,min ( N A , n )
Erwartungswert von X:
N
E( X ) = n ⋅ A
N
N  N − N
Häufigkeitsfunktion:
⋅
Wie groß ist die Varianz von
k   Y?
n−k
A
f (k ) =
N
 
n
Varianz
Wie großvon
ist X:
die Varianz von Y?
Var ( X ) = n ⋅
NA
N
A
N  N −n

⋅ 1 − A  ⋅
N  N −1




Universität Hamburg - Institut für Statistik und Ökonometrie - Dr. S. Kindermann - Methodenlehre der Statistik I - Sitzung 11
Folie I - 11 - 21
Aufgabe zur hypergeometrischen Verteilung:
Das Skat-Turnier
Auf dem Skat-Turnier...
Sie spielen Skat. Nach dem Geben haben Sie zwei Buben auf der Hand.
a)
Wie groß ist die Wahrscheinlichkeit, dass Ihr Mitspieler zur Linken zwei
Buben dagegen hat?
b)
Wie groß ist die Wahrscheinlichkeit, dass einer Ihrer beiden Mitspieler
zwei Buben dagegen hat?
Universität Hamburg - Institut für Statistik und Ökonometrie - Dr. S. Kindermann - Methodenlehre der Statistik I - Sitzung 11
Folie I - 11 - 22
Aufgabe:
Das Capture-Recapture-Problem
Um den Bestand in einem Fischteich zu schätzen, wurden außerhalb der
Laichzeit 100 Fische gefangen und markiert (capture). Nach drei Tagen wurden
wieder 100 Fische gefangen (recapture).
Y sei die ZV „Zahl der markierten Fische unter den wiedergefangenen
Fischen“.
a)
Welche Verteilung kann man für Y ansetzen, wenn in dem Teich 2000
Fische leben und welche impliziten Annahmen trifft man dabei?
b)
Wieviele markierte Fische sind im zweiten Fang zu erwarten?
c)
Wie groß würden Sie den Fischbestand schätzen, wenn Sie im zweiten
Fang 2 markierte Fische finden?
Universität Hamburg - Institut für Statistik und Ökonometrie - Dr. S. Kindermann - Methodenlehre der Statistik I - Sitzung 11
Übersicht:
Wichtige diskrete Verteilungen für
Auswahlexperimente
Gleichverteilung
GLV ( n), n ∈ »
Bernoulliverteilung (=Zweipunktverteilung)
Binomialverteilung
Folie I - 11 - 23
ZPV ( p ), p ∈ [ 0, 1]
BV ( n, p ), n ∈ », p ∈ [ 0, 1]
Hypergeometrische Verteilung
HV ( N , M , n), N , M , n ∈ »
Herunterladen