1 Kapitel 9 Einzelne parametrische Verteilungen Letzte Änderung 8

Werbung
1
Kapitel 9 Einzelne parametrische Verteilungen
Letzte Änderung 8. Mai 2001, 21 Seiten
Den folgenden speziellen Verteilungen liegt immer eine Zufallsvariable X zugrunde:
X: Ω →R
1 Diskrete Gleichverteilung
Die einfachste Wahrscheinlichkeit, die offensichtlich alle drei Axiome der Wahrscheinlichkeit erfüllt, ist die sog. Gleichverteilung, die sog. Laplace-Zähldichte.
Jedes von N Elementarereignissen hat die gleiche Wahrscheinlichkeit, d.h. für
Ω = {ω1,ω2,...,ωN }
1
gilt:
p k = P({ωk}) = P(X = k)=
, k = 1,2, ..., N .
N
Dann heißt die Zufallsvariable X gleichverteilt. Mit dieser Zuordnung von P(.) ist die
große Rolle der Kombinatorik einsichtig. Aus der Kombinatorik wird die Menge der
Möglichkeiten bestimmt, und dann wird jedem Element die gleiche Wahrscheinlichkeit
zugeteilt. Es ist eine allgemeine Konstruktionsidee für Wahrscheinlichkeiten.
1.1 Beispiel
Die beliebige Gleichverteilung: Ω = {-3, 1, 6} mit
1
1
1
p 1 = P({-3}) = P(X = -3) = , p 2 = P({1}) = P(X = 1) = , p 3 = P({6}) = P(X = 6) = .
3
3
3
1.2 Beispiel Die (lückenlose) Gleichverteilung U(a,b):
Eine Gleichverteilung auf den ganzen Zahlen von a bis b, (a=-3 und b=5):
Ω = {-3, -2, -1, 0, 1, 2, 3, 4, 5}
In diesem Sonderfall der lückenlosen Aufeinanderfolge zwischen unterer Grenze
a=-3 und oberer Grenze b=5 der natürlichen Zahlen gilt offensichtlich:
1
1
p k = P({ω k}) = P(X = ω k) =
= , k = 1,2,...,9.
b- a + 1 9
1.3 Beispiel
Eine Gleichverteilung von 1 bis 6
Ω ={1, 2, 3, 4, 5, 6}
Dieser Sonderfall der diskreten Gleichverteilung, der lückenlosen Aufeinanderfolge
zwischen unterer Grenze a =1 und oberer Grenze b = 6 der natürlichen Zahlen, beschreibt
den Wurf eines fairen (idealen) Würfels. Offensichtlich gilt:
1
1
p k = P({ω k}) = P(X = ω k) =
= , k = 1,2,3,4,5,6.
b- a + 1 6
Diese Gleichverteilung wird als U(a,b) bezeichnet, hier U(1,6), der faire (ideale) Würfel, in
Beispiel 2 mit U(-3, 5)
2
2 Die Bernoulli-Verteilung
Wenn der Ereignisraum Ω nur genau zwei Elemente
Ω = {ω1, ω2}
mit
P({ω1}) = p, P({ω2}) = 1-p, 0 < p < 1
enthält, dann heißt die Zufallsvariable Bernoulli-verteilt, abgekürzt X ~ B(1,p). In jedem
Fall kann man die beiden möglichen Ergebnisse des Zufallsvorgangs durch die Zahlen 0
und 1 repräsentieren.
2.1 Beispiele
Hierzu gibt es eine Vielzahl von Anwendungen:
1. Belegung eines Chips:
0
2, Stellung eines Schalters:
an
3. Geschlecht eines Kindes:
Knabe
4. Typ einer Manöverpartei:
blau
5. Ergebnis eines Münzwurfs:
Zahl
1
aus
Mädchen
rot
Adler
In der letzten Interpretation mit p=1/2 wird die Situation als Modell einer fairen (idealen)
Münze bezeichnet. Empirische Münzen sind im Regelfall nicht fair bzw. müssen es auch
nicht sein, ihre Prüfung z.B. in Automaten geschieht ohnehin anders - nach Gewicht,
Leitfähigkeit u.ä.; ihre Verwendung in Glücksspielen ist meist gezielt nicht fair.
2.2 Aufgabe (Die Zähldichte der Bernoulli-Verteilung)
Zeigen Sie, daß
1
x
1-x
P[X=x]=
p (1-p) ; x=0,1; 0 ≤ p ≤ 1
x
eine Zähldichte ist. Berechnen Sie den Erwartungswert und die Varianz der zugehörigen
Zufallsvariablen.
Die Lösung ist eine unmittelbare Anwendung der Definitionen:
P[X=0] = 1-p, P[X=1] = p; E(X)= p; var(X)= p(1-p).
(Diese Aufgabe ist ein Vorgriff auf Kapitel 10)
3
3 Die Binomial-Verteilung
Wird ein Bernoulli-Zufallsexperiment nicht einmal, sondern n-mal in Folge durchgeführt
und zwar so, daß jeder Versuch unabhängig von den anderen Ver-suchen ist, d.h. wenn
wieder
Ω = {ω1, ω2} = {0, 1} gilt,
und man sich nun für die Anzahl der 1 bei n-maliger Durchführung dieses Zufallsexperiments interessiert, dann erhält man die Binomial-Zähldichte
n-k
n k
p k = P(X = k) =
p (1-p)
, 0 < p < 1 , k = 0,1,2,...,n .
k
Eine Kurzschreibweise ist X ~ B(n,p).
Der Beweis, daß diese Zähldichte die drei Axiome der Wahrscheinlichkeit erfüllt, gelingt
am einfachsten aus dem binomischen Lehrsatz (s.o.) mit a = p und b = 1-p.
3.1 Der Sonderfall der Bernoulli-Zähldichte
Der Fall der Bernoulli-Zähldichte ist offenbar der Sonderfall für n=1. Das läßt sich auch
direkt zeigen:
1-0
1 0
p0 =
p (1-p) = 1-p ,
0
1-1
1 1
p1 =
p (1-p) = p .
1
Eine Veranschaulichung des Bildungsgesetzes für die Binomialzähldichte ist der folgende
Baum. Nach links wird jeweils der Zweig für eine Eins und nach rechts jeweils der Zweig
für eine Null gezeichnet. Verknüpft man dann jeweils die Kanten eines Weges nach unten
multiplikativ (wegen der Unabhängigkeit der aufeinanderfolgenden Durchführungen des
Zufallsexperiments), dann gibt die Folge der p und (1-p) die jeweiligen
Wahrscheinlichkeiten an, um an das Ende des Baumes zu gelangen und eine bestimmte
Zahl von Einsen zu bekommen.
3.2 Die Zahl der Einsen
p
p
1-p
1-p
p
1-p
p
1-p
p
1-p
p
1-p
p
1-p
3
2
2
1
2
1
1
0
Von besonderer Bedeutung ist wieder der symmetrische (faire, ideale) Fall, d.h. p = 1/2.
4
3.3 Beispiel
Eine faire Münze wird eine gerade Anzahl von Malen geworfen. Wie groß ist die
Wahrscheinlichkeit, ebenso oft Zahl wie Adler zu erhalten?
n
2n-n
2n
2n
(2n)! 1
2n 1 1
2n 1
P(X = n) =
=
=
n 2 2
n 2
n! n! 2
bzw. mit der Stirlingschen Annäherung:
1
P(X=n) ≈
(Dies ist eine sehr kleine Zahl für n → ∞).
π⋅n
Für 2n=4 etwa und mit der Bezeichnung A = Adler, Z = Zahl, X = Zahl der Adler in den 4
Würfen erhält man den Ereignisraum Ω:
AAAA
X=4
Hier ist:
ZAAA
AZAA
AAZA
AAAZ
X=3
ZAAZ
ZAZA
AZAZ
ZZAA
AZZA
AAZZ
ZZZA
ZZAZ
ZAZZ
AZZZ
X=2
X=1
2
4 1
1 4-2 4
P(X =2) =
=
2 2
2
2
ZZZZ
X=0
1 4 4! 1 4 3
=
= .
2
2! 2! 2
8
3.4 Aufgabe (Beispiel ‘Multiple Choice’)
In einer Prüfung werden 5 Fragen gestellt. Jede Frage kann nur falsch oder richtig beantwortet werden, und die Richtigkeit der Antwort zu einer Frage werde nicht von der
Richtigkeit der Antwort zu einer anderen Frage beeinflußt. Die Prüflinge sollen außerdem
alle über die gleichen Fähigkeiten verfügen.
a) Wie groß ist die Wahrscheinlichkeit, daß ein Kandidat alle Fragen richtig
beantwortet?
b) Wie groß ist die Wahrscheinlichkeit, daß ein Kandidat mindestens drei Fragen
richtig beantwortet?
c) Wie groß ist die Wahrscheinlichkeit, daß ein Kandidat genau die zweite Frage
bzw. nur eine einzige beliebige Frage richtig beantwortet?
d) Wie groß ist die durchschnittliche Zahl der richtig beantworteten Fragen?
e) Wie groß muß die Wahrscheinlichkeit für eine richtige Antwort sein, damit im
Durchschnitt 4 Fragen richtig beantwortet werden?
Lösung: Voraussetzung: Alle Fragen sind gleichschwierig, und die Beantwortung ist
jeweils statistisch unabhängig! Damit folgt eine Binomialverteilung.
a) P[alle Fragen richtig] = p5
5 3
b) P[drei Fragen richtig und 2 Fragen falsch] =
p (1-p)2
3
c) P[genau die 2. Frage richtig und alle übrigen Fragen falsch] = p (1-p)4, bzw.
5
P[genau eine einzige beliebige Frage richtig und vier Fragen falsch] =
p (1-p)4
1
d) Mittelwert der Verteilung np = 5p
e) np= 4, also p= 4/5
5
3.5 Aufgabe (Geburtshäufigkeiten)
Die Wahrscheinlichkeit, daß ein Kind ein Knabe ist, beträgt (weltweit) etwa 1-p =0.51. Wie
groß ist die Wahrscheinlichkeit, daß alle drei Kinder eines Elternpaares Mädchen sind? Wie
beurteilen Sie die Behauptung eines Vaters, da die ersten drei Kinder Mädchen seien, das
vierte ein Junge werden müsse? Wie groß ist die Wahrscheinlichkeit hierfür?
Lösung:
Bei Unabhängigkeit der Ereignisse beträgt die Wahrscheinlichkeit, daß alle drei Kinder
49 3
117 649
Mädchen sind, p3 =
=
≈ 0.1
100
1 000 000
Die Wahrscheinlichkeit, daß das vierte Kind ein Junge ist, beträgt dann ebenso wie bei den
ersten dreien unverändert 0.51. Für diese Aufgabe ist die Behauptung des Vaters
unbegründet, da es sich um unabhängige Ereignisse handelt, also stets, in jeder Geburt: p
= 0.49.
Der Lösungsbaum für das Problem ist der folgende Ereignisbaum:
+
M
M
K
K
M
K
M
K
M
K
M
K
M
K
KMM KMK KKM KKK
MMM MMK MKM MKK
n m
P(X=m) =
p (1-p)n-m, n=3 (K = Knabe, k=0,1,2,3; M = Mädchen, m=0,1,2,3; k die Zahl
m
der Knaben bzw. m die Zahl der Mädchen)
3 3
Für n=3 und m=3 folgt
p (1-p)3-3 = p3, wie oben direkt abgeleitet
3
Beachten Sie, daß individuell die Frage der Unabhängigkeit der Geburten durchaus nicht
selbstverständlich ist; dazu sehe man z.B. die lange weibliche Generationenfolge im
niederländischen Herrscherhaus bzw. man befrage seinen Hausarzt bzw. betrachte das
abnorme Geburtsverhältnis in solchen Ländern, in denen Knaben eklatant höher als
Mädchen geschätzt werden, d.h. weibliche Embryos eher als männliche abgetrieben
werden, z.B. verbreitet in Indien und China.
6
3.6 Aufgabe (Zuverlässigkeit paralleler Systeme)
Ein Flugzeugmotor eines bestimmten Typs fällt während des Fluges mit der Wahr-scheinlichkeit 1 - q aus. Der Ausfall eines solchen Motors erfolgt unabhängig vom Aus-fall der
anderen Motoren des Flugzeugs. Wenn nicht mehr als die Hälfte der Motoren ausfällt,
kann ein Flug sicher beendet werden.
Für welche Werte von q ist eine viermotorige Maschine, die mit solchen Motoren
ausgerüstet ist, sicherer als eine entsprechende zweimotorige Maschine?
Lösungsalternative 1:
Vergleich zweier Binomialverteilungen: X die Zahl der Motore, die ordnungsgemäß
arbeiten: X 1~ B(4, q), X2 ~ B(2, q), P(Triebwerk funktionstüchtig) = q
φ
Fall 1: 4 Triebwerke:
M1M2
|
|
+
M3M4
P[Absturz] = P(X1 ≤1) = P(X1 = 0) + P(X1 = 1) =
4
4 1
(1-q)4 +
q (1-q)3 = (1-q)4 + 4q(1-q)3
0
1
φ
Fall 2: 2 Triebwerke:
M1
|
+
M2
2
(1 - q)2 = (1 - q)2
0
Bei Vorteilhaftigkeit von 4 Triebwerken muß gelten:
(1-q)4 + 4q(1-q)3 ≤ (1 - q)2 ⇔ (1-q)2 + 4q(1-q) ≤ 1 ⇔ 1 - 2q + q2 + 4q - 4q2 ≤ 1
2
⇔ - 3q2 + 2q ≤ 0 ⇔ q(2 - 3q ) ≤ 0 ⇒ q ≥
3
Alternative 2:
Vergleich zweier Binomialverteilungen: X die Zahl der Motore, die nicht arbeitet
X~ B(n,1-q), P(Triebwerkausfall) = 1-q; n=4,2
Fall 1: 4 Triebwerke
4
4
P[Flug] = P(X<2) = P(X=0) + P(X=1) =
(1-q)4 q 0 +
(1-q) 3 q1
0
1
Fall 2: 2 Triebwerke
2
P[Flug] =P(X<1) = P(X=0)=
(1-q)2 q 0 = (1 - q)2
0
P[Absturz] =P(X2 = 0) =
Der Vergleich beider Wahrscheinlichkeiten ist identisch mit dem der ersten Alternative.
Wie die folgende Graphik zeigt, hängt die Vorteilhaftigkeit, ob vier oder zwei Triebwerke
sicherer sind, davon ab, ob q unterhalb oder oberhalb eines Schwellenwertes liegt. Vier
Motore sind überraschenderweise nicht durchgängig sicherer.
7
3.7 Ein Random Walk
Eine besonders schöne Anwendung der binomialen Zähldichte ist das folgende
Froschproblem. Sei ein Lebewesen (z.B. ein Frosch) zur Zeit 0 in der Ausgangsposition 0,
wie in der Abbildung verdeutlicht. Zu diskreten Zeitpunkten, z.B. kt springt der Frosch
entweder um λ Wegeinheiten mit der jeweiligen Wahrscheinlichkeit von 1/2 vorwärts
oder rückwärts.
c
------.----.----.----.----.----.----.----.----.----.----.----.
-3λ -2λ -1λ
0
+λ
+2λ +3λ
Seien m und n gerade ganze Zahlen. Was ist dann die Wahrscheinlichkeit, daß der Frosch
zur Zeit nt nach dem letzten Sprung an Position mλ ist? Das ist die Wahrscheinlichkeit,
1
1
daß er (m+n) Sprünge vorwärts und (n-m) Sprünge rückwärts gemacht hat, denn
2
2
1
1
(n+m) - (n-m) = m. Zeigen Sie: Die geeignete Zähldichte ist dafür die binomiale und es
2
2
gilt:
P[zur Zeit nt in Position mλ] =
n
1
n+m
2
2n
=
n
1
n-m
2
2n
8
4 Die geometrische Verteilung
Der Ereignisraum der geometrischen Zähldichte ist im Gegensatz zu den beiden
vorhergehenden Beispielen nicht endlich, sondern abzählbar unendlich:
Ω = {ω1, ω2, ...,ωn-1, ωn, ...} = { 0, 1, ..., n-2, n-1, ...}
Dann ist die Zähldichte
pk = P(X=k) = p(1-p)k, 0<p<1, k= 0,1,2,....
und die Zufallsvariable heißt geometrisch verteilt.
Die drei Wahrscheinlichkeitsaxiome werden offensichtlich erfüllt: Axiom (A1) folgt aus
0<p<1, Axiom (A2) aus der geometrischen Reihe, die der Zähldichte ihren Namen gibt:
∞
∑
k=0
∞
pk =
∑ p(1-p)
k
=1.
k=0
Interpretation und Veranschaulichung kann wie bei der Binomialzähldichte über einen
Ereignisbaum vorgeführt werden, indem man den Erfolg nach links und den Mißerfolg
nach rechts abträgt. Dann ist offensichtlich, daß die geometrische Dichte pk die
Wahrscheinlichkeit beschreibt, nach k Fehlschlägen einen ersten Erfolg zu haben. M.a.W.
sie beschreibt das Auftreten der ersten Eins in einer Situation wie in der BinomialZähldichte, aber mit dem entscheidenden Unterschied, daß das Münzwerfen so lange
fortgesetzt wird, bis eine 1 erscheint. Theoretisch kann das beliebig lange dauern. Die
Verteilung läßt sich explizit bestimmen:
k
k
k+1
1-p
k+1
∑ p i = ∑ p(1-p) = p 1-(1-p) = 1-p .
i=0
i=0
Der Ereignisbaum für die geometrische Verteilung:
p
k
1-p
p
1-p
p
1-p
•
p
•
•
1-p
•
Eine Kurzschreibweise ist X ~ NB(1,p) = G(p).
•
•
9
4.1 Aufgabe zur Interpretation der geometrischen Zähldichte
Ein Telefonteilnehmer wird so lange angewählt, bis eine Verbindung zustande kommt. Bei
jedem Versuch kommt diese Verbindung mit der Wahrscheinlichkeit von p= 0.75
zustande.
Geben Sie die Zufallsvariable X, die die Anzahl der Versuche beschreibt, vollständig an
und bestimmen Sie deren Zähldichte.
4.2 Aufgabe (Schlüsselprobe)
Nach einer ausgedehnten Zechtour kommt Professor U nach Hause und versucht, die
Haustür aufzuschließen. Von den 10 Schlüsseln am Bund versucht er, den passenden durch
Ausprobieren zu finden.
Wie groß ist die Wahrscheinlichkeit, nach spätestens drei Versuchen ins Haus zu gelangen,
wenn
a) er sich nicht merken kann, welchen Schlüssel er schon ausprobiert hat,
b) er sich merken kann, welchen Schlüssel er schon ausprobiert hat?
Lösung:
Teil a) ist eine geometrische Situation: pk = p(1-p)k, p =0.1. Die Zahl der Schlüssel (n=10)
spielt keine Rolle. Die gesuchte Wahrscheinlichkeit ist
p0 + p1 + p2 = p + p(1-p) + p(1-p)2 = 0.1 + 0.1 . 0.9 + 0.1 . 0.92
= 0.100 + 0.090 + 0.081 = 0.271
Teil b) ist eine Warte-Verteilung ähnlich der hypergeometrischen Situation. Sei
pk = P({Erfolg im k-ten Versuch}), k=1,2,3
1
9 1
9 8 1
p1 = , p2 = ⋅ , p3 = ⋅ ⋅ , also p1 + p2 + p3 = 0.3.
10
10 9
10 9 8
5 Pascal-Verteilung
Eine Verallgemeinerung der geometrischen Verteilung ist die Pascal-Verteilung. NB(r,p)
(auch als negative Binomialverteilung bezeichnet, r=1,2,3,...). Sie gibt die
Wahrscheinlichkeit dafür an, daß r (r≥1) Erfolgen k Fehlschläge vorausgehen.
P({k Fehlschläge vor dem r-ten Erfolg, r≥1}) =
k
r+k-1 r
P(X = k) =
p (1-p) ; k= 0, 1, 2, ... ; r= 1, 2, ... .
k
Eine Kurzschreibweise ist X ~ NB(r,p). Für r=1 folgt die geometrische Zähldichte NB(1,p).
10
6 Hypergeometrische Verteilung
Für natürliche Zahlen M, N, n, k mit 0≤k≤m=min{n,M}, M≤N und dem Ereignisraum Ω=
{ω1, ω2, ..., ωm} ist die Zähldichte der hypergeometrischen Verteilung gegeben durch:
(1)
M N-M
k n-k
p k := P(X = k) =
, k = 0,1,2,...,m.
N
n
Eine Kurzschreibweise ist X ~ H(M,N,n).
Das zugrundeliegende Urnenmodell ist eine Urne mit N Kugeln, von denen M die eine
Farbe aufweisen und N-M eine andere Farbe (z.B. rot und blau). Aus der Urne werden n
Kugeln (n<M) ohne Zurücklegen und ohne Berücksichtigung der Reihenfolge entnommen
(vergl. das Modell des Binomialkoeffizienten). Zur Bestimmung der Zahl der
Möglichkeiten für eine solche Wahl gibt es zwei äquivalente Wege:
N
Übersieht man die Farbe, so sind es offensichtlich
Möglichkeiten.
n
Betrachtet man zugleich die Farbe, so gibt es n+1 unterschiedliche Wahlmöglichkeiten:
rote
Kugeln
blaue
Kugeln
unterschiedliche
Kombinationen
0
n-0
M N–M
0
n
1
n-1
M N–M
1
n–1
2
n-2
M N–M
2
n–2
k
n-k
M N–M
k
n–k
n
0
M N–M
n
0
N
gleich der Summe der unterschiedlichen Kombinationen aus der rechten Spalte ist,
n
ist bewiesen, daß (1) eine Zähldichte ist. Denn es gilt:
Da
0 ≤ pk ≤ 1 ,
M
∑ p k = 1.
k=0
11
6.1 Beispiel (Das Lottoproblem "6 aus 49 ohne Zusatzzahl")
N = 49, M = 6 (die Gewinnzahlen), n = 6 (die angekreuzten Zahlen des Tippzettels; pk
bedeutet daher die Wahrscheinlichkeit, k richtige Gewinnzahlen angekreuzt zu haben.
Diese Wahrscheinlichkeiten sind für k≥3 außerordentlich gering, wie die folgende Tabelle
verdeutlicht. Lotto-Spielen ist daher, obwohl weltweit allgegenwärtig, irrational und
beruht auf anderen menschlichen Verhaltensweisen als einem wissenschaftlich
begründeten Kalkül, Millionär zu werden.
Zahl der
Gewinnzahlen k
0
1
2
3
4
5
6
pk
p0 =
6
0
43
49
/
6
6
6 096 454
≈ 0.435965
13 983 816
p1 =
6
1
43
49
/
5
6
5 775 588
≈ 0.413
13 983 816
p2 =
6
2
43
49
/
4
6
1 851 150
≈ 0.1324
13 983 816
p3 =
6
3
43
49
/
3
6
246 820
≈ 0.01765
13 983 816
p4 =
6
4
43
49
/
2
6
13545
≈ 0.001
13 983 816
p5 =
6
5
43
49
/
1
6
258
≈ 0.00001845
13 983 816
p6 =
6
6
43
49
/
0
6
1
≈ 0.000000072
13 983 816
Eine interessante Anschluß-Frage ist die folgende Aufgabe:
6.2 Aufgabe
Welches der beiden folgenden Ergebnisse beim “Lotto am Sonnabend 6 aus 49” halten Sie
für wahrscheinlicher?
A = {(7, 24, 31, 44, 45)} oder B = {(1, 2, 3, 4, 5, 6)}
Begründen Sie ihre Entscheidung!
Die Lösung ist trivial, aber denoch richtig und wichtig: beide sind gleich wahrscheinlich.
12
6.3 Aufgabe (Ein hypergeometrischer Ereignisraum)
Aus einem Behälter, der acht mit 1, 2, ..., 8 numerierte Kugeln enthält, wird ohne Zurücklegen eine Stichprobe vom Umfang 3 gezogen. Betrachten Sie die möglichen
Elementarereignisse in der Form ω = (ω1, ω2, ω3, ..., ω8) mit
ω1, ..., ω8∈{0,1} und ω1 +... + ω8 = 3, d.h.
ωi =
{ 01 ,,
falls Kugel Nr. i gezogen wird
falls Kugel Nr. i nicht gezogen wird
a) Wieviele Elemente hat Ω?
b) Nehmen Sie an, daß die Kugeln Nr. 1 und 2 rot, die Kugeln Nr. 3, 4, 5 grün und die
Kugeln Nr. 6, 7, 8 weiß sind und beschreiben Sie das Ereignis A "Zwei der
gezogenen Kugeln sind rot" explizit als Teilmenge von Ω.
c) Mit welcher Wahrscheinlichkeit tritt das Ereignis A aus b) ein?
Lösung:
a) In dem Behälter sind die Kugeln {R, R, G, G, G, W, W, W}, damit folgen (siehe
auch b):
8
8!
8.7.6
=
= . . = 56 Elemente
3
3! 5!
1 2 3
b) A = { (1,1,1,0,0,0,0,0), (1,1,0,1,0,0,0,0), (1,1,0,0,1,0,0,0),
(1,1,0,0,0,1,0,0), (1,1,0,0,0,0,1,0), (1,1,0,0,0,0,0,1) }, |A| = 6
6
3
c) P(A) =
=
56
28
6.4 Aufgabe (Ein Beispiel zum Rechnen)
Eine kleine Werkstatt stellt pro Tag 10 sehr teure Haushaltsmaschinen her. Der Hersteller
weiß, daß pro Tag drei defekte Maschinen darunter sind, was jedoch äußerlich nicht
erkennbar ist. Die Maschinen werden deswegen genauso verkauft wie die einwandfrei
funktionierenden.
Nachdem dies in der Presse vermutet wurde, entschließt sich die Stiftung Warentest, eine
halbe Tagesproduktion aufzukaufen und zu untersuchen.
Wie groß ist die Wahrscheinlichkeit, daß dabei mindestens zwei defekte Maschinen
gefunden werden?
Lösung: X ist hypergeometrisch verteilt:
3 7
3 7
2 3
3 2
1
P[ X ≥2 ] = P[ X =2 ] + P[ X = 3 ] =
+
=
2
10
10
5
5
NB: Es empfiehlt sich kein umständliches, voreiliges Ausrechnen der Ausdrücke, sondern
erst zu kürzen und damit ein einfaches Ergebnis zu bekommen.
13
6.5 Aufgabe (zur Qualitätskontrolle)
In der Abnahme-Qualitäts-Kontrolle wird oft folgendermaßen verfahren: Aus einer
Packung mit z.B. N = 50 Artikeln werden k = 5 zufällig entnommen und überprüft. Nach
der Prüfung sind die entnommenen Stücke vernichtet (destruktive Prüfung). Sind alle 5
entnommenen Stücke einwandfrei, wird die Packung angenommen, sonst nicht. Wie groß
ist die Wahrscheinlichkeit, daß eine Packung angenommen wird, obwohl sie a% = 20%
Ausschuß enthält?
Lösung : 20% Ausschuß heißt: es gibt 0.2. 50 = 10 = M defekte Stücke (20% Ausschuß ⇔ 10
von 50), also für ein beliebiges k (k=1,2,3,4,5)
40
10
k 5-k
=P[k Stücke sind in Ordnung] = P["alle k ersten Züge sind erfolgreich"]=:Pk
50
5
P5 =
40
5
10
0
50
5
=
40! 45! 40 39 38 37 36
⋅
⋅
⋅
⋅
=
= 31%
35! 50! 50 49 48 47 46
6.6 Aufgabe (zur Berücksichtigung von Bedingungen)
Aus einer Sendung von Maschinenteilen, unter denen sich n einwandfreie und m
minderwertige befinden mögen, wähle man zur Kontrolle willkürlich s Stück aus.
Bei der Überprüfung zeige sich, daß die ersten k der s Maschinenteile einwandfrei sind.
Man bestimme die Wahrscheinlichkeit dafür, daß auch das (k+1)-te Maschinenteil
einwandfrei ist.
n m
k 0
n!(n +m –k)!
Lösung: P("k einwandfreie Teile bis k < s") =
=
= P[B]
n+m
(n – k)!(n+ m)!
k
n –k m
1
0
n–k
P("(k+1)-tes Teil einwandfrei") =
=
= P[A|B]
n+m – k
n + m –k
1
.
P[A ∩ B] = P[A|B] P[B] mit den Ereignissen:
A = “(k+1). Teil einwandfrei nach k einwandfreien Teilen”,
B = “k einwandfrei”.
Man vergleiche die (k+1) Stichprobe
n m
k+ 1 0
n!
(k+ 1)!(n +m – k–1)!
n!
(n +m – k–1)!
=
=
n+m
(k+ 1)!(n –k – 1)!
(n + m)!
(n – k– 1)! (n+ m)!
k+ 1
mit der sequentiellen Stichprobe, erst k Teile, dann noch ein weiteres Teil:
n–k
n!(n +m –k)!
n!(n +m – k– 1)!
P[A|B] P[B] =
=
n + m –k (n – k)!(n+ m)! (n – k–1)!(n + m)!
14
6.7 Aufgabe (Urnenproblem)
In einem Los von N Stücken sind M defekte Stücke enthalten. Wie groß ist die Wahrscheinlichkeit, beim Ziehen von n Stücken ohne Zurücklegen und ohne Berücksichtigung
der Reihenfolge insgesamt k defekte zu erhalten?
6.8 Verallgemeinerungen der hypergeometrischen Situation
Aufgabe (zum Bestimmen von Ausschüssen aus mehr als einer Gruppe)
Aus einer Gruppe von 3 Schlagzeugern, 3 Bassisten und 3 Pianisten werden zufällig drei
Personen ausgewählt.
a) Wie groß ist die Wahrscheinlichkeit, daß alle 3 ausgewählten Personen
verschiedene Instrumente spielen?
b) Wie groß ist die Wahrscheinlichkeit, daß alle 3 ausgewählten Personen das
gleiche Instrument spielen?
Lösung
3 3 3
3 3
1 1 1
1 3
18
9
1
a)
=
=
, b)
=
56
28
28
9
9
3
3
Aufgabe (zum Bestimmen von Ausschüssen aus mehr als einer Gruppe)
Aus einem Chor von 20 Sopranisten, je 15 Altisten und Bässen und 10 Tenören werden 40
Sänger für das nächste Konzert zufällig und unabhängig voneinander ausgewählt. Es
werden je Stimme jedoch 10 Sänger benötigt. Wie groß ist die Wahr-scheinlichkeit, daß das
Konzert stattfindet?
Lösung:
Ω: Chorbesetzung bei Auswahl von 40 Sängern aus 60 möglichen Sängern
A: Auswahl von 10 Sängern je Stimme
20 15 15 10
20!
15! 2
⋅
10 10 10 10
A
10! ⋅ 10! 10! ⋅ 5! .
184756 ⋅ 30032
P(A)=
=
=
1=
Ω
60!
60
4.1918 ⋅ 1015
40! ⋅ 20!
40
= 0.0003975 (≈ 0.04%)
15
6.9 Beispiel (Das Schätzproblem für die Größe der Grundgesamtheit)
Wie später allgemein gezeigt wird, heißt die Bestimmung eines unbekannten Parameters
einer Verteilung, z.B. N in H(M, N, n) das statistische Schätzproblem für den Parameter.
Für die hypergeometrische Verteilung bietet es sich an, ein solches Schätzproblem schon
hier zu behandeln: In vielen Anwendungen ist zwar M bekannt, aber nicht N, z.B. in
biologischen Problemen folgender Art: Für eine vom Aussterben bedrohte Vogelart soll
die Größe der Population bestimmt werden. Nachdem M dieser Vögel gefangen und
beringt und wieder in die Freiheit entlassen worden sind, wird nach einiger Zeit eine
Prüfaktion unternommen. Es werden erneut Vögel dieser Art gefangen, diesmal n, und
untersucht, wieviele das Merkmal Ring besitzen, nämlich k. Damit kann auf N
zurückgeschlossen werden. Da die Zähldichte von N abhängt,
pk = pk(N), eine in N unimodale Funktion ist, nimmt das Verhältnis
p k(N)
(N – M)(N –n)
=
p k(N–1)
N –M –n – k
für das maximale N, d.h. das N, das den größten Wert der Zähldichte für die beobachtete
Stichprobe {M, n, k} erzeugt, den Wert 1 an.
p k(N)
p
=1
p k(N–1)
liefert die Bedingung:
M k
= ,
N n
in Worten: sowohl in der Grundgesamtheit als auch in der Stichprobe sind die Anteile des
Merkmals (Ring oder Nicht-Ring) gleichgroß, falls
M⋅n
N=
.
k
Damit ist ein Schätzwert für N gewonnen, z.B. für M=100 Ringe in der ersten Stichprobe
und einer zweiten Stichprobe von n=50 Vögeln und k=20 Ringen, N=250. Nach diesem
Verfahren müßte man daher von 250 Vögeln dieser Spezies ausgehen.
16
6.10 Aufgabe (zur Schätzung)
Vor den Augen der Zuschauer setzt ein Zauberkünstler drei weiße Häschen in seinen Hut,
der bisher nur schwarze Häschen enthält. Nun läßt er einen Zuschauer in den Hut greifen
und drei Häschen nacheinander herausnehmen, ohne sie wieder zurückzulegen. Er zieht 2
schwarze und 1 weißes (oder alternativ: 1 schwarzes und 2 weiße).
Halten Sie es für wahrscheinlicher, daß insgesamt 7 oder 8 Häschen im Hut waren?
Lösung:
Dies ist eine hypergeometrische Situation, entweder ist die Grundgesamtheit 7 oder 8, d.h.
es gibt zwei mögliche Fälle, Fall 1 und Fall 2:
{ w w w s s s s } oder { w w w s s s s s }
Sei X die Anzahl der aus dem Hut gezogenen schwarzen Häschen.
Die erste Interpretation der Aufgabe ist:
3 4
1 2
18
Fall i) X~H(3,7,3), P(X = 2) =
=
= 0.514286
35
7
3
3 5
1 2
15
Fall ii) X~H(3,8,3), P(X = 2) =
=
= 0.53571
28
8
3
Die zweite Interpretation der Aufgabe (in Klammern) ist die folgende:
3 4
2 1
12
Fall i) X~H(3,7,3), P(X = 2) =
=
= 0.34286
35
7
3
3 5
2 1
15
Fall ii) X~H(3,8,3), P(X = 2) =
=
= 0.26786.
56
8
3
Es sind 7 Hasen mit { w w w s s s s } zu vermuten, da hier das Auftreten (2s/1w
bzw. 1s/2w) mit höherer Wahrscheinlichkeit stattfindet.
17
7 Die Poisson-Verteilung
Hier enthält der Ereignisraum wieder abzählbar unendlich viele Elemente:
Ω= {ω1, ω2, ...,ωn-1, ωn, ωn+1, ...} = { 0, 1, ..., n-2, n-1,n, n+1, ...}
und die Zähldichte ist wie folgt definiert:
λk
p k = P(X =k) =e -λ , 0 < λ∈R, k= 0, 1, 2, ... .
k!
Auch hier ergibt sich das Zutreffen der Axiome unmittelbar aus pk >0 sowie aus direkter
Betrachtung der Zähldichte:
∞
∞
∑ pk = ∑
k=0
k=0
λk - λ
e =1
k!
Eine Kurzschreibweise ist X~P(λ).
Eine einfache Rekursionsformel zur tatsächlichen Berechnung ist
λ
pk = pk-1 , k = 1,2, ..., mit p 0 = e-λ
k
k
p k = P(X = k) = e
-λ
λ
, 0 < λ∈R , k = 0,1,2,... .
k!
Die Interpretation der Poisson-Verteilung ist die als Wahrscheinlichkeit sehr seltener
Ereignisse. Historisch bedeutsam zur Entwicklung dieser Verteilung war die Wahrscheinlichkeit dafür, daß ein Kavallerist innerhalb eines Jahres am Huftritt seines Pferdes stirbt.
Empirisch heute wichtiger ist die Wahrscheinlichkeit eines Unfalls auf einem bestimmten
Straßenabschnitt innerhalb einer vorgegebenen Zeitperiode; das Auftreten von
Telefonstörungen; aber auch Fragestellungen im R3: z.B. das Auftreten von Rosinen in
einem cm 3 Topfkuchen, der insgesamt nur wenige Rosinen enthält.
18
Die folgenden Aufgaben illustrieren typische Fälle.
7.1 Aufgabe (Selbstmorde in einer Großstadt)
Angenommen die tägliche Selbstmordrate in einer Großstadt sei poissonverteilt mit dem
Erwartungswert 3.
Berechnen Sie näherungsweise die Wahrscheinlichkeit dafür, daß während einer Periode
von 20 Tagen weniger als 50 Selbstmorde begangen werden
7.2 Aufgabe (Druckfehler in einem Buch)
In einem Buch mit 400 Seiten seien 200 Druckfehler zufällig verteilt.
a) Welche Verteilung hat die Zufallsvariable X, die die Anzahl der Druckfehler
pro Seite angibt? (e-0.5 = 0.6)
b) Wie groß ist die Wahrscheinlichkeit, daß auf einer bestimmten Seite
höchstens 1 Druckfehler ist?
c) Wie groß ist die Wahrscheinlichkeit, daß auf einer bestimmten Seite
mindestens 2 Druckfehler sind?
(Hinweis: der Poisson-Parameter ist λ =0.5)
7.3 Aufgabe (Jagdtrophäen)
Die Anzahl der Tiere, die bei einer Touristensafari erlegt werden, sei poissonverteilt mit
Parameter λ = 4.
a) Bestimmen Sie die Wahrscheinlichkeit, daß mindestens zwei Tiere erlegt werden.
b) Bestimmen Sie die Wahrscheinlichkeit, daß weniger als drei Tiere erlegt werden.
c) Leiten Sie den Erwartungwert der zugrundeliegenden Zufallsgröße her.
Lösung
a) P(X ≥ 2) = 1 - P(X < 2) = 1 - P(X = 1) - P(X = 0) = 1 - 4e-4 - e-4 = 1 - 5e-4 = 0.91
(Taschenrechnergenauigkeit)
b) P(X < 3) = P(X = 0) + P(X = 1) + P(X = 2) = e-4 + 4e-4 + 8e-4 = 13e-4 = 0.24
∞
∞
k
k
k-1
∞
∞
λ -λ
-λ
λ
-λ
λ
-λ λ
E(X)
=
kP(X
=
k)
=
k
e
=
e
k
=
e
λ
c)
∑
∑ k!
∑ k!
∑ (k-1)! = λe e = λ
k=0
k=0
k=0
k=1
19
7.4 Aufgabe (Unfälle)
Nehmen Sie an, die Zahl der Unfälle beim Arbeiten mit Handbohrmaschinen innerhalb
eines Jahres in einer bestimmten Stadt könne durch die Poisson-Verteilung mit Parameter
λ = 5 beschrieben werden.
Wie groß ist die Wahrscheinlichkeit, daß sich in einem bestimmten Jahr
a) mehr als 5 Unfälle und b) genau 5 Unfälle ereignen?
c) Geben Sie den 20%-Punkt der vorgegebenen Verteilung an.
Lösung
X~ P(λ) = P(5)
a)
P(X > 5) = 1 - [P(X = 0) + P(X = 1) + ... + P(X = 5)]
P(X = 0) + P(X = 1) + ... + P(X = 5) =
50
51
52
53
54
55
= e-5 .
+ e-5 .
+ e-5 .
+ e-5 .
+ e-5 .
+ e-5 .
= 0.616
0!
1!
2!
3!
4!
5!
also P(X > 5) = 1 - 0.616 = 0.384
b)
P(X = 5) = 0.1755
c) Die Werte sind entweder elementar auszurechnen oder einer Poissontafel zu
entnehmen: P(X ≤ 3) = 0.2650, P(X ≤ 2) = 0.1247 ⇒ x0.20 = 3
7.5 Aufgabe (Das Auftreten schwerer Krankheiten)
Die Verteilung für Herzanfälle auf der Fährverbindung von Schweden nach Finnland ist
annäherungsweise durch eine Poisson-Verteilung beschrieben. Die durchschnitt-liche Zahl
von Anfällen auf einer Reise (mit etwa 800 Passagieren) beträgt 2.
Wie groß ist die Wahrscheinlichkeit von
a) höchstens 2 Anfällen,
b) mehr als 2 Anfällen,
c) genau 2 Anfällen?
Lösung P[X = k] =
a) P[X ≤ 2] =
e-2 (1
2
e-2
k
k!
2
22
+
+
) = 5e-2 ; b) P[X > 2] = 1 - P0 - P1 - P2
1!
2!
c) P[X = 2] = P2 = e-2
22
= 2e-2
2!
20
7.6 Ein weiteres Beispiel für Poissonverteilte Beobachtungen:
Die Zahl der fündigen Bohrlöcher pro Monat
Zahl der Bohrlöcher
Zahl der Monate
Gesamt
0
123
1
67
2
27
3
10
4
0
5
1
228
7.7 Ein weiteres Beispiel für Poissonverteilte Beobachtungen:
Die Zahl der Autos, die während 120 Zeiteinheiten der Länge von 30 sec an einer
Zählstation vorbeifahren
Zahl der Autos
Zahl der 1/2 Minuten
Gesamt
0
19
1
29
2
23
3
23
4
15
5
7
6
2
≥7
2
120
21
Übersicht zu den Approximationsregeln diskreter Zufallsvariablen
Hypergeometrische
Zähldichte
H(N,M,n)
n/N≤0.05
n/(Ν−Μ)≤0.05
p=M/N
Binomial-Zähldichte
B(n,p)
p≤0.1;n≥20;np≤10
λ=np
PoissonZähldichte
E(X)=var(X)=λ>9
B(n,p)
np(1-p)>9
E(X)=np
var(X)=np(1-p)
Normaldichte
Eine beliebige Verteilung
mit E(X) und var(X)
Herunterladen