Höchstens 10% defekt Es wird

Lösungsvorschläge zu Blatt 3
20) Die gelieferte Packung enthalte 100 Stück.
Lieferbedingungen: Höchstens 10% defekt
Es wird zufällige Stichprobe o.Z. von 10 Stück gezogen.
Bevor die Stichprobe gezogen und ausgewertet wird, ist
X:= Anzahl der defekten Stücke in der Stichprobe
eine hypergeometrisch verteilte Zufallsvariable mit den Parametern
N = Anzahl der Stücke in der Packung = 100,
M = Anzahl der defekten Stücke in der Packung,
n = Anzahl der Ziehungen (o.Z.) = 10.
Damit gilt:
P (X = m) =
M
m
N −M
n−m
N
n
=
M
m
100−M
10−m
100
10
Die Packung wird zurückgewiesen, wenn mindestens ein Stück in der Stichprobe
defekt ist. Die Wahrscheinlichkeit dafür ist:
P (X > 1) = 1 − P (X = 0)
a) Für M = 10 erhalten wir für die Wahrscheinlichkeit für die irrtümliche Zurückweisung einer Packung:
10 90
10
0
P (X > 1) = 1 − 100
10
1 · 90 · 89 · . . . · 81 · 10!
90 · 89 · . . . · 81
= 1−
= 0.670
10! · 100 · 99 · . . . · 91
100 · 99 · . . . · 91
b) M ist jetzt nicht mehr bekannt, aber wir wissen, dass M 6 10 (statt M = 10)
gilt, da die Lieferbedingungen erfüllt sind. Eine Zurückweisung bei weniger als 10
defekten Stücken in der Packung ist höchstens genauso wahrscheinlich wie eine
Zurückweisung bei genau 10 defekten Stücken. Da aber M 6 10 u.a. den Fall
M = 10 einschließt, müssen wir von einer Wahrscheinlichkeit von 0.670 für eine
irrtümliche Ablehnung der Packung ausgehen.
= 1−
Die Aufgabe 20 b) ist damit gelöst. Wir wollen aber trotzdem die Wahrscheinlichkeit für eine irrtümliche Ablehnung der Packung direkt abschätzen. Dazu
verwenden wir die Abschätzung
n2
n1
für m ≤ n1 ≤ n2 ,
≤
m
m
1
die sich aus der Ungleichungskette
n1 · (n1 − 1) · · · (n1 − m + 1)
n1
n2 · (n1 − 1) · · · (n1 − m + 1)
=
≤
m
m!
m!
n2 · (n2 − 1) · (n1 − 2) · · · (n1 − m + 1)
≤
≤ ...
m!
n2 · (n2 − 1) · (n2 − 2) · · · (n2 − m + 1) · (n1 − m + 1)
≤
m!
n2 · (n2 − 1) · · · (n2 − m + 1)
n2
≤
=
m
m!
ergibt, wobei die Positivität aller Faktoren in den Zählern zu beachten ist. Da
nun 100 − M ≥ 100 − 10 ≥ 10 ist erhalten wir daraus:
100 − M M
100 − M 1·
10
0
10
P (X > 1)|M ≤10 = 1 −
= 1−
100
100
10
10
M ≤10
M ≤10
100 − M 1·
a)
10
= P (X > 1)|M =10 = 0.670.
≤ 1−
100
10
M =10
21)
N, n vergl. Aufgabe 20)
Wir haben jetzt 11 defekte Stücke in der Packung, die Lieferbedingungen sind
also verletzt.
Die Wahrscheinlichkeit für die irrtünliche Annahme der Packung
11 89
89 · 88 · . . . · 80
10!
10
0
P (X = 0) = =
·
= 0.294
100
10!
100 · 99 · . . . · 91
10
ist also ziemlich groß.
Da also sowohl eine irrtümliche Ablehnung als auch eine irrtümliche Annahme
der Packung noch sehr wahrscheinlich sind, ist die Stichprobe zu klein.
22) Die gelieferte Packung enthalte 10000 Stück, 100 davon sind defekt
Zufällige Stichprobe von 250 (o.Z.)
Bevor die Stichprobe gezogen und ausgewertet wird, ist
X:= Anzahl der defekten Stücke in der Stichprobe
eine hypergeometrisch verteilte Zufallsvariable mit den Parametern
2
N = Anzahl der Stücke in der Lieferung = 10000,
M = Anzahl der defekten Stücke in der Lieferung = 100,
n = Anzahl der Ziehungen (o.Z.) = 250.
Damit gilt:
9900
100
250 − m
m
P (X = m) =
10000
250
Die Näherung durch die Binomialverteilung ist gut genug, da N = 10000 > 1000
und n/N = 0.025 6 0.1.
Damit gilt also
M
n m
p (1 − p)n−m
n = 250, p =
P (X = m) ≈
= 0.01
m
N
Die Näherung durch die Poisson-Verteilung gut genug, da n = 250 > 50 und
λ := n · p = 2.5 6 5.
Damit gilt also
2.5m
P (X = m) ≈ e−2.5
m!
a)
2.5 2.52
2.5 2.52
−2.5
−2.5
1+
=e
= 0.544
+
+
1+
P (X 6 2) ≈ e
1!
2!
1
2
p
b) Wir suchen die Wahrscheinlichkeit P |X − E(X)| 6 V (X) .
Dazu müssen wir zunächst den Erwartungswert und die Varianz berechnen. Wir
könnten auch dazu die Näherung durch die Poisson–Verteilung verwenden, aber
die Berechnung über die hypergeometrische Verteilung selbst ist kaum aufwändiger und bei diskreten Verteilungen wirken sich kleine Ungenauigkeiten in Intervallgrenzen stärker aus als bei stetigen Verteilungen. Aus den Formeln in Satz
7.6.9 erhalten wir sofort:
E(X) = 250 ·
100
= 2.5(= λ),
10000
V (X) = 2.5 ·
9900 9750
·
= 2.413(≈ λ),
10000 9999
√
σ = 2.413 = 1.554.
Für die gesuchte Wahrscheinlichkeit erhalten wir also:
P (|X − 2.5| 6 1.554) = P (2.5 − 1.554 6 X 6 2.5 + 1.554)
= P (0.946 6 X 6 4.054) = P (X = 1) + . . . + P (X = 4)
1
2.52 2.53 2.54
2.5
−2.5
+
+
+
≈ e
1!
2!
3!
4!
1
2
3
2.5
2.5
2.54
2.5
−2.5
= 0.809
+
+
+
= e
1
2
6
24
3
23) Randverteilungen
↓ X| Y → −1
−1
0
1
0
2
0.5
0.5
1
5
0 0.1
0.4 0
0
0
0.4 0.1
0.1
0.4
0.5
1.0
Beispiele:
P (X = 1 ∧ Y = 1) = 0.4
P (X = 1) = 0.4
P (Y = 5) = 0.1
Erwartungswerte und Varianzen:
E(X) = (−1) · 0.1 + 1 · 0.4 + 2 · 0.5 = 1.3
E(X 2 ) = (−1)2 · 0.1 + 12 · 0.4 + 22 · 0.5 = 2.5
V (X) = 2.5 − 1.32 = 0.81
E(Y ) = (−1) · 0.5 + 1 · 0.4 + 5 · 0.1 = 0.4
E(Y 2 ) = (−1)2 · 0.5 + 12 · 0.4 + 52 · 0.1 = 3.4
V (Y ) = 3.4 − 0.42 = 3.24
Die Lösung dieser Aufgabe ist damit abgeschlossen. Zur Vorbereitung der Lösung
von Aufgabe 28 sind noch einige Berechnungen durchzuführen. Zunächst bestimmen wir E(X · Y ). Dies ist die Summe aller Produkte aus den möglichen Werten
von X und Y und den zugehörigen Wahrscheinlichkeiten. Die Produkte, bei denen
mindestens ein Faktor = 0 ist, sind gleich weggelassen worden:
E(X · Y ) = 2 · (−1) · 0.5 + 1 · 1 · 0.4 + (−1) · 5 · 0.1 = −1.1
Cov(X, Y ) := E(X · Y ) − E(X) · E(Y ) = −1.1 − 1.3 · 0.4 = −1.62
σ(X) = 0.9,
σ(Y ) = 1.8
24) a)
Sind X und Y aus 23) unabhängig? Da X und Y diskrete ZV sind, ist dies
gleichbedeutend mit pi,j = pi,∗ · p∗,j für alle i, j. Da schon
P (X = −1 ∧ Y = −1) = 0 6= P (X = −1) · P (Y = −1) = 0.1 · 0.5 ist, sind X
und Y nicht unabhängig.
b)
↓ X| Y →
0
1
2
0
0.18 0.30 0.12
1
0.12 0.20 0.08
0.30 0.50 0.20
4
0.60
0.40
1.00
Wir prüfen, ob jedes Produkt von Randverteilungswahrscheinlichkeiten gleich der
zugehörigen Wahrscheinlichkeit der gemeinsamen Verteilung ist:
0.30 · 0.60 = 0.18, 0.50 · 0.60 = 0.30, 0.20 · 0.60 = 0.12, 0.30 · 0.40 = 0.12,
0.50 · 0.40 = 0.20, 0.20 · 0.40 = 0.08.
Es gilt also tatsächlich pi,j = pi,∗ ·p∗,j für alle i, j. Damit sind X und Y unabhängig.
25) Bei dieser Aufgabe sind die Wahrscheinlichkeiten P (X = xi ), P (Y = yj )
vorgegeben, also die Wahrscheinlichkeiten der Randverteilung. Wegen der Unabhängigkeit der ZV kann man daraus leicht die Wahrscheinlichkeiten der gemeinsamen Verteilung ermitteln:
pi,j := P (X = xi ∧ Y = yj ) = P (X = xi ) · P (Y = yj ) für alle i, j.
Ausrechnungsbeispiel: P (X = 1.5 ∧ Y = 2.5) = 0.5 · 0.1 = 0.05
↓ X| Y →
0
1.5
2
3
1
0.03
0.15
0.06
0.06
0.3
2
0.04
0.20
0.08
0.08
0.4
2.5
0.01
0.05
0.02
0.02
0.1
4
0.01
0.05
0.02
0.02
0.1
5
0.01
0.05
0.02
0.02
0.1
0.1
0.5
0.2
0.2
1.0
26)
Es sei Xi =
1 mit Wahrscheinlichkeit p,
(Erfolg)
0 mit Wahrscheinlichkeit q := 1 − p,
(Fehlschlag)
Sn := X1 + X2 + . . . + Xn
a) Nach Satz 7.8.4 a) gilt:
E(Sn ) = E(X1 ) + E(X2) + . . . + E(Xn ) = np.
| {z } | {z }
| {z }
=p
=p
=p
Aus der Unabhängigkeit der ZV X1 , X2 , . . . , Xn folgt nach Satz 7.8.4 b)
V (Sn ) = V (X1 ) + V (X2 ) + . . . + V (Xn ) = npq
| {z }
| {z } | {z }
=pq
=pq
=pq
b) Bei der Bestimmung der Verteilung von Sn verwenden wir, dass
Xi einem Zufallsexperiment mit 2 Ausgängen (Erfolg oder Fehlschlag) entspricht.
Sn := X1 + X2 + . . . + Xn ist also die Anzahl der Erfolge bei n Versuchen.
Erläuterung:
3 Beispiele für Realisierungen von X1 , . . . , Xn :
1. Beispiel: x1 = . . . = xn = 1 : sn = n · 1 = n
2. Beispiel: x1 = . . . = xn = 0 : sn = n · 0 = 0
3. Beispiel: x1 = x3 = 1, übrige xi = 0 : sn = 1 + 0 + 1 + 0 + . . . + 0 = 2
5
Nach den Erläuterungen bei der Einführung der Binomialverteilung ist Sn damit
binomialverteilt mit der Parametern p und n.
Die Aufgabe ist damit gelöst. Um aber insbesondere die (bisher nur erläuterte
aber nicht bewiesene) Formel für den Binomialkoeffizienten herzuleiten, beweisen wir für die Darstellung der Wahrscheinlichkeitsverteilung mit vollständiger
Induktion:
Behauptung:
n k n−k
p q
für alle k = 0, 1, . . . , n
P (Sn = k) =
k
(1)
gilt für alle n ∈ N
Beweis durch Induktion:
Induktionsanfang: (1) gilt für n = 1:
P (S1 = k) = P (X1 = k) =
Induktionsschluss:
Fall 1: 1 6 k 6 n
q=
p=
1
0
1
1
· p0 q 1−0
· p1 q 1−1
für k = 0
für k = 1
n l n−l
pq
für alle l = 0, 1, . . . , n
P (Sn = l) =
l
⇒ P (Sn+1 = k)
=
Unahängigkeit
=
(2)
=
=
=
Fall 2: k = 0
(2)
P (Sn = k ∧ Xn+1 = 0) ∨ (Sn = k − 1 ∧ Xn+1 = 1)
P (Sn = k) · P (Xn+1 = 0) + P (Sn = k − 1) · P (Xn+1 = 1)
n
n k n−k
pk−1 q n−k+1 · p
p q
·q+
k−1
k
n
n k n−k+1
pk q n−k+1
p q
+
k−1
k
n + 1 k n+1−k
n
n
k n+1−k
p q
p q
=
+
k
k−1
k
n 0 n−0
pq
P (Sn = 0) =
0
(3)
Unahängigkeit
⇒ P (Sn+1 = 0) = P Sn = 0 ∧ Xn+1 = 0
=
P (Sn = 0) · P (Xn+1 = 0)
n + 1 0 n+1−0
n 0 n−0
(3)
pq
pq
·q =
=
0
0
6
Fall 3: k = n + 1
n n n−n
p q
P (Sn = n) =
n
(4)
Unahängigkeit
⇒ P (Sn+1 = n + 1) = P Sn = n ∧ Xn+1 = 1
=
P (Sn = n) · P (Xn+1 = 1)
n + 1 n+1 (n+1)−(n+1)
n n n−n
(4)
p q
p q
·p=
=
n+1
n
27) Wir nutzen, dass die Summe der Wahrscheinlichkeiten der gemeinsamen Verteilung gleich der passenden Wahrscheinlichkeit der Randverteilungen ist und
dass die Summe der Randverteilungen zu Y gleich 1 ist.
1. Rechengang:
↓ X| Y →
−1
0
2
3
4
6
0 1/8 2/8
∗
0
∗
∗
0 1/8
2/8 1/8 5/8
3/8
∗
∗
1
↓ X| Y →
−1
0
2
3
4
6
0 1/8 2/8
∗
0 2/8
∗
0 1/8
2/8 1/8 5/8
3/8
∗
∗
1
2. Rechengang:
Jetzt brauchen wir die zusätzliche Angabe über den Erwartungswert:
3
6
3
3 !
= E(X) = (−1) · + 2 · P (X = 2) ⇒ 2 · P (X = 2) = ⇒ P (X = 2) =
8
8
8
8
4. Rechengang:
↓ X| Y → 3
4
6
−1
0 1/8 2/8
0
∗
0 2/8
2
2/8 0 1/8
2/8 1/8 5/8
3/8
∗
3/8
1
↓ X| Y → 3
4
6
−1
0 1/8 2/8
0
0
0 2/8
2
2/8 0 1/8
2/8 1/8 5/8
3/8
2/8
3/8
1
5. Rechengang:
7
28)
a)

Cov(X, Y ) = 0 

Jede der ZV X, Y nimmt mehr als einen Wert mit


Wahrscheinlichkeit > 0 an ⇒ V (X), V (Y ) > 0
Die ZVX,Yin Aufg. 25 sind unabhängig
⇒
Satz 7.8.3
⇒
ρ(X, Y ) = 0, d.h. X und Y sind unkorreliert.
In Aufg. 23 wurden bereits folgende Werte ermittelt: Cov(X, Y ) = −1.62,
σ(X) = 0.9, σ(Y ) = 1.8. Damit erhalten wir:
−1.62
Cov(X, Y )
=
= −1
σ(X) · σ(Y )
0.9 · 1.8
Es besteht also ein extremer linearer Zusammenhang zwischen X un Y und
damit gilt Y = a + bX für geeignete Zahlen a ∈ R, b < 0 (f.s.). Um die
Werte für a und b zu bestimmen, setzen wir mögliche Werte für die ZV X
und Y ein und betrachten dabei nur Kombinationen mit Wahrscheinlichkeit
> 0 nach der in Aufgabe 23 vorgegebenen Tabelle:
↓ X Y → −1 1
5
ρ(X, Y ) :=
−1
1
2
0
0 0.1
0 0.4 0
0.5 0
0
Die möglichen Wertekombinationen notieren wir in Tabellenform:
Y = a + bX
X Y
-1 5 5 = a + (−1) · b
1 1
1=a+1·b
Die Addition der beiden Gleichungen liefert 2a = 6, d.h. a = 3.
b = a − 5 = 3 − 5 = −2
Kontrolle (die aber nicht durchgeführt zu werden braucht): X = 2, Y = −1:
−1 = 3 + (−2) · 2
Bem.: Wenn hier (−2) statt (−1) ein möglicher Wert für Y wäre, so würde
man keinen extremen linearen Zusammenhang erhalten; denn für X = 2,
Y = −1 müsste −2 = 3+(−2)·2 gelten, was aber offensichtlich nicht richtig
ist. Es würde dann aber auch |ρ(X, Y )| < 1 herauskommen.
b) (i )
↓ X Y →
0
1
2
0
0.08
0.07
0.20
0.35
8
1
0.08
0.10
0.15
0.33
2
0.09
0.08
0.15
0.32
0.25
0.25
0.50
1.00
E(X) = 1 · 0.25 + 2 · 0.50 = 1.25
E(Y ) = 1 · 0.33 + 2 · 0.32 = 0.97
2
2
2
E(X ) = 1 · 0.25 + 2 · 0.50 = 2.25 E(Y 2 ) = 12 · 0.33 + 22 · 0.32 = 1.61
V (X) = 2.25 − 1.252 = 0.6875
V (Y ) = 1.61 − 0.972 = 0.6691
Cov(X, Y ) := E(X · Y ) − E(X) · E(Y )
= (1 · 1 · 0.10 + 1 · 2 · 0.08 · +2 · 1 · 0.15 + 2 · 2 · 0.15) − 1.25 · 0.97
= −0.0525,
ρ(X, Y ) = √
−0.0525
= −0.0774.
0.6875 · 0.6691
X und Y sind also schwach negativ korreliert.
(ii )
↓ X Y →
0
1
2
0
1
2
0.01 0 0.39
0 0.30 0
0.28 0.02 0
0.29 0.32 0.39
0.40
0.30
0.30
1.00
E(X) = 1 · 0.30 + 2 · 0.30 = 0.90
E(Y ) = 1 · 0.32 + 2 · 0.39 = 1.10
E(X 2 ) = 12 · 0.30 + 22 · 0.30 = 1.50 E(Y 2 ) = 12 · 0.32 + 22 · 0.39 = 1.88
V (X) = 1.50 − 0.902 = 0.6900
V (Y ) = 1.88 − 1.102 = 0.6700
Cov(X, Y ) = (1 · 1 · 0.30 + 2 · 1 · 0.02) − 0.90 · 1.10 = −0.6500,
ρ(X, Y ) = √
−0.6500
= −0.9560.
0.6900 · 0.6700
X und Y sind also stark negativ korreliert.
29) Aus der Verteilung für X und aus der Beziehung Y = X 2 erhalten wir sofort
folgende Einträge für die gemeinsame Verteilung und die Randverteilungen:
↓ X| Y → 1 4
−2
0 *
−1
* 0
1
* 0
2
0 *
* *
1/4
1/4
1/4
1/4
Daraus ergeben sich nach Satz 7.7.1 b) (Summe der Einträge der gemeinsamen
Verteilung in einer Zeile = Eintrag der Randverteilung in dieser Zeile, Summe
9
der Einträge der gemeinsamen Verteilung in einer Spalte = Eintrag der Randverteilung in dieser Spalte) sofort die übrigen Einträge der gemeinsamen Verteilung
und der Randverteilungen:
↓ X| Y → 1
4
−2
0 1/4
−1
1/4 0
1
1/4 0
2
0 1/4
1/2 1/2
1/4
1/4
1/4
1/4
X, Y sind nicht unabhängig aus zwei Gründen:
1.) Y ist sogar Funktion von X und V (X), V (Y ) > 0.
2.) P (X = −2 ∧ Y = 1) = 0 6= 18 = P (X = −2) · P (Y = 1) (zum Beispiel)

1


E(X) = · (−2 − 1 + 1 + 2) = 0
4
⇒ Cov(X, Y ) = E(X·Y )−E(X)E(Y ) = 0
1

E(X · Y ) = E(X 3 ) = · (−8 − 1 + 1 + 8) = 0 
4
Ergebnis: X und Y sind unkorreliert, aber nicht unabhängig.
10