Diplomvorprüfung Stochastik WS0607

Universität Karlsruhe (TH)
Name
Institut für Stochastik
Dr. Bernhard Klar
Dipl.-Math. oec. Volker Baumstark
Vorname
Matr.-Nr.:
Diplomvorprüfung Stochastik
09. März 2007
Diese Klausur hat bestanden, wer mindestens 16 Punkte erreicht.
Als Hilfsmittel sind nur zwei selbst erstellte DIN A4 Seiten sowie ein nicht programmierbarer Taschenrechner zugelassen!
Aufgabe
1 (7)
2 (7)
3 (6)
4 (6)
5 (7)
Punkte
Korrektor
Gesamtpunktzahl
Note
6 (7)
P
(40)
Aufgabe 1 (7 Punkte)
Ein Zufallszahlengenerator wählt in unabhängiger Folge jede der Ziffern 0, 1, 2, 3 mit gleicher Wahrscheinlichkeit 1/4 aus. Die Zufallsvariable Z k bezeichne die beim k–ten Mal ausgewählte Ziffer
(k = 1, 2, . . .). Die Zufallsvariable X n,j gebe an, wie häufig die Ziffer j unter den ersten n erzeugten
Zahlen auftritt, es sei also
Xn,j :=
n
X
1{Zk = j}
(j = 0, 1, 2, 3).
k=1
a) Bestimmen Sie E(Z1 ), V (Z1 ) und ρ(Z1 − 2Z2 , 2Z2 − Z3 ).
b) Welche Verteilung besitzt der Zufallsvektor (X n,0 , Xn,1 , Xn,2 , Xn,3 )?
Lösung:
(keine Begründung erforderlich)
c) Welche Verteilung besitzt Xn,3 ?
Lösung:
(keine Begründung erforderlich)
d) Welche Verteilung besitzt Xn,0 + Xn,3 ?
Lösung:
(keine Begründung erforderlich)
e) Berechnen Sie die Wahrscheinlichkeit, dass unter 5 erzeugten Zahlen 3 Nullen und 2 Einsen
vorkommen.
f) Berechnen Sie mit Hilfe des zentralen Grenzwertsatzes approximativ die Wahrscheinlichkeit,
dass unter 800 erzeugten Zahlen mehr als 230 Einsen vorkommen.
Einige Werte der Verteilungsfunktion Φ der Normalverteilung N (0, 1):
0
1
1.73
2
2.45
3
t
Φ(t) 0.5 0.84 0.96 0.98 0.993 0.999
Lösung zu Aufgabe 1
a) Es gelten
EZ1 =
V (Z1 ) =
3
1
(1 + 2 + 3) = ,
4
2
14 9
5
− =
4
4
4
1
7
E(Z12 ) = (1 + 4 + 9) = ,
4
2
und
ρ(Z1 − 2Z2 , 2Z2 − Z3 ) =
=
2C(Z1 , Z2 ) − C(Z1 , Z3 ) − 4C(Z2 , Z2 ) + 2C(Z2 , Z3 )
p
V (Z1 ) + 4V (Z2 )) · (4V (Z2 ) + V (Z3 ))
−4V (Z2 )
4
=− .
5V (Z1 )
5
2.5 P
b)
1 1 1 1
Mult n; , , ,
4 4 4 4
c)
1
Bin n,
4
.
.
d)
1
Bin n,
2
.
e)
P (X5,0 = 3, X5,1 = 2, X5,2 = X5,3
5!
= 0) =
3! · 2! · 0! · 0!
0.5 P
0.5 P
0.5 P
5
1
10
= 5 (≈ 0.0098).
4
4
f) Nach dem ZGWS von de Moivre-Laplace kann man hier die Bin(800, 14 )-Verteilung durch
die Normalverteilung mit Parameter µ = np = 200 und σ 2 = np(1 − p) = 150 approximieren.
Somit gilt
230 − 200
√
P (X800,1 > 230) = 1 − P (X800,1 ≤ 230) ≈ 1 − Φ
5 6
√
= 1 − Φ( 6) = 1 − 0.993 = 0.007.
1P
2P
Aufgabe 2 (7 Punkte)
Tom will im Karlsruher Zoo zur Eisbärenanlage. Er kann hierfür nach rechts (richtiger Weg) oder
nach links (falscher Weg) gehen. Fragt er einen Besucher des Zoos mit Tageskarte nach dem Weg
dorthin, so erhält er mit Wahrscheinlichkeit 2/3 die richtige Antwort und mit Wahrscheinlichkeit 1/3
eine falsche Antwort. Fragt er einen Dauerkartenbesitzer nach dem Weg dorthin, so erhält er stets
die richtige Antwort. Antworten und Eintrittskarten von verschiedenen Personen sind unabhängig.
Die Wahrscheinlichkeit, dass eine zufällig angesprochene Person eine Dauerkarte besitzt, sei 1/10.
a) Zeichnen Sie das zu dem 2-stufigen Experiment gehörende Baumdiagramm, und tragen Sie
die Start- und Übergangswahrscheinlichkeiten ein.
b) Tom fragt einen Besucher B1 nach dem Weg zur Eisbärenanlage. Mit welcher Wahrscheinlichkeit erhält er eine richtige Antwort?
c) Wie groß ist die bedingte Wahrscheinlichkeit, dass der Besucher B1 eine Dauerkarte besitzt,
wenn er die richtige Antwort gegeben hat?
d) Tom fragt einen weiteren Besucher B2 nach dem Weg zur Eisbärenanlage. Mit welcher Wahrscheinlichkeit geben B1 und B2 dieselbe Antwort?
e) Wie groß ist die bedingte Wahrscheinlichkeit, dass der Besucher B1 eine Tageskarte besitzt,
wenn B1 und B2 dieselbe Antwort geben?
Lösung zu Aufgabe 2
a) D := Dauerkarte, T := Tageskarte, R := Antwort richtig, F := Antwort falsch,
1P
1
1
10
Start HH
9
10
HH
*
D
H
j
H
T
2
3
@
@
- R
1
10
- R
6
10
@
R
@ F
3
10
@
1@
3 @
@
b) Der Index 1 beziehe sich auf B1. Aus obigem Diagramm lesen wir ab
P (R1 ) = P (D1 ∩ R1 ) + P (T1 ∩ R1 ) =
6
7
1
+
= .
10 10
10
1P
c) Unser Diagramm und Teil a) liefern
1P
P (D1 |R1 ) =
1/10
1
P (D1 ∩ R1 )
=
= .
P (R1 )
7/10
7
d) Der Index 2 beziehe sich auf B2. Es sei C das Ereignis, dass B1 und B2 dieselbe Antwort
geben. Analog zu a) gilt
7
P (R2 ) = .
10
Die gesuchte Wahrscheinlichkeit berechnet sich wegen der Unabhängigkeit von R1 und R2
bzw. F1 und F2 zu
P (C) = P (R1 ∩ R2 ) + P (F1 ∩ F2 )
= P (R1 )P (R2 ) + P (F1 )P (F2 ) =
7
10
2
+
3
10
2
=
1.5 P
49 + 9
58
=
.
100
100
e) Es gelten unter Beachtung des Teils a)
P (T1 ∩ R1 ∩ R2 ) = P (T1 ∩ R1 )P (R2 ) =
6 7
42
·
=
10 10
100
P (T1 ∩ F1 ∩ F2 ) = P (T1 ∩ F1 )P (F2 ) =
9
3 3
·
=
.
10 10
100
und
Folglich
P (T1 ∩ C) = P (T1 ∩ R1 ∩ R2 ) + P (T1 ∩ F1 ∩ F2 ) =
Die gesuchte Wahrscheinlichkeit berechnet sich mit c) zu
P (T1 |C) =
51
P (T1 ∩ C)
= .
P (C)
58
9
51
42
+
=
.
100 100
100
2.5 P
Aufgabe 3 (6 Punkte)
Sei X exponentialverteilt mit Parameter λ > 0, d.h. X besitze die Dichte
f (x) = λe−λx ,
x > 0.
a) Bestimmen Sie den Median von X.
b) Berechnen Sie die Verteilungsfunktion und Dichte der Zufallsvariablen Y := e αX , α > 0.
c) Bestimmen Sie alle α > 0, für die der Erwartungswert von Y existiert. Berechnen Sie EY für
alle derartigen α.
Lösung zu Aufgabe 3
a) Die Verteilungsfunktion F von X ist gegeben durch
F (x) = 1 − e−λx ,
1.5 P
x > 0,
und F (x) = 0 für x ≤ 0. Wegen
F (x) =
1
2
e−λx =
⇔
berechnet sich der Median von X zu
1
2
⇔
λx = − log
1
2
⇔
x=
1
· log 2
λ
log 2
.
λ
b) Wegen X > 0 ist Y = eαX > 1. Für t > 1 gilt
log t
P (Y ≤ t) = P (αX ≤ log t) = P X ≤
α
log t
= 1 − exp −λ ·
α
2.5 P
= 1 − t−λ/α .
Eine Dichte für Y ist folglich durch
f (t) :=
dP (Y ≤ t)
λ
· 1{t > 1} = · t−λ/α−1 · 1{t > 1}
dt
α
gegeben.
c) Nach der Transformationsformel für Erwartungswerte gilt
EY =
Z
∞
αx
e λe
0
−λx
dx =
Z
0
∞
λe
−(λ−α)x
dx =


 ∞


λ
λ−α
für α ≥ λ
für α < λ.
Der Erwartungswert existiert also für α < λ und berechnet sich in diesem Fall zu λ/(λ − α).
2P
Aufgabe 4 (6 Punkte)
Es sei (U, V ) ein zweidimensionaler Zufallsvektor mit Dichte
f (u, v) =
u −u/v
e
1{u>0,0<v<1} .
v2
a) Zeigen Sie, dass U ∼ Exp(1) und V ∼ U(0, 1) gilt.
b) Berechnen Sie die Kovarianz C(U, V ) zwischen U und V .
Z ∞
x2 e−x dx = 2 verwenden.
Hinweis: Sie können ohne Beweis
0
c) Sind U und V unabhängig?
Lösung zu Aufgabe 4
a) Die Dichte fV von V ergibt sich durch
fV (v) =
Z
∞
0
u −u
e v du =
v2
Z
∞
xe−x dx = 1,
0
v ∈ (0, 1),
2P
und fV (v) = 0 sonst. Somit ist V auf (0, 1) gleichverteilt.
Ferner gilt für u > 0
fU (u) =
Z
1
0
u −u
e v dv =
v2
Z
∞
e−x dx = e−u .
u
Somit ist U exponentialverteilt mit Parameter 1.
b) Für U ∼ Exp(1) bzw. W ∼ U(0, 1) gilt
EU = 1,
EV =
1
.
2
3P
Ferner ist
Z
1Z ∞
Z
1Z ∞
u2 −u/v
e
dudv
v
0
0
0
0
Z 1
Z 1 Z ∞
2
v 2 dv = .
v2
x2 e−x dxdv = 2
=
3
0
0
0
E(U V ) =
uvf (u, v)dudv =
Somit
C(U, V ) = EU V − EU EV =
2 1
1
− = .
3 2
6
c) Aus C(U, V ) 6= 0 folgt, dass U und V nicht unabhängig sind.
1P
Aufgabe 5 (7 Punkte)
Die Zufallsvariablen X1 , . . . , Xn seien unabhängig und identisch verteilt mit
P (X1 = k) =
k+r−1
k
r
r+µ
r µ
r+µ
k
,
k ∈ N0 .
Dabei ist r ∈ N bekannt und µ > 0 unbekannt.
a) Zeigen Sie, dass
n
1X
µ̂n =
Xi
n
i=1
P
der Maximum-Likelihood-Schätzer für µ ist, falls ni=1 Xi > 0 ist.
b) Ist µ̂n erwartungstreu für µ?
c) Berechnen Sie die Varianz von µ̂n und die mittlere quadratische Abweichung
M QAµ̂n (µ) = Eµ (µ̂n − µ)2 .
d) Ist die Folge (µ̂n )n∈N konsistent für µ?
Hinweis: Sie können ohne Beweis Eµ X1 = µ und Vµ (X1 ) =
µ(r + µ)
benutzen.
r
Lösung zu Aufgabe 5
a) Für x = (x1 , . . . , xn ), wobei x1 , . . . , xn ∈ N0 , gilt:
n Y
xi + r − 1
r xi
r
µ
Lx (µ) =
xi
r+µ
r+µ
i=1
nr Pni=1 xi Y
n xi + r − 1
µ
r
.
=
xi
r+µ
r+µ
i=1
|
{z
}
=:c
Folglich
log Lx (µ) = nr(log r − log(µ + r)) +
n
X
i=1
xi (log µ − log(r + µ)) + log c
und
r
= µ(µ+r)
}|
z
{
n X
d
1
nr
1
·xi
log Lx (µ) = −
+
−
dµ
µ+r
µ µ+r
i=1
nr
1
=
−1 + x̄n ·
=0 ⇔
µ+r
µ
sowie
nr
1
d2
log Lx (x̄n ) =
· −
< 0,
d2 µ
x̄n + r
x̄n
µ = x̄n ,
4P
falls x̄n > 0. Folglich ist
n
1X
µ̂n := X̄n =
Xi
n
i=1
P
der gesuchte Maximum-Likelihood-Schätzer, falls ni=1 Xi > 0 ist.
b) Wegen Eµ X̄n = µ ist µ̂n erwartungstreu.
c) Die mittlere quadratische Abweichung stimmt wegen der Erwartungstreue von µ̂ n mit Vµ (µ̂n )
überein und es gilt
Vµ (X1 )
µ(r + µ)
MAQµ̂n (µ) = Vµ (µ̂n ) =
=
.
n
nr
1P
1P
d) Die Folge (µ̂n )n∈N ist konsistent: Für ε > 0 folgt aus der Tschebyscheff-Ungleichung
Pµ (|µ̂n − µ| ≥ ε) ≤
Vµ (µ̂n )
µ(r + µ)
=
→0
2
ε
nrε2
für n → ∞.
Alternativ folgt die Konsistenz direkt aus dem Schwachen Gesetz großer Zahlen.
1P
Aufgabe 6 (7 Punkte)
In einer Studie soll gezeigt werden, dass bei trainierten Personen der mittlere systolische Blutdruck
niedriger als der Normalwert von 80mmHG ist. Dazu wird bei n Sportlern der Blutdruck gemessen,
wobei wir annehmen, dass die Blutdruckwerte als Realisierungen unabhängiger Zufallsvariablen mit
gleicher Normalverteilung N (µ, 16) modelliert werden können.
a) Formulieren Sie eine geeignete Hypothese und Alternative und geben Sie ein Testverfahren
√
basierend auf der Testgröße Tn = n(X̄n − 80)/4 an, das geeignet ist, die obige Behauptung
statistisch nachzuweisen“.
”
Wie muss dabei der kritische Wert gewählt werden, wenn der Stichprobenumfang n = 30 und
das Signifikanzniveau α = 1% betragen soll?
b) Was ist das Testergebnis, wenn bei den 30 Sportlern x̄ 30 =78mmHG gemessen wurde.
c) Bestimmen Sie die Gütefunktion des Tests.
d) Wie groß ist die Wahrscheinlichkeit des Fehlers 2. Art, wenn im Falle n = 30 der mittlere
systolische Blutdruck in Wirklichkeit 78mmHG beträgt?
e) Was könnte der Leiter der Studie tun, um die Fehlerwahrscheinlichkeit in d) zu verringern?
Einige Werte der Verteilungsfunktion Φ der Normalverteilung N (0, 1):
t
Φ(t)
0
0.5
0.41
0.66
1.28
0.9
1.65
0.95
1.96
0.975
2.33
0.99
2.58
0.995
Lösung zu Aufgabe 6
a) Man muss als Hypothese H0 : ϑ ≥ 80 und als Alternative H1 : ϑ < 80 wählen. Nur dann
ist bei Ablehnung von H0 die Aussage “bei trainierten Personen ist der mittlere systolische
Blutdruck niedriger als 80mmHG“ statistisch gesichert.
2P
Da kleine Werte von Tn gegen H0 sprechen, und da Tn unter H0 standardnormalverteilt ist,
muss H0 zum Niveau α = 0.01 verworfen werden, wenn T n ≤ z0.01 = Φ−1 (0.01) = −2.33 ist.
Andernfalls besteht kein Einwand gegen H 0 .
√
b) Wegen T30 = 30(X̄30 −80)/4 = −2.74 < z0.01 wird H0 wird auf dem 1%–Niveau abgelehnt.
c) Die Gütefunktion des Tests ist
√
n(X̄n − 80)
≤ z0.01
g(µ) = Pµ (Test verwirft H0 ) = Pµ
4
√
√
n(X̄n − µ)
n(80 − µ)
= Pµ
≤ z0.01 +
4
4
√
n(80 − µ)
= Φ z0.01 +
.
4
1P
2P
d) Für µ = 78 ist die Wahrscheinlichkeit des Fehlers 2. Art
β = 1 − g(78) = 1 − Φ(−2.33 + 2.74) = 1 − Φ(0.41) = 0.34.
e) Der Studienleiter könnte den Stichprobenumfang erhöhen, denn dann nimmt die Güte des
Tests zu, es verringert sich also die Wahrscheinlichkeit, dass bei Vorliegen der Alternative die
Hypothese H0 fälschlicherweise nicht abgelehnt wird.
Eine weitere Möglichkeit wäre, den Fehler 1. Art anzuheben (etwa auf α = 5%).
1P
1P