Diplomvorprüfung Stochastik WS0607

Werbung
Universität Karlsruhe (TH)
Name
Institut für Stochastik
Dr. Bernhard Klar
Dipl.-Math. oec. Volker Baumstark
Vorname
Matr.-Nr.:
Diplomvorprüfung Stochastik
09. März 2007
Diese Klausur hat bestanden, wer mindestens 16 Punkte erreicht.
Als Hilfsmittel sind nur zwei selbst erstellte DIN A4 Seiten sowie ein nicht programmierbarer Taschenrechner zugelassen!
Aufgabe
1 (7)
2 (7)
3 (6)
4 (6)
5 (7)
Punkte
Korrektor
Gesamtpunktzahl
Note
6 (7)
P
(40)
Aufgabe 1 (7 Punkte)
Ein Zufallszahlengenerator wählt in unabhängiger Folge jede der Ziffern 0, 1, 2, 3 mit gleicher Wahrscheinlichkeit 1/4 aus. Die Zufallsvariable Z k bezeichne die beim k–ten Mal ausgewählte Ziffer
(k = 1, 2, . . .). Die Zufallsvariable X n,j gebe an, wie häufig die Ziffer j unter den ersten n erzeugten
Zahlen auftritt, es sei also
Xn,j :=
n
X
1{Zk = j}
(j = 0, 1, 2, 3).
k=1
a) Bestimmen Sie E(Z1 ), V (Z1 ) und ρ(Z1 − 2Z2 , 2Z2 − Z3 ).
b) Welche Verteilung besitzt der Zufallsvektor (X n,0 , Xn,1 , Xn,2 , Xn,3 )?
Lösung:
(keine Begründung erforderlich)
c) Welche Verteilung besitzt Xn,3 ?
Lösung:
(keine Begründung erforderlich)
d) Welche Verteilung besitzt Xn,0 + Xn,3 ?
Lösung:
(keine Begründung erforderlich)
e) Berechnen Sie die Wahrscheinlichkeit, dass unter 5 erzeugten Zahlen 3 Nullen und 2 Einsen
vorkommen.
f) Berechnen Sie mit Hilfe des zentralen Grenzwertsatzes approximativ die Wahrscheinlichkeit,
dass unter 800 erzeugten Zahlen mehr als 230 Einsen vorkommen.
Einige Werte der Verteilungsfunktion Φ der Normalverteilung N (0, 1):
0
1
1.73
2
2.45
3
t
Φ(t) 0.5 0.84 0.96 0.98 0.993 0.999
Lösung zu Aufgabe 1
a) Es gelten
EZ1 =
V (Z1 ) =
3
1
(1 + 2 + 3) = ,
4
2
14 9
5
− =
4
4
4
1
7
E(Z12 ) = (1 + 4 + 9) = ,
4
2
und
ρ(Z1 − 2Z2 , 2Z2 − Z3 ) =
=
2C(Z1 , Z2 ) − C(Z1 , Z3 ) − 4C(Z2 , Z2 ) + 2C(Z2 , Z3 )
p
V (Z1 ) + 4V (Z2 )) · (4V (Z2 ) + V (Z3 ))
−4V (Z2 )
4
=− .
5V (Z1 )
5
2.5 P
b)
1 1 1 1
Mult n; , , ,
4 4 4 4
c)
1
Bin n,
4
.
.
d)
1
Bin n,
2
.
e)
P (X5,0 = 3, X5,1 = 2, X5,2 = X5,3
5!
= 0) =
3! · 2! · 0! · 0!
0.5 P
0.5 P
0.5 P
5
1
10
= 5 (≈ 0.0098).
4
4
f) Nach dem ZGWS von de Moivre-Laplace kann man hier die Bin(800, 14 )-Verteilung durch
die Normalverteilung mit Parameter µ = np = 200 und σ 2 = np(1 − p) = 150 approximieren.
Somit gilt
230 − 200
√
P (X800,1 > 230) = 1 − P (X800,1 ≤ 230) ≈ 1 − Φ
5 6
√
= 1 − Φ( 6) = 1 − 0.993 = 0.007.
1P
2P
Aufgabe 2 (7 Punkte)
Tom will im Karlsruher Zoo zur Eisbärenanlage. Er kann hierfür nach rechts (richtiger Weg) oder
nach links (falscher Weg) gehen. Fragt er einen Besucher des Zoos mit Tageskarte nach dem Weg
dorthin, so erhält er mit Wahrscheinlichkeit 2/3 die richtige Antwort und mit Wahrscheinlichkeit 1/3
eine falsche Antwort. Fragt er einen Dauerkartenbesitzer nach dem Weg dorthin, so erhält er stets
die richtige Antwort. Antworten und Eintrittskarten von verschiedenen Personen sind unabhängig.
Die Wahrscheinlichkeit, dass eine zufällig angesprochene Person eine Dauerkarte besitzt, sei 1/10.
a) Zeichnen Sie das zu dem 2-stufigen Experiment gehörende Baumdiagramm, und tragen Sie
die Start- und Übergangswahrscheinlichkeiten ein.
b) Tom fragt einen Besucher B1 nach dem Weg zur Eisbärenanlage. Mit welcher Wahrscheinlichkeit erhält er eine richtige Antwort?
c) Wie groß ist die bedingte Wahrscheinlichkeit, dass der Besucher B1 eine Dauerkarte besitzt,
wenn er die richtige Antwort gegeben hat?
d) Tom fragt einen weiteren Besucher B2 nach dem Weg zur Eisbärenanlage. Mit welcher Wahrscheinlichkeit geben B1 und B2 dieselbe Antwort?
e) Wie groß ist die bedingte Wahrscheinlichkeit, dass der Besucher B1 eine Tageskarte besitzt,
wenn B1 und B2 dieselbe Antwort geben?
Lösung zu Aufgabe 2
a) D := Dauerkarte, T := Tageskarte, R := Antwort richtig, F := Antwort falsch,
1P
1
1
10
Start HH
9
10
HH
*
D
H
j
H
T
2
3
@
@
- R
1
10
- R
6
10
@
R
@ F
3
10
@
1@
3 @
@
b) Der Index 1 beziehe sich auf B1. Aus obigem Diagramm lesen wir ab
P (R1 ) = P (D1 ∩ R1 ) + P (T1 ∩ R1 ) =
6
7
1
+
= .
10 10
10
1P
c) Unser Diagramm und Teil a) liefern
1P
P (D1 |R1 ) =
1/10
1
P (D1 ∩ R1 )
=
= .
P (R1 )
7/10
7
d) Der Index 2 beziehe sich auf B2. Es sei C das Ereignis, dass B1 und B2 dieselbe Antwort
geben. Analog zu a) gilt
7
P (R2 ) = .
10
Die gesuchte Wahrscheinlichkeit berechnet sich wegen der Unabhängigkeit von R1 und R2
bzw. F1 und F2 zu
P (C) = P (R1 ∩ R2 ) + P (F1 ∩ F2 )
= P (R1 )P (R2 ) + P (F1 )P (F2 ) =
7
10
2
+
3
10
2
=
1.5 P
49 + 9
58
=
.
100
100
e) Es gelten unter Beachtung des Teils a)
P (T1 ∩ R1 ∩ R2 ) = P (T1 ∩ R1 )P (R2 ) =
6 7
42
·
=
10 10
100
P (T1 ∩ F1 ∩ F2 ) = P (T1 ∩ F1 )P (F2 ) =
9
3 3
·
=
.
10 10
100
und
Folglich
P (T1 ∩ C) = P (T1 ∩ R1 ∩ R2 ) + P (T1 ∩ F1 ∩ F2 ) =
Die gesuchte Wahrscheinlichkeit berechnet sich mit c) zu
P (T1 |C) =
51
P (T1 ∩ C)
= .
P (C)
58
9
51
42
+
=
.
100 100
100
2.5 P
Aufgabe 3 (6 Punkte)
Sei X exponentialverteilt mit Parameter λ > 0, d.h. X besitze die Dichte
f (x) = λe−λx ,
x > 0.
a) Bestimmen Sie den Median von X.
b) Berechnen Sie die Verteilungsfunktion und Dichte der Zufallsvariablen Y := e αX , α > 0.
c) Bestimmen Sie alle α > 0, für die der Erwartungswert von Y existiert. Berechnen Sie EY für
alle derartigen α.
Lösung zu Aufgabe 3
a) Die Verteilungsfunktion F von X ist gegeben durch
F (x) = 1 − e−λx ,
1.5 P
x > 0,
und F (x) = 0 für x ≤ 0. Wegen
F (x) =
1
2
e−λx =
⇔
berechnet sich der Median von X zu
1
2
⇔
λx = − log
1
2
⇔
x=
1
· log 2
λ
log 2
.
λ
b) Wegen X > 0 ist Y = eαX > 1. Für t > 1 gilt
log t
P (Y ≤ t) = P (αX ≤ log t) = P X ≤
α
log t
= 1 − exp −λ ·
α
2.5 P
= 1 − t−λ/α .
Eine Dichte für Y ist folglich durch
f (t) :=
dP (Y ≤ t)
λ
· 1{t > 1} = · t−λ/α−1 · 1{t > 1}
dt
α
gegeben.
c) Nach der Transformationsformel für Erwartungswerte gilt
EY =
Z
∞
αx
e λe
0
−λx
dx =
Z
0
∞
λe
−(λ−α)x
dx =


 ∞


λ
λ−α
für α ≥ λ
für α < λ.
Der Erwartungswert existiert also für α < λ und berechnet sich in diesem Fall zu λ/(λ − α).
2P
Aufgabe 4 (6 Punkte)
Es sei (U, V ) ein zweidimensionaler Zufallsvektor mit Dichte
f (u, v) =
u −u/v
e
1{u>0,0<v<1} .
v2
a) Zeigen Sie, dass U ∼ Exp(1) und V ∼ U(0, 1) gilt.
b) Berechnen Sie die Kovarianz C(U, V ) zwischen U und V .
Z ∞
x2 e−x dx = 2 verwenden.
Hinweis: Sie können ohne Beweis
0
c) Sind U und V unabhängig?
Lösung zu Aufgabe 4
a) Die Dichte fV von V ergibt sich durch
fV (v) =
Z
∞
0
u −u
e v du =
v2
Z
∞
xe−x dx = 1,
0
v ∈ (0, 1),
2P
und fV (v) = 0 sonst. Somit ist V auf (0, 1) gleichverteilt.
Ferner gilt für u > 0
fU (u) =
Z
1
0
u −u
e v dv =
v2
Z
∞
e−x dx = e−u .
u
Somit ist U exponentialverteilt mit Parameter 1.
b) Für U ∼ Exp(1) bzw. W ∼ U(0, 1) gilt
EU = 1,
EV =
1
.
2
3P
Ferner ist
Z
1Z ∞
Z
1Z ∞
u2 −u/v
e
dudv
v
0
0
0
0
Z 1
Z 1 Z ∞
2
v 2 dv = .
v2
x2 e−x dxdv = 2
=
3
0
0
0
E(U V ) =
uvf (u, v)dudv =
Somit
C(U, V ) = EU V − EU EV =
2 1
1
− = .
3 2
6
c) Aus C(U, V ) 6= 0 folgt, dass U und V nicht unabhängig sind.
1P
Aufgabe 5 (7 Punkte)
Die Zufallsvariablen X1 , . . . , Xn seien unabhängig und identisch verteilt mit
P (X1 = k) =
k+r−1
k
r
r+µ
r µ
r+µ
k
,
k ∈ N0 .
Dabei ist r ∈ N bekannt und µ > 0 unbekannt.
a) Zeigen Sie, dass
n
1X
µ̂n =
Xi
n
i=1
P
der Maximum-Likelihood-Schätzer für µ ist, falls ni=1 Xi > 0 ist.
b) Ist µ̂n erwartungstreu für µ?
c) Berechnen Sie die Varianz von µ̂n und die mittlere quadratische Abweichung
M QAµ̂n (µ) = Eµ (µ̂n − µ)2 .
d) Ist die Folge (µ̂n )n∈N konsistent für µ?
Hinweis: Sie können ohne Beweis Eµ X1 = µ und Vµ (X1 ) =
µ(r + µ)
benutzen.
r
Lösung zu Aufgabe 5
a) Für x = (x1 , . . . , xn ), wobei x1 , . . . , xn ∈ N0 , gilt:
n Y
xi + r − 1
r xi
r
µ
Lx (µ) =
xi
r+µ
r+µ
i=1
nr Pni=1 xi Y
n xi + r − 1
µ
r
.
=
xi
r+µ
r+µ
i=1
|
{z
}
=:c
Folglich
log Lx (µ) = nr(log r − log(µ + r)) +
n
X
i=1
xi (log µ − log(r + µ)) + log c
und
r
= µ(µ+r)
}|
z
{
n X
d
1
nr
1
·xi
log Lx (µ) = −
+
−
dµ
µ+r
µ µ+r
i=1
nr
1
=
−1 + x̄n ·
=0 ⇔
µ+r
µ
sowie
nr
1
d2
log Lx (x̄n ) =
· −
< 0,
d2 µ
x̄n + r
x̄n
µ = x̄n ,
4P
falls x̄n > 0. Folglich ist
n
1X
µ̂n := X̄n =
Xi
n
i=1
P
der gesuchte Maximum-Likelihood-Schätzer, falls ni=1 Xi > 0 ist.
b) Wegen Eµ X̄n = µ ist µ̂n erwartungstreu.
c) Die mittlere quadratische Abweichung stimmt wegen der Erwartungstreue von µ̂ n mit Vµ (µ̂n )
überein und es gilt
Vµ (X1 )
µ(r + µ)
MAQµ̂n (µ) = Vµ (µ̂n ) =
=
.
n
nr
1P
1P
d) Die Folge (µ̂n )n∈N ist konsistent: Für ε > 0 folgt aus der Tschebyscheff-Ungleichung
Pµ (|µ̂n − µ| ≥ ε) ≤
Vµ (µ̂n )
µ(r + µ)
=
→0
2
ε
nrε2
für n → ∞.
Alternativ folgt die Konsistenz direkt aus dem Schwachen Gesetz großer Zahlen.
1P
Aufgabe 6 (7 Punkte)
In einer Studie soll gezeigt werden, dass bei trainierten Personen der mittlere systolische Blutdruck
niedriger als der Normalwert von 80mmHG ist. Dazu wird bei n Sportlern der Blutdruck gemessen,
wobei wir annehmen, dass die Blutdruckwerte als Realisierungen unabhängiger Zufallsvariablen mit
gleicher Normalverteilung N (µ, 16) modelliert werden können.
a) Formulieren Sie eine geeignete Hypothese und Alternative und geben Sie ein Testverfahren
√
basierend auf der Testgröße Tn = n(X̄n − 80)/4 an, das geeignet ist, die obige Behauptung
statistisch nachzuweisen“.
”
Wie muss dabei der kritische Wert gewählt werden, wenn der Stichprobenumfang n = 30 und
das Signifikanzniveau α = 1% betragen soll?
b) Was ist das Testergebnis, wenn bei den 30 Sportlern x̄ 30 =78mmHG gemessen wurde.
c) Bestimmen Sie die Gütefunktion des Tests.
d) Wie groß ist die Wahrscheinlichkeit des Fehlers 2. Art, wenn im Falle n = 30 der mittlere
systolische Blutdruck in Wirklichkeit 78mmHG beträgt?
e) Was könnte der Leiter der Studie tun, um die Fehlerwahrscheinlichkeit in d) zu verringern?
Einige Werte der Verteilungsfunktion Φ der Normalverteilung N (0, 1):
t
Φ(t)
0
0.5
0.41
0.66
1.28
0.9
1.65
0.95
1.96
0.975
2.33
0.99
2.58
0.995
Lösung zu Aufgabe 6
a) Man muss als Hypothese H0 : ϑ ≥ 80 und als Alternative H1 : ϑ < 80 wählen. Nur dann
ist bei Ablehnung von H0 die Aussage “bei trainierten Personen ist der mittlere systolische
Blutdruck niedriger als 80mmHG“ statistisch gesichert.
2P
Da kleine Werte von Tn gegen H0 sprechen, und da Tn unter H0 standardnormalverteilt ist,
muss H0 zum Niveau α = 0.01 verworfen werden, wenn T n ≤ z0.01 = Φ−1 (0.01) = −2.33 ist.
Andernfalls besteht kein Einwand gegen H 0 .
√
b) Wegen T30 = 30(X̄30 −80)/4 = −2.74 < z0.01 wird H0 wird auf dem 1%–Niveau abgelehnt.
c) Die Gütefunktion des Tests ist
√
n(X̄n − 80)
≤ z0.01
g(µ) = Pµ (Test verwirft H0 ) = Pµ
4
√
√
n(X̄n − µ)
n(80 − µ)
= Pµ
≤ z0.01 +
4
4
√
n(80 − µ)
= Φ z0.01 +
.
4
1P
2P
d) Für µ = 78 ist die Wahrscheinlichkeit des Fehlers 2. Art
β = 1 − g(78) = 1 − Φ(−2.33 + 2.74) = 1 − Φ(0.41) = 0.34.
e) Der Studienleiter könnte den Stichprobenumfang erhöhen, denn dann nimmt die Güte des
Tests zu, es verringert sich also die Wahrscheinlichkeit, dass bei Vorliegen der Alternative die
Hypothese H0 fälschlicherweise nicht abgelehnt wird.
Eine weitere Möglichkeit wäre, den Fehler 1. Art anzuheben (etwa auf α = 5%).
1P
1P
Herunterladen