Zulassungsprüfung Stochastik, 15.05.11

Werbung
Zulassungsprüfung Stochastik, 15.05.11
Wir gehen stets von einem Maßraum (Ω, A, µ) bzw. einem Wahrscheinlichkeitsraum (Ω, A, P) aus. Die Borel σ-Algebra auf Rn wird mit B n bezeichnet, das
Lebesgue Maß auf Rn wird mit λn bezeichnet.
Aufgabe 1 (14 Punkte)
(a) Seien fn : Ω −→ [0, ∞) messbar. Zeigen Sie:
Z
∞ Z
∞
X
X
fn dµ.
fn ist messbar, und es gilt
f dµ =
f :=
n=1
n=1
1
. Beweisen Sie
1 − e−bx
(b) Sei b > 0 und f : (0, ∞) −→ R, f (x) =
f (x) =
∞
X
e−kbx .
k=0
(c) Seien a > 0, b > 0 und f : (0, ∞) −→ R, f (x) =
Z
f (x)dλ(x) =
(0,∞)
∞
X
k=0
xe−ax
. Beweisen Sie
1 − e−bx
1
.
(a + kb)2
Lösung
Zu (a)
Die Funktionen gn :=
messbar. Wegen
n
P
fk sind als endliche Summen messbarer Funktionen
k=1
lim gn =
n→∞
∞
X
fk
k=1
ist f als Grenzwert messbarer Funktionen messbar. Es gilt sogar
gn ր f
(n → ∞)
also folgt mit dem Satz von der monotonen Konvergenz
Z
f dµ = lim
n→∞
Z
gn dµ = lim
n→∞
n Z
X
fk dµ =
Es handelt sich um die geometrische Reihen
fk dµ.
k=1
k=1
Zu (b)
∞ Z
X
∞
X
k=0
e−bx
k
. Wegen b > 0 gilt
e−bx < 1 für alle x > 0, also konvergiert obige Reihe für alle x > 0 gegen
1
.
1 − e−bx
Zu (c)
1
Laut (b) gilt f (x) =
∞
X
k=0
Z
R
xe
−ax−kbx
dx
=
0
=
also
Z
∞
xe
−ax−kbx
xe−ax−kbx . Für k ∈ N und R > 0 gilt
R
Z R
1
xe−x(a+kb) +
e−x(a+kb) dx =
−
a + kb 0
a + kb 0
R
1
Re−R(a+kb)
1
−ax−kbx R→∞
−
e
−
−→ (a + kb)2
a + kb
(a + kb)2
0
dx =
0
Z
xe−ax−kbx dλ(x) =
(0,∞)
1
.
(a + kb)2
Die Behauptung folgt nun mit (a) und der obigen Reihendarstellung von f .
Aufgabe 2 (14 Punkte) Sei X eine Zufallsvariable mit Dichte f (x) =
(
e−x
√
πx
x>0
0
sonst
Sei Y eine weitere Zufallsvariable, die bei gegebenem X = x > 0 normalverteilt
1
.
ist mit Erwartungswert 0 und Varianz
2x
(a) Bestimmen Sie die gemeinsame Dichte f von Y und X.
(b) Beweisen Sie, dass für die bedingte Dichte fX|Y von X gegeben Y
fX|Y (x|y) = (1 + y 2 )e−(1+y
2
)x
· 1(0,∞) (x)
gilt.
(c) Sind Y und X unabhängig?
(d) Bestimmen Sie P(X ≤ x|Y ) für x > 0. Um welche Verteilung handelt es
sich?
(e) Bestimmen Sie E(X|Y ) und Var(X|Y ).
Lösung
Seien fX und fY die Randdichten von (X, Y ).
Zu (a)
Für die bedingte Dichte fY |X von Y gegeben X gilt
fY |X (y|x) =
f (x, y)
wenn fX (x) > 0.
fX (x)
Auflösen nach f (x, y) ergibt für x > 0
f (x, y)
=
=
√
2
1
x
f (y|x)fX (x) = √ e−xy √ e−x
π
πx
1 −x(1+y2 )
e
.
π
Für x ≤ 0 ist f (x, y) = 0.
Zu (b)
2
.
Aus (a) ergibt sich
∞
Z
1
1
1 ∞ −x(1+y2 )
−x(1+y 2 ) e
e
dx = −
fY (y) =
= π(1 + y 2 ) .
π 0
π(1 + y 2 )
0
Es gilt somit für x > 0
fX|Y (x|y) =
f (x, y)
=
fY (y)
1 −x(1+y 2 )
πe
1
π(1+y 2 )
2
= e−x(1+y ) (1 + y 2 ).
Für x ≤ 0 ist fX|Y (x|y) = 0.
Zu (c)
Die Zufallsvariablen X, Y sind nicht unabhängig, da die gemeinsame Dichte
nicht Produkt der Randdichten ist.
Zu (d)
Es handelt sich um eine E(1 + Y 2 )-Verteilung, somit gilt für x > 0
2
P(X ≤ x|Y ) = 1 − e−x(1+Y ) .
Zu (e)
Wegen (d) kann man Erwartungswert und Varianz von E(1 + y 2 ) verwenden:
Z ∞
1
1
xfX|Y (x|y)dx =
E(X|Y = y) =
=⇒ E(X|Y ) =
2
1+y
1+Y2
0
1
Var(X|Y ) =
.
(1 + Y 2 )2
Aufgabe 3 (18 Punkte)
Sei Xij die Anzahl der zahlenden Kunden in einem Warenhaus, die in der j-ten
Minute der i-ten Stunde in der Zeit zwischen 16:00 und 20:00 zahlen. Es sei
E(Xij ) = 15, Var(Xij ) = 100, die Xij seien unabhängig. Sei X die Anzahl der
zahlenden Kunden in diesen vier Stunden. Y sei die Anzahl der Kunden, die
bargeldlos während dieser vier Stunden zahlen. Wir gehen im folgenden davon
aus, dass X normalverteilt ist.
(a) Bestimmen Sie E(X) und Var(X).
(b) Bestimmen Sie die Wahrscheinlichkeit, dass nicht mehr als 3500 Kunden
während der 4 Stunden bezahlen.
(c) 1/6 der Kunden zahlt bargeldlos. Bestimmen Sie Erwartungswert, Varianz
und Verteilung von Y .
(d) Die Kapazität für bargeldloses Zahlen liegt bei 660. Bestimmen Sie die
Wahrscheinlichkeit, dass diese Kapazität überschritten wird.
(e) Bei n beobachteten Tagen sei N die Anzahl der Tage, an denen die Kapazität für bargeldloses Zahlen überschritten wird. Bestimmen Sie die Verteilung von N .
(f) Diskutieren Sie die Annahme der Normalverteilung für X.
3
Lösung
Zu (a)
Laut Definition gilt X =
4 360
P
P
Xij . Somit gilt
i=1 j=1
E(X)
=
60
4 X
X
i=1 j=1
Var(X)
=
60
4 X
X
E(Xij ) = 4 · 15 · 60 = 3600
Var(Xij ) = 24000.
i=1 j=1
Zu (b)
Da X normalverteilt ist mit den Parametern aus (a) folgt
100
≈ Φ(0, 65) = 0, 742.
P(X > 3500) = 1 − P(X ≤ 3500) = Φ √
24000
Zu (c)
Laut Angabe gilt Y =
E(Y ) =
X
6,
damit folgt
E(X)
= 600,
6
Var(Y ) =
Var(X)
2000
=
36
3
also Y ∼ N 600, 2000
.
3
Zu (d)
Aufgrund von (c) ergibt sich mit der Standardnormalverteilung
60
= 0, 0102.
P(Y > 660) = 1 − P(Y ≤ 660) = 1 − Φ √
666, 67
Zu (e)
Die Wahrscheinlichkeit, dass an einem Tag die Kapazität überschritten wird ist
p = 0, 0102. Somit ist N ∼ B(n, p) verteilt.
Zu (f)
X Summe einer großen Anzahl unabhängiger, identisch verteilter Zufallsvariablen mit endlicher Varianz. Mit dem zentralen Grenzwertsatz kann man daher
davon ausgehen, dass X normalverteilt ist.
Aufgabe 4 (20 Punkte)
Für x ∈ R sei ⌊x⌋ die größte ganze Zahl, die kleiner als x ist, z.B. ⌊3, 1⌋ =
3, ⌊3, 8⌋ = 3.
Sei X ∼ Exp(λ) und die diskrete Zufallsvariable Y := ⌊X⌋.
(a) Beweisen Sie, dass für die Wahrscheinlichkeitsfunktion von Y gilt:
P(Y = y) = e−λy 1 − e−λ , y ∈ N0 .
(b) Um welche bekannte Verteilung handelt es sich in (a)? Bestimmen Sie den
Erwartungswert und die Varianz von Y .
4
(c) Bestimmen Sie einen Maximum Likelihood Schätzer für λ aus einer Stichprobe von unabhängig und identisch verteilten Y1 , . . . Yn ∼ Y .
(d) Gegeben sei eine Stichprobe mit Stichprobenlänge 15, Stichprobenmittel
1,6 und Stichprobenvarianz 4. Bestimmen Sie den Maximum Likelihood
Schätzwert für λ.
Lösung
Zu (a)
P (Y = y) = P (y ≤ X < y + 1) = P (y < X ≤ y + 1) = P (X ≤ y + 1)−P (X ≤ y) .
Für die Verteilungsfunktion von gilt
P (X ≤ x) = 1 − e−λx
und somit folgt weiter
P (Y = y) = 1 − e−λ(y+1) − 1 − e−λy = e−λy − e−λ(y+1) = e−λy 1 − e−λ .
Zu (b)
Es handelt sich um die geometrische Verteilung, Geo(1−e−λ ) = N B(1, 1−e−λ ).
Damit folgt
e−λ
e−λ
E(Y ) =
, Var(Y ) =
2.
−λ
1−e
(1 − e−λ )
Zu (c)
Aus der Likelihood L ergibt sich
L (λ) =
n
Y
i=1
n
n Y
e−λyi 1 − e−λ = 1 − e−λ
e−λyi
i=1
ℓ (λ) = ln L (λ) = n ln 1 − e
n
ℓ′ (λ) =
−λ
−
n
X
λyi
i=1
n
X
X
n
ne−λ
yi = λ
yi
−
−
−λ
1−e
e − 1 i=1
i=1
ℓ′′ (λ) = −
neλ
(1 − eλ )
2
<0
Aus ℓ′ (λ) = 0 ergibt sich wegen ℓ′′ (λ) < 0 der ML-Schätzer


n
P
yi
n+
n


1X
1 + ȳ
i=1


mit ȳ =
yi .
λ̂ = ln  P
n
 = ln
ȳ
n i=1
yi
i=1
Zu (d)
1+1,6
Laut (c) erhält man den Schätzwert λ̂ = ln 1+ȳ
=
ln
= 0, 49.
ȳ
1,6
Aufgabe 5 (24 Punkte)
In der folgenden Tabelle sind die relativen Sterbehäufigkeiten in % eines homogenen Kollektivs der letzten 10 Jahre aufgezeichnet.
5
Jahr
rel. Häuf. (%)
1
3,51
2
3,46
3
3,46
4
3,38
5
3,36
6
3,31
7
3,07
8
2,98
9
2,81
Bezeichnet man mit xi das Jahr und mit yi die relative Häufigkeit, so wird für
die Zufallsvariablen Yi das Modell
Yi = a + bxi + εi , i = 1, . . . , 10
untersucht. Die εi seien unabhängig und N (0, σ 2 )-verteilt. Sie können verwenden:
x = 5, 5;
10
X
i=1
(xi − x)2 = 82, 5
10
X
y = 3, 209;
i=1
2
(yi − y) = 0, 725;
10
X
i=1
(yi − y)(xi − x) = −7, 407.
Stützen die Daten die Behauptung, dass die Sterblichkeit
(a) vom Beobachtungsjahr abhängt?
(b) sich jedes Jahr um 0,1 %-Punkte verringert?
Beide Aussagen sollen zu einem Niveau von α = 5 % erfolgen.
Lösung
Zu (a)
Zu untersuchen ist die Hypothese H0 : b = 0. Es ergeben sich folgende Schätzwerte:
b̂
=
σ̂ 2
=
se(b̂)
=
T
=
−7, 407
= −0, 09
82, 5
7, 4072
1
0, 725 −
= 0, 0075
8
82, 5
r
0, 0075
= 0, 0095
82, 5
b̂ − b0
se(b̂)
=
−0, 09
= 9, 439.
0, 0095
H0 wird abgelehnt, denn |T | > t8;0,975 = 2, 308. Somit wird die Hypothese, dass
die Sterblichkeit nicht vom Beobachtungsjahr abhängt, verworfen.
Zu (b) Zu untersuchen ist nun die Hypothese H0 : b = −0, 1. Mit den Werten
aus (a) ergibt sich nun die Testgröße
T
=
b̂ − b0
se(b̂)
=
−0, 09 + 0, 1
= 1, 053.
0, 0095
Die Hypothese, dass sich die Sterblichkeit jähhrlich um 0,1 % verbessert wird
also nicht verworfen.
6
10
2,75
Herunterladen