Zulassungsprüfung Stochastik, 05.05.12

Werbung
Zulassungsprüfung Stochastik, 05.05.12
Wir gehen stets von einem Maßraum (Ω, A, µ) bzw. einem Wahrscheinlichkeitsraum (Ω, A, P) aus. Die Borel σ-Algebra auf Rn wird mit B n bezeichnet, das
Lebesgue Maß auf Rn wird mit λn bezeichnet.
Sollten Ihnen in Teilaufgaben Ergebnisse fehlen, dann treffen Sie eine plausible
Annahme dafür.
Aufgabe 1 (14 Punkte) Sei g : Ω −→ Ω messbar. Das Bildmaß µg von µ
bezüglich g sei invariant, also
∀A ∈ A :
µg (A) = µ(A).
Beweisen Sie:
(a) Für alle A ∈ A gilt 1A ◦ g = 1g−1 (A) .
Hierbei wird mit 1A die Indikatorfunktion von A bezeichnet.
Z
Z
(b) Sei f : Ω −→ [0, ∞) messbar. Dann gilt
f dµ =
f ◦ g dµ.
Ω
Ω
Lösung
Zu (a)
Es gilt für alle A ∈ A und ω ∈ Ω
1A (g(ω)) = 1 ⇐⇒ g(ω) ∈ A ⇐⇒ ω ∈ g −1 (A) ⇐⇒ 1g−1 (A) (ω) = 1.
Zu (b) P
n
Sei f = i=1 αi 1Ai , αi ≥ 0, Ai ∈ A, i = 1, . . . , n eine positive Treppenfunktion.
Dann gilt wegen (a)
f ◦g =
n
X
i=1
αi 1Ai ◦ g =
n
X
αi 1g−1 (Ai )
i=1
und somit folgt aus
Z
Z
n
n
n
X
X
X
αi
f ◦ g dµ =
αi µg (Ai )
αi µ(g −1 (Ai )) =
1g−1 (Ai ) dµ =
Ω
=
i=1
n
X
Ω
i=1
i=1
αi µ(Ai ) =
n
X
αi
i=1
i=1
Z
dµ =
Ai
Z X
n
Ω i=1
αi 1Ai dµ =
Z
f dµ
Ω
die Behauptung für positive Treppenfunktionen.
Sei nun f ≥ 0. Es gibt eine Folge (fn )n∈N von positiven Treppenfunktionen mit
fn ≥ 0 und fn ր f . Da fn eine Treppenfunktion ist, gilt wie oben gezeigt
Z
Z
fn ◦ g dµ
fn dµ =
Ω
Ω
Aus fn ր f folgt fn ◦g ր f ◦g und mit dem Satz von der monotonen Konvergenz
folgt für die beiden Seiten
Z
Z
lim
fn ◦ g dµ =
f ◦ g dµ,
n→∞ Ω
Z
ZΩ
lim
fn dµ =
f dµ
n→∞
Ω
Ω
1
und somit insgesamt :
Z
Ω
f ◦ g dµ =
Z
f dµ.
Ω
Aufgabe 2 (18 Punkte)
Seien X, Y ∼ U (0, 1) unabhängig, und sei V := max{X, Y }, W := min{X, Y }.
(a) Bestimmen Sie die Verteilungsfunktionen von V und W .
[Ergebnis: FV (v) = v 2 , FW (w) = 2w − w2 ]
(b) Bestimmen Sie die Erwartungswerte von V und W .
(c) Beweisen Sie V W = XY .
(d) Bestimmen Sie Cov(V, W ).
(e) Sind V und W unabhängig?
Lösung
Zu (a)
Die Verteilungsfunktion F der Gleichverteilung auf (0, 1) ist gegeben durch

x falls x ∈ [0, 1]
. Sei v, w ∈ R. Es gilt wegen der
F : R −→ [0, 1], F (x) = 1 falls x > 1


0 sonst
Unabhängigkeit von X, Y
P(V ≤ v) =
P(W ≤ w)
=
=
=
=
Damit ergeben

2

v
FV (v) = 1


0
P(max{X, Y } ≤ v) = P(X ≤ v, Y ≤ v) = P(X ≤ v)P(Y ≤ v)
F (v)2
P(min{X, Y } ≤ w) = 1 − P(min{X, Y } > w)
1 − P(X > w, Y > w) = 1 − P(X > w)P(Y > w)
1 − (1 − F (w))2 = 1 − 1 + 2F (w) − F (w)2 = 2F (w) − F (w)2 .
sich die Verteilungsfunktionen FV , FW wie folgt:

2

falls v ∈ [0, 1]
2w − w falls w ∈ [0, 1]
und FW (w) = 1
falls w > 1
falls v > 1


0
sonst
sonst
Zu (b)
Aus (a) erhält man die Dichten fV und fW von V, W :
fV (v)
=
2v1(0,1)
fW (w)
=
2(1 − w)1(0,1) .
Damit folgt
E(V )
E(W )
=
=
Z
Z
1
2v 2 dv =
0
2
3
1
0
2w − 2w2 dv = 1 −
2
2
1
= .
3
3
Zu (c)
Sei ω ∈ Ω.
Im Fall X(ω) ≤ Y (ω) gilt V (ω) = Y (ω) und W (ω) = X(ω), und damit
X(ω)Y (ω) = V (ω)W (ω).
Im Fall X(ω) ≥ Y (ω) ergibt sich analog X(ω)Y (ω) = V (ω)W (ω).
Zu (d)
Wegen (b), (c) und der Unabhängigkeit von X, Y gilt
Cov(V, W )
=
E(V W ) − E(V )E(W ) = E(XY ) −
=
1 2
1
− =
.
4 9
36
2
2
= E(X)E(Y ) −
9
9
Zu (e)
V und W sind nicht unabhängig, da sonst die Kovarianz verschwinden würde.
Aufgabe 3 (16 Punkte)
Die Zufallsvariable A sei U [a, b] verteilt und die Zufallsvariable X sei unter A
bedingt Pareto–verteilt, d.h., für A = α > 0 besitzt X die Verteilungsfunktion

1 − 1 x ≥ 1
.
FX (x) =
xα
0
sonst
(a) Bestimmen Sie den bedingten Erwartungswert E(X|A = α). Für welche
α existiert er?
1 Kontrollergebnis E(X|A) = 1 +
A−1
(b) Bestimmen Sie E(X).
(c) Sind die Zufallsvariablen X und A unabhängig?
(d) Bestimmen Sie die Wahrscheinlichkeit P(X ≥ x).
Lösung
Zu a)
Die bedingte Dichte von X gegeben A = α erhält man durch Ableitung von FX
nach x:
(
αx−α−1 x > 1
f (x|α) =
.
0
sonst
Daraus folgt
E(X|A = α) =
Z
∞
αxx−α−1 dx
1
=
α
Z
∞
x−α dx.
1
Das uneigentliche Integral existiert nur für α > 1 und in diesem Fall gilt
E(X|A = α) =
α
1
=1+
.
α−1
α−1
Zu (b)
3
Mit dem Satz vom iterierten Erwartungswert gilt
Z b
1
1
1
=
dα
1+
E(X) = E(E(X|A)) = E 1 +
A−1
b−a a
α−1
b−1
1
1
b−1
(b − a) + ln
=1+
ln
.
=
b−a
a−1
b−a a−1
Zu (c)
Die Zufallsvariablen X und A sind nicht unabhängig, da sonst E(X|A) = E(X)
gelten würde, was offensichtlich nicht der Fall ist.
Zu (d)
P(X > x)
=
=
=
1
b−a
Z
b
P(X > x|A = α) dα =
a
1
b−a
Z
b
x−α dα
a
b
b
Z b
1
1 −α ln x 1 −α 1
1
−α ln x
e
e
dα = −
= − b − a ln x x b−a a
b − a ln x
a
a
1
1
−a
−b
(x − x )
b − a ln x
Aufgabe 4 (18 Punkte)
Seien X ∼ N 1, σ 2 mit σ 2 > 0. Es sei eine Stichprobe vom Umfang n durch unabhängige Realisierungen x1 , . . . , xn gegeben. Bestimmen Sie einen MaximumLikelihood-Schätzer für den Parameter σ 2 .
Lösung
Wegen der Unabhängigkeit ist die Likelihood gegeben durch
L(σ 2 )
=
=
n
Y
1 (xi − 1)2
1
√
exp −
2
σ2
2πσ 2
i=1
!
n/2
n
1 X (xi − 1)2
1
.
exp −
2πσ 2
2 i=1
σ2
Somit folgt für ℓ := ln L
ℓ(σ 2 )
= −
ℓ′ (σ 2 )
= −
ℓ′′ (σ 2 )
=
n
1 X
n
ln(2π) + ln(σ 2 ) − 2
(xi − 1)2
2
2σ i=1
n
n
1 X
+
(xi − 1)2
2σ 2
2(σ 2 )2 i=1
n
1 X
n
−
(xi − 1)2
2(σ 2 )2
(σ 2 )3 i=1
Aus der zweiten Gleichung ergibt sich durch Nullsetzen und Auflösen
n
σ̂ 2 =
1X
(xi − 1)2
n i=1
4
und wegen
ℓ′′ (σ̂ 2 ) =
n
1 X
n
n
n
n
−
− 2 2 =−
<0
(xi − 1)2 =
2(σ̂ 2 )2
(σ̂ 2 )3 i=1
2(σ̂ 2 )2
(σ̂ )
2(σ̂ 2 )2
folgt, dass in σ̂ 2 ein Maximum vorliegt. Der gesuchte Schätzer ist
n
1X
(Xi − 1)2 .
n i=1
Aufgabe 5 (24 Punkte)
Es liegen 120 Daten vor, die Temperatur-Jahresmittelwerte der Jahre 1891-2010.
Folgende Zusammenfassung wird geliefert:
Zeitraum
1891-1980
1981-2010
1891-2010
Mittelwert
9, 5 ◦ C
10, 4 ◦ C
9, 7 ◦ C
empirische Standardabweichung
0,60 ◦ C
0,75 ◦ C
0,73 ◦ C
Wir gehen davon aus, dass die Jahresmitteltemperatur eines Jahres normalverteilt ist und die Jahresmitteltemperaturen jeweils unabhängig voneinander
sind.
(a) Wie beurteilen Sie die Behauptung, dass die Jahresmitteltemperatur in
den Jahren 1981-2010 gegenüber den Jahren 1891-1980 nicht gestiegen ist?
Geben Sie das Ergebnis zu einem Signifikanzniveau von 5 % an. Welche
Annahmen treffen Sie? Begründen Sie ihr Vorgehen.
(b) In den folgenden Graphiken sind die Jahresmittel der Jahre 1891-1980 und
1981-2010 dargestellt zusammen mit den Ausgleichsgeraden.
Eine Statistiksoftware liefert noch die folgenden Werte:
1980
X
i=1891
2
(yi − yˆi ) = 31, 63,
2010
X
i=1981
1980
X
j=1891
2010
X
2
(yi − yˆi ) = 13, 71,
(j − 1935, 5)2 = 60742, 5
j=1981
5
(j − 1995, 5)2 = 2247, 5
Wie beurteilen Sie aufgrund dieser Daten mit dem Modell der einfachen
linearen Regression die Behauptung, dass das Jahresmittel der Jahre
(i) 1891-1980
(ii) 1981-2010
nicht vom Jahr abhängt? Verwenden Sie das Signifikanzniveau von 5 %.
Beschreiben Sie das von Ihnen verwendete Modell.
(c) Ist Ihr Vorgehen in (a) im Lichte Ihrer Ergebnisse von (b) gerechtfertigt?
(d) Untersuchen Sie den linearen Trend im Zeitraum 1981-2010. Stützen die
Daten die Behauptung, dass er
(i) 0,3 ◦ C
(ii) 0,2 ◦ C
(iii) 0,4◦ C
pro Jahrzehnt beträgt? Verwenden Sie das Signifikanzniveau von 5 %.
(e) Eine Klimainitiative stellt folgende Behauptungen auf:
(1) Die Temperatur der Jahre 1981-2010 ist im Vergleich zu den Jahren
1891-1980 angestiegen.
(2) Der lineare Erwärmungstrend über die vergangenen 30 Jahre (19812010) liegt bei 0,3 ◦ C pro Jahrzehnt.
Kommentieren Sie kurz die Behauptungen der Klimainitiative?
Lösung
Zu (a)
Sei ti das Jahresmittel des Jahres i = 1891, . . . , 2010. Dann wird angenommen,
dass die ti unabhängige Realisierungen von Zufallsvariablen Ti sind mit
Ti
iid
Ti
iid
∼
∼
X wobei X ∼ N (µ1 , σ12 ), i = 1891, . . . , 1980
Y wobei Y ∼ N (µ2 , σ22 ), i = 1981, . . . , 2010.
Nullhypothese ist hier
H0 : µ 1 ≥ µ 2 .
Es wird der einseitige t-Test verwendet, da die Varianzen unbekannt sind. Die
Testgröße ist
r
(n − 1)s2x + (m − 1)s2y
y−x
mn
T =
, s2 =
.
s
m+n
m+n−2
Konkret ergibt sich mit y = 10, 4, x = 9, 5, n = 90, m = 30
r
r
89 · 0, 62 + 29 · 0, 752
0, 9 2700
s=
= 0, 64
T =
s
120
118
= 6, 67.
Die Hypothese wird wegen 6, 67 > t118,0.95 ≈ 1, 65 verworfen.
Bemerkung zu H0 : Die Wahrscheinlichkeit fälschlicherweise anzunehmen, dass
die mittlere Temperatur gestiegen ist beträgt bei diesem Vorgehen 5 %. Würde
man µ1 ≤ µ2 testen, wäre keine Aussage über diese Wahrscheinlichkeit möglich.
Zu (b)
Es werden die Modelle Ti = a + bxi + εi für i = 1891, . . . , 1980 bzw. i =
1981, . . . , 2010 getrennt untersucht. Die Ti sind die Jahresmittelwerte, xi die
6
Jahre und εi sind in jedem der beiden Modelle jeweils unabhängig, identisch
normalverteilt mit Erwartungswert 0. Die Nullhypothese lautet jeweils
H0 : b = 0.
Zu (i) Die Testgröße lautet
s
31, 63/88
b̂
0, 00372
=
mit se(b) =
= 0, 00243
se(b)
0, 00243
60742, 5
= 1, 53.
Die Hypothese wird wegen t88,0.95 ≈ 1, 96 nicht verworfen.
Zu (ii) Die Testgröße lautet
s
13, 71/28
b̂
0, 03295
=
mit se(b) =
= 0, 01476
se(b)
0, 01476
2247, 5
= 2, 23.
Die Hypothese wird wegen t28,0.95 ≈ 2, 048 verworfen.
Zu (c)
Das Vorgehen in (a) ist nicht korrekt, da die Annahme, dass die Jahresmittel
der Jahre 1981-2010 identisch verteilt sind, verletzt ist: der Erwartungswert ist
über die Jahre nicht konstant.
Zu (d)
Zu untersuchen sind die Nullhypothesen
(i) H0 : b = 0, 03
(ii) H0 : b = 0, 02
(iii) H0 : b = 0, 04
Mit den Zahlen aus (b) also se(b) = 0, 01476 ergeben sich die Testgrößen
0, 00295
=0, 2
0, 01476
0, 01295
=0, 88
0, 01476
0, 00705
−
= − 0, 48
0, 01476
(i)
(ii)
(iii)
Somit kann keine der angegebenen Hypothesen verworfen werden.
Zu (e)
Es fehlt die Angabe des Signifikanzniveaus. Ferner wäre bei (2) die Angabe
eines Schätzintervalls sinnvoller gewesen. Alle drei Behauptungen können aber
bei einem Niveau von 5 % nicht verworfen werden.
7
Herunterladen