Zulassungsprüfung Stochastik, 07.05.16 Wir gehen stets von einem Maßraum (Ω, A, µ) bzw. einem Wahrscheinlichkeitsraum (Ω, A, P ) aus. Die Borel σ-Algebra auf Rn wird mit B n bezeichnet, das Lebesgue-Maß auf Rn wird mit λn bezeichnet. Sollten Ihnen in Teilaufgaben Ergebnisse fehlen, dann treffen Sie eine plausible Annahme dafür. Aufgabe 1 (12 Punkte) Sei X : Ω −→ [0, ∞) eine Zufallsvariable. Zeigen Sie Z X dP ≥ 0. Ω Hinweis: Beweisen Sie diese Ungleichung zuerst für Treppenfunktionen. Aufgabe 2 (30 Punkte) (a) Sei k ∈ N, X ∼ Γ(α, λ) mit α > k. Beweisen Sie, dass λk 1 = E k X (α − 1) . . . (α − k) gilt. Für die Gamma-Funktion Γ : (0, ∞) → (0, ∞) mit Γ(x) := gilt die Identität Γ(x) = (x − 1) . . . (x − k)Γ(x − k), x > k. R∞ 0 tx−1 e−t dt (b) Gegeben seien X1 , . . . , Xn ∼ Exp(λ) unabhängig mit n ≥ 3 und unbekanntem λ > 0. Der Mittelwert der Xi wird mit n X := bezeichnet. Zeigen Sie, dass λ̂ = λ ist. 1X Xi n i=1 1 ein Maximum Likelihood Schätzer für X (c) Seien X1 , . . . , Xn und X wie in (b). (i) Begründen Sie X ∼ Γ(n, nλ). Hinweis: Verwenden Sie die Eigenschaften der Gammaverteilung in der Formelsammlung! (ii) Bestimmen Sie Erwartungswert und Varianz des Schätzers λ̂ aus (b). 2 nλ n λ2 · n−2 n−1 und n−1 (iii) Geben Sie eine erwartungstreue Modifikation λ∗ des Schätzers λ̂ an und bestimmen Sie Var(λ∗ ). (iv) Für welchen Schätzer λ̂, λ∗ würden Sie sich entscheiden? Begründen Sie Ihre Antwort mit dem mittleren quadratischen Fehler. Für einen Schätzer T von λ ist der mittlere quadratische Fehler gegeben durch mse(T ) = E((T − λ)2 ) = (E(T ) − λ)2 + Var(T ). 1 Aufgabe 3 (12 Punkte) Seien X, Y Zufallsvariablen mit E(X), Var(X) ∈ R. Die Zufallsvariablen A, B seien σ(Y ) messbar, d.h. es gibt messbare Funktionen f, g : R −→ R mit A = f (Y ) und B = g(Y ). Beweisen Sie E(AX + B|Y ) = AE(X|Y ) + B, Var(AX + B|Y ) = A2 Var(X|Y ). Aufgabe 4 (36 Punkte) Max fährt täglich um 07:30 in die Hochschule, Vorlesungsbeginn ist 08:00. Die Anfahrtzeit T in Minuten sei normalverteilt. (a) Es gelte T ∼ N (25, 16). (i) Bestimmen Sie die Wahrscheinlichkeit, dass er zwischen 07:45 und 08:05 ankommt. (ii) Wie groß ist die Wahrscheinlichkeit des Zuspätkommens? (iii) An wievielen Vorlesungstagen im Jahr (150 Tage pro Jahr) wird er im Mittel zu spät kommen? (iv) Welchen Abfahrtszeitpunkt (minutengenau) schlagen Sie vor, damit Max bei unveränderter Anfahrtszeit T im Mittel an höchstens 2 Tagen im Jahr zu spät kommt? (b) Max will weiterhin erst um 07:30 starten und probiert eine neue Route. Die Anfahrtzeit sei weiter normalverteilt. An 10 Tagen kommt er im Mittel um 07:50 an, die empirische Varianz beträgt 12,25. (i) Max vermutet, dass sich seine Anfahrtzeit verkürzt hat. Überprüfen Sie anhand einer geeigneten Nullhypothese seine Vermutung zum Niveau von 5 %. (ii) Geben Sie für den Erwartungswert der Anfahrtzeit ein Konfidenzintervall zum Niveau 5 % an. (c) Kommentieren Sie Normalverteilungsannahme. 2 Lösungsvorschläge AufgabeP1 [12] n Sei X = i=1 αi 1Ai , αi ≥ 0, Ai ∈ A, i = 1, . . . , n eine Treppenfunktion. Dann gilt Z n X αi P (Ai ) X dP = Ω i=1 R und damit Ω X dP ≥ 0. Sei nun X ≥ 0 beliebig. Dann gibt es eine monoton wachsende Folge (Xn )n∈N von Treppenfunktionen mit Xn ≥ 0 und limn→∞ Xn = X. Es gilt mit dem Satz von der monotonen Konvergenz Z Z Xn dP, X dP = lim Ω n→∞ und aus dem vorher Gezeigten folgt nun R Ω Ω X dP ≥ 0. Aufgabe 2 [a) 5 b) 7 c) 3+5+5+5] Zu (a) Es gilt Z ∞ λα α−1 −λx 1 x−k = x e dx E k X Γ(α) 0 Z λα Γ(α − k) ∞ λα−k = xα−k−1 e−λx dx Γ(α) λα−k Γ(α − k) {z } |0 =1 λk λk Γ(α − k) = . = Γ(α) (α − 1) . . . (α − k) Die Gleichung in der zweiten Zeile folgt, da der Intergrand die Dichte der Γ(α−k, λ)-Verteilung ist. In der letzten Gleichung wurde der Hinweis verwendet. Zu (b) Aufgrund der Unabhängigkeit der Xi , i = 1, . . . , n gilt für die LikelihoodFunktion ! n X xi , x1 , . . . , xn > 0. L(λ; x1 , . . . , xn ) = λe−λx1 · . . . · λe−λxn = λn exp −λ i=1 Für die Loglikelihood-Funktion ℓ mit ℓ(λ) := ln(L(λ)) ergibt sich ℓ(λ) := ln L(λ) = ln(λn ) − λ n ℓ′ (λ) = ℓ′′ (λ) = n X xi − λ i=1 n − 2 <0 λ 3 n X i=1 xi = n ln(λ) − λ n X i=1 xi n ein Maximum der Likelihoodfunktion vor. Damit ist und somit liegt in P n xi i=1 n 1 ein Maximum Likelihood Schätzer. die Zufallsvariable λ̂ = P = n X Xi i=1 Zu (c) Pn (i) Es gilt Xi ∼ Γ(1, λ) = Exp(λ). Da die Xi unabhängig sind, gilt k=1 Xi ∼ 1 Pn Γ(n, λ) und somit Xi ∼ Γ(n, nλ). n k=1 (ii) Mit (a) und (i) gilt 1 nλ E(λ̂) = E = n−1 X n2 λ2 1 2 = E(λ̂ ) = E 2 X (n − 1)(n − 2) n2 λ2 n2 λ2 1 = − Var(λ̂) = Var (n − 1)(n − 2) (n − 1)2 X n−1−n+2 = n2 λ2 · (n − 1)2 (n − 2) 2 λ2 n n2 λ2 · = = (n − 1)2 (n − 2) n−1 n−2 (iii) Wegen (ii) ist λ̂ nicht erwartungstreu. Dagegen ist offenbar λ∗ = n−1 n−1 λ̂ = n nX ein erwartungstreuer Schätzer von λ. Es gilt Var(λ∗ ) = (n − 1)2 (n − 1)2 n2 λ2 λ2 Var(λ̂) = · = . 2 2 2 n n (n − 1) (n − 2) n−2 (iv) Vergleicht man (ii) und (iii) ergibt sich Var(λ̂) > Var(λ∗ ). Da λ̂ nicht erwartungstreu ist, während λ∗ erwartungstreu ist, gilt mse(λ̂) = (E(λ̂) − λ)2 +Var(λ̂) > Var(λ̂) > Var(λ∗ ) = (E(λ∗ ) − λ)2 + Var(λ∗ ) | {z } >0 = mse(λ∗ ). λ∗ weist einen kleineren mse auf als λ̂, somit wird man λ∗ den Vorzug geben. Aufgabe 3 [12] Es gilt E(AX + B|Y ) = E(AX|Y ) + E(B|Y ) = AE(X|Y ) + BE(1|Y ) = AE(X|Y ) + B. Die erste Gleichheit gilt wegen der Linearität der bedingten Erwartung, die zweite, da A, B jeweils σ(Y )-messbar sind. 4 Mit der gleichen Argumentation erhalten wir Var(AX + B|Y ) = E((AX + B)2 |Y )) − (E(AX + B|Y )) 2 = E(A2 X 2 + 2ABX + B 2 |Y ) − (AE(X|Y ) + B) 2 = E(A2 X 2 |Y ) + E(2ABX|Y ) + E(B 2 |Y ) − A2 E(X|Y )2 + 2ABE(X|Y ) + B 2 = A2 E(X 2 |Y ) + 2ABE(X|Y ) + B 2 − A2 E(X|Y )2 − 2ABE(X|Y ) − B 2 = A2 E(X 2 |Y ) − A2 E(X|Y )2 = A2 (E(X 2 |Y ) − E(X|Y )2 ) = A2 Var(X|Y ). Aufgabe 4 [a) 5+3+5+9=22, b) 5+5=10, c) 4] Zu (a) (i) Ankunftszeit liegt zwischen 07:45 und 08:00 genau dann wenn T ∈ [15, 30] gilt. 30 − 25 15 − 25 P (15 ≤ T ≤ 30) = P (T ≤ 30) − P (T ≤ 15) = Φ −Φ 4 4 = Φ (1, 25) − Φ (−1, 52) = 0, 9938 − (1 − 0, 9938) = 0, 9876. (ii) Max verspätet sich genau dann wenn T > 30 gilt. P (T > 30) = 1 − P (T ≤ 30) = 1 − Φ (1, 25) = 0, 1056. (iii) Bezeichnet man mit N die Anzahl der Tage, an denen sich Max verspätet, und setzt man p := 0, 1056, dann gilt nach (ii) N ∼ B(150, p) und damit E(N ) = 150p = 15, 84. Im Mittel kommt Max an 16 Tagen im Jahr zu spät. (iv) Die Wahrscheinlichkeit q, dass Max sich verspätet, soll so bestimmt werden, 1 dass 150q ≤ 2 gilt, also q ≤ . Sei t0 die Reisezeit, die mit einer Wahrschein75 1 überschritten wird, also lichkeit von maximal 75 P (T > t0 ) = 1 . 75 Wegen P (T > t0 ) = 1 − P (T ≤ t0 ) = 1 − Φ ergibt sich zunächst Φ und damit (näherungsweise) t0 − 25 4 = t0 − 25 4 74 ≈ 0, 9867 75 t0 = 25 + 4u0, 74 ≈ 25 + 4 · 2, 23 = 33, 92 ≈ 34. 75 5 Max sollte also um 07:26 starten. Zu (b) (i) Zu testen ist die Nullhypothese H0 : µ ≤ µ0 mit µ0 := 25. Es handelt sich um einen einseitigen t-Test, Testgröße ist T = x − µ0 √ n s und besitzt bei den vorliegenden Daten den Wert 20 − 25 √ 10 = −4, 52. 3, 5 Die Hypothese wird im Fall T > t9;0,95 = 1, 833 abgelehnt. Also wird H0 nicht verworfen. √ (ii) Das Schätzintervall lautet mit t9;0,975 = 2, 262, s = 12, 25 = 3, 5: s · t9;0,975 s · t9;0,975 = [17, 5; 22, 5] . ,x + √ x− √ 10 10 Zu (c) Unter der Annahme der Normalverteilung gilt P (T < 0) > 0. Die Annahme der Normalverteilung kann daher nur näherungsweise erfüllt sein. 6