Zulassungsprüfung Stochastik, 15.05.11 Wir gehen stets von einem Maßraum (Ω, A, µ) bzw. einem Wahrscheinlichkeitsraum (Ω, A, P) aus. Die Borel σ-Algebra auf Rn wird mit B n bezeichnet, das Lebesgue Maß auf Rn wird mit λn bezeichnet. Aufgabe 1 (14 Punkte) (a) Seien fn : Ω −→ [0, ∞) messbar. Zeigen Sie: Z ∞ Z ∞ X X fn dµ. fn ist messbar, und es gilt f dµ = f := n=1 n=1 1 . Beweisen Sie 1 − e−bx (b) Sei b > 0 und f : (0, ∞) −→ R, f (x) = f (x) = ∞ X e−kbx . k=0 (c) Seien a > 0, b > 0 und f : (0, ∞) −→ R, f (x) = Z f (x)dλ(x) = (0,∞) ∞ X k=0 xe−ax . Beweisen Sie 1 − e−bx 1 . (a + kb)2 Lösung Zu (a) Die Funktionen gn := messbar. Wegen n P fk sind als endliche Summen messbarer Funktionen k=1 lim gn = n→∞ ∞ X fk k=1 ist f als Grenzwert messbarer Funktionen messbar. Es gilt sogar gn ր f (n → ∞) also folgt mit dem Satz von der monotonen Konvergenz Z f dµ = lim n→∞ Z gn dµ = lim n→∞ n Z X fk dµ = Es handelt sich um die geometrische Reihen fk dµ. k=1 k=1 Zu (b) ∞ Z X ∞ X k=0 e−bx k . Wegen b > 0 gilt e−bx < 1 für alle x > 0, also konvergiert obige Reihe für alle x > 0 gegen 1 . 1 − e−bx Zu (c) 1 Laut (b) gilt f (x) = ∞ X k=0 Z R xe −ax−kbx dx = 0 = also Z ∞ xe −ax−kbx xe−ax−kbx . Für k ∈ N und R > 0 gilt R Z R 1 xe−x(a+kb) + e−x(a+kb) dx = − a + kb 0 a + kb 0 R 1 Re−R(a+kb) 1 −ax−kbx R→∞ − e − −→ (a + kb)2 a + kb (a + kb)2 0 dx = 0 Z xe−ax−kbx dλ(x) = (0,∞) 1 . (a + kb)2 Die Behauptung folgt nun mit (a) und der obigen Reihendarstellung von f . Aufgabe 2 (14 Punkte) Sei X eine Zufallsvariable mit Dichte f (x) = ( e−x √ πx x>0 0 sonst Sei Y eine weitere Zufallsvariable, die bei gegebenem X = x > 0 normalverteilt 1 . ist mit Erwartungswert 0 und Varianz 2x (a) Bestimmen Sie die gemeinsame Dichte f von Y und X. (b) Beweisen Sie, dass für die bedingte Dichte fX|Y von X gegeben Y fX|Y (x|y) = (1 + y 2 )e−(1+y 2 )x · 1(0,∞) (x) gilt. (c) Sind Y und X unabhängig? (d) Bestimmen Sie P(X ≤ x|Y ) für x > 0. Um welche Verteilung handelt es sich? (e) Bestimmen Sie E(X|Y ) und Var(X|Y ). Lösung Seien fX und fY die Randdichten von (X, Y ). Zu (a) Für die bedingte Dichte fY |X von Y gegeben X gilt fY |X (y|x) = f (x, y) wenn fX (x) > 0. fX (x) Auflösen nach f (x, y) ergibt für x > 0 f (x, y) = = √ 2 1 x f (y|x)fX (x) = √ e−xy √ e−x π πx 1 −x(1+y2 ) e . π Für x ≤ 0 ist f (x, y) = 0. Zu (b) 2 . Aus (a) ergibt sich ∞ Z 1 1 1 ∞ −x(1+y2 ) −x(1+y 2 ) e e dx = − fY (y) = = π(1 + y 2 ) . π 0 π(1 + y 2 ) 0 Es gilt somit für x > 0 fX|Y (x|y) = f (x, y) = fY (y) 1 −x(1+y 2 ) πe 1 π(1+y 2 ) 2 = e−x(1+y ) (1 + y 2 ). Für x ≤ 0 ist fX|Y (x|y) = 0. Zu (c) Die Zufallsvariablen X, Y sind nicht unabhängig, da die gemeinsame Dichte nicht Produkt der Randdichten ist. Zu (d) Es handelt sich um eine E(1 + Y 2 )-Verteilung, somit gilt für x > 0 2 P(X ≤ x|Y ) = 1 − e−x(1+Y ) . Zu (e) Wegen (d) kann man Erwartungswert und Varianz von E(1 + y 2 ) verwenden: Z ∞ 1 1 xfX|Y (x|y)dx = E(X|Y = y) = =⇒ E(X|Y ) = 2 1+y 1+Y2 0 1 Var(X|Y ) = . (1 + Y 2 )2 Aufgabe 3 (18 Punkte) Sei Xij die Anzahl der zahlenden Kunden in einem Warenhaus, die in der j-ten Minute der i-ten Stunde in der Zeit zwischen 16:00 und 20:00 zahlen. Es sei E(Xij ) = 15, Var(Xij ) = 100, die Xij seien unabhängig. Sei X die Anzahl der zahlenden Kunden in diesen vier Stunden. Y sei die Anzahl der Kunden, die bargeldlos während dieser vier Stunden zahlen. Wir gehen im folgenden davon aus, dass X normalverteilt ist. (a) Bestimmen Sie E(X) und Var(X). (b) Bestimmen Sie die Wahrscheinlichkeit, dass nicht mehr als 3500 Kunden während der 4 Stunden bezahlen. (c) 1/6 der Kunden zahlt bargeldlos. Bestimmen Sie Erwartungswert, Varianz und Verteilung von Y . (d) Die Kapazität für bargeldloses Zahlen liegt bei 660. Bestimmen Sie die Wahrscheinlichkeit, dass diese Kapazität überschritten wird. (e) Bei n beobachteten Tagen sei N die Anzahl der Tage, an denen die Kapazität für bargeldloses Zahlen überschritten wird. Bestimmen Sie die Verteilung von N . (f) Diskutieren Sie die Annahme der Normalverteilung für X. 3 Lösung Zu (a) Laut Definition gilt X = 4 360 P P Xij . Somit gilt i=1 j=1 E(X) = 60 4 X X i=1 j=1 Var(X) = 60 4 X X E(Xij ) = 4 · 15 · 60 = 3600 Var(Xij ) = 24000. i=1 j=1 Zu (b) Da X normalverteilt ist mit den Parametern aus (a) folgt 100 ≈ Φ(0, 65) = 0, 742. P(X > 3500) = 1 − P(X ≤ 3500) = Φ √ 24000 Zu (c) Laut Angabe gilt Y = E(Y ) = X 6, damit folgt E(X) = 600, 6 Var(Y ) = Var(X) 2000 = 36 3 also Y ∼ N 600, 2000 . 3 Zu (d) Aufgrund von (c) ergibt sich mit der Standardnormalverteilung 60 = 0, 0102. P(Y > 660) = 1 − P(Y ≤ 660) = 1 − Φ √ 666, 67 Zu (e) Die Wahrscheinlichkeit, dass an einem Tag die Kapazität überschritten wird ist p = 0, 0102. Somit ist N ∼ B(n, p) verteilt. Zu (f) X Summe einer großen Anzahl unabhängiger, identisch verteilter Zufallsvariablen mit endlicher Varianz. Mit dem zentralen Grenzwertsatz kann man daher davon ausgehen, dass X normalverteilt ist. Aufgabe 4 (20 Punkte) Für x ∈ R sei ⌊x⌋ die größte ganze Zahl, die kleiner als x ist, z.B. ⌊3, 1⌋ = 3, ⌊3, 8⌋ = 3. Sei X ∼ Exp(λ) und die diskrete Zufallsvariable Y := ⌊X⌋. (a) Beweisen Sie, dass für die Wahrscheinlichkeitsfunktion von Y gilt: P(Y = y) = e−λy 1 − e−λ , y ∈ N0 . (b) Um welche bekannte Verteilung handelt es sich in (a)? Bestimmen Sie den Erwartungswert und die Varianz von Y . 4 (c) Bestimmen Sie einen Maximum Likelihood Schätzer für λ aus einer Stichprobe von unabhängig und identisch verteilten Y1 , . . . Yn ∼ Y . (d) Gegeben sei eine Stichprobe mit Stichprobenlänge 15, Stichprobenmittel 1,6 und Stichprobenvarianz 4. Bestimmen Sie den Maximum Likelihood Schätzwert für λ. Lösung Zu (a) P (Y = y) = P (y ≤ X < y + 1) = P (y < X ≤ y + 1) = P (X ≤ y + 1)−P (X ≤ y) . Für die Verteilungsfunktion von gilt P (X ≤ x) = 1 − e−λx und somit folgt weiter P (Y = y) = 1 − e−λ(y+1) − 1 − e−λy = e−λy − e−λ(y+1) = e−λy 1 − e−λ . Zu (b) Es handelt sich um die geometrische Verteilung, Geo(1−e−λ ) = N B(1, 1−e−λ ). Damit folgt e−λ e−λ E(Y ) = , Var(Y ) = 2. −λ 1−e (1 − e−λ ) Zu (c) Aus der Likelihood L ergibt sich L (λ) = n Y i=1 n n Y e−λyi 1 − e−λ = 1 − e−λ e−λyi i=1 ℓ (λ) = ln L (λ) = n ln 1 − e n ℓ′ (λ) = −λ − n X λyi i=1 n X X n ne−λ yi = λ yi − − −λ 1−e e − 1 i=1 i=1 ℓ′′ (λ) = − neλ (1 − eλ ) 2 <0 Aus ℓ′ (λ) = 0 ergibt sich wegen ℓ′′ (λ) < 0 der ML-Schätzer n P yi n+ n 1X 1 + ȳ i=1 mit ȳ = yi . λ̂ = ln P n = ln ȳ n i=1 yi i=1 Zu (d) 1+1,6 Laut (c) erhält man den Schätzwert λ̂ = ln 1+ȳ = ln = 0, 49. ȳ 1,6 Aufgabe 5 (24 Punkte) In der folgenden Tabelle sind die relativen Sterbehäufigkeiten in % eines homogenen Kollektivs der letzten 10 Jahre aufgezeichnet. 5 Jahr rel. Häuf. (%) 1 3,51 2 3,46 3 3,46 4 3,38 5 3,36 6 3,31 7 3,07 8 2,98 9 2,81 Bezeichnet man mit xi das Jahr und mit yi die relative Häufigkeit, so wird für die Zufallsvariablen Yi das Modell Yi = a + bxi + εi , i = 1, . . . , 10 untersucht. Die εi seien unabhängig und N (0, σ 2 )-verteilt. Sie können verwenden: x = 5, 5; 10 X i=1 (xi − x)2 = 82, 5 10 X y = 3, 209; i=1 2 (yi − y) = 0, 725; 10 X i=1 (yi − y)(xi − x) = −7, 407. Stützen die Daten die Behauptung, dass die Sterblichkeit (a) vom Beobachtungsjahr abhängt? (b) sich jedes Jahr um 0,1 %-Punkte verringert? Beide Aussagen sollen zu einem Niveau von α = 5 % erfolgen. Lösung Zu (a) Zu untersuchen ist die Hypothese H0 : b = 0. Es ergeben sich folgende Schätzwerte: b̂ = σ̂ 2 = se(b̂) = T = −7, 407 = −0, 09 82, 5 7, 4072 1 0, 725 − = 0, 0075 8 82, 5 r 0, 0075 = 0, 0095 82, 5 b̂ − b0 se(b̂) = −0, 09 = 9, 439. 0, 0095 H0 wird abgelehnt, denn |T | > t8;0,975 = 2, 308. Somit wird die Hypothese, dass die Sterblichkeit nicht vom Beobachtungsjahr abhängt, verworfen. Zu (b) Zu untersuchen ist nun die Hypothese H0 : b = −0, 1. Mit den Werten aus (a) ergibt sich nun die Testgröße T = b̂ − b0 se(b̂) = −0, 09 + 0, 1 = 1, 053. 0, 0095 Die Hypothese, dass sich die Sterblichkeit jähhrlich um 0,1 % verbessert wird also nicht verworfen. 6 10 2,75