Universität Karlsruhe (TH) Name Institut für Stochastik Dr. Bernhard Klar Dipl.-Math. oec. Volker Baumstark Vorname Matr.-Nr.: Diplomvorprüfung Stochastik 09. März 2007 Diese Klausur hat bestanden, wer mindestens 16 Punkte erreicht. Als Hilfsmittel sind nur zwei selbst erstellte DIN A4 Seiten sowie ein nicht programmierbarer Taschenrechner zugelassen! Aufgabe 1 (7) 2 (7) 3 (6) 4 (6) 5 (7) Punkte Korrektor Gesamtpunktzahl Note 6 (7) P (40) Aufgabe 1 (7 Punkte) Ein Zufallszahlengenerator wählt in unabhängiger Folge jede der Ziffern 0, 1, 2, 3 mit gleicher Wahrscheinlichkeit 1/4 aus. Die Zufallsvariable Z k bezeichne die beim k–ten Mal ausgewählte Ziffer (k = 1, 2, . . .). Die Zufallsvariable X n,j gebe an, wie häufig die Ziffer j unter den ersten n erzeugten Zahlen auftritt, es sei also Xn,j := n X 1{Zk = j} (j = 0, 1, 2, 3). k=1 a) Bestimmen Sie E(Z1 ), V (Z1 ) und ρ(Z1 − 2Z2 , 2Z2 − Z3 ). b) Welche Verteilung besitzt der Zufallsvektor (X n,0 , Xn,1 , Xn,2 , Xn,3 )? Lösung: (keine Begründung erforderlich) c) Welche Verteilung besitzt Xn,3 ? Lösung: (keine Begründung erforderlich) d) Welche Verteilung besitzt Xn,0 + Xn,3 ? Lösung: (keine Begründung erforderlich) e) Berechnen Sie die Wahrscheinlichkeit, dass unter 5 erzeugten Zahlen 3 Nullen und 2 Einsen vorkommen. f) Berechnen Sie mit Hilfe des zentralen Grenzwertsatzes approximativ die Wahrscheinlichkeit, dass unter 800 erzeugten Zahlen mehr als 230 Einsen vorkommen. Einige Werte der Verteilungsfunktion Φ der Normalverteilung N (0, 1): 0 1 1.73 2 2.45 3 t Φ(t) 0.5 0.84 0.96 0.98 0.993 0.999 Lösung zu Aufgabe 1 a) Es gelten EZ1 = V (Z1 ) = 3 1 (1 + 2 + 3) = , 4 2 14 9 5 − = 4 4 4 1 7 E(Z12 ) = (1 + 4 + 9) = , 4 2 und ρ(Z1 − 2Z2 , 2Z2 − Z3 ) = = 2C(Z1 , Z2 ) − C(Z1 , Z3 ) − 4C(Z2 , Z2 ) + 2C(Z2 , Z3 ) p V (Z1 ) + 4V (Z2 )) · (4V (Z2 ) + V (Z3 )) −4V (Z2 ) 4 =− . 5V (Z1 ) 5 2.5 P b) 1 1 1 1 Mult n; , , , 4 4 4 4 c) 1 Bin n, 4 . . d) 1 Bin n, 2 . e) P (X5,0 = 3, X5,1 = 2, X5,2 = X5,3 5! = 0) = 3! · 2! · 0! · 0! 0.5 P 0.5 P 0.5 P 5 1 10 = 5 (≈ 0.0098). 4 4 f) Nach dem ZGWS von de Moivre-Laplace kann man hier die Bin(800, 14 )-Verteilung durch die Normalverteilung mit Parameter µ = np = 200 und σ 2 = np(1 − p) = 150 approximieren. Somit gilt 230 − 200 √ P (X800,1 > 230) = 1 − P (X800,1 ≤ 230) ≈ 1 − Φ 5 6 √ = 1 − Φ( 6) = 1 − 0.993 = 0.007. 1P 2P Aufgabe 2 (7 Punkte) Tom will im Karlsruher Zoo zur Eisbärenanlage. Er kann hierfür nach rechts (richtiger Weg) oder nach links (falscher Weg) gehen. Fragt er einen Besucher des Zoos mit Tageskarte nach dem Weg dorthin, so erhält er mit Wahrscheinlichkeit 2/3 die richtige Antwort und mit Wahrscheinlichkeit 1/3 eine falsche Antwort. Fragt er einen Dauerkartenbesitzer nach dem Weg dorthin, so erhält er stets die richtige Antwort. Antworten und Eintrittskarten von verschiedenen Personen sind unabhängig. Die Wahrscheinlichkeit, dass eine zufällig angesprochene Person eine Dauerkarte besitzt, sei 1/10. a) Zeichnen Sie das zu dem 2-stufigen Experiment gehörende Baumdiagramm, und tragen Sie die Start- und Übergangswahrscheinlichkeiten ein. b) Tom fragt einen Besucher B1 nach dem Weg zur Eisbärenanlage. Mit welcher Wahrscheinlichkeit erhält er eine richtige Antwort? c) Wie groß ist die bedingte Wahrscheinlichkeit, dass der Besucher B1 eine Dauerkarte besitzt, wenn er die richtige Antwort gegeben hat? d) Tom fragt einen weiteren Besucher B2 nach dem Weg zur Eisbärenanlage. Mit welcher Wahrscheinlichkeit geben B1 und B2 dieselbe Antwort? e) Wie groß ist die bedingte Wahrscheinlichkeit, dass der Besucher B1 eine Tageskarte besitzt, wenn B1 und B2 dieselbe Antwort geben? Lösung zu Aufgabe 2 a) D := Dauerkarte, T := Tageskarte, R := Antwort richtig, F := Antwort falsch, 1P 1 1 10 Start HH 9 10 HH * D H j H T 2 3 @ @ - R 1 10 - R 6 10 @ R @ F 3 10 @ 1@ 3 @ @ b) Der Index 1 beziehe sich auf B1. Aus obigem Diagramm lesen wir ab P (R1 ) = P (D1 ∩ R1 ) + P (T1 ∩ R1 ) = 6 7 1 + = . 10 10 10 1P c) Unser Diagramm und Teil a) liefern 1P P (D1 |R1 ) = 1/10 1 P (D1 ∩ R1 ) = = . P (R1 ) 7/10 7 d) Der Index 2 beziehe sich auf B2. Es sei C das Ereignis, dass B1 und B2 dieselbe Antwort geben. Analog zu a) gilt 7 P (R2 ) = . 10 Die gesuchte Wahrscheinlichkeit berechnet sich wegen der Unabhängigkeit von R1 und R2 bzw. F1 und F2 zu P (C) = P (R1 ∩ R2 ) + P (F1 ∩ F2 ) = P (R1 )P (R2 ) + P (F1 )P (F2 ) = 7 10 2 + 3 10 2 = 1.5 P 49 + 9 58 = . 100 100 e) Es gelten unter Beachtung des Teils a) P (T1 ∩ R1 ∩ R2 ) = P (T1 ∩ R1 )P (R2 ) = 6 7 42 · = 10 10 100 P (T1 ∩ F1 ∩ F2 ) = P (T1 ∩ F1 )P (F2 ) = 9 3 3 · = . 10 10 100 und Folglich P (T1 ∩ C) = P (T1 ∩ R1 ∩ R2 ) + P (T1 ∩ F1 ∩ F2 ) = Die gesuchte Wahrscheinlichkeit berechnet sich mit c) zu P (T1 |C) = 51 P (T1 ∩ C) = . P (C) 58 9 51 42 + = . 100 100 100 2.5 P Aufgabe 3 (6 Punkte) Sei X exponentialverteilt mit Parameter λ > 0, d.h. X besitze die Dichte f (x) = λe−λx , x > 0. a) Bestimmen Sie den Median von X. b) Berechnen Sie die Verteilungsfunktion und Dichte der Zufallsvariablen Y := e αX , α > 0. c) Bestimmen Sie alle α > 0, für die der Erwartungswert von Y existiert. Berechnen Sie EY für alle derartigen α. Lösung zu Aufgabe 3 a) Die Verteilungsfunktion F von X ist gegeben durch F (x) = 1 − e−λx , 1.5 P x > 0, und F (x) = 0 für x ≤ 0. Wegen F (x) = 1 2 e−λx = ⇔ berechnet sich der Median von X zu 1 2 ⇔ λx = − log 1 2 ⇔ x= 1 · log 2 λ log 2 . λ b) Wegen X > 0 ist Y = eαX > 1. Für t > 1 gilt log t P (Y ≤ t) = P (αX ≤ log t) = P X ≤ α log t = 1 − exp −λ · α 2.5 P = 1 − t−λ/α . Eine Dichte für Y ist folglich durch f (t) := dP (Y ≤ t) λ · 1{t > 1} = · t−λ/α−1 · 1{t > 1} dt α gegeben. c) Nach der Transformationsformel für Erwartungswerte gilt EY = Z ∞ αx e λe 0 −λx dx = Z 0 ∞ λe −(λ−α)x dx = ∞ λ λ−α für α ≥ λ für α < λ. Der Erwartungswert existiert also für α < λ und berechnet sich in diesem Fall zu λ/(λ − α). 2P Aufgabe 4 (6 Punkte) Es sei (U, V ) ein zweidimensionaler Zufallsvektor mit Dichte f (u, v) = u −u/v e 1{u>0,0<v<1} . v2 a) Zeigen Sie, dass U ∼ Exp(1) und V ∼ U(0, 1) gilt. b) Berechnen Sie die Kovarianz C(U, V ) zwischen U und V . Z ∞ x2 e−x dx = 2 verwenden. Hinweis: Sie können ohne Beweis 0 c) Sind U und V unabhängig? Lösung zu Aufgabe 4 a) Die Dichte fV von V ergibt sich durch fV (v) = Z ∞ 0 u −u e v du = v2 Z ∞ xe−x dx = 1, 0 v ∈ (0, 1), 2P und fV (v) = 0 sonst. Somit ist V auf (0, 1) gleichverteilt. Ferner gilt für u > 0 fU (u) = Z 1 0 u −u e v dv = v2 Z ∞ e−x dx = e−u . u Somit ist U exponentialverteilt mit Parameter 1. b) Für U ∼ Exp(1) bzw. W ∼ U(0, 1) gilt EU = 1, EV = 1 . 2 3P Ferner ist Z 1Z ∞ Z 1Z ∞ u2 −u/v e dudv v 0 0 0 0 Z 1 Z 1 Z ∞ 2 v 2 dv = . v2 x2 e−x dxdv = 2 = 3 0 0 0 E(U V ) = uvf (u, v)dudv = Somit C(U, V ) = EU V − EU EV = 2 1 1 − = . 3 2 6 c) Aus C(U, V ) 6= 0 folgt, dass U und V nicht unabhängig sind. 1P Aufgabe 5 (7 Punkte) Die Zufallsvariablen X1 , . . . , Xn seien unabhängig und identisch verteilt mit P (X1 = k) = k+r−1 k r r+µ r µ r+µ k , k ∈ N0 . Dabei ist r ∈ N bekannt und µ > 0 unbekannt. a) Zeigen Sie, dass n 1X µ̂n = Xi n i=1 P der Maximum-Likelihood-Schätzer für µ ist, falls ni=1 Xi > 0 ist. b) Ist µ̂n erwartungstreu für µ? c) Berechnen Sie die Varianz von µ̂n und die mittlere quadratische Abweichung M QAµ̂n (µ) = Eµ (µ̂n − µ)2 . d) Ist die Folge (µ̂n )n∈N konsistent für µ? Hinweis: Sie können ohne Beweis Eµ X1 = µ und Vµ (X1 ) = µ(r + µ) benutzen. r Lösung zu Aufgabe 5 a) Für x = (x1 , . . . , xn ), wobei x1 , . . . , xn ∈ N0 , gilt: n Y xi + r − 1 r xi r µ Lx (µ) = xi r+µ r+µ i=1 nr Pni=1 xi Y n xi + r − 1 µ r . = xi r+µ r+µ i=1 | {z } =:c Folglich log Lx (µ) = nr(log r − log(µ + r)) + n X i=1 xi (log µ − log(r + µ)) + log c und r = µ(µ+r) }| z { n X d 1 nr 1 ·xi log Lx (µ) = − + − dµ µ+r µ µ+r i=1 nr 1 = −1 + x̄n · =0 ⇔ µ+r µ sowie nr 1 d2 log Lx (x̄n ) = · − < 0, d2 µ x̄n + r x̄n µ = x̄n , 4P falls x̄n > 0. Folglich ist n 1X µ̂n := X̄n = Xi n i=1 P der gesuchte Maximum-Likelihood-Schätzer, falls ni=1 Xi > 0 ist. b) Wegen Eµ X̄n = µ ist µ̂n erwartungstreu. c) Die mittlere quadratische Abweichung stimmt wegen der Erwartungstreue von µ̂ n mit Vµ (µ̂n ) überein und es gilt Vµ (X1 ) µ(r + µ) MAQµ̂n (µ) = Vµ (µ̂n ) = = . n nr 1P 1P d) Die Folge (µ̂n )n∈N ist konsistent: Für ε > 0 folgt aus der Tschebyscheff-Ungleichung Pµ (|µ̂n − µ| ≥ ε) ≤ Vµ (µ̂n ) µ(r + µ) = →0 2 ε nrε2 für n → ∞. Alternativ folgt die Konsistenz direkt aus dem Schwachen Gesetz großer Zahlen. 1P Aufgabe 6 (7 Punkte) In einer Studie soll gezeigt werden, dass bei trainierten Personen der mittlere systolische Blutdruck niedriger als der Normalwert von 80mmHG ist. Dazu wird bei n Sportlern der Blutdruck gemessen, wobei wir annehmen, dass die Blutdruckwerte als Realisierungen unabhängiger Zufallsvariablen mit gleicher Normalverteilung N (µ, 16) modelliert werden können. a) Formulieren Sie eine geeignete Hypothese und Alternative und geben Sie ein Testverfahren √ basierend auf der Testgröße Tn = n(X̄n − 80)/4 an, das geeignet ist, die obige Behauptung statistisch nachzuweisen“. ” Wie muss dabei der kritische Wert gewählt werden, wenn der Stichprobenumfang n = 30 und das Signifikanzniveau α = 1% betragen soll? b) Was ist das Testergebnis, wenn bei den 30 Sportlern x̄ 30 =78mmHG gemessen wurde. c) Bestimmen Sie die Gütefunktion des Tests. d) Wie groß ist die Wahrscheinlichkeit des Fehlers 2. Art, wenn im Falle n = 30 der mittlere systolische Blutdruck in Wirklichkeit 78mmHG beträgt? e) Was könnte der Leiter der Studie tun, um die Fehlerwahrscheinlichkeit in d) zu verringern? Einige Werte der Verteilungsfunktion Φ der Normalverteilung N (0, 1): t Φ(t) 0 0.5 0.41 0.66 1.28 0.9 1.65 0.95 1.96 0.975 2.33 0.99 2.58 0.995 Lösung zu Aufgabe 6 a) Man muss als Hypothese H0 : ϑ ≥ 80 und als Alternative H1 : ϑ < 80 wählen. Nur dann ist bei Ablehnung von H0 die Aussage “bei trainierten Personen ist der mittlere systolische Blutdruck niedriger als 80mmHG“ statistisch gesichert. 2P Da kleine Werte von Tn gegen H0 sprechen, und da Tn unter H0 standardnormalverteilt ist, muss H0 zum Niveau α = 0.01 verworfen werden, wenn T n ≤ z0.01 = Φ−1 (0.01) = −2.33 ist. Andernfalls besteht kein Einwand gegen H 0 . √ b) Wegen T30 = 30(X̄30 −80)/4 = −2.74 < z0.01 wird H0 wird auf dem 1%–Niveau abgelehnt. c) Die Gütefunktion des Tests ist √ n(X̄n − 80) ≤ z0.01 g(µ) = Pµ (Test verwirft H0 ) = Pµ 4 √ √ n(X̄n − µ) n(80 − µ) = Pµ ≤ z0.01 + 4 4 √ n(80 − µ) = Φ z0.01 + . 4 1P 2P d) Für µ = 78 ist die Wahrscheinlichkeit des Fehlers 2. Art β = 1 − g(78) = 1 − Φ(−2.33 + 2.74) = 1 − Φ(0.41) = 0.34. e) Der Studienleiter könnte den Stichprobenumfang erhöhen, denn dann nimmt die Güte des Tests zu, es verringert sich also die Wahrscheinlichkeit, dass bei Vorliegen der Alternative die Hypothese H0 fälschlicherweise nicht abgelehnt wird. Eine weitere Möglichkeit wäre, den Fehler 1. Art anzuheben (etwa auf α = 5%). 1P 1P