Prof. Dr. Barbara Gentz Fakultät für Mathematik Universität Bielefeld WS 2009/10 1. Klausur zur Stochastik A: Lösungshinweise zu den Aufgaben 4 und 5 Aufgabe 4 Auf einer Kreisscheibe mit Radius 1 werde zufällig mit uniformer Verteilung ein Punkt Q gewählt mit den Koordinaten Q = (X, Y ). Bestimmen Sie: (a) die gemeinsame Dichte von X und Y ; (b) die Randdichten; (c) die Wahrscheinlichkeit, daß Q in dem zentrierten Inkreis mit Radius 1/2 liegt. (d) Sind X und Y unabhängig? Ausführlicher, kommentierter Lösungsvorschlag: Die Dichte f : R 2 → [0, ∞) der uniformen Verteilung auf der Kreisscheibe D := B1 (0) = {(x, y) ∈ R 2 : x2 + y 2 ≤ 1} ist gegeben durch ein Vielfaches der Indikatorfunktion auf der Menge D, wobei das Vielfache der Kehrwert des Volumens von D sein muß. Das Volumen der Kreisscheibe ist πr2 , wobei hier r = 1 gilt. Damit wissen wir: ( 1 für (x, y) ∈ D , 1 f (x, y) = 1D (x, y) = π π 0 sonst . (a) Die gemeinsame Dichte von X und Y ist nichts anderes als die Dichte von Q, also die obige Dichte f der uniformen Verteilung auf D. Im Gegensatz zur uniformen Verteilung auf einem Rechteck (vgl. Vorlesung) sind wir hier in einer Situation, die wie die uniforme Verteilung auf einem Dreieck (vgl. ebenfalls Vorlesung) gehandhabt werden muß. Das heißt insbesondere, daß die gemeinsame Dichte nicht direkt aus den eindimensionalen uniformen Verteilungen für die x- und die y-Koordinate gewonnen werden kann. Auch kann die Dichte nicht sinnvoll durch eine Intervallänge ausgedrückt werden, wie einige es versucht haben. (b) Die Randdichten sind die Dichten der Verteilungen von X bzw. Y . Da wir die gemeinsame Dichte f von X und Y kennen, erhalten wir die Dichte fX von X als Z +∞ f (x, y) dy fX (x) = −∞ Für x 6∈ [−1, 1] ist f (x, y) = 0 für jede Wahl von y, folglich ist für diese√x automatisch fX√(x) = 0. Ist x ∈ [−1, 1], so ist f (x, y) 6= 0 genau dann, wenn − 1 − x2 < y < + 1 − x2 , und für diese x folgt somit Z +∞ Z f (x, y) dy = fX (x) = √ + 1−x2 √ − 1−x2 −∞ 1 π dy = 2 π p 1 − x2 . Damit ist die Dichte von X gegeben durch ( √ 2 1 − x2 für x ∈ [−1, +1] , fX (x) = π 0 sonst . Aus Symmetriegründen folgt genau so ( p 2 1 − y2 fY (y) = π 0 für y ∈ [−1, +1] , sonst , für die Dichte von Y . Die Randdichten haben nichts zu tun mit dem Wert von f auf dem Rand von D. Dies sollte offensichtlich sein, da Dichten nicht eindeutig bestimmt sind und immer insbesondere in einzelnen Punkten abgeändert werden dürfen. (c) Die Wahrscheinlichkeit, daß Q in dem zentrierten Inkreis A := B1/2 (0) = {(x, y) ∈ R 2 : x2 + y 2 ≤ ( 12 )2 } liegt, bestimmt sich ohne Kenntnis der Dichten aus (a) oder (b) direkt aus der Tatsache, daß bei uniformer Verteilung auf D die Wahrscheinlichkeit von A mit A ⊂ D gegeben ist als das Verhältnis der Volumina, also P(Q ∈ A) = π( 1 )2 Volumen(A) 1 = 22 = . Volumen(D) π1 4 Natürlich kann diese Wahrscheinlichkeit auch aus der Dichte f berechnet werden. Auszurechnen wäre in diesem Fall das Integral der Dichte f über die Menge A, d.h. Z Z Z +1/2 Z +√(1/2)2 −y2 1 4 1/2 p dx dy = 1/4 − y 2 dy . P(Q ∈ A) = f (x, y) dx dy = √ π π 2 2 0 A −1/2 − (1/2) −y (Weiter per Substitution.) (d) Die Zufallsvariablen X und Y sind nicht unabhängig. Wir haben zwei offensichtliche Möglichkeiten, dies zu zeigen. Wenn (a) und (b) gelöst wurden, sind wir fertig, weil (z.B.) für die Wahl x = y = 3/4 f (x, y) = 0 gelten muß, denn der Punkt (x, y) liegt nicht in D, während fX (x) 6= 0 und fY (y) 6= 0 gelten, da x, y ∈ (−1, 1). Folglich kann die gemeinsame Dichte f nicht das Produkt der Randdichten sein: f (x, y) 6= fX (x)fY (y) . Diese Aussage ist äquivalent dazu, daß die Zufallsvariablen nicht unabhängig sind. Alternativ können wir wie in (c) vorgehen: Wenn beide Koordinaten größer als (z.B.) 3/4 sind, kann der Punkt nicht in D liegen, folglich ist P(X ≥ 3/4, Y ≥ 3/4) = 0 , während 1 π/16 P(X ≥ 3/4) = P(Y ≥ 3/4) ≥ P Q ∈ B1/4 (( 43 , 0))∩{(x, y) ∈ R 2 : x ≥ 34 } = >0. 2 π Hier ist nicht nur die Wahl von 3/4 als Grenze willkürlich, sondern es sind auch andere Abschätzung der Wahrscheinlichkeit nach unten denkbar, als durch die halbe Kreisscheibe B1/4 (( 43 , 0))∩{(x, y) ∈ R 2 : x ≥ 43 } mit Mittelpunkt (3/4, 0) und Radius 1/4. Es kommt nur darauf an, eine Menge zu wählen, die in D enthalten ist und positive Wahrscheinlichkeit hat. Naheliegend wäre zum Beispiel auch die Wahl eines Rechtecks, das noch ganz in D ∩ {(x, y) ∈ R 2 : x ≥ 3/4} enthalten ist. Aufgabe 5 Die Studentin Anna fährt jeden Tag mit dem Bus zur Universität. Sie hat die Wahl zwischen den Buslinien A und B. Die Wartezeiten TA und TB (in Minuten) an der Haltestelle auf die Linie A und die Linie B seien unabhängige, exponentialverteilte Zufallsvariablen mit Erwartungswerten µA bzw. µB . (a) Bestimmen Sie die Parameter der beiden Exponentialverteilungen sowie die Varianzen der Wartezeiten. (Sie dürfen dabei die allgemein gültigen, aus der Vorlesung bekannten Ausdrücke für Erwartungswert und Varianz der Exponentialverteilung verwenden.) (b) Wie groß ist die Wahrscheinlichkeit, daß Linie A zuerst kommt? (c) Gegeben, Linie A trifft zuerst an der Haltestelle ein, wie groß ist dann die Wahrscheinlichkeit, daß Linie B höchstens t Minuten nach der Linie A eintrifft? Interpretieren Sie das Ergebnis. (d) Bestimmen Sie die Verteilung der Wartezeit an der Haltestelle bis zum Eintreffen des ersten Busses. Interpretieren Sie das Ergebnis. Lösungsansatz: Die Fahrzeiten werden als exponentialverteilte Zufallsgrößen modelliert, d.h., TA und TB haben Dichten ( ( λA e−λA s für s ≥ 0 , λB e−λB t für t ≥ 0 , fA (s) = bzw. fB (t) = 0 sonst , 0 sonst . Dabei müssen die Parameter λA , λB > 0 sein. Gemäß Voraussetzung sind TA und TB unabhängig, also ist die gemeinsame Dichte von TA und TB gegeben durch f (s, t) = fA (s)fB (t) für alle s, t ∈ R . (a) Es darf verwendet werden, daß der Erwartungswert der Exponentialverteilung der Kehrwert des Parameters ist, also λA = 1/µA und λB = 1/µB . Ebenfalls aus der Vorlesung bekannt: Für die Exponentialverteilung ist die Varianz gerade das Quadrat des Erwartungswerts, es gilt also Var(TA ) = 1 = µ2A λ2A und Var(TB ) = 1 = µ2B . λ2B (b) Die Wahrscheinlichkeit P(TA < TB ), daß Linie A zuerst kommt, ist gegeben durch das Integral Z f (s, t) ds dt . {(s,t)∈[0,∞)2 : s<t} Wir müssen also die gemeinsame Dichte f über das “unendliche Dreieck” {0 ≤ s < t < ∞} integrieren: Z Z ∞Z t P(TA < TB ) = f (s, t) ds dt = fA (s)fB (t) ds dt = . . . {(s,t)∈[0,∞)2 : s<t} 0 0 Keinesfalls können die Zufallsvariablen TA oder TB in den Integralgrenzen auftreten! (c) Die bedingte Wahrscheinlichkeit, daß Linie B höchstens t Minuten nach der Linie A an der Haltestelle eintrifft, gegeben, Linie A trifft zuerst ein, ist P(TB ≤ TA + t | TA < TB ) = P(TA < TB ≤ TA + t) . P(TA < TB ) Der Nenner wurde in (b) berechnet. Um den Zähler zu berechnen, müssen wir wie in (b) vorgehen, nur dass jetzt über die Menge {(u, v) ∈ [0, ∞)2 : u < v ≤ u + t} = {(u, v) : 0 ≤ u < v ≤ u + t < ∞} integriert werden muß, d.h., das neu zu berechnende Doppelintegral ist Z ∞ Z u+t fA (u)fB (v) dv du = . . . 0 u Beachten Sie: Die Gedächtnislosigkeit der Exponentialverteilung kann hier nicht verwendet werden, da wir diese nur für den Fall einer deterministischen Zeit TA und einer exponentialverteilten Zeit TB kennengelernt haben. Dieser Aufgabenteil beweist gerade, daß die Gedächtnislosigkeit auch gilt, wenn die Zeit TA unabhängig und ebenfalls exponentialverteilt ist. (d) Wir bestimmen die Verteilungsfunktion der Eintreffzeit des ersten Busses: P(min{TA , TB } ≤ z) = 1 − P(TA > z, TB > z) = 1 − P(TA > z)P(TB > z) . Dabei verwendet der letzte Schritt die Unabhängigkeit von TA und TB . Einsetzen der bekannten Verteilungsfunktion der Exponentialverteilung zeigt, daß die Eintreffzeit min{TA , TB } des ersten der Busse wiederum exponentialverteilt ist mit Parameter λA + λB . Damit haben wir allgemein gezeigt, daß das Minimum von exponentialverteilten Zufallsvariablen wieder exponentialverteilt ist und daß die Parameter sich addieren.