Klausur Stochastik und Statistik 18. September 2012 Prof. Dr. Matthias Schmid Institut für Statistik, LMU München Wichtig: Überprüfen Sie, ob Ihr Klausurexemplar vollständig ist. Die Klausur besteht aus fünf Aufgaben, einem Deckblatt und der Standardnormalverteilung im Anhang. Schreiben Sie Ihren Namen und die Matrikelnummer auf jeden Klausurbogen. Verwenden Sie für Ihre Lösungen ausschließlich die Klausurbögen (Vorder- und Rückseite), Zusatzblätter werden auf Anfrage ausgeteilt. Als Hilfsmittel sind das ausgedruckte Skript bzw. die Vorlesungsfolien sowie ein nichtprogrammierbarer Taschenrechner zugelassen. Weiters darf ein einseitig beschriebenes oder bedrucktes A4 Blatt mit einer selbst erstellten Formelsammlung verwendet werden. Bücher, alte Klausuren und Übungsaufgaben inkl. Lösungen sind nicht zugelassen. Bei Unterschleif erfolgt eine Meldung an das Prüfungsamt. Sie sind verpflichtet, durch Ihr Verhalten jegliche Missverständnisse diesbezüglich auszuschließen. Die Bearbeitungszeit beträgt 120 Minuten. In den ersten 30 Minuten und in den letzten 15 Minuten ist keine vorzeitige Abgabe möglich. Halten Sie für die Ausweiskontrolle bitte Ihren Studentenausweis und einen Lichtbildausweis bereit. Ich habe die Anweisungen zur Kenntnis genommen und die Angabe auf Vollständigkeit überprüft. Matrikelnummer: Name: Vorname: Unterschrift: Punkte: Note: Name: Matrikelnr.: Klausur Stochastik und Statistik Aufgabe 1 Betrachten Sie folgende Zufallsvariablen X und Y , deren gemeinsame Verteilung, soweit bekannt, in der angegebenen Kontingenztabelle abzulesen ist. fX,Y (x, y) y = 1 y = 2 fX (x) x = −1 θ 0.35 x=0 x=1 0.2 0.15 fY (y) 0.5 (a) Vervollständigen Sie die Tabelle (inkl. der Randverteilungen). (3 Pkt.) (b) Berechnen Sie die Erwartungswerte von X, Y und X · Y . (3 Pkt.) (c) Bestimmen Sie θ so, dass X und Y unkorreliert sind. (3 Pkt.) (d) Sind X und Y unabhängig? Warum, bzw. warum nicht? (2 Pkt.) Lösung: (a) . -1 0 1 fY (y) 1 0.35 − θ θ − 0.05 0.2 0.5 2 θ 0.35 − θ 0.15 0.5 fX (x) 0.35 0.3 0.35 1 (b) E(Y ) = 1 · 0.5 + 2 · 0.5 = 1.5 E(X) = −0.35 + 0.35 = 0 E(XY ) = −0.35 + θ − 2θ + 0.2 + 2 · 0.15 = 0.15 − θ (c) ρ(X, Y ) = p Cov(X, Y ) p , V ar(X) · V ar(Y ) d.h. X und Y sind unkorreliert, falls Cov(X, Y ) = 0 ! Cov(X, Y ) = E(XY ) − E(X) · E(Y ) = 0.15 − θ = 0 ⇔ θ = 0.15 (d) Nein, denn fX,Y (x = 1, y = 2) = 0.15 6= 0.175 = 0.35 · 0.5 = fX (x = 1) · fY (y = 2) 18. September 2012 Aufgabe 2 LMU München Name: Matrikelnr.: Klausur Stochastik und Statistik Aufgabe 2 Von einer stetigen Zufallsvariable X, die von einem Parameter θ ∈ [− 21 , 12 ] abhängt, sei die Verteilungsfunktion gegeben: für x < −2 0, 1 1 2 (x + 2) + 8 θ(x − 4), für − 2 ≤ x < 2 F (x) = 4 1, für x ≥ 2. (a) Berechnen Sie die Dichte f (x) von X. (3 Pkt.) (b) Welche spezielle Verteilung liegt für θ = 0 vor? (1 Pkt.) (c) Berechnen Sie den Erwartungswert von X in Abhängigkeit von θ. (2 Pkt.) Lösung: (a) f (x) = 0, 1 4 + 1 θx, 4 für x ∈ / [−2, 2] für − 2 ≤ x < 2 (b) Stetige Gleichverteilung: X ∼ U[−2, 2] (c) Z2 E(X) = −2 18. September 2012 2 2 3 2 x x 1 1 8 8 4 1 1 2 = − + θ+ θ= θ + θ x · + θx dx = 4 4 8 −2 12 −2 2 2 12 12 3 Aufgabe 2 LMU München Name: Matrikelnr.: Klausur Stochastik und Statistik Aufgabe 3 Ein Marktforschungsinstitut, das in Foto-Fachgeschäften eine Erhebung machen will, stützt sich bei der zufälligen Auswahl von n = 200 Geschäften auf eine erworbene Adressenliste. Von den mehr als 5000 Adressen auf der Liste sind allerdings 15% nicht mehr gültig. (a) Wie ist die Anzahl der ungültigen Adressen in der Stichprobe exakt verteilt und wie lässt sie sich anhand des Zentralen Grenzwertsatzes approximieren? Gehen Sie dabei davon aus, dass die Adressen mit Zurücklegen gezogen werden. (4 Pkt.) (b) Berechnen Sie approximativ die Wahrscheinlichkeit, dass in der Stichprobe zwischen 20 und 30 Adressen ungültig sind. (4 Pkt.) Lösung: (a) Sei X die Anzahl der ungültigen Adressen in der Stichprobe. Dann ist X ∼ B(n = 200, p = 0.15). Es gilt: E(X) = np = 30, V ar(X) = np(1 − p) = 25.5. Die Zufallsvariable X kann durch folgende Normalverteilung approximiert werden: a X ∼ N (30, 25.5) (b) Eine Anzahl von ungültigen Adressen in der Stichprobe zwischen 20 und 30 ergibt sich, wenn die Zufallsvariable X Werte zwischen 19.5 und 30.5 annimmt: P (19.5 < X < 30.5) = P (X < 30.5) − P (X < 19.5) 19.5 − 30 30.5 − 30 √ √ −P = P 25.5 25.5 = P (X < 0.0990) − P (X < −2.0793) = Φ (X < 0.0990) − Φ (X < −2.0793) = Φ (X < 0.0990) + 1 − Φ (X < 2.0793) = 0.5394 − 1 + 0.9812 = 0.5206 18. September 2012 Aufgabe 3 LMU München Name: Matrikelnr.: Klausur Stochastik und Statistik Aufgabe 4 Das Guthaben einer Vereinigung soll als Markov-Kette mit Zustandsraum S = {0, 1000, 2000, 3000, 4000, 5000} modelliert werden. Die Vereinigung bekommt zum Zeitpunkt t = 0 eine Spende von 1000 Euro. Um Steuern zu sparen, wird das Geld außer Landes angelegt. Nach jedem Jahr bringt ein Bote weitere 2000 Euro auf das Konto, wird aber mit einer Wahrscheinlichkeit von 0.2 an der Grenze verhaftet, wo er das Geld sowie weitere 1000 Euro Strafe zahlen muss. Die Strafe wird vom Konto bezahlt, sofern dies gedeckt ist. Wenn der Kontostand 3500 Euro übersteigt (d.h. 4000 oder 5000 Euro beträgt), wird das gesamte Geld am nächsten Tag zu Werbezwecken zurücktransferiert, der Geldbetrag bleibt gleich und die Markov-Kette endet. (a) Geben Sie die zugehörige Übergangmatrix P an. (4 Pkt.) (b) Ist die Markov-Kette irreduzibel? Besitzt die Markov-Kette eine stationäre Verteilung? (Bitte jeweils begründen.) (4 Pkt.) Lösung: (a) 0 1000 2000 P = 3000 4000 5000 0 0.2 0.2 0 0 0 0 1000 0 0 0.2 0 0 0 2000 0.8 0 0 0.2 0 0 3000 0 0.8 0 0 0 0 4000 0 0 0.8 0 1 0 5000 0 0 0 0.8 0 1 (b) Eine Markov-Kette ist irreduzibel, falls jeder Zustand von jedem anderen erreichbar ist. Dies ist bei der gegebenen Markov-Kette nicht gegeben, denn die Zustände 5000 und 4000 sind final. Kommt die Markov-Kette einmal in einen dieser Zustände, verharrt sie dort. Eine stationäre Verteilung beschreibt die Wahrscheinlichkeit, mit welcher die MarkovKette nach langer Zeit in einem bestimmten Zustand ist. Diese Verteilung existiert nur wenn die Markov-Kette irreduzibel ist. Die stationäre Verteilung ist dann unabhängig vom Verlauf der Markov-Kette. Im gegebenen Beispiel ist die Markov-Kette jedoch nicht irreduzibel, weshalb keine stationäre Verteilung existiert (vgl. Skript Satz 7.3.1). Kommt die Markov-Kette in einen der finalen Zustände, verharrt sie dort und macht eine Aussage über das Verhalten der Markov-Kette nach langer Zeit abhängig vom Verlauf. 18. September 2012 Aufgabe 4 LMU München Name: Matrikelnr.: Klausur Stochastik und Statistik Aufgabe 5 (a) Ein Automobilzulieferer stellt an fünf Arbeitstagen Blinker her, wobei der Produktionsanteil am Freitag nur halb so hoch ist wie an den restlichen Tagen. Am Montag sind 12% der Blinker defekt, an den restlichen Tagen sind es lediglich 8%. Wie groß ist die Wahrscheinlichkeit, dass dieser defekte Blinker montags produziert wurde? (3 Pkt.) (b) Gegeben sei eine diskrete Zufallsvariable 0.45, 0.3, f (x) = 0.25, 0, X mit der Wahrscheinlichkeitsdichte Geben Sie das 0.9-Quantil von X an. für x = −1 für x = 0 für x = 1 sonst. (2 Pkt.) (c) Beschreiben Sie, was der Wert 1 − α eines (1 − α)-Konfidenzintervalls bedeutet. (1 Pkt.) (d) Wie lautet die Dichte einer exponentialverteilten Zufallsvariable Y mit Varianz 1 V ar(Y ) = 16 ? (2 Pkt.) (e) Geben Sie für die folgenden Beispiele an, welche aus der Vorlesung bekannte Verteilung für die Zufallsvariablen X1 bis X4 angenommen werden kann. Geben Sie für die Teilaufgaben (iii) und (iv) auch die zugehörigen Parameterwerte an. (i) In einem Areal lebt eine unbekannte Anzahl N von Tieren. Um die Populationsgröße zu schätzen, verfahren Ökologen nach dem folgenden Schema: Zunächst fangen sie eine Zahl m von Tieren und markieren sie. Diese werden wieder frei gelassen. Man wartet ab, bis sie sich mit den übrigen gut durchmischt haben und fängt dann (zufällig) n Tiere ein. Angenommen alle Tiere werden mit gleicher Wahrscheinlichkeit gefangen. Sei X1 die Anzahl der markierten Tiere in der Stichprobe. (1 Pkt.) (ii) Ein Klumpen einer radioaktiven Substanz besteht aus vielen Atomen, welche bei ihrem sehr seltenen Zerfall α-Teilchen ausstrahlen. X2 sei die Anzahl emittierter α-Teilchen pro Zeitintervall. (1 Pkt.) (iii) Ein betrunkener Nachtwächter hat einen Schlüsselbund mit 10 Schlüsseln und will eine Tür aufschließen, in deren Schloss genau einer dieser Schlüssel passt. Er probiert dazu einen zufällig ausgewählten Schlüssel aus. Passt er nicht, so fällt ihm der Schlüsselbund aus der Hand, die Schlüssel durchmischen sich und er wiederholt sein Vorgehen. X3 sei die Anzahl der Versuche bis er den passenden Schlüssel findet. (2 Pkt.) (iv) Angenommen ein Münchner kennt jeden 1000. Einwohner persönlich. X4 sei die Anzahl der Bekannten, die er auf einem Spaziergang trifft, wenn ihm 50 Münchner begegnet sind. (2 Pkt.) Lösung: 18. September 2012 Aufgabe 5 LMU München Name: Matrikelnr.: Klausur Stochastik und Statistik (a) Definiere die Ereignisse M : Blinker wurde am Montag produziert. D: Blinker ist defekt. Aus den Angaben entnimmt man die folgenden Wahrscheinlichkeiten: P (M ) = 29 , P (M̄ ) = 97 , P (D|M ) = 0.12, P (D̄|M ) = 0.88 P (D|M̄ ) = 0.08, P (D̄|M̄ ) = 0.92. Aus dem Satz von Bayes ergibt sich dann die gesuchte Wahrscheinlichkeit, dass dieser defekte Blinker am Montag produziert wurde, gemäß P (M |D) = 0.12 · 29 P (D|M ) · P (M ) = P (D|M ) · P (M ) + P (D|M̄ ) · P (M̄ ) 0.12 · 29 + 0.08 · 7 9 = 0.3 (b) 0, 0.45, F (x) = 0.75, 1, für für für für x < −1 −1≤x<0 0≤x<1 x ≥ 1. x̃0.9 = F −1 (0.9) = 1 (c) Ein (1−α)-Konfidenzintervall überdeckt bei hypothetischer vielfacher Wiederholung des Zufallsexperiments mit einer Sicherheit von 1 − α den unbekannten Parameter. (d) V ar(Y ) = 1 λ2 = 1 16 ⇒ λ = 4. f (y) = 4 · exp(−4y) für y > 0 und f (y) = 0 für y ≤ 0. (e) (i) X1 ist hypergeometrisch verteilt mit der Gesamtanzahl N , der Anzahl markierter Tiere m und dem Stichprobenumfang n: X1 ∼ H(n, N, m) (ii) X2 ist Poisson-verteilt mit unbekanntem Parameter λ: X2 ∼ P(λ) (iii) X3 ist geometrisch verteilt mit p = 0.1: X3 ∼ G(0.1) (iv) Wir betrachten einen beliebigen Münchner aus der Gruppe der 50 getroffenen 1 Münchner. Diese Person kennt man (mit Wahrscheinlichkeit p = 1000 = 0.001) oder man kennt sie nicht ⇒ Bernoulli-Experiment. Dieses Bernoulli-Experiment wird 50 mal wiederholt (Annahme: Unabhängigkeit). X4 ist also binomialverteilt mit n = 50 und p = 0.001: X4 ∼ B(50, 0.001) 18. September 2012 Aufgabe 5 LMU München Name: Matrikelnr.: Klausur Stochastik und Statistik x 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 0.10 0.11 0.12 0.13 0.14 0.15 0.16 0.17 0.18 0.19 Φ(x) 0.5000 0.5040 0.5080 0.5120 0.5160 0.5199 0.5239 0.5279 0.5319 0.5359 0.5398 0.5438 0.5478 0.5517 0.5557 0.5596 0.5636 0.5675 0.5714 0.5753 x 1.70 1.71 1.72 1.73 1.74 1.75 1.76 1.77 1.78 1.79 1.80 1.81 1.82 1.83 1.84 1.85 1.86 1.87 1.88 1.89 Φ(x) 0.9554 0.9564 0.9573 0.9582 0.9591 0.9599 0.9608 0.9616 0.9625 0.9633 0.9641 0.9649 0.9656 0.9664 0.9671 0.9678 0.9686 0.9693 0.9699 0.9706 x 1.90 1.91 1.92 1.93 1.94 1.95 1.96 1.97 1.98 1.99 2.00 2.01 2.02 2.03 2.04 2.05 2.06 2.07 2.08 2.09 Φ(x) 0.9713 0.9719 0.9726 0.9732 0.9738 0.9744 0.9750 0.9756 0.9761 0.9767 0.9772 0.9778 0.9783 0.9788 0.9793 0.9798 0.9803 0.9808 0.9812 0.9817 Tabelle 1: Verteilungsfunktion der Standardnormalverteilung (Ausschnitt). 18. September 2012 Anhang LMU München