Klausur Stochastik und Statistik 18. September 2012

Werbung
Klausur
Stochastik und Statistik
18. September 2012
Prof. Dr. Matthias Schmid
Institut für Statistik, LMU München
Wichtig:
ˆ Überprüfen Sie, ob Ihr Klausurexemplar vollständig ist. Die Klausur besteht aus fünf
Aufgaben, einem Deckblatt und der Standardnormalverteilung im Anhang.
ˆ Schreiben Sie Ihren Namen und die Matrikelnummer auf jeden Klausurbogen.
ˆ Verwenden Sie für Ihre Lösungen ausschließlich die Klausurbögen (Vorder- und Rückseite),
Zusatzblätter werden auf Anfrage ausgeteilt.
ˆ Als Hilfsmittel sind das ausgedruckte Skript bzw. die Vorlesungsfolien sowie ein nichtprogrammierbarer Taschenrechner zugelassen. Weiters darf ein einseitig beschriebenes
oder bedrucktes A4 Blatt mit einer selbst erstellten Formelsammlung verwendet werden.
Bücher, alte Klausuren und Übungsaufgaben inkl. Lösungen sind nicht zugelassen.
ˆ Bei Unterschleif erfolgt eine Meldung an das Prüfungsamt. Sie sind verpflichtet, durch Ihr
Verhalten jegliche Missverständnisse diesbezüglich auszuschließen.
ˆ Die Bearbeitungszeit beträgt 120 Minuten. In den ersten 30 Minuten und in den letzten
15 Minuten ist keine vorzeitige Abgabe möglich.
ˆ Halten Sie für die Ausweiskontrolle bitte Ihren Studentenausweis und einen Lichtbildausweis bereit.
Ich habe die Anweisungen zur Kenntnis genommen und die Angabe auf Vollständigkeit überprüft.
Matrikelnummer:
Name:
Vorname:
Unterschrift:
Punkte:
Note:
Name:
Matrikelnr.:
Klausur Stochastik und Statistik
Aufgabe 1
Betrachten Sie folgende Zufallsvariablen X und Y , deren gemeinsame Verteilung, soweit
bekannt, in der angegebenen Kontingenztabelle abzulesen ist.
fX,Y (x, y) y = 1 y = 2 fX (x)
x = −1
θ
0.35
x=0
x=1
0.2
0.15
fY (y)
0.5
(a) Vervollständigen Sie die Tabelle (inkl. der Randverteilungen).
(3 Pkt.)
(b) Berechnen Sie die Erwartungswerte von X, Y und X · Y .
(3 Pkt.)
(c) Bestimmen Sie θ so, dass X und Y unkorreliert sind.
(3 Pkt.)
(d) Sind X und Y unabhängig? Warum, bzw. warum nicht?
(2 Pkt.)
Lösung:
(a) .
-1
0
1
fY (y)
1
0.35 − θ
θ − 0.05
0.2
0.5
2
θ
0.35 − θ
0.15
0.5
fX (x)
0.35
0.3
0.35
1
(b)
E(Y ) = 1 · 0.5 + 2 · 0.5 = 1.5
E(X) = −0.35 + 0.35 = 0
E(XY ) = −0.35 + θ − 2θ + 0.2 + 2 · 0.15 = 0.15 − θ
(c)
ρ(X, Y ) = p
Cov(X, Y )
p
,
V ar(X) · V ar(Y )
d.h. X und Y sind unkorreliert, falls Cov(X, Y ) = 0
!
Cov(X, Y ) = E(XY ) − E(X) · E(Y ) = 0.15 − θ = 0
⇔
θ = 0.15
(d) Nein, denn
fX,Y (x = 1, y = 2) = 0.15 6= 0.175 = 0.35 · 0.5 = fX (x = 1) · fY (y = 2)
18. September 2012
Aufgabe 2
LMU München
Name:
Matrikelnr.:
Klausur Stochastik und Statistik
Aufgabe 2
Von einer stetigen Zufallsvariable X, die von einem Parameter θ ∈ [− 21 , 12 ] abhängt, sei
die Verteilungsfunktion gegeben:

für x < −2
 0,
1
1
2
(x + 2) + 8 θ(x − 4), für − 2 ≤ x < 2
F (x) =
 4
1,
für x ≥ 2.
(a) Berechnen Sie die Dichte f (x) von X.
(3 Pkt.)
(b) Welche spezielle Verteilung liegt für θ = 0 vor?
(1 Pkt.)
(c) Berechnen Sie den Erwartungswert von X in Abhängigkeit von θ.
(2 Pkt.)
Lösung:
(a)
f (x) =
0,
1
4
+
1
θx,
4
für x ∈
/ [−2, 2]
für − 2 ≤ x < 2
(b) Stetige Gleichverteilung: X ∼ U[−2, 2]
(c)
Z2
E(X) =
−2
18. September 2012
2 2
3 2
x
x
1 1
8
8
4
1 1 2
= − + θ+ θ= θ
+
θ
x · + θx dx =
4 4
8 −2
12 −2 2 2 12
12
3
Aufgabe 2
LMU München
Name:
Matrikelnr.:
Klausur Stochastik und Statistik
Aufgabe 3
Ein Marktforschungsinstitut, das in Foto-Fachgeschäften eine Erhebung machen will,
stützt sich bei der zufälligen Auswahl von n = 200 Geschäften auf eine erworbene Adressenliste. Von den mehr als 5000 Adressen auf der Liste sind allerdings 15% nicht mehr
gültig.
(a) Wie ist die Anzahl der ungültigen Adressen in der Stichprobe exakt verteilt und wie
lässt sie sich anhand des Zentralen Grenzwertsatzes approximieren? Gehen Sie dabei
davon aus, dass die Adressen mit Zurücklegen gezogen werden.
(4 Pkt.)
(b) Berechnen Sie approximativ die Wahrscheinlichkeit, dass in der Stichprobe zwischen
20 und 30 Adressen ungültig sind.
(4 Pkt.)
Lösung:
(a) Sei X die Anzahl der ungültigen Adressen in der Stichprobe. Dann ist
X ∼ B(n = 200, p = 0.15).
Es gilt:
E(X) = np = 30,
V ar(X) = np(1 − p) = 25.5.
Die Zufallsvariable X kann durch folgende Normalverteilung approximiert werden:
a
X ∼ N (30, 25.5)
(b) Eine Anzahl von ungültigen Adressen in der Stichprobe zwischen 20 und 30 ergibt
sich, wenn die Zufallsvariable X Werte zwischen 19.5 und 30.5 annimmt:
P (19.5 < X < 30.5) = P (X < 30.5) − P (X < 19.5)
19.5 − 30
30.5 − 30
√
√
−P
= P
25.5
25.5
= P (X < 0.0990) − P (X < −2.0793)
= Φ (X < 0.0990) − Φ (X < −2.0793)
= Φ (X < 0.0990) + 1 − Φ (X < 2.0793)
= 0.5394 − 1 + 0.9812 = 0.5206
18. September 2012
Aufgabe 3
LMU München
Name:
Matrikelnr.:
Klausur Stochastik und Statistik
Aufgabe 4
Das Guthaben einer Vereinigung soll als Markov-Kette mit Zustandsraum
S = {0, 1000, 2000, 3000, 4000, 5000}
modelliert werden. Die Vereinigung bekommt zum Zeitpunkt t = 0 eine Spende von 1000
Euro. Um Steuern zu sparen, wird das Geld außer Landes angelegt. Nach jedem Jahr
bringt ein Bote weitere 2000 Euro auf das Konto, wird aber mit einer Wahrscheinlichkeit
von 0.2 an der Grenze verhaftet, wo er das Geld sowie weitere 1000 Euro Strafe zahlen
muss. Die Strafe wird vom Konto bezahlt, sofern dies gedeckt ist. Wenn der Kontostand
3500 Euro übersteigt (d.h. 4000 oder 5000 Euro beträgt), wird das gesamte Geld am
nächsten Tag zu Werbezwecken zurücktransferiert, der Geldbetrag bleibt gleich und die
Markov-Kette endet.
(a) Geben Sie die zugehörige Übergangmatrix P an.
(4 Pkt.)
(b) Ist die Markov-Kette irreduzibel? Besitzt die Markov-Kette eine stationäre Verteilung? (Bitte jeweils begründen.)
(4 Pkt.)
Lösung:
(a)
0
1000
2000
P =
3000
4000
5000








0
0.2
0.2
0
0
0
0
1000
0
0
0.2
0
0
0
2000
0.8
0
0
0.2
0
0
3000
0
0.8
0
0
0
0
4000
0
0
0.8
0
1
0
5000
0
0
0
0.8
0
1








(b) Eine Markov-Kette ist irreduzibel, falls jeder Zustand von jedem anderen erreichbar
ist. Dies ist bei der gegebenen Markov-Kette nicht gegeben, denn die Zustände 5000
und 4000 sind final. Kommt die Markov-Kette einmal in einen dieser Zustände, verharrt sie dort.
Eine stationäre Verteilung beschreibt die Wahrscheinlichkeit, mit welcher die MarkovKette nach langer Zeit in einem bestimmten Zustand ist. Diese Verteilung existiert
nur wenn die Markov-Kette irreduzibel ist. Die stationäre Verteilung ist dann unabhängig vom Verlauf der Markov-Kette. Im gegebenen Beispiel ist die Markov-Kette
jedoch nicht irreduzibel, weshalb keine stationäre Verteilung existiert (vgl. Skript
Satz 7.3.1). Kommt die Markov-Kette in einen der finalen Zustände, verharrt sie
dort und macht eine Aussage über das Verhalten der Markov-Kette nach langer Zeit
abhängig vom Verlauf.
18. September 2012
Aufgabe 4
LMU München
Name:
Matrikelnr.:
Klausur Stochastik und Statistik
Aufgabe 5
(a) Ein Automobilzulieferer stellt an fünf Arbeitstagen Blinker her, wobei der Produktionsanteil am Freitag nur halb so hoch ist wie an den restlichen Tagen. Am Montag
sind 12% der Blinker defekt, an den restlichen Tagen sind es lediglich 8%. Wie groß
ist die Wahrscheinlichkeit, dass dieser defekte Blinker montags produziert wurde?
(3 Pkt.)
(b) Gegeben sei eine diskrete Zufallsvariable

0.45,



0.3,
f (x) =
0.25,



0,
X mit der Wahrscheinlichkeitsdichte
Geben Sie das 0.9-Quantil von X an.
für x = −1
für x = 0
für x = 1
sonst.
(2 Pkt.)
(c) Beschreiben Sie, was der Wert 1 − α eines (1 − α)-Konfidenzintervalls bedeutet.
(1 Pkt.)
(d) Wie lautet die Dichte einer exponentialverteilten Zufallsvariable Y mit Varianz
1
V ar(Y ) = 16
?
(2 Pkt.)
(e) Geben Sie für die folgenden Beispiele an, welche aus der Vorlesung bekannte Verteilung für die Zufallsvariablen X1 bis X4 angenommen werden kann. Geben Sie für die
Teilaufgaben (iii) und (iv) auch die zugehörigen Parameterwerte an.
(i) In einem Areal lebt eine unbekannte Anzahl N von Tieren. Um die Populationsgröße zu schätzen, verfahren Ökologen nach dem folgenden Schema: Zunächst
fangen sie eine Zahl m von Tieren und markieren sie. Diese werden wieder frei
gelassen. Man wartet ab, bis sie sich mit den übrigen gut durchmischt haben
und fängt dann (zufällig) n Tiere ein. Angenommen alle Tiere werden mit gleicher Wahrscheinlichkeit gefangen. Sei X1 die Anzahl der markierten Tiere in der
Stichprobe.
(1 Pkt.)
(ii) Ein Klumpen einer radioaktiven Substanz besteht aus vielen Atomen, welche bei
ihrem sehr seltenen Zerfall α-Teilchen ausstrahlen. X2 sei die Anzahl emittierter
α-Teilchen pro Zeitintervall.
(1 Pkt.)
(iii) Ein betrunkener Nachtwächter hat einen Schlüsselbund mit 10 Schlüsseln und
will eine Tür aufschließen, in deren Schloss genau einer dieser Schlüssel passt. Er
probiert dazu einen zufällig ausgewählten Schlüssel aus. Passt er nicht, so fällt
ihm der Schlüsselbund aus der Hand, die Schlüssel durchmischen sich und er
wiederholt sein Vorgehen. X3 sei die Anzahl der Versuche bis er den passenden
Schlüssel findet.
(2 Pkt.)
(iv) Angenommen ein Münchner kennt jeden 1000. Einwohner persönlich. X4 sei
die Anzahl der Bekannten, die er auf einem Spaziergang trifft, wenn ihm 50
Münchner begegnet sind.
(2 Pkt.)
Lösung:
18. September 2012
Aufgabe 5
LMU München
Name:
Matrikelnr.:
Klausur Stochastik und Statistik
(a) Definiere die Ereignisse
M : Blinker wurde am Montag produziert.
D: Blinker ist defekt.
Aus den Angaben entnimmt man die folgenden Wahrscheinlichkeiten:
P (M ) = 29 , P (M̄ ) = 97 ,
P (D|M ) = 0.12, P (D̄|M ) = 0.88
P (D|M̄ ) = 0.08, P (D̄|M̄ ) = 0.92.
Aus dem Satz von Bayes ergibt sich dann die gesuchte Wahrscheinlichkeit, dass
dieser defekte Blinker am Montag produziert wurde, gemäß
P (M |D) =
0.12 · 29
P (D|M ) · P (M )
=
P (D|M ) · P (M ) + P (D|M̄ ) · P (M̄ )
0.12 · 29 + 0.08 ·
7
9
= 0.3
(b)

0,



0.45,
F (x) =
0.75,



1,
für
für
für
für
x < −1
−1≤x<0
0≤x<1
x ≥ 1.
x̃0.9 = F −1 (0.9) = 1
(c) Ein (1−α)-Konfidenzintervall überdeckt bei hypothetischer vielfacher Wiederholung
des Zufallsexperiments mit einer Sicherheit von 1 − α den unbekannten Parameter.
(d) V ar(Y ) =
1
λ2
=
1
16
⇒ λ = 4.
f (y) = 4 · exp(−4y) für y > 0 und f (y) = 0 für y ≤ 0.
(e) (i) X1 ist hypergeometrisch verteilt mit der Gesamtanzahl N , der Anzahl markierter
Tiere m und dem Stichprobenumfang n: X1 ∼ H(n, N, m)
(ii) X2 ist Poisson-verteilt mit unbekanntem Parameter λ: X2 ∼ P(λ)
(iii) X3 ist geometrisch verteilt mit p = 0.1: X3 ∼ G(0.1)
(iv) Wir betrachten einen beliebigen Münchner aus der Gruppe der 50 getroffenen
1
Münchner. Diese Person kennt man (mit Wahrscheinlichkeit p = 1000
= 0.001)
oder man kennt sie nicht ⇒ Bernoulli-Experiment. Dieses Bernoulli-Experiment
wird 50 mal wiederholt (Annahme: Unabhängigkeit). X4 ist also binomialverteilt
mit n = 50 und p = 0.001: X4 ∼ B(50, 0.001)
18. September 2012
Aufgabe 5
LMU München
Name:
Matrikelnr.:
Klausur Stochastik und Statistik
x
0.00
0.01
0.02
0.03
0.04
0.05
0.06
0.07
0.08
0.09
0.10
0.11
0.12
0.13
0.14
0.15
0.16
0.17
0.18
0.19
Φ(x)
0.5000
0.5040
0.5080
0.5120
0.5160
0.5199
0.5239
0.5279
0.5319
0.5359
0.5398
0.5438
0.5478
0.5517
0.5557
0.5596
0.5636
0.5675
0.5714
0.5753
x
1.70
1.71
1.72
1.73
1.74
1.75
1.76
1.77
1.78
1.79
1.80
1.81
1.82
1.83
1.84
1.85
1.86
1.87
1.88
1.89
Φ(x)
0.9554
0.9564
0.9573
0.9582
0.9591
0.9599
0.9608
0.9616
0.9625
0.9633
0.9641
0.9649
0.9656
0.9664
0.9671
0.9678
0.9686
0.9693
0.9699
0.9706
x
1.90
1.91
1.92
1.93
1.94
1.95
1.96
1.97
1.98
1.99
2.00
2.01
2.02
2.03
2.04
2.05
2.06
2.07
2.08
2.09
Φ(x)
0.9713
0.9719
0.9726
0.9732
0.9738
0.9744
0.9750
0.9756
0.9761
0.9767
0.9772
0.9778
0.9783
0.9788
0.9793
0.9798
0.9803
0.9808
0.9812
0.9817
Tabelle 1: Verteilungsfunktion der Standardnormalverteilung (Ausschnitt).
18. September 2012
Anhang
LMU München
Herunterladen