Wahrscheinlichkeitstheorie und Statistik vom 2.3.2007

Werbung
WS 2006/07
INSTITUT FÜR STOCHASTIK
UNIVERSITÄT KARLSRUHE
Priv.-Doz. Dr. D. Kadelka
Klausur
Wahrscheinlichkeitstheorie und Statistik
vom 2.3.2007
Musterlösungen
Aufgabe A1:
Gegeben sei eine Urliste mit den Paaren (x1 , y1), . . . , (x10 , y10 )
j
xj
yj
a)
1
1
7.4
2
1.7
7.1
3
3.1
6.2
4
4.1
3.9
5
4.9
4.5
6
6.1
4.6
7
7.3
−0.5
9
9.1
0.4
10
9.7
−1.2
Berechnen Sie die Stichprobenmittel x̄, ȳ, die Stichproben-Standardabweichungen sx ,
sy und den empirischen Korrelationskoeffizienten rxy .
Lösung: Direkt aus den Daten ergibt sich gemäß Definition 1.8 und Paragraph 1.5
unter Ausnützung der Beziehung
n
X
(xj − x̄) · (yj − ȳ) =
j=1
n
X
xj · yj − n · x̄ · ȳ
j=1
x̄ = 5.51
ȳ = 3.48
rxy = − 0.929
b)
8
8.1
2.4
sx = 3.05
sy = 3.104
Bestimmen Sie die zugehörige Regressionsgerade y = a∗ + b∗ · x von y auf x.
sy
und a∗ = ȳ − b∗ · x̄, also
Lösung: Nach Paragraph 1.5 ist b∗ = rxy ·
sx
b∗ = −0.946
a∗ = 8.69
und die Regressionsgerade y = 8.69 − 0.946 · x.
6
4
0
2
y
2
4
6
8
10
x
Punkte und Regressionsgerade y = a∗ + b∗ · x
Für die Lösung der nächsten drei Aufgabenteile benötigen wir die aufsteigend sortierten
y-Werte. Es ist
y() = (−1.2, −0.5, 0.4, 2.4, 3.9, 4.5, 4.6, 6.2, 7.1, 7.4)
c)
Berechnen Sie das 0.2-getrimmte Stichprobenmittel ȳ0.2 von (y1 , . . . , y10 ).
Lösung: Mit k = [10 · 0.2] = 2 ergibt sich
ȳ0.2 =
d)
1
· (y(3) + . . . + y(8) ) = 3.667
10 − 2 · 2
Bestimmen Sie das Stichproben-0.2-Quantil ỹ0.2 von (y1 , . . . , y10 ).
Lösung: Da 10 · 0.2 = 2 ganzzahlig ist, ist mit k = [2] = 2
ỹ0.2 =
y(2) + y(3)
y(k) + y(k+1)
=
= −0.05
2
2
Aufgabe A2:
Die Zufallsvariable X besitze die Verteilung N (8, 9) und die Zufallsvariable Y die Verteilung
N (−3, 16). X und Y seien stochastisch unabhängig.
a)
Welche Verteilung besitzt Z := X + Y und welche Verteilung besitzt U := X − Y ?
b)
Bestimmen Sie die Varianz V (U) von U.
c)
Berechnen Sie die Kovarianz C(U, Y ) von U und Y . Sind U und Y positiv korreliert,
negativ korreliert oder unkorreliert?
d)
Bestimmen Sie P(X ≥ 14).
e)
Berechnen Sie das 0.975-Quantil von Y .
Lösung:
a) Es ist −Y ∼ N (3, 16), also nach der Faltungsformel 11.16
Z ∼ N (8 − 3, 9 + 16) = N (5, 25),
U = X + (−Y ) ∼ N (8 + 3, 9 + 16) = N (11, 25).
b) Der zweite Parameter von N (µ, σ 2) ist die Varianz dieser Verteilung, also wegen b)
V (Z) = 25.
c) Wegen Satz 12.23 und der Unabhängigkeit von X und Y gilt
C(U, Y ) = C(X − Y, Y ) = C(X, Y ) − C(Y, Y ) = 0 − V (Y ) = −16.
Hieraus erhält man ohne Rechnung, dass ρ(U, Y ) < 0 ist. Daher sind U und Y negativ korreliert.
d) Wegen der Stetigkeit von N (8, 9) gilt nach (9.6) und Tabelle A.1
14 − 8
P(X ≥ 14) = P(X > 14) = 1 − P(X ≤ 14) = 1 − Φ
3
= 1 − Φ(2) = 1 − 0.9772 = 0.0228.
e) Nach Definition 12.19 gilt, dass t0.975 die Lösung ist von
t0.975 − (−3)
Φ−3,16 (t0.975 ) = Φ
= 0.975.
4
Wegen Φ(1.96) = 0.975) gilt also
und daraus t0.975
t0.975 + 3
= 1.96
4
= 4 · 1.96 − 3 = 4.84. (Man kann hierfür auch 12.20 c) benützen.)
Aufgabe A3:
Ein Arbeiter überwacht 3 Aggregate, die unabhängig voneinander arbeiten. Sei Ai das Ereignis, dass Aggregat i einer Überprüfung bedarf und pi = P(Ai ) die zugehörige Wahrscheinlichkeit, i = 1, 2, 3, mit p1 = 0.2, p2 = 0.4 und p3 = 0.6. Die Ereignisse A1 , A2 und A3 seien
stochastisch unabhängig.
B sei das Ereignis Mindestens ein Aggregat bedarf einer Überprüfung“.
”
a)
Berechnen Sie P(A1 ∩ A2 ∩ A3 ) und P(A1 ∪ A2 ).
b)
Stellen Sie B formelmäßig mit Hilfe von A1 , A2 , A3 dar.
c)
Berechnen Sie P(B).
d)
Berechnen Sie die (bedingte) Wahrscheinlichkeit P(A1 | B), dass Aggregat 1 einer
Überprüfung bedarf, wenn mindestens ein Aggregat einer Überprüfung bedarf.
Lösung: a) Da A1 , A2 und A3 unabhängig sind, gilt
P(A1 ∩ A2 ∩ A3 ) = P(A1 ) · P(A2 ) · P(A3 ) = 0.048.
Ferner gilt
P(A1 ∪ A2 ) = P(A1 ) + P(A2 ) − P(A1 ∩ A2 )
A1 ,A2 unabhängig
=
p1 + p2 − P(A1 ) · P(A2 ) = p1 + p2 − p1 p2 = 0.52
b) Dass mindestens ein Aggregat der Überprüfung bedarf, ist gleichbedeutend damit, dass
Aggregat 1 oder 2 oder 3 einer Überprüfung bedarf. Daher gilt
B = A1 ∪ A2 ∪ A3 .
c) Wegen der Formel des Ein- und Ausschließens gilt
P(B) = P(A1 ) + P(A2 ) + P(A3 ) − P(A1 ∩ A2 ) − P(A1 ∩ A3 ) − P(A2 ∩ A3 ) + P(A1 ∩ A2 ∩ A3 )
= p1 + p2 + p3 − p1 p2 − p1 p3 − p2 p3 + p1 p2 p3 = 0.808
d) Nach Definition der bedingten Wahrscheinlichkeit gilt wegen A1 ⊂ B (wenn 1 einer
Überprüfung bedarf, bedarf insbesondere mindestens ein Aggregat der Überprüfung)
P(A1 | B) =
P(A1 ∩ B)
P(A1 )
0.2
=
=
= 0.2475
P(B)
P(B)
0.808
Aufgabe A4:
Eine Messeinrichtung habe eine zufällige Lebensdauer mit Verteilung Exp(λ), λ > 0. Immer
wenn eine Messeinrichtung ausfällt, wird sie durch eine gleichartige neue ersetzt. Das Ersetzen
dauert genau 3 Zeiteinheiten. Die Lebensdauern X1 , X2 , . . . der einzelnen Messeinrichtungen
seien unabhängig voneinander und identisch verteilt.
Zn =
n
X
Xi + 3n
i=1
ist damit der Zeitpunkt, zu dem das (n+ 1)-te Messgerät mit den Messungen beginnt. Damit
hat Zn − 3 · n die Verteilung Γ(n, λ).
a)
Bestimmen Sie P(Z1 > t) für t > 3.
b)
Bestimmen Sie die Verteilungsfunktion FZ2 (t) und eine Dichte fZ2 (t) von Z2 für t > 6.
Hinweis: Die Γ(2, λ)-Verteilung hat die Verteilungsfunktion
t → 1 − e−λt · (1 + λt), t ≥ 0.
c)
Die Ersetzung einer Messeinrichtung kostet c Euro, ferner fallen pro Zeiteinheit a > 0
Euro laufende Kosten an (auch während der Zeit, wenn eine Messeinrichtung ersetzt
wird).
c1 ) Die (zufälligen) Kosten Kn bis zum Zeitpunkt Zn sind von der Form
Kn = bn + dn ·
n
X
Xi
i=1
mit geeigneten Konstanten bn , dn . Bestimmen Sie bn und dn .
c2 ) Berechnen Sie EKn und V (Kn ).
P
Lösung: Zn − 3n = ni=1 Xi ist die n-fache Faltung der Exp(λ) = Γ(1, λ)-verteilten Zufallsvariablen X1 , . . . , Xn . Wegen 11.16 gilt daher
Zn − 3n ∼ Γ(n, λ).
a) P(Z1 > t) = P(X1 + 3 > t) = P(X1 > t − 3) = 1 − (1 − e−λ(t−3) ) = e−λ(t−3) für t > 3, also
t − 3 > 0.
b) Wegen a) hat Y := Z2 − 6 die Verteilung Γ(2, λ). Insbesondere gilt Y > 0 und damit
FZ2 (t) = P(Z2 ≤ t) = P(Y + 6 ≤ t) = P(Y ≤ t − 6) = 0
für t ≤ 6. Für t > 6 gilt dagegen
FZ2 (t) = P(Y ≤ t − 6) = 1 − e−λ(t−6) · (1 + λ(t − 6)).
Diese Verteilungsfunktion ist stetig und bis auf eventuell die Stelle t = 6 stetig differenzierbar
(ob FZ2 auch an der einzelnen Stelle t = 6 differenzierbar ist, muss nicht überprüft werden).
Wegen Satz 8.12 ist daher
(
0
, t≤6
fZ2 (t) =
′
−λ(t−6)
−λ(t−6)
2
−λ(t−6)
FZ2 (t) = λe
· (1 + λ(t − 6)) − λe
= λ (t − 6)e
, t>6
eine Dichte von Z2 .
c) Bis zum Zeitpunkt Zn liegen n Ersetzungen vor, daher sind die Kosten
Kn = n · c + a · Zn = n · (c + 3 · a) + a ·
n
X
Xi ,
i=1
P
wobei ni=1 Xi ∼ Γ(n, λ). Damit gilt c1 ) bn = n · (c + 3 · a) und dn = a.
c2 ) Mit den Tabellen auf S. 124 und S. 128 ergibt sich
!
n
n
X
X
n
EKn = E n · (c + 3 · a) + a ·
Xi = n · (c + 3 · a) + a · E
Xi = n · (c + 3 · a) + a
λ
i=1
i=1
und wegen Satz 12.11 c)
V (Kn ) = V
n · (c + 3 · a) + a ·
n
X
i=1
Xi
!
=V
a·
n
X
i=1
Xi
!
= a2 · V
n
X
i=1
Xi
!
=
a2 · n
.
λ2
Aufgabe A5:
Bei n = 200 Kontrollen wurde die zufällige Fehlerzahl xi bei jeweils 30 Vorgängen ermittelt,
i = 1, . . . , n. Man nimmt an, dass die zufälligen Zahlen Xi der Fehler stochastisch unabhängig
sind mit der Zähldichte
30−k
k ϑ
30
ϑ
·
fϑ (k) =
· 1−
, k = 0, . . . , 30,
k
30
30
ϑ ein unbekannter Parameter mit 0 < ϑ < 30.
a)
Welche Verteilung besitzen die zufälligen Zahlen der Fehler Xi , d.h. welche Verteilung
hat gerade die Zähldichte fϑ ? (Geben Sie auch die Parameter an! )
b)
Bestimmen Sie die Loglikelihood-Funktion Mx (ϑ) zur Stichprobe x = (x1 , . . . , xn ).
c)
Berechnen Sie einen Maximum-Likelihood-Schätzer ϑ̂(x) für ϑ.
d)
Insgesamt stellte man
ˆ 40 mal 0 Fehler,
ˆ 67 mal 1 Fehler,
ˆ 60 mal 2 Fehler,
ˆ 22 mal 3 Fehler,
ˆ 9 mal 4 Fehler und
ˆ 2 mal 5 Fehler fest.
Berechnen Sie das Stichprobenmittel x̄ und die Stichprobenvarianz s2x .
k
ϑ
Lösung: a) Es ist fϑ (k) = 30
· p · (1 − p)30−k mit p := 30
und dies ist gerade die Zähldichte
k
ϑ
von Bin(30, p). Daher besitzt X1 die Verteilung Bin(30, 30
).
b) Wir berechnen die Loglikelihood-Funktion Mx (ϑ). Es gilt ln(fϑ (k)) = ln
(30 − k) · ln(1 − ϑ/30) und damit
Mx (ϑ) =
n
X
i=1
30
k
+k·ln(ϑ/30)+
n X
30
+ xi · ln(ϑ/30) + (n − xi ) · ln(1 − ϑ/30)
ln
ln(fϑ (xi )) =
xi
i=1
n
n
n
X
X
X
30
+ ln(ϑ/30) ·
xi + ln(1 − ϑ/30) ·
(30 − xi )
=
ln
xi
i=1
i=1
i=1
c) Mx besitzt die Ableitung
Mx′ (ϑ) =
=
n
n
X
1
n · x̄ n · (30 − x̄)
1 X
·
xi −
·
(30 − xi ) =
−
ϑ i=1
30 − ϑ i=1
ϑ
30 − ϑ
n · x̄ · (30 − ϑ) − n · (30 − x̄) · ϑ
n · x̄ · 30 − n · 30 · ϑ
30 · n
=
=
· (x̄ − ϑ)
ϑ · (30 − ϑ)
ϑ · (30 − ϑ)
ϑ · (30 − ϑ)
wobei wir
Pn
i=1
xi = n · x̄ benützt haben. Hierbei ist
30·n
ϑ·(30−ϑ)


 > 
Mx′ (ϑ) = 0 genau dann, wenn


<
> 0 und damit


 < 
ϑ = x̄.


>
Dies bedeutet, dass die Funktion Mx unterhalb von ϑ̂(x) = x̄ steigt und oberhalb von
ϑ̂(x) = x̄ fällt. Damit ist ϑ̂(x) die (einzige) Maximumstelle von Mx und ϑ̂(x) = x̄ der gesuchte Maximum-Likelihood-Schätzer.
d) Zur P
Berechnung von x̄ und s2x kann Satz 1.10 verwendet
berechnet man
P200 2werden.2Alternativ
200
2
direkt i=1 xi = 40·0+67·1+. . .+2·5 = 299 und i=1 xi = 40·0 +67·1 +. . .+2·52 = 699
und damit
n
200
1 X
1 X
299
xi =
·
xi =
= 1.495 und
x̄ = ·
n i=1
200 i=1
200

!2 
n
n
X
X
1
2992
1
1 
2
2

x −
xi
699 −
= 1.2663.
=
sx =
n − 1 i=1 i n i=1
199
200
Aufgabe A6:
Eine Firma besitzt 16 gleichartige Messgeräte, welche unabhängig voneinander und unter
gleichen Bedingungen 2 Jahre lang ohne Wartung eingesetzt wurden. Bei der Überprüfung
dieser Messgeräte stellt sich heraus, dass 10 dieser Messgeräte keine korrekten Messergebnisse
mehr liefern.
a) Es sei p die unbekannte Wahrscheinlichkeit, dass ein Messgerät auch nach 2 Jahren noch
korrekte Messergebnisse liefert. Geben Sie ein Konfidenzintervall für die Wahrscheinlichkeit p zur Konfidenzwahrscheinlichkeit 0.90 an.
Lösung: Nach Voraussetzung kann wie in Beispiel 18.5 ein ideales Zufallsexperiment mit
den zwei möglichen Ergebnissen Keine korrekten Messergebnisse“ (Treffer) und Korrek”
”
te Messergebnisse“ (Niete) und der Trefferwahrscheinlichkeit ϑ := p angesehen werden.
Nach diesem Beispiel und wegen 18.6 ist mit n = 16 und x = 10 das gesuchte Konfidenzintervall [l(x), L(x)], wobei die Konfidenzgrenzen l(x) und L(x) für x = 10 und n − x = 6
und 1 − α = 0.9 aus Tabelle A.4 entnommen werden. Dies ergibt das Konfidenzintervall
C1 (x) = [0.391 , 0.822] .
b) Sie suchen jetzt ein Konfidenzintervall für p zum Konfidenzniveau 0.95. Ist dieses kleiner,
gleich oder größer als das zur Konfidenzwahrscheinlichkeit 0.9?
Lösung: Für das Konfidenzintervall zur Konfidenzwahrscheinlichkeit 0.95 erhält man aus
Tabelle A.4
C2 (x) = [0.354 , 0.848] .
Dieses ist größer als C1 (x). (Dies gilt allgemein: Wird die Konfidenzwahrscheinlichkeit
(die Sicherheit) erhöht, so muss auch das Konfidenzintervall größer werden.)
Herunterladen