Wahrscheinlichkeitstheorie und Statistik vom 2.3.2007

WS 2006/07
INSTITUT FÜR STOCHASTIK
UNIVERSITÄT KARLSRUHE
Priv.-Doz. Dr. D. Kadelka
Klausur
Wahrscheinlichkeitstheorie und Statistik
vom 2.3.2007
Musterlösungen
Aufgabe A1:
Gegeben sei eine Urliste mit den Paaren (x1 , y1), . . . , (x10 , y10 )
j
xj
yj
a)
1
1
7.4
2
1.7
7.1
3
3.1
6.2
4
4.1
3.9
5
4.9
4.5
6
6.1
4.6
7
7.3
−0.5
9
9.1
0.4
10
9.7
−1.2
Berechnen Sie die Stichprobenmittel x̄, ȳ, die Stichproben-Standardabweichungen sx ,
sy und den empirischen Korrelationskoeffizienten rxy .
Lösung: Direkt aus den Daten ergibt sich gemäß Definition 1.8 und Paragraph 1.5
unter Ausnützung der Beziehung
n
X
(xj − x̄) · (yj − ȳ) =
j=1
n
X
xj · yj − n · x̄ · ȳ
j=1
x̄ = 5.51
ȳ = 3.48
rxy = − 0.929
b)
8
8.1
2.4
sx = 3.05
sy = 3.104
Bestimmen Sie die zugehörige Regressionsgerade y = a∗ + b∗ · x von y auf x.
sy
und a∗ = ȳ − b∗ · x̄, also
Lösung: Nach Paragraph 1.5 ist b∗ = rxy ·
sx
b∗ = −0.946
a∗ = 8.69
und die Regressionsgerade y = 8.69 − 0.946 · x.
6
4
0
2
y
2
4
6
8
10
x
Punkte und Regressionsgerade y = a∗ + b∗ · x
Für die Lösung der nächsten drei Aufgabenteile benötigen wir die aufsteigend sortierten
y-Werte. Es ist
y() = (−1.2, −0.5, 0.4, 2.4, 3.9, 4.5, 4.6, 6.2, 7.1, 7.4)
c)
Berechnen Sie das 0.2-getrimmte Stichprobenmittel ȳ0.2 von (y1 , . . . , y10 ).
Lösung: Mit k = [10 · 0.2] = 2 ergibt sich
ȳ0.2 =
d)
1
· (y(3) + . . . + y(8) ) = 3.667
10 − 2 · 2
Bestimmen Sie das Stichproben-0.2-Quantil ỹ0.2 von (y1 , . . . , y10 ).
Lösung: Da 10 · 0.2 = 2 ganzzahlig ist, ist mit k = [2] = 2
ỹ0.2 =
y(2) + y(3)
y(k) + y(k+1)
=
= −0.05
2
2
Aufgabe A2:
Die Zufallsvariable X besitze die Verteilung N (8, 9) und die Zufallsvariable Y die Verteilung
N (−3, 16). X und Y seien stochastisch unabhängig.
a)
Welche Verteilung besitzt Z := X + Y und welche Verteilung besitzt U := X − Y ?
b)
Bestimmen Sie die Varianz V (U) von U.
c)
Berechnen Sie die Kovarianz C(U, Y ) von U und Y . Sind U und Y positiv korreliert,
negativ korreliert oder unkorreliert?
d)
Bestimmen Sie P(X ≥ 14).
e)
Berechnen Sie das 0.975-Quantil von Y .
Lösung:
a) Es ist −Y ∼ N (3, 16), also nach der Faltungsformel 11.16
Z ∼ N (8 − 3, 9 + 16) = N (5, 25),
U = X + (−Y ) ∼ N (8 + 3, 9 + 16) = N (11, 25).
b) Der zweite Parameter von N (µ, σ 2) ist die Varianz dieser Verteilung, also wegen b)
V (Z) = 25.
c) Wegen Satz 12.23 und der Unabhängigkeit von X und Y gilt
C(U, Y ) = C(X − Y, Y ) = C(X, Y ) − C(Y, Y ) = 0 − V (Y ) = −16.
Hieraus erhält man ohne Rechnung, dass ρ(U, Y ) < 0 ist. Daher sind U und Y negativ korreliert.
d) Wegen der Stetigkeit von N (8, 9) gilt nach (9.6) und Tabelle A.1
14 − 8
P(X ≥ 14) = P(X > 14) = 1 − P(X ≤ 14) = 1 − Φ
3
= 1 − Φ(2) = 1 − 0.9772 = 0.0228.
e) Nach Definition 12.19 gilt, dass t0.975 die Lösung ist von
t0.975 − (−3)
Φ−3,16 (t0.975 ) = Φ
= 0.975.
4
Wegen Φ(1.96) = 0.975) gilt also
und daraus t0.975
t0.975 + 3
= 1.96
4
= 4 · 1.96 − 3 = 4.84. (Man kann hierfür auch 12.20 c) benützen.)
Aufgabe A3:
Ein Arbeiter überwacht 3 Aggregate, die unabhängig voneinander arbeiten. Sei Ai das Ereignis, dass Aggregat i einer Überprüfung bedarf und pi = P(Ai ) die zugehörige Wahrscheinlichkeit, i = 1, 2, 3, mit p1 = 0.2, p2 = 0.4 und p3 = 0.6. Die Ereignisse A1 , A2 und A3 seien
stochastisch unabhängig.
B sei das Ereignis Mindestens ein Aggregat bedarf einer Überprüfung“.
”
a)
Berechnen Sie P(A1 ∩ A2 ∩ A3 ) und P(A1 ∪ A2 ).
b)
Stellen Sie B formelmäßig mit Hilfe von A1 , A2 , A3 dar.
c)
Berechnen Sie P(B).
d)
Berechnen Sie die (bedingte) Wahrscheinlichkeit P(A1 | B), dass Aggregat 1 einer
Überprüfung bedarf, wenn mindestens ein Aggregat einer Überprüfung bedarf.
Lösung: a) Da A1 , A2 und A3 unabhängig sind, gilt
P(A1 ∩ A2 ∩ A3 ) = P(A1 ) · P(A2 ) · P(A3 ) = 0.048.
Ferner gilt
P(A1 ∪ A2 ) = P(A1 ) + P(A2 ) − P(A1 ∩ A2 )
A1 ,A2 unabhängig
=
p1 + p2 − P(A1 ) · P(A2 ) = p1 + p2 − p1 p2 = 0.52
b) Dass mindestens ein Aggregat der Überprüfung bedarf, ist gleichbedeutend damit, dass
Aggregat 1 oder 2 oder 3 einer Überprüfung bedarf. Daher gilt
B = A1 ∪ A2 ∪ A3 .
c) Wegen der Formel des Ein- und Ausschließens gilt
P(B) = P(A1 ) + P(A2 ) + P(A3 ) − P(A1 ∩ A2 ) − P(A1 ∩ A3 ) − P(A2 ∩ A3 ) + P(A1 ∩ A2 ∩ A3 )
= p1 + p2 + p3 − p1 p2 − p1 p3 − p2 p3 + p1 p2 p3 = 0.808
d) Nach Definition der bedingten Wahrscheinlichkeit gilt wegen A1 ⊂ B (wenn 1 einer
Überprüfung bedarf, bedarf insbesondere mindestens ein Aggregat der Überprüfung)
P(A1 | B) =
P(A1 ∩ B)
P(A1 )
0.2
=
=
= 0.2475
P(B)
P(B)
0.808
Aufgabe A4:
Eine Messeinrichtung habe eine zufällige Lebensdauer mit Verteilung Exp(λ), λ > 0. Immer
wenn eine Messeinrichtung ausfällt, wird sie durch eine gleichartige neue ersetzt. Das Ersetzen
dauert genau 3 Zeiteinheiten. Die Lebensdauern X1 , X2 , . . . der einzelnen Messeinrichtungen
seien unabhängig voneinander und identisch verteilt.
Zn =
n
X
Xi + 3n
i=1
ist damit der Zeitpunkt, zu dem das (n+ 1)-te Messgerät mit den Messungen beginnt. Damit
hat Zn − 3 · n die Verteilung Γ(n, λ).
a)
Bestimmen Sie P(Z1 > t) für t > 3.
b)
Bestimmen Sie die Verteilungsfunktion FZ2 (t) und eine Dichte fZ2 (t) von Z2 für t > 6.
Hinweis: Die Γ(2, λ)-Verteilung hat die Verteilungsfunktion
t → 1 − e−λt · (1 + λt), t ≥ 0.
c)
Die Ersetzung einer Messeinrichtung kostet c Euro, ferner fallen pro Zeiteinheit a > 0
Euro laufende Kosten an (auch während der Zeit, wenn eine Messeinrichtung ersetzt
wird).
c1 ) Die (zufälligen) Kosten Kn bis zum Zeitpunkt Zn sind von der Form
Kn = bn + dn ·
n
X
Xi
i=1
mit geeigneten Konstanten bn , dn . Bestimmen Sie bn und dn .
c2 ) Berechnen Sie EKn und V (Kn ).
P
Lösung: Zn − 3n = ni=1 Xi ist die n-fache Faltung der Exp(λ) = Γ(1, λ)-verteilten Zufallsvariablen X1 , . . . , Xn . Wegen 11.16 gilt daher
Zn − 3n ∼ Γ(n, λ).
a) P(Z1 > t) = P(X1 + 3 > t) = P(X1 > t − 3) = 1 − (1 − e−λ(t−3) ) = e−λ(t−3) für t > 3, also
t − 3 > 0.
b) Wegen a) hat Y := Z2 − 6 die Verteilung Γ(2, λ). Insbesondere gilt Y > 0 und damit
FZ2 (t) = P(Z2 ≤ t) = P(Y + 6 ≤ t) = P(Y ≤ t − 6) = 0
für t ≤ 6. Für t > 6 gilt dagegen
FZ2 (t) = P(Y ≤ t − 6) = 1 − e−λ(t−6) · (1 + λ(t − 6)).
Diese Verteilungsfunktion ist stetig und bis auf eventuell die Stelle t = 6 stetig differenzierbar
(ob FZ2 auch an der einzelnen Stelle t = 6 differenzierbar ist, muss nicht überprüft werden).
Wegen Satz 8.12 ist daher
(
0
, t≤6
fZ2 (t) =
′
−λ(t−6)
−λ(t−6)
2
−λ(t−6)
FZ2 (t) = λe
· (1 + λ(t − 6)) − λe
= λ (t − 6)e
, t>6
eine Dichte von Z2 .
c) Bis zum Zeitpunkt Zn liegen n Ersetzungen vor, daher sind die Kosten
Kn = n · c + a · Zn = n · (c + 3 · a) + a ·
n
X
Xi ,
i=1
P
wobei ni=1 Xi ∼ Γ(n, λ). Damit gilt c1 ) bn = n · (c + 3 · a) und dn = a.
c2 ) Mit den Tabellen auf S. 124 und S. 128 ergibt sich
!
n
n
X
X
n
EKn = E n · (c + 3 · a) + a ·
Xi = n · (c + 3 · a) + a · E
Xi = n · (c + 3 · a) + a
λ
i=1
i=1
und wegen Satz 12.11 c)
V (Kn ) = V
n · (c + 3 · a) + a ·
n
X
i=1
Xi
!
=V
a·
n
X
i=1
Xi
!
= a2 · V
n
X
i=1
Xi
!
=
a2 · n
.
λ2
Aufgabe A5:
Bei n = 200 Kontrollen wurde die zufällige Fehlerzahl xi bei jeweils 30 Vorgängen ermittelt,
i = 1, . . . , n. Man nimmt an, dass die zufälligen Zahlen Xi der Fehler stochastisch unabhängig
sind mit der Zähldichte
30−k
k ϑ
30
ϑ
·
fϑ (k) =
· 1−
, k = 0, . . . , 30,
k
30
30
ϑ ein unbekannter Parameter mit 0 < ϑ < 30.
a)
Welche Verteilung besitzen die zufälligen Zahlen der Fehler Xi , d.h. welche Verteilung
hat gerade die Zähldichte fϑ ? (Geben Sie auch die Parameter an! )
b)
Bestimmen Sie die Loglikelihood-Funktion Mx (ϑ) zur Stichprobe x = (x1 , . . . , xn ).
c)
Berechnen Sie einen Maximum-Likelihood-Schätzer ϑ̂(x) für ϑ.
d)
Insgesamt stellte man
40 mal 0 Fehler,
67 mal 1 Fehler,
60 mal 2 Fehler,
22 mal 3 Fehler,
9 mal 4 Fehler und
2 mal 5 Fehler fest.
Berechnen Sie das Stichprobenmittel x̄ und die Stichprobenvarianz s2x .
k
ϑ
Lösung: a) Es ist fϑ (k) = 30
· p · (1 − p)30−k mit p := 30
und dies ist gerade die Zähldichte
k
ϑ
von Bin(30, p). Daher besitzt X1 die Verteilung Bin(30, 30
).
b) Wir berechnen die Loglikelihood-Funktion Mx (ϑ). Es gilt ln(fϑ (k)) = ln
(30 − k) · ln(1 − ϑ/30) und damit
Mx (ϑ) =
n
X
i=1
30
k
+k·ln(ϑ/30)+
n X
30
+ xi · ln(ϑ/30) + (n − xi ) · ln(1 − ϑ/30)
ln
ln(fϑ (xi )) =
xi
i=1
n
n
n
X
X
X
30
+ ln(ϑ/30) ·
xi + ln(1 − ϑ/30) ·
(30 − xi )
=
ln
xi
i=1
i=1
i=1
c) Mx besitzt die Ableitung
Mx′ (ϑ) =
=
n
n
X
1
n · x̄ n · (30 − x̄)
1 X
·
xi −
·
(30 − xi ) =
−
ϑ i=1
30 − ϑ i=1
ϑ
30 − ϑ
n · x̄ · (30 − ϑ) − n · (30 − x̄) · ϑ
n · x̄ · 30 − n · 30 · ϑ
30 · n
=
=
· (x̄ − ϑ)
ϑ · (30 − ϑ)
ϑ · (30 − ϑ)
ϑ · (30 − ϑ)
wobei wir
Pn
i=1
xi = n · x̄ benützt haben. Hierbei ist
30·n
ϑ·(30−ϑ)


 > 
Mx′ (ϑ) = 0 genau dann, wenn


<
> 0 und damit


 < 
ϑ = x̄.


>
Dies bedeutet, dass die Funktion Mx unterhalb von ϑ̂(x) = x̄ steigt und oberhalb von
ϑ̂(x) = x̄ fällt. Damit ist ϑ̂(x) die (einzige) Maximumstelle von Mx und ϑ̂(x) = x̄ der gesuchte Maximum-Likelihood-Schätzer.
d) Zur P
Berechnung von x̄ und s2x kann Satz 1.10 verwendet
berechnet man
P200 2werden.2Alternativ
200
2
direkt i=1 xi = 40·0+67·1+. . .+2·5 = 299 und i=1 xi = 40·0 +67·1 +. . .+2·52 = 699
und damit
n
200
1 X
1 X
299
xi =
·
xi =
= 1.495 und
x̄ = ·
n i=1
200 i=1
200

!2 
n
n
X
X
1
2992
1
1 
2
2

x −
xi
699 −
= 1.2663.
=
sx =
n − 1 i=1 i n i=1
199
200
Aufgabe A6:
Eine Firma besitzt 16 gleichartige Messgeräte, welche unabhängig voneinander und unter
gleichen Bedingungen 2 Jahre lang ohne Wartung eingesetzt wurden. Bei der Überprüfung
dieser Messgeräte stellt sich heraus, dass 10 dieser Messgeräte keine korrekten Messergebnisse
mehr liefern.
a) Es sei p die unbekannte Wahrscheinlichkeit, dass ein Messgerät auch nach 2 Jahren noch
korrekte Messergebnisse liefert. Geben Sie ein Konfidenzintervall für die Wahrscheinlichkeit p zur Konfidenzwahrscheinlichkeit 0.90 an.
Lösung: Nach Voraussetzung kann wie in Beispiel 18.5 ein ideales Zufallsexperiment mit
den zwei möglichen Ergebnissen Keine korrekten Messergebnisse“ (Treffer) und Korrek”
”
te Messergebnisse“ (Niete) und der Trefferwahrscheinlichkeit ϑ := p angesehen werden.
Nach diesem Beispiel und wegen 18.6 ist mit n = 16 und x = 10 das gesuchte Konfidenzintervall [l(x), L(x)], wobei die Konfidenzgrenzen l(x) und L(x) für x = 10 und n − x = 6
und 1 − α = 0.9 aus Tabelle A.4 entnommen werden. Dies ergibt das Konfidenzintervall
C1 (x) = [0.391 , 0.822] .
b) Sie suchen jetzt ein Konfidenzintervall für p zum Konfidenzniveau 0.95. Ist dieses kleiner,
gleich oder größer als das zur Konfidenzwahrscheinlichkeit 0.9?
Lösung: Für das Konfidenzintervall zur Konfidenzwahrscheinlichkeit 0.95 erhält man aus
Tabelle A.4
C2 (x) = [0.354 , 0.848] .
Dieses ist größer als C1 (x). (Dies gilt allgemein: Wird die Konfidenzwahrscheinlichkeit
(die Sicherheit) erhöht, so muss auch das Konfidenzintervall größer werden.)

Zugehörige Unterlagen

Prof Dr. Hans-Peter Scheffler Sommersemester 2010

Blatt 2 - Lehrstuhl für Informatik 12

Wahrscheinlichkeitstheorie und Statistik vom 2.3.2007

Zugehörige Unterlagen

Produkte

Unterstützung

Wahrscheinlichkeitstheorie und Statistik vom 2.3.2007

Zugehörige Unterlagen

Dieses Dokument Sammlung (en)

Dieses Dokument gespeichert

Schlagen Sie uns vor, wie wir StudyLib verbessern können