Lösungen Blatt 11

Werbung
Statistik I für Statistiker, Mathematiker und Informatiker
Gerhard Tutz, Jan Ulbricht
Lösungen zu Blatt 11
WS 05/06
Lösung Aufgabe 55
(a) Damit f (x) eine Dichte ist, muß
R3
2
f (x)dx = 1 gelten. Dies ist äquivalent zu
3
Z
c(x − 2)dx
2
x
⇐⇒ c
− 2x |32
2
4
9
−6− +4
⇐⇒ c
2
2
1
⇐⇒ c
2
⇐⇒ c
= 1
2
= 1
= 1
= 1
= 2.
(b) Ansatz für die Berechnung der Verteilungsfunktion:
Z a
Z a
F (a) =
f (x)dx =
2(x − 2)dx = (x2 − 4x)|a2 = a2 − 4a − 4 + 8 = a2 − 4a + 4
−∞
2
Für die Verteilungsfunktion erhält man damit

für x < 2,
 0,
x2 − 4x + 4, für 2 ≤ x ≤ 3,
F (x) =

1,
für x > 3.
(c) Die Wahrscheinlichkeiten lassen sich über die Verteilungsfunktion bestimmen als
P (X > 2.1) = 1 − P (X ≤ 2.1) = 1 − F (2.1)
= 1 − (2.12 − 4 · 2.1 + 4)
= 1 − 0.01 = 0.99.
P (2.1 < X < 2.8) = P (X ≤ 2.8) − P (X ≤ 2.1)
= F (2.8) − F (2.1)
= 0.64 − 0.01 = 0.63.
(d) Die bedingte Wahrscheinlichkeit berechnet sich als
P ({−4 ≤ X ≤ 3} ∩ {X ≤ 2.1})
P (X ≤ 2.1)
P (−4 ≤ X ≤ 2.1)
=
P (X ≤ 2.1)
F (2.1) − F (−4)
=
F (2.1)
= 1.
P (−4 ≤ X ≤ 3|X ≤ 2.1) =
Die stochastische Unabhängigkeit der Ereignisse läßt sich nachweisen, indem man zeigt, dass die
Wahrscheinlichkeit für das gemeinsame Ereignis mit dem Produkt der Einzelwahrscheinlichkeiten
übereinstimmt:
P ({−4 ≤ X ≤ 3} ∩ {X ≤ 2.1}) = P (−4 ≤ X ≤ 2.1)
= F (2.1) = 0.01
P (−4 ≤ X ≤ 3) · P (X ≤ 2.1) = (F (3) − F (−4)) · F (2.1)
= (1 − 0) · F (2.1)
= 0.01 = P ({−4 ≤ X ≤ 3} ∩ {X ≤ 2.1})
(e) Für den Erwartungswert erhält man
∞
Z
Z
3
Z
xf (x)dx =
x2(x − 2)dx =
−∞
2
3
2x
4x2 3
|2
=
−
3
2
2 · 27 4 · 9 2 · 8 4 · 4
=
−
−
+
3
2
3
2
16
=
.
6
3
E(X) =
(2x2 − 4x)dx
2
Der Median berechnet sich als
F (xmed )
2
⇐⇒ xmed − 4xmed + 4
⇐⇒ x2med − 4xmed + 3.5
(1)
=⇒ xmed
(2)
xmed
= 0.5
= 0.5
= 0
= 2+
= 2−
√
√
4 − 3.5 ≈ 2.7071
4 − 3.5 ≈ 0.7071
(2)
(1)
Da xmed = 0.7071 außerhalb des Definitionsbereiches D = [2, 3] liegt, gilt xmed = xmed = 2.7071.
Die Varianz ermittelt man, indem man zunächst E(X 2 ) berechnet als
∞
Z
2
Z
2
x f (x)dx =
E(X ) =
−∞
Z 3
3
x2 2(x − 2)dx
2
(2x3 − 4x2 )dx
4
2x
4x3 3
=
−
|2
4
3
2 · 81 4 · 27 2 · 16 4 · 8
=
−
−
+
4
3
4
3
43
=
,
6
=
2
woraus sich die Varianz ergibt als
43
V ar(X) = E(X ) − E(X) =
−
6
2
2
16
6
2
=
1
.
18
Lösung Aufgabe 56
Theorie: Stetige Gleichverteilung
• Definition: Eine stetige Zufallsvariable heißt gleichverteilt auf dem Intervall [a, b], wenn sie eine
Dichte
1
b−a , für a ≤ x ≤ b,
f (x) =
0,
sonst
besitzt.
• Bemerkung: Eine auf [0, 1] gleichverteilte Zufallsvariable nennt man auch standardgleichverteilt.
• Die Verteilungsfunktion einer gleichverteilten Zufallsvariable lautet

x < a,
 0,
x−a
, a ≤ x ≤ b,
F (x)
 b−a
1,
x > b.
• Bemerkung: Die Dichte ist an den Stellen a und b unstetig =⇒ Verteilungsfunktion ist dort nicht
differenzierbar.
• Der Erwartungswert lautet
E(X) =
die Varianz lautet
V ar(X) =
a+b
,
2
(b − a)2
.
12
Zur eigentlichen Aufgabe:
Sei X der Zeitpunkt, an dem der Fahrgast den Bahnsteig erreicht. Aus Vereinfachungsgründen geben
wir den Zeitpunkt in fortlaufenden Minuten an, also X ∈ [0, 60]. Da laut Aufgabenstellung X eine
gleichverteilte stetige Zufallsvariable ist, gilt
1
60 , x ∈ [0, 60],
f (x) =
0, sonst.
Die S-Bahnen fahren im Zeitraum von 7.00 Uhr bis 8.00 Uhr zu folgenden Zeitpunkten
Richtung A
7.00 Uhr
7.15 Uhr
7.30 Uhr
7.45 Uhr
8.00 Uhr
Richtung B
7.07 Uhr
7.27 Uhr
7.47 Uhr
Der Fahrgast fährt in Richtung A, wenn seine Ankunft in einen der folgenden Intervalle fällt
{X = 0}, {7 < X ≤ 15}, {27 < X ≤ 45}, {47 < X ≤ 60}.
Sei A das Ereignis, dass der Fahrgast eine S-Bahn in Richtung A wählt. Aufgrund der Disjunktheit der
Intervalle gilt
P (A) = P (X = 0) + P (7 < X ≤ 15) + P (27 < X ≤ 45) + P (47 < X ≤ 60)
Z 0
Z 15
Z 45
Z 60
=
1/60dx +
1/60dx +
1/60dx +
1/60dx
0
7
27
47
8
18 13
= 0+
+
+
60 60 60
39
=
= 0.65.
60
Mit einer Wahrscheinlichkeit von P (A) = 0.65 nimmt der Fahrgast eine S-Bahn in Richtung A.
Lösung Aufgabe 57
Theorie: Normalverteilung:
• Definition: Eine Zufallsvariable X heißt normalverteilt mit den Parametern µ ∈ IR und σ 2 > 0,
kurz X ∼ N (µ, σ 2 ), wenn sie die Dichte
(x − µ)2
1
exp −
, x ∈ IR
f (x) = √
2σ 2
2πσ
besitzt.
• Bemerkung: Gilt µ = 0 und σ 2 = 1, so nennt man X standardnormalverteilt, kurz X ∼ N (0, 1) mit
der Dichte
1
1 2
φ(x) = √
exp − x .
2
2πσ
• Die Verteilungsfunktion ist definitionsgemäß gegeben durch
Z x
f (t)dt,
F (x) = P (X ≤ x) =
−∞
bzw. für die Standardnormalverteilung durch
Z x
Z
Φ(x) =
φ(t)dt =
−∞
x
−∞
√
1
1
exp − t2 dt.
2
2πσ
• Problem: Das Integral der Verteilungsfunktion läßt sich nicht analytisch berechnen und durch bekannt Funktionen in geschlossener Form schreiben. Daher muß Φ(x) durch spezielle numerische
Verfahren berechnet werden. Die Werte von Φ(x) liegen tabelliert vor.
• Eigenschaften der Normalverteilung:
(a) E(X) = µ,
(b) V ar(X) = σ 2 ,
(c) Symmetrie zu µ, d.h. es gilt
f (µ − x) = f (µ + x), x ∈ IR
bzw. für standardnormalverteilte Zufallsvariablen
Φ(−x) = 1 − Φ(x).
(d) Standardisierung: Ist X eine N (µ, σ 2 )-verteilte Zufallsvariable, so ist die standardisierte
Zufallsvariable
X −µ
Z=
σ
standardnormalverteilt, d.h. Z ∼ N (0, 1). Damit ergibt sich
x−µ
x−µ
= Φ(z), mit z =
.
F (x) = Φ
σ
σ
• Quantile: Die Quantile zp der Standardnormalverteilung sind durch die Gleichung
Φ(zp ) = p, 0 < p < 1
bestimmt.
• Das p-Quantil zp teilt die Fläche unter der Dichte φ(z) in eine Fläche mit Inhalt p links von zp und
eine Fläche mit Inhalt 1 − p rechts davon auf.
• Relation zwischen Quantil xp einer N (µ, σ 2 )-verteilte Zufallsvariable X und dem der zugehörigen
standardisierten Zufallsvariable Z:
xp − µ
zp =
σ
bzw. xp = µ + σzp .
• Zentrale Schwankungsintervalle, kσ-Bereiche: Für X ∼ N (µ, σ 2 ) gilt
P (µ − z1−α/2 σ ≤ X ≤ µ + z1−α/2 σ) = 1 − α.
• Sei k = z1−α/2 , so gilt
µ + kσ − µ
µ − kσ − µ
F (µ + kσ) − F (µ − kσ) = Φ
−Φ
σ
σ
= Φ(k) − Φ(−k) = 2Φ(k) − 1.
Zur eigentlichen Aufgabe:
Laut Angabe gilt für den Quecksilbergehalt X ∼ N (25, 25).
(a) Die gesuchten Wahrscheinlichkeiten erhält man unter Verwendung der tabellierten Verteilungsfunktion Φ der Standardnormal-Verteilung gemäß
= 1 − Φ (1.5) = 0.0668
(i) P (X > 32.5) = 1 − P (X ≤ 32.5) = 1 − Φ 32.5−25
5
25−25
(ii) P (X < 25) = Φ
= Φ(0) = 0.5
5
22.5−25
(iii) P (22.5 < X < 30) = Φ 30−25
−
Φ
= Φ(1) − Φ(−0.5) = Φ(1) + Φ(0.5) − 1 = 0.5328
5
5
(b) Allgemein gilt für eine N (µ, σ 2 )-verteilte Zufallsgröße
P (µ − 3σ ≤ X ≤ µ + 3σ) = 0.9973,
so dass die in der Aufgabe gesuchte Wahrscheinlichkeit also 0.9973 beträgt.
(c) Allgemein gilt für eine N (µ, σ 2 )-verteilte Zufallsgröße
P (µ − σ ≤ X ≤ µ + σ) = 0.6827,
so dass das in der Aufgabe gesuchte Intervall also
I = [µ − σ, µ + σ] = [25 − 5, 25 + 5] = [20, 30]
lautet.
(d) Für den kritischen Wert c muss die Bedingung
P (X ≥ c) = 0.02
⇔
P (X ≤ c) = 0.98
erfüllt sein. Daraus ergibt sich unter Verwendung der tabellierten Verteilungsfunktion Φ der
Standardnormal-Verteilung
c − 25
Φ
= 0.98
5
c − 25
5
= Φ−1 (0.98) ≈ 2.055
c = 2.055 · 5 + 25 = 35.275
Lösung Aufgabe 58
Theorie: Exponentialverteilung
• Definition: Eine stetige Zufallsvariable X mit nichtnegativen Werten heißt exponentialverteilt mit
dem Parameter λ > 0, kurz X ∼ Ex(λ), wenn sie die Dichte
λe−λx , für x ≥ 0,
f (x) =
0,
sonst
besitzt. Die zugehörige Verteilung heißt Exponentialverteilung mit Parameter λ.
• Die Exponentialverteilung ergibt sich als Grenzfall der geometrischen Verteilung.
• Die Verteilungsfunktion ergibt sich durch partielle Integration zu
1 − e−λx , für x ≥ 0,
F (x) =
0,
sonst.
• Eigenschaften:
(i) E(X) = λ1 ,
(ii) V ar(X) =
1
,
λ2
(iii) Gedächtnislosigkeit: Für s, t ≥ 0 gilt
P (X > s + t| X > t) = P (X > s).
Zur eigentlichen Aufgabe:
Bezeichne die Zufallsvariable X die stetige Lebensdauer eines elektrischen Bauteils, so gilt zunächst
X ∼ Ex(λ). Aus den Angaben entnimmt man E(X) = λ1 = 500 und folgert daraus λ = 0.002. Damit gilt
für die Verteilungsfunktion von X
1 − e−0.002x , x ≥ 0
F (x) =
0
,x < 0
(a) Für die Wahrscheinlichkeit, dass ein Bauteil vor t0 = 100 nicht ausfällt gilt
P (X > 100) = 1 − P (X ≤ 100) = 1 − F (100) = e−0.2 = 0.8187
(b) Für die Wahrscheinlichkeit, dass ein Bauteil zwischen t1 = 200 und t2 = 300 ausfällt gilt
P (200 < X < 300) = F (300) − F (200) = 1 − e−0.6 − 1 + e−0.4 = 0.1215
(c) Für die Wahrscheinlichkeit, dass ein Bauteil vor t1 ausfällt gilt
P (X < 200) = F (200) = 1 − e−0.4 = 0.3297
Wenn man weiß, dass es zum Zeitpunkt t0 noch intakt war, ergibt sie sich unter Verwendung der
Definition der bedingten Wahrscheinlichkeit gemäß
P (X < 200|X > 100) =
−e−0.4 + e−0.2
P (100 < X < 200)
=
= 0.1813
P (X > 100)
e−0.2
(d) Für den Zeitpunkt t4 soll laut Angabe
P (X > t4 ) = 1 − F (t4 ) = e−0.002·t4 = 0.9
gelten. Daraus erhält man t4 durch
e−0.002·t4
= 0.9
−0.002 · t4 = ln 0.9
t4 = −
ln 0.9
≈ 52.68
0.002
Damit überlebt das Bauteil den Zeitpunkt t4 = 52.68 mit genau 90% Sicherheit und alle Zeitpunkte
vor t4 mit mindestens 90% Sicherheit.
(e) Gesucht ist der Parameter λY einer Ex(λY )-verteilten Zufallsvariable Y , für die
P (Y ≥ 50) = 1 − FY (50) = e−λY 50 = 0.9
gilt. Aus dieser Bedingung ergibt sich
λY = −
ln 0.9
≈ 0.0021
50
Lösung Aufgabe 59
Ist X eine stetige Zufallsvariable mit Dichtefunktion fX , so erhält man Verteilungs- und Dichtefunktion
von Y := X 2 folgendermaßen:
FY (y) = P (Y ≤ y)
= P (X 2 ≤ y)
√
√
= P (− y ≤ X ≤ y)
√
√
= FX ( y) − FX (− Y ).
Die Dichtefunktion fY (y) erhalten wir durch Ableitung der Verteilungsfunktion FY (y)
fY (y) =
dFY (y)
1
√
√
= √ (fX ( y) + fX (− y)).
dy
2 y
Allgemein gilt:
Satz: Sei X stetig mit Dichte fX und g : IR → IR streng monoton und differenzierbar. Sei Y = g(X).
Dann hat Y die Dichte
fX (g −1 (y)) · (g −1 )0 (y), y ∈ g(IR) = (g(x) : x ∈ IR),
fY (y) =
0,
sonst.
Beweis:
Sei g monoton wachsend und y ∈ g(IR). Dann
FY (y) = P (Y ≤ y) = P (g(X) ≤ y)
= P (g −1 (g(X)) ≤ g −1 (y))
= P (X ≤ g −1 (y))
= FX (g −1 (y)).
Anwendung der Kettenregel führt zu
fY (y) =
d
FX (g −1 (y)) = fX (g −1 (y)) · (g −1 )0 (y).
dy
Herunterladen