Statistik I für Statistiker, Mathematiker und Informatiker Gerhard Tutz, Jan Ulbricht Lösungen zu Blatt 11 WS 05/06 Lösung Aufgabe 55 (a) Damit f (x) eine Dichte ist, muß R3 2 f (x)dx = 1 gelten. Dies ist äquivalent zu 3 Z c(x − 2)dx 2 x ⇐⇒ c − 2x |32 2 4 9 −6− +4 ⇐⇒ c 2 2 1 ⇐⇒ c 2 ⇐⇒ c = 1 2 = 1 = 1 = 1 = 2. (b) Ansatz für die Berechnung der Verteilungsfunktion: Z a Z a F (a) = f (x)dx = 2(x − 2)dx = (x2 − 4x)|a2 = a2 − 4a − 4 + 8 = a2 − 4a + 4 −∞ 2 Für die Verteilungsfunktion erhält man damit für x < 2, 0, x2 − 4x + 4, für 2 ≤ x ≤ 3, F (x) = 1, für x > 3. (c) Die Wahrscheinlichkeiten lassen sich über die Verteilungsfunktion bestimmen als P (X > 2.1) = 1 − P (X ≤ 2.1) = 1 − F (2.1) = 1 − (2.12 − 4 · 2.1 + 4) = 1 − 0.01 = 0.99. P (2.1 < X < 2.8) = P (X ≤ 2.8) − P (X ≤ 2.1) = F (2.8) − F (2.1) = 0.64 − 0.01 = 0.63. (d) Die bedingte Wahrscheinlichkeit berechnet sich als P ({−4 ≤ X ≤ 3} ∩ {X ≤ 2.1}) P (X ≤ 2.1) P (−4 ≤ X ≤ 2.1) = P (X ≤ 2.1) F (2.1) − F (−4) = F (2.1) = 1. P (−4 ≤ X ≤ 3|X ≤ 2.1) = Die stochastische Unabhängigkeit der Ereignisse läßt sich nachweisen, indem man zeigt, dass die Wahrscheinlichkeit für das gemeinsame Ereignis mit dem Produkt der Einzelwahrscheinlichkeiten übereinstimmt: P ({−4 ≤ X ≤ 3} ∩ {X ≤ 2.1}) = P (−4 ≤ X ≤ 2.1) = F (2.1) = 0.01 P (−4 ≤ X ≤ 3) · P (X ≤ 2.1) = (F (3) − F (−4)) · F (2.1) = (1 − 0) · F (2.1) = 0.01 = P ({−4 ≤ X ≤ 3} ∩ {X ≤ 2.1}) (e) Für den Erwartungswert erhält man ∞ Z Z 3 Z xf (x)dx = x2(x − 2)dx = −∞ 2 3 2x 4x2 3 |2 = − 3 2 2 · 27 4 · 9 2 · 8 4 · 4 = − − + 3 2 3 2 16 = . 6 3 E(X) = (2x2 − 4x)dx 2 Der Median berechnet sich als F (xmed ) 2 ⇐⇒ xmed − 4xmed + 4 ⇐⇒ x2med − 4xmed + 3.5 (1) =⇒ xmed (2) xmed = 0.5 = 0.5 = 0 = 2+ = 2− √ √ 4 − 3.5 ≈ 2.7071 4 − 3.5 ≈ 0.7071 (2) (1) Da xmed = 0.7071 außerhalb des Definitionsbereiches D = [2, 3] liegt, gilt xmed = xmed = 2.7071. Die Varianz ermittelt man, indem man zunächst E(X 2 ) berechnet als ∞ Z 2 Z 2 x f (x)dx = E(X ) = −∞ Z 3 3 x2 2(x − 2)dx 2 (2x3 − 4x2 )dx 4 2x 4x3 3 = − |2 4 3 2 · 81 4 · 27 2 · 16 4 · 8 = − − + 4 3 4 3 43 = , 6 = 2 woraus sich die Varianz ergibt als 43 V ar(X) = E(X ) − E(X) = − 6 2 2 16 6 2 = 1 . 18 Lösung Aufgabe 56 Theorie: Stetige Gleichverteilung • Definition: Eine stetige Zufallsvariable heißt gleichverteilt auf dem Intervall [a, b], wenn sie eine Dichte 1 b−a , für a ≤ x ≤ b, f (x) = 0, sonst besitzt. • Bemerkung: Eine auf [0, 1] gleichverteilte Zufallsvariable nennt man auch standardgleichverteilt. • Die Verteilungsfunktion einer gleichverteilten Zufallsvariable lautet x < a, 0, x−a , a ≤ x ≤ b, F (x) b−a 1, x > b. • Bemerkung: Die Dichte ist an den Stellen a und b unstetig =⇒ Verteilungsfunktion ist dort nicht differenzierbar. • Der Erwartungswert lautet E(X) = die Varianz lautet V ar(X) = a+b , 2 (b − a)2 . 12 Zur eigentlichen Aufgabe: Sei X der Zeitpunkt, an dem der Fahrgast den Bahnsteig erreicht. Aus Vereinfachungsgründen geben wir den Zeitpunkt in fortlaufenden Minuten an, also X ∈ [0, 60]. Da laut Aufgabenstellung X eine gleichverteilte stetige Zufallsvariable ist, gilt 1 60 , x ∈ [0, 60], f (x) = 0, sonst. Die S-Bahnen fahren im Zeitraum von 7.00 Uhr bis 8.00 Uhr zu folgenden Zeitpunkten Richtung A 7.00 Uhr 7.15 Uhr 7.30 Uhr 7.45 Uhr 8.00 Uhr Richtung B 7.07 Uhr 7.27 Uhr 7.47 Uhr Der Fahrgast fährt in Richtung A, wenn seine Ankunft in einen der folgenden Intervalle fällt {X = 0}, {7 < X ≤ 15}, {27 < X ≤ 45}, {47 < X ≤ 60}. Sei A das Ereignis, dass der Fahrgast eine S-Bahn in Richtung A wählt. Aufgrund der Disjunktheit der Intervalle gilt P (A) = P (X = 0) + P (7 < X ≤ 15) + P (27 < X ≤ 45) + P (47 < X ≤ 60) Z 0 Z 15 Z 45 Z 60 = 1/60dx + 1/60dx + 1/60dx + 1/60dx 0 7 27 47 8 18 13 = 0+ + + 60 60 60 39 = = 0.65. 60 Mit einer Wahrscheinlichkeit von P (A) = 0.65 nimmt der Fahrgast eine S-Bahn in Richtung A. Lösung Aufgabe 57 Theorie: Normalverteilung: • Definition: Eine Zufallsvariable X heißt normalverteilt mit den Parametern µ ∈ IR und σ 2 > 0, kurz X ∼ N (µ, σ 2 ), wenn sie die Dichte (x − µ)2 1 exp − , x ∈ IR f (x) = √ 2σ 2 2πσ besitzt. • Bemerkung: Gilt µ = 0 und σ 2 = 1, so nennt man X standardnormalverteilt, kurz X ∼ N (0, 1) mit der Dichte 1 1 2 φ(x) = √ exp − x . 2 2πσ • Die Verteilungsfunktion ist definitionsgemäß gegeben durch Z x f (t)dt, F (x) = P (X ≤ x) = −∞ bzw. für die Standardnormalverteilung durch Z x Z Φ(x) = φ(t)dt = −∞ x −∞ √ 1 1 exp − t2 dt. 2 2πσ • Problem: Das Integral der Verteilungsfunktion läßt sich nicht analytisch berechnen und durch bekannt Funktionen in geschlossener Form schreiben. Daher muß Φ(x) durch spezielle numerische Verfahren berechnet werden. Die Werte von Φ(x) liegen tabelliert vor. • Eigenschaften der Normalverteilung: (a) E(X) = µ, (b) V ar(X) = σ 2 , (c) Symmetrie zu µ, d.h. es gilt f (µ − x) = f (µ + x), x ∈ IR bzw. für standardnormalverteilte Zufallsvariablen Φ(−x) = 1 − Φ(x). (d) Standardisierung: Ist X eine N (µ, σ 2 )-verteilte Zufallsvariable, so ist die standardisierte Zufallsvariable X −µ Z= σ standardnormalverteilt, d.h. Z ∼ N (0, 1). Damit ergibt sich x−µ x−µ = Φ(z), mit z = . F (x) = Φ σ σ • Quantile: Die Quantile zp der Standardnormalverteilung sind durch die Gleichung Φ(zp ) = p, 0 < p < 1 bestimmt. • Das p-Quantil zp teilt die Fläche unter der Dichte φ(z) in eine Fläche mit Inhalt p links von zp und eine Fläche mit Inhalt 1 − p rechts davon auf. • Relation zwischen Quantil xp einer N (µ, σ 2 )-verteilte Zufallsvariable X und dem der zugehörigen standardisierten Zufallsvariable Z: xp − µ zp = σ bzw. xp = µ + σzp . • Zentrale Schwankungsintervalle, kσ-Bereiche: Für X ∼ N (µ, σ 2 ) gilt P (µ − z1−α/2 σ ≤ X ≤ µ + z1−α/2 σ) = 1 − α. • Sei k = z1−α/2 , so gilt µ + kσ − µ µ − kσ − µ F (µ + kσ) − F (µ − kσ) = Φ −Φ σ σ = Φ(k) − Φ(−k) = 2Φ(k) − 1. Zur eigentlichen Aufgabe: Laut Angabe gilt für den Quecksilbergehalt X ∼ N (25, 25). (a) Die gesuchten Wahrscheinlichkeiten erhält man unter Verwendung der tabellierten Verteilungsfunktion Φ der Standardnormal-Verteilung gemäß = 1 − Φ (1.5) = 0.0668 (i) P (X > 32.5) = 1 − P (X ≤ 32.5) = 1 − Φ 32.5−25 5 25−25 (ii) P (X < 25) = Φ = Φ(0) = 0.5 5 22.5−25 (iii) P (22.5 < X < 30) = Φ 30−25 − Φ = Φ(1) − Φ(−0.5) = Φ(1) + Φ(0.5) − 1 = 0.5328 5 5 (b) Allgemein gilt für eine N (µ, σ 2 )-verteilte Zufallsgröße P (µ − 3σ ≤ X ≤ µ + 3σ) = 0.9973, so dass die in der Aufgabe gesuchte Wahrscheinlichkeit also 0.9973 beträgt. (c) Allgemein gilt für eine N (µ, σ 2 )-verteilte Zufallsgröße P (µ − σ ≤ X ≤ µ + σ) = 0.6827, so dass das in der Aufgabe gesuchte Intervall also I = [µ − σ, µ + σ] = [25 − 5, 25 + 5] = [20, 30] lautet. (d) Für den kritischen Wert c muss die Bedingung P (X ≥ c) = 0.02 ⇔ P (X ≤ c) = 0.98 erfüllt sein. Daraus ergibt sich unter Verwendung der tabellierten Verteilungsfunktion Φ der Standardnormal-Verteilung c − 25 Φ = 0.98 5 c − 25 5 = Φ−1 (0.98) ≈ 2.055 c = 2.055 · 5 + 25 = 35.275 Lösung Aufgabe 58 Theorie: Exponentialverteilung • Definition: Eine stetige Zufallsvariable X mit nichtnegativen Werten heißt exponentialverteilt mit dem Parameter λ > 0, kurz X ∼ Ex(λ), wenn sie die Dichte λe−λx , für x ≥ 0, f (x) = 0, sonst besitzt. Die zugehörige Verteilung heißt Exponentialverteilung mit Parameter λ. • Die Exponentialverteilung ergibt sich als Grenzfall der geometrischen Verteilung. • Die Verteilungsfunktion ergibt sich durch partielle Integration zu 1 − e−λx , für x ≥ 0, F (x) = 0, sonst. • Eigenschaften: (i) E(X) = λ1 , (ii) V ar(X) = 1 , λ2 (iii) Gedächtnislosigkeit: Für s, t ≥ 0 gilt P (X > s + t| X > t) = P (X > s). Zur eigentlichen Aufgabe: Bezeichne die Zufallsvariable X die stetige Lebensdauer eines elektrischen Bauteils, so gilt zunächst X ∼ Ex(λ). Aus den Angaben entnimmt man E(X) = λ1 = 500 und folgert daraus λ = 0.002. Damit gilt für die Verteilungsfunktion von X 1 − e−0.002x , x ≥ 0 F (x) = 0 ,x < 0 (a) Für die Wahrscheinlichkeit, dass ein Bauteil vor t0 = 100 nicht ausfällt gilt P (X > 100) = 1 − P (X ≤ 100) = 1 − F (100) = e−0.2 = 0.8187 (b) Für die Wahrscheinlichkeit, dass ein Bauteil zwischen t1 = 200 und t2 = 300 ausfällt gilt P (200 < X < 300) = F (300) − F (200) = 1 − e−0.6 − 1 + e−0.4 = 0.1215 (c) Für die Wahrscheinlichkeit, dass ein Bauteil vor t1 ausfällt gilt P (X < 200) = F (200) = 1 − e−0.4 = 0.3297 Wenn man weiß, dass es zum Zeitpunkt t0 noch intakt war, ergibt sie sich unter Verwendung der Definition der bedingten Wahrscheinlichkeit gemäß P (X < 200|X > 100) = −e−0.4 + e−0.2 P (100 < X < 200) = = 0.1813 P (X > 100) e−0.2 (d) Für den Zeitpunkt t4 soll laut Angabe P (X > t4 ) = 1 − F (t4 ) = e−0.002·t4 = 0.9 gelten. Daraus erhält man t4 durch e−0.002·t4 = 0.9 −0.002 · t4 = ln 0.9 t4 = − ln 0.9 ≈ 52.68 0.002 Damit überlebt das Bauteil den Zeitpunkt t4 = 52.68 mit genau 90% Sicherheit und alle Zeitpunkte vor t4 mit mindestens 90% Sicherheit. (e) Gesucht ist der Parameter λY einer Ex(λY )-verteilten Zufallsvariable Y , für die P (Y ≥ 50) = 1 − FY (50) = e−λY 50 = 0.9 gilt. Aus dieser Bedingung ergibt sich λY = − ln 0.9 ≈ 0.0021 50 Lösung Aufgabe 59 Ist X eine stetige Zufallsvariable mit Dichtefunktion fX , so erhält man Verteilungs- und Dichtefunktion von Y := X 2 folgendermaßen: FY (y) = P (Y ≤ y) = P (X 2 ≤ y) √ √ = P (− y ≤ X ≤ y) √ √ = FX ( y) − FX (− Y ). Die Dichtefunktion fY (y) erhalten wir durch Ableitung der Verteilungsfunktion FY (y) fY (y) = dFY (y) 1 √ √ = √ (fX ( y) + fX (− y)). dy 2 y Allgemein gilt: Satz: Sei X stetig mit Dichte fX und g : IR → IR streng monoton und differenzierbar. Sei Y = g(X). Dann hat Y die Dichte fX (g −1 (y)) · (g −1 )0 (y), y ∈ g(IR) = (g(x) : x ∈ IR), fY (y) = 0, sonst. Beweis: Sei g monoton wachsend und y ∈ g(IR). Dann FY (y) = P (Y ≤ y) = P (g(X) ≤ y) = P (g −1 (g(X)) ≤ g −1 (y)) = P (X ≤ g −1 (y)) = FX (g −1 (y)). Anwendung der Kettenregel führt zu fY (y) = d FX (g −1 (y)) = fX (g −1 (y)) · (g −1 )0 (y). dy