Prüfungsvorbereitungskurs Höhere Mathematik 3 Stochastik Marco Boßle Jörg Hörner Marcel Thoms Mathematik–Online Herbst 2011 PV-Kurs HM 3 Stochastik 1-1 Zusammenfassung Wahrscheinlichkeitsraum (WR): Menge der Elementarereignisse Ω (Ergebnismenge) Ereignismenge M ⊆ P(Ω) (σ-Algebra) Wahrscheinlichkeitsverteilung p : M → [0, 1] I Endlicher oder abzählbarer WR: Elementarwahrscheinlichkeiten p({ω}) X X p(M) = p({ω}) , p(Ω) = p({ω}) = 1 ω∈M I ω∈Ω Ω ⊆ Rn : Verteilungsfunktion F oder Dichte f F (x) = F (x1 , ..., xn ) = p((−∞, x1 ) × · · · × (−∞, xn )) Zx1 Zxn Z F (x) = ... f (y ) dyn · · · dy1 , f (y ) dy = 1 −∞ PV-Kurs HM 3 Stochastik −∞ Rn Zusammenfassung 2-1 Wahrscheinlichkeitsverteilungen: Laplaceverteilung L(Ω): p(M) = #(M) (Gleichverteilung) #(Ω) Binomialverteilung B(n, p): Ω = {0, . . . , n} , p({`}) = n` p ` (1 − p)n−` Hypergeometrische Verteilung H(n, m, k) : Ω = {0, . . . , k} , p({`}) = n ` m k−` n+m k Geometrische Verteilung G (p) : Ω = N , p({`}) = (1 − p)`−1 p λ` Poissonverteilung P(λ) : Ω = N0 , p({`}) = e −λ `! Gleichverteilung: Ω = [a, b] , p([c, d]) = (d − c)/(b − a) −λx Exponentialverteilung: Ω = R+ 0 , f (x) = λe Normalverteilung: N(µ, σ 2 ) , Ω = R , f (x) = PV-Kurs HM 3 Stochastik 2 2 √1 e −(x−µ) /(2σ ) σ 2π Zusammenfassung 2-2 Andere Verteilungen Urnenexperimente Kombinationsmöglichkeiten bei Auswahl von k aus n Elementen: Reihenfolge relevant nicht relevant n+k −1 k mit Wiederholungen n k n ohne Wiederholungen n(n − 1) · · · (n − k + 1) k Modellierung durch Zufallsvariablen X : Ω → Ω̃ , PV-Kurs HM 3 Stochastik pX (A) = p({ω ∈ Ω|X (ω) ∈ A}) Zusammenfassung 2-3 Bedingte Wahrscheinlichkeit: p(A ∩ B) p(A|B) = , p(B) p(B|A) = p(A ∩ B) p(A) Formel von der totalen Wahrscheinlichkeit: A1 ∪ A2 = Ω , A1 ∩ A2 = ∅ : p(B) = p(B|A1 )p(A1 ) + p(B|A2 )p(A2 ) Ak : Zerlegung von Ω in disjunkte Teilmengen: X p(B) = p(B|Ak )p(Ak ) k Formel von Bayes: p(A1 |B) = p(B|A1 )p(A1 ) p(B|A` )p(A` ) , p(A` |B) = P p(B|A1 )p(A1 ) + p(B|A2 )p(A2 ) k p(B|Ak )p(Ak ) Unabhängigkeit von n Ereignissen A1 , . . . , An : ! \ Y p Ak = p(Ak ) , ∀K ⊆ {1, . . . , n} k∈K PV-Kurs HM 3 Stochastik k∈K Zusammenfassung 2-4 Momente von reellwertigen Zufallsvariablen (Ω̃ ⊆ R) Erwartungswert: (Erstes Moment) E (X ) = X Z∞ x f (x) dx x p({x}) , E (X ) = x∈Ω̃ −∞ Varianz: (Zweites zentrales Moment) D(X ) = E ((X − E (X ))2 ) = E (X 2 ) − (E (X ))2 Rechenregeln: E (αX + βY ) = αE (X ) + βE (Y ) , PV-Kurs HM 3 Stochastik D(αX + β) = α2 D(X ) Zusammenfassung 2-5 Erwartungswert und Varianz bei speziellen Verteilungen: Binomialverteilung B(n, p) : E (X ) = np , D(X ) = np(1 − p) Geometrische Verteilung G (p) : E (X ) = 1/p , D(X ) = (1 − p)/p 2 Poissonverteilung P(λ) : E (X ) = λ , D(X ) = λ Gleichverteilung auf [a, b] : E (X ) = (a + b)/2 , D(X ) = (b − a)2 /12 Exponential-λ-Verteilung: E (X ) = 1/λ , D(X ) = 1/λ2 Normalverteilung N(µ, σ 2 ) : E (X ) = µ , D(X ) = σ 2 PV-Kurs HM 3 Stochastik Zusammenfassung 2-6 Zufallsvektoren X = (X1 , . . . , Xn ) Erwartungswerte: (erste Momente) Z E (Xk ) = xk f (x1 , . . . , xn ) dx Rn Kovarianz: (Zweite zentrale Momente) cov(Xj , Xk ) = E ((Xj − E (Xj ))(Xk − E (Xk ))) Rechenregeln bei unabhängigen Xk : Verteilfunktion: FX (x) = FX1 (x1 ) · · · · · FXn (xn ) Dichte: fX (x) = fX1 (x1 ) · · · · · fXn (xn ) E (Xj Xk ) = E (Xj )E (Xk ) , PV-Kurs HM 3 Stochastik D(Xj + Xk ) = D(Xj ) + D(Xk ) Zusammenfassung 2-7 Approximation der B(n, p) Verteilung: Seltenes Ereignis (kleines p) Poissonverteilung P(λ) mit λ = np : p(k) ≈ e −np (np)k k! Häufige Wiederholung (großes n) Normalverteilung N(µ, σ 2 ) mit µ = np , σ 2 = np(1 − p): p({k, . . . , `}) ≈ p(a ≤ (X − µ)/σ < b) ≈ Φ(b) − Φ(a) mit a = (k − 1/2 − µ)/σ , b = (` + 1/2 − µ)/σ Parameterschätzung bei Beobachtungen x1 , ..., xn : P Erwartungswert: E (X ) ≈ x̄ P = n1 nk=1 xk n 1 2 Varianz: D(X ) ≈ s̃ 2 = n−1 k=1 (xk − x̄) B(n, p)-Verteilung: p ≈ x̄/n Poisson-Verteilung: λ ≈ x̄ Exponential-Verteilung: λ ≈ 1/x̄ N(µ, σ 2 )-Verteilung: µ ≈ x̄, σ 2 ≈ s̃ 2 Maximum-Likelihood-Schätzung: Wähle u so, dass p(X = x, u) maximal ist. PV-Kurs HM 3 Stochastik Zusammenfassung 2-8 Aufgabe 4.1 (I1438) In einer Urne befinden sich drei rote und drei grüne Kugeln, in einer zweiten Urne befinden sich drei rote und drei blaue Kugeln. Aus diesen Urnen wird (ohne zurücklegen) zweimal eine Kugel gezogen, indem zunächst zufällig eine Urne ausgewählt und dann dieser Urne zufällig eine Kugel entnommen wird. Bestimmen Sie die Wahrscheinlichkeiten p(A) und p(B) folgender Ereignisse: A: beide Kugeln sind rot. B: beide Kugeln haben dieselbe Farbe. Vergleichen Sie die Ergebnisse mit den Wahrscheinlichkeiten p2 (A) und p2 (B) bei einer Ziehung von zwei Kugeln ohne Zurücklegen aus einer Urne mit allen 12 Kugeln. PV-Kurs HM 3 Stochastik Aufgabe 4.1 (I1438) 3-1 Lösung 4.1 (I1438) Ereignisse: A: beide Kugeln sind rot B: beide Kugeln haben dieselbe Farbe C1 : beide Kugeln aus gleicher Urne p(C1 ) = 1/2 C2 : Kugeln aus verschiedenen Urnen p(C2 ) = 1/2 Bedingte Wahrscheinlichkeiten: 3 6 3·2 p(A|C1 ) = = = 1/5 / 2 2 6·5 33 1 p(A|C2 ) = = 66 4 p(B|C1 ): andere Farbe gleiche Fall wie rot p(B|C1 ) = 2p(A|C1 ) = 2/5 p(B|C2 ): Kugeln müssen rot sein p(B|C2 ) = p(A|C2 ) = 1/4 PV-Kurs HM 3 Stochastik Lösung 4.1 (I1438) 4-1 Formel der totalen Wahrscheinlichkeit: p(A) = p(A|C1 )p(C1 ) + p(A|C2 )p(C2 ) = 11 11 9 + = 52 42 40 p(B) = p(B|C1 )p(C1 ) + p(B|C2 )p(C2 ) = 21 11 13 + = 52 42 40 Alle Kugeln in einer Urne: 6 12 6·5 p2 (A) = / = = 5/22 2 2 12 · 11 Ereignis D: beide Kugeln sind grün 3 12 3·2 p2 (D) = / = = 1/22 2 2 12 · 11 PV-Kurs HM 3 Stochastik Lösung 4.1 (I1438) 4-2 Analog für blau , daher p2 (B) = p2 (A) + 2p2 (D) = 7/22 Vergleich: p(A) = 9/40 = 99/440 < 100/440 = 5/22 = p2 (A) p(B) = 13/40 = 143/440 > 140/440 = 7/22 = p2 (B) PV-Kurs HM 3 Stochastik Lösung 4.1 (I1438) 4-3 Klausuraufgabe 5 (Schneider F11) Eine zweidimensionale Zufallsvariable (X , Y ) besitze die Dichte 1 für 0 < x < 1 und 0 < y < 3x 2 , f (x, y ) = 0 sonst , Skizzieren Sie in einem Koordinatensystem den Bereich, in dem f von Null verschieden ist und weisen Sie nach, dass es sich um eine Wahrscheinlichkeitsdichte handelt. Zeigen Sie dass X und Y stochastisch abhängig sind. Bestimmen Sie des weiteren die Standardabweichung von X . Bestimmen Sie die bedingte Wahrscheinlichkeit P(X > 13 | 2X + Y < 1) . PV-Kurs HM 3 Stochastik Klausuraufgabe 5 (Schneider F11) 5-1 Lösung Klausuraufgabe 5 Bedingung für Wahrscheinlichkeitsdichte Z f (x, y ) ≥ 0 , f (x, y )d(x, y ) = 1 R2 Erste Bedingung erfüllt. Zweite Bedingung: Z1 Z3x 2 Z1 dy dx = 0 PV-Kurs HM 3 Stochastik 0 3x 2 dx = 1 0 Lösung Klausuraufgabe 5 6-1 Bedingung für Unabhängigkeit: E (X · Y ) = E (X )E (Y ) Z1 Z1 Z3x 2 E (X ) = x dy dx = 3x 3 dx = 3/4 0 0 0 Z1 Z3x 2 E (Y ) = Z1 y dy dx = 0 0 0 3x 2 Z1 Z E (XY ) = Standardabweichung: σ = 2 Z1 xy dy dx = 0 p 0 0 2 2 Z1 x x dy dx = 0 0 9x 5 dx = 3/4 2 E (X 2 ) − E (X )2 : Z1 Z3 E (X ) = 9x 4 dx = 9/10 2 3x 4 dx = 3/5 0 p p σ = 3/5 − 9/16 = 3/80 PV-Kurs HM 3 Stochastik Lösung Klausuraufgabe 5 6-2 Bedingte Wahrscheinlichkeit: P(A|B) = P(A ∩ B) . P(B) Hier: A : X > 1/3 , B : Y < 1 − 2X Schnittstellen von y = 3x 2 und y = 1 − 2x: x = −1 und x = 1/3 . y = 1 − 2x schneidet x-Achse bei x = 1/2 . Damit lässt sich P(A ∩ B) bestimmen: Z1/2 1−2x Z P(A ∩ B) = 1/3 Z1/2 1 − 2x dx = 1/6 − 1/4 + 1/9 = 1/36 . dy dx = 0 1/3 Für P(B) wird noch der zweite Gebietsteil berücksichtigt: Z1/3Z3x 2 P(B \ A) = 0 0 Z1/3 dy dx = 3x 2 dx = 1/27 . 0 Ergebnis: P(A|B) = PV-Kurs HM 3 Stochastik P(A ∩ B) 1/36 = = 3/7 . P(B) 1/36 + 1/27 Lösung Klausuraufgabe 5 6-3 Klausuraufgabe 6 (Schneider F11) In einem Binnenmeer befinden sich vier Arten von Fischen. 50% aller Fische sind rot, 25% aller Fische sind schwarz, 15% aller Fische sind gelb und 10% aller Fische sind grün . Die schwarzen Fische gelten als Delikatesse. Mit welcher Wahrscheinlichkeit sind bei einem Fang von 1200 Fischen mehr als 279 schwarz? Ein Fischer fängt 400 Fische. Geben Sie ein Intervall an, in dem mit 95% Wahrscheinlichkeit die Anzahl der gefangenen roten Fische liegt. Die grünen Fische sind vom Aussterben bedroht. Wie viele Fische muss man mindestens fangen, um mit 84% Sicherheit zu sagen, dass noch mindestens 4% grüne Fische im Binnenmeer leben. Hinweis: Gehen Sie davon aus, dass die Gesamtzahl der Fische im Meer sehr groß gegenüber der Anzahl der gefangenen Fische ist, und benutzen Sie den zentralen Grenzwertsatz. PV-Kurs HM 3 Stochastik Klausuraufgabe 6 (Schneider F11) 7-1 Lösung Klausuraufgabe 6 Bernoulli-Experiment: schwarzer Fisch oder nicht I I Erfolgswahrscheinlichkeit p = 25% = 1/4 n = 1200 Wiederholungen Anzahl der Erfolge: B(n, p) verteilt Approximation durch Normalverteilung N(µ, σ 2 ): I I µ = np = 300 p = 1200 · 1/4p σ = np(1 − p) = 1200 · 1/4 · 3/4 = 15 Mehr als 279 Erfolge 279 − 300 15 = Φ(7/5) ≈ .9192 . P(279 < X ) = 1 − P(X ≤ 279) ≈ 1 − Φ PV-Kurs HM 3 Stochastik Lösung Klausuraufgabe 6 8-1 Experiment: roter Fisch oder nicht I I Erfolgswahrscheinlichkeit p = 50% = 1/2 n = 400 Wiederholungen Approximation durch Normalverteilung N(µ, σ 2 ): I I µ = np p200 p = 400 · 1/2 = σ = np(1 − p) = 400 · 1/2 · 1/2 = 10 Intervall I = (200 − r , 200 + r ) mit P(X ∈ I ) = 95% r −r ! P(X ∈ I ) ≈ Φ −Φ = 2Φ(r /10) − 1 = .95 10 10 Φ(r /10) = 0.975 r /10 = 1.96 PV-Kurs HM 3 r = 19.6 I = (180.4, 219.6) Stochastik Lösung Klausuraufgabe 6 8-2 Experiment: grüner Fisch oder nicht I I Erfolgswahrscheinlichkeit p = 10% = 1/10 n Wiederholungen Approximation durch Normalverteilung N(µ, σ 2 ): I I µ = np p p = n/10 σ = np(1 − p) = n · 1/10 · 9/10 Ab welchem n ist P(X > 4n/100) mindestens 84% 4n/100 − n/10 p P(X > 4n/100) = 1 − P(X ≤ 4n/100) ≈ 1 − Φ 9n/100 √ n ! = Φ = .84 5 √ n = 1 5 n = 25 PV-Kurs HM 3 Stochastik Lösung Klausuraufgabe 6 ! 8-3 Aufgabe 4.4 (I1451) Sei fα (x) = αx1 x2 für x = (x1 , x2 ) ∈ [0, 2]2 , 0 sonst , und A : min(x1 , x2 ) > 1 , B : (x1 − 1)2 + (x2 − 1)2 ≤ 1 . Bestimmen Sie α so, dass fα (x) die Dichte einer Zufallsvariablen ist, und bestimmen Sie für diese Dichte die Wahrscheinlichkeiten p(A) , p(B) und p(A ∩ B) . Sind A und B stochastisch unabhängig? PV-Kurs HM 3 Stochastik Aufgabe 4.4 (I1451) 9-1 Lösung 4.4 (I1451) Bedingung für Wahrscheinlichkeitsdichte Z f (x) ≥ 0 , f (x)dx = 1 R2 Erste Bedingung erfüllt für α > 0. Zweite Bedingung: Z2 Z2 1 1 ! αx1 x2 dx1 dx2 = α 4 4 = 4α = 1 ⇒ α = 1/4 . 2 2 0 0 Wahrscheinlichkeiten der Teilmengen: Z2 Z2 Z p(A) = f (x) dx = 1 A PV-Kurs HM 3 Stochastik x1 x2 14−1 4−1 dx1 dx2 = = 9/16 = .5625 4 4 2 2 1 Lösung 4.4 (I1451) 10-1 Kreis mit (verschobenen) Polarkoordinaten x1 = 1 + r cos(ϕ) , p(B) = 1 4 x2 = 1 + r sin(ϕ) , r ∈ [0, 1] , ϕ ∈ [0, 2π) , Z1 Z2π (1 + r cos ϕ)(1 + r sin ϕ)rdϕ dr 0 = 1 4 0 1 Z Z2π 0 = = PV-Kurs HM 3 r + r 2 cos ϕ + r 2 sin ϕ + r 3 sin ϕ cos ϕdϕ dr 0 1 2 1 2π 3 1 2π [r /2]0 [ϕ]0 + [r 3 /3]10 [sin ϕ]2π 0 + [r /3]0 [− cos ϕ]0 4 + [r 4 /4]10 [ 21 sin2 ϕ]2π 0 1 (π + 0 + 0 + 0) = π/4 ≈ .7854 4 Stochastik Lösung 4.4 (I1451) 10-2 Schnittmenge Viertekreis → ϕ ∈ [0, π/2) p(A ∩ B) = 1 (π/4 + 1/3 + 1/3 + 1/8) = π/16 + 19/96 ≈ .3943 4 p(A)p(B) = 9π/64 6= π/16 + 19/96 ⇒ nicht unabhängig. PV-Kurs HM 3 Stochastik Lösung 4.4 (I1451) 10-3 Aufgabe 4.6 (I1618) Zur Analyse der Dauer von Arbeitslosigkeit wird der Zusammenhang zwischen Ausbildungsniveau und Dauer der Arbeitslosigkeit untersucht. Unter 152 Arbeitslosen ohne Ausbildung waren 98 kurzzeitig, 32 mittelfristig und 22 längerfristig arbeitslos. a) Schätzen Sie jeweils die Wahrscheinlichkeiten dafür, dass ein Arbeitsloser ohne Ausbildung kurzfristig, mittelfristig oder langfristig arbeitslos ist und geben Sie für jede der Schätzungen ein (approximatives) 97%-Konfidenzintervall an. b) Wieviel größer müßte die Stichprobe sein, um die Länge der Konfidenzintervalle zu vierteln? PV-Kurs HM 3 Stochastik Aufgabe 4.6 (I1618) 11-1 Lösung 4.6 (I1618) Schätzung von p der B(n, p)-Verteilung: p = x/n pk = 98/152 = 49/76 ≈ 0.6447 , pm = 32/152 = 4/19 ≈ 0.2105 , pl = 22/152 = 11/76 ≈ 0.1447 . Berechnung der Intervalle: Approximative-Normalverteilung: µ = np , σ 2 = p(1 − p)n Gesucht: Ip = [p − δ/n, p + δ/n] bzw. I = [µ − δ, µ + δ] mit X − µ δ 97% = P(X ∈ I ) = P (|X − µ| < δ) = P < σ σ δ δ = Φ −Φ − = 2Φ(δ/σ) − 1 ⇒ Φ(δ/σ) = 1.97/2 = 0.985 σ σ p Tabelle der Φ-Funktion → δ/σ ≈ 2.17 ⇒ δ ≈ 2.17 p(1 − p)n ! PV-Kurs HM 3 Stochastik Lösung 4.6 (I1618) 12-1 Somit p 98/152 · 54/152 · 152 ≈ 12.8 δk ≈ δm ⇒ pk ∈ [(98 − 12.8)/152, (98 + 12.8)/152] = [.5605, 0.7290] p ≈ 2.17 32/152 · 120/152 · 152 ≈ 10.907 δl 2.17 ⇒ pm ∈ [(32 − 10.907)/152, (32 + 10.907)/152] = [.1388, 0.2823] p ≈ 2.17 22/152 · 130/152 · 152 ≈ 9.413 ⇒ pl ∈ [(22 − 9.413)/152, (22 + 9.413)/152] = [.0828, 0.2067] . p Länge der Intervalle: 2δ/n = 2 · 2.17 p(1 − p)/n ⇒ ñ = 16n. PV-Kurs HM 3 Stochastik Lösung 4.6 (I1618) 12-2