Aufgabenblock 3 Aufgabe 1) A sei das Ereignis: schwerer Verkehrsunfall B sei das Ereignis: „Alkohol ist im Spiel“ Herr Walker betrachtet die Wahrscheinlichkeit P(B|A) = 0.3 und errechnet daraus P(-B|A) = 1 – 0.3 = 0.7. Dieses Ereignis –B|A ist aber gar nicht interessant für die Frage, ob man betrunken fahren sollte sondern vielmehr umgekehrt: Wie groß ist die Wahrscheinlichkeit einen Verkehrsunfall zu haben, gegeben Alkohol: also P(A|B)? Diese Wahrscheinlichkeit ist aus den angegebenen Fakten jedoch nicht zu berechnen. Nur wenn die Wahrscheinlichkeit P(A|B) kleiner wäre als P(A|-B), sollte man besser mit Alkohol Auto fahren. Aufgabe 2) Durch zählen erhält man P(A) = 10 / 36 P(C) = 18 / 36 und P(A∩B) = 3 / 36 3 P( A ∩ B) 36 3 P( B | A) = = = . 10 10 P( A) 36 Somit ist P ( A | A) = P(B) = 3 / 36 P( A ∩ A) = 1 ≠ P ( A) . A ist also von A stochastisch abhängig. P( A) P( A | B) = 1 ≠ 10 = P( A) . A und B sind stochastisch abhängig. 36 4 P ( A ∩ C ) 36 4 P( A | C ) = = = ≠ P( A) . A und C sind ebenfalls stochastisch abhängig. 10 10 P( A) 36 Aufgabe 3) Die Menge der Männer und die Menge der Frauen sind paarweise disjunkt und schöpfen Ω aus. Nach dem Satz der totalen Wahrscheinlichkeit gilt dann: P(klinischer Bereich) = P(klinischer Bereich | Mann) ⋅ P( Mann) + P( klinischer Bereich | Frau ) ⋅ P( Frau ) 21 53 = 0.46 ⋅ + 0.34 ⋅ ≈ 0.374 74 74 Aufgabenblock 3 1 Und da P (klinischer Bereich | Mann) ≠ P(klinischer Bereich) sind Geschlecht und das Ereignis, dass ein zufällig ausgewählter angehender Psychologe in den klinischen Bereich will, stochastisch abhängig. Aufgabe 4) Die erste Aussage ist richtig, wie man an der Produktformel für stochastisch unabhängige Ereignisse sehen kann: Unabhängigkeit gilt genau dann, wenn P ( A ∩ B ) = P ( A) ⋅ P ( B ) gilt. Da nach Definition P( A ∩ B) = P( B ∩ A) ist, kommt es bei stochastischer Unabhängigkeit nicht auf die Reihenfolge an. Demzufolge auch nicht bei stochastischer Abhängigkeit. Die zweite Aussage ist richtig, da die stochastische Abhängigkeit immer im „Familienverbund“ auftritt. Die dritte Aussage ist richtig für alle Ereignisse, die nicht die Wahrscheinlichkeit 1 haben. Es gilt immer P(A|A) = 1. Ω ist hingegen von sich selbst unabhängig. Die vierte Aussage ist richtig für alle Ereignisse, die nicht die Wahrscheinlichkeit Null haben. Es gilt immer P(A| -A) = 0. Die fünfte Aussage ist nicht richtig. P(A| Ω) = P(A) Aufgabe 5) P(positiv | infiziert) = 0.99, P(negativ | gesund) = 0.98 und P(infiziert) = 0.0007. Da man entweder infiziert ist oder nicht kann man den Satz von Bayes anwenden. P( positiv | infiziert ) ⋅ P(infiziert ) P( positiv | infiziert ) ⋅ P (infiziert ) + P( positiv | gesund ) ⋅ P( gesund ) 0.99 ⋅ 0.0007 = ≈ 0.0335 0.99 ⋅ 0.0007 + (1 − 0.98) ⋅ (1 − 0.0007) P (infiziert | positiv) = Das bedeutet, dass trotz positiver Testung das Risiko der Infektion überraschend gering ist. Der Grund liegt in der sehr niedrigen Quote der Infizierten überhaupt, so dass falscher Alarm des Testes insgesamt viel häufiger vorkommt also korrekte Infektionsmeldungen. Aufgabe 6) Wir gehen von einem Jahr mit 365 Tagen aus und die Berechnung erfolgt mit der Gegenwahrscheinlichkeit. A sei dass Ereignis, dass mindestens ein Doppelgeburtstag dabei ist. Aufgabenblock 3 2 P ( A) = 1 − P(− A) = 1 − 365 364 363 341 ⋅ ⋅ ⋅ ... ⋅ ≈ 0.569 365 365 365 365 Dabei wird verwendet, dass die Geburtstage verschiedener Personen nichts miteinander zu tun haben, also stochastisch unabhängig sind. Aufgabe 7) z115 = 115 − 100 = 1.5 10 P ( A) = 1 − FN ( z115 ) = 1 − FN (1.5) = 1 − 0.9332 ≈ 0.0668 z120 = 120 − 100 80 − 100 = −2 = 2 und z80 = 10 10 P ( B) = FN ( z120 ) − FN ( z80 ) = FN (2) − FN (−2) = FN (2) − (1 − FN (2)) = FN (2) − 1 + FN (2) = 2 FN (2) − 1 ≈ 2 ⋅ 0.9772 − 1 = 0.954 0.1 = FN ( zu ) = 1 − FN (− zu ) ↔ 1 − 0.1 = 0.9 = FN (− zu ) Tabelle : − zu ≈ 1.28 ↔ zu = −1.28 außerdem ist FN ( zo ) = 0.9 = FN (− zu ) → zo ≈ 1.28 1.28 ≈ zo = xo − 100 ↔ xo ≈ 112.8 10 −1.28 ≈ zu = xu − 100 ↔ xu ≈ 87.2 10 Normale Leute haben eine Intelligenz zwischen ungefähr 87.2 und 112.8. P ( A ∩ B) = FN ( z120 ) − FN ( z115 ) = 0.9772 − 0.9332 = 0.044 Somit ist P( A | B) = P( A ∩ B) 0.044 ≈ ≈ 0.658 P ( A) 0.0668 und da Geschlecht und Intelligenz unabhängig ist P(A| weiblich) = P(A) = 0.0668. Merkmale, die stochastisch abhängig von der Intelligenz sein sollten sind z. B. Schulnoten, Bildungsabschluss usw. E(Z) = E(X + Y) = E (X) + E (Y) = 100 + 50 = 150 Kor ( X , Y ) = Cov( X , Y ) ↔ Cov( X , Y ) = Kor ( X , Y ) ⋅ Std ( X ) ⋅ Std (Y ) Std ( X ) ⋅ Std (Y ) Aufgabenblock 3 3 Var ( Z ) = Var ( X + Y ) = Var ( X ) + Var (Y ) + 2 ⋅ Cov( X , Y ) = = Var ( X ) + Var (Y ) + 2 ⋅ Kor ( X , Y ) ⋅ Std ( X ) ⋅ Std (Y ) = = 100 + 25 + 2 ⋅ 0.85 ⋅10 ⋅ 5 = 210 Aufgabe 8) Die Aufgabe ist nicht ganz präzise formuliert. Es wird einmal von Haushalte und dann von Personen gesprochen. Wir setzen der Einfachheit halber Personen und Haushalte gleich (um es ganz korrekt zu machen, kann man sich vom statistischen Bundesamt die durchschnittliche Anzahl von Personen pro Haushalt besorgen und alle Personenzahlen in Haushalte umrechnen). Wir benutzen die Poissonverteilung mit µ = 2.5 und X die Anzahl der Fernseher, die pro 1000 Haushalte kaputt gehen. Die gesuchte Wahrscheinlichkeit P(X > 5) = 1- P(X≤ 5) P ( X > 5) = 1 − P( X ≤ 5) = 1 − ( P ( X = 0) + P ( X = 1) + ... + P ( X = 5) ) = 1 − P( X = 0) − P ( X = 1) − ... − P( X = 5) = 1 − 2.50 2.5 2.55 2.5 ⋅ e − ... − ⋅ e ≈ 0.042 0! 5! Für eine Millionenstadt ist die Anzahl der zu erwartenden kaputten Fernseher 1000*2.5 = 2500. Dies folgt wieder nach der Formel für den Erwartungswert einer Summe von Zufallsvariablen, wobei die Millionenstadt einfach die Summe aus 1000 der eben betrachteten Städten darstellt. 1000 1000 i =1 i =1 E (Y ) = ∑ E ( X ) = ∑ 2.5 = 1000 ⋅ 2.5 = 2500 Aufgabe 9) 2 2 1 1 E ( X ) = ∑ xi ⋅ P ( X = xi ) = 0 ⋅ + 1 ⋅ = 3 3 3 i =1 2 1 1 1 E (Y ) = ∑ yi ⋅ P(Y = yi ) = 0 ⋅ + 1⋅ = 2 2 2 i =1 2 1 2 4 1 2 Var ( X ) = ∑ ( xi − E ( X )) 2 ⋅ P( X = xi ) = ⋅ + ⋅ = 9 3 9 3 9 i =1 2 1 1 1 1 1 Var (Y ) = ∑ ( yi − E (Y )) 2 ⋅ P(Y = yi ) = ⋅ + ⋅ = 4 2 4 2 4 i =1 Kor ( X , Y ) = Cov( X , Y ) ↔ Cov( X , Y ) = Kor ( X , Y ) ⋅ Std ( X ) ⋅ Std (Y ) Std ( X ) ⋅ Std (Y ) Cov( X , Y ) = 0.75 ⋅ 2 1 ⋅ ≈ 0.177 9 4 Aufgabenblock 3 4 Die Kovarianz ist nur hinsichtlich ihres Vorzeichens, nicht hinsichtlich ihrer Größe interpretierbar. Letzteres leistet die Pearson-Korrelation, welche somit besser als Maß für den Zusammenhang von X und Y geeignet ist. Sie ist im Gegensatz zur Kovarianz auch invariant gegenüber linearen Transformationen der beiden Zufallsvariablen. Betrachten wir nun die Zufallsvariable Z = 3*X+2: 2 Var ( Z ) = Var (3 ⋅ X + 2) = 9Var ( X ) = 9 ⋅ = 2 → Std ( Z ) = 2 9 Cov(Y , Z ) = Cov(Y ,3 X + 2) = 3Cov(Y , X ) ≈ 3 ⋅ 0.177 = 0.531 Cov(Y , Z ) 0.531 Kor (Y , Z ) = ≈ ≈ 0.75 Std (Y ) ⋅ Std ( Z ) 1 ⋅ 2 2 Man sieht, dass die Korrelation von Y mit einer linearen Transformation von X genau so groß ist wie die Korrelation von Y und X selbst. Dies wird im Folgenden noch mal gezeigt: Kor (Y , Yˆ ) = Kor (Y , aX + b) = Cov(Y , aX + b) a ⋅ Cov(Y , X ) = = Kor (Y , X ) Std (Y ) Std (aX + b) Std (Y ) ⋅ a ⋅ Std ( X ) Zum Schluss: Var ( X + Y ) = Var ( X ) + Var (Y ) + 2Cov( X , Y ) 2 1 ≈ + + 2 ⋅ 0.177 = 0.826 9 4 Aufgabenblock 3 5