Aufgabenblock 3 (PDF

Werbung
Aufgabenblock 3
Aufgabe 1)
A sei das Ereignis: schwerer Verkehrsunfall
B sei das Ereignis: „Alkohol ist im Spiel“
Herr Walker betrachtet die Wahrscheinlichkeit P(B|A) = 0.3 und errechnet daraus
P(-B|A) = 1 – 0.3 = 0.7. Dieses Ereignis –B|A ist aber gar nicht interessant für die Frage, ob
man
betrunken
fahren
sollte
sondern
vielmehr
umgekehrt:
Wie
groß
ist
die
Wahrscheinlichkeit einen Verkehrsunfall zu haben, gegeben Alkohol: also P(A|B)? Diese
Wahrscheinlichkeit ist aus den angegebenen Fakten jedoch nicht zu berechnen. Nur wenn die
Wahrscheinlichkeit P(A|B) kleiner wäre als P(A|-B), sollte man besser mit Alkohol Auto
fahren.
Aufgabe 2)
Durch zählen erhält man
P(A) = 10 / 36
P(C) = 18 / 36
und
P(A∩B) = 3 / 36
3
P( A ∩ B) 36 3
P( B | A) =
=
= .
10 10
P( A)
36
Somit ist
P ( A | A) =
P(B) = 3 / 36
P( A ∩ A)
= 1 ≠ P ( A) . A ist also von A stochastisch abhängig.
P( A)
P( A | B) = 1 ≠
10
= P( A) . A und B sind stochastisch abhängig.
36
4
P ( A ∩ C ) 36 4
P( A | C ) =
=
= ≠ P( A) . A und C sind ebenfalls stochastisch abhängig.
10 10
P( A)
36
Aufgabe 3)
Die Menge der Männer und die Menge der Frauen sind paarweise disjunkt und schöpfen Ω
aus. Nach dem Satz der totalen Wahrscheinlichkeit gilt dann:
P(klinischer Bereich)
= P(klinischer Bereich | Mann) ⋅ P( Mann) + P( klinischer Bereich | Frau ) ⋅ P( Frau )
21
53
= 0.46 ⋅ + 0.34 ⋅ ≈ 0.374
74
74
Aufgabenblock 3
1
Und da
P (klinischer Bereich | Mann) ≠ P(klinischer Bereich)
sind Geschlecht und das Ereignis, dass ein zufällig ausgewählter angehender Psychologe in
den klinischen Bereich will, stochastisch abhängig.
Aufgabe 4)
Die erste Aussage ist richtig, wie man an der Produktformel für stochastisch unabhängige
Ereignisse sehen kann: Unabhängigkeit gilt genau dann, wenn P ( A ∩ B ) = P ( A) ⋅ P ( B ) gilt.
Da nach Definition P( A ∩ B) = P( B ∩ A) ist, kommt es bei stochastischer Unabhängigkeit
nicht auf die Reihenfolge an. Demzufolge auch nicht bei stochastischer Abhängigkeit.
Die zweite Aussage ist richtig, da die stochastische Abhängigkeit immer im
„Familienverbund“ auftritt.
Die dritte Aussage ist richtig für alle Ereignisse, die nicht die Wahrscheinlichkeit 1 haben. Es
gilt immer P(A|A) = 1. Ω ist hingegen von sich selbst unabhängig.
Die vierte Aussage ist richtig für alle Ereignisse, die nicht die Wahrscheinlichkeit Null haben.
Es gilt immer P(A| -A) = 0.
Die fünfte Aussage ist nicht richtig. P(A| Ω) = P(A)
Aufgabe 5)
P(positiv | infiziert) = 0.99, P(negativ | gesund) = 0.98 und P(infiziert) = 0.0007.
Da man entweder infiziert ist oder nicht kann man den Satz von Bayes anwenden.
P( positiv | infiziert ) ⋅ P(infiziert )
P( positiv | infiziert ) ⋅ P (infiziert ) + P( positiv | gesund ) ⋅ P( gesund )
0.99 ⋅ 0.0007
=
≈ 0.0335
0.99 ⋅ 0.0007 + (1 − 0.98) ⋅ (1 − 0.0007)
P (infiziert | positiv) =
Das bedeutet, dass trotz positiver Testung das Risiko der Infektion überraschend gering ist.
Der Grund liegt in der sehr niedrigen Quote der Infizierten überhaupt, so dass falscher Alarm
des Testes insgesamt viel häufiger vorkommt also korrekte Infektionsmeldungen.
Aufgabe 6)
Wir gehen von einem Jahr mit 365 Tagen aus und die Berechnung erfolgt mit der
Gegenwahrscheinlichkeit. A sei dass Ereignis, dass mindestens ein Doppelgeburtstag dabei
ist.
Aufgabenblock 3
2
P ( A) = 1 − P(− A) = 1 −
365 364 363
341
⋅
⋅
⋅ ... ⋅
≈ 0.569
365 365 365
365
Dabei wird verwendet, dass die Geburtstage verschiedener Personen nichts miteinander zu tun
haben, also stochastisch unabhängig sind.
Aufgabe 7)
z115 =
115 − 100
= 1.5
10
P ( A) = 1 − FN ( z115 ) = 1 − FN (1.5) = 1 − 0.9332 ≈ 0.0668
z120 =
120 − 100
80 − 100
= −2
= 2 und z80 =
10
10
P ( B) = FN ( z120 ) − FN ( z80 ) = FN (2) − FN (−2) = FN (2) − (1 − FN (2))
= FN (2) − 1 + FN (2) = 2 FN (2) − 1 ≈ 2 ⋅ 0.9772 − 1 = 0.954
0.1 = FN ( zu ) = 1 − FN (− zu ) ↔ 1 − 0.1 = 0.9 = FN (− zu )
Tabelle :
− zu ≈ 1.28 ↔ zu = −1.28
außerdem ist
FN ( zo ) = 0.9 = FN (− zu ) → zo ≈ 1.28
1.28 ≈ zo =
xo − 100
↔ xo ≈ 112.8
10
−1.28 ≈ zu =
xu − 100
↔ xu ≈ 87.2
10
Normale Leute haben eine Intelligenz zwischen ungefähr 87.2 und 112.8.
P ( A ∩ B) = FN ( z120 ) − FN ( z115 ) = 0.9772 − 0.9332 = 0.044
Somit ist
P( A | B) =
P( A ∩ B) 0.044
≈
≈ 0.658
P ( A)
0.0668
und da Geschlecht und Intelligenz unabhängig ist P(A| weiblich) = P(A) = 0.0668.
Merkmale, die stochastisch abhängig von der Intelligenz sein sollten sind z. B. Schulnoten,
Bildungsabschluss usw.
E(Z) = E(X + Y) = E (X) + E (Y) = 100 + 50 = 150
Kor ( X , Y ) =
Cov( X , Y )
↔ Cov( X , Y ) = Kor ( X , Y ) ⋅ Std ( X ) ⋅ Std (Y )
Std ( X ) ⋅ Std (Y )
Aufgabenblock 3
3
Var ( Z ) = Var ( X + Y ) = Var ( X ) + Var (Y ) + 2 ⋅ Cov( X , Y ) =
= Var ( X ) + Var (Y ) + 2 ⋅ Kor ( X , Y ) ⋅ Std ( X ) ⋅ Std (Y ) =
= 100 + 25 + 2 ⋅ 0.85 ⋅10 ⋅ 5 = 210
Aufgabe 8)
Die Aufgabe ist nicht ganz präzise formuliert. Es wird einmal von Haushalte und dann von
Personen gesprochen. Wir setzen der Einfachheit halber Personen und Haushalte gleich (um
es ganz korrekt zu machen, kann man sich vom statistischen Bundesamt die durchschnittliche
Anzahl von Personen pro Haushalt besorgen und alle Personenzahlen in Haushalte
umrechnen).
Wir benutzen die Poissonverteilung mit µ = 2.5 und X die Anzahl der Fernseher, die pro 1000
Haushalte kaputt gehen. Die gesuchte Wahrscheinlichkeit P(X > 5) = 1- P(X≤ 5)
P ( X > 5) = 1 − P( X ≤ 5) = 1 − ( P ( X = 0) + P ( X = 1) + ... + P ( X = 5) ) =
1 − P( X = 0) − P ( X = 1) − ... − P( X = 5) = 1 −
2.50 2.5
2.55 2.5
⋅ e − ... −
⋅ e ≈ 0.042
0!
5!
Für eine Millionenstadt ist die Anzahl der zu erwartenden kaputten Fernseher 1000*2.5 =
2500. Dies folgt wieder nach der Formel für den Erwartungswert einer Summe von
Zufallsvariablen, wobei die Millionenstadt einfach die Summe aus 1000 der eben betrachteten
Städten darstellt.
1000
1000
i =1
i =1
E (Y ) = ∑ E ( X ) = ∑ 2.5 = 1000 ⋅ 2.5 = 2500
Aufgabe 9)
2
2
1 1
E ( X ) = ∑ xi ⋅ P ( X = xi ) = 0 ⋅ + 1 ⋅ =
3
3 3
i =1
2
1
1 1
E (Y ) = ∑ yi ⋅ P(Y = yi ) = 0 ⋅ + 1⋅ =
2
2 2
i =1
2
1 2 4 1 2
Var ( X ) = ∑ ( xi − E ( X )) 2 ⋅ P( X = xi ) = ⋅ + ⋅ =
9 3 9 3 9
i =1
2
1 1 1 1 1
Var (Y ) = ∑ ( yi − E (Y )) 2 ⋅ P(Y = yi ) = ⋅ + ⋅ =
4 2 4 2 4
i =1
Kor ( X , Y ) =
Cov( X , Y )
↔ Cov( X , Y ) = Kor ( X , Y ) ⋅ Std ( X ) ⋅ Std (Y )
Std ( X ) ⋅ Std (Y )
Cov( X , Y ) = 0.75 ⋅
2 1
⋅
≈ 0.177
9 4
Aufgabenblock 3
4
Die Kovarianz ist nur hinsichtlich ihres Vorzeichens, nicht hinsichtlich ihrer Größe
interpretierbar. Letzteres leistet die Pearson-Korrelation, welche somit besser als Maß für den
Zusammenhang von X und Y geeignet ist. Sie ist im Gegensatz zur Kovarianz auch invariant
gegenüber linearen Transformationen der beiden Zufallsvariablen.
Betrachten wir nun die Zufallsvariable Z = 3*X+2:
2
Var ( Z ) = Var (3 ⋅ X + 2) = 9Var ( X ) = 9 ⋅ = 2 → Std ( Z ) = 2
9
Cov(Y , Z ) = Cov(Y ,3 X + 2) = 3Cov(Y , X ) ≈ 3 ⋅ 0.177 = 0.531
Cov(Y , Z )
0.531
Kor (Y , Z ) =
≈
≈ 0.75
Std (Y ) ⋅ Std ( Z ) 1 ⋅ 2
2
Man sieht, dass die Korrelation von Y mit einer linearen Transformation von X genau so groß
ist wie die Korrelation von Y und X selbst. Dies wird im Folgenden noch mal gezeigt:
Kor (Y , Yˆ ) = Kor (Y , aX + b) =
Cov(Y , aX + b)
a ⋅ Cov(Y , X )
=
= Kor (Y , X )
Std (Y ) Std (aX + b) Std (Y ) ⋅ a ⋅ Std ( X )
Zum Schluss:
Var ( X + Y ) = Var ( X ) + Var (Y ) + 2Cov( X , Y )
2 1
≈ + + 2 ⋅ 0.177 = 0.826
9 4
Aufgabenblock 3
5
Herunterladen