Lösung 10

Dr. Marcel Dettling
Dr. Daniel Haase
[email protected]
14.05.2010
FS 2010
Grundlagen der Mathematik II (LVA 401-0622-00 U)
Lösung 10
Zur Übungsstunde vom 14.05.2010
Aufgabe 28 (Die Gleichverteilung)
(a) Die Wahrscheinlichkeitsfunktion für die Zufallsvariable X = Anzahl der geworfenen Augen mit einem
”
regulären Würfel“ ist eine Uniform-Verteilung. Nun wird ein solcher regulärer Würfel aber 2x geworfen
und Y = Summe der Augenzahlen aus den beiden Würfen“. Es handelt sich nun nicht mehr um eine
”
Uniform-Verteilung. Bestimme und zeichne die entsprechende diskrete Wahrscheinlichkeitsfunktion.
auf. Beachte dass die Summe über alle Wahrscheinlichkeiten gleich Eins sein muss.
(b) Nun haben wir es mit einem gefälschten Würfel zu tun. Er ist so gefälscht, dass die Wahrscheinlichkeit
für eine bestimmte Augenzahl umgekehrt proportional zur Augenzahl ist. Es sei nun X = Anzahl
”
der geworfenen Augen“. Bestimme und zeichne die entsprechende Wahrscheinlichkeitsfunktion. Der
gefälschte Würfel wird nun 2x geworfen. Bestimme und zeichne die Wahrscheinlichkeitsverteilung für
Y = Summe der Augenzahlen aus den beiden Würfen“.
”
(c) Ein auf der Strasse gefundener Franken ist leicht verbogen. Er wird 10mal geworfen, und das dreimal
hintereinander. Die Würfe lauten
KZZKKZZZKK ,
KZZZZZZZZZ , ZZZZZZZZZZ .
Berechne die relative Häufigkeit der Kopf-Würfe separat für die drei Folgen. Danach berechne die
Wahrscheinlichkeit für diese Folgen unter der Annahme, dass die Münze fair ist (also 50% Wahrscheinlichkeit für Kopf), und dann unter der Annahme, dass der Kopf eine Wahrscheinlichkeit von
nur 0.4 besitzt. Beachte dass es hier auf die korrekte Reihenfolge ankommt.
Lösung
Zu a): Da nur die Augensumme gezäht wird sind die möglichen Ergebnisse 2, 3, 4, . . . , 12, die haben allerdings
unterschiedliche Wahrscheinlichkeiten, weil die Augensumme 3 beispielsweise durch die Würfe (1, 2) und (2, 1)
erreicht werden kann, die Summe 2 aber nur durch den einzigen Wurf (1, 1). Jedes Paar (x1 , x2 ) hat die gleiche
Wahrscheinlichkeit (weil x1 und x2 jeweils uniform verteilt sind). Da es 6 · 6 = 36 mögliche Paare gibt, ist die
1
Einzelwahrscheinlichkeit für jedes Paar 36
≈ 0.277. Wir zählen wieviele Paare zu einer gegebenen Augensumme
führen:
Wert von Y
Ergebnisse von (X1 , X2 ) zu Y
Wahrscheinlichkeit
2 Augen
(1, 1)
P (Y = 2) =
1
36
3 Augen
(1, 2), (2, 1)
P (Y = 3) =
2
36
4 Augen
(1, 3), (2, 2), (3, 1)
P (Y = 4) =
3
36
5 Augen
(1, 4), (2, 3), (3, 2), (4, 1)
P (Y = 5) =
4
36
6 Augen
(1, 5), (2, 4), (3, 3), (4, 2), (5, 1)
P (Y = 6) =
5
36
7 Augen
(1, 6), (2, 5), (3, 4), (4, 3), (5, 2), (6, 1)
P (Y = 7) =
6
36
8 Augen
(2, 6), (3, 5), (4, 4), (5, 3), (6, 2)
P (Y = 8) =
5
36
9 Augen
(3, 6), (4, 5), (5, 4), (6, 3)
P (Y = 9) =
4
36
10 Augen
(4, 6), (5, 5), (6, 4)
P (Y = 10) =
3
36
11 Augen
(5, 6), (6, 5)
P (Y = 11) =
2
36
12 Augen
(6, 6)
P (Y = 12) =
1
36
Als Histogramm:
Zu b): Hier müssen wir zuerst die nicht-uniforme Verteilung von X bestimmen, der Anzahl der Augen eines
Wurfes mit einem (gefälschten) Würfel. Laut Aufgabe soll sie antiproportional zur Augenzahl sein, also P (X =
k) = c · k1 für eine unbekannte Konstante c. Die ist dann aber durch die Normierungsbedingung P (Alles) = 1
festgelegt, wie in in Aufgabe 27 nur dass wir hier mit Summen statt Integralen arbeiten. Die Summe über alle
möglichen Ergebnisse des Wurfes ist
6
6
X
X
c
1 1 1 1 1 1
P (Alles) =
P (X = k) =
= c·
+ + + + +
k
1 2 3 4 5 6
k=1
k=1
60 + 30 + 20 + 15 + 12 + 10
147
= c·
= c·
= c · 2.45 .
60
60
60
≈ 0.408 einsetzen. Damit steht
Damit die Gesamtwahrscheinlichkeit Eins ist, müssen wir den Kehrwert c = 147
die Verteilung des gefälschten Würfels fest:
c
c
c
P (X = 1) =
= 0.408 , P (X = 2) =
= 0.204 , P (X = 3) =
= 0.136 ,
1
2
3
c
c
c
P (X = 4) =
= 0.102 , P (X = 5) =
= 0.081 , P (X = 6) =
= 0.068 .
4
5
6
Als Histogramm also
Aus dieser Verteilung berechnen wir wieder die Doppelwurf-Verteilung für Y , jetzt sind aber nicht mehr alle
Paare (x1 , x2 ) gleichwahrscheinlich, wir müssen die Summen aus Teil (a) weiter auftrennen. Dazu überlegt man
sich, dass wegen der Unabhängigkeit der Würfe gelten muss
P (Paar (x1 , x2 ) gewürfelt) = P (X1 = x1 und X2 = x2 ) = P (X = x1 ) · P (X = x2 )
=
c
c
1
·
= 0.1664 ·
.
x1 x2
x1 · x2
Für jede mögliche Augenzahl müssen wir die verschiedenen Wahrscheinlichkeiten über die Einzelpaare aufaddieren:
Wert von Y
Ergebnisse von (X1 , X2 ) zu Y
Wahrscheinlichkeit
2 Augen
(1, 1)
P (Y = 2) = c2 · 1
= 0.166
3 Augen
(1, 2), (2, 1)
P (Y = 3) = c2 · ( 21 + 12 )
= 0.166
4 Augen
(1, 3), (2, 2), (3, 1)
P (Y = 4) = c2 · ( 31 +
1
4
+ 31 )
= 0.152
5 Augen
(1, 4), (2, 3), (3, 2), (4, 1)
P (Y = 5) = c2 · ( 41 +
1
6
+
1
6
+ 14 )
6 Augen
(1, 5), (2, 4), (3, 3), (4, 2), (5, 1)
P (Y = 6) = c2 · ( 15 +
1
8
+
1
9
+
7 Augen
(1, 6), (2, 5), (3, 4), (4, 3), (5, 2), (6, 1) P (Y = 7) = c2 · ( 16 +
8 Augen
(2, 6), (3, 5), (4, 4), (5, 3), (6, 2)
1
P (Y = 8) = c2 · ( 12
+
1
15
+
1
16
+
1
15
9 Augen
(3, 6), (4, 5), (5, 4), (6, 3)
1
P (Y = 9) = c2 · ( 18
+
1
20
+
1
20
+
1
18 )
10 Augen
(4, 6), (5, 5), (6, 4)
1
P (Y = 10) = c2 · ( 24
+
1
25
11 Augen
(5, 6), (6, 5)
1
P (Y = 11) = c2 · ( 30
+
1
30 )
12 Augen
(6, 6)
P (Y = 12) = c2 ·
Als Histogramm:
1
36
1
10
1
12
+
+
1
8
= 0.138
+ 51 )
+
1
24 )
1
12
+
= 0.126
1
10
+
+ 16 )
1
12 )
= 0.116
= 0.060
= 0.035
= 0.020
= 0.011
= 0.005
Zu c): Die relative Häufigkeit der Kopf-Würfe ist einfach deren Anzahl geteilt durch die Gesamtzahl der Würfe:
5
= 0.5
10
1
= 0.1
Folge KZZZZZZZZZ : h =
10
0
Folge ZZZZZZZZZZ : h =
= 0.0
10
Diese Häufigkeiten sind als Aussage grundsätzlich verschieden von den Wahrscheinlichkeiten für das Auftreten dieser Würfe: Es sei X = (X1 , . . . , X10 ) die Zufallsvariable die eine Wurffolge beschreibt, und Xj die
Zufallsvariable mit Werten {0, 1} mit X = 1 für Kopf im j-ten Wurf. Dann ist bei einer fairen Münze
P (Xj = 0) = P (Xj = 1) = 21 , und wegen der Unabhängigkeit der Einzelwürfe folglich
Folge KZZKKZZZKK
:
h =
P (X = (x1 , . . . , x10 )) = P (X1 = x1 und X2 = x2 und . . . und X10 = x10 )
1 1
1
1
· ··· =
= 0.00097 .
2 2
2
1024
Dabei ist es ganz egal welche Werte wir in die Zielwerte xj schreiben, weil Kopf und Zahl in jedem Einzelwurf
1
die gleiche Wahrscheinlichkeit haben. Jede der drei Wurffolgen hat also die gleiche Wahrscheinlichkeit 1024
.
Jetzt nehmen wir an, dass die Münze nicht fair ist mit Kopf-Wahrscheinlichkeit P (Xj = 1) = 0.4 und dem
Gegenereignis Zahl P (Xj = 0) = 0.6 in einem Einzelwurf. Dann haben wir für die drei Folgen:
= P (X1 = x1 ) · P (X2 = x2 ) · · · P (X10 = x10 ) =
P (X = (KZZKKZZZKK))
=
0.45 · 0.65 = 0.00079
P (X = (KZZZZZZZZZ))
=
0.41 · 0.69 = 0.004
P (X = (ZZZZZZZZZZ))
=
0.610 = 0.006 .
Hier ist es also wahrscheinlicher, eine Folge mit hohem Zahl-Anteil zu bekommen.
Aufgabe 29 (Die Binomialverteilung)
(a) Wie hoch ist die Wahrscheinlichkeit, mit einer fairen Münze bei 5 Würfen genau zweimal Kopf zu
werfen?
(b) Wie hoch ist die Wahrscheinlichkeit, mit einer unfairen Münze (Kopf hat Wahrscheinlichkeit 0.4) bei
5 Würfen höchstens zweimal Kopf zu werfen?
(c) Wie hoch ist die Wahrscheinlichkeit, genau 500mal Kopf zu werfen wenn man 1000mal werfen darf?
Beantworte die Frage für den Fall dass die Münze fair ist (also echte 50%-Chance auf Kopf), und
dass sie unfair ist (Wahrscheinlichkeit nur 0.4 für den Kopf). Bearbeite diese Frage nicht per Hand,
sondern verwende Mathematica: der Zufallsvariablen X ordnet man die Binomialverteilung B(n, p) zu
mit dem Kommando X = BinomialDistribution[n,p], danach kann man mit PDF[X][k] die Wahrscheinlichkeit P (X = k) abfragen.
(d) Wie hoch ist bei einer fairen Münze die Wahrscheinlichkeit, bei 1’000’000’000 Würfen höchstens
500’000’000 mal den Kopf zu erhalten?
Lösung
Die Binomialverteilung misst die Wahrscheinlichkeit eine Anzahl von Erfolgen zu erzielen wie beim Münzwurf,
nur dass es nicht mehr auf die Reihenfolge der einzelnen Würfe ankommt. Beim Münzwurf fallen beispielsweise
die Ergebnisse KZZZZZZZZZ und ZZZZZZZZZK zusammen. Ist die Erfolgswahrscheinlichkeit im Wurf
p ∈ [0, 1], so ist die geordnete Erfolgswahrscheinlichkeit für die Folge von n Würfen pk (1 − p)n−k , genau k
Erfolge in n Würfen zu haben. Jetzt fallen alle Sortierungen der Folge zu einem einzigen Ereignis zusammen,
es gibt
n
n!
=
k!(n − k)!
k
Möglichkeiten die Folge anzuordnen wenn k Erfolge und n − k Fehlschläge zu sortieren sind. Daher ist die
Binomialverteilung gegeben durch
n k
X ∼ B(n, p) , P (X = k) =
p (1 − p)n−k .
k
Zu a): Bei einer fairen Münze ist p = (1 − p) = 21 , also haben wir
5
5!
P (X = 2) =
· 0.52 · 0.53 =
· 0.55 = 0.3125 .
2
2! · 3!
Zu b): Bei der unfairen Münze haben wir p = 0.4 Erfolgswahrscheinlichkeit, und 1 − p = 0.6 Fehlschlagswahrscheinlichkeit. Die Wahrscheinlichkeit höchstens zweimal Kopf zu bekommen ist
2 X
5
P (X ≤ 2) = P (X = 0) + P (X = 1) + P (X = 2) =
· 0.4k · 0.65−k
k
k=0
= 1 · 0.40 · 0.65 + 5 · 0.41 · 0.64 + 10 · 0.42 · 0.63 = 0.68256 .
Zu c): Diese Werte berechnet Mathematica natürlich nicht mit den Binomialkoeffizienten (die werden für n ≥ 10
so groß dass man nicht mehr anständig damit rechnen kann, sondern mit einer ausgefeilten Näherungsformel.
Für die unfaire Münze gibt Mathematica einen Wert aus der annähernd Null ist, bei der fairen Münze dagegen
den Wert PDF[X][500]=0.025. Diese Chance von ca. 2% ist überraschend hoch wenn man bedenkt dass es sich
um ein Einzelergebnis unter 21000 möglichen Wurffolgen handelt. Das liegt daran, dass die Wurffolge bei der
Binomialverteilung ungeordnet ist, und die geringe Einzelwahrscheinlichkeit durch die extrem hohe Anzahl an
möglichen Umordnungen kompensiert wird (ein ähnlicher Kompensationseffekt findet im Teil a) der vorigen
Aufgabe in der Tabelle für Y statt). Bei der unfairen Münze versagt die Kompensation (wie in Teil b) der
vorigen Aufgabe), bei tausend Würfen dominiert die Verzerrung richtung Zahl einfach zu sehr.
Zu d): Hier kann man auch Mathematica fragen, die analytische Näherung für B(n, p) ist so effizient, dass
auch diese großen Werte problemlos verarbeitet werden. Mit ein wenig Nachdenken kommen man aber auch
ohne Rechnung darauf, dass die Wahrscheinlichkeit ≈ 12 sein muss, weil die Beschreibung aus der Aufgabe
genau die Hälfte der ungeordneten Wurffolgen beschreibt. Die hat dann auch nach der Zusammenfassung zu
den ungeordneten Ereignissen die Wahrscheinlichkeit 21 . Das der Wahrscheinlichkeitswert den Mathematica hier
produziert nicht exakt .5 ist liegt daran, dass 1000000000 eine gerade Zahl ist: ein Ereignis liegt genau auf der
Mitte, und man kann es leider nicht zerteilen.
Aufgabe 30 (Eine Korrelation)
Lade den Datensatz zur Serie 10 von der Homepage, und bearbeite dann die folgenden Aufgaben mit Mathematica:
(a) Auftrennung der Blumensorten: Sind es die Sepal- oder die Petalblätter, welche die verschiedenen
Blumensorten am besten unterscheiden können? Probiere zur Beantwortung dieser Frage alle 4 quantitativen Variablen einzeln mit einem geeigneten Plot durch.
(b) Scatterplot der Sepalblätter: Erstelle einen Scatterplot von Länge und Breite der Sepalblätter, ohne
Regressions- und Glättungsgerade.
(c) Separate Scatterplots: Nun drei separate Scatterplots jeweils für die drei Blumensorten, indem Du die
Stichprobe auftrennst.
(d) Berechnung der Korrelation: Berechne die Korrelation zwischen Länge und Breite der Sepalblätter
sowohl mit der Methode von Pearson, wie auch mit der Methode von Spearman, über die gesamte
Stichprobe.
(e) Berechnen die Korrelation zwischen Länge und Breite für jede einzelne Blumensorte.
Die Datensätze beschreiben die Längen und Breiten der verschiedenen Blatttypen dreier Blumensorten. Ziel ist
es, Anhand der Blatteigenschaften die Art der Blume zu bestimmen.
Die Struktur der Datensätze ist:
(1)
(2)
(3)
(4)
(5)
Sepal (Länge)
Sepal (Breite)
Petal (Länge)
Petal (Breite)
Blumensorte
Lösung
Vergleiche das NB-File auf der Homepage.
(a) Die vier Plots der Variablen jeweils mit der Sorte zeigen, dass die Petalblätter durch die Sorte stärker
beeinflusst werden als die Sepalblätter, wobei es nicht viel Unterschied macht ob man die Länge oder
Breite verwendet.
(b) Die drei Scatterplots der Sepalblätter sind für die drei Sorten ziemlich ähnlich.
(c) Die Pearson-Korrelation zwischen Sepalbreite und Sepallänge über alle Sorten ist %P = −0.11757, das
ist sehr gering. Das verwundert da die Breite und die Länge eines Blattes normalerweise voneinander
abhängen. Die Spearman-Korrelation zwischen Sepalbreite und Sepallänge über alle Sorten ist mit
%P = −0.16677 nur wenig besser.
(d) Mit ρ1 = 0.7425 ist der Korrelationskoeffizient der Sepalblätter der Sorte 1 recht hoch, auch ρ2 =
0.5259 für die zweite Sorte ist gut, ebenso ρ3 = 0.4572. Alle drei Werte liegen weit über der Korrelation
über die gesamte Stichprobe, d. h. die Blättlängen und Blattbreiten hängen schon stark voneinander
ab, nur ist die Art des Zusammenhangs bei jeder Sorte anders. Bei der Korrelationsprobe über die
gesamte Stichprobe ist das aber nicht mehr erkennbar.