Lösung 10

Werbung
Dr. Marcel Dettling
Dr. Daniel Haase
[email protected]
14.05.2010
FS 2010
Grundlagen der Mathematik II (LVA 401-0622-00 U)
Lösung 10
Zur Übungsstunde vom 14.05.2010
Aufgabe 28 (Die Gleichverteilung)
(a) Die Wahrscheinlichkeitsfunktion für die Zufallsvariable X = Anzahl der geworfenen Augen mit einem
”
regulären Würfel“ ist eine Uniform-Verteilung. Nun wird ein solcher regulärer Würfel aber 2x geworfen
und Y = Summe der Augenzahlen aus den beiden Würfen“. Es handelt sich nun nicht mehr um eine
”
Uniform-Verteilung. Bestimme und zeichne die entsprechende diskrete Wahrscheinlichkeitsfunktion.
auf. Beachte dass die Summe über alle Wahrscheinlichkeiten gleich Eins sein muss.
(b) Nun haben wir es mit einem gefälschten Würfel zu tun. Er ist so gefälscht, dass die Wahrscheinlichkeit
für eine bestimmte Augenzahl umgekehrt proportional zur Augenzahl ist. Es sei nun X = Anzahl
”
der geworfenen Augen“. Bestimme und zeichne die entsprechende Wahrscheinlichkeitsfunktion. Der
gefälschte Würfel wird nun 2x geworfen. Bestimme und zeichne die Wahrscheinlichkeitsverteilung für
Y = Summe der Augenzahlen aus den beiden Würfen“.
”
(c) Ein auf der Strasse gefundener Franken ist leicht verbogen. Er wird 10mal geworfen, und das dreimal
hintereinander. Die Würfe lauten
KZZKKZZZKK ,
KZZZZZZZZZ , ZZZZZZZZZZ .
Berechne die relative Häufigkeit der Kopf-Würfe separat für die drei Folgen. Danach berechne die
Wahrscheinlichkeit für diese Folgen unter der Annahme, dass die Münze fair ist (also 50% Wahrscheinlichkeit für Kopf), und dann unter der Annahme, dass der Kopf eine Wahrscheinlichkeit von
nur 0.4 besitzt. Beachte dass es hier auf die korrekte Reihenfolge ankommt.
Lösung
Zu a): Da nur die Augensumme gezäht wird sind die möglichen Ergebnisse 2, 3, 4, . . . , 12, die haben allerdings
unterschiedliche Wahrscheinlichkeiten, weil die Augensumme 3 beispielsweise durch die Würfe (1, 2) und (2, 1)
erreicht werden kann, die Summe 2 aber nur durch den einzigen Wurf (1, 1). Jedes Paar (x1 , x2 ) hat die gleiche
Wahrscheinlichkeit (weil x1 und x2 jeweils uniform verteilt sind). Da es 6 · 6 = 36 mögliche Paare gibt, ist die
1
Einzelwahrscheinlichkeit für jedes Paar 36
≈ 0.277. Wir zählen wieviele Paare zu einer gegebenen Augensumme
führen:
Wert von Y
Ergebnisse von (X1 , X2 ) zu Y
Wahrscheinlichkeit
2 Augen
(1, 1)
P (Y = 2) =
1
36
3 Augen
(1, 2), (2, 1)
P (Y = 3) =
2
36
4 Augen
(1, 3), (2, 2), (3, 1)
P (Y = 4) =
3
36
5 Augen
(1, 4), (2, 3), (3, 2), (4, 1)
P (Y = 5) =
4
36
6 Augen
(1, 5), (2, 4), (3, 3), (4, 2), (5, 1)
P (Y = 6) =
5
36
7 Augen
(1, 6), (2, 5), (3, 4), (4, 3), (5, 2), (6, 1)
P (Y = 7) =
6
36
8 Augen
(2, 6), (3, 5), (4, 4), (5, 3), (6, 2)
P (Y = 8) =
5
36
9 Augen
(3, 6), (4, 5), (5, 4), (6, 3)
P (Y = 9) =
4
36
10 Augen
(4, 6), (5, 5), (6, 4)
P (Y = 10) =
3
36
11 Augen
(5, 6), (6, 5)
P (Y = 11) =
2
36
12 Augen
(6, 6)
P (Y = 12) =
1
36
Als Histogramm:
Zu b): Hier müssen wir zuerst die nicht-uniforme Verteilung von X bestimmen, der Anzahl der Augen eines
Wurfes mit einem (gefälschten) Würfel. Laut Aufgabe soll sie antiproportional zur Augenzahl sein, also P (X =
k) = c · k1 für eine unbekannte Konstante c. Die ist dann aber durch die Normierungsbedingung P (Alles) = 1
festgelegt, wie in in Aufgabe 27 nur dass wir hier mit Summen statt Integralen arbeiten. Die Summe über alle
möglichen Ergebnisse des Wurfes ist
6
6
X
X
c
1 1 1 1 1 1
P (Alles) =
P (X = k) =
= c·
+ + + + +
k
1 2 3 4 5 6
k=1
k=1
60 + 30 + 20 + 15 + 12 + 10
147
= c·
= c·
= c · 2.45 .
60
60
60
≈ 0.408 einsetzen. Damit steht
Damit die Gesamtwahrscheinlichkeit Eins ist, müssen wir den Kehrwert c = 147
die Verteilung des gefälschten Würfels fest:
c
c
c
P (X = 1) =
= 0.408 , P (X = 2) =
= 0.204 , P (X = 3) =
= 0.136 ,
1
2
3
c
c
c
P (X = 4) =
= 0.102 , P (X = 5) =
= 0.081 , P (X = 6) =
= 0.068 .
4
5
6
Als Histogramm also
Aus dieser Verteilung berechnen wir wieder die Doppelwurf-Verteilung für Y , jetzt sind aber nicht mehr alle
Paare (x1 , x2 ) gleichwahrscheinlich, wir müssen die Summen aus Teil (a) weiter auftrennen. Dazu überlegt man
sich, dass wegen der Unabhängigkeit der Würfe gelten muss
P (Paar (x1 , x2 ) gewürfelt) = P (X1 = x1 und X2 = x2 ) = P (X = x1 ) · P (X = x2 )
=
c
c
1
·
= 0.1664 ·
.
x1 x2
x1 · x2
Für jede mögliche Augenzahl müssen wir die verschiedenen Wahrscheinlichkeiten über die Einzelpaare aufaddieren:
Wert von Y
Ergebnisse von (X1 , X2 ) zu Y
Wahrscheinlichkeit
2 Augen
(1, 1)
P (Y = 2) = c2 · 1
= 0.166
3 Augen
(1, 2), (2, 1)
P (Y = 3) = c2 · ( 21 + 12 )
= 0.166
4 Augen
(1, 3), (2, 2), (3, 1)
P (Y = 4) = c2 · ( 31 +
1
4
+ 31 )
= 0.152
5 Augen
(1, 4), (2, 3), (3, 2), (4, 1)
P (Y = 5) = c2 · ( 41 +
1
6
+
1
6
+ 14 )
6 Augen
(1, 5), (2, 4), (3, 3), (4, 2), (5, 1)
P (Y = 6) = c2 · ( 15 +
1
8
+
1
9
+
7 Augen
(1, 6), (2, 5), (3, 4), (4, 3), (5, 2), (6, 1) P (Y = 7) = c2 · ( 16 +
8 Augen
(2, 6), (3, 5), (4, 4), (5, 3), (6, 2)
1
P (Y = 8) = c2 · ( 12
+
1
15
+
1
16
+
1
15
9 Augen
(3, 6), (4, 5), (5, 4), (6, 3)
1
P (Y = 9) = c2 · ( 18
+
1
20
+
1
20
+
1
18 )
10 Augen
(4, 6), (5, 5), (6, 4)
1
P (Y = 10) = c2 · ( 24
+
1
25
11 Augen
(5, 6), (6, 5)
1
P (Y = 11) = c2 · ( 30
+
1
30 )
12 Augen
(6, 6)
P (Y = 12) = c2 ·
Als Histogramm:
1
36
1
10
1
12
+
+
1
8
= 0.138
+ 51 )
+
1
24 )
1
12
+
= 0.126
1
10
+
+ 16 )
1
12 )
= 0.116
= 0.060
= 0.035
= 0.020
= 0.011
= 0.005
Zu c): Die relative Häufigkeit der Kopf-Würfe ist einfach deren Anzahl geteilt durch die Gesamtzahl der Würfe:
5
= 0.5
10
1
= 0.1
Folge KZZZZZZZZZ : h =
10
0
Folge ZZZZZZZZZZ : h =
= 0.0
10
Diese Häufigkeiten sind als Aussage grundsätzlich verschieden von den Wahrscheinlichkeiten für das Auftreten dieser Würfe: Es sei X = (X1 , . . . , X10 ) die Zufallsvariable die eine Wurffolge beschreibt, und Xj die
Zufallsvariable mit Werten {0, 1} mit X = 1 für Kopf im j-ten Wurf. Dann ist bei einer fairen Münze
P (Xj = 0) = P (Xj = 1) = 21 , und wegen der Unabhängigkeit der Einzelwürfe folglich
Folge KZZKKZZZKK
:
h =
P (X = (x1 , . . . , x10 )) = P (X1 = x1 und X2 = x2 und . . . und X10 = x10 )
1 1
1
1
· ··· =
= 0.00097 .
2 2
2
1024
Dabei ist es ganz egal welche Werte wir in die Zielwerte xj schreiben, weil Kopf und Zahl in jedem Einzelwurf
1
die gleiche Wahrscheinlichkeit haben. Jede der drei Wurffolgen hat also die gleiche Wahrscheinlichkeit 1024
.
Jetzt nehmen wir an, dass die Münze nicht fair ist mit Kopf-Wahrscheinlichkeit P (Xj = 1) = 0.4 und dem
Gegenereignis Zahl P (Xj = 0) = 0.6 in einem Einzelwurf. Dann haben wir für die drei Folgen:
= P (X1 = x1 ) · P (X2 = x2 ) · · · P (X10 = x10 ) =
P (X = (KZZKKZZZKK))
=
0.45 · 0.65 = 0.00079
P (X = (KZZZZZZZZZ))
=
0.41 · 0.69 = 0.004
P (X = (ZZZZZZZZZZ))
=
0.610 = 0.006 .
Hier ist es also wahrscheinlicher, eine Folge mit hohem Zahl-Anteil zu bekommen.
Aufgabe 29 (Die Binomialverteilung)
(a) Wie hoch ist die Wahrscheinlichkeit, mit einer fairen Münze bei 5 Würfen genau zweimal Kopf zu
werfen?
(b) Wie hoch ist die Wahrscheinlichkeit, mit einer unfairen Münze (Kopf hat Wahrscheinlichkeit 0.4) bei
5 Würfen höchstens zweimal Kopf zu werfen?
(c) Wie hoch ist die Wahrscheinlichkeit, genau 500mal Kopf zu werfen wenn man 1000mal werfen darf?
Beantworte die Frage für den Fall dass die Münze fair ist (also echte 50%-Chance auf Kopf), und
dass sie unfair ist (Wahrscheinlichkeit nur 0.4 für den Kopf). Bearbeite diese Frage nicht per Hand,
sondern verwende Mathematica: der Zufallsvariablen X ordnet man die Binomialverteilung B(n, p) zu
mit dem Kommando X = BinomialDistribution[n,p], danach kann man mit PDF[X][k] die Wahrscheinlichkeit P (X = k) abfragen.
(d) Wie hoch ist bei einer fairen Münze die Wahrscheinlichkeit, bei 1’000’000’000 Würfen höchstens
500’000’000 mal den Kopf zu erhalten?
Lösung
Die Binomialverteilung misst die Wahrscheinlichkeit eine Anzahl von Erfolgen zu erzielen wie beim Münzwurf,
nur dass es nicht mehr auf die Reihenfolge der einzelnen Würfe ankommt. Beim Münzwurf fallen beispielsweise
die Ergebnisse KZZZZZZZZZ und ZZZZZZZZZK zusammen. Ist die Erfolgswahrscheinlichkeit im Wurf
p ∈ [0, 1], so ist die geordnete Erfolgswahrscheinlichkeit für die Folge von n Würfen pk (1 − p)n−k , genau k
Erfolge in n Würfen zu haben. Jetzt fallen alle Sortierungen der Folge zu einem einzigen Ereignis zusammen,
es gibt
n
n!
=
k!(n − k)!
k
Möglichkeiten die Folge anzuordnen wenn k Erfolge und n − k Fehlschläge zu sortieren sind. Daher ist die
Binomialverteilung gegeben durch
n k
X ∼ B(n, p) , P (X = k) =
p (1 − p)n−k .
k
Zu a): Bei einer fairen Münze ist p = (1 − p) = 21 , also haben wir
5
5!
P (X = 2) =
· 0.52 · 0.53 =
· 0.55 = 0.3125 .
2
2! · 3!
Zu b): Bei der unfairen Münze haben wir p = 0.4 Erfolgswahrscheinlichkeit, und 1 − p = 0.6 Fehlschlagswahrscheinlichkeit. Die Wahrscheinlichkeit höchstens zweimal Kopf zu bekommen ist
2 X
5
P (X ≤ 2) = P (X = 0) + P (X = 1) + P (X = 2) =
· 0.4k · 0.65−k
k
k=0
= 1 · 0.40 · 0.65 + 5 · 0.41 · 0.64 + 10 · 0.42 · 0.63 = 0.68256 .
Zu c): Diese Werte berechnet Mathematica natürlich nicht mit den Binomialkoeffizienten (die werden für n ≥ 10
so groß dass man nicht mehr anständig damit rechnen kann, sondern mit einer ausgefeilten Näherungsformel.
Für die unfaire Münze gibt Mathematica einen Wert aus der annähernd Null ist, bei der fairen Münze dagegen
den Wert PDF[X][500]=0.025. Diese Chance von ca. 2% ist überraschend hoch wenn man bedenkt dass es sich
um ein Einzelergebnis unter 21000 möglichen Wurffolgen handelt. Das liegt daran, dass die Wurffolge bei der
Binomialverteilung ungeordnet ist, und die geringe Einzelwahrscheinlichkeit durch die extrem hohe Anzahl an
möglichen Umordnungen kompensiert wird (ein ähnlicher Kompensationseffekt findet im Teil a) der vorigen
Aufgabe in der Tabelle für Y statt). Bei der unfairen Münze versagt die Kompensation (wie in Teil b) der
vorigen Aufgabe), bei tausend Würfen dominiert die Verzerrung richtung Zahl einfach zu sehr.
Zu d): Hier kann man auch Mathematica fragen, die analytische Näherung für B(n, p) ist so effizient, dass
auch diese großen Werte problemlos verarbeitet werden. Mit ein wenig Nachdenken kommen man aber auch
ohne Rechnung darauf, dass die Wahrscheinlichkeit ≈ 12 sein muss, weil die Beschreibung aus der Aufgabe
genau die Hälfte der ungeordneten Wurffolgen beschreibt. Die hat dann auch nach der Zusammenfassung zu
den ungeordneten Ereignissen die Wahrscheinlichkeit 21 . Das der Wahrscheinlichkeitswert den Mathematica hier
produziert nicht exakt .5 ist liegt daran, dass 1000000000 eine gerade Zahl ist: ein Ereignis liegt genau auf der
Mitte, und man kann es leider nicht zerteilen.
Aufgabe 30 (Eine Korrelation)
Lade den Datensatz zur Serie 10 von der Homepage, und bearbeite dann die folgenden Aufgaben mit Mathematica:
(a) Auftrennung der Blumensorten: Sind es die Sepal- oder die Petalblätter, welche die verschiedenen
Blumensorten am besten unterscheiden können? Probiere zur Beantwortung dieser Frage alle 4 quantitativen Variablen einzeln mit einem geeigneten Plot durch.
(b) Scatterplot der Sepalblätter: Erstelle einen Scatterplot von Länge und Breite der Sepalblätter, ohne
Regressions- und Glättungsgerade.
(c) Separate Scatterplots: Nun drei separate Scatterplots jeweils für die drei Blumensorten, indem Du die
Stichprobe auftrennst.
(d) Berechnung der Korrelation: Berechne die Korrelation zwischen Länge und Breite der Sepalblätter
sowohl mit der Methode von Pearson, wie auch mit der Methode von Spearman, über die gesamte
Stichprobe.
(e) Berechnen die Korrelation zwischen Länge und Breite für jede einzelne Blumensorte.
Die Datensätze beschreiben die Längen und Breiten der verschiedenen Blatttypen dreier Blumensorten. Ziel ist
es, Anhand der Blatteigenschaften die Art der Blume zu bestimmen.
Die Struktur der Datensätze ist:
(1)
(2)
(3)
(4)
(5)
Sepal (Länge)
Sepal (Breite)
Petal (Länge)
Petal (Breite)
Blumensorte
Lösung
Vergleiche das NB-File auf der Homepage.
(a) Die vier Plots der Variablen jeweils mit der Sorte zeigen, dass die Petalblätter durch die Sorte stärker
beeinflusst werden als die Sepalblätter, wobei es nicht viel Unterschied macht ob man die Länge oder
Breite verwendet.
(b) Die drei Scatterplots der Sepalblätter sind für die drei Sorten ziemlich ähnlich.
(c) Die Pearson-Korrelation zwischen Sepalbreite und Sepallänge über alle Sorten ist %P = −0.11757, das
ist sehr gering. Das verwundert da die Breite und die Länge eines Blattes normalerweise voneinander
abhängen. Die Spearman-Korrelation zwischen Sepalbreite und Sepallänge über alle Sorten ist mit
%P = −0.16677 nur wenig besser.
(d) Mit ρ1 = 0.7425 ist der Korrelationskoeffizient der Sepalblätter der Sorte 1 recht hoch, auch ρ2 =
0.5259 für die zweite Sorte ist gut, ebenso ρ3 = 0.4572. Alle drei Werte liegen weit über der Korrelation
über die gesamte Stichprobe, d. h. die Blättlängen und Blattbreiten hängen schon stark voneinander
ab, nur ist die Art des Zusammenhangs bei jeder Sorte anders. Bei der Korrelationsprobe über die
gesamte Stichprobe ist das aber nicht mehr erkennbar.
Herunterladen