Dr. Marcel Dettling Dr. Daniel Haase [email protected] 14.05.2010 FS 2010 Grundlagen der Mathematik II (LVA 401-0622-00 U) Lösung 10 Zur Übungsstunde vom 14.05.2010 Aufgabe 28 (Die Gleichverteilung) (a) Die Wahrscheinlichkeitsfunktion für die Zufallsvariable X = Anzahl der geworfenen Augen mit einem ” regulären Würfel“ ist eine Uniform-Verteilung. Nun wird ein solcher regulärer Würfel aber 2x geworfen und Y = Summe der Augenzahlen aus den beiden Würfen“. Es handelt sich nun nicht mehr um eine ” Uniform-Verteilung. Bestimme und zeichne die entsprechende diskrete Wahrscheinlichkeitsfunktion. auf. Beachte dass die Summe über alle Wahrscheinlichkeiten gleich Eins sein muss. (b) Nun haben wir es mit einem gefälschten Würfel zu tun. Er ist so gefälscht, dass die Wahrscheinlichkeit für eine bestimmte Augenzahl umgekehrt proportional zur Augenzahl ist. Es sei nun X = Anzahl ” der geworfenen Augen“. Bestimme und zeichne die entsprechende Wahrscheinlichkeitsfunktion. Der gefälschte Würfel wird nun 2x geworfen. Bestimme und zeichne die Wahrscheinlichkeitsverteilung für Y = Summe der Augenzahlen aus den beiden Würfen“. ” (c) Ein auf der Strasse gefundener Franken ist leicht verbogen. Er wird 10mal geworfen, und das dreimal hintereinander. Die Würfe lauten KZZKKZZZKK , KZZZZZZZZZ , ZZZZZZZZZZ . Berechne die relative Häufigkeit der Kopf-Würfe separat für die drei Folgen. Danach berechne die Wahrscheinlichkeit für diese Folgen unter der Annahme, dass die Münze fair ist (also 50% Wahrscheinlichkeit für Kopf), und dann unter der Annahme, dass der Kopf eine Wahrscheinlichkeit von nur 0.4 besitzt. Beachte dass es hier auf die korrekte Reihenfolge ankommt. Lösung Zu a): Da nur die Augensumme gezäht wird sind die möglichen Ergebnisse 2, 3, 4, . . . , 12, die haben allerdings unterschiedliche Wahrscheinlichkeiten, weil die Augensumme 3 beispielsweise durch die Würfe (1, 2) und (2, 1) erreicht werden kann, die Summe 2 aber nur durch den einzigen Wurf (1, 1). Jedes Paar (x1 , x2 ) hat die gleiche Wahrscheinlichkeit (weil x1 und x2 jeweils uniform verteilt sind). Da es 6 · 6 = 36 mögliche Paare gibt, ist die 1 Einzelwahrscheinlichkeit für jedes Paar 36 ≈ 0.277. Wir zählen wieviele Paare zu einer gegebenen Augensumme führen: Wert von Y Ergebnisse von (X1 , X2 ) zu Y Wahrscheinlichkeit 2 Augen (1, 1) P (Y = 2) = 1 36 3 Augen (1, 2), (2, 1) P (Y = 3) = 2 36 4 Augen (1, 3), (2, 2), (3, 1) P (Y = 4) = 3 36 5 Augen (1, 4), (2, 3), (3, 2), (4, 1) P (Y = 5) = 4 36 6 Augen (1, 5), (2, 4), (3, 3), (4, 2), (5, 1) P (Y = 6) = 5 36 7 Augen (1, 6), (2, 5), (3, 4), (4, 3), (5, 2), (6, 1) P (Y = 7) = 6 36 8 Augen (2, 6), (3, 5), (4, 4), (5, 3), (6, 2) P (Y = 8) = 5 36 9 Augen (3, 6), (4, 5), (5, 4), (6, 3) P (Y = 9) = 4 36 10 Augen (4, 6), (5, 5), (6, 4) P (Y = 10) = 3 36 11 Augen (5, 6), (6, 5) P (Y = 11) = 2 36 12 Augen (6, 6) P (Y = 12) = 1 36 Als Histogramm: Zu b): Hier müssen wir zuerst die nicht-uniforme Verteilung von X bestimmen, der Anzahl der Augen eines Wurfes mit einem (gefälschten) Würfel. Laut Aufgabe soll sie antiproportional zur Augenzahl sein, also P (X = k) = c · k1 für eine unbekannte Konstante c. Die ist dann aber durch die Normierungsbedingung P (Alles) = 1 festgelegt, wie in in Aufgabe 27 nur dass wir hier mit Summen statt Integralen arbeiten. Die Summe über alle möglichen Ergebnisse des Wurfes ist 6 6 X X c 1 1 1 1 1 1 P (Alles) = P (X = k) = = c· + + + + + k 1 2 3 4 5 6 k=1 k=1 60 + 30 + 20 + 15 + 12 + 10 147 = c· = c· = c · 2.45 . 60 60 60 ≈ 0.408 einsetzen. Damit steht Damit die Gesamtwahrscheinlichkeit Eins ist, müssen wir den Kehrwert c = 147 die Verteilung des gefälschten Würfels fest: c c c P (X = 1) = = 0.408 , P (X = 2) = = 0.204 , P (X = 3) = = 0.136 , 1 2 3 c c c P (X = 4) = = 0.102 , P (X = 5) = = 0.081 , P (X = 6) = = 0.068 . 4 5 6 Als Histogramm also Aus dieser Verteilung berechnen wir wieder die Doppelwurf-Verteilung für Y , jetzt sind aber nicht mehr alle Paare (x1 , x2 ) gleichwahrscheinlich, wir müssen die Summen aus Teil (a) weiter auftrennen. Dazu überlegt man sich, dass wegen der Unabhängigkeit der Würfe gelten muss P (Paar (x1 , x2 ) gewürfelt) = P (X1 = x1 und X2 = x2 ) = P (X = x1 ) · P (X = x2 ) = c c 1 · = 0.1664 · . x1 x2 x1 · x2 Für jede mögliche Augenzahl müssen wir die verschiedenen Wahrscheinlichkeiten über die Einzelpaare aufaddieren: Wert von Y Ergebnisse von (X1 , X2 ) zu Y Wahrscheinlichkeit 2 Augen (1, 1) P (Y = 2) = c2 · 1 = 0.166 3 Augen (1, 2), (2, 1) P (Y = 3) = c2 · ( 21 + 12 ) = 0.166 4 Augen (1, 3), (2, 2), (3, 1) P (Y = 4) = c2 · ( 31 + 1 4 + 31 ) = 0.152 5 Augen (1, 4), (2, 3), (3, 2), (4, 1) P (Y = 5) = c2 · ( 41 + 1 6 + 1 6 + 14 ) 6 Augen (1, 5), (2, 4), (3, 3), (4, 2), (5, 1) P (Y = 6) = c2 · ( 15 + 1 8 + 1 9 + 7 Augen (1, 6), (2, 5), (3, 4), (4, 3), (5, 2), (6, 1) P (Y = 7) = c2 · ( 16 + 8 Augen (2, 6), (3, 5), (4, 4), (5, 3), (6, 2) 1 P (Y = 8) = c2 · ( 12 + 1 15 + 1 16 + 1 15 9 Augen (3, 6), (4, 5), (5, 4), (6, 3) 1 P (Y = 9) = c2 · ( 18 + 1 20 + 1 20 + 1 18 ) 10 Augen (4, 6), (5, 5), (6, 4) 1 P (Y = 10) = c2 · ( 24 + 1 25 11 Augen (5, 6), (6, 5) 1 P (Y = 11) = c2 · ( 30 + 1 30 ) 12 Augen (6, 6) P (Y = 12) = c2 · Als Histogramm: 1 36 1 10 1 12 + + 1 8 = 0.138 + 51 ) + 1 24 ) 1 12 + = 0.126 1 10 + + 16 ) 1 12 ) = 0.116 = 0.060 = 0.035 = 0.020 = 0.011 = 0.005 Zu c): Die relative Häufigkeit der Kopf-Würfe ist einfach deren Anzahl geteilt durch die Gesamtzahl der Würfe: 5 = 0.5 10 1 = 0.1 Folge KZZZZZZZZZ : h = 10 0 Folge ZZZZZZZZZZ : h = = 0.0 10 Diese Häufigkeiten sind als Aussage grundsätzlich verschieden von den Wahrscheinlichkeiten für das Auftreten dieser Würfe: Es sei X = (X1 , . . . , X10 ) die Zufallsvariable die eine Wurffolge beschreibt, und Xj die Zufallsvariable mit Werten {0, 1} mit X = 1 für Kopf im j-ten Wurf. Dann ist bei einer fairen Münze P (Xj = 0) = P (Xj = 1) = 21 , und wegen der Unabhängigkeit der Einzelwürfe folglich Folge KZZKKZZZKK : h = P (X = (x1 , . . . , x10 )) = P (X1 = x1 und X2 = x2 und . . . und X10 = x10 ) 1 1 1 1 · ··· = = 0.00097 . 2 2 2 1024 Dabei ist es ganz egal welche Werte wir in die Zielwerte xj schreiben, weil Kopf und Zahl in jedem Einzelwurf 1 die gleiche Wahrscheinlichkeit haben. Jede der drei Wurffolgen hat also die gleiche Wahrscheinlichkeit 1024 . Jetzt nehmen wir an, dass die Münze nicht fair ist mit Kopf-Wahrscheinlichkeit P (Xj = 1) = 0.4 und dem Gegenereignis Zahl P (Xj = 0) = 0.6 in einem Einzelwurf. Dann haben wir für die drei Folgen: = P (X1 = x1 ) · P (X2 = x2 ) · · · P (X10 = x10 ) = P (X = (KZZKKZZZKK)) = 0.45 · 0.65 = 0.00079 P (X = (KZZZZZZZZZ)) = 0.41 · 0.69 = 0.004 P (X = (ZZZZZZZZZZ)) = 0.610 = 0.006 . Hier ist es also wahrscheinlicher, eine Folge mit hohem Zahl-Anteil zu bekommen. Aufgabe 29 (Die Binomialverteilung) (a) Wie hoch ist die Wahrscheinlichkeit, mit einer fairen Münze bei 5 Würfen genau zweimal Kopf zu werfen? (b) Wie hoch ist die Wahrscheinlichkeit, mit einer unfairen Münze (Kopf hat Wahrscheinlichkeit 0.4) bei 5 Würfen höchstens zweimal Kopf zu werfen? (c) Wie hoch ist die Wahrscheinlichkeit, genau 500mal Kopf zu werfen wenn man 1000mal werfen darf? Beantworte die Frage für den Fall dass die Münze fair ist (also echte 50%-Chance auf Kopf), und dass sie unfair ist (Wahrscheinlichkeit nur 0.4 für den Kopf). Bearbeite diese Frage nicht per Hand, sondern verwende Mathematica: der Zufallsvariablen X ordnet man die Binomialverteilung B(n, p) zu mit dem Kommando X = BinomialDistribution[n,p], danach kann man mit PDF[X][k] die Wahrscheinlichkeit P (X = k) abfragen. (d) Wie hoch ist bei einer fairen Münze die Wahrscheinlichkeit, bei 1’000’000’000 Würfen höchstens 500’000’000 mal den Kopf zu erhalten? Lösung Die Binomialverteilung misst die Wahrscheinlichkeit eine Anzahl von Erfolgen zu erzielen wie beim Münzwurf, nur dass es nicht mehr auf die Reihenfolge der einzelnen Würfe ankommt. Beim Münzwurf fallen beispielsweise die Ergebnisse KZZZZZZZZZ und ZZZZZZZZZK zusammen. Ist die Erfolgswahrscheinlichkeit im Wurf p ∈ [0, 1], so ist die geordnete Erfolgswahrscheinlichkeit für die Folge von n Würfen pk (1 − p)n−k , genau k Erfolge in n Würfen zu haben. Jetzt fallen alle Sortierungen der Folge zu einem einzigen Ereignis zusammen, es gibt n n! = k!(n − k)! k Möglichkeiten die Folge anzuordnen wenn k Erfolge und n − k Fehlschläge zu sortieren sind. Daher ist die Binomialverteilung gegeben durch n k X ∼ B(n, p) , P (X = k) = p (1 − p)n−k . k Zu a): Bei einer fairen Münze ist p = (1 − p) = 21 , also haben wir 5 5! P (X = 2) = · 0.52 · 0.53 = · 0.55 = 0.3125 . 2 2! · 3! Zu b): Bei der unfairen Münze haben wir p = 0.4 Erfolgswahrscheinlichkeit, und 1 − p = 0.6 Fehlschlagswahrscheinlichkeit. Die Wahrscheinlichkeit höchstens zweimal Kopf zu bekommen ist 2 X 5 P (X ≤ 2) = P (X = 0) + P (X = 1) + P (X = 2) = · 0.4k · 0.65−k k k=0 = 1 · 0.40 · 0.65 + 5 · 0.41 · 0.64 + 10 · 0.42 · 0.63 = 0.68256 . Zu c): Diese Werte berechnet Mathematica natürlich nicht mit den Binomialkoeffizienten (die werden für n ≥ 10 so groß dass man nicht mehr anständig damit rechnen kann, sondern mit einer ausgefeilten Näherungsformel. Für die unfaire Münze gibt Mathematica einen Wert aus der annähernd Null ist, bei der fairen Münze dagegen den Wert PDF[X][500]=0.025. Diese Chance von ca. 2% ist überraschend hoch wenn man bedenkt dass es sich um ein Einzelergebnis unter 21000 möglichen Wurffolgen handelt. Das liegt daran, dass die Wurffolge bei der Binomialverteilung ungeordnet ist, und die geringe Einzelwahrscheinlichkeit durch die extrem hohe Anzahl an möglichen Umordnungen kompensiert wird (ein ähnlicher Kompensationseffekt findet im Teil a) der vorigen Aufgabe in der Tabelle für Y statt). Bei der unfairen Münze versagt die Kompensation (wie in Teil b) der vorigen Aufgabe), bei tausend Würfen dominiert die Verzerrung richtung Zahl einfach zu sehr. Zu d): Hier kann man auch Mathematica fragen, die analytische Näherung für B(n, p) ist so effizient, dass auch diese großen Werte problemlos verarbeitet werden. Mit ein wenig Nachdenken kommen man aber auch ohne Rechnung darauf, dass die Wahrscheinlichkeit ≈ 12 sein muss, weil die Beschreibung aus der Aufgabe genau die Hälfte der ungeordneten Wurffolgen beschreibt. Die hat dann auch nach der Zusammenfassung zu den ungeordneten Ereignissen die Wahrscheinlichkeit 21 . Das der Wahrscheinlichkeitswert den Mathematica hier produziert nicht exakt .5 ist liegt daran, dass 1000000000 eine gerade Zahl ist: ein Ereignis liegt genau auf der Mitte, und man kann es leider nicht zerteilen. Aufgabe 30 (Eine Korrelation) Lade den Datensatz zur Serie 10 von der Homepage, und bearbeite dann die folgenden Aufgaben mit Mathematica: (a) Auftrennung der Blumensorten: Sind es die Sepal- oder die Petalblätter, welche die verschiedenen Blumensorten am besten unterscheiden können? Probiere zur Beantwortung dieser Frage alle 4 quantitativen Variablen einzeln mit einem geeigneten Plot durch. (b) Scatterplot der Sepalblätter: Erstelle einen Scatterplot von Länge und Breite der Sepalblätter, ohne Regressions- und Glättungsgerade. (c) Separate Scatterplots: Nun drei separate Scatterplots jeweils für die drei Blumensorten, indem Du die Stichprobe auftrennst. (d) Berechnung der Korrelation: Berechne die Korrelation zwischen Länge und Breite der Sepalblätter sowohl mit der Methode von Pearson, wie auch mit der Methode von Spearman, über die gesamte Stichprobe. (e) Berechnen die Korrelation zwischen Länge und Breite für jede einzelne Blumensorte. Die Datensätze beschreiben die Längen und Breiten der verschiedenen Blatttypen dreier Blumensorten. Ziel ist es, Anhand der Blatteigenschaften die Art der Blume zu bestimmen. Die Struktur der Datensätze ist: (1) (2) (3) (4) (5) Sepal (Länge) Sepal (Breite) Petal (Länge) Petal (Breite) Blumensorte Lösung Vergleiche das NB-File auf der Homepage. (a) Die vier Plots der Variablen jeweils mit der Sorte zeigen, dass die Petalblätter durch die Sorte stärker beeinflusst werden als die Sepalblätter, wobei es nicht viel Unterschied macht ob man die Länge oder Breite verwendet. (b) Die drei Scatterplots der Sepalblätter sind für die drei Sorten ziemlich ähnlich. (c) Die Pearson-Korrelation zwischen Sepalbreite und Sepallänge über alle Sorten ist %P = −0.11757, das ist sehr gering. Das verwundert da die Breite und die Länge eines Blattes normalerweise voneinander abhängen. Die Spearman-Korrelation zwischen Sepalbreite und Sepallänge über alle Sorten ist mit %P = −0.16677 nur wenig besser. (d) Mit ρ1 = 0.7425 ist der Korrelationskoeffizient der Sepalblätter der Sorte 1 recht hoch, auch ρ2 = 0.5259 für die zweite Sorte ist gut, ebenso ρ3 = 0.4572. Alle drei Werte liegen weit über der Korrelation über die gesamte Stichprobe, d. h. die Blättlängen und Blattbreiten hängen schon stark voneinander ab, nur ist die Art des Zusammenhangs bei jeder Sorte anders. Bei der Korrelationsprobe über die gesamte Stichprobe ist das aber nicht mehr erkennbar.