Übung zur Vorlesung Statistik I WS 2012-2013 Übungsblatt 2 29. Oktober 2012 Aufgabe 3 (4 Punkte): Geben Sie für den Wahrscheinlichkeitsraum (Ω, P) mit Ω = {1, 2, 3} und P(1) = 0.7, P(2) = 0.2 und P(3) = 0.1 alle Ereignisse und deren Wahrscheinlichkeiten an. Lösung: E1 = ∅, E2 = {1}, E3 = {2}, E4 = {3}, E5 = {1, 2}, E6 = {1, 3}, E7 = {2, 3}, E8 = Ω, P(E1 ) = 0 P(E2 ) = 0.7 P(E3 ) = 0.2 P(E4 ) = 0.1 P(E5 ) = 0.9 P(E6 ) = 0.8 P(E7 ) = 0.3 P(E8 ) = 1 Aufgabe 4 (4 Punkte): Gregor Mendel kreuzte Erbsenpflanzen vom Genotyp (A, A) (runde Erbsen) mit Pflanzen vom Genotyp (a, a) (eckige Erbsen). Das Merkmal runde/eckige Erbsen wird dominant-rezessiv vererbt. Das AAllel sei das dominante Allel. In der F1 Generation trugen alle Pflanzen nur runde Erbsen. Aus der F1 Generation wurden nun Pflanzen zufällig gekreuzt. Bestimmen Sie die Verteilung der A Genotypen und B Phänotypen in der F2 Generation. Geben Sie eine Begründung an. Lösung: Da in der F1 Generation nur Pflanzen vom Genotyp (A, a) vorkommen können, ist die Wahrscheinlichkeit für eine Pflanze der Generation F2 von der Mutter- bzw. Vaterpflanze ein A-Allel zu bekommen, jeweils pA = 1/2. Weil angenommen wurde, dass die Allele unabhängig vererbt werden, ergibt sich für die Wahrscheinlichkeitsverteilung der Genotypen in der F2: P((A, A)) = 1/4 P((A, a)) = 2 ∗ 1/4 = 1/2 P((a, a)) = 1/4 Für die Phänotypen folgt daraus: P(A) = 3/4 P(a) = 1/4 Aufgabe 5 (4 Punkte): Beim Lotto “6 aus 49“ werden zufällig sechs Kugeln aus 49 ohne Zurücklegen gezogen. Berechnen Sie die Wahrscheinlichkeiten von k = 0, 1, . . . , 6 Richtigen. Geben Sie die allgemeine Formel mit Begründung an und berechnen Sie mit R explizit die sieben Wahrscheinlichkeiten. Lösung: Da der Wahrscheinlichkeitsraum, der die Lotterie“6 aus 49“ beschreibt, ein Laplaceraum ist, müssen nur die Anzahl der Elemente des Ereignisses “genau k Richtige“ (die günstigen Fälle) bestimmt werden. Diese Anzahl geteilt 49 durch alle Möglichkeiten (laut Vorlesung 6 ) ergibt die gesuchte Wahrscheinlichkeit. Um die günstigen Fälle zu ermitteln, überlegt man sich, auf wie viele Möglichkeiten man k Kugeln aus den sechs Richtigen und auf wie viele Möglichkeiten man 6 − k Kugeln aus den 43 “Nieten“ ziehen kann. Die Lösung beider Teil 6 probleme ist schon aus der Vorlesung bekannt: Man kann auf k Weisen k 43 aus 6 Kugeln und auf 6−k Weisen 6 − k Kugeln aus 43 Kugeln ziehen. Da jede Möglichkeit k aus 6 Kugeln mit jeder Möglichkeit 6 − k aus 43 Kugeln zu ziehen kombiniert werden kann, gibt es insgesamt 6 43 k 6−k günstige Fälle. Die Wahrscheinlichkeit für genau k Richtige ist daher 43 6 k 6−k 49 6 Explizite Werte erhält man mit > for(k in 0:6) print(choose(6,k)*choose(43,6-k)/choose(49,6)) [1] [1] [1] [1] [1] [1] [1] 0.435965 0.4130195 0.132378 0.0176504 0.0009686197 1.84499e-05 7.151124e-08 Aufgabe 6 (4 Punkte): Einige schwere Erbkrankheiten werden dominantrezessiv vererbt. Krank sind nur Individuen vom Genotyp (a, a), wohingegen die beiden anderen Genotypen gesund bleiben. Nehmen Sie an, dass die Prävalenz des a-Allels in der F0 (=relative Häufigkeit des a-Allels) pa ist und nehmen Sie die Hardy-Weinberg Bedingung an. A Mit welchen Wahrscheinlichkeiten treten die drei Genotypen in der Generation F1 auf? B Nehmen Sie nun weiter an, dass die Erbkrankheit so schwer ist, dass die Individuen vom Genotyp (a, a) nicht überleben. Berechnen Sie nun die Wahrscheinlichkeiten für die verbleibenden beiden Genotypen unter der Bedingung, dass das Individuum nicht vom Genotyp (a, a) ist. Hinweis: Bestimmen Sie die bedingten Wahrscheinlichkeiten P((A, A)|{(a, a)}C ) und P((A, a)|{(a, a)}C ). C Berechnen Sie die Prävalenz des a-Allels in der F1. D In der F0 sei pa = 0.1. Nach wie vielen Generationen sinkt die Prävalenz des a-Allels unter 0.001? Schreiben Sie ein kleines R Programm. Hinweis: Benutzen Sie eine while-Schleife. Lösung: A Hier muss man einfach die Formeln der Vorlesung angeben: P((a, a)) = p2a P((A, a)) = 2 ∗ pa (1 − pa ) P((A, A)) = (1 − pa )2 B Man wendet die Definition der bedingten Wahrscheinlichkeit an. Da {(A, A)} ∩ {(a, a)}C = {(A, A)} ∩ {(A, A), (A, a)} = {(A, A)} und {(A, a)} ∩ {(a, a)}C = {(A, a)} ∩ {(A, A), (A, a)} = {(A, a)} gilt, folgt P((A, A)|{(a, a)}C ) = P((A, A)) (1 − pa )2 = P({(A, A), (A, a)}) (1 − pa )2 + 2 ∗ pa (1 − pa ) und P((A, a)|{(a, a)}C ) = 2 ∗ pa (1 − pa ) P((A, a)) = . P({(A, A), (A, a)}) (1 − pa )2 + 2 ∗ pa (1 − pa ) Die Prävalenz pa (F 1) des a-Allels in der F1 ist die Hälfte der Prävalenz des Genotyps (A, a): pa (F 1) = C > > > + + + + > pa (1 − pa ) (1 − pa )2 + 2 ∗ pa (1 − pa ) p_a <- 0.1 k <- 0 while(p_a>0.001){ p_a <- p_a*(1-p_a)/((1-p_a)^2+2*p_a*(1-p_a)) k <- k+1 } p_a [1] 0.000999001 > k [1] 991 Anscheinend verschwindet das “kranke“ Allel langsam aus dem Genepool. Erst nach > k [1] 991 Generationen liegt seine Häufigkeit unter 0.001. Schicken Sie Ihre Lösung bis spätestens Sonntag, den 4.11.2012 direkt an Ihre(n) Tutor(in): [email protected] (Franziska Metge). [email protected] (Stina Richter) [email protected] (Ivo Parchero)