¨Ubung zur Vorlesung Statistik I WS 2012

Werbung
Übung zur Vorlesung Statistik I
WS 2012-2013
Übungsblatt 2
29. Oktober 2012
Aufgabe 3 (4 Punkte): Geben Sie für den Wahrscheinlichkeitsraum (Ω, P)
mit
Ω = {1, 2, 3}
und
P(1) = 0.7, P(2) = 0.2 und P(3) = 0.1
alle Ereignisse und deren Wahrscheinlichkeiten an.
Lösung:
E1 = ∅,
E2 = {1},
E3 = {2},
E4 = {3},
E5 = {1, 2},
E6 = {1, 3},
E7 = {2, 3},
E8 = Ω,
P(E1 ) = 0
P(E2 ) = 0.7
P(E3 ) = 0.2
P(E4 ) = 0.1
P(E5 ) = 0.9
P(E6 ) = 0.8
P(E7 ) = 0.3
P(E8 ) = 1
Aufgabe 4 (4 Punkte): Gregor Mendel kreuzte Erbsenpflanzen vom Genotyp (A, A) (runde Erbsen) mit Pflanzen vom Genotyp (a, a) (eckige Erbsen).
Das Merkmal runde/eckige Erbsen wird dominant-rezessiv vererbt. Das AAllel sei das dominante Allel. In der F1 Generation trugen alle Pflanzen nur
runde Erbsen. Aus der F1 Generation wurden nun Pflanzen zufällig gekreuzt.
Bestimmen Sie die Verteilung der
A
Genotypen und
B
Phänotypen
in der F2 Generation. Geben Sie eine Begründung an.
Lösung: Da in der F1 Generation nur Pflanzen vom Genotyp (A, a) vorkommen
können, ist die Wahrscheinlichkeit für eine Pflanze der Generation F2 von der
Mutter- bzw. Vaterpflanze ein A-Allel zu bekommen, jeweils pA = 1/2. Weil
angenommen wurde, dass die Allele unabhängig vererbt werden, ergibt sich für
die Wahrscheinlichkeitsverteilung der Genotypen in der F2:
P((A, A)) = 1/4
P((A, a)) = 2 ∗ 1/4 = 1/2
P((a, a)) = 1/4
Für die Phänotypen folgt daraus:
P(A) = 3/4
P(a) = 1/4
Aufgabe 5 (4 Punkte): Beim Lotto “6 aus 49“ werden zufällig sechs Kugeln
aus 49 ohne Zurücklegen gezogen.
Berechnen Sie die Wahrscheinlichkeiten von k = 0, 1, . . . , 6 Richtigen. Geben
Sie die allgemeine Formel mit Begründung an und berechnen Sie mit R explizit
die sieben Wahrscheinlichkeiten.
Lösung: Da der Wahrscheinlichkeitsraum, der die Lotterie“6 aus 49“ beschreibt,
ein Laplaceraum ist, müssen nur die Anzahl der Elemente des Ereignisses “genau k Richtige“ (die günstigen Fälle) bestimmt
werden. Diese Anzahl geteilt
49
durch alle Möglichkeiten (laut Vorlesung 6 ) ergibt die gesuchte Wahrscheinlichkeit.
Um die günstigen Fälle zu ermitteln, überlegt man sich, auf wie viele Möglichkeiten man k Kugeln aus den sechs Richtigen und auf wie viele Möglichkeiten
man 6 − k Kugeln aus den 43 “Nieten“ ziehen kann. Die Lösung beider
Teil
6
probleme ist schon aus der Vorlesung bekannt: Man kann auf k Weisen k
43
aus 6 Kugeln und auf 6−k
Weisen 6 − k Kugeln aus 43 Kugeln ziehen. Da
jede Möglichkeit k aus 6 Kugeln mit jeder Möglichkeit 6 − k aus 43 Kugeln zu
ziehen kombiniert werden kann, gibt es insgesamt
6
43
k
6−k
günstige Fälle. Die Wahrscheinlichkeit für genau k Richtige ist daher
43 6
k
6−k
49
6
Explizite Werte erhält man mit
> for(k in 0:6) print(choose(6,k)*choose(43,6-k)/choose(49,6))
[1]
[1]
[1]
[1]
[1]
[1]
[1]
0.435965
0.4130195
0.132378
0.0176504
0.0009686197
1.84499e-05
7.151124e-08
Aufgabe 6 (4 Punkte): Einige schwere Erbkrankheiten werden dominantrezessiv vererbt. Krank sind nur Individuen vom Genotyp (a, a), wohingegen
die beiden anderen Genotypen gesund bleiben. Nehmen Sie an, dass die Prävalenz des a-Allels in der F0 (=relative Häufigkeit des a-Allels) pa ist und nehmen
Sie die Hardy-Weinberg Bedingung an.
A
Mit welchen Wahrscheinlichkeiten treten die drei Genotypen in der Generation F1 auf?
B
Nehmen Sie nun weiter an, dass die Erbkrankheit so schwer ist, dass die
Individuen vom Genotyp (a, a) nicht überleben. Berechnen Sie nun die
Wahrscheinlichkeiten für die verbleibenden beiden Genotypen unter der
Bedingung, dass das Individuum nicht vom Genotyp (a, a) ist.
Hinweis: Bestimmen Sie die bedingten Wahrscheinlichkeiten P((A, A)|{(a, a)}C )
und P((A, a)|{(a, a)}C ).
C
Berechnen Sie die Prävalenz des a-Allels in der F1.
D
In der F0 sei pa = 0.1. Nach wie vielen Generationen sinkt die Prävalenz
des a-Allels unter 0.001? Schreiben Sie ein kleines R Programm.
Hinweis: Benutzen Sie eine while-Schleife.
Lösung:
A
Hier muss man einfach die Formeln der Vorlesung angeben:
P((a, a)) = p2a
P((A, a)) = 2 ∗ pa (1 − pa )
P((A, A)) = (1 − pa )2
B
Man wendet die Definition der bedingten Wahrscheinlichkeit an. Da
{(A, A)} ∩ {(a, a)}C = {(A, A)} ∩ {(A, A), (A, a)} = {(A, A)} und
{(A, a)} ∩ {(a, a)}C = {(A, a)} ∩ {(A, A), (A, a)} = {(A, a)}
gilt, folgt
P((A, A)|{(a, a)}C ) =
P((A, A))
(1 − pa )2
=
P({(A, A), (A, a)})
(1 − pa )2 + 2 ∗ pa (1 − pa )
und
P((A, a)|{(a, a)}C ) =
2 ∗ pa (1 − pa )
P((A, a))
=
.
P({(A, A), (A, a)})
(1 − pa )2 + 2 ∗ pa (1 − pa )
Die Prävalenz pa (F 1) des a-Allels in der F1 ist die Hälfte der Prävalenz
des Genotyps (A, a):
pa (F 1) =
C
>
>
>
+
+
+
+
>
pa (1 − pa )
(1 − pa )2 + 2 ∗ pa (1 − pa )
p_a <- 0.1
k <- 0
while(p_a>0.001){
p_a <- p_a*(1-p_a)/((1-p_a)^2+2*p_a*(1-p_a))
k <- k+1
}
p_a
[1] 0.000999001
> k
[1] 991
Anscheinend verschwindet das “kranke“ Allel langsam aus dem Genepool.
Erst nach
> k
[1] 991
Generationen liegt seine Häufigkeit unter 0.001.
Schicken Sie Ihre Lösung bis spätestens Sonntag, den 4.11.2012 direkt an
Ihre(n) Tutor(in):
[email protected] (Franziska Metge).
[email protected] (Stina Richter)
[email protected] (Ivo Parchero)
Herunterladen