Ubungen zu Mathematik für Biologen

Werbung
Mathematisches Institut
der Heinrich-Heine-Universität
Düsseldorf
WS 02/03
15.01.2002
Blatt 11
Prof. Dr. A. Janssen / Dr. Weisshaupt
Übungen zu Mathematik für Biologen
Aufgabe 33: In einer großen Population seien A und a die Allele eines Gens. Aufgrund
einer Genuntersuchung, die an n zufällig ausgewählten Individuen
durchgeführt wurde, sollen die Wahrscheinlichkeiten p1 , p2 und p3 für das Auftreten der
Genotypen AA, Aa bzw. aa geschätzt werden. In der Stichprobe sind k1 Individuen vom
Genotyp AA, k2 Individuen vom Genotyp Aa und k3 Individuen vom Genotyp aa vorhanden, k1 + k2 + k3 = n. Alle ki seien größer als 0.
Betrachten Sie die Aufgabe für die konkreten Werte n = 70, k1 = 35, k2 = 28 und k3 = 7.
a) Geben Sie den Maximum-Likelihood Schätzer für die Parameter (p1 , p2 , p3 ) an.
b) Falls sich die Population im Hardy-Weinberg Gleichgewicht befindet, so läßt sich das
Tripel (p1 , p2 , p3 ) durch einen Parameter p ∈ (0, 1) beschreiben. Es gilt dann:
p1 = p2 , p2 = 2p(1 − p), p3 = (1 − p)2 .
Geben Sie in diesem Fall den Maximum-Likelihood Schätzer für p und (p1 , p2 , p3 ) an.
Anleitung: Sehen Sie die einzelnen Individuen als unabhängig an, die jeweils die Genotypen AA, Aa und aa mit Wahrscheinlichkeit p1 , p2 und p3 tragen.
Hinweis: Aussagen, die in der Vorlesung bewiesen wurden, können verwendet werden.
Aufgabe 34: Aus der Kreuzung von Individuen vom Genotyp Aa gehen 48 Nachkommen
hervor. Gehen Sie davon aus, das ”A dominant” ist, d.h. die Genotypen AA und Aa
führen zum selben (dominanten) Phänotyp. Es sei Y die Zufallsvariable: ”Anzahl der
Nachkommen vom dominanten Phänotyp”.
a) Bestimmen Sie Verteilung, Erwartungswert und Varianz von Y.
b) Bestimmen Sie mittels beiliegender Tabelle der B(n, p)-Verteilung die Wahrscheinlichkeit dafür, dass mindestens 32 und höchstens 40 Nachkommen vom dominanten
Phänotyp sind, d.h. die Wahrscheinlichkeit P (32 ≤ Y ≤ 40).
c) Bestimmen Sie mittels der Tschebyscheff-Ungleichung eine untere Schranke für diese
Wahrscheinlichkeit.
d) Vergleichen Sie diese Wahrscheinlichkeit mit dem Wert, der sich mittels Normalapproximation (mit und ohne Stetigkeitskorrektur) ergibt.
Anleitung: Zur Lösung der Aufgabe liegt eine Tabelle über Binomialwahrscheinlichkeiten
bei. Verwenden Sie: Ist X eine B(n, p)-verteilte Zufallsvariable so ist Y = n − X eine
Zufallsvariable, die B(n, 1 − p)-verteilt ist. Daher lassen sich Binomialtabellen sowohl für
den Parameter p als auch für 1 − p zur Berechnung von Verteilungsfunktionen verwenden.
Aufgabe 35: Beim Schwarzfahren mit der Bahn werde man mit einer bestimmten Wahrscheinlichkeit p erwischt. Nun sitzen drei ertappte Schwarzfahrer nach der Kontrolle zusammen und erzählen sich, dass sie vorher bereits 4, 8 bzw. 15 mal unbestraft ohne
Fahrschein gefahren sind.
a) Bestimmen Sie die Wahrscheinlichkeit für dieses Ereignis in Abhängigkeit von p.
b) Bestimmen Sie den Maximum-Likelihood-Schätzer für p unter diesen Beobachtungen.
Hinweis: Die Aufgabe führt auf die Schätzung des Parameters bei der geometrischen
Verteilung. Sehen Sie die einzelnen Kontrollen als unabhängig an.
Zum Klausurablauf: Mittwoch 12.02.03, 18-20 Uhr.
Prüfen Sie bitte nach, ob Ihre Daten für die Klausuranmeldung richtig erfaßt worden
sind. Die Anmeldeliste finden Sie im Netz. Bei Nichterscheinen zählt die Klausur als nicht
bestanden. Laut DPO Biologie können Sie sich bis 8 Tage vor der Klausur schriftlich beim
Akademischen Prüfungsamt (Frau Winterstein) abmelden. Eine Abmeldung in der letzten
Woche vor der Klausur ist nur noch in begründeten Fällen (Attest !?) möglich. Wer nicht
zur Klausur antritt oder die erste Klausur nicht besteht ist automatisch für die nächste
Klausur im April 2003 angemeldet.
Abgabe: 22.01.2003, 11.00 Uhr, in den Übungsbriefkästen
Unterlagen: http://www.cs.uni-duesseldorf.de/∼stoch/biol ws02.html
Herunterladen