Mathematisches Institut der Heinrich-Heine-Universität Düsseldorf WS 02/03 15.01.2002 Blatt 11 Prof. Dr. A. Janssen / Dr. Weisshaupt Übungen zu Mathematik für Biologen Aufgabe 33: In einer großen Population seien A und a die Allele eines Gens. Aufgrund einer Genuntersuchung, die an n zufällig ausgewählten Individuen durchgeführt wurde, sollen die Wahrscheinlichkeiten p1 , p2 und p3 für das Auftreten der Genotypen AA, Aa bzw. aa geschätzt werden. In der Stichprobe sind k1 Individuen vom Genotyp AA, k2 Individuen vom Genotyp Aa und k3 Individuen vom Genotyp aa vorhanden, k1 + k2 + k3 = n. Alle ki seien größer als 0. Betrachten Sie die Aufgabe für die konkreten Werte n = 70, k1 = 35, k2 = 28 und k3 = 7. a) Geben Sie den Maximum-Likelihood Schätzer für die Parameter (p1 , p2 , p3 ) an. b) Falls sich die Population im Hardy-Weinberg Gleichgewicht befindet, so läßt sich das Tripel (p1 , p2 , p3 ) durch einen Parameter p ∈ (0, 1) beschreiben. Es gilt dann: p1 = p2 , p2 = 2p(1 − p), p3 = (1 − p)2 . Geben Sie in diesem Fall den Maximum-Likelihood Schätzer für p und (p1 , p2 , p3 ) an. Anleitung: Sehen Sie die einzelnen Individuen als unabhängig an, die jeweils die Genotypen AA, Aa und aa mit Wahrscheinlichkeit p1 , p2 und p3 tragen. Hinweis: Aussagen, die in der Vorlesung bewiesen wurden, können verwendet werden. Aufgabe 34: Aus der Kreuzung von Individuen vom Genotyp Aa gehen 48 Nachkommen hervor. Gehen Sie davon aus, das ”A dominant” ist, d.h. die Genotypen AA und Aa führen zum selben (dominanten) Phänotyp. Es sei Y die Zufallsvariable: ”Anzahl der Nachkommen vom dominanten Phänotyp”. a) Bestimmen Sie Verteilung, Erwartungswert und Varianz von Y. b) Bestimmen Sie mittels beiliegender Tabelle der B(n, p)-Verteilung die Wahrscheinlichkeit dafür, dass mindestens 32 und höchstens 40 Nachkommen vom dominanten Phänotyp sind, d.h. die Wahrscheinlichkeit P (32 ≤ Y ≤ 40). c) Bestimmen Sie mittels der Tschebyscheff-Ungleichung eine untere Schranke für diese Wahrscheinlichkeit. d) Vergleichen Sie diese Wahrscheinlichkeit mit dem Wert, der sich mittels Normalapproximation (mit und ohne Stetigkeitskorrektur) ergibt. Anleitung: Zur Lösung der Aufgabe liegt eine Tabelle über Binomialwahrscheinlichkeiten bei. Verwenden Sie: Ist X eine B(n, p)-verteilte Zufallsvariable so ist Y = n − X eine Zufallsvariable, die B(n, 1 − p)-verteilt ist. Daher lassen sich Binomialtabellen sowohl für den Parameter p als auch für 1 − p zur Berechnung von Verteilungsfunktionen verwenden. Aufgabe 35: Beim Schwarzfahren mit der Bahn werde man mit einer bestimmten Wahrscheinlichkeit p erwischt. Nun sitzen drei ertappte Schwarzfahrer nach der Kontrolle zusammen und erzählen sich, dass sie vorher bereits 4, 8 bzw. 15 mal unbestraft ohne Fahrschein gefahren sind. a) Bestimmen Sie die Wahrscheinlichkeit für dieses Ereignis in Abhängigkeit von p. b) Bestimmen Sie den Maximum-Likelihood-Schätzer für p unter diesen Beobachtungen. Hinweis: Die Aufgabe führt auf die Schätzung des Parameters bei der geometrischen Verteilung. Sehen Sie die einzelnen Kontrollen als unabhängig an. Zum Klausurablauf: Mittwoch 12.02.03, 18-20 Uhr. Prüfen Sie bitte nach, ob Ihre Daten für die Klausuranmeldung richtig erfaßt worden sind. Die Anmeldeliste finden Sie im Netz. Bei Nichterscheinen zählt die Klausur als nicht bestanden. Laut DPO Biologie können Sie sich bis 8 Tage vor der Klausur schriftlich beim Akademischen Prüfungsamt (Frau Winterstein) abmelden. Eine Abmeldung in der letzten Woche vor der Klausur ist nur noch in begründeten Fällen (Attest !?) möglich. Wer nicht zur Klausur antritt oder die erste Klausur nicht besteht ist automatisch für die nächste Klausur im April 2003 angemeldet. Abgabe: 22.01.2003, 11.00 Uhr, in den Übungsbriefkästen Unterlagen: http://www.cs.uni-duesseldorf.de/∼stoch/biol ws02.html