Mathematik in der Evolutionsbiologie Vom Konflikt zwischen Mendelianern und Biometrikern zur modernen Populationsgenetik Wolfgang Stephan Abt. Evolutionsbiologie LMU München Reaktionen auf Darwins Evolutionstheorie Charles Darwin in Origin of Species (1859): - Evolutionäre Änderungen erfolgen graduell, - Hauptantriebskraft ist die natürliche Selektion. Saltationisten (Thomas H. Huxley, Francis Galton, William Bateson): - Evolution erfolgt zumeist in größeren Sprüngen, - sie begrüßten die Wiederentdeckung der Mendelschen Gesetze (1900) Æ Mendelianer. Biometriker (Francis Galton, W.F.R. Weldon, Karl Pearson): - Evolution erfolgt graduell (getrieben durch die natürliche Selektion), - Veränderungen quantitativer Merkmale können nur mit Hilfe der Statistik studiert werden (z.B. Korrelationen zw. Verwandten). Hauptproblem von Darwins Evolutionstheorie: Vererbung vermischend oder partikulär? D.h.: wird die Erbinformation vermischt oder bleiben die Erbfaktoren von Generation zu Generation erhalten? Jenkin (1867): Die Vermischung führt zu einem Verlust der Unterschiede zwischen Merkmalen innerhalb kürzester Zeit. Die Varianz wird jede Generation um 50% reduziert. Damit kann aber die natürliche Selektion, die auf phänotypischen Unterschieden zwischen den Individuen einer Population beruht, nicht mehr wirken. Mendels Wiederentdeckung rettet die Darwinsche Evolutionstheorie! Das Hardy-Weinberg Gesetz (1908) Modell: • Unendlich große diploide Population • Zufallspaarung • Keine Evolutionskräfte Betrachte Gen mit 2 Allelen A und a. Definiere Allelfrequenz x:=f(A), und Genotypfrequenzen X:=f(AA), Y:=f(Aa), und Z:=f(aa). Dann gilt unter der Annahme, dass eine Population in der gegenwärtigen Generation die Genotypfrequenzen X, Y und Z hat, in der nächsten Generation: X’=x2, Y’= 2x(1-x), und Z’=(1-x)2, wobei x=X+ 12Y. Ferner, falls die Genotypfrequenzen X, Y und Z in der gegenwärtigen Generation schon von der Form x2, 2x(1-x) und (1-x)2 sind, sind diese Frequenzen für alle folgenden Generationen stabil. Versöhnung zwischen Biometrikern und Mendelianern (Ronald A. Fisher 1918) Biometriker: Mendels segregierende Erbfaktoren sind irrelevant in der Erklärung der beobachteten Korrelationen zw. Verwandten Mendelianer: Segregation von vielen verschiedenen interagierenden Faktoren kann die kontinuierliche Verteilung von Merkmalen erklären. Fisher (1918) hat letzteres mit einem mathematischen Modell nachgewiesen, indem er Merkmale als Funktion von Genotyp- und Allelfrequenzen ausgedrückt hat. Dieses Paper war auch ein Meilenstein in der Geschichte der Statistik. Zur Anzeige wird der QuickTime™ Dekompressor „“ benötigt. Synthese der Evolutionstheorie, Genetik und Biometrie (R.A. Fisher, J.B.S. Haldane und S. Wright, 1920-1940) Klassische Selektionstheorie und die Geburt der klassischen Populationsgenetik. Genotyp Fitness Frequenz vor Sel. Frequenz nach Sel. = ∝ AA wAA x2 x2 wAA Aa wAa 2x(1-x) 2x(1-x) wAa aa waa (1-x)2 (1-x)2 waa wAa = 1+s waa = 1, Beispiel: Positiv gerichtete Selektion wAA = 1+2s wobei 0 < s << 1 Selektionsvorteil von Allele A. Î Δx = sx(1-x), 0 ≤ x ≤ 1. Evolution als stochastischer Prozess Wright-Fisher Modell: – Endliche Populationsgröße N – Zufallspaarung Genetische Drift: Stochastische Beschreibung von Allelfrequenz X(t) zur Zeit t auf dem Zustandsraum {0, 1/2N, …, 1} erfolgt als Markovkette. Diffusionstheorie Wenn N sehr groß ist, kann eine solche Markovkette durch eine Diffusionsgleichung approximiert werden (Wright, Malécot, Kimura). ∂ ∂ 1 ∂2 f (x,t) = − [a(x) f (x,t)]+ [b(x) f (x,t)], ∂t ∂x 2 ∂x 2 wobei x = Allelfrequenz und f(x,t) deren Wahrscheinlichkeitsdichte zur Zeit t, und z.B. a(x) = 2Nsx(1 − x), b(x) = x(1 − x). Dadurch werden viele grundlegende Resultate der Populationsgenetik erhalten, z.B. - die Fixationswahrscheinlichkeit einer neuen Mutation unter dem Zusammenwirken von positiver Selektion und Drift, die Verteilung der Allelfrequenzen im Gleichgewicht zwischen Mutation und Drift, etc. Neutrale Theorie der Molekularen Evolution (Motoo Kimura 1968) Diese Theorie behauptet, dass die Evolution auf der molekularen Ebene durch Die Kombination von zwei Kräften erklärt werden kann: Mutation und genetische Drift. D.h., Einflüsse der Selektion sind vernachlässigbar. Die Grundaussagen sind: Heterozygotie π = 4Nu, Substitutionsrate k = u, wobei u = Mutationsrate. Kimura (1985): “Even my neutral theory of molecular evolution is on this line of development: it is a flower, so to speak, that bloomed on a tree whose main trunk comprises the diffusion models of population genetics.” Die quantitative Formulierung der Theorie erlaubt rigorose statistische Tests, z.B. der Hypothese, dass Heterozygotie und Substitutionsrate positiv korreliert sind. Molekulare Populationsgenetik und der Coalescent In den letzten 20 Jahren haben neue DNA-Sequenziermethoden unvorhergesehene Möglichkeiten eröffnet, die neutrale Theorie zu testen. Im besten Fall können große Stichproben von gesamten Genomen analysiert werden (ÆHuman-Genomprojekt von 1000 Individuen; ähnliches ist für Drosophila im Bereich des Möglichen). Der Coalescent (Kingman 1982) ist die wichtigste mathematisch/ statistische Methode der modernen Populationsgenetik, die generierten SNP-Daten zu untersuchen, quantitative Hypothesen zu testen und Parameter von Evolutionsmodellen zu schätzen. Er wird auch bei Assoziationsstudien in der Biomedizin eingesetzt. Past Coalescent without recombination and selection T(2) T(3) T(4) T(5) Present Sampled gene copies Ancestral recombination graph with hitchhiking Tlimit neutral phase selective phase T=τ neutral phase T = 0 (Present) Heterozygosity Position (kb) Expected hitchhiking effect of a beneficial mutation Heterozygosity (π) Position (kb)