Die Theorie des Koaleszenten; Tests für Selektion • • • • 1. Der Koaleszent und Gen-Genealogien 2. Mutationen in Koaleszenten 3. Tests für Selektion 4. Vergleich der Synonyme und Nichtsynonyme Substitutionen: Omega-Test • 5. Vergleich der Synonyme und Nichtsynonyme Substitutionen: McDonald-Kreitman • 6. Genomweite Vergleiche: 12 Drosophila Arten • 7. Genomscans für "Selective Sweep" Wright-Fisher: binomischer Prozess • Wenn die die Allelfrequenz pt zum Zeitpunkt t, und die Populationsgröße N gegeben sind, sagt es die Wahrscheinlichkeit der Werte der Allelfrequenz zum Zeitpunkt t + 1 voraus • Das Wright-Fischer Modell sagt die Wahrscheinlichkeit eines zukünftigen Verlustes oder Fixierung eines Allels voraus Koaleszenz • Der Koaleszent beginnt mit einem Set an Allelen, die jetzt existieren und blickt zurück in die Zeit. • Die "Genealogie" eines Allels ist die Geschichte dieses Allels über die Zeit. Gene ändern sich in Populationen über die Zeit • Wir können genetische Änderungen entweder vorwärts oder rückwärts in der Zeit betrachten • Das Wright-Fischer Modell schaut nach vorn Drift • Unter genetischer Drift, zu jeder neuen Generation werden einige Allele einmal, andere zwei- oder mehrmals, andere gar nicht, gezogen. Koaleszenz • Wir beginnen mit einer Gruppe von Allelen, die aus einer gegenwärtigen Population gezogen werden • Wenn wir rückwärts in die Zeit schauen könnten, sähen wir, wo alle Allelgenealogien zu einer verschmelzen 1 Koaleszenz • Ein "Koaleszenz-Ereignis" tritt ein, wenn zwei Allelgenealogien zusammentreffen • Genealogien von zwei Allelen treffen zusammen oder verschmelzen Beispiel mit k=5 Allelen Koaleszenz • Dieses Koaleszenz-Muster (Verschmelzungsmuster) kann unter dem Wright-Fischer-Modell vorhergesagt werden, wenn alle Allele neutral sind • Die Koaleszenz-Theorie sagt die erwartete Anzahl Generationen zwischen zwei Koaleszenzereignissen vorher • Diese Koaleszenz-Zeiten hängen nur von N und der Anzahl der Allele k ab Koaleszenz-Muster die Vergangenheit • Bei genetischer Drift hat der Baum eine bestimmte Gestalt • die Koaleszenz-Zeiten werden länger, je weniger Allele da sind • die letzte Koaleszenz-Zeit von zwei zu einem Allel ist etwa so lang wie alle anderen zusammengerechnet T5 = erwartete Zeit, um von 5 zu 4 Allelen zu verschmelzen die Gegenwart Beispiel mit k=5 Allelen Koaleszenz die Vergangenheit • Warum ist der Koaleszenz-Prozess so nützlich für die Populationsgenetik? • er macht Computersimulationen viel einfacher • Die Daten der gegenwärtig existierenden Allele (~2N) allein können verwendet werden, es ist nicht notwendig, alle Allele mit einzubeziehen, die in der Vergangenheit verloren gegangen sind (k) T5 = erwartete Zeit, um von 5 zu 4 Allelen zu verschmelzen die Gegenwart 2 Koaleszenz • Andere Faktoren können dem Modell zugeordnet werden • Populationswachstum, Migration, Mutation, Rekombination Ein Beispiel von Drosophila melanogaster • Gene für das Enzym Superoxid-Dismutase • 10 Allele wurden von einer spanischen Population sequenziert • 5 Allele waren identisch • die anderen 5 Allele waren unterschiedlich mit 55 Polymorphismen • Wie wahrscheinlich ist es, dass dies zufällig geschah? Superoxid-Dismutase Superoxid-Dismutase • wir simulieren einen Koaleszenz-Prozess • Mutationen geschehen zufällig, genetische Drift kommt vor, keine Selektion • wir verteilen die Mutationen zufällig auf den Baum • wir zählen alle Mutationsereignisse vom anzestralen Allel • Wie oft bekommen wir 5 identische Allele als Endergebnis? • wir wiederholen es 10.000 mal • Die Antwort: etwa 1 % aller simulierten Bäume zeigen 5 identische Allele als Endergebnis • Ablehnung des Driftmodells: Vielleicht spielt Selektion eine Rolle, die das häufigste Allel oder ein daran gekoppeltes Gen bevorzugt Superoxid-Dismutase Koaleszenz-Muster • Treten synonyme und nicht synonyme Substitutionen mit derselben Rate auf? • Wenn nicht, sind die nicht synonymen Substitutionen vielleicht durch Selektion beeinflusst 55 Mutationen sehr selten: < 1% Zusätzliche Tests für Selektion: Omega häufiger 3 Negative Selektion Positive Selektion • Negative Selektion ("reinigende Selektion"): die meisten nicht synonymen Substitutionen sind schädlich und werden ausselektiert • nicht synonyme Substitutionen treten dadurch viel langsamer auf als synonyme Substitutionen • Positive Selektion (diversifizierende Selektion); viele nicht synonyme Substitutionen sind vorteilhaft und werden von der Selektion bevorzugt • nicht synonyme Substitutionen treten schneller auf als synonyme Substitutionen Beispiel: Actin Omega-Test Maus-Mensch Vergleich • kN/kS Verhältnis = Omega • Das Verhältnis nicht synonymer zu synonymen Substitutionen • Der einfachste Fall: zwei Arten, ein Gen, eine Allelsequenz von jeder Art k (subst. per site per 109 yr) • Gene • Actin α kN nichtsyn. kS synon. 0.01 < 3.7 kN/kS Verhältnis = Omega = 0.0027 <<1 Der McDonald-Kreitman-Test Der McDonald-Kreitman-Test • Wie schnell treten Aminosäuresubstitutionen relativ zur Rate der durch Drift bedingten synonymen Substitutionen im selben Gen auf? • vergleiche dasselbe Gen in zwei Arten • der einfachste Fall: zwei Arten, ein Gen, mehrere Allelsequenzen von jeder Art • zähle die Anzahl nicht synonymer oder synonymer Polymorhphismen, die innerhalb der Arten auftreten • zähle die Anzahl der zwischen den Arten fixierten Unterschiede, die entweder synonym oder nicht synonym sind • ordne die Ergebnisse in einer 2x2 Tabelle an 4 Der McDonald-Kreitman-Test • Ist das Muster synonymer und nicht synonymer Substitutionen innerhalb und zwischen Arten das gleiche? divergent oder fixiert (zwischen den Arten) polymorph (innerhalb der Arten) Synon. 7 1 nicht Synon. 3 8 • Statistischer Test: Chi-Quadrat-Test auf Unabhängigkeit mit einem Freiheitsgrad P= 0.007 12 Drosophila spp Genomsequenzen von 12 Drosophila Arten • Die Drosophila melanogaster Sequenz wurde 1999 fertiggestellt • jetzt ist die DNA-Sequenzierung wesentlich schneller und billiger • 11 andere Drosophila Arten wurden anhand ihrer unterschiedlichen Verwandtschaftsgrade zu D melanogaster ausgewählt D grimshawi aus Hawaii • Die genetische Distanz zu D melanogaster ist ähnlich der genetischen Distanz zwischen Menschen und Reptilien • D simulans & D sechellia: Ihre genetische Distanz ist ähnlich der genetischen Distanz zwischen Menschen und höheren Primaten Negative Selektion Negative Selektion • Welche DNA Sequenzen sind zwischen all den Arten am konserviertesten? • Hinweise auf starke reinigende Selektion • Negative Selektion • Man kann diese Methode verwenden, um regulatorische Sequenzen in nicht kodierender DNA zu finden 5 Positive Selektion Positive Selektion • Welche Gene ändern sich zwischen den Arten? • Hinweise auf diversifizierende Selektion? Hinweise auf diversifizierende Selektion Omega in GO-Categories • Genklassifikation über funktionelle Kategorien • GO = Gene Ontology classification of Biological Process • z.B. DNA Metabolismus, Zellzyklus, Transkription, Lipidmetabolismus, Ionentransport u.s.w. • für viele Gene ist der biologische Prozess unbekannt • berechne das durchschnittliche Omega für alle Gene innerhalb der GO Kategorien 12-Drosophila Omega • berechne das durchschnittliche Omega für alle Gene innerhalb der GO Kategorien • Kategorien mit hohem Omega-Wert: – Unbekannt, – Abwehrantwort, – Proteolyse, – Geruchsmolekülbindung, – DNA Bindung, – Rezeptoraktivität "Selective Sweep" • Ein anderer Ansatz: suche nach Hinweisen auf rezente starke Selektion innerhalb einer einzelnen Art 6 Der genetische "Hitch-hiking Effekt" --A---C---T----T--CG----G--T---A-----C----A---T---T----T--TG----G--C---A-----C----G---C---C----T--CA----A--T---A-----C----A---T---C----T--CG----G--T---A-----T----A---C---T----T--TG----G--C---G-----T----G---T---T----T--TA----A--C---G-----C----A---C---C----T--CG----A--T---G-----C----A---T---C----T--TG----G--T---G-----C----C---C---T----T--CG----G--T---G-----T----A---A---T----T--AA----A--G---G-----C----A---C---A----T--CG----G--T---G-----T--Variation an vielen Nukleotidorten, generell ist das Ungleichgewicht in etwa Null Der genetische "Hitch-hiking Effekt" --A---C---T-C--T--CG----G--T---A-----C----A---T---T----T--TG----G--C---A-----C----G---C---C----T--CA----A--T---A-----C----A---T---C----T--CG----G--T---A-----T----A---C---T----T--TG----G--C---G-----T----G---T---T----T--TA----A--C---G-----C----A---C---C----T--CG----A--T---G-----C----A---T---C----T--TG----G--T---G-----C----C---C---T----T--CG----G--T---G-----T----A---A---T----T--AA----A--G---G-----C----A---C---A----T--CG----G--T---G-----T--- Der genetische "Hitch-hiking Effekt" --A---C---T-C--T--CG----G--T---A-----C----A---T---T----T--TG----G--C---A-----C----G---C---C----T--CA----A--T---A-----C----A---T---C----T--CG----G--T---A-----T----A---C---T----T--TG----G--C---G-----T----G---T---T----T--TA----A--C---G-----C----A---C---C----T--CG----A--T---G-----C----A---T---C----T--TG----G--T---G-----C----C---C---T----T--CG----G--T---G-----T----A---A---T----T--AA----A--G---G-----C----A---C---A----T--CG----G--T---G-----T--eine nützliche Mutation tritt auf einem Chromosom auf Der genetische "Hitch-hiking Effekt" --A---C---T-C--T--CG----G--T---A-----C----A---C---T-C--T--CG----G--T---A-----C----A---C---T-C--T--CG----G--T---A-----C----A---C---T-C--T--CG----G--T---A-----C----A---C---T-C--T--CG----G--T---A-----C----G---T---T----T--TA----A--C---G-----C----A---C---C----T--CG----A--T---G-----C----A---T---C----T--TG----G--T---G-----C----C---C---T----T--CG----G--T---G-----T----A---A---T----T--AA----A--G---G-----C----A---C---A----T--CG----G--T---G-----T--- eine nützliche Mutation tritt auf einem Chromosom auf starke positive Selektion erhöht die Frequenz des neuen Allels Der genetische "Hitch-hiking Effekt" Der genetische "Hitch-hiking Effekt" --A---C---T-C--T--CG----G--T---A-----C----A---C---T-C--T--CG----G--T---A-----C----A---C---T-C--T--CG----G--T---A-----C----A---C---T-C--T--CG----G--T---A-----C----G---C---T-C--T--CG----G--T---A-----C----A---C---T-C--T--CG----G--T---A-----T----A---C---T-C--T--CG----G--T---A-----C----A---C---T-C--T--CG----G--T---A-----C----A---C---T-C--T--CG----G--T---A-----C----A---C---T-C--T--CG----G--T---A-----C----A---C---A----T--CG----G--T---G-----T--Sequenzvarianten, die an das neue Allel gekoppelt sind, wurden ebenfalls häufiger • Jetzt kommt es zu einer nicht zufälligen Verbindung von Allelen zu Gameten • das neue selektierte Allel ist jetzt stärker mit Allelen aus seinem ursprünglichen genetischen Hintergrund assoziiert • Rekombination könnte diese Assoziierung aufbrechen • aber wenn Selektion stark genug ist, wird das neue Allel fixiert, bevor viel Rekombination stattfinden kann 7 "Selective Sweep" Genomscans • Nach der Selektion wird die genetische Variation rund um das neue Allel sehr niedrig sein • die neutralen Varianten, die an das selektierte Allel gekoppelt waren, sind also als "Trittbrettfahrer" fixiert worden • "Selective sweep", das selektierte Allel hat andere Allele zur Fixierung mitgenommen --A---C---T-C--T--CG----G--T---A-----C--- Beispiel: Insektizidresistenz in Drosophila Heterozygosität • Ein Genomscan in D. simulans hat eine Region mit sehr niedriger Variabilität gefunden • Wie können wir dieses Muster finden? • Genomscans - verwenden ein Set an Markern, die entlang jedes Chromosoms gleichmäßig verteilt sind • wir messen die Menge an Polymorphismus an jedem Marker • Wir suchen nach genomischen Regionen mit einer verringerten Menge an Variation Selektion in der Vergangenheit? • Resistenz für das Insektizid DDT • Kandidatengen: Cytochrom p450 • Ein transponibles Element ist in eine Promotorregion gesprungen • Hypothesis: höhere Genexpression - mehr Protein - größerer Detoxifikationseffekt Chromosome 2R position in band region 47-50 Parallele Evolution P450 Expression • Das gleiche ist in D. melanogaster geschehen • Cyp6G1: höher p450 Expression (Resistant strains) wurde durch Gen-ChipExperimente entdeckt P450 enzyme 8 D. melanogaster Cyp6G1 • dann wurde ein anderes transponibles Element in seinem Promotor entdeckt Expression von p450 in Zellkulturen Arbeitsgruppe an der RWTH Aachen: das Enzym CYP6G1 kann Imidicloprid und DDT detoxifizieren All R strains have the Accord element! CHkov1 gene, D. melanogaster ein anderes Gen, ein anderes transponible Element McDonald-Kreitman Tests anzestral mit Doc-element Pattern of nucleotide variation Sequence variation in first intron, Resistant and Susceptible strains. 9 Zusammenfassung • Der Koaleszenz-Prozess kann verwendet werden, um die Vorhersagen genetische Drift und andere Prozesse effizient zu studieren • Vorhersagen der neutralen Theorie können verwendet werden, um auf Selektion zu testen • Positive und negative Selektion lässt sich nachweisen • Der Vergleich unterschiedlicher Regionen im Genom einer Art kann verwendet werden, um Selektion nachzuweisen • ebenso der Vergleich derselben Gene in unterschiedlichen Arten 10