Wright-Fisher: binomischer Prozess Koaleszenz Koaleszenz

Werbung
Die Theorie des Koaleszenten;
Tests für Selektion
•
•
•
•
1. Der Koaleszent und Gen-Genealogien
2. Mutationen in Koaleszenten
3. Tests für Selektion
4. Vergleich der Synonyme und Nichtsynonyme
Substitutionen: Omega-Test
• 5. Vergleich der Synonyme und Nichtsynonyme
Substitutionen: McDonald-Kreitman
• 6. Genomweite Vergleiche: 12 Drosophila Arten
• 7. Genomscans für "Selective Sweep"
Wright-Fisher: binomischer
Prozess
• Wenn die die Allelfrequenz pt zum Zeitpunkt t, und die
Populationsgröße N gegeben sind, sagt es die
Wahrscheinlichkeit der Werte der Allelfrequenz zum
Zeitpunkt t + 1 voraus
• Das Wright-Fischer Modell sagt die Wahrscheinlichkeit
eines zukünftigen Verlustes oder Fixierung eines Allels
voraus
Koaleszenz
• Der Koaleszent
beginnt mit einem Set
an Allelen, die jetzt
existieren und blickt
zurück in die Zeit.
• Die "Genealogie"
eines Allels ist die
Geschichte dieses
Allels über die Zeit.
Gene ändern sich in Populationen
über die Zeit
• Wir können genetische Änderungen entweder
vorwärts oder rückwärts in der Zeit betrachten
• Das Wright-Fischer Modell schaut nach vorn
Drift
• Unter genetischer
Drift, zu jeder neuen
Generation werden
einige Allele einmal,
andere zwei- oder
mehrmals, andere gar
nicht, gezogen.
Koaleszenz
• Wir beginnen mit einer Gruppe von
Allelen, die aus einer gegenwärtigen
Population gezogen werden
• Wenn wir rückwärts in die Zeit schauen
könnten, sähen wir, wo alle
Allelgenealogien zu einer verschmelzen
1
Koaleszenz
• Ein "Koaleszenz-Ereignis" tritt ein, wenn
zwei Allelgenealogien zusammentreffen
• Genealogien von zwei Allelen treffen
zusammen oder verschmelzen
Beispiel mit k=5 Allelen
Koaleszenz
• Dieses Koaleszenz-Muster
(Verschmelzungsmuster) kann unter dem
Wright-Fischer-Modell vorhergesagt
werden, wenn alle Allele neutral sind
• Die Koaleszenz-Theorie sagt die erwartete
Anzahl Generationen zwischen zwei
Koaleszenzereignissen vorher
• Diese Koaleszenz-Zeiten hängen nur von
N und der Anzahl der Allele k ab
Koaleszenz-Muster
die Vergangenheit
• Bei genetischer Drift hat der Baum eine
bestimmte Gestalt
• die Koaleszenz-Zeiten werden länger, je
weniger Allele da sind
• die letzte Koaleszenz-Zeit von zwei zu
einem Allel ist etwa so lang wie alle
anderen zusammengerechnet
T5 = erwartete Zeit,
um von 5 zu 4
Allelen zu
verschmelzen
die Gegenwart
Beispiel mit k=5 Allelen
Koaleszenz
die Vergangenheit
• Warum ist der Koaleszenz-Prozess so
nützlich für die Populationsgenetik?
• er macht Computersimulationen viel
einfacher
• Die Daten der gegenwärtig existierenden
Allele (~2N) allein können verwendet
werden, es ist nicht notwendig, alle Allele
mit einzubeziehen, die in der
Vergangenheit verloren gegangen sind (k)
T5 = erwartete Zeit,
um von 5 zu 4
Allelen zu
verschmelzen
die Gegenwart
2
Koaleszenz
• Andere Faktoren können dem Modell
zugeordnet werden
• Populationswachstum, Migration,
Mutation, Rekombination
Ein Beispiel von Drosophila
melanogaster
• Gene für das Enzym Superoxid-Dismutase
• 10 Allele wurden von einer spanischen
Population sequenziert
• 5 Allele waren identisch
• die anderen 5 Allele waren unterschiedlich
mit 55 Polymorphismen
• Wie wahrscheinlich ist es, dass dies
zufällig geschah?
Superoxid-Dismutase
Superoxid-Dismutase
• wir simulieren einen Koaleszenz-Prozess
• Mutationen geschehen zufällig, genetische
Drift kommt vor, keine Selektion
• wir verteilen die Mutationen zufällig auf
den Baum
• wir zählen alle Mutationsereignisse vom
anzestralen Allel
• Wie oft bekommen wir 5 identische Allele
als Endergebnis?
• wir wiederholen es 10.000 mal
• Die Antwort: etwa 1 % aller simulierten
Bäume zeigen 5 identische Allele als
Endergebnis
• Ablehnung des Driftmodells: Vielleicht
spielt Selektion eine Rolle, die das
häufigste Allel oder ein daran gekoppeltes
Gen bevorzugt
Superoxid-Dismutase
Koaleszenz-Muster
• Treten synonyme und nicht synonyme
Substitutionen mit derselben Rate auf?
• Wenn nicht, sind die nicht synonymen
Substitutionen vielleicht durch Selektion
beeinflusst
55
Mutationen
sehr selten: < 1%
Zusätzliche Tests für Selektion:
Omega
häufiger
3
Negative Selektion
Positive Selektion
• Negative Selektion ("reinigende
Selektion"): die meisten nicht synonymen
Substitutionen sind schädlich und werden
ausselektiert
• nicht synonyme Substitutionen treten
dadurch viel langsamer auf als synonyme
Substitutionen
• Positive Selektion (diversifizierende
Selektion); viele nicht synonyme
Substitutionen sind vorteilhaft und werden
von der Selektion bevorzugt
• nicht synonyme Substitutionen treten
schneller auf als synonyme Substitutionen
Beispiel: Actin
Omega-Test
Maus-Mensch Vergleich
• kN/kS Verhältnis = Omega
• Das Verhältnis nicht synonymer zu
synonymen Substitutionen
• Der einfachste Fall: zwei Arten, ein Gen,
eine Allelsequenz von jeder Art
k (subst. per site per 109 yr)
• Gene
• Actin α
kN nichtsyn. kS synon.
0.01 <
3.7
kN/kS Verhältnis = Omega = 0.0027 <<1
Der McDonald-Kreitman-Test
Der McDonald-Kreitman-Test
• Wie schnell treten
Aminosäuresubstitutionen relativ zur Rate
der durch Drift bedingten synonymen
Substitutionen im selben Gen auf?
• vergleiche dasselbe Gen in zwei Arten
• der einfachste Fall: zwei Arten, ein Gen,
mehrere Allelsequenzen von jeder Art
• zähle die Anzahl nicht synonymer oder
synonymer Polymorhphismen, die
innerhalb der Arten auftreten
• zähle die Anzahl der zwischen den Arten
fixierten Unterschiede, die entweder
synonym oder nicht synonym sind
• ordne die Ergebnisse in einer 2x2 Tabelle
an
4
Der McDonald-Kreitman-Test
• Ist das Muster synonymer und nicht synonymer
Substitutionen innerhalb und zwischen Arten das
gleiche?
divergent oder
fixiert (zwischen
den Arten)
polymorph
(innerhalb der
Arten)
Synon.
7
1
nicht Synon.
3
8
• Statistischer Test: Chi-Quadrat-Test auf
Unabhängigkeit mit einem Freiheitsgrad
P=
0.007
12 Drosophila spp
Genomsequenzen von 12
Drosophila Arten
• Die Drosophila melanogaster Sequenz
wurde 1999 fertiggestellt
• jetzt ist die DNA-Sequenzierung
wesentlich schneller und billiger
• 11 andere Drosophila Arten wurden
anhand ihrer unterschiedlichen
Verwandtschaftsgrade zu D melanogaster
ausgewählt
D grimshawi aus Hawaii
• Die genetische Distanz zu D melanogaster ist
ähnlich der genetischen Distanz zwischen
Menschen und Reptilien
• D simulans & D sechellia: Ihre genetische
Distanz ist ähnlich der genetischen Distanz
zwischen Menschen und höheren Primaten
Negative Selektion
Negative Selektion
• Welche DNA Sequenzen sind zwischen all
den Arten am konserviertesten?
• Hinweise auf starke reinigende Selektion
• Negative Selektion
• Man kann diese Methode verwenden, um
regulatorische Sequenzen in nicht
kodierender DNA zu finden
5
Positive Selektion
Positive Selektion
• Welche Gene ändern sich zwischen den
Arten?
• Hinweise auf diversifizierende Selektion?
Hinweise auf diversifizierende
Selektion
Omega in GO-Categories
• Genklassifikation über funktionelle Kategorien
• GO = Gene Ontology classification of Biological
Process
• z.B. DNA Metabolismus, Zellzyklus,
Transkription, Lipidmetabolismus, Ionentransport
u.s.w.
• für viele Gene ist der biologische Prozess
unbekannt
• berechne das durchschnittliche Omega für alle
Gene innerhalb der GO Kategorien
12-Drosophila Omega
• berechne das durchschnittliche Omega für
alle Gene innerhalb der GO Kategorien
• Kategorien mit hohem Omega-Wert:
– Unbekannt,
– Abwehrantwort,
– Proteolyse,
– Geruchsmolekülbindung,
– DNA Bindung,
– Rezeptoraktivität
"Selective Sweep"
• Ein anderer Ansatz: suche nach
Hinweisen auf rezente starke Selektion
innerhalb einer einzelnen Art
6
Der genetische "Hitch-hiking
Effekt"
--A---C---T----T--CG----G--T---A-----C----A---T---T----T--TG----G--C---A-----C----G---C---C----T--CA----A--T---A-----C----A---T---C----T--CG----G--T---A-----T----A---C---T----T--TG----G--C---G-----T----G---T---T----T--TA----A--C---G-----C----A---C---C----T--CG----A--T---G-----C----A---T---C----T--TG----G--T---G-----C----C---C---T----T--CG----G--T---G-----T----A---A---T----T--AA----A--G---G-----C----A---C---A----T--CG----G--T---G-----T--Variation an vielen Nukleotidorten, generell ist das
Ungleichgewicht in etwa Null
Der genetische "Hitch-hiking
Effekt"
--A---C---T-C--T--CG----G--T---A-----C----A---T---T----T--TG----G--C---A-----C----G---C---C----T--CA----A--T---A-----C----A---T---C----T--CG----G--T---A-----T----A---C---T----T--TG----G--C---G-----T----G---T---T----T--TA----A--C---G-----C----A---C---C----T--CG----A--T---G-----C----A---T---C----T--TG----G--T---G-----C----C---C---T----T--CG----G--T---G-----T----A---A---T----T--AA----A--G---G-----C----A---C---A----T--CG----G--T---G-----T---
Der genetische "Hitch-hiking
Effekt"
--A---C---T-C--T--CG----G--T---A-----C----A---T---T----T--TG----G--C---A-----C----G---C---C----T--CA----A--T---A-----C----A---T---C----T--CG----G--T---A-----T----A---C---T----T--TG----G--C---G-----T----G---T---T----T--TA----A--C---G-----C----A---C---C----T--CG----A--T---G-----C----A---T---C----T--TG----G--T---G-----C----C---C---T----T--CG----G--T---G-----T----A---A---T----T--AA----A--G---G-----C----A---C---A----T--CG----G--T---G-----T--eine nützliche Mutation tritt auf einem Chromosom auf
Der genetische "Hitch-hiking
Effekt"
--A---C---T-C--T--CG----G--T---A-----C----A---C---T-C--T--CG----G--T---A-----C----A---C---T-C--T--CG----G--T---A-----C----A---C---T-C--T--CG----G--T---A-----C----A---C---T-C--T--CG----G--T---A-----C----G---T---T----T--TA----A--C---G-----C----A---C---C----T--CG----A--T---G-----C----A---T---C----T--TG----G--T---G-----C----C---C---T----T--CG----G--T---G-----T----A---A---T----T--AA----A--G---G-----C----A---C---A----T--CG----G--T---G-----T---
eine nützliche Mutation tritt auf einem Chromosom auf
starke positive Selektion erhöht die Frequenz des neuen Allels
Der genetische "Hitch-hiking
Effekt"
Der genetische "Hitch-hiking
Effekt"
--A---C---T-C--T--CG----G--T---A-----C----A---C---T-C--T--CG----G--T---A-----C----A---C---T-C--T--CG----G--T---A-----C----A---C---T-C--T--CG----G--T---A-----C----G---C---T-C--T--CG----G--T---A-----C----A---C---T-C--T--CG----G--T---A-----T----A---C---T-C--T--CG----G--T---A-----C----A---C---T-C--T--CG----G--T---A-----C----A---C---T-C--T--CG----G--T---A-----C----A---C---T-C--T--CG----G--T---A-----C----A---C---A----T--CG----G--T---G-----T--Sequenzvarianten, die an das neue Allel gekoppelt sind,
wurden ebenfalls häufiger
• Jetzt kommt es zu einer nicht zufälligen
Verbindung von Allelen zu Gameten
• das neue selektierte Allel ist jetzt stärker
mit Allelen aus seinem ursprünglichen
genetischen Hintergrund assoziiert
• Rekombination könnte diese Assoziierung
aufbrechen
• aber wenn Selektion stark genug ist, wird
das neue Allel fixiert, bevor viel
Rekombination stattfinden kann
7
"Selective Sweep"
Genomscans
• Nach der Selektion wird die genetische
Variation rund um das neue Allel sehr
niedrig sein
• die neutralen Varianten, die an das
selektierte Allel gekoppelt waren, sind also
als "Trittbrettfahrer" fixiert worden
• "Selective sweep", das selektierte Allel hat
andere Allele zur Fixierung mitgenommen
--A---C---T-C--T--CG----G--T---A-----C---
Beispiel: Insektizidresistenz in
Drosophila
Heterozygosität
• Ein Genomscan in D. simulans hat eine
Region mit sehr niedriger Variabilität
gefunden
• Wie können wir dieses Muster finden?
• Genomscans - verwenden ein Set an
Markern, die entlang jedes Chromosoms
gleichmäßig verteilt sind
• wir messen die Menge an
Polymorphismus an jedem Marker
• Wir suchen nach genomischen Regionen
mit einer verringerten Menge an Variation
Selektion in der Vergangenheit?
• Resistenz für das Insektizid DDT
• Kandidatengen: Cytochrom p450
• Ein transponibles Element ist in eine
Promotorregion gesprungen
• Hypothesis: höhere Genexpression - mehr
Protein - größerer Detoxifikationseffekt
Chromosome 2R position in band region 47-50
Parallele Evolution
P450 Expression
• Das gleiche ist in D. melanogaster
geschehen
• Cyp6G1:
höher p450
Expression
(Resistant
strains)
wurde durch
Gen-ChipExperimente
entdeckt
P450 enzyme
8
D. melanogaster Cyp6G1
• dann wurde ein anderes transponibles
Element in seinem Promotor entdeckt
Expression von p450 in
Zellkulturen
Arbeitsgruppe an
der RWTH
Aachen: das
Enzym CYP6G1
kann
Imidicloprid und
DDT
detoxifizieren
All R strains have the Accord
element!
CHkov1 gene, D. melanogaster
ein anderes Gen, ein anderes transponible Element
McDonald-Kreitman Tests
anzestral
mit Doc-element
Pattern of nucleotide variation
Sequence variation in first
intron, Resistant and
Susceptible strains.
9
Zusammenfassung
• Der Koaleszenz-Prozess kann verwendet
werden, um die Vorhersagen genetische Drift
und andere Prozesse effizient zu studieren
• Vorhersagen der neutralen Theorie können
verwendet werden, um auf Selektion zu testen
• Positive und negative Selektion lässt sich
nachweisen
• Der Vergleich unterschiedlicher Regionen im
Genom einer Art kann verwendet werden, um
Selektion nachzuweisen
• ebenso der Vergleich derselben Gene in
unterschiedlichen Arten
10
Herunterladen