Phylogenetische Bäume

Werbung
Softwarewerkzeuge der
Bioinformatik WS05/06
Phylogenetische Bäume
Barbara Hutter
Bäume in der (Bio)Informatik
– Kanten verbinden die
Knoten
– eine Wurzel = oberster
Knoten (ältester
gemeinsamer Vorfahre)
– Kinder (Nachfahren)
– innere Knoten mit Kindern
(Vorläuferarten,
ausgestorben oder
weiterenwickelt)
– Blätter = unterste Knoten,
ohne Kinder (rezente
Arten)
Sonderfall Binärbaum:
dichotome Verzweigung, d.h.
jeder Knoten hat 2 Kinder
2
Bäume und Phylogenie
• Darstellung der Evolution
• evolutionärer Stammbaum = Dendrogramm
– vollständige Verwandtschaftsbeziehungen von Teilen
des Tier- oder Pflanzenreichs
• phylogenetischer Baum = spezielles Cladogramm
– (meist) Binärbaum
– Verwandtschaft innerhalb einer Gruppe (Monophylum)
– Kantenlängen sind Maß für die Verwandtschaft
3
Molekulare Uhr
• Annahme: Mutationen treten regelmäßig auf, also ist nach
einer bestimmten Zeit eine bestimmte Zahl von Mutationen
zu erwarten
• Zahl der Mutationen als Maß für die evolutionäre
Entfernung zwischen Spezies (= Kantenlänge im Baum)
• Nachteile:
– Mutationsraten sind in Wirklichkeit variabel
– es treten auch Rückmutationen auf (Reversionen)
– zwei Sequenzen sind evtl. nicht ähnlich wegen direktem
gemeinsamen Vorfahren, sondern weil sie sich vergleichsweise
langsam verändern
4
Arten von Bäumen
• mit Wurzel
– gemeinsamer Vorfahre bekannt (Fossil, ...)
• ohne Wurzel
– gemeinsamer Vorfahre nicht bekannt
– man weiß nicht, welche Art die älteste ist
• für n Spezies gibt es
(2n - 3)!
2n-2(n - 2)!
mögliche phylogenetische Bäume mit Wurzel
(ohne Wurzel: selbe Formel mit n-1 statt n)
5
wurzelloser Baum
+--------Gamma
!
+--|
+--Epsilon
! ! +--|
! +--| +--Delta
|
!
!
+-----Beta
!
+-----------Alpha
Epsilon
Delta
Beta
outgroup
Newick-Format
((Gamma,((Epsilon,Delta),Beta)),Alpha)
Gamma
Alpha
6
"Bewurzelung"
Aus einem wurzellosen Baum kann man viele
verschiedene Bäume mit Wurzel konstruieren:
– midpoint Methode: lege Wurzel an den Schwerpunkt
des "Mobiles" (Annahme einer molekularen Uhr)
– wähle eine "outgroup" – Wurzel liegt unterhalb der
Auftrennung von outgroup und Rest der Arten
• die outgroup sollte aus einer evolutionär nicht allzu weit
entfernten Gruppe stammen
7
Phylogenie mit ClustalW
• Distanzmatriz aus multiplem Aligment (Problem: Bewertung der
Ähnlichkeit)
• neighbor joining Methode
• Beginn: sternförmiger Baum
• dann werden die 2 einander laut Matrix am nächsten stehenden
"Nachbarn" mit einem neuen internen Knoten verbunden usw.
8
Bootstrapping
Alignment
Sq1
Sq2
Sq3
Sq4
1
G
G
A
A
2
T
T
C
C
3
A
A
A
A
4
G
G
A
A
5
T
T
T
C
Pseudo-Alignment
(Replikat)
6
A
A
A
A
7
C
C
C
C
8
T
T
C
T
1
6
A
A
A
A
2
1
G
G
A
A
3
6
A
A
A
A
4
8
T
T
C
T
5 6 7 8
...
...
...
...
...
stelle zufällig ausgewählte Spalten neu
zusammen, z. B. Spalte 6, 1, 6, 8, ...
9
Kontrolle der Ergebnisse
Wie zuverlässig ist das Ergebnis?
• keine Möglichkeit zur direkten Überprüfung!
• Bootstrapping: Test auf Einfluß stochastischer Effekte
- Annahme: Verwandtschaft nicht nur in Bereichen auf der Sequenz,
sondern in der ganzen
- dadurch spielt die Reihenfolge der Spalten innerhalb des multiplen
Alignments keine Rolle
- Spalten können mehrfach vorkommen oder fehlen
- konstruiere Bäume aus Pseudo-Alignments derselben Länge
- zähle, wie oft dieselben Verzweigungen in den neuen Bäumen
wiedergefunden werden: Bootstrap-Wert
- Werte über 90% sind sehr zuverlässig
10
Herunterladen