Softwarewerkzeuge der Bioinformatik WS05/06 Phylogenetische Bäume Barbara Hutter Bäume in der (Bio)Informatik – Kanten verbinden die Knoten – eine Wurzel = oberster Knoten (ältester gemeinsamer Vorfahre) – Kinder (Nachfahren) – innere Knoten mit Kindern (Vorläuferarten, ausgestorben oder weiterenwickelt) – Blätter = unterste Knoten, ohne Kinder (rezente Arten) Sonderfall Binärbaum: dichotome Verzweigung, d.h. jeder Knoten hat 2 Kinder 2 Bäume und Phylogenie • Darstellung der Evolution • evolutionärer Stammbaum = Dendrogramm – vollständige Verwandtschaftsbeziehungen von Teilen des Tier- oder Pflanzenreichs • phylogenetischer Baum = spezielles Cladogramm – (meist) Binärbaum – Verwandtschaft innerhalb einer Gruppe (Monophylum) – Kantenlängen sind Maß für die Verwandtschaft 3 Molekulare Uhr • Annahme: Mutationen treten regelmäßig auf, also ist nach einer bestimmten Zeit eine bestimmte Zahl von Mutationen zu erwarten • Zahl der Mutationen als Maß für die evolutionäre Entfernung zwischen Spezies (= Kantenlänge im Baum) • Nachteile: – Mutationsraten sind in Wirklichkeit variabel – es treten auch Rückmutationen auf (Reversionen) – zwei Sequenzen sind evtl. nicht ähnlich wegen direktem gemeinsamen Vorfahren, sondern weil sie sich vergleichsweise langsam verändern 4 Arten von Bäumen • mit Wurzel – gemeinsamer Vorfahre bekannt (Fossil, ...) • ohne Wurzel – gemeinsamer Vorfahre nicht bekannt – man weiß nicht, welche Art die älteste ist • für n Spezies gibt es (2n - 3)! 2n-2(n - 2)! mögliche phylogenetische Bäume mit Wurzel (ohne Wurzel: selbe Formel mit n-1 statt n) 5 wurzelloser Baum +--------Gamma ! +--| +--Epsilon ! ! +--| ! +--| +--Delta | ! ! +-----Beta ! +-----------Alpha Epsilon Delta Beta outgroup Newick-Format ((Gamma,((Epsilon,Delta),Beta)),Alpha) Gamma Alpha 6 "Bewurzelung" Aus einem wurzellosen Baum kann man viele verschiedene Bäume mit Wurzel konstruieren: – midpoint Methode: lege Wurzel an den Schwerpunkt des "Mobiles" (Annahme einer molekularen Uhr) – wähle eine "outgroup" – Wurzel liegt unterhalb der Auftrennung von outgroup und Rest der Arten • die outgroup sollte aus einer evolutionär nicht allzu weit entfernten Gruppe stammen 7 Phylogenie mit ClustalW • Distanzmatriz aus multiplem Aligment (Problem: Bewertung der Ähnlichkeit) • neighbor joining Methode • Beginn: sternförmiger Baum • dann werden die 2 einander laut Matrix am nächsten stehenden "Nachbarn" mit einem neuen internen Knoten verbunden usw. 8 Bootstrapping Alignment Sq1 Sq2 Sq3 Sq4 1 G G A A 2 T T C C 3 A A A A 4 G G A A 5 T T T C Pseudo-Alignment (Replikat) 6 A A A A 7 C C C C 8 T T C T 1 6 A A A A 2 1 G G A A 3 6 A A A A 4 8 T T C T 5 6 7 8 ... ... ... ... ... stelle zufällig ausgewählte Spalten neu zusammen, z. B. Spalte 6, 1, 6, 8, ... 9 Kontrolle der Ergebnisse Wie zuverlässig ist das Ergebnis? • keine Möglichkeit zur direkten Überprüfung! • Bootstrapping: Test auf Einfluß stochastischer Effekte - Annahme: Verwandtschaft nicht nur in Bereichen auf der Sequenz, sondern in der ganzen - dadurch spielt die Reihenfolge der Spalten innerhalb des multiplen Alignments keine Rolle - Spalten können mehrfach vorkommen oder fehlen - konstruiere Bäume aus Pseudo-Alignments derselben Länge - zähle, wie oft dieselben Verzweigungen in den neuen Bäumen wiedergefunden werden: Bootstrap-Wert - Werte über 90% sind sehr zuverlässig 10