Phylogenetische Bäume Kieu Trinh Do SS 2009 1. Einleitung Wie seit geraumer Zeit bekannt ist, hat Ähnlichkeit ihre Ursachen in gemeinsamer Abstammung. Es stellt sich aber die Frage, wie wir die evolutionäre Geschichte heutiger Spezies und die Verwandschaft zweier Arten klären können. Dazu wurden seit dem 19. Jhd. phylogenetische Bäume verwendet, die zunächst auf der Intuition und Erfahrung der Forscher beruhten, aber allmählich auch durch mathematische Methoden erstellt werden konnten. Es gibt heutzutage eine Vielzahl an Möglichkeiten, phylogenetische Bäume zu berechnen. Im Folgenden sollen insbesondere die merkmalsbasierten Methoden dargestellt werden. 2. Allgemeines zu Phylogenetischen Bäumen 2.1 Begriffsklärung und Zielsetzung Bevor tiefer in die Thematik eingegangen werden kann, müssen einige wichtige Begriffe geklärt werden. Der wichtigste Ausdruck in dieser Arbeit ist der Ausdruck der „Phylogenie“. Dieses Wort stammt aus dem Griechischen (phylon: Stamm, genesis: Entstehung) und beschreibt die Entwicklungsgeschichte einer Spezies oder einer taxonomischen Einheit (nach bestimmten Merkmalen klassifizierte Objekte). Ein Baum ist ein zusammenhängender, azyklischer Graph (abstrakte Struktur mit Kanten und Knoten), der entweder mit oder ohne Wurzel vorliegen kann. Die meisten Methoden erstellen einen ungewurzelten Baum, da nicht genügend Daten zur Verfügung stehen, um die Wurzel zu bestimmen. Dennoch ist es durch Methoden wie der Out-Group-Methode oder der Molecular-Clock-Methode möglich, aus dem unrooted tree einen rooted tree zu erstellen. Ein phylogenetischer Baum ist also ein Baum, der die Verwandtschaftsbeziehung zwischen einer Menge von Taxa darstellt und diese gruppiert. Ziel der Erstellung von phylogenetischen Bäumen ist das Rückschließen auf die evolutionäre Geschichte der heutigen Arten. Der Mangel an Daten über entfernte Vorfahren erweist sich jedoch als Problem, da man nicht mit hundertprozentiger Sicherheit davon ausgehen kann, dass ein Vorfahre wirklich ein Vorfahre bestimmter Taxa ist. Der phylogenetische Baum ist deshalb nur eine Hypothese. 2.2 Baum-Topologien Zunächst stellt sich die Frage, wie viele mögliche, verschiedene Bäume es für eine bestimmte Menge an Taxa gibt. Sei zunächst die Anzahl an Taxa n=3 gegeben. Wie in Tabelle 1 zu sehen ist, gibt es hierfür nur einen einzigen ungewurzelten Baum. Erhöht man jedoch die Taxazahl um 1 (n=4) ergeben sich bereits zwei weitere Möglichkeiten. Es ist deutlich zu sehen, dass die Anzahl an möglichen Bäumen mit der Zunahme der Taxa sehr stark ansteigt. Tatsächlich beeinflusst die Art der Merkmale die computerbasierte Lösung dieses Problems. 1 von 8 Wenn sie ungeordnet sind (d.h. wir wissen nicht, in welche Richtung sich ein Merkmal entwickelt hat), wird diese Angelegenheit NP-vollständig. Sind die Merkmale jedoch geordnet (d.h. wir wissen, dass die Merkmale sich über ein „Zwischenmerkmal“ entwickelt haben, können sie effizient durch Algorithmen gelöst werden. n N (=Anzahl an möglichen ungewurzelten Bäumen) 3 1 4 3 5 15 6 105 7 945 ... ... N= Tabelle 1: Anzahl an möglichen Bäumen für n Taxa 2.3 Ansätze zur Erstellung Phylogenetischer Bäume Zur Erstellung phylogenetischer Bäume gibt es im Wesentlichen drei verschiedene Ansätze: Merkmalsbasierte Verfahren Im hier entstandenen Baum stellen die Blätter die verglichenen Taxa, die Knoten die gemeinsamen Vorfahren und die Kanten die Merkmale dar. Ein Objekt besitzt also alle Merkmale, die den Pfad von der Wurzel bis zum Objekt bilden. Distanzbasierte Verfahren Distanzbasierte Verfahren beruhen auf der Tatsache, dass verwandte Taxa im Baum benachbart sind. Je größer also die Distanz zwischen zwei Taxa, desto mehr unterscheiden sie sich. Die Blätter stellen die Taxa, die Knoten die gemeinsamen Vorfahren und die Kanten die Distanzen zwischen Taxa und Knoten (oder Knoten und Knoten) dar. Wahrscheinlichkeitsbasierte Verfahren Hierbei werden für verschiedene Mutationen jeweils die Auftrittswahrscheinlichkeiten bestimmt. Anschließend werden alle möglichen Bäume berechnet und der Baum mit der höchsten Wahrscheinlichkeit wird als Lösung genommen (sehr rechenaufwendig bei großer Anzahl an Taxa) 3 Merkmalsbasierte Verfahren 3.1 Merkmalsbasierte Matrix als Grundlage 3.1.1 Definition der merkmalsbasierten Matrix Gegeben sei eine Menge O = {o1,... , on} von Objekten und eine Menge C = {c1,... , cm} von Merkmalen. Eine merkmalsbasierte Matrix ist eine binäre Matrix M mit n Zeilen und m Spalten. Die Reihen stellen Taxa dar, während die Spalten die Merkmale repräsentieren. Die Zelle M(i,j) codiert eine bestimmte Eigenschaft j für ein Taxa i, d.h. die Taxa werden als 2 von 8 Kombination ihrer Merkmale interpretiert. Es gibt eine endliche Anzahl an Merkmalen, deren Erscheinungsformen mit nichtnegativen Zahlen gekennzeichnet sind. Die Zeilen einer merkmalsbasierten Matrix werden auch als „state vectors“ bezeichnet. c1 c2 c3 c4 c5 c6 c7 o1 1 1 0 0 0 1 1 o2 0 0 1 0 1 0 1 o3 1 1 0 0 1 0 0 o4 0 1 1 1 0 1 0 o5 1 1 0 0 1 1 0 1, falls Objekt i Merkmal j besitzt M(i,j) = 0, sonst 3.1.2 Input-Daten Bevor man eine merkmalsbasierte Methode zur Rekonstruktion eines phylogenetischen Baumes wählt, sollte man sich eine grundlegende Frage bezüglich der gegebenen Merkmale stellen: Sind diese Merkmale sinnvoll und aussagekräftig genug? Die Input-Daten sind größtenteils diskrete Merkmale, wie beispielsweise die Schnabelform, die Anzahl an Fingern oder das Vorhandensein von Rückgrat oder Federn. Es können aber auch metabolische und regulatorische Eigenschaften sowie – auf molekularer Ebene – die Positionen der Basen in DNA oder RNA ausgewertet werden. Wir können die verwendeten Merkmale in ungeordnete (qualitative) Merkmale, geordnete (kladistische) Merkmale und direkte (polare) Merkmale klassifizieren. Qualitative Merkmale sind Merkmale, bei denen wir nicht wissen, wie sie sich verändert haben, sprich jedes Merkmal kann sich in jedes andere Merkmal entwickelt haben. Für kladistische Merkmale braucht der Nutzer zusätzliche Informationen, da die Umwandlung von Merkmalen in andere Merkmale vermutlich über ein so genanntes „Zwischenmerkmal“ gelaufen ist. Auch hier ist keine Richtungsangabe möglich, d.h. man weiß nicht, ob 0 oder 1 der ursprüngliche Phänotyp war. Im Gegensatz dazu geben uns polare Merkmale Richtungsangaben an. 3.2 Problemdarstellung der merkmalsbasierten Verfahren 3.2.1 Konvergenz/parallele Evolution Ein zu beachtendes Problem der Erstellung eines phylogenetischen Baumes ist die Konvergenz (parallele Evoluton), d.h. die Entwicklung von ähnlichen Merkmalen bei entfernt verwandten Arten. Dieses Phänomen kommt dadurch zustande, dass sich Lebewesen im Laufe der Evolution an ähnliche Umweltbedingungen anpassen und somit ähnliche Merkmale ausbilden. Wir können also nicht nur aufgrund von Ähnlichkeit auf nahe Verwandtschaft schließen, sondern müssen auch der Funktion eines Merkmals für einen Organismus Beachtung schenken. Typisches Beispiel sind die Flügel der Vögel und Fledermäuse: Fledermäuse sind – wie oftmals missverstanden – keine Vögel, sondern Säugetiere der Ordnung Fledertiere (Chiroptera). Die Flügel entstanden jeweils durch Anpassung an ihre ähnliche Umwelt und rührt nicht von Verwandtschaft her. Da nahezu alle Methoden zur Erstellung eines phylogenetischen Baumes annehmen, dass Taxa mit gleichen oder ähnlichen Erscheinungsformen eines Merkmals näher verwandt sind als Taxa mit unerschiedlichen Erscheinungsformen, kommt es unweigerlich zur Fehlkonstruktion des Baumes, falls die Analyse Objekte beinhaltet, die sich durch parallele Evolution ähnlich sind. 3 von 8 3.2.2 Umkehrungen Auch die Verhältnisse zwischen den unterschiedlichen Erscheinungsformen eines Merkmals müssen bei der Erstellung eines phylogenetischen Baumes beachtet werden. Angenommen es sei eine Matrix M gegeben und es haben die Taxa A,B,C und D bezüglich eines Merkmals c die folgenden Erscheinungsformen: A(c) = 1, B(c) = 0, C(c) = 1 und D(c) = 0. Zunächst werden A und B betrachtet und es wird angenommen, dass die Taxa A und B einen gemeinsamen Vorfahren X haben, der hinsichtlich Merkmal c die Erscheinungsform 0 hat, also X(c) = 0. Diese Annahme impliziert, dass 0 die Urform und 1 die abgeleitete Form des Merkmals c ist. Bezüglich desselben Merkmals haben nun C und D einen Vorfahren Y ≠ X mit der Erscheinungsform 1. In diesem Fall ist also 1 die Urform und 0 die abgeleitete Form. Eine Interpretation in Hinsicht auf Gewinn und Verlust kann dieses Phänomen erklären: Taxa D repräsentiert eine „Umkehrung“ zu der Erscheinungsform 1 seines Vorfahren Y. A hat bezüglich X das Merkmal c erworben, während D es bezüglich Y verloren hat. Durch das Phänomen der „Umkehrung“ kommt es zur scheinbaren Ähnlichkeit zwischen zwei Taxa und somit zur fehlerhaften Konstruktion des Baumes, wenn man von falschen Annahmen ausgeht. Im Hintergrund sollte bedacht werden, dass die entsprechenden Erscheinungsformen der Vorfahren nur hypothetisch sind, denn die Merkmalsausprägung eines Vorfahren ist weiterhin unbekannt. 3.2.2 Folgerungen Da sowohl Konvergenz als auch Umkehrung von Merkmalen in der Natur äußerst selten sind, wird für die Erstellung phylogentischer Bäume zunächst angenommen, dass sie nicht existieren oder deren Anzahl minimal ist. Weiterhin wird hinsichtlich der Entwicklung von Merkmalen davon ausgegangen, dass es sich sowohl um unabhängige Vererbung handelt als auch keine Rückentwicklungen stattfindet, sprich es gibt nur Entwicklungen von 0 nach 1 und alle zu betrachtenden Erscheinungsformen eines Merkmals entstammen einer „ursprünglichen Form“. Weiterhin gilt, dass die den Vorfahren zugeordneten Merkmale rein hypothetisch sind, also nichts über deren tatsächliche Merkmalsausprägungen aussagen. 4. Merkmalsbasierte Matrix und Perfekte Phylogenie Sei M eine binäre nxm Merkmalsmatrix. Ein perfekt-phylogenetischer Baum T für M ist ein Baum mit genau n Blättern, bei dem jedes Blatt genau ein Taxa darstellt und jedes Merkmal durch eine Kante gekennzeichnet wird. Außerdem gilt für jedes Taxa im Baum T: Die Merkmale, die durch die Kanten auf dem Pfad von der Wurzel bis zum Blatt o dargestellt werden sind genau die Merkmale, die o besitzt. 4.1 Existenz perfekter Phylogenie Theorem: Sei Oi die Menge der Zellen mit Wert 1 in Spalte i für i∈[1 ; n ] . Eine binäre Matrix läßt einen perfekt-phylogenetischen Baum dann und nur dann zu, wenn für jedes Spaltenpaar i, j die Mengen Oi und Oj disjunkt oder in einander enthalten sind. Es gilt also: Beweis des Theorems: 4 von 8 Angenommen M erlaubt eine perfekte Phylogenie und das Theorem sei nicht erfüllt. Da M binär ist, wissen wir, dass wir jedem Merkmal i eine Kante (u,v) im Baum T zuordnen können. Außerdem beinhalte der Unterbaum, der v als Wurzel hat, alle Knoten, die den Wert 1 für das Merkmal i haben und liege v tiefer als u. Jeder Knoten, der den Wert 0 hat, gehört also nicht zu diesem Unterbaum. Aufgrund der Annahme gibt es nun Taxa A, B und C, sodass A,B ϵ Oi und B,C ϵ Oj mit A∉O j und C ∉O i . Zunächst wird das Objekt B betrachtet: Da B ϵ Oi und B ϵ Oj, muss vom Blatt B zur Wurzel eine Kante (p, q) bezüglich des Merkmals i und eine Kante (r, s) bezüglich des Merkmals j existieren. Sei (p, q) im Baum höher als (r, s), dann beinhaltet der Unterbaum Tp, der p als Wurzel hat den Unterbaum Tr der r als Wurzel hat. Als nächstes betrachten wir Objekt C: Wie wir wissen ist C ϵ Oj , also C ϵ Tr. Aber andererseits ist C ∉O i , also C ∉T p , was ein Widerspruch ist, da Tp– wie vorhin erwähnt – Tr beinhaltet. Wäre (r, s) im Baum T höher als (p, q) gewesen, würde derselbe Widerspruch mit Objekt A auftreten. Nehmen wir jetzt an, dass alle Spaltenpaare von M die Bedingungen des Theorems erfüllen. Der Einfachheit halber nehmen wir zudem noch an, dass alle Spalten verschieden sind. Um einen gewurzelten Baum mit perfekter Phylogenie zu konstruieren, geht man induktiv folgendermaßen vor: Als Induktionsanfang haben wir nur ein Merkmal c. Dieses Merkmal teilt die Objekte in zwei Mengen A=Oc und B=Oc. Erstelle eine Wurzel und einen Knoten a, der die Objekte der Menge A beinhaltet, sowie einen Knoten b für die Objekte der Menge B. Verbinde den Knoten a zur Wurzel und kennzeichne die Kante zwischen a und der Wurzel mit 1. Verbinde b mit der Wurzel und lasse die Kante dazwischen unbeschriftet. Als finalen Schritt spaltet man jedes Kind der Wurzel – also die Knoten a und b – in so viele Blätter wie Objekte in diesen jeweiligen Mengen vorliegen. Der Baum, der dadurch ensteht hat eindeutig perfekte Phylogenie. Dies sei unser Basisfall, d.h. wir können einen Baum T für k Merkmale konstruieren, jedoch führen wir den letzten Schritt nicht aus und hängen keine Blätter an die Knoten. Das bedeutet, dass die Knoten immer noch Mengen von Objekte darstellen. Nun betrachten wir die Matrix M mit k+1 Merkmale und sei Merkmal j das k+1-te Merkmal, so dass Oi ⊄O j für alle i. Solch ein Merkmal existiert, wenn jede Spalte unterschiedlich ist. Nun können wir aufgrund der Induktionshypothese also den Baum T mit k Merkmalen erstellen und wenden uns dem letzten Merkmal j zu, welches auch die Menge der Objekte teilt. Aus dem Baum T sollten wir nun den Baum T' erstellen können, jedoch nur solange, wie die Zerlegung durch j die Objekte desselben Knotens teilt. Wenn dies nicht der Fall wäre, wären wir gezwungen, zwei Kanten mit j zu kennzeichnen, wodurch keine perfekte Phylogenie zustande kommen würde. Angenommen j teile die Objekte der Knoten a und b. Weil dies zwei unterschiedliche Knoten sind, muss ein Merkmal i existieren, das diese Knoten unterscheidet. Dann muss gelten: Oj∩Oi ≠ ∅ , da in einem dieser Knoten alle Objekte zu finden sind, die den Wert 1 bezüglich des Merkmals i haben. Da es aber mindestens ein Objekt im anderen Knoten gibt, das den Wert 1 bezüglich des Merkmals j hat, wissen wir, dass O j ⊄O i gilt. Nach der Definition von j ist Oi ⊄O j , also würde diese Erkenntnis einen Widerspruch zu unserer Annahme darstellen und somit unser Theorem beweisen. ■ Um unser Theorem etwas einfacher und kompakter zu beschreiben, benutzen wir den Ausdruck der Kompatibilität. Eine Menge von binären Merkmalen ist dann und nur dann kompatibel, wenn sie paarweise kompatibel sind. Die Definition der paarweisen Kompatibilität ergibt sich aus der Menge an Beziehungen, wie sie im Theorem beschrieben sind. 5 von 8 4.2 Erstellung eines perfekt-phylogenetischen Baumes Der Algorithmus zur Rekonstruktion eines phylogenetischen Baumes gliedert sich in zwei Hauptteile. Zunächst muss geprüft werden, ob die gegebene Matrix perfekte Phylogenie erlaubt und anschließend muss ein solcher Baum – falls der erste Teil true ergibt – konstruiert werden. 4.2.1 Algorithmus zum Prüfen auf Existenz perfekter Phylogenie Ein naiver Ansatz zum Prüfen auf perfekte Phylogenie wäre – nach unserem Theorem – der Vergleich von jeder Spalte mit jeder. Jeder Vergleich hat jeweils eine lineare Laufzeit von O(n), da es n Spalten gibt. Man muss O(m²) Vergleiche machen, also ergibt dies insgesamt O(n*m²), was eine äußerst schlechte Laufzeit für einen Algorithmus wäre. Um die Effzienz auf O(n*m) zu verbessern, nimmt man sich vor, jede Spalte nur einmal zu lesen, indem man die Spalten der Größe nach ordnet. Dazu interpretiert man jede Spalte als binäre Zahl mit der signifikantesten Stelle in Zeile 1 und sortiert die Spalten in M absteigend nach diesen Zahlen. Man geht im eigentlichen Algorithmus folgendermaßen vor: Zunächst sortiert man mittels Radix-Sort in O(nm) die Spalten der Größe nach. Danach löscht man alle Spalten, die identisch mit der Spalte zu ihrer Rechten sind (keine biologische Bedeutung, d.h. keine Auswirkungen auf den späteren Baum). Sei O die Menge der Zellen mit dem Wert 1, für jede Zelle M(i,j) ϵ O setze L(i,j) gleich dem größten Index k<j, so dass gilt M(i,k) ϵ O. Das heißt k ist die rechteste Spalte links von j mit M(i,k)=1. Falls solch eine Spalte nicht existiert ist k=-1, also L(i,j)=-1 und für jede Spalte j sei L(j) = max L(i,j) für alle i. Wenn für alle L(i,j) gilt L(i,j) = L(j), so dass M(i,j) ϵ O, dann existiert ein perfekt-phylogenetischer Baum. Erst wird also die Eigenschaft zweier Taxa gesucht, die sie als letztes gemeinsam haben und anschließend wird geprüft, ob alle Eigenschaften vor dieser übereinstimmen. Nachdem wir jede Spalte in der sortierten Matrix bearbeitet haben, können wir sie „vergessen“, da alle restlichen Spalten entweder mit ihr disjunkt oder aber Untermengen von ihr sind. 4.2.2 Algorithmus zur Konstruktion eines perfekt-phylogenetischen Baumes Die Idee hinter dem Algorithmus zur Kontruktion eines perfekt-phylogenetischen Baumes ist folgende: Zuerst wird eine Wurzel erstellt, die den aktuellen Knoten darstellt. Für jedes einzelne Objekt werden nun nacheinander die Merkmale mit Wert 1 betrachtet. Falls noch keine Kante mit dem besagten Merkmal vorhanden ist, erstellen wir einen neuen Knoten und verbinden ihn mit dem aktuellen Knoten, wobei wir die Kante mit diesem Merkmal kennzeichnen. Der gerade erstellte Knoten wird nun zum aktuellen Knoten und das nächste Merkmal wird betrachtet. Existiert bereits eine Kante mit dem Merkmal, das wir gerade analysieren, so wird einfach das Ende dieser Kante zum aktuellen Knoten und man geht zum nächsten Merkmal über. Hierdurch entsteht ein gewurzelter phylogenetischer Baum, der aber leicht entwurzelt werden kann, indem man die entsprechende Wurzel entfernt und deren Kinder verbindet. Jede Kante beschreibt also ein einziges Merkmal und jeder Pfad von der Wurzel zu einem Blatt stellt die Merkmale des Blattes dar. Die Laufzeit beträgt O(nm), da jedes Element von M nur einmal betrachtet wird, wobei bei jedem Element der Aufwand konstant ist. Auch ungeordnete Merkmale kann man mit dem genannten Algorithmus lösen, allerdings ist eine kleine Transformation nötig. Es gibt für dieses Problem keinen schnelleren Algorithmus als den oben beschriebenen. Jeder Algorithmus, der das Problem löst muss mindestens einmal jedes Element in der Matrix betrachten, weshalb die untere Schranke stets Ω(nm) beträgt. Das bedeutet, jeder Algorithmus hat eine Laufzeit, die größer oder gleich Ω(nm) ist. Daher ist der obige Algorithmus optimal. 6 von 8 5. Kompatibilität Beschäftigt man sich näher mit phylogenetischen Bäumen, kommt oft die Fragestellung, ob zwei Bäume (allgemeiner: Datensätze) den gleichen evolutionären Vorgang beschreiben, sprich ob sie zueinander kompatibel sind. Theorem: Zwei Bäume Ti und Tj sind kompatibel, wenn es einen Baum Tk gibt, der eine Verfeinerung von Ti und Tj ist. (Tk ist eine Verfeinerung eines Baumes Tk', wenn man Tk durch Kantenreduktionen aus Tk' erhält.) Das Kompatibililitätsproblem besteht darin zu erkennen, ob solch eine Verfeinerung zweier Bäume, die eine gemeinsam Schnittmenge an dargestellten Objekten haben, existiert und falls ja, diese Verfeinerung zu berechnen. Dazu geht man folgendermaßen vor: Im Baum T1 wird das erste Objekt bestimmt, das eine größere Anzahl an Nachbarn hat als dasselbe Objekt im Baum T2. T2 ist dann feiner als T1, wenn die Verfeinerung an dieser Stelle genauso viele Objekte enthält wie das Blatt in T1 und man ersetzt dieses Blatt durch die eben genannte Verfeinerung. Diese Schritte werden so oft wiederholt, bis keine weiteren Objekte mehr gefunden werden, die in T1 mehr Nachbarn haben als in T2. Anschließend wird derselbe Vorgang für Objekte in T2 gemacht. Falls es für jedes der besagten Blätter eine Verfeinerung im jeweils anderen Baum gibt, dann sind T1 und T2 kompatibel. Der beschriebene Algorithmus erlaubt es uns, für verschiedene Datensätze zu testen, ob sie dieselbe evolutionäre Aussage haben, und hat eine Laufzeit O(n). 6. Fazit Im hier vorgestellten Verfahren zur Rekonstruktion eines phylogenetischen Baumes und hinsichtlich der perfekten Phylogenie wurden die Bedingungen für brauchbare Input-Daten sehr stark eingeschränkt (nur binäre und diskrete Merkmale), weshalb eine reale Merkmalsmatrix eher keinen perfekt-phylogenetischen Baum erlaubt. Auch die fehlerhaft experimentell ermittelten Daten der Biologie und das Ignorieren von Konvergenz und Umkehrung vermeiden reale perfekte Phylogenie. Neben den Algorithmen für Merkmalsmatrices gibt es noch andere Methoden zur Erstellung eines phylogenetischen Baumes, wie beispielsweise die Neighbour-Joining, Maximum Likelihood-, UPGMAMethode, etc. Wahrscheinlich werden all diese Methoden dennoch nicht ausreichen um die wahren evolutionären Hintergründe aller Spezies zu bestimmen. 7 von 8 Literaturhinweise: [1] J. Setubal, J. Meidanis: Introduction to Computional Molecular Biology, PWS, 1997; Abschnitte 6.1, 6.2, 6.4 sowie Errata zu Lemma 6.1 [2] B. Hammer: Vorlesung zur Algorithmische Bioinformatik, TU Clausthal http://www2.in.tu-clausthal.de/~hammer/lectures/bioinf/phylogenie.pdf vom: 02.02.2006, zugegriffen am 23.04.2009 [3] Andreas Brieg: Hauptseminar AfS: Algrithmen der Bioinformatik – Phylogenetische Bäume, Vortrag vom 06.07.2007, TU Ilmenau http://eiche.theoinf.tu-ilmenau.de/lehre/secret/hs_afs_ss07/Brieg_Phylo.pdf vom: 06.07.2007, zugegriffen am 12.05.2009 [4] Ulf Leser: Vorlesung Bioinformatik der Humboldt Universität http://www.informatik.huberlin.de/forschung/gebiete/wbi/teaching/archive/ws0506/bioinformatik/24_phylogeny _parsimony.pdf. vom: Wintersemester 2005/2006, zugegriffen am 03.06.2009 [5] Evolutionary Trees and Perfect Phylogeny, Zentrum der Bioinformatik der Universität des Saarlandes fred.bioinf.uni-sb.de:4711/downloads/bioinfo_ws01/BioinfI8.ppt vom: Wintersemester 2001/2002, zugegriffen am 23.04.2009 [6] Wikipedia: Phylogenetischer Baum http://de.wikipedia.org/wiki/Phylogenetischer_Baum vom: 19.02.2009, zugegriffen am 23.04.2009 8 von 8