Phylogenetische Bäume - Lehr- und Forschungseinheit Bioinformatik

Phylogenetische Bäume
Kieu Trinh Do
SS 2009
1. Einleitung
Wie seit geraumer Zeit bekannt ist, hat Ähnlichkeit ihre Ursachen in gemeinsamer
Abstammung. Es stellt sich aber die Frage, wie wir die evolutionäre Geschichte heutiger
Spezies und die Verwandschaft zweier Arten klären können. Dazu wurden seit dem 19. Jhd.
phylogenetische Bäume verwendet, die zunächst auf der Intuition und Erfahrung der Forscher
beruhten, aber allmählich auch durch mathematische Methoden erstellt werden konnten. Es
gibt heutzutage eine Vielzahl an Möglichkeiten, phylogenetische Bäume zu berechnen. Im
Folgenden sollen insbesondere die merkmalsbasierten Methoden dargestellt werden.
2. Allgemeines zu Phylogenetischen Bäumen
2.1 Begriffsklärung und Zielsetzung
Bevor tiefer in die Thematik eingegangen werden kann, müssen einige wichtige Begriffe
geklärt werden. Der wichtigste Ausdruck in dieser Arbeit ist der Ausdruck der „Phylogenie“.
Dieses Wort stammt aus dem Griechischen (phylon: Stamm, genesis: Entstehung) und
beschreibt die Entwicklungsgeschichte einer Spezies oder einer taxonomischen Einheit (nach
bestimmten Merkmalen klassifizierte Objekte).
Ein Baum ist ein zusammenhängender, azyklischer Graph (abstrakte Struktur mit Kanten
und Knoten), der entweder mit oder ohne Wurzel vorliegen kann. Die meisten Methoden
erstellen einen ungewurzelten Baum, da nicht genügend Daten zur Verfügung stehen, um die
Wurzel zu bestimmen. Dennoch ist es durch Methoden wie der Out-Group-Methode oder der
Molecular-Clock-Methode möglich, aus dem unrooted tree einen rooted tree zu erstellen.
Ein phylogenetischer Baum ist also ein Baum, der die Verwandtschaftsbeziehung zwischen
einer Menge von Taxa darstellt und diese gruppiert.
Ziel der Erstellung von phylogenetischen Bäumen ist das Rückschließen auf die
evolutionäre Geschichte der heutigen Arten. Der Mangel an Daten über entfernte Vorfahren
erweist sich jedoch als Problem, da man nicht mit hundertprozentiger Sicherheit davon
ausgehen kann, dass ein Vorfahre wirklich ein Vorfahre bestimmter Taxa ist. Der
phylogenetische Baum ist deshalb nur eine Hypothese.
2.2 Baum-Topologien
Zunächst stellt sich die Frage, wie viele mögliche, verschiedene Bäume es für eine
bestimmte Menge an Taxa gibt. Sei zunächst die Anzahl an Taxa n=3 gegeben. Wie in Tabelle 1
zu sehen ist, gibt es hierfür nur einen einzigen ungewurzelten Baum. Erhöht man jedoch die
Taxazahl um 1 (n=4) ergeben sich bereits zwei weitere Möglichkeiten. Es ist deutlich zu
sehen, dass die Anzahl an möglichen Bäumen mit der Zunahme der Taxa sehr stark ansteigt.
Tatsächlich beeinflusst die Art der Merkmale die computerbasierte Lösung dieses Problems.
1 von 8
Wenn sie ungeordnet sind (d.h. wir wissen nicht, in welche Richtung sich ein Merkmal
entwickelt hat), wird diese Angelegenheit NP-vollständig. Sind die Merkmale jedoch geordnet
(d.h. wir wissen, dass die Merkmale sich über ein „Zwischenmerkmal“ entwickelt haben,
können sie effizient durch Algorithmen gelöst werden.
n
N (=Anzahl an möglichen
ungewurzelten Bäumen)
3
1
4
3
5
15
6
105
7
945
...
...
N=
Tabelle 1: Anzahl an möglichen Bäumen für n Taxa
2.3 Ansätze zur Erstellung Phylogenetischer Bäume
Zur Erstellung phylogenetischer Bäume gibt es im Wesentlichen drei verschiedene Ansätze:
Merkmalsbasierte Verfahren
Im hier entstandenen Baum stellen die Blätter die verglichenen Taxa, die Knoten die
gemeinsamen Vorfahren und die Kanten die Merkmale dar. Ein Objekt besitzt also alle
Merkmale, die den Pfad von der Wurzel bis zum Objekt bilden.
Distanzbasierte Verfahren
Distanzbasierte Verfahren beruhen auf der Tatsache, dass verwandte Taxa im Baum
benachbart sind. Je größer also die Distanz zwischen zwei Taxa, desto mehr unterscheiden sie
sich. Die Blätter stellen die Taxa, die Knoten die gemeinsamen Vorfahren und die Kanten die
Distanzen zwischen Taxa und Knoten (oder Knoten und Knoten) dar.
Wahrscheinlichkeitsbasierte Verfahren
Hierbei werden für verschiedene Mutationen jeweils die Auftrittswahrscheinlichkeiten
bestimmt. Anschließend werden alle möglichen Bäume berechnet und der Baum mit der
höchsten Wahrscheinlichkeit wird als Lösung genommen (sehr rechenaufwendig bei großer
Anzahl an Taxa)
3 Merkmalsbasierte Verfahren
3.1 Merkmalsbasierte Matrix als Grundlage
3.1.1 Definition der merkmalsbasierten Matrix
Gegeben sei eine Menge O = {o1,... , on} von Objekten und eine Menge C = {c1,... , cm} von
Merkmalen. Eine merkmalsbasierte Matrix ist eine binäre Matrix M mit n Zeilen und m
Spalten. Die Reihen stellen Taxa dar, während die Spalten die Merkmale repräsentieren. Die
Zelle M(i,j) codiert eine bestimmte Eigenschaft j für ein Taxa i, d.h. die Taxa werden als
2 von 8
Kombination ihrer Merkmale interpretiert. Es gibt eine endliche Anzahl an Merkmalen, deren
Erscheinungsformen mit nichtnegativen Zahlen gekennzeichnet sind. Die Zeilen einer
merkmalsbasierten Matrix werden auch als „state vectors“ bezeichnet.
c1
c2 c3
c4 c5 c6 c7
o1
1
1
0
0
0
1
1
o2
0
0
1
0
1
0
1
o3
1
1
0
0
1
0
0
o4
0
1
1
1
0
1
0
o5
1
1
0
0
1
1
0
1, falls Objekt i Merkmal j besitzt
M(i,j) =
0, sonst
3.1.2 Input-Daten
Bevor man eine merkmalsbasierte Methode zur Rekonstruktion eines phylogenetischen
Baumes wählt, sollte man sich eine grundlegende Frage bezüglich der gegebenen Merkmale
stellen: Sind diese Merkmale sinnvoll und aussagekräftig genug? Die Input-Daten sind
größtenteils diskrete Merkmale, wie beispielsweise die Schnabelform, die Anzahl an Fingern
oder das Vorhandensein von Rückgrat oder Federn. Es können aber auch metabolische und
regulatorische Eigenschaften sowie – auf molekularer Ebene – die Positionen der Basen in
DNA oder RNA ausgewertet werden.
Wir können die verwendeten Merkmale in ungeordnete (qualitative) Merkmale, geordnete
(kladistische) Merkmale und direkte (polare) Merkmale klassifizieren. Qualitative Merkmale
sind Merkmale, bei denen wir nicht wissen, wie sie sich verändert haben, sprich jedes
Merkmal kann sich in jedes andere Merkmal entwickelt haben. Für kladistische Merkmale
braucht der Nutzer zusätzliche Informationen, da die Umwandlung von Merkmalen in andere
Merkmale vermutlich über ein so genanntes „Zwischenmerkmal“ gelaufen ist. Auch hier ist
keine Richtungsangabe möglich, d.h. man weiß nicht, ob 0 oder 1 der ursprüngliche Phänotyp
war. Im Gegensatz dazu geben uns polare Merkmale Richtungsangaben an.
3.2 Problemdarstellung der merkmalsbasierten Verfahren
3.2.1 Konvergenz/parallele Evolution
Ein zu beachtendes Problem der Erstellung eines phylogenetischen Baumes ist die
Konvergenz (parallele Evoluton), d.h. die Entwicklung von ähnlichen Merkmalen bei entfernt
verwandten Arten. Dieses Phänomen kommt dadurch zustande, dass sich Lebewesen im Laufe
der Evolution an ähnliche Umweltbedingungen anpassen und somit ähnliche Merkmale
ausbilden. Wir können also nicht nur aufgrund von Ähnlichkeit auf nahe Verwandtschaft
schließen, sondern müssen auch der Funktion eines Merkmals für einen Organismus
Beachtung schenken. Typisches Beispiel sind die Flügel der Vögel und Fledermäuse:
Fledermäuse sind – wie oftmals missverstanden – keine Vögel, sondern Säugetiere der
Ordnung Fledertiere (Chiroptera). Die Flügel entstanden jeweils durch Anpassung an ihre
ähnliche Umwelt und rührt nicht von Verwandtschaft her. Da nahezu alle Methoden zur
Erstellung eines phylogenetischen Baumes annehmen, dass Taxa mit gleichen oder ähnlichen
Erscheinungsformen eines Merkmals näher verwandt sind als Taxa mit unerschiedlichen
Erscheinungsformen, kommt es unweigerlich zur Fehlkonstruktion des Baumes, falls die
Analyse Objekte beinhaltet, die sich durch parallele Evolution ähnlich sind.
3 von 8
3.2.2 Umkehrungen
Auch die Verhältnisse zwischen den unterschiedlichen Erscheinungsformen eines Merkmals
müssen bei der Erstellung eines phylogenetischen Baumes beachtet werden. Angenommen es
sei eine Matrix M gegeben und es haben die Taxa A,B,C und D bezüglich eines Merkmals c
die folgenden Erscheinungsformen: A(c) = 1, B(c) = 0, C(c) = 1 und D(c) = 0. Zunächst
werden A und B betrachtet und es wird angenommen, dass die Taxa A und B einen
gemeinsamen Vorfahren X haben, der hinsichtlich Merkmal c die Erscheinungsform 0 hat, also
X(c) = 0. Diese Annahme impliziert, dass 0 die Urform und 1 die abgeleitete Form des
Merkmals c ist. Bezüglich desselben Merkmals haben nun C und D einen Vorfahren Y ≠ X mit
der Erscheinungsform 1. In diesem Fall ist also 1 die Urform und 0 die abgeleitete Form. Eine
Interpretation in Hinsicht auf Gewinn und Verlust kann dieses Phänomen erklären: Taxa D
repräsentiert eine „Umkehrung“ zu der Erscheinungsform 1 seines Vorfahren Y. A hat
bezüglich X das Merkmal c erworben, während D es bezüglich Y verloren hat. Durch das
Phänomen der „Umkehrung“ kommt es zur scheinbaren Ähnlichkeit zwischen zwei Taxa und
somit zur fehlerhaften Konstruktion des Baumes, wenn man von falschen Annahmen ausgeht.
Im Hintergrund sollte bedacht werden, dass die entsprechenden Erscheinungsformen der
Vorfahren nur hypothetisch sind, denn die Merkmalsausprägung eines Vorfahren ist weiterhin
unbekannt.
3.2.2 Folgerungen
Da sowohl Konvergenz als auch Umkehrung von Merkmalen in der Natur äußerst selten
sind, wird für die Erstellung phylogentischer Bäume zunächst angenommen, dass sie nicht
existieren oder deren Anzahl minimal ist. Weiterhin wird hinsichtlich der Entwicklung von
Merkmalen davon ausgegangen, dass es sich sowohl um unabhängige Vererbung handelt als
auch keine Rückentwicklungen stattfindet, sprich es gibt nur Entwicklungen von 0 nach 1 und
alle zu betrachtenden Erscheinungsformen eines Merkmals entstammen einer „ursprünglichen
Form“. Weiterhin gilt, dass die den Vorfahren zugeordneten Merkmale rein hypothetisch sind,
also nichts über deren tatsächliche Merkmalsausprägungen aussagen.
4. Merkmalsbasierte Matrix und Perfekte Phylogenie
Sei M eine binäre nxm Merkmalsmatrix. Ein perfekt-phylogenetischer Baum T für M ist ein
Baum mit genau n Blättern, bei dem jedes Blatt genau ein Taxa darstellt und jedes Merkmal
durch eine Kante gekennzeichnet wird. Außerdem gilt für jedes Taxa im Baum T: Die
Merkmale, die durch die Kanten auf dem Pfad von der Wurzel bis zum Blatt o dargestellt
werden sind genau die Merkmale, die o besitzt.
4.1 Existenz perfekter Phylogenie
Theorem:
Sei Oi die Menge der Zellen mit Wert 1 in Spalte i für i∈[1 ; n ] . Eine binäre Matrix läßt
einen perfekt-phylogenetischen Baum dann und nur dann zu, wenn für jedes Spaltenpaar i, j
die Mengen Oi und Oj disjunkt oder in einander enthalten sind. Es gilt also:
Beweis des Theorems:
4 von 8
Angenommen M erlaubt eine perfekte Phylogenie und das Theorem sei nicht erfüllt. Da M
binär ist, wissen wir, dass wir jedem Merkmal i eine Kante (u,v) im Baum T zuordnen können.
Außerdem beinhalte der Unterbaum, der v als Wurzel hat, alle Knoten, die den Wert 1 für das
Merkmal i haben und liege v tiefer als u. Jeder Knoten, der den Wert 0 hat, gehört also nicht zu
diesem Unterbaum. Aufgrund der Annahme gibt es nun Taxa A, B und C, sodass A,B ϵ Oi und
B,C ϵ Oj mit A∉O j und C ∉O i . Zunächst wird das Objekt B betrachtet: Da B ϵ Oi und B ϵ
Oj, muss vom Blatt B zur Wurzel eine Kante (p, q) bezüglich des Merkmals i und eine Kante
(r, s) bezüglich des Merkmals j existieren. Sei (p, q) im Baum höher als (r, s), dann beinhaltet
der Unterbaum Tp, der p als Wurzel hat den Unterbaum Tr der r als Wurzel hat. Als nächstes
betrachten wir Objekt C: Wie wir wissen ist C ϵ Oj , also C ϵ Tr. Aber andererseits ist C ∉O i
, also C ∉T p , was ein Widerspruch ist, da Tp– wie vorhin erwähnt – Tr beinhaltet. Wäre (r,
s) im Baum T höher als (p, q) gewesen, würde derselbe Widerspruch mit Objekt A auftreten.
Nehmen wir jetzt an, dass alle Spaltenpaare von M die Bedingungen des Theorems erfüllen.
Der Einfachheit halber nehmen wir zudem noch an, dass alle Spalten verschieden sind. Um
einen gewurzelten Baum mit perfekter Phylogenie zu konstruieren, geht man induktiv
folgendermaßen vor: Als Induktionsanfang haben wir nur ein Merkmal c. Dieses Merkmal teilt
die Objekte in zwei Mengen A=Oc und B=Oc. Erstelle eine Wurzel und einen Knoten a, der die
Objekte der Menge A beinhaltet, sowie einen Knoten b für die Objekte der Menge B. Verbinde
den Knoten a zur Wurzel und kennzeichne die Kante zwischen a und der Wurzel mit 1.
Verbinde b mit der Wurzel und lasse die Kante dazwischen unbeschriftet. Als finalen Schritt
spaltet man jedes Kind der Wurzel – also die Knoten a und b – in so viele Blätter wie Objekte
in diesen jeweiligen Mengen vorliegen. Der Baum, der dadurch ensteht hat eindeutig perfekte
Phylogenie. Dies sei unser Basisfall, d.h. wir können einen Baum T für k Merkmale
konstruieren, jedoch führen wir den letzten Schritt nicht aus und hängen keine Blätter an die
Knoten. Das bedeutet, dass die Knoten immer noch Mengen von Objekte darstellen. Nun
betrachten wir die Matrix M mit k+1 Merkmale und sei Merkmal j das k+1-te Merkmal, so
dass Oi ⊄O j für alle i. Solch ein Merkmal existiert, wenn jede Spalte unterschiedlich ist.
Nun können wir aufgrund der Induktionshypothese also den Baum T mit k Merkmalen
erstellen und wenden uns dem letzten Merkmal j zu, welches auch die Menge der Objekte teilt.
Aus dem Baum T sollten wir nun den Baum T' erstellen können, jedoch nur solange, wie die
Zerlegung durch j die Objekte desselben Knotens teilt. Wenn dies nicht der Fall wäre, wären
wir gezwungen, zwei Kanten mit j zu kennzeichnen, wodurch keine perfekte Phylogenie
zustande kommen würde. Angenommen j teile die Objekte der Knoten a und b. Weil dies zwei
unterschiedliche Knoten sind, muss ein Merkmal i existieren, das diese Knoten unterscheidet.
Dann muss gelten: Oj∩Oi ≠ ∅ , da in einem dieser Knoten alle Objekte zu finden sind, die
den Wert 1 bezüglich des Merkmals i haben. Da es aber mindestens ein Objekt im anderen
Knoten gibt, das den Wert 1 bezüglich des Merkmals j hat, wissen wir, dass O j ⊄O i gilt.
Nach der Definition von j ist Oi ⊄O j , also würde diese Erkenntnis einen Widerspruch zu
unserer Annahme darstellen und somit unser Theorem beweisen.
■
Um unser Theorem etwas einfacher und kompakter zu beschreiben, benutzen wir den
Ausdruck der Kompatibilität. Eine Menge von binären Merkmalen ist dann und nur dann
kompatibel, wenn sie paarweise kompatibel sind. Die Definition der paarweisen
Kompatibilität ergibt sich aus der Menge an Beziehungen, wie sie im Theorem beschrieben
sind.
5 von 8
4.2 Erstellung eines perfekt-phylogenetischen Baumes
Der Algorithmus zur Rekonstruktion eines phylogenetischen Baumes gliedert sich in zwei
Hauptteile. Zunächst muss geprüft werden, ob die gegebene Matrix perfekte Phylogenie
erlaubt und anschließend muss ein solcher Baum – falls der erste Teil true ergibt – konstruiert
werden.
4.2.1 Algorithmus zum Prüfen auf Existenz perfekter Phylogenie
Ein naiver Ansatz zum Prüfen auf perfekte Phylogenie wäre – nach unserem Theorem – der
Vergleich von jeder Spalte mit jeder. Jeder Vergleich hat jeweils eine lineare Laufzeit von
O(n), da es n Spalten gibt. Man muss O(m²) Vergleiche machen, also ergibt dies insgesamt
O(n*m²), was eine äußerst schlechte Laufzeit für einen Algorithmus wäre. Um die Effzienz auf
O(n*m) zu verbessern, nimmt man sich vor, jede Spalte nur einmal zu lesen, indem man die
Spalten der Größe nach ordnet. Dazu interpretiert man jede Spalte als binäre Zahl mit der
signifikantesten Stelle in Zeile 1 und sortiert die Spalten in M absteigend nach diesen Zahlen.
Man geht im eigentlichen Algorithmus folgendermaßen vor: Zunächst sortiert man mittels
Radix-Sort in O(nm) die Spalten der Größe nach. Danach löscht man alle Spalten, die
identisch mit der Spalte zu ihrer Rechten sind (keine biologische Bedeutung, d.h. keine
Auswirkungen auf den späteren Baum). Sei O die Menge der Zellen mit dem Wert 1, für jede
Zelle M(i,j) ϵ O setze L(i,j) gleich dem größten Index k<j, so dass gilt M(i,k) ϵ O. Das heißt k
ist die rechteste Spalte links von j mit M(i,k)=1. Falls solch eine Spalte nicht existiert ist k=-1,
also L(i,j)=-1 und für jede Spalte j sei L(j) = max L(i,j) für alle i. Wenn für alle L(i,j) gilt L(i,j)
= L(j), so dass M(i,j) ϵ O, dann existiert ein perfekt-phylogenetischer Baum. Erst wird also die
Eigenschaft zweier Taxa gesucht, die sie als letztes gemeinsam haben und anschließend wird
geprüft, ob alle Eigenschaften vor dieser übereinstimmen. Nachdem wir jede Spalte in der
sortierten Matrix bearbeitet haben, können wir sie „vergessen“, da alle restlichen Spalten
entweder mit ihr disjunkt oder aber Untermengen von ihr sind.
4.2.2 Algorithmus zur Konstruktion eines perfekt-phylogenetischen Baumes
Die Idee hinter dem Algorithmus zur Kontruktion eines perfekt-phylogenetischen Baumes
ist folgende: Zuerst wird eine Wurzel erstellt, die den aktuellen Knoten darstellt. Für jedes
einzelne Objekt werden nun nacheinander die Merkmale mit Wert 1 betrachtet. Falls noch
keine Kante mit dem besagten Merkmal vorhanden ist, erstellen wir einen neuen Knoten und
verbinden ihn mit dem aktuellen Knoten, wobei wir die Kante mit diesem Merkmal
kennzeichnen. Der gerade erstellte Knoten wird nun zum aktuellen Knoten und das nächste
Merkmal wird betrachtet. Existiert bereits eine Kante mit dem Merkmal, das wir gerade
analysieren, so wird einfach das Ende dieser Kante zum aktuellen Knoten und man geht zum
nächsten Merkmal über. Hierdurch entsteht ein gewurzelter phylogenetischer Baum, der aber
leicht entwurzelt werden kann, indem man die entsprechende Wurzel entfernt und deren
Kinder verbindet. Jede Kante beschreibt also ein einziges Merkmal und jeder Pfad von der
Wurzel zu einem Blatt stellt die Merkmale des Blattes dar. Die Laufzeit beträgt O(nm), da
jedes Element von M nur einmal betrachtet wird, wobei bei jedem Element der Aufwand
konstant ist.
Auch ungeordnete Merkmale kann man mit dem genannten Algorithmus lösen, allerdings
ist eine kleine Transformation nötig. Es gibt für dieses Problem keinen schnelleren
Algorithmus als den oben beschriebenen. Jeder Algorithmus, der das Problem löst muss
mindestens einmal jedes Element in der Matrix betrachten, weshalb die untere Schranke stets
Ω(nm) beträgt. Das bedeutet, jeder Algorithmus hat eine Laufzeit, die größer oder gleich
Ω(nm) ist. Daher ist der obige Algorithmus optimal.
6 von 8
5. Kompatibilität
Beschäftigt man sich näher mit phylogenetischen Bäumen, kommt oft die Fragestellung,
ob zwei Bäume (allgemeiner: Datensätze) den gleichen evolutionären Vorgang beschreiben,
sprich ob sie zueinander kompatibel sind.
Theorem: Zwei Bäume Ti und Tj sind kompatibel, wenn es einen Baum Tk gibt, der eine
Verfeinerung von Ti und Tj ist. (Tk ist eine Verfeinerung eines Baumes Tk', wenn man Tk durch
Kantenreduktionen aus Tk' erhält.)
Das Kompatibililitätsproblem besteht darin zu erkennen, ob solch eine Verfeinerung zweier
Bäume, die eine gemeinsam Schnittmenge an dargestellten Objekten haben, existiert und falls
ja, diese Verfeinerung zu berechnen. Dazu geht man folgendermaßen vor: Im Baum T1 wird
das erste Objekt bestimmt, das eine größere Anzahl an Nachbarn hat als dasselbe Objekt im
Baum T2. T2 ist dann feiner als T1, wenn die Verfeinerung an dieser Stelle genauso viele
Objekte enthält wie das Blatt in T1 und man ersetzt dieses Blatt durch die eben genannte
Verfeinerung. Diese Schritte werden so oft wiederholt, bis keine weiteren Objekte mehr
gefunden werden, die in T1 mehr Nachbarn haben als in T2. Anschließend wird derselbe
Vorgang für Objekte in T2 gemacht. Falls es für jedes der besagten Blätter eine Verfeinerung
im jeweils anderen Baum gibt, dann sind T1 und T2 kompatibel. Der beschriebene Algorithmus
erlaubt es uns, für verschiedene Datensätze zu testen, ob sie dieselbe evolutionäre Aussage
haben, und hat eine Laufzeit O(n).
6. Fazit
Im hier vorgestellten Verfahren zur Rekonstruktion eines phylogenetischen Baumes und
hinsichtlich der perfekten Phylogenie wurden die Bedingungen für brauchbare Input-Daten
sehr stark eingeschränkt (nur binäre und diskrete Merkmale), weshalb eine reale
Merkmalsmatrix eher keinen perfekt-phylogenetischen Baum erlaubt. Auch die fehlerhaft
experimentell ermittelten Daten der Biologie und das Ignorieren von Konvergenz und
Umkehrung vermeiden reale perfekte Phylogenie. Neben den Algorithmen für
Merkmalsmatrices gibt es noch andere Methoden zur Erstellung eines phylogenetischen
Baumes, wie beispielsweise die Neighbour-Joining, Maximum Likelihood-, UPGMAMethode, etc. Wahrscheinlich werden all diese Methoden dennoch nicht ausreichen um die
wahren evolutionären Hintergründe aller Spezies zu bestimmen.
7 von 8
Literaturhinweise:
[1]
J. Setubal, J. Meidanis: Introduction to Computional Molecular Biology, PWS, 1997; Abschnitte
6.1, 6.2, 6.4 sowie Errata zu Lemma 6.1
[2]
B. Hammer: Vorlesung zur Algorithmische Bioinformatik, TU Clausthal
http://www2.in.tu-clausthal.de/~hammer/lectures/bioinf/phylogenie.pdf
vom: 02.02.2006, zugegriffen am 23.04.2009
[3]
Andreas Brieg: Hauptseminar AfS: Algrithmen der Bioinformatik – Phylogenetische Bäume,
Vortrag vom 06.07.2007, TU Ilmenau
http://eiche.theoinf.tu-ilmenau.de/lehre/secret/hs_afs_ss07/Brieg_Phylo.pdf
vom: 06.07.2007, zugegriffen am 12.05.2009
[4]
Ulf Leser: Vorlesung Bioinformatik der Humboldt Universität
http://www.informatik.huberlin.de/forschung/gebiete/wbi/teaching/archive/ws0506/bioinformatik/24_phylogeny
_parsimony.pdf.
vom: Wintersemester 2005/2006, zugegriffen am 03.06.2009
[5]
Evolutionary Trees and Perfect Phylogeny, Zentrum der Bioinformatik der Universität des
Saarlandes
fred.bioinf.uni-sb.de:4711/downloads/bioinfo_ws01/BioinfI8.ppt
vom: Wintersemester 2001/2002, zugegriffen am 23.04.2009
[6]
Wikipedia: Phylogenetischer Baum
http://de.wikipedia.org/wiki/Phylogenetischer_Baum
vom: 19.02.2009, zugegriffen am 23.04.2009
8 von 8