Kapitel 7: Erforschung der Evolution Moleküle kann man aufgrund ihrer dreidimensionalen Struktur in Familien einordnen und so den Entwicklungsweg nachvollziehen (z.B. die menschliche und die RinderRibonuclease sind sich sehr ähnlich). Das Problem dabei ist aber, dass erst von wenigen Proteinen die Struktur bekannt ist. Deshalb sind Sequenzvergleiche zu einem wichtigen Instrument geworden. Denn man kennt Basen- und Aminosäuresequenzen von vielen Proteinen. Wenn man die beiden Methoden kombiniert, kann man viel über Funktion- und Wirkmechanismen, Beziehungen zu bereits bekannten Molekülen, evolutionären Ursprung und den Zeitpunkt herausragender evolutionärer Ereignisse dieses Proteins herausfinden. 7.1 Homologien Homologe Moleküle: abstammen. Moleküle, die von einem gemeinsamen Vorfahren Paraloge Moleküle: Homologe Moleküle innerhalb von einer Art (unterscheiden sich in Einzelheitien ihrer biochemischen Funktion) Orthologen Moleküle: Homologe Moleküle in verschiedenen Arten (biochemische Funktion oft sehr ähnlich oder identisch; Informationen über evolutionäre Geschichte) Eine Homologie äussert sich meist durch eine grosse Ähnlichkeit in der Basen- und Aminosäurensequenz und in der dreidimensionalen Struktur. 7.2 Aufdeckung von Homologien Um Proteine zu analysieren eignet sich die Aminosäuresequenzierung am besten. Um nun 2 Aminosäuren miteinander zu vergleichen braucht man eine Methode, die sich Sequenzalignment nennt. Dabei werden 2 Aminosäuresequenzen nebeneinander gelegt und so lange gegeneinander weiter geschoben, bis man die meisten Sequenzübereinstimmung (Alignements) gefunden hat. Um mehrere solche Alignements zu verbinden, kann man bei der einen Aminosäuresequenz auch Lücken einfügen (Insertionen) oder Aminosäuren ausschneiden (Deletionen), wie dies im Laufe der Evolution auch geschehen ist (z.B. bei einer der vier Hämoglobinketten im Vergleich mit der Myoglobinkette findet man 23 Übereinstimmungen über die Ketten verteilt und 22 Übereinstimmungen gegen Ende der Sequenz, durch Einfügen von Lücken und Ausschneiden von Aminosäuren gelingt es, eine grössere Übereinstimmungen zu erreichen). Um eine sinnlose Anhäufung von Lücken zu vermeiden, hat man ein Punktesystem eingeführt; bei jeder Übereinstimmung gibt es 10 Punkte und für jede Lücke werden 25 Punkte abgezogen. Die Gesamtzahl, die sich daraus ergibt nennt man Alignmentpunkte. 7.2.1 Statistische Signifikanz von Alignments Man kann den Prozentsatz der Übereinstimmung ausrechnen, weiss dann aber noch nicht, ob die Ähnlichkeit rein zufällig, oder ob sie evolutiv begründet ist. Um dies zu überprüfen, durchmischt man eine der beiden Aminosäuresequenzen und stellt einen neuen Sequenzvergleich an. Dies wiederholt man viele Male und erhält so eine Verteilung, welche für jede mögliche Punktzahl die Anzahl an durchmischten Sequenzen zeigt. Wenn man die Punktezahl der ursprünglichen Aminosäuresequenz mit den zufällig gebildeten vergleicht und die ursprüngliche weit über dem Durchschnitt liegt, kann man ziemlich sicher sein, dass die beiden Sequenzen homolog sind. 7.2.2 Entferntere evolutionäre Beziehungen In der vorher beschriebenen Methode, werden nur identische Aminosäuren berücksichtigt. Es gibt aber auch viele Aminosäuren die sich sehr ähnlich sind. Sie lassen sich aufgrund verschiedener Kriterien einteilen (z.B. geladene, polare, grosse hydrophobe,…) Wenn ähnliche Aminosäuren gegeneinander ausgetauscht werden, hat dies meist keinen grossen Einfluss auf die Funktion (konservative Substitution). Solche Substitutionen sind für die Evolution wahrscheinlicher, als die radikale Veränderung von Substituenten. Dafür hat man nun ein Punktesystem entwickelt, das Homologien zwischen weniger offensichtlich verwandten Sequenzen entdeckt. Es gibt viele Punkte, wenn ein Substituent für eine bestimmte Aminosäure häufig vorkommt (also ähnlich ist), ein hoher negativer Wert wird erreicht, wenn ein Substituent selten oder nie beobachtet wird. Faustregeln: Bei Sequenzlängen über 100 Aminosäuren ist eine Sequenzidentität von über 25 % mit grosser Wahrscheinlichkeit nicht bloss zufällig. => Sequenzen sind homolog Sind zwei Sequenzen hingegen zu weniger als 15 % identisch, eher keine Homologie feststellbar Bei Sequenzen zwischen 15 und 25% Identität sind weitere Analysen notwendig, um die Signifikanz der Übereinstimmung zu bewerten. 7.2.3 Mithilfe von Datenbanken Hat man die Sequenz eines Proteins erstmals bestimmt, kann ein Vergleich mit allen bereits charakterisierten Sequenzen hervorragende Einblicke in dessen evolutionäre Verwandtschaftsbeziehungen und damit in seine Struktur und Funktion vermitteln. 7.3 Die Untersuchung der dreidimensionalen Struktur Biomoleküle funktionieren als komplexe dreidimensionale Strukturen und nicht als lineare Polymere. Die Mutationen mögen zwar bei den Aminosäuresequenzen geschehen, auswirken wird sich das aber auf die Funktion. 7.3.1 Tertiär und Primärstruktur Im Laufe der Evolution sind die dreidimensionalen Strukturen viel besser konserviert worden, als die Primärstruktur. Deutlich wird dies beispielsweise bei den Globinen. Im Vergleich sind menschliches Myoglobin und Leghämoglobin aus der Lupine verblüffend ähnlich, was die Struktur betrifft, obwohl nur 15.6% Sequenzübereinstimmung besteht. Dies spricht dafür, dass das Gerüst, welches die Hämgruppe bindet und die reversible Bindung von Sauerstoff ermöglicht, über einen langen Evolutionszeitraum hinweg konserviert worden ist. Es gibt aber auch Ähnlichkeiten zwischen Proteinen, die man noch weniger erwarten würde, meist dann, wenn sie völlig verschiedene biologische Rollen einnehmen. Die Suche nach solchen verwandtschaftlichen Beziehungen wird heute meist mit dem Computer durchgeführt, so können schnell und effizient Strukturen verglichen werden. 7.3.2 dreidimensionale Strukturen und Auswertung von Sequenzvergleichen Je nach dem, wie wichtig eine Region oder ein Aminosäurerest für die Funktion eines Proteins ist, wird es stärker konserviert als andere. Die Herstellung von Sequenzvorlagen (Sequence templates) kann zur Identifizierung neuer Familienmitglieder beitragen, die mit anderen Mitteln vielleicht unentdeckt blieben. Dabei nimmt man als Sequenzvorlagen konservierte Reste, die strukturell und funktionell wichtig und für eine bestimmte Familie charakteristisch sind. 7.3.3 Motivwiederholungen lassen sich durch Sequenzvergleiche innerhalb einer Sequenz nachweisen Über 10% aller Proteine enthalten 2 oder mehr Domänen, die einander ähneln. Beim Eigendiagonalen Diagramm (selfdiagonal plot) vergleicht man die Sequenz sozusagen mit sich selbst, indem man die Proteinsequenz sowohl in vertikaler als auch horizontaler Richtung jeweils vom Amino – zum Carboxylende hin aufträgt. So kann man Motivwiederholungen innerhalb der Aminosäuresequenz eines Proteins auffinden. Die zentrale Diagonale entspricht dabei dem Alignment der Sequenz mit sich selbst. 7.3.4 Konvergente Evolution: gemeinsame Lösungen für biochem. Probleme divergente Evolution: konvergente Evolution: Proteine, die von einem gemeinsamen Vorfahren abstammen. Ganz unterschiedliche Evolutionswege führen zur selben Lösung. Proteine haben unabhängig voneinander ähnliche Strukturen entwickelt, um ähnliche biochemische Funktionen zu erfüllen. Beispiel für konvergente Evolution: Serinproteasen. Durch ihre Ähnlichkeiten könnte man meinen, die Proteine seien homolog. Aber die massiven Unterschiede in der Gesamtstruktur dieser Proteine machen eine evolutionäre Verwandtschaftsbeziehung extrem unwahrscheinlich. Es ist extrem unwahrscheinlich, dass zwei Proteine, die sich aus einem gemeinsamen Vorläufer entwickelt haben, ähnliche Aktivitätszentren behalten haben sollen, während andere Aspekte ihrer Struktur sich so dramatisch verändert haben. 7.3.5 Der Vergleich von RNA – Sequenzen ermöglicht Einblicke in die Sekundärstruktur Der Vergleich mehrerer homologer RNA – Sequenzen kann Hinweise auf die dreidimensionale Struktur der RNA selbst vermitteln. Die einzelsträngigen Nukleinsäuren falten sich zu komplexen Strukturen, die von Watson – Crick – Basenpaarungen und anderen Wechselwirkungen zusammengehalten werden. Die Basen können somit (sofern sie aufeinander passen) eine Bindung (Watson – Crick – Basenpaarung) eingehen, was dann die dreidimensionale Struktur verändert. Dort, wo die Sequenzen mehrerer homologer RNA – Moleküle bekannt sind, kann diese Art der Sequenzanalyse ganze Sekundärstrukturen erschliessen sowie einige zusätzliche Wechselwirkungen darüber hinaus. 7.4 Auf der Basis von Sequenzinformationen lassen sich Stammbäume konstruieren Sequenzen, die einander ähnlicher sind als andere, haben offenbar weniger Zeit gehabt, sich auseinander zu entwickeln als Sequenzen, die weniger ähnlich sind. Vergleicht man die Sequenzen, lässt sich ein Stammbaum konstruieren, bei dem die Länge der Verknüpfung zwischen einem Proteinpaar proportional zur Anzahl der AS ist, die sich bei den beiden Sequenzen jeweils unterscheiden. Die Zeitskala wird durch die Ergebnisse von Fossiluntersuchungen geliefert, und zeigt den jeweiligen Zeitpunkt der Divergenz. 7.5 Moderne Verfahren ermöglichen Untersuchungen von Evolutionsprozessen die experimentelle Polymerasekettenreaktion erlaubt die direkte Untersuchung fossiler DNA – Sequenzen. Mit ihr kann man zum Teil auch Genome untersuchen, die nicht mehr gegenwärtig sind. Mit der kombinatorischen Chemie lässt sich die molekulare Evolution untersuchen. Bei diesem Verfahren werden grosse Molekülpopulationen en masse produziert und auf eine bestimmte biochemische Eigenschaft hin selektioniert. 7.5.1. In manchen Fällen lässt sich urtümliche DNA amplifizieren und sequenzieren Methode: DNA wird mittels PCR amplifiziert und sequenziert. Urtümliche DNA kann so ausgewertet werden, da die DNA eine extreme chemische Stabilität aufweist. Voraussetzungen für das erfolgreiche sequenzieren urtümlicher DNA : - hinreichende DNA – Mengen für Amplifikation - alle Quellen potenzieller Verunreinigungen müssen konsequent ausgeschlossen werden 7.5.2. Die experimentelle Untersuchung der molekularen Evolution Drei wichtige Voraussetzungen für die Evolution: - Vorhandensein einer Population mit grosser Vielfalt. - Selektion durch unterschiedliche Fitness. - Durchsetzung, Anreicherung der fitesten Organismen in einer Population. Diese drei Prozesse kann man auch in vitro an Nucleinsäuremolekülen ablaufen lassen. So kann man nachvollziehen, wie Evolutionsereignisse zu katalystischen Aktivitäten und spezifischen Bindungskapazitäten führten. Vorgehen: - Ausgangspopulation schaffen - Ausgangspopulation wird einem Selektionsprozess unterworfen, der bestimmte Moleküle mit den gewünschten Bindungs – oder Reaktionseigenschaften heraussortiert. - Selektionsprozess – überstandene Moleküle mittels PCR vermehren (Primer auf spezifische Sequenzen gerichtet, die sich an den Enden aller Sequenzen in dieser Population befinden.) (Beispiel dazu siehe evt. Buch)