Molekulare Evolution (LvNr. 300036) SS11 Skriptum GNU General Public License 1 RNA Welt Vorgeschlagene Literatur: Fundamentals of Molecular Evolution Dan Graur and Wen-Hsiung Li Evolution Barton, Briggs, Eisen, Goldstein, and Patel Das Alter der Erde wird auf 4.5 Milliarden Jahre geschätzt, 300 Millionen Jahre war eine stabile Hydrosphäre ausgebildet. Aus primitiven organischen Verbindungen ist die Prä-RNA-Welt und daraus die RNA-Welt hervorgegangen. Das erste auf DNA und Proteinen basierende Leben ist schätzungsweise vor 3.6 Milliarden Jahren aufgetreten, hier reiht man auch den LCA (last common ancestor) ein. Weitere bedeutende Zeitpunkte: • • • • • • • Erste bakterielle metabolische Aktivität (unsicherer Nachweis, 3.67 Milliarden Jahre) Erste bakterielle metabolische Aktivität (sicherer Nachweis, 2.7 Milliarden Jahre) Ursprung der Eukaryoten (1.5 Milliarden Jahre) Erste Tierfossilien (580 Millionen Jahre) Kambrische Explosion (545 Millionen Jahre) Erste Dinosaurier (245 Millionen Jahre) Erste moderne Menschen (120.000 Jahre) Das Auffinden von Fossilien hat zur Erstellung einer geologischen Zeitskala, die in verschiedene Erdzeitalter gegliedert ist, geführt. Radiometrische Datierung (radiometric dating) ermöglicht die Zuweisung eines Alters zu einem Fossil. Dabei wird die Konzentration bestimmter (radioaktiver) Isotope gemessen, die sich im Laufe der Zeit ändert. Die häufigste Methode ist die Uran-Blei-Datierung, die einen Datierungszeitraum von etwa 1 Million bis über 4.5 Milliarden Jahren bei 0.1-1% Genauigkeit erlaubt. Sie beruht auf den Zerfällen: • • 235 U zu 207Pb (Halbwertszeit 704 Milliarden Jahre) 238 U zu 206Pb (Halbwertszeit 4.5 Milliarden Jahre) Zur Analyse setzt man meist Zirkon (ZrSiO4) ein, welches oft als feine Körner in Sedimenten zu finden ist, wo es widerum in metamorphe Gesteine inkorporiert wird und die Kristalle dabei immer um eine Schicht größer werden. Dabei wird als Fehler Uran oder Thorium in die Kristallstruktur eingebaut, aber absolut kein Blei. Daher kann man vorraussetzen, dass das gesamte Blei im Kristall aus den radioaktiven Zerfällen hervorgegangen ist. -1- Die frühesten Belege für biologische Aktivität in Form von Gesteinsablagerungen sind: 1. Stromatolithen – Ablagerungen von Cyanobakterien mit einem Alter von 2.7 Milliarden Jahre werden als gesicherter Beweis für frühes Leben auf der Erde angesehen. In Australien (Warrawoona) gibt es lebende Kolonien, die die gleichen Strukturen aufbauen, wie sie in präkambrischen Gesteinen gefunden worden sind. Sulfidablagerungen auf Baryt – In 3.67 Milliarden Jahre alten Baryt (Schwerspat, BaSO 4) aus Nordwest-Australien (North Pole) wurden verschiedene Sulfide (Pyrit, Sphalerit), die durch Reduktion des Sulfats durch organische Materie oder Wasserstoff entstehen, entdeckt. Dadurch verändert sich die Verteilung des 34S-Isotops, was von den Entdeckern beobachtet wurde.[1] Durch solche Fossilien kann man in den Stammbäumen, die man durch Alignments von Sequenzen der SSU 5S rRNA erhält, den speciation events konkrete Zeitpunkte zuordnen (2,7 Milliarden Jahre für einen gemeinsamen Vorfahren von Archae und Eukarya; 3,5 Milliarden Jahre für die Entstehung von Sulfatreduzierern). Das zentrale Dogma der Biologie, des Lebens, lautet DNA → RNA → Protein. Das ist ein relativ komplexes System. Wie konnte es aber entstehen? Dazu müssen mehrere Probleme gelöst werden: 1. Entstehung der Nukleotide Die Komponenten der DNA (2-Desoxyribose, Purin- und Pyrimidinbasen) sowie deren spezielle Verknüpfungen (Phosphoester, N-Glycosid) müssen erst einmal entstehen. Es konnten einige Synthesemöglichkeiten für organische Schlüsselmoleküle gefunden werden, darunter die Polymerisation von Formaldehyd (CH2O) unter Einwirkung von Kalkwasser (Ca(OH)2) zu verschiedenen Zuckern, darunter auch kleine Mengen Ribose. Eine Atmosphäre aus Methan (CH4), Ammoniak (NH3) und H2O ergeben durch elektrische Entladungen Aminosäuren. -2- Blausäure (HCN) in wässriger Ammoniaklösung führt zu Adenin, während 1-Propinnitril unter Einwirkung von Cyanat oder Harnstoff zu Cytosin führt, aus denen die anderen Nucleobasen entstehen können. Die Entstehung von Ribonukleotiden ist ein wenig schwieriger, kürzlich konnte aber ein einfacher Syntheseweg über 2-Aminooxazol gefunden werden.[2] 2. Entstehung biologischer Informationsspeicherung und Vererbung Es gilt anzunehmen, dass das Leben mit RNA begonnen hat. Es gibt mehrere Indizien, die diese Hypothese vorschlagen. Das Ursuppen-Experiment von Stanley Miller (1953) hat gezeigt, dass Aminosäuren spontan in abiotischer Umgebung entstehen können, aber nicht wie sie zu Proteinen angeordnet und diese Ordnung codiert ist. Francis Crick (1968) brachte die Idee ein, dass RNA katalytische Wirkung haben und Reaktionen begünstigen könnte. Walter Gilbert (1986) beschrieb die Existenz einer RNA-Welt basierend auf der zu der Zeit gewonnenen Erkenntnis, dass in RNA Information gespeichert sein und autonom Leben als evolutives System aufrechterhalten kann. Erst später sei DNA entstanden, danach das heutige System aus Transkription und Translation.[3] In seiner Vorstellung haben also frei schwimmende Nukleotide zufällige Bindungen gemacht, durch Zufall hatten einige der entstandenen Nukleotidkombinationen katalytische Wirkung wie Ligation oder Selbstreplikation. Probleme von RNA als genetischem Material sind allerdings, dass größere RNAs chemisch instabil sind und sie als Speichermedium unzuverlässig machen. Zusätzlich hat sie nur einen Strang, bei Mutation liegt kann kein Reparaturmechanismus ansetzen. Zu den Beweisen für eine RNA-Welt in der Frühphase des Lebens zählt die Entdeckung von Ribozymen. Thomas Czech (1982) versuchte ein Protein zu finden, um rRNA zu splicen. Was er herausfand war, dass sie in genereller Abwesenheit von Proteinen ein Intron der großen rRNA in Tetrahymena thermophila entfernt wurde, der erste Nachweis für self-splicing Aktivität. Sidney Altman (1983) isolierte RNAse P, die für die Umwandlung von pre-tRNA in aktive tRNA verantwortlich ist. Es stellte sich heraus, dass die RNAse als neben einem geringen Peptidanteil fast zur Gänze aus RNA besteht, die die katalytische Komponente ist. Das Bild zeigt RNAse P aus Thermotoga maritima im Komplex mit tRNA-Phe.[4] RNAse P spaltet ein Stück von pre-tRNA ab, daneben ist es für die Expression von kleinen ncRNAs verantwortlich (tRNA, 5S rRNA, SRP RNA, U6 RNA), die im Menschen von RNA Polymerase III transkribiert werden. Das Ribozym kommt in allen Domänen des Lebens vor, aber nur in RNAse P aus Bakterien behält es seine Funktion in Abwesenheit der Peptidkomponente bei. Man unterscheidet je nach Mechanismus eine Reihe von Reaktionstypen, die von Ribozymen katalysiert werden: -3- Eine weitere faszinierende Eigenschaft von RNAs ist, dass sie als Sensoren (RNA switches, riboswitching) für Umgebungsbedingungen (Temperatur) oder für die Anwesenheit spezieller Liganden, mitunter selbst RNA, dienen können. Beispielsweise führt erhöhte Temperatur zur Aktivierung von Virulenzfaktoren in Listeria, da Sekundärstrukturen der RNA schmelzen (RBS von prfA mRNA). Andererseits kann es in E. coli zur Stabilisierung von mRNA von Sigmafaktoren (rpoS) durch ncRNAs (DsrA) kommen, was ebenfalls die Translation katalysiert. In beiden Fällen wird die ribosome binding site (RBS) für Ribosomen verfügbar. -4- 3. Möglichkeiten zu Veränderung und Anpassung Damit die RNA Welt als Epoche der Evolution anerkannt werden kann, sind an sie bestimmte Anforderungen gestellt, die Darwinischen Vorraussetzungen: • • • Mutation (Variabiliät) Selektion Vererbung (Replikation) Der erste Nachweis von Evolution in der RNA-Welt wurde von Spiegelmann (1965) erbracht. Er simulierte die Evolution des Coliphagen Qß, einem RNA-Phagen, in vitro. Die RNA-Replicase (RNA-abhängige RNA-Polymerase) des Phagen repliziert nur die eigene genomische RNA, nicht die RNA anderer Phagen, diese spezielle Polymerase ist also sequenzspezifisch! Im Versuchsansatz das Qß-Genom mit freien Nukleotiden und der Replicase für 20 Minuten inkubiert, anschließend wurde der Reaktionsansatz in ein neues Gefäß transferiert. Nach einigen Transfers bemerkte er einen Anstieg der Replikationsgeschwindigkeit. Das RNA-Template, nicht aber die Replicase, hatte sich verändert. Auf Grund der (zu) kurzen Inkubationszeit für die Replikation des gesamten Genoms, wurden kürzere RNAs selektiert. Das Ergebnis nach 74 Transfers war, dass sich das Genom vpn 3600bp auf 550bp reduziert, der Phage aber immer noch gleich infektiös war. Auch Resistenzen können in einer RNA-Welt auf evolutivem Weg entstehen. Im gleichen Qß-Replicase-System wird nun RNAse A, die ungepaarte C und U schneidet. In einem automatisierten Transfersystem, das exponentielles Wachstum sicherstellt (Populationsgröße > 1011 RNAs), wird nun Evolution simuliert. Das Ergebnis sind widerum kürzere RNA-Moleküle, die gegen RNAse A resistent sind. Das Evolvieren von RNA mit den bisher erwähnten Methoden ist Zeit aufwändig und teuer. Das Aufkommen der PCR ermöglichte die Entwicklung von Methoden wie SELEX (Systematic Evolution of Ligands by EXponential Enrichment). Dabei werden durch Einführung von zufälligen Mutationen durch Fehler anfällige PCR bei einer Fehlerrate von 0.1 pro Nukleotid (jede Position mutiert mindestens einmal in zehn Replikationsvorgängen) neuartige RNAMoleküle hergestellt. Die gewonnenen Produkte können anschließend auf gewünschte Eigenschaften selektiert werden, wie beispielsweise Affinität für bestimmte Liganden. Die mit Hilfe der SELEX gewonnenen Oligonukleotid-Sequenzen werden Aptamere genannt. Die ersten katalytischen RNAs, die durch dieses In-Vitro-Evolutionsverfahren gewon-5- nen wurden, waren RNA-Ligasen. Obwohl solche Moleküle in freier Natur noch nicht gefunden wurden, gelten sie als Beleg für die Existenz einer präbiotischen RNA-Welt. Eines dieser Experimente wurde von Bartel and Szostak (1993) durchgeführt . Sie selektierten in einem Pool zufälliger RNA-Sequenzen für die Fähigkeit einer RNA-Sequenz, eine 3'-5'Phosphodiesterbindung auszubilden und Pyrophosphat freizusetzen, also eine Ligation durchzuführen. Die Forscher erhielten die erste synthetische Ligase, L1 Ligase oder Klasse I Ligase, nachdem ein 189bp Oligonukleotid mit einer Katalyserate von 0,029 lig/min -1 zu einem zu 119bp verkürzten Oligonukleotid mit einer Katalyserate von 14,4 lig/min -1 evolviert ist. Die schnellste auf diese Weise evolvierte Ligase hat eine Katalyserate von 360 lig/min -1, was im Vergleich zur unkatalysierten Reaktion mit 10-6 lig/min-1 ein gewaltiger Unterschied ist.[5] Neben einer Ligase ist auch eine Polymerase, ein RNA Polymerase Ribozym, evolviert worden. Ausgehend von der Klasse I Ligase wurden 76 zufällige Nukleotide an das 3'-Ende angefügt (grün), gleichzeitig wurde die interne Templateregion deletiert (rot). Dann wurde ein externes Template zugegeben (blau), ein Primer zugegeben und für Template abhängige Polymerisation selektiert. Das Ergebnis ist ein 189 nt Ribozym, das 14 nt mit hoher Zuverlässigkeit an den Primer anfügen kann. In-Vitro-Evolution kann auch in einem zyklischen Prozess über ein DNA-Intermediat erfolgen. Ein Ribozym könnte ein chimäres DNA-RNA-Substrat, dessen DNA-Anteil (blau) dem T7 RNA-Polymerase Promoter entspricht, an sein 5'-Ende ligieren. Nach DNA-Priming und reverser Transkription liegen doppelsträngige Nukleinsäurehybride vor. Ein Strang davon besteht vollständig aus DNA, die durch T7 RNA-Polymerase widerum in RNA trankribiert werden kann, da der Strang den Promoter für diese Polymerase enthält. -6- Dieser Zyklus läuft so lange ab, bis alle NTPs eines Reaktionsansatzes aufgebraucht sind. Transferiert man ein Aliquot in einen neuen Ansatz, beginnt die Reaktion läuft die Reaktion weiter. Jetzt haben wir einige Szenarien in vitro dargestellt, aber hat das auch etwas mit der Realität zu tun? Ein Ort, an dem die Entwicklung solcher RNAs stattgefunden haben und noch immer stattfinden könnte sind schwarze Raucher (hydrothermal vents). In umgebenden Gesteinshohlräumen und Poren in dort abgelagerten Mineralien (Zeolithe wie Montmorillonit, (Al1,67Mg0,33) [(OH)2|Si4O10] • Na0,33(H2O)4) kann sich eine rezirkulierende Umgebung mit hohen Konzentrationen organischer Substanzen in Konzentrations- und Temperaturgradienten etablieren. Tatsache ist, dass sich an solchen hydrothermalen Quellen auch in großen Meerestiefen Leben halten kann, daher liegt es nahe, dass es auch dort entstanden ist; es ist schwer anzunehmen, dass die Lebewesen vom umgebenden Meeresboden zur Quelle eingewandert sind. Das heutige Modell des Beginns präbiotischer Evolution geht von einer prä-RNA-Welt aus, in der eine Ansammlung zufälliger Sequenzen existiert hat, organische Substanzen verfügbar waren und möglicherweise auch alternative genetische Systeme in Form von informationsspeichernden Polymeren mit Metallionen für katalytische Aktivität entstanden sind. In einer Übergangszeit sind Ribozyme entstanden, die zur eigenständigen Replikation fähig waren, zusätzlich verbesserte sich die Qualität der Replikation, sodass RNA stabile Genome mit Größen von etwa 100nt erreichen konnte. In der RNA-Welt ist RNA die einzige genetisch codierende Komponente, Evolution erfolgt durch Replikationsabweichungen bei veränderter homologer Basenpaarung. Translation entsteht. Ab hier scheiden sich die Geister: Einerseits könnte der DNA-Welt eine Proteinwelt vorangegangen sein, in der Aminosäuren durch RNA angeordnet wurden, sodass Proteinenzyme entstehen konnten, die RNA in DNA trankribierten. Andererseits könnte RNA DNA-Kopien von sich selbst erzeugt haben und erst danach sind Proteine entstanden. 2 Mutationen Mutationen sind eine treibende Kraft der Evolution. Es war nicht von Anfang an bekannt, welche Rolle DNA in einer Zelle einnimmt. Zunächst konnten keine für die Zelle Struktur gebenden Eigenschaften identifiziert werden, dann aber wurde erkannt, dass sie funktionell aktiv ist und biochemische Eigenschaften bestimmt. Avery, McCarty und MacLeod (1940) konnten zeigen, dass DNA vorhersagbare und vererbbare Veränderungen in Zellen hervorruft und somit Gene auf DNA codiert sein müssen. Viele Forscher glaubten zu dieser Zeit, Gene seien aus Proteinen aufgebaut. -7- Avery's Experiment nutzte die Transformation zwischen glatten und rauhen Eigenschaften von Streptococcus pneumoniae Kolonien, sowie Enzyme, die Lipide, RNA, Polysaccharide, Proteine und DNA abbauen. Es wurden fünf Ansätze getestet: (1) R-Zellen ohne S-Zell-Extrakt (SZE), (2) R-Zellen mit SZE, (3) R-Zellen mit trypsinisiertem SZE, (4) R-Zellen mit RNAse behandeltem SZE, (5) R-Zellen mit DNAse behandeltem SZE. Es zeigte sich, dass bei Abbau der DNA keine Transformation mehr eintrat, somit war nachgewiesen, die Information für die Oberflächenstruktur der Zellen durch DNA codiert ist.[6] Watson und Crick (1953) lösten die chemische Struktur der DNA. Sie besteht aus Nukleotiden, das sind Verbindungen aus einem anorganischen Phosphatrest, einer Desoxyribose und organischen Basen (A-T, C-G), die über Wasserstoffbrücken verbunden sind. Die dritte Wasserstoffbrücke zwischen C und G war in der ursprünglichen Veröffentlichung nicht enthalten und wurde erst später postuliert.[7] Betrachtet man Proteinsequenzalignments (zum Beispiel von Mitgliedern der HSP70 Familie von Bakterien bis Mensch) wird schnell klar, dass es eine Notwendigkeit zur Erhaltung bestimmter Sequenzbereiche gibt. Diese können mit der Funktion des Proteins in Zusammenhang gebracht werden. Auf das Vorhandensein dieser Bereiche kann und wird selektiert, falls Mutationen auftreten. Lange Zeit war unbekannt, warum Mutationen entstehen. Es standen sich zwei alternative Hypothesen gegenüber: (a) Wenn ein selektiver Faktor auf einen Organismus einwirkt (Phagen auf eine Bakterienkultur), dann erwartet man in jeder getesteten Kultur eine ähnliche Zahl von resistenten Individuen (Lamarckismus!), oder (b), Mutationen entstehen spontan und unabhängig von den Phagen, als Folge erhält man stark fluktuierende Zahlen von resistenten Individuen. Diese Fragestellung hat das Luria-Delbrück-Experiment (1943) beantwortet, in dem eine große Zahl von E. coli Kulturen mit T1-Phagen infiziert wurden. Es zeigte, dass sich Resistenzen gegenüber den Phagen spontan durch zufällige Mutation und in Abwesenheit (vor Zugabe) der Phagen entwickeln. Mutationen in multizellulären Organismen haben andere Auswirkungen auf die genetische Ausstattung eines Individuums, abhängig davon, in welchem Zelltyp sie vorkommen. Daher unterscheidet man somatische Mutationen und Keimbahnmutationen. Nur letztere verändern das Genom eines ganzen Organismus, weil er aus der Zelle hervorgeht, in der die Mutation stattgefunden hat, während erstere meist Krebs zur Folge haben. Ein Mechanismus zur Etablierung von Mutationen sind Replikationsfehler einer DNA-Polymerase. Kommt es zur Inkorporation einer falschen Base, wird die fehlerhafte Basenpaarung durch die proof-reading Aktivität der Polymerase erkannt, das Enzym fährt ein Stück auf der DNA zurück und entfernt die falsche Base. Dieser Reparaturmechanimus funktioniert aber nicht immer. Das Resultat sind unterschiedliche Mutationsraten zwischen Organismengruppen, abhängig von der Reparaturfähigkeit ihrer Polymerasen: -8- Bakterien: 1 Nukleotidaustausch per Zellgeneration/109 Basenpaaren Säugetiere: 1 Nukleotidaustausch per Replikationszyklus/109 Basenpaaren Mensch: 3*109 Basenpaare ergibt 3 Austausche per Replikationszyklus Man unterscheidet verschiedene Typen von Mutationsmechanismen, die man je nach zu Grunde liegendem Mechanismus einer von zwei Gruppen zuordnet: 1. Spontane Mutationen a) Tautomere Formen der Nucleobasen Die seltene Iminoform von Cytosin führt zu veränderter Wasserstoffbrückenbildung. Das Ergebnis semikonservativer Replikation einer C=A Paarung (Transition mit der Pyrimidinbase Thymin) ist im folgenden Diagramm dargestellt: Punktmutationen machen 75% aller Mutationen, neben Insertionen, Deletionen, Duplikationen, Inversionen, Translokationen und Genomabberationen, aus. Man unterscheidet sie weiters in Transversion (Purin- zu Pyrimidinbase oder umgekehrt) und Transition (Purin- zu Purinbase oder Pyrimidin- zu Pyrimidinbase). Transitionen sind 20 mal so häufig wie Transversionen. Auf Proteinebene können verschiedene Effekte durch Punktmutationen beobachtet werden: 1. Stille Mutation – Auf Grund der Redundanz des genetischen Codes kommt es nicht zum Austausch einer Aminosäure 2. Neutrale Mutation – Es kommt zu einem Aminosäureaustausch, die neue Aminosäure hat aber ähnliche chemische Eigenschaften, sodass die Funktion des Proteins nicht beeinträchtigt ist 3. Missense Mutation – Es kommt zu einem Aminosäureaustausch und die neue Aminosäure hat chemisch unterschiedliche Eigenschaften, sodass die Funktion des Proteins eingeschränkt bis zerstört wird 4. Nonsense Mutation – Die Punktmutation führt zur Entstehung eines Stop-Codons, die Synthese der Peptidkette wird zu früh gestoppt, sodass das essentielle Bereiche fehlen und das Protein die ursprüngliche Funktion nicht mehr ausüben oder völlig funktionslos ist -9- b) Chemische Modifikation der Nucleotide Diese Mechanismen beruhen auf Säurebelastung oder erhöhter Temperatur. Spontane hydrolytische Depurinierung findet 10.000 mal pro Tag und Genom. Das Ergebnis ist eine abasische Position durch Verlust der Nucleobase, die bei der Replikation in Folge ausgelassen wird. - 10 - Spontane hydrolytische Deaminierung vollzieht sich etwa 400 mal pro Tag und Genom und führt zu Depyrimidinierung. Deaminiert werden können Adenin zu Hypoxanthin, Cytosin zu Uracil, welches durch einen Reparaturmechanimus durch Cytosin ersetzt wird und 5-Methylcytosin zu Thymin, für das kein Reparaturmechanimus existiert. In Bakterien ist somit 5-Methylcytosin und in Vertebraten sind CpG-islands hotspots der Mutation. c) Replikationsfehler DNA-Abschnitte mit Wiederholungen von GC-Folgen können loop-Strukturen ausbilden, die während Replikation oder Rekombination zu Insertionen oder Deletionen führen können. Die Folge sind frame shifts, die schnell zu verfrühten Stopps der Proteinsynthese führen. d) Insertion mobiler genetischer Elemente (Transposons) siehe Kapitel 3 2. Induzierte Mutationen a) Chemikalien Thymin und Guanin können durch Sauerstoffradikale modifziert werden, dadurch entsteht Thyminglykol, der zum Stopp der Replikation führt, sowie 8-oxo-Guanin, das mit T paart und eine Transition von G-C nach A-T zur Folge hat. - 11 - Die Modifikation der Basen mit Alkylresten durch alkylierende Substanzen wie Ethylmethansulfonat (EMS) oder Nitrosoguanidin (NG) verursacht mismatches. Interkalierende Chemikalien wie Ethidiumbromid, Proflavin, Acridinorange oder andere planare Moleküle lagern sich zwischen die Basenpaare der DNA ein. Dadurch kann es zu Insertionen oder Deletionen kommen. Der Ames-Test dient der Bewertung der Mutagenität einer Substanz. Dazu werden Histidin auxotrophe Salmonella-Stämme eingesetzt und deren relative Häufigkeit von Revertanten im Vergleich zu einer Kontrollgruppe bestimmt. - 12 - b) Ionisierende Strahlung Hochfrequente elektromagnetische Strahlung hat zahlreiche negative Auswirkungen auf die DNA. Es entstehen HO und O-Radikale sowie Hydroxylperoxide, die vielfältige chemische Prozesse in Gang setzen: 1. Crosslinks – Benachbarte Basen werden kovalent verbunden 2. Doppelstrangbrüche – DSBs setzen Reparatursysteme in Gang, dabei kommt es oft zu fehlerhaften Religationen wie Ringchromosomen und Inversionen, aber auch Translokationen und dizentrische Chromosomen. 3. Einzelstrangbrüche 4. Zerstörung von Basen – Dihydrothymin-5,6-diol, 5-Formylamino-Pyrimidine Die Mutationsrate korreliert direkt linear mit der einwirkenden Dosis ionisierender Strahlung, unabhängig von der Art der Strahlung (γ-Strahlung (▼); β-Strahlung (■); 160kV Röntgenstrahlung (●)). 3 Repetitive DNA Die Organisation des menschlichen Genoms zeigt krasse Unterschiede zwischen chromosomalem und mitochondrialem Genom. Die relative Größe von Letzterem wird durch den schwarzen Punkt in der folgenden Abbildung dargestellt. Zu beachten ist auch der Unterschied der Anteile an repetitiver nicht kodierender, und hoch konservierter (kodierende oder regulative Sequenzen) DNA. Der prozentuale Anteil an Protein-kodierenden Genen sinkt mit der Genomgröße, während der von transposablen Elementen (TEs) zunimmt (C-value Paradoxon).[8] - 13 - Mobile genetische Elemente (Transposons) Diese Gruppe umfasst eine Reihe von Sequenzen, die ihre Position im Genom wechseln können. Es gibt drei Mechanismen der Transposition: • • • Konservative Transposition Das Element selbst wird von der Donor zur Targetsite verschoben (Austritt und Reintegration, DNA-Intermediat) Replikative Transposition Es wird eine (DNA-)Kopie des Elements hergestellt, die an der neuen Stelle reintegriert (Replikation und Reintegration, DNA-Intermediat) Retrotransposition Es wird eine RNA-Kopie des Elements hergestellt, die revers in cDNA trankribiert wird und an der Targetsite integriert (RNA-Intermediat) Der Insertionsmechanismus erzeugt kurze direct repeats an der Insertionsstelle. Die flankierenden short inverted repeats sind das Substrat für die Transposase, die an solchen Stellen Rekombinationsereignisse katalysiert. Bacterial insertion sequence elements (IS elements) sind ein Beispiel für TEs. In der proteinkodierenden Region liegen oft Resistenzgene gegen Antibiotika wie Chloramphenicol. IS Elemente bewegen sich in konservativer Weise, die zurückbleibenden Paare der direct repeats der Donorsite, die bei der Insertion entstehen, sind ein Zeichen dafür, dass hier in früherer ein TE anwesend war. Oft liegen Resistenzgene auf solchen TEs, wie zum Beispiel gegen Chloramphenicol. - 14 - Unerlaubte Excision (imprecise excision) kann zur Deletion von Genen führen. Insertion von mobilen Elementen in ein Gen zur Pigmentierung von Mais (Zea mays) hat zur Entdeckung mobiler genetischer Elemente durch Barbara McClintock (1948, Nobelpreis 1968) geführt. Die Interaktion von autonomen Ac-Elementen (activator elements) und ihren nichtautonomen Varianten, den Ds-Elementen (dissociator elements), führt zu einem variablen Phänotyp. Pigmentflecken beziehungsweise pigmentfreie Flecken entstehen durch mitotische Expansion von Zellen, in denen es zur Excision in das Pigmentgen beziehungsweise Insertion gekommen ist. - 15 - Zusätzlich zu Deletionen, die zum Verlust der Eigenständigkeit der mobilen Elemente (DsVarianten wie Ds9, Ds2d1, Ds6 ) führen, kann es in Eukaryoten zu alternativem Splicing kommen (KP-Variante des P-Elements in Drosophila melanogaster). Im humanen Genom kennt man vier Klassen mobiler Elemente: Klasse Eigenständigkeit DNA-Transposons autonom Genprodukte Anzahl im Genom % des Genoms Transposase 300000 3% gag pol (env) 450000 8% ORF1 ORF2 850000 21% 1500000 13% nicht-autonom Retrotransposons autonom nicht-autonom LINEs autonom SINEs nicht-autonom DNA-Transposons haben DNA-Intermediate, während Retrotransposons und LINEs/SINEs RNA-Intermediate haben, die revers in DNA transkribiert wird. Integrierte Retrotransposons werden durch die Wirtszelle oft transkribiert, dieses Primärtranskript kann auch durch RNA prozessierende Faktoren des Wirts prozessiert werden. Die virale reverse Transkriptase aus dem reifen Transkript eine cDNA, die ins Genom integrieren kann. Die virale reverse Transkriptase unterscheidet aber nicht zuverlässig zwischem viralem Transkript und wirtseigener mRNA, sodass gesplicete mRNA als cDNA ins Genom reintegriert. Dadurch geht die Intron-Exon-Struktur verloren, die mitunter für die korrekte Expression durch den Wirt essentiell sein kann. Das Ergebnis dieses Phänomens sind Pseudogene, die bedeutende evolutive Effekte haben können (siehe später). LINEs sind charakterisiert durch eigene PolII-Promotoren, zwei ORFs, einer 3'-binding site für das ORF2-Protein sowie ein poly-A-Signal. Das ORF2-Protein hat cis-Aktivität, das heißt es bindet die mRNA des LINE. Dadurch wird die mRNA in den Kern zurücktransportiert, wo es zur reversen Transkription und zum Einbau der DNA-Kopie an TT|AAA kommt. Die targetsite duplication beträgt 7-20bp. Im Gegensatz dazu, kann bei DNA-Transposons die Transposase, sobald nach Synthese im Cytoplasma zurück in den Kern gelangt, nicht zwischen aktiven und inaktiven Elementen unterscheiden. Dadurch kommt es zur Akkumulation von inaktiven Elementen, als Folge wird die Transposition weniger effizient. Als unmittelbare Folge expandiert ein Typ von DNA-Transposons, langfristig gesehen kann dieser Typ aussterben, weil verschiedene Mechanismen (piRNA, siRNA, DNA Methylierung, Histonmodifikationen) die Ausbreitung verhindern beziehungsweise einschränken und die evolutive Tendenz zur Genomreduktion die Population an DNA-Transposons kontinuierlich vermindert. Die Aktivität transposabler Elemente in verschiedenen Spezies ist variabel, das macht man sich zu Ntuze, um Rückschlüsse auf das evolutive Alter einer Spezies zu ziehen. - 16 - Der dominierende evolutive Effekt, den transposable Elemente auf ein Genom ausüben, besteht in der Veränderung der Genomstabilität. Eine hohe Kopienzahl eines Typs transposabler Elemente bietet viele Gelegenheiten zu unbalancierter homologer Rekombination. Wenn das innerhalb eines Chromosoms passiert, kann es zu Inversionen oder Deletionen kommen. Ein direkter Nachweis dafür ist das Vorhandensein einzelner LTRs. Der erste bekannte Fall einer Krankheit, die durch transposable Elemente hervorgerufen wird, ist das Menkes Syndrom. Dabei wurde eine Alu-Sequenz (AluYa5a2, 382bp) in Exon 9 von ATP7A eingebaut, was zu dereguliertem Splicing führt. Es werden zwei Splicing Enhancer eingebracht, in Folge wird Exon 9 ausgelassen und zwei Transmembrandomänen des Proteins fehlen, die aber für die normale Funktion essentiell sind. Zusätzlich nehmen transposable Elemente auf vielfältige Weise Einfluss auf die Transkription.[9] Retrotransposons können in der Phylogenie eingesetzt werden, da im Laufe der Evolution an immer neuen Stellen Individuen solcher Elemente eingebaut werden und kein Mechanismus bekannt ist, um sie wieder aus dem Wirtsgenom zu entfernen. Außerdem ist unwahrscheinlich, dass ein un derselbe Typ eines Elements im Laufe der Evolution an exakt der gleichen Stelle in zwei Entwicklungslinien unabhängig voneinander integrieren. Tandem repeats Im menschlichen Genom kommt eine Vielzahl von jeder möglichen Mono-, Di-, Tri- und Tetranukleotidkombination vor. Diese bilden Motife, zusammenhängende Sequenzbereich mit variabler Wiederholung dieser Kombinationen. Tandem repeats sind hochgradig polymorph und es ist anzunehmen, dass kein Individuen für eines dieser polymorphen Merkmale homozygot ist, somit ist jedes Individuum in dieser Hinsicht einzigartig. Dieser Umstand erlaubt die Nutzung von tandem repeats in einer Reihe genetischer Tests, wie Vaterschaftstest, Forensik oder die Untersuchung demographischer Entwicklungen. Man unterscheidet Microsatelliten, Minisatelliten und Satelliten-DNA, abhängig von der Länge. - 17 - Tandem repeats können Sekundärstrukturen bilden, wenn die DNA als Einzelstrang vorliegt, wie beispielsweise bei Transkription oder Replikation. Die repetitiven Sequenzen der Motife hybridisieren in cis, sodass sich DNA-Sekundärstrukturen ausbilden. Diese aktivieren DNAReparatursysteme, als Folge kommt es zur Insertion oder Deletion einiger Wiederholungen der repeats.[10] Expansionen von Satelliten-DNA sind mit manchmal mit Krankheiten verbunden. Man kennt knapp 30 erbliche Defekte, die von einer Zunahme der tandem repeat Länge verursacht werden. Übersicht über Krankheiten, hervorgerufen durch an verschiedenen Sequenzbereichen lokalisierte Mikrosatelliten. BPES, blepharophimosis, ptosis and epicanthus inversus; CCD, cleidocranial dysplasia; CCHS, congenital central hypoventilation syndrome; DM, myotonic dystrophy; DRPLA, dentatorubral–pallidoluysian atrophy; EPM1, progressive myoclonic epilepsy 1; FRAXA, fragile X syndrome; FRAXE, fragile X mental retardation associated with FRAXE site; FRDA, Friedreich's ataxia; FXTAS, fragile X tremor and ataxia syndrome; HD, Huntington's disease; HDL2, Huntington's-disease-like 2; HFG, hand–foot–genital syndrome; HPE5, holoprosencephaly 5; ISSX, X-linked infantile spasm syndrome; MRGH, mental retardation with isolated growth hormone deficiency; OPMD, oculopharyngeal muscular dystrophy; SBMA, spinal and bulbar muscular atrophy; SCA, spinocerebellar ataxia; SPD, synpolydactyly - 18 - Von einem evolutionären Standpunkt aus, sind Transposons und tandem repeats sehr verschieden. Während verschiedene Individuen (Instanzen) eines Transposon-Typs eine gemeinsame Abstammung, aber nicht notwendigerweise einen direkten gemeinsamen Vorgänger, aufweisen, können tandem repeats, Satelliten-DNA, vollkommen unabhängig voneinander entstehen. 4 Molecular clocks Sequenzen, egal ob Nukleinsäure- oder Proteinsequenzen, die homolog sind, gehen auf einen gemeinsamen Vorfahren zurück. Die Wahrscheinlichkeit, dass Ähnlichkeiten homologer Sequenzen reiner Zufall sind, ist astronomisch gering. Daher muss angenommen werden, dass zwei gegebene Sequenzen durch eine bestimmte Reihenfolge von Veränderungen (Mutationen) aus einer ancestralen Sequenz hervorgegangen sein müssen. In den 1960er Jahren haben Forscher die Sequenzen von Hämoglobin verschiedener Spezies miteinander verglichen. Es wurde beobachtet, dass die Anzahl der Unterschiede zwischen den einzelnen Spezies mit der geschätzten Zeit korrelierte, zu der die Spezies einen gemeinsamen Vorfahren hatten. Seither hat man konstante, chronometrische Änderungsraten in einer Vielzahl von Proteinen festgestellt. Das Hämoglobin eines adulten Menschen ist ein Heterotetramer aus 2 α– und 2 β–Untereinheiten, das fetale Hämoglobin besteht aus 2 α– und 2 γ–Untereinheiten. Nun wurde festgestellt, dass die evolutionäre Distanz zwischen α-Untereinheiten verschiedener Spezies kleiner ist, als die Distanz zwischen α- und β-Untereinheit aus ein und demselben Organimus.[11] Als Erklärung für diese Beobachtung wurde Genduplikation vorgeschlagen. Aus einer ursprünglichen Hämoglobin-Untereinheit (π) sind zunächst durch Duplikation (duplication event) des Gens zwei Allele entstanden (α, β), die sich unabhängig voneinander weiterentwickelt haben. Erst danach ist es zur Artbildung gekommen (speciation event). Proteine als Beispiel für molekulare Uhren evolvieren mit unterschiedlichen Raten. Im Zeitraum von 90 Millionen Jahren, der geschätzten Zeit seit dem letzten gemeinsamen Vorfahren von Mensch und Pferd, haben sich in den Histonen keine Unterschiede entwickelt, während einige Faserproteine Unterschiede von 86% aufweisen. Proteine mit lebensnotwendiger Funktion werden mit geringerer Geschwindigkeit evolvieren, solche Proteine, deren Funktion leicht ersetzt werden kann, dagegen mit höherer Geschwindigkeit. - 19 - Kombiniert man die Evolutionsraten mehrerer Proteine, kann man den Zeitpunkt von Artbildungsereignissen genauer datieren. Neben der unterschiedlichen Evolutionsraten ganzer Proteine, kann die molekulare Uhr auch von Region zu Region desselben Proteins unterschiedlich gehen. Beispielsweise könnten sich auf den ersten Blick Bereiche auf der Außenseite schneller ändern als auf der Innenseite (hydrophobic core). Dabei muss man aber beachten, dass die Mutationsrate für alle Bereiche gleich ist, und der beobachteten unterschiedlichen Evolutionsrate Unterschiede im Selektionsdruck zu Grunde liegen. Um die Evolutionsrate zu quantifizieren, misst man die Unterschiede in der Nukleotidsequenz von DNA per 100 Basenpaaren, die evolutionäre Distanz. Dabei werden nur Punktmutationen beachtet, Insertionen oder Deletionen werden ignoriert. Wenn die Hypothese der molekularen Uhr stimmt, dann ist im folgenden phylogenetischen Stammbaum zu erwarten, dass die Distanz zwischen a) Maus-Hamster sowie Ratte-Hamster b) Maus-Mensch, Ratte-Mensch und Hamster-Mensch gleich ist.[12] Unter zu Hilfenahme von Fossilien kann die Austauschrate (r) von Nukleotiden, also die zu erwartende Zahl an Substitutionen (K, gelbe Punkte) pro Zeiteinheit (T), berechnet werden. Das ist allerdings nur ein Mittelwert, da auf der Zeitachse Bereiche hoher Mutationszahl mit Bereichen geringer abwechseln können. - 20 - r= K 2T T= K 2r Mit der Austauschrate und fossilen Belegen kann die molekulare Uhr kalibriert werden, um Ereignisse zu datieren, für die es keine fossilen Belege gibt. Das folgende Diagramm zeigt eine Zusammenstellung der Geschwindigkeit der molekularen Uhr für Hämoglobin (α/β-Komplex), Cytochrom C und Fibrinopeptiden (Dickerson 1971). Basierend darauf wurde versucht, unter Summierung der untersuchten Peptidsequenzen, eine Reihenfolge der Artbildungsereignisse verschiedener Säugetiergruppen darzustellen (Langley, Fitch 1974). - 21 - Es fällt auf, dass sich in manchen Gruppen die Geschwindigkeit der molekularen Uhr ändert, eine Beschleunigung bei Pferd-Esel, eine Verlangsamung bei apes-monkeys. Im Meerschweinchen hat man beobachtet, dass das Insulin dieser Spezies im Vergleich zu anderen Säugern stark zugenommen hat. Die Anwendbarkeit der molekularen Uhr hat Limitierungen. Es ergeben sich Ungenauigkeiten, wenn: 1. Eine geringe Anzahl von Aminosäuren untersucht wird (auf Grund der stochastischen Natur der molekularen Uhr erhält man stark variierende Ergebnisse) 2. Externe Faktoren einen Bias einbringen (Selektion, Katastrophen, populationsökologische Ereignisse) 3. Die geologischen Daten, die zur Kalibrierung benötigt werden, inkorrekt sind. Man unterscheidet verschiedene Effekte, die zu Abweichungen der molekularen Uhr führen: 1. Generation time effect Organismen mit kurzem Reproduktionszyklus evolvieren schneller als Organismen mit langer Generationszeit. Die Austauschrate ist in Affen größer als in Menschen, noch größer sogar in Nagetieren. Die Beobachtung daraus ist, dass mit sinkender Generationszeit also die Geschwindigkeit der Evolution steigt, was mit dieser Hypothese im Einklang steht. 2. Mutation rate effect Die Effizienz von DNA Reparatursystemen kann zwischen verschiedenen Entwicklungslinien variieren, was die Häufigkeit von Mutationen beeinflusst. [13] Anhand der folgenden Grafik erkennt man, dass mit zunehmender Genomgröße die Wahrscheinlichkeit einer Mutation sinkt. Mutationsraten verschiedener Genome: Bacteriophagen M13, T2, T4, λ, Escherichia coli (Eco) Saccharomyces cerevisiae (Sce), Neurospora crassa (Ncr), Caenorhabditis elegans (Cel), Drosophila melanogaster (Dme), Mus musculus (Mmu), Homo sapiens (Hsa). Zusätzlich kann der Metabolismus Einfluss nehmen, ein verminderter Metabolismus führt zu weniger Sauerstoffradikalen oder anderen mutagenen Metaboliten. Den Effekt kann man auch in Zellkulturen beobachten. Entstehen weniger Mutanten, evolviert die Kultur langsamer. - 22 - 3. Gene function Mit der Zeit kann sich durch Mutation die Funktion eines Gens verändern, die dadurch entbehrlicher oder essentieller wird und daher die Geschwindigkeit der molekularen Uhr dementsprechend verändert. Dieser Effekt kann speziell bei Genduplikationen erwartet werden. 4. Natural selection Organismen sind einem sich ständig ändernden Selektionsdruck ausgesetzt – als Antwort auf positive und negative Selektion verändert sich die Mutationsrate und somit die molekulare Uhr. Versucht man eine beliebige Sequenz in einer Simulation zu evolvieren, könnte man wie folgt vorgehen: Man beginnt mit einer Sequenz von 10.000 Nukleotiden, danach wählt man per Zufall eine Position aus und wandelt sie in eine andere um. Das wiederholt man 10.000 mal. Wie viele Unterschiede hat man zu erwarten? Beispielsweise könnten 21 Veränderungen passiert, aber nur 17 Unterschiede per 100 Positionen entstanden sein. Neben einfachen Substitutionen können mehrfache Substitutionen und als Spezialfall davon Rücksubstitutionen vorkommen. Durch Mutationen an derselben Stelle kommt es dazu, dass sich die Sequenz nicht linear mit der Zahl akkumulierter Subsitutionen ändert, was für analytische Zwecke unbrauchbar ist. Grafisch ist dieser Umstand im folgenden Diagramm dargestellt: Nun gibt es verschiedene Korrekturverfahren, um mehrfache Substitutionen zu berücksichtigen. Einerseits das Jukes-Cantor-Modell, in dem alle Möglichkeiten für Substitutionen als gleich wahrscheinlich angenommen werden, andererseits das Kimura-Modell, in dem zusätzlich zwischen Transitionen und Transversionen unterschieden wird. - 23 - Man kann mittels eines statistischen Tests (Tajima's relative rate test) prüfen, ob eine evolvierende Einheit schneller oder langsamer evolviert als erwartet. Dadurch kann man feststellen, ob Abweichungen von der molekularen Uhr vorliegen, wie beispielsweise, dass ein Organimus positiv selektiert wird oder der mutation rate effect wirksam ist. Ausgehend von einer Referenzsequenz wird die Zahl der Unterschiede gezählt und mittels eines χ2Tests ein P-Value bestimmt.[14] 5 Evolution of microbial genomes Das Genom von E. coli, und prokaryotische Genome im Allgemeinen, sind im Vergleich zu Eukaryontengenomen klein und dicht gepackt, bei einer durchschnittlichen Anzahl von 3000 Genen. Die Gene sind auf beiden Strängen codiert, die Verteilung folgt keiner höheren Ordnung. Weiters zeichnen sich prokaryotische Genome durch streamlining aus, einer geringen Anzahl repetitiver Elemente. Gene, die dem Bakterium keinen evolutiven Vorteil verschaffen, werden rasch aus dem Genom entfernt, so auch repetitive Elemente. Dadurch bestehen mehr als 80% der DNA in Bakterien aus codierenden Sequenzen. Eukaryotische Genome enthalten daher auch bei 1000-fach größerer Länge nur 10-mal mehr Gene. Je dichter gepackt das Genom ist, desto schneller kann das Genom repliziert werden, was sich positiv auf die Wachstumsgeschwindigkeit auswirkt und einen evolutiven Vorteil einbringt. Auf Eukaryonten wirkt dieser evolutive Zwang nicht, daher kommt es zu den enormen Genomgrößen. Prokaryotische Gene sind zum Großteil in Operons, funktionellen Einheiten, zusammengefasst. Das bekannteste davon ist das lac-Operon. Aber nicht alle Gene befinden sich in Operons, wie die heat shock proteins (Hsp; rpoH, rpoD, grpE, dnaKJ, groESL, htpG, Ion) beispielsweise, die über das ganze Chromosom verteilt sind. Der Vorteil von Operons besteht darin, die enthaltenen Gene als Gruppe regulieren zu können, beispielsweise das lac-Operon bei Abwesenheit von Laktose abzuschalten und damit Energie zu sparen. Operons können als ganzes an andere Prokaryonten (Bakterien, aber auch Archaea!) weitergegeben werden, die dadurch mitunter ganze biochemische Pathways erlernen. Die gemeinsame Regulation birgt aber auch einen Nachteil, da sich die Empfindlichkeit gegenüber Mutationen erhöht. Eine Mutation in der regulativen Sequenz kann somit den Totalausfall des Operons zur Folge haben. Zusätzlich zum Chromosom besitzen Bakterien eine unterschiedliche Anzahl an Plasmiden. Plasmide bringen bestimmte genetische Funktionen mit sich, die aber meist nur akzessorisch sind, sich also nicht auf das Überleben auswirken, wie zum Beispiel: • • • • • Resistenzen gegen Antibiotika (Rbk-Plasmid von E. coli) Fertilität, Fähigkeit zur Konjugation und zum DNA-Transfer (F-Plasmid von E. coli) Virulenz (Ti-Plasmid von Agrobacterium tumefaciens, verursacht Pflanzengallen) Degradation (TOL-Plasmid von Pseudomonas putida zum Abbau von Toluol) Toxine (Col-Plasmid von E. coli zur Produktion von Colicin) Plasmide sind für gewöhnlich kleiner als das Chromosom und liegen in großer Kopienzahl vor. Der Replikationsmechanismus unterscheidet sich von dem des Chromosoms und daher auch die Mutationsrate. Plasmide können leich im horizontalen Gentransfer ausgetauscht werden. Genomreduktion ist eine markante evolutionäre Folge in endosymbiotischen Prokaryonten. Blättläuse ernähren sich von Pflanzensäften, die sie aus dem Phloem saugen. Diese Ernährung ist reich an Kohlehydraten, aber arm an Aminosäuren. Blättläuse können aber 10 der proteinogenen Aminosäuren nicht synthetisieren, sie sind darauf angewiesen, dass ihr Endosymbiont Buchnera - 24 - aphidicola diese 10 für Blattläuse essentiellen Aminosäuren zur Verfügung stellen. Diese Abhängigkeit voneinander existiert seit 160-280 Millionen Jahren, und zeichnet sich auch beim Vergleich der phylogenetischen Stammbäume beider Spezies ab, die die gleichen Verzweigungspunkte aufweisen. Infolgedessen ist es zu massiven Genverlusten im Bakterium gekommen, darunter die Fähigkeit, LPS zu synthetisieren. Die Genreihenfolge hat sich aber erhalten. Es ist zu bemerken, dass Deletionen im Schnitt länger sind als Insertionen, der Trend also in Richtung kleinerer Genome liegt. Vergleicht man die Genomgrößen von frei lebenden Bakterien (110Mb) mit obligat parasitären (0,5-Mb) und obligat endosymbiontischen (0,3-2Mb) setzt sich dieser Trend fort. Als man begonnen hat, mikrobielle Genome zu sequenzieren, hat man die minimale Anzahl an Genen gesucht, die einem freilebenden Mikroorganismus das Leben ermöglichen. Beim Vergleich von Mycoplasma genitalium (486 Gene) und Haemophilus influenzae (1703 Gene) hat man 240 Gene gefunden, die in beiden Genomen vorkommen. Als man mehr Genomsequenzen hatte, ist die Zahl gemeinsamer Gene auf 80 gesunken. Das konnte allerdings nicht stimmen, weil das zu wenige für alle Faktoren in Ribosomen, der Atmungskette, Transkription, Translation und einen rudimentären Metabolismus sowie Katabolismus wären. Deshalb ist man dazu übergegangen, eine minimale genetische Ausstattung nach Funktion zu suchen, offenbar gibt es sehr viele unterschiedliche evolutionäre Linien, die unterschiedlichen genetische Codierungen für biochemische Probleme gefunden haben, was sich in der Diversität bakterieller Genome niederschlägt. Beim Vergleich der Genome von nicht-pathogenen E. coli (MG1655, EcoK12) mit uropathogenen CFT073 und enterohämorrhagischen (EDL933, O157:H7) hat man erkannt, dass eine erstaunliche große Zahl an Genen für einen Stamm spezifisch sind. Dieser Befund belegt, wie schwierig es dadurch wird, auf mikrobieller Ebene das Spezieskonzept anzuwenden. Es ist, als wollte man Menschen auf Grund ihrer biochemischen Feinregulation in ein Artenmodell pressen. - 25 - Dotplots werden eingesetzt, um die genetische Struktur von Genomen verschiedener Organismen zu vergleichen und Evolutionsereignisse (Duplikation, Insertion, Deletion, Inversion) zu finden. Dazu linearisiert man Genom am ORI (A) und vergleicht die erhaltenen Sequenzen Buchstabe für Buchstabe (B-F). Sind die Genome exakt gleicht, erhält man eine einfache Gerade (B), parallel dazu laufende Linien oder gepunktete Flächen geben unterschiedlich lange repetitive oder duplizierte Sequenzbereiche an (C,D). Eine Inversion ist in (E) und eine Insertion oder Deletion, je nach betrachtetem Genom, in (F) dargestellt. Die letzten beiden Diagramme erhält man nur beim Vergleich von Genomen unterschiedlicher Spezies. Beim Vergleich gleicher Genome fallen auf diese Weise mitunter repetitive Sequenzen auf, beim Vergleich von Genomen unterschiedlicher Spezies, beispielsweise E. coli K12 und O157:H7 erkennt man eine Inversion und einen Bereich, dem gehäuft repetitive Elemente auftauchen. Aber bereits der Vergleich etwas weiter entfernter Spezies (Heliobacter pylori und Haemophilus influenzae) hat gezeigt, dass die Genreihenfolge völlig anders ist und sich offenbar sehr schnell ändert. Aber trotz diesem generellen Chaos gibt es Einschränkungen: Die Genreihenfolge von Genen mit grundlegenden Funktionen wie ribosomale Operons hat sich in allen bisher verglichenen Bakterien und Archaea erhalten. Veränderungen der Genreihenfolge werden durch das vermehrte Auftreten repetitiver Elemente begünstigt, beispielsweise in Vertretern der Gattung Wolbachia, da es dadurch öfter zu Rekombinationsereignissen kommen kann. - 26 - Eine andere Form der Veränderungen der Genreihenfolge wird durch den Replikationsmechanismus in Prokaryonten begünstigt. Im Theta-Replisom liegen beide duplizierten DNA-Stränge nach beieinander, sodass die Wahrscheinlichkeit homologer Rekombination steigt. Dadurch kommt es zu Inversionen, die aber stets symmetrisch sind, am Beispiel von Vibrio cholerae und Vibrio parahaemolyticus sowie E. coli gezeigt. Es ergibt dabei ein X-Muster. Bei dieser Form der Genomevolution bleibt die Entfernung zum ORI konstant. Das ist ein evolutiver Zwang, da der Abstand direkt mit der Transkriptionsrate zusammenhängt und sich daher auf die Gendosis auswirkt (gene dosage effect). Stark exprimierte Gene werden normalerweise in der gleichen Richtung transkribiert wie die Replikation fortschreitet. Dadurch werden Kollisionen zwischen Polymerasen vermieden, viel wichtiger ist aber noch, dass Gene rund um den ORI immer transkribiert werden können, weil das Replisom relativ schnell nach der Inititation diesen Genombereich verlässt und der Transkription zugänglich macht, auch in Organismen, in denen die Replikation mehrmals pro Teilungszyklus initiiert wird. Gene in der Nähe des ORI codieren für ribosomale RNA und Proteine oder tRNA, alles Produkte die während der Verdopplung der Zelle limitierende Faktoren darstellen. Horizontaler Gentransfer (HGT) zwischen Bakterien aber auch Bakterien und Archaen erlaubt den unidirektionalen, lateralen Austausch von genetischem Material zwischen evolutionären Entwicklungslinien. Im Gegensatz dazu, sind Eukaryonten auf sexuelle Reproduktion angewiesen und können ihre Gensets nur von einer auf die nächste Generation verändern. Man unterscheidet drei Mechanismen des HGT: • Aufnahme freier DNA Prokaryonten sind im Boden permanent freier DNA ausgesetzt, die durch Huminsäuren stabilisiert wird. Sie besitzen spezielle Aufnahmeapparate, um doppelsträngige DNA aufzunehmen, um deren Nukleotide zu recyclen. Während der Aufnahme wird der Doppelstrang aufgeschmolzen und ein Strang degradiert. Der verbleibende Einzelstrang ist ein Signal für bakterielle Reparaturmechanismen, als Folge kann es zu homologer Rekombination kommen, wenn im Genom eine passende Sequenz gefunden wird. In Acinetobacter sp. BD413 sind 16 Kompetenzgene identifiziert worden, die einen TypIVartigen Pilus aufbauen, der DNA translocieren kann. • Konjugation Zellen (F+), die fähig sind, einen Sex-Pilus auszubilden, dessen Komponenten auf dem FPlasmid codiert sind, können dieses Plasmid während gleichzeitiger rolling circle replication auf Zellen übertragen, die dieses Plasmid nicht enthalten. Die Empfänger-Zellen (F–) können dann wiederum eine Konjugation mit anderen Zellen einleiten. Das F-Plasmid kann sich auch in das Chromosom einbauen, was dazu führt, dass mitunter das ganze genetische Information des Chromosoms übertragen werden kann. Auf der Empfänger-Seite wird das Genom mit dem aquirierten Einzelstrang widerum durch homologe Rekombination gepatcht. • Transduktion Bacteriophagen, Archaeen haben gleichermaßen ihre Viren, stellen Genvehikel dar, die DNA von einer Wirtszelle zur nächsten mittels unterschiedlicher Mechanismen übertragen. Man muss zwischen spezieller und genereller Transduktion unterscheiden. Im Normalfall (generelle Transduktion) wird das virale Genom bei Infektion in den Wirt injiziert. Dort beginnt meist sofort die Produktion viraler Proteine und die Vervielfältigung des viralen Genoms sowie Selbstassemblierung neuer Virionen. Während diesem Prozess wird das Wirtsgenom fragmentiert und Teile des Wirtsgenoms werden in die Virionen verpackt. Infizieren diese Virionen widerum andere Zellen, ist der Gentransfer vollzogen. - 27 - Im Fall spezieller Transduktion sorgen virale Faktoren oder der Wirt selbst, dass das virale Genom zunächst in das Wirtsgenom eingebaut wird. Dort kann es mitunter viele Generationszyklen des Wirts überdauern, bevor es das Wirtsgenom verlässt und in den Vermehrungszyklus eintritt. Beim Verlassen kann es passieren, dass Teile des Wirtsgenoms, die der Insertionsstelle am nächsten liegen, mitgenommen werden. Dadurch werden spezielle Gene, nämlich die, die der Insertionsstelle am nächsten liegen, in andere Zellen übertragen. Der Beitrag der Transduktion zur Evolution bakterieller Genome wird oft unterschätzt. Im Meer kommen durchschnittlich 105-106 cfu/ml vor, in 300m Tiefe 104 cfu/ml und in der Tiefsee immer noch 103 cfu/ml, die Zahl an Phagen liegt aber jeweils um das 10-fache höher! Daher kann eine enorme Flexibilität hinsichtlich des gesamten Genpools entstehen, was aber auf Grund der Größe des Systems, nämlich der Gesamtheit der Weltmeere, schwierig in Modellversuchen zu studieren ist. Transduktion ist auch dafür verantwortlich, dass bestimmte hotspots, sogenannte genomic islands, zur Aquirierung neuen genetischen Materials in Prokaryonten existieren. Sie entstehen, indem sich zunächst repetitive Elemente an bestimmten Sequenzbereichen akkumulieren. Diese verlieren im Zuge der Genomevolution Teile ihres Genoms, das sie zum Beispiel befähigt, das Wirtsgenom zu verlassen. Bei erneuter Infektion folgender Prokaryontengenerationen findet die injizierte virale Nukleinsäure passende Insertionsstellen auf Grund der Ansammlung repetitiver Elemente. Somit wird die Aufnahme fremder genetischer Information vereinfacht. Neue genetische Teile sind aber nicht immer plug-and-play fähig. Es existieren Mechanismen, die es angreifender DNA schwierig bis unmöglich machen, ins Wirtsgenom zu gelangen beziehungsweise exprimiert zu werden. Der GC-Anteil der DNA und die Inkompatibilität regulatorischer Elemente verhindern eine erfolgreiche Expression. Darüberhinaus wurden kürzlich aktive Abwehrmechanismen in Bakterien entdeckt, die, ähnlich der eukaryotischen RISC-abhängigen RNADegradation, virale Nukleinsäure erkennen und abbauen. Dabei konnte auch den vielen prokaryotischen ORFs, die kurze RNA produzieren, aber deren Funktion unbekannt war, eine Bedeutung zugeordnet werden, da man erkannte, dass sie zu viralen Genomabschnitten perfekt komplementär sind. 6 Entwicklung eukaryotischen Lebens Der Stammbaum des Lebens, wie er in den heutigen Lehrbüchern zu finden ist, beschreibt drei fundamental unterschiedliche Domänen, basierend auf Sequenzvergleichen. Welche der drei Gruppen war aber zuerst da? Die Vergleiche der 5S rRNA ergeben Stammbäume ohne Wurzel, da der Vergleich nur aussagt, wie weit die Sequenzen voneinander entfernt sind. Man kann aber auch Stammbäume mit Wurzel herstellen, indem man Genduplikationen berücksichtigt. Der letzte gemeinsame Vorfahre einer Gruppe von Spezies muss all jene Gene enthalten, auf die die Duplikationsereignisse zurückzuführen sind. Gewurzelte Stammbäume hängen daher von einer Hypothese ab. Die Erweiterung des 5S rRNA Stammbaums mit Genen für Elongationsfaktoren und ATPasen, die in Duplikationsereignisse verwickelt wurden, hat dazu geführt, dass der Prototyp des Lebens als Wurzel im Stamm- 28 - baum in den bakteriellen Zweig eingereiht wurde. Diese Behauptung hat Folgen: Einige basale bakterielle und archaeelle Entwicklungslinien haben Anpassungen an heiße Umweltbedingungen, sind hyperthermophil. Das hat zur Hypothese geführt, dass das Leben in heißer Umgebung entstanden ist. Durch Extrapolation kann man annehmen, dass der letzte universelle gemeinsame Vorfahr des Lebens (LUCA) bakterielle Eigenschaften besaß. LUCA muss aber nicht der erste Prototyp zellulären Lebens sein, er vereint letztlich nur alle Eigenschaften, die sich alle heutigen Lebewesen teilen. Interessanterweise finden sich in manchen heutigen Spezies Aminosäuresequenzen, die vermutlich von ausgestorbenen Linien vor LUCA stammen. Da LUCA allem Anschein nach ein simpler Prokaryot war, stellt sich natürlich die Frage, wie plötzlich viel komplexeres, eukaryotisches Leben auftauchen konnte, was eine starke Diskontinuität darstellt. Kompartimentalisierung von Transkription und Translation, die Erfindung von Splicing und posttranslationaler Modifikation von Proteinen, das Auftreten von Zellorganellen, vollkommen andere Chromosomen-Organisation und der Anstieg des Anteils an nicht-codierender DNA konnte nicht einfach durch Mutationen erklärt und mit der Abstammung von einfacheren Organismen vereinbart werden. Molekulare Fossilien in Form von Biomarkern wie Sterane in Tappania plana, gefunden in paläoproterozoischen Schiefern in der australischen Provinz Pilbara, sind ein Indiz dafür, dass eukaryotisches Leben bereits vor 1.9-1.7 Milliarden Jahren, also 0.5-1 Milliarde Jahre früher als multizelluläres Leben, existierte, aber trotzdem lange nach Bakterien und Archaea entstand. Die Entstehung von Eukaryonten hat vermutlich stark mit Archaeen zu tun, da sie eine gemeinsame evolutionäre Geschichte haben. Morphologisch sind sie nicht von Bakterien zu unterscheiden, es handelt sich um unizelluläre Organismen, die meist kleiner als Bakterien sind. Biochemisch gibt es aber Unterschiede. Sie besitzen kein Murein, dafür spezielle oder gar keine Zellwände aus Pseudomurein. Die Lipide der Zellmembran sind ether- statt estergelinkt, als Anpassung an extreme Lebensräume (121°C, pH 0, hohe Osmolarität, hoher Druck am Grund der Tiefsee). Neben einigen biochemischen Unterschieden hat vor allem die Erkenntnis, dass Archaeen eine völlig andere Art der Transkription als Bakterien anwenden, für Aufregung gesorgt. RNA Polymerasen von Archaeen sind genauso komplex wie die von Eukaryonten. Die herkömmliche Methode zur Feststellung dieses Umstands ist das Denaturieren und Auftragen von gereinigten Polymerase-Komplexen auf Gele (links; Ec E. coli, Hs Halobacterium salinarum, Sa Sulfolobus - 29 - acidocaldarius, Sc Saccharomyces cerevisiae), moderne Methoden bedienen sich der röntgenographischen Proteinstrukturanalyse von gereinigten Polymerase-Komplexen (rechts). Zusätzlich zur Zusammensetzung des Holoenzyms, ähneln sich auch die involvierten Promoter bindenden beziehungsweise akzessorischen Proteine TBP und TFB zwischen Archeen und Eukaryonten sowie der Promoter selbst (eukaryotische Consensussequenz: TATA; archaeelle Consensussequenz: (T/C)TTA(T/A)A). Eigenschaft Archaea Eukarya Bacteria Promoterstruktur Assemblierung des Initiationskomplexes TATA-Box -25 bis -30 TATA-Box -25 bis -30 Pribnow-Box -10 Richtungsbestimmung BRE-Element > -30 BRE-Element > -30 -35-Box Sequenz Katalytisches Enzym RNA-Polymerase RNA-PolymeraseII RNA-Polymerase (10-14 Untereinheiten) (12 Untereinheiten) (4 Untereinheiten) Genereller Transkriptionsfaktor TBP TBP TBP, DNA, RNAP Interaktion TFB TFIIB Stabilisierung des Transkriptionskomplexes TFE TFIIE Transkription Sigma-Faktor Mitochondrien und Chloroplasten haben sich höchstwahrscheinlich aus Bakterien entwickelt. Molekulare phylogenetische Rekonstruktionen haben gezeigt, dass alle Mitochondrien einen gemeinsamen Ursprung haben, genauer gesagt ein endosymbiontisches α-Proteobakterium. Chloroplasten scheinen aus Cyanobakterien hervorgegangen zu sein. Indizien dafür sind: • • • • • • • • • Die innere Membran der von einer Doppelmembran umschlossen Organellen teilt Eigenschaften mit bakteriellen Membranen Das Chromosom ist ringförmig Die Genreihenfolge ribosomaler Gene ist gleich wie in Bakterien Gentransfer von den Organellen in den Nucleus, 18% eukaryotischer Gene haben bakteriellen Ursprung Die Elektronentransportkette von Mitochondrien ähnelt denjenigen freilebender Bakterien. Chloroplasten und Cyanobakterien assimilieren Licht zu ATP und NADPH unter Verbrauch von CO2 Die Translation passiert co-transkriptionell im selben Kompartment Die Vermehrung von Mitochondrien und Chloroplasten ist unabhängig von der Kernteilung Der genetische Informationsgehalt unterscheidet sich vom nukleären Genom Hinsichtlich der Entstehung des Zellkerns und der Kompartimente in eukaryotischen Zellen gibt es nur Vermutungen. Man kennt Bakterien der Gattung Gemmata, die keine Zellwand besitzen und deren Nukleoid (N) innerhalb des Kernkompartiments (NB, nuclear body) von einer Membran umschlossen ist (A). In einem Querschnitt von Gemmata obscuriglobus erkennt man - 30 - die unterschiedliche Textur innerhalb des Membran gebundenen Kernkompartiments (M) und dem Cytoplasma (C). Sie enthalten darüberhinaus Gene für Proteine wie Integrin-α-V, das normalerweise mit der extrazellulären Matrix eukaryotischer Gewebe interagiert, die dieses Bakterium wohl kaum zu Gesicht bekommt. Diese und derartige Spezies sind prädestiniert, die Evolution von Eukaryonten zu ermöglichen, zu der es schließlich mehrere Hypothesen gibt: • Fusion Ein Bakterium wie Gemmata und ein Archaeon verschmelzen zum ersten Eukaryonten (Zillig, 1989). • Symbiose Die serielle Endosymbiontentheorie von Margulis (1970, 1993, 2000) beschreibt die Symbiose eines zellwandlosen Archaeon mit Spirochaeten zu einem Protoeukaryonten, der daraufhin Endosymbiose mit Cyanobakterien und/oder α-Proteobakterien eingegangen ist. Problematisch ist allerdings, dass man keine noch so primitiven Eukaryonten kennt, die keine Mitochondrien haben. Bei Arten wir Microsporidia oder Trichomonas, die man zunächst als solche identifiziert hat, hat man dann doch energieerzeugende Organellen gefunden, die sich als degradierte Mitochondrien herausgestellt haben. In dieser Hinsicht findet allerdings die Tatsache der Genomreduktion obligater Endosymbionten Bestätigung. • Engulfment Dabei handelt es sich um ein durchaus wahrscheinliche Situation, in der eine Zelle eine andere zu fressen versucht, was ihr aber nicht gelingt. Dieses Modell wird zur Erklärung der Kompartimentalisierung eurkaryotischer Zellen herangezogen, besonders im Hinblick auf die Entstehung des endoplasmatischen Retikulums. Die Szenarien umfassen: Ein Bakterium verschlingt eine „Eocyte“ (Crenarchaeota), Lake and Riviera (1994). Ein zellwandloses gram-negatives Bakterium verschlingt eine „Eocyte“, Gupta and Golding (1996). Ein RNAbasierter Protoeukaryont phagocytiert ein Archaeon, Sogin (1991). 7 Gene duplications – Driving force of genome evolution Die Bedeutung von Genduplikation in der molekularen Evolution hat 1971 der Japaner Susumu Ohno erkannt. Diese fundamentale Idee hat der in seinem Buch „Evolution by Gene Duplication“ dargestellt. Man unterscheidet entsprechend dem Ausmaß der Auswirkung verschiedene Typen von Genduplikationen: 1. 2. 3. 4. Duplikation von internen Sequenzbereichen und auf Proteinebene funktioneller Domänen Duplikation ganzer Gene Duplikation von Chromosomenabschnitten Duplikation des ganzen Genoms (Polyploidie) Weiters hat man mehrere Mechanismen identifiziert, die eine Genduplikation verursachen: 1. 2. 3. 4. Unbalanciertes Crossing-Over Unbalancierter Austausch zwischen Schwesterchromatiden Homologe Rekombination in der Replikationsgabel Abgleiten der Matrize bei der Replikation (replication slippage) - 31 - Duplikation interner Sequenzbereiche kann lange Moleküle mit repetitiven Domänen hervorbringen, wie zum Beispiel Immunglobuline, Cadherine, epidermal growth factor (EGF) oder Collagen. Letzteres besitzt ein repetitives Sequenzmotif in Form von G-X-X, das zugleich ein Beispiel für replication slippage ist. Man unterscheidet Sequenzwiederholungen innerhalb eines Gens nach ihrer Funktion in invariante Wiederholungen (invariant repeats), die beispielsweise in metabolischen Enzymen den Stoffumsatz erhöhen, und variante Wiederholungen (variant repeats), die nach der Duplikation mutieren und eine andere Funktion erhalten. Als Beispiel sei hier die Laktatdehydrogenase genannt, deren katalytische Domäne durch Austausch einer einzigen von 317 Aminosäuren zu einer Malatdehydrogenase wird. Anhand der Duplikation von Domänen und der Beobachtung der Aminosäureunterschiede kann man die Reihenfolge der Duplikationsereignisse ablesen. Der Trypsin-Inhibitor Ovomucoid besteht aus drei ähnlichen Domänen, von denen zwei eine höhere Ähnlichkeit ausweisen als die dritte. Daher kann man festhalten, dass die Domänen 1 und 2 aus einer Vorgänger-Domäne 1/2 hervorgegangen ist, die widerum in einem früheren Duplikationsereignis aus Domäne 3 entstanden ist. Ein spannendes Beispiel dafür Glykoproteine in antarktischen Fischen, die eine Frostschutzmittelartige Funktion ausüben (anti-freeze glycoproteins). Die Proteine bestehen zum Großteil aus Tripeptid-Wiederholungen von Thr-Ala-Ala oder Thr-Pro-Ala. Das Gen ist vor etwa 5-14 Millionen - 32 - Jahren entstanden, das Zufrieren antarktischer Gewässer hat vor etwa 10-14 Millionen Jahren begonnen! Das erste Exon zeigt Ähnlichkeit zum Trypsinogen-Gen (6 Exons). Deletion und Exonisation hat zu den 2 Exons des Gefrierschutz-Proteins geführt, gefolgt von Duplikation der Tripeptide und Einbau von Spacer-Sequenzen. Die Evolution dieser neuen Funktion durch mehrere Mutationsereignisse ist in einer relativ kurzen Zeitspanne passiert, was darauf hindeutet, dass starke positive Selektion in einer sich rasch änderenden Umwelt stattgefunden hat. Insertion von Exons in Introns hat oft Verschiebungen des Leserahmens (frameshifts) zur Folge. Dadurch entstehen leicht neue Stop-Codons, die zum Abbruch der Translation führen. Nur wenn die Länge der Insertion ein Vielfaches von 3 beträgt, bleibt der Leserahmen erhalten (d). Als Folge von Genduplikation finden sich rRNA und tRNA Gene in einer Anzahl, die mit der Genomgröße korreliert. Das könnte einerseits eine passive Konsequenz der Genomvergrößerung, oder aber damit zusammenhängen, dass größere Genome größere Mengen an rRNA und tRNA erfordern und einen selektiven Vorteil verschaffen. Dabei wurde beobachtet, dass die intraspezifische Homogenität der rRNA Gene weit größer als erwartet ist. Man hat in allen Kopien die gleichen Mutationen im Vergleich zu anderen Spezies oder einem gemeinsamen Vorfahren vorgefunden. Das sogenannte Prinzip der Concerted Evolution beschreibt, dass paraloge Gene einer Spezies näher verwandt sind als Gene derselben Familie einer anderen Spezies, obwohl das Genduplikationsereignis vor dem Artbildungsereignis stattgefunden hat.[15] Die Homogenisierung tandemartig organisierter Gene kann auf drei Arten erfolgen: • • Positive Selektion vorteilhafter Mutationen. Homogenisierung nach diesem Prinzip würde tausende Generationen dauern und ist sehr langsam. Mutationen passieren und vorteilhafte reichern sich. Das erklärt aber weder, wie die hohe Homogenität entsteht, da verschiedene Mutationen vorteilhaft sein können, noch wie unvorteilhafte wieder entfernt werden. Duplikation einer vorteilhaften Variante. Dieses Szenario umfasst zunächst das Mutieren einer Kopie, die durch Duplikation vervielfältigt wird, während die alten Varianten deletiert werden. Das ist allerdings zu unwahrscheinlich, um zufällig zu passieren. - 33 - • Genkonversion oder unbalanciertes Crossing-Over. Eine Kopie mutiert und ersetzt nach und nach die Sequenz der anderen Kopien. Die hohe Sequenzähnlichkeit wird durch homologe Rekombination, die zu Genkonversion oder unbalanciertem Crossing-Over führt. Genkonversion ist nicht-reziproke Rekombination zwischen homologen und nicht-homologen Chromosomen, was im Prinzip das Kopieren einer Sequenz, oft nur wenige Kilobasen, an einen anderen Ort unter Überschreibung der Zielsequenz ist. Unbalanciertes Crossing-Over ist nicht-reziproke Rekombination zwischen homologen Chromosomen, die oft große chromosomale Abschnitte umfasst und Deletionen zur Folge hat. Ein Beispiel für Genkonversion ist die Wiederbelebung einer Ribonuclease, RNAse P (RP), in der Entwicklungslinie der Rinder. Duplikation des PR-Gens hat durch Mutation zur Bildung eines Pseudogens (ψSR) geführt. In einem Genkonversionsereignis ist der Beginn des PR-Gens in frame an die Stelle des Beginns von ψSR kopiert worden, sodass dieses wieder exprimiert werden kann. Unbalanciertes Crossing-Over (UCO) führt zu Duplikation eines chromosomalen Teils, während ein anderer deletiert wird. Daher hat Genkonversion einige Vorteile: (1) Genkonversion verursacht keine Deletionen, und (2) Genkonversion kann als Korrekturmechanismus für tandem- und verstreute Kopien, auch auf nicht-homologen Chromosomen, wirken. Genkonversion ist allerdings langsamer als UCO. Rekombination hat auch in anderer Hinsicht evolutive Bedeutung. Beim exon shuffling entstehen neue Gene durch Kombination von Exons verschiedener existierender Gene. Dieser Mechanismus führt zu Diversifikation und Entwicklung neuer Funktionen auf Proteinebene. Ein Beispiel dafür ist das Protein tissue plasminogen activator, das das finger module von Fibronectin, die kringle structure von Plasminogen und die growth factor domain von EGF enthält. Duplizierte Gene können drei verschiedene Schicksale haben: 1. Der Selektionsdruck wirkt auf beide Kopien gleich und bleiben daher ähnlich (rRNA) 2. Der Selektionsdruck wirkt ungleich auf beide Kopien und eine Kopie wird deletiert 3. Der Selektionsdruck wirkt ungleich auf beide Kopien, eine Kopie erhält eine neue Funktion und wird beibehalten Die Fixierung einer Duplikation und einer aquirierten neuen Funktion gliedert sich in verschiedene Phasen. Bevor die schicksalsbestimmende Mutation nicht stattgefunden hat ist es unsicher, ob die Kopie beibehalten wird. Bis dahin kann die Frequenz der Kopie schwanken. - 34 - Es gibt theoretische Überlegungen zu den Mechanismen, die über die Beibehaltung duplizierter Gene entscheiden. Die duplizierten Gene A und B mit derselben Funktion 1 werden beide beibehalten, wenn die Mutationsraten µA und µB gleich sind, was aber auf lange eine instabile Situation ist (I). Evolvieren A und B unterschiedlich schnell, wird die schneller mutierende und weniger funktionelle Kopie B trotzdem beibehalten, weil sie im Falle eines Totalausfalls von A die Rolle 1 zumindest teilweise ersetzen kann (II). Ist B weniger effizient, kann es auch beibehalten werden, wenn es zusätzlich die Funktion 2 übernimmt (III). Betrachtet man mehrere solcher Beziehungen ergeben sich redundante Netzwerke, die pleiotrope Effekte hervorrufen können (IV). Diese Mechanismen beschränken sich nicht auf Leserahmen, auch cis-regulatorische Elemente evolvieren in duplizierten Genen. Das DDC-Modell (Duplikation, Degeneration, Complementation) beschreibt, wie in duplizierten Genen regulatorische Elemente, die in einer ersten Phase mutieren, die Funktionalität des regulierten Leserahmens beeinflussen. In Phase zwei kommt es zu Nonfunctionalisation, der Leserahmen wird inaktiv, Neofunctionalisation, ein regulatorisches Element erhält Affinität zu neuen Regulatoren, und Subfunctionalisation, das duplizierte Gen wird ortsabhängig (Gewebe) exprimiert.[16] Ein Beispiel für Subfunctionalisation sind die Brachyury Paraloge, HyBra1 und HyBra2, in Hydra. Es handelt sich um Transkriptionsfaktoren der T-box Familie, die die hochkonservierte, DNA-bindende T-domain enthalten, die seit 600 Millionen Jahren unverändert in allen eukaryotischen Genomen zu finden sind. In Hydra liegt Brachyury dupliziert vor und es werden beide Kopien beibehalten. Obwohl beide Varianten am Hypostom, in der Nähe der Mundöffnung, exprimiert werden, wird HyBra1 ausschließlich im Endoderm, HyBra2 nur im Ektoderm exprimiert. Die Faktoren haben gewebsspezifische Aufgaben und werden daher beibehalten. Ein Beispiel für Neofunctionalisation fibroblast growth factor (FGF) Paraloge FGFa und FGFb in Nematostella. Vor der Metamorphose bildet diese Art ein Apikalorgan am aboralen Pol aus. Dort - 35 - werden auch beide Paraloge exprimiert, sogar im gleichen Gewebe. Zuerst dachte man, die Beibehaltung beider Kopien würde einen Gendosis-Effekt ausüben. Dann hat man aber Knockout-Versuche gemacht, in denen einmal FGFa deletiert wurde, es hat sich kein Apikalorgan mehr gebildet, und einmal FGFb deletiert wurde, also Folge ist ein viel größeres Apikalorgan entstanden. Es hat sich herausgestellt, dass beide Kopien zusammen einen feedbackMechanismus geschaffen haben. FGFa ist erforderlich für Ausbildung des Apikalorgans und fördert gleichzeitig auf autokatalytische Weise die Expression von FGF-Rezeptor, FGFa selbst und sogar FGFb, das eine antagonistische Wirkung auf den Rezeptor ausübt und somit auch die Produktion von FGFa hemmt. Das prominenteste Beispiel für Genduplikationen ist das Hox-Cluster, dessen Gene die anteriorposterior-Achse (AP-Achse) unter anderem in der Maus und der Fruchtfliege bestimmen. Die Expression dieser Gene, die eine Homeobox (→ Hox) enthalten, die als Interaktionsstelle für Transkriptionsfaktoren mit Homeodomain wirkt, erfolgt in co-linearer Weise. Mutationen in Hox-Genen führen zu spezifischen homeotischen Transformationen von Körperteilen entlang der AP-Achse. In der Ubx-Mutante differenziert das dritte Thorax-Segment in ein zusätzliches Flügelpaar, die Antennapedia-Mutante hat ein zusätzliches Beinpaar an Stelle von Fühlern. Das Hox-Cluster, beziehungsweise die 4 Hox-Cluster in Vertebraten, sind durch eine Reihe von Duplikationsereignissen entstanden. Nach Duplikation eines frühen Protohox-Cluster (ancestral twin cluster) mit mindestens 4 Genen sind ein ursprüngliches Parahox-Cluster mit drei Genen (AGsx-Xlox-Cdx-P) und ein ursprüngliches Hox-Cluster entstanden. Das Parahox-Cluster wird in Amphioxus beispielsweise nur im Endoderm ebenfalls in co-linearer Weise exprimiert. Das Cluster enthält, im Gegensatz zu den 4 Gen-Gruppen Posterior, Anterior, Middle und Group3 des HoxCluster, keine Middle-Gene. - 36 - In Vertebraten wurde das Hox-Cluster zweimal dupliziert, im Lachs haben zwei zusätzliche Duplikationsereignisse stattgefunden, sodass das Genom dieser Spezies 118 Hox-Gene in 13 paralogen Clustern enthält. Es bleibt die Frage, wann die Evolution der Hox-Cluster und damit die Entwicklung von Körperbauplänen von Tieren begonnen hat und ob eine oral-aborale Körperorganisation zur Entstehung anterior-posteriorer Baupläne geführt hat. In diesem Fall müsste bereits in Nematostella ein HoxCluster zu finden sein, was auch teilweise der Fall ist. Nematostella und andere Cnidarier haben allerdings keine mittleren und posterioren Hox-Gene, die anderen heutigen Hox-Cluster in dieser Spezies und anderen Vetretern dieser Gruppe sind durch Desintegration, Neuordnung und unabhängige Genduplikation entstanden. Eine mögliche Entwicklungsgeschichte zeigt folgendes Diagramm: - 37 - Auch die Diversität an G-Protein-gekoppelten Geruchsrezeptoren (GPC-OR) ist Genduplikation zu verdanken. Im Menschen kommen derer 388 vor, die in Familien eingeteilt werden können, die widerum auf genomischen Clustern lokalisiert sind. Vergleicht man orthologe Beziehungen zwischen den Rezeptorgenen von Mensch und Maus, so erkennt man, dass die Reihenfolge konserviert ist, also alle Rezeptoren von einem gemeinsamen Vorfahren entwickelt worden sind. Geht man dieser Überlegung nach, kann man insgesamt 754 Rezeptoren eines most recent common ancestor (MRCA) rekonstruieren, von denen 691 erhalten sind. Daraus haben sich in der Maus 1037 Rezeptoren entwickelt, während im Menschen ein drastischer Verlust stattgefunden hat, sodass nur noch 388 Rezeptoren in seinem Genom vorkommen. Der Ursprung der GPC-OR Gene lassen sich bis zur Seeanomone Nematostella zurückverfolgen, in den folgenden Entwicklungslinien ist es anschließend zu massiven Genduplikationen gefolgt von Deletionen gekommen, was ein generelles Prinzip in der Entstehung von Diversität ist. 8 Comparative Genomics In der Meiose kann es zur abberanten Segregation der Chromsomen kommen. Normalerweise werden in der Meiose I die Chromosomen getrennt (Reduktionsteilung) und in Meoise II die Chromatiden. Wird aber die Meiose I fehlerhaft durchgeführt, sodass die Chromosomen nicht getrennt werden, entstehen diploide Gameten oder Gameten mit einzelnen diploiden Chromosomen. Bilden diese Gameten mit einem haploiden Gameten eine Zygote, ist diese (teilweise) triploid. In der Mitose kann in Folge keine Paarung homologer Chromosomen stattfinden, da einige Chromosomen keinen Partner haben und somit den Zellzyklus aufhalten. Erst eine Endomitose, also eine Genomduplikation, sichert das Fortbestehen eines lebensfähigen Individuums. Hinweise auf vergangene Genomduplikationen sind charakterisiert durch Syntenie, der Erhaltung der Genreihenfolge chromosomaler Abschnitte (Abfolgen homologer Gene), zwischen den Chromosomen zweier Arten, wie zum Beispiel Maus und Mensch. Eine doppelte Chromosomenzahl ist allerdings kein gutes Indiz, da Chromosomen auch fusionieren können. Syntenie und Genomduplikationen sind nicht immer auf den ersten Blick ersichtlich. Vergleicht man Chromosomen der Bäckerhefe, so fällt auf, dass einige Gene dupliziert sind, was auf individuelle Duplikationsereignisse schließen lässt. Aber beim Vergleich der Genomorganisation von Saccharomyces mit Klyveromyces, einer nah verwandten Gruppe, so sieht man schnell, dass jedes Gen der Bäckerhefe in der gleichen Reihenfolge in Klyveromyces vertreten ist. Massiver Genverlust nach Genomduplikation in der Bäckerhefe verschleiert also die Syntenie mit dem nichtduplizierten Vorgänger. Diese Methode, comparative genomics, erlaubt also eine Zurückverfolgung evolutionärer Ereignisse.[17] Genome kann man allerdings nur sinnvoll vergleichen, wenn man sie sequenziert hat. In der Geschichte der Wissenschaft hat man dafür verschiedene Strategien entwickelt, um dieses keineswegs triviale Problem zu lösen. Zu Beginn des human genome projects waren Frank Collins und Craig Venter wichtige Akteure des Projekts, der Unternehmergeist von Craig Venter veranlasste ihn aber dann dazu, das Projekt zu verlassen und eine andere, schnellere Strategie, das whole genome shotgun sequencing, im Gegensatz zum mapped clone sequencing, zu verfolgen. Dieser Wettstreit führte dazu, dass das menschliche Genom früher als erwartet publiziert werden konnte. Beide Methoden basieren auf der Sanger-Sequenzierung, die 0.5-1kb in einem Durchgang aufdecken kann. Das ist im Vergleich zu Genomgrößen von vielen Eukaryonten sehr wenig, darüberhinaus braucht man eine bestimmte Überlappung, um aus einzelnen Sequenzen komplette - 38 - Genomsequenzen zusammenbauen zu können, daher muss man viel mehr sequenzieren als das Genom groß ist. Die Überlappungssequenzen dürfen dabei nicht zu kurz sein, was besonders bei tandem repeats falsche, zu kurze Sequenzlängen ergeben könnte. Falsche Überlappung von genomweiten repeats kann sogar zum Auslassen ganzer codierender chromosomaler Regionen führen, je nach dem welcher Assemblierungsalgorithmus eingesetzt wird. Komplementäre Information kommt vom Transkriptom. Das expressed sequence tag sequencing (EST) erlaubt die Erstellung eines Schnappschusses des exprimierten Genoms. Introns werden nicht mitsequenziert, was bei der Annotierung des Genoms hilft (Intron-Exon-Organisation). Isolierte mRNA wird revers in (ss)cDNA mit Primern, die zum 3'-poly-A komplementär sind, transkribiert. Dann wird der komplementäre cDNA synthetisiert, gleichzeitig werden Sequenzen 5' und 3' ligiert, die Restriktionsschnittstellen haben (T3, SP6), die eine gerichtete Insertion in Plasmidvektoren erlauben. Hunderttausende dieser Klone werden dann sequenziert und auf das Genom gemappt. Der Nachteil dieser Methode ist, dass mRNA, die in geringer Stückzahl vorliegt, nicht erfasst wird. Man erhält also keine hundertprozentige Repräsentation des exprimierten Genoms. Je mehr Spezies sequenziert werden, desto mehr Vergleiche kann man anstellen, beispielsweise um die frühesten Chordaten als Vorgänger der Vertebraten zu studieren. Die Seescheide Ciona intestinalis, ist als Vertreter der Tunicata (Manteltiere), der nächste Verwandte der Vertebraten, das Lanzettfischchen Amphioxus der einfachste Chordat. Ursprünglich wurde Amphioxus als nächster verwandter der Vertebraten angesehen, aber molekulargenetische Untersuchungen haben die Tunicata als stark abgeleitete Gruppe mit raschen evolutionären Veränderungen (Sessilität) den Vertebraten als nächstes gestellt. Der Vergleich des Genoms von Amphioxus mit anderen Genomen zeigt, dass es außergewöhnlich langsam evolviert. Die Austauschrate in einer Entwicklungslinie wird in Phylogrammen durch die Länge des Zweigs relativ zu den Schwestergruppen repräsentiert. Die Seescheide hat im Vergleich eine große Zweiglänge, weil ungewöhnlich viele Austausche, Genverluste und Genduplikationen (tbx6-Gen) gefunden wurden. Aber die Evolutionsrate von Ciona ist nichts im Vergleich zu einem nahen Verwandten, Oikopleura dioica, einem freischwimmenden Manteltier. Es sezerniert Cellulose, die sich aufbläht und eine schützende Struktur (house) bildet. Mit dem Schwanz erzeugt es eine Strömung, aus der es Kleinstlebewesen wie einzellige Algen filtert. Es ist ein extremes Beispiel für rasche Evolution, Sequenzdivergenz und andere genomische Eigenschaften. Mit 75 Megabasen ist es das kleinste tierische Genom, es hat Genomkompaktion, Genverlust und Verkürzung intergenischer Regionen hinter sich. Genomvergleiche können helfen, den Ursprung vielzelliger Lebewesen zu erforschen und einen Metazoa-Urahn zu finden. Von den als primitiv angesehenen Tiergruppen sind die Cnidaria (Nesseltiere) im wesentlichen eine Schwestergruppe der Bilateria, nur die Ctenophora (Rippen- 39 - quallen) und Schwämme sind noch primitiver. Der Vorfahr der Cnidaria und Bilateria wird als UrEumetazoa bezeichnet (erste Organismen mit spezialisierten Geweben), während Schwämme keine echten Gewebe trotz der Vielzelligkeit haben und daher auf den Ur-Metazoa zurückgehen. Der Süßwasserpolyp Hydra (Hydrozoa) und die Seeanemone Nematostella (Anthozoa) sind bekannte Modellorganismen der Cnidaria. Eigenschaften von Hydra sind: • • • Erforschung von Regeneration. Zwackt man ein Stück ab, regeniert sich ein gesamter Polyp. Erforschung von Stammzellen. Wie verändert sich die Zellidentität während der Regeneration, was befähigt die Zellen dazu, wie bleibt die Totipotenz erhalten oder wie wird sie wiederhergestellt? Manipulation auf Zell- und Gewebeebene. Eigenschaften von Nematostella sind: • • • Basale Phylogenie. Hydra evolviert rascher als Nematostella, daher wird die Seeanemone als ursprünglicher unter den Cnidaria angesehen. Erforschung von Embryogenese. Funktionale Analyse von entwicklungsrelevanten Genen. Der Bauplan der Cnidaria ist diploblastisch, sie haben zwei Zellschichten, Ectoderm und Endoderm und darin etwa ein dutzend Zelltypen. Bereits diese ursprünglichen Organismen haben Eigenschaften entwickelt, die zur Grundausstattung höherer Lebewesen wie dem Menschen gehören, wie beispielsweise die Wnt-Familie. Die Wnt-Liganden unterteilen sich in 12 Unterfamilien, von denen bereits 11 in den Cnidaria vertreten waren. Daran zeigt sich aber auch, dass bei den Insekten und Nematoden gravierende Genverluste stattgefunden haben, da Drosophila nur noch 5 und C. elegans gar nur noch eine dieser Familien im Genom tragen. Ein ähnliches Bild zeigt sich beim Vergleich der Intronpositionen in verschiedenen Genomen. Entgegen der allgemeinen Auffassung, dass Introns in Genomen akkumulieren, haben Untersuchungen gezeigt, dass Nematostella mit dem Mensch 80% der Introns teilt und widerum in der Fliege und im Wurm starke Verluste vorgekommen sind. Unerwarteterweise gibt es sogar 30% Synthenie zwischen Mensch und Nematostella beim Vergleich orthologer Gene in der Nähe der Hox-Cluster, und das nach 600 Millionen Jahren Evolution! Macht man diesen Vergleich zwischen Mensch und Fliege findet man gar nichts. Das Hydra-Genom zeigt Eigenschaften abgeleiteter Genome, besonders erwähnenswert ist, dass 57% des Genoms tranposable Elemente sind, die in 500 Familien gegliedert werden können. Eine Familie, chicken repeat 1 (CR1), macht alleine 15% der Transposons aus und kann in drei Unterfamilien unterteilt werten, die sich auf Grund ihrer Sequenzdivergenz unterscheiden. Man bringt drei Ausbrüche der Transposonaktivität mit Artbildungsereignissen in Hydra in Zusammenhang. Die Aktivität könnte zu genomweiten Neuordnungen und Veränderungen in der Biologie des Polypen geführt haben. - 40 - Hydra hat Ecto- und Endoderm. Ob diese Zellschichten analog zu denen in Vertebraten sind, kann man herausfinden, indem man im Genom nach genetischen Kennzeichen sucht, die für Epithelien charakteristisch sind, wie beispielsweise für die Ausbildung von Zell-ZellKontakten (tight junction, gap juntion, desmosom hemidesmosom). Es zeigt sich, dass sogar neuromuskuläre Synapsen morphologisch vorhanden sind (nAChR, ChT), denen aber noch Teile ihrer molekularen Ausstattung fehlen (MuSK, Rapsyn, VAChT, etc.). Weiters sind bereits alle Komponenten (außer Connexin und Occludin) für alle Typen von junctions vorhanden.[18] Wenn schon am Anfang große Komplexität vorhanden war, stellt sich die Frage, wie neue Eigenschaften und Funktionen evolvierten. Die Analyse der Eumetazoa-Gene hat ergeben, dass etwa 80% von Bakterien, Pilzen und Pflanzen abgeleitet, also noch älterem Ursprung, sind. Die anderen 20% stellen Neuerungen dar, die in drei Gruppen gegliedert werden: • • • Typ I Novelties (15%) – Komplett neu (SMAD und andere Signaltransduktionsproteine) Typ II Novelties (2%) – Alte Domäne mit neuer Domäne kombiniert (Notch, Hedgehog) Typ III Novelties (3%) – Bekannte Domänen neu kombiniert (exon shuffling, Lim Homöobox Proteine) Neue Proteine werden in bestehende Proteinnetzwerke integriert, wie die focal adhesion kinase als Beispiel für eine Typ II Neuerung. Eine alte Kinasedomäne wurde mit einer neuen Fokaladhäsionsdomäne kombiniert, daraufhin konnte auf Signale durch Integrin-Interaktion mit der Umgebung reagiert werden. - 41 - Die Entstehung von Neuerungen waren Grund legend für die Evolution von Genomen multizellulärer Lebewesen. Der wahrscheinlich einfachste Vielzeller Trichoplax adhaerens besitzt nur 4 Zelltypen und eine dorsal-ventrale Körperachse, aber kein vorne und hinten. Entscheidend aber ist, dass viele Komponenten der wichtigsten Signaltransduktionswege in Trichoplax schon entwickelt sind (Wnt-Signalling, TGF-βSignalling, neuronale Signaltransduktion, MAPKSignalling). Aber das Tier muss nicht der allerfrüheste Metazoa sein. Choanoflagellaten wie Monosiga brevicollis sind nach heutiger Ansicht die nächsten einzelligen Verwandten der vielzelligen Organismen auf diesem Planeten. Sie besitzen ein eingeschränktes Genset für Zell-ZellAdhäsion, Zell-Matrix-Adhäsion und Metazoa-Transkriptionsfaktoren. Dieser Umstand ist erstaunlich, weil Einzeller keine Verwendung für Zell-Zell-Adhäsionsgene haben. Die Gene wurden in diesen Organismen offenbar entwickelt und später in anderem Kontext, nämlich Multizellularität, verwendet. - 42 - Beispiele für Neuentwicklungen in Monosiga sind Notch und Hedgehog, die einer Typ II Neuerung (domain shuffling zwischen vermutlich drei Genen) ihren Ursprung zu verdanken haben. Aber in diesem Fall reicht es nicht, nur Monosiga als Vertreter opistokonter Protisten zu sehen. Die ursprünglicheren Klassen Ichthyosporea und besonders Capsaspora besitzen mehr Transkriptionsfaktoren, die als Metazoa spezifisch angesehen werden, als Monosiga, der eigentlichen Schwestergruppe der Metazoa. Monosiga als stärker abgeleitete Gattung hat die Transkriptionsfaktorfamilien T-box, Churchill und Runt verloren, was auf Genverluste bei den Choanoflagellaten hinweist. 9 Evolution of complexity Der Vergleich von Genomen kann Aufschluss über die Entstehung von Komplexität liefern. Diese liegt nicht in der Anzahl der beteiligten Faktoren begründet, sondern in der Anzahl der Wechselwirkungen miteinander (Pleiotropismus). Komplexität beruht auf der Entwicklung von Netzwerken und Regulationsmechanismen: – – – Regulation auf genetischer/transkriptionaler Ebene Silencer/Enhancer Regulation auf posttranskriptionaler Ebene Alternatives Splicing, miRNA Regulation auf posttranslationaler Ebene Phosphorylierung, Ubiquitinierung, etc. Evolution transkriptionaler Regulation Genregulation geht mit zellulärer Diversität und Diversifikation einher. Alle 10 13 Zellen eines adulten Homo sapiens sapiens haben das gleiche Genom. Man schätzt die Zahl Protein codierender Gene darin auf etwa 20.000, über eine Million genomischer Schalter bestimmen, wann wie viel von welchem Gen zu machen ist. Die Evolution von Genregulation auf transkriptionaler Ebene basiert daher auf einem kombinatorischen Code. Ungefähr 2000 menschliche Proteine (Transkriptionsfaktoren) können an DNA binden. Zu jedem Gen gehören eine oder mehrere regulatorische Sequenzen mit 3-10 Proteinbindungsstellen, die von einer variablen Kombination an Transkriptionsfaktoren gebunden werden können. Dadurch ergibt sich eine unglaublich große Variation an Schaltungszuständen. - 43 - Regulatorische Komplexität unterscheidet sich in einzelligen und mehrzelligen Organismen. Prokaryontische Gene (a) umfassen neben einer TATA-Box eine upstream activating sequence (UAS) und manchmal einen Silencer. Gene von mehrzelligen Eukaryonten (b) werden von einer erstaunlich größeren Anzahl an regulatorischen Einheiten beeinflusst: Core-Promoter (TATA-Box, Initiator-Element (INR), Proximale Promoter-Elemente, Downstream Promoterelement (DPE)), Upstream-Silencer, Upstream-Enhancer, Distal-Enhancer, Isolator, Downstream-Enhancer. Regulatorische Bereiche sind sehr oft in ganzen Entwicklungslinien unverändert konserviert, was deren Bedeutung unterstreicht. Beim Vergleich von Genomen deuten stark konservierte Bereiche daher meist auf regulatorische Bereiche hin. Cis-regulatorische Elemente können sich über große chromosomale Regionen erstrecken und benachbarte Gene einschließen. Beispielsweise erstrecken sich regulatorische Regionen für manche Entwicklungsgene (Sox2, Pax6) über einige Megabasen und enthalten einige Gene, die funktionell unabhängig sind. Zielgene werden dabei über highly conserved non-coding elements (HCNEs) reguliert sowie durch Beobachtergene (bystander genes) moduliert. Diese HCNE-Dichte sowie Syntenie-Beziehungen können auf Grund der hohen Konservierung dazu benutzt werden, um von regulatorischen Regionen in Modellorganismen auf solche im Menschen zu schließen, und darin Mutationen zu suchen, die Auslöser für genetische vererbte Defekte sein können. Die Aufrechterhaltung der Organisation dieser cis-regulatorischen Regionen zieht auch SyntenieBeziehungen nach sich, da bei Rekombinationen die Regulationsfähigkeit verloren gehen würde. Morphologische Veränderungen müssen nicht immer mit der evolutiven Entwicklung neuer Gene in Verbindung stehen, oft verändert sich nur die Expression bestimmter Gene. Vergleichende Studien haben gezeigt, dass morphologische Unterschiede durch veränderte räumliche Regulation von Genen während der Entwicklung entstehen können. Veränderungen cis-regulatorischer Regionen nehmen dabei Einfluss auf die Transkription. Es hat sich außerdem gezeigt, dass Mutationen von Transkriptionsfaktoren selbst oft schädliche Konsequenzen und negativen Einfluss auf die Fitness haben. Mutationen mit größerem pleiotropen Effekt sind dabei schädlicher: Der Ausfall eines Transkriptionsfaktors übt meist Pleiotropismus aus, während eine Mutation in einer cis-regulatorischen Sequenz dazu führen kann, dass einfach nur ein anderer Transkriptionsfaktor besser bindet, somit bleiben in Summe die Funktionen aller Transkriptionsfaktoren erhalten, ein verändertes morphologisches Merkmal kann sich aber trotzdem ausbilden. Die abdominale Pigmentierung von Fruchtfliegen wurde als polygenes Merkmal identifiziert. Während Drosophila yakuba die für die Melanogaster-Gruppe typische sexual-dimorphe Pigmentierung zeigen, fehlt sie in Drosophila santomea fast vollständig. Die beiden Arten entstanden vor etwa 120.000-500.000 Jahren nach der Besiedelung einer Insel und bevölkern heute verschiedene Höhenlagen. Die zwei essentiellen Pigmentierungsgene, tan und yellow, sitzen auf dem X-Chromosom. Yellow ist für die Ablagerung von Melanin in der Cuticula erforderlich, tan ist eine Hydrolase, die Vorgängersubstanzen spaltet. Es hat sich gezeigt, dass der tan-Locus einen upstream-Enhancer - 44 - hat, der in D. santomea eine Mutation trägt, wodurch sich die Transkriptionsrate der Hydrolase verrringert. Ein Rescue-Versuch mit t_MSE::nEGFP hat den Enhancer zwischen den Genen Gr8a und CG15730 lokalisiert. Im Menschen sind einige regulatorische Regionen (583 Deletionen) verloren gegangen, die noch Schimpansen mit vielen anderen Tieren teilen. Damit gehen morphologische Veränderungen einher. Der Verlust sogenannter hCONDELs (human deletions that contain chimp concerved sequences) umfasste auch spezifische Enhancer für die Entwicklung von Schnurrhaaren und Penisbehaarung, die beim Menschen bekanntlich nicht vorkommen.[19] Evolution posttranskriptionaler Regulation Splicing beruht auf der Erkennung der 3'-Enden und 5'-Enden von Exons durch snRNAs (U1, U2, U4, U5, U6). Diese RNAs werden zusätzlich durch Sequenzen in Exons und Introns beeinflusst: ISS (intronic splicing silencer), ISE (intronic splicing enhancer), ESS (exonic splicing silencer), ESE (exonic splicing enhancer). Dadurch entstehen verschiedene Modi des alternativen Splicings: – – – – – – – Exon skipping (Exon wird ausgelassen) Alternative 3'-splice site selection (nächstes Exon beginnt weiter upstream) Alternative 5'-splice site selection (nächstes Exon beginnt weiter downstream) Intron retention (Intron wird in reifes Transkript inkludiert) Mutually exclusive exons (Exons silencen sich gegenseitig) Alternative promoter (Zusätzliches Exon upstream) Alternative Poly-A site (Zusätzliches Exon downstream) Berühmte Beispiele alternativen Splicings sind die Drosophila-Gen dsx (doublesex), Sxl (sex lethal) und tra (transformer). Ereignisse, die zum Übergang von konstanter zu alternativer Expression von Genen führen, sind unter anderem die Entstehung alternativer 3'- oder 5'-splice sites, Schwächung der 5'-splice site eines Exons, Übergang eines ESE zu einem ESS oder die Integration repetitiver DNA wie zum Beispiel Alu-Sequenzen in Introns. Unter miRNA versteht man kleine (21-25bp) nicht-codierende RNAs, die wie normale Gene exprimiert und reguliert werden. Viele sind zwischen allen Tieren hoch konserviert. Sie binden an spezifische komplementäre Sequenzen in der 3'-UTR (untranslated region) von bis zu hundert verschiedenen mRNAs, deren Translation sie modulieren. Die posttranskriptionale miRNA-vermittelte Repression in tierischen Zellen wird in verschiedenen Typen von Mechanismen realisiert: - 45 - – – – Degradation Deadenylierung des Poly-A Schwanzes und nachfolgendes Decapping führt zum Abbau der mRNA im P-Body Proteolyse der wachsenden Peptidkette am Ribosom Translationskontrolle Initionsinhibierung durch Repression der cap-recognition oder 60S joining Elongationsinhibierung durch verlangsamte Elongation oder Abfallen des Ribosoms Lagerung von mRNA im P-Body Räumliche Trennung der mRNA von Ribosomen Die Anzahl der miRNAs in einem Organismus korreliert mit der morphologischen Komplexität gemessen an Faktoren wie Anzahl der Zelltypen, Anzahl der Neuronen oder Multizellularität. Da in Choanoflagellaten keine miRNAs vorkommen, nimmt man an, dass die Fähigkeit zu deren Biosynthese am Übergang zu den Metazoen und zur Multizellularität, entstanden ist. Trichoplax dürfte die Synthesemaschinerie wieder deletiert haben. Bis hin zum Menschen ist ein deutlicher Anstieg der Anzahl an miRNA zu erkennen.[20] Viele miRNAs werden in Vertebraten in spezifischen Geweben exprimiert, etwa die Hälfte in Nervensystem. Beispiele sind miR-206 in Muskeln, miR-126 in Blutgefäßen, miR200a im Seitenlinienorgan und miR30c in Protonephridien. Evolution durch Adaptation Selektion ist ein Grundprinzip der Evolution. Dabei verändert sich die Allelfrequenz innerhalb einer Population. Wenn Individuen mit vorteilhaften Merkmalen größeren Reproduktionserfolg haben, wird sich die Häufigkeit der Merkmale in der Population erhöhen. Allele mit vorteilhaftem Effekt neigen dazu, sich schnell in einer Population zu etablieren. Man unterscheidet drei Mechanismen positiver direktionaler Selektion: - 46 - Fall A zeigt drei Formen direktionaler Selektion eines Merkmals Q gegenüber P. In Mechanismus B ist ein typischer Heterozygotenvorteil dargestellt, auch als Überdominanz bezeichnet. Wenn Allel Q (blau) zuerst schwach und Allel P (rot) in der ganzen Population vertreten ist, so verringert sich die Allelfrequenz von P, weil P zunehmend in hetero- statt homozygoten Individuen vorkommt, während die Allelfrequenz von Q steigt bis das Gleichgewicht bei etwa p = 0.7 erreicht ist. Fall C zeigt das Gegenteil, nämlich Unterdominanz, bei der heterozygote Individuen im Nachteil sind. Solche Populationen entwickeln sich in Richtung homozygot rot dominiert. Das prominenteste Beispiel für adaptive Evolution ist die Pigmentierung von Menschen. Je näher man zum Äquator kommt, desto dunkler wird die Bevölkerung, was eine Anpassung an die steigende UV-Strahlung ist. Körperfärbung und Pigmentierung entsteht aber nicht nur als Anpassung an UV-Strahlung. Die Felstaschen-Maus Chaetodipus intermedius kommt sowohl auf dunkel als auch auf hell gefärbten Gesteinen vor. Als Anpassung an die Umgebung sind Mäuse selektiert worden, die sich besser tarnen und dadurch schlechter durch Beutegreifer gerissen werden. Die molekulare Grundlage für Pigmentierung liegt in Mutationen von MC1R (Melanocortin-1-Rezeptor). MC1R ist im Syntheseweg für Melanin involviert. In verschiedenen Entwicklungslinien sind Varianten entstanden, die die Produktion von Melanin verringern oder verstärken. MC1R ist ein Transmembranrezeptor, der über den Second-Messenger cAMP die Synthese von Phaeomelanin und Eumelanin reguliert. Er besitzt eine N-terminale extrazelluläre Rezeptordomäne und eine C-terminale intrazelluläre SignallingDomäne. - 47 - Der Rezeptor ist ein Beispiel für konvergente Evolution. Unabhängige Mutationen im selben Gen liegen konvergenten, als gleich gut funktionierenden, Phänotypen in einer Vielzahl and Spezies zu Grunde. Obwohl Mutationen im gleichen Gen zu hellen Phänotypen beitragen, sind die spezifischen molekularen Mechanismen für verringerte Melanin-Produktion unterschiedlich. Einerseits kann die Signalling-Funktion beeinträchtigt, andererseits die Fähigkeit zur Membranintegration verändert sein. Solche funktionale Unterschiede haben Einfluss auf Ebene des Organismus, beispielsweise auf Dominanzverhältnisse, die unterschiedlich selektiert werden. Auch wenn das gleiche Gen für phänotypische Konvergenz verantwortlich ist, können die molekularen Mechanismen dramatische Auswirkungen auf die Expression des Merkmals und die adaptive Laufbahn des Organismus haben. - 48 - 10 Literaturverzeichnis 1. Shen et al. (2001), Isotopic evidence for microbial sulphate reduction in the early Archaean era. Nature 410, 77-81. doi: 10.1038/35065071 http://www.nature.com/nature/journal/v410/n6824/full/410077a0.html 2. Powner, M.W., Gerland, B., Sutherland, J.D. (2009), Synthesis of activated pyrimidine ribonucleotides in prebiotically plausible conditions. Nature 459, 239-242. doi:10.1038/nature08013 http://www.nature.com/nature/journal/v459/n7244/full/nature08013.html 3. Gilbert, W. (1986), Origin of life: The RNA world. Nature 319, 618. doi:10.1038/319618a0 http://www.nature.com/nature/journal/v319/n6055/abs/319618a0.html 4. Reiter, N.J., Osterman, A., Torres-Larios, A., Swinger, K.K., Pan, T., Mondragón, A. (2010), Structure of a bacterial ribonuclease P holoenzyme in complex with tRNA. Nature 468, 784-789. doi: 10.1038/nature09516 http://www.nature.com/nature/journal/v468/n7325/full/nature09516.html 5. Bartel, D.P., Szostak, J.W. (1993), Isolation of a new ribozyme from a large pool of random sequences. Science 261, 1411-1418. http://genetics.mgh.harvard.edu/szostakweb/publications/Szostak_pdfs/Bartel_Szostak_Science_93.pdf 6. Avery, O.T., MacLeod, C.M., McCarthy, M. (1944), Studies on the chemical nature of the substance inducing transformation of Pneumococcal types. J Exp Med 79, 137-159. http://www.nature.com/nature/dna50/macLeodmccarty.pdf 7. Watson, J.D., Crick, F.H.C (1953), A Structure for Deoxyribose Nucleic Acid. Nature 171, 737-738. doi: 10.1038/35065071 http://www.nature.com/nature/dna50/watsoncrick.pdf 8. Gregory, T.R. (2005), Synergy between sequence and size in Large-scale genomics. Nature 6, 699-708. doi:10.1038/nrg1674 http://www.nature.com/nrg/journal/v6/n9/full/nrg1674.html 9. Feschotte, C. (2008), Transposable elements and the evolution of regulatory networks. Nature Reviews Genetics 9, 397-405. doi: 10.1038/nrg2337 http://www.nature.com/nrg/journal/v9/n5/full/nrg2337.html 10. Mirkin, S.M. (2007), Review Article Expandable DNA repeats and human disease. Nature 447, 932-940. doi:10.1038/nature05977 http://www.nature.com/nature/journal/v447/n7147/full/nature05977.html 11. Zuckerkandl, E., Pauling, L. (1965), Evolutionary Divergence and Convergence in Proteins. Evolving Genes and Proteins , 97-166. http://authors.library.caltech.edu/5456/1/hrst.mit.edu/hrs/evolution/public/papers/zuckerkandlpauling1965/zuc kerkandlpauling1965.pdf 12. O'hUigin, C., Li, W.H. (1992), The molecular clock ticks regularly in muroid rodents and hamsters. J Mol Evol 5, 377-384. PMID: 1487823 http://www.ncbi.nlm.nih.gov/pubmed/1487823 13. Britten, R.J. (1986), Rates of DNA sequence evolution differ between taxonomic groups. Science 231, 13931398. doi:10.1126/science.3082006 http://www.sciencemag.org/content/231/4744/1393.full 14. Tajima, F. (1993), Simple Methods for Testing the Molecular Evolutionary Clock Hypothesis. Genetics 135, 599-607. doi: 10.1038/35065071 http://www.genetics.org/content/135/2/599.full.pdf+html 15. Liao, D. (1999), Concerted evolution: molecular mechanism and biological implications. Am J Hum Genet 64, 24-30. PMCID: PMC1377698 http://www.ncbi.nlm.nih.gov/pmc/articles/PMC1377698/ 16. Force, A., Lynch, M., Pickett, F.B., Amoresa, A., Yana, Y., Postlethwait, J. (1999), Preservation of Duplicate Genes by Complementary, Degenerative Mutations . Genetics 151, 1531-1545. 17. Kellis, M., Birren, B.W., Lander, E.S. (2004), Proof and evolutionary analysis of ancient genome duplication in the yeast Saccharomyces cerevisiae. Nature 428, 617-624. doi: 10.1038/nature02424 http://compbio.mit.edu/publications/06_Kellis_Nature_04.pdf 18. Chapman et al. (2010), The dynamic genome of Hydra. Nature 464, 592-596. doi: 10.1038/nature08830 http://www.nature.com/nature/journal/v464/n7288/full/nature08830.html 19. McLean, C.Y., et. al (2010), Human-specific loss of regulatory DNA and the evolution of human-specific traits. Nature 471, 216-219. doi: 10.1038/nature09774 http://www.nature.com/nature/journal/v471/n7337/full/nature09774.html 20. Technau, U. (2008), Evolutionary biology: Small regulatory RNAs pitch in. Nature 455, 1184-1185. doi: 10.1038/4551184a http://www.nature.com/nature/journal/v455/n7217/full/4551184a.html