Überblick 720 Schrott oder Gold: transponierbare Elemente im Humangenom Jean-Nicolas Volff Biozentrum, Universität Würzburg Die Sequenzierung des Humangenoms hat gezeigt, dass unser Erbgut mit Millionen von DNA-Parasiten, die transponierbare Elemente genannt werden, durchsetzt ist. Diese beweglichen und rekombinierenden Sequenzen können durch verschiedene molekulare Mechanismen unsere Gene zerstören und dadurch eine Vielzahl genetischer Erkrankungen hervorrufen. Andererseits weisen eine Reihe wichtiger Beobachtungen darauf hin, dass Retroelemente und andere transponierbare Sequenzen wichtige Komponenten eukaryotischer Genome sind. Ihre positiven Auswirkungen auf Genfunktionen sowie Genomstruktur und Evolution sind viel umfangreicher als zunächst angenommen. Besonders wichtig erscheinen diese Sequenzen als Reservoir für neue regulatorische und kodierende Sequenzen, die zu evolutionärer Innovation führen können. Einige wichtige zelluläre Funktionen, die zum Beispiel für die Replikation der Chromosomen oder das Immunsystem wichtig sind, werden von Genen kodiert, die von transponierbaren Elementen abgeleitet worden sind. Dabei haben diese oft als „Schrott-DNA“ bezeichneten Sequenzen einen „goldwerten“ Beitrag zur Entwicklung der Säugetiere und anderer Lebewesen geleistet. Abb. 1: Autonome Retroelemente bei Wirbeltieren. APE, apurinische/apyrimidinische-ähnliche Endonuklease; ENV, „envelope“ (Hülle); IN, Integrase; ORF, „open reading frame“; PR, Protease; LTR, „long terminal repeat“; REL, „restriction enzyme-like“ Endonuklease; RH, Ribonuklease H; RT, reverse Transkriptase; URI, „UvrC and intron-encoded“ Endonuklease; YR, Tyrosin-Rekombinase. Etwa 95 % des menschlichen Erbguts besteht aus Sequenzen, die keinerlei bekannte Funktionen besitzen[1]. Ein Großteil dieser Sequenzen sind endogene Retroelemente, die mit drei Millionen Kopien mindestens 40 % des Humangenoms ausmachen. Zum Vergleich: Die Protein-kodierenden Exons aus 20.000–30.000 Genen bilden nur etwa 1,5 % des Erbguts des Menschen (Tab. 1). DNA-Transposons ihrerseits machen mit ca. 300.000 Kopien etwa 3 % des Humangenoms aus. Da aber endogene Retroelemente wesentlich wichtiger für die Struktur und Evolution von Säugergenomen sind, wird in diesem Artikel nicht auf die DNA-Transposons eingegangen. Hauptgruppen von Retroelementen Der gemeinsame Nenner autonomer Retroelemente ist ein Gen, das für eine reverse Transkriptase (RT) kodiert (Abb. 1). Die RT ist das Enzym, das die mRNA in komple- mentäre DNA (cDNA) umschreibt. Durch Integration der cDNA ins Genom wird eine neue Kopie des Elements erzeugt, die ursprüngliche Kopie bleibt dabei erhalten. Es wird grundsätzlich zwischen Retroelementen mit LTRs („Long Terminal Repeats“) und ohne LTRs unterschieden. LTRs sind die beiden Sequenzwiederholungen, die sich jeweils am 5’- und 3’-Ende der LTR-Retrotransposons und Retroviren befinden. Sie enthalten Sequenzen für die korrekte Transkription des Elements und sind für die Integration der cDNA erforderlich. Dazu weisen die meisten LTR-Retroelemente zwei offene Leseraster namens gag und pol auf. Gag ist ein Kapsid-Strukturprotein. Pol kodiert für ein Polyprotein mit Protease-, RT/Ribonuklease H- und IntegraseBereichen. Retroviren unterscheiden sich von LTR-Retrotransposons durch die Anwesenheit eines Gens für das Hüllglykoprotein Env (Envelope). BIOspektrum · 6/05 · 11. Jahrgang Überblick 721 Tab. 1: Transponierbare Elemente und Protein-kodierende Gene bei Vertebraten: Kopienanzahl und Genom-Anteil (%). Mensch 3.100 Mb Nicht-LTR-Retrotransposons Maus 2.800 Mb Ratte 2.750 Mb Huhn 1.200 Mb Fugu 400 Mb 868.000 660.000 657.000 205.000 14.000 21 % 19 % 23 % 6% ? LTR-Retroelemente 443.000 631.000 556.000 12.000 3.000 8% 10 % 9% 1% ? SINEs 1.558.000 1.498.000 1.360.000 10.000 5.000 13 % 8% 7% 0,1 % ? DNA-Transposons Summe transponierbarer Elemente 294.000 112.000 108.000 13.000 8.000 3% 1% 1% 1% ? 3.163.000 2.901.000 2.681.000 240.000 30.000 45 % 38 % 40 % 8% <5 % Protein-kodierende Gene 20–30.000 20–30.000 20–30.000 20–23.000 20–30.000 Exons 1,5 % 1,5 % 1,5 % 4% 10–15 % Die einzigen kodierenden LTR-Elemente im Humangenom sind die humanen endogenen Retroviren (HERV)[2]. Sie sind nach reverser Transkription der mRNA exogener Retroviren ins Wirtsgenom integriert worden. Fast alle HERVs sind durch Mutationen inaktiviert worden. Autonome nicht-LTR-Retrotransposons bzw. LINEs (Long Interspersed Nuclear Elements) kodieren für eine RT und entweder eine apurinische/apyrimidinischeähnliche (AP) Endonuklease oder eine Endonuklease, die mit Resktriktionsenzymen verwandt ist. Eine weitere Hauptgruppe von Retrotransposons ohne LTRs sind die Penelope-verwandten Elemente, die eine sogennante Uri-Endonuklease kodieren. Die große Mehrheit der nicht-LTR-Retrotransposons im Humangenom sind LINE1 (L1) Elemente. Sie sind die einzigen autonomen Retrotransposons, die beim Menschen noch aktiv sind. Vollständige L1-Elemente sind etwa 6 Kb groß und kodieren eine AP-Endonuklease. Die meisten L1Elemente sind, wahrscheinlich als Folge einer fehlerhaften reversen Transkription, am 5’-Ende unvollständig. Aus den über 500.000 Kopien von L1, die im Humangenom vorhanden sind, können nur 80–100 Elemente autonom retrotransponieren. Einige Familien nicht-autonomer Retroelemente sind auf die enzymatische Maschinerie der L1-Retrotransposons angewiesen, um sich in Genomen zu vermehren. Eine wichtige Gruppe solcher Sequenzen sind die SINEs („Short Interspersed Nuclear Elements“). SINEs sind kurze, vielfach wiederholte Sequenzen, die von Genen abgeleitet sind, die von der Polymerase III transkribiert werden (tRNA-, rRNA-, 7SLRNA-Gene). Die meisten dieser Sequenzen im Humangenom sind die Alu-Elemente. Das nicht-autonome SVA-Retroelement, das aus zwei SINE-Sequenzen, besteht, wird BIOspektrum · 6/05 · 11. Jahrgang auch durch L1-Elemente mobilisiert, genauso wie die prozessierten Retrogene, die durch die reverse Transkription von zellulären Genen entstehen. Viele Gruppen von Retroelementen, die bei Vertebraten identifiziert werden konnten, wurden aus dem Genom der Vorfahren von Säugern und Vögeln eliminiert. Besonders LTR Retrotransposons, Retrotransposons mit Restriktionsenzym-ähnlicher Endonuklease und Penelope-verwandte Retroelemente sind beim Menschen nicht mehr vorhanden[3]. Die evolutionären Mechanismen hinter dieser massiven Eliminierung bleiben unbekannt. Endogene Retroelemente, Mutationen und Krankheiten Endogene Retroelemente können verschiedene Typen von Mutationen hervorrufen und eine Vielfalt genetischer Erkrankungen verursachen (Abb. 2, Tab. 2)[4]. Beim Menschen ist schätzungsweise eins von 20 Neugeborenen von einer de novo genomischen Insertion betroffen. Etwa 0,3 % der spontanen Mutationen beim Menschen sind auf endogene Retroelemente zurückzuführen. Die Insertion einer neuen Kopie eines Retroelements kann zur Zerstörung wichtiger genomischer Sequenzen führen. Zum Beispiel können solche Ereignisse zur Unterbrechung der protein-kodierenden Sequenz eines Gens führen. Exonische Insertionen von L1, Alu oder SVA-Retroelementen, die genetische Erkrankungen beim Menschen hervorgerufen haben, sind in verschiedenen Genen beschrieben worden (Tab. 1). Die Insertion eines Retroelements in der Nähe des Promotors eines Gens kann Abb. 2: Retroelement-vermittelte molekulare Mechanismen, die zur Entstehung genetischer Erkrankungen führen können. Gelbe Kästchen, Exons; Grüne Kästchen, Retroelemente (RTE). (A) Wildtyp-Gen, (B) Insertion eines Retroelements in einem Exon, (C) Retrotranspositions-assoziierte Deletion an der Insertionsstelle, (D) Exonierung eines intronischen Retroelementes, die zur Unterbrechung des offenen Leserasters führen kann, (E) Bildung einer Antisense-RNA aus einem im Retroelement enthaltenden Promotor, (F) Abbruch der Transkription in einem intronischen Retroelement, (G) Ungleiche homologe Rekombination zwischen zwei nicht-allelischen Kopien des Retroelementes, die zur Deletion bzw. Duplikation führen kann, (H) Deletion durch illegitime Rekombination zwischen zwei Retroelementen. Überblick 722 Tab. 2: Retroelement-vermittelte Mutationen und genetische Erkrankungen beim Menschen (Auswahl). Erkrankung Gen(Produkt) Mutation Hämophilie A Faktor VIII L1-Insertion (Exon) Hämophilie B Faktor IX L1-Insertion (Exon) Darmkrebs APC-Tumorsuppressor L1-Insertion (Exon) Choroideremie Rab Escort Protein-1 L1-Insertion (Exon) X-chromosomale Retinitis Pigmentosa Retinitis Pigmentosa 2 L1-Insertion (Intron) Chronische Granulomatose Cytochrom b245 L1-Insertion (Intron) Kolorektales Karzinom (HNPCC) MutS-Homolog 2 Alu-Insertion (Exon) X-chromosomale Agammaglobulinämie Bruton-Tyrosinkinase Alu-Insertion (Exon) Dent-Krankheit Chloridkanal CLCN5 Alu-Insertion (Exon) Brustkrebs BRCA2-Protein Alu-Insertion (Exon) Apert-Syndrom FGF-Rezeptor 2 Alu-Insertion (Exon) Acholinesterasemia Cholinesterase Alu-Insertion (Exon) Neurofibromatose Typ 1 Neurofibromatose-1 Alu-Insertion (Intron) Glycerol-Kinase-Mangel Glycerol-Kinase Alu-Insertion (Intron) Hereditäre Elliptozytose Alpha-Spectrin SVA-Insertion (Exon) X-chromosomale Agammaglobulinämie Bruton-Tyrosinkinase SVA-Insertion (Exon) Rezessive Hypercholesterinämie Adaptor-Protein ARH SVA-Insertion (Intron) Fukuyama kongenitale Muskeldystrophie Fukutin SVA-Insertion (3’-UTR) Glykogenose Phosphorylase-Kinase PHKB Deletion, L1/L1 Rekombination Fanconi-Anämie Fanconi-Anemia-A Deletion, Alu/Alu-Rekombination Lesch-Nyhan-Syndrom HPR-Transferase Deletion, Alu/Alu-Rekombination Li-Fraumeni-Syndrom TP53-Tumorsuppressor Deletion, Alu/Alu-Rekombination Tangier-Krankheit Transporter ABCA1 Deletion, Alu/Alu-Rekombination Hereditäres Angioödem C1-Inhibitor Deletion, Alu/Alu-Rekombination Männliche Sterilität Azoospermia-Region a Deletion, HERV/HERV-Rekombination X-gekoppelte Agammaglobulinämie Bruton-Tyrosinkinase Duplikation, Alu/Alu-Rekombination Lesch-Nyhan-Syndrom HPR-Transferase Duplikation, Alu/Alu-Rekombination Pelizaeus-Merzbacher-Syndrom Myelin-Proteolipid-Protein Translokation, Alu/Alu-Rekombination Ahornsirupkrankheit Dihydrolipoyl-Transacylase Deletion, Alu/L1-Rekombination Duchenne Muskeldystrophie Dystrophin Deletion, Alu/L1-Rekombination Kongenitales Katarakt, Neuropathie Proteinphosphatase FCP1 Alu-Mutation und Exonisierung auch dessen Expression verändern und zu Erkrankungen führen. Solche Insertionen können die Gentranskription entweder aktivieren oder unterdrücken, z. B. durch epigenetische Mechanismen. Die Insertion kann auch Deletionen, Inversionen und Duplikationen an der Integrationsstelle verursachen. Deletionen, die durch L1-Retrotransposition hervorgerufen werden, können beträchtlich sein (> 20 Kb). Auch in Introns können Retroelemente die Funktion von Genen beeinträchtigen. Die Rekrutierung intronischer Retroelemente als Exons (Exonisierung) kann zur Unterbrechung der kodierenden Sequenz führen. Retroelemente tragen eigene Promotoren, deren Aktivierung zur Synthese einer Antisense-RNA des Gens führen kann, und sind auch in der Lage, die Transkription eines Gens abzubrechen[5]. Ungleiche homologe Rekombination kann zwischen nicht-allelischen Kopien eines Retroelements stattfinden. Solche Rekombinationsereignisse können Deletionen, interne Duplikationen oder Translokationen als Folgen haben. Deletionen können auch durch illegitime Rekombination zwischen Retroelementen, zum Beispiel zwischen Alu-Sequenzen und L1-Retrotransposons, verursacht werden. Die Aktivierung der Expression von humanen endogenen Retroviren ist mit verschiedenen Erkrankungen in Zusammenhang gebracht worden, wie zum Beispiel Autoimmunerkrankungen, Krebs oder Schizophrenie. Bei manchen Krebserkrankungen wird das Hüllglykoprotein endogener Retroviren durch die Tumorzellen exprimiert. Dieses Protein wirkt immunsuppressiv und fördert das Wachstum der Tumoren[6]. Transponierbare Elemente und Gen(om)Evolution Transponierbare Elemente sind lange als „selfish“ (egoistisch), „junk“ (Schrott) bzw. Parasiten des Genoms betrachtet worden[7]. Es gibt nun zunehmend Hinweise darauf, dass sie eine wichtige Rolle in der Evolution und der Funktion von Genen und Genomen spielen[2, 8, 9]. Homologe Rekombination zwischen nicht-allelischen Kopien endogener Retroviren bzw. Alu-Sequenzen hat durch die Bildung von großen DNA-Umlagerungen wesentlich zur Evolution des Genoms von Primaten beigetragen. Genduplikation kann durch Retrotransposition zellulärer mRNAs stattfinden, die zur Bildung neuer funktioneller intronloser Gene führen kann. Bei Säugetieren sind viele dieser Retrogene spezifisch im Hoden exprimiert und möglicherweise an der Spermatogenese beteiligt[10]. Retroelemente wie das L1-Retrotransposon sind in der Lage, 3’-flankierende genomische Sequenzen zu retrotransponieren. Dieser Duplikations-Mechanismus könnte von großer Bedeutung für die Evolution von Genen sein[2]. Kodierende und regulatorische Sequenzen von transponierbaren Elementen sind während der Evolution für die Funktion zellulärer Gene rekrutiert worden[11]. Etwa 3,5 % der Gene des Menschen enthalten Retroelement-abgeleitete Sequenzen in ihren protein-kodierenden Exons[12]. Vollständige Gene aus Retroelementen sind während der Evolution auch „gezähmt“ worden und erfüllen seitdem neue Funktionen für die Wirtszellen. Die Telomerase, die die Replikation der Enden eukaryotischer Chromosomen (Telomere) katalysiert, leitet sich möglicherweise von der reversen Transkriptase eines Retrotransposons ab[13]. Hüllproteine endogener Retroviren sind am Aufbau der menschlichen Plazenta beteiligt[14]. Eine Familie von Genen, die möglicherweise an der Kontrolle von Zellproliferation und Apoptose beteiligt sind, ist aus gag-Genen von Retrotransposons entstanden. Einige dieser Gene unterliegen einer elterlichen Prägung, die möglicherweise von epigenetischen Abwehrmechanismen gegen Retroelemente abgeleitet ist[15]. Proteine aus endogenen Retroviren können auch vor Infektionen durch exogene Retroviren schützen[16]. Auch DNA-Transposons können als evolutionäre Quelle für neue Gene fungieren: die RAG1-Rekombinase, die für die V(D)J-Rekombination notwendig ist, ist wahrscheinlich aus einem DNA-Transposon entstanden[17]. Retroelemente spielen auch eine wichtige Rolle in der Strukturgebung und Funktion der Genome. Transponierbare Elemente sind wahrscheinlich wichtige Faktoren für die Bildung von Heterochromatin sowie für die epigenetische Regulation von Genen. Es ist vorgeschlagen worden, dass der Abbruch der Transkription zellulärer Gene durch intronische L1-Retrotransposons einem generellen Mechanismus der Genregulation entBIOspektrum · 6/05 · 11. Jahrgang Überblick spricht[5] und dass L1-Retrotransposons als Auslöser für die Inaktivierung des X-Chromosoms fungieren[18]. Retrotransposons spielen möglicherweise eine wichtige Rolle bei der Reprogrammierung des Genoms in früheren Stadien der Embryogenese bei Säugern[19] sowie bei der Regulation der Genexpression nach Hitzeschock[20]. [11] Jordan, I. K., Rogozin, I. B., Glazko, G. V., and Koonin, E. V. (2003): Origin of a substantial fraction of human regulatory sequences from transposable elements. Trends Genet. 19: 68–72. [12] Nekrutenko, A., and Li, W. H. (2001): Transposable elements are found in a large number of human protein-coding genes. Trends Genet. 17: 619–621. [13] Nakamura, T. M., and Cech, T. R. (1998): Reversing time: origin of telomerase. Cell 92: 587–590. [14] Mi, S., Lee, X., Li, X., Veldman, G. M., Finner- Literatur [1] International Human Genome Sequencing Consortium (2001): Initial sequencing and analysis of the human genome. Nature 409: 860–921. ty, H., Racie, L., LaVallie, E., Tang, X. Y., Edouard, P., Howes, S., Keith, J. C. Jr., and McCoy, J. M. (2000): Syncytin is a captive retroviral envelope protein involved in human placental morphogenesis. Nature 403: 785–789. [2] Kazazian, H.H. Jr. (2004): Mobile elements: drivers of genome evolution. Science 303: 1626–1632. [15] Brandt, J., Schrauth, S., Veith, A.-M., [3] Volff, J.-N., Bouneau, L., Ozouf-Costaz, C., and Fischer, C. (2003): Diversity of retrotransposable Transposable elements as a source of genetic innovation: expression and evolution of a family of retrotransposonderived neogenes in mammals. Gene 345: 101–111. elements in compact pufferfish genomes. Trends Genet. 19: 674–678. [4] Chen, J.-M., Stenson, P. D., Cooper, D. N., and Ferec, C. (2005): A systematic analysis of LINE-1 endonuclease-dependent retrotranspositional events causing human genetic disease. Hum. Genet. 117: 4114–4127. [5] Han, J. S., and Boeke, J. D. (2005): LINE-1 retrotransposons: modulators of quantity and quality of mammalian gene expression? Bioessays 27: 775–784. [6] Mangeney, M., Pothlichet, J., Renard, M., Ducos, B., and Heidmann, T. (2005): Endogenous retrovirus expression is required for murine melanoma tumor growth in vivo. Cancer Res. 65: 2588–2591. [7] Orgel, L. E., and Crick, F. H. (1980): Selfish DNA: the ultimate parasite. Nature 284: 604–607. [8] Volff, J.-N. (Hrsg): Retrotransposable elements and genome evolution. Karger Verlag, Basel, 2005. [9] Brosius, J. (2003): The contribution of RNAs and retroposition to evolutionary novelties. Genetica 118: 99–116. [10] Wang, P. J. (2004): X chromosomes, retrogenes and their role in male reproduction. Trends Endocrinol. Metab. 15: 79–83. Froschauer, A., Haneke, T., Schultheis, C., Gessler, M., Leimeister, C., and Volff, J.-N. (2005): [16] Best, S., Le Tissier, P., Towers, G., and Stoye, J. P. (1996): Positional cloning of the mouse retrovirus restriction gene Fv1. Nature 382: 826–829. [17] Agrawal, A., Eastman, Q. M., and Schatz, D. G. (1998): Transposition mediated by RAG1 and RAG2 and its implications for the evolution of the immune system. Nature 394: 744–751. [18] Lyon, M. F. (2000): LINE-1 elements and X chromosome inactivation: a function for „junk“ DNA? Proc. Natl. Acad. Sci. USA 97: 6248–6249. [19] Peaston, A. E., Evsikov, A. V., Graber, J. H., de Vries, W. N., Holbrook, A. E., Solter, D., and Knowles, B. B. (2004): Retrotransposons regulate host genes in mouse oocytes and preimplantation embryos. Dev. Cell 7: 597–606. [20] Allen, T. A., Von Kaenel, S., Goodrich, J. A., and Kugel, J. F. (2004): The SINE-encoded mouse B2 RNA represses mRNA transcription in response to heat shock. Nat. Struct. Mol. Biol. 11: 816–821. Korrespondenzadresse: Dr. Jean-Nicolas Volff Physiologische Chemie I Biozentrum Universität Würzburg Am Hubland D-97074 Würzburg [email protected] Jean-Nicolas Volff geboren 1966; Studium der Biologie in Nancy (Frankreich); 1994 Promotion am Institut für Genetik und Mikrobiologie in Nancy; 1994–1996 EMBO-Stipendiat am Institut für Industrielle Genetik in Stuttgart; 1996–1997 Arbeitsgruppenleiter am Robert-Bosch-Krankenhaus in Stuttgart; 1997–2001 Wiss. Assistent und Arbeitsgruppenleiter am Institut für Physiologische Chemie I in Würzburg; seit 2001 Biofuture-Nachwuchsgruppenleiter in Würzburg; 2006 Habilitation.