Vorlesung 1: Evolution des prokaryontischen Genoms • mikrobielle Genome Sequenzierung der mikrobiellen Genome • die erste in 1995--Haemophilus influenzae • abgeschlossen – Überblick, Webseiten – Fallstudien – ganzheitliche Genom-Muster • Evolution der hauptsächlichen Abstammungen des Lebens – “Tree of Life”, Lebensbaum – Theorie von der mehrfachen Symbiose – Clusters of Orthologous Groups (Cluster der orthologischen Gruppen) – Lebensbaum, neue Sichtweise cmr.jcvi.org – – – – 526 Bacteria 42 Archaea 3 Virus Hefe (Saccharomyces, Eukaryot, 13 MB) • 17 in Bearbeitung Liste aller Genome J. Craig Venter Institute Haemophilus influenzae • die meisten Bakterienstämme sind nichtpathogen (zB: Rd-strain) • 6 pathogene Bakterienstämme, Impstoff für nur einen (b-strain) • Infektionen der Ohren, Atemwege bei Kinder • Meningitis (fatale Infektion der Hirnhaut) Haemophilus influenzae • 1.8 MB (Kosten: $0.48 / basepair) • erste Genomesequenzierung mit “Shotguntechnik” • “Lo and behold, the two ends joined. I was as stunned as anyone.” -- Rob Fleischmann • 1743 vorhergesagte Gene – 1007 ähnlich zu bekannten Genen – 736 (> 40%) ganz unbekannte Gene 1 Normalverfahren H. influenzae ringförmiges Chromosom • Sequenzierungsstrategie & Zusammensetzung • Erkennung der rRNAs, tRNAs • Vorhersage der proteincodierenden Sequenz • BLAST-Suche für bekannte Proteine • Kategorisierung mit Bezug auf Funktion – (unbekannte: “hypothetical protein”, “unknown function”) Nahaufnahme Metabolismus • Zuckertransport – glucose, fructose, galactose, ribose, etc • kompletter Glycolyseweg • Citronensäurezyklus (TCA)--3 Enzyme fehlen – (Nährstoffbedarf für Glutamat!) Pathogenese • 8 Gene in fimbrialen Gencluster • Fimbrien: fädige Anhangsgebilde verschiedener Bakterien • Haftvermögen der Bakterien zu Wirtszellen • vorliegend in b strain, fehlend in Rd strain Escherichia coli K-12 • 4.6 MB • Projektdauer: 6 Jahre (nicht mit ShotgunTechnik) • fundierte Kentnisse – Genetik – Biochemie – Physiologie 2 coding seqs. bidirectionale Replikation • oriC (origin) - Ursprung der Replikation - 245 bp rRNA – 3 x 13 bp repeat (DNA Abspulen) – 4 x 9 bp repeat (DnaA Anbindung) tRNA sim.to phage proteins • Terminierung CAI codon adaptation index G-C Schrägung (skew) = [G - C]/[G + C] Gene in Operonen Ori term 1st 2nd 3rd all Intergenic % Operone # Gene 73% 1 17% 2 5% 3 6% 4 oder mehr – milde Pneumonie – Atherosclerosis (Infektion des Blutgefäßes) 1 20% 2 12% 3 oder mehr Faden Faden Beule – Trachoma-Blindheit (Asien & Afrika) – Geschlechtskrankheit (USA) • C. pneumoniae # Promotoren 68% Chlamydia Chlamydia • obligatorisch intrazellulärer Bewohner in den eukaryotischen Zellen • C. trachomatis % Operone (Rasterelektronenmikroskopie) erweitern durch Vacuole (Transmissionselektronenmikroskopie) • leben in spezialisierten Vacuolen in “post-Golgi exocytic vesicular compartment” • weicht der Immunantwort des Wirtsorganismus aus 3 Chlamydia Chlamydia • Frage: Warum verhindert Penicillin die Zellteilung? Peptidoglycan (Zielort des Penicillins) wurde nicht gefunden. • Antwort: Peptidoglycan muss vorhanden sein! Gesamte Stoffwechselweg für Synthese, Membranzusammensetzung, und Recycling ist vorhanden! • vorhanden – Enzyme für DNA-Reparatur, DNA-Replikation, Transkription, Translation. – TCA (außer 3 Enzyme, Glutamat-Auxotroph) • fehlend – Enzyme für Biosynthese der Nucleotide – Enzyme für Biosynthese der Aminoäure (außer Tryptophan-operon) • Frage: Produziert es eigenes ATP oder stielt es sich von der Wirtszelle? • Antwort: Beides! – ATP/ADP Transportproteine – Enzyme für ATP-Generation Chlamydia Vibrio cholerae -- Cholera • Frage: Was sind die Fäden, die durch die Beulen stechen? – Hypothese: Nährstoffaufnahme • Antwort: Proteine für komplettes “Type III secretory system” gefunden. – Sekretion der Proteine für Steuerung der Wirtszelle Zwei ringförmige Chromosome 1.0 MB • • • • • epidemisch in S. Asien > 1,000 yr 7 globale Epidemien seit 1817 derzeitige Pandemie, beginnend 1991 verbreitet im Wasser, unreines Trinkwasser lebt in Schleimhaut des Darms, stellt Giftstoffe her: cholera toxin (CT) • bewirkt Verlust von Wasser & Elektrolyten; -- schneller, schlimmer Durchfal Determinante der Pathogenität 2.9 MB CT 4 Neisseria meningitidis (meningococcus) Pathogenese durch Neisseria • Meningitis (fatale Infektion der Hirnhaut) • 5 Serotype • Serotyp B -- Europa, N. Amerika. kein Impstoff vorhanden • Serotyp B -- Sequenzierung März 2000 Diagramm des Genoms der Neisseria Inseln des horizonalen Gentransfers Suche nach Kandidaten für Impstoff IHT: USS: DNA Aufnahme Signalsequenzen • • • • • • • Virulence genes Base composition Borrelia burgdorferi & “Lyme disease” • ~1975 Endeckung einer mysteriösen Krankheit, gleichartig zu rheumaähnlicher Arthritis • ~1982 verursachendes Mittel ist Spirochät, Borrelia bergdorferi – vorkommend bei wilden Säugetieren -- Hirsche, Eichhörnchen – Krankheitsüberträger durch Zecken • 1997 Genomsequenzierung – viele Plasmide: 12 Fadenmoleküle, 9 Ringmoleküle! • Lipoproteine an der Zelloberfläche – OspA, OspB “outer surface proteins” • Impstoff, LYMErix, SmithKline Beecham • Problem: Impstoff hat viele Nebenwirkungen! • 2158 proteincodieriende Gene 570 Proteine, vorhergesagt an der Zelloberfläche 350 Proteine, Expression bei E coli 350 Proteine, in Mäusen eingespritzt, um Antikörper zu bilden Immunserum ausprobiert -- Anbindung oder Tötung der Bakterien -- 85 positiv Prüfung für Präsenz & Variabiliät 7 Proteine sind vorhanden und meistens die gleichen in MenB Bakterienstämme Gute Kandidaten für künftigen Imstoff gegen MenB Deinococcus radiodurans • Entdeckung 1956: Schadstoff in bestrahltem Büchsenfleisch • sehr widerstandsfähig gegen Mittel, die DNA schadet – ionisierende Strahlung – UV-Strahlung – Wasserstoffperoxid • Kandidatorganismus für biologische Sanierung der Bereiche, die mit radioaktiven Mitteln & giftigen Verbindungen kontaminiert sind 5 Wie überlebt dieses Bakterium? • entgiftet Sauerstoffradikale – vielfältige Katalasen, Superoxiddismutasen • schnelle & effiziente DNA-Reparatur – vielfältige Kopien der meisten Reparatur-Enzyme 2 Chromosome & 2 Plasmide kürzliche Genduplikationen • exportiert beschädigte Nukleotide – verhindert die neue Inkorporation in DNA • DNA-Reparatur durch homologe Rekombination – jede Zelle ist polyploid; mit vielfältigen Kopien jedes Chromosoms; unbeschädigte Kopie benutzt die beschädigte Kopie zur Reparatur; repetitive DNA hilft bei Chromosomenpaarung Xylella fastidiosa • 1987 CVC (citrus variegated chlorosis) - Erkrankung bei Zitrusfrüchten - erstes Auftreten in Brasilien • Bakterien verstopfen das Xylem (Wasserstraße in der Pflanze) Xylella fastidiosa • brazilianisches Sequenzierung-Konsortium • 30 kleine Laboratorien in Zusammenarbeit; jedes erhält ein DNA-Sequenzierungsgerät • wissenschaftliche Infrastruktur aufgebaut, Kompetenz in Molekularbiologie verbessert Insekt: “Glassy-winged sharpshooter” Pierce’s Disease of grapevine Nahrungsaufnahme durch stechende Mundwerkzeuge, die Bakterien von Pflanze zu Pflanze übertragen Gefahr für Weinbau in Xylella Kalifornien! fastidiosa 6 Mechanismus der Pathogenie • EPS : extrazelluläres Polysaccharid: klebriger Gummi: verklebt Bakterien miteinander und mit der Zellwand der Pflanze Mechanismus der Pathogenie • Fimbrien (wie bei Haemophilus): fädige Anhangsgebilde, Festhalten an Xylem der Pflanzen und der stechenden Mundwerkzeuge des Insekts Mechanismus der Pathogenie • Protease & Cellulase zusammenbrechen der Zellwand der Pflanze Mechanismus der Pathogenie • Hemagglutanin Klebstoff für Fimbrien : ähnlich zu sezerniertes Protein von Neisseria • Viele andere Ähnlichkeiten mit tierpathologischen Bakterien Der Lebensbaum -- die Evolution der hauptsächlichen Abstammungen des Lebens – Lebensbaum (“Tree of Life”) – Theorie von der mehrfachen Symbiose (Serial Endosymbiont Theory) – Cluster der orthologischen Gruppen (Clusters of Orthologous Groups) – Lebensbaum, neue Sichtweise Stammesgeschichte alle Organismen • Wie sind derzeitige Organismen miteinander verwandt? • Was ist der Ursprung der eukaryotischen Zelle? 7 Die klasslichen fünf Reiche der Organismen Eukaryote vs Prokaryote • • • • Zellkern Organelle Histone DNA + + + lineare • • • • • ringförmige molekulare Daten -- 3 Hauptgruppen (nicht 5) Bacteria Archaea Eukarya Animalia Plantae Fungi Protoctista -- einzellige Eukaryote Monera -- Prokaryote Ursprung der eukaryotischen Zelle • woher kommen die Organellen? 2 Hypothesen • 1) “Endogenous origin hypothesis” - von innen der Einzelzelle • 2) “Serial Endosymbiont Hypothesis” - Theorie von der mehrfachen Symbiose – Lynn Margulis -- 1960’s • Phylogenie der rRNA-Gene (ribosomale RNA) Theorie von PLANTAE der mehrfachen Symbiose ANIMALIA FUNGI Hinweis von DNA der Organelle • Mitochondrion -- mtDNA – Pflanzen -- 300 - 1,200 kb – Pilze -- 26 - 115 kb – Tiere -- 16 - 18 kb PROTOCTISTA • Chloroplast -- cpDNA – Pflanzen -- 150-160 kb MONERA • ringförmige Genome • Gene für – rRNA – tRNA – wenig Proteine 8 rRNA Vergleiche: Vorhersage der Hypothese 1 • wenn endogener Ursprung der Organellen, rRNA Vergleiche: Vorhersage der Hypothese 2 • wenn endosymbiotischer Ursprung der Organellen, am ähnlichsten Bakterium Kuh N m Kuh N Mais N N m am ähnlichsten Bakterium am ähnlichsten Mais N N m c m rRNA Vergleiche: Daten COGs - Cluster der orthologischen Gruppen - Clusters of Orthologous Groups Archaea mt chl Eukarya c Blaugrüne Alge am ähnlichsten Blaugrüne Alge Bacteria • rRNA unterstützt die mehrfache Symbiose sehr stark • aber erzählen die Proteine dieselbe Geschichte? • Ziel: Identifizierung der Gruppen der Ur-Proteine, wovon stammen die derzeitigen Proteine ab • Vorteil der Kenntnis der ganzen Genome: keine Daten fehlen • nur wenn ganzes Genom bekannt ist, kann man bestimmt sagen, dass der Species X das Protein Y fehlt! • Anfang 1997 mit 7 Genomen Definition des COGs • 17,967 Proteine, 7 komplette Genome – 5 Bact, 1 Arch, 1 Eukar (Hefe) • Alle möglichen paarweisen Vergleiche der Proteinsequenzen bei BLAST • wählen 1 Protein aus 1 Genom – finden “best hit (BeT)”: das ähnlichste Protein in jedem anderen der 6 Genome – verbinden mit gestrichelte Linie Definition des COGs • durchgehende Linie -- reziproker “best Hit” – KatG is the BeT of YKR066c and – YKR066c is the BeT of KatG KatG E. coli YKR066c Yeast KatG E. coli YKR066c Hefe 9 Definition des COGs COG mit 2 Paraloge in Hefe • Dreieck aus durchgehender Linie: kleinstmögliche COG • verbinden aller Dreiecke mit gemeinsamer Linie -> neue COG Ile-tRNA synthetase Hefe cyto Hefe mito Hefe Proteine: mitochondrialer Typ ähnlicher als bakterieller Typ σ- (sigma) factors--RNA pol. initiation E. coli Abschätzung der Funktionen der COGs • Die meisten COG haben mindestens ein Protein, von dem die Funktion auf Grund experimenteller Forschung bekannt ist • Man nimmt an, das alle anderen Proteine in COG die selbe Funktion haben Synechocystis (Blaugrüne Alga) Synochocystis Paraloge sind neuer, haben besondere Funktionen funktionale Einordnung (1) funktionale Einordnung (2) 10 http://www.ncbi.nlm.nih.gov/COG/ Liste aller COGs AE phylogenetische Verteilung (2001) • in 2001 -- 2791 COGs aus 30 kompletten Genome • 45,350 Proteine in COGs (60% der Total ) • Verteilung in Archaea, Bacteria, Eukarya – – – – – – – B wenn neue Genome sequenziert werden, werden immer noch neue COGs gefunden Anzahl der COGs AEB - 606 AB - 829 AE - 98 EB - 200 A- 197 B- 955 E0 (in 2001, nur Hefe als Eukaryote in COG database) Clusteranalyse der hauptsächlichen Abstammungen mit COGs Zeigen alle Proteine ein ähnliches evolutionelles Muster? • Parallelentwicklung, Paralleldivergenz A B C D E Spezies Protein 1 all COGs translation transcription replication Protein 2 metabolism • diskordante Divergenz – Hinweis für horizontaler Gentransfer A B C D E Spezies Protein 1 Protein 2 verscheidene Funktionen haben verscheidene Beziehungen 11 Hinweis für früheren horizontalen Gentransfer • • • • Aquifex aeolicus (Genomesequenz 1998) thermophil, aber als Bakterium klassifiziert aber 15% der Gene sind ähnlicher zu Archaea diese Gene treten zusammen auf in A ae Genome “Bacterial” “Archaeal” 2 verschiedene Muster in Prokaryoten Hinweis für 2 Hauptklassen von Genen • “informationale” Gene – Translation, Transkription, Replikation – GTPases, vacuolar ATPases, tRNA synthetases. • “operative” Gene – Biosynthese der Aminosäure, Cofaktoren, Fettsäure, Phospholipide, Nucleotide, usw. – Zellmembran, Energiestoffwechsel, regulatorische Funktionen Eukaryote mögen “Chimäre” sein B B B B E A • informationale Gene aus Archaea • operationale Gene aus Bakteria B A A • zusätzlicher, späterer horizontaler Gentransfer der operationalen Gene Archaea <-->Bacteria Zusammenfassung ENDE • das Studium ganzer Genome sagt aus: • bezüglich drei Hauptgruppen – ein Lebensbaum wäre zu einfach – horizontaler Gentransfer ist sehr früh in der Evolution passiert 12