Vorlesung 1: Evolution des prokaryontischen Genoms

Werbung
Vorlesung 1: Evolution des
prokaryontischen Genoms
• mikrobielle Genome
Sequenzierung der mikrobiellen
Genome
• die erste in 1995--Haemophilus influenzae
• abgeschlossen
– Überblick, Webseiten
– Fallstudien
– ganzheitliche Genom-Muster
• Evolution der hauptsächlichen Abstammungen des
Lebens
– “Tree of Life”, Lebensbaum
– Theorie von der mehrfachen Symbiose
– Clusters of Orthologous Groups (Cluster der
orthologischen Gruppen)
– Lebensbaum, neue Sichtweise
cmr.jcvi.org
–
–
–
–
526 Bacteria
42 Archaea
3 Virus
Hefe (Saccharomyces, Eukaryot, 13 MB)
• 17 in Bearbeitung
Liste aller Genome
J. Craig Venter Institute
Haemophilus influenzae
• die meisten Bakterienstämme sind nichtpathogen
(zB: Rd-strain)
• 6 pathogene Bakterienstämme, Impstoff für nur
einen (b-strain)
• Infektionen der Ohren, Atemwege bei Kinder
• Meningitis (fatale Infektion der Hirnhaut)
Haemophilus influenzae
• 1.8 MB (Kosten: $0.48 / basepair)
• erste Genomesequenzierung mit “Shotguntechnik”
• “Lo and behold, the two ends joined. I was as
stunned as anyone.” -- Rob Fleischmann
• 1743 vorhergesagte Gene
– 1007 ähnlich zu bekannten Genen
– 736 (> 40%) ganz unbekannte Gene
1
Normalverfahren
H. influenzae ringförmiges Chromosom
• Sequenzierungsstrategie &
Zusammensetzung
• Erkennung der rRNAs, tRNAs
• Vorhersage der proteincodierenden Sequenz
• BLAST-Suche für bekannte Proteine
• Kategorisierung mit Bezug auf Funktion
– (unbekannte: “hypothetical protein”, “unknown
function”)
Nahaufnahme
Metabolismus
• Zuckertransport
– glucose, fructose, galactose, ribose, etc
• kompletter Glycolyseweg
• Citronensäurezyklus (TCA)--3 Enzyme
fehlen
– (Nährstoffbedarf für Glutamat!)
Pathogenese
• 8 Gene in fimbrialen Gencluster
• Fimbrien: fädige Anhangsgebilde
verschiedener Bakterien
• Haftvermögen der Bakterien zu Wirtszellen
• vorliegend in b strain, fehlend in Rd strain
Escherichia coli K-12
• 4.6 MB
• Projektdauer: 6 Jahre (nicht mit ShotgunTechnik)
• fundierte Kentnisse
– Genetik
– Biochemie
– Physiologie
2
coding seqs.
bidirectionale Replikation
• oriC (origin) - Ursprung der Replikation
- 245 bp
rRNA
– 3 x 13 bp repeat (DNA Abspulen)
– 4 x 9 bp repeat (DnaA Anbindung)
tRNA
sim.to
phage
proteins
• Terminierung
CAI
codon
adaptation
index
G-C Schrägung (skew) =
[G - C]/[G + C]
Gene in Operonen
Ori
term
1st
2nd
3rd
all
Intergenic
% Operone
# Gene
73%
1
17%
2
5%
3
6%
4 oder mehr
– milde Pneumonie
– Atherosclerosis (Infektion des Blutgefäßes)
1
20%
2
12%
3 oder mehr
Faden
Faden
Beule
– Trachoma-Blindheit (Asien & Afrika)
– Geschlechtskrankheit (USA)
• C. pneumoniae
# Promotoren
68%
Chlamydia
Chlamydia
• obligatorisch intrazellulärer Bewohner in
den eukaryotischen Zellen
• C. trachomatis
% Operone
(Rasterelektronenmikroskopie)
erweitern
durch
Vacuole
(Transmissionselektronenmikroskopie)
• leben in spezialisierten Vacuolen in “post-Golgi
exocytic vesicular compartment”
• weicht der Immunantwort des Wirtsorganismus aus
3
Chlamydia
Chlamydia
• Frage: Warum verhindert Penicillin die
Zellteilung? Peptidoglycan (Zielort des
Penicillins) wurde nicht gefunden.
• Antwort: Peptidoglycan muss vorhanden sein!
Gesamte Stoffwechselweg für Synthese,
Membranzusammensetzung, und Recycling ist
vorhanden!
• vorhanden
– Enzyme für DNA-Reparatur, DNA-Replikation,
Transkription, Translation.
– TCA (außer 3 Enzyme, Glutamat-Auxotroph)
• fehlend
– Enzyme für Biosynthese der Nucleotide
– Enzyme für Biosynthese der Aminoäure (außer
Tryptophan-operon)
• Frage: Produziert es eigenes ATP oder stielt es
sich von der Wirtszelle?
• Antwort: Beides!
– ATP/ADP Transportproteine
– Enzyme für ATP-Generation
Chlamydia
Vibrio cholerae -- Cholera
• Frage: Was sind die Fäden, die durch die Beulen
stechen?
– Hypothese: Nährstoffaufnahme
• Antwort: Proteine für komplettes “Type III
secretory system” gefunden.
– Sekretion der Proteine für Steuerung der Wirtszelle
Zwei
ringförmige
Chromosome
1.0
MB
•
•
•
•
•
epidemisch in S. Asien > 1,000 yr
7 globale Epidemien seit 1817
derzeitige Pandemie, beginnend 1991
verbreitet im Wasser, unreines Trinkwasser
lebt in Schleimhaut des Darms, stellt
Giftstoffe her: cholera toxin (CT)
• bewirkt Verlust von Wasser & Elektrolyten;
-- schneller, schlimmer Durchfal
Determinante der Pathogenität
2.9 MB
CT
4
Neisseria meningitidis (meningococcus)
Pathogenese durch Neisseria
• Meningitis (fatale Infektion der Hirnhaut)
• 5 Serotype
• Serotyp B -- Europa, N. Amerika. kein
Impstoff vorhanden
• Serotyp B -- Sequenzierung März 2000
Diagramm des Genoms der Neisseria
Inseln
des
horizonalen
Gentransfers
Suche nach Kandidaten für Impstoff
IHT:
USS: DNA
Aufnahme
Signalsequenzen
•
•
•
•
•
•
•
Virulence
genes
Base
composition
Borrelia burgdorferi & “Lyme disease”
• ~1975 Endeckung einer mysteriösen Krankheit,
gleichartig zu rheumaähnlicher Arthritis
• ~1982 verursachendes Mittel ist Spirochät, Borrelia
bergdorferi
– vorkommend bei wilden Säugetieren -- Hirsche,
Eichhörnchen
– Krankheitsüberträger durch Zecken
• 1997 Genomsequenzierung
– viele Plasmide: 12 Fadenmoleküle, 9 Ringmoleküle!
• Lipoproteine an der Zelloberfläche
– OspA, OspB “outer surface proteins”
• Impstoff, LYMErix, SmithKline Beecham
• Problem: Impstoff hat viele Nebenwirkungen!
•
2158 proteincodieriende Gene
570 Proteine, vorhergesagt an der Zelloberfläche
350 Proteine, Expression bei E coli
350 Proteine, in Mäusen eingespritzt, um Antikörper
zu bilden
Immunserum ausprobiert -- Anbindung oder Tötung
der Bakterien -- 85 positiv
Prüfung für Präsenz & Variabiliät
7 Proteine sind vorhanden und meistens die gleichen
in MenB Bakterienstämme
Gute Kandidaten für künftigen Imstoff gegen MenB
Deinococcus radiodurans
• Entdeckung 1956: Schadstoff in bestrahltem
Büchsenfleisch
• sehr widerstandsfähig gegen Mittel, die DNA
schadet
– ionisierende Strahlung
– UV-Strahlung
– Wasserstoffperoxid
• Kandidatorganismus für biologische Sanierung
der Bereiche, die mit radioaktiven Mitteln &
giftigen Verbindungen kontaminiert sind
5
Wie überlebt dieses Bakterium?
• entgiftet Sauerstoffradikale
– vielfältige Katalasen, Superoxiddismutasen
• schnelle & effiziente DNA-Reparatur
– vielfältige Kopien der meisten Reparatur-Enzyme
2 Chromosome
& 2 Plasmide
kürzliche Genduplikationen
• exportiert beschädigte Nukleotide
– verhindert die neue Inkorporation in DNA
• DNA-Reparatur durch homologe Rekombination
– jede Zelle ist polyploid; mit vielfältigen Kopien jedes
Chromosoms; unbeschädigte Kopie benutzt die
beschädigte Kopie zur Reparatur; repetitive DNA hilft
bei Chromosomenpaarung
Xylella fastidiosa
• 1987 CVC (citrus variegated chlorosis) - Erkrankung
bei Zitrusfrüchten - erstes Auftreten in Brasilien
• Bakterien verstopfen das Xylem (Wasserstraße in der
Pflanze)
Xylella fastidiosa
• brazilianisches Sequenzierung-Konsortium
• 30 kleine Laboratorien in Zusammenarbeit;
jedes erhält ein DNA-Sequenzierungsgerät
• wissenschaftliche Infrastruktur aufgebaut,
Kompetenz in Molekularbiologie verbessert
Insekt: “Glassy-winged sharpshooter”
Pierce’s Disease of grapevine
Nahrungsaufnahme durch
stechende
Mundwerkzeuge, die
Bakterien von Pflanze zu
Pflanze übertragen
Gefahr für Weinbau in Xylella
Kalifornien!
fastidiosa
6
Mechanismus der Pathogenie
• EPS :
extrazelluläres
Polysaccharid:
klebriger Gummi:
verklebt
Bakterien
miteinander und
mit der Zellwand
der Pflanze
Mechanismus der Pathogenie
• Fimbrien (wie bei
Haemophilus):
fädige
Anhangsgebilde,
Festhalten an
Xylem der
Pflanzen und der
stechenden
Mundwerkzeuge
des Insekts
Mechanismus der Pathogenie
• Protease &
Cellulase
zusammenbrechen
der Zellwand der
Pflanze
Mechanismus der Pathogenie
• Hemagglutanin Klebstoff für
Fimbrien : ähnlich
zu sezerniertes
Protein von
Neisseria
• Viele andere
Ähnlichkeiten mit
tierpathologischen
Bakterien
Der Lebensbaum -- die
Evolution der hauptsächlichen
Abstammungen des Lebens
– Lebensbaum (“Tree of Life”)
– Theorie von der mehrfachen Symbiose (Serial
Endosymbiont Theory)
– Cluster der orthologischen Gruppen (Clusters of
Orthologous Groups)
– Lebensbaum, neue Sichtweise
Stammesgeschichte alle Organismen
• Wie sind derzeitige Organismen miteinander
verwandt?
• Was ist der Ursprung der eukaryotischen Zelle?
7
Die klasslichen fünf Reiche der
Organismen
Eukaryote vs Prokaryote
•
•
•
•
Zellkern
Organelle
Histone
DNA
+
+
+
lineare
•
•
•
•
•
ringförmige
molekulare Daten -- 3 Hauptgruppen
(nicht 5)
Bacteria
Archaea
Eukarya
Animalia
Plantae
Fungi
Protoctista -- einzellige Eukaryote
Monera -- Prokaryote
Ursprung der eukaryotischen Zelle
• woher kommen die Organellen? 2 Hypothesen
• 1) “Endogenous origin hypothesis” - von innen
der Einzelzelle
• 2) “Serial Endosymbiont Hypothesis” - Theorie
von der mehrfachen Symbiose
– Lynn Margulis -- 1960’s
• Phylogenie der rRNA-Gene
(ribosomale RNA)
Theorie von PLANTAE
der mehrfachen
Symbiose
ANIMALIA
FUNGI
Hinweis von DNA der Organelle
• Mitochondrion -- mtDNA
– Pflanzen -- 300 - 1,200 kb
– Pilze -- 26 - 115 kb
– Tiere -- 16 - 18 kb
PROTOCTISTA
• Chloroplast -- cpDNA
– Pflanzen -- 150-160 kb
MONERA
• ringförmige
Genome
• Gene für
– rRNA
– tRNA
– wenig Proteine
8
rRNA Vergleiche: Vorhersage der
Hypothese 1
• wenn endogener Ursprung der Organellen,
rRNA Vergleiche: Vorhersage der
Hypothese 2
• wenn endosymbiotischer Ursprung der Organellen,
am ähnlichsten
Bakterium
Kuh
N
m
Kuh
N
Mais
N
N
m
am
ähnlichsten
Bakterium
am ähnlichsten
Mais
N
N
m
c
m
rRNA Vergleiche: Daten
COGs - Cluster der orthologischen
Gruppen - Clusters of Orthologous Groups
Archaea
mt
chl
Eukarya
c
Blaugrüne Alge
am ähnlichsten
Blaugrüne Alge
Bacteria
• rRNA unterstützt die mehrfache Symbiose sehr stark
• aber erzählen die Proteine dieselbe Geschichte?
• Ziel: Identifizierung der Gruppen der Ur-Proteine,
wovon stammen die derzeitigen Proteine ab
• Vorteil der Kenntnis der ganzen Genome: keine
Daten fehlen
• nur wenn ganzes Genom bekannt ist, kann man
bestimmt sagen, dass der Species X das Protein Y
fehlt!
• Anfang 1997 mit 7 Genomen
Definition des COGs
• 17,967 Proteine, 7 komplette Genome
– 5 Bact, 1 Arch, 1 Eukar (Hefe)
• Alle möglichen paarweisen Vergleiche der
Proteinsequenzen bei BLAST
• wählen 1 Protein aus 1 Genom
– finden “best hit (BeT)”: das ähnlichste Protein in jedem
anderen der 6 Genome
– verbinden mit gestrichelte Linie
Definition des COGs
• durchgehende Linie -- reziproker “best Hit”
– KatG is the BeT of YKR066c and
– YKR066c is the BeT of KatG
KatG
E. coli
YKR066c
Yeast
KatG
E. coli
YKR066c
Hefe
9
Definition des COGs
COG mit 2 Paraloge in Hefe
• Dreieck aus durchgehender Linie: kleinstmögliche COG
• verbinden aller Dreiecke mit gemeinsamer Linie -> neue
COG
Ile-tRNA
synthetase
Hefe cyto
Hefe mito
Hefe Proteine: mitochondrialer Typ ähnlicher als bakterieller Typ
σ- (sigma) factors--RNA pol. initiation
E. coli
Abschätzung der Funktionen der COGs
• Die meisten COG haben mindestens ein
Protein, von dem die Funktion auf Grund
experimenteller Forschung bekannt ist
• Man nimmt an, das alle anderen Proteine in
COG die selbe Funktion haben
Synechocystis
(Blaugrüne
Alga)
Synochocystis Paraloge sind neuer, haben besondere Funktionen
funktionale Einordnung (1)
funktionale Einordnung (2)
10
http://www.ncbi.nlm.nih.gov/COG/
Liste aller COGs
AE
phylogenetische Verteilung (2001)
• in 2001 -- 2791 COGs aus 30 kompletten Genome
• 45,350 Proteine in COGs (60% der Total )
• Verteilung in Archaea, Bacteria, Eukarya
–
–
–
–
–
–
–
B
wenn neue Genome sequenziert werden,
werden immer noch neue COGs gefunden
Anzahl
der COGs
AEB - 606
AB - 829
AE - 98
EB - 200
A- 197
B- 955
E0 (in 2001, nur Hefe als Eukaryote in COG database)
Clusteranalyse der hauptsächlichen
Abstammungen mit COGs
Zeigen alle Proteine ein ähnliches
evolutionelles Muster?
• Parallelentwicklung,
Paralleldivergenz
A B C D
E
Spezies
Protein 1
all COGs
translation
transcription
replication
Protein 2
metabolism
• diskordante Divergenz
– Hinweis für
horizontaler
Gentransfer
A B C D
E
Spezies
Protein 1
Protein 2
verscheidene Funktionen haben verscheidene Beziehungen
11
Hinweis für früheren horizontalen
Gentransfer
•
•
•
•
Aquifex aeolicus (Genomesequenz 1998)
thermophil, aber als Bakterium klassifiziert
aber 15% der Gene sind ähnlicher zu Archaea
diese Gene treten zusammen auf in A ae Genome
“Bacterial”
“Archaeal”
2 verschiedene Muster in Prokaryoten
Hinweis für 2 Hauptklassen von Genen
• “informationale” Gene
– Translation, Transkription, Replikation
– GTPases, vacuolar ATPases, tRNA synthetases.
• “operative” Gene
– Biosynthese der Aminosäure, Cofaktoren,
Fettsäure, Phospholipide, Nucleotide, usw.
– Zellmembran, Energiestoffwechsel,
regulatorische Funktionen
Eukaryote mögen “Chimäre” sein
B
B
B
B
E
A
• informationale Gene aus
Archaea
• operationale Gene aus
Bakteria
B
A
A
• zusätzlicher, späterer
horizontaler Gentransfer
der operationalen Gene
Archaea <-->Bacteria
Zusammenfassung
ENDE
• das Studium ganzer Genome sagt aus:
• bezüglich drei Hauptgruppen
– ein Lebensbaum wäre zu einfach
– horizontaler Gentransfer ist sehr früh in der
Evolution passiert
12
Herunterladen