Kapitel II

Werbung
Vorlesung 1: Evolution des
prokaryontischen Genoms
• Fortsetzung
• Evolution der hauptsächlichen Abstammungen des
Lebens
– “Tree of Life”, Lebensbaum
– Theorie von der mehrfachen Symbiose
– Clusters of Orthologous Groups (Cluster der
orthologischen Gruppen)
– Lebensbaum, neue Sichtweise
Der Lebensbaum -- die
Stammesgeschichte alle Organismen
• Wie sind derzeitige Organismen miteinander
verwandt?
• Was ist der Ursprung der eukaryotischen Zelle?
Vorlesung 2: Evolution des eukaryotischen
Genoms
Die klasslichen fünf Reiche der
Organismen
Eukaryote vs Prokaryote
•
•
•
•
Zellkern
Organelle
Histone
DNA
+
+
+
lineare
ringförmige
molekulare Daten -- 3 Hauptgruppen
(nicht 5)
Bacteria
Archaea
Eukarya
•
•
•
•
•
Animalia
Plantae
Fungi
Protoctista -- einzellige Eukaryote
Monera -- Prokaryote
Ursprung der eukaryotischen Zelle
• woher kommen die Organellen? 2 Hypothesen
• 1) “Endogenous origin hypothesis” - von innen
der Einzelzelle
• 2) “Serial Endosymbiont Hypothesis” - Theorie
von der mehrfachen Symbiose
– Lynn Margulis -- 1960’s
• Phylogenie der rRNA-Gene
(ribosomale RNA)
1
Theorie von PLANTAE
der mehrfachen
Symbiose
ANIMALIA
FUNGI
Hinweis von DNA der Organelle
• Mitochondrion -- mtDNA
– Pflanzen -- 300 - 1,200 kb
– Pilze -- 26 - 115 kb
– Tiere -- 16 - 18 kb
PROTOCTISTA
• Chloroplast -- cpDNA
– Pflanzen -- 150-160 kb
– rRNA
– tRNA
– wenig Proteine
MONERA
rRNA Vergleiche: Vorhersage der
Hypothese 1
• wenn endogener Ursprung der Organellen,
rRNA Vergleiche: Vorhersage der
Hypothese 2
• wenn endosymbiotischer Ursprung der Organellen,
am ähnlichsten
Bakterium
Kuh
N
• ringförmige
Genome
• Gene für
m
Kuh
N
Mais
N
N
m
am
ähnlichsten
Bakterium
am ähnlichsten
Mais
N
N
m
c
Blaugrüne Alge
rRNA Vergleiche: Daten
c
Blaugrüne Alge
am ähnlichsten
COGs - Cluster der orthologischen
Gruppen - Clusters of Orthologous Groups
Archaea
mt
Eukarya
m
chl
Bacteria
• rRNA unterstützt die mehrfache Symbiose sehr stark
• aber erzählen die Proteine dieselbe Geschichte?
• Ziel: Identifizierung der Gruppen der Ur-Proteine,
wovon stammen die derzeitigen Proteine ab
• Vorteil der Kenntnis der ganzen Genome: keine
Daten fehlen
• nur wenn ganzes Genom bekannt ist, kann man
bestimmt sagen, dass der Species X das Protein Y
fehlt!
• Anfang 1997 mit 7 Genomen
2
Definition des COGs
Definition des COGs
• durchgehende Linie -- reziproker “best Hit”
• 17,967 Proteine, 7 komplette Genome
– 5 Bact, 1 Arch, 1 Eukar (Hefe)
• Alle möglichen paarweisen Vergleiche der
Proteinsequenzen bei BLAST
• wählen 1 Protein aus 1 Genom
– finden “best hit (BeT)”: das ähnlichste Protein in jedem
anderen der 6 Genome
– verbinden mit gestrichelte Linie
– KatG is the BeT of YKR066c and
– YKR066c is the BeT of KatG
KatG
E. coli
YKR066c
Yeast
KatG
E. coli
YKR066c
Hefe
Definition des COGs
COG mit 2 Paraloge in Hefe
• Dreieck aus durchgehender Linie: kleinstmögliche COG
• verbinden aller Dreiecke mit gemeinsamer Linie -> neue
COG
Ile-tRNA
synthetase
Hefe cyto
Hefe mito
Hefe Proteine: mitochondrialer Typ ähnlicher als bakterieller Typ
σ- (sigma) factors--RNA pol. initiation
E. coli
Abschätzung der Funktionen der COGs
• Die meisten COG haben mindestens ein
Protein, von dem die Funktion auf Grund
experimenteller Forschung bekannt ist
• Man nimmt an, das alle anderen Proteine in
COG die selbe Funktion haben
Synechocystis
(Blaugrüne
Alga)
Synochocystis Paraloge sind neuer, haben besondere Funktionen
3
funktionale Einordnung (1)
funktionale Einordnung (2)
E, E. coli;
H, H. influenzae;
G, M. genitalium;
P, M. pneumoniae;
C, Synechocystis sp.;
M, M. jannaschii;
Y, S. cerevisiae.
http://www.ncbi.nlm.nih.gov/COG/
Liste aller COGs
AE
phylogenetische Verteilung (2001)
• in 2001 -- 2791 COGs aus 30 kompletten Genome
• 45,350 Proteine in COGs (60% der Total )
• Verteilung in Archaea, Bacteria, Eukarya
–
–
–
–
–
–
–
B
wenn neue Genome sequenziert werden,
werden immer noch neue COGs gefunden
Anzahl
der COGs
AEB - 606
AB - 829
AE - 98
EB - 200
A- 197
B- 955
E0 (in 2001, nur Hefe als Eukaryote in COG database)
4
Clusteranalyse der hauptsächlichen
Abstammungen mit COGs
Zeigen alle Proteine ein ähnliches
evolutionelles Muster?
• Parallelentwicklung,
Paralleldivergenz
A B C D
E
Spezies
Protein 1
all COGs
translation
transcription
replication
Protein 2
metabolism
• diskordante Divergenz
– Hinweis für
horizontaler
Gentransfer
A B C D
E
Spezies
Protein 1
Protein 2
verscheidene Funktionen haben verscheidene Beziehungen
Hinweis für früheren horizontalen
Gentransfer
•
•
•
•
Aquifex aeolicus (Genomesequenz 1998)
thermophil, aber als Bakterium klassifiziert
aber 15% der Gene sind ähnlicher zu Archaea
diese Gene treten zusammen auf in A ae Genome
“Bacterial”
“Archaeal”
2 verschiedene Muster in Prokaryoten
Hinweis für 2 Hauptklassen von Genen
• “informationale” Gene
– Translation, Transkription, Replikation
– GTPases, vacuolar ATPases, tRNA synthetases.
• “operative” Gene
– Biosynthese der Aminosäure, Cofaktoren,
Fettsäure, Phospholipide, Nucleotide, usw.
– Zellmembran, Energiestoffwechsel,
regulatorische Funktionen
Eukaryote mögen “Chimäre” sein
B
B
B
B
E
A
• informationale Gene aus
Archaea
• operationale Gene aus
Bakteria
B
A
A
• zusätzlicher, späterer
horizontaler Gentransfer
der operationalen Gene
Archaea <-->Bacteria
5
Vorlesung 2: Evolution des eukaryotischen
Genoms
Zusammenfassung
• das Studium ganzer Genome sagt aus:
• bezüglich drei Hauptgruppen
– ein Lebensbaum wäre zu einfach
– horizontaler Gentransfer ist sehr früh in der
Evolution passiert
• Struktur des eukaryotischen Gens
–
–
–
–
Intronen und Exonen
Genduplikation--Familien des Gens
Eiweißdomänen (Protein domains)
Domänen und Exonen: sind sie verwandt?
• Struktur & Evolution des eukaryotische Genoms
– Saccharomyces cerevisae -- Caenorhabditis elegans -- Drosophila
melanogaster -- Arabidopsis thaliana -- Homo sapiens
• chromosomale Umordnungen bei Evolution
– Inversionen bei Fliegen -- Translokationen bei Säugetieren -chromosomale Ausweitung bei Gräsern
Struktur des eukaryotischen Gens
Intronen und Exonen
genomische DNA
einzelsträngig pre-mRNA
Exon
Exon
intron
Intron
im Zellkern
doppelsträngig
Exon
ds DNA
Exon
Exon
Transkription, Spleißen, Reifung
Messenger-RNA
AAAAAAAA
im Cytoplasma
ss mRNA
einzelsträngig
Exon Exon
Translation
Protein
einzelsträngig mRNA
Arten der Intronen
• Group I
• Group II
• Spliceosomal
Spliceosome
selbstspleißend
selbstspleißend
Spliceosome gefordet
RNA
electronenmikroskopische
Abbildung
• > 50 Proteine
• 5 kleine Kern-RNAs
•
U1, U2, U4/U6, U5 snRNAs
• Proteine + RNAs = RNPs
(Ribonucleoproteikomplexen)
• RNPs binden nacheinanderfolgende premRNA
• katalysieren das Ausschneiden des Introns
Spliceosome
6
Spliceosome
Intronen-- nicht nur unnütze DNA!
Struktur des
snRNP U1
• Ein Intron kann ein anderes Gen enthalten.
Drosophila ADH region
os
p
Ad
h
osp (outspread wings)
aberrations mapped to
both sides of Adh!.
Genes within genes: Adh, Adhr, 2 others within introns of osp
erwachsenes Auge von Drosophila melanogaster
Intronen-- nicht nur unnütze DNA!
• Intronen können Verstärker (Enhancer) oder
andere regulatorische Elemente enthalten.
• zB: Das Gen lozenge bei Drosophila
• lozenge Protein ist ein Transkriptionsfaktor
(DNA-bindendes Protein), das ein anderes
Gen steuert
• ausgeprägte in verschiedenem Gewebe
Intron 2
unbeschädigt
Intron 2
teilweise
gelöscht
augenspezifische
Enhancer
vorhanden
augenspezifische
Enhancer
fehlen
– Augen
– Antennen
– Blutzellen
alternatives Spleißen
• vielfältige Transkripte und Proteine aus
einem einzigen Gen
12
Drosophila
Dscam
Down
syndrome cell
adhesion
molecule
48
33
Duplikation der Gene
2
• Quelle der Verschiedenheit in Struktur und
Wirkung der Gene
verscheidene
Signale für
das
Wachstum der
Axone
38,016
Kombinationen!
7
Herunterladen