Arten der Intronen Spliceosome Spliceosome

Werbung
4/20/11
Vorlesung 3: Evolution des
eukaryotischen Genoms
 
Intronen und Exonen
Struktur des eukaryotischen Gens
 
 
 
 
 
Struktur des eukaryotischen Gens
Intronen und Exonen
Genduplikation--Familien des Gens
Eiweißdomänen (Protein domains)
Domänen und Exonen: sind sie verwandt?
genomische DNA
Intron
im Zellkern
ds DNA
Struktur & Evolution des eukaryotische Genoms
 
doppelsträngig
Exon
Saccharomyces cerevisae -- Caenorhabditis elegans -Drosophila melanogaster
Transkription, Spleißen, Reifung
Messenger-RNA
AAAAAAAA
im Cytoplasma
ss mRNA
einzelsträngig
Translation
Protein
Jump to first page
einzelsträngig pre-mRNA
Exon
Exon
Arten der Intronen
 
 
intron
 
Exon
Exon
Group I
Group II
Spliceosomal
selbstspleißend
selbstspleißend
Spliceosome gefordet
RNA
electronenmikroskopische
Abbildung
Exon
Exon
einzelsträngig mRNA
Jump to first page
 
 
 
 
 
Spliceosome
Spliceosome
Spliceosome
 
Jump to first page
Jump to first page
Struktur des
snRNP U1
> 50 Proteine
5 kleine Kern-RNAs
U1, U2, U4/U6, U5 snRNAs
Proteine + RNAs = RNPs
(Ribonucleoproteikomplexen)
RNPs binden nacheinanderfolgende premRNA
katalysieren das Ausschneiden des Introns
Jump to first page
Jump to first page
1
4/20/11
Intronen-- nicht nur unnütze DNA!
 
Intronen-- nicht nur unnütze DNA!
Ein Intron kann ein anderes Gen enthalten.
 
Drosophila ADH region
os
p!
Ad
h!
osp (outspread wings)
aberrations mapped to
both sides of Adh!.
 
 
 
Intronen können Verstärker (Enhancer) oder
andere regulatorische Elemente enthalten.
zB: Das Gen lozenge bei Drosophila
lozenge Protein ist ein Transkriptionsfaktor
(DNA-bindendes Protein), das ein anderes
Gen steuert
ausgeprägte in verschiedenem Gewebe
  Augen
  Antennen
  Blutzellen
Genes within genes: Adh, Adhr, 2 others within introns
of osp
Jump to first page
Jump to first page
erwachsenes Auge von Drosophila melanogaster
Intron 2
unbeschädigt
augenspezifische
Enhancer
vorhanden
alternatives Spleißen
Intron 2
teilweise
gelöscht
augenspezifische
Enhancer
fehlen
 
vielfältige Transkripte und Proteine aus einem
einzigen Gen
12
48
2
verscheidene
Signale für
das Wachstum
der Axone
Drosophila
Dscam Down
syndrome cell
adhesion
molecule
38,016
Kombinationen!
Jump to first page
Jump to first page
Homologes Gen
Duplikation der Gene
 
33
anzestrale Spezies
α
Quelle der Verschiedenheit in Struktur und
Wirkung der Gene
Artbildung
α
abstammende
Spezies 1
Jump to first page
α
abstammende
Spezies 2
homologe Gene -Kopien desselben
anzestralen Gens
Jump to first page
2
4/20/11
Unterarten der homologen Gene
Genduplikation durch ungleichen
Überkreuzungsaustausch bei
Meiosis
Paralogen -- durch
Genduplikation
hergestellt
Orthologen -- durch
Artbildung
hergestellt
Jump to first page
Genduplikation durch
Retrotransposition
Chromosom
Jump to first page
Familien des Gens
ds DNA
 
Transkription, Spleißen, Reifung
AAAAAAAA
ss mRNA
 
Umkehrtranskription
 
AAAAAAAAAAA
TTTTTTTTTTTTT
wiederholte Duplikation bringt viele Kopie eines
Gens hervor
diese Kopien weichen schrittweise durch
Anhäufung von Mutationen ab
Neue Gene übernehmen neue Funktionen
ds DNA
Einbau ins Genom
Chromosom
AAAAAAAAAAA
TTTTTTTTTTTTT
ds DNA
Retrokopie -- gereiftes Pseudogen “processed pseudogene”
Jump to first page
Jump to first page
1E9X
Beispiel
Cytochrome p450
 
 
 
Proteine mit prosthetischer Gruppe: Heme
Heme-gruppe bindet Eisen
katalysierte Reaktion: Oxidation
Jump to first page
Jump to first page
3
4/20/11
1E9X
1E9X
Jump to first page
1E9X
Jump to first page
1E9X
Jump to first page
1E9X
Jump to first page
1E9X
Jump to first page
Jump to first page
4
4/20/11
Anzahl der Cytochromen
p450
 
 
 
 
 
0 or 1 -- die meisten Bakterien
3
-- Hefe
41 -- Schleimpilze
88 -- Drosophila
256 -- Arabidopsis
Jump to first page
Jump to first page
Drosophila p450 chromosomale Stellen (88)
vielfältige Reaktionen
Jump to first page
Arabidopsis p450 chromosomale Stellen (256)
Jump to first page
Domänen des Proteins
 
 
Jump to first page
Einheit der Struktur und Funktion
Manche Proteine enthalten viele Domänen
Jump to first page
5
4/20/11
Cadherine
 
 
Protein steckt aus der Zellmembranen heraus
Länge hängt von Anzahl der “cad” Domäne ab
Jump to first page
verschiedene
Kombinationen von
Domänen bei
Proteinen, die in
Apoptose
(programmierte
Zelltod) funktionieren
Domänen und Exonen:
 
 
 
 
 
 
 
Go plot (für Pferde-Hemoglobin)
sind sie verwandt?
“Die Exontheorie der Gene”
 
anzestrale Gene/Proteine waren sehr klein
moderne Gene sind Kombinationen von anzestralen Genen
Intronen trennen ehemalige einzelne Gene voneinander ab
daher haben sich Intronen früh in Evolution entwickelt
Held der “Früh-Intronen-Theorie” -- Walter Gilbert, Harvard
Univ.
Alternativtheorie “Spät-Introns”, Intronen in Genen haben
später in Evolution eingesetzt
Jump to first page
 
Punkte:
Aminosäure
mit α-C
Atomen in
< 28-A
Abstand
Abschnitte liegen
innerhalb 28-A
Modulen
Grenzregionen:
vorhergesagte
Lage der
Intronen
“Introns-Early” vs “Introns-Late”
Jump to first page
Keine Intronen bei UrEukaryoten
Zu viele Intronen?
 
je mehr verschiende Spezies Informationen
abgeben, desto mehr verschiedene
Intronenstellen sind bekannt
TPI: triose phosphate isomerase gene
Jump to first page
Jump to first page
1.0 Intronen pro
kb kodierte
Sequenz
Jump to first page
6
4/20/11
Struktur & Evolution des
eukaryotischem Genoms
Intronen: Früh oder Spät?
 
 
 
Obwohl früher akzeptierte Theorie,
scheint heute “Introns-Early” immer
weniger plausibel
aber schwierig auszuschließen
mehr eukaryotische
Gensequenzen erforderlich!
 
 
 
Saccharomyces cerevisiae
Caenorhabditis elegans
Drosophila melanogaster
Jump to first page
Jump to first page
Vergleich von allen Proteinen:
Hefe & Fadenwurm
 
 
Hefe: 13 Mb, 6217 Proteine
Caenorhabditis elegans (Nematoda,
Fadenwurm) : 97 Mb, 19,099 Proteine
  viele
 
Kernfunktionen -- ~ 3,000
Proteine
 
nur “vorhergesagte” Proteine
zentrale
Lebensprozesse -gleichartige Anzahl
der Proteine bei Hefe
und Wurm.
Alle möglichen paarweise Vergleiche.
Jump to first page
orthologische Proteine-Paare
für Kernfunktionen
 
Wurm
Hefe
.
Jump to first page
einige Kernfunktionen haben
mehr paralogische Gene beim
Wurm
.
 
Wurm
Hefe
Wurm
Hefe
Jump to first page
Jump to first page
7
4/20/11
nicht-gemeinsame Domäne
andere Proteine
 
 
 
 
Y W
Vergleich is kompliziert
vielfältige Domänen pro Protein
vielfältige Kombinationen von Domänen
deswegen nur Domänen vergleichen.
 
 
Jump to first page
gemeinsame Domäne
 
nur bei
Wurm
nur bei
Hefe
Jump to first page
gemeinsame Domäne
einige sind etwas weniger zahlreich beim Wurm.
Wurm
=
Hefe
Y
W
 
adj. for
R = W
genome
Y
size
R
viele sind
3-10x
mehr
zahlreich
beim Wurm
R = W
Y
adj. for
genome
size
Wurm
Hefe
Jump to first page
verschiedene Strategien,
verschiedene Gene
gemeinsame Domäne
 
Jump to first page
einige sind wesentlich zahlreicher beim Wurm.
 
einzellige Hefe
 
Y
W
R
R = W
Y
adj. for
genome
size
 
 
vielzelliger Wurm -- vielfältige Zelltypen
 
 
 
Jump to first page
adaptiert sich dynamisch an Umwelt in dem sie
verschiedene Genbatterien nutzt
Nährstoffsituation, Sauerstoffpartialdruck,
Kreuzungstyppheromone
kompliziertes Entwicklungsprogramm,
Zellendifferenzierung
spezifische Strukturen der Genexpression
Kontrolle durch Proteinen mit Regulationsdomäne,
Signaldomäne
Genduplikation & Domänenkopplung ermöglicht
Jump to first page
die Entwicklung der Vielzelligkeit!
8
4/20/11
Drosophila melanogaster
Drosophila melanogaster
 
 
140 Mb
International collaboration finished 10%
Venter’s company Celera Genomics
  Celera
= fast
genomic sequencing
  10-fold (average) coverage now
  Many gaps will remain
  What does the sequence mean??.
13,600 genes
  Shotgun
“Sequence annotation”
Description of biological significance of nucleotide sequences.
Jump to first page
Sequence annotation-- Strategies
 
Celera Annotation--Drosophila
Gene detection
 
  Base
frequencies
  e. g. Mammalian genes are GC-rich
 
Jump to first page
 
 
Protein coding genes
 
 
  “GeneFinder”
programs
  Start & stop; intron/exon boundaries
  Organism-specific!
 
 
 
 
Genscan, Genie predictions
EST data
Protein databases, other organisms
“expert judgement”--some mistakes apparent now
Only 13,601 protein-coding genes
 
 
Promoter regions
Discovery by homology
  Similarity
“Annotation Jamboree”
40 Drosophila experts, 2 weeks
C. elegans has 19,000
Arabidopsis has ~ 26,000
to known sequences.
Jump to first page
Adh Chromosomenbereich, D.
melanogaster
 
 
69 Polytänbanden, Chromosome 2L =2.9 Mb
DNA-Sequenz aus P1 clones (80 kb inserts)
und BAC clones (110 kb inserts)
Jump to first page
verher bekannt von dem ADHChromosomenbereich:
 
 
intensivste genetische Analyse aller Tiere
73 Gene mit genetischen Beweisen
  65
  49
 
mit mutierten Allelen
mit lethalen Mutanten
viele chromosomale Umordnungen
  86
inversions, 109 translocations, 317 deletions,
40 duplications
  ingesamt 658 Bruchpunkte kartiert.
Jump to first page
Jump to first page
9
4/20/11
Legende
ADH-Bereich: Überblick
 
mapped
gene
.
 
transposable
element
.
copia
P < 10-51
BLAST
P < 10-8
325 kb
2900 kb.
cDNA, EST
mRNA
predicted
Jump to first page
.
 
.
.
 
P-element
insertion
Jump to first page
.
geringe Anzahl von Genen.
os
p!
Ad
h!
osp (outspread wings)
aberrations mapped to
both sides of Adh!.
Jump to first
Genes within genes: Adh, Adhr, 2 others within introns
ofpage
osp
.
 
Jump to first page
Ergebnisse--ADH Bereich
.
 
218 proteinkodierte Gene
  23%
vorher bekannt (49)
korrespondiert mit ESTs
  66% sind ähnlich zu anderen Organismen
(BLAST).
  37% haben Beweis über Funktion --BLAST
Hohe Genintensität, Kluster.
  44%
 
11 tRNAs
 
17 transponible Elemente (ein neues).
  5
Jump to first page
vorher bekannt
Jump to first page
10
4/20/11
Verhältnis zu bereits analysierten
Genen
 
73 Gene vorher bekannt
 
 
 
 
ENDE
218 vorhergesagte proteinkodierte Gene
 
 
mit klassichen Methoden wahrscheinlich alle möglichen Gene
identifiziert
49 haben eine bekannte DNA-Sequenz
24 haben noch eine unbekannte Sequenz
Evolution des eukaryotischen
Genoms
~ 145 (= 218 - 73) davon haben keinen sichtbaren mutierten
Phenotyp
Gene mit sichtbaren Phenotyp
 
 
wahrscheinlich mehr bewahrt in der Evolution (mehrere
BLAST-Treffer)
mehr ausgeprägt im Gewebe (mehr EST-Treffer).
Jump to first page
Jump to first page
11
Herunterladen