4/20/11 Vorlesung 3: Evolution des eukaryotischen Genoms Intronen und Exonen Struktur des eukaryotischen Gens Struktur des eukaryotischen Gens Intronen und Exonen Genduplikation--Familien des Gens Eiweißdomänen (Protein domains) Domänen und Exonen: sind sie verwandt? genomische DNA Intron im Zellkern ds DNA Struktur & Evolution des eukaryotische Genoms doppelsträngig Exon Saccharomyces cerevisae -- Caenorhabditis elegans -Drosophila melanogaster Transkription, Spleißen, Reifung Messenger-RNA AAAAAAAA im Cytoplasma ss mRNA einzelsträngig Translation Protein Jump to first page einzelsträngig pre-mRNA Exon Exon Arten der Intronen intron Exon Exon Group I Group II Spliceosomal selbstspleißend selbstspleißend Spliceosome gefordet RNA electronenmikroskopische Abbildung Exon Exon einzelsträngig mRNA Jump to first page Spliceosome Spliceosome Spliceosome Jump to first page Jump to first page Struktur des snRNP U1 > 50 Proteine 5 kleine Kern-RNAs U1, U2, U4/U6, U5 snRNAs Proteine + RNAs = RNPs (Ribonucleoproteikomplexen) RNPs binden nacheinanderfolgende premRNA katalysieren das Ausschneiden des Introns Jump to first page Jump to first page 1 4/20/11 Intronen-- nicht nur unnütze DNA! Intronen-- nicht nur unnütze DNA! Ein Intron kann ein anderes Gen enthalten. Drosophila ADH region os p! Ad h! osp (outspread wings) aberrations mapped to both sides of Adh!. Intronen können Verstärker (Enhancer) oder andere regulatorische Elemente enthalten. zB: Das Gen lozenge bei Drosophila lozenge Protein ist ein Transkriptionsfaktor (DNA-bindendes Protein), das ein anderes Gen steuert ausgeprägte in verschiedenem Gewebe Augen Antennen Blutzellen Genes within genes: Adh, Adhr, 2 others within introns of osp Jump to first page Jump to first page erwachsenes Auge von Drosophila melanogaster Intron 2 unbeschädigt augenspezifische Enhancer vorhanden alternatives Spleißen Intron 2 teilweise gelöscht augenspezifische Enhancer fehlen vielfältige Transkripte und Proteine aus einem einzigen Gen 12 48 2 verscheidene Signale für das Wachstum der Axone Drosophila Dscam Down syndrome cell adhesion molecule 38,016 Kombinationen! Jump to first page Jump to first page Homologes Gen Duplikation der Gene 33 anzestrale Spezies α Quelle der Verschiedenheit in Struktur und Wirkung der Gene Artbildung α abstammende Spezies 1 Jump to first page α abstammende Spezies 2 homologe Gene -Kopien desselben anzestralen Gens Jump to first page 2 4/20/11 Unterarten der homologen Gene Genduplikation durch ungleichen Überkreuzungsaustausch bei Meiosis Paralogen -- durch Genduplikation hergestellt Orthologen -- durch Artbildung hergestellt Jump to first page Genduplikation durch Retrotransposition Chromosom Jump to first page Familien des Gens ds DNA Transkription, Spleißen, Reifung AAAAAAAA ss mRNA Umkehrtranskription AAAAAAAAAAA TTTTTTTTTTTTT wiederholte Duplikation bringt viele Kopie eines Gens hervor diese Kopien weichen schrittweise durch Anhäufung von Mutationen ab Neue Gene übernehmen neue Funktionen ds DNA Einbau ins Genom Chromosom AAAAAAAAAAA TTTTTTTTTTTTT ds DNA Retrokopie -- gereiftes Pseudogen “processed pseudogene” Jump to first page Jump to first page 1E9X Beispiel Cytochrome p450 Proteine mit prosthetischer Gruppe: Heme Heme-gruppe bindet Eisen katalysierte Reaktion: Oxidation Jump to first page Jump to first page 3 4/20/11 1E9X 1E9X Jump to first page 1E9X Jump to first page 1E9X Jump to first page 1E9X Jump to first page 1E9X Jump to first page Jump to first page 4 4/20/11 Anzahl der Cytochromen p450 0 or 1 -- die meisten Bakterien 3 -- Hefe 41 -- Schleimpilze 88 -- Drosophila 256 -- Arabidopsis Jump to first page Jump to first page Drosophila p450 chromosomale Stellen (88) vielfältige Reaktionen Jump to first page Arabidopsis p450 chromosomale Stellen (256) Jump to first page Domänen des Proteins Jump to first page Einheit der Struktur und Funktion Manche Proteine enthalten viele Domänen Jump to first page 5 4/20/11 Cadherine Protein steckt aus der Zellmembranen heraus Länge hängt von Anzahl der “cad” Domäne ab Jump to first page verschiedene Kombinationen von Domänen bei Proteinen, die in Apoptose (programmierte Zelltod) funktionieren Domänen und Exonen: Go plot (für Pferde-Hemoglobin) sind sie verwandt? “Die Exontheorie der Gene” anzestrale Gene/Proteine waren sehr klein moderne Gene sind Kombinationen von anzestralen Genen Intronen trennen ehemalige einzelne Gene voneinander ab daher haben sich Intronen früh in Evolution entwickelt Held der “Früh-Intronen-Theorie” -- Walter Gilbert, Harvard Univ. Alternativtheorie “Spät-Introns”, Intronen in Genen haben später in Evolution eingesetzt Jump to first page Punkte: Aminosäure mit α-C Atomen in < 28-A Abstand Abschnitte liegen innerhalb 28-A Modulen Grenzregionen: vorhergesagte Lage der Intronen “Introns-Early” vs “Introns-Late” Jump to first page Keine Intronen bei UrEukaryoten Zu viele Intronen? je mehr verschiende Spezies Informationen abgeben, desto mehr verschiedene Intronenstellen sind bekannt TPI: triose phosphate isomerase gene Jump to first page Jump to first page 1.0 Intronen pro kb kodierte Sequenz Jump to first page 6 4/20/11 Struktur & Evolution des eukaryotischem Genoms Intronen: Früh oder Spät? Obwohl früher akzeptierte Theorie, scheint heute “Introns-Early” immer weniger plausibel aber schwierig auszuschließen mehr eukaryotische Gensequenzen erforderlich! Saccharomyces cerevisiae Caenorhabditis elegans Drosophila melanogaster Jump to first page Jump to first page Vergleich von allen Proteinen: Hefe & Fadenwurm Hefe: 13 Mb, 6217 Proteine Caenorhabditis elegans (Nematoda, Fadenwurm) : 97 Mb, 19,099 Proteine viele Kernfunktionen -- ~ 3,000 Proteine nur “vorhergesagte” Proteine zentrale Lebensprozesse -gleichartige Anzahl der Proteine bei Hefe und Wurm. Alle möglichen paarweise Vergleiche. Jump to first page orthologische Proteine-Paare für Kernfunktionen Wurm Hefe . Jump to first page einige Kernfunktionen haben mehr paralogische Gene beim Wurm . Wurm Hefe Wurm Hefe Jump to first page Jump to first page 7 4/20/11 nicht-gemeinsame Domäne andere Proteine Y W Vergleich is kompliziert vielfältige Domänen pro Protein vielfältige Kombinationen von Domänen deswegen nur Domänen vergleichen. Jump to first page gemeinsame Domäne nur bei Wurm nur bei Hefe Jump to first page gemeinsame Domäne einige sind etwas weniger zahlreich beim Wurm. Wurm = Hefe Y W adj. for R = W genome Y size R viele sind 3-10x mehr zahlreich beim Wurm R = W Y adj. for genome size Wurm Hefe Jump to first page verschiedene Strategien, verschiedene Gene gemeinsame Domäne Jump to first page einige sind wesentlich zahlreicher beim Wurm. einzellige Hefe Y W R R = W Y adj. for genome size vielzelliger Wurm -- vielfältige Zelltypen Jump to first page adaptiert sich dynamisch an Umwelt in dem sie verschiedene Genbatterien nutzt Nährstoffsituation, Sauerstoffpartialdruck, Kreuzungstyppheromone kompliziertes Entwicklungsprogramm, Zellendifferenzierung spezifische Strukturen der Genexpression Kontrolle durch Proteinen mit Regulationsdomäne, Signaldomäne Genduplikation & Domänenkopplung ermöglicht Jump to first page die Entwicklung der Vielzelligkeit! 8 4/20/11 Drosophila melanogaster Drosophila melanogaster 140 Mb International collaboration finished 10% Venter’s company Celera Genomics Celera = fast genomic sequencing 10-fold (average) coverage now Many gaps will remain What does the sequence mean??. 13,600 genes Shotgun “Sequence annotation” Description of biological significance of nucleotide sequences. Jump to first page Sequence annotation-- Strategies Celera Annotation--Drosophila Gene detection Base frequencies e. g. Mammalian genes are GC-rich Jump to first page Protein coding genes “GeneFinder” programs Start & stop; intron/exon boundaries Organism-specific! Genscan, Genie predictions EST data Protein databases, other organisms “expert judgement”--some mistakes apparent now Only 13,601 protein-coding genes Promoter regions Discovery by homology Similarity “Annotation Jamboree” 40 Drosophila experts, 2 weeks C. elegans has 19,000 Arabidopsis has ~ 26,000 to known sequences. Jump to first page Adh Chromosomenbereich, D. melanogaster 69 Polytänbanden, Chromosome 2L =2.9 Mb DNA-Sequenz aus P1 clones (80 kb inserts) und BAC clones (110 kb inserts) Jump to first page verher bekannt von dem ADHChromosomenbereich: intensivste genetische Analyse aller Tiere 73 Gene mit genetischen Beweisen 65 49 mit mutierten Allelen mit lethalen Mutanten viele chromosomale Umordnungen 86 inversions, 109 translocations, 317 deletions, 40 duplications ingesamt 658 Bruchpunkte kartiert. Jump to first page Jump to first page 9 4/20/11 Legende ADH-Bereich: Überblick mapped gene . transposable element . copia P < 10-51 BLAST P < 10-8 325 kb 2900 kb. cDNA, EST mRNA predicted Jump to first page . . . P-element insertion Jump to first page . geringe Anzahl von Genen. os p! Ad h! osp (outspread wings) aberrations mapped to both sides of Adh!. Jump to first Genes within genes: Adh, Adhr, 2 others within introns ofpage osp . Jump to first page Ergebnisse--ADH Bereich . 218 proteinkodierte Gene 23% vorher bekannt (49) korrespondiert mit ESTs 66% sind ähnlich zu anderen Organismen (BLAST). 37% haben Beweis über Funktion --BLAST Hohe Genintensität, Kluster. 44% 11 tRNAs 17 transponible Elemente (ein neues). 5 Jump to first page vorher bekannt Jump to first page 10 4/20/11 Verhältnis zu bereits analysierten Genen 73 Gene vorher bekannt ENDE 218 vorhergesagte proteinkodierte Gene mit klassichen Methoden wahrscheinlich alle möglichen Gene identifiziert 49 haben eine bekannte DNA-Sequenz 24 haben noch eine unbekannte Sequenz Evolution des eukaryotischen Genoms ~ 145 (= 218 - 73) davon haben keinen sichtbaren mutierten Phenotyp Gene mit sichtbaren Phenotyp wahrscheinlich mehr bewahrt in der Evolution (mehrere BLAST-Treffer) mehr ausgeprägt im Gewebe (mehr EST-Treffer). Jump to first page Jump to first page 11