3. Genomik

Werbung
Zwei Genome in einer
Zelle
10a.
Genom des Zellkerns Genom des Mitochondriums
Chloroplastgenom bei Pflanzen!
10b.
das mitochondriale Genom
16,569 Nukleotiden
10c.
Das mitochondriale Genom
Lynn Margulis
 Mitochondrion: ging hervor vor 1.5x109 Jahren aus einem lila Bacterium
sp.: Endosymbiosis
Säuger Mitochondrion:
- Die meisten Gene gingen verloren oder befinden sich jetzt im Genom.
Was über blieb:
- 13 Polypeptide (Alles Enzyme zur oxydativen Phosphorylisation) Gene
- 12S and 16S rRNA Gene, 22 tRNA Gene :
- Ringförmig
 Mitochondriale DNA: mehrere tausend Kopien/Zelle
• Abweichungen vom Universal Code:
Codon
Aminosäure regulär
- Ohne Introne
- bakterielloid Ribosom
- eigene tRNAs
- binarische Teilung
Aminosäure in Mitochondrion
UGA
Stop
Trp (Säuger, Insekten, Hefe, Pilze)
AGA
Arg
Stop (Säuger, Insekten)
ACG
Arg
stop (Säuger)
AUA
Ile
Met (Säuger, Insekten, Hefe, )
CUN
Leu
Thr (Hefe,)
CGG
Arg
Trp (Mäuse)
Anmerkung: Es gibt ebenfalls Alterationen in den genom DNAs einiger Species (Prokaryoten und
Eukaryoten)
Chromatin
Genom Programme
11.
Automatischer Sequencer
Verwandten des Menschen: Chimpanse, Orangutan
Modellorganismen in der Wissenschaft: E. coli, Hefe, C. elegans, Fruchtfliege, Arabidop
Maus
Pathogene und ihre Vektoren: Viren, Bacterien, Plasm. malariae + Malaria mosquito
Agric. Tiere und Pflanzen: Weizen, Hühner, Kuh, Schwein
Haustiere: Hund
Others: Archaebakterien, Amoeba, Wallabi kangaroo, usw..
Human Genom Project
12.
Plan: $3 Milliarden Project - 15 Jahre
1990 James Watson (NIH, resignierte; Genomteilen mehrerer Individuelle
1992 Francis Collins (NIH)
International Consortium: USA, China, USA, Japan, Deutschl., Frankr.
Rennen
1998 Craig Venter (Celera Genomics): Genom aus 5 Individuellen
Human Genom Project
13.
Menschliches Genom:
2001: unvollständige Version (90%)
2004: Vollständige Version (99%)
Die fehlenden 1%: sind repetitive Sequenzen nahe des Centromers
Craig Venter
Francis Collins
Genom einer einzelen Person
14.
Craig Venter – 2007 September
Wissenschaft und
Gesellschaft von Vater
Narzism von Mutter
1. Zwischen den mütterlichen und väterlichen Chromosomen mehr als 4 Millionen
Unterschied:
- Single Nukleotid
- Deletionen, Insertionen
2. Unterschiedliche Anzahl von Kopien der Genen auf den homologen Chromosomen
 Nicht 0,1%, aber 0,5% der Differenz zwischen den Menschen!
Diplod Genome der Rassen
James Watson (europäer):
Ein Mann von Han Pop.(asiäner):
2007
-2008
Ein Mann von Yoruba Pop. (afrikaner):2008
15.
Human Variom Project
Richard Cotton
16a.
Seit 2006
Sammeln von variablen Sequenzen von verschiedenen Individuen
Primärer Fokus : Die medizinische Anwendung
Die Zukunft:
Individuelle auf Genom basierte Medizin
22.
1000 Genom Project
16b.
(seit 2008)
Teilnehmer:
•
•
•
•
•
Wellcome Trust Sanger Institute
Beijing Genomics Institute
National Human Genome Research Institute
National Institutes of Health
Budget: 30-50 Million $
• Ziel:
- Analyse von Variationen zwischen Individuen (SNPs)
• 8,2 Milliarde neue Basenpaaren/Tag (!)
16c.
Der Süd-Afrika Projekt
Human Genom Project
17.
Die Hoffnung:
Knacken wir die Nukleotidsequenz der DNA verstehen wir wie
das genetische Material operiert , erlangen wir das
Verständnis Krankheiten zu heilen
Die Einschränkung der Hoffnung
1. Genfunktion kann nicht von der Genstruktur abgeleitet werden
2. Genetische Krankheiten machen nur einen Teil aller Krankheiten aus
3. Wir kennen nur die Mutationen in den kodierenden Regionen
- monogene Krankheiten: 2%
- polygene Krankheiten: 98% - wir kennen nicht alle beteiligten Gene
4. Wir kennen nicht die Signifikanz von Mutationen in den regulierenden Regionen eines Genes
5. Die Gene – Einfluss der Umwelt nicht ganz verstanden
Human Genom
18a.
– 3,2 GB (3,2 Milliard Basenpaaren
Grosse Duplikationen
Verschiedene Heterochromatin
Eigene Sequenzen
LINEs
Introns
Exons
Transposon: springende Gene, mobile genetische Elemente
Im engeren Sinn:
Retrotransposon ist selbst beweglich,
Retroposon: nur mit Hilfe den Produkten anderer Elemente
Human Genom
Sequenzen mit Genen verbunden
1,1%
36%
63%
Intergenische Sequenzen
1152 MB
Kodierende Sequenzen
48 MB
2000 MB
18b.
Kodierende
Sequenzen
Natur vs. Edukation
19.
Herr
Craig Venter
5 Typen von Atomen: C, H, O, N, P
-Aber ausreichend um das menschliche
-Gehirn zu kodieren! !
Wir haben zu wenige Gene, deswegen: „genetische Determinismus,
Die Idee, ein Person wird durch Ihr Genom kontrolliert, war ein Irrtum”
Gene des Menschen
Expression, Replikation, Aufrechterhaltung des Genoms
Signalprozesse
Verschiedene andere Aktivitäten
(immunologische, strukturelle)
10-12,000 Gene; die Funktion der restlichen 10k Gene ist unbekannt !!
20.
21.
Konservative Gene:
erfüllen grundlegende Funktionen der Zelle: metabolische Enzyme, Zytoskelet
- regulierende Gene : Hox Gene, Elemente der Signaltransduktionsbahnen
Schnell entwickelnde Gene:
-Maus: Sex, Immunabwehr, Geruchus
-Mensch: Sex, Immunabwehr, (Geruchverwandte Gene werden abgebaut)
21.
Konservative Gene:
erfüllen grundlegende Funktionen der Zelle: metabolische Enzyme, Zytoskelet
- regulierende Gene : Hox Gene, Elemente der Signaltransduktionsbahnen
Schnell entwickelnde Gene:
-Maus: Sex, Immunabwehr, Geruchus
-Mensch: Sex, Immunabwehr, (Geruchverwandte Gene werden abgebaut)
Debette
Was ist wichtiger in der Evolution:
Die Veränderungen der Gen-Funktion oder der Genregulierung?
Was ist ein Gen?
22a.
1 Gen – 1 Enzym Hypothese
1941
Neurospora crassa
Enzym 1
Enzym 2
Enzym 3
Enzym 4
Enzym 5
Genmutation:
Wenn das Enzym 5 nicht funktioniert: Sammelt sich Substrat E an => Das Produkt von F wird nicht produziert
Problemen:
(1) ein Protein kann aus verschiedenen Geneinheiten
produziert werden (zB. Hämoglobin aus 4)
(2) Nicht jede Proteine sind auch Enzyme
Was ist ein Gen? –
22b.
1 Cistron, 1 Polypeptid Hypothese
T4 Phag
1955
Seymour Benzer
Mutation-Rekombination Experimente wurde gemacht um die Struktur der Phagen-Gene zu
erkunden:
Ergebniss: die funktionelle Einheit des genetischen Materials ist Cistron und kodiert ein Polypeptid
Was ist ein Gen? –
22c.
1 Gen, 1 Polypeptid Hypothese
Das Konzept der Cistron gang aus der Mode:
Wieder das Genkonzept benutzen wir
Alternative Promoterbenutzung, Capping, Splicing, Polyadenilation
Problemen:
(1) Wegen der alternativen Prozessen sind die Grenzen der Gene
nicht eindeutig
(2) Nicht jede Gene kodieren Proteine (zB: RNA Gene)
Das Konzept heutzutage
1 Gen und mehrere Proteine
Mit neue DNA Sequenzierungstechniken wird das Konzept in eine neue Beleuchtung gestellt
Struktur der Gene
Promoter
DNA
exon intron exon intron exon intron exon
Transkription
Pre-mRNA
Splicing
mRNA
Translation
Polypeptid
reifes Protein
Post-Translationelle
Modifitierung
23a.
Struktur der Gene
Aminosäuer kodierende Teile der Exon
E3
E1
pre-mRNA
I1
E2
I2
5’-UTR
3’-UTR
AUG
Stop
E3
E1
mRNA
E2
5’-UTR
Kodierende Sequenz 3’-UTR
AUG
Stop
(ORF)
ORF: open reading frame; offener Leserahmen
polyA Signal
polyA Schwanz
23b.
Untersuchung von Genen
24.
Untersuchung eines Gens
1. Klassische (Mendelsche) Genetik:1. Hälfte des XX. Jahrh.
2. Molekulare Genetik: 2. Hälfte des XX. Jahrh.
Untersuchung eines Genoms
3. Genomik: 1. Hälfte des XXI. Jahrh.
Automatische Sequenzer
a. Strukturelle Genomik
b. Funktionelle und Integratives Genomik–
- postgenomische Aera
MicroarrayScanner
Genom Annotation
Ist der Prozess vom Anhänger biologischer Information und Sequenzen
(g.a. bezieht sich normalerweise auf Gene , kann aber auf jede Sequenz angewandt werden)
Strukturelle Annotation: Identifikation einer Sequenz
- Lokalisation auf dem Chromosom
- Identifikationen auf Exons und Introns
-Lokalization von regulierenden Regionen
-Funktionelle Annotation: Anhängen eine Funktion an einer Sequenz
-- biochemisch
-- Andere biologische Funktionen
--Teilnahme in der Regulierung und Interaktion
--- Expression (wann, in welcher Zellen, wie viel?)
Biologische & in silico Untersuchungen
25.
26.
%
Prokaryont Einzellige
Pflanzen/ Wirbellose
Pilze
Chordatiere Wirbeltiere Mensch
27.
Menschliches Genom
Sequenzen mit Genen verbunden
1,1%
36%
62,5%
Sequenzen mit Genen
verbunden
Kodierende
Sequenzen
Pseudogene
Nichtkodierende Sequenzen
Genfragmente
10,5%
Introns
24%
UTRs
1,5%
Intergene
Sequenzen
Introns und UTRs
E3
E1
pre-mRNA
I1
E2
5’-UTR
AUG
I2
3’-UTR
Stop
polyA Signal
UTR: regulation von Translation und Halbwertszeit von mRNA
Intron (mögliche Rollen):
1. Genetischer Abfall
2. Regulation: (a) Es kann cis-Elemente enthalten, oder
(b) es reguliert RNA
3. In Alternative Splicing kann es als Exon dienen
UTR: untranslatierter Bereich ,engl. Untranslated Region)
28.
Pseudogene &
Genfragmente
Genfragmente
Genetischer Abfall
Fossile im genetischen Friedhof
Pseudogene
Typen:
. Intron-enthaltend: chromosomale Segmentduplikation
1
2. Intronlos: reverse Transkription, danach Reinsertion
Funktion
1. 1. In manchen Fällen Regulation des originalen Gens durch
antisense Interaction
2. Genetischer Abfall
Pseudo = falsch, unecht
29.
Menschliches Genom
30.
Intergene Sequenzen
1,1%
Kodierende
Sequenzen
36%
Nichtkodierende Sequenzen
63%
Sequenzen mit Genen
verbunden
Intergene
Sequenzen
52%
11%
Repetitive
Sequenzen
andere
Transposons
Retroposons
41%
DNA Transposons
3%
Simple
Repeats
Grosse
Repeats
3%
5%
Entdeckung des Transpons
(springende Gene)
1951: Das Genom ist in Bewegung
wegen der DNA Transposons
1983
31.
Klassifikation
von Transposone - I
32.
Ausgerissene
eigene Elemente
Fremde Eindringlinge
1. Retroviren
SINEs
- Alu Sequenzen
300 bp ……...aatggcgtattat……….
- andereSINEs
2. Degenerierte Retroviren
3. DNA Transposone
IR
IR
Transposase
Infektion eines Retroviruses
33.
Virus RNA
1. Freie Vírus
Envelope / Hülle
2. Adhesion + Fusion
Kapsid
3. Eintreten
4. Reverse Transkription
5. Integration
6. Transkription
7. Einbau
8. Austreten
9. Virion
Stabile Retrovirus Insertion in das
GenoStabileRetrovirusInsertionindasGenom
Hautzelle
Neuron
Pigmentzelle
Spermium
Oozyta
34.
Retroviren müssen
in die Keimbahn
des Wirtsgenoms
insertiert werden
In Embryo oder in
Erwachsenen
Keimbahnzelle
Ektoderma
Zygot
Blastula
Gastrula
Mesoderm
Herzzelle
Muskelzelle
Endoderm
Blutkörperzelle
Tubulare Zelle
Glattmuskelzelle
alveolare Zelle
pankreatische Zelle
Schildrüsezelle
Koala Retroviren
Kolonisierung heutzutage
bei Menschen waren mehrere unabhängige Invasionen stattgefunden
–aber zB. HIV ist nicht sicher, dass es Teil unseres Genoms wird).
Dieses Prozess findet sich heutzutage bei Koalabär statt
(eine Endogenisierung durch Koala Retrovirus).
X.
35.
Klassen der Transposons
-II
I.
Klasse: Retrotransposons
LTR
1. LTR Transposons
2. Nicht-LTR Transposons
- 2a. LINEs
- 2b. SINEs
II. Klasse: DNA Transposons
IR
IR
Transposase
IR: inverted repeat, (invertierte Wiederholung)
LTR: long terminal repeat, (lange terminale Wiederholung)
LTR
Transposons
gag
CP
LTR
pol
NC
Pr RT
env
Endogene Retroviren: sie haben
alle Gene aber Mutant
RNaseH Int
Kapsid Nukleokapsid Protease Ribonuklease H
Hülle
Reverse Transkriptase Integrase
gag
CP
Pr RT
RNase
LTR
1%
7%
pol
NC
35.
H Int
I. Klasse
Retrotransposon: autonom
Retroposon: nicht autonom
LTR Retro-Transposone
(Retrovirus ähnliche) 8%
Transposons
gag
CP
LTR
pol
NC
Pr RT
env
Endogene Retrovirus: sie haben
alle Gene aber Mutant
RNaseH Int
Kapsid Nukleokapsid Protease Ribonuklease H
Hülle
Reverse transkriptase Integrase
gag
CP
Pr RT
gag?
RNase
1%
LTR Retro-Transposone
(Retrovirus ähnliche) 8%
H Int
Nicht-LTR Retroposone
pol
RT
LTR
7%
pol
NC
35.
RNse H
polyA
LINEs
(long interspersed
nuclear elements)
A
B
polyA
I. Klasse
Retrotransposon: autonom
Retroposon: nicht autonom
SINEs
(short interspersed
nuclear elements)
33%
Transposons
gag
CP
LTR
pol
Pr RT
NC
env
Endogene Retrovirus: sie haben
alle Gene aber Mutant
Rnase H Int
Kapsid Nukleokapsid Protease Ribonuklease H
Hülle
LTR
Reverse Transkriptase Integrase
gag
CP
Pr RT
gag?
A
IR
RNase
H Int
B
LTR Retro-Transposone
(Retrovírus ähnliche Elemente) 8%
Nicht-LTR Retroposone
pol
RT
1%
7%
pol
NC
35.
RNase H
polyA
LINEs
33%
polyA
I. Klasse
SINEs
IR
Transposase
II. Klasse
IR: inverted repeat, umgekehrte, invertierte Wiederholung
Retroransposon: autonom
Retroposon: nicht autonom
DNA Transposone
3%
35.
Nicht-LTR Retrotransposone
LTR Retrotransposone
DNA Transposon
(850,000 LINE, 1500,000 SINE)
20% LINE
Endogene Retroviruse und
Retrovirus-ähnliche Elemente
(mehr als 20 Familien;
450,000 Kopien)
degenerierte
Retrovíren
3%
8%
13% SINE
Kolonisieren das Genom
durch horizontalen
Gen-Transfer
Vektor unbekannt
1. Alu: veränderte 7SL RNA „Gen” (11%)
2. MIR, MIR-3: stammen ab von tRNA
3. SINE-R: degenerierte Retrovíren
„Copy and paste”
LTR: long terminal repeat:
LINE: long interspersed nuclear elements:
SINE: short interspersed nuclear elements:
„cut and paste”
lange terminale Wiederholung
(lange, eingestreute Kernsequenzelemente, bis 6000 Bp
(kurze, eingestreute Kernsequenzelemente, bis 600 Bp
LTR Retrotransposone
36a.
HERV: human endogene Retroviren
gag
CP
pol
NC
Pr RT
LTR Kapsid Nukleokapsid Protease
env
RNáz H Int
Ribonuklease H
Hülle LTR
Reverse Transkriptase Integrase
LTR retrotransposons machen 8% des Genoms aus , aber nur 1% hat eine Struktur ähnlich dem
Retrovirus, der rest ist degeneriert. Alle sind mutant: sind sind nicht in der Lage infektiöse Viren
zu formen aber , können sich bewegen durch Enzyme anderer Elemente.
Neue Entdeckung: HERVs sind aktiv !
LTR Retrotransposon
Gag: capsid (Strukturelement)
Pol: polymerase: Reverse Transkriptase, Integrase, Protease, RNase H
Env: Envelope(Hülle)/ (Strukturelement)
LTR (long terminal repeat): Promoter in diesem Fall
gag
MaLR
36b.
Wild-typ Retrovirus
Human endogenous retroviruses
…und ihre Fossile
einzelnes LTR
Die Wirkung von endogenen
Retroviren auf
die Genexpression
Ein zelluläres Gen
1. Kein Effekt
2. Transkription vom LTR
3. andere Splissen
Polymorphism
Zell-spezifische Ackivation/Inhibition
4. Die Aktivität von LTR kann moduliert werden
HERV: human endogenous retroviruses
Methylation
36c.
Nicht-LTR
Retrotransposons
LTR
gag
CP
pol
NC
Pr
gag?
RT RNase H
A
B
LTR
RT RNase H Int
pol
polyA
37.
LTR Retro-Transposons
polyA
LINEs
„autonom” Transposon
SINE
Nicht-autonom Transposons
LINEs
DNA
gag?
pol
polyA
RT RNase H
ORF1
promoter
ORF2
IRES
38a.
RNA
RT
RNase H
polyA
21% des menschlichen Genoms(850,000), 17% L1 (500,000), 10,000 vollen Länge (6,1 kb),
wie auch immer nur 50-100 von ihnen sind Funktionsfähig (zB Herv-K und L1)
- Nur manche Teile des Rests können springen (zB Herv-K und L1 ) mit der Hilfe von Enzymen, die anderen sind
Pseudogene.
- LINE Mobilisation in Keim- und Somatischer Zelllinien
polyA Signal
Gene
Protein
ORF1
ORF2
LINE-1
p40
Endonuklease
Reverse Transkriptase
LINE: long interspersed nuclear elements:
(lange, eingestreute Kernsequenzelemente)
SINE: short interspersed nuclear elements: (kurze, eingestreute Kernsequenzelemente )
IRES: internal ribosome entry site: (interne ribosomale Eintrittsstelle )
LINE-1 Vermehrung
springende Gene
Kopieren
perfekt
5’-gelöscht
5’-gelöscht + invertiert
38b.
Formation von Pseudogenen
39a.
Der Effekt von LINE-1 auf das
Genom
Gene
Intronloses Pseudogen
Geninaktivation
Der Effekt von LINE-1 auf
das Genom
Insertion
Ins Exon
Ins Intron
Ins Intron
*: Stop Codon
L1 mRNS
39b.
Der Effekt von LINE-1 auf das Genom:
Transduktion
Exon von Gene „A”
mRNA
Das poly-A Signal von LINE ist schwach →read-through von
benachbartem Gen
„B” Gene
Insertion von einem Stueck von LINE und das Exon
von Gen „A” zu Gen„B”
oder nur das Exon von Gen„A”
Bemerkungen:
1.LINE-1 nimmt im allgemein nicht ein komplettes Exon, sonder nur einen DNA-Stück
2.Das Prozess findet sich in körperlichen Zellen statt, aber in L1 Keimzellen ist es sehr
aktiv - nicht vererblich, aber meistens verursacht Tumoren
3. Das Transdution hat eine selektive Vorteil, wenn es sich in Keimzellen findet statt oder
zufällig in einer kleinen Population - verursachend "Exon-shuffling"
39c.
SINEs
A
- 13% des Genoms, 11% Alu Sequenzen; nicht-Protein kodierend
- AluI Restriktions-Enzyme Erkennungsstelle
Die durchscnittliche SINE Wiederholungseinheit 100 - 400 bp
B
polyA
ALU
40.
(Alu: 300 bp: 280 bp + pol III promoter)
Mehr als 1Millione Kopien, das “erfolgreichste” Transposon im Menschen
- Vorfahre: SRP (signal recognition particle; ribonucleoprotein) + RNA Komponente (7SL RNA)
SRP
Ursprüngliche Funktion von SRP:
Nach der Verbindung mit Signalsequenzen der Proteinen
führte die Proteine nach Membrane zB: ER
Alu domän S Domän
Link Monomer
Link Monomer
recht Monomer
Recht monomer
-MIR und MIR-3 sind Retroposon Familien: stammen von tRNA ,
-SINE-R: hat Retrovirus Ursprung
Die Hyperparasite Alu
Sequenzen
41a.
Alu Sequenz-verbundene
Krankheiten
- Brustkrebs (auch bei Männern)
- Ewing Sarcoma
- familiäre Hypercholesterolemie
- Hemophylia
- Neurofibromatosis
- Diabetes mellitus typ II
41b.
DNA Transposons
42.
- Infektionsmechanismus ist nicht verstanden, was könnte der Vektor
sein ?
Transposase löst das Springen aus: „cut and paste” Mechanismus –
Wie vervielfältigen sie sich?
-Mehr als 60 Familien!: Charlie, Mariner, Tigger, THE1, usw.
-Die Mariner Familie gleicht den Insekten Transposons:
wahrscheinlich aber kein Horizontaler Gene-Transfer
IR
Transposase
IR: inverted repeat : umgekehrte Wiederholung
IR
43.
Verteidigungsmechanismus gegen
Transposons im Wirtsgenom
1. Heterochromatinisation (Methylation) -> Inhibition der Transkription
2. RNA Interferenz -> inhibition der Transkription & Translation
3. Lokal Erhöhung der Mutationsrate -> Inaktivation des Transposons
4. DNA- und Hystonmethylations Enzymen werden rekruitiert
Vorteile für das Wirtsgenom
durch Transposons
44.
1.Variabilität von Genen die Antikörper und T-Zell Rezeptoren kodieren
2. Genomplastizität
Tandem Repeats
genom
DNA
45.
konsekutive identisch oder nahezu identisch (degenerierte) Wiederholungseinheiten
Variabilität in der Länge von: (1) Wiederholungseinheit und (2) dem kompletten Repeat Satellit
DNA
(Makro)satelliten:1 – mehrere hundert kilobasen (kb) Wiederholungen: um Zentromer und
konstitutives Heterochromatin
- Telomer: 15 kb: TTAGGG hexamer – Telomerase bindet an die Enden des chromosoms
- Satellit 2 and 3: GGAAT
- Alpha Satellite: 171 bp Einheiten
Minisatelliten: (VNTR*, STR*): sind kürzer als Macrosatelliten.
Genetische Marker (paternal test, descent); Verbunden mit verschiedenen Krankheiten, z.B. Diabet
Mikrosatelliten : klein 1-5 basenpaare Wiederholungen: bis zu mehreren hundert Wiederholunge
CA/TG Wiederholungen 0.5% des Genoms– keine bekannte Funtktion
Trinucleotid Wiederholungen CAA (Gln), ACA (ala):
Neurodegenerative Krankheiten; beim Hund in Transkriptionsfaktoren->
STR: short tandem repeats; VNTR: variable number of tandem repeats
Andere intergenische
sequenzen
1. Unkenntlich degradierte Transposons, Pseudogene
2. Regulierende Regionen: promoter, Enhancer, silencer
3. Andere
46.
Herunterladen