Technologisches Arsenal der Molekularbiologie - II Technologisches Arsenal der Molekularbiologie II. Strukturelle Genomik FOLIE 1-7. 12. Genomische Bibliothek, EST-Datenbank Eine genomische Bibliothek (Genbibliothek, DNA-Bibliothek oder Genbank), beherbergt das gesamte Genom eines Organismus in Form von definierten DNA-Teilstücken auf Vektoren in einzelligen TrägerOrganismen oder Phagen. Diese Träger-Organismen dienen der Speicherung und Vervielfältigung der Fragmente zum Zweck molekularbiologischer Untersuchungen. Beim Anlegen einer Genbibliothek werden in der Regel, durch enzymatische Verdauung von genomischer DNA mit Restriktionsenzymen, oder durch physischen Methoden (zB. mit Ultraschall) zunächst kleine Fragmente des kompletten Genoms eines spezifischen Organismus hergestellt. Jedes Fragment enthält ein oder mehrere Gene und wird über einen Vektor in E. coli eingeführt. Der Einzeller vervielfältigt einhergehend mit seiner eigenen Vermehrung durch Zellteilung das ihm eingefügte DNA-Fragment und bildet auf entsprechendem Nährboden eine Kolonie. Im Labor werden entsprechend viele Kolonien erzeugt und kultiviert wie benötigt werden um das gesamte Genom eines Organismus, fragmentiert in Einzelkolonien, unterzubringen. Die Identifizierung der DNASegmente in der DNA-Bibliothek erfolgt durch Southern-Analyse mit fluoreszent oder radioaktiv markierten Proben. FOLIE 5. Eine cDNA-Bibliothek ist eine Sammlung von vielen cDNAs (komplementär-DNAs), die aus der mRNA einer bestimmten Zelle oder eines Gewebes isoliert und mit reverser Transkriptase umgeschrieben wurde und repräsentiert im Idealfall die Gesamtheit aller exprimierten Gene, also das Transkriptom der untersuchten Probe. Die cDNAs werden in der Regel in Plasmide kloniert, die in Bakterien vermehrt werden. Die Gesamtheit der so entstandenen Klone nennen wir cDNA-Bibliothek. Es kann z.B. für die Untersuchung der Genstruktur (intronfreie Gene) verwendet werden. EXTRA ANFORDERUNG: Expressed Sequence Tags (EST) sind kurze Nukleotidsequenzen (einige Hunderte von Basen), die durch Sequenzierung einer cDNA-Bibliothek erhalten werden. Die ESTBibliothek ist eine Bibliothek von solchen kurzen Sequenzen, was – ähnlich wie die cDNA-Bibliothek – das Transkriptom representiert. Die EST-Bibliothek kann verwendet werden, um schnell zu erfassen, welche Gene in einem gegebenen Zell- oder Gewebetyp exprimiert werden. Es kann auch für die schnelle Sequenzierung des aktiven Genoms (des proteinkodierenden Teils vom Genom) benutzt werden. FOLIE 6-8. 13. DNA-Sequenzierung DNA-Sequenzierung ist die Bestimmung der DNA-Sequenz, also der Nukleotid-Abfolge in einem DNAMolekül. Die DNA-Sequenzierung hat die biologischen Wissenschaften revolutioniert und die Ära der Genomforschung (Genomik) eingeleitet. Alle Genomprojekte basieren auf diese Technik. Die Didesoxymethode nach Sanger wird auch Kettenabbruch-Synthese genannt und stellt eine enzymatische Methode dar. Frederik Sanger erhielt für seine Arbeiten zur DNA-Sequenzierung zusammen mit Gilbert 1980 den Nobelpreis für Chemie. dNTP ist die allgemeine Abkürzung für ein Nukleosidtriphosphat und kann für dATP, dCTP, dGTP oder dTTP stehen. ddNTPs sind die entsprechenden Didesoxy-Varianten der dNTPs. Der Einbau eines ddNTPs führt zum Abbruch der Polymerisationsreaktion. Ausgehend von einem radioaktiv markierten Primer wird durch das Enzym DNA-Polymerase einer der beiden komplementären DNA-Stränge verlängert. Zunächst wird die DNA-Doppelhelix durch Erwärmung denaturiert, woraufhin Einzelstränge für das weitere Vorgehen zur Verfügung stehen. In vier sonst gleichen Ansätzen (alle Grundanforderung 13. Vorlesung 0Boldogkői Zsolt Tombácz Dóra © Technologisches Arsenal der Molekularbiologie - II beinhalten die vier Nukleotide) wird je eine der vier Basen zum Teil als Didesoxynukleosidtriphosphat (ddNTP) zugegeben. Diese Kettenabbruch-ddNTPs besitzen keine 3'-Hydroxylgruppe: Werden sie in den neusynthetisierten Strang eingebaut, ist eine Verlängerung der DNA durch die DNA-Polymerase nicht mehr möglich, da die OH-Gruppe am 3'-C-Atom für die Verknüpfung mit der Phosphatgruppe des nächsten Nukleotids fehlt. In der Folge entstehen DNA-Fragmente unterschiedlicher Länge, die in jedem Ansatz stets mit dem gleichen ddNTP enden. Nach der Sequenzier-Reaktion werden die markierten Abbruchprodukte aus jedem Ansatz mittels Polyacrylamid-Gelelektrophorese der Länge nach aufgetrennt. Durch Vergleich der vier Ansätze kann man die Sequenz nach Autoradiographie am Röntgenfilm von unten nach oben ablesen. Die dementsprechend komplementäre Sequenz ist die Sequenz der verwendeten einsträngigen DNAMatrize. FOLIE 9. Automatisierte Farbstoff-Terminationsmethode: Basiert auf die Methode von Sanger. Seit Anfang der neunziger Jahre werden vor allem mit Fluoreszenz-Farbstoffen markierte Didesoxynukleosidtriphosphate eingesetzt. Jedes der vier ddNTPs wird mit einem unterschiedlichen Farbstoff gekoppelt. Diese Modifikation erlaubt es, alle vier ddNTPs in einem Reaktionsgefäβ zuzugeben, eine Aufspaltung in getrennte Ansätze und der Umgang mit Radioisotopen entfällt. Die entstehenden Kettenabbruchprodukte werden mittels Kapillarelektrophorese aufgetrennt und mit Hilfe eines Lasers zur Fluoreszenz angeregt. Die ddNTPs am Ende jedes DNA-Fragmentes zeigen dadurch Fluoreszenz unterschiedlicher Farbe und können so von einem Detektor erkannt werden. Das Chromatogramm (die Abfolge der Farbsignale, die am Detektor erscheinen) gibt direkt die Sequenz der Basen des sequenzierten DNA-Stranges wieder. Die automatischen Detektoren können täglich Sequenzen von 10000 Basen bestimmen. Sequenzierung des kompletten Humangenoms würde mit so einer einzigen Sequenzierautomat 1000 Jahre dauern. Die Anwendung von Robotern macht die Sequenzierung schneller. FOLIE 10. EXTRA ANFORDERUNG Das Humangenomprojekt (HGP, Human Genome Project) wurde im Herbst 1990 mit dem Ziel gegründet, das Genom des Menschen vollständig zu entschlüsseln, d. h. die Abfolge der Basenpaare in der menschlichen DNA auf ihren einzelnen Chromosomen durch Sequenzieren zu identifizieren. Das menschliche Genom enthält alle Informationen, die die für einen Menschen notwendigen Proteine mit den Basenpaaren in seiner DNA kodieren. Das Projekt wurde in den USA im Oktober 1990 als Projekt eines öffentlich finanzierten internationalen Forschungsverbunds gegründet. Geleitet wurde das HGP zuerst von James Watson, einem der Entdecker der DNA-Struktur. Sein Nachfolger wurde der renommierte Genetiker Francis Collins. Am Projekt nahmen zu Beginn über 1000 Wissenschaftler in 40 Ländern teil (International Human Genome Sequencing Consortium, IHGSC, Teilnehmer unter anderen: National Institute of Health, USA; Department of Energy, USA; Welcome Trust Institute, UK; deutsche, französische, japanische und chinesische Forschungsinstitute). Ziel war die Sequenzierung des menschlichen Genoms bis 2010. Die Human Genome Organisation bekam 1998 durch die neu gegründete US-Firma Celera Genomics (geleitet von J. Craig Venter) private Konkurrenz. Celera hat versprochen, daβ sie die Arbeit, die das HGP schon fast vor einem Jahrzehnten begonnen hat, innerhalb von 3 Jahren beenden werden. Sequenzierung von vollständigen Chromosomen im Rahmen des HGP erfolgte in 500-1000 bp Serien, also das Humangenom muβte in solche kleinen Stücke zerschnitten werden, dann muβten diese Fragmente sequenziert und wieder zusammengepasst werden. Celera hat eine völlig andere Strategie, die Shotgun-Sequenzierung verwendet. 2001 wurde unabhängig von beiden Forschungsunternehmungen die vollständige Sequenzierung des menschlichen Genoms verkündet (Celera in der Zeitschrift Science, HGP in der Zeitschrift Nature). Dies ist in den Medien häufig als „Entschlüsselung“ tituliert (nicht mit der Entschlüsselung des genetischen Codes zu vermischen!!!) Die vollständige Sequenzierung des menschlichen Genoms bildet unter anderem die Grundlage für die Möglichkeit, Erbkrankheiten zu erforschen und molekulare Mechanismen der Krebsentstehung besser zu verstehen. FOLIE 11. EXTRA ANFORDERUNG Die Methode des HGP (IHGSC) – hierarchische Sequenzierung (Kartierung von oben nach unten, top-down): diese sehr viel Zeit beanspruchende Technik wurde in den Grundanforderung 13. Vorlesung 0Boldogkői Zsolt Tombácz Dóra © Technologisches Arsenal der Molekularbiologie - II achtziger Jahren entwickelt. Die Gundlage ist, daβ das ganze zu sequenzierende Genom auf immer kleinere Teileinheiten aufgeteilt wird. Erstmal kloniert man groβe, durchschnittlich 200 kb-lange Chromosomenabschnitte in BAC-Vektore, dann werden ihre Enden sequenziert, und auf die übberlappenden Teile basierend die Mitglieder der BAC-Bibliothek in eine Reihe gestellt. Dann werden die Mitglieder der BAC-Bibliothek, derer Position auf dem Chromosom schon bekannt ist, weitergeschnitten. Dieser Prozess wird solange wiederholt, bis man solche kleine (500-1000 bp) Fragmente bekommt, die schon vollständig sequenziert werden können. Celera hat die sogenannte Shotgun-Technik benutzt: das ganze Genom wurde gleich in kleine Fragmente zerschnitten, welche von beiden Enden sequenziert worden sind. Dann wurden komplizierte Computerprogramme verwendet, um die bestimmten Sequenzen zusammenzustellen. FOLIE 12. Wem gehört das sequenzierte Genom? Es geht um eine freiwillige, anonyme, etnisch diverse Donorgruppe. Zu welchem Person ein bestimmter, sequenzierter Genomteil gehört, hang nur von technischen Faktoren ab. Wir können es also nicht genau aussagen, wem die erste bekannt gewordene DNASequenz gehört. Andererseits wurde erstmal nur der haploide Chromosomensatz und die mitochondriale DNA sequenziert. Als Ausgangspunkt hat HGP die Proben von 50 Donoren benutzt, die sowohl etnisch, als auch geschlechtlich divers waren. Die anfänglichen Genbibliotheken haben Genomabschnitte von beiden Gechlechten enthalten, am Ende verwendete man aber nur die Dateien aus 8 Männern. Die Proben wurden zufälligerweise ausgewählt, so kann man es nicht wissen, von welchen etnischen Gruppen die Donoren sind. An der anderen Seite, Celera hat mindestens eine Probe von beiden Geschlechten aller vier Groβrassen verwendet. Die anfängliche Probeanzahl von 21 wurde auf 5 vermindert: die Genomkombination von 2 Männern und 3 Frauen, 1 Afrikaner, 1 Asiater, 1 Latein-Amerikaner und 2 Kaukaser (weiβ) wurde 2001 von Celera veröffentlicht. Das war aber nur die rohe Version. Das erste vollständige Humangenom wurde im April 2003 von HGP veröffentlicht. Offiziell hat das Programm im Jahre 2006 beendet, wenn die Genbibliothek mit der Sequenz des gröβten menschlichen Chromosoms (Chromosom 1, 8% der gesamten humanen DNA) vervollständigt wurde. Im Jahre 2007 hat man die Sequenz des ersten zwei diploiden Humangenoms veröffentlicht: die gehören zu Craig Venter und James Watson. Als beide in die europäische Groβrasse gehören, war es nötig die menschliche Genbibliothek mit Genkarten von den anderen Groβrassen zu vervollständigen. Im Jahre 2008 wurden die kompletten Genome von einem Han-Chineser und einem Nigerianer aus dem Joruba Etnikum bestimmt. FOLIE 13. Weitere Genomprojekte: • HapMap Projekt: 2002, Kartierung der SNPs • 1000 Genom Projekt: 2008, Vergleich der genetischen Variabilität von 1000 Menschen • Human Variom Projekt: 2008, Aufklärung aller genetischen Unterschieden im Humangenom Sequenzierungsstrategien der neuen Generation (large-scale, high-throughput): groβe Leistung, niedrige Kosten. Das Ziel ist die Verwirklichung von Sequenzierung eines Humangenoms in 15 Minuten für100$. FOLIE 14-16. 14. Genetische Marker Genetische Marker: SSR-s (simple sequence repeats; einfache Sequenzwiederholungen). Als Marker bezeichnet man in der Molekularbiologie eindeutig identifizierbare, kurze DNA-Abschnitte, deren Ort im Genom bekannt ist. (1) Als STR (Short Tandem Repeat, Mikrosatelliten DNA) wird die Wiederholung kurzer BasenpaarMuster hintereinander in einem DNA-Strang bezeichnet. Diese Muster bestehen aus 2-5 (nach anderen Meinungen sowohl 2-13, 2-20) Basenpaaren. Einige differenzieren die Wiederholungen von 2-NukleotidEinheiten als VNDR (Variable Number of Dinucleotide Repeats). Die Anzahl der Wiederholungen ist sehr Grundanforderung 13. Vorlesung 0Boldogkői Zsolt Tombácz Dóra © Technologisches Arsenal der Molekularbiologie - II variabel. STRs unteschiedlicher Länge können auch an den beiden homologen Chromosomen einer diploiden Zelle vorkommen. Die wiederholenden Abschnitte unterschiedlicher Länge repräsentieren unterschiedliche Allele. Die Anzahl der Wiederholungen wird vererbt. STRs kommen normalerweise auf genfreien DNA-Abschnitten vor. Die mit den Mikrosatelliten benachbarten Regionen sind innerhalb einer Art konserviert. Dementsprechend können wir die Mikrosatelliten-DNA in PCR mit Primern, die auf diese konservierten Regionen geplant sind, in allen Genotypen der gegebenen Art amplifizieren. Die Anzahl der Wiederholungen ist variabel unter den Individuen, deshalb ist STR das am häufigsten benutzte DNAFingerabdruck-Marker. (2) Als Minisatelliten, Minisatelliten-DNA oder VNTRs (variable number of tandem repeats) werden Abschnitte der DNA in heterochromatischen Regionen des Genoms von Eukaryoten bezeichnet, die aus tandemartigen Wiederholungen einer kurzen (ca. 10–100 Nukleotiden langen) DNA-Sequenz bestehen. Anders als bei anderen Satelliten-DNAs ist die Anzahl der Wiederholungen wesentlich kürzer, sie besteht in der Regel aus fünf bis 50 Wiederholungen. Diese Wiederholungen sind auβerdem hochvariabel: Im Verlauf der Evolution haben sich viele verschiedene Allele gebildet, die aus jeweils einer anderen Zahl von Wiederholungen bestehen. Jeder Mensch hat dadurch eine sehr spezifische Zusammensetzung dieser Allele. Diese Eigenschaft der Minisatelliten macht man sich beim Fingerprinting, dem Verfahren zur Erstellung eines genetischen Fingerabdrucks, zunutze. VNTRs werden mit spezifischen Primern amplifiziert, die auf die ihre beiden Grenzregionen geplant sind. Gröβenunterschiede können mit Gelelektrophorese detektiert werden. Die Länge des PCR-Produkts hängt von der Länge der wiederholenden Einheit und ihrer Kopienzahl ab. Wenn wir genaue Information über die Länge der wiederholenden Einheit haben, können wir die Kopienzahl bestimmen. Die resultierenden Muster sind für den gegebenen Mensch charakteristisch. Es ist eine sensitive Technik, eine VNTR-Analyse kann sogar an Hand eines einzigen Haarwurzels oder Bluttropfes realisiert werden. FOLIE 17-18. (3) SNP (single nucleotide polymorphism, Einzelnukleotidpolymorhismus) ist Austausch/Veränderung von einem einzigen Nukleotid (A, T, G oder C) im Genom. SNPs stellen ungefähr 90% aller genetischen Varianten im menschlichen Genom dar. Eine Variation ist ein SNP, wenn in der gegebenen Position alle Allele mit einer Wahrscheinlichkeit von mindestens 1% in der Population vorkommen. Zwei Drittel aller SNPs bestehen aus dem Austausch von Cytosin mit Thymin. Obwohl an einer gegebenen Stelle des Genoms theoretisch alle vier Basen vorkommen könnten, meiβtens kommen nur zwei Varianten vor. Die SNP-Anzahl der Menschen ist auf 10 Millionen geschätzt, das heiβt das es durchschnittlich 1 variable Position in allen 300 Basenpaaren vorkommt. Die meissten SNPs verursachen keine funtionelle Veränderung, einige können aber die Expression des Gens oder die Proteinfunktion beeinflussen, mehrere hängen daneben auch mit Krankheiten zusammen. Die sogenannten nicht kodierenden SNPs kommen in Introns, in den 5’ oder 3’ UTRs (nicht translatierte Regionen der Gene), oder in intergenischen Regionen vor. Eine Möglichkeit für die Identifizierung der SNPs ist die allelspezifische Amplifikation (ASA), wozu allelspezifische Primer verwendet werden. Diese Primer werden so geplant, daβ ihre 3’ Ende genau auf den SNP fällt, so kann die PCR nur im Fall einer Übereinstimmung ablaufen. FOLIE 19-20. 15. RFLP EXTRA ANFORDERUNG Restriktionsfragmentlängen-Polymorphismus, abgekürzt RFLP (Restriction Fragment Length Polymorphism) bezeichnet Unterschiede von DNA-Sequenzen homologer Chromosomen, welche als verschiedene Restriktionsfragmentmuster bei der Gelelektrophorese sichtbar werden. Die Länge eines Restriktionsfragments wird durch Mutation beeinflusst, bei der eine Erkennungssequenz für ein Restriktionsenzym entsteht oder verloren geht. Der RFLP Polymorphismus der DNA ist also das Ergebnis der Anwesenheit oder Abwesenheit einer bestimmten Restriktionsschnittstelle an demselbem Abschnitt der DNA von unterschiedlichen Individuen gleicher Art. Beispiel: Eine Sequenz enthält bei Person 1 eine Schnittstelle für ein Restriktionsenzym, in der Sequenz bei Person 2 kommt diese nicht vor. Werden nun diese Sequenzen mit einem Restriktionsenzym geschnitten, entstehen bei Person 1 Grundanforderung 13. Vorlesung 0Boldogkői Zsolt Tombácz Dóra © Technologisches Arsenal der Molekularbiologie - II zwei Fragmente und bei Person 2 ein Fragment. Werden nun die Längen der Sequenzen verglichen, kann ein RFLP festgestellt werden, die Fragmente sind unterschiedlich lang, der Locus ist polymorph. RFLPs dienen u.a. als genetische Marker bei der Genkartierung, aber sie können auch für Personenidentifizierung (DNAFingerabdruck-Analyse, Vaterschaftsteste), für die Untersuchung von genetischen Merkmalen (Krankheiten) und für pränatale Diagnostik verwendet werden. Funktionelle Genomik FOLIE 21-22. 16. Mikrochips in der Genomik Die Chip-Technologie (Microarray). Bis zum Ende des 20. Jahrhunderts wurden die Funktion und Regulation der einzigen Gene separat untersucht. Als die vollständige Genomsequenz von immer mehreren Organismen bekannt wurde, neue Techniken wurden entwickelt, die die gleichzeitige Untersuchung der Exrpression zahlreicher Gene möglich machen. Eine der automatisierbaren Methoden ist die ChipTechnologie, derer Einführung im Jahre 1996 die Molekularbiologie, die funktionelle Genomik und heutzutage auch die Methoden der klinischen Diagnostik revolutioniert haben. Das grundlegende Unterschied zwischen den beiden Arten des Chips, DNA- und Proteinchips ist das untersuchte Objekt. DNA-Chips ermöglichen die Untersuchung des Genoms und des Transkriptoms, nämlich (1) die Untersuchung von Veränderungen der Genexpression, (2) die Detektion von Splice-Varianten und (3) die Detektion von regulatorischen RNAs. Proteinchips sind Instrumente für die Untersuchung der (1) Expression, (2) Veränderungen und (3) Wechselwirkungen des Proteoms (funkzionelle Genomik). Neben der Untersuchung des Transkriptoms können wir mit Hilfe von DNA-Chips auch (1) Mutationen, (2) SNP-s, (3) Deletionen und (4) Insertionen detektieren, (5) Sequenz bestimmen, oder (6) das Methylierungsmuster aufklären (strukturelle Genomik). DNA-Chips machen die gleichzeitige Bestimmung des Expressionsmusters zahlreicher Gene möglich. Ein einziger Chip ermöglicht die simultane Untersuchung von 6-10000 Genen. Die Basis ihrer Funktion ist die DNA-DNA oder DNA-RNA-Hybridisierung. FOLIE 23-25. Woraus besteht sich ein DNA-Chip, wie wird es hergestellt? Die DNA-ChipTechnologie nutzt Techniken aus der Halbleiterfertigung, um bekannte Gene auf einem fingernagelgroβen Plastik- oder Glasplättchen, dem Chip (Microarray), zu identifizieren und deren Aktivität zu messen. Mit diesem Verfahren können sogar 1 000 000 bekannte Gene in zu untersuchenden Patientenproben aus verschiedenen Geweben identifiziert werden. Die einzelnen Rasterpositionen des Chips sind von einem Roboter mit einzelsträngigen DNA-Stücken beschichtet. Die Sequenz dieser DNA-Stücke ist bekannt, sowohl auch ihre Position auf dem Chip. Es ist dadurch möglich, das ein Computer genau speichert, welche Nukleotidsequenzen in welche Positionen des zweidimensional Rasters aufgetragt werden. Die DNA bindet kovalent an der Oberfläche. Demnächst gibt man DNA- (oder RNA-) Fragmente, die aus Zellen der untersuchten Person (Organismus) isoliert worden und mit fluoreszenten Farbstoffen markiert sind, zu dem Chip. Nach einer kurzen Inkubationszeit werden die nicht gebundenen Nukleinsäurestücke weggewaschen. Die farbigen Nukleinsärestücke können nämlich nur dort am Chip binden, wo die Voraussetzung der Basenkomplementarität erfüllt wird. Anders gesagt, die Inkubation und das Waschen werden so durchgeführt, daβ nur solche Stränge die denen entsprechenden, markierten Nukleinsäurestücke binden können, die eine vollständig komplementäre Basensequenz haben. Demnächst wird das sich aus dunklen und farbigen Punkten bestehende Muster von einem Scanner abgelesen und die Ergebnisse werden analysiert. Dies wird auch mit dem Computer durchgeführt, weil es genau „weiβ”, welche Nukleotidsequenzen in welchen Rasterpositionen vorhanden sind. Wenn z.B. in einer Rasterposition eine charakteristische Sequenz von HIV aufgetragen wurde, und in dieser Position wir eine positive Reaktion bekommen, das bedeutet, daβ dieses Virus in der Probe der Patienten vorkommt. Anhand der Qualität der Proben kann man die DNAChips in zwei Gruppen unterteilen: cDNA-Chips die von mRNA durch reverse Trankription in vitro hergestellt werden, und Oligonukleotide-Chips die auf synthetisch hergestellten Oligonukleotiden (20-25 bp) Grundanforderung 13. Vorlesung 0Boldogkői Zsolt Tombácz Dóra © Technologisches Arsenal der Molekularbiologie - II beruhen. Mit der Anwendung von mehreren, fluoreszenten Farbstoffen ist es möglich, einen Chip mit einer, durch roten Farbstoff markierten DNA-Probe aus behandelten Zellen, und einen anderen, identischen Chip mit einer durch grünen Farbstoff markierten DNA-Probe aus unbehandelten Kontrollzellen zu inkubieren. In diesem Fall wird RNA aus beiden Proben isoliert und mit reverser Transkription in cDNA umgeschrieben. Die Nukleotide, die die cDNA aufbauen, werden fluoreszent mit zwei in ihren spektralen Eigenschaften unterschiedlichen Farbstoffen markiert. Im Beispiel benutzen wir für die reverse Transkription der RNA aus der Kontrollprobe einen grünen Farbstoff, und im Fall der behandelten Probe einen roten Farbstoff → dadurch bekommen wir rot und grün fluoreszierende cDNAs, welche mit cDNA-Chips hybridisiert werden. Nach dem Ablesen des Chips mit einer hochauflösenden Laserkamera ist es dann möglich, die relative Expression der Gene zu bestimmen. Die Aktivität des Gens ist mit der Intensität des fluoreszenten Signals in der gegebenen Rasterposition proportional. Wenn das fluoreszente Signal der unbehandelten Probe in einer gegebenen Rasterposition stärker ist, es heisst dass die Aktivität des entsprechenden Gens im Folge der Behandlung niedriger wurde. Die Auswertung des Chips erfolgt mit Hilfe von hochentwickelter Computertechnik. Nach der Detektion kann das Computer die abgelesenen Muster auf einander projizieren. Wo der entsprechende DNA-Abschnitt aus der behandelten Probe fehlt, bekommen wir eine grüne Farbe, wo ein DNA-Abschnitt nur in der behandelten Probe vorkommt, dominiert die rote Farbe. In Rasterpositionen, wo in beiden Fällen (z.B. behandelt-unbehandelt, krank-gesund, usw.) eine gegebene DNA-Struktur hybridisiert hat, die Überprojektion von rot und grün ergibt eine gelbe Mischfarbe. Die Position, Intensität und Wellenlänge der entstehenden Mischfarbe liefern Informationen über Unterschiede in der Expression der Gene zwischen den beiden Proben. FOLIE 26. Chromatin-Immunpräzipitation EXTRA ANFORDERUNG Die Chromatin-Immunopräzipitation (ChIP – nicht mit den DNA-Chips zu vermischen!!!) ist ein experimentelles Verfahren in der Molekularbiologie. Ziel der Methode ist es, festzustellen, ob bestimmte Proteine (meist Transkriptionsfaktoren und Histone) bestimmte Teile des endogenen Chromatin lebendiger Zellen oder Geweben binden. Da das Verfahren in vivo arbeitet, unterscheidet es sich wesentlich von anderen Verfahren, die das gleiche Ziel verfolgen, wie z.B. Gelretardation und Footprint Analyse. Das Grundprinzip der Chromatin-Immunopräzipitation beruht darauf, die zu einem Zeitpunkt bestehenden Protein-DNA-Bindungen durch Fixierung mit Formaldehyd festzuhalten. Anschließend werden die Zellen zerstört und das Chromatin mittels Ultraschall in Stücke von einigen hundert Basenpaaren Länge zertrümmert. Jene DNA-Stücke, die das gewünschte Protein gebunden haben, werden mit einem für das Protein spezifischen Antikörper immunopräzipiert (isoliert). Die isolierten DNA-Protein-Komplexe werden gelöst. Die Identität der jeweiligen DNA-Stücke kann auf verschiedene Weise geklärt werden: Die DNA-Fragmente können in Plasmide eingebaut und dann sequenziert werden. Hat man eine Hypothese über den wahrscheinlichen Bindungsort im Genom, kann man eine PCR unter Verwendung von Primern, die spezifisch für die vermutete DNA-Region sind, durchführen. Ist man hingegen am Aufspüren aller Bindungsstellen des Proteins im gesamten Genom interessiert, kann ein DNAMicroarray verwendet werden. In diesem Fall spricht man auch von einem ChIP-on-chip-Experiment. Ein mit der ChIP-Technik zusammenhängender Begriff ist das Cistrom (nicht mit Cistron zu vermischen!!!), was die Gesamtheit solcher Cis-Elementen des Genoms (hier: DNA-Bindestellen) ist, welche zu einem gegebenen Trans-Element (z.B. Transkriptionsfaktor) binden. ChIP-chip Technik und ChIP-seq Technik: siehe im Vortrag! FOLIE 27-31. 18. Real-Time PCR Real-Time- PCR (qPCR, kvantitative PCR, kinetische PCR) & Real-time (RT2) RT-PCR. Die Real-TimePCR ist eine Vervielfältigungsmethode für Nukleinsäuren, die auf dem Prinzip der herkömmlichen Polymerase-Kettenreaktion (PCR) beruht, und zusätzlich die Quantifizierung der gewonnenen DNA ermöglicht. Die Quantifizierung wird mit Hilfe von Fluoreszenz-Messungen durchgeführt, die während eines Grundanforderung 13. Vorlesung 0Boldogkői Zsolt Tombácz Dóra © Technologisches Arsenal der Molekularbiologie - II PCR-Zyklus erfasst werden (daher der Name „Real Time“ = in wahrer Zeit). Die Fluoreszenz nimmt proportional mit der Menge der PCR-Produkte zu. Am Ende eines Laufs (der aus mehreren Zyklen besteht) wird anhand von erhaltenen Fluoreszenzsignalen die Quantifizierung in der exponentiellen Phase der PCR vorgenommen. Nur in der exponentiellen Phase der PCR (die wenige Zyklen in einem Lauf dauert) ist die korrekte Quantifizierung möglich, da während dieser Phase die optimalen Reaktionsbedingungen herrschen. Die einfachste Möglichkeit der Quantifizierung der PCR-Produkte ist die Nutzung von DNA-Farbstoffen (z.B. Ethidiumbromid oder SYBR Green I). Diese Fluoreszenzfarbstoffe lagern sich in die DNA ein (interkalieren) bzw. binden an die doppelsträngige DNA, wodurch die Fluoreszenz dieser Farbstoffe ansteigt. Die Zunahme der Target-DNA korreliert daher mit der Zunahme der Fluoreszenz von Zyklus zu Zyklus. Die Messung findet am Ende der Elongation in jedem Zyklus statt. Ein Nachteil dieses Verfahrens ist die geringe Spezifität, da zwischen verschiedenen PCR-Produkten nicht unterschieden werden kann. Auβerdem können keine Multiplex-Messungen durchgeführt werden. Den ersten Nachteil kann man mit der Ausnutzung von FRET (Fluorescence Resonance Energy Transfer) ausgleichen. Ein Donor-Fluorochrom (Reporter - im Zusammenhang mit TaqMan Sonden), das durch eine Lichtquelle angeregt wird, gibt einen Teil seiner Energie an ein in ausreichender Nähe befindliches Akzeptor-Fluorochrom (Quencher - im Zusammenhang mit TaqMan Sonden) ab. Nimmt der Abstand zwischen Akzeptor und Donor zu, so nimmt FRET und somit das Fluoreszenzsignal des Akzeptors ab, während das des Donors zunimmt. Eine häufig genutzte Möglichkeit des FRET besteht in der Anwendung einer Sonde, die an ihrem einen Ende mit dem Quencher, an ihrem anderen Ende mit einem Reporter-Fluoreszenzfarbstoff (z.B. TAMRA) markiert wird (TaqManSonde). Wenn die Taq-Polymerase, die zusätzlich zur Polymeraseaktivität eine 5'-3'-Exonuklease-Aktivität besitzt, die Sonde während der Synthese des Gegenstranges am 5'-Ende abbaut, entfernen sich dadurch Quencher und Fluorophor voneinander, und eine steigende Reporter-Fluoreszenz kann gemessen werden. Die Messung findet am Ende der Elongation in jedem Zyklus statt (siehe Abbildung im Material des Praktikumseminars). Real-Time PCR kann z.B. für die Detektierung von SNPs und Untersuchung der Genexpression verwendet werden. Real-time vs. End-Point PCR: bei herkömmlicher PCR besteht die Möglichkeit für Auswertung im Gel nur nach dem Ende der Reaktion, so können wir nur eine Endpunktanalyse (endpoint) durchführen. Im Fall von Real-Time PCR besteht die Möglichkeit, Informationen über die Produkte zu bekommen, die während den ersten Zyklen gebildet werden, weil die fluoreszenten Signale von allen Proben in allen Zyklen der Reaktion zu numerischen Werten konvertiert werden. Grundanforderung 13. Vorlesung 0Boldogkői Zsolt Tombácz Dóra ©