Neue PCR-Technologien für alte DNA

Werbung
491_549_BIOsp_0510.qxd
19.08.2010
7:51 Uhr
Seite 531
531
Multiplex-PCR
Neue PCR-Technologien
für alte DNA
MICHAEL KNAPP 1 , KNUT FINSTERMEIER 2 , SUSANNE HORN 2 , MATHIAS STILLER 3 , MICHAEL HOFREITER 4
1 ALLAN WILSON CENTRE FOR MOLECULAR ECOLOGY AND EVOLUTION, UNIVERSITY OF OTAGO, DUNEDIN, NEUSEELAND
2 ABTEILUNG FÜR EVOLUTIONÄRE GENETIK, MAX-PLANCK-INSTITUT FÜR EVOLUTIONÄRE ANTHROPOLOGIE, LEIPZIG
3 DEPARTMENT OF BIOLOGY, PENNSYLVANIA STATE UNIVERSITY, PA, USA
4 DEPARTMENT OF BIOLOGY, THE UNIVERSITY OF YORK, UK
Die PCR war für mehr als 20 Jahre das wichtigste Werkzeug zur Erforschung alter DNA. Ihre Weiterentwicklung sowie die Einführung alternativer Techniken ermöglichte den Sprung der Erforschung alter DNA ins
Zeitalter des Next Generation Sequencing.
For more than 20 years, PCR was the most important tool in ancient DNA
research. New PCR variants as well as the introduction of alternative
techniques enabled ancient DNA research to leap into the age of „Next
Generation Sequencing“.
ó Für die Erforschung alter DNA kann die
Bedeutung der Polymerasekettenreaktion
(PCR) (Abb. 1, [1]) kaum hoch genug eingeschätzt werden. Aufgrund der meist geringen
Konzentration von endogenen Zielmolekülen
in DNA-Extrakten aus subfossilen Tier- und
Pflanzenresten ist eine Vervielfältigung der
Ziel-DNA Grundvoraussetzung für weiterführende Analysen.
Sequenzierung definierter Genomabschnitte mithilfe der PCR
Wie in vielen Bereichen der Genetik wird
auch in der Erforschung alter DNA die PCR
verwendet, um bestimmte Genomabschnitte
zu vervielfältigen und dann nach der von Sanger entwickelten Methode zu sequenzieren
(Abb. 2A, [2]). Dabei ergeben sich allerdings
verschiedene Probleme, die vor allem auf den
stark degradierten Zustand und die geringen
Mengen an endogener alter DNA zurückzuführen sind. DNA-Moleküle beginnen sofort
nach dem Tod eines Organismus, in kleinere
Bruchstücke zu zerfallen. Deshalb enthalten
DNA-Extrakte aus eiszeitlichen (mehr als
10.000 Jahre alten) Proben, z. B. von Mammuts [3] oder Neandertalern [4], selten endogene Moleküle von mehr als 100 bis 150
Basenpaaren Länge. PCR-Amplifikationen von
größerer Länge sind selten erfolgreich und
mehrere, überlappende PCRs sind nötig, um
längere Genomregionen zu vervielfältigen.
¯ Abb. 1: Einzelamplifikation (ePCR): doppelsträngiges DNA-Molekül (a) wird denaturiert (b),
danach werden Primer angelagert (c). Eine Polymerase synthetisiert einen neuen DNA-Strang
auf der Grundlage eines vorhandenen DNAStrangs (d), dies ergibt zwei identische Kopien
des ursprünglichen DNA-Moleküls (e).
BIOspektrum | 05.10 | 16. Jahrgang
491_549_BIOsp_0510.qxd
532
19.08.2010
7:51 Uhr
Seite 532
W I S S E N SCH AFT · S P E C I A L : P C R
A
B
C
E
D
˚ Abb. 2: PCR-Evolution. A, Einzelamplifikation (ePCR) mit Sanger-Sequenzierung: DNA-Zielregionen werden in separaten PCRs vervielfältigt und dann einzeln nach der Methode von Sanger
sequenziert. B, Zwei-Schritt-Multiplex-PCR (mPCR) und Sanger-Sequenzierung: Zahlreiche nichtüberlappende DNA-Zielregionen werden gemeinsam vervielfältigt. Danach dient das MultiplexPCR-Produkt als Startmaterial für die Einzelamplifikation und Sanger-Sequenzierung der in ihm
enthaltenen Amplikons. C, Zwei-Schritt-Multiplex-PCR und Next Generation Sequencing (NGS):
Wie B, aber die Amplikons werden nach der Einzelamplifikation in äquimolarem Verhältnis
gemischt und gemeinsam auf einer NGS-Plattform sequenziert. D, Multiplex-PCR und direktes
Next Generation Sequencing (DMPS): Das Multiplex-PCR-Produkt wird direkt auf einer NGS-Plattform sequenziert. E, Vergleich verschiedener Sequenzierstrategien. Weitere Erklärungen im Text.
Aufgrund der oft geringen DNA-Konzentration in solchen Extrakten besteht ferner die
Gefahr, dass eine Amplifikation von einem
einzigen, in vielen Fällen beschädigten, Molekül ausgeht. Um die dadurch entstehenden
Sequenzierfehler zu identifizieren und ggf.
zu korrigieren, sollte jede PCR mindestens
zweimal durchgeführt und die Sequenzdaten
auf Konsistenz überprüft werden. Oft stehen
aber nur wenige, wertvolle Milligramm Knochen, Zahn oder Gewebereste für die DNAExtraktion zur Verfügung. Daher ist die Menge der vorhandenen alten DNA häufig ein
limitierender Faktor, der die Anzahl der möglichen PCRs und somit die maximale Länge
der analysierbaren Genomregion begrenzt.
Multiplex-PCR und
Sanger-Sequenzierung
Um trotz geringer DNA-Mengen möglichst viele oder insgesamt möglichst lange Genomregionen vervielfältigen zu können, wurde die
zweistufige Multiplex-PCR (mPCR) entwickelt
[5]. Statt in jeder PCR nur ein einziges Primerpaar einzusetzen, werden im ersten
Schritt zahlreiche Primerpaare in derselben
PCR verwendet, wobei die mPCR nicht mehr
Ausgangs-DNA als eine gewöhnliche PCR
benötigt. Allerdings dürfen die verschiedenen Amplikons in einer Reaktion nicht überlappen, da die bevorzugte Amplifikation kurzer Fragmente in der PCR zu einer starken
Vervielfältigung der kurzen Überlappungsregionen zwischen Amplikons führen würde.
Die mPCR erlaubt also lange, zusammenhängende Genomregionen wie beispielsweise
das mitochondriale Genom in nur zwei PCRs
zu vervielfältigen, auch wenn die AusgangsDNA stark fragmentiert ist. In einem zweiten
Schritt werden die Produkte der mPCR als
Startmaterial für weitere Einzelamplifikationen und der späteren Sequenzierung der
in ihnen enthaltenen Amplikons genutzt
(Abb. 2B).
Multiplex-PCR und Next Generation
Sequencing
Die Einführung von Next Generation Sequencing(NGS)-Technologien im Jahre 2005 hat
seitdem zu einer Revolution der Genetik
geführt [6]. Diese neuen DNA-Sequenziertechnologien zeichnen sich durch enorm
hohen Durchsatz bei relativ geringer Leselänge aus. So ermöglichen z. B. die zur
Sequenzierung des Neandertaler-Genoms
verwendeten Instrumente der Firmen Roche
und Illumina [7] die Sequenzierung von bis
zu 600 Millionen Basenpaaren bei 400 Basenpaaren durchschnittlicher Leselänge
(Roche) bzw. 50 Milliarden Basenpaaren bei
2 x 100 Basenpaaren Leselänge (Illumina).
Die kurze Leselänge und die große Datenmenge bilden ideale Voraussetzungen für die
Sequenzierung fragmentierter alter DNA.
Zudem lassen sich mPCR-Ansätze problemlos mit NGS-Verfahren kombinieren. Statt
jedes einzelne Amplikon getrennt zu sequenzieren, wie dies bei der traditionellen Sanger-Sequenzierung der Fall wäre, können die
Amplikons nach dem zweiten Schritt der
mPCR in äquimolarem Verhältnis gemischt
und anschließend in eine einzige Sequenzierbibliothek umgewandelt werden (Abb.
2C). Aufgrund des enormen Durchsatzes der
NGS-Technologien ermöglicht es diese Strategie, kostengünstig zahlreiche Amplikons
gleichzeitig zu sequenzieren und so große
Sequenzdatenmengen in kurzer Zeit zu
erzeugen. Ferner ist es auch möglich, Amplikons von unterschiedlichen Proben mit individuellen, künstlich erzeugten, kurzen Oligonukleotiden zu kennzeichnen und anschließend parallel zu sequenzieren [8].
Somit wird eine optimale Ausnutzung der
Kapazität des jeweiligen Sequenzierinstruments gewährleistet.
Direkte Sequenzierung von
Multiplex-PCR-Produkten
Wenn größere genomische Bereiche von
mehreren Individuen, z. B. im Rahmen einer
Populationsstudie, sequenziert werden sollen, stößt die klassische zweistufige mPCR
schnell an ihre ökonomischen Grenzen.
Durch die Vielzahl an Einzelamplifikationen
im zweiten Schritt nach der eigentlichen
mPCR wird die praktische Umsetzung des
Protokolls im Labor schnell äußerst aufwendig. Da im ersten (Multiplex-)Schritt bereits
alle Zielfragmente simultan amplifiziert werden, verzichtet die direkte Multiplex-Sequenzierung (DMPS) gänzlich auf die Einzelamplifikationen (Abb. 2D, [9]). Dies bedeutet
eine erhebliche Zeitersparnis (Abb. 2E)
sowie eine Reduzierung der Amplifikationskosten. Ein Nachteil der DMPS liegt in der
unterschiedlichen Effizienz einzelner Primerpaare, wodurch es zu einer starken
BIOspektrum | 05.10 | 16. Jahrgang
491_549_BIOsp_0510.qxd
534
19.08.2010
7:51 Uhr
Seite 534
W I S S E N SCH AFT · S P E C I A L : P C R
A
B
˚ Abb. 3: Capture-Anreicherungsverfahren: Ziel-DNA (blau) bindet an Sonden (rot) zur Abtrennung unerwünschter DNA (grau). A, Sonden an Array gebunden. B, Sonden an magnetisches
Kügelchen (Bead) gebunden.
Ungleichverteilung der Amplikons am Ende
der mPCR kommen kann. Um dieser
Ungleichverteilung entgegenzuwirken, wird
die Zahl der PCR-Zyklen in der mPCR auf
20 bis 25 reduziert. So kann die Anzahl der
amplifizierten Zielfragmente über das
Niveau exogener und endogener Nicht-ZielDNA gehoben werden und gleichzeitig ihre
Ungleichverteilung minimiert werden. Nach
der Amplifikation werden die mPCR-Produkte direkt in Sequenzierbibliotheken
umgewandelt. Um die gemeinsame Sequenzierung von mPCR-Produkten unterschiedlicher Herkunft zu ermöglichen, wurde das
klassische Protokoll zur Erstellung von
Sequenzierbibliotheken [9] mit einer Methode zur molekularen Markierung von DNAMolekülen kombiniert. Je nach gewünschter
Sequenziertiefe können damit beliebig viele individuell markierte Multiplex-PCRAnsätze gemeinsam und kosteneffizient auf
einer der NGS-Plattformen sequenziert werden. DMPS kombiniert PCR-Sensitivität mit
einem effizienten Protokoll zur Erstellung
molekular markierter Sequenzierbibliotheken und ermöglicht damit große, homologe
Sequenzbereiche von einer Vielzahl subfossiler oder rezenter Proben zeit- und kostengünstig zu sequenzieren.
DNA-capture-Methoden
Seit Kurzem findet eine andere Strategie zur
Anreicherung von Zielmolekülen für die DNAoder RNA-Sequenzierung große Aufmerk-
samkeit: Hybridisierung und capture [10].
Hybridisierungen sind hocheffizient wenn
große Zielregionen, oft Kilo- oder Megabasen,
aus genomischer DNA angereichert werden
sollen. Die Herstellung von Sequenzierbibliotheken aus genomischer DNA anstelle von
PCR-Produkten und die Hybridisierung an
entsprechende DNA-Sonden sind die grundlegenden Prinzipien dieser Methoden. Die
Sonden repräsentieren die gewünschte Zielregion und bestehen aus kurzen (60 Basenpaare) oder längeren, meist synthetischen
Oligonukleotiden. Die Zielmoleküle werden
über ihre Bindung an die Sonden selektiert,
während nicht hybridisierte Moleküle der
Sequenzierbibliothek durch Waschschritte
entfernt werden. Die Sonden sind bei diesem
capture-Schritt oft physisch fixiert, z. B. über
kovalente Bindung an die Glasoberfläche
eines Arrays (Abb. 3A) oder über Biotin-Streptavidin-Bindung an kleine magnetische Kügelchen (Abb. 3B).
Hybridisierung und capture-Methoden
haben einige Vorteile, besonders im Forschungsfeld der alten DNA. Zunächst sind sie
weniger verunreinigungsanfällig: Lange,
moderne DNA-Moleküle, die in der PCR bevorzugt amplifiziert werden, werden bei der Herstellung einer Sequenzierbibliothek nicht
bevorzugt. Ferner können individuelle Moleküle aufgrund ihrer Anfangs- und Endkoordinaten relativ zu einem Referenzgenom identifiziert werden [11]. So kann ausgeschlossen
werden, dass die Sequenzdaten von einem
einzigen, potenziell chemisch veränderten
Molekül stammen. Folglich sind keine Replikate der Ansätze nötig. Auch beeinträchtigen
Unterschiede zwischen Sonde und Zielmolekül die Effizienz der Anreicherung weniger
stark, als dies bei Unterschieden zwischen
Primern und Primerbindungsstellen in der
PCR der Fall ist, da die Sonden länger als konventionelle PCR-Primer sind.
Die PCR bleibt jedoch nach wie vor ein
wichtiges Werkzeug innerhalb der Hybridisierungs- und capture-Protokolle. So müssen
NGS-Bibliotheken nach der Hybridisierung
in der Regel mithilfe von PCR amplifiziert
werden, um genügend Material für die
Sequenzierung zu erzeugen. Auch die Herstellung der Sonden kann mittels long-rangeoder herkömmlicher PCR im eigenen Labor
durchgeführt werden [12]. Und schließlich
kann die individuelle molekulare Markierung
von Sequenzierbibliotheken vor der Durchführung von Hybridisierungs- und captureExperimenten mithilfe der PCR erfolgen.
Zusammenfassung und Ausblick
Die PCR ist nicht nur ein Standardwerkzeug
im Bereich der Forschung an alter DNA, sondern findet auch eine breite Palette von neuen Anwendungen im Bereich des NGS. Trotz
der Entwicklung alternativer Techniken zur
Anreicherung von Zielsequenzen bleibt die
PCR auch nach mehr als 20 Jahren ein unersetzlicher Bestandteil der Erforschung alter
DNA.
Danksagung
Wir danken dem Allan Wilson Centre for
Molecular Ecology and Evolution, der MaxPlanck-Gesellschaft, der VolkswagenStiftung,
der Pennsylvania State University und der
University of York für finanzielle Unterstützung.
ó
Literatur
[1] Saiki RK, Gelfand DH, Stoffel S et al. (1988) Primer-directed enzymatic amplification of DNA with a thermostable DNApolymerase. Science 239:487–491
[2] Sanger F, Nicklen S, Coulson AR (1977) DNA sequencing
with chain-terminating inhibitors. Proc Natl Acad Sci USA
74:5463–5467
[3] Miller W, Drautz DI, Ratan A et al. (2008) Sequencing the
nuclear genome of the extinct woolly mammoth. Nature
456:387–390
[4] Briggs AW, Good JM, Green RE et al. (2009) Targeted
retrieval and analysis of five Neandertal mtDNA genomes.
Science 325:318–321
[5] Krause J, Dear PH, Pollack JL et al. (2006) Multiplex
amplification of the mammoth mitochondrial genome and the
evolution of Elephantidae. Nature 439:724–727
[6] Margulies M, Egholm M, Altman WE et al. (2005) Genome
sequencing in microfabricated high-density picolitre reactors.
Nature 437:376–380
[7] Green RE, Krause J, Briggs AW et al. (2010) A draft
sequence of the Neandertal genome. Science 328:710–722
BIOspektrum | 05.10 | 16. Jahrgang
491_549_BIOsp_0510.qxd
19.08.2010
7:51 Uhr
Seite 535
535
[8] Meyer M, Stenzel U, Hofreiter M (2008) Parallel tagged
sequencing on the 454 platform. Nat Protoc 3:267–278
[9] Stiller M, Knapp M, Stenzel U et al. (2009) Direct multiplex sequencing (DMPS) – a novel method for targeted highthroughput sequencing of ancient and highly degraded DNA.
Genome Res 19:1843–1848
[10] Mamanova L, Coffey AJ, Scott CE et al. (2010) Targetenrichment strategies for next-generation sequencing. Nat
Methods 7:111–118
[11] Prüfer K, Stenzel U, Hofreiter M et al. (2010)
Computational challenges in the analysis of ancient DNA.
Genome Biol 11:47
[12] Noonan JP, Coop G, Kudaravalli S et al. (2006)
Sequencing and analysis of Neanderthal genomic DNA.
Science 314:1113–1118
Korrespondenzadresse:
Michael Knapp, PhD (Massey University)
University of Otago
Department of Anatomy and Structural Biology
270 Great King Street
Dunedin 9016, Neuseeland
Tel.: +64-(0)3-479-4376
Fax: +64-(0)3-479-7254
[email protected]
BIOspektrum | 05.10 | 16. Jahrgang
AUTOREN
Michael Knapp, Knut Finstermeier, Susanne Horn, Mathias Stiller und Michael Hofreiter (v. l. n. r)
Die Autoren arbeiteten 2005–2010 gemeinsam in der Max-Planck-Nachwuchsgruppe Molekulare Ökologie am Max-Planck-Institut für evolutionäre Anthropologie in Leipzig. Hauptziel ihrer Forschung ist die Anwendung alter DNA auf verschiedene evolutionäre Fragestellungen. Dazu zählen die Verwandtschaftsverhältnisse ausgestorbener Arten zu ihren lebenden Verwandten, die Veränderung genetischer Diversität
über Zeiträume von mehreren Zehntausenden von Jahren sowie die genetischen Grundlagen für phänotypische Unterschiede zwischen Arten.
Herunterladen