491_549_BIOsp_0510.qxd 19.08.2010 7:51 Uhr Seite 531 531 Multiplex-PCR Neue PCR-Technologien für alte DNA MICHAEL KNAPP 1 , KNUT FINSTERMEIER 2 , SUSANNE HORN 2 , MATHIAS STILLER 3 , MICHAEL HOFREITER 4 1 ALLAN WILSON CENTRE FOR MOLECULAR ECOLOGY AND EVOLUTION, UNIVERSITY OF OTAGO, DUNEDIN, NEUSEELAND 2 ABTEILUNG FÜR EVOLUTIONÄRE GENETIK, MAX-PLANCK-INSTITUT FÜR EVOLUTIONÄRE ANTHROPOLOGIE, LEIPZIG 3 DEPARTMENT OF BIOLOGY, PENNSYLVANIA STATE UNIVERSITY, PA, USA 4 DEPARTMENT OF BIOLOGY, THE UNIVERSITY OF YORK, UK Die PCR war für mehr als 20 Jahre das wichtigste Werkzeug zur Erforschung alter DNA. Ihre Weiterentwicklung sowie die Einführung alternativer Techniken ermöglichte den Sprung der Erforschung alter DNA ins Zeitalter des Next Generation Sequencing. For more than 20 years, PCR was the most important tool in ancient DNA research. New PCR variants as well as the introduction of alternative techniques enabled ancient DNA research to leap into the age of „Next Generation Sequencing“. ó Für die Erforschung alter DNA kann die Bedeutung der Polymerasekettenreaktion (PCR) (Abb. 1, [1]) kaum hoch genug eingeschätzt werden. Aufgrund der meist geringen Konzentration von endogenen Zielmolekülen in DNA-Extrakten aus subfossilen Tier- und Pflanzenresten ist eine Vervielfältigung der Ziel-DNA Grundvoraussetzung für weiterführende Analysen. Sequenzierung definierter Genomabschnitte mithilfe der PCR Wie in vielen Bereichen der Genetik wird auch in der Erforschung alter DNA die PCR verwendet, um bestimmte Genomabschnitte zu vervielfältigen und dann nach der von Sanger entwickelten Methode zu sequenzieren (Abb. 2A, [2]). Dabei ergeben sich allerdings verschiedene Probleme, die vor allem auf den stark degradierten Zustand und die geringen Mengen an endogener alter DNA zurückzuführen sind. DNA-Moleküle beginnen sofort nach dem Tod eines Organismus, in kleinere Bruchstücke zu zerfallen. Deshalb enthalten DNA-Extrakte aus eiszeitlichen (mehr als 10.000 Jahre alten) Proben, z. B. von Mammuts [3] oder Neandertalern [4], selten endogene Moleküle von mehr als 100 bis 150 Basenpaaren Länge. PCR-Amplifikationen von größerer Länge sind selten erfolgreich und mehrere, überlappende PCRs sind nötig, um längere Genomregionen zu vervielfältigen. ¯ Abb. 1: Einzelamplifikation (ePCR): doppelsträngiges DNA-Molekül (a) wird denaturiert (b), danach werden Primer angelagert (c). Eine Polymerase synthetisiert einen neuen DNA-Strang auf der Grundlage eines vorhandenen DNAStrangs (d), dies ergibt zwei identische Kopien des ursprünglichen DNA-Moleküls (e). BIOspektrum | 05.10 | 16. Jahrgang 491_549_BIOsp_0510.qxd 532 19.08.2010 7:51 Uhr Seite 532 W I S S E N SCH AFT · S P E C I A L : P C R A B C E D ˚ Abb. 2: PCR-Evolution. A, Einzelamplifikation (ePCR) mit Sanger-Sequenzierung: DNA-Zielregionen werden in separaten PCRs vervielfältigt und dann einzeln nach der Methode von Sanger sequenziert. B, Zwei-Schritt-Multiplex-PCR (mPCR) und Sanger-Sequenzierung: Zahlreiche nichtüberlappende DNA-Zielregionen werden gemeinsam vervielfältigt. Danach dient das MultiplexPCR-Produkt als Startmaterial für die Einzelamplifikation und Sanger-Sequenzierung der in ihm enthaltenen Amplikons. C, Zwei-Schritt-Multiplex-PCR und Next Generation Sequencing (NGS): Wie B, aber die Amplikons werden nach der Einzelamplifikation in äquimolarem Verhältnis gemischt und gemeinsam auf einer NGS-Plattform sequenziert. D, Multiplex-PCR und direktes Next Generation Sequencing (DMPS): Das Multiplex-PCR-Produkt wird direkt auf einer NGS-Plattform sequenziert. E, Vergleich verschiedener Sequenzierstrategien. Weitere Erklärungen im Text. Aufgrund der oft geringen DNA-Konzentration in solchen Extrakten besteht ferner die Gefahr, dass eine Amplifikation von einem einzigen, in vielen Fällen beschädigten, Molekül ausgeht. Um die dadurch entstehenden Sequenzierfehler zu identifizieren und ggf. zu korrigieren, sollte jede PCR mindestens zweimal durchgeführt und die Sequenzdaten auf Konsistenz überprüft werden. Oft stehen aber nur wenige, wertvolle Milligramm Knochen, Zahn oder Gewebereste für die DNAExtraktion zur Verfügung. Daher ist die Menge der vorhandenen alten DNA häufig ein limitierender Faktor, der die Anzahl der möglichen PCRs und somit die maximale Länge der analysierbaren Genomregion begrenzt. Multiplex-PCR und Sanger-Sequenzierung Um trotz geringer DNA-Mengen möglichst viele oder insgesamt möglichst lange Genomregionen vervielfältigen zu können, wurde die zweistufige Multiplex-PCR (mPCR) entwickelt [5]. Statt in jeder PCR nur ein einziges Primerpaar einzusetzen, werden im ersten Schritt zahlreiche Primerpaare in derselben PCR verwendet, wobei die mPCR nicht mehr Ausgangs-DNA als eine gewöhnliche PCR benötigt. Allerdings dürfen die verschiedenen Amplikons in einer Reaktion nicht überlappen, da die bevorzugte Amplifikation kurzer Fragmente in der PCR zu einer starken Vervielfältigung der kurzen Überlappungsregionen zwischen Amplikons führen würde. Die mPCR erlaubt also lange, zusammenhängende Genomregionen wie beispielsweise das mitochondriale Genom in nur zwei PCRs zu vervielfältigen, auch wenn die AusgangsDNA stark fragmentiert ist. In einem zweiten Schritt werden die Produkte der mPCR als Startmaterial für weitere Einzelamplifikationen und der späteren Sequenzierung der in ihnen enthaltenen Amplikons genutzt (Abb. 2B). Multiplex-PCR und Next Generation Sequencing Die Einführung von Next Generation Sequencing(NGS)-Technologien im Jahre 2005 hat seitdem zu einer Revolution der Genetik geführt [6]. Diese neuen DNA-Sequenziertechnologien zeichnen sich durch enorm hohen Durchsatz bei relativ geringer Leselänge aus. So ermöglichen z. B. die zur Sequenzierung des Neandertaler-Genoms verwendeten Instrumente der Firmen Roche und Illumina [7] die Sequenzierung von bis zu 600 Millionen Basenpaaren bei 400 Basenpaaren durchschnittlicher Leselänge (Roche) bzw. 50 Milliarden Basenpaaren bei 2 x 100 Basenpaaren Leselänge (Illumina). Die kurze Leselänge und die große Datenmenge bilden ideale Voraussetzungen für die Sequenzierung fragmentierter alter DNA. Zudem lassen sich mPCR-Ansätze problemlos mit NGS-Verfahren kombinieren. Statt jedes einzelne Amplikon getrennt zu sequenzieren, wie dies bei der traditionellen Sanger-Sequenzierung der Fall wäre, können die Amplikons nach dem zweiten Schritt der mPCR in äquimolarem Verhältnis gemischt und anschließend in eine einzige Sequenzierbibliothek umgewandelt werden (Abb. 2C). Aufgrund des enormen Durchsatzes der NGS-Technologien ermöglicht es diese Strategie, kostengünstig zahlreiche Amplikons gleichzeitig zu sequenzieren und so große Sequenzdatenmengen in kurzer Zeit zu erzeugen. Ferner ist es auch möglich, Amplikons von unterschiedlichen Proben mit individuellen, künstlich erzeugten, kurzen Oligonukleotiden zu kennzeichnen und anschließend parallel zu sequenzieren [8]. Somit wird eine optimale Ausnutzung der Kapazität des jeweiligen Sequenzierinstruments gewährleistet. Direkte Sequenzierung von Multiplex-PCR-Produkten Wenn größere genomische Bereiche von mehreren Individuen, z. B. im Rahmen einer Populationsstudie, sequenziert werden sollen, stößt die klassische zweistufige mPCR schnell an ihre ökonomischen Grenzen. Durch die Vielzahl an Einzelamplifikationen im zweiten Schritt nach der eigentlichen mPCR wird die praktische Umsetzung des Protokolls im Labor schnell äußerst aufwendig. Da im ersten (Multiplex-)Schritt bereits alle Zielfragmente simultan amplifiziert werden, verzichtet die direkte Multiplex-Sequenzierung (DMPS) gänzlich auf die Einzelamplifikationen (Abb. 2D, [9]). Dies bedeutet eine erhebliche Zeitersparnis (Abb. 2E) sowie eine Reduzierung der Amplifikationskosten. Ein Nachteil der DMPS liegt in der unterschiedlichen Effizienz einzelner Primerpaare, wodurch es zu einer starken BIOspektrum | 05.10 | 16. Jahrgang 491_549_BIOsp_0510.qxd 534 19.08.2010 7:51 Uhr Seite 534 W I S S E N SCH AFT · S P E C I A L : P C R A B ˚ Abb. 3: Capture-Anreicherungsverfahren: Ziel-DNA (blau) bindet an Sonden (rot) zur Abtrennung unerwünschter DNA (grau). A, Sonden an Array gebunden. B, Sonden an magnetisches Kügelchen (Bead) gebunden. Ungleichverteilung der Amplikons am Ende der mPCR kommen kann. Um dieser Ungleichverteilung entgegenzuwirken, wird die Zahl der PCR-Zyklen in der mPCR auf 20 bis 25 reduziert. So kann die Anzahl der amplifizierten Zielfragmente über das Niveau exogener und endogener Nicht-ZielDNA gehoben werden und gleichzeitig ihre Ungleichverteilung minimiert werden. Nach der Amplifikation werden die mPCR-Produkte direkt in Sequenzierbibliotheken umgewandelt. Um die gemeinsame Sequenzierung von mPCR-Produkten unterschiedlicher Herkunft zu ermöglichen, wurde das klassische Protokoll zur Erstellung von Sequenzierbibliotheken [9] mit einer Methode zur molekularen Markierung von DNAMolekülen kombiniert. Je nach gewünschter Sequenziertiefe können damit beliebig viele individuell markierte Multiplex-PCRAnsätze gemeinsam und kosteneffizient auf einer der NGS-Plattformen sequenziert werden. DMPS kombiniert PCR-Sensitivität mit einem effizienten Protokoll zur Erstellung molekular markierter Sequenzierbibliotheken und ermöglicht damit große, homologe Sequenzbereiche von einer Vielzahl subfossiler oder rezenter Proben zeit- und kostengünstig zu sequenzieren. DNA-capture-Methoden Seit Kurzem findet eine andere Strategie zur Anreicherung von Zielmolekülen für die DNAoder RNA-Sequenzierung große Aufmerk- samkeit: Hybridisierung und capture [10]. Hybridisierungen sind hocheffizient wenn große Zielregionen, oft Kilo- oder Megabasen, aus genomischer DNA angereichert werden sollen. Die Herstellung von Sequenzierbibliotheken aus genomischer DNA anstelle von PCR-Produkten und die Hybridisierung an entsprechende DNA-Sonden sind die grundlegenden Prinzipien dieser Methoden. Die Sonden repräsentieren die gewünschte Zielregion und bestehen aus kurzen (60 Basenpaare) oder längeren, meist synthetischen Oligonukleotiden. Die Zielmoleküle werden über ihre Bindung an die Sonden selektiert, während nicht hybridisierte Moleküle der Sequenzierbibliothek durch Waschschritte entfernt werden. Die Sonden sind bei diesem capture-Schritt oft physisch fixiert, z. B. über kovalente Bindung an die Glasoberfläche eines Arrays (Abb. 3A) oder über Biotin-Streptavidin-Bindung an kleine magnetische Kügelchen (Abb. 3B). Hybridisierung und capture-Methoden haben einige Vorteile, besonders im Forschungsfeld der alten DNA. Zunächst sind sie weniger verunreinigungsanfällig: Lange, moderne DNA-Moleküle, die in der PCR bevorzugt amplifiziert werden, werden bei der Herstellung einer Sequenzierbibliothek nicht bevorzugt. Ferner können individuelle Moleküle aufgrund ihrer Anfangs- und Endkoordinaten relativ zu einem Referenzgenom identifiziert werden [11]. So kann ausgeschlossen werden, dass die Sequenzdaten von einem einzigen, potenziell chemisch veränderten Molekül stammen. Folglich sind keine Replikate der Ansätze nötig. Auch beeinträchtigen Unterschiede zwischen Sonde und Zielmolekül die Effizienz der Anreicherung weniger stark, als dies bei Unterschieden zwischen Primern und Primerbindungsstellen in der PCR der Fall ist, da die Sonden länger als konventionelle PCR-Primer sind. Die PCR bleibt jedoch nach wie vor ein wichtiges Werkzeug innerhalb der Hybridisierungs- und capture-Protokolle. So müssen NGS-Bibliotheken nach der Hybridisierung in der Regel mithilfe von PCR amplifiziert werden, um genügend Material für die Sequenzierung zu erzeugen. Auch die Herstellung der Sonden kann mittels long-rangeoder herkömmlicher PCR im eigenen Labor durchgeführt werden [12]. Und schließlich kann die individuelle molekulare Markierung von Sequenzierbibliotheken vor der Durchführung von Hybridisierungs- und captureExperimenten mithilfe der PCR erfolgen. Zusammenfassung und Ausblick Die PCR ist nicht nur ein Standardwerkzeug im Bereich der Forschung an alter DNA, sondern findet auch eine breite Palette von neuen Anwendungen im Bereich des NGS. Trotz der Entwicklung alternativer Techniken zur Anreicherung von Zielsequenzen bleibt die PCR auch nach mehr als 20 Jahren ein unersetzlicher Bestandteil der Erforschung alter DNA. Danksagung Wir danken dem Allan Wilson Centre for Molecular Ecology and Evolution, der MaxPlanck-Gesellschaft, der VolkswagenStiftung, der Pennsylvania State University und der University of York für finanzielle Unterstützung. ó Literatur [1] Saiki RK, Gelfand DH, Stoffel S et al. (1988) Primer-directed enzymatic amplification of DNA with a thermostable DNApolymerase. Science 239:487–491 [2] Sanger F, Nicklen S, Coulson AR (1977) DNA sequencing with chain-terminating inhibitors. Proc Natl Acad Sci USA 74:5463–5467 [3] Miller W, Drautz DI, Ratan A et al. (2008) Sequencing the nuclear genome of the extinct woolly mammoth. Nature 456:387–390 [4] Briggs AW, Good JM, Green RE et al. (2009) Targeted retrieval and analysis of five Neandertal mtDNA genomes. Science 325:318–321 [5] Krause J, Dear PH, Pollack JL et al. (2006) Multiplex amplification of the mammoth mitochondrial genome and the evolution of Elephantidae. Nature 439:724–727 [6] Margulies M, Egholm M, Altman WE et al. (2005) Genome sequencing in microfabricated high-density picolitre reactors. Nature 437:376–380 [7] Green RE, Krause J, Briggs AW et al. (2010) A draft sequence of the Neandertal genome. Science 328:710–722 BIOspektrum | 05.10 | 16. Jahrgang 491_549_BIOsp_0510.qxd 19.08.2010 7:51 Uhr Seite 535 535 [8] Meyer M, Stenzel U, Hofreiter M (2008) Parallel tagged sequencing on the 454 platform. Nat Protoc 3:267–278 [9] Stiller M, Knapp M, Stenzel U et al. (2009) Direct multiplex sequencing (DMPS) – a novel method for targeted highthroughput sequencing of ancient and highly degraded DNA. Genome Res 19:1843–1848 [10] Mamanova L, Coffey AJ, Scott CE et al. (2010) Targetenrichment strategies for next-generation sequencing. Nat Methods 7:111–118 [11] Prüfer K, Stenzel U, Hofreiter M et al. (2010) Computational challenges in the analysis of ancient DNA. Genome Biol 11:47 [12] Noonan JP, Coop G, Kudaravalli S et al. (2006) Sequencing and analysis of Neanderthal genomic DNA. Science 314:1113–1118 Korrespondenzadresse: Michael Knapp, PhD (Massey University) University of Otago Department of Anatomy and Structural Biology 270 Great King Street Dunedin 9016, Neuseeland Tel.: +64-(0)3-479-4376 Fax: +64-(0)3-479-7254 [email protected] BIOspektrum | 05.10 | 16. Jahrgang AUTOREN Michael Knapp, Knut Finstermeier, Susanne Horn, Mathias Stiller und Michael Hofreiter (v. l. n. r) Die Autoren arbeiteten 2005–2010 gemeinsam in der Max-Planck-Nachwuchsgruppe Molekulare Ökologie am Max-Planck-Institut für evolutionäre Anthropologie in Leipzig. Hauptziel ihrer Forschung ist die Anwendung alter DNA auf verschiedene evolutionäre Fragestellungen. Dazu zählen die Verwandtschaftsverhältnisse ausgestorbener Arten zu ihren lebenden Verwandten, die Veränderung genetischer Diversität über Zeiträume von mehreren Zehntausenden von Jahren sowie die genetischen Grundlagen für phänotypische Unterschiede zwischen Arten.