001_069_BIOsp_0110.qxd 56 29.01.2010 11:22 Uhr Seite 56 MET H ODE N & AN WE N DU NGEN DNA-Anreicherung Fangt uns doch: parallele HochdurchsatzSequenzierung EVA STERZEL FEBIT BIOMED GMBH, HEIDELBERG Verlässliches Barcoding von Proben unterstützt den Einzug von Hochdurchsatz-Sequenzierern in die Biomedizin und ermöglicht den Einsatz für statistisch aussagekräftige Studien. Reliable barcoding of samples paves the way for next-generation sequencing in modern biomedicine by providing statistically relevant data from large cohort studies. ó Es ist bereits seit vielen Jahren bekannt, dass Mutationen des Erbguts eines Individuums mit der Entstehung bestimmter Krankheiten korrelieren. Die Bedeutung, die das Wissen um eine solche Prädisposition für die Früherkennung insbesondere bei der Therapie von Krebserkrankungen hat, lässt viele Arbeitsgruppen nach solchen Mutationen 3 1 4 suchen. Stetig steigt die Zahl an Mutationen, die der Prädisposition bzw. Ursache für die verschiedensten Krankheiten zugeordnet werden können. Der Weg dieses Wissens in die RoutineDiagnostik ist beschwerlich und teuer, steht aber im Fokus moderner Technologien zur DNA-Analyse. Mit deren Hilfe sollen künftig Einzelnukleotidpolymorphismen (SNPs) und andere Mutationen der DNA als diagnostische Marker für verschiedene Krankheiten dienen und Einzug in den ärztlichen Alltag halten. Leistungsfähige Hochdurchsatzmaschinen ermöglichen Sequenzierungen zu deutlich günstigeren Preisen als noch vor zwei Jahren. Trotzdem, die hohen Kosten pro Patient, die enorme Datenflut und der gerin- 5 6 2 ˚ Abb. 1: Beim Barcoding werden die zu sequenzierenden DNA-Abschnitte jeder einzelnen Probe mit einer probenspezifischen Erkennungssequenz versehen (1–2). Anschließend können die Proben gemischt und gemeinsam auf den Biochip für HybSelect gegeben werden (3). Dort hybridisieren die gesuchten Fragmente aller Proben. Diese werden nach einem Waschschritt eluiert (4) und im Gemisch sequenziert (5). Die Zuordnung der Sequenzen zu den verschiedenen Proben erfolgt anschließend anhand der Barcoding-Sequenz (6). BIOspektrum | 01.10 | 16. Jahrgang 001_069_BIOsp_0110.qxd 29.01.2010 11:22 Uhr Seite 57 57 Durchschnittliche Abdeckung über 1.000 SNP-Regionen (500 bp) (500 kb Gesamtzielregion) ge Automatisierungsgrad waren bis vor Kurzem die Stolpersteine auf dem Weg zu statistisch relevanten Daten aus groß angelegten klinischen Studien [1]. Dies könnte sich nun ändern: Eine neue Technologie der Firma febit ermöglicht die Kombination von Barcoding in Zusammenhang mit gezielter Anreicherung für die anschließende Sequenzierung. Durchschnitt = 469fach ¯ Abb. 2: Gezielte Anreicherung von SNP-Regionen. 1.000 Regionen von je 500 Basenpaaren Länge mit je einem SNP wurden von einer HapMap-Referenzprobe mit HybSelect gezielt angereichert. Eine durchschnittlich 469fache Abdeckungstiefe wird erreicht. Barcoding Unter Barcoding versteht man eine probenspezifische Markierung [2]. Diese Markierung kann dazu verwendet werden, ein Gemisch aus verschiedenen Proben zu prozessieren und am Ende die Ergebnisse wieder den einzelnen Proben zuordnen zu können (Abb. 1). Die zu sequenzierende DNA wird dazu gemäß dem Protokoll des Sequenziergeräts aufbereitet und mit Adaptoren versehen. Diese Adaptoren dienten bisher zum einen der Amplifizierung vor der Sequenzierung und zum anderen als Erkennungszeichen beim Sequenzieren für den Beginn des jeweiligen DNA-Fragments. Beim Barcoding werden die Adaptoren um einen Sequenzabschnitt erweitert, der als Kennzeichnung für DNAFragmente einer bestimmten Probe, z. B. von einem bestimmten Patienten, dient. Die so gekennzeichneten Proben können nun als Gemisch im HybSelect-Verfahren (febit) angereichert werden [3, 4]: Ein Mikroarray-basierter Biochip dient als Filter für die gesuchten Sequenzen, die an entsprechende Fänger-Oligonukleotide hybridisieren. Das alles geschieht automatisch, und die DNA ist bereit für den Einsatz im Sequenziergerät, z. B. Illumina GAII und Life Technologies SOLiD 3, für die diese Technik bereits optimiert ist. Nach einem Waschschritt werden die Sequenzen eluiert und können nun im Sequenzierer entschlüsselt werden. Anhand der Barcoding-Sequenzen können alle sequenzierten Fragmente nun ihrer Ursprungsprobe zugeordnet und die Ergebnisse entsprechend analysiert werden. Bereits ohne das Barcoding ist es bei einfacher Nutzung des Geniom-Biochip möglich, 24 Proben in sechs Arbeitstagen gezielt anzureichern. Kürzlich konnte die Anwendung von 16 plex-Barcoding-Reagenzien auf dem SOLiD 3-Sequenziergerät gezeigt werden, die die parallele Sequenzierung von 16 Proben in einem einzigen Sequenzierlauf ermöglichen. Damit können in sechs Arbeitstagen 384 Proben angereichert werden. BIOspektrum | 01.10 | 16. Jahrgang SNP-Regionen (n = 1.000) Hohe Abdeckungsraten Hohe Abdeckungsraten bei der Anreicherungstechnologie sind der ausschlaggebende Faktor für den Erfolg bei Multiplex-Sequenzierungen. Werden nicht ausreichend viele Kopien aus jeder Probe für jedes gesuchte Gen angereichert, ist eine Zuordnung im Anschluss an die Sequenzierung nicht zuverlässig möglich. Die nötige coverage für eine erfolgreiche Anreicherung wird in der Praxis mit etwa 20 Kopien pro Genabschnitt angegeben [5]. Bei parallelen Sequenzierungen mit mehreren Proben sollte die Abdeckung höher liegen. Solche „ertragreichen“ Anreicherungen gelingen am besten, wenn die Voraussetzungen für die Hybridisierung optimal sind, das heißt vor allem optimierte Fängersonden und konstante Reaktionsbedingungen. Die mikrofluidischen Kanäle von unserem Biochip haben sich hierfür als optimal erwiesen und führen mit dem ausgereiften tiling zu höchsten Abdeckungsraten. Dieser Vorteil hat sich insbesondere bei der Untersuchung von Einzelnukleotidpolymorphismen (SNPs) gezeigt. Um das zu belegen, wurde eine HapMap-Referenzprobe mit HybSelect gezielt angereichert [6]. Gesucht wurden 1.000 Regionen von je 500 Basenpaaren Länge mit je einem, mittig gelegenen SNP. Das Verhältnis der homozygoten und heterozygoten Allele betrug 1:1. Die anschließende Sequenzierung zeigte eine durchschnittlich 469fache Abdeckung (Abb. 2). Mutationsscreening von krankheitsassoziierten Genen Die Möglichkeit nun parallele Sequenzierungen durchführen zu können, wird routinemäßige Sequenzanalysen zu einem wertvollen Werkzeug für die Untersuchung und Diagnostik krankheitsassoziierter Mutationen machen. Die Praxis zeigt, dass eine Anrei- cherungstechnologie insbesondere für die Untersuchung solcher Mutationen in den verschiedensten biomedizinischen Bereichen gefragt ist. So werden Mutationen untersucht, die mit verschiedenen Krebserkrankungen in Verbindung stehen, aber auch neurologische und immungenetische Erkrankungen. Ausblick Ziel ist es, die Möglichkeiten der Hochleistungssequenzierer auch für medizinische und pharmakologische Fragestellungen, wie z. B. der personalisierten Medizin, einsetzen zu können. Durch die Durchführung von groß angelegten Studien, die statistisch relevante Daten liefern, können Mutationsanalysen zu einem wichtigen diagnostischen Werkzeug der Medizin etabliert werden. ó Literatur [1] Summerer D (2009) Enabling technologies of genomicscale sequence enrichment for targeted high-throughput sequencing. Genomics 94:363–368 [2] Craig DW, Pearson JV, Szelinger S et al. (2008) Identification of genetic variants using bar-coded multiplexed sequencing. Nat Methods 5:887–893 [3] Schracke N, Kornmeyer T, Kränzle M et al. (2009) Specific sequence selection and next generation resequencing of 68 E. coli genes using HybSelect. N Biotechnol 26:229–233 [4] Schracke N, Kränzle M, Stähler P (2009) Spezifische Genselektion durch mikrofluidische Biochips. BIOspektrum 1:54–55 [5] Li H, Ruan J, Durbin R (2008) Mapping short DNA sequencing reads and calling variants using mapping quality scores. Genome Res 18:1851–1858 [6] Summerer D, Wu H, Haase B (2009) Microarray-based multicycle-enrichment of genomic subsets for targeted nextgeneration sequencing. Genome Res 19:1616–1621 Korrespondenzadresse: Eva Sterzel febit biomed GmbH Im Neuenheimer Feld 519 D-69120 Heidelberg Tel.: 06221-6510300 [email protected] www.febit.com