Special 437 Microarray-basierte DNA-Analyse in der klinischen Diagnostik Michael Bonin und Olaf Riess Microarray Facility Tübingen, Institut für Anthropologie und Humangenetik, Abteilung Medizinische Genetik, Tübingen Einleitung Einhergehend mit der vollständigen Sequenzierung des humanen Genoms sind neueste Technologien für die DNA-Analyse entwickelt worden, die in unmittelbarer Zukunft die klinisch-genetische Diagnostik maßgeblich beeinflussen werden. Dabei wird es zu einer umfassenden Ausweitung des Anwendungsspektrums genetischer Analysemethoden kommen, wodurch die Einbeziehung der genetische Konstitution des Patienten (genetische Variabilität) in Fragestellungen einer individuellen Therapie möglich wird. Hierbei soll insbesondere auf die individuelle Reaktion von Patienten auf Medikamentengabe hingewiesen werden (Arzneimittelnebeneffekte, Arzneimittelwirksamkeit). Erste bahnbrechende Erkenntnisse in dieser Richtung sind auf dem Gebiet der Tumortherapie, die mit Genexpressionsprofilen aus Tumorgewebe verglichen werden, zu verzeichnen (siehe Beitrag von Herrn Hoheisel). In unserem Beitrag möchten wir insbesondere auf die Chancen der umfassenden individuellen DNAAnalyse hinweisen. Seit etwa drei Jahren drängen für diese weitergehende Herausforderung microarraybasierte Technologien auf den Markt, die es ermöglichen, bekannte Sequenzbereiche mithilfe von Oligonukleotiden zu resequenzieren und damit Licht in das Dunkel der genetischen Variabilität des Menschen zu bringen[1, 2]. Maßgeblich beteiligt ist dabei die Firma Perlegen (www.perlegen.com), eine Tochterfirma von Affymetrix, die mit großformatigen Oligonukleotidarrays innerhalb von 18 Monaten insgesamt 50 menschliche Genome resequenziert hat und damit erstmals einen Eindruck über die Variabilität der ca. 3 Mrd. Basenpaaren vermitteln möchte. Insgesamt im Zuge dieser MicroarrayEntwicklungen wurde es über das so genannte CustomSeq™-Programm der Firma Affymetrix für akademische Anwender mögBIOspektrum · 4/04 · 10. Jahrgang Abb. 1: Bei der Entwicklung von Resequenzierungsarrays werden zu jedem Basenpaar acht Oligonukleotide photolithographisch synthetisiert. Dabei wird an der zentralen Position jedes Oligonukleotids die vier alternativen Nukleotide eingebaut. Auf diese Weise sind für die Resequenzierung von 30.000 Basenpaaren 240.000 Sonden auf dem Array nötig. Bei der Auswertung werden die Hybridisierungssignale der 4 korrespondierenden Oligonukleotide eines Stranges bewertet und gegebenenfalls Heterozygotien bzw. Mutationen festgestellt (Pfeil). lich, selbst gewählte Sequenzbereiche in der Größenordnung von 30.000 bp Doppelstrang bzw. 60.000 nt Einzelstrang DNA zu definieren und auf der herkömmlichen GeneChip®-Platform von Affymetrix zu resequenzieren. Diese Methode der Sequenzierung durch Hybridisierung hält gegenwärtig bereits in einigen wenigen Zentren in der Molekularen Diagnostik Einzug und wird zukünftig die sequenzorientierte Diagnostik nachhaltig verändern. Wir sehen dafür insbesondere folgende Anwendungsgebiete: • Komplexe Analyse polygener Erkrankungen (z.B. Bluthochdruck, idiopathische neurodegenerative Erkrankungen), • Erfassung von genetisch-modifizierenden Faktoren (Penetranz), Special 438 • umfassende Analyse individualisierter genetischer Konstitutionen für pharmakogenomische Fragestellungen (z.B. Tumortherapie), • genomweite Erfassung von Mikrodeletionen bei der Syndromdiagnostik, • gezieltes Screening nach Mutationen kosten- und zeiteffizient für stark heterogene Erkrankungen (Resequenzierung, beispielsweise bei genetischen Ursachen geistiger Retardierung, Polyneuropathien usw.), und die • genomweite Erfassung uniparentaler Disomien. Technologie und Prozessierung Die Microarray-basierte Resequenzierung mithilfe der Affymetrix-Technologie beruht auf der Verwendung photolithographischer Techniken, kombinatorischer Synthese und mittels molekularer Hybridisierung hochdichter Microarrays. Dabei werden, identisch zu der Fabrikation von Microarrays für Genexpressionsanalysen, 25 Nukleotide lange Oligonukleotide auf einer Glasoberfläche hoch geordnet synthetisiert. Für den zu analysierenden DNA-Strang werden vier Oligonukleotide für eine zu sequenzierende Base synthetisiert. An die zentrale Position (13. Base) eines jeden Oligonukleotids werden die vier alternativen Nukleotide A, C, G oder T eingebaut (siehe Abb. 1). Insgesamt sind somit für die Analyse eines Basenpaares (Doppelstrang) acht unterschiedliche Oligonukleotide notwendig. Die Prozessierung der Resequenzierungsarrays teilt sich in verschiedene Teilprozesse auf (Abb. 2). Zu Beginn findet eine Amplifikation der zu resequenzierenden genomischen DNA in Form einer PCR statt. Dabei ist es nicht relevant, ob diese Vervielfältigung als Long-Range oder Short-PCR durchgeführt wird. Die anschließende Quantifizierung kann in Form einer Doppelstrang-spezifischen Farbstoffmessung, z.B. Picogreen erfolgen. Die verschiedenen PCR-Produkte werden daraufhin äquimolar vereinigt und unter zuhilfenahme einer Nuklease fragmentiert. Die Markierung der entstandenen Fragmente wird durch eine Terminale Desoxynukleotidyl Transferase mit biotinylierten Nukleotiden vorgenommen. Abschließend erfolgen die Hybridisierung auf den Array, ein Waschschritt sowie die Färbung der biotinylierten Fragmente mittels Streptavidin-Phycoerythrin. Das Auslesen und die Auswertung der Hybridisierungssignale geschehen mit dem neuesten Affymetrix-Scanner 3000 und der entsprechenden GDAS Software. Dabei wird die dem Array-Design zugrunde gelegte Sequenz mit den gemessenen Signalverteilungen verglichen und die ermittelte Ba- Abb. 2: Die Prozessierung von ResequenzierungsMicroarrays gliedert sich in verschiedene Teilprozesse. Die verschiedenen Stufen der Präparation sind aufgrund der Kontaminationsgefahr örtlich zu trennen. senabfolge dargestellt. Verglichen mit derzeitiger Sequenzier-Software gestalten sich die bisher verfügbaren Microarray-basierten Auswertungsroutinen als noch ausbaufähig. Vielfach müssen sie durch eigens entwickelte Tools ergänzt werden. Applikationen Resequenzierungsarrays eröffnen eine Reihe von Einsatzmöglichkeiten in der grundlagenorientierten Forschung, wie auch in der medizinischen Diagnostik. Ein Meilenstein dieser Arbeit wurde bereits 2001 durch Patil und Kollegen mit der kompletten Rese- quenzierung des Chromosoms 21 veröffentlicht[2]. Mit dem Ziel die SNP- und Haplotypen-Kollektion des vollständigen Chromosoms zu erhalten, wurden über 21 Mb von 20 ethnisch unterschiedlichen Individuen resequenziert. Dabei konnten 35.989 SNPs detektiert werden. Diese Ergebnisse besitzen u. a. besondere Relevanz für zukünftige Assoziationsstudien zur Identifikation von krankheitsrelevanten Genen bis hin zu Untersuchungen von Suszeptibilität bei häufigen Erkrankungen. Unmittelbare Produkte, welche aus diesen Arbeiten generiert wurden, stellen die so genannten 100K SNP-Arrays (Affymetrix) dar, welche es ermöglichen, mehr als 100.000 nahezu gleichmäßig über das Genom verteilte Polymorphismen, auch Einzelbasenaustausche (SNPs) genannt, innerhalb von 1–2 Tagen zu analysieren. Diese bereits jetzt kommerziell erhältlichen Arrays finden bereits bei der Auffindung von kleinsten Deletionen (Mikrodeletionen) im Erbmaterial beispielsweise bei der Diagnostik von Kindern mit Syndromverdacht ihre Anwendung. Darüber hinaus kann dieselbe Technologie zur genomweiten Erfassung der so genannten uniparentalen Disomie (Zustand, bei der die homologen Chromosomen eines Kindes nicht von beiden Eltern, sondern nur von einem Elternteil weitergegeben wurden) als Ursache einer Entwicklungsverzögerung bei Kindern angewandt werden (Abb. 3). Neben diesen genomweiten Analysen bekannter Polymorphismen zeichnen sich bereits jetzt schon Einsatzmöglichkeiten für Resequenzierungsarrays mit kleinerer Kapazität in der klinischen Diagnostik ab. Ein herausragender Sektor wird die Sequenzierung durch Hybridiserung bei der schnellen Identifikation von Krankheitserregern darstellen und Diagnosezeiten und damit Kosten für das Gesundheitssystem drastisch senken. Unlängst wurde auf dem Human Genome Meeting 2004 in Berlin durch Guiver und Mitarbeiter ein Microarray-Design vorgestellt, das die Möglichkeit eröffnet, zwischen verschiedenen Neisseria meningococcus Subtypen zu unterscheiden[3]. Die Zeit bis zur Feststellung des Sub-Serotyps beträgt bei der Verwendung von herkömmlichen Methoden, wie Immunoassays in Kombination mit Kapillar-Sequenzierung 4–5 Tage. In Zukunft könnte diese Zeit auf etwa einen Tag verkürzt und damit die medizinisch notwendige Serotyp-spezifische Behandlung bedeutend früher angewandt werden. Eine weitere medizinisch-diagnostische Verwendungsmöglichkeit besteht in der schnellen und kostengünstigen Resequenzierung von großen krankheitsrelevanten Genen oder Gengruppen. Unter Einsatz des p53-Resequenzierungsarrays von Affymetrix BIOspektrum · 4/04 · 10. Jahrgang Special Abb. 3: Schematische Darstellung einer segmentalen paternalen uniparentalen Disomie (UPD). Die aufgeführten SNPs sind gemäß ihrer chromosomalen Lokalisation mit ihren Genotypen aufgeführt. Die Buchstaben A und B repräsentieren die alternativen Allele. Die segmentale UPD ist durch die mit Pfeilen besetzten SNPs begrenzt. Die SNPs im Kasten demonstrieren die angrenzende eindeutig biparentale Vererbung. wurde an 70 Formalin-fixierten und Paraffin-eingebetteten Brustkrebs-Geweben Mutationsanalysen an p53 durchgeführt[4]. Das p53 Gen ist eine der zentralen Komponenten der Carcinogenese bei Brustkrebs, wie auch bei anderen Krebsarten[5]. Der p53Microarray konnte in dieser Studie insgesamt 26 Mutationen in 24 Geweben nachweisen. Obwohl der Microarray im Vergleich zur herkömmliche Sequenzierung nicht alle Veränderungen detektierte, kann doch festgehalten werden, dass dieses Microarray-Design eine exzellente Ergänzung zur herkömmlichen Mutationsanalyse darstellt. Diese Ergebnisse werden durch eigene Untersuchungen auf dem Sektor der Mutationssuche krankheitsrelevanter Gene gestützt. Innerhalb der Microarray Facility Tübingen wurde ein Resequenzierungsarray entwickelt, der den kompletten codierenden Bereich sowie die Promoterregion des Gens CFTR enthält. Dieses Gen ist in seiner mutierten Form für die Krankheit Mukoviszidose verantwortlich. Mukoviscidose oder Cystische Fibrose (CF) ist eine der häufigsten autosomal-rezessiven Erkrankungen der westlichen Welt. Die Häufigkeit wird durchschnittlich mit 1:2000 bis 1:3000 kaukasische Neugeborene angegeben. Bisher wurden über 1000 verschiedene CFTR-Allele mit Mutationen identifiziert. Neben der häufigsten Mutation dF508 (72% in Deutschland) existieren viele Mutationen mit einer geBIOspektrum · 4/04 · 10. Jahrgang ringeren Häufigkeit bis hin zu privaten Mutationen, welche nur in einer Familie zu finden sind. Die herkömmliche Sequenzierung der 27 Exone von CFTR nimmt in der klinischen Routine zwischen zwei und vier Monate in Anspruch. Mit Hilfe des von uns entwickelten Resequenzierungsarrays kann das gesamte Gen innerhalb weniger Tage resequenziert werden. Bei der Analyse von 33 bereits sequenzierten DNAProben, konnten bis auf eine 1-Basen Deletion alle Mutationen nachgewiesen und bestätigt werden. Ferner wurden eine Reihe bekannter Polymorphismen festgestellt. Eine Entwicklung die ebenfalls große medizinische Relevanz nach sich ziehen kann, ist jüngst durch Maitra und Mitarbeitern in Genome Research publiziert worden[6]. Der dort beschriebene MitoChip enthält die komplette kodierende Sequenz des humanen mitochondrialen Genoms. Für die Resequenzierungsanalyse werden nur insgesamt 300 ng genomische DNA eingesetzt, wobei die Amplifikation der zu analysierenden DNA nur drei überlappende Long-Range PCRs benötigt. Die Ergebnisse zeigen eine herausragende Reproduzierbarkeit mit mehr als 99.99%. Somatische mitochondriale Mutationen sind häufig bei verschiedenen Formen des Krebses detektierbar und können somit als Marker für die zukünftige Früherkennung herangezogen werden. Industrie-Applikationen 440 Ausblick Hochdichte Oligonukleotidmicroarrays werden seit Jahren als Werkzeug zur genomweiten Expressionsanalyse eingesetzt. Durch die Verringerung der benötigten Synthesefläche und der Verbesserung von Auswertungsalgorithmen ist es gelungen, auch Resequenzierungsarrays erfolgreich zu entwickeln. Die bisherige Limitierung für Akademiker auf 30.000 ist durch die neue 11µm Technologie, verbunden mit dem neuen hochauflösenden Scanner, nur der Anfang einer schnell voranschreitenden Entwicklung. In der nächsten Generation von CustomSeq™-Arrays wird die Kapazität auf bis zu 300.000 Nukleotide ansteigen und damit die Resequenzierung von kompletten Genclustern oder großen chromosomalen Regionen ermöglichen, welche putativ krankheitsrelevante Gene enthalten. Daneben werden in naher Zukunft eine Reihe von krankheitsspezifischen Resequenzierungsarrays veröffentlicht werden, deren Testung der Einsatzfähigkeit, im Gegensatz zu der sehr aufwendigen Validierung von Expressionsanalysen, einfacher durchzuführen ist und damit einen schnelleren Zugang zur diagnostischen Routine eröffnet. Literatur [1] Warrington et al. (2002): New Developments in High-Throughput Resequencing ans Variation Detection Using High Density Microarrays. Human Mutation 19: 402–409 [2] Patil et al. (2001): Blocks of Limited Haplotype Diversity Revealed by High-Resolution Scanning of Human Chromosome 21. Science 294: 1719–1723 [3] Press Release Affymetrix 06.04.2004 [4] Cooper et al. (2004): Evaluation of Oligonucleotid Arrays for Sequencing of p53 Gene in DNA from Formalin-Fixed, Paraffin-Embedded Breast Cancer Specimens. Clinical Chemistry 50: 3500–508 [5] Gasco et al. (2002): The p53 pathway in breast cancer. Breast Cancer Res 4: 70–76 [6] Maitra et al. (2004): The Human MitoChip: a highthroughput sequencing Microarray for mitochrondrial mutation detection. Genome Res 14: 812–819 Korrepondenzadresse: Dr. Michael Bonin Microarray Facility Tübingen Service Provider Affymetrix Institut für Anthropologie und Humangenetik Abteilung Medizinische Genetik Calwerstr. 7 D-72076 Tübingen Tel.: 07071-29 72295 Fax: 07071-29 5172 [email protected] www.microarray-facility.de