Grundlagen der DNA-Analytik Prof. Dr. med. Bernd Brinkmann Direktor des Instituts für Rechtsmedizin Universitätsklinikum Münster Röntgenstr. 23 48149 Münster Fax: 0251/8355158 eMail: [email protected] http://rechtsmedizin.uni-muenster.de 2 1. Einleitung Bis vor etwa 10 Jahren hat sich die Rechtsmedizin einer großen Zahl polymorpher Proteinsysteme bedient, um Fragen der biologischen Verwandtschaft und der Herkunft von Spuren zu klären. Seit Einführung molekulargenetischer Techniken liegt der Untersuchungsschwerpunkt auf der DNA-Ebene und hat sich nicht nur in quantitativer Sicht revolutioniert; es wurden auch neue Anwendungsbereiche erschlossen, die zuvor nicht denkbar waren. Die Desoxyribonukleinsäure (abgekürzt DNS, engl.: deoxyribonucleic acid, DNA) ist Träger der Erbinformation. Der größte Teil der DNA einer Zelle findet sich im Zellkern und wird nukleäre DNA oder Kern-DNA genannt. Daneben besitzen die Mitochondrien, die als „Kraftwerke der Zelle“ genannten Zellorganellen, eine eigenständige DNA (mitochondriale DNA, abgekürzt mtDNA). Der Mensch trägt 46 Chromosomen, die als 22 sog. Körperchromosomen-Paare (’Autosomen’) und 2 Geschlechtschromosomen (’Gonosomen’, XX bei einer Frau und XY bei einem Mann) organisiert sind. Auf molekularer Ebene besteht die DNA aus zwei zueinander komplementären Strängen, die wendeltreppenartig zu einer Doppelhelix umeinander gewunden sind. Die Länge dieses Molekülfadens beträgt etwa 1,8 m. Jeder Strang besteht aus einem Zucker-Phosphatrückgrat, wobei an den Zuckerbaustein eine von vier möglichen Basen (Adenin, Cytosin, Guanin und Thymin, die mit A, C, G, T abgekürzt werden) gebunden ist. Die Abfolge dieser vier Bausteine legt die gesamte genetische Information fest. 50 Jahre nach der Entschlüsselung der DNA-Struktur ist die Abfolge der aus 3 Milliarden Bausteinen bestehende menschliche Erbgut zu mehr als 99% bekannt. Einschränkend muss angemerkt werden, dass jeder Mensch (mit Ausnahme eineiiger Mehrlinge) genetisch einzigartig ist und sich seine DNA punktuell unterscheidet. Gerade diese Unterschiede nutzt die forensische Molekulargenetik zur individualisierenden Analytik. Die menschliche DNA ist nur zu weniger als 5% kodierend. Kodierende Bereiche eines Gens, die sog. Exons, sind funktionell und werden in ein Genprodukt (zumeist ein Protein) übersetzt, während der Rest, bestehend aus Introns sowie regu- 3 latorischen Regionen, nicht-kodierend ist. Auch die Bereiche zwischen den Genen, sog. intergene Regionen, sind nicht-kodierend. Dies bedeutet aber nicht zwangsläufig ’funktionslos’. Während die klassischen polymorphen Protein-Marker aus kodierenden Bereichen stammen, so sind die in der forensischen Molekulargenetik etablierten DNAMarker in nicht-kodierenden Bereichen lokalisiert. Auch in den Genen unterscheiden sich Menschen. Eine solche Gen-Variante wird --abhängig von ihrer Häufigkeit in der Bevölkerung-- Mutation oder Polymorphismus genannt. Polymorphismus bedeutet nach der Definition, dass die Variante häufiger ist als 1%. Unterhalb dieser Häufigkeit wird der Begriff „Mutation“ verwendet. Eine solche Gen-Variante kann zu einer Protein-Variante führen und kann funktionell neutral oder relevant sein, wobei letzteres zumeist einen Nachteil für den Träger bedeutet, indem diese Variante eine Krankheit auslöst (z.B. Varianten des Sauerstofftransportmoleküls Hämoglobin). Es gibt jedoch ebenso GenVarianten, die für den Träger vorteilhaft sind, wie z.B. ’Apo A-I Milano’, das zu vermindertem Gefäßrisiko und einer höheren Lebenserwartung führen kann. Manche Gen-Variante hat nur eine Auswirkung auf äußerlich sichtbare Charakteristika, z.B. die Pigmentierung von Augen, Haaren und der Haut. Die Kausalkette: 1 Gen -- 1 Variante -- 1 Krankheit wird selten beobachtet; Krankheiten sind zumeist durch mehrere Genvarianten begründet. Es gibt zwar mehrere Tausend unterschiedliche monogene Erkrankungen, doch sind sie in der Summe der Erkrankungsfälle selten. Die großen Krankheiten sind polygen, d.h., sie werden durch ein komplexes Zusammenwirken mehrerer genetischer Varianten und / oder Defekte verursacht. Auch muss eine Gen-Variante nicht zwangsläufig zum Ausbruch einer Krankheit führen. Aufgrund des doppelten Körperchromosomen-Satzes kann ein Mensch 4 mischerbig (’heterozygot’) sein, so dass die Genkopie ohne Variante den negativen Effekt der Variante mildert. Bestimmte Krankheiten sind mit bestimmten Markern assoziiert, z.B. Magenkrebs mit Blutgruppe A und Zwölffingerdarmgeschwür mit Blutgruppe 0. Die Blutgruppe 0 ist in diesem Fall ein Marker für die genetische Suszeptibilität oder Disposition in Hinblick auf die Entwicklung eines Zwölffingerdarmgeschwürs. Eine solche Assoziation ist in der Regel rein statistisch ermittelt worden und daher mit einer gewissen Irrtumswahrscheinlichkeit behaftet. Es gibt genetische Marker, die chromosomal dem eigentlichen Krankheits-Genomort nahe benachbart sind und daher zusammen mit ihm ohne freie Rekombination vererbt werden. Solche Assoziationen sind z.B. beschrieben für den in der forensischen Molekulargenetik etablierten Marker TH01 aus Intron 1 des Tyrosin-Hydroxylase-Gens und TypI-Diabetes. Folgende Rechnungen zeigen, wie schwach solche Assoziationen üblicherweise ausgeprägt sind: vier von 1000 Europäern werden statistisch TypI-Diabetes entwickeln. Wenn Sie eines der 'Risiko-Allele’ in dem Markersystem TH01 tragen, beträgt die Chance, dass Sie TypI-Diabetes entwickeln ca. 0,13 zu 1000. Ihr Gesamtrisiko für TypI-Diabetes beträgt demnach 0,4 x 1,3 = 0,52%, d.h. das allgemeine Risiko hat sich von 0,4 auf 0,52% vergrößert. Der Umkehrschluss, dass Sie aufgrund dieses Risiko-Allels tatsächlich an TypI-Diabetes leiden, ist statistisch demnach nicht möglich. 2. Aktuelle Methodik In der forensischen Molekulargenetik werden Bereiche der DNA untersucht, bei denen interindividuelle Unterschiede auftreten. Sie sind für forensische Untersuchungen mit dem Ziel der Individualisierung und eindeutigen Zuordnung von Personen zu Spuren und vice versa von besonderem Interesse. Dabei werden Abschnitte der DNA, die eine Längenvariation in der Bevölkerung (= Längenpolymorphismen) aufweisen, analysiert. Sie sind zumeist in nichtkodierenden Bereichen lokalisiert, da ein Großteil dieser Bereiche aus repetitiven Sequenzen besteht, die die Grundlage der Längenvariationen sind. Die Anzahl an Wiederholungen an einem definierten Genomort kann zwischen Schwesterchro- 5 mosomen und unterschiedlichen Individuen variieren. Innerhalb eines Individuums können jedoch keine Unterschiede im Wiederholungsmuster nachgewiesen werden: jede Körperzelle weist dieselbe Zahl an Wiederholungen auf. Genau dies ist die Basis der Anwendung in der forensischen Molekulargenetik, denn sonst könnte keine eindeutige Zuordnung von Spuren (z.B. eine Haarwurzel, eine Spermaantragung) und Vergleichsproben (zumeist ein Mundschleimhautabrieb oder eine Blutprobe) erfolgen. Heutiger Stand der Technik ist die Analyse von short tandem repeats (STRs), die auch als Mikrosatelliten bekannt sind. STRs bestehen aus sehr kurzen repetitiven Einheiten von zwei bis sieben DNA-Bausteinen (Abb. 1). AATG 7 Wiederholungseinheiten 8 Wiederholungseinheiten Abb. 1: Schematische Darstellung der STR-Struktur. Die Repeat-Region ist variabel, während die flankierenden Regionen mit ihren PrimerBindungsstellen (Pfeile) konstant sind. Mittlerweile sind mehrere Tausend solcher STRs entdeckt, von denen aber nur ca. 30 für die forensische Molekulargenetik ausreichend validiert sind. Für die Untersuchung der biologischen Verwandtschaft sollen nach Empfehlung der Bundesärztekammer mindestens 12 STRs [1] verwendet werden, während die deutsche DNA-Analyse-Datei (DAD) die folgenden acht STRs umfasst: ACTBP2 (=SE33), VWA, TH01, FGA (=FIBRA), D21S11, D3S1358, D8S1179 und D18S51. Für die Darstellung dieser STRs ist eine Isolierung der menschlichen DNA aus einer u.U. komplexen Probenmatrix sowie die selektive Vermehrung der entsprechenden Genomorte (=Loci) mittels Polymerasekettenreaktion (PCR) erforderlich. 6 Erst durch diese Technik ist es möglich, noch winzigste biologische Spuren, in denen wenige menschliche Zelle vorhanden sind, erfolgreich zu untersuchen. Die Häufigkeit der nachgewiesenen Allel-Kombination, manchmal als DNAIdentifizierungsmuster bezeichnet, wird für die relevante Population berechnet, falls eine Übereinstimmung zwischen einem Tatverdächtigen und einer Spur festgestellt wurde (Tab. 1). Tabelle 1: Biostatistische Häufigkeitsberechnung in einem Spurenfall. Die drei gezeigten STR-Systeme konnten in einem Abrieb von einem Hammergriff erfolgreich dargestellt werden. FGA VWA ACTBP2 Allele 20 22 14 16 19 24.2 Synonyme a b a b a b Häufigkeit [%] 14 19 10 20 7 3 2xaxb 5,3% x 3,7% x 0,4% =0,001% (≙ 1/100.000) 3. Informationen aus DNA-Analysen Aus der Untersuchung kodierender und nicht-kodierender Bereiche können verschiedene Informationen gewonnen werden. Aus dem kodierenden Bereich lassen sich z.B. Informationen über ganz normale phänotypische Merkmale wie Haarfarbe, Hautfarbe, Augenfarbe gewinnen. Es ist zu erwarten, dass die Zahl der menschlichen Gene mit phänotypischer Relevanz im weiteren Verlauf der Grundlagenforschung zunehmen wird. 7 Alle weiteren ableitbaren Informationen betreffen eigentlich immer nur den Phänotyp: Rückschlüsse auf die ethnische oder geographische Herkunft können gezogen werden. Indirekt kann damit z.B. auf eine schwarze Hautfarbe geschlossen werden. Gleiches gilt dann für die Augenfarbe und die Haarfarbe, ohne dass man entsprechende Gene untersucht hat. Wichtig dabei ist, dass es sich eine probabilistische Bewertung handelt, d.h., ein solcher Rückschluss ist nicht mit 100%iger Sicherheit möglich. Informationen über das Geschlecht können ohne Untersuchung kodierende Bereiche gewonnen werden. Die Untersuchung auf Amelogenin ist ein Bespiel hierfür. Lag sie bislang als Überschuss-Information z.B. bei der molekulargenetischen Spuren-Untersuchung vor, so ist sie seit kurzem durch eine entsprechende Gesetzestextänderung (§ 81e,g StPO) ausdrücklich inkludiert. Bei irregulärer Zahl von Allelen im nicht-kodierenden Bereich können Rückschlüsse auf irreguläre Chromosomenzahl gezogen werden, wobei es sich zunächst um eine Verdachtsdiagnose handelt. Es gibt nämlich andere Ursachen, die zu dem gleichen Phänomen führen können, wie z.B. Genverdoppelung oder Mosaizismus. Ein Beispiel ist die Trisomie 21 (Down-Syndrom, Mongolismus), bei der häufig in einem weit verbreiteten DNA-Merkmalssystem, D21S11, drei Allele beobachtet werden. Die autosomalen STR-Allele weisen häufig zwischen den ethnischen Großgruppen unterschiedliche Frequenzen auf [2]. Wenn man mehrere STR-Systeme miteinander kombiniert, erhält man typische Muster für die eine oder für die andere ethnische Großgruppe, d.h. Häufigkeitsunterschiede [3]. Ein bestimmtes Muster kann z.B. bei Europäern 1000 x so häufig sein, wie bei Schwarzafrikanern. Damit wäre, wenn im Vorfeld Personen aus diesen beiden ethnischen Großgruppen als Spurenleger in Betracht kommen, der Europäer z.B. 1000 x so wahrscheinlich ein Spurenleger. Diese Häufigkeitsunterschiede können bis in den Bereich millionenfach und höher gehen. Es gibt aber auch Konstellationen, wo diese Unterschiede wenig ausgeprägt sind. Daher hat man längst nicht in jedem Fall, der hinterfragt wird, mit einer statistisch verbindlichen Antwort zu rechnen. Es kommt sehr auf die verwendeten Systeme an, nämlich auf deren Fähigkeit zur Diskrimination zwischen verschiedenen Großpopulationen. Es ist ohne weiteres 8 schen verschiedenen Großpopulationen. Es ist ohne weiteres möglich, eine Mischung von Systemen auszusuchen, mit der die Frage der Zugehörigkeit zu einer ethnischen Großgruppe in praktisch jedem Fall beantwortet werden kann. Auch das Gegenteil ist möglich. Unterschiede lassen sich an zwei DNA-Systemen aus der DNA-Analyse-Datei (DAD) erkennen: TH01 ist z.B. eher geeignet zur Differenzierung zwischen ethnischen Großgruppen, während ACTBP2 (=SE33) dazu nicht geeignet ist. Das Y-Chromosom verfügt über zahlreiche Genomorte, die nicht-kodierend sind. Bestimmt man an etlichen Genomorten den Genotyp, so erhält man in der Kombination einen sog. Y-Haplotyp. Solche Haplotypen sind sehr häufig populationsspezifisch. Es gibt also Haplotypen, die für einen Teil der spanischen Population mehr oder weniger spezifisch sind, sowie andere, die für asiatische Populationen spezifisch sind und bei europäischen Populationen überhaupt nicht vorkommen. Auch gibt es deutliche Unterschiede innerhalb der asiatischen Subpopulationen. Gleiches gilt auch für viele europäische Populationen [4]. Einige Populationen sind wiederum aufgrund des Y-Haplotyps nicht oder so gut wie nicht unterscheidbar, wie z.B. Deutsche und Italiener. Gleichermaßen gilt, dass zwischen diskriminierenden Haplotypen und mehr oder weniger untypischen Haplotypen unterschieden werden muss. Nicht jeder Haplotyp erlaubt den Rückschluss auf die Zugehörigkeit zu einer bestimmten Subpopulation. Ähnliches wie für den Y-Haplotyp gilt für die mitochondriale DNA (mtDNA). Hier spricht man auch von einem Mitotyp. Ein Mitotyp kann Rückschlüsse auf die ethnische Großgruppe, aber auch auf Populationen etwa innerhalb des großen Kreises kaukasoider (europider) Populationen erlauben. Auch hier gilt Ähnliches im Hinblick auf die Effizienz wie beim Y-Haplotyp. Bei beiden ist wichtig, dass es sich hierbei gewissermaßen um familiäre Eigenschaften handelt, d.h., man kann Rückschlüsse auf den Mitotyp der maternalen Verwandten oder den Haplotyp der paternalen Verwandten ziehen. Im Bereich der mtDNA gibt es einen nichtkodierenden und einen kodierenden Abschnitt, wobei letzterer viel größer ist. Wenn auch der kodierende Abschnitt untersucht wird, werden Punktmutationen entdeckt. Die Gesamtheit sämtlicher Mutationen etwa im Verhältnis zu einem „Normaltyp“ wird natürlich größer, je mehr untersucht wird, d.h., der Mitotyp wird 9 individueller. Der kodierende Bereich kann soweit untersucht werden, dass ein verändertes Protein nachgewiesen werden kann. Man kann aber auch bewusst so untersuchen, dass lediglich eine Mutation detektiert wird, die jedoch nicht zu einem veränderten Protein führt und demnach keine Änderung im Phänotyp erwarten lässt [5]. Zusammengefasst können durch Untersuchung kodierender und nicht-kodierender Bereiche Rückschlüsse auf einzelne Aspekte des individuellen Phänotyps, also des äußeren Erscheinungsbildes, gewonnen werden. Literatur 1 Richtlinien für die Erstattung von Abstammungsgutachten. Deutsches Ärzteblatt 2002; 99: A665-667. 2 Wiegand P, Meyer E, Brinkmann B. Microsatellite structures in the context of human evolution. Electrophoresis. 2000;21:889-895. 3 Brinkmann B, Junge A, Meyer E, Wiegand P. Population genetic diversity in relation to microsatellite heterogeneity. Hum Mutat. 1998; 11:135-144. 4 Gusmao L, Sanchez-Diz P, Alves C, Beleza S, Lopes A, Carracedo A, Amorim A. Grouping of Y-STR haplotypes discloses European geographic clines. Forensic Sci Int. 2003;134:172-179. 5 Brandstätter A, Parsons TJ, Parson W. Rapid screening of mtDNA coding region SNPs for the identification of west European Caucasian haplogroups. Int J Legal Med. 2003; 117: 291-298.