225_261_BIOsp_0308.qxd 25.04.2008 9:43 Uhr Seite 255 255 Populationsgenetik Nachweis der natürlichen Selektion Adaptation und Selektion WOLFGANG STEPHAN BIOZENTRUM, LMU MÜNCHEN Die Anpassung von Lebewesen an ihre Umwelt ist ein zentrales Thema der Evolutionsbiologie. Dieser Prozess ist jedoch kaum fassbar, wenn er ausschließlich auf der phänotypischen Ebene betrachtet wird. Im Folgenden wird die Anpassung aus der Sicht der Darwin’schen Selektionstheorie beschrieben und das Wirken der Selektion auf der Genomebene analysiert. The adaptation of organisms to their environment is a major objective of evolutionary biology. This process, however, is hard to understand if it is considered exclusively at the phenotypical level. Here we describe adaptation from the perspective of Darwinian selection theory by analyzing the action of selection at the genomic level. ó Adaptation, die Anpassung von Individuen einer natürlichen Population an ihre Umwelt, ist ein schwer zu definierender Begriff. Denn, laut R. A. Fisher[1], dem großen Evolutionsgenetiker, geht es bei der Anpassung nicht um spezifische Merkmale wie den langen Hals oder die langen Beine, die es der Giraffe ermöglichen, an den oberen Blättern der Bäume herumzufressen, sondern um die „Konformität“ aller Merkmale eines Individuums mit allen Facetten, die die Umwelt ausmachen. Untersuchungen einzelner Merkmale, wie sie in der klassischen Evolutionsbiologie oft durchgeführt werden, laufen somit Gefahr, einen Großteil der Bedeutung des Begriffs Adaptation unberücksichtigt zu lassen. Wie aber kann man dem Fisher’schen Anspruch gerecht werden und die „Gesamtheit“ der Merkmale eines Organismus und ihre Angepasstheit an einen komplexen Lebensraum analysieren? R. A. Fisher betont, dass Adaptation durch die Bewegung einer Population auf einen Phänotypen hin charakterisiert ist, der in die gegenwärtige Umwelt am besten passt. Neben neutralen Evolutionskräften wie Mutation, Rekombination und genetischer Drift ist diese Bewegung insbesondere von der natürlichen Selektion getrieben. Es liegt deshalb nahe, anstelle des operational nur schwer fassbaren Begriffs Adaptation die natürliche Selektion zu untersuchen, die auf die Individuen einer Population wirkt. Dies hat den Vorteil, dass man sich (zunächst) BIOspektrum | 03.08 | 14. Jahrgang nicht auf bestimmte Merkmale, die etwas mit Adaptation zu tun haben könnten (was man allerdings oft nicht weiß), festlegen muss. Um die natürliche Selektion nachzuweisen, ist es am effizientesten, die Auswirkungen der Selektion durch zwischenartliche Vergleiche (z. B. durch Betrachtung des Verhältnisses von nicht synonymen zu synonymen Substitutionen in kodierenden Bereichen) oder auf Populationsebene anhand der genetischen Variabilität zu studieren. So hat die molekulare Populationsgenetik in den letzten 20 Jahren eine Reihe von statistischen Verfahren hervorgebracht, mit deren Hilfe man Rückschlüsse auf das Wirken der Selektion in der Vergangenheit ziehen kann. Das Datenmaterial, auf das sich diese Methoden stützen, beruht auf kleinsten, natürlich vorkommenden Veränderungen im Genpool einer Population (insbesondere single nucleotide polymorphisms oder SNPs). Der große Durchbruch kam dann in den letzten 5–10 Jahren mit dem Einzug der Populationsgenomik, mit deren Mitteln es möglich geworden ist, SNP-Datensätze genomweit in Modellorganismen zu erheben and statistisch zu analysieren. Der entscheidende Fortschritt des genomischen Ansatzes besteht darin, dass sich die Interpretation der Testergebnisse vereinfacht, weil man Phänomene wie demo- Die hitchhiking -Methode Kim und Stephan[2] haben einen composite likelihood ratio (CLR)-Test entwickelt, um die Wahrscheinlichkeit zu berechnen, dass eine beobachtete lokale Reduktion der Variabilität im Genom durch positive Selektion entstanden ist (anstatt durch neutrale Evolutionsfaktoren); d. h. der CLR-Test vergleicht die Wahrscheinlichkeit von SNP-Daten unter einem neutralen Modell mit der unter einem hitchhiking-Modell. Durch Maximierung letzterer Wahrscheinlichkeit bezüglich der Modellparameter können diese gleichzeitig geschätzt werden. Auf diese Weise erhält man Schätzwerte für den Ort, an dem die vorteilhafte Mutation im Genom aufgetreten ist, und auch für deren Selektionskoeffizienten (Selektionsvorteil). Ein Computerprogramm, um diese Rechnungen durchzuführen, ist unter http://www.yuseobkim.net zu finden. Dieses Verfahren soll am Beispiel von polyhomeotic (ph), einem in Drosophila melanogaster unter Selektion stehendem Gen[12], erläutert werden. Die besagte Genregion wurde durch einen Genom-Scan gefunden[4]. In der Nähe des dabei in der europäischen Population entdeckten Fragments mit niedriger Variabilität (Abb. 1) wurden in den afrikanischen und europäischen Stichproben weitere Fragmente analysiert. Dabei ergab sich ein Tal der Variabilität, das in der afrikanischen Population viel enger war als in der europäischen (Abb. 1), weshalb für die Feinanalyse die afrikanische Stichprobe gewählt wurde[12]. Durch Anwendung des CLR-Tests konnte schließlich das Target der Selektion im großen Intron von ph-p lokalisiert werden (in einem Bereich, in dem mehrere Transkriptionsfaktor-Bindungsstellen liegen), und auch der Selektionskoeffizient konnte ermittelt werden. Obwohl die phDuplikation vor mehr als 25 Millionen Jahren stattgefunden hat, sind die ph-Duplikate auf der Sequenzebene sehr ähnlich, jedoch zeigen sie unterschiedliche Expressionsprofile. Offenbar stehen sie also noch am Anfang ihrer Differenzierung, aber starke Selektion sorgt dafür, dass sich ihre Funktionen allmählich auseinander entwickeln. 225_261_BIOsp_0308.qxd 256 25.04.2008 9:43 Uhr Seite 256 WISSENSCHAFT · SPECIAL: L ABORAUTOMATION/HTS ˚ Abb. 1: Nukleotiddiversität π und θ in der polyhomeotic-Region einer afrikanischen D. melanogaster-Population. Die Diversitätswerte wurden durch Sequenzieren von 13 kurzen Fragmenten gemessen, wobei das mit einem Stern gekennzeichnete Fragment im ursprünglichen Genom-Scan einer Population aus Holland als monomorph gefunden wurde[4]. π ist die durchschnittliche Anzahl der Unterschiede zweier Allele an einer Nukleotidstelle, während θ proportional zur Anzahl der SNPs in der Stichprobe ist. Im gekennzeichneten Bereich sind zwei Eigenschaften des hitchhiking-Effekts zu sehen: a) π und θ sind erniedrigt und b) ihre Differenz π – θ, die zu Tajimas DStatistik proportional ist, ist negativ. Der vom CLR-Test geschätzte Angriffspunkt der Selektion ist durch einen senkrechten Pfeil angedeutet und liegt im großen Intron von ph-p. Der untere Teil der Abbildung zeigt die in der Feinanalyse[12] sequenzierten 18 Fragmente, die Struktur der Gene und die Distanzen (in kb). grafische Einflüsse, die das gesamte Genom betreffen, von lokalen Effekten (wie der Wirkung der Selektion) unterscheiden kann. Um genomweite SNP-Datensätze nach Spuren positiver (d. h. adaptiver) Selektion abzusuchen, haben wir eine Methode entwickelt, die auf dem hitchhiking-Effekt beruht[2] (Box). Dieser besagt, dass in einer lokalen Region des Genoms die genetische Variation reduziert ist, wenn in dieser Region in jüngerer Vergangenheit eine vorteilhafte Mutation aufgetaucht und sich in der gesamten Population durchgesetzt hat. Das Wirken positiver Selektion hinterlässt somit im Genom definierte Muster der Sequenzvariabilität; und die Gesamtheit dieser Muster bildet eine Genkarte, die angibt, wo im Genom evolutionäre Veränderungen mit adaptiver Bedeutung in der jüngeren Historie einer Population stattgefunden haben. In anderen Worten, diese Genkarte stellt eine Momentaufnahme der Adaptation dar. Genom-Scans positiver Selektion Um positive Selektion mithilfe des hitchhiking-Effekts zu identifizieren, wird das Genom systematisch nach Regionen reduzierter Variation abgesucht. Organismen, deren Genom vollständig sequenziert ist, eignen sich besonders gut für solche Untersu- chungen. Beim Menschen hat das HapMapProjekt mehr als 3,1 Millionen SNPs gefunden[3]. In D. melanogaster konnte ein solcher Scan bisher nur in einem kleineren Maßstab durchgeführt werden (für das X-Chromosom und ein Autosom)[4, 5]. In frei lebenden Mäusen wurde die Variation genomweit durch Mikrosatelliten gemessen[6]. Die Untersuchung dieser Datensätze mithilfe des CLRTests (Box) und dessen Weiterentwicklungen[7, 8] hat zu folgenden Resultaten bei D. melanogaster und dem Menschen, den am besten untersuchten Arten, geführt. D. melanogaster: In den SNP-Scans wurden jeweils 260 kurze Fragmente auf dem X-Chromosom in einer ursprünglichen afrikanischen und einer abgeleiteten Population aus Holland untersucht[4, 5]. Ferner wurden 375 Fragmente auf dem 3. Chromosom der holländischen Population analysiert[9]. Die Analyse ergab, dass auf dem X-Chromosom der afrikanischen Population in den letzten 60.000 Jahren 160 Ereignisse positiver Selektion Spuren hinterlassen haben, während in der europäischen Population, die sich erst nach der letzten Eiszeit (vor etwa 15.000 Jahren) von der ursprünglichen afrikanischen Linie abgespalten hat, 60 Selektionsereignisse gefunden wurden[8]. Die Frequenz der adaptiven Ereignisse ist damit in Europa höher als in Afrika, was mit der Ausbreitung der Fliegen in neue Territorien (temperierte Klimazonen) und damit verbundenen Anpassungen zu tun haben dürfte. Ferner ist sie höher als auf dem 3. Chromosom, was dadurch bedingt ist, dass die meisten adaptiven Mutationen (schwach) rezessiv sind. Die Angriffspunkte positiver Selektion im D. melanogaster-Genom können sehr genau lokalisiert werden (Box). Das bedeutet, dass man die Gene kennt, die in der Adaptation eine Rolle gespielt haben. Mithilfe dieser Information kann man nun beginnen, einzelne adaptive Merkmale zu analysieren. Bisher wissen wir, dass von den Genen mit bekannter Funktion die weitaus meisten in Signalwegen wirken, die an der ökologischen Anpassung beteiligt sind. Dazu gehören Resistenzgene und Gene, die die Körpergröße regulieren oder die Sinneswahrnehmung beeinflussen. Andererseits wurden aber auch Gene identifiziert, die sich nicht einfach in das herkömmliche Bild der ökologischen Anpassung einordnen lassen. Beispielsweise wurde positive Selektion an einem der beiden polyhomeotic-Gene nachgewiesen (Box). Dieses Gen kodiert für einen Transkriptionsrepressor (aus der Polycomb-Gruppe). Mensch: Die Analyse der HapMap-Daten hat zur Lokalisierung zahlreicher Genregionen im menschlichen Genom geführt, die Evidenz für Selektion aufweisen. Zunächst hat man sich dabei auf so genannte unvollständige hitchhiking-Ereignisse konzentriert, also Selektionsereignisse, in denen das vorteilhafte Allel noch auf dem Weg zur Fixation ist, sich in der Population aber noch nicht vollständig durchgesetzt hat[10]. Statt einer Reduktion der Variation führt dies zu einem Muster, in dem die genetische Variation in langen Haplotypen organisiert ist. Das bekannteste Beispiel hierfür ist die Genregion, die das für das Aufspalten von Milchzucker verantwortliche Lactase-Gen enthält. Bekanntlich ist dieses Gen in Nordeuropäern seit der Verbreitung der Milchwirtschaft (seit ca. 12.000 Jahren) unter positiver Selektion, nicht aber in anderen Populationen (also beispielsweise nicht bei Asiaten). Weitere Klassen von Genen, die man bei der Analyse der HapMapDaten in den insgesamt 700 identifizierten Genomregionen gefunden hat, umfassen Pigmentgene und Gene, die die Gehirngröße beeinflussen. Ähnliche Klassen von Genen wurden auch gefunden, wenn die HapMapDaten auf Stellen im Genom durchsucht wurden, an denen die genetische Variation – ähnlich wie bei D. melanogaster – reduziert ist[11]. BIOspektrum | 03.08 | 14. Jahrgang 225_261_BIOsp_0308.qxd 25.04.2008 9:43 Uhr Seite 257 257 Schlussbemerkungen Es ist zu erwarten, dass der hier aufgezeigte Ansatz neue Impulse für die Untersuchung der Adaptation liefert. Zum einen wird vom Fisher’schen Diktum der Gesamtheit der Merkmale (bzw. des Genoms) ausgegangen, zum anderen können – aufgrund der Kenntnis der involvierten Gene – gezielt adaptive Merkmale analysiert werden. Jedoch ist auch offensichtlich, dass der Weg bis zu einem adäquaten Verständnis der Adaptation noch weit ist. Ein solches Verständnis der Adaptation erfordert nämlich eine detaillierte Charakterisierung der mithilfe der Selektion identifizierten Gene. Hier stehen wir aber noch am Anfang. Danksagung Dieses Projekt wird durch die VolkswagenStiftung und DFG gefördert. ó Literatur [1] Fisher, R. A. (1958): The genetical theory of natural selection. Dover Publications, New York (Second edition). [2] Kim, Y., Stephan, W. (2002): Detecting a local signature of genetic hitchhiking along a recombining chromosome. Genetics 160: 765–777. BIOspektrum | 03.08 | 14. Jahrgang [3] International HapMap Consortium (2007): A second generation human haplotype map of over 3.1 million SNPs. Nature 449: 851–861. [4] Glinka, S., Ometto, L., Mousset, S., Stephan, W., De Lorenzo, D. (2003): Demography and natural selection have shaped genetic variation in Drosophila melanogaster: a multilocus approach. Genetics 165: 1269–1278. [5] Ometto, L., Glinka, S., De Lorenzo, D., Stephan, W. (2005): Inferring the effects of demography and selection on Drosophila melanogaster populations from a chromosomewide scan of DNA variation. Mol. Biol. Evol. 22: 2119–2130. [6] Ihle, S., Ravaoarimanana, I., Thomas, M., Tautz, D. (2006): An analysis of signatures of selective sweeps in natural populations of the house mouse. Mol. Biol. Evol. 23: 790–797. [7] Nielsen, R., Williamson, S., Kim, Y. et al. (2005): Genomic scans for selective sweeps using SNP data. Genome Res. 15: 1566–1575. [8] Li, H., Stephan, W. (2006): Inferring the demographic history and rate of adaptive substitution in Drosophila. PLoS Genetics 2: e166. [9] Hutter, S., Li, H., Beisswanger, S., De Lorenzo, D., Stephan, W. (2007): Distinctly different sex ratios in African and European populations of Drosophila melanogaster inferred from chromosome-wide single nucleotide polymorphism data. Genetics 177: 469–480. [10] Voight, B. F., Kudaravalli, S., Wen, X., Pritchard, J. K. (2006): A map of recent positive selection in the human genome. PLoS Biology 4: e72. [11] Williamson, S. H., Hubisz, M. J., Clark, A. G. et al. (2007): Localizing recent adaptive evolution in the human genome. PLoS Genetics 3: e90. [12] Beisswanger, S., Stephan, W. (2008): Evidence that strong positive selection drives neofunctionalization in the tandemly duplicated polyhomeotic genes in Drosophila. Proc. Natl. Acad. Sci. USA 105: 5447–5452. Korrespondenzadresse: Prof. Dr. Wolfgang Stephan Biozentrum, LMU München Großhaderner Straße 2 D-82152 Planegg-Martinsried Tel: 089-2180-74102 Fax: 089-2180-74104 [email protected] www.zi.biologie.uni-muenchen.de/evol AUTOR Wolfgang Stephan Physik-Studium in Erlangen, Promotion in Konstanz, anschließend an der University of Sussex (bei J. Maynard Smith und B. Charlesworth) und National Institutes of Health (bei C. H. Langley) mit Schwerpunkt Populationsgenetik. 1989–2000 tenure track vom Assistant zum Full Professor an amerikanischen Universitäten. Seit 2000 Leiter des Bereiches Evolutionsbiologie der LMU München.