Methoden 239 B I O S P E K T R U M • 3. 0 1 • 7. J A H R G A N G Alle Gene gleichzeitig: Transkriptionsprofilierung in der mikrobiellen Stammoptimierung Oliver Sorgenfrei, F+E Mikrobiologie, BASF-LYNX Bioscience AG A Zahlreiche mikrobielle und einige eukaryontische Genome sind dank mehrerer Genomsequenzierungsprojekte mittlerweile bekannt. Zwar wurden selbst bei sehr intensiv untersuchten Modellorganismen viele offene Leseraster (ORFs) unbekannter Funktion gefunden, doch eine vorliegende Genomsequenz erlaubt dennoch einen recht tiefen Einblick in die möglichen Eigenschaften des sequenzierten Organismus. Welche Eigenschaften allerdings unter welchen Umständen zu beobachten sind, ist aus der Genomsequenz nicht ablesbar. Auch Zellen mit identischer Genomsequenz können sehr verschiedene Phänotypen und physiologische Eigenschaften zeigen. So verändert sich der Metabolismus eines Mikroorganismus stark in Abhängigkeit vom Medium und der Wachstumsphase. Zellen aus verschiedenen Geweben eines Organismus enthalten dasselbe Genom, haben aber völlig andere Aufgaben und Eigenschaften. Zum großen Teil sind diese Unterschiede auf die unterschiedliche Expression ganzer Gengruppen unter veränderten Bedingungen zurückzuführen. Die vollständige und gleichzeitige Analyse der Transkription aller Gene einer Zelle (Transkriptionsprofilierung) erlaubt eine umfassende Charakterisierung des physiologischen Zustands dieser Zelle. Daher ist die Transkriptionsprofilierung ein effektives Werkzeug, das in unterschiedlichen Bereichen, wie zum Beispiel bei der Produktivitätssteigerung von Mikroorganismen oder der Aufklärung von Wirkmechanismen von Antibiotika, einsetzbar ist. Auch das Auffinden neuer Angriffspunkte für Medikamente und die Prüfung auf unerwünschte Nebenwirkungen von Leitsubstanzen aus der pharmazeutischen Entwicklung sind Einsatzgebiete der Transkriptionsprofilierung. Verschiedene Methoden für verschiedene Anforderungen Für die Transkriptionsprofilierung stehen eine Reihe von Methoden zur Verfügung, die sich sowohl bezüglich des Aufwands als auch der Qualität und Quantität der erhaltenen Daten unterscheiden. Zum einen gibt es Methoden, mit denen eine begrenzte (wenn auch große) Zahl von Transkripten analysiert werden kann. Hier ist an erster Stelle die DNA-Array-Technologie zu nennen. Hierbei können einige zehntausend Gene gleichzeitig untersucht werden. Da bei der DNA-Array-Technologie ausschließlich Gene analysiert werden, für die entspre- chende Proben auf einen festen Träger immobilisiert wurden, hat man es hier mit einem geschlossenen System zu tun (Abb.1). Im Unterschied hierzu gibt es auch Methoden, die die Anzahl der untersuchten Gene nicht a priori begrenzen. Diese offenen Systeme finden vor allem bei der Analyse komplexer Organismen Anwendung. In diesen Bereich gehören unter anderem verschiedene „differential display“-Methoden und subtraktive Hybridisierungen (Abb.1). In beiden Fällen werden differentiell exprimierte Gene aus komplexen Mischungen isoliert; quantitative Aussagen über alle Gene gleichzeitig sind jedoch nur bedingt möglich. Ebenfalls zu den offenen Systemen zu rechnen sind so genannte Tag-Sequencing-Methoden (Abb.1.). Diese zielen darauf ab, von jedem mRNAMolekül einer Zelle eine bestimmte kurze Sequenz (Signature) zu erhalten. Hier sind zum Beispiel Methoden wie serial analysis of gene expression (SAGE™) (1) und massively parallel signature sequencing (MPSS®) (2) zu erwähnen. Die MPSS®-Technologie basiert auf der Fixierung jedes einzelnen mRNAMoleküls auf ein spezifisches Glaskügelchen (Bead). Die so auf Beads gebrachten Moleküle können dann hochparallel (etwa 350.000 gleichzeitig) sequenziert werden. Da jedes Bead ein mRNA-Molekül repräsentiert, korreliert die Frequenz, mit der eine bestimmte Signatur beobachtet wird, mit der Expressionshöhe. Die Grenze zwischen geschlossenen Systemen, bei denen die Analyse auf einen festgelegten Satz von Genen beschränkt ist, und offenen Systemen, die die Analyse aller Gene eines Organismus erlauben, verschwimmt im Falle von Mikroorganismen. Die meisten Mikroorganismen besitzen weniger als 10.000 Gene, somit können mit DNA-Arrays alle Gene gleichzeitig analysiert werden. Für die Herstellung und Auswertung von DNA-Arrays gibt es verschiedene Ansätze. Allen gemeinsam ist, dass DNA-Sonden in einer hochdichten Anordnung auf einen festen Träger aufgebracht werden. Dieser Array wird dann für die Hybridisierung eingesetzt. Anschließend wird für jede DNA-Sonde auf dem Array quantifiziert, wieviel markierte Probe dort hybridisiert hat (Abb.2). Ein Unterschied zwischen verschiedenen DNA-Array-Technologien liegt in der Herstellung der DNA-Arrays. Die Firma Affymetrix beispielsweise synthetisiert Oligonukleotide mittels einer photolithographischen Methode direkt auf einer Oberfläche. Hierfür werden aus der Sequenz der zu untersuchenden ORFs geeignete Sequenzen ausgewählt. Während sich mit dieser Technik sehr hohe Dichten erzielen lassen, ist die Länge der Sonde, die für eine spezifische Hybridisierung zur Verfügung steht, begrenzt. Ein anderer Ansatz besteht darin, vorher produzierte DNA auf einen Träger zu übertragen. Üblicherweise werden hierbei PCR-Produkte verwendet, die mit ORFspezifischen Primern hergestellt wurden. Darüber hinausgehend werden bei BASFLYNX auch DNA-Arrays für nicht sequenzierte Mikroorganismen hergestellt. Hierfür werden zunächst genomische Fragmente geeigneter Größe in einen Vektor kloniert, anschließend werden die Inserts amplifiziert und auf Arrays übertragen. Für die Ablage der DNA-Sonden als hochdichte Arrays werden ebenfalls verschiedenen Techniken eingesetzt. Zu den am weitesten verbreiteten Methoden gehören neben piezoelektrischen Methoden, die sich an die Funktionsweise eines Tintenstrahldruckers anlehnen, verschiedene Kontakt-Printing-Verfahren, bei denen eine Nadel in die zu übertragende Lösung eintaucht und dann eine bestimmte Menge Lösung überträgt. Als Trägermaterialien für die Arrays kommen in erster Abb. 1: Verschiedene Technologien der Transkriptionsprofilierung und ihre Vorund Nachteile Methoden 240 Linie modifizierte Gläser und Nylonmembranen zum Einsatz. Während bei Glas als Trägermaterial die Dichte der Arrays in der Regel über 1000 Spots/cm2 beträgt, werden auf Nylonmembranen nur Dichten von 100150 Spots/cm2 erreicht. Das verwendete Trägermaterial entscheidet auch über die Art der verwendeten Markierung. Fluoreszenzmarkierungen, die eine gleichzeitige kompetitive Hybridisierung mit unterscheidbaren Markierungen erlaubt, kommen vor allem auf Glasoberflächen zum Einsatz, da bei Nylonmembranen eine hohe Eigenfluoreszenz die Detektion erschwert. Entsprechend werden für Hybridisierungen auf Nylonmembranen hauptsächlich radioaktive Markierungen verwendet. Durch den Einsatz von DNA-Arrays wird in jedem einzelnen Experiment eine große Datenmenge erzeugt. Je nach Fragestellung steigen die zu verarbeitenden Datenmengen sehr schnell an, so dass häufig weit mehr als 100.000 Datenpunkte zu analysieren sind. Um aus dieser Datenmenge die relevanten Informationen zu erhalten, ist eine leistungsfähige Bioinformatik erforderlich. Diese muss nicht nur Algorithmen bereitstellen, die Gene mit ähnlichen Transkriptionsmustern gruppieren – clustern – (Abb. 3), sondern muss auch in der Lage sein, Informationen aus anderen Experimenten und Datenbanken mit den Transkriptionsdaten zu verknüpfen. Transkriptionsprofilierung für verbesserte mikrobielle Produktionsstämme Fermentative Prozesse (d.h. die Verwendung lebender Zellen als Stoffproduzenten oder Stoffumwandler) bieten in vielen Fällen eine attraktive und kostengünstige Alternative gegenüber chemischen Synthesen von Feinchemikalien. Komplexere Produkte, wie beispielsweise Proteine, lassen sich B I O S P E K T R U M • 3. 0 1 • 7. J A H R G A N G ausschließlich fermentativ herstellen. Die effiziente Optimierung solcher Prozesse ist essentiell, um im Wettbewerbsumfeld zu bestehen. Während in der Vergangenheit mikrobielle Produktionsstämme hauptsächlich durch ungezielte Mutagenese und anschließende Selektion optimiert wurden, gewinnen zielgerichtete Methoden der Stammoptimierung zunehmend an Bedeutung. Da für viele fermentativ hergestellte Produkte die Biosynthesewege bekannt sind, waren die direkt beteiligten Enzyme häufig verwendete Ziele einer Stammoptimierung. In vielen Fällen hat sich allerdings gezeigt, dass die Beeinflussung der Expression eines Genes nicht den erwarteten Effekt zeigte. Vielmehr ist häufig eine aufeinander abstimmte Beeinflussung mehrerer Gene notwendig. Die Kenntnis von regulatorischen Netzwerken der Zelle stellt somit eine wichtige Voraussetzung für ein zielgerichtetes und schnelles Vorgehen bei der Stammoptimierung dar. Eine allumfassende Methode wie die Transkriptionsprofilierung bietet die Möglichkeit, Einblicke in die regulatorischen Netzwerke zu erhalten. Wird zum Beispiel ein Mikroorganismus durch einen äußeren Reiz – wie Hitze, hohe Osmolarität, ein Antibiotikum oder einen Enzyminhibitor␣ – beeinflusst, so lassen sich durch eine Transkriptionsprofilierung die dadurch betroffenen Gene feststellen. Ein Vergleich der Transkritionsprofile verschiedener Stämme liefert Daten über produktionsrelevante Gene, die außerhalb des direkten Biosynthesewegs liegen und daher nur durch einen umfassenden Ansatz wie die Transkriptionsprofilierung identifiziert werden können. Durch die Analyse eines Fermentationsverlaufs mittels Transkriptionsprofilierung kann festgestellt werden, welche Gene in ihrer Expressionshöhe beispielsweise mit der Produktionsrate korrelieren. Neben Genen, die die Produktionsrate positiv beeinflussen, können auch Gene entdeckt werden, die die Produktionsrate verschlechtern. In beiden Fällen gewinnt man Informationen darüber, welche Gene produktionsrelevant sind und somit interessante Angriffspunkte für die Stammoptimierung darstellen. Die Untersuchung der Expressionsmuster während eines Fermentationsverlaufs liefert nicht nur Daten über produktionsrelevante Gene, sondern auch über den physiologischen Zustand der Zellen während der Fermentation. Diese Informationen können dann auch ohne Veränderung des Stammes zur Verfahrensoptimierung genutzt werden. Nachdem die Expression von Genen verändert wurde, ist die Transkriptionsprofilierung ein wichtiges analytisches Werkzeug, um den veränderten Stamm zu charakterisieren und festzustellen, ob neben der beabsichtigten Veränderung in der Zelle unvorhergesehene Nebeneffekte aufgetreten sind. Diese Art der Analyse ist nicht nur im Bereich der industriellen Stammoptimierung wichtig, sondern auch im Rahmen der Grundlagenforschung. Wird beispielsweise ein Gen noch unbekannter Funktion deletiert und ein veränderter Phänotyp beobachtet, so muss untersucht werden, ob der Phänotyp nicht dadurch auftritt, dass das regulatorische Netzwerk der Zelle reagiert und Sekundäreffekte erzeugt. Nur dann kann der beobachtete Phänotyp mit der Funktion des Gens gleichgesetzt werden. Die Sequenzierung von Genomen stellt dem Wissenschaftler das Inventar an allen Genen zur Verfügung. Mit Hilfe dieser Informationen kann vorhergesagt werden, welche Stoffwechselwege prinzipiell vorhanden sein könnten und welche ausgeschlossen werden können (metabolische Rekonstruktion). Die Transkriptionsprofilierung stellt das dynamische Bild der aktiven Gene zur Verfügung. Diese Informationen ermöglichen Einblicke in die unter bestimmten Bedingungen aktiven Stoffwechselvorgänge. Aus der Gesamtheit von Daten aus verschiedenen Messungen werden relationale Datenbanken erzeugt, mit deren Hilfe Einblikke in die regulatorischen Funktionen einer Zelle möglich sind. Literatur (1) Velculescu V.E., Zhang L., Vogelstein B., Kinzler K.W. (1995) Serial analysis of gene expression. Science, 270: 484-487. (2) Brenner S, Johnson M, Bridgham J, Golda G, Lloyd DH, Johnson D, Luo S, McCurdy S, Foy Abb. 2. Herstellung, Hybridisierung und Auswertung eines DNA-Arrays M, Ewan M, Roth R, George D, Eletr S, Albrecht G, Vermaas E, Williams SR, Moon K, Burcham T, Pallas M, DuBridge RB, Kirchner J, Fearon K, Mao J, Corcoran K (2000) Gene expression Methoden B I O S P E K T R U M • 3. 0 1 • 7. J A H R G A N G analysis by massively parallel signature sequencing (MPSS) on microbead arrays. Nat. Biotechnol.,18: 630-634 Korrespondenzadresse Dr. Oliver Sorgenfrei F+E Mikrobiologie BASF-LYNX Bioscience AG Im Neuenheimer Feld 515 D-69120 Heidelberg Tel.: 06221-454 728 Fax: 06221-454 778 eMail: [email protected] Abb. 3: Beispiel für ein hierarchisches Clustering von Transkritionsprofilen. Für jedes Gen ist die Expressionshöhe zu verschiedenen Zeitpunkten einer Fermentation farblich dargestellt: rot= hohe Expression, blau= niedrige Expression. Die Zeitpunkte während der Fermentation sind zeilenweise angeordnet, die Gene spaltenweise. Beim hierarchischen Clustering werden jeweils Gene mit ähnlichen Expressionscharakteristika nebeneinander dargestellt. 241