Special 91 Proteomanalyse Prof. Dr. Dr. Joachim Klose Humboldt-Universität zu Berlin, Charité, Institut für Humangenetik Proteomanalyse bedeutet Auftrennung, Identifizierung und funktionelle Charakterisierung möglichst aller Proteine eines bestimmten Zelltyps oder Gewebes unter den gegebenen biologischen Bedingungen des Organismus. Die funktionelle Charakterisierung der Proteine führt zugleich zur Aufklärung der spezifischen Funktion der entsprechenden Gene. Eine genetische Analyse von Proteinpolymorphismen zeigte jedoch, dass selbst ein einzelnes Protein polygener Natur ist. Für die Anwendung der Proteomanalyse werden verschiedene Strategien aufgezeigt. Funktionelle Genomanalyse Funktionelle Genomanalyse wurde definiert als „the attachment of information about function to the knowledge of DNA sequence“[1]. Streng genommen bedeutet dann funktionelle Genomanalyse die Bestimmung der spezifischen Funktion für jedes Gen eines Genoms. Eine Vorgehensweise, die heute am ehesten geeignet erscheint, die spezifische Funktion eines Gens herauszufinden, ist das molekulargenetische Ausschalten (Knock-out) eines Gens eines Organismus und die Bestimmung der Veränderung, die in Folge dessen phänotypisch im Organismus auftritt. Mit dem Knock-outVerfahren wurden jedoch oft Überraschungen erlebt[2]. Das Ausschalten eines wichtigen Wachstumfaktors bei der Maus, zum Beispiel, bewirkte keineswegs, dass die Mäuse, die mit diesem Defekt geboren wurden, ganz klein blieben oder gar nicht lebensfähig waren – ihnen fehlten lediglich ein paar Barthaare. Es ist inzwischen ganz offensichtlich geworden, was aber eigentlich schon immer klar war, dass die einzelnen Eigenschaften eines Organismus immer von mehreren Genen abhängen, und dass es dabei auch alternative Stoffwechselwege gibt. Änderungen im Phänotyp eines Organismus, in Folge einer Mutation, spiegeln nicht die Funktionen des mutierten Gens wieder, sondern die Folge von irregulären Interaktionen einer Anzahl von Genen, die durch den GenBIOspektrum · 1/02 · 8. Jahrgang Abb. 1: Einzelne Schritte der Proteomanalyse defekt ausgelöst wurden. Das gilt nicht nur für Eigenschaften, die den äußeren Phänotyp eines Organismus prägen, sondern für Merkmale auf allen Ebenen der Genexpression, der morphologisch/histologischen, der physiologischen, zellulären und biochemischen Ebene[3]. Man kann jedoch annehmen, dass die genetische Komplexität, das Netzwerk zwischen Genotyp und Phänotyp, immer einfacher wird, je dichter am Gen man das funktionelle Geschehen untersucht. Demnach müsste die spezifische Funktion der Gene am besten zu erfassen sein, wenn man das Protein eines jeden Gens genau charakterisiert. Je genauer die Eigenschaften eines Proteins untersucht sind, je genauer kann man die Funktion dieses Proteins und damit die seines Gens beschreiben. „The genome’s only orders are to make a polypeptide with a particular function. It speaks ‘biochemistry’ not ‘phenotypes’“ [4]. Proteomanalyse Die Genom-weite Identifizierung und Charakterisierung der Proteine eines Organismus ist das Ziel der Proteomanalyse. Proteomanalyse ist systematische, funktionelle Genomanalyse. Es gibt jedoch viel mehr Proteine als Gene in einem Organismus. Die Proteine treten gewöhnlich in mehreren Isoformen auf, als Folge von alternativem Splicing, Protein-Processing, co- und posttranslationalen Modifikation und Fragmentierung von Proteinen. Ferner ist die Proteinzusammensetzung unterschiedlich von Zelltyp zu Zelltyp und hängt innerhalb eines Zelltyps vom Differenzierungs- und Alterungsstadium der Zellen ab. Proteomanalyse ist daher weniger auf das gesamte Proteom eines Organismus gerichtet, als vielmehr auf das Proteom eines bestimmten Zelltyps oder Gewebes zu einem bestimmten Zeitpunkt. Special 92 Abb. 2: Lokalisierung der Gene einer Anzahl von Proteinen auf den Chromosomen der Maus. Die genetische Kartierung von Proteinpolymorphismen zeigte, dass ein einzelnes Protein von mehreren Genen abhängt. Die Polymorphismen wurden durch Vergleich von zweidimensionalen Proteinmustern zweier unterschiedlicher Mäusearten entdeckt und betrafen verschiedene Eigenschaften der Proteine (Molekulargewicht, pI, Quantität, Isoformen). Auftrennung der Gewebsproteine 2D-Elektrophorese Proteomanalyse bedeutet zunächst Auftrennung und Darstellung möglichst aller Proteine eines Gewebes. Die klassische und bisher nicht übertroffene Methode zur Auftrennung komplexer Proteinextrakte aus Geweben ist die zwei-dimensionale Elektrophorese (2-DE). Diese Technik wurde ursprünglich von mir[5] und – unabhängig davon – von O’Farrell [6] entwickelt und ist seit dem unter verschiedenen Aspekten weiterentwickelt worden: Höhere Auflösung, bessere Reproduzierbarkeit, neue Nachweisverfahren für die aufgetrennten Proteine, Entwicklung von Computerprogrammen zur Imageanalyse und Auswertung der 2-DEMuster. Von industrieller Seite wurde viel an der Vereinfachung der 2-DE-Technik gearbeitet. Hier war insbesondere die Einführung der immobilisierten pH-Gradienten (IPG) in Form von Gelstrips ein wichtiger Schritt . Ein besonderes Anliegen in der Weiterentwicklung der 2-DE in unserem Labor war, eine maximale Auflösung der Proteinextrakte zu erreichen. Wir verfolgten damit unsere ursprüngliche Idee, Proteinanalytik nicht nur durch intensive Untersuchung einzelner Proteine zu betreiben, sondern den Blick auch auf die Gesamtheit der Proteine eines Zelltyps zu richten (ein Konzept, das in Bezug auf die Gene auch der Genomanalyse zugrunde liegt). Mit der Entwicklung einer Großgeltechnik[7,8,9], basierend auf Tubegelen und Carrier-Ampholyten, haben wir die Trennleistung der 2-DE erheblich verbessert und eine Auflösung von über 10 000 Proteinspots in einem Gel erreicht. Das bedeutet jedoch nicht, dass damit alle Proteine eines Gewebes dargestellt werden könnten. Diesem Ziel kann man nur nahe kommen, wenn man die Proteine eines Gewebes nach systematischer Fraktionierung und Konzentrierung auftrennt. Massenspektrometrie Ein wichtiger Schritt für die heutige Proteomanalyse war die Weiterentwicklung der Massenspektrometrie von Proteinen in Richtung steigender Empfindlichkeit. So wurde es möglich, die Peptidzusammensetzung einzelner Proteinspots aus 2-DE-Gelen zu analysieren und anhand der Peptidmassen über Sequenzdatenbanken die Proteine eines 2-DE-Musters zu identifizieren. Die Geräteindustrie bemüht sich heute für die Proteomanalyse komplette Gerätestraßen (Abb.1) anzubieten. Dabei ist zur Zeit der größte Engpass die automatische Auswertung der 2-DE-Muster. Obwohl es sehr weit fortgeschrittene Computerprogramme zu Spotdetektierung und zum Vergleich von Proteinmustern gibt, bleibt es dem Untersucher nicht erspart, jedes Computermuster BIOspektrum · 1/02 · 8. Jahrgang Special 93 am realen Spotmuster zu überprüfen, Spot für Spot. Da geringe Intensitätsschwankungen von Spots oder im Gelhintergrund darüber entscheiden können, ob das Computerprogramm zur Imageanalyse zwei eng benachbarte Spots als zwei oder einen Spot registriert, treten ohne visuelle Kontrolle beim Matchen zweier Muster – dem eigentlichen Auswertungsvorgang – sehr schnell Fehler auf. Mit diesem Problem eng verbunden ist ein anderes grundlegendes Problem: Die genaue Quantifizierung der Proteinspots. Abgesehen davon, dass kaum ein Farbstoff für die Quantifizierung alle idealen Eigenschaften aufweist (hohe Empfindlichkeit, langer linearer Bereich, homogene Färbung der Proteinspots, gleiche Reaktion bei verschiedenen Proteinen), ist eine genaue, quantitative Auswertung eines Proteinmusters immer an mehrere Wiederholungsläufe gebunden, selbst bei guter Reproduzierbarkeit der Muster. Das führt sehr schnell zu einem Umfang an Proteinmustern, der ohne vollautomatische Auswertung nicht zu bewältigen ist. Proteinchiptechnologie Es sind heute Bemühungen im Gange, die 2-DE durch andere Methoden zu ersetzen. Proteinchiptechnologie bietet dabei einen neuen Weg, ebenso wie Versuche, die einzelnen Proteine komplexer Gemische direkt durch Massenspektometrie zu identifizieren. Dabei zeigt sich, dass jede Methode ihre eigenen Vorteile hat; eine ideale Methode, die allen Anforderungen gerecht wird, kann es kaum geben. Der besondere Vorteil der 2DE liegt in der Möglichkeit, Proteinisoformen (posttranslationale Modifikationen) und genetische Polymorphismen erfassen zu können und die Proteine in einer Weise zu erhalten , die noch einigermaßen gut erlaubt, Rückschlüsse auf die relative Konzentration der Proteine im Gewebe ziehen zu können. Unübersehbar ist auch der Vorteil, Tausende von Proteinen nebeneinander im gleichen Bild studieren zu können. Charakterisierung der Proteine Proteinphänotypen und ihre Gene Entscheidend für die Proteomforschung ist die Charakterisierung der einzelnen Proteine, die aufgetrennt wurden. Hier könnte man zwischen einer chemischen und einer biologischen Charakterisierung unterscheiden. Chemische Eigenschaften der Proteine wären: Die Aminosäuresequenz, die Seitenkettenmodifizierungen, Konformation, Bindungs-eigenschaften und die verschiedenen funktionellen Formen, die z.B. durch alternatives Splicing, Protein-Processing, Transport oder begrenzter Fragmentierung der Proteine entstehen. Biologische Eigenschaften wären: Die Spezifität der Proteine für die verschiedenen Zelltypen, Entwicklungs- und Alterstadien eines Organismus und für das Geschlecht; ferner quantitative Eigenschaften wie Konzentration des Proteins in der Zelle und turn-over-Rate, genetische Merkmale wie Polymorphismen und Art der Vererbung und die Sensitivität der Proteine gegenüber verschiedenen Umwelteinflüssen. Zu Zeiten der klassischen Proteinchemie war das unumstößliche Forschungskonzept, ein einzelnes Protein herauszugreifen – z.B. das Hämoglobin, das leicht zu isolieren war – und dann mit allen verfügbaren Methoden zu untersuchen. Obwohl detailierte Untersuchungen an einzelnen Proteinen auch heute noch unabdingbar sind, geht die Entwicklung doch weiter dahin, für die verschieden Untersuchungsmethoden Large-Scale-Techniken zu entwickeln. Die 2-DE selbst ist hierfür ein gutes Beispiel, aber auch die Chiptechnologie, das Two-Hybrid-System und die Massenspektrometrie. Viele der oben genannten Proteineigenschaften können mit der 2-DE gleichzeitig an Tausenden von Proteinen untersucht werden. Heute werden geradezu Proteinfabriken aufgebaut, um Eigenschaften – selbst solche wie die Raumstruktur der Proteine – an Hunderten und Tausenden von Proteinen untersuchen zu können. Wenn Proteomanalyse funktionelle Genomanalyse bedeutet, dann muss auch für jedes Protein, das durch Auftrennung gefunden und anschließend charakterisiert wurde, das zugehörige Gen gefunden werden. Mit der Sequenzierung ganzer Genome und der Erkennung der einzelnen Gene in diesen Sequenzen und – andererseits – mit der Fähigkeit der Massenspektrometrie auch einzelne Sequenzabschnitte von Proteinen zu erkennen, wird die ProteinGen Identifizierung immer einfacher. Die oben genannten Eigenschaften eines Proteins hängen aber nicht nur von seinem Strukturgen ab. Regulierende und modifizierende Gene bestimmen den „Proteinphänotyp“ mit. Bei der Protein-Gen Identifizierung geht es daher auch um die Erfassung dieser Gene. Ein 2-DE-Muster kann für jedes einzelne Protein eine ganze Anzahl von verschiedenen Phänotypen erkennen lassen. Molekulargewicht (ungefähr), pI (ungefähr), Spotvolumen, Spot da/nicht da, verschiedenen Typen von „Isospots“, turn-overRate (bei radioaktiver Markierung), Entwicklungsprofile (bei Vergleich verschiedener Embryonalstadien) u.a.. Die Gene, die diesen Phänotypen zugrunde liegen – Protein-Modifier – können nicht über Sequenzanalyse gefunden werden. Hier gibt es aber die Möglichkeit auf genetischem Wege, Phänotyp-Genotyp Beziehungen von Proteinen zu erkennen. Wir haben 2-DEMuster von Gehirnproteinen von zwei verschiedenen Mäusearten, Mus musculus und Mus spretus untersucht. Da diese zwei Mäusearten phylogenetisch relativ weit auseinander liegen, fanden wir eine große Anzahl von Proteinpolymorphismen zwischen diesen beiden Arten (etwa 1300 polymorphe Spots unter 8700 Proteinspots)[10]. Die Polymorphismen betrafen 2-DE-Phänotypen wie Spotposition (horizontale, vertikale oder schräge Verschiebung), Spotvolumen (quantitative Unterschiede, Spot da/nicht da) und Special 94 Auftreten von Isoformen (Unterschiede in Anzahl und Position von Isospots). Wir haben die Gene, die diesen Polymorphismen zugrunde liegen, durch Rückkreuzungsanalyse auf den Mauschromosomen kartiert. Für eine ganze Anzahl von Proteinen konnten wir mehrere Gene (bis zu drei pro Protein) kartieren (Abb.2). Hier handelte es sich offenbar um Regulator- und Modifiergene einzelner Proteine. Der Nachweis, dass selbst ein einzelnes Protein ein polygenes Merkmal ist, wirft ein Licht auf die Komplexität polygener Krankheiten. Strategien in der Proteomanalyse Untersuchungen im Bereich der Proteomanalyse verlaufen heute üblicher Weise wie folgt (Strategie A): Man nimmt ein bestimmtes biologisches Material (Herz, Gehirn; Blatt, Stengel; Zellkultur, Mikroorganismus), das durch eine bestimmte Ursache (Krankheit, Mutation, toxischer Effekt, Umweltfaktoren) verändert ist, und extrahiert die Proteine aus dem Gewebe oder aus einer bestimmten Gewebsfraktion. Die Proteine werden dann durch 2-DE aufgetrennt und das erhaltene Proteinmuster wird mit dem 2-DE-Muster des entsprechenden Normalgewebes verglichen. Unterschiedliche Proteinspots (meist quantitative Unterschiede) werden durch Massenspektrometrie analysiert. Die Peptidmassenprofile führen über Sequenzdatenbanken meist zu einem bekannten Protein. Es werden dann Datenbanken über Proteine, Genexpression, Stoffwechselwege, Phänotypen usw. herangezogen (Bioinformatik), um einen Zusammenhang zwischen dem veränderten Protein(en) und dem Auslöser der Veränderung zu finden. Mit einer solchen Strategie, in dieser einfachen Form, hat man jedoch nur geringe Erfolgsaussichten. Wenn ein bestimmter Zelltyp schätzungsweise 10 000 unterschiedliche Proteine exprimiert und jedes Protein durchschnittlich in schätzungsweise 3 Isoformen auftritt, müssten wir etwa 30 000 Proteinspots zu Gesicht bekommen, um mit Sicherheit ein Protein zu finden, das von der Störung betroffen ist. Wenn aber wie üblich nur 2–3 Tausend Spots in einem 2DE-Muster aufgetrennt werden, ist die „Chance“, dieses Protein nicht zu finden 90% und höher. Trotzdem findet man auch immer Unterschiede. Aber diese können technische oder ganz normale genetische oder physiologische Ursachen haben. Strategie A hat daher nur Aussicht auf Erfolg, wenn sie mit sehr großem Aufwand betrieben wird: Untersuchung mehrerer Zellfraktionen bei hoher Proteinkonzentration und maximaler Auflösung in der 2-DE; mehrfache Wiederholung der Experimente bei guter Reproduzierbarkeit und Verwendung brauchbarer Auswertungsverfahren; und besonders wichtig: Zur Beurteilung der beobachteten varianten Proteine muss man die Möglichkeit haben, noch andere Parameter heranziehen zu können, z.B.: Korrelieren die Proteinveränderungen mit dem Krankheitsverlauf?, Zeigt die Proteinvariante (z.B. bei Mutagenitätsuntersuchungen) im Kreuzungsexperiment eine Vererbung?, Treten die Proteinveränderungen im Zusammenhang mit bestimmten Symptomen in einem anderen Bereich des betroffenen Organismus auf? Anhand solcher Parameter kann man prüfen, ob unter den varianten Proteinen überhaupt welche zu finden sind, die eine weitere Untersuchung lohnen. Eine andere Strategie (B) in der Proteomanalyse befasst sich von vornherein nur mit den Proteinen, die ein 2-DE-Muster sauber und reproduzierbar bietet, d.h. es kommt nicht darauf an, ob ein ganz bestimmtes, z.B. krankheitsrelevantes Protein mit dem Proteinmuster erfasst wurde oder nicht. Mit einem solchen Proteinmuster, von vielleicht einigen Tausend Spots, kann man Fragen untersuchen, die auf das generelle Funktionieren der Proteine in der Zelle gerichtet sind, z.B.: Wie groß ist die genetische Variabilität der Proteine zwischen Individuen einer Population? Wie stark ist die Fluktuation der Proteine in frühen Entwicklungsstadien (z.B. von omnipotenten Stammzellen zu differenzierten Zellen), kurz nach der Geburt oder im Alter? Welche Proteine interagieren miteinander, welche mit besonders vielen anderen Proteinen (Frage nach Proteinkomplexen, nach „Schlüsselproteinen“)? Mit dieser Strategie forscht man auf ziemlich sicherem Boden, die Fragen richten sich aber allein auf biologische Probleme, sie ziehlen nicht auf einen unmittelbaren Anwendungszweck. Strategie B mündet in letzter Konsequenz in Strategie C, die systematische Auftrennung, Charakterisierung und genetische Analyse aller Proteine eines Organismus, wie eingangs beschrieben. Das Besondere dieser Strategie ist, dass sie nur langfristig Erfolg bringt. Sie geht einher mit technischen Verbesserungen und Neuentwicklungen und beschert zunächst keinerlei praktischen Nutzen. Betrachten wir das Ganze, bleibt unbestritten, dass alle drei Strategien ihre Berechtigung haben und Anwendung finden müssen. In der praktischen Forschung wird aber fast ausschließlich nur Strategie A verfolgt. Die Erklärung liegt auf der Hand: Strategie A birgt die Hoffnung, auf schnellem Wege zu einem Ergebnis zu kommen, das von praktischem Nutzen ist. Strategie B und C fallen in die Kategorie Grundlagenforschung, die keinen unmittelbaren Nutzen bringt. Das Paradoxe aber ist, dass die wirklich entscheidenden Fortschritte auf praktischen Gebieten wie Medizin, Nahrungsmittelproduktion, Verfahrenstechniken nur aus der Grundlagenforschung hervorgehen können (von Glücksfällen abgesehen). Literatur [1] Goodfellow, P. (1997): A celebration and a farewell. Nat. Genet. 16, 209–210 [2] Bradly, A. & Luo, G. (1998): The tentative nature of mouse knockouts. Nat. Genet. 20, 322–323 [3] Klose, J. (1999): Genotypes and phenotypes. Electrophoresis 20, 643–652 [4] Scriver, C. R. & Waters, P. J. (1999): Monogenic traits are not simple: lessons from Phenylketonuria. Trends Genet. 15, 267–272 [5] Klose, J. (1975): Protein mapping by combined isoelectric focusing and electrophoresis of mouse tissue. A novel approach to testing for induced point mutations in mammals. Humangentik. 20, 231–243 [6] O’ Farrell, P. H. (1975): High resolution two-dimensional electrophoresis of proteins. J. Biol. Chem. 250, 4007–4021 [7] Klose, J. & Kobalz, U. (1995): Two-dimensional electrophoresis of proteins: an updated protocol and implications for a functional analysis of the genome. Electrophoresis 16, 1034–1059 [8] Klose, J. (1999): Large-gel 2-D electrophoresis. Methods Mol. Biol. 112, 147–172 [9] Klose, J. (1999): Frationated extraction of total tissue proteins from mouse and human for 2-D electrophoresis. Methods Mol. Biol. 112, 67–85 [10] Klose, J.; Nock, C.; Herrmann, M.; Stühler, K.; Marcus, K; Blüggel, M.; Krause, E.; Schalkwyk, Leonard C.; Rastan, S.; Brown, Steve D. M.; Büssow, K.; Himmelbauer, H.; Lehrach, H. (2002): Ge- netic analysis of the mouse brain proteome. Nat. Genet., in press Kontaktadresse Prof. Dr. Dr. Joachim Klose Biologe und Mediziner, habilitiert für das Fach Humangenetik. Gründungsmitglied der Human Proteome Organisation (HUPO). Prof. Dr. Dr. Joachim Klose Humboldt-Universität, Charité Institut für Humangenetik Augustenburger Platz 1 D-13353 Berlin Tel.: (030) 450 566133 Fax: (030) 450 566904 E-mail:[email protected] BIOspektrum · 1/02 · 8. Jahrgang