Proteomanalyse

Werbung
Special
91
Proteomanalyse
Prof. Dr. Dr. Joachim Klose
Humboldt-Universität zu Berlin, Charité, Institut für Humangenetik
Proteomanalyse bedeutet Auftrennung,
Identifizierung und funktionelle
Charakterisierung möglichst aller Proteine
eines bestimmten Zelltyps oder Gewebes
unter den gegebenen biologischen
Bedingungen des Organismus. Die
funktionelle Charakterisierung der
Proteine führt zugleich zur Aufklärung der
spezifischen Funktion der entsprechenden
Gene. Eine genetische Analyse von
Proteinpolymorphismen zeigte jedoch,
dass selbst ein einzelnes Protein polygener
Natur ist. Für die Anwendung der
Proteomanalyse werden verschiedene
Strategien aufgezeigt.
Funktionelle Genomanalyse
Funktionelle Genomanalyse wurde definiert als „the attachment of information about function to the knowledge of DNA sequence“[1]. Streng genommen bedeutet
dann funktionelle Genomanalyse die Bestimmung der spezifischen Funktion für jedes Gen eines Genoms. Eine Vorgehensweise, die heute am ehesten geeignet erscheint, die spezifische Funktion eines Gens
herauszufinden, ist das molekulargenetische
Ausschalten (Knock-out) eines Gens eines
Organismus und die Bestimmung der Veränderung, die in Folge dessen phänotypisch
im Organismus auftritt. Mit dem Knock-outVerfahren wurden jedoch oft Überraschungen erlebt[2]. Das Ausschalten eines wichtigen Wachstumfaktors bei der Maus, zum
Beispiel, bewirkte keineswegs, dass die
Mäuse, die mit diesem Defekt geboren wurden, ganz klein blieben oder gar nicht lebensfähig waren – ihnen fehlten lediglich ein
paar Barthaare.
Es ist inzwischen ganz offensichtlich geworden, was aber eigentlich schon immer
klar war, dass die einzelnen Eigenschaften
eines Organismus immer von mehreren
Genen abhängen, und dass es dabei auch
alternative Stoffwechselwege gibt. Änderungen im Phänotyp eines Organismus, in
Folge einer Mutation, spiegeln nicht die
Funktionen des mutierten Gens wieder, sondern die Folge von irregulären Interaktionen
einer Anzahl von Genen, die durch den GenBIOspektrum · 1/02 · 8. Jahrgang
Abb. 1: Einzelne Schritte der Proteomanalyse
defekt ausgelöst wurden. Das gilt nicht nur
für Eigenschaften, die den äußeren Phänotyp eines Organismus prägen, sondern für
Merkmale auf allen Ebenen der Genexpression, der morphologisch/histologischen,
der physiologischen, zellulären und biochemischen Ebene[3]. Man kann jedoch annehmen, dass die genetische Komplexität, das
Netzwerk zwischen Genotyp und Phänotyp,
immer einfacher wird, je dichter am Gen
man das funktionelle Geschehen untersucht.
Demnach müsste die spezifische Funktion
der Gene am besten zu erfassen sein, wenn
man das Protein eines jeden Gens genau
charakterisiert. Je genauer die Eigenschaften eines Proteins untersucht sind, je genauer kann man die Funktion dieses Proteins und damit die seines Gens beschreiben. „The genome’s only orders are to make a polypeptide with a particular function.
It speaks ‘biochemistry’ not ‘phenotypes’“ [4].
Proteomanalyse
Die Genom-weite Identifizierung und Charakterisierung der Proteine eines Organismus ist das Ziel der Proteomanalyse. Proteomanalyse ist systematische, funktionelle
Genomanalyse. Es gibt jedoch viel mehr
Proteine als Gene in einem Organismus. Die
Proteine treten gewöhnlich in mehreren Isoformen auf, als Folge von alternativem Splicing, Protein-Processing, co- und posttranslationalen Modifikation und Fragmentierung von Proteinen. Ferner ist die Proteinzusammensetzung unterschiedlich von Zelltyp zu Zelltyp und hängt innerhalb eines
Zelltyps vom Differenzierungs- und Alterungsstadium der Zellen ab. Proteomanalyse ist daher weniger auf das gesamte Proteom eines Organismus gerichtet, als vielmehr
auf das Proteom eines bestimmten Zelltyps
oder Gewebes zu einem bestimmten Zeitpunkt.
Special
92
Abb. 2: Lokalisierung der Gene einer Anzahl von Proteinen auf den Chromosomen der Maus. Die genetische Kartierung von Proteinpolymorphismen zeigte,
dass ein einzelnes Protein von mehreren Genen abhängt. Die Polymorphismen wurden durch Vergleich von zweidimensionalen Proteinmustern zweier
unterschiedlicher Mäusearten entdeckt und betrafen verschiedene Eigenschaften der Proteine (Molekulargewicht, pI, Quantität, Isoformen).
Auftrennung der Gewebsproteine
2D-Elektrophorese
Proteomanalyse bedeutet zunächst Auftrennung und Darstellung möglichst aller Proteine eines Gewebes. Die klassische und
bisher nicht übertroffene Methode zur Auftrennung komplexer Proteinextrakte aus Geweben ist die zwei-dimensionale Elektrophorese (2-DE). Diese Technik wurde ursprünglich von mir[5] und – unabhängig davon – von O’Farrell [6] entwickelt und ist seit
dem unter verschiedenen Aspekten weiterentwickelt worden: Höhere Auflösung, bessere Reproduzierbarkeit, neue Nachweisverfahren für die aufgetrennten Proteine,
Entwicklung von Computerprogrammen zur
Imageanalyse und Auswertung der 2-DEMuster. Von industrieller Seite wurde viel an
der Vereinfachung der 2-DE-Technik gearbeitet. Hier war insbesondere die Einführung der immobilisierten pH-Gradienten
(IPG) in Form von Gelstrips ein wichtiger
Schritt . Ein besonderes Anliegen in der
Weiterentwicklung der 2-DE in unserem
Labor war, eine maximale Auflösung der
Proteinextrakte zu erreichen. Wir verfolgten
damit unsere ursprüngliche Idee, Proteinanalytik nicht nur durch intensive Untersuchung einzelner Proteine zu betreiben,
sondern den Blick auch auf die Gesamtheit
der Proteine eines Zelltyps zu richten (ein
Konzept, das in Bezug auf die Gene auch der
Genomanalyse zugrunde liegt). Mit der
Entwicklung einer Großgeltechnik[7,8,9], basierend auf Tubegelen und Carrier-Ampholyten, haben wir die Trennleistung der 2-DE
erheblich verbessert und eine Auflösung
von über 10 000 Proteinspots in einem Gel
erreicht. Das bedeutet jedoch nicht, dass
damit alle Proteine eines Gewebes dargestellt werden könnten. Diesem Ziel kann
man nur nahe kommen, wenn man die Proteine eines Gewebes nach systematischer
Fraktionierung und Konzentrierung auftrennt.
Massenspektrometrie
Ein wichtiger Schritt für die heutige Proteomanalyse war die Weiterentwicklung der
Massenspektrometrie von Proteinen in Richtung steigender Empfindlichkeit. So wurde
es möglich, die Peptidzusammensetzung
einzelner Proteinspots aus 2-DE-Gelen zu
analysieren und anhand der Peptidmassen
über Sequenzdatenbanken die Proteine eines 2-DE-Musters zu identifizieren. Die Geräteindustrie bemüht sich heute für die Proteomanalyse komplette Gerätestraßen
(Abb.1) anzubieten. Dabei ist zur Zeit der
größte Engpass die automatische Auswertung der 2-DE-Muster. Obwohl es sehr weit
fortgeschrittene Computerprogramme zu
Spotdetektierung und zum Vergleich von
Proteinmustern gibt, bleibt es dem Untersucher nicht erspart, jedes Computermuster
BIOspektrum · 1/02 · 8. Jahrgang
Special
93
am realen Spotmuster zu überprüfen, Spot
für Spot. Da geringe Intensitätsschwankungen von Spots oder im Gelhintergrund darüber entscheiden können, ob das Computerprogramm zur Imageanalyse zwei eng benachbarte Spots als zwei oder einen Spot registriert, treten ohne visuelle Kontrolle beim
Matchen zweier Muster – dem eigentlichen
Auswertungsvorgang – sehr schnell Fehler
auf. Mit diesem Problem eng verbunden ist
ein anderes grundlegendes Problem: Die genaue Quantifizierung der Proteinspots. Abgesehen davon, dass kaum ein Farbstoff für
die Quantifizierung alle idealen Eigenschaften aufweist (hohe Empfindlichkeit,
langer linearer Bereich, homogene Färbung
der Proteinspots, gleiche Reaktion bei verschiedenen Proteinen), ist eine genaue,
quantitative Auswertung eines Proteinmusters immer an mehrere Wiederholungsläufe
gebunden, selbst bei guter Reproduzierbarkeit der Muster. Das führt sehr schnell zu einem Umfang an Proteinmustern, der ohne
vollautomatische Auswertung nicht zu bewältigen ist.
Proteinchiptechnologie
Es sind heute Bemühungen im Gange, die
2-DE durch andere Methoden zu ersetzen.
Proteinchiptechnologie bietet dabei einen
neuen Weg, ebenso wie Versuche, die einzelnen Proteine komplexer Gemische direkt
durch Massenspektometrie zu identifizieren.
Dabei zeigt sich, dass jede Methode ihre eigenen Vorteile hat; eine ideale Methode, die
allen Anforderungen gerecht wird, kann es
kaum geben. Der besondere Vorteil der 2DE liegt in der Möglichkeit, Proteinisoformen (posttranslationale Modifikationen) und
genetische Polymorphismen erfassen zu
können und die Proteine in einer Weise zu
erhalten , die noch einigermaßen gut erlaubt,
Rückschlüsse auf die relative Konzentration
der Proteine im Gewebe ziehen zu können.
Unübersehbar ist auch der Vorteil, Tausende von Proteinen nebeneinander im gleichen Bild studieren zu können.
Charakterisierung der Proteine
Proteinphänotypen und ihre Gene
Entscheidend für die Proteomforschung ist
die Charakterisierung der einzelnen Proteine, die aufgetrennt wurden. Hier könnte
man zwischen einer chemischen und einer
biologischen Charakterisierung unterscheiden. Chemische Eigenschaften der Proteine wären: Die Aminosäuresequenz, die Seitenkettenmodifizierungen, Konformation,
Bindungs-eigenschaften und die verschiedenen funktionellen Formen, die z.B. durch
alternatives Splicing, Protein-Processing,
Transport oder begrenzter Fragmentierung
der Proteine entstehen. Biologische Eigenschaften wären: Die Spezifität der Proteine
für die verschiedenen Zelltypen, Entwicklungs- und Alterstadien eines Organismus
und für das Geschlecht; ferner quantitative
Eigenschaften wie Konzentration des Proteins in der Zelle und turn-over-Rate, genetische Merkmale wie Polymorphismen und
Art der Vererbung und die Sensitivität der
Proteine gegenüber verschiedenen Umwelteinflüssen. Zu Zeiten der klassischen
Proteinchemie war das unumstößliche Forschungskonzept, ein einzelnes Protein herauszugreifen – z.B. das Hämoglobin, das
leicht zu isolieren war – und dann mit allen
verfügbaren Methoden zu untersuchen.
Obwohl detailierte Untersuchungen an einzelnen Proteinen auch heute noch unabdingbar sind, geht die Entwicklung doch
weiter dahin, für die verschieden Untersuchungsmethoden Large-Scale-Techniken zu
entwickeln. Die 2-DE selbst ist hierfür ein
gutes Beispiel, aber auch die Chiptechnologie, das Two-Hybrid-System und die Massenspektrometrie. Viele der oben genannten
Proteineigenschaften können mit der 2-DE
gleichzeitig an Tausenden von Proteinen
untersucht werden. Heute werden geradezu Proteinfabriken aufgebaut, um Eigenschaften – selbst solche wie die Raumstruktur der Proteine – an Hunderten und Tausenden von Proteinen untersuchen zu können.
Wenn Proteomanalyse funktionelle Genomanalyse bedeutet, dann muss auch für
jedes Protein, das durch Auftrennung gefunden und anschließend charakterisiert
wurde, das zugehörige Gen gefunden werden. Mit der Sequenzierung ganzer Genome und der Erkennung der einzelnen Gene in diesen Sequenzen und – andererseits
– mit der Fähigkeit der Massenspektrometrie auch einzelne Sequenzabschnitte von
Proteinen zu erkennen, wird die ProteinGen Identifizierung immer einfacher. Die
oben genannten Eigenschaften eines Proteins hängen aber nicht nur von seinem
Strukturgen ab. Regulierende und modifizierende Gene bestimmen den „Proteinphänotyp“ mit. Bei der Protein-Gen Identifizierung geht es daher auch um die Erfassung dieser Gene. Ein 2-DE-Muster kann
für jedes einzelne Protein eine ganze Anzahl
von verschiedenen Phänotypen erkennen
lassen. Molekulargewicht (ungefähr), pI (ungefähr), Spotvolumen, Spot da/nicht da, verschiedenen Typen von „Isospots“, turn-overRate (bei radioaktiver Markierung), Entwicklungsprofile (bei Vergleich verschiedener Embryonalstadien) u.a.. Die Gene, die
diesen Phänotypen zugrunde liegen – Protein-Modifier – können nicht über Sequenzanalyse gefunden werden. Hier gibt es
aber die Möglichkeit auf genetischem Wege, Phänotyp-Genotyp Beziehungen von
Proteinen zu erkennen. Wir haben 2-DEMuster von Gehirnproteinen von zwei verschiedenen Mäusearten, Mus musculus und
Mus spretus untersucht. Da diese zwei Mäusearten phylogenetisch relativ weit auseinander liegen, fanden wir eine große Anzahl
von Proteinpolymorphismen zwischen diesen beiden Arten (etwa 1300 polymorphe
Spots unter 8700 Proteinspots)[10]. Die Polymorphismen betrafen 2-DE-Phänotypen wie
Spotposition (horizontale, vertikale oder
schräge Verschiebung), Spotvolumen (quantitative Unterschiede, Spot da/nicht da) und
Special
94
Auftreten von Isoformen (Unterschiede in
Anzahl und Position von Isospots). Wir haben die Gene, die diesen Polymorphismen
zugrunde liegen, durch Rückkreuzungsanalyse auf den Mauschromosomen kartiert. Für
eine ganze Anzahl von Proteinen konnten
wir mehrere Gene (bis zu drei pro Protein)
kartieren (Abb.2). Hier handelte es sich offenbar um Regulator- und Modifiergene einzelner Proteine. Der Nachweis, dass selbst
ein einzelnes Protein ein polygenes Merkmal ist, wirft ein Licht auf die Komplexität
polygener Krankheiten.
Strategien in der Proteomanalyse
Untersuchungen im Bereich der Proteomanalyse verlaufen heute üblicher Weise wie
folgt (Strategie A): Man nimmt ein bestimmtes biologisches Material (Herz, Gehirn; Blatt, Stengel; Zellkultur, Mikroorganismus), das durch eine bestimmte Ursache
(Krankheit, Mutation, toxischer Effekt, Umweltfaktoren) verändert ist, und extrahiert
die Proteine aus dem Gewebe oder aus einer bestimmten Gewebsfraktion. Die Proteine werden dann durch 2-DE aufgetrennt
und das erhaltene Proteinmuster wird mit
dem 2-DE-Muster des entsprechenden Normalgewebes verglichen. Unterschiedliche
Proteinspots (meist quantitative Unterschiede) werden durch Massenspektrometrie analysiert. Die Peptidmassenprofile führen über Sequenzdatenbanken meist zu einem bekannten Protein. Es werden dann
Datenbanken über Proteine, Genexpression,
Stoffwechselwege, Phänotypen usw. herangezogen (Bioinformatik), um einen Zusammenhang zwischen dem veränderten
Protein(en) und dem Auslöser der Veränderung zu finden. Mit einer solchen Strategie,
in dieser einfachen Form, hat man jedoch
nur geringe Erfolgsaussichten. Wenn ein bestimmter Zelltyp schätzungsweise 10 000
unterschiedliche Proteine exprimiert und jedes Protein durchschnittlich in schätzungsweise 3 Isoformen auftritt, müssten wir etwa
30 000 Proteinspots zu Gesicht bekommen,
um mit Sicherheit ein Protein zu finden, das
von der Störung betroffen ist. Wenn aber wie
üblich nur 2–3 Tausend Spots in einem 2DE-Muster aufgetrennt werden, ist die
„Chance“, dieses Protein nicht zu finden 90%
und höher. Trotzdem findet man auch immer Unterschiede. Aber diese können technische oder ganz normale genetische oder
physiologische Ursachen haben. Strategie A
hat daher nur Aussicht auf Erfolg, wenn sie
mit sehr großem Aufwand betrieben wird:
Untersuchung mehrerer Zellfraktionen bei
hoher Proteinkonzentration und maximaler
Auflösung in der 2-DE; mehrfache Wiederholung der Experimente bei guter Reproduzierbarkeit und Verwendung brauchbarer
Auswertungsverfahren; und besonders wichtig: Zur Beurteilung der beobachteten varianten Proteine muss man die Möglichkeit
haben, noch andere Parameter heranziehen
zu können, z.B.: Korrelieren die Proteinveränderungen mit dem Krankheitsverlauf?,
Zeigt die Proteinvariante (z.B. bei Mutagenitätsuntersuchungen) im Kreuzungsexperiment eine Vererbung?, Treten die Proteinveränderungen im Zusammenhang mit
bestimmten Symptomen in einem anderen
Bereich des betroffenen Organismus auf?
Anhand solcher Parameter kann man prüfen,
ob unter den varianten Proteinen überhaupt
welche zu finden sind, die eine weitere
Untersuchung lohnen.
Eine andere Strategie (B) in der Proteomanalyse befasst sich von vornherein nur
mit den Proteinen, die ein 2-DE-Muster sauber und reproduzierbar bietet, d.h. es kommt
nicht darauf an, ob ein ganz bestimmtes, z.B.
krankheitsrelevantes Protein mit dem Proteinmuster erfasst wurde oder nicht. Mit einem solchen Proteinmuster, von vielleicht
einigen Tausend Spots, kann man Fragen
untersuchen, die auf das generelle Funktionieren der Proteine in der Zelle gerichtet
sind, z.B.: Wie groß ist die genetische Variabilität der Proteine zwischen Individuen einer Population? Wie stark ist die Fluktuation
der Proteine in frühen Entwicklungsstadien
(z.B. von omnipotenten Stammzellen zu differenzierten Zellen), kurz nach der Geburt
oder im Alter? Welche Proteine interagieren
miteinander, welche mit besonders vielen
anderen Proteinen (Frage nach Proteinkomplexen, nach „Schlüsselproteinen“)?
Mit dieser Strategie forscht man auf ziemlich sicherem Boden, die Fragen richten sich
aber allein auf biologische Probleme, sie
ziehlen nicht auf einen unmittelbaren Anwendungszweck.
Strategie B mündet in letzter Konsequenz
in Strategie C, die systematische Auftrennung, Charakterisierung und genetische
Analyse aller Proteine eines Organismus, wie
eingangs beschrieben. Das Besondere dieser Strategie ist, dass sie nur langfristig Erfolg bringt. Sie geht einher mit technischen
Verbesserungen und Neuentwicklungen
und beschert zunächst keinerlei praktischen
Nutzen.
Betrachten wir das Ganze, bleibt unbestritten, dass alle drei Strategien ihre Berechtigung haben und Anwendung finden
müssen. In der praktischen Forschung wird
aber fast ausschließlich nur Strategie A verfolgt. Die Erklärung liegt auf der Hand: Strategie A birgt die Hoffnung, auf schnellem
Wege zu einem Ergebnis zu kommen, das
von praktischem Nutzen ist. Strategie B und
C fallen in die Kategorie Grundlagenforschung, die keinen unmittelbaren Nutzen
bringt. Das Paradoxe aber ist, dass die wirklich entscheidenden Fortschritte auf praktischen Gebieten wie Medizin, Nahrungsmittelproduktion, Verfahrenstechniken nur
aus der Grundlagenforschung hervorgehen
können (von Glücksfällen abgesehen).
Literatur
[1] Goodfellow, P. (1997): A celebration and a farewell.
Nat. Genet. 16, 209–210
[2] Bradly, A. & Luo, G. (1998): The tentative nature of
mouse knockouts. Nat. Genet. 20, 322–323
[3] Klose, J. (1999): Genotypes and phenotypes.
Electrophoresis 20, 643–652
[4] Scriver, C. R. & Waters, P. J. (1999): Monogenic
traits are not simple: lessons from Phenylketonuria.
Trends Genet. 15, 267–272
[5] Klose, J. (1975): Protein mapping by combined isoelectric focusing and electrophoresis of mouse tissue. A
novel approach to testing for induced point mutations in
mammals. Humangentik. 20, 231–243
[6] O’ Farrell, P. H. (1975): High resolution two-dimensional electrophoresis of proteins. J. Biol. Chem. 250,
4007–4021
[7] Klose, J. & Kobalz, U. (1995): Two-dimensional
electrophoresis of proteins: an updated protocol and implications for a functional analysis of the genome.
Electrophoresis 16, 1034–1059
[8] Klose, J. (1999): Large-gel 2-D electrophoresis.
Methods Mol. Biol. 112, 147–172
[9] Klose, J. (1999): Frationated extraction of total tissue
proteins from mouse and human for 2-D electrophoresis.
Methods Mol. Biol. 112, 67–85
[10] Klose, J.; Nock, C.; Herrmann, M.; Stühler, K.;
Marcus, K; Blüggel, M.; Krause, E.; Schalkwyk,
Leonard C.; Rastan, S.; Brown, Steve D. M.; Büssow, K.; Himmelbauer, H.; Lehrach, H. (2002): Ge-
netic analysis of the mouse brain proteome. Nat. Genet.,
in press
Kontaktadresse
Prof. Dr. Dr.
Joachim Klose
Biologe und Mediziner,
habilitiert für das Fach
Humangenetik.
Gründungsmitglied der
Human Proteome
Organisation (HUPO).
Prof. Dr. Dr. Joachim Klose
Humboldt-Universität, Charité
Institut für Humangenetik
Augustenburger Platz 1
D-13353 Berlin
Tel.: (030) 450 566133
Fax: (030) 450 566904
E-mail:[email protected]
BIOspektrum · 1/02 · 8. Jahrgang
Herunterladen