Perspektiven in der Modellierung von Proteinfaltungsprozessen

Werbung
Perspektiven in der Modellierung
von Proteinfaltungsprozessen
von Markus Butz
1
Einleitung
Die vorliegende Arbeit entstand im Rahmen des
Seminars „Proteindocking in der Bioinformatik“ im
WS 1999/2000 (39 20 13). In dieser Arbeit beziehe
ich mich auf die Publikation von Ken A. Dill
„Polymer principles and protein folding“ in Protein
Sciences 1999 (8:1166-1180).
gemeinsam ist, dass sie statisch sind, das heißt, dass
sie nur auf einzelne Zustände von Proteinen
anwendbar sind. Proteinstrukturen sind jedoch
dynamisch. Verschiedene Faktoren spielen bei der
Strukturbildung eine Rolle, wie vor allem das
Lösungsmittel, dockende Liganden, aber auch pHund Temperaturveränderungen beeinflussen die
Proteinstruktur. Diese Dynamik fehlt in der bisherigen
Modellierung der Faltung einzelner Polypeptidketten.
Insbesondere die zeitliche Dimension, in der
Konformationsänderungen von Proteinen ablaufen, ist
von besonderem Interesse. Bisher ist es nur möglich,
mit sogenannten „mass - action - Modellen“ die
Energieveränderung bei sich faltenden Proteinen zu
messen. Die in mass - action - Diagrammen
dargestelleten Kurven werden auch als macropath
einer Proteinfaltung bezeichnet.
Ziel ist es, neue Perspektiven in der Modellierung von
Faltungsprozessen bei Proteinen darzustellen und
anhand bestehender Modelle zu diskutieren.
Zunächst beginne ich damit, die Motivation für eine
neue Perspektive zu begründen. In die Thematik
einleitend stelle ich zwei bisher vertretenen
Sichtweisen,
die
grundlegend
voneinander
divergieren, einander gegenüber. Im zweiten
Abschnitt diskutiere ich die Vorhersagbarkeit von
Proteinstrukturen anhand des „Blind Watchmaker‘s
Paradox“ und des „Levinthal‘s Paradox“ unter
evolutionstheoretischen Aspekten. Im Hauptteil der
Arbeit stelle ich Modelle dar, mit denen man die zuvor
beschriebenen Paradoxe auflösen kann. Insbesondere
stelle ich Funktionen dar, sogenannte energy
landscapes, mit denen Konformationsänderungen von
Proteinen in Zukunft berechnet werden sollen. Daran
schließt sich ein Vergleich der Aussagefähigkeit von
empirischen Daten aus Faltungsexperimenten und der
Aussagefähigkeit der aus den Modellen errechneten
Daten an. Im fünften Abschnitt folgen Ausblicke auf
weitere Modellansätze und Optimierungsmethoden
zur Berechnung von Proteinstrukturen. Ich schließe
die Arbeit mit einer kurzen Zusammenfassung und
Bewertung der dargestellten Inhalte.
1.1
Motivation
Der molekulare Bauplan des Lebens wird durch
Aminosäuren kodiert, welche in spezifischer Weise
aneinandergereiht,
Proteine
ausbilden.
Die
Funktionalität der Proteine ist durch deren
dreidimensionale Struktur und die damit verbundene
thermodynamische Aktivität gegeben, wobei sich
deren Struktur aus der Aminosäuresequenz herleitet.
Dazu gibt es eine ganze Reihe von Modellen, mit
denen sich konkrete Faltungszustände von Proteinen
beschreiben lassen. Statistische Untersuchungen
ermöglichen es, Vorhersagen darüber zu machen, ob
eine bestimmte Abfolge von hydrophoben oder
polaren Aminosäuren eher in einer Alpha-Helix oder
in einem Beta-Faltblatt vorkommt. Diesen Modellen
Fig. 1) Alte Chemikersicht: Der messbare Verlauf
einer Reaktion wird in einem Mass-Action Diagramm
wiedergegeben.
Bei den simpelsten dieser Modellen werden nur die
gemittelten Energieniveaus von Proteinen im
denaturierten und natürlichen Zustand in einem
Koordinatensystem gegen die Zeit aufgetragen.
Detailliertere
Modelle
berücksichtigen
auch
Zwischenstufen im Faltungsprozess, jedoch sind auch
die daraus resultierenden Werte für die detaillierte
Modellierung
von
Konformationsänderungen
einzelner Proteine nicht brauchbar, da die Messungen
keine Aussagen über eine einzelne Polypeptidkette
erlauben.
Es wird daher ein neues Modell gebraucht, was im
Gegensatz zu den bisherigen Modellen, den
„micropath“, den Faltungsweg eines Proteins für jede
beliebige Reaktionskoordinate berechnet. Dazu ist
jedoch eine neue Perspektive notwendig, aus der
Proteinfaltung gesehen wird. Im folgenden sollen zwei
Perspektiven dargestellt werden.
1.2
Die backbone - orientierte Perspektive
Diese Sichtweise ist über einen Zeitraum von fast 50
Jahren vertreten worden. Seit 1933 haben Mirsky und
Pauling daran gearbeitet. Im Focus dieser Sichtweise
steht das Rückgrat eines Proteins. Mirsky und Pauling
gingen davon aus, dass vor allem H-Brücken zwischen
den Seitenketten und sterische Zwänge die - und -
Winkel
festlegen.
Daraus
haben
sie
Sekundärstrukturen wie alpha-Helizes und beta-Sheets
gefordert. Diese Sichtweise wurde vor allem dadurch
gestärkt, dass die geforderten Sekundärstrukturen
tatsächlich
mittels
Röntgenstrukturanalysen
nachgewiesen werden konnten.
Später entwickelten sie dann ein Modell zum
Verständnis der helix-coil-transition, also dem
Übergang von der Sekundär- zur Tertiärstruktur eines
Proteins. Auch hierbei wurden den H-Brücken und der
Konstellationen der - und -Winkel zentrale
Bedeutung zugeordnet.
Fig. 2) Drehwinkel des Rückgrats
Eine Hypothese, die von dieser Sichtweise abgeleitet
wurde, ist die, dass Proteinfaltung hierarchisch
verläuft. Danach bilden sich aus der Primärstruktur
zunächst Sekundärstrukturen, worauf aufbauend dann
eine Tertiärstruktur des Proteins resultiert.
1.3
Die side-chain - orientierte Perspektive
Diese Sichtweise wird seit rund 15 Jahren favorisiert.
Im Vordergrund hierbei stehen die hydrophobischen
Interaktionen
zwischen
Polypeptidkette
und
Lösungsmittel. Dabei zwingt das Lösungsmittel das
Protein durch die Ausbildung von Hydrathüllen um
hydrophobe Anteile, eine neue Konformation
einzunehmen. Dabei ist diese Sichtweise im Kern die
Formulierung eines Optimierungsproblems, nämlich
die Polypeptidkette so zu falten, dass möglichst viele
Kontakte zwischen hydrophoben Aminosäuren
ausgebildet werden und diese im Inneren des Kneuls
liegen, damit sie leichter durch polare Aminosäuren
vor dem ebenfalls polaren Lösungsmittel abgeschirmt
werden können. Von zentraler Bedeutung sind in
dieser Sichtweise also die Seitenketten mit ihren
chemischen Eigenschaften. Dagegen treten die
Strukturmerkmale wie z. B. Bindungswinkel und
Helizes als Folgeerscheinung hydrophobischer
Wechselwirkungen in den Hintergrund.
1.4
Diskussion der beiden Perspektive
Die backbone - orientierte Perspektive hat sicher zum
Verständnis von Sekundärstrukturen beigetragen, aber
sie ist nicht ausreichend, wenn es darum geht,
komplexe Tertiärstrukturen vorherzusagen, weil die
Vorhersage von dreidimensionalen Proteinstrukturen
nur unter Betracht lokaler Interaktionen wie der
Winkelkonstellationen ein exponentielles Problem
darstellt, dass sich so nicht berechnen lässt.
Algorithmen, die von dieser Sichtweise ausgehen sind
zwar in der Lage, Sekundärstrukturen vorherzusagen,
aber es gelingt nicht, den Kollaps eines Proteins bishin
zum natürlichen Zustand zu prognostizieren.
Von entscheidendem Vorteil bei der side-chain orientierten
Perspektive
ist
gerade
die
Berücksichtigung von nicht-lokalen Interaktionen als
zentrale strukturgebende Einflüsse. Denn durch neuere
Experimente weiß man, dass bereits die Ausbildung
von Sekundärstrukturen kontextabhängig ist. Das
bedeutet nun, ob eine alpha-Helix ausgebildet wird
oder nicht, ist nicht nur von den beteiligten
Aminosäuren
abhängig,
sondern
auch
von
benachbarten
Kettenabschnitten
und
den
Wechselwirkungen dazwischen. Desweiteren konnte
gezeigt werden, dass die Faltung nicht zwingend
hierarchisch verläuft.
Zwar sind die Bindungswinkel des Rückgrates für eine
exakte Beschreibung einer Proteinfaltung nicht
unwichtig, jedoch ergeben sich aus letzterer
Perspektive mehr erfolgversprechende Ansätze für
neue Modelle.
2
Fig. 3) Verteilung von hydrophoben und polaren
Aminosäuren
Die Vorhersagbarkeit von
Proteinstrukturen
Zunächst einmal faltet sich nicht jede Polypeptidkette
zu einem dreidimensional stabilen Kneul. Nur ein sehr
kleiner Teil von Sequenzen lässt die Anordnung ihrer
Bestandteile so zu, wie das in einem natürlichen
Zustand eines Proteins der Fall ist. Gerade der
Endzustand einer Proteinfaltung erzeugt den Eindruck
einer nahezu perfekten Konstruktion. Die Sequenz der
Teile für diese geometrische Konstruktion vollständig
dem Zufall nach zu finden und aneinanderzureihen,
lässt sich anscheinend mit der Arbeitseffizienz eines
blinden Uhrmachers vergleichen. Richard Dawkins
hat dieses sogenannte „Blind Watchmaker‘s Paradox“
aufgestellt, das besagt:
„Die Wahrscheinlichkeit, natürliche Proteine dem
Zufall nach in einem Raum aller möglichen Sequenzen
zu finden, scheint unendlich klein.“
Das bedeutet, die Wahrscheinlichkeit, zufällig von
allen möglichen Polypeptidketten beispielsweise
gerade die mit der Sequenz des Lysozyms zu finden,
geht gegen null. Selbst eine spezifische Sequenz mit
nur hundert Aminosäuren zu finden, ist mit einer
Wahrscheinlichkeit von 1:10130 unvorstellbar klein.
Diese Zahlen bieten Evolutionsgegnern immer wieder
Angriffspunkte, die gesamte Evolutionstherorie in
Frage zu stellen. Vor allem Kreationisten, die die
Natur mit ihrer Artenvielfalt als etwas von Gott
gegebenes ansehen, schließen eine Makroevolution,
insbesondere die Entstehung des Lebens aus
Makromolekülen aus.
Der Denkfehler, der hinter dieser Evolutionskritik
steht und zu solchen Widersprüchen führt, ist recht
simpel: Die Evolution ist eben nicht zielgerichtet. Es
ist einfach die falsche Denkrichtung zu fragen, wie
hoch die Wahrscheinlichkeit ist, dass genau ein
bestimmtes Protein mit einer eindeutigen Sequenz
gerade per Zufall gefunden wird. Stattdessen geht es
in der Evolution zunächst einmal nur darum, wie hoch
die Wahrscheinlichkeit ist, dass überhaupt eine
Aminosäuresequenz gefunden wird, die zu einer
kompakten Struktur faltet. Desweiteren geht es darum,
ob eine Aminosäurekette biologische relevant ist oder
nicht, und genau das hängt nicht von ihrer eindeutigen
Sequenz ab, sondern von ihrer gefalteten Struktur.
Genau diese aber ist nicht notwendig nur durch eine
Sequenz definiert. (Auf den Zusammenhang zwischen
Sequenz und Struktur gehe ich im dritten Abschnitt
genauer ein.) Eine Polypeptidkette, die dem Lysozym
in Struktur und Funktion ähnelt, findet sich in einem
Liter einer nanomolaren Flüssigkeit statistisch gesehen
zumindest einmal. Gemessen an der Litermenge eines
Ozeans relativiert sich dieses Verhältnis recht schnell.
Zuletzt bleibt zu bedenken, dass sich in der Evolution
immer Zufallsschritte mit Schritten der Optimierung
abwechseln (Darwin: Prinzip der Mutation und
Selektion).
Wenn die spezifische Sequenz für eine bestimmte
Struktur nicht im Vordergrund steht, so bleibt
trotzdem zu fragen, wie das Optimierungsproblem,
das sich bei einem Protein vom Übergang vom
denaturierten zum naürlichen Zustand darstellt, in
einer für den Zellstoffwechsel akzeptablen Zeit zu
lösen ist. Levinthal formulierte das in dem
Zusammenhang zweite wichtige Paradox:
„Die Wahrscheinlichkeit, dass der native state eines
Proteins durch naive Suche gefunden wird, scheint
unmöglich klein.“ (Levinthal‘s Paradox)
Ohne Zusatzinformationen lässt sich dieses Paradox
nicht auflösen, aber auch hier hängt die Lösbarkeit des
Problems von der Sichtweise ab. Die im ersten Teil
beschriebene side-chain - orientierte Perspektive
liefert einen Ansatz, um zu erkennen, dass der Zufall
nicht die einzige statistische Größe in diesem Prozess
ist. Bereits kleine Lenkungen in einem vom Zufall
abhängigen Prozess können bereits die dafür benötigte
Zeit um zehn bis hundert Größenordnungen
verringern. Man stelle sich dazu nur einen Golfplatz
vor, auf dem ein Golfball durch Zufall das Loch
finden soll. Das Problem scheint so lange aussichtslos
ineffizient, bis man annimmt, dass der Golfplatz nur
minimal zum Loch hin geneigt ist. (Das Problem der
Proteinfaltung wird ebenfalls im nächsten Abschnitt
ausführlich anhand von Modellen diskutiert.)
3
Modelle zur Berechnung von
Faltungswegen
Zum vollständigen Auflösen der im vorigen Abschnitt
diskutierten Paradoxe sind Modelle notwendig, mit
denen man den dynamischen Prozess der
Proteinfaltung beschreiben kann. Zunächst resultiert
eine Grundannahme aus der side-chain - orientierten
Perspektive: Da die hydrophobische Interaktion
zwischen der Polypeptidkette und dem Lösungsmittel
als wesentliche Triebkraft der Proteinfaltung
angesehen wird, ist es bei der Modellierung von
Faltungswegen legitim, von der genauen
Proteinsequenz zu abstrahieren und dafür nur die
Sequenz von hydrophoben und polaren Seitenketten
zu betrachten. Dieses sogenante HP-Modell
vernachlässigt zwar atomare Details, aber darin liegt
gerade die entscheidende Stärke des Modells. Denn
für die Modellierung eines so komplexen Problems
wie der Proteinfaltung kommt man ohne
Simplifizierungen nicht zum Ergebnis. So ist es nun
mit dieser Abstraktion zu einem binären Alphabet der
Aminosäuren möglich, den gesamten Sequenz- und
Konformationsraum zu durchsuchen. Mit Hilfe des
HP-Modells lässt sich das Blind Watchmaker‘s
Paradox vollständig auflösen: Für eine Polypeptidkette
von 100 Aminosäuren gibt es anstatt 10130 danach
nämlich nur noch 2100 = 1030 mögliche Sequenzen.
Desweiteren könnte man diese Zahl sogar noch auf ein
Drittel reduzieren, wenn man von der Funktion des
Proteins abstrahiert. Denn nur ein Drittel der
Aminosäuren liegen in dem für den kollabierten
Zustand des Proteins interessanten Kern; der Rest liegt
an der Oberfläche.
Um nun das oben beschriebene Optimierungsproblem
anzugehen, nämlich möglichst viele hydrophobe
Kontakte im Kern zu erreichen, hat Stanley 1971
basierend auf dem HP-Modell ein Gittermodell
entwickelt, das als erstes dynamisches Modell für
einen micropath gesehen werden kann. Dieses wird im
folgenden beschrieben.
3.1
Das Lattice Ising Modell
Hierbei handelt es sich um eine enorme
Vereinfachung des Faltungsproblems. Hydrophobe
und polare Aminosäuren werden in einem
zweidimensionalen Modell als weiße bzw. schwarze
Punkte dargestellt, die durch zu einander orthogonale
Strecken verbunden sind. Durch die Strecken werden
Bindungen repräsentiert, welche nur diskrete Winkel
von 90°- Schritten annehmen dürfen und immer gleich
lang sind. In einem Koordinatensystem werden die
Anzahl der möglichen Konformationen gegen die
Anzahl der hydrophobischen Kontakte aufgetragen.
Die Anzahl der hydrophobischen Kontakte ist an
dieser Stelle eine spezielle Interpretation der
ansonsten allgemeinen Fortschritssvariable  (auch
Reaktionskoordinate genannt).
Der Schauplatz einer Reaktion ist ein System. Die
Summe aller Energieformen in diesem System ist die
innere Energie (U). Die innere Energie eines Systems
kann nicht gemessen werden, sondern nur Änderungen
der selben (delta U) durch z.B. Messen von
Temperaturänderungen.
delta
U
wird
als
Reaktionsenergie bezeichnet. Das System kann von
seiner Umgebung Energie in der Regel in Form von
Wärme aufnehmen bzw. bei Verrichten von Arbeit
wieder abgeben. Damit berrechnet sich die
Veränderung der inneren Energie aus der Differenz
von aufgenommener Energie (Q) und der verrichteten
Arbeit (W). Löst man die Gleichung nach Q auf und
bestimmt die Differenz zwischen aufgenommener
Energie (Enthalpie) im Anfangs- und Endzustand
einer Reaktion, so erhält man die Reaktionsenthalpie
(delta H) einer Zustandsänderung.
Der erste Hauptsatz der Thermodynamik sagt nichts
darüber aus, ob eine Reaktion spontan abläuft ode
nicht. Dazu muss eine weitere thermodynamische
Größe definiert werden, nämlich die Entropie (S), ein
Maß für die Unordnung in einem System.
Der zweite Hauptsatz besagt nun, dass eine Reaktion
nur dann spontan ablaufen kann, wenn dabei die
Entropie zunimmt.
Fig. 4) Anzahl der möglichen Konformationen mit
gleichem Energieniveau, das mit der Anzahl der
hydrophoben kontakte korreliert.
Die Berechtigung für ein so stark vereinfachtes
Modell, liegt in der Absicht, aus den Ergebnissen
eines solchen Modells neue Hypothesen formulieren
zu wollen.
3.2
Modellierung der Thermodynamik von
Konformationsänderungen
„Die Thermodynamik ist die Lehre von
Energieänderungen im Verlaufe von physikalischen
und chemischen Vorgängen.“ (Definition aus
„Chemie“ von Charles E. Mortimer, Thieme-Verlag
1996)
Damit liefert die Thermodynamik die essentiellen
Werkzeuge zur Schaffung eines dynamischen Modells
der Konformationsänderungen von Proteinen. Aus
diesem Grund sollen an dieser Stelle der erste und
zweite Hauptsatz der Thermodynamik sowie in
diesem Kontext relevante Definitionen aufgeführt
werden.
Der erste Hauptsatz ist der Energieerhaltungssatz, der
besagt, dass Energie nur von einer Form in die andere
umgewandelt werden kann, aber weder vernichtet
noch erzeugt werden kann.
Dabei kommt es nicht nur auf eine Entropiezunahme
im System an, sondern auch in der Umgebung.
Entscheidend ist also die Gesamtentropie also die
Summe aus der Entropie des Systems und der der
Umgebung.
Bei konstantem Volumen kann man diese Gleichung
umformen, so dass man eine Differenz zwischen der
inneren Energie und dem Produkt aus Entropie des
Systems und Temperatur erhält. Diese Differenz wird
freie Energie (F) genannt. Aus der Änderung der
freien Energie vom Anfangs- zum Endzustand der
Reaktion ergibt sich die freie Reaktionsenergie (delta
F), welche ein hinreichendes Kriterium dafür ist, ob
eine Reaktion spontan abläuft oder nicht. Für alle delta
F kleiner null läuft die Reaktion spontan ab. Dagegen
läuft sie für alle delta F größer null nicht freiwillig ab
und für delta F gleich null befindet sich die Reaktion
im Gleichgewichtszustand.
Daraus lassen sich zwei wichtige Gesetzmäßigkeiten
der Thermodynamik ableiten, die für die Fragestellung
der Proteinfaltung relevant sind:


Bei einer Reaktion wird ein Energieminimum
angestrebt, da dann die Reaktionsenergie ein
negatives Vorzeichen erhält und somit zu einem
negativen Wert der freien Reaktionsenergie
beiträgt.
Bei einer Reaktion wird ein Maximum an
Unordnung angestrebt; denn aus der Gleichung
für die freie Reaktionsenergie folgt, dass diese um
so eher negativ ist, je größer die Entropie in
diesem System wird.
(Die Herleitung dieser beiden Gesetzmäßigkeiten ist
ausführlich auf den Seiten 332 bis 338 in bereits o. g.
Lehrbuch beschrieben.)
Der Bezug zu den Faltungsmodellen stellt sich nun
wie folgt dar:
Das Lösungsmittel zwingt das Protein zu kollabieren,
was die hydrophoben Kontakte zwischen den
Seitenketten erhöht. Je mehr hydrophoben Kontakte
mit der Zeit ausgebildet werden, desto negativer ist die
Entropieänderung im System also dem Protein. Das
bedeutet jedoch, dass die Unordnung nicht wie
verlangt zunimmt, sondern abnimmt. Daraus folgt
zwingend, dass die Konformationsänderung hin zu
maximal vielen hydrophoben Kontakten gleichzeitig
eine Konformationsänderung hin zu einem
Energieminimum ist, damit die Reaktion überhaupt
noch spontan ablaufen kann.
Polypeptidkette (1, ..., n) dargestellt wird.
Trichterförmig sind diese Funktionsgraphen zum
anderen deshalb, weil es mehr Konformationen mit
hohem Energieniveau als mit niedrigem gibt, was
bereits aus den Lattice-Ising-Modellen zu fordern war.
Um diese Funktionen als Oberfächenplotts graphisch
darstellen zu können, wird der hochdimensionale
Parameterraum () aller Freiheitsgerade in eine
Ebene projeziert. Auf der darauf senkrechten Achse ist
das zugehörige Energieniveau als Funktionswert
abzulesen. Die Funktion erreicht ihr absolutes
Minimum für diejenige Konformation, die dem native
state des Proteins entspricht. Der Kollaps einer
einzelnen Polypeptidkette kann als Weg auf der
energy landscape von einem beliebigen Punkt bishin
zum absoluten Minimalpunkt dargestellt werden.
Die Anzahl der hydrophobe Kontakte wird im Lattice
- Ising - Modell mit  bezeichnet, was jedoch nur ein
Spezialfall der Reaktionskoordinate  ist. In
sogenannten energy landscapes wird sowohl von der
der Anzahl der hydrophoben Kontakte abstrahiert als
auch von diskreten Bindungswinkeln und -längen, und
stattdessen
die
Energieniveaus
beliebiger
Konformationen in einem multidimensionalen
Oberflächenplott dargestellt. Die Theorie der energy
landscapes wird im folgenden besprochen.
4
Ein neuer Ansatz: Energy landscapes
zur Modellierung von
Proteinfaltungswegen
Energy landscapes sind weder neu noch auf die
Verwendung für Proteine beschränkt. Sie sind nur
deshalb an dieser Stelle interessant zu diskutieren,
weil ihre Anwendung auf Proteine eine neue
Perspektive in der Modellierung der Faltungskinetik
von Proteinen darstellt. Bislang gibt es nämlich kein
Modell, was in der Lage ist, den Faltungsweg einer
einzelnen Polypeptidkette zu berechnen oder
vorherzusagen. Levinthal forderte 1968, als er sein
Paradox aufgestellt hat, dass es einen Pfad geben
müsse, dem alle Proteine folgen, um ihren natürlichen
Zustand zu erreichen. Denn ansonsten wäre nach
seinem Paradox ein Protein ein Leben lang damit
beschäftigt, diesen optimalen Zustand zu erreichen.
Dieser alten Auffassung, die als sequential micropath
perspective bezeichnet wird, steht die neue
Perspektive (ensemble perspective), aus der die Idee
zur Anwendung von energy landscapes erwächst,
gegenüber. Dabei ist die Thermodynamik der
Proteinfaltung zentral, dass nämlich Proteine bei ihrer
Faltung minimale Energieniveaus einnehmen. Dieser
Aspekt wird auch in der Gestalt der energy landscapes
deutlich. Das sind mehrdimensionale trichterförmige
Funktionsgraphen bei denen die innere Energie der
Polypeptidkette (hier als Fmicro bezeichnet) in
Abhängigkeit
von
den
Freiheitsgrade
der
Fig. 5) Energy landscapes zeigen den energetisch
günstigsten Falltungsweg auf.
4.1
Folgerungen aus dem Modell der energy
landscapes
In diesem Modell wird deutlich, dass man die
Proteinfaltung
nicht
als
einen
Optimierungsalgorithmus auffassen muss, dessen
Effizienz von dem betrachteten Suchraum abhängig
ist. In dieser Vorstellung ist die Größe des Suchraums
gänzlich uninteressant, weil die Optimierung immer
einen abwärts verlaufenden Pfad beschreibt, der in
einem energetischen Minimum endet. Damit lässt sich
erklären, wie ein Protein innerhalb von Millisekunden
in seinen natürlichen Zustand falten kann. Denn bei
einer zum absoluten Minimum hin monoton fallenden
energy landscape läuft dieser Prozess mit
Diffusionsgeschwindigkeit ab. Gebremst wird der
Prozess durch lokale energetische Minima. Diese
werden auch als energetische Fallen bezeichnet, weil
nach den Gesetzen der Thermodynamik diese
Konformationen
auch
stabil
sind.
Durch
Katalysatoren, sogenannte Chaperons werden Proteine
aus energetischen Fallen befreit, um auf noch
niedrigere Energieniveaus zu gelangen. Im
allgemeinen werden Faltungswege bevorzugt, die
möglichst wenige energetische Barrieren beinhalten.
4.2
Bezug zwischen den energy landscapes und
den bisherigen Reaktionsdiagrammen
Die bisherigen Reaktionsdiagramme stellen die freie
Energie FMacro in Abhängigkeit zu einer
Fortschrittsvariable  dar. Wobei FMacro ein gemittelter
Wert ist, da es nicht gelingt, bei einer Messung nur
eine Polypeptidkette zu untersuchen. In FMacro fließt
außerdem die Entropie der Konformation mit ein. Im
Idealfall ließe sich FMacro als Differenz zwischen der
inneren Energie des einzelnen Proteins (FMicro) und
dem Produkt aus der Temperatur und der Entropie des
Konformationszustandes des Proteins berechnen. Das
Problem dabei
ist nur, dass FMicro() eben ein berechneter Wert einer
einzelnen Kette ist und FMacro() ein Durchschnittswert
vieler Ketten ist, wobei jede Kette der Brown‘schen
Molekularbewegung ausgesetzt ist. Allein deswegen
könnnen gerade zu Beginn der Faltung die
Faltungswege einzelner Ketten, die micropaths sehr
von einander abweichen. Dies wird deutlich, wenn
man die Trajektorien der energy landscapes in die
Ebene projiziert und die Projektionen mehrerer Ketten
übereinander legt. Die trichterförmige Gestalt der
energy landscapes macht deutlich, dass die
Faltungswege sich zum energetischen Minimum, dem
native state hin vereinheitlichen. In diesem Bereich
divergieren der micropath und der macropath der
Proteinfaltung entsprechend weniger von einander als
zu Beginn der Faltung.
Ziel ist es also, mit Hilfe der energy landscapes in
Zukunft Konformationsänderungen eines Proteins zu
simulieren
und
gemittelte
Messergebnisse
vorherzusagen, so dass der macropath einer Faltung
als ein Weg auf der energy landscape dargestellt
werden kann.
5
Fig. 6) Projektion der Faltungswege in die Ebene
Fig. 7) Vergleich der Faltungswege mehrerer
Einzelketten
Ausblick
Die Mathematik der hochdimensionalen Räume, die
zur Berechnung der energy landscapes notwendig ist,
wird weiter entwickelt werden, so dass man ein
detailliertes Bild von deren Beschaffenheit bekommt.
Desweiteren müssen Suchalgorithmen entwickelt
werden, die bei der Suche nach optimalen Wegen auf
der energy landscape hin zum absoluten energetischen
Minimum nicht in lokalen Minima hängen bleiben.
Aktuelle Suchalgorithmen (z.B. Monte Carlo) haben
genau das Problem und sind außerdem zu langsam. In
Zukunft wird es darum gehen, Algorithmen zu
entwickeln, die globale Informationen über alle
möglichen Faltungswege, die durch energy landscapes
gegeben sein werden, zu nutzen. Ein erster Ansatz ist
der CGU - Algorithmus (Convex global
underestimator). Dabei werden parabolisch konvexe
Oberflächen gebildet, die lokale Minima der energy
landscape schneiden, dann aber unterhalb der energy
landscape
verlaufen.
An
tiefergelegenden
Schnittpunkten mit der trichterförmigen energy
landscape läuft die Suche dann weiter, um so den
energetischen Fallen zu entgehen.
onsänderungen von Polypeptidketten in Zukunft
berechnet werden können, wenn es gelingt, die
Simulationsergebnisse gerade in frühen Faltungsphase
in geeigneter Weise zu mitteln. Dazu muss man
jedoch bedenken, dass die energy landscapes von
einem beliebig hochdimensionalen Parameterraum
abhängen, und wir daher zumindest bei detaillierteren
Simulationen heute noch von der dahinterstehenden
Mathematik buchstäblich erschlagen werden. Energy
landscapes sind zur Zeit die einzigen dynamischen
Modelle,
die
eine
Verbindung
zwischen
makroskopischen
Messdaten
und
den
mikroskopischen
Simulationsdaten
des
Faltungsprozesses zu schaffen versuchen.
Neuer Suchalgorithmus für absolute Minima Convex Global Underestimator (CGU)
Literatur:
"Polymer principles and protein folding“, Ken A. Dill
in Protein Sciences 1999 (8:1166-1180).
"Biochemie", Lubert Stryer, Spektrum Verlag 1996
Desweiteren gibt es eine ganze Reihe von konkreten
Überlegungen Gittermodelle zu erweitern und nicht
wie beim Lattice-Ising-Modell nur diskrete
Bindungswinkel und -längen zuzulassen. Sogenannte
Off-lattice-Modelle sind sogar schon dreidimensional.
Daraus werden sich in Zukunft sicher noch neue
weiterführende Perspektiven entwickeln.
6
Kurze Zusammenfassung und
Bewertung
Stark vereinfachende Modelle, wie das Lattice-IsingModell liefern die Hypothesen für neue Sichtweisen,
da sie unwichtige Aspekte wie atomare Details ver
nachlässigen und das Wesentliche in den Vordergrund
heben. So konnte gezeigt werden, dass die
hydrophobischen Interaktionen zwischen dem Protein
und dem Lösungsmittel die wichtigste Triebkraft für
die
Proteinfaltung
ist.
Dabei
spielt
die
Thermodynamik eine wichtige Rolle, so dass die
Suche nach dem natürlichen Zustand dem Lauf einer
Kugel in einem energetischen Trichter gleich kommt.
Damit wird der Suchraum irrelevant zur Zeit.
Energielandschaften geben eine Vorstellung davon,
wie
die
Konformati-
"Chemie", Charles E. Mortimer, Thieme-Verlag 1996
Herunterladen