Perspektiven in der Modellierung von Proteinfaltungsprozessen von Markus Butz 1 Einleitung Die vorliegende Arbeit entstand im Rahmen des Seminars „Proteindocking in der Bioinformatik“ im WS 1999/2000 (39 20 13). In dieser Arbeit beziehe ich mich auf die Publikation von Ken A. Dill „Polymer principles and protein folding“ in Protein Sciences 1999 (8:1166-1180). gemeinsam ist, dass sie statisch sind, das heißt, dass sie nur auf einzelne Zustände von Proteinen anwendbar sind. Proteinstrukturen sind jedoch dynamisch. Verschiedene Faktoren spielen bei der Strukturbildung eine Rolle, wie vor allem das Lösungsmittel, dockende Liganden, aber auch pHund Temperaturveränderungen beeinflussen die Proteinstruktur. Diese Dynamik fehlt in der bisherigen Modellierung der Faltung einzelner Polypeptidketten. Insbesondere die zeitliche Dimension, in der Konformationsänderungen von Proteinen ablaufen, ist von besonderem Interesse. Bisher ist es nur möglich, mit sogenannten „mass - action - Modellen“ die Energieveränderung bei sich faltenden Proteinen zu messen. Die in mass - action - Diagrammen dargestelleten Kurven werden auch als macropath einer Proteinfaltung bezeichnet. Ziel ist es, neue Perspektiven in der Modellierung von Faltungsprozessen bei Proteinen darzustellen und anhand bestehender Modelle zu diskutieren. Zunächst beginne ich damit, die Motivation für eine neue Perspektive zu begründen. In die Thematik einleitend stelle ich zwei bisher vertretenen Sichtweisen, die grundlegend voneinander divergieren, einander gegenüber. Im zweiten Abschnitt diskutiere ich die Vorhersagbarkeit von Proteinstrukturen anhand des „Blind Watchmaker‘s Paradox“ und des „Levinthal‘s Paradox“ unter evolutionstheoretischen Aspekten. Im Hauptteil der Arbeit stelle ich Modelle dar, mit denen man die zuvor beschriebenen Paradoxe auflösen kann. Insbesondere stelle ich Funktionen dar, sogenannte energy landscapes, mit denen Konformationsänderungen von Proteinen in Zukunft berechnet werden sollen. Daran schließt sich ein Vergleich der Aussagefähigkeit von empirischen Daten aus Faltungsexperimenten und der Aussagefähigkeit der aus den Modellen errechneten Daten an. Im fünften Abschnitt folgen Ausblicke auf weitere Modellansätze und Optimierungsmethoden zur Berechnung von Proteinstrukturen. Ich schließe die Arbeit mit einer kurzen Zusammenfassung und Bewertung der dargestellten Inhalte. 1.1 Motivation Der molekulare Bauplan des Lebens wird durch Aminosäuren kodiert, welche in spezifischer Weise aneinandergereiht, Proteine ausbilden. Die Funktionalität der Proteine ist durch deren dreidimensionale Struktur und die damit verbundene thermodynamische Aktivität gegeben, wobei sich deren Struktur aus der Aminosäuresequenz herleitet. Dazu gibt es eine ganze Reihe von Modellen, mit denen sich konkrete Faltungszustände von Proteinen beschreiben lassen. Statistische Untersuchungen ermöglichen es, Vorhersagen darüber zu machen, ob eine bestimmte Abfolge von hydrophoben oder polaren Aminosäuren eher in einer Alpha-Helix oder in einem Beta-Faltblatt vorkommt. Diesen Modellen Fig. 1) Alte Chemikersicht: Der messbare Verlauf einer Reaktion wird in einem Mass-Action Diagramm wiedergegeben. Bei den simpelsten dieser Modellen werden nur die gemittelten Energieniveaus von Proteinen im denaturierten und natürlichen Zustand in einem Koordinatensystem gegen die Zeit aufgetragen. Detailliertere Modelle berücksichtigen auch Zwischenstufen im Faltungsprozess, jedoch sind auch die daraus resultierenden Werte für die detaillierte Modellierung von Konformationsänderungen einzelner Proteine nicht brauchbar, da die Messungen keine Aussagen über eine einzelne Polypeptidkette erlauben. Es wird daher ein neues Modell gebraucht, was im Gegensatz zu den bisherigen Modellen, den „micropath“, den Faltungsweg eines Proteins für jede beliebige Reaktionskoordinate berechnet. Dazu ist jedoch eine neue Perspektive notwendig, aus der Proteinfaltung gesehen wird. Im folgenden sollen zwei Perspektiven dargestellt werden. 1.2 Die backbone - orientierte Perspektive Diese Sichtweise ist über einen Zeitraum von fast 50 Jahren vertreten worden. Seit 1933 haben Mirsky und Pauling daran gearbeitet. Im Focus dieser Sichtweise steht das Rückgrat eines Proteins. Mirsky und Pauling gingen davon aus, dass vor allem H-Brücken zwischen den Seitenketten und sterische Zwänge die - und - Winkel festlegen. Daraus haben sie Sekundärstrukturen wie alpha-Helizes und beta-Sheets gefordert. Diese Sichtweise wurde vor allem dadurch gestärkt, dass die geforderten Sekundärstrukturen tatsächlich mittels Röntgenstrukturanalysen nachgewiesen werden konnten. Später entwickelten sie dann ein Modell zum Verständnis der helix-coil-transition, also dem Übergang von der Sekundär- zur Tertiärstruktur eines Proteins. Auch hierbei wurden den H-Brücken und der Konstellationen der - und -Winkel zentrale Bedeutung zugeordnet. Fig. 2) Drehwinkel des Rückgrats Eine Hypothese, die von dieser Sichtweise abgeleitet wurde, ist die, dass Proteinfaltung hierarchisch verläuft. Danach bilden sich aus der Primärstruktur zunächst Sekundärstrukturen, worauf aufbauend dann eine Tertiärstruktur des Proteins resultiert. 1.3 Die side-chain - orientierte Perspektive Diese Sichtweise wird seit rund 15 Jahren favorisiert. Im Vordergrund hierbei stehen die hydrophobischen Interaktionen zwischen Polypeptidkette und Lösungsmittel. Dabei zwingt das Lösungsmittel das Protein durch die Ausbildung von Hydrathüllen um hydrophobe Anteile, eine neue Konformation einzunehmen. Dabei ist diese Sichtweise im Kern die Formulierung eines Optimierungsproblems, nämlich die Polypeptidkette so zu falten, dass möglichst viele Kontakte zwischen hydrophoben Aminosäuren ausgebildet werden und diese im Inneren des Kneuls liegen, damit sie leichter durch polare Aminosäuren vor dem ebenfalls polaren Lösungsmittel abgeschirmt werden können. Von zentraler Bedeutung sind in dieser Sichtweise also die Seitenketten mit ihren chemischen Eigenschaften. Dagegen treten die Strukturmerkmale wie z. B. Bindungswinkel und Helizes als Folgeerscheinung hydrophobischer Wechselwirkungen in den Hintergrund. 1.4 Diskussion der beiden Perspektive Die backbone - orientierte Perspektive hat sicher zum Verständnis von Sekundärstrukturen beigetragen, aber sie ist nicht ausreichend, wenn es darum geht, komplexe Tertiärstrukturen vorherzusagen, weil die Vorhersage von dreidimensionalen Proteinstrukturen nur unter Betracht lokaler Interaktionen wie der Winkelkonstellationen ein exponentielles Problem darstellt, dass sich so nicht berechnen lässt. Algorithmen, die von dieser Sichtweise ausgehen sind zwar in der Lage, Sekundärstrukturen vorherzusagen, aber es gelingt nicht, den Kollaps eines Proteins bishin zum natürlichen Zustand zu prognostizieren. Von entscheidendem Vorteil bei der side-chain orientierten Perspektive ist gerade die Berücksichtigung von nicht-lokalen Interaktionen als zentrale strukturgebende Einflüsse. Denn durch neuere Experimente weiß man, dass bereits die Ausbildung von Sekundärstrukturen kontextabhängig ist. Das bedeutet nun, ob eine alpha-Helix ausgebildet wird oder nicht, ist nicht nur von den beteiligten Aminosäuren abhängig, sondern auch von benachbarten Kettenabschnitten und den Wechselwirkungen dazwischen. Desweiteren konnte gezeigt werden, dass die Faltung nicht zwingend hierarchisch verläuft. Zwar sind die Bindungswinkel des Rückgrates für eine exakte Beschreibung einer Proteinfaltung nicht unwichtig, jedoch ergeben sich aus letzterer Perspektive mehr erfolgversprechende Ansätze für neue Modelle. 2 Fig. 3) Verteilung von hydrophoben und polaren Aminosäuren Die Vorhersagbarkeit von Proteinstrukturen Zunächst einmal faltet sich nicht jede Polypeptidkette zu einem dreidimensional stabilen Kneul. Nur ein sehr kleiner Teil von Sequenzen lässt die Anordnung ihrer Bestandteile so zu, wie das in einem natürlichen Zustand eines Proteins der Fall ist. Gerade der Endzustand einer Proteinfaltung erzeugt den Eindruck einer nahezu perfekten Konstruktion. Die Sequenz der Teile für diese geometrische Konstruktion vollständig dem Zufall nach zu finden und aneinanderzureihen, lässt sich anscheinend mit der Arbeitseffizienz eines blinden Uhrmachers vergleichen. Richard Dawkins hat dieses sogenannte „Blind Watchmaker‘s Paradox“ aufgestellt, das besagt: „Die Wahrscheinlichkeit, natürliche Proteine dem Zufall nach in einem Raum aller möglichen Sequenzen zu finden, scheint unendlich klein.“ Das bedeutet, die Wahrscheinlichkeit, zufällig von allen möglichen Polypeptidketten beispielsweise gerade die mit der Sequenz des Lysozyms zu finden, geht gegen null. Selbst eine spezifische Sequenz mit nur hundert Aminosäuren zu finden, ist mit einer Wahrscheinlichkeit von 1:10130 unvorstellbar klein. Diese Zahlen bieten Evolutionsgegnern immer wieder Angriffspunkte, die gesamte Evolutionstherorie in Frage zu stellen. Vor allem Kreationisten, die die Natur mit ihrer Artenvielfalt als etwas von Gott gegebenes ansehen, schließen eine Makroevolution, insbesondere die Entstehung des Lebens aus Makromolekülen aus. Der Denkfehler, der hinter dieser Evolutionskritik steht und zu solchen Widersprüchen führt, ist recht simpel: Die Evolution ist eben nicht zielgerichtet. Es ist einfach die falsche Denkrichtung zu fragen, wie hoch die Wahrscheinlichkeit ist, dass genau ein bestimmtes Protein mit einer eindeutigen Sequenz gerade per Zufall gefunden wird. Stattdessen geht es in der Evolution zunächst einmal nur darum, wie hoch die Wahrscheinlichkeit ist, dass überhaupt eine Aminosäuresequenz gefunden wird, die zu einer kompakten Struktur faltet. Desweiteren geht es darum, ob eine Aminosäurekette biologische relevant ist oder nicht, und genau das hängt nicht von ihrer eindeutigen Sequenz ab, sondern von ihrer gefalteten Struktur. Genau diese aber ist nicht notwendig nur durch eine Sequenz definiert. (Auf den Zusammenhang zwischen Sequenz und Struktur gehe ich im dritten Abschnitt genauer ein.) Eine Polypeptidkette, die dem Lysozym in Struktur und Funktion ähnelt, findet sich in einem Liter einer nanomolaren Flüssigkeit statistisch gesehen zumindest einmal. Gemessen an der Litermenge eines Ozeans relativiert sich dieses Verhältnis recht schnell. Zuletzt bleibt zu bedenken, dass sich in der Evolution immer Zufallsschritte mit Schritten der Optimierung abwechseln (Darwin: Prinzip der Mutation und Selektion). Wenn die spezifische Sequenz für eine bestimmte Struktur nicht im Vordergrund steht, so bleibt trotzdem zu fragen, wie das Optimierungsproblem, das sich bei einem Protein vom Übergang vom denaturierten zum naürlichen Zustand darstellt, in einer für den Zellstoffwechsel akzeptablen Zeit zu lösen ist. Levinthal formulierte das in dem Zusammenhang zweite wichtige Paradox: „Die Wahrscheinlichkeit, dass der native state eines Proteins durch naive Suche gefunden wird, scheint unmöglich klein.“ (Levinthal‘s Paradox) Ohne Zusatzinformationen lässt sich dieses Paradox nicht auflösen, aber auch hier hängt die Lösbarkeit des Problems von der Sichtweise ab. Die im ersten Teil beschriebene side-chain - orientierte Perspektive liefert einen Ansatz, um zu erkennen, dass der Zufall nicht die einzige statistische Größe in diesem Prozess ist. Bereits kleine Lenkungen in einem vom Zufall abhängigen Prozess können bereits die dafür benötigte Zeit um zehn bis hundert Größenordnungen verringern. Man stelle sich dazu nur einen Golfplatz vor, auf dem ein Golfball durch Zufall das Loch finden soll. Das Problem scheint so lange aussichtslos ineffizient, bis man annimmt, dass der Golfplatz nur minimal zum Loch hin geneigt ist. (Das Problem der Proteinfaltung wird ebenfalls im nächsten Abschnitt ausführlich anhand von Modellen diskutiert.) 3 Modelle zur Berechnung von Faltungswegen Zum vollständigen Auflösen der im vorigen Abschnitt diskutierten Paradoxe sind Modelle notwendig, mit denen man den dynamischen Prozess der Proteinfaltung beschreiben kann. Zunächst resultiert eine Grundannahme aus der side-chain - orientierten Perspektive: Da die hydrophobische Interaktion zwischen der Polypeptidkette und dem Lösungsmittel als wesentliche Triebkraft der Proteinfaltung angesehen wird, ist es bei der Modellierung von Faltungswegen legitim, von der genauen Proteinsequenz zu abstrahieren und dafür nur die Sequenz von hydrophoben und polaren Seitenketten zu betrachten. Dieses sogenante HP-Modell vernachlässigt zwar atomare Details, aber darin liegt gerade die entscheidende Stärke des Modells. Denn für die Modellierung eines so komplexen Problems wie der Proteinfaltung kommt man ohne Simplifizierungen nicht zum Ergebnis. So ist es nun mit dieser Abstraktion zu einem binären Alphabet der Aminosäuren möglich, den gesamten Sequenz- und Konformationsraum zu durchsuchen. Mit Hilfe des HP-Modells lässt sich das Blind Watchmaker‘s Paradox vollständig auflösen: Für eine Polypeptidkette von 100 Aminosäuren gibt es anstatt 10130 danach nämlich nur noch 2100 = 1030 mögliche Sequenzen. Desweiteren könnte man diese Zahl sogar noch auf ein Drittel reduzieren, wenn man von der Funktion des Proteins abstrahiert. Denn nur ein Drittel der Aminosäuren liegen in dem für den kollabierten Zustand des Proteins interessanten Kern; der Rest liegt an der Oberfläche. Um nun das oben beschriebene Optimierungsproblem anzugehen, nämlich möglichst viele hydrophobe Kontakte im Kern zu erreichen, hat Stanley 1971 basierend auf dem HP-Modell ein Gittermodell entwickelt, das als erstes dynamisches Modell für einen micropath gesehen werden kann. Dieses wird im folgenden beschrieben. 3.1 Das Lattice Ising Modell Hierbei handelt es sich um eine enorme Vereinfachung des Faltungsproblems. Hydrophobe und polare Aminosäuren werden in einem zweidimensionalen Modell als weiße bzw. schwarze Punkte dargestellt, die durch zu einander orthogonale Strecken verbunden sind. Durch die Strecken werden Bindungen repräsentiert, welche nur diskrete Winkel von 90°- Schritten annehmen dürfen und immer gleich lang sind. In einem Koordinatensystem werden die Anzahl der möglichen Konformationen gegen die Anzahl der hydrophobischen Kontakte aufgetragen. Die Anzahl der hydrophobischen Kontakte ist an dieser Stelle eine spezielle Interpretation der ansonsten allgemeinen Fortschritssvariable (auch Reaktionskoordinate genannt). Der Schauplatz einer Reaktion ist ein System. Die Summe aller Energieformen in diesem System ist die innere Energie (U). Die innere Energie eines Systems kann nicht gemessen werden, sondern nur Änderungen der selben (delta U) durch z.B. Messen von Temperaturänderungen. delta U wird als Reaktionsenergie bezeichnet. Das System kann von seiner Umgebung Energie in der Regel in Form von Wärme aufnehmen bzw. bei Verrichten von Arbeit wieder abgeben. Damit berrechnet sich die Veränderung der inneren Energie aus der Differenz von aufgenommener Energie (Q) und der verrichteten Arbeit (W). Löst man die Gleichung nach Q auf und bestimmt die Differenz zwischen aufgenommener Energie (Enthalpie) im Anfangs- und Endzustand einer Reaktion, so erhält man die Reaktionsenthalpie (delta H) einer Zustandsänderung. Der erste Hauptsatz der Thermodynamik sagt nichts darüber aus, ob eine Reaktion spontan abläuft ode nicht. Dazu muss eine weitere thermodynamische Größe definiert werden, nämlich die Entropie (S), ein Maß für die Unordnung in einem System. Der zweite Hauptsatz besagt nun, dass eine Reaktion nur dann spontan ablaufen kann, wenn dabei die Entropie zunimmt. Fig. 4) Anzahl der möglichen Konformationen mit gleichem Energieniveau, das mit der Anzahl der hydrophoben kontakte korreliert. Die Berechtigung für ein so stark vereinfachtes Modell, liegt in der Absicht, aus den Ergebnissen eines solchen Modells neue Hypothesen formulieren zu wollen. 3.2 Modellierung der Thermodynamik von Konformationsänderungen „Die Thermodynamik ist die Lehre von Energieänderungen im Verlaufe von physikalischen und chemischen Vorgängen.“ (Definition aus „Chemie“ von Charles E. Mortimer, Thieme-Verlag 1996) Damit liefert die Thermodynamik die essentiellen Werkzeuge zur Schaffung eines dynamischen Modells der Konformationsänderungen von Proteinen. Aus diesem Grund sollen an dieser Stelle der erste und zweite Hauptsatz der Thermodynamik sowie in diesem Kontext relevante Definitionen aufgeführt werden. Der erste Hauptsatz ist der Energieerhaltungssatz, der besagt, dass Energie nur von einer Form in die andere umgewandelt werden kann, aber weder vernichtet noch erzeugt werden kann. Dabei kommt es nicht nur auf eine Entropiezunahme im System an, sondern auch in der Umgebung. Entscheidend ist also die Gesamtentropie also die Summe aus der Entropie des Systems und der der Umgebung. Bei konstantem Volumen kann man diese Gleichung umformen, so dass man eine Differenz zwischen der inneren Energie und dem Produkt aus Entropie des Systems und Temperatur erhält. Diese Differenz wird freie Energie (F) genannt. Aus der Änderung der freien Energie vom Anfangs- zum Endzustand der Reaktion ergibt sich die freie Reaktionsenergie (delta F), welche ein hinreichendes Kriterium dafür ist, ob eine Reaktion spontan abläuft oder nicht. Für alle delta F kleiner null läuft die Reaktion spontan ab. Dagegen läuft sie für alle delta F größer null nicht freiwillig ab und für delta F gleich null befindet sich die Reaktion im Gleichgewichtszustand. Daraus lassen sich zwei wichtige Gesetzmäßigkeiten der Thermodynamik ableiten, die für die Fragestellung der Proteinfaltung relevant sind: Bei einer Reaktion wird ein Energieminimum angestrebt, da dann die Reaktionsenergie ein negatives Vorzeichen erhält und somit zu einem negativen Wert der freien Reaktionsenergie beiträgt. Bei einer Reaktion wird ein Maximum an Unordnung angestrebt; denn aus der Gleichung für die freie Reaktionsenergie folgt, dass diese um so eher negativ ist, je größer die Entropie in diesem System wird. (Die Herleitung dieser beiden Gesetzmäßigkeiten ist ausführlich auf den Seiten 332 bis 338 in bereits o. g. Lehrbuch beschrieben.) Der Bezug zu den Faltungsmodellen stellt sich nun wie folgt dar: Das Lösungsmittel zwingt das Protein zu kollabieren, was die hydrophoben Kontakte zwischen den Seitenketten erhöht. Je mehr hydrophoben Kontakte mit der Zeit ausgebildet werden, desto negativer ist die Entropieänderung im System also dem Protein. Das bedeutet jedoch, dass die Unordnung nicht wie verlangt zunimmt, sondern abnimmt. Daraus folgt zwingend, dass die Konformationsänderung hin zu maximal vielen hydrophoben Kontakten gleichzeitig eine Konformationsänderung hin zu einem Energieminimum ist, damit die Reaktion überhaupt noch spontan ablaufen kann. Polypeptidkette (1, ..., n) dargestellt wird. Trichterförmig sind diese Funktionsgraphen zum anderen deshalb, weil es mehr Konformationen mit hohem Energieniveau als mit niedrigem gibt, was bereits aus den Lattice-Ising-Modellen zu fordern war. Um diese Funktionen als Oberfächenplotts graphisch darstellen zu können, wird der hochdimensionale Parameterraum () aller Freiheitsgerade in eine Ebene projeziert. Auf der darauf senkrechten Achse ist das zugehörige Energieniveau als Funktionswert abzulesen. Die Funktion erreicht ihr absolutes Minimum für diejenige Konformation, die dem native state des Proteins entspricht. Der Kollaps einer einzelnen Polypeptidkette kann als Weg auf der energy landscape von einem beliebigen Punkt bishin zum absoluten Minimalpunkt dargestellt werden. Die Anzahl der hydrophobe Kontakte wird im Lattice - Ising - Modell mit bezeichnet, was jedoch nur ein Spezialfall der Reaktionskoordinate ist. In sogenannten energy landscapes wird sowohl von der der Anzahl der hydrophoben Kontakte abstrahiert als auch von diskreten Bindungswinkeln und -längen, und stattdessen die Energieniveaus beliebiger Konformationen in einem multidimensionalen Oberflächenplott dargestellt. Die Theorie der energy landscapes wird im folgenden besprochen. 4 Ein neuer Ansatz: Energy landscapes zur Modellierung von Proteinfaltungswegen Energy landscapes sind weder neu noch auf die Verwendung für Proteine beschränkt. Sie sind nur deshalb an dieser Stelle interessant zu diskutieren, weil ihre Anwendung auf Proteine eine neue Perspektive in der Modellierung der Faltungskinetik von Proteinen darstellt. Bislang gibt es nämlich kein Modell, was in der Lage ist, den Faltungsweg einer einzelnen Polypeptidkette zu berechnen oder vorherzusagen. Levinthal forderte 1968, als er sein Paradox aufgestellt hat, dass es einen Pfad geben müsse, dem alle Proteine folgen, um ihren natürlichen Zustand zu erreichen. Denn ansonsten wäre nach seinem Paradox ein Protein ein Leben lang damit beschäftigt, diesen optimalen Zustand zu erreichen. Dieser alten Auffassung, die als sequential micropath perspective bezeichnet wird, steht die neue Perspektive (ensemble perspective), aus der die Idee zur Anwendung von energy landscapes erwächst, gegenüber. Dabei ist die Thermodynamik der Proteinfaltung zentral, dass nämlich Proteine bei ihrer Faltung minimale Energieniveaus einnehmen. Dieser Aspekt wird auch in der Gestalt der energy landscapes deutlich. Das sind mehrdimensionale trichterförmige Funktionsgraphen bei denen die innere Energie der Polypeptidkette (hier als Fmicro bezeichnet) in Abhängigkeit von den Freiheitsgrade der Fig. 5) Energy landscapes zeigen den energetisch günstigsten Falltungsweg auf. 4.1 Folgerungen aus dem Modell der energy landscapes In diesem Modell wird deutlich, dass man die Proteinfaltung nicht als einen Optimierungsalgorithmus auffassen muss, dessen Effizienz von dem betrachteten Suchraum abhängig ist. In dieser Vorstellung ist die Größe des Suchraums gänzlich uninteressant, weil die Optimierung immer einen abwärts verlaufenden Pfad beschreibt, der in einem energetischen Minimum endet. Damit lässt sich erklären, wie ein Protein innerhalb von Millisekunden in seinen natürlichen Zustand falten kann. Denn bei einer zum absoluten Minimum hin monoton fallenden energy landscape läuft dieser Prozess mit Diffusionsgeschwindigkeit ab. Gebremst wird der Prozess durch lokale energetische Minima. Diese werden auch als energetische Fallen bezeichnet, weil nach den Gesetzen der Thermodynamik diese Konformationen auch stabil sind. Durch Katalysatoren, sogenannte Chaperons werden Proteine aus energetischen Fallen befreit, um auf noch niedrigere Energieniveaus zu gelangen. Im allgemeinen werden Faltungswege bevorzugt, die möglichst wenige energetische Barrieren beinhalten. 4.2 Bezug zwischen den energy landscapes und den bisherigen Reaktionsdiagrammen Die bisherigen Reaktionsdiagramme stellen die freie Energie FMacro in Abhängigkeit zu einer Fortschrittsvariable dar. Wobei FMacro ein gemittelter Wert ist, da es nicht gelingt, bei einer Messung nur eine Polypeptidkette zu untersuchen. In FMacro fließt außerdem die Entropie der Konformation mit ein. Im Idealfall ließe sich FMacro als Differenz zwischen der inneren Energie des einzelnen Proteins (FMicro) und dem Produkt aus der Temperatur und der Entropie des Konformationszustandes des Proteins berechnen. Das Problem dabei ist nur, dass FMicro() eben ein berechneter Wert einer einzelnen Kette ist und FMacro() ein Durchschnittswert vieler Ketten ist, wobei jede Kette der Brown‘schen Molekularbewegung ausgesetzt ist. Allein deswegen könnnen gerade zu Beginn der Faltung die Faltungswege einzelner Ketten, die micropaths sehr von einander abweichen. Dies wird deutlich, wenn man die Trajektorien der energy landscapes in die Ebene projiziert und die Projektionen mehrerer Ketten übereinander legt. Die trichterförmige Gestalt der energy landscapes macht deutlich, dass die Faltungswege sich zum energetischen Minimum, dem native state hin vereinheitlichen. In diesem Bereich divergieren der micropath und der macropath der Proteinfaltung entsprechend weniger von einander als zu Beginn der Faltung. Ziel ist es also, mit Hilfe der energy landscapes in Zukunft Konformationsänderungen eines Proteins zu simulieren und gemittelte Messergebnisse vorherzusagen, so dass der macropath einer Faltung als ein Weg auf der energy landscape dargestellt werden kann. 5 Fig. 6) Projektion der Faltungswege in die Ebene Fig. 7) Vergleich der Faltungswege mehrerer Einzelketten Ausblick Die Mathematik der hochdimensionalen Räume, die zur Berechnung der energy landscapes notwendig ist, wird weiter entwickelt werden, so dass man ein detailliertes Bild von deren Beschaffenheit bekommt. Desweiteren müssen Suchalgorithmen entwickelt werden, die bei der Suche nach optimalen Wegen auf der energy landscape hin zum absoluten energetischen Minimum nicht in lokalen Minima hängen bleiben. Aktuelle Suchalgorithmen (z.B. Monte Carlo) haben genau das Problem und sind außerdem zu langsam. In Zukunft wird es darum gehen, Algorithmen zu entwickeln, die globale Informationen über alle möglichen Faltungswege, die durch energy landscapes gegeben sein werden, zu nutzen. Ein erster Ansatz ist der CGU - Algorithmus (Convex global underestimator). Dabei werden parabolisch konvexe Oberflächen gebildet, die lokale Minima der energy landscape schneiden, dann aber unterhalb der energy landscape verlaufen. An tiefergelegenden Schnittpunkten mit der trichterförmigen energy landscape läuft die Suche dann weiter, um so den energetischen Fallen zu entgehen. onsänderungen von Polypeptidketten in Zukunft berechnet werden können, wenn es gelingt, die Simulationsergebnisse gerade in frühen Faltungsphase in geeigneter Weise zu mitteln. Dazu muss man jedoch bedenken, dass die energy landscapes von einem beliebig hochdimensionalen Parameterraum abhängen, und wir daher zumindest bei detaillierteren Simulationen heute noch von der dahinterstehenden Mathematik buchstäblich erschlagen werden. Energy landscapes sind zur Zeit die einzigen dynamischen Modelle, die eine Verbindung zwischen makroskopischen Messdaten und den mikroskopischen Simulationsdaten des Faltungsprozesses zu schaffen versuchen. Neuer Suchalgorithmus für absolute Minima Convex Global Underestimator (CGU) Literatur: "Polymer principles and protein folding“, Ken A. Dill in Protein Sciences 1999 (8:1166-1180). "Biochemie", Lubert Stryer, Spektrum Verlag 1996 Desweiteren gibt es eine ganze Reihe von konkreten Überlegungen Gittermodelle zu erweitern und nicht wie beim Lattice-Ising-Modell nur diskrete Bindungswinkel und -längen zuzulassen. Sogenannte Off-lattice-Modelle sind sogar schon dreidimensional. Daraus werden sich in Zukunft sicher noch neue weiterführende Perspektiven entwickeln. 6 Kurze Zusammenfassung und Bewertung Stark vereinfachende Modelle, wie das Lattice-IsingModell liefern die Hypothesen für neue Sichtweisen, da sie unwichtige Aspekte wie atomare Details ver nachlässigen und das Wesentliche in den Vordergrund heben. So konnte gezeigt werden, dass die hydrophobischen Interaktionen zwischen dem Protein und dem Lösungsmittel die wichtigste Triebkraft für die Proteinfaltung ist. Dabei spielt die Thermodynamik eine wichtige Rolle, so dass die Suche nach dem natürlichen Zustand dem Lauf einer Kugel in einem energetischen Trichter gleich kommt. Damit wird der Suchraum irrelevant zur Zeit. Energielandschaften geben eine Vorstellung davon, wie die Konformati- "Chemie", Charles E. Mortimer, Thieme-Verlag 1996