Energy Landscape of a Random Heteropolymer Many aspects of the folding process can be understood from studying the energetic properties of a random heteropolymer (RHP). Helpful tool: lattice models of protein conformations Simplest model uses two kinds of residues (i.e. hydrophobic and hydrophilic amino acids) that are randomly distributed. Simulations show (1) small modest structural changes give rise to large changes in energy (2) low energy states exist that are very different in structure but close in energy. 3. Lecture SS 2006 GK 1276 1 Foldable sequences Within the space of random heteropolymers based on the 20 naturally occurring amino acids there would be 20N possible sequences of length N. Only a small subset of these sequences are thermodynamically and kinetically foldable on the appropriate biological timescale seen in nature. The kinetically allowed set is shown to lie within the thermodynamic core. Onuchic, Luthey-Schulten, Wolynes, Annu Rev Phys Chem 48, 545 (1997) 3. Lecture SS 2006 GK 1276 2 Einleitung: Aminosäuren In Peptiden und Proteinen sind Aminosäuren als lange Ketten miteinander verbunden. Paare von jeweils zwei werden durch eine „Peptidbindung“ verknüpft. (Emil Fischer und Franz Hofmeister, 1902). H + O H3N R1 O - + + G>0 H3N 3. Lecture SS 2006 H H R2 H O + R2 O H3N H - O N R1 Emil Fischer, Nobelpreis 1902 Zucker- und Purinsynthese O H3N H O + H O + - H2O O N R1 H R2 O peptide bond GK 1276 3 Eigenschaften der Peptidbindung E.J. Corey und Linus Pauling studierten die Petidbindung in den 1940‘ern und 1950‘ern. Linus Pauling Sie fanden: die C-N Länge ist 1.33 Å. Sie liegt damit zwischen 1.52 Å und 1.25 Å, was die Werte für eine Einfach- bzw. Doppelbindung sind. Nobelpreise für Chemie 1954 und Frieden 1963 H + H3N R1 Die benachbarte C=O Bindung hat eine Länge Von 1.24 Å, was etwas länger als eine typische Carbonyl- C=O Doppelbindung ist (1.215 Å). die Peptidbindung hat einen teilweise konjugierten Charakter und ist nicht frei drehbar. Es bleiben damit pro Residue 2 frei drehbare Diederwinkel des Proteinrückgrats übrig. 3. Lecture SS 2006 GK 1276 O O - + + G>0 H3N R2 O H + H R2 H O H3N H - O N R1 + O H3N H O + H O - H2O O N R1 H R2 O peptide bond 4 Einleitung: Sekundärstrukturelemente Wie seit den 1950‘er Jahren bekannt, können Aminosäure-Stränge Sekundärstrukturelemente bilden: (aus Stryer, Biochemistry) -Helices und -Stränge. In diesen Konformationen bilden sich jeweils Wasserstoffbrückenbindungen zwischen den C=O und N-H Atomen des Rückgrats. Daher sind diese Einheiten strukturell stabil. 3. Lecture SS 2006 GK 1276 5 Was bestimmt die Proteineigenschaften? Zu Zeiten des zweiten Weltkriegs glaubte man, die Eigenschaften von Proteinen würden durch ihre Zusammensetzung aus Aminosäuren bestimmt. Durch die Arbeiten von Frederick Sanger (1949-51) zur Bestimmung der Aminosäuresequenz eines Proteins – und schließlich der Entschlüsselung der Sequenz von Insulin – wurde klar, dass die Eigenschaften eines Proteins durch seine Aminosäuresequenz bestimmt werden. Frederick Sanger, Nobelpreise für Chemie 1958 und 1980 Proteine bestehen aus einer linearen Polymerkette, die 20 verschiedene Aminosäuren enthalten kann. Alle Kopien eines Proteins haben eine identische Sequenz. Durch die Bestimmung der kompletten Genomsequenzen von Organismen weiß man, dass Prokaryonten ca. 2000 – 5000 Proteine (d.h. verschiedene Proteine) enthalten und Eukaryonten ca. 10.000 – 50.000. 3. Lecture SS 2006 GK 1276 6 Christian Anfinsen (1956) Studierte die Eigenschaften von Ribonuclease A, einem kleinen Enzym mit 124 Aminosäuren, in dem 4 Disulfidbrücken verschiedene Abschnitte der Polypeptidkette im gefalteten Zustand stabilisieren. Disulfidbrücken eines Proteins denaturieren gewöhnlich (d.h. brechen auf), wenn man reduzierende Substanzen wie Mercaptoethanol hinzugibt. Wenn man dies mit Ribonuklease A macht und das Urea/Mercaptoethanol später wieder entfernt, entsteht ein Protein mit gleicher Aktivität wie das ursprüngliche Protein! Die Faltung geschieht selbst-assemblierend. Die Struktur eines Proteins wird allein aus seiner Sequenz bestimmt. (Nobelpreis 1972). 3. Lecture SS 2006 GK 1276 [Karp] 7 Wieviele Proteine gibt es? Da es 20 verschiedene Aminosäuren gibt, gibt es 20200 verschiedene Sequenzen der Länge 200! Allerdings können sich nur eine sehr kleine Teilmenge davon zu dreidimensionalen Strukturen falten, die gegenüber Verdauenzymen stabil sind. Wie groß ist ein Protein? 3. Lecture SS 2006 Durchmesser 3-10 Nanometer GK 1276 8 Levinthal-Paradoxon Für ein Protein mit 100 AS und jeweils 2 Konformationen für jede Aminosäure ergeben sich 2100 = 1.27 x 1030 mögliche Konformationen des Proteins. Wenn das Protein 10-13 sec brauchen würde, jede einzelne Konformation abzusuchen, zu „samplen“, dann würde es 10-13 x 1.27x1030 = 1.27 x 1017 s = 4 x 109 Jahre brauchen bis es alle seine Konformationen abgesucht hätte und eventuell die energetisch günstigste gefunden hätte. Dies ist offensichtlich nicht möglich. Daher muß es Faltungshilfen oder spezielle Faltungspfade geben, sodaß das Protein nicht alle theoretisch mögliche Zustände absuchen braucht. 3. Lecture SS 2006 GK 1276 9 Random energy model (REM) The random energy model was originally developed by Derrida to describe spin glasses, and was first applied to biopolymers by Bryngelson and Wolynes (1987) as a 0-th order approximation. The low-energy structures of a RHP, represented by a lattice with two kinds of residues, are unrelated and the conformational changes are associated with a fluctuation in the energy. Onuchic, Luthey-Schulten, Wolynes, Annu Rev Phys Chem 48, 545 (1997) 3. Lecture SS 2006 GK 1276 10 Energy landscape of a random heteropolymer For a random sequence, the sum of interactions is expected to produce a Gaussian probability distribution for the energy E 2 P E exp 2 2 2 2 1 where and are the mean and standard deviation of the distribution, respectively. Onuchic, Luthey-Schulten, Wolynes, Annu Rev Phys Chem 48, 545 (1997) 3. Lecture SS 2006 GK 1276 11 entropy Energy landscape of a random heteropolymer The system runs out of entropy when the average energy falls below E0, and this entropy crisis is characterized by a glass transition temperature TG, which depends on the corresponding conformational entropy and fluctuations. If is the total number of configurational states the entropy can be written as S E k ln PE Onuchic, Luthey-Schulten, Wolynes, Annu Rev Phys Chem 48, 545 (1997) 3. Lecture SS 2006 GK 1276 12 Properties of Random Heteropolymers The system runs out of entropy when the average energy falls below a critical value E E0 such that S(E) = 0, or P(E) = 1/. E 2 1 exp 2 2 2 2 This entropy crisis occurs at a glass-transition temperature TG where 1 Two solutions, lower energy corresponds to entropy crisis ... E 2 (without derivation assuming a microcanonical distribution) Tg 3. Lecture SS 2006 2 2 E 2 k 2 ln ln 2 E 2 2 exp 2 2 2 2 2 E ln 2 2 ln 2 2 2 2 ln 2 2 E 2 ln 2 2 2 GK 1276 13 Folding energy funnel Onuchic, Luthey-Schulten, Wolynes, Annu Rev Phys Chem 48, 545 (1997) 3. Lecture SS 2006 GK 1276 14 Foldable sequences Phase diagram and folding scenarios according to the minimally frustrated REM analysis. (Top) The phase diagram along a line of some average sequence hydrophobicity shows the possible thermodynamic states of a protein modeled as a minimally frustrated heteropolymer. Varying the hydrophobicity by changes in solvent and temperature can modify the number of phases observed in the folding process. (Bottom) The free-energy curves consistent with the above phase diagram exhibit various folding scenarios: Type 0 and 1 are examples of fast folding, downhill with no barrier and a small barrier in the latter. These are typical scenarios for well-designed proteins at temperatures below the folding temperatures and conditions such that the glass transition is not encountered. The Type II scenarios occur at the right-hand side of the phase diagram under conditions that favor the formation of the glassy state either after or before the thermodynamic transition barrier. Onuchic, Luthey-Schulten, Wolynes, Annu Rev Phys Chem 48, 545 (1997) 3. Lecture SS 2006 GK 1276 15 Simulationsmodell Das Modell ist ein dreidimensionales Kopolymer. Polymere werden als self-avoiding walks auf einem kubischen Gitter dargestellt. Das Wechselwirkungspotential soll kompakte Zustände bevorzugen. Die Polymerkette soll kollabieren und sich falten. Das heisst, man braucht ein Potential, das den hydrophoben Effekt nachahmt, der die dominierenden Kraft für die Proteinfaltung ist. Das Potential besteht aus Kontakt-Wechselwirkungen zwischen nächsten Nachbarn. Das Potential soll einen eindeutigen Grundzustand besitzen. 3. Lecture SS 2006 GK 1276 16 Foldable sequences A random configuration for a 27-mer sequence encountered en route to the native structure. The maximally compacted conformation for this sequence, not shown here, has the shape of a 3 3 3 cube. Onuchic, Luthey-Schulten, Wolynes, Annu Rev Phys Chem 48, 545 (1997) 3. Lecture SS 2006 GK 1276 17 Monte Carlo moves (1) A rotation by angle in the xy-plane rotation matrix cos sin sin cos 0 0 can be achieved by application of the 0 0 1 (det() = cos2 +sin2 = 1 rotation preserves distances) while a rotation by angle in the xz-plane can be achieved by the rotation matrix cos 0 sin 0 sin 1 0 0 cos note that cos(-) = cos and sin(-) = -sin 3. Lecture SS 2006 GK 1276 18 Monte Carlo moves (2) A corner move. (3) A crankshaft move. 3. Lecture SS 2006 GK 1276 19 27-mer Proteinmodell [nach A.R. Dinner, M. Karplus, J. Phys. Chem. B, 103, 7976 (1999)] * In früheren Monte Carlo-Simulationen mit 27-meren auf einem kubischen Gitter (Anfang – Mitte der 90er Jahre) war die einzige Bedingung (notwendig und hinreichend) für die Fähigkeit einer Sequenz, eindeutig zu einem nativen Zustand zu falten, daß dieser ein globales Minimum der freien Energie sein mußte und zugleich durch einen ausreichend großen Energieabstand zu den übrigen Zuständen getrennt sein mußte. * Es gab keine Korrelation zwischen der Faltungsrate und anderen Eigenschaften der Sequenz, wie z.B. dem Anteil an Sekundärstruktur. 3. Lecture SS 2006 GK 1276 20 27-mer HP-Proteinmodell Kette H-H-H-P-P-H-P-H …. attraktive WW zwischen H-H und P-P, neutrale WW zwischen H-P Die Faltung solch eines 27-mers geschieht durch: - einen schnellen Kollaps (ca. 104 MC-Schritte) - gefolgt von einer langsamen, nicht-gerichteten Suche (ca. 107 MC-Schritte) durch die ca. 1010 semi-kompakten Strukturen nach einem der ca. 103 Übergangszustände. - Der anschließende Übergang in den nativen Zustand ist wiederum rasch (ca. 105 MC-Schritte) Diese Einschränkung der Suche auf kompakten Unterraum des Konfigurationsraums löste gewissermaßen das Levinthal-Paradoxon für solch ein 27-mer. Jedoch scheint dieser Mechanismus nur für kleine Proteine gültig zu sein, da die Faltungszeit exponentiell mit der Länge der Aminosäurekette ansteigt und unrealistisch hoch wird für mehr als 80 Residuen. 3. Lecture SS 2006 GK 1276 21 Faltung auf Oberfläche der freien Enthalpie geringe Temperatur 3. Lecture SS 2006 hohe Temperatur GK 1276 Dobson, Karplus, Angew. Chemie Int. Ed. 37, 868 (1998) 22 125-mer Proteinmodell * konstruiere also Modell, das Proteinfaltung für größere (und realistischere) Proteine beschreibt * 125-mere mit einem maximal kompakten 5 x 5 x 5 nativen Zustand haben eine ähnliche Länge und Oberfläche-zu-Volumen-Verhältnis (22%) wie globuläre Proteine. Polymerkette soll sich gemäß self-avoiding-walk falten. neue Energiefunktion für eine Konformation (modifiziertes Go-Modell) B0 ist eine mittlere attraktive WW, entsprechend einer allgemeinen hydrophoben WW Bij ist die sequenzspezifische WW: native Kontakte (Bij) mittlere WW e= -1.67, Standardabweichung 1.0 nicht-native Kontakte (Bij0) mittlere WW e= 0, Standardabweichung 1.0 3. Lecture SS 2006 GK 1276 23 Proteinfaltung Dobson, Karplus, Angew. Chemie Int. Ed. 37, 868 (1998) Energie des Systems Gesamtzahl der nativen Kontakte N Prozentsatz Q an gesamter Zahl nativer Kontakte. 3. Lecture SS 2006 GK 1276 24 125-mer Proteinmodell 3. Lecture SS 2006 GK 1276 25 Analogie zu exp. Daten für richtige Proteine: NMR-Daten für Faltung von Lysozym Man findet zwei Faltungspfade. Der gelbe ist schnell, der grüne langsam. Dobson, Karplus, Angew. Chemie Int. Ed. 37, 868 (1998) 3. Lecture SS 2006 GK 1276 26 neue Sicht der Proteinfaltung: Proteinfaltungstrichter, energy landscape model Proteinfaltung ist durch verschiedene Grade an Ordnung bestimmt! Die meisten dynamischen Experimente untersuchen nur eine Sorte von Ordnung, z.B. die Kompaktheit, Anteil der Sekundärstruktur, spezifische tertiäre Kontakte.. Generell kann man den Faltungsprozess mit der Theorie von Energielandschaften und dem Konzept eines Faltungstrichters beschreiben. Um eine Anzahl von Faltungsexperimenten vollständig zu verstehen muss man die Eigenschaften dieses Trichters durch eine multidimensionale Sicht seiner Form und statistischen Eigenschaften verstehen. Verschiedene Faltungsszenarien entstehen durch die Balance zwischen dem Kollaps-Ordnungs-Parameter Z und einem Ordnungsparameter, der für bestimmte tertiäre Kontakt empfindlich ist, Q. 3. Lecture SS 2006 GK 1276 27 2 wichtige Temperaturen Tf : Tg : die Faltungstemperatur, unter der sich das Protein spontan in den nativen Zustand faltet. die Temperatur des Glas-Übergangs. Analogie zwischen Proteinen und Spingläsern. Der Grad an Nicht-Exponentialität hängt mit der Struktur der Energielandschaft zusammen. 3. Lecture SS 2006 GK 1276 28 Wechselwirkungspotential E Nl El Nu Eu Nl ist die Anzahl an Kontakten zwischen Monomeren desselben Typs (like contacts), Nu ist die Anzahl der nicht-ähnlichen Kontakte. Verwende entweder 2 oder 3 verschiedene Monomere. Mit diesen beiden Parametern kann man die Eigenschaften des Modells gut diskutieren: 1 E l Eu 2 Eu E l E Ehet Dimensionsloser Kollaps-Parameter E Ehet bezeichnet Stärke der Kollabierungskraft: = 1 ist das Limit grosser Hydrophobizität, = 0 is das Limit geringer Hydrophobizität. 3. Lecture SS 2006 GK 1276 29 Faltungsszenarien unterschiedlicher Hydrophobizität Z misst die Kompaktheit der Kette: Z total number of contacts maximum number of contacts Q misst die Ähnlichkeit zum nativen Zustand: Q = Anzahl der ausgebildeten nativen Kontakte 3. Lecture SS 2006 GK 1276 30 Faltungstrichter 2 schematische Faltungsszenarien Fall grosser Hydrophobizität Prozess in zwei Schritten:: 1 schneller Kollaps (durch Z getrieben) + 2 Umordnung in native Struktur (getrieben durch Q) Freie Enthalpie Barriere. Fall geringer Hydrophobizität Kollaps und Faltung geschehen gleichzeitig. Downhill Faltung, keine Freie Enthalpie Barriere. Socci, Onuchic, Wolynes Proteins, 32, 136 (1998) 3. Lecture SS 2006 GK 1276 31 Faltungskinetik Proteindynamik kann durch “Hopping” zwischen verschiedenen Konformationen geringer Energie dominiert sein (Bryngelson & Wolynes, 1987; Kidera & Go, 1998). Falls die Energielandschaft nicht rauh ist, kann die Bewegung als Diffusion eines Teilchens auf einer Oberfläche der Freien Enthalpie als Funktion des Faltungsordnungs-Parameters beschrieben werden. Dies ist eine gute Beschreibung sollange die Rauhheit der Energieoberfläche klein gegenüber der Temperatur ist = solange Faltung durch eine Anzahl verschiedener Pfade geschieht.. Dies ist der Fall für T > Tg , der Temperatur des Glas-Übergangs. 3. Lecture SS 2006 GK 1276 32 Quantifiziere den Glasübergang Es ist schwierig einen Phasenübergang für ein kleines, endliches System genau zu definieren. Grobes Kriterium: Faltungszeit. Benutze Gittermodell um die Beziehung zwischen dynamischem slowing down und nicht-exponentieller Kinetik zu testen. Messe den Bruchteil der Population, der ungefaltet bleibt als Funktion der Zeit, plotte als log-log Plot. Einfach exponentieller Prozess besitzt charakteristische Signatur Eine Power-law Abhängigkeit drückt sich durch eine breite Verteilung der Lebensdauern aus und bewirkt lineare Kurven. 3. Lecture SS 2006 GK 1276 33 Proteinfaltung: gute Sequenz, hohe Hydrophobizität Socci, Onuchic, Wolynes Proteins, 32, 136 (1998) 3. Lecture SS 2006 GK 1276 34 Proteinfaltung: gute Sequenz, geringe Hydrophobizität Socci, Onuchic, Wolynes, Proteins, 32, 136 (1998) 3. Lecture SS 2006 GK 1276 35 Kollaps vs. Faltung Geschieht Kollaps vor Faltung oder geschehen beide gleichzeitig? Es gibt exp. Hinweise auf beide Szenarios in unterschiedlichen Systemen. Freie-Enthalpie-Oberfläche für eine gute Sequenz bei grosser Hydrophobizität: Oben (Tf): zwei Minima, kinetisch 2-Zustandsverhalten Faltung = Diffusion über Barriere exp. System: Protein G (all-atom MD) Unten (geringe Temperatur): beide Minima kollabieren, down-hill Faltung Faltungszeit durch Diffusionskonstante bestimmt. 3. Lecture SS 2006 GK 1276 Socci, Onuchic, Wolynes Proteins, 32, 136 (1998) 36 Gute Sequenz, geringer Hydrophobizität hohe Temperatur (A): nicht-gefaltetes Minimum ist nicht kollabiert. Kollaps und Faltung geschehen gleichzeitig. Faltung entlang von Linie Q = Z. Socci, Onuchic, Wolynes Proteins, 32, 136 (1998) 3. Lecture SS 2006 exp. System: Faltung eines 3-HelixBündels liegt in intermediärem Regine zwischen den Bedingungen grosser und geringer Hydrophobizität. GK 1276 37 Zusammenfassung Die Darstellung als multidimensionaler Faltungstrichter (funnel) zeigt, dass man die Faltung kleiner Proteine abhängig von den Eigenschaften der EnergieLandschaft entweder als (a) einen direkt aktivierten 2-Zustands-Prozess oder (b) mit “Intermediaten” ansehen kann. Die Art der Zwischenzustände hängt vom Zusammenwirken zwischen der Rauhheit der Energielandschaft (durch Lage des Glas-Übergangs bestimmt) und der allgemeinen Form des Faltungstrichters ab, die die thermodynamischen Barrieren bestimmt. Zusätzliche Dimensionen: In richtigen Proteinen kann der Grad an lokaler Sekundärstruktur ein nahezu unabhängige Rolle von Q and Z bei der Charakterisierung der Landschaft spielen. Die Ordnung von Seitenketten kann ebenfalls eine bedeutsame und möglicherweise separierbare Rolle spielen. 3. Lecture SS 2006 GK 1276 38 Zusammenfassung II Das energy landscape Modell für die Proteinfaltung zeigt, daß es Protein geben kann, sogenannte fast folding proteins, bei denen die Faltung gewissermaßen down-hill stattfindet. Nun mag man sich fragen: * Wie schnell kann sich ein Protein überhaupt falten? * Ist Proteinfaltung schlußendlich ein diffusiver Vorgang? Dies wird bisher von Experimentalisten kontrovers diskutiert ... Es ist schwierig, die Bedeutung der Diffusion experimentell zu belegen. Die Zugabe eines Ko-Solvens (Glykol, ...), der die Viskosität verändert, beeinflußt (erhöht) oft auch die Stabilität des Proteins gegenüber thermischer Denaturierung (Entfaltung). Um zu beweisen, daß eine Erhöhung der Viskosität zu einer verlangsamten Faltung des Proteins führt, und damit Proteinfaltung ein diffusiver Prozeß ist, benötigt man Systeme, bei denen Zugabe von Ko-Solvens die Stabilität des Proteins NICHT verändert. Ein Beispiel dafür ist: Jacob, Geeves, Holtermann, Schmid, Nature Struct.Biol., 6, 923 (1999) Diffusional barrier crossing in a two-state protein folding reaction. 3. Lecture SS 2006 GK 1276 39