ppt

Werbung
Energy Landscape of a Random Heteropolymer
Many aspects of the folding process can be understood from studying the
energetic properties of a random heteropolymer (RHP).
Helpful tool: lattice models of protein conformations
Simplest model uses two kinds of residues (i.e. hydrophobic and hydrophilic
amino acids) that are randomly distributed.
Simulations show
(1) small modest structural changes give rise to large changes in energy
(2) low energy states exist that are very different in structure but close in
energy.
3. Lecture SS 2006
GK 1276
1
Foldable sequences
Within the space of random heteropolymers
based on the 20 naturally occurring amino
acids there would be 20N possible
sequences of length N.
Only a small subset of these sequences are
thermodynamically and kinetically foldable
on the appropriate biological timescale
seen in nature.
The kinetically allowed set is shown to lie
within the thermodynamic core.
Onuchic, Luthey-Schulten, Wolynes, Annu Rev Phys Chem 48, 545 (1997)
3. Lecture SS 2006
GK 1276
2
Einleitung: Aminosäuren
In Peptiden und Proteinen sind Aminosäuren als lange Ketten
miteinander verbunden.
Paare von jeweils zwei werden durch eine „Peptidbindung“ verknüpft.
(Emil Fischer und Franz Hofmeister, 1902).
H
+
O
H3N
R1
O
-
+
+
 G>0
H3N
3. Lecture SS 2006
H
H R2
H O
+
R2
O
H3N
H
-
O
N
R1
Emil Fischer,
Nobelpreis 1902
Zucker- und
Purinsynthese
O
H3N
H O
+
H
O
+
-
H2O
O
N
R1
H R2
O
peptide bond
GK 1276
3
Eigenschaften der Peptidbindung
E.J. Corey und Linus Pauling studierten die Petidbindung in den
1940‘ern und 1950‘ern.
Linus Pauling
Sie fanden: die C-N Länge ist 1.33 Å.
Sie liegt damit zwischen 1.52 Å und 1.25 Å,
was die Werte für eine Einfach- bzw.
Doppelbindung sind.
Nobelpreise für
Chemie 1954 und
Frieden 1963
H
+
H3N
R1
Die benachbarte C=O Bindung hat eine Länge
Von 1.24 Å, was etwas länger als eine typische
Carbonyl- C=O Doppelbindung ist (1.215 Å).
 die Peptidbindung hat einen teilweise
konjugierten Charakter und ist nicht frei drehbar.
Es bleiben damit pro Residue 2 frei drehbare
Diederwinkel des Proteinrückgrats übrig.
3. Lecture SS 2006
GK 1276
O
O
-
+
+
 G>0
H3N
R2
O
H
+
H R2
H O
H3N
H
-
O
N
R1
+
O
H3N
H O
+
H
O
-
H2O
O
N
R1
H R2
O
peptide bond
4
Einleitung: Sekundärstrukturelemente
Wie seit den 1950‘er Jahren bekannt,
können Aminosäure-Stränge
Sekundärstrukturelemente
bilden:
(aus Stryer, Biochemistry)
-Helices
und -Stränge.
In diesen Konformationen
bilden sich jeweils
Wasserstoffbrückenbindungen
zwischen den C=O und N-H
Atomen des Rückgrats. Daher
sind diese Einheiten strukturell
stabil.
3. Lecture SS 2006
GK 1276
5
Was bestimmt die Proteineigenschaften?
Zu Zeiten des zweiten Weltkriegs glaubte man, die Eigenschaften von Proteinen
würden durch ihre Zusammensetzung aus Aminosäuren bestimmt.
Durch die Arbeiten von Frederick Sanger (1949-51) zur
Bestimmung der Aminosäuresequenz eines Proteins –
und schließlich der Entschlüsselung der Sequenz von
Insulin – wurde klar, dass die Eigenschaften eines Proteins
durch seine Aminosäuresequenz bestimmt werden.
Frederick Sanger,
Nobelpreise für Chemie
1958 und 1980
Proteine bestehen aus einer linearen Polymerkette, die 20 verschiedene Aminosäuren enthalten kann.
Alle Kopien eines Proteins haben eine identische Sequenz.
Durch die Bestimmung der kompletten Genomsequenzen von Organismen weiß
man, dass Prokaryonten ca. 2000 – 5000 Proteine (d.h. verschiedene Proteine)
enthalten und Eukaryonten ca. 10.000 – 50.000.
3. Lecture SS 2006
GK 1276
6
Christian Anfinsen (1956)
Studierte die Eigenschaften von Ribonuclease A,
einem kleinen Enzym mit 124 Aminosäuren, in dem
4 Disulfidbrücken verschiedene Abschnitte der
Polypeptidkette im gefalteten Zustand stabilisieren.
Disulfidbrücken eines Proteins denaturieren gewöhnlich (d.h. brechen auf), wenn
man reduzierende Substanzen wie Mercaptoethanol hinzugibt.
Wenn man dies mit Ribonuklease A macht
und das Urea/Mercaptoethanol später
wieder entfernt, entsteht ein Protein mit
gleicher Aktivität wie das ursprüngliche Protein!
 Die Faltung geschieht selbst-assemblierend.
Die Struktur eines Proteins wird allein aus
seiner Sequenz bestimmt.
(Nobelpreis 1972).
3. Lecture SS 2006
GK 1276
[Karp]
7
Wieviele Proteine gibt es?
Da es 20 verschiedene Aminosäuren gibt,
gibt es 20200 verschiedene Sequenzen der Länge 200!
Allerdings können sich nur eine sehr kleine Teilmenge davon zu
dreidimensionalen Strukturen falten, die gegenüber
Verdauenzymen stabil sind.
Wie groß ist ein Protein?
3. Lecture SS 2006
Durchmesser 3-10 Nanometer
GK 1276
8
Levinthal-Paradoxon
Für ein Protein mit 100 AS und jeweils 2 Konformationen für jede Aminosäure
ergeben sich 2100 = 1.27 x 1030 mögliche Konformationen des Proteins.
Wenn das Protein 10-13 sec brauchen würde, jede einzelne Konformation
abzusuchen, zu „samplen“, dann würde es
10-13 x 1.27x1030 = 1.27 x 1017 s = 4 x 109 Jahre brauchen
bis es alle seine Konformationen abgesucht hätte und eventuell
die energetisch günstigste gefunden hätte.
Dies ist offensichtlich nicht möglich.
Daher muß es Faltungshilfen oder spezielle Faltungspfade geben, sodaß das
Protein nicht alle theoretisch mögliche Zustände absuchen braucht.
3. Lecture SS 2006
GK 1276
9
Random energy model (REM)
The random energy model was originally developed by Derrida to describe
spin glasses, and was first applied to biopolymers by Bryngelson and
Wolynes (1987) as a 0-th order approximation.
The low-energy structures of a RHP, represented by a lattice with two kinds
of residues, are unrelated and the conformational changes are associated
with a fluctuation  in the energy.
Onuchic, Luthey-Schulten, Wolynes, Annu Rev Phys Chem 48, 545 (1997)
3. Lecture SS 2006
GK 1276
10
Energy landscape of a random heteropolymer
For a random sequence,
the sum of interactions is
expected to produce a
Gaussian probability
distribution for the energy
 E   2 

P E  
exp  
2

2
2
2


1
where  and  are the mean
and standard deviation of the
distribution, respectively.
Onuchic, Luthey-Schulten, Wolynes, Annu Rev Phys Chem 48, 545 (1997)
3. Lecture SS 2006
GK 1276
11
entropy
Energy landscape of a random heteropolymer
The system runs out of entropy
when the average energy falls
below E0, and this entropy crisis
is characterized by a glass
transition temperature TG,
which depends on the
corresponding conformational
entropy and fluctuations.
If  is the total number of
configurational states the
entropy can be written as
S E   k ln PE 
Onuchic, Luthey-Schulten, Wolynes, Annu Rev Phys Chem 48, 545 (1997)
3. Lecture SS 2006
GK 1276
12
Properties of Random Heteropolymers
The system runs out of entropy when the average energy falls below a critical
value E  E0 such that S(E) = 0, or P(E) = 1/.
 E   2  1

exp  
2
 
2
2

2


This entropy crisis occurs at
a glass-transition temperature TG where
1
Two solutions, lower energy corresponds
to entropy crisis ...
E   2
(without derivation assuming a
microcanonical distribution)
Tg 
3. Lecture SS 2006
2 2
E   2

k 2 ln   ln 2
 E   2 
2 

exp  

2 2 


2
 2 2

E  

 ln 
2
 
2





  

 ln 
2 
 2 
 
 2 2 ln 
2
 2




 
E     2 ln 
2
 2
2
GK 1276




13
Folding energy funnel
Onuchic, Luthey-Schulten, Wolynes, Annu Rev Phys Chem 48, 545 (1997)
3. Lecture SS 2006
GK 1276
14
Foldable sequences
Phase diagram and folding scenarios according to the
minimally frustrated REM analysis.
(Top) The phase diagram along a line of some average
sequence hydrophobicity shows the possible thermodynamic
states of a protein modeled as a minimally frustrated
heteropolymer. Varying the hydrophobicity by changes in
solvent and temperature can modify the number of phases
observed in the folding process.
(Bottom) The free-energy curves consistent with the above
phase diagram exhibit various folding scenarios:
Type 0 and 1 are examples of fast folding, downhill with no
barrier and a small barrier in the latter. These are typical
scenarios for well-designed proteins at temperatures below the
folding temperatures and conditions such that the glass
transition is not encountered.
The Type II scenarios occur at the right-hand side of the phase
diagram under conditions that favor the formation of the glassy
state either after or before the thermodynamic transition
barrier.
Onuchic, Luthey-Schulten, Wolynes, Annu Rev Phys Chem 48, 545 (1997)
3. Lecture SS 2006
GK 1276
15
Simulationsmodell
Das Modell ist ein dreidimensionales Kopolymer.
Polymere werden als self-avoiding walks
auf einem kubischen Gitter dargestellt.
Das Wechselwirkungspotential soll kompakte
Zustände bevorzugen. Die Polymerkette soll
kollabieren und sich falten. Das heisst, man
braucht ein Potential, das den hydrophoben
Effekt nachahmt, der die dominierenden Kraft
für die Proteinfaltung ist.
Das Potential besteht aus Kontakt-Wechselwirkungen zwischen nächsten Nachbarn.
Das Potential soll einen eindeutigen Grundzustand besitzen.
3. Lecture SS 2006
GK 1276
16
Foldable sequences
A random configuration for a 27-mer
sequence encountered en route to
the native structure.
The maximally compacted
conformation for this sequence,
not shown here,
has the shape of a 3  3 3 cube.
Onuchic, Luthey-Schulten, Wolynes, Annu Rev Phys Chem 48, 545 (1997)
3. Lecture SS 2006
GK 1276
17
Monte Carlo moves
(1) A rotation by angle  in the xy-plane
rotation matrix
 cos   sin 

 sin  cos 
 0
0

can be achieved by application of the
0

0
1 
(det() = cos2 +sin2 = 1  rotation preserves distances)
while a rotation by angle  in the xz-plane can be achieved by the rotation matrix
 cos 

 0
 sin 

0  sin  

1
0 
0 cos  
note that cos(-) = cos  and sin(-) = -sin
3. Lecture SS 2006
GK 1276
18
Monte Carlo moves
(2) A corner move.
(3) A crankshaft move.
3. Lecture SS 2006
GK 1276
19
27-mer Proteinmodell
[nach A.R. Dinner, M. Karplus, J. Phys. Chem. B, 103, 7976 (1999)]
*
In früheren Monte Carlo-Simulationen mit 27-meren auf einem
kubischen Gitter (Anfang – Mitte der 90er Jahre) war die einzige Bedingung
(notwendig und hinreichend) für die Fähigkeit einer Sequenz, eindeutig zu
einem nativen Zustand zu falten, daß dieser ein globales Minimum der
freien Energie sein mußte und zugleich durch einen ausreichend großen
Energieabstand zu den übrigen Zuständen getrennt sein mußte.
*
Es gab keine Korrelation zwischen der Faltungsrate und anderen
Eigenschaften der Sequenz, wie z.B. dem Anteil an Sekundärstruktur.
3. Lecture SS 2006
GK 1276
20
27-mer HP-Proteinmodell
Kette H-H-H-P-P-H-P-H ….
attraktive WW zwischen H-H und P-P, neutrale WW zwischen H-P
Die Faltung solch eines 27-mers geschieht durch:
- einen schnellen Kollaps (ca. 104 MC-Schritte)
- gefolgt von einer langsamen, nicht-gerichteten Suche (ca. 107 MC-Schritte)
durch die ca. 1010 semi-kompakten Strukturen nach einem der ca. 103
Übergangszustände.
- Der anschließende Übergang in den nativen Zustand ist wiederum rasch (ca.
105 MC-Schritte)
Diese Einschränkung der Suche auf kompakten Unterraum des Konfigurationsraums löste gewissermaßen das Levinthal-Paradoxon für solch ein 27-mer.
Jedoch scheint dieser Mechanismus nur für kleine Proteine gültig zu sein, da die
Faltungszeit exponentiell mit der Länge der Aminosäurekette ansteigt und
unrealistisch hoch wird für mehr als 80 Residuen.
3. Lecture SS 2006
GK 1276
21
Faltung auf Oberfläche der freien Enthalpie
geringe Temperatur
3. Lecture SS 2006
hohe Temperatur
GK 1276
Dobson, Karplus,
Angew. Chemie
Int. Ed. 37, 868 (1998)
22
125-mer Proteinmodell
*
konstruiere also Modell, das Proteinfaltung für größere (und realistischere)
Proteine beschreibt
*
125-mere mit einem maximal kompakten 5 x 5 x 5 nativen Zustand haben
eine ähnliche Länge und Oberfläche-zu-Volumen-Verhältnis (22%) wie globuläre
Proteine.
Polymerkette soll sich gemäß self-avoiding-walk falten.
neue Energiefunktion für eine Konformation (modifiziertes Go-Modell)
B0 ist eine mittlere attraktive WW, entsprechend einer allgemeinen hydrophoben
WW
Bij ist die sequenzspezifische WW:
native Kontakte (Bij)
mittlere WW e= -1.67,
Standardabweichung   1.0
nicht-native Kontakte (Bij0)
mittlere WW e= 0,
Standardabweichung   1.0
3. Lecture SS 2006
GK 1276
23
Proteinfaltung
Dobson, Karplus,
Angew. Chemie
Int. Ed. 37, 868 (1998)
Energie des Systems
Gesamtzahl der nativen
Kontakte N
Prozentsatz Q an gesamter
Zahl nativer Kontakte.
3. Lecture SS 2006
GK 1276
24
125-mer Proteinmodell
3. Lecture SS 2006
GK 1276
25
Analogie zu exp. Daten für richtige Proteine:
NMR-Daten für Faltung von Lysozym
Man findet
zwei Faltungspfade. Der
gelbe ist schnell,
der grüne
langsam.
Dobson, Karplus,
Angew. Chemie
Int. Ed. 37, 868 (1998)
3. Lecture SS 2006
GK 1276
26
neue Sicht der Proteinfaltung:
Proteinfaltungstrichter,
energy landscape model
Proteinfaltung ist durch verschiedene Grade an Ordnung bestimmt!
Die meisten dynamischen Experimente untersuchen nur eine Sorte von Ordnung,
z.B. die Kompaktheit, Anteil der Sekundärstruktur, spezifische tertiäre Kontakte..
Generell kann man den Faltungsprozess mit der Theorie von Energielandschaften
und dem Konzept eines Faltungstrichters beschreiben.
Um eine Anzahl von Faltungsexperimenten vollständig zu verstehen muss man die
Eigenschaften dieses Trichters durch eine multidimensionale Sicht seiner Form
und statistischen Eigenschaften verstehen.
Verschiedene Faltungsszenarien entstehen durch die Balance zwischen dem
Kollaps-Ordnungs-Parameter Z und einem Ordnungsparameter, der für bestimmte
tertiäre Kontakt empfindlich ist, Q.
3. Lecture SS 2006
GK 1276
27
2 wichtige Temperaturen
Tf :
Tg :
die Faltungstemperatur, unter der sich das Protein spontan
in den nativen Zustand faltet.
die Temperatur des Glas-Übergangs.
Analogie zwischen Proteinen und Spingläsern.
Der Grad an Nicht-Exponentialität hängt mit der
Struktur der Energielandschaft zusammen.
3. Lecture SS 2006
GK 1276
28
Wechselwirkungspotential
E  Nl El  Nu Eu
Nl ist die Anzahl an Kontakten zwischen
Monomeren desselben Typs (like contacts),
Nu ist die Anzahl der nicht-ähnlichen Kontakte.
Verwende entweder 2 oder 3 verschiedene Monomere.
Mit diesen beiden Parametern kann man die
Eigenschaften des Modells gut diskutieren:
1
 E l  Eu 
2
  Eu  E l 
E
Ehet

Dimensionsloser Kollaps-Parameter 
E
Ehet
bezeichnet Stärke der Kollabierungskraft: = 1 ist das Limit grosser Hydrophobizität,
 = 0 is das Limit geringer Hydrophobizität.
3. Lecture SS 2006
GK 1276
29
Faltungsszenarien unterschiedlicher Hydrophobizität
Z misst die Kompaktheit der Kette:
Z
total number of contacts
maximum number of contacts
Q misst die Ähnlichkeit zum nativen Zustand:
Q = Anzahl der ausgebildeten nativen Kontakte
3. Lecture SS 2006
GK 1276
30
Faltungstrichter
2 schematische Faltungsszenarien
Fall grosser Hydrophobizität
Prozess in zwei Schritten::
1 schneller Kollaps (durch Z getrieben)
+ 2 Umordnung in native Struktur
(getrieben durch Q)
Freie Enthalpie Barriere.
Fall geringer Hydrophobizität
Kollaps und Faltung geschehen gleichzeitig.
Downhill Faltung,
keine Freie Enthalpie Barriere.
Socci, Onuchic, Wolynes
Proteins, 32, 136 (1998)
3. Lecture SS 2006
GK 1276
31
Faltungskinetik
Proteindynamik kann durch “Hopping” zwischen verschiedenen Konformationen
geringer Energie dominiert sein (Bryngelson & Wolynes, 1987; Kidera & Go, 1998).
Falls die Energielandschaft nicht rauh ist, kann die Bewegung als
Diffusion eines Teilchens auf einer Oberfläche der Freien Enthalpie als
Funktion des Faltungsordnungs-Parameters beschrieben werden.
Dies ist eine gute Beschreibung sollange die Rauhheit der Energieoberfläche
klein gegenüber der Temperatur ist
= solange Faltung durch eine Anzahl verschiedener Pfade geschieht..
Dies ist der Fall für T > Tg , der Temperatur des Glas-Übergangs.
3. Lecture SS 2006
GK 1276
32
Quantifiziere den Glasübergang
Es ist schwierig einen Phasenübergang für ein kleines, endliches System genau
zu definieren.
Grobes Kriterium: Faltungszeit.
Benutze Gittermodell um die Beziehung zwischen dynamischem slowing down
und nicht-exponentieller Kinetik zu testen.
Messe den Bruchteil der Population, der ungefaltet bleibt als Funktion der Zeit,
plotte als log-log Plot.
Einfach exponentieller Prozess besitzt charakteristische Signatur
Eine Power-law Abhängigkeit drückt sich durch eine breite Verteilung der
Lebensdauern aus und bewirkt lineare Kurven.
3. Lecture SS 2006
GK 1276
33
Proteinfaltung: gute Sequenz, hohe Hydrophobizität
Socci, Onuchic, Wolynes
Proteins, 32, 136 (1998)
3. Lecture SS 2006
GK 1276
34
Proteinfaltung: gute Sequenz, geringe Hydrophobizität
Socci, Onuchic,
Wolynes, Proteins,
32, 136 (1998)
3. Lecture SS 2006
GK 1276
35
Kollaps vs. Faltung
Geschieht Kollaps vor Faltung oder
geschehen beide gleichzeitig?
Es gibt exp. Hinweise auf beide
Szenarios in unterschiedlichen Systemen.
Freie-Enthalpie-Oberfläche für eine gute
Sequenz bei grosser Hydrophobizität:
Oben (Tf):
zwei Minima, kinetisch 2-Zustandsverhalten
Faltung = Diffusion über Barriere
exp. System: Protein G (all-atom MD)
Unten (geringe Temperatur):
beide Minima kollabieren, down-hill Faltung
Faltungszeit durch Diffusionskonstante bestimmt.
3. Lecture SS 2006
GK 1276
Socci, Onuchic, Wolynes
Proteins, 32, 136 (1998)
36
Gute Sequenz, geringer Hydrophobizität
hohe Temperatur (A): nicht-gefaltetes
Minimum ist nicht kollabiert. Kollaps und
Faltung geschehen gleichzeitig.
Faltung entlang von Linie Q = Z.
Socci, Onuchic, Wolynes
Proteins, 32, 136 (1998)
3. Lecture SS 2006
exp. System: Faltung eines 3-HelixBündels liegt in intermediärem
Regine zwischen den Bedingungen
grosser und geringer Hydrophobizität.
GK 1276
37
Zusammenfassung
Die Darstellung als multidimensionaler Faltungstrichter (funnel) zeigt, dass man
die Faltung kleiner Proteine abhängig von den Eigenschaften der EnergieLandschaft entweder als
(a) einen direkt aktivierten 2-Zustands-Prozess oder
(b) mit “Intermediaten” ansehen kann.
Die Art der Zwischenzustände hängt vom Zusammenwirken zwischen der
Rauhheit der Energielandschaft (durch Lage des Glas-Übergangs bestimmt) und
der allgemeinen Form des Faltungstrichters ab, die die thermodynamischen
Barrieren bestimmt.
Zusätzliche Dimensionen:
In richtigen Proteinen kann der Grad an lokaler Sekundärstruktur ein nahezu
unabhängige Rolle von Q and Z bei der Charakterisierung der Landschaft spielen.
Die Ordnung von Seitenketten kann ebenfalls eine bedeutsame und
möglicherweise separierbare Rolle spielen.
3. Lecture SS 2006
GK 1276
38
Zusammenfassung II
Das energy landscape Modell für die Proteinfaltung zeigt, daß es Protein geben
kann, sogenannte fast folding proteins, bei denen die Faltung gewissermaßen
down-hill stattfindet. Nun mag man sich fragen:
*
Wie schnell kann sich ein Protein überhaupt falten?
*
Ist Proteinfaltung schlußendlich ein diffusiver Vorgang?
Dies wird bisher von Experimentalisten kontrovers diskutiert ...
Es ist schwierig, die Bedeutung der Diffusion experimentell zu belegen. Die
Zugabe eines Ko-Solvens (Glykol, ...), der die Viskosität verändert, beeinflußt
(erhöht) oft auch die Stabilität des Proteins gegenüber thermischer Denaturierung
(Entfaltung).
Um zu beweisen, daß eine Erhöhung der Viskosität zu einer verlangsamten
Faltung des Proteins führt, und damit Proteinfaltung ein diffusiver Prozeß ist,
benötigt man Systeme, bei denen Zugabe von Ko-Solvens die Stabilität des
Proteins NICHT verändert.
Ein Beispiel dafür ist:
Jacob, Geeves, Holtermann, Schmid, Nature Struct.Biol., 6, 923 (1999)
Diffusional barrier crossing in a two-state protein folding reaction.
3. Lecture SS 2006
GK 1276
39
Herunterladen