V13 Proteinfaltung

Werbung
V13 Proteinfaltung
Es gibt zwei grundsätzliche Sichtweisen des Proteinfaltungsproblems:
1.
Was sind die treibenden Kräfte (driving forces),
aufgrund derer sich ein Protein faltet?
Physikalische/bioinformatische Sicht des Problems.
2.
Zu welcher dreidimensionalen Struktur faltet sich (m)ein
bestimmtes Protein?
Biologische Sicht des Problems.
13. Vorlesung SS07
Computational Chemistry
1
experimentell beobachtbare Variablen
Die komplette Beschreibung der Proteinfaltungsreaktion erfordert eine Vielzahl an
Reaktionskoordinaten:
- Wie ändert sich die Größe (der radius of
gyration) mit der Zeit?
(Exp. Kleinwinkelstreuung)
- Wann bilden sich Elemente der
Sekundärstruktur?
(Exp. FTIR, CD)
- Wann bildet sich der hydrophobe Kern?
(Exp. Fluoreszenz)
- Wann werden die Wassermoleküle aus
dem Proteininneren verdrängt?
(Fluoreszenz-Quenching)
- Wann sind welche tertiären Kontakte
gebildet? (siehe -value analysis, NMR)
- Was ist die Rolle von Dynamik
(H/D-Austausch-Experimente)
- Gibt es Intermediate?
Dobson, Karplus,
Angew. Chemie
Int. Ed. 37, 868 (1998)
13. Vorlesung SS07
Computational Chemistry
2
Proteinfaltung:
Kombination von Simulation mit Experiment notwendig
Experimente zeigen die Faltung stets entlang einiger weniger
Reaktionskoordinaten.
Es ist schwierig, dadurch den Mechanismus der Proteinfaltung
zu verstehen.
Das Fazit dieser Stunde wird lauten:
Reichen Simulationen allein aus um Proteinfaltung zu verstehen? Nein!
Kombination von Simulation mit Experiment. Ja!
13. Vorlesung SS07
Computational Chemistry
3
driving forces für Proteinfaltung
1
Typen von Wechselwirkungen
hydrophob
elektrostatisch
2
Wechselwirkungspartner
Protein-Protein
Protein-Solvens
Solvens-Solvens
3
Freie Enthalpie (G) des Gesamtsystems reduzieren,
nicht z.B. nur die innere Energie des Proteins alleine
 dynamische Simulationen notwendig
13. Vorlesung SS07
Computational Chemistry
4
Nicht betrachtete Spezialfälle
1
Proteine mit Di-Sulphidbrücken (z.B. BPTI)
Faltungskinetik wird komplett durch Bildung von Disulfidbrücken dominiert.
2
Proteine mit cis-Prolinen
in entfalteten Peptide sind Proline zu 10 – 20 % in cis-Konformation;gefaltete
Proteine haben fast nur trans-Proline; cis/trans-Isomerisierung dauert jedoch
Minuten; es gibt jedoch spezielle cis/trans-Isomerasen wie Cyclophilin
3
Mehr-Domänenproteine
...
Was bleibt dann noch übrig?
kleine “Standard” Ein-Domänen-Proteine
13. Vorlesung SS07
Computational Chemistry
5
Warum ist die Energetik der Proteinfaltung ein
schwieriges Problem?
*
“Problem der Proteinfaltung” beinhaltet zwei Aspekte:
(a) Sequenz  Struktur ist weitgehend ungelöst
(b) Verständnis der treibenden Kräfte/Dynamik/ Mechanismen.
Diese sind mittlerweile vergleichsweise gut bekannt.
*
warum ist (a) so schwierig?
Beispiel: Lysozym bei 25 C
H UF = – 2245 kJ/mol
davon sind – 1881 kJ/mol von den nichtpolaren Gruppen
und – 364 kJ/mol von den polaren Gruppen
- T S UF = + 2186 kJ/mol
 UF = – 59 kJ/mol
d.h. nur ca. 0.4 kJ/mol pro Residue !
Die Differenz zweier sehr großer Terme ist selbst sehr klein.
13. Vorlesung SS07
Computational Chemistry
6
Levinthal-Paradox 1968
C. Levinthal, J. Chim. Phys. 65, 44-45 (1968):
Falls man eine Kette von 100 Aminosäuren betrachtet und annimmt, dass jede
Aminosäure in einer von 3 Konformationen existieren kann – ausgestreckt, Helix
oder Schleife - dann gibt es 3100 mögliche Weise, die Kette anzuordnen.
Das sind etwa 1048 Konformationen.
Die Rotation um Bindungen geschieht höchstens 1014 mal pro Sekunde. Daher
dauert eine Zufallssuche nach der richtigen Konformation etwa 1034s = 1026
Jahre, viel länger als das Alter des Universums!
Die kritische Annahme dabei ist, dass alle möglichen Konformationen mit der
gleichen Wahrscheinlichkeit gesampelt werden. Der Faltungstrichter sieht
also wie ein Loch auf einem flachen Golfplatz aus.
Daher wurde vermutet, dass bestimmte Faltungspfade existieren, die zur
gefalteten Struktur führen.
13. Vorlesung SS07
Computational Chemistry
7
Golfkurs-Beispiel
1-D Energielandschaft.
Im Fall extremer Frustration gibt es
keine Korrelation zwischen
struktureller Ähnlichkeit mit dem
Grundzustand und der Energie.
Einzige Möglichkeit:Zufallssuche.
13. Vorlesung SS07
Computational Chemistry
8
Lösung für Levinthal-Paradoxon: Folding Funnel
Energielandschaft eines minimal
frustrierten Heteropolymers.
Die Trichterform ermöglicht, dass der
gefaltete Zustand in kurzer Zeit erreicht
wird.
13. Vorlesung SS07
Computational Chemistry
9
Modelle um Proteinfaltung zu beschreiben
Nucleation-condensation-Modell
Wetlaufer, D.B. (1973) PNAS 70, 697
Es werden einige kritische kinetische Nuklei geformt, um die herum der Rest der
Struktur wächst.
Framework Modell
Ptitsyn, O.B. & Rashin, A.A. (1975) Biophys. Chem. 3, 1
Zunächst falten sich die Sekundärstrukturelemente. Diese docken dann im
ratenlimitierenden Schritt zur 3D-Struktur.
Modell des hydrophoben Kollapses
Dill, K.A. (1985) Biochemistry 24, 1501
Treibende Kraft ist der hydrophobe Effekt. Wasser wird unspezifisch verdrängt.
Die abschliessende Umordnung des kollabierten Zustands ist ratenlimitierend.
13. Vorlesung SS07
Computational Chemistry
10
Nucleation-condensation Modell
Die ersten Schritte der Proteinfaltung sind entropisch ungünstig, durch den
Verlust an Entropie aufgrund der reduzierten Beweglichkeit der Seitenketten.
Der enthalpische Gewinn durch entstehende native Wechselwirkungen kann
dies nicht ganz kompensieren.
Erst im Übergangszustand (transition state) werden die beiden Beiträge
gleichgroß.
Danach geht die Faltung downhill.
13. Vorlesung SS07
Computational Chemistry
11
Framework-Modell
gewann an Bedeutung als man kleine Sekundärstrukturelemente-Fragmente
von Proteinen identifizieren konnte, die bereits in Lösung gefaltet sind.
(Munoz, Serrano 1994-1997).
13. Vorlesung SS07
Computational Chemistry
12
Auch native Kontakte passen zum Framework-Modell
native Kontakte
*
native Kontakte sind essentiell
 Hypothese, daß es kleine Peptidstücke gibt,
unabhängig faltende Einheiten, sogennante Foldons
Beispiele:
-hairpins (Munoz&Eaton), die sich in ca. 6 s falten
kleine Fragmente aus BPTI (SYPFDV)
*
Langevin-Simulationen zeigen:
-Helices falten sich in ca. 10-100 ns
-hairpins brauchen ca. 10 s
13. Vorlesung SS07
a: Ar(i)-HN(i) Wechselwirkung zwischen
Phe517 und der Amidgruppe des Rückgrats
von Tyr518 in Phosphoinoitide-Specific
Phospholipase C (1DJX).
b: Ar(i)-HN(i) Wechselwirkung in Ascorbate
Oxidase (1AOZ).
Tóth et al. Proteins 43, 373 (2001)
Computational Chemistry
13
Molten Globule
Modell des hydrophoben Kollapses
sagt ein Faltungs-Intermediat voraus, den sogenannten Molten Globule,
den man kinetisch und im Gleichgewicht als eine expandierte Form des
gefalteten, nativen Zustands charakterisiert hat.
13. Vorlesung SS07
Computational Chemistry
14
Neue Methoden
Hydrogen-Exchange: H/D-Austausch der Backbone HN-Atome gegen D/HAtome der Lösung. Gibt Information über Faltungs-Intermediate: ist diese
Gruppe solvenszugänglich? Konsolidierung des Protein-Rückgrats.
Protein Engineering (Mutagenese): sensitiv für SeitenkettenWechselwirkungen.
Entdeckung von kleinen Proteinen mit lediglich zwei Zuständen
(gefaltet  entfaltet)
CI-2
spectrin SH3
cold shock protein CspB
Bisher wurden etwa 30 Proteine mit dieser Methode untersucht.
13. Vorlesung SS07
Computational Chemistry
15
Mechanismus der Proteinfaltung (Fersht)
(a) zwei extreme Szenarien:
„Framework“ bedeutet, dass
sich die Sekundär-Strukturelemente
zuerst falten.
„Nucleation condensation“ ist
ein Kompromiss zwischen den
beiden Extremfällen.
(b) Proteine, die man einer
oder der anderen Kategorie
zuordnen kann.
Bisher wurde kein Protein
gefunden, das einen reinen
Hydrophoben Kollaps zeigt, also
während des Kollapses keine
Sekundär-Struktur formt.
13. Vorlesung SS07
Daggett, Fersht, TIBS 28, 18 (2003)
Computational Chemistry
16
Faltung kleiner Proteine
Nucleation-condensation wird heute als Standardmechanismus für die Faltung
kleiner Proteine angesehen (Serrano und Mitarbeiter, PNAS 99, 15846 (2002)).
Manche Proteine falten jedoch auf eine polarisierte Weise, wobei sich ein Teil der
Struktur sehr früh bildet und andere Abschnitte bis zuletzt unstrukturiert bleiben.
CI-2
2-Zustand
global diffus:alle Residuen falten sich gleichzeitig
SH3
2-Zustand
im Übergangszustand ist eine Region des Proteins fast
vollständig gefaltet, eine andere jedoch nur kaum.
Barnase
13. Vorlesung SS07
zwei Faltungsmodule falten sich unabhängig voneinander zu
Intermediat gemäss NC-Mechanismus
Dann docken diese beiden Module gemäss Framework-Modell.
Computational Chemistry
17
„New view of Protein folding“:
Faltung auf rauhen, trichterförmigen Energielandschften
Bryngelson, Wolynes, PNAS (1987)
gradient 
macht Faltung
schneller
roughness
macht Faltung
langsamer
“Frustration”
Brooks, Gruebele, Onuchic, Wolynes,
PNAS 95, 11037 (1998)
13. Vorlesung SS07
Computational Chemistry
18
Energielandschaft mit unterschiedlicher Frustration
Links: hoch frustrierte Landschaft mit Tg > Tf.
Rechts: geringe Frustration; Tg < Tf; Ähnlichkeit mit Trichterform
13. Vorlesung SS07
Computational Chemistry
19
Theorie der Energielandschaften für Proteinfaltung
nach Onuchic, Nymeyer, Garcia, Chahine, Socci, Adv. Prot. Chem. 53, 87 (2000)
http://guara.ucsd.edu/group/Folding-papers.html
„Holy grail“: Proteinsequenz  Proteinstruktur
Entwicklung von theoretischen Konzepten, mit denen man sich faltende von sich
nicht faltenden Sequenzen unterscheiden kann.
P.S. Kim & R.L. Baldwin (Annu Rev BioChem 59, 631 [1990]):
Faltung geschieht entlang von Pfaden mit wohldefinierten Intermediaten.
Diese Sichtweise wurde seit Beginn der ´90er Jahre durch das Bild der Faltung
eines Proteins in einem Faltungstrichter der Energie ersetzt.
- Faltung ist ein kollektiver (d.h. die Faltung der Aminosäurenkette beginnt an
vielen Positionen gleichzeitig) und ein selbst-organisierter Prozeß
- Faltung geschieht entlang einer Vielzahl von Routen bis auf den Boden des
Faltungstrichters.
13. Vorlesung SS07
Computational Chemistry
20
Rolle der Topologie
D. Baker, Nature 405, 39 (2000)
Für viele Proteine ist die Faltungsgeschwindigkeit durch das Verhältnis von
lokalen zu nicht-lokalen Kontakten bestimmt.
a bis d rot großer Einfluss auf Faltungsrate, blau kleiner Einfluss.
e: Kontakt-Ordnung: mittlerer Sequenz-Abstand räumlich benachbarter Aminosäuren; normiert über die Gesamtlänge des Proteins.
f: überraschend deutlicher Zusammenhang zwischen der Faltungsgeschwindigkeit
von Proteinen und ihrer Kontakt-Ordnung.
13. Vorlesung SS07
Computational Chemistry
21
-value Analyse
Studiere den Effekt von
Mutationen auf die
Kinetik und Stabilität der
Proteinfaltung.
Die grüne Residue hat im
Übergangszustand (TS)
fast die gleiche Umgebung
wie im gefalteten Protein (N).
Daher wird TS um den gleichen
Betrag destabilisiert wie N.
Umgekehrtes gilt für die blaue
Residue.
Daggett, Fersht, TIBS 28, 18 (2003)
13. Vorlesung SS07
GTS  D  GTS'  D GTS  D


GN  D  GN'  D
GN  D
G´ kennzeichnet Daten für eine Mutante
Computational Chemistry
22
Proteinfaltung mit Simulationen
Faltung von -Helices und -Faltblättern dauert 100 ns bis 10 s.
MD-Simulation auf einem Prozessor mit 2 fs Zeitschritt würde Jahre dauern.
verschiedene Auswege aus diesem Dilemma
-Vereinfachung der Proteindarstellung (HP- oder
Go-Modelle)
0 steered Molecular Dynamics – Entfaltung unter Zwangskraft.
Problem: Freies Energieprofil ist pfadabhängig (wird nicht behandelt).
1 Simulation der Entfaltung bei erhöhter Temperatur
2 systematische Variation entlang eines Faltungsparameters liefert die
Hyperfläche der Freien Enthalpie
3 “distributed computing” – Faltungskinetik aus zahlreichen kurzen Simulationen
13. Vorlesung SS07
Computational Chemistry
23
Entfaltungssimulationen bei erhöhter Temperatur
Faltung von CI2
(a) Kristallstruktur. (b) Entfaltungssimulation bei 100 K. Umgekehrte Reihenfolge der Schnappschüsse.
„S“ – Werte:
charaktisiert
Packungswechselwirkungen der
Residue und
ihrer lokalen
SekundärStruktur.
Gute Korrelation
mit experimentellen -Werten.
Daggett, Fersht, TIBS 28, 18 (2003)
13. Vorlesung SS07
Computational Chemistry
24
Faltung von Barnase
(a) NMR-Struktur von Barnase. (b) MD-Schnappschüsse von 225°C Simulation.
(c) Korrelation von
S und . Gute
Übereinstimmung
bis auf grüne Boxen
(2-Helix). Ihr helikaler
Anteil im TS, aber auch
im entfalteten Zustand
ist in MD-Simulation
grösser.
Eventuell bedeutet
dies, dass die -Analyse
solch autonom faltende
Einheiten nicht gut
beschreiben kann.
13. Vorlesung SS07
Daggett, Fersht, TIBS 28, 18 (2003)
Computational Chemistry
25
MD erlaubt detaillierte Einblicke in Faltungsprozess
Daggett, Fersht, TIBS 28, 18 (2003)
13. Vorlesung SS07
Computational Chemistry
26
Faltung der engrailed homeodomain
(a) Übergangszustände bei 100°C und 225°C sind sehr ähnlich. Erhöhung der
Temperatur bewirkt also vermutlich keine Veränderung des allgemeinen Faltungspfades, sondern beschleunigt lediglich die Faltung/Entfaltung.
(b) Helices sind selbst im denaturierten Zustand stabil. Die engrailed homeodomain
ist also ein Beispiel für ein Protein, das gemäss dem Framework-Modell faltet.
Daggett, Fersht, TIBS 28, 18 (2003)
13. Vorlesung SS07
Computational Chemistry
27
Rolle der Topologie
Proteine mit SH3-ähnlicher Struktur.
Die Farbkodierung folgt den -Werten:
blau für kleine -Werte,
rot für grosse -Werte.
Je grösser der -Wert, desto mehr gefaltet
ist die entsprechende Region in der Region
des Übergangszustands.
„Topologie ist nicht alles“
Die Unterschiede in dem Faltungsverhalten
dieser 3 Proteine lassen sich nur durch
spezifische Wechselwirkungen erklären.
Schymkowitz et al. PNAS 99, 15846 (2002)
13. Vorlesung SS07
Computational Chemistry
28
Faltungssimulation entlang Reaktionskoordinate:
src-SH3 Domäne
Kristallstruktur 1SRL
(a) 6.5 Å contact map
zwischen nicht-benachbarten Residuen für die
Kristallstruktur.
(b) contact maps aus
MD-Simulationen für
=0.2 (über Diagonale)
=0.4 (unter Diagonale)
(c)
=0.6 (über Diagonale)
=0.8 (unter Diagonale)
 entspricht der Anzahl
an nativen Kontakten.
13. Vorlesung SS07
Shea, Onuchic, Brooks, PNAS 99, 16064 (2002)
Computational Chemistry
29
Faltung der src-SH3 Domäne
(a) pmf bei 298 K als Funktion
der Anzahl nativer Kontakte:
Profil zeigt klar downhill.
(b) und (c) Erweiterung von (a)
um den Gyrations-Radius bzw.
die Anzahl an Wassermolekülen
im Kern.
(d) Überlagerung von 3
Entfaltungssimulationen bei
400 K.
Profile wurde mit einem Zwangspotential entlang von  erzeugt.
Shea, Onuchic, Brooks, PNAS 99, 16064 (2002)
13. Vorlesung SS07
Computational Chemistry
30
Faltungssimulation mit Distributed Computing
für BBA5, ein Designer-Protein
Das Design des 23-Residuen langen BBA5-Motifs
(-Hairpin / turn / -Helix) wurde von der Faltung
von Zinkfinger inspiriert.
•
•
•
•
NMR-Struktur von BBA5
Doppelmutante (2.2 Å)
Doppelmutante (2.4 Å)
Einzelmutante (2.5 Å)
BBA5 besitzt starke Tendenz, Sekundärstrukturelemente zu formen und kleinen hydrophoben Kern.
Daher ist der Effekt von Ungenauigkeiten des
Kraftfelds vielleicht eher klein.
13. Vorlesung SS07
Computational Chemistry
31
Folding@Home
Faltungssimulation von 10 s Länge auf einem Prozessor würde Jahrzehnte
dauern, selbst mit implizitem Solvens.
Distributed computing (Folding@home): simuliere 10.000 Simulation von jeweils
5 - 20 ns Länge mit implizitem Solvensmodell.
Für ein kleines Protein mit einer Faltungszeit von 10 s sollten etwa 10 von
10.000 Simulation innerhalb von 10 ns gefaltet sein.
Folding@home: 30.000 Heimbenutzer stellten ihre PCs über Monate zur
Verfügung um MD-Simulationen während idle-Zeit laufen zu lassen.
Die akkumulierte CPU-Zeit entspricht ca. 1 Millionen CPU-Tage!
Es wurden über 100 unabhängige Faltungsvorgänge beobachtet.
13. Vorlesung SS07
Computational Chemistry
32
Faltungstrajektorien für Doppelmutante
Cα backbone (blau 1-3 und 6-8, rot
11-21) und ausgewählte Seitenketten (Y1 Y3 Y6 W8 E13 L14 L17
L18) für Faltungstrajektorien, die
nahe der nativen BBA5- Struktur
enden (unten).
a, 2.2 Å b, 2.4 Å c, 2.6 Å d, 3.0
Å e, Natives BBA5 f, Natives
BBA1 mit artifizieller Aminosäure
Fen in Orange g, HomologieModel für Doppelmutante h,
anderes Homologie-Modell.
13. Vorlesung SS07
Computational Chemistry
33
Energie-Landschaft der Faltung
Logarithmierte Population von verschiedenen Kombinationen aus RMSDca
und Gyrations-Radius für
a, 9000 sich faltende Trajektorien nach 1 ns, die aus einem gestreckten
Zustand gestartet wurden. b, dieselben Trajektorien nach 20ns
c, 2500 Simulationen des nativen Zustands nach 10 ns.
Nach 20 ns ist das entfaltete Ensemble so kompakt wie das gefaltete
Ensemble (radius of gyration, y-Achse).
Es gibt aber nur einen kleinen Überlapp zwischen b und c: Ein kleiner Teil
des gefalteten Ensembles (c) ist nach 10 ns teilweise entfaltet, und ein
kleiner Teil des entfalteten Ensembles ist nach 20 ns gefaltet (b).
13. Vorlesung SS07
Computational Chemistry
34
Zunahme an Sekundärstruktur in Doppelmutante
a Helikale Strukturen (278K).
b, Hairpin-Structuren (278K).
c, Präsenz von mindestens 4
-helikalen Residuen.
d, Population eines richtigen Hairpins um Residuen 4-5.
Native Ensembles sind gezeigt
bei 278, 378, und 478 K ( ◊, +,
und ).
Faltende Ensembles bei 278 und
338 K sind mit ▪ und ∆ markiert.
Der entfaltete Zustand ist zu
~40% -helikal.
13. Vorlesung SS07
Computational Chemistry
35
Exp. Faltungs-Thermodynamik und –kinetik von BBA5
(a) CD-Spektra. Die isodichroischen
Punkte (rot) deuten auf ZweiZustands-Modell hin.
(b) Normalisierte Fluoreszenzspektren.
(c) Temperatur-Sprung durch 10 ns
Laserpuls induziert teilweise
Entfaltung.
(d) Zeitaufgelöste Beobachtung der um
11 nm rotverschobenen Fluoreszenz.
Exp. Faltungszeit 7.5 ± 3.5 s
Simulation: 6 s
Quantitative Übereinstimmung!
Snow et al. Nature 420, 102 (2002)
13. Vorlesung SS07
Computational Chemistry
36
Zunahme der gefalteten Zustände
Faltung in den
Simulationen.
Bei höherer Temperatur
geschieht Zunahme ca.
2 mal so schnell.
Snow et al. Nature 420, 102 (2002)
13. Vorlesung SS07
Computational Chemistry
37
Trends
*
Konzentration auf realistischere Modelle um wirkliche
Proteine zu simulieren
*
Einfluß äußerer Effekte (z.B. Kräfte oder Viskosität)
*
Einfluß von Chaperonins
*
Einfluß der Viskosität auf Faltungsdynamik.
wurde seit langem vorhergesagt, z.B. durch Simulationen, und wurde
vor kurzem zum ersten Mal exp. bestätigt.
 Diffusion wichtig für Proteinfaltung
(z.B. Simulation durch Brownian Dynamics Simulationen)
 es sollte nicht die Transition-State-Theorie verwendet werden,
sondern die Kramersche Theorie
13. Vorlesung SS07
kf 
Computational Chemistry
0b
exp  G  
2
38
Fazit
L. Serrano und Mitarbeiter, PNAS 99, 15846 (2002):
Im Feld der „Protein-Falter“ ist nun anerkannt, dass die Kombination von
Experiment mit Theorie/Simulation die verbliebenen Rätsel der Proteinfaltung
lösen werden.
Die Modelle können wohl nur dann streng überprüft und verbessert werden
wenn das experimentelle Know-how eine nächste Stufe erreicht.
Ein Schritt hier: experimentelle Untersuchung von Einzelmolekülen!
Die Anstrengungen und Erfahrungen im Blue-Gene-Projekt von IBM in einer
Vielzahl von Kollaborationen werden für die theoretische Seite eine
umfassende Evaluation der bestehenden Methoden bedeuten.
Neue Techniken wie Replica-Exchange bewirken immer wieder signifikante
Verbesserungen.
13. Vorlesung SS07
Computational Chemistry
39
Herunterladen