V13 Proteinfaltung Es gibt zwei grundsätzliche Sichtweisen des Proteinfaltungsproblems: 1. Was sind die treibenden Kräfte (driving forces), aufgrund derer sich ein Protein faltet? Physikalische/bioinformatische Sicht des Problems. 2. Zu welcher dreidimensionalen Struktur faltet sich (m)ein bestimmtes Protein? Biologische Sicht des Problems. 13. Vorlesung SS07 Computational Chemistry 1 experimentell beobachtbare Variablen Die komplette Beschreibung der Proteinfaltungsreaktion erfordert eine Vielzahl an Reaktionskoordinaten: - Wie ändert sich die Größe (der radius of gyration) mit der Zeit? (Exp. Kleinwinkelstreuung) - Wann bilden sich Elemente der Sekundärstruktur? (Exp. FTIR, CD) - Wann bildet sich der hydrophobe Kern? (Exp. Fluoreszenz) - Wann werden die Wassermoleküle aus dem Proteininneren verdrängt? (Fluoreszenz-Quenching) - Wann sind welche tertiären Kontakte gebildet? (siehe -value analysis, NMR) - Was ist die Rolle von Dynamik (H/D-Austausch-Experimente) - Gibt es Intermediate? Dobson, Karplus, Angew. Chemie Int. Ed. 37, 868 (1998) 13. Vorlesung SS07 Computational Chemistry 2 Proteinfaltung: Kombination von Simulation mit Experiment notwendig Experimente zeigen die Faltung stets entlang einiger weniger Reaktionskoordinaten. Es ist schwierig, dadurch den Mechanismus der Proteinfaltung zu verstehen. Das Fazit dieser Stunde wird lauten: Reichen Simulationen allein aus um Proteinfaltung zu verstehen? Nein! Kombination von Simulation mit Experiment. Ja! 13. Vorlesung SS07 Computational Chemistry 3 driving forces für Proteinfaltung 1 Typen von Wechselwirkungen hydrophob elektrostatisch 2 Wechselwirkungspartner Protein-Protein Protein-Solvens Solvens-Solvens 3 Freie Enthalpie (G) des Gesamtsystems reduzieren, nicht z.B. nur die innere Energie des Proteins alleine dynamische Simulationen notwendig 13. Vorlesung SS07 Computational Chemistry 4 Nicht betrachtete Spezialfälle 1 Proteine mit Di-Sulphidbrücken (z.B. BPTI) Faltungskinetik wird komplett durch Bildung von Disulfidbrücken dominiert. 2 Proteine mit cis-Prolinen in entfalteten Peptide sind Proline zu 10 – 20 % in cis-Konformation;gefaltete Proteine haben fast nur trans-Proline; cis/trans-Isomerisierung dauert jedoch Minuten; es gibt jedoch spezielle cis/trans-Isomerasen wie Cyclophilin 3 Mehr-Domänenproteine ... Was bleibt dann noch übrig? kleine “Standard” Ein-Domänen-Proteine 13. Vorlesung SS07 Computational Chemistry 5 Warum ist die Energetik der Proteinfaltung ein schwieriges Problem? * “Problem der Proteinfaltung” beinhaltet zwei Aspekte: (a) Sequenz Struktur ist weitgehend ungelöst (b) Verständnis der treibenden Kräfte/Dynamik/ Mechanismen. Diese sind mittlerweile vergleichsweise gut bekannt. * warum ist (a) so schwierig? Beispiel: Lysozym bei 25 C H UF = – 2245 kJ/mol davon sind – 1881 kJ/mol von den nichtpolaren Gruppen und – 364 kJ/mol von den polaren Gruppen - T S UF = + 2186 kJ/mol UF = – 59 kJ/mol d.h. nur ca. 0.4 kJ/mol pro Residue ! Die Differenz zweier sehr großer Terme ist selbst sehr klein. 13. Vorlesung SS07 Computational Chemistry 6 Levinthal-Paradox 1968 C. Levinthal, J. Chim. Phys. 65, 44-45 (1968): Falls man eine Kette von 100 Aminosäuren betrachtet und annimmt, dass jede Aminosäure in einer von 3 Konformationen existieren kann – ausgestreckt, Helix oder Schleife - dann gibt es 3100 mögliche Weise, die Kette anzuordnen. Das sind etwa 1048 Konformationen. Die Rotation um Bindungen geschieht höchstens 1014 mal pro Sekunde. Daher dauert eine Zufallssuche nach der richtigen Konformation etwa 1034s = 1026 Jahre, viel länger als das Alter des Universums! Die kritische Annahme dabei ist, dass alle möglichen Konformationen mit der gleichen Wahrscheinlichkeit gesampelt werden. Der Faltungstrichter sieht also wie ein Loch auf einem flachen Golfplatz aus. Daher wurde vermutet, dass bestimmte Faltungspfade existieren, die zur gefalteten Struktur führen. 13. Vorlesung SS07 Computational Chemistry 7 Golfkurs-Beispiel 1-D Energielandschaft. Im Fall extremer Frustration gibt es keine Korrelation zwischen struktureller Ähnlichkeit mit dem Grundzustand und der Energie. Einzige Möglichkeit:Zufallssuche. 13. Vorlesung SS07 Computational Chemistry 8 Lösung für Levinthal-Paradoxon: Folding Funnel Energielandschaft eines minimal frustrierten Heteropolymers. Die Trichterform ermöglicht, dass der gefaltete Zustand in kurzer Zeit erreicht wird. 13. Vorlesung SS07 Computational Chemistry 9 Modelle um Proteinfaltung zu beschreiben Nucleation-condensation-Modell Wetlaufer, D.B. (1973) PNAS 70, 697 Es werden einige kritische kinetische Nuklei geformt, um die herum der Rest der Struktur wächst. Framework Modell Ptitsyn, O.B. & Rashin, A.A. (1975) Biophys. Chem. 3, 1 Zunächst falten sich die Sekundärstrukturelemente. Diese docken dann im ratenlimitierenden Schritt zur 3D-Struktur. Modell des hydrophoben Kollapses Dill, K.A. (1985) Biochemistry 24, 1501 Treibende Kraft ist der hydrophobe Effekt. Wasser wird unspezifisch verdrängt. Die abschliessende Umordnung des kollabierten Zustands ist ratenlimitierend. 13. Vorlesung SS07 Computational Chemistry 10 Nucleation-condensation Modell Die ersten Schritte der Proteinfaltung sind entropisch ungünstig, durch den Verlust an Entropie aufgrund der reduzierten Beweglichkeit der Seitenketten. Der enthalpische Gewinn durch entstehende native Wechselwirkungen kann dies nicht ganz kompensieren. Erst im Übergangszustand (transition state) werden die beiden Beiträge gleichgroß. Danach geht die Faltung downhill. 13. Vorlesung SS07 Computational Chemistry 11 Framework-Modell gewann an Bedeutung als man kleine Sekundärstrukturelemente-Fragmente von Proteinen identifizieren konnte, die bereits in Lösung gefaltet sind. (Munoz, Serrano 1994-1997). 13. Vorlesung SS07 Computational Chemistry 12 Auch native Kontakte passen zum Framework-Modell native Kontakte * native Kontakte sind essentiell Hypothese, daß es kleine Peptidstücke gibt, unabhängig faltende Einheiten, sogennante Foldons Beispiele: -hairpins (Munoz&Eaton), die sich in ca. 6 s falten kleine Fragmente aus BPTI (SYPFDV) * Langevin-Simulationen zeigen: -Helices falten sich in ca. 10-100 ns -hairpins brauchen ca. 10 s 13. Vorlesung SS07 a: Ar(i)-HN(i) Wechselwirkung zwischen Phe517 und der Amidgruppe des Rückgrats von Tyr518 in Phosphoinoitide-Specific Phospholipase C (1DJX). b: Ar(i)-HN(i) Wechselwirkung in Ascorbate Oxidase (1AOZ). Tóth et al. Proteins 43, 373 (2001) Computational Chemistry 13 Molten Globule Modell des hydrophoben Kollapses sagt ein Faltungs-Intermediat voraus, den sogenannten Molten Globule, den man kinetisch und im Gleichgewicht als eine expandierte Form des gefalteten, nativen Zustands charakterisiert hat. 13. Vorlesung SS07 Computational Chemistry 14 Neue Methoden Hydrogen-Exchange: H/D-Austausch der Backbone HN-Atome gegen D/HAtome der Lösung. Gibt Information über Faltungs-Intermediate: ist diese Gruppe solvenszugänglich? Konsolidierung des Protein-Rückgrats. Protein Engineering (Mutagenese): sensitiv für SeitenkettenWechselwirkungen. Entdeckung von kleinen Proteinen mit lediglich zwei Zuständen (gefaltet entfaltet) CI-2 spectrin SH3 cold shock protein CspB Bisher wurden etwa 30 Proteine mit dieser Methode untersucht. 13. Vorlesung SS07 Computational Chemistry 15 Mechanismus der Proteinfaltung (Fersht) (a) zwei extreme Szenarien: „Framework“ bedeutet, dass sich die Sekundär-Strukturelemente zuerst falten. „Nucleation condensation“ ist ein Kompromiss zwischen den beiden Extremfällen. (b) Proteine, die man einer oder der anderen Kategorie zuordnen kann. Bisher wurde kein Protein gefunden, das einen reinen Hydrophoben Kollaps zeigt, also während des Kollapses keine Sekundär-Struktur formt. 13. Vorlesung SS07 Daggett, Fersht, TIBS 28, 18 (2003) Computational Chemistry 16 Faltung kleiner Proteine Nucleation-condensation wird heute als Standardmechanismus für die Faltung kleiner Proteine angesehen (Serrano und Mitarbeiter, PNAS 99, 15846 (2002)). Manche Proteine falten jedoch auf eine polarisierte Weise, wobei sich ein Teil der Struktur sehr früh bildet und andere Abschnitte bis zuletzt unstrukturiert bleiben. CI-2 2-Zustand global diffus:alle Residuen falten sich gleichzeitig SH3 2-Zustand im Übergangszustand ist eine Region des Proteins fast vollständig gefaltet, eine andere jedoch nur kaum. Barnase 13. Vorlesung SS07 zwei Faltungsmodule falten sich unabhängig voneinander zu Intermediat gemäss NC-Mechanismus Dann docken diese beiden Module gemäss Framework-Modell. Computational Chemistry 17 „New view of Protein folding“: Faltung auf rauhen, trichterförmigen Energielandschften Bryngelson, Wolynes, PNAS (1987) gradient macht Faltung schneller roughness macht Faltung langsamer “Frustration” Brooks, Gruebele, Onuchic, Wolynes, PNAS 95, 11037 (1998) 13. Vorlesung SS07 Computational Chemistry 18 Energielandschaft mit unterschiedlicher Frustration Links: hoch frustrierte Landschaft mit Tg > Tf. Rechts: geringe Frustration; Tg < Tf; Ähnlichkeit mit Trichterform 13. Vorlesung SS07 Computational Chemistry 19 Theorie der Energielandschaften für Proteinfaltung nach Onuchic, Nymeyer, Garcia, Chahine, Socci, Adv. Prot. Chem. 53, 87 (2000) http://guara.ucsd.edu/group/Folding-papers.html „Holy grail“: Proteinsequenz Proteinstruktur Entwicklung von theoretischen Konzepten, mit denen man sich faltende von sich nicht faltenden Sequenzen unterscheiden kann. P.S. Kim & R.L. Baldwin (Annu Rev BioChem 59, 631 [1990]): Faltung geschieht entlang von Pfaden mit wohldefinierten Intermediaten. Diese Sichtweise wurde seit Beginn der ´90er Jahre durch das Bild der Faltung eines Proteins in einem Faltungstrichter der Energie ersetzt. - Faltung ist ein kollektiver (d.h. die Faltung der Aminosäurenkette beginnt an vielen Positionen gleichzeitig) und ein selbst-organisierter Prozeß - Faltung geschieht entlang einer Vielzahl von Routen bis auf den Boden des Faltungstrichters. 13. Vorlesung SS07 Computational Chemistry 20 Rolle der Topologie D. Baker, Nature 405, 39 (2000) Für viele Proteine ist die Faltungsgeschwindigkeit durch das Verhältnis von lokalen zu nicht-lokalen Kontakten bestimmt. a bis d rot großer Einfluss auf Faltungsrate, blau kleiner Einfluss. e: Kontakt-Ordnung: mittlerer Sequenz-Abstand räumlich benachbarter Aminosäuren; normiert über die Gesamtlänge des Proteins. f: überraschend deutlicher Zusammenhang zwischen der Faltungsgeschwindigkeit von Proteinen und ihrer Kontakt-Ordnung. 13. Vorlesung SS07 Computational Chemistry 21 -value Analyse Studiere den Effekt von Mutationen auf die Kinetik und Stabilität der Proteinfaltung. Die grüne Residue hat im Übergangszustand (TS) fast die gleiche Umgebung wie im gefalteten Protein (N). Daher wird TS um den gleichen Betrag destabilisiert wie N. Umgekehrtes gilt für die blaue Residue. Daggett, Fersht, TIBS 28, 18 (2003) 13. Vorlesung SS07 GTS D GTS' D GTS D GN D GN' D GN D G´ kennzeichnet Daten für eine Mutante Computational Chemistry 22 Proteinfaltung mit Simulationen Faltung von -Helices und -Faltblättern dauert 100 ns bis 10 s. MD-Simulation auf einem Prozessor mit 2 fs Zeitschritt würde Jahre dauern. verschiedene Auswege aus diesem Dilemma -Vereinfachung der Proteindarstellung (HP- oder Go-Modelle) 0 steered Molecular Dynamics – Entfaltung unter Zwangskraft. Problem: Freies Energieprofil ist pfadabhängig (wird nicht behandelt). 1 Simulation der Entfaltung bei erhöhter Temperatur 2 systematische Variation entlang eines Faltungsparameters liefert die Hyperfläche der Freien Enthalpie 3 “distributed computing” – Faltungskinetik aus zahlreichen kurzen Simulationen 13. Vorlesung SS07 Computational Chemistry 23 Entfaltungssimulationen bei erhöhter Temperatur Faltung von CI2 (a) Kristallstruktur. (b) Entfaltungssimulation bei 100 K. Umgekehrte Reihenfolge der Schnappschüsse. „S“ – Werte: charaktisiert Packungswechselwirkungen der Residue und ihrer lokalen SekundärStruktur. Gute Korrelation mit experimentellen -Werten. Daggett, Fersht, TIBS 28, 18 (2003) 13. Vorlesung SS07 Computational Chemistry 24 Faltung von Barnase (a) NMR-Struktur von Barnase. (b) MD-Schnappschüsse von 225°C Simulation. (c) Korrelation von S und . Gute Übereinstimmung bis auf grüne Boxen (2-Helix). Ihr helikaler Anteil im TS, aber auch im entfalteten Zustand ist in MD-Simulation grösser. Eventuell bedeutet dies, dass die -Analyse solch autonom faltende Einheiten nicht gut beschreiben kann. 13. Vorlesung SS07 Daggett, Fersht, TIBS 28, 18 (2003) Computational Chemistry 25 MD erlaubt detaillierte Einblicke in Faltungsprozess Daggett, Fersht, TIBS 28, 18 (2003) 13. Vorlesung SS07 Computational Chemistry 26 Faltung der engrailed homeodomain (a) Übergangszustände bei 100°C und 225°C sind sehr ähnlich. Erhöhung der Temperatur bewirkt also vermutlich keine Veränderung des allgemeinen Faltungspfades, sondern beschleunigt lediglich die Faltung/Entfaltung. (b) Helices sind selbst im denaturierten Zustand stabil. Die engrailed homeodomain ist also ein Beispiel für ein Protein, das gemäss dem Framework-Modell faltet. Daggett, Fersht, TIBS 28, 18 (2003) 13. Vorlesung SS07 Computational Chemistry 27 Rolle der Topologie Proteine mit SH3-ähnlicher Struktur. Die Farbkodierung folgt den -Werten: blau für kleine -Werte, rot für grosse -Werte. Je grösser der -Wert, desto mehr gefaltet ist die entsprechende Region in der Region des Übergangszustands. „Topologie ist nicht alles“ Die Unterschiede in dem Faltungsverhalten dieser 3 Proteine lassen sich nur durch spezifische Wechselwirkungen erklären. Schymkowitz et al. PNAS 99, 15846 (2002) 13. Vorlesung SS07 Computational Chemistry 28 Faltungssimulation entlang Reaktionskoordinate: src-SH3 Domäne Kristallstruktur 1SRL (a) 6.5 Å contact map zwischen nicht-benachbarten Residuen für die Kristallstruktur. (b) contact maps aus MD-Simulationen für =0.2 (über Diagonale) =0.4 (unter Diagonale) (c) =0.6 (über Diagonale) =0.8 (unter Diagonale) entspricht der Anzahl an nativen Kontakten. 13. Vorlesung SS07 Shea, Onuchic, Brooks, PNAS 99, 16064 (2002) Computational Chemistry 29 Faltung der src-SH3 Domäne (a) pmf bei 298 K als Funktion der Anzahl nativer Kontakte: Profil zeigt klar downhill. (b) und (c) Erweiterung von (a) um den Gyrations-Radius bzw. die Anzahl an Wassermolekülen im Kern. (d) Überlagerung von 3 Entfaltungssimulationen bei 400 K. Profile wurde mit einem Zwangspotential entlang von erzeugt. Shea, Onuchic, Brooks, PNAS 99, 16064 (2002) 13. Vorlesung SS07 Computational Chemistry 30 Faltungssimulation mit Distributed Computing für BBA5, ein Designer-Protein Das Design des 23-Residuen langen BBA5-Motifs (-Hairpin / turn / -Helix) wurde von der Faltung von Zinkfinger inspiriert. • • • • NMR-Struktur von BBA5 Doppelmutante (2.2 Å) Doppelmutante (2.4 Å) Einzelmutante (2.5 Å) BBA5 besitzt starke Tendenz, Sekundärstrukturelemente zu formen und kleinen hydrophoben Kern. Daher ist der Effekt von Ungenauigkeiten des Kraftfelds vielleicht eher klein. 13. Vorlesung SS07 Computational Chemistry 31 Folding@Home Faltungssimulation von 10 s Länge auf einem Prozessor würde Jahrzehnte dauern, selbst mit implizitem Solvens. Distributed computing (Folding@home): simuliere 10.000 Simulation von jeweils 5 - 20 ns Länge mit implizitem Solvensmodell. Für ein kleines Protein mit einer Faltungszeit von 10 s sollten etwa 10 von 10.000 Simulation innerhalb von 10 ns gefaltet sein. Folding@home: 30.000 Heimbenutzer stellten ihre PCs über Monate zur Verfügung um MD-Simulationen während idle-Zeit laufen zu lassen. Die akkumulierte CPU-Zeit entspricht ca. 1 Millionen CPU-Tage! Es wurden über 100 unabhängige Faltungsvorgänge beobachtet. 13. Vorlesung SS07 Computational Chemistry 32 Faltungstrajektorien für Doppelmutante Cα backbone (blau 1-3 und 6-8, rot 11-21) und ausgewählte Seitenketten (Y1 Y3 Y6 W8 E13 L14 L17 L18) für Faltungstrajektorien, die nahe der nativen BBA5- Struktur enden (unten). a, 2.2 Å b, 2.4 Å c, 2.6 Å d, 3.0 Å e, Natives BBA5 f, Natives BBA1 mit artifizieller Aminosäure Fen in Orange g, HomologieModel für Doppelmutante h, anderes Homologie-Modell. 13. Vorlesung SS07 Computational Chemistry 33 Energie-Landschaft der Faltung Logarithmierte Population von verschiedenen Kombinationen aus RMSDca und Gyrations-Radius für a, 9000 sich faltende Trajektorien nach 1 ns, die aus einem gestreckten Zustand gestartet wurden. b, dieselben Trajektorien nach 20ns c, 2500 Simulationen des nativen Zustands nach 10 ns. Nach 20 ns ist das entfaltete Ensemble so kompakt wie das gefaltete Ensemble (radius of gyration, y-Achse). Es gibt aber nur einen kleinen Überlapp zwischen b und c: Ein kleiner Teil des gefalteten Ensembles (c) ist nach 10 ns teilweise entfaltet, und ein kleiner Teil des entfalteten Ensembles ist nach 20 ns gefaltet (b). 13. Vorlesung SS07 Computational Chemistry 34 Zunahme an Sekundärstruktur in Doppelmutante a Helikale Strukturen (278K). b, Hairpin-Structuren (278K). c, Präsenz von mindestens 4 -helikalen Residuen. d, Population eines richtigen Hairpins um Residuen 4-5. Native Ensembles sind gezeigt bei 278, 378, und 478 K ( ◊, +, und ). Faltende Ensembles bei 278 und 338 K sind mit ▪ und ∆ markiert. Der entfaltete Zustand ist zu ~40% -helikal. 13. Vorlesung SS07 Computational Chemistry 35 Exp. Faltungs-Thermodynamik und –kinetik von BBA5 (a) CD-Spektra. Die isodichroischen Punkte (rot) deuten auf ZweiZustands-Modell hin. (b) Normalisierte Fluoreszenzspektren. (c) Temperatur-Sprung durch 10 ns Laserpuls induziert teilweise Entfaltung. (d) Zeitaufgelöste Beobachtung der um 11 nm rotverschobenen Fluoreszenz. Exp. Faltungszeit 7.5 ± 3.5 s Simulation: 6 s Quantitative Übereinstimmung! Snow et al. Nature 420, 102 (2002) 13. Vorlesung SS07 Computational Chemistry 36 Zunahme der gefalteten Zustände Faltung in den Simulationen. Bei höherer Temperatur geschieht Zunahme ca. 2 mal so schnell. Snow et al. Nature 420, 102 (2002) 13. Vorlesung SS07 Computational Chemistry 37 Trends * Konzentration auf realistischere Modelle um wirkliche Proteine zu simulieren * Einfluß äußerer Effekte (z.B. Kräfte oder Viskosität) * Einfluß von Chaperonins * Einfluß der Viskosität auf Faltungsdynamik. wurde seit langem vorhergesagt, z.B. durch Simulationen, und wurde vor kurzem zum ersten Mal exp. bestätigt. Diffusion wichtig für Proteinfaltung (z.B. Simulation durch Brownian Dynamics Simulationen) es sollte nicht die Transition-State-Theorie verwendet werden, sondern die Kramersche Theorie 13. Vorlesung SS07 kf Computational Chemistry 0b exp G 2 38 Fazit L. Serrano und Mitarbeiter, PNAS 99, 15846 (2002): Im Feld der „Protein-Falter“ ist nun anerkannt, dass die Kombination von Experiment mit Theorie/Simulation die verbliebenen Rätsel der Proteinfaltung lösen werden. Die Modelle können wohl nur dann streng überprüft und verbessert werden wenn das experimentelle Know-how eine nächste Stufe erreicht. Ein Schritt hier: experimentelle Untersuchung von Einzelmolekülen! Die Anstrengungen und Erfahrungen im Blue-Gene-Projekt von IBM in einer Vielzahl von Kollaborationen werden für die theoretische Seite eine umfassende Evaluation der bestehenden Methoden bedeuten. Neue Techniken wie Replica-Exchange bewirken immer wieder signifikante Verbesserungen. 13. Vorlesung SS07 Computational Chemistry 39