Pharmazeutische Chemie PROTEINSTRUKTUREN UND NMR SPEKTROSKOPIE Reto Bader Mirjam Lerch Dr.Oliver Zerbe Department Angewandte Biowissenschaften Institut für Pharmazeutische Wissenschaften Sommersemester 2001 1 Peptid und Protein Strukturen .......................................................................................... 2 1.1 Einleitung ........................................................................................................... 2 1.2 Die Aminosäuren:............................................................................................... 2 1.3 Gliederung der Protein Strukturen: .................................................................... 3 1.4 Gefaltete vs. denaturierte Proteine: .................................................................... 4 1.5 Die Sekundärstruktur:......................................................................................... 4 1.6 Helices: ............................................................................................................... 6 1.7 b-Blätter:............................................................................................................. 8 1.8 Reverse Turns:.................................................................................................... 9 1.9 Seitenkettenkonformationen:............................................................................ 11 1.10 Supersekundärstrukturen: ............................................................................... 12 1.11 Kräfte zwischen Atomen in Proteinen: .......................................................... 13 1.12 Elektrostatische Wechselwirkungen: ............................................................. 15 1.13 Wechselwirkungen mit Dipolen:.................................................................... 15 1.14 Wasserstoffbrücken: ....................................................................................... 17 1.15 Methoden zur Strukturbestimmung:............................................................... 18 1.16 Dynamik von Proteinen:................................................................................. 21 1.17 Informationen über Proteine auf dem Web (aus Branden and Tooze):.......... 22 1.18 Literatur: ......................................................................................................... 22 2 Einleitung zur Strukturbestimmung mit NMR ............................................................... 23 3 Sample-Vorbereitung ..................................................................................................... 23 4 Spektren-Aufnahme ....................................................................................................... 25 4.1 [1H,1H]-COSY:[1H,1H]-Correlated Spectroscopy.......................................... 28 4.2 [1H,1H]-TOCSY: Total Correlation Spectroscopy ........................................... 31 4.3 [1H,1H]-NOESY: Nuclear Overhauser Effect Spectroscopy ........................... 32 5 Strategie zur Resonanzfrequenz-Zuordnung für kleine, nicht-markierte Proteine ........ 35 5.1 Beurteilung der Spektrenqualität...................................................................... 35 5.2 Spinsystem-Identifikation: NH-aH-bH-... ........................................................ 35 5.3 Sequenz-spezifische Zuordnung....................................................................... 38 6 Strukturrechnung mit NMR-Daten ................................................................................ 40 6.1 Chemische Shifts .............................................................................................. 40 6.2 3JHN-aH-Kopplungskonstanten ......................................................................... 40 7 Qualtitätsbeurteilung der berechneten Struktur ............................................................. 47 8 Literatur ........................................................................................................................ 49 9 Anhang: Bezeichnung der Protonen der 20 natürlichen Aminosäuren ........................ 49 1 PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR 1. PEPTID UND PROTEIN STRUKTUREN 1.1 Einleitung: Die drei-dimensionale Struktur von Peptiden und Proteinen ist sehr eng mit ihrer biologischen Aktivität verknüpft. Um den Wirkmechanismus von Enzymen zu verstehen ist eine genaue Kenntnis der 3D Anordnung der Atome der Polypeptidkette nötig. Ferner ist im Bereich der Molekularen Modellierung von Wirkstoffen strukturelle Information unentbehrlich. Leider ist es bisher noch nicht gelungen, die Primärsequenz von Proteinen in die 3D Struktur zu übersetzen (das sogenannte Faltungsproblem). Das erscheint auf den ersten Blick erstaunlich, sind doch die Kräfte, die zwischen den Atomen wirken, seit langem bekannt und berechenbar. Wenn man aber bedenkt, dass gefaltete Proteine nur um 5-10 kcal pro mol gegenüber dem ungefalteten Zustand stabilisiert sind, ein Energiebetrag, der ungefähr einer einzigen Wasserstoffbrücke entspricht, wird klar, dass es einer enormen Präzession bedarf, um die relative Stabilität von Konformeren abzuschätzen. Die geringe Stabilisierung des gefalteten gegenüber dem ungefalteten Zustand hat im wesentlichen 3 Gründe: a) die Funktion der Protein erfordert eine Flexibilität (z.B. für induced-fit Wechselwirkungen). b) es sollten während der Proteinfaltung keine falsch-gefalteten Intermediate mit niedriger Energie entstehen können. c) Eine Entfaltung des Proteins ist für die Translokation durch die Membran nötig. Die erfolgreichsten Strukturvorhersagen sind derzeit dann möglich, wenn eine hohe Sequenzhomologie (>40%) zu einem bekannten Protein vorliegt. Dazu muss aber auch aber auch das Hydrophobizitätsprofil, d.h. die Abfolge von hydrophilen und hydrophoben Aminosäuren, sehr ähnlich sein. 1.2 Die Aminosäuren: Es gibt 20 proteinogene Aminosäuren, die in von Eukaryonten exprimierten Proteinen vorkommen. Diese unterscheiden sich in der Seitenkette. Die Aminosäuren werden aufTABELLE 1. AS Hydropath AS Hydropath AS Hydropath AS Hydropath Ile Val 4.5 4.2 Met Ala 1.9 1.8 Trp Tyr -0.9 -1.3 Gln Asp -3.5 -3.5 Leu Phe Cys 3.8 2.8 2.5 Gly Thr Ser -0.4 -0.7 -0.8 Pro His Glu -1.6 -3.2 -3.5 Asn Lys Arg -3.5 -3.9 -4.5 2 PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR grund der Hydrophilie/Lipophilie ihrer Seitenketten grob klassifiziert. Es ist in diesem Zusammenhang aber von Bedeutung zu erkennen, das die Hydrophilie einer Seitenkette stark von ihrem Ladungszustand abhängt, wobei die ionisierten Seitenketten sehr viel hydrophiler sind. Peptide/Proteine am pH in der Nähe ihres pI sind daher am schlechtesten löslich. Eine Übersicht über die kovalente Struktur und den pK der proteinogenen Aminosäuren befindet sich im Anhang.1 Aminosäuren sind chiral am Cα. Der Cahn-Ingold-Prelog Nomenklatur folgend liegen alle proteinogenen Aminosäuren in der (S) Form vor, mit Ausnahme von Cys (R). Gly und Pro haben eine Sonderstellung. Gly hat keine Seitenkette (2 α-H Atome) und Pro kein Amidproton (ringförmige Seitenkette). Somit ist für Gly der Bereich erlaubter Seitenkettenkonformationen größer und für Pro ist deren Bereich sehr viel eingeschränkter als bei den anderen Resten. Die Peptidbindung hat einen partiellen Doppelbindungscharakter, weswegen der Dihedralwinkel um die Amidbindung 0 oder 180° ist. Für alle Peptidbindungen Xxx-Aaa mit Aaa ungleich Pro ist die trans Konformation sehr viel günstiger (weniger sterische Probleme). In unstrukturierten Peptiden wird für die Xxx-Pro Amidbindung dagegen häufig ein gewisser Anteil cis (bis zu 30%) beobachtet. In globulär gefalteten Proteine kommen dagegen durchaus, wenn auch relativ selten, cis Amidbindungen vor. 1.3 Gliederung der Protein Strukturen: Man unterscheidet bei der Beschreibung der Struktur die • Primärstruktur, d.h. die Abfolge der Aminosäuren • die Sekundärstruktur, d.h. die Nahordnung der Polypeptidkette (z.B. Helix, β-Blatt) • die Tertiärstruktur, die beschreibt, wie die Sekundärstrukturelemente zueinander angeordnet sind und damit einzelne Domänen bilden. Eine Domäne ist ein Teil der Proteinkette, der sich unabhängig vom Rest des Proteins faltet (d.h. eine wohl-definierte Struktur einnimmt). Häufig kodieren Exons für Domänen von Proteinen. Eine Domäne ist auch häufig von der Funktion autark, d.h. eine biologische Funktion wird ausschließlich von einer bestimmten Domäne ausgeübt während eine andere z.B. für die Bindung an einem bestimmten Rezeptor verantwortlich ist. • Häufig sind Proteine als Multimere aufgebaut. Die Packung der Monomereinheiten zueinander wird durch die Quartärstruktur beschrieben. 1. Die pK Werte der einzelnen Aminosäuren hängen stark von der Umgebung im Protein ab (sog. pK Shifts) 3 PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR 1.4 Gefaltete vs. denaturierte Proteine: Korrekt gefaltete Proteine zeichnen sich dadurch aus, dass die Polypeptidkette eine wohl-definierte Struktur einnimmt. Speziell die Backbone Dihedralwinkel regulärer Sekundärstrukturelemente nehmen ausgezeichnete Werte ein. Korrekt gefaltete Proteine zeichnen sich in der Regel durch einen relativ scharf definierten Temperaturbereich aus, im dem die Struktur verloren geht. Dies lässt sich relativ gut im CD Spektrum verfolgen. Einen Übergang zwischen völlig ungefalteten Polypeptiden und globulären Proteinen bilden die sogenannten “Molten Globules”. Die “Molten Globules” werden als Zwischenstufe bei der Proteinfaltung interpretiert. Sie zeichen sich durch ein Nebeneinander von gefalteten und ungefalteten Bereichen aus. “Molten Globules” lassen sich aus globulären Proteinen durch Zugabe von denaturierenden Stoffen teilweise erzeugen. Die globulären Proteine zeichen sich durch eine Reihe von Eigenschaften aus: • die hydrophoben Reste befinden sich meist im Inneren (dem sogenannten “Core”) • hydrophile Reste sind eher an der Oberfläche anzutreffen • die Seitenketten im Core sind sehr dicht gepackt • φ,ψ Dihedralwinkel sind in den Ramachandran-erlaubten Bereichen. • Der hydrodynamische Radius ist kleiner als bei ungefalteten Proteinen gleicher Größe Wird ein globuläres Protein durch Zugabe von Guanidiniumhydrochlorid oder durch Erhitzen denaturiert, so werden hydrophobe Reste dem Wasser exponiert, weswegen denaturierte Proteine in reinem Wasser meist unlöslich sind. Proteine falten sich in Abwesenheit anderer Proteine. Kürzlich wurden aber Hilfsmoleküle, sogenannte Chaperone, entdeckt, die bei der Faltung helfen, indem sie helfen, dass falsch-gefaltete Intermediate sich wieder entfalten. Bislang gilt auch immer noch das Dogma, das es eine eindeutige Faltung gibt, d.h. das ein und das gleiche Protein in einer bestimmten Lösungsumgebung immer in einer einzigen (der gleichen) Konformation vorliegt. 1.5 Die Sekundärstruktur: Die Sekundärstruktur wird durch die Faltung des Proteinrückgrades (Backbone), welches durch den Amidstickstoff, das C-alpha und den Carbonyl-Kohlenstoff gebildet wird, beschrieben.Es werden die folgenden Elemente in Proteinstrukturen angetroffen: • Helices • β-Stränge/Blätter 4 PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR • Turns daneben gibt es längere Loops, die nicht gut-definierte Backbone Konformationen besitzen und auch häufig flexibler sind. Disulfidbrücken, die zwischen Cystein Resten gebildet werden, stabilisieren Sekundärstrukturelemente, haben aber auch einen grossen Einfluss auf die Tertiärstruktur, da sie die Fernordnung beeinflussen. Diese Sekundärstrukturen lassen sich über die entsprechenden Dihedralwinkel beschrieben. Sie sind nach IUPAC-IUB Regeln wie folgt definiert : ωi = 0 for Ciα − Ci' cis to N i +1 − Ciα+1 ψi = 0 for Ciα − N i trans to Ci' − Oi φi = 0 for Ciα − Ci' trans to N i − Hi χ i1 = 0 for Ciα − N i cis to Ciβ − Oiγ FIGUR 2. Definition der Backbone Diederwinkel nach IUPAC Die Sekundärstrukturelemente lassen sich über die entsprechenden φ,ψ Dihedralwinkel wie folgt definieren: antiparalleles β-Blatt paralleles βBlatt φ ψ ω Anzahl Reste/ Turn Ausdehnung der Kette/ Rest (Å) -139° 135° -178° 2.0 3.4 -119° 113° 180° 2.0 3.2 TABELLE 3. Definitionen der Dihedralwinkel in Sekundärstrukturelementen 5 PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR φ ψ ω Anzahl Reste/ Turn Ausdehnung der Kette/ Rest (Å) α-Helix 310-Helix -57° -49° -47° -26° 180° 180° 3.6 3.0 1.5 2.0 π-Helix PolyprolineI PolyprolineII PolyprolineIII -57° -83° -78° -70° 158° 149° 180° 0° 180° 4.4 3.3 3.0 1.15 1.9 3.12 -80° 150° 180° 3.0 3.1 TABELLE 3. Definitionen der Dihedralwinkel in Sekundärstrukturelementen 1.6 Helices: Die α-Helix hat 3.6 Reste per Helix Windung. Korrespondierende Atome benachbarter Helixwindungen sind 5.4 Å entfernt. Die α-Helix wird durch Wasserstoffbrücken, die zwischen dem Carbonylatom des Restes i und dem Amidproton des Restes i+4 gebildet wird, stabilisiert. FIGUR 4. Fig: Links: Schematische Darstellung der Helix. Mitte: Backbone Darstellung mit Angabe der Richtung des Dipolmomentes. Rechts: Struktur des 434 Repressors. Die planare Anordnung der Amidbindung bedingt ein Dipolmoment. Da in der α-Helix alle Wasserstoffbrücken gleichgerichtet sind, addieren sich alle Dipolmoment einer einzelnen Helix, so dass das Gesamtdipolmoment für n Reste n*3.5 Debye beträgt. Dies entspricht in etwa 0.5-0.7 positiven bzw. negativen Ladungen am N-oder C-Terminus, 6 PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR respektive. Deshalb sind negative geladene Aminosäure häufig vor einer Helix und positiv geladene häufig hinter einer Helix anzutreffen. Da der Ladungszustand der Aminosäuren vom pH abhängt, ist die Stabilität der Helix mit dem pH korreliert. Normalerweise ist der Helixdrehsinn rechtsgängig. Viele Helices sind amphiphatisch, d.h. die Reste sind derart angeordnet, dass die Seitenketten der polaren und unpolaren Gruppen zu verschiedenen Seiten der Helix zeigen. Die verschiedenen Aminosäuren haben unterschiedliche Neigungen, bestimmte Sekundärstrukturelemente auszubilden. Dies wurde statistisch zuerst von Chou und Fasman untersucht (“Chou-Fasman Regeln”). Für α-Helices sind folgende Werte kürzlich bestimmt worden: AS Relative Stabilisierung (kcal/mol) AS Relative Stabilisierun g (kcal/mol) Ala Arg Lys Leu Met Trp Phe -0.77 -0.68 -0.65 -0.62 -0.50 -0.45 -0.41 Ser Gln Glu Cys Ile Tyr Asp -0.35 -0.33 -0.27 -0.23 -0.23s -0.17 -0.15 AS Relative Stabilisierung (kcal/mol) Val Thr Asn His Gly Pro -0.14 -0.11 -0.07 -0.06 0 3 TABELLE 5. Relative Stabilisierungsenergien der einzelnen Aminosäuren in Helices Es gibt noch zwei weitere Formen der Helix: die 310Helix und die π-Helix. Die 310-Helix hat 3 Reste pro Windung, die π-Helix 4.4. Wasserstoffbrücken werden in diesen beiden Formen zwischen Carbonyl-sauerstoffen der Reste i und Amidprotonen der Reste i+3 bzw. i+5 gebildet. Damit ist der Durchmesser der 310-Helix kleiner und der der π-Helix FIGUR 6. Oben VerschiedeneWasserstoffbrückenpositionen. Unten: Abhängigkeit des Durchmessers vom Helix Typ. 7 größer als in der α-Helix PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR Die ersten 3 Amidprotonen bzw. die letzten 3 Carbonyl Sauerstoffe einer Helix haben keine H-Brücken Partner. Man findet deshalb in Helices häufig sogenannte N- bzw- C- Capping Reste. Diese bilden über ihre Seitenkettenfunktionen (z.B. über die β-Hydroxylgruppe von Ser) Wasserstoffbrücken zu den entsprechenden Atomen und stabilisieren so die Helix. Beim Proteindesign hilft das Einfügung von geeigneten Cbzw. N-Caps, die Helix zu stabilisieren. Wie bereits erwähnt, hat die Helix ein Dipolmoment, das am N-Terminus in etwa einer halben positiven und am C-Terminus einer halben negativen Ladung entspricht. Das Einfügen geladener Aminosäuren am FIGUR 7. Helix N-Cap. Das . OH von Ser bildet H-Brücke C- oder N- Cap hilft ebenfalls, die Helix zu stabilisieren. 1.7 β-Blätter: Grundlegende Einheit der β-Blätter ist der β-Strang, der eine gestreckte Konformation der Polypeptidkette darstellt. Der isolierte β-Strang ist nicht stabil, wird aber durch die Aneinanderreihung benachbarter β-Stränge zum sogenannten β-Faltblatt stabilisiert. Dabei gibt es zwei verschiedene Anordnungen der β-Stränge zueinander: • die Kopf-Schwanz Anordnung, die zum antiparallelen Faltblatt führt: FIGUR 8. Fig: Links: Antiparalleles Faltblatt. Mitte: Ball-and-Stick Darstellung. Rechts: Seitenansicht. 8 PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR • die Kopf-Kopf Anordnung, die zum parallelen Faltblatt führt: FIGUR 9. Fig: Links:Paralleles Faltblatt. Mitte: Ball-and-Stick Darstellung. Rechts: Seitenansicht. In β-Faltblättern sind die Seitenketten abwechselnd oberhalb und unterhalb der Ebene des Faltblattes angeordnet. Dabei kommen sich die Seitenketten gegenüberliegender Stränge relativ nahe. Die meisten der in natürlichen Polypeptiden beobachteten β-Faltblätter sind nicht vollständig planar sondern weisen eine rechtsgängige Verdrillung auf. 1.8 Reverse Turns: Reverse Turns spielen eine wichtige Rolle in Proteinstrukturen. Sie bewirken, dass die Polypeptidkette ihre Richtung ändert und sind deshalb bevorzugt an der Oberfläche von Proteinen anzutreffen. Turns werden ebenfalls über Wasserstoffbrücken stabilisiert.In sogenannten γ-turns werden H-Brücken zwischen dem Carbonylsauerstoff des Restes i und dem Amidproton des Restes i+2 gebildet. β-Turns zeichen sich durch Wasserstoffbrücken zwischen dem Carbonylsauerstoff des Restes i und dem Amidproton des Restes i+3 aus. Es gibt eine Vielzahl verschiedener β-Turns, von denen diejenigen vom Typ I und II am häufigsten angetroffen werden. Eine wichtige Eigneschaft von Turns ist, dass immer wieder ähnliche Reste an bestimmten Positionen der FIGUR 10. :Oben: γ-Turn. Unten: inverser γ-Turn. Turns angetroffen werden. Gly ist besonders deshalb 9 PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR prädestiniert, weil es wegen der fehlenden Seitenkette ungewöhnliche φ,ψ Kombinationen einnehmen kann. Ebenfalls häufig angetroffen wird Pro oder Asn Position Typ I Typ I’ Typ II Typ II’ i Asp,Asn,Ser,Cy s Pro kein Pro Gly Asp,Asn,Ser,Cy s Gly Gly Asp,Asn,Ser,Cy s Pro Gly, Asn Gly Asp,Asn,Ser,Cy s Gly i+1 i+2 i+3 TABELLE 11. Bevorzugte Aminosäuren in Turns Die wichtigsten Turns sind wie folgt definiert: I’ II’ FIGUR 12. : Turns mit den dazugehörigen Backbonedihedralwinkeln. Die oben bereits erwähnten Chou Fasman Regeln erlauben eine Abschätzung der Wahrscheinlichkeiten, dass eine bestimmte Sequenz eine der Sekundärstrukturen einnimmt. Folgende Kriterien gelten als Hinweise auf helikale Strukturen: • innerhalb eines Hexapeptides 4 Reste mit P(Helix)>1.12 • der Durchschnitt für alle Reste <P(Helix)> 1.03 • <P(α)> > <P(β)> • und für β-Blätter • Pentapeptid mit mindestens drei Reste mit P(b-Strang) >1.19 10 PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR • der Durchschnitt für alle Reste <P(β-Blatt)> 1.05 • <P(β)> > <P(α)> Das betreffende Sekundärelement läuft um jeweils umn einen Rest weiter, solange der Durchschnitt der Wahrscheinlichkeit des terminalen Tetrapeptides nicht unter 1.0 fällt. : AS α-Helix βStrang Turn AS α-Helix βStrang Turn Glu Ala Leu Met Gln Lys Arg His Val Ile 1.59 1.41 1.34 1.30 1.27 1.23 1.21 1.05 0.90 1.09 0.52 0.72 1.22 1.14 0.98 0.69 0.84 0.80 1.87 1.67 1.01 0.82 0.57 0.52 0.84 1.07 0.90 0.81 0.41 0.47 Tyr Cys Trp Phe Thr Gly Asn Pro Ser Asp 0.74 0.66 1.02 1.16 0.76 0.43 0.76 0.34 0.57 0.99 1.45 1.40 1.35 1.33 1.17 0.58 0.48 0.31 0.96 0.39 0.76 0.54 0.65 0.59 0.90 1.77 1.34 1.32 1.22 1.24 TABELLE 13. Propensitäten der einzelnen Aminosäuren für Sekundärstrukturelemente. 1.9 Seitenkettenkonformationen: Die Seitenkettenkonformationen werden über die Dihedralwinkel χ1 (Cα-Cβ), χ2 (CβCγ) etc. beschrieben. Aus sterischen Gründen nehmen die Seitenketten bevorzugt gestaffelte anstatt ekliptische Konformationen ein. Globuläre Proteine zeichen sich auch dadurch aus, dass die Seitenketten definierte Winkel einnehmen, obwohl es in den flexibleren Loops teilweise auch Übergänge zwischen verschiedenen Rotameren geben kann. FIGUR 14. Darstellungen der Seitenkettenkonformationen. Links: Ekliptisch. Rechts: Gestaffelt. 11 PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR 1.10 Supersekundärstrukturen: Es gibt eine Anzahl von Anordnungen, in denen Sekundärstrukturelemente gegeneinander gepackt sein können: FIGUR 15. Supersekundärstrukturelemente Ein bekanntes Motiv ist das Helix-Turn-Helix Motiv. Es wird z.B. bei den DNA bindenden Proteinen (434 Repressor) oder bei Calcium-bindenden Proteinen (Calbindin) angetroffen. Wie der Name besagt, werden darin zwei Helices über einen Loop verknüpft. Das β-Hairpin Motiv ist eine einfache Anordnung, um 2 antiparallele β-Stränge über einen kurzen Turn miteinander zu verknüpfen.Überhaupt besitzen Proteine die starke Tendenz, β-Stränge so miteinander zu verknüpfen, dass solche Stränge miteinander verknüpft werden, deren Aminosäuren in der Primärsequenz benachbart sind. Im β−α−β Motiv werden 2 parallele β-Stränge über einen kurzen Loop, dann eine Helix, und dann wieder einen kurzen Loop miteinander verknüpft. Im Greek-Key Motiv werden 4 antiparallele β-Stränge in charakteristischer Art und Weise über Loops miteinander verknüpft. Dieses Motiv hat seinen Namen von den Verzierungen, die auf antiken griechischen Vasen gefunden worden. 12 PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR 1.11 Kräfte zwischen Atomen in Proteinen: Es gibt eine Reihe von interatomaren Kräften, die die Faltung des Proteins beeinflussen. Derartige Kräfte können anziehender oder abstossender Natur sein. Vom Mechanismus her können sie elektronischer Natur wie z.B. die Wechselwirkung zwischen geladenen Atomen oder sterischer Natur sein. Man unterscheidet die starken Wechselwirkungen, wie z.B. die kovalenten Bindungen sowie die schwachen Wechselwirkungen: FIGUR 16. Grösse wichtiger Die schwachen Wechselwirkungen haben eine unterschiedliche Abhängigkeit vom Abstand der wechselwirkenden Atome: Typ der Wechselwirkung Abstandsabhängigkeit Ladung-Ladung Ladung-Dipol 1/r 1/r2 perm. Dipol - perm. Dipol 1/r3 Ladung - induz. Dipol 1/r4 induz. Dipol - induz. Dipol 1/r6 TABELLE 17. Abstandsabhängigkeit der Wechselwirkungen Die sterischen Wechselwirkungen treten immer dann auf, wenn der Abstand zweier Atome d kleiner als die Summe der van-der-Waals Radien (ra/2+rb/2) ist FIGUR 18. 13 PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR Der van-der-Waals Radius für die am häufigsten angetroffenen Atome ist in der folgenden Tabelle angegeben: Atom beobachteter Bereich Radius bei Einfachbindungen Wasserstoff Sauerstoff Stickstoff Kohlenstoff Schwefel 1.00-1.54 Å 1.40-1.70 Å 1.55-1.60 Å 1.70-1.78 Å 1.75-1.80 Å 1.17 Å 1.40 Å 1.55 Å 1.75 Å 1.80 Å TABELLE 19. Atome, die van der Waals Anziehungskräfte erfahren, sind ungefähr 0.8 Å weiter voneinander entfernt, als wenn sie kovalent gebunden wären. Die sterische Abstossung zwischen Atomen schränkt die Kombination der ψ,φ Bindungswinkel stark ein. Dies wurde von Ramachandran berechnet (“Hard-Sphere” Model): FIGUR 20. Fig: Ramachandran Plot Wie aus dem Ramachandran Plot ersichtlich ist, sind nur bestimmte Kombinationen sterisch erlaubt. Zudem sind die verschiedenen Sekundärstrukturelemente auf bestimmte Ramachandran Regionen beschränkt. Glycin Reste, die keine Seitenkette haben, können noch andere Kombinationen einnehmen. 14 PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR 1.12 Elektrostatische Wechselwirkungen: Die elektrostatischen Wechselwirkungen sind stark und weitreichend. Sie werden nach dem Coulombschen Gesetz beschrieben durch: 2 Z AZ Bε ∆E = -------------------r AB In Lösung ist die Wechselwirkung um die Dielektrische Konstante D herabgesetzt: 2 Z AZ Bε ∆E = -------------------D r AB Solche Wechselwirkung treten in Proteinen zwischen geladenen Gruppen auf. Ein Beispiel ist z.B. die anziehende Wechselwirkung zwischen einer Aspartat CO2- Gruppe und einer NH3+ Lysin Seitenkettenfunktion, die zu einer sogenannten Salzbrücke führt. Bei der Berechnung der stabilisierenden Wirkung ist allerdings zu bedenken, dass solche Gruppen im ungefalteten Zustand solvatisiert vorliegen. 1.13 Wechselwirkungen mit Dipolen: Die Amidbindung hat Doppelbindungscharakter. Dies ist der Grund, warum der Dihedralwinkel ω auf 0° (cis) oder 180° (trans) beschränkt ist. Zudem ist aus den mesomeren Grenzstrukturen erkenntlich, dass es ein Dipolmoment geben sollte: FIGUR 21. Fig: Links: Resonanzformel der Peptidbindung. Rechts: Partialladungen. Das Dipolmoment der Amidbindung ist 3.5 Debye (Wasser hat 1.85 zum Vergleich). 15 PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR Aromatische Ringe haben ebenfalls ein Dipolmoment, weswegen sie zueinander bevorzugte Konformationen einnehmen: δ+ H δ+ H H δ+ H δ+ δ− H δ+ H δ+ FIGUR 22. Partialladungen in aromatischen Systemen und deren relative Orientierung Dipolmomente können permanent oder induziert sein. Die Wechselwirkungsenergie zwischen permanenten Dipolen ist proportional r-3. Die Wechselwirkungen mit induzierten Dipolmomenten werden van-der Waals Wechselwirkungen genannt und sind proportional r-6. Bei hydrophoben Gruppen spielen die sogenannten London Dispersionskräfte eine wichtige Rolle. Sie entstehen zwischen 2 Gruppen, die beide kein permanentes Dipolmoment haben, und sind auf die zeitlich asymmetrische Ladungsverteilung der Elektronen zurückzuführen. Van-der Waals Kräfte werden häufig in Form des Lennard-Jones Potentiales ausgedrückt: Cn C 6 - – ------E ( d ) = -----dn d 6 Cn und C6 sind Konstanten, wobei der erste Term der Gleichung die Abstossung, die aus dem Verbot der Überlappung der Elektronenorbitale resultiert, beschreibt. Meist FIGUR 23. Lenard-Jones Potential verwendet man für diese Term n=12. Der zweite Term ist anziehend und wird durch die induzierten Dipolmomente hervorgerufen. 16 PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR 1.14 Wasserstoffbrücken: Wasserstoffbrücken spielen eine herausragende Rolle in der Ausformung von Sekundärstrukturelementen. Sie treten immer dann auf, wenn zwei elektronegative Atome um die Bindung zu einem Wasserstoffatom konkurrieren. α-Helices werden durch die Ausbildung Wasserstoffbrücken von zwischen Amidprotonen der Reste i und Carbonlysauerstoffen der Reste i+3 stabilisiert. β-Blätter weisen ebenfalls Wasserstoffbrücken zwischen Amidprotonen und Carbonylsauerstoffen benach- barter Stränge auf. In diesen FIGUR 24. Fig.: Abstände in Wasserstoffbrücken. Wasserstoffbrücken ist der O..H Abstand 1.9-2.0 Å. Normaler- weise ist das Proton kovalent an ein anderes Atom gebunden, den sogenannten Donor. Der Abstand zum Akzeptor, mit dem es ebenfalls wechselwirkt, ist aber kleiner als die Summe der van der Waals Radien, was auf einen partiellen Bindungscharakter hindeutet. Je stärker die Wasserstoffbrücke, desto kleiner ist der Atomabstand zum Akzeptor. In den stärksten H-Brücken, den symmetrischen H-Brücken, ist der Abstand zum Akzeptor gleich groß wie der Abstand zum Donor. Die Länge und damit die Stärke der Wasserstoffbrücken hängt von der relativen Elektronegativität von Donor und Akzeptor ab. Besonders starke H-Brücken werden zu geladenen Atomen gebildet. Sauerstoffatome können zwei Wasserstoffbrücken gleichzeitig ausbilden. Wasserstoffbrücken stabilisieren das Protein um 2-10 kcal/mol pro gebildeter Brücke. Man muss allerdings bedenken, dass im denaturierten Protein meistens Wasserstoffbrücken zum Lösungsmittel Wasser ausgebildet werden, so dass der stabilisierende Einfluss auf die Proteinfaltung sehr viel geringer ist. 17 PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR Während der N-H...O Bindungswinkel Ψ meist um 180° beträgt, bilden die Carbonylbindung und die Amidbindung nicht eine Achse. Die Winkel Φ und θ nehmen einen weiteren Bereich ein, dessen häufigste Werte 60° bzw. 0° sind, respektive: FIGUR 25. Definition der Winkel in H-Brücke 1.15 Methoden zur Strukturbestimmung: Bei den Methoden zur Untersuchung der 3-dimensionalen Struktur von Proteinen unterscheidet man zwischen solchen Methoden, die lediglich eine Abschätzung des Gehaltes an Sekundärstrukturen liefern und solchen, die das Studium der Struktur mit atomarer Auflösung erlauben. Zu den ersteren gehören die IR und vor allen Dingen die CD Spektroskopie und zu den letzteren die NMR Spektroskopie und die Einkristall-Röntgenbeugung (“X-Ray”). Die Circulardichroismus (CD) Methode hilft zu erkennen, ob das Protein ungefaltet, eher helikal oder eher β-Blatt artig aufgebaut ist. Die Methode beruht darauf, dass die chromophoren Gruppen in Proteinen mit den beiden Komponenten des zirkular polarisierten Licht unterschiedlich wechselwirken und daher unterschiedlich absorbiert werden. Dies ist immer genau dann der Fall, wenn optisch-aktive Verbindungen vorliegen. Diese Absorption ist abhängig von der Wellenlänge. In regelmässigen FIGUR 26. Typische CD Kurven für Helices ( α), β-Blatt (β) und Zufallsknäul(r) 18 Sekundärstrukturelementen kommt es wegen der definierten Anor- PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR dnung der Chromophore zueinander zur gegenseitigen Wechselwirkung (“Exciton Splitting”), die das Ausmass der Absorption und deren Frequenz beeinflusst. CD Spektren brauchen wenig Material und sind schnell aufgenommen und interpretiert. Sie repräsentieren die Summe aller Sekundärelemente und erlauben keine direkte räumliche Auflösung. CD Spektren eignen sich sehr gut, um folgende Punkte schnell abzuklären: • Ist das Protein überhaupt gefaltet? • Wenn ja, was ist das dominierende Sekundärstrukturelement? • Bei welcher Temperatur denaturiert das Protein und ist dieser Vorgang reversibel? • Findet eine konformationelle Aenderung z.B. bei einer Ligandbindung statt? Die CD Spektren der verschiedenen Sekundärstrukturelemente haben ein charakteristisches Aussehen. Im Prinzip lässt sich ein CD Spektrum mathematisch in die Komponenten von α-Helix, β-Blatt und Random Coil zerlegen und so deren anteiligen Gehalt bestimmen (Deconvolution). Die wichtigste Methode zur Bestimmung von Proteinen im Festkörper (neben der jetzt langsam an Bedeutung gewinnenden Cryo-Elektronenmikroskopie) ist die Röntgenbeugung am Einkristall. Die (Schwer)atome des Kristallgitters beugen den (monochromatischen) Röntgenstrahl in charakteristischer Weise: FIGUR 27. Fig.: Links: Brechnung des Röntgenstrahls gemäss Braggs Gesetz. Rechts:Resultierendes Brechungsmuster. Zwischen den abgelenkten Strahlen kommt es zur konstruktiven und destruktiven Interferenz, so dass am Ende ein charakteristisches Beugungsmuster entsteht. Mit dieser In- 19 PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR formation kann man dann indirekt eine Rekonstruktion der dreidimensionalen Elektronendichte vornehmen. Der abgelenkte Strahl wird z.B. auf einer photographischen Platte detektiert, wobei leider die Phaseninformation des Strahls verloren geht. Dies führt zu einer erheblichen Komplizierung der Interpretation der Daten. In der Protein Kristallographie werden im wesentlichen zwei Methoden angewandt, um trotzdem die Elektronendichten berechnen zu können: • bei homologen Strukturen wird das sogenannte Molecular Replacement benutzt, bei dem ein Model der Struktur, das aus einem Homologen erzeugt wurde, benutzt wird, um die Elektronendichteverteilung zu berechnen • es wird eine Reihe von Schweratomderivaten erzeugt (Isomorphous Replacement) • (Man arbeitet mit Synchrotonstrahlung verschiedener Wellenlänge (Multiwavelength Anomalous Diffraction)) Insbesondere die erstere Methode führt sehr schnell zu gut-aufgelösten Strukturen, lässt sich aber nur dann anwenden, wenn bereits die Struktur eines Proteins mit hoher Sequenzhomologie bekannt ist. Die Mehrzahl der Proteinstrukturen, die in der pdB Datenbank enthalten sind, sind Kristallstrukturdaten. Die X-Ray Methode misst die Struktur des Proteins im Festkörper. Obwohl ein Vergleich von NMR und X-Ray Daten in fast allen Fällen sehr gute Übereinstimmung geliefert hat, kann es an den Kontaktflächen der Moleküle zu sogenannten Packungsartefakten kommen, d.h. der Verlauf der Polypeptidkette ist dort durch Packungseffekte bestimmt. Das grösste Problem in der Röntgenkristallmethode ist es, einen Kristall ausreichender Güte, d.h. sehr hoher Ordnung, zu erhalten. Im Prinzip werden solche Kristalle aus übersättigten Lösungen hoch aufgereinigter Proteine (>97%) gezüchtet. Ob und wie ein Protein kristallisiert ist aber immer noch sehr schlecht verstanden. Wenn sehr gute Kristalle erhalten wurden, lassen sich heute Auflösungen im Bereich von 1Å erhalten, die auch die Lokalisation von Wasserstoffatomen (sonst nur Schweratome) sowie von Wassermolekülen im Kristall erlaubt. Ein unbestrittener Vorteil der X-Ray Methode gegenüber der NMR Spektroskopie ist, dass sie auf Proteine beinahe beliebiger Grösse anwendbar ist, sofern sich diese kristallisieren lassen. 20 PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR 1.16 Dynamik von Proteinen: Die Polypeptidkette in Proteinen ist nicht überall gleich gut definiert. Besonders an den C- und N- Termini der Kette wird in der Regel eine grosse Flexibilität beobachtet. Diese Flexibilität führt dazu, dass die Elektronendichten für diese Reste zu gering sind und diese sich daher in der Röntgenstrukturanalyse nicht interpretieren lassen (diese Reste bleiben dann “unsichtbar”). In der NMR Spektroskopie äussert sich die Flexibilität darin, dass das Strukturbündel, das aus den Strukturrechnungen resultiert, für diese Reste sehr breit aufgefächert ist (hoher RMSD). In den X-Ray Untersuchungen geben die sogenannten B-Faktoren einen Hinweis auf die thermische Beweglichkeit der einzelnen Atome, d.h. hohe B-Faktoren bedeuten, dass diese Atome schlechter definiert sind. Die NMR Spektroskopie erlaubt über Relaxationsmessungen (z.B. 15N Relax- ation) direkt das Ausmass der Beweglichkeit sowie, im Gegensatz zur X-Ray, auch die Zeitskala der relevanten Bewegungsvorgänge zu messen. Die Dynamik der Proteine ist für ihre Funktion von essentieller Bedeutung. Katalytische Vorgänge gehen einher mit der Umgruppierung von an dem katalytischen Schritt beteiligten Atomen und erfordern daher eine gewisse Flexibilität. In der Regel sind längere Loops in Proteinen flexibel. Häufig wird auch eine Bewegungen von Domänen zueinander (sog. “Hinge-Motion”) beobachtet. Aromatische Ringe führen häufig sog. Ringflips mit hoher Frequenz durch. Ferner diffundiert Wasser relativ schnell durch den Core von Proteinen. Die Dynamik von Proteinen auf der Picosekunden/Nanosekunden Zeitskala lässt heutzutage relativ gut mit Moleküldynamik (MD) Methoden berechnen. 1.17 Informationen über Proteine auf dem Web (aus Branden and Tooze): Es gibt eine Reihe von relevanten Adressen im Internet, um Struktur- und Sequenzinformationen zu erhalten: • die Homepage der Brookhaven Datenbank (pdb): http://www.rcsb.org/pdb • die Homepage des schweizer Institutes für Bioinformatik (ExPASy), die die automatische Sequenzdatenbank SWISSPROT enthält: http://www.expasy.ch 21 PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR • für Proteintopologien CATH http://www.biochem.ucl.ac.uk/bsm/cath • oder TOPS, mit dem sich nach Topologien suchen lässt http://www3.ebi.ac.uk/tops/ • oder FSSP: http://www2.ebi.ac.uk/dali/fssp • DALI vergleicht die Koordinaten mit bekannten Koordinaten, um Ähnlichkeiten mit bekannten Proteinen aufzudecken. • für Sequenzalignments: Pfram http://www.sanger.ac.uk/Pfam oder ProDom: http://www.protein.toulouse.inra.fr/prodom.html 1.18 Literatur: • Carl Branden, John Tooze: Introduction to Protein Structure, Garland Publisher 1999. • Thomas E. Creighton, Proteins; Structure and Molecular Properties, Freeman, 1993. • Georg E. Schultz, R.H. Schirmer, Principles of Protein Structure, Springer 1985. • K.E. van Holde, W.C. Johnson, P.S. Ho, Physical Biochemistry, Prentice Hall 1998. • Alan Fersht, Structure and Mechanism in Protein Science, Freeman 1999. 22 PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR PEPTID NMR 2. EINLEITUNG ZUR STRUKTURBESTIMMUNG MIT NMR NMR Spektroskopie ist die Methode zur Strukturaufklärung von Proteinen in Lösung. Im Gegensatz zur Röntgeneinkristalldiffraktometrie erlaubt sie die Untersuchung der Struktur unter annähernd physiologischen Bedingungen. Leider ist die Routineanwendung der NMR Methode derzeit noch auf Proteine unter 30 kDa beschränkt. Die Strukturaufklärung mittels NMR beruht im wesentlichen auf der Ausnutzung des “Nuklear Overhauser Effektes” (NOE), der sich im NOESY zwischen Protonen, die weniger als 5 Å voneinander entfernt sind, beobachten lässt1: NOE ∼ r –6 ⋅ f ( τc ) (GL 1) Mit Hilfe der Information über die Nachbarschaftsbeziehungen aller Protonen zueinandern lässt sich dann die Struktur berechnen. Die Strukturaufklärung ist in folgende Schritte unterteilt: • Etablierung von geeigneten Messbedingungen (Probe ist monomer , stabil etc.) • Messung der 2D oder 3D NMR Spektren • Sequentielle Zuordnung aller Protonenfrequenzen (von jedem einzelnen Proton muss dessen Frequenz bekannt sein) • Zuordnung der Kreuzpeaks im NOESY zu den Protonen in der Primärsequenz • Integration des NOESY und Umsetzung der Intensitäten in Distanzein-schränkungen • Bestimmung von Kopplungskonstanten für Diederwinkeleinschränkungen • Strukturrechnung • Refinement • Ueberprüfung der Qualität der Struktur 3. SAMPLE-VORBEREITUNG Gute Messbedingungen sind Voraussetzung für qualitativ gute Spektren, ohne die eine gute Auflösung der Struktur nicht zu erreichen ist, da diese mit Hilfe dieser Spektren gerechnet wird. Folgende Kriterien sollten bei der Probenvorbereitung beachtet werden: 1. unter τc versteht man die Korrelationszeit, d.h. die Zeit, die das Molekül für eine 360° Drehung benötigt 24 PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR 1. Das Protein muss in nativer und funktioneller Konformation vorliegen: • Globuläre Faltung (nicht nur kurze Peptide sind oft sehr flexibel, nur eine Subpopulation ist gefaltet, CD checken!) • geeigneten pH wählen (möglichst physiologisch, falsche Ladungszustände können zu Aggregation führen, aber pH Abhängigkeit des H,D Austausch für Amidprotonen beachten! (vergl. 6.)) • Temperatur variieren, bis Qualität und Signaldispersion optimal ist (oft: schärfere Linien bei erhöhter Temperatur) • Ionenstärke beeinflusst das Aggregationsverhalten (Hofmeister Serie) • Screening geeigneter Bedingungen z.B. mit CD-Spektroskopie • Löslichkeit muss beim pH nach Wahl hoch genug sein (pI!). Die Konzentration sollte mindestens 1mM betragen (in 0.5ml). Bei halber Konzentration muss doppelt solange gemessen werden, um das gleiche Signal/Rausch-Verhältnis zu erhalten! Evtl. Zusatz von Detergentien/Salz. 2. Keine Kontaminationen, genügend hohe Reinheit des Proteins (>95%, genügende Anzahl Reinigungsschritte, Check via HPLC/MS/SDS-PAGE etc.). 3. In Abhängigkeit vom Molekulargewicht: • Anzahl Signale im Protonenspektrum: Jedes Proton gibt mindestens einen Peak im Spektrum (Ausnahme: langsamer Austausch), d.h. je grösser das Molekulargewicht, desto komplexer das Spektrum (Signalüberlappung!) Je grösser das Molekül, desto länger seine Korrelationszeit τc (η: Viskosität, r: hydrodynamischer Radius, T: Temperatur in Kelvin, k: Boltzmann-Konstante) 3 4πηr τ c = --------------3kT (GL 2) Lange Korrelationszeiten führen zu breiten Linien im Spektrum: Geringe Signalintensität und mehr Signalüberlagerungen! • Zuordnung der Resonanzen mit homonuklearen Protonenspektren oft einfach bis zu ca 50AS, bei 50-100 AS empfiehlt sich 15N-Labelling, bei > 100 AS (bis gegen 200 AS) zusätzlich 13C und evtl. Deuterium-Labelling. 4. Aggregationszustand: • Monodisperse Verteilung anstreben, da verschiedene Aggregatszustände evtl. zu verschiedenen Signalsätzen führen können. • Wenn möglich in Monomerform messen (Check via Dynamic Light Scattering): kleine Moleküle geben schärfere Signale 5. Stabilität unter den gewählten Bedingungen prüfen (CD, FPLC) 25 PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR Hydrophile Peptide misst man meist in 90% H20/D2O, damit die labilen Protonen (NH) nicht durch Deuterium ausgetauscht sind. Der Backbone-NH Austausch von freien Amidprotonen ist bei einem pH um 3.0 im Minimum, aus Stabilitätsgründen misst man oft bei einem pH zwischen 4 und 5. (Fig. 1) Sind die Amidprotonen in Wasserstoffbrücken involviert (z.B. in einer Helix), oder befinden sie sich im Core und sind nicht Lösungsmittel-zugänglich, tauschen sie sehr viel langsamer aus und können auch bei höherem pH gut beobachtet werden. FIGUR 28. Logarithmische Darstellung der intrinsischen Austauschraten kintr versus pH für Lösungsmittel-zugängliche, labile Protonen in Wasser bei 25˚C. 4. SPEKTREN-AUFNAHME Die Strukturbestimmung von Peptiden via NMR basiert auf der Beobachtung des sogenannten Nuklear Overhauser Effektes (NOEs) zwischen Protonen (siehe oben). Um die NOEs den Protonen zuordnen zu können, müssen zunächst deren Resonanzfrequenzen ermittelt werden. Aufgrund der grossen Protonenzahl (3-13 pro Aminosäure) und der daraus resultierenden Signalüberlappung ist es bereits in kleinen Peptiden undenkbar, die Signale in einem normalen 1D Protonenspektrum zuzuordnen. Eine schematische Verteilung der verschiedenen Protonen ist in der folgenden Figur gezeigt: 26 PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR FIGUR 29. Chemische Shift-Bereiche für die verschiedenen Typen von1H-Resonanzen in Ubiquitin (aus Cavanagh et al.: Protein NMR Spectroscopy). Elegant lassen sich die Zuordnungsprobleme allerdings mit Hilfe der zweidimensionalen NMR-Spektroskopie lösen. Grundprinzip aller 2D-Experimente ist die Korrelation zweier Frequenzen miteinander. Die Korrelationsintensitäten entsprechen der dritten Dimension (Darstellung wie von Höhenlinien auf Landkarten). Werden auf den beiden Achsen chemische Verschiebungen aufgetragen, spricht man von zweidimensionaler Verschiebungs-korrelierter Spektroskopie. Die horizontal liegende Frequenzachse (Abszisse) wird als F2-, die vertikale als F1-Achse bezeichnet (Ordinate). Welche Eigenschaften ein Protonenpaar (A, B) haben muss, damit es in einem 2D-Spektrum korreliert erscheint, d.h. durch zwei Kreuzpeaks (entspricht einem Berg auf der Landkarte) bei den beiden zugehörigen Protonenfrequenzen (νA, νB) bzw. (νB, νA) in F2 und F1 verbunden ist, wird durch das NMR-Experiment genau definiert. In allen homonuklearen Spektren wird jede Protonenfrequenz auch mit sich selber korreliert (νA, νA). Dies führt zu den sogenannten Diagonalpeaks, oft die intensivsten 27 PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR Signale im 2D-Spektrum. Alle Diagonalpeaks zusammen bilden die Diagonale des Spektrums und entsprechen einem Standard 1D Protonenspektrum. ν2 ν1 F1 ν1 (ν 1, ν2) (ν 1, ν1) ν2 (ν 2, ν2) (ν 2, ν1) Diagonale: ν1 = ν1 Gegendiagonale: ν1 = -ν1 F2 FIGUR 30. Schema eines 2D Spektrums mit Angabe der Kreuz- und Diagonalpeaks sowie der externen Projektionen Eine grosse Fülle an 2D Experimenten wurde entwickelt, so dass viele komplexe Fragestellungen durch sequentielle Applikation der geeigneten Experimente beantwortet werden können. Zur Resonanzfrequenzzuordnung von Protonenspektren eines Peptids werden standardmässig 3 verschiedene zweidimensionale homonukleare [1H,1H]-korrelierte Experimente gemacht: das COSY, das TOCSY und das NOESY. Diese liefern 2D-Spektren, bei denen auf beiden Frequenzachsen 1H-chemische Verschiebungen miteinander korreliert sind (siehe Abschnitt 4.1 auf Seite 29,Abschnitt 4.2 auf Seite 32, Abschnitt 4.3 auf Seite 33). Eine kurze grundsätzliche Bemerkung zur Aufnahme von Spektren mit Wasser als Lösungsmittel: Das bei weitem intensivste Signal in einem normalen 1DProtonenspektrum liegt selbstverständlich bei der Wasserfrequenz (um 4.7ppm bei 37˚C). Da in diesem Frequenzbereich auch die meisten Cα-H liegen, muss das Wassersignal unterdrückt werden, z.B. durch vorheriges Einstrahlen auf die Wasserfrequenz werden die Wasserprotonen gesättigt, was die Spins der 28 PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR Wasserprotonen für das nachfolgende Experiment quasi unsichtbar macht. Ein schmales Wasserband ist jedoch auch in wasserunterdrückten Spektren gut sichtbar. 4.1 [1H,1H]-COSY:[1H,1H]-Correlated Spectroscopy [1H,1H]-Korrelation aufgrund skalarer [1H,1H]-Kopplungen mit Kopplungskonstanten J > 2Hz Pro Memoria: In Molekülen treten benachbarte magnetische Kerndipole miteinander in Wechselwirkung. Solche Spin-Spin-Kopplungen beeinflusen die Energien und somit die Frequenzen der beobachteten Kerne. Es kommt zu Aufspaltungen der Signale in Dubletts, Tripletts etc. Bei der skalaren (indirekten) Kopplung erfolgt die Wechselwirkung über die Bindungen, d.h. indirekt, während bei der direkten (dipolaren) Kopplung eine direkte Wechselwirkung durch den Raum stattfindet, die sich allerdings in Lösung nicht als Aufspaltung zeigt. FIGUR 31. Skalare (links) und dipolare (rechts) Kopplungen Die Effizienz des COSY Experimentes nimmt mit zunehmender Linienbreite, d.h. zunehmendem Molekulargewicht, drastisch ab. Dies ist ein Grund dafür, dass für grössere Moleküle Experiemente mit isotopenmarkierten Verbindungen eingesetzt werden müssen. Die Peaks in einem COSY lassen sich an Hand ihrer Position im Spektrum wie folgt grob klassifizieren: a. alle nichtlabilen, nichtaromatischen Seitenkettenprotonen ausser βH - γCH3 von Thr, δH-δH von Pro und βH-βH von Ser. b. αH-βCH3 von Ala und βH-γCH3 von Thr. c. αH-βH von Val, Ile, Leu, Glu, Gln, Met, Pro, Arg, und Lys. d. αH-βH von Cys, Asp, Asn, Phe, Tyr, His und Trp. e. αH-αH von Gly, αH-βH von Thr, δH-δH von Pro, αH-βH und βH-βH von Ser. 29 PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR . FIGUR 32. [ 1H,1H]-COSY von Neuropeptid Y (NPY) f. aromatische Ringprotonen, inklusive 2H-4H von His, sowie SeitenkettenAmidprotonen von Asn und Gln. g. Hauptketten (Backbone) NH-αH. h. δCH2-εNH von Arg. Von spezieller Bedeutung ist die Backbone NH-αH-Region (g) von Spektren, die in Wasser aufgenommen wurden (in D2O tauschen die Backbone NH-Gruppen gegen D aus, ND gibt kein Signal). Sie wird Fingerprint-Region der Aminosäure-Sequenz genannt und kann als erstes Kriterium zur Qualitätsbeurteilung des Samples sowie der Spektren dienen. Jede L-Aminosäure (Ausnahme:Pro) führt zu einem einzelnen NHαH Kreuzpeak, und jedes Gly gibt entweder 2 Kreuzpeaks (wenn die beiden αH verschiedene chemische Verschiebungen haben) oder einen einzelnen Peak mit einer charakteristischen Multiplett-Feinstruktur. Die N-terminale AS kann wegen des raschen Austauschs der α-Aminoprotonen mit Wasser nicht beobachtet werden (Abbildung 28 auf Seite 26). 30 PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR Die skalaren Kopplungen werden überwiegend zwischen Protonen, die durch 3 Bindungen separiert sind (sog. vicinalen Protonen) beobachtet. Mehrere Gründe können dafür verantwortlich sein, dass nicht die maximal mögliche Anzahl an Kreuzpeaks in der Fingerprint Region sichtbar sind: Signalüberlagerungen (Spektren werden erneut bei leicht erhöhter oder erniedrigter Temperatur aufgenommen, wodurch die Signal meist auf verschiedene Weise schieben), sehr kleine JNH-αΗKopplungskonstanten (in stabilen α-Helices ist sie < 4 Hz), die aus Dihedralwinkeln nahe 90° resultieren (s. Abbildung 44 auf Seite 41), oder schneller Austausch mit dem Wasser. Die COSY Peaks zeigen eine Multiplet-Feinstruktur. Diese resultiert aus den aktiven und passiven Kopplungen der beiden Protonen, deren skalare Wechselwirkung den Peak verursacht. Unter der aktiven Kopplung versteht man die Kopplung der beiden zu dem Peak gehörenden Protonen zueinander. Die passiven Kopplungen sind die Kopplungen der beiden Protonen zu weiteren Protonen. Aktive Kopplungen sind in anti-Phase (die beiden Komponenten haben unterschiedliches Vorzeichen) passive Kopplungen sind in-Phase: J(A,B) J(A,C) ppm F1 4.00 J(A,B) 2.00 ppm F2 FIGUR 33. COSY Kreuzpeakpattern für ein Spinsystem C B pinsystem: A 31 PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR 4.2 [1H,1H]-TOCSY: Total Correlation Spectroscopy Das TCOSY Experiment liefert [1H,1H]-Korrelation von Signalen aller Protonen eines Spinsystems. Ein Spinsystem setzt sich zusammen aus allen Spins, die zum gleichen (skalaren) Kopplungsnetzwerk gehören. Protonen verschiedener Aminosäuren gehören immer zu verscheidenen Spinsystemen (es gibt keine skalare Kopplung über die Amidbindung). In manchen Aminosäuren sind alle Protonen Bestandteil eines Spinsystemes (z.B. Ile), andere bestehen aus 2 Spinsystemen (z.B. Phe): FIGUR 34. Spinsysteme von Tyr (J) und Arg(X) im TOCSY Experiment Das Erkennen der Spinsysteme ist ein wichtiger, erster Schritt im Verlauf der Resonanzzuordnung, und das TOCSY Experiment spielt bei Peptiden hier eine herausragende Rolle (siehe Abschnitt 5.2 auf Seite 36). Durch Variation der sogenannten Mischzeit des Experimentes kann man bestimmen, wie weitreichend die Korrelationen innerhalb der beobachteten Spinsysteme sein werden. Wählt man z.B. eine kurze Mischzeit von 12ms, so beobachet man im 2D Spektrum ausschliesslich Kreuzpeaks zwischen geminal und vicinal koppelnden Protonen. Wählt man eine lange Mischzeit von ca 80ms, so erwartet man Kreuzpeaks für alle Protonen des Spinsystems. Um die Spinsysteme gut zu erkennen, ist es sinnvoll in einen Bereich des Spektrum zu schauen, der eine möglichst gute Signalseparation aufweist. Das ist normalerweise der Bereich der Amidprotonen (ca. 7-10 ppm), ev. Ueberlappungsprobleme lassen sich häufig durch die Aufnahme der Spektren bei zwei verschiedenen Temperaturen beseitigen (der Shift der Amid Protonen ist stark temperaturabhängig). Ein Vergleich der Aussagekraft von COSY und TOCSY ist in der folgenden Figur gut zu erkennen: 32 PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR . FIGUR 35. Vergleich der Region der Amidprotonen (F2), aliphatischen Protonen (F1) für COSY (A) und TOCSY (B) sowie der Kopplungen aliphatischer Protonen untereinander im COSY (C) und TOCSY (D). 4.3 [1H,1H]-NOESY: Nuclear Overhauser Effect Spectroscopy Im NOESY-Experiment sind auf beiden Frequenzachsen 1H-chemische Verschiebungen aufgetragen. Kreuzpeaks resultieren aufgrund von 1H, 1H- Wechselwirkungen durch den Raum (dipolare, direkte Kopplung), sind also nur vom 33 PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR Abstand der Kerne voneinander abhängig, während die Anzahl der zwischen den Atomen liegenden Bindungen keinen Einfluss hat. D ≈ r –6 (GL 3) Dipolare Kopplungen lassen sich in der hochauflösenden NMR Spektroskopie, d.h. in flüssiger (isotroper) Phase, nicht direkt aus dem Spektrum herauslesen, weil die Kopplungen aufgrund der raschen Reorientierung der Moleküle in Lösung zeitlich herausgemittelt werden. Die dipolaren Kopplungen sind aber die Ursache des KernOverhauser Effekts (nuclear Overhauser effect, NOE) - vgl. mit Gleichung 1, auf Seite 24 - und können somit aufgrund der Distanzabhängigkeit der Intensität zur Strukturbestimmung von Proteinen herangezogen werden. TABELLE 36. Besonderheiten des NOESY-Experiments: Signalphase Diagonalpeak Signalphase Kreuzpeak kleine Moleküle, niedervisköse Lösungsmittel positiv negativ mittlere Moleküle positiv sehr schwache Signale (positiv oder negativ) grosse Moleküle positiv positiv Die Signalphase der Kreuzpeaks im NOESY-Experiment ist abhängig vom Vorzeichen des NOEs. Als Faustregel kann man sich merken, dass der NOE für kleine Moleküle . FIGUR 37. Abhängigkeit des homonuklearen Kern-Overhauser-Effekts zwischen Protonen vom Produkt aus Resonanzfrequenz und molekularer Korrelationszeit.(Abb. aus Günther: NMR-Spektr.) 34 PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR positiv und für grosse Moleküle negativ ist. Der NOE für mittlere Moleküle befindet sich gerade im Bereich des Vorzeichenwechsels und ist deshalb klein oder nullAuch im NOESY lassen sich aus der Lage der Peaks schon Rückschlüsse über die Art der involvierten Protonen erhalten: FIGUR 38. (H,H)-NOESY von ProteinD (Phagen Hüllprotein) a. NH; aromatische - NH; aromatische. b. NH; aromatische - αH; δH von Pro; βH von Ser und Thr. c. NH; aromatische - aliphatische Seitenketten. d. αH; δH von Pro; βH von Ser und Thr - αH; δH von Pro; βH von Ser und Thr. e. αH; δH von Pro; βH von Ser und Thr - aliphatische Seitenketten. f. Aliphatische Seitenketten - aliphatische Seitenketten. Nicht nur liefert das NOESY als einziges der 3 erwähnten Experimente Informationen über Protonendistanzen innerhalb des Peptids - es ist auch das Schlüsselexperiment bei der sequentiellen Zuordnung der AS-Spinsysteme zur Aminosäuresequenz. Man bedenke, dass 2 AS-Reste immer zu verschiedenen Spinsystemen gehören und deshalb nie durch Kreuzpeaks in einem COSY oder TOCSY-Experiment verbunden sind! Nur mit Hilfe des NOESY lassen sich die Spinsysteme über die Amidbindungen miteinander verknüpfen (s. 4.3). 35 PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR 5. STRATEGIE ZUR RESONANZFREQUENZ-ZUORDNUNG FÜR KLEINE, NICHT-MARKIERTE PROTEINE 5.1 Beurteilung der Spektrenqualität Anhand der Fingerprint-Region im COSY-Spektrum wird die Anzahl der beobachtbaren Spinsysteme bestimmt. Fehlen mehr als 10% der maximal möglichen Zahl an Resten, sollte der Grund für die Abwesenheit der Peaks bestimmt und die Spektrenaufnahme optimiert werden (Temperatur, pH, Salz etc.) In einem zweiten Schritt müssen alle Spektren gleich kalibriert werden. Als interner Standard wird dabei oft die Wasserfrequenz verwendet (T=Temperatur in [K]): T δ( H 2 O ) = 7, 83 – ------------ ppm 96, 9 (GL 4) Durch Übereinanderlegen von TOCSY und COSY, bzw. NOESY und COSY kann nun auch die Qualität der Fingerprint-Region von TOCSY und NOESY abgeschätzt werden. Hierbei ist zu beachten, dass im NOESY eine grössere Anzahl an zusätzlichen (interresiduellen, meist sequentiellen NHi-Hαi-1) Kreuzpeaks vorhanden sein können. Es lohnt sich ausserdem meist, Spektren bei zwei verschiedenen Temperaturen aufzunehmen, um in Fällen von Signalüberlappung eindeutige Interpretationen zu erhalten (siehe Abschnitt 5.3 auf Seite 39). 5.2 Spinsystem-Identifikation: NH-αΗ−βΗ−... Im ersten Schritt versucht man, die Spinsysteme von der Hauptkette aus (Spins, die zum gleichen Spinsystem wie das betrachtete Amidproton gehören) zu identifizieren. Es gelingt meist nicht, die Aminosäuren direkt zu indentifizieren (Ausnahmen sind Thr, Ser, Gly). Die Klassifizierung nach Typ des Spinsystemes erlaubt aber später unter Zuhilfenahme der sequentiellen Information aus dem NOESY für Tri/ Tetrapeptidsegmente eine eindeutige Zuordnung. Kriterien für die Klassifizierung hierzu sind z.B. • die Länge der Spinsysteme es gibt kurze Spinsysteme (Typ J, z.B. Ser), lange Spinsysteme (z.B. Lys) • bestimmte Peak-“Patterns“ (siehe Anhang): Man sucht sich einen Bereich, in dem die Spinsysteme möglichst gut separiert sind. Dies ist meist in der NH Region der Fall. Bei kurzen Peptiden ist die Analyse des NH (F2)/H-aliphatisch (F1) Bereiches im TOCSY sehr nützlich. Manche Ami- 36 PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR nosäuren lassen sich schon anhand der chemischen Verschiebungen ziemlich eindeutig bestimmen: Ser: β−Protonen sehr tief, keine Methylgruppe Thr: β−Protonen sehr tief, plus Methylgruppe um 1 ppm Ala: keine β-Protonen, jedoch Mehtylgruppe um 1 ppm Gly gibt als einzige Aminosäure ein Triplett für die Amidresonanz. Pro hat kein Amidproton, zeigt aber ein charakteristisches Spinsystem im TOCSY. Methylgruppen tragen neben Ala und Thr nur noch Val, Leu und Ile. Val, Leu und Ile können aufgrund der unterschiedlichen Verknüpfungen von Methyl- und Methylengruppen im COSY unterschieden werden. Kurze Spinsysteme (nur NH, αund β-Protonen) besitzen neben Ser nur Cys, Asp, Asn, Phe, His, Trp und Tyr (sog. Typ J-Spinsysteme). Die Verschiebungsbereiche der Protonen sind schemtisch in der folgenden Abbildung gegeben FIGUR 39. 1H-chemische Verschiebungen von aliphatischen Protonen. Mittelwert und Standardabweichung wurden aus Daten von 13 Proteinen bestimmt. (Abbildung aus Cavanagh et al.: Protein NMR Spectroscopy) 37 PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR Die sogenannten “Random-Coil” Verschiebungen (Shifts in unstrukturierten Tripeptiden) sind in der nachfolgenden Tabelle dargestellt: TABELLE 40. Random coil chemische Verschiebungen für die 20 natürlichen Aminosäuren im Dipeptid mit nachfolgendem Alanin Rest NH Hα Hβ Andere Ala 8.24 4.32 1.39 Cys(red) 8.32 4.55 2.93, 2.93 Cys(ox) 8.43 4.71 3.25, 2.99 Asp 8.34 4.64 2.72, 2.65 Glu 8.42 4.35 2.06, 1.96 Phe 8.30 4.62 3.14, 3.04 2,6H 7.28; 3,5H 7.38; 4H 7.32 Gly 8.33 3.96 His 8.42 4.73 3.29, 3.16 2H 8.58; 4H 7.29 Ile 8.00 4.17 1.87 γCH2 1.45, 1.16; γCH3 0.91; δCH3 0.86 Lys 8.29 4.32 1.84, 1.75 γCH2 1.44, 1.44; δCH2 1.68, 1.68; γCH2 2.31, 2.31 εCH2 2.99, 2.99; εNH3+ 7.81 Leu 8.16 4.34 1.62, 1.62 γCH 1.59; δCH3 0.92, 0.87 Met 8.28 4.48 2.11, 2.01 γCH2 2.60, 2.54; εCH3 2.10 Asn 8.40 4.74 2.83, 2.75 γNH2 7.59, 6.91 Pro - 4.42 2.29, 1.94 γCH2 2.02, 2.02; δCH2 3.63, 3.63 Gln 8.32 4.34 2.12, 1.99 γCH2 2.36, 2.36; δNH2 7.52, 6.85 Arg 8.23 4.34 1.86, 1.76 γCH2 1.63, 1.63; δCH2 3.20, 3.20; εNH 8.07 Ser 8.31 4.47 3.89, 3.87 Thr 8.15 4.35 4.24 γCH3 1.21 Val 8.03 4.12 2.08 γCH3 0.94, 0.93 Trp 8.25 4.66 3.29, 3.27 2H 7.27; 4H 7.65; 5H 7.18; 6H 7.25; 7H 7.50 Tyr 8.12 4.55 3.03, 2.98 2,6H 7.14; 3,5H 6.84 Die Mitglieder der letzten Gruppe von AS-Resten, Lys, Arg, Met, Gln, Glu und Pro, besitzen alle 2 γ-Protonen, gekoppelt an die β−Protonen. Weil die shifts der β− Protonen in dieser Gruppe höher als 2.2 ppm liegen, werden diese Reste auch Typ-U (upfield) Spinsysteme genannt. Met, Gln und Glu haben ihre γH-Resonanzen tiefer als jene der β-Protonen und vice versa für Arg, Lys, Pro und Leu. Für die aliphatischen und aromatischen Protonen der Aminosäuren gibt es charakteristische Pattern in der COSY und TOCSY Spektren, die im Anhang schematisch zusammengefasst sind. 38 PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR 5.3 Sequenz-spezifische Zuordnung Hat man die Spinsysteme charakterisiert, so versucht man sie über NOEs aneinander zu hängen. Hierzu gibt es charakteristische, kurze sequentielle Abstände, die je nach Sekundärstruktur variieren. 4 3 9 1 8 5 2 7 4 ppm ppm 7 FIGUR 41. NOESY-Diagonal- und Kreuzpeaks in der NH (F2)/ NH (F1)- Region. Starke (sequentielle) dNN-Kreuzpeaks werden v.a. in helikalen Segmenten, augrund der kurzen (sequentiellen) NHi-NHi+1 Abstände beobachtet und erlauben es, die sequentielle Anordnung der Spinsysteme zu bestimmen durch Zuordnung der NH-shifts (sog. NOESY-walk in der NH/NH-Region) . 3 H 3.5 1 ppm N i+1 5 Cα C 4 N α 4 3 C O 2 4.5 -1 α O 9 8 7 pm FIGUR 42. NOESY-Kreuzpeaks in der NH(F2)/αH (F1)-Region. Starke (sequentielle) dαΝKreuzpeaks werden v.a. in gestreckten (β−Blättern und random coil) Konformationen aufgrund der kurzen NHi+1/αHi-Abstände beobachtet, oft gleichzeitig in Kombination mit dβN-Kreuzpeaks. Natürlich werden auch nicht-sequentielle kurze Abstände beobachtet, daher sollte man nur starke und mittelstarke NOEs für die sequentielle Zuordnung benutzen. In gestreckten Konformationen wie in β−Faltblättern oder im Zufallsknäul (random-coil) 39 PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR werden kurze sequentielle NHi+1-αHi beobachtet. In helikalen Abschnitten sind die NHi-NHi+1 Abstände kurz. Durch Vergleich von NOESY und COSY lassen sich die intraresiduellen von den sequentiellen (interresiuduellen) NH-αΗ Peaks unterscheiden. Mit geeigneten Programmen wie XEASY können identische Frequenzausschnitte aus COSY/TOCSY und NOESY gleichzeitig nebeneinander angezeigt werden und intraresiduelle von interresiduellen NOEs schnell unterschieden werden. Der Vergleich von COSY und NOESY eignet sich für die sequentielle Aneinandereihung der Spinsysteme: FIGUR 43. : Fingerprint Region im COSY (links) und NOESY (rechts) Spektrum. Die kurzen sequentiellen Abstände, bzw. die daraus resultierenden NOEs ermöglichen es nun, kurze Segmente zusammenzuhängen, und man kann dann meist unter Zuhilfenahme der Information über die Art der Spinsysteme entscheiden, um welche Aminosäure es sich handelt. 40 PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR 6. STRUKTURRECHNUNG MIT NMR-DATEN Sind einmal alle (oder fast alle) Resonanzen zugeordnet, können Chemische Verschiebungen, skalare Kopplungskonstanten und NOEs, die alle abhängig von der Konformation sind, zur Strukturanalyse verwendet werden. 6.1 Chemische Shifts. Helikale Faltung und Faltblätter haben einen unterschiedlichen Effekt auf die Resonanzfrequenzen der α-Protonen. Folgende Regel dient zu einer ersten (vorläufigen) Sekundärstrukturvorhersage: Liegen die αH-Shifts von mehr als drei aufeinanderfolgenden Resten im Vergleich mit den Random-Coil αH-Shifts der korrespondierenden Aminosäure um mehr als 0.1ppm höher, kann für diese Reste eine helikale Struktur angenommen werden, umgekehrtes gilt für Faltblätter (um mehr als 0.1ppm tiefer...). 6.2 3JHN-αH-Kopplungskonstanten. Sie hängen über die Karplus-Beziehung vom Torsionswinkel θ ab: J ( θ ) = 6, 98 ( cos θ ) 2 – ( 1, 38 ( cos θ ) ) + 1, 72 (GL 5) . FIGUR 44. Plot von 3JHN-αH-Kopplungskonstanten versus Torsionswinkel θ=|φ-60˚| in BPTI. φ wurde aus der Kristallstruktur bestimmt. Werte für einzelne Aminosäuren sind mit Kreisen dargestellt. (Abbildung aus Wüthrich: NMR of Proteins and Nucleic Acids) 41 PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR Die Karplus-Beziehung ist nicht eindeutig - zu einem gegebenen 3J gibt es 4 mögliche θ-Konformationen, einige davon möglicherweise sterisch ungünstig, d.h., dass der Bereich aller möglichen θ durch Messung von J allenfalls eingeschränkt, θ jedoch nicht bestimmt werden kann. Umgekehrt kann allerdings gesagt werden, welche Kopplungen in den verschiedenen Sekundärstrukturelementen (wo die θ ja einen definierten Wert besitzen) erwartet werden: TABELLE 45. Theoretische Werte für 3JHN-αH in regulären Sekundärstrukturelementen Sekundärstruktur θ 3J HN-αH α-Helix -57˚ 3.9 Hz 310-Helix -60˚ 4.2 Hz antiparalleles β-Blatt -139˚ 8.9 Hz paralleles β-Blatt -119˚ 9.7 Hz Intramolekulare Bewegungen führen zu J-Werten, die zeitgemittelt sind über die Verteilung der eingenommen Torsionswinkel. Extensive Hauptkettenbewegungen resultieren in J-Werten um 7 Hz in kurzen, linearen Peptiden, dh., 3JHN-αH zwischen 6 und 8 Hz werden für die Strukturrechnung nicht berücksichtigt. NOEs. Sie sind die wichtigsten NMR-Daten zur Strukturbestimmung, essentiell für Tertiär- und Quarternärstrukturaufklärung. Sie werden beobachtet zwischen Protonenpaaren, die im Raum weniger als 5Å voneinander entfernt sind. Unter Umständen sind sie in AS-Resten lokalisiert, die in der Primärsequenz weit voneinander entfernt sind, die sich aber aufgrund der Faltung im dreidimensionalen Raum wieder nahe kommen. Vlg. mit Gleichung 1, auf Seite 24! Im Prinzip sind alle Wasserstoffatome eines Proteins miteinander gekoppelt über die Dipol-Dipol-Interaktionen. Magnetisierung kann nicht nur direkt von einem Spin zum anderen übertragen werden, sondern auch durch die sogenannte Spin-Diffusion, dh. indirekt via andere, benachbarte Spins. Die Approximation isolierter Spinpaare ist nur gültig für sehr kurze Mischzeiten (der wichtigste experimentelle Parameter eines NOESY-Experiments). In der Praxis können die Mischzeiten allerdings nicht beliebig kurz gewählt werden, für kurze Mischzeiten ist die NOE-Intensität nämlich linear abhängig von der Mischzeit, es muss also ein Kompromiss gemacht werden zwischen Spin-Diffusionsvermeidung und genügend hoher Signalintensität. Dies hat zur Folge, dass die gemessenen NOEs nicht auf exakte Weise in Distanzen umgerechnet werden 42 PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR können. Man behilft sich bei der Strukturrechnung mit dem Ausweg, die geschätzten Distanzen bloss als obere Distanzlimiten (upper limits) zu interpretieren. Ist die Distanz zwischen einem Protonenpaar in der berechneten Struktur kürzer als es aufgrund des NOEs hätte vermutet werden können (d.h. der gemessene NOE ist stärker als der aus der berechneten Struktur abgeleitete), wird dies ohne weiteres akzeptiert. Wie berechnet man aus einem NOE-Kreuzpeak zwischen zwei Protonen eine obere Distanzlimite für deren Abstand? In einem ersten Schritt müssen die Volumina der Kreuzpeaks im NOESY-Spektrum bestimmt werden (Integration des Spektrums in 2 Dimensionen). Obere Distanzlimiten u zwischen zwei Wasserstoffatomen werden nachher aus den korrespondierenden NOESY-Kreuzpeak-Volumina V abgeleitet. Für ein rigides Molekül gilt folgende Kalibrierungsbeziehung: k V = ----6u (GL 6) mit einer Konstanten k, die von der aktuellen Kalibrierung des NOESY-Spektrums abhängt. k wird bestimmt aus NOESY-Volumina, die bekannten Distanzen zugeordnet sind, z.B. den sequentiellen Distanzen d(Hiα, Hi+1N) und d(HiN, Hi+1N) von regulären Sekundärstrukturelementen. TABELLE 46. Kurze (<4.5A) sequentielle und mittlere 1H-1H Distanzen in PolypeptidSekundärstrukturen Distanz α-Helix 310-Helix β βp turn I turn II dαN 3.5 3.4 2.2 2.2 3.4 3.2 2.2 3.2 dαN(i,i+2) 4.4 3.8 3.6 3.3 dαN(i,i+3) 3.4 3.3 3.1-4.2 3.8-4.7 dαN(i,i+4) 4.2 dNN 2.8 2.6 2.6 2.4 4.5 2.4 dNN(i,i+2) 4.2 4.1 3.8 4.3 dβN 2.5-4.1 2.9-4.4 2.9-4.4 3.6-4.6 3.6-4.6 3.6-4.6 dαβ(i,i+3) 2.5-4.4 3.1-5.1 4.3 4.2 3.2-4.5 3.7-4.7 43 PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR . FIGUR 47. Sequentielle und mittelgrosse (medium-range) 1H-1H Distanzen in Polypeptidketten (aus Wüthrich: NMR of Proteins and Nucleic Acids). . FIGUR 48. Ueberblick über die squentiellen und medium-range1H-1H NOEs und Spin-SpinKopplungskonstanten 3JHNα in den verschiedenen Sekundärstrukturelementen. Die Nummern ganz unten stehen für die Position der Aminosäure im Sekundärstrukturelement. Ein Zeile weiter oben stehen die Werte für die Kopplungskonstanten. Kurze Protonenpaardistanzen sind mit Linien angegeben, die die Reste verbinden, welche die entsprechenden Wasserstoffatome tragen. Die Breite der Linie repräsentiert die korrespondierende NOE-Kreuzpeak-Intensität. (Abbildung aus Wüthrich: NMR of Proteins and Nucleic Acids) Ist einmal eine grössere Anzahl an NOE-Kreuzpeaks eindeutig zugeordnet, können ihre Volumina, bzw. die daraus abgeleiteten, kalibrierten oberen Distanzlimiten, für eine erste Strukturbestimmung verwendet werden. Gemäss IUPAC ist die Konformation einer Aminosäure in einer Polypeptidkette definiert durch vier Winkel. Die φ, ψ - Paare sind aus energetischen Gründen (sterische Interaktionen) gemäss Ramachandran-Plot eingeschränkt. Für Θ gilt Θ=Φ-60˚. Ebenfalls aus energetischen 44 PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR Gründen können nur 3 Werte für χ1 (60˚, -180˚, -60˚) eingenommen werden. Die Methoden zur Konformationsbestimmung mittels NMR beruhen im wesentlichen auf den etablierten, allgemeinen Ansätzen zur Konformationsanalyse von Proteinen/ Peptiden, d.h. entweder Distanzgeometrie (DG) oder Moleküldynamiksimulationen (MD), wobei in diese Ansätze zusätzliche Terme, die die aus den NMR-Messungen gewonnenen Distanzeinschränkungen berücksichtigen, integriert werden. Im folgenden wird eine sehr elegante Methode via MD, wie sie im Programm DYANA implementiert ist, genauer vorgestelllt. Eine MD-Simulation ist eine deterministische Prozedur, bestehend aus Abtasten des Raums der möglichen Konfigurationen und gleichzeitiger Integration der klassischen Newton‘schen Bewegungsgleichungen für alle Atome i des Systems (mi: Masse des Atoms i; ri(t): Position von i zur Zeit t; Fi(t): Kraft auf i, ausgeübt durch die übrigen Atome N-1 zur Zeit t).: 2 mi d r (t ) = Fi(t ) dt2 i i = 1, …, N (GL 7) Im Verlauf der Simulation wird die potentielle Energie minimiert, indem die Atome ihre Position in Richtung des Gradienten (.d.h. in Richtung abnehmender Energie oder in Richtung der auf sie wirkenden Kraft Fi(t)) verändern. Das Ziel der Simulation ist es, alle ri (die Abstände aller Atome vom Massezentrum) im Energieminimum zu kennen, dann ist die Struktur bestimmt. Für jedes Atom i wird die Kraft Fi zu jeder Zeit t als negativer Gradient der Potentialfunktion (U in Abhängigkeit der Atomkoordinaten ri) berechnet: Fi = – d U ( r 1, r 2, …, r N ) dri (GL 8) Die Potentiale sind die in normalen Kraftfeldern verwendeten Potentiale Upot, die um einige Terme, die die NMR Distanz- und Diederwinkeleinschränkungen repräsentieren, erweitert worden sind:Energie jedes Moleküls berücksichtigt: U pot = U Torsionswinkel + U vdW + U Coulomb + U NMR 45 (GL 9) PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR Verletzungen der oberen Distanzlimiten, die aus den NOE-Daten gewonnen wurden, werden in ein Zusatzpotential umgerechnet und zum Torsionswinkel-, van der Waalssowie Coulombpotential aufaddiert: . Epot dNOE FIGUR 49. U NMR eines Protonenpaars in Abhängigkeit von deren gegenseitigen Distanz. Aus den NOE-Daten (Volumen des entsprechenden Kreuzpeaks) wurde eine obere DistanzlimiteNOE d bestimmt. Der NMR-Term U NMR steigt an, sobald diese Limite in der MD-Simulation zur Strukturrechnung überschritten wird, d.h., die intermolekulare Kraft (Gleichung 8, auf Seite 45) wird in Richtung kürzerer Distanz wirken. Bindungslängen, Bindungswinkel, Chiralitäten und Planaritäten (alle kovalenten Strukturparameter) werden zur Vereinfachung (Reduktion der Rechenzeit!) fixiert. Es gibt zahlreiche Algorithmen zur Integration der MD Bewegungsgleichungen1. Am Anfang einer Strukturrechnung mit DYANA steht das Generieren eines Ensembles (20-50 Moleküle) von Random-Strukturen, d.h. Polypeptidketten mit zufälligen Einstellungen aller Torsionswinkel. Gleichzeitig werden die Moleküle aufgeheizt, d.h. mit kinetischer Energie versehen (Temperaturen von mehreren Tausend Kelvin), was zu schnellen Veränderungen der Torsionswinkeleinstellung führt. Damit wird verhindert, dass bereits in einem frühen Stadium der Rechnung Konformationen mit lokalem Energieminimum definitiv eingenommen werden (gesucht wird ja das globale Energieminimum), dh., das System muss genügend hohe kinetische Energie besitzen, um den Potentialtopf eines lokalen Minimums wieder verlassen zu können. Im Verlaufe der Rechnung wird das System langsam abgekühlt, die Moleküle werden in eine Endkonformation gezwungen und deren potentielle Energie, die niedrig seien sollte, berechnet: 1. In DYANA wird die Integration im Torsionswinkelraum durchgeführt, d.h. F und U werden nicht mehr als Funktionen von r, sondern als Funktionen der Torsionswinkel Θ, Ψ, Φ, χ betrachtet. (Es wird also eine Transformation aus dem kartesischen System (Newton-Gleichungen) in den Torsionswinkelraum durchgeführt (Lagrange-Gleichungen)). 46 PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR A Epot B Temp Time FIGUR 50. Links: Potentielle Energie eines Moleküls in Abhängigkeit seiner Konformation. Das globale Minimum (Potentialtopf rechts) ist von dem lokalen Minimum, in dem sich die aktuelle Konfiguration zur Zeit x während der Simulation befindet, durch eine Energiebarriere getrennt. Rechts: Temperatur versus Zeit MD-Simulation mit simulated annealing Protokoll: Zu Beginn der Simulation wird das System aufgeheizt (Zufügen von kinetischer Energie), um zu verhindern, dass die Konformation der Moleküle in lokalen Minima steckenbleibt. Hohe potentielle Energien weisen darauf hin, dass die NMR-Daten nicht konsistent in eine sinnvolle Struktur umgesetzt werden konnten ohne z.B. van der Waals Verletzungen zu generieren oder alle oberen Distanzlimite einzuhalten. Mehrere Gründe können dafür verantwortlich sein: die Kalibrierung (Volumenintensität im NOESY vs. Distanz) kann zu eng angezogen sein. Letzteres würde sich in einer grossen Zahl an Distanzverletzungen äussern. Es können aber auch einzelne NOESYKreuzpeaks falsch zugeordnet sein. Dies muss im einzelnen für jede Distanzverletzung unter Konsultation der Spektren überprüft werden. Da die Rechungen mit z.B. 50 zufällig erzeugten Startkonformationen durchgeführt werden, geben die daraus resultierenden 50 Endkonformationen ein Bild darüber, wie genau die Faltung durch die Distanzeinschränkungen definiert sind. Ist der rmsd des Ensembles der resultierenden Strukturen gross, so ist die Kette schlecht definiert: FIGUR 51. Links: Backbone Darstellung der Ueberlagerung der 25 berechneten Strukturen des Prion Proteins . Mitte: Spline Darstellung durch die Ca Kette. Rechts: Schematische Darstellung der MeanStruktur. Dies ist meist der Fall in flexiblen Loops (dann gibt es auch weniger NOEs). Es kann aber auch ein Samplingproblem (C- und N- Terminus sowie Oberflächenprotonen) 47 PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR sein. Je mehr voneinander unabhängige Distanzeinschränkungen aus den NOE-Daten abgeleitet werden können, desto höher wird die Auflösung der Struktur sein. Ist einmal der globale Fold der Hauptkette bekannt, können oft weitere NOEs, die auf long-range Interaktionen zurückzuführen sind (kurze Distanzen zwischen Protonen, die in der Primärsequenz weit voneinander entfernt sind), eindeutig zugeordnet werden und damit in der nächsten Runde der Rechnung helfen, die Positionierungen weiter zu verfeinern und den globalen rmsd zu senken. Automatisches Assignment von NOEKreuzpeaks ist in der neusten Version von DYANA für diesen Schritt der Strukturrechnung bereits implementiert. Eine letzte Bemerkung zur stereospezifischen Zuordnung der beiden geminalen Protonen von Methylengruppen: Die oben vorgestellte Standardmethode zur Zuordnung der Resonanzfrequenzen in Proteinen erlaubt es nicht, die beiden diastereotopen Substitutenten eines prochiralen Zentrums, z.B. die beiden Protonen einer Methylengruppe oder die Isopropylgruppen von Valin oder Leucin zu unterscheiden und stereospezifisch zuzuordnen. Im Zuge der Resonanzzuordnung wird die Zuordnung willkürlich gemacht - z.B. wird das β-Proton mit der höheren Resonanzfrequenz oft als HB2, das mit tieferen Frequenz HB3 genannt. DYANA probiert im Verlaufe der Strukturrechnung beide Zuordnungsmöglichkeiten aus. Eine eindeutige stereospezifische Zuordnung erfolgt, falls nur für eine der beiden Möglichkeiten erlaubte Konformationen gefunden werden, d.h., wenn die gefundenen NOEs und die Kopplungskonstanten nur mit einer stereospezifischen Zuordnungsvariante kompatibel sind. Generell kann gesagt werden, dass nur bei grossen Unterschieden in NOE-Intensitäten zu benachbarten Protonen oder grossen Unterschieden in den Kopplungskonstanten eine eindeutige Zuordnung erwartet werden kann. 7. QUALTITÄTSBEURTEILUNG DER BERECHNETEN STRUKTUR • Anzahl zugeordneter Resonanzen • Anzahl unabhängiger oberer Distanzlimiten (in gut definierten Strukturen > 20 / ASRest!) • Wert der Target-Funktion=Mass für die nicht weiter reduzierbare potentielle Energie der berechneten Struktur (ist niedrig in konsistenten Konformationen) • Anzahl Distanzverletzungen • Torsionswinkelverteilung im Ramachandran-Plot 48 PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR • RMSD (backbone/heavy atoms) = root mean square deviation/Wurzel aus den quadrierten Differenzen von der Durchschnittstruktur ist in gut definierten Strukturen < 0.5A für die Hauptkette und < 1 A für die Seitenkette Beispiel: human prion protein TABELLE 52. Collection of the input for the structure calculation and characterization of the energy-minimized NMR structures of the polypeptide segment 121-230 in different human PrP constructs Quantity* hPrP(23-230) hPrP(90-230) hPrP(121-230) -------------------------------------------------------------------------NOE upper distance limits 1,732 1,705 1,752 429 453 436 Dihedral angle constraints Residual target function, value, Å2 0.25 ± 0.06 0.34 ± 0.08 0.39 ± 0.05 Residual distance constraint violations, Number [>= ] 0.1, Å 0.3 ± 0.5 0.7 ± 0.9 0.1 ± 0.3 0.10 ± 0.01 0.11 ± 0.01 0.10 ± 0.00 1.8 ± 1.0 1.5 ± 1.0 5.6 ± 2.0 2.9 ± 0.8 3.0 ± 1.2 3.7 ± 0.9 [-]4824 ± 85 [-]4533 ± 79 [-]4698 ± 83 Maximum, Å Residual dihedral angle constraint violations Number [>= ] 2.0 degrees Maximum, degrees AMBER energies, kcal/mol Total Van der Waals [-]352 ± 16 [-]315 ± 15 [-]325 ± 16 Electrostatic [-]5398 ± 84 [-]5164 ± 71 [-]5283 ± 67 rms deviation from ideal geometry Bond lengths, Å Bond angles, degrees 0.0084 ± 0.0002 0.0089 ± 0.0002 0.0084 ± 0.0003 2.25 ± 0.04 2.41 ± 0.04 2.29 ± 0.04 0.65 ± 0.10 0.79 ± 0.11 0.81 ± 0.11 1.06 ± 0.09 1.27 ± 0.10 1.26 ± 0.13 0.51 ± 0.12 0.60 ± 0.12 0.68 ± 0.13 rms deviation to the averaged coordinates, Å N, C[alpha ], C' (125-228) All heavy atoms (125-228) N, C[alpha ], C' of regular secondary structures † * Except for the top two entries, the data characterize the group of 20 conformers that is used to represent the NMR structure; the mean value and the standard deviation are given. † Secondary structure elements are formed by residues 128-131 ([beta ]-strand 1), 144-154 ([alpha ]-helix 1), 161164 ([beta ]-strand 2), 173-194 ([alpha ]-helix 2), and 200-228 ([alpha ]-helix 3). 49 PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR 8. LITERATUR • Kurt Wuethrich: NMR of Proteins and Nucleic Acids, Wiley 1986 • John Cavanagh, Wayne J. Fairbrother, Arthur G. Palmer III, Nicholas J. Skelton: Protein NMR Spectroscopy Principles and Practice, Academic Press 1996 • NMR of Macromolecules - A practical approach, Oxford University Press 1993 • Ad Bax: Two-Dimensional NMR and Protein Structure, Annu. Rev. Biochem. 1989. 58:223-56 • Zahn et al.: NMR solution structure of the human prion protein, PNAS 2000. 97(1): 145-150 9. ANHANG: BEZEICHNUNG AMINOSÄUREN DER PROTONEN DER 20 NATÜRLICHEN FIGUR 53. Seitenketten aromatischer Spinsysteme 50 PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR TABELLE 54. Aminosäuren mit charakteristischen Spinsystempatterns im TOCSY 51 PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR TABELLE 55. Typ-J Spinsysteme TABELLE 56. Typ-U Spinsysteme 52