phar. chemie: protein strukturen und nmr - ETH E

Werbung
Pharmazeutische Chemie
PROTEINSTRUKTUREN UND NMR SPEKTROSKOPIE
Reto Bader
Mirjam Lerch
Dr.Oliver Zerbe
Department Angewandte Biowissenschaften
Institut für Pharmazeutische Wissenschaften
Sommersemester 2001
1 Peptid und Protein Strukturen .......................................................................................... 2
1.1 Einleitung ........................................................................................................... 2
1.2 Die Aminosäuren:............................................................................................... 2
1.3 Gliederung der Protein Strukturen: .................................................................... 3
1.4 Gefaltete vs. denaturierte Proteine: .................................................................... 4
1.5 Die Sekundärstruktur:......................................................................................... 4
1.6 Helices: ............................................................................................................... 6
1.7 b-Blätter:............................................................................................................. 8
1.8 Reverse Turns:.................................................................................................... 9
1.9 Seitenkettenkonformationen:............................................................................ 11
1.10 Supersekundärstrukturen: ............................................................................... 12
1.11 Kräfte zwischen Atomen in Proteinen: .......................................................... 13
1.12 Elektrostatische Wechselwirkungen: ............................................................. 15
1.13 Wechselwirkungen mit Dipolen:.................................................................... 15
1.14 Wasserstoffbrücken: ....................................................................................... 17
1.15 Methoden zur Strukturbestimmung:............................................................... 18
1.16 Dynamik von Proteinen:................................................................................. 21
1.17 Informationen über Proteine auf dem Web (aus Branden and Tooze):.......... 22
1.18 Literatur: ......................................................................................................... 22
2 Einleitung zur Strukturbestimmung mit NMR ............................................................... 23
3 Sample-Vorbereitung ..................................................................................................... 23
4 Spektren-Aufnahme ....................................................................................................... 25
4.1 [1H,1H]-COSY:[1H,1H]-Correlated Spectroscopy.......................................... 28
4.2 [1H,1H]-TOCSY: Total Correlation Spectroscopy ........................................... 31
4.3 [1H,1H]-NOESY: Nuclear Overhauser Effect Spectroscopy ........................... 32
5 Strategie zur Resonanzfrequenz-Zuordnung für kleine, nicht-markierte Proteine ........ 35
5.1 Beurteilung der Spektrenqualität...................................................................... 35
5.2 Spinsystem-Identifikation: NH-aH-bH-... ........................................................ 35
5.3 Sequenz-spezifische Zuordnung....................................................................... 38
6 Strukturrechnung mit NMR-Daten ................................................................................ 40
6.1 Chemische Shifts .............................................................................................. 40
6.2 3JHN-aH-Kopplungskonstanten ......................................................................... 40
7 Qualtitätsbeurteilung der berechneten Struktur ............................................................. 47
8 Literatur ........................................................................................................................ 49
9 Anhang: Bezeichnung der Protonen der 20 natürlichen Aminosäuren ........................ 49
1
PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR
1. PEPTID UND PROTEIN STRUKTUREN
1.1 Einleitung:
Die drei-dimensionale Struktur von Peptiden und Proteinen ist sehr eng mit ihrer biologischen Aktivität verknüpft. Um den Wirkmechanismus von Enzymen zu verstehen ist
eine genaue Kenntnis der 3D Anordnung der Atome der Polypeptidkette nötig. Ferner
ist im Bereich der Molekularen Modellierung von Wirkstoffen strukturelle Information
unentbehrlich. Leider ist es bisher noch nicht gelungen, die Primärsequenz von Proteinen in die 3D Struktur zu übersetzen (das sogenannte Faltungsproblem). Das erscheint
auf den ersten Blick erstaunlich, sind doch die Kräfte, die zwischen den Atomen wirken,
seit langem bekannt und berechenbar. Wenn man aber bedenkt, dass gefaltete Proteine
nur um 5-10 kcal pro mol gegenüber dem ungefalteten Zustand stabilisiert sind, ein Energiebetrag, der ungefähr einer einzigen Wasserstoffbrücke entspricht, wird klar, dass
es einer enormen Präzession bedarf, um die relative Stabilität von Konformeren abzuschätzen. Die geringe Stabilisierung des gefalteten gegenüber dem ungefalteten Zustand
hat im wesentlichen 3 Gründe: a) die Funktion der Protein erfordert eine Flexibilität
(z.B. für induced-fit Wechselwirkungen). b) es sollten während der Proteinfaltung keine
falsch-gefalteten Intermediate mit niedriger Energie entstehen können. c) Eine Entfaltung des Proteins ist für die Translokation durch die Membran nötig. Die erfolgreichsten
Strukturvorhersagen sind derzeit dann möglich, wenn eine hohe Sequenzhomologie
(>40%) zu einem bekannten Protein vorliegt. Dazu muss aber auch aber auch das Hydrophobizitätsprofil, d.h. die Abfolge von hydrophilen und hydrophoben Aminosäuren,
sehr ähnlich sein.
1.2 Die Aminosäuren:
Es gibt 20 proteinogene Aminosäuren, die in von Eukaryonten exprimierten Proteinen
vorkommen. Diese unterscheiden sich in der Seitenkette. Die Aminosäuren werden aufTABELLE 1.
AS
Hydropath
AS
Hydropath
AS
Hydropath
AS
Hydropath
Ile
Val
4.5
4.2
Met
Ala
1.9
1.8
Trp
Tyr
-0.9
-1.3
Gln
Asp
-3.5
-3.5
Leu
Phe
Cys
3.8
2.8
2.5
Gly
Thr
Ser
-0.4
-0.7
-0.8
Pro
His
Glu
-1.6
-3.2
-3.5
Asn
Lys
Arg
-3.5
-3.9
-4.5
2
PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR
grund der Hydrophilie/Lipophilie ihrer Seitenketten grob klassifiziert. Es ist in diesem
Zusammenhang aber von Bedeutung zu erkennen, das die Hydrophilie einer Seitenkette
stark von ihrem Ladungszustand abhängt, wobei die ionisierten Seitenketten sehr viel
hydrophiler sind. Peptide/Proteine am pH in der Nähe ihres pI sind daher am schlechtesten löslich. Eine Übersicht über die kovalente Struktur und den pK der proteinogenen
Aminosäuren befindet sich im Anhang.1
Aminosäuren sind chiral am Cα. Der Cahn-Ingold-Prelog Nomenklatur folgend liegen
alle proteinogenen Aminosäuren in der (S) Form vor, mit Ausnahme von Cys (R). Gly
und Pro haben eine Sonderstellung. Gly hat keine Seitenkette (2 α-H Atome) und Pro
kein Amidproton (ringförmige Seitenkette). Somit ist für Gly der Bereich erlaubter
Seitenkettenkonformationen größer und für Pro ist deren Bereich sehr viel
eingeschränkter als bei den anderen Resten.
Die Peptidbindung hat einen partiellen Doppelbindungscharakter, weswegen der Dihedralwinkel um die Amidbindung 0 oder 180° ist. Für alle Peptidbindungen Xxx-Aaa mit
Aaa ungleich Pro ist die trans Konformation sehr viel günstiger (weniger sterische Probleme). In unstrukturierten Peptiden wird für die Xxx-Pro Amidbindung dagegen häufig
ein gewisser Anteil cis (bis zu 30%) beobachtet. In globulär gefalteten Proteine kommen
dagegen durchaus, wenn auch relativ selten, cis Amidbindungen vor.
1.3 Gliederung der Protein Strukturen:
Man unterscheidet bei der Beschreibung der Struktur die
• Primärstruktur, d.h. die Abfolge der Aminosäuren
• die Sekundärstruktur, d.h. die Nahordnung der Polypeptidkette (z.B. Helix, β-Blatt)
• die Tertiärstruktur, die beschreibt, wie die Sekundärstrukturelemente zueinander
angeordnet sind und damit einzelne Domänen bilden. Eine Domäne ist ein Teil der
Proteinkette, der sich unabhängig vom Rest des Proteins faltet (d.h. eine wohl-definierte Struktur einnimmt). Häufig kodieren Exons für Domänen von Proteinen. Eine
Domäne ist auch häufig von der Funktion autark, d.h. eine biologische Funktion
wird ausschließlich von einer bestimmten Domäne ausgeübt während eine andere
z.B. für die Bindung an einem bestimmten Rezeptor verantwortlich ist.
• Häufig sind Proteine als Multimere aufgebaut. Die Packung der Monomereinheiten
zueinander wird durch die Quartärstruktur beschrieben.
1. Die pK Werte der einzelnen Aminosäuren hängen stark von der Umgebung im Protein ab (sog.
pK Shifts)
3
PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR
1.4 Gefaltete vs. denaturierte Proteine:
Korrekt gefaltete Proteine zeichnen sich dadurch aus, dass die Polypeptidkette eine
wohl-definierte Struktur einnimmt. Speziell die Backbone Dihedralwinkel regulärer
Sekundärstrukturelemente nehmen ausgezeichnete Werte ein. Korrekt gefaltete Proteine zeichnen sich in der Regel durch einen relativ scharf definierten Temperaturbereich aus, im dem die Struktur verloren geht. Dies lässt sich relativ gut im CD Spektrum
verfolgen. Einen Übergang zwischen völlig ungefalteten Polypeptiden und globulären
Proteinen bilden die sogenannten “Molten Globules”. Die “Molten Globules” werden
als Zwischenstufe bei der Proteinfaltung interpretiert. Sie zeichen sich durch ein Nebeneinander von gefalteten und ungefalteten Bereichen aus. “Molten Globules” lassen
sich aus globulären Proteinen durch Zugabe von denaturierenden Stoffen teilweise
erzeugen.
Die globulären Proteine zeichen sich durch eine Reihe von Eigenschaften aus:
• die hydrophoben Reste befinden sich meist im Inneren (dem sogenannten “Core”)
• hydrophile Reste sind eher an der Oberfläche anzutreffen
• die Seitenketten im Core sind sehr dicht gepackt
• φ,ψ Dihedralwinkel sind in den Ramachandran-erlaubten Bereichen.
• Der hydrodynamische Radius ist kleiner als bei ungefalteten Proteinen gleicher
Größe
Wird ein globuläres Protein durch Zugabe von Guanidiniumhydrochlorid oder durch
Erhitzen denaturiert, so werden hydrophobe Reste dem Wasser exponiert, weswegen
denaturierte Proteine in reinem Wasser meist unlöslich sind. Proteine falten sich in
Abwesenheit anderer Proteine. Kürzlich wurden aber Hilfsmoleküle, sogenannte Chaperone, entdeckt, die bei der Faltung helfen, indem sie helfen, dass falsch-gefaltete Intermediate sich wieder entfalten. Bislang gilt auch immer noch das Dogma, das es eine
eindeutige Faltung gibt, d.h. das ein und das gleiche Protein in einer bestimmten
Lösungsumgebung immer in einer einzigen (der gleichen) Konformation vorliegt.
1.5 Die Sekundärstruktur:
Die Sekundärstruktur wird durch die Faltung des Proteinrückgrades (Backbone), welches durch den Amidstickstoff, das C-alpha und den Carbonyl-Kohlenstoff gebildet wird,
beschrieben.Es werden die folgenden Elemente in Proteinstrukturen angetroffen:
• Helices
• β-Stränge/Blätter
4
PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR
• Turns
daneben gibt es längere Loops, die nicht gut-definierte Backbone Konformationen besitzen und auch häufig flexibler sind. Disulfidbrücken, die zwischen Cystein Resten gebildet werden, stabilisieren Sekundärstrukturelemente, haben aber auch einen grossen
Einfluss auf die Tertiärstruktur, da sie die Fernordnung beeinflussen.
Diese Sekundärstrukturen lassen sich über die entsprechenden Dihedralwinkel beschrieben. Sie sind nach IUPAC-IUB Regeln wie folgt definiert :
ωi
= 0
for Ciα − Ci' cis to N i +1 − Ciα+1
ψi
= 0
for Ciα − N i trans to Ci' − Oi
φi
= 0
for Ciα − Ci' trans to N i − Hi
χ i1 = 0
for Ciα − N i cis to Ciβ − Oiγ
FIGUR 2. Definition der Backbone Diederwinkel nach IUPAC
Die Sekundärstrukturelemente lassen sich über die entsprechenden φ,ψ Dihedralwinkel
wie folgt definieren:
antiparalleles β-Blatt
paralleles βBlatt
φ
ψ
ω
Anzahl
Reste/
Turn
Ausdehnung
der Kette/
Rest (Å)
-139°
135°
-178°
2.0
3.4
-119°
113°
180°
2.0
3.2
TABELLE 3. Definitionen der Dihedralwinkel in Sekundärstrukturelementen
5
PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR
φ
ψ
ω
Anzahl
Reste/
Turn
Ausdehnung
der Kette/
Rest (Å)
α-Helix
310-Helix
-57°
-49°
-47°
-26°
180°
180°
3.6
3.0
1.5
2.0
π-Helix
PolyprolineI
PolyprolineII
PolyprolineIII
-57°
-83°
-78°
-70°
158°
149°
180°
0°
180°
4.4
3.3
3.0
1.15
1.9
3.12
-80°
150°
180°
3.0
3.1
TABELLE 3. Definitionen der Dihedralwinkel in Sekundärstrukturelementen
1.6 Helices:
Die α-Helix hat 3.6 Reste per Helix Windung. Korrespondierende Atome benachbarter
Helixwindungen sind 5.4 Å entfernt. Die α-Helix wird durch Wasserstoffbrücken, die
zwischen dem Carbonylatom des Restes i und dem Amidproton des Restes i+4 gebildet
wird, stabilisiert.
FIGUR 4. Fig: Links: Schematische Darstellung der Helix. Mitte: Backbone Darstellung mit Angabe
der Richtung des Dipolmomentes. Rechts: Struktur des 434 Repressors.
Die planare Anordnung der Amidbindung bedingt ein Dipolmoment. Da in der α-Helix
alle Wasserstoffbrücken gleichgerichtet sind, addieren sich alle Dipolmoment einer einzelnen Helix, so dass das Gesamtdipolmoment für n Reste n*3.5 Debye beträgt. Dies
entspricht in etwa 0.5-0.7 positiven bzw. negativen Ladungen am N-oder C-Terminus,
6
PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR
respektive. Deshalb sind negative geladene Aminosäure häufig vor einer Helix und positiv geladene häufig hinter einer Helix anzutreffen. Da der Ladungszustand der Aminosäuren vom pH abhängt, ist die Stabilität der Helix mit dem pH korreliert.
Normalerweise ist der Helixdrehsinn rechtsgängig. Viele Helices sind amphiphatisch,
d.h. die Reste sind derart angeordnet, dass die Seitenketten der polaren und unpolaren
Gruppen zu verschiedenen Seiten der Helix zeigen. Die verschiedenen Aminosäuren haben unterschiedliche Neigungen, bestimmte Sekundärstrukturelemente auszubilden.
Dies wurde statistisch zuerst von Chou und Fasman untersucht (“Chou-Fasman
Regeln”). Für α-Helices sind folgende Werte kürzlich bestimmt worden:
AS
Relative
Stabilisierung
(kcal/mol)
AS
Relative
Stabilisierun
g (kcal/mol)
Ala
Arg
Lys
Leu
Met
Trp
Phe
-0.77
-0.68
-0.65
-0.62
-0.50
-0.45
-0.41
Ser
Gln
Glu
Cys
Ile
Tyr
Asp
-0.35
-0.33
-0.27
-0.23
-0.23s
-0.17
-0.15
AS
Relative
Stabilisierung
(kcal/mol)
Val
Thr
Asn
His
Gly
Pro
-0.14
-0.11
-0.07
-0.06
0
3
TABELLE 5. Relative Stabilisierungsenergien der einzelnen Aminosäuren in Helices
Es gibt noch zwei weitere
Formen der Helix: die 310Helix und die π-Helix. Die
310-Helix hat 3 Reste pro
Windung, die π-Helix 4.4.
Wasserstoffbrücken werden
in diesen beiden Formen
zwischen Carbonyl-sauerstoffen der Reste i und Amidprotonen der Reste i+3 bzw.
i+5 gebildet. Damit ist der
Durchmesser der 310-Helix
kleiner und der der π-Helix
FIGUR 6. Oben VerschiedeneWasserstoffbrückenpositionen.
Unten: Abhängigkeit des Durchmessers vom Helix Typ.
7
größer als in der α-Helix
PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR
Die ersten 3 Amidprotonen bzw. die letzten 3 Carbonyl Sauerstoffe einer Helix haben keine H-Brücken
Partner. Man findet deshalb in Helices häufig sogenannte N- bzw- C- Capping Reste. Diese bilden über
ihre Seitenkettenfunktionen (z.B. über die β-Hydroxylgruppe von Ser) Wasserstoffbrücken zu den entsprechenden Atomen und stabilisieren so die Helix. Beim
Proteindesign hilft das Einfügung von geeigneten Cbzw. N-Caps, die Helix zu stabilisieren.
Wie bereits erwähnt, hat die Helix ein Dipolmoment,
das am N-Terminus in etwa einer halben positiven und
am C-Terminus einer halben negativen Ladung
entspricht. Das Einfügen geladener Aminosäuren am
FIGUR 7. Helix N-Cap. Das
. OH von Ser bildet H-Brücke
C- oder N- Cap hilft ebenfalls, die Helix zu stabilisieren.
1.7 β-Blätter:
Grundlegende Einheit der β-Blätter ist der β-Strang, der eine gestreckte Konformation
der Polypeptidkette darstellt. Der isolierte β-Strang ist nicht stabil, wird aber durch die
Aneinanderreihung benachbarter β-Stränge zum sogenannten β-Faltblatt stabilisiert.
Dabei gibt es zwei verschiedene Anordnungen der β-Stränge zueinander:
• die Kopf-Schwanz Anordnung, die zum antiparallelen Faltblatt führt:
FIGUR 8. Fig: Links: Antiparalleles Faltblatt. Mitte: Ball-and-Stick Darstellung. Rechts:
Seitenansicht.
8
PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR
• die Kopf-Kopf Anordnung, die zum parallelen Faltblatt führt:
FIGUR 9. Fig: Links:Paralleles Faltblatt. Mitte: Ball-and-Stick Darstellung. Rechts: Seitenansicht.
In β-Faltblättern sind die Seitenketten abwechselnd oberhalb und unterhalb der Ebene
des Faltblattes angeordnet. Dabei kommen sich die Seitenketten gegenüberliegender
Stränge relativ nahe. Die meisten der in natürlichen Polypeptiden beobachteten β-Faltblätter sind nicht vollständig planar sondern weisen eine rechtsgängige Verdrillung auf.
1.8 Reverse Turns:
Reverse Turns spielen eine wichtige Rolle in Proteinstrukturen. Sie bewirken, dass die Polypeptidkette ihre
Richtung ändert und sind deshalb bevorzugt an der
Oberfläche von Proteinen anzutreffen. Turns werden
ebenfalls über Wasserstoffbrücken stabilisiert.In sogenannten γ-turns werden H-Brücken zwischen dem
Carbonylsauerstoff des Restes i und dem Amidproton
des Restes i+2 gebildet.
β-Turns zeichen sich durch Wasserstoffbrücken zwischen dem Carbonylsauerstoff des Restes i und dem
Amidproton des Restes i+3 aus. Es gibt eine Vielzahl
verschiedener β-Turns, von denen diejenigen vom
Typ I und II am häufigsten angetroffen werden.
Eine wichtige Eigneschaft von Turns ist, dass immer
wieder ähnliche Reste an bestimmten Positionen der
FIGUR 10. :Oben: γ-Turn.
Unten: inverser γ-Turn.
Turns angetroffen werden. Gly ist besonders deshalb
9
PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR
prädestiniert, weil es wegen der fehlenden Seitenkette ungewöhnliche φ,ψ Kombinationen einnehmen kann. Ebenfalls häufig angetroffen wird Pro oder Asn
Position
Typ I
Typ I’
Typ II
Typ II’
i
Asp,Asn,Ser,Cy
s
Pro
kein Pro
Gly
Asp,Asn,Ser,Cy
s
Gly
Gly
Asp,Asn,Ser,Cy
s
Pro
Gly, Asn
Gly
Asp,Asn,Ser,Cy
s
Gly
i+1
i+2
i+3
TABELLE 11. Bevorzugte Aminosäuren in Turns
Die wichtigsten Turns sind wie folgt definiert:
I’
II’
FIGUR 12. : Turns mit den dazugehörigen Backbonedihedralwinkeln.
Die oben bereits erwähnten Chou Fasman Regeln erlauben eine Abschätzung der Wahrscheinlichkeiten, dass eine bestimmte Sequenz eine der Sekundärstrukturen einnimmt.
Folgende Kriterien gelten als Hinweise auf helikale Strukturen:
• innerhalb eines Hexapeptides 4 Reste mit P(Helix)>1.12
• der Durchschnitt für alle Reste <P(Helix)> 1.03
• <P(α)> > <P(β)>
• und für β-Blätter
• Pentapeptid mit mindestens drei Reste mit P(b-Strang) >1.19
10
PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR
• der Durchschnitt für alle Reste <P(β-Blatt)> 1.05
• <P(β)> > <P(α)>
Das betreffende Sekundärelement läuft um jeweils umn einen Rest weiter, solange der
Durchschnitt der Wahrscheinlichkeit des terminalen Tetrapeptides nicht unter 1.0 fällt. :
AS
α-Helix
βStrang
Turn
AS
α-Helix
βStrang
Turn
Glu
Ala
Leu
Met
Gln
Lys
Arg
His
Val
Ile
1.59
1.41
1.34
1.30
1.27
1.23
1.21
1.05
0.90
1.09
0.52
0.72
1.22
1.14
0.98
0.69
0.84
0.80
1.87
1.67
1.01
0.82
0.57
0.52
0.84
1.07
0.90
0.81
0.41
0.47
Tyr
Cys
Trp
Phe
Thr
Gly
Asn
Pro
Ser
Asp
0.74
0.66
1.02
1.16
0.76
0.43
0.76
0.34
0.57
0.99
1.45
1.40
1.35
1.33
1.17
0.58
0.48
0.31
0.96
0.39
0.76
0.54
0.65
0.59
0.90
1.77
1.34
1.32
1.22
1.24
TABELLE 13. Propensitäten der einzelnen Aminosäuren für Sekundärstrukturelemente.
1.9 Seitenkettenkonformationen:
Die Seitenkettenkonformationen werden über die Dihedralwinkel χ1 (Cα-Cβ), χ2 (CβCγ) etc. beschrieben. Aus sterischen Gründen nehmen die Seitenketten bevorzugt gestaffelte anstatt ekliptische Konformationen ein. Globuläre Proteine zeichen sich auch
dadurch aus, dass die Seitenketten definierte Winkel einnehmen, obwohl es in den flexibleren Loops teilweise auch Übergänge zwischen verschiedenen Rotameren geben
kann.
FIGUR 14. Darstellungen der Seitenkettenkonformationen. Links: Ekliptisch. Rechts: Gestaffelt.
11
PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR
1.10 Supersekundärstrukturen:
Es gibt eine Anzahl von Anordnungen, in denen Sekundärstrukturelemente gegeneinander gepackt sein können:
FIGUR 15. Supersekundärstrukturelemente
Ein bekanntes Motiv ist das Helix-Turn-Helix Motiv. Es wird z.B. bei den DNA bindenden Proteinen (434 Repressor) oder bei Calcium-bindenden Proteinen (Calbindin)
angetroffen. Wie der Name besagt, werden darin zwei Helices über einen Loop
verknüpft.
Das β-Hairpin Motiv ist eine einfache Anordnung, um 2 antiparallele β-Stränge über
einen kurzen Turn miteinander zu verknüpfen.Überhaupt besitzen Proteine die starke
Tendenz, β-Stränge so miteinander zu verknüpfen, dass solche Stränge miteinander
verknüpft werden, deren Aminosäuren in der Primärsequenz benachbart sind.
Im β−α−β Motiv werden 2 parallele β-Stränge über einen kurzen Loop, dann eine Helix, und dann wieder einen kurzen Loop miteinander verknüpft.
Im Greek-Key Motiv werden 4 antiparallele β-Stränge in charakteristischer Art und
Weise über Loops miteinander verknüpft. Dieses Motiv hat seinen Namen von den
Verzierungen, die auf antiken griechischen Vasen gefunden worden.
12
PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR
1.11 Kräfte zwischen Atomen in Proteinen:
Es gibt eine Reihe von interatomaren
Kräften, die die Faltung des Proteins beeinflussen. Derartige Kräfte können anziehender oder abstossender Natur sein. Vom
Mechanismus her können sie elektronischer
Natur wie z.B. die Wechselwirkung zwischen geladenen Atomen oder sterischer Natur sein. Man unterscheidet die starken
Wechselwirkungen, wie z.B. die kovalenten
Bindungen sowie die schwachen Wechselwirkungen:
FIGUR 16. Grösse wichtiger
Die schwachen Wechselwirkungen haben
eine unterschiedliche Abhängigkeit vom
Abstand der wechselwirkenden Atome:
Typ der Wechselwirkung
Abstandsabhängigkeit
Ladung-Ladung
Ladung-Dipol
1/r
1/r2
perm. Dipol - perm. Dipol
1/r3
Ladung - induz. Dipol
1/r4
induz. Dipol - induz. Dipol
1/r6
TABELLE 17. Abstandsabhängigkeit der Wechselwirkungen
Die sterischen Wechselwirkungen treten immer dann auf, wenn der Abstand zweier
Atome d kleiner als die Summe der van-der-Waals Radien (ra/2+rb/2) ist
FIGUR 18.
13
PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR
Der van-der-Waals Radius für die am häufigsten angetroffenen Atome ist in der folgenden Tabelle angegeben:
Atom
beobachteter Bereich
Radius bei
Einfachbindungen
Wasserstoff
Sauerstoff
Stickstoff
Kohlenstoff
Schwefel
1.00-1.54 Å
1.40-1.70 Å
1.55-1.60 Å
1.70-1.78 Å
1.75-1.80 Å
1.17 Å
1.40 Å
1.55 Å
1.75 Å
1.80 Å
TABELLE 19.
Atome, die van der Waals Anziehungskräfte erfahren, sind ungefähr 0.8 Å weiter voneinander entfernt, als wenn sie kovalent gebunden wären.
Die sterische Abstossung zwischen Atomen schränkt die Kombination der ψ,φ Bindungswinkel stark ein. Dies wurde von Ramachandran berechnet (“Hard-Sphere” Model):
FIGUR 20. Fig: Ramachandran Plot
Wie aus dem Ramachandran Plot ersichtlich ist, sind nur bestimmte Kombinationen
sterisch erlaubt. Zudem sind die verschiedenen Sekundärstrukturelemente auf bestimmte Ramachandran Regionen beschränkt. Glycin Reste, die keine Seitenkette haben,
können noch andere Kombinationen einnehmen.
14
PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR
1.12 Elektrostatische Wechselwirkungen:
Die elektrostatischen Wechselwirkungen sind stark und weitreichend. Sie werden nach
dem Coulombschen Gesetz beschrieben durch:
2
Z AZ Bε
∆E = -------------------r AB
In Lösung ist die Wechselwirkung um die Dielektrische Konstante D herabgesetzt:
2
Z AZ Bε
∆E = -------------------D r AB
Solche Wechselwirkung treten in Proteinen zwischen geladenen Gruppen auf. Ein
Beispiel ist z.B. die anziehende Wechselwirkung zwischen einer Aspartat CO2- Gruppe
und einer NH3+ Lysin Seitenkettenfunktion, die zu einer sogenannten Salzbrücke führt.
Bei der Berechnung der stabilisierenden Wirkung ist allerdings zu bedenken, dass
solche Gruppen im ungefalteten Zustand solvatisiert vorliegen.
1.13 Wechselwirkungen mit Dipolen:
Die Amidbindung hat Doppelbindungscharakter. Dies ist der Grund, warum der Dihedralwinkel ω auf 0° (cis) oder 180° (trans) beschränkt ist. Zudem ist aus den mesomeren
Grenzstrukturen erkenntlich, dass es ein Dipolmoment geben sollte:
FIGUR 21. Fig: Links: Resonanzformel der Peptidbindung. Rechts: Partialladungen.
Das Dipolmoment der Amidbindung ist 3.5 Debye (Wasser hat 1.85 zum Vergleich).
15
PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR
Aromatische Ringe haben ebenfalls ein Dipolmoment, weswegen sie zueinander bevorzugte Konformationen einnehmen:
δ+
H
δ+
H
H
δ+
H
δ+
δ−
H
δ+
H δ+
FIGUR 22. Partialladungen in aromatischen Systemen und deren relative Orientierung
Dipolmomente können permanent oder induziert sein. Die Wechselwirkungsenergie
zwischen permanenten Dipolen ist proportional r-3.
Die Wechselwirkungen mit induzierten Dipolmomenten werden van-der Waals Wechselwirkungen genannt und sind proportional r-6. Bei hydrophoben Gruppen spielen die
sogenannten London Dispersionskräfte eine wichtige Rolle.
Sie entstehen zwischen 2 Gruppen, die
beide kein permanentes Dipolmoment haben, und sind auf die zeitlich asymmetrische
Ladungsverteilung der Elektronen zurückzuführen. Van-der Waals Kräfte werden
häufig in Form des Lennard-Jones Potentiales ausgedrückt:
Cn C 6
- – ------E ( d ) = -----dn d 6
Cn und C6 sind Konstanten, wobei der erste
Term der Gleichung die Abstossung, die aus
dem Verbot der Überlappung der Elektronenorbitale resultiert, beschreibt. Meist
FIGUR 23. Lenard-Jones Potential
verwendet man für diese Term n=12. Der
zweite Term ist anziehend und wird durch die induzierten Dipolmomente hervorgerufen.
16
PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR
1.14 Wasserstoffbrücken:
Wasserstoffbrücken spielen eine
herausragende Rolle in der Ausformung von Sekundärstrukturelementen. Sie treten immer
dann auf, wenn zwei elektronegative Atome um die Bindung zu
einem Wasserstoffatom konkurrieren. α-Helices werden durch
die
Ausbildung
Wasserstoffbrücken
von
zwischen
Amidprotonen der Reste i und
Carbonlysauerstoffen der Reste
i+3 stabilisiert. β-Blätter weisen
ebenfalls
Wasserstoffbrücken
zwischen Amidprotonen und
Carbonylsauerstoffen
benach-
barter Stränge auf. In diesen
FIGUR 24. Fig.: Abstände in
Wasserstoffbrücken.
Wasserstoffbrücken ist der O..H
Abstand 1.9-2.0 Å. Normaler-
weise ist das Proton kovalent an ein anderes Atom gebunden, den sogenannten Donor.
Der Abstand zum Akzeptor, mit dem es ebenfalls wechselwirkt, ist aber kleiner als die
Summe der van der Waals Radien, was auf einen partiellen Bindungscharakter hindeutet. Je stärker die Wasserstoffbrücke, desto kleiner ist der Atomabstand zum Akzeptor.
In den stärksten H-Brücken, den symmetrischen H-Brücken, ist der Abstand zum
Akzeptor gleich groß wie der Abstand zum Donor. Die Länge und damit die Stärke der
Wasserstoffbrücken hängt von der relativen Elektronegativität von Donor und Akzeptor
ab. Besonders starke H-Brücken werden zu geladenen Atomen gebildet. Sauerstoffatome können zwei Wasserstoffbrücken gleichzeitig ausbilden. Wasserstoffbrücken
stabilisieren das Protein um 2-10 kcal/mol pro gebildeter Brücke. Man muss allerdings
bedenken, dass im denaturierten Protein meistens Wasserstoffbrücken zum
Lösungsmittel Wasser ausgebildet werden, so dass der stabilisierende Einfluss auf die
Proteinfaltung sehr viel geringer ist.
17
PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR
Während der N-H...O Bindungswinkel Ψ meist um 180° beträgt,
bilden die Carbonylbindung und die
Amidbindung nicht eine Achse. Die
Winkel Φ und θ nehmen einen weiteren Bereich ein, dessen häufigste
Werte 60° bzw. 0° sind, respektive:
FIGUR 25. Definition der Winkel in H-Brücke
1.15 Methoden zur Strukturbestimmung:
Bei den Methoden zur Untersuchung der 3-dimensionalen Struktur von Proteinen unterscheidet man zwischen solchen Methoden, die lediglich eine Abschätzung des Gehaltes
an Sekundärstrukturen liefern und solchen, die das Studium der Struktur mit atomarer
Auflösung erlauben. Zu den ersteren gehören die IR und vor allen Dingen die CD Spektroskopie und zu den letzteren die NMR Spektroskopie und die Einkristall-Röntgenbeugung (“X-Ray”).
Die Circulardichroismus (CD)
Methode hilft zu erkennen, ob das
Protein ungefaltet, eher helikal
oder eher β-Blatt artig aufgebaut
ist. Die Methode beruht darauf,
dass die chromophoren Gruppen
in Proteinen mit den beiden Komponenten des zirkular polarisierten
Licht
unterschiedlich
wechselwirken und daher unterschiedlich
absorbiert
werden.
Dies ist immer genau dann der
Fall, wenn optisch-aktive Verbindungen vorliegen. Diese Absorption
ist
abhängig
von
der
Wellenlänge. In regelmässigen
FIGUR 26. Typische CD Kurven für Helices ( α), β-Blatt
(β) und Zufallsknäul(r)
18
Sekundärstrukturelementen kommt es wegen der definierten Anor-
PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR
dnung der Chromophore zueinander zur gegenseitigen Wechselwirkung (“Exciton
Splitting”), die das Ausmass der Absorption und deren Frequenz beeinflusst. CD Spektren brauchen wenig Material und sind schnell aufgenommen und interpretiert. Sie
repräsentieren die Summe aller Sekundärelemente und erlauben keine direkte räumliche
Auflösung. CD Spektren eignen sich sehr gut, um folgende Punkte schnell abzuklären:
• Ist das Protein überhaupt gefaltet?
• Wenn ja, was ist das dominierende Sekundärstrukturelement?
• Bei welcher Temperatur denaturiert das Protein und ist dieser Vorgang reversibel?
• Findet eine konformationelle Aenderung z.B. bei einer Ligandbindung statt?
Die CD Spektren der verschiedenen Sekundärstrukturelemente haben ein charakteristisches Aussehen. Im Prinzip lässt sich ein CD Spektrum mathematisch in die Komponenten von α-Helix, β-Blatt und Random Coil zerlegen und so deren anteiligen Gehalt
bestimmen (Deconvolution).
Die wichtigste Methode zur Bestimmung von Proteinen im Festkörper (neben der jetzt
langsam an Bedeutung gewinnenden Cryo-Elektronenmikroskopie) ist die Röntgenbeugung am Einkristall. Die (Schwer)atome des Kristallgitters beugen den (monochromatischen) Röntgenstrahl in charakteristischer Weise:
FIGUR 27. Fig.: Links: Brechnung des Röntgenstrahls gemäss Braggs Gesetz. Rechts:Resultierendes
Brechungsmuster.
Zwischen den abgelenkten Strahlen kommt es zur konstruktiven und destruktiven Interferenz, so dass am Ende ein charakteristisches Beugungsmuster entsteht. Mit dieser In-
19
PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR
formation kann man dann indirekt eine Rekonstruktion der dreidimensionalen
Elektronendichte vornehmen. Der abgelenkte Strahl wird z.B. auf einer photographischen Platte detektiert, wobei leider die Phaseninformation des Strahls verloren geht.
Dies führt zu einer erheblichen Komplizierung der Interpretation der Daten. In der Protein Kristallographie werden im wesentlichen zwei Methoden angewandt, um trotzdem
die Elektronendichten berechnen zu können:
• bei homologen Strukturen wird das sogenannte Molecular Replacement benutzt, bei
dem ein Model der Struktur, das aus einem Homologen erzeugt wurde, benutzt
wird, um die Elektronendichteverteilung zu berechnen
• es wird eine Reihe von Schweratomderivaten erzeugt (Isomorphous Replacement)
• (Man arbeitet mit Synchrotonstrahlung verschiedener Wellenlänge (Multiwavelength Anomalous Diffraction))
Insbesondere die erstere Methode führt sehr schnell zu gut-aufgelösten Strukturen, lässt
sich aber nur dann anwenden, wenn bereits die Struktur eines Proteins mit hoher Sequenzhomologie bekannt ist. Die Mehrzahl der Proteinstrukturen, die in der pdB Datenbank enthalten sind, sind Kristallstrukturdaten. Die X-Ray Methode misst die Struktur
des Proteins im Festkörper. Obwohl ein Vergleich von NMR und X-Ray Daten in fast
allen Fällen sehr gute Übereinstimmung geliefert hat, kann es an den Kontaktflächen
der Moleküle zu sogenannten Packungsartefakten kommen, d.h. der Verlauf der
Polypeptidkette ist dort durch Packungseffekte bestimmt. Das grösste Problem in der
Röntgenkristallmethode ist es, einen Kristall ausreichender Güte, d.h. sehr hoher Ordnung, zu erhalten. Im Prinzip werden solche Kristalle aus übersättigten Lösungen hoch
aufgereinigter Proteine (>97%) gezüchtet. Ob und wie ein Protein kristallisiert ist aber
immer noch sehr schlecht verstanden. Wenn sehr gute Kristalle erhalten wurden, lassen
sich heute Auflösungen im Bereich von 1Å erhalten, die auch die Lokalisation von
Wasserstoffatomen (sonst nur Schweratome) sowie von Wassermolekülen im Kristall
erlaubt. Ein unbestrittener Vorteil der X-Ray Methode gegenüber der NMR Spektroskopie ist, dass sie auf Proteine beinahe beliebiger Grösse anwendbar ist, sofern sich diese
kristallisieren lassen.
20
PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR
1.16 Dynamik von Proteinen:
Die Polypeptidkette in Proteinen ist nicht überall gleich gut definiert. Besonders an den
C- und N- Termini der Kette wird in der Regel eine grosse Flexibilität beobachtet. Diese
Flexibilität führt dazu, dass die Elektronendichten für diese Reste zu gering sind und
diese sich daher in der Röntgenstrukturanalyse nicht interpretieren lassen (diese Reste
bleiben dann “unsichtbar”). In der NMR Spektroskopie äussert sich die Flexibilität
darin, dass das Strukturbündel, das aus den Strukturrechnungen resultiert, für diese
Reste sehr breit aufgefächert ist (hoher RMSD). In den X-Ray Untersuchungen geben
die sogenannten B-Faktoren einen Hinweis auf die thermische Beweglichkeit der einzelnen Atome, d.h. hohe B-Faktoren bedeuten, dass diese Atome schlechter definiert
sind. Die NMR Spektroskopie erlaubt über Relaxationsmessungen (z.B.
15N
Relax-
ation) direkt das Ausmass der Beweglichkeit sowie, im Gegensatz zur X-Ray, auch die
Zeitskala der relevanten Bewegungsvorgänge zu messen.
Die Dynamik der Proteine ist für ihre Funktion von essentieller Bedeutung. Katalytische
Vorgänge gehen einher mit der Umgruppierung von an dem katalytischen Schritt
beteiligten Atomen und erfordern daher eine gewisse Flexibilität. In der Regel sind
längere Loops in Proteinen flexibel. Häufig wird auch eine Bewegungen von Domänen
zueinander (sog. “Hinge-Motion”) beobachtet. Aromatische Ringe führen häufig sog.
Ringflips mit hoher Frequenz durch. Ferner diffundiert Wasser relativ schnell durch den
Core von Proteinen.
Die Dynamik von Proteinen auf der Picosekunden/Nanosekunden Zeitskala lässt
heutzutage relativ gut mit Moleküldynamik (MD) Methoden berechnen.
1.17 Informationen über Proteine auf dem Web (aus Branden and Tooze):
Es gibt eine Reihe von relevanten Adressen im Internet, um Struktur- und Sequenzinformationen zu erhalten:
• die Homepage der Brookhaven Datenbank (pdb):
http://www.rcsb.org/pdb
• die Homepage des schweizer Institutes für Bioinformatik (ExPASy), die die automatische Sequenzdatenbank SWISSPROT enthält:
http://www.expasy.ch
21
PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR
• für Proteintopologien CATH
http://www.biochem.ucl.ac.uk/bsm/cath
• oder TOPS, mit dem sich nach Topologien suchen lässt
http://www3.ebi.ac.uk/tops/
• oder FSSP:
http://www2.ebi.ac.uk/dali/fssp
• DALI vergleicht die Koordinaten mit bekannten Koordinaten, um Ähnlichkeiten mit
bekannten Proteinen aufzudecken.
• für Sequenzalignments:
Pfram
http://www.sanger.ac.uk/Pfam
oder
ProDom:
http://www.protein.toulouse.inra.fr/prodom.html
1.18 Literatur:
• Carl Branden, John Tooze: Introduction to Protein Structure, Garland Publisher
1999.
• Thomas E. Creighton, Proteins; Structure and Molecular Properties, Freeman, 1993.
• Georg E. Schultz, R.H. Schirmer, Principles of Protein Structure, Springer 1985.
• K.E. van Holde, W.C. Johnson, P.S. Ho, Physical Biochemistry, Prentice Hall 1998.
• Alan Fersht, Structure and Mechanism in Protein Science, Freeman 1999.
22
PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR
PEPTID NMR
2. EINLEITUNG ZUR STRUKTURBESTIMMUNG MIT NMR
NMR Spektroskopie ist die Methode zur Strukturaufklärung von Proteinen in Lösung.
Im Gegensatz zur Röntgeneinkristalldiffraktometrie erlaubt sie die Untersuchung der
Struktur
unter
annähernd
physiologischen
Bedingungen.
Leider
ist
die
Routineanwendung der NMR Methode derzeit noch auf Proteine unter 30 kDa
beschränkt.
Die Strukturaufklärung mittels NMR beruht im wesentlichen auf der Ausnutzung des
“Nuklear Overhauser Effektes” (NOE), der sich im NOESY zwischen Protonen, die
weniger als 5 Å voneinander entfernt sind, beobachten lässt1:
NOE ∼ r
–6
⋅ f ( τc )
(GL 1)
Mit Hilfe der Information über die Nachbarschaftsbeziehungen aller Protonen
zueinandern lässt sich dann die Struktur berechnen. Die Strukturaufklärung ist in
folgende Schritte unterteilt:
• Etablierung von geeigneten Messbedingungen (Probe ist monomer , stabil etc.)
• Messung der 2D oder 3D NMR Spektren
• Sequentielle Zuordnung aller Protonenfrequenzen (von jedem einzelnen Proton
muss dessen Frequenz bekannt sein)
• Zuordnung der Kreuzpeaks im NOESY zu den Protonen in der Primärsequenz
• Integration des NOESY und Umsetzung der Intensitäten in Distanzein-schränkungen
• Bestimmung von Kopplungskonstanten für Diederwinkeleinschränkungen
• Strukturrechnung
• Refinement
• Ueberprüfung der Qualität der Struktur
3. SAMPLE-VORBEREITUNG
Gute Messbedingungen sind Voraussetzung für qualitativ gute Spektren, ohne die eine
gute Auflösung der Struktur nicht zu erreichen ist, da diese mit Hilfe dieser Spektren
gerechnet wird. Folgende Kriterien sollten bei der Probenvorbereitung beachtet
werden:
1. unter τc versteht man die Korrelationszeit, d.h. die Zeit, die das Molekül für eine 360° Drehung
benötigt
24
PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR
1. Das Protein muss in nativer und funktioneller Konformation vorliegen:
• Globuläre Faltung (nicht nur kurze Peptide sind oft sehr flexibel, nur eine Subpopulation ist gefaltet, CD checken!)
• geeigneten pH wählen (möglichst physiologisch, falsche Ladungszustände können
zu Aggregation führen, aber pH Abhängigkeit des H,D Austausch für Amidprotonen
beachten! (vergl. 6.))
• Temperatur variieren, bis Qualität und Signaldispersion optimal ist (oft: schärfere
Linien bei erhöhter Temperatur)
• Ionenstärke beeinflusst das Aggregationsverhalten (Hofmeister Serie)
• Screening geeigneter Bedingungen z.B. mit CD-Spektroskopie
• Löslichkeit muss beim pH nach Wahl hoch genug sein (pI!). Die Konzentration
sollte mindestens 1mM betragen (in 0.5ml). Bei halber Konzentration muss doppelt
solange gemessen werden, um das gleiche Signal/Rausch-Verhältnis zu erhalten!
Evtl. Zusatz von Detergentien/Salz.
2. Keine Kontaminationen, genügend hohe Reinheit des Proteins (>95%, genügende
Anzahl Reinigungsschritte, Check via HPLC/MS/SDS-PAGE etc.).
3. In Abhängigkeit vom Molekulargewicht:
• Anzahl Signale im Protonenspektrum: Jedes Proton gibt mindestens einen Peak im
Spektrum (Ausnahme: langsamer Austausch), d.h. je grösser das Molekulargewicht,
desto komplexer das Spektrum (Signalüberlappung!)
Je grösser das Molekül, desto länger seine Korrelationszeit τc (η: Viskosität, r:
hydrodynamischer Radius, T: Temperatur in Kelvin, k: Boltzmann-Konstante)
3
4πηr
τ c = --------------3kT
(GL 2)
Lange Korrelationszeiten führen zu breiten Linien im Spektrum: Geringe
Signalintensität und mehr Signalüberlagerungen!
• Zuordnung der Resonanzen mit homonuklearen Protonenspektren oft einfach bis zu
ca 50AS, bei 50-100 AS empfiehlt sich 15N-Labelling, bei > 100 AS (bis gegen 200
AS) zusätzlich 13C und evtl. Deuterium-Labelling.
4. Aggregationszustand:
• Monodisperse Verteilung anstreben, da verschiedene Aggregatszustände evtl. zu
verschiedenen Signalsätzen führen können.
• Wenn möglich in Monomerform messen (Check via Dynamic Light Scattering):
kleine Moleküle geben schärfere Signale
5. Stabilität unter den gewählten Bedingungen prüfen (CD, FPLC)
25
PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR
Hydrophile Peptide misst man meist in 90% H20/D2O, damit die labilen Protonen (NH)
nicht durch Deuterium ausgetauscht sind. Der Backbone-NH Austausch von freien
Amidprotonen ist bei einem pH um 3.0 im Minimum, aus Stabilitätsgründen misst man
oft bei einem pH zwischen 4 und 5. (Fig. 1) Sind die Amidprotonen in
Wasserstoffbrücken involviert (z.B. in einer Helix), oder befinden sie sich im Core und
sind nicht Lösungsmittel-zugänglich, tauschen sie sehr viel langsamer aus und können
auch bei höherem pH gut beobachtet werden.
FIGUR 28. Logarithmische Darstellung der intrinsischen Austauschraten kintr versus pH für
Lösungsmittel-zugängliche, labile Protonen in Wasser bei 25˚C.
4. SPEKTREN-AUFNAHME
Die Strukturbestimmung von Peptiden via NMR basiert auf der Beobachtung des
sogenannten Nuklear Overhauser Effektes (NOEs) zwischen Protonen (siehe oben).
Um die NOEs den Protonen zuordnen zu können, müssen zunächst deren
Resonanzfrequenzen ermittelt werden. Aufgrund der grossen Protonenzahl (3-13 pro
Aminosäure) und der daraus resultierenden Signalüberlappung ist es bereits in kleinen
Peptiden undenkbar, die Signale in einem normalen 1D Protonenspektrum zuzuordnen.
Eine schematische Verteilung der verschiedenen Protonen ist in der folgenden Figur
gezeigt:
26
PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR
FIGUR 29. Chemische Shift-Bereiche für die verschiedenen Typen von1H-Resonanzen in Ubiquitin
(aus Cavanagh et al.: Protein NMR Spectroscopy).
Elegant
lassen
sich
die
Zuordnungsprobleme
allerdings
mit
Hilfe
der
zweidimensionalen NMR-Spektroskopie lösen. Grundprinzip aller 2D-Experimente ist
die Korrelation zweier Frequenzen miteinander. Die Korrelationsintensitäten
entsprechen der dritten Dimension (Darstellung wie von Höhenlinien auf Landkarten).
Werden auf den beiden Achsen chemische Verschiebungen aufgetragen, spricht man
von zweidimensionaler Verschiebungs-korrelierter Spektroskopie. Die horizontal
liegende Frequenzachse (Abszisse) wird als F2-, die vertikale als F1-Achse bezeichnet
(Ordinate). Welche Eigenschaften ein Protonenpaar (A, B) haben muss, damit es in
einem 2D-Spektrum korreliert erscheint, d.h. durch zwei Kreuzpeaks (entspricht einem
Berg auf der Landkarte) bei den beiden zugehörigen Protonenfrequenzen (νA, νB) bzw.
(νB, νA) in F2 und F1 verbunden ist, wird durch das NMR-Experiment genau definiert.
In allen homonuklearen Spektren wird jede Protonenfrequenz auch mit sich selber
korreliert (νA, νA). Dies führt zu den sogenannten Diagonalpeaks, oft die intensivsten
27
PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR
Signale im 2D-Spektrum. Alle Diagonalpeaks zusammen bilden die Diagonale des
Spektrums und entsprechen einem Standard 1D Protonenspektrum.
ν2
ν1
F1
ν1
(ν 1, ν2)
(ν 1, ν1)
ν2
(ν 2, ν2)
(ν 2, ν1)
Diagonale: ν1 = ν1
Gegendiagonale: ν1 = -ν1
F2
FIGUR 30. Schema eines 2D Spektrums mit Angabe der Kreuz- und Diagonalpeaks sowie der
externen Projektionen
Eine grosse Fülle an 2D Experimenten wurde entwickelt, so dass viele komplexe
Fragestellungen durch sequentielle Applikation der geeigneten Experimente
beantwortet werden können. Zur Resonanzfrequenzzuordnung von Protonenspektren
eines Peptids werden standardmässig 3 verschiedene zweidimensionale homonukleare
[1H,1H]-korrelierte Experimente gemacht: das COSY, das TOCSY und das NOESY.
Diese liefern 2D-Spektren, bei denen auf beiden Frequenzachsen 1H-chemische
Verschiebungen
miteinander
korreliert
sind
(siehe
Abschnitt 4.1
auf
Seite 29,Abschnitt 4.2 auf Seite 32, Abschnitt 4.3 auf Seite 33).
Eine kurze grundsätzliche Bemerkung zur Aufnahme von Spektren mit Wasser als
Lösungsmittel: Das bei weitem intensivste Signal in einem normalen 1DProtonenspektrum liegt selbstverständlich bei der Wasserfrequenz (um 4.7ppm bei
37˚C). Da in diesem Frequenzbereich auch die meisten Cα-H liegen, muss das
Wassersignal unterdrückt werden, z.B. durch vorheriges Einstrahlen auf die
Wasserfrequenz werden die Wasserprotonen gesättigt, was die Spins der
28
PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR
Wasserprotonen für das nachfolgende Experiment quasi unsichtbar macht. Ein
schmales Wasserband ist jedoch auch in wasserunterdrückten Spektren gut sichtbar.
4.1 [1H,1H]-COSY:[1H,1H]-Correlated Spectroscopy
[1H,1H]-Korrelation aufgrund skalarer [1H,1H]-Kopplungen mit Kopplungskonstanten
J > 2Hz
Pro Memoria: In Molekülen treten benachbarte magnetische Kerndipole miteinander in
Wechselwirkung. Solche Spin-Spin-Kopplungen beeinflusen die Energien und somit
die Frequenzen der beobachteten Kerne. Es kommt zu Aufspaltungen der Signale in
Dubletts, Tripletts etc. Bei der skalaren (indirekten) Kopplung erfolgt die
Wechselwirkung über die Bindungen, d.h. indirekt, während bei der direkten
(dipolaren) Kopplung eine direkte Wechselwirkung durch den Raum stattfindet, die
sich allerdings in Lösung nicht als Aufspaltung zeigt.
FIGUR 31. Skalare (links) und dipolare (rechts) Kopplungen
Die Effizienz des COSY Experimentes nimmt mit zunehmender Linienbreite, d.h.
zunehmendem Molekulargewicht, drastisch ab. Dies ist ein Grund dafür, dass für
grössere Moleküle Experiemente mit isotopenmarkierten Verbindungen eingesetzt
werden müssen.
Die Peaks in einem COSY lassen sich an Hand ihrer Position im Spektrum wie folgt
grob klassifizieren:
a. alle nichtlabilen, nichtaromatischen Seitenkettenprotonen ausser βH - γCH3 von
Thr, δH-δH von Pro und βH-βH von Ser.
b. αH-βCH3 von Ala und βH-γCH3 von Thr.
c. αH-βH von Val, Ile, Leu, Glu, Gln, Met, Pro, Arg, und Lys.
d. αH-βH von Cys, Asp, Asn, Phe, Tyr, His und Trp.
e. αH-αH von Gly, αH-βH von Thr, δH-δH von Pro, αH-βH und βH-βH von Ser.
29
PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR
.
FIGUR 32. [ 1H,1H]-COSY von Neuropeptid Y (NPY)
f. aromatische Ringprotonen, inklusive 2H-4H von His, sowie SeitenkettenAmidprotonen von Asn und Gln.
g. Hauptketten (Backbone) NH-αH.
h. δCH2-εNH von Arg.
Von spezieller Bedeutung ist die Backbone NH-αH-Region (g) von Spektren, die in
Wasser aufgenommen wurden (in D2O tauschen die Backbone NH-Gruppen gegen D
aus, ND gibt kein Signal). Sie wird Fingerprint-Region der Aminosäure-Sequenz
genannt und kann als erstes Kriterium zur Qualitätsbeurteilung des Samples sowie der
Spektren dienen. Jede L-Aminosäure (Ausnahme:Pro) führt zu einem einzelnen NHαH Kreuzpeak, und jedes Gly gibt entweder 2 Kreuzpeaks (wenn die beiden αH
verschiedene chemische Verschiebungen haben) oder einen einzelnen Peak mit einer
charakteristischen Multiplett-Feinstruktur. Die N-terminale AS kann wegen des
raschen Austauschs der α-Aminoprotonen mit Wasser nicht beobachtet werden
(Abbildung 28 auf Seite 26).
30
PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR
Die skalaren Kopplungen werden überwiegend zwischen Protonen, die durch 3
Bindungen separiert sind (sog. vicinalen Protonen) beobachtet. Mehrere Gründe
können dafür verantwortlich sein, dass nicht die maximal mögliche Anzahl an
Kreuzpeaks in der Fingerprint Region sichtbar sind: Signalüberlagerungen (Spektren
werden erneut bei leicht erhöhter oder erniedrigter Temperatur aufgenommen, wodurch
die Signal meist auf verschiedene Weise schieben), sehr kleine JNH-αΗKopplungskonstanten (in stabilen α-Helices ist sie < 4 Hz), die aus Dihedralwinkeln
nahe 90° resultieren (s. Abbildung 44 auf Seite 41), oder schneller Austausch mit dem
Wasser.
Die COSY Peaks zeigen eine Multiplet-Feinstruktur. Diese resultiert aus den aktiven
und passiven Kopplungen der beiden Protonen, deren skalare Wechselwirkung den
Peak verursacht. Unter der aktiven Kopplung versteht man die Kopplung der beiden zu
dem Peak gehörenden Protonen zueinander. Die passiven Kopplungen sind die
Kopplungen der beiden Protonen zu weiteren Protonen. Aktive Kopplungen sind in
anti-Phase (die beiden Komponenten haben unterschiedliches Vorzeichen) passive
Kopplungen sind in-Phase:
J(A,B)
J(A,C)
ppm
F1
4.00
J(A,B)
2.00
ppm
F2
FIGUR 33. COSY Kreuzpeakpattern für ein Spinsystem
C
B
pinsystem:
A
31
PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR
4.2 [1H,1H]-TOCSY: Total Correlation Spectroscopy
Das TCOSY Experiment liefert [1H,1H]-Korrelation von Signalen aller Protonen eines
Spinsystems. Ein Spinsystem setzt sich zusammen aus allen Spins, die zum gleichen
(skalaren) Kopplungsnetzwerk gehören. Protonen verschiedener Aminosäuren gehören
immer zu verscheidenen Spinsystemen (es gibt keine skalare Kopplung über die
Amidbindung). In manchen Aminosäuren sind alle Protonen Bestandteil eines
Spinsystemes (z.B. Ile), andere bestehen aus 2 Spinsystemen (z.B. Phe):
FIGUR 34. Spinsysteme von Tyr (J) und Arg(X) im TOCSY Experiment
Das Erkennen der Spinsysteme ist ein wichtiger, erster Schritt im Verlauf der
Resonanzzuordnung, und das TOCSY Experiment spielt bei Peptiden hier eine
herausragende Rolle (siehe Abschnitt 5.2 auf Seite 36).
Durch Variation der sogenannten Mischzeit des Experimentes kann man bestimmen,
wie weitreichend die Korrelationen innerhalb der beobachteten Spinsysteme sein
werden. Wählt man z.B. eine kurze Mischzeit von 12ms, so beobachet man im 2D
Spektrum ausschliesslich Kreuzpeaks zwischen geminal und vicinal koppelnden
Protonen. Wählt man eine lange Mischzeit von ca 80ms, so erwartet man Kreuzpeaks
für alle Protonen des Spinsystems. Um die Spinsysteme gut zu erkennen, ist es sinnvoll
in einen Bereich des Spektrum zu schauen, der eine möglichst gute Signalseparation
aufweist. Das ist normalerweise der Bereich der Amidprotonen (ca. 7-10 ppm), ev.
Ueberlappungsprobleme lassen sich häufig durch die Aufnahme der Spektren bei zwei
verschiedenen Temperaturen beseitigen (der Shift der Amid Protonen ist stark
temperaturabhängig).
Ein Vergleich der Aussagekraft von COSY und TOCSY ist in der folgenden Figur gut
zu erkennen:
32
PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR
.
FIGUR 35. Vergleich der Region der Amidprotonen (F2), aliphatischen Protonen (F1) für COSY
(A) und TOCSY (B) sowie der Kopplungen aliphatischer Protonen untereinander im COSY (C) und
TOCSY (D).
4.3 [1H,1H]-NOESY: Nuclear Overhauser Effect Spectroscopy
Im
NOESY-Experiment
sind
auf
beiden
Frequenzachsen
1H-chemische
Verschiebungen aufgetragen. Kreuzpeaks resultieren aufgrund von
1H,
1H-
Wechselwirkungen durch den Raum (dipolare, direkte Kopplung), sind also nur vom
33
PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR
Abstand der Kerne voneinander abhängig, während die Anzahl der zwischen den
Atomen liegenden Bindungen keinen Einfluss hat.
D ≈ r –6
(GL 3)
Dipolare Kopplungen lassen sich in der hochauflösenden NMR Spektroskopie, d.h. in
flüssiger (isotroper) Phase, nicht direkt aus dem Spektrum herauslesen, weil die
Kopplungen aufgrund der raschen Reorientierung der Moleküle in Lösung zeitlich
herausgemittelt werden. Die dipolaren Kopplungen sind aber die Ursache des KernOverhauser Effekts (nuclear Overhauser effect, NOE) - vgl. mit Gleichung 1, auf
Seite 24 - und können somit aufgrund der Distanzabhängigkeit der Intensität zur
Strukturbestimmung von Proteinen herangezogen werden.
TABELLE 36. Besonderheiten des NOESY-Experiments:
Signalphase
Diagonalpeak
Signalphase
Kreuzpeak
kleine Moleküle,
niedervisköse
Lösungsmittel
positiv
negativ
mittlere Moleküle
positiv
sehr schwache Signale (positiv oder
negativ)
grosse Moleküle
positiv
positiv
Die Signalphase der Kreuzpeaks im NOESY-Experiment ist abhängig vom Vorzeichen
des NOEs. Als Faustregel kann man sich merken, dass der NOE für kleine Moleküle .
FIGUR 37. Abhängigkeit des homonuklearen Kern-Overhauser-Effekts zwischen Protonen vom
Produkt aus Resonanzfrequenz und molekularer Korrelationszeit.(Abb. aus Günther: NMR-Spektr.)
34
PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR
positiv und für grosse Moleküle negativ ist. Der NOE für mittlere Moleküle befindet
sich gerade im Bereich des Vorzeichenwechsels und ist deshalb klein oder nullAuch im
NOESY lassen sich aus der Lage der Peaks schon Rückschlüsse über die Art der
involvierten Protonen erhalten:
FIGUR 38. (H,H)-NOESY von ProteinD (Phagen Hüllprotein)
a. NH; aromatische - NH; aromatische.
b. NH; aromatische - αH; δH von Pro; βH von Ser und Thr.
c. NH; aromatische - aliphatische Seitenketten.
d. αH; δH von Pro; βH von Ser und Thr - αH; δH von Pro; βH von Ser und Thr.
e. αH; δH von Pro; βH von Ser und Thr - aliphatische Seitenketten.
f. Aliphatische Seitenketten - aliphatische Seitenketten.
Nicht nur liefert das NOESY als einziges der 3 erwähnten Experimente Informationen
über Protonendistanzen innerhalb des Peptids - es ist auch das Schlüsselexperiment bei
der sequentiellen Zuordnung der AS-Spinsysteme zur Aminosäuresequenz. Man
bedenke, dass 2 AS-Reste immer zu verschiedenen Spinsystemen gehören und deshalb
nie durch Kreuzpeaks in einem COSY oder TOCSY-Experiment verbunden sind! Nur
mit Hilfe des NOESY lassen sich die Spinsysteme über die Amidbindungen
miteinander verknüpfen (s. 4.3).
35
PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR
5. STRATEGIE ZUR RESONANZFREQUENZ-ZUORDNUNG FÜR KLEINE,
NICHT-MARKIERTE PROTEINE
5.1 Beurteilung der Spektrenqualität
Anhand der Fingerprint-Region im COSY-Spektrum wird die Anzahl der
beobachtbaren Spinsysteme bestimmt. Fehlen mehr als 10% der maximal möglichen
Zahl an Resten, sollte der Grund für die Abwesenheit der Peaks bestimmt und die
Spektrenaufnahme optimiert werden (Temperatur, pH, Salz etc.)
In einem zweiten Schritt müssen alle Spektren gleich kalibriert werden. Als interner
Standard wird dabei oft die Wasserfrequenz verwendet (T=Temperatur in [K]):
T
δ( H 2 O ) = 7, 83 – ------------ ppm
96, 9
(GL 4)
Durch Übereinanderlegen von TOCSY und COSY, bzw. NOESY und COSY kann nun
auch die Qualität der Fingerprint-Region von TOCSY und NOESY abgeschätzt
werden. Hierbei ist zu beachten, dass im NOESY eine grössere Anzahl an zusätzlichen
(interresiduellen, meist sequentiellen NHi-Hαi-1) Kreuzpeaks vorhanden sein können.
Es lohnt sich ausserdem meist, Spektren bei zwei verschiedenen Temperaturen
aufzunehmen, um in Fällen von Signalüberlappung eindeutige Interpretationen zu
erhalten (siehe Abschnitt 5.3 auf Seite 39).
5.2 Spinsystem-Identifikation: NH-αΗ−βΗ−...
Im ersten Schritt versucht man, die Spinsysteme von der Hauptkette aus (Spins, die
zum gleichen Spinsystem wie das betrachtete Amidproton gehören) zu identifizieren.
Es gelingt meist nicht, die Aminosäuren direkt zu indentifizieren (Ausnahmen sind Thr,
Ser, Gly). Die Klassifizierung nach Typ des Spinsystemes erlaubt aber später unter
Zuhilfenahme
der
sequentiellen
Information
aus
dem
NOESY
für
Tri/
Tetrapeptidsegmente eine eindeutige Zuordnung.
Kriterien für die Klassifizierung hierzu sind z.B.
• die Länge der Spinsysteme
es gibt kurze Spinsysteme (Typ J, z.B. Ser), lange Spinsysteme (z.B. Lys)
• bestimmte Peak-“Patterns“ (siehe Anhang):
Man sucht sich einen Bereich, in dem die Spinsysteme möglichst gut separiert sind.
Dies ist meist in der NH Region der Fall. Bei kurzen Peptiden ist die Analyse des
NH (F2)/H-aliphatisch (F1) Bereiches im TOCSY sehr nützlich. Manche Ami-
36
PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR
nosäuren lassen sich schon anhand der chemischen Verschiebungen ziemlich eindeutig bestimmen:
Ser: β−Protonen sehr tief, keine Methylgruppe
Thr: β−Protonen sehr tief, plus Methylgruppe um 1 ppm
Ala: keine β-Protonen, jedoch Mehtylgruppe um 1 ppm
Gly gibt als einzige Aminosäure ein Triplett für die Amidresonanz. Pro hat kein
Amidproton,
zeigt
aber
ein
charakteristisches
Spinsystem
im
TOCSY.
Methylgruppen tragen neben Ala und Thr nur noch Val, Leu und Ile. Val, Leu und
Ile können aufgrund der unterschiedlichen Verknüpfungen von Methyl- und
Methylengruppen im COSY unterschieden werden. Kurze Spinsysteme (nur NH, αund β-Protonen) besitzen neben Ser nur Cys, Asp, Asn, Phe, His, Trp und Tyr (sog.
Typ J-Spinsysteme). Die Verschiebungsbereiche der Protonen sind schemtisch in
der folgenden Abbildung gegeben
FIGUR 39. 1H-chemische Verschiebungen von aliphatischen Protonen. Mittelwert und
Standardabweichung wurden aus Daten von 13 Proteinen bestimmt.
(Abbildung aus Cavanagh et al.: Protein NMR Spectroscopy)
37
PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR
Die sogenannten “Random-Coil” Verschiebungen (Shifts in unstrukturierten
Tripeptiden) sind in der nachfolgenden Tabelle dargestellt:
TABELLE 40. Random coil chemische Verschiebungen für die 20 natürlichen Aminosäuren im
Dipeptid mit nachfolgendem Alanin
Rest
NH
Hα
Hβ
Andere
Ala
8.24
4.32
1.39
Cys(red)
8.32
4.55
2.93, 2.93
Cys(ox)
8.43
4.71
3.25, 2.99
Asp
8.34
4.64
2.72, 2.65
Glu
8.42
4.35
2.06, 1.96
Phe
8.30
4.62
3.14, 3.04
2,6H 7.28; 3,5H 7.38; 4H 7.32
Gly
8.33
3.96
His
8.42
4.73
3.29, 3.16
2H 8.58; 4H 7.29
Ile
8.00
4.17
1.87
γCH2 1.45, 1.16; γCH3 0.91; δCH3
0.86
Lys
8.29
4.32
1.84, 1.75
γCH2 1.44, 1.44; δCH2 1.68, 1.68;
γCH2 2.31, 2.31
εCH2 2.99, 2.99; εNH3+ 7.81
Leu
8.16
4.34
1.62, 1.62
γCH 1.59; δCH3 0.92, 0.87
Met
8.28
4.48
2.11, 2.01
γCH2 2.60, 2.54; εCH3 2.10
Asn
8.40
4.74
2.83, 2.75
γNH2 7.59, 6.91
Pro
-
4.42
2.29, 1.94
γCH2 2.02, 2.02; δCH2 3.63, 3.63
Gln
8.32
4.34
2.12, 1.99
γCH2 2.36, 2.36; δNH2 7.52, 6.85
Arg
8.23
4.34
1.86, 1.76
γCH2 1.63, 1.63; δCH2 3.20, 3.20;
εNH 8.07
Ser
8.31
4.47
3.89, 3.87
Thr
8.15
4.35
4.24
γCH3 1.21
Val
8.03
4.12
2.08
γCH3 0.94, 0.93
Trp
8.25
4.66
3.29, 3.27
2H 7.27; 4H 7.65; 5H 7.18; 6H 7.25;
7H 7.50
Tyr
8.12
4.55
3.03, 2.98
2,6H 7.14; 3,5H 6.84
Die Mitglieder der letzten Gruppe von AS-Resten, Lys, Arg, Met, Gln, Glu und Pro,
besitzen alle 2 γ-Protonen, gekoppelt an die β−Protonen. Weil die shifts der β−
Protonen in dieser Gruppe höher als 2.2 ppm liegen, werden diese Reste auch Typ-U
(upfield) Spinsysteme genannt. Met, Gln und Glu haben ihre γH-Resonanzen tiefer
als jene der β-Protonen und vice versa für Arg, Lys, Pro und Leu.
Für die aliphatischen und aromatischen Protonen der Aminosäuren gibt es
charakteristische Pattern in der COSY und TOCSY Spektren, die im Anhang
schematisch zusammengefasst sind.
38
PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR
5.3 Sequenz-spezifische Zuordnung
Hat man die Spinsysteme charakterisiert, so versucht man sie über NOEs aneinander
zu hängen. Hierzu gibt es charakteristische, kurze sequentielle Abstände, die je nach
Sekundärstruktur variieren.
4
3
9
1
8
5
2
7
4
ppm
ppm
7
FIGUR 41. NOESY-Diagonal- und Kreuzpeaks in der NH (F2)/ NH (F1)- Region. Starke
(sequentielle) dNN-Kreuzpeaks werden v.a. in helikalen Segmenten, augrund der kurzen (sequentiellen)
NHi-NHi+1 Abstände beobachtet und erlauben es, die sequentielle Anordnung der Spinsysteme zu
bestimmen durch Zuordnung der NH-shifts (sog. NOESY-walk in der NH/NH-Region)
.
3
H
3.5
1
ppm
N
i+1
5
Cα
C
4
N
α
4 3
C
O
2
4.5
-1
α
O
9
8
7
pm
FIGUR 42. NOESY-Kreuzpeaks in der NH(F2)/αH (F1)-Region. Starke (sequentielle) dαΝKreuzpeaks werden v.a. in gestreckten (β−Blättern und random coil) Konformationen aufgrund der
kurzen NHi+1/αHi-Abstände beobachtet, oft gleichzeitig in Kombination mit dβN-Kreuzpeaks.
Natürlich werden auch nicht-sequentielle kurze Abstände beobachtet, daher sollte man
nur starke und mittelstarke NOEs für die sequentielle Zuordnung benutzen. In
gestreckten Konformationen wie in β−Faltblättern oder im Zufallsknäul (random-coil)
39
PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR
werden kurze sequentielle NHi+1-αHi beobachtet. In helikalen Abschnitten sind die
NHi-NHi+1 Abstände kurz. Durch Vergleich von NOESY und COSY lassen sich die
intraresiduellen
von
den
sequentiellen
(interresiuduellen)
NH-αΗ
Peaks
unterscheiden. Mit geeigneten Programmen wie XEASY können identische
Frequenzausschnitte aus COSY/TOCSY und NOESY gleichzeitig nebeneinander
angezeigt werden und intraresiduelle von interresiduellen NOEs schnell unterschieden
werden. Der Vergleich von COSY und NOESY eignet sich für die sequentielle
Aneinandereihung der Spinsysteme:
FIGUR 43. : Fingerprint Region im COSY (links) und NOESY (rechts) Spektrum.
Die kurzen sequentiellen Abstände, bzw. die daraus resultierenden NOEs ermöglichen
es nun, kurze Segmente zusammenzuhängen, und man kann dann meist unter
Zuhilfenahme der Information über die Art der Spinsysteme entscheiden, um welche
Aminosäure es sich handelt.
40
PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR
6. STRUKTURRECHNUNG MIT NMR-DATEN
Sind einmal alle (oder fast alle) Resonanzen zugeordnet, können Chemische
Verschiebungen, skalare Kopplungskonstanten und NOEs, die alle abhängig von der
Konformation sind, zur Strukturanalyse verwendet werden.
6.1 Chemische Shifts. Helikale Faltung und Faltblätter haben einen unterschiedlichen
Effekt auf die Resonanzfrequenzen der α-Protonen. Folgende Regel dient zu einer
ersten (vorläufigen) Sekundärstrukturvorhersage: Liegen die αH-Shifts von mehr als
drei aufeinanderfolgenden Resten im Vergleich mit den Random-Coil αH-Shifts der
korrespondierenden Aminosäure um mehr als 0.1ppm höher, kann für diese Reste eine
helikale Struktur angenommen werden, umgekehrtes gilt für Faltblätter (um mehr als
0.1ppm tiefer...).
6.2 3JHN-αH-Kopplungskonstanten. Sie hängen über die Karplus-Beziehung vom
Torsionswinkel θ ab:
J ( θ ) = 6, 98 ( cos θ ) 2 – ( 1, 38 ( cos θ ) ) + 1, 72
(GL 5)
.
FIGUR 44. Plot von 3JHN-αH-Kopplungskonstanten versus Torsionswinkel θ=|φ-60˚| in BPTI. φ
wurde aus der Kristallstruktur bestimmt. Werte für einzelne Aminosäuren sind mit Kreisen
dargestellt.
(Abbildung aus Wüthrich: NMR of Proteins and Nucleic Acids)
41
PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR
Die Karplus-Beziehung ist nicht eindeutig - zu einem gegebenen 3J gibt es 4 mögliche
θ-Konformationen, einige davon möglicherweise sterisch ungünstig, d.h., dass der
Bereich aller möglichen θ durch Messung von J allenfalls eingeschränkt, θ jedoch
nicht bestimmt werden kann. Umgekehrt kann allerdings gesagt werden, welche
Kopplungen in den verschiedenen Sekundärstrukturelementen (wo die θ ja einen
definierten Wert besitzen) erwartet werden:
TABELLE 45. Theoretische Werte für 3JHN-αH in regulären Sekundärstrukturelementen
Sekundärstruktur
θ
3J
HN-αH
α-Helix
-57˚
3.9 Hz
310-Helix
-60˚
4.2 Hz
antiparalleles β-Blatt
-139˚
8.9 Hz
paralleles β-Blatt
-119˚
9.7 Hz
Intramolekulare Bewegungen führen zu J-Werten, die zeitgemittelt sind über die
Verteilung der eingenommen Torsionswinkel. Extensive Hauptkettenbewegungen
resultieren in J-Werten um 7 Hz in kurzen, linearen Peptiden, dh., 3JHN-αH zwischen 6
und 8 Hz werden für die Strukturrechnung nicht berücksichtigt.
NOEs. Sie sind die wichtigsten NMR-Daten zur Strukturbestimmung, essentiell für
Tertiär- und Quarternärstrukturaufklärung. Sie werden beobachtet zwischen
Protonenpaaren, die im Raum weniger als 5Å voneinander entfernt sind. Unter
Umständen sind sie in AS-Resten lokalisiert, die in der Primärsequenz weit
voneinander entfernt sind, die sich aber aufgrund der Faltung im dreidimensionalen
Raum wieder nahe kommen. Vlg. mit Gleichung 1, auf Seite 24!
Im Prinzip sind alle Wasserstoffatome eines Proteins miteinander gekoppelt über die
Dipol-Dipol-Interaktionen. Magnetisierung kann nicht nur direkt von einem Spin zum
anderen übertragen werden, sondern auch durch die sogenannte Spin-Diffusion, dh.
indirekt via andere, benachbarte Spins. Die Approximation isolierter Spinpaare ist nur
gültig für sehr kurze Mischzeiten (der wichtigste experimentelle Parameter eines
NOESY-Experiments). In der Praxis können die Mischzeiten allerdings nicht beliebig
kurz gewählt werden, für kurze Mischzeiten ist die NOE-Intensität nämlich linear
abhängig von der Mischzeit, es muss also ein Kompromiss gemacht werden zwischen
Spin-Diffusionsvermeidung und genügend hoher Signalintensität. Dies hat zur Folge,
dass die gemessenen NOEs nicht auf exakte Weise in Distanzen umgerechnet werden
42
PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR
können. Man behilft sich bei der Strukturrechnung mit dem Ausweg, die geschätzten
Distanzen bloss als obere Distanzlimiten (upper limits) zu interpretieren. Ist die
Distanz zwischen einem Protonenpaar in der berechneten Struktur kürzer als es
aufgrund des NOEs hätte vermutet werden können (d.h. der gemessene NOE ist stärker
als der aus der berechneten Struktur abgeleitete), wird dies ohne weiteres akzeptiert.
Wie berechnet man aus einem NOE-Kreuzpeak zwischen zwei Protonen eine obere
Distanzlimite für deren Abstand? In einem ersten Schritt müssen die Volumina der
Kreuzpeaks im NOESY-Spektrum bestimmt werden (Integration des Spektrums in 2
Dimensionen). Obere Distanzlimiten u zwischen zwei Wasserstoffatomen werden
nachher aus den korrespondierenden NOESY-Kreuzpeak-Volumina V abgeleitet. Für
ein rigides Molekül gilt folgende Kalibrierungsbeziehung:
k
V = ----6u
(GL 6)
mit einer Konstanten k, die von der aktuellen Kalibrierung des NOESY-Spektrums
abhängt. k wird bestimmt aus NOESY-Volumina, die bekannten Distanzen zugeordnet
sind, z.B. den sequentiellen Distanzen d(Hiα, Hi+1N) und d(HiN, Hi+1N) von regulären
Sekundärstrukturelementen.
TABELLE 46. Kurze (<4.5A) sequentielle und mittlere 1H-1H Distanzen in PolypeptidSekundärstrukturen
Distanz
α-Helix
310-Helix
β
βp
turn I
turn II
dαN
3.5
3.4
2.2
2.2
3.4
3.2
2.2
3.2
dαN(i,i+2)
4.4
3.8
3.6
3.3
dαN(i,i+3)
3.4
3.3
3.1-4.2
3.8-4.7
dαN(i,i+4)
4.2
dNN
2.8
2.6
2.6
2.4
4.5
2.4
dNN(i,i+2)
4.2
4.1
3.8
4.3
dβN
2.5-4.1
2.9-4.4
2.9-4.4
3.6-4.6
3.6-4.6
3.6-4.6
dαβ(i,i+3)
2.5-4.4
3.1-5.1
4.3
4.2
3.2-4.5
3.7-4.7
43
PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR
.
FIGUR 47. Sequentielle und mittelgrosse (medium-range) 1H-1H Distanzen in Polypeptidketten (aus
Wüthrich: NMR of Proteins and Nucleic Acids).
.
FIGUR 48. Ueberblick über die squentiellen und medium-range1H-1H NOEs und Spin-SpinKopplungskonstanten 3JHNα in den verschiedenen Sekundärstrukturelementen. Die Nummern ganz
unten stehen für die Position der Aminosäure im Sekundärstrukturelement. Ein Zeile weiter oben
stehen die Werte für die Kopplungskonstanten. Kurze Protonenpaardistanzen sind mit Linien
angegeben, die die Reste verbinden, welche die entsprechenden Wasserstoffatome tragen. Die Breite
der Linie repräsentiert die korrespondierende NOE-Kreuzpeak-Intensität.
(Abbildung aus Wüthrich: NMR of Proteins and Nucleic Acids)
Ist einmal eine grössere Anzahl an NOE-Kreuzpeaks eindeutig zugeordnet, können
ihre Volumina, bzw. die daraus abgeleiteten, kalibrierten oberen Distanzlimiten, für
eine erste Strukturbestimmung verwendet werden. Gemäss IUPAC ist die
Konformation einer Aminosäure in einer Polypeptidkette definiert durch vier Winkel.
Die φ, ψ - Paare sind aus energetischen Gründen (sterische Interaktionen) gemäss
Ramachandran-Plot eingeschränkt. Für Θ gilt Θ=Φ-60˚. Ebenfalls aus energetischen
44
PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR
Gründen können nur 3 Werte für χ1 (60˚, -180˚, -60˚) eingenommen werden. Die
Methoden zur Konformationsbestimmung mittels NMR beruhen im wesentlichen auf
den etablierten, allgemeinen Ansätzen zur Konformationsanalyse von Proteinen/
Peptiden, d.h. entweder Distanzgeometrie (DG) oder Moleküldynamiksimulationen
(MD), wobei in diese Ansätze zusätzliche Terme, die die aus den NMR-Messungen
gewonnenen
Distanzeinschränkungen
berücksichtigen,
integriert
werden.
Im
folgenden wird eine sehr elegante Methode via MD, wie sie im Programm DYANA
implementiert ist, genauer vorgestelllt.
Eine MD-Simulation ist eine deterministische Prozedur, bestehend aus Abtasten des
Raums der möglichen Konfigurationen und gleichzeitiger Integration der klassischen
Newton‘schen Bewegungsgleichungen für alle Atome i des Systems (mi: Masse des
Atoms i; ri(t): Position von i zur Zeit t; Fi(t): Kraft auf i, ausgeübt durch die übrigen
Atome N-1 zur Zeit t).:
2
mi
d
r (t ) = Fi(t )
dt2 i
i = 1, …, N
(GL 7)
Im Verlauf der Simulation wird die potentielle Energie minimiert, indem die Atome
ihre Position in Richtung des Gradienten (.d.h. in Richtung abnehmender Energie oder
in Richtung der auf sie wirkenden Kraft Fi(t)) verändern. Das Ziel der Simulation ist es,
alle ri (die Abstände aller Atome vom Massezentrum) im Energieminimum zu kennen,
dann ist die Struktur bestimmt. Für jedes Atom i wird die Kraft Fi zu jeder Zeit t als
negativer Gradient der Potentialfunktion (U in Abhängigkeit der Atomkoordinaten ri)
berechnet:
Fi = –
d
U ( r 1, r 2, …, r N )
dri
(GL 8)
Die Potentiale sind die in normalen Kraftfeldern verwendeten Potentiale Upot, die um
einige
Terme,
die
die
NMR
Distanz-
und
Diederwinkeleinschränkungen
repräsentieren, erweitert worden sind:Energie jedes Moleküls berücksichtigt:
U pot = U Torsionswinkel + U vdW + U Coulomb + U NMR
45
(GL 9)
PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR
Verletzungen der oberen Distanzlimiten, die aus den NOE-Daten gewonnen wurden,
werden in ein Zusatzpotential umgerechnet und zum Torsionswinkel-, van der Waalssowie Coulombpotential aufaddiert:
.
Epot
dNOE
FIGUR 49. U NMR eines Protonenpaars in Abhängigkeit von deren gegenseitigen Distanz. Aus den
NOE-Daten (Volumen des entsprechenden Kreuzpeaks) wurde eine obere DistanzlimiteNOE
d
bestimmt. Der NMR-Term U NMR steigt an, sobald diese Limite in der MD-Simulation zur
Strukturrechnung überschritten wird, d.h., die intermolekulare Kraft (Gleichung 8, auf Seite 45) wird
in Richtung kürzerer Distanz wirken.
Bindungslängen, Bindungswinkel, Chiralitäten und Planaritäten (alle kovalenten
Strukturparameter) werden zur Vereinfachung (Reduktion der Rechenzeit!) fixiert. Es
gibt zahlreiche Algorithmen zur Integration der MD Bewegungsgleichungen1.
Am Anfang einer Strukturrechnung mit DYANA steht das Generieren eines Ensembles
(20-50 Moleküle) von Random-Strukturen, d.h. Polypeptidketten mit zufälligen
Einstellungen aller Torsionswinkel. Gleichzeitig werden die Moleküle aufgeheizt, d.h.
mit kinetischer Energie versehen (Temperaturen von mehreren Tausend Kelvin), was
zu schnellen Veränderungen der Torsionswinkeleinstellung führt. Damit wird
verhindert, dass bereits in einem frühen Stadium der Rechnung Konformationen mit
lokalem Energieminimum definitiv eingenommen werden (gesucht wird ja das globale
Energieminimum), dh., das System muss genügend hohe kinetische Energie besitzen,
um den Potentialtopf eines lokalen Minimums wieder verlassen zu können. Im
Verlaufe der Rechnung wird das System langsam abgekühlt, die Moleküle werden in
eine Endkonformation gezwungen und deren potentielle Energie, die niedrig seien
sollte, berechnet:
1. In DYANA wird die Integration im Torsionswinkelraum durchgeführt, d.h. F und U werden nicht mehr
als Funktionen von r, sondern als Funktionen der Torsionswinkel Θ, Ψ, Φ, χ betrachtet. (Es wird also
eine Transformation aus dem kartesischen System (Newton-Gleichungen) in den Torsionswinkelraum
durchgeführt (Lagrange-Gleichungen)).
46
PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR
A
Epot
B
Temp
Time
FIGUR 50. Links: Potentielle Energie eines Moleküls in Abhängigkeit seiner Konformation. Das
globale Minimum (Potentialtopf rechts) ist von dem lokalen Minimum, in dem sich die aktuelle
Konfiguration zur Zeit x während der Simulation befindet, durch eine Energiebarriere getrennt.
Rechts: Temperatur versus Zeit MD-Simulation mit simulated annealing Protokoll: Zu Beginn der
Simulation wird das System aufgeheizt (Zufügen von kinetischer Energie), um zu verhindern, dass die
Konformation der Moleküle in lokalen Minima steckenbleibt.
Hohe potentielle Energien weisen darauf hin, dass die NMR-Daten nicht konsistent in
eine sinnvolle Struktur umgesetzt werden konnten ohne z.B. van der Waals
Verletzungen zu generieren oder alle oberen Distanzlimite einzuhalten. Mehrere
Gründe können dafür verantwortlich sein: die Kalibrierung (Volumenintensität im
NOESY vs. Distanz) kann zu eng angezogen sein. Letzteres würde sich in einer
grossen Zahl an Distanzverletzungen äussern. Es können aber auch einzelne NOESYKreuzpeaks falsch zugeordnet sein. Dies muss im einzelnen für jede Distanzverletzung
unter Konsultation der Spektren überprüft werden.
Da die Rechungen mit z.B. 50 zufällig erzeugten Startkonformationen durchgeführt
werden, geben die daraus resultierenden 50 Endkonformationen ein Bild darüber, wie
genau die Faltung durch die Distanzeinschränkungen definiert sind. Ist der rmsd des
Ensembles der resultierenden Strukturen gross, so ist die Kette schlecht definiert:
FIGUR 51. Links: Backbone Darstellung der Ueberlagerung der 25 berechneten Strukturen des Prion
Proteins . Mitte: Spline Darstellung durch die Ca Kette. Rechts: Schematische Darstellung der MeanStruktur.
Dies ist meist der Fall in flexiblen Loops (dann gibt es auch weniger NOEs). Es kann
aber auch ein Samplingproblem (C- und N- Terminus sowie Oberflächenprotonen)
47
PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR
sein. Je mehr voneinander unabhängige Distanzeinschränkungen aus den NOE-Daten
abgeleitet werden können, desto höher wird die Auflösung der Struktur sein. Ist einmal
der globale Fold der Hauptkette bekannt, können oft weitere NOEs, die auf long-range
Interaktionen zurückzuführen sind (kurze Distanzen zwischen Protonen, die in der
Primärsequenz weit voneinander entfernt sind), eindeutig zugeordnet werden und
damit in der nächsten Runde der Rechnung helfen, die Positionierungen weiter zu
verfeinern und den globalen rmsd zu senken. Automatisches Assignment von NOEKreuzpeaks ist in der neusten Version von DYANA für diesen Schritt der
Strukturrechnung bereits implementiert.
Eine letzte Bemerkung zur stereospezifischen Zuordnung der beiden geminalen
Protonen von Methylengruppen: Die oben vorgestellte Standardmethode zur
Zuordnung der Resonanzfrequenzen in Proteinen erlaubt es nicht, die beiden
diastereotopen Substitutenten eines prochiralen Zentrums, z.B. die beiden Protonen
einer Methylengruppe oder die Isopropylgruppen von Valin oder Leucin zu
unterscheiden und stereospezifisch zuzuordnen. Im Zuge der Resonanzzuordnung wird
die Zuordnung willkürlich gemacht - z.B. wird das β-Proton mit der höheren
Resonanzfrequenz oft als HB2, das mit tieferen Frequenz HB3 genannt. DYANA
probiert im Verlaufe der Strukturrechnung beide Zuordnungsmöglichkeiten aus. Eine
eindeutige stereospezifische Zuordnung erfolgt, falls nur für eine der beiden
Möglichkeiten erlaubte Konformationen gefunden werden, d.h., wenn die gefundenen
NOEs
und
die
Kopplungskonstanten
nur
mit
einer
stereospezifischen
Zuordnungsvariante kompatibel sind. Generell kann gesagt werden, dass nur bei
grossen Unterschieden in NOE-Intensitäten zu benachbarten Protonen oder grossen
Unterschieden in den Kopplungskonstanten eine eindeutige Zuordnung erwartet
werden kann.
7. QUALTITÄTSBEURTEILUNG DER BERECHNETEN STRUKTUR
• Anzahl zugeordneter Resonanzen
• Anzahl unabhängiger oberer Distanzlimiten (in gut definierten Strukturen > 20 / ASRest!)
• Wert der Target-Funktion=Mass für die nicht weiter reduzierbare potentielle Energie
der berechneten Struktur (ist niedrig in konsistenten Konformationen)
• Anzahl Distanzverletzungen
• Torsionswinkelverteilung im Ramachandran-Plot
48
PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR
• RMSD (backbone/heavy atoms) = root mean square deviation/Wurzel aus den quadrierten Differenzen von der Durchschnittstruktur
ist in gut definierten Strukturen < 0.5A für die Hauptkette und < 1 A für die Seitenkette
Beispiel: human prion protein
TABELLE 52. Collection of the input for the structure calculation and
characterization of the energy-minimized NMR structures of the
polypeptide
segment 121-230 in different human PrP constructs
Quantity*
hPrP(23-230)
hPrP(90-230)
hPrP(121-230)
-------------------------------------------------------------------------NOE upper distance limits
1,732
1,705
1,752
429
453
436
Dihedral angle constraints
Residual target function,
value, Å2
0.25 ± 0.06
0.34 ± 0.08
0.39 ± 0.05
Residual distance
constraint violations,
Number [>= ] 0.1, Å
0.3 ± 0.5
0.7 ± 0.9
0.1 ± 0.3
0.10 ± 0.01
0.11 ± 0.01
0.10 ± 0.00
1.8 ± 1.0
1.5 ± 1.0
5.6 ± 2.0
2.9 ± 0.8
3.0 ± 1.2
3.7 ± 0.9
[-]4824 ± 85
[-]4533 ± 79
[-]4698 ± 83
Maximum, Å
Residual dihedral angle
constraint violations
Number [>= ] 2.0 degrees
Maximum, degrees
AMBER energies, kcal/mol
Total
Van der Waals
[-]352 ± 16
[-]315 ± 15
[-]325 ± 16
Electrostatic
[-]5398 ± 84
[-]5164 ± 71
[-]5283 ± 67
rms deviation from ideal
geometry
Bond lengths, Å
Bond angles, degrees
0.0084 ± 0.0002 0.0089 ± 0.0002 0.0084 ± 0.0003
2.25 ± 0.04
2.41 ± 0.04
2.29 ± 0.04
0.65 ± 0.10
0.79 ± 0.11
0.81 ± 0.11
1.06 ± 0.09
1.27 ± 0.10
1.26 ± 0.13
0.51 ± 0.12
0.60 ± 0.12
0.68 ± 0.13
rms deviation to the
averaged coordinates, Å
N, C[alpha ], C'
(125-228)
All heavy atoms
(125-228)
N, C[alpha ], C' of
regular secondary structures †
* Except for the top two entries, the data characterize the group of 20 conformers that is used to represent the
NMR structure; the mean value and the standard deviation are given.
† Secondary structure elements are formed by residues 128-131 ([beta ]-strand 1), 144-154 ([alpha ]-helix 1), 161164 ([beta ]-strand 2), 173-194 ([alpha ]-helix 2), and 200-228 ([alpha ]-helix 3).
49
PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR
8. LITERATUR
• Kurt Wuethrich: NMR of Proteins and Nucleic Acids, Wiley 1986
• John Cavanagh, Wayne J. Fairbrother, Arthur G. Palmer III, Nicholas J.
Skelton: Protein NMR Spectroscopy Principles and Practice, Academic
Press 1996
• NMR of Macromolecules - A practical approach, Oxford University Press
1993
• Ad Bax: Two-Dimensional NMR and Protein Structure, Annu. Rev. Biochem.
1989. 58:223-56
• Zahn et al.: NMR solution structure of the human prion protein, PNAS
2000. 97(1): 145-150
9. ANHANG: BEZEICHNUNG
AMINOSÄUREN
DER
PROTONEN DER 20 NATÜRLICHEN
FIGUR 53. Seitenketten aromatischer Spinsysteme
50
PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR
TABELLE 54. Aminosäuren mit charakteristischen Spinsystempatterns im TOCSY
51
PHAR. CHEMIE: PROTEIN STRUKTUREN UND NMR
TABELLE 55. Typ-J Spinsysteme
TABELLE 56. Typ-U Spinsysteme
52
Herunterladen