Chemische Prinzipien der Strukturbiologie (LvNr. 300631) WS10 Skriptum GNU General Public License 1 – Konzepte in der Strukturbiologie Die Strukturbiologie geht der Frage nach, wodurch Proteine ihre Eigenschaften erhalten und welche chemischen Prinzipien ihrer Funktion zu Grunde liegen. Ein zentrales Thema der Strukturbiologie ist das folding problem, das bis heute ungelöst ist und vermutlich noch lange ungelöst bleiben wird. Dabei handelt es sich um die Frage, woher Proteine wissen, wie sie sich nach der Synthese am Ribosom falten sollen. Wenn man Proteine denaturiert, beispielsweise bei Säureeinwirkung oder durch Erhitzen, hat man bei manchen Proteinen eine reversible Strukturbildung bei Renaturierung festgestellt. Diese Beobachtung hat sofort zur Annahme geführt, dass die lineare Basenabfolge in der DNA die Strukturinformation für Proteine enthält und dass daraus für jedes beliebige Protein die Struktur vorhergesagt werden kann. Neben der Basensequenz gibt es aber eine weitere Informationsebene. Während der Translation am Ribosom kommt es zum Kinetischen Effekt, hervorgerufen durch Sekundärstrukturen der mRNA. Eine transkribierte mRNA ist im Gegensatz zur DNA bereits nicht mehr linear, sondern weist Strukturmotife wie hairpins auf. Das Öffnen dieser Strukturen bedeutet einen Aufwand für das System, daher ist die Geschwindigkeit der Translation nicht gleichförmig. Als Beispiel sei die linker-Domäne in diesem T7 Primase Fragment (PDB 1NUI) genannt. Sie entsteht aus einem kompakten Bereich der entsprechenden mRNA (linkes Bild). Während dieser Bereich aufgelöst wird, kann die Faltung der Nterminalen RNA polymerase domain (RPD) bereits am Ribosom beginnen, die Proteinbiosynthese pausiert inzwischen, daher spricht man auch vom pausing. Der Einfluss der Kinetik kann also entscheidend sein. Gäbe es hier kein pausing und keine variable Synthesegeschwindigkeit, käme es zum misfolding trotz korrekter Aminosäuresequenz und es könnte sich die katalytische RPD nicht ausbilden, der Phage könnte seine Gene nicht transkribieren.[1] Wenn man von Mutationen spricht, versteht man darunter entweder • eine nonsynonymous mutation → Veränderung der Aminosäuresequenz. -1- • eine synonymous mutation → gleiche Aminosäuresequenz, aber veränderte RNA-Struktur. Es gibt dokumentierte Fälle, in denen es zu veränderten Phänotypen durch veränderte Kinetik am Ribosom gekommen ist. Die Proteinbiosynthese ist ein hochgradig komplexer Prozess, der auf verschiedenen Ebenen, die miteinander gekoppelt sind, reguliert ist. Die Basensequenz ist dabei die erste Ebene, auf zweiter Ebene steht die Kinetik im folding code. Die meisten biologisch relevanten Prozesse sind Gleichgewichtsprozesse. Ein Gleichgewicht kann thermodynamisch oder kinetisch kontrolliert sein. Es handelt sich um eine Verteilung von Zuständen, hier A und B, die über eine Gleichgewichtskonstante Keq in Verbindung stehen. K eq A⇋ B (1) k1 k2 (2) K eq = Die Verteilung der Zustände wird durch ΔG wiedergegeben. G= H− S∗T (3) G=−RT∗ln K eq (4) In einem thermodynamisch kontrollierten Gleichgewicht ist der thermische Energieunterschied (EA) des Systems maßgeblich für die Gleichgewichtseinstellung. In einem kinetisch kontrollierten Gleichgewicht entscheidet der sterische Einfluss der Umgebung darüber, ob ein bestimmter Prozess bevor- oder benachteiligt wird, unabhängig davon, ob er energetisch durchführbar ist. Ein Beispiel ist die Proteinbiosynthese. Es stellt sich bald die Frage, warum Proteinstrukturen interessant sind und warum es sich lohnt, sie zu erforschen. Einerseits geben sie Einsichten in das System, sodass die Funktionsweise besser erforscht werden kann. Andererseits können dadurch targets für die biomedizinische Forschung identifiziert werden. Vorraussetzung für das sogenannte rational oder structure based drug design sind Erkenntnisse über die Wechselwirkungen eines Proteins, intramolekular mit eigenen Proteindomänen oder intermolekular mit Liganden, Faktoren, die die Spezifität und Selektivität bestimmen, sowie die Arten von Wechselwirkungen, die ein Protein ausbilden kann. -2- Wenn man eine Struktur kennt, kann man zusätzlich die Bedeutung einer einzelnen Position innerhalb eines Polypeptids einschätzen. Eine Proteinstruktur stellt eine Art räumlicher Karte bereit, die über die Verteilung von Aminosäureresten (residues) Aufschluss gibt. Viele Proteine haben hydrophobe Kernbereiche und hydrophile Reste an der Oberfläche, nur diese sind für das drug targeting zugänglich. Ein wesentlicher Aspekt in der Evolutionsbiologie sind Phylogenien als Erklärungshilfe von Verwandtschaftsbeziehungen. Es gibt verschiedene Arten, Phylogenien aufzustellen, darunter phänotypische (Aussehen eines Organismus) und molekulare (Charakteristiken in der Primärsequenz). Es zeigt sich, dass die Primärsequenz recht variabel ist, Strukturen aber meist stark konserviert sind. Dadurch ergibt sich eine gewisse Mehrdeutigkeit im folding code, ein Hinweis auf den kinetischen Effekt. Die Variabilität ist dabei aber nicht uniform, man kann Bereiche auf der Primärsequenz unterscheiden, die eine hohe Mutationsdichte aufweisen, von anderen unterscheiden, die hochgradig konserviert sind. Beispielsweise enthält eine Serinprotease eine katalytische Triade (Asp-His-Ser), die unter keinen Umständen mutieren darf, sonst wäre das Protein keine Serinprotease mehr. Einige Institute betreiben structural genomics. Das ist der Versuch, alle Proteinstrukturen eines Organismus zu entschlüsseln. Dabei wird hauptsächlich Kristallographie angewandt, die ein wesentliches Problem beinhaltet, das generell ein Problem in der Strukturbiologie ist: Von 100 löslichen Proteinen (darin sind keine Membranproteine enthalten) kann man im günstigsten Fall 15 Strukturen erhalten, da viele Proteine unter den gewählten experimentellen Bedingungen keine verwertbaren Resultate liefern, sofern man es einmal schafft, sie zu kristallisieren. Es ist ein weit verbreiteter Irrglaube, dass ein Protein nur eine einzige Struktur einnehmen kann, die es die meiste Zeit behält. Hält man sich vor Augen, dass ein Protein ein System ist, das aus tausenden Komponenten besteht, so drängt sich aus dieser Tatsache bereits die Notwendigkeit des Vorhandenseins einer enormen Anzahl alternativer Strukturen auf. Die Strukturen eines Protein bilden ein Kontinuum. Das Levinthal-Paradoxon beschreibt anschaulich das Problem der Proteinfaltung, die kein Prozess mit einem einzigen definierten Endpunkt ( N … native ) ist. Auf dem Weg zum gefalteten Protein existieren Energiebarrieren und Entropietröge, die ein Protein in einer alternativen Form halten. Das dahinterstehende kombinatorische Problem ist, dass die Anzahl der möglichen Faltungen eines Proteins mit der Länge der Aminosäurekette exponentiell ansteigt. Selbst wenn jeder Aminosäurerest nur 2 Zustände annehmen könnte, gäbe es bei -3- einer Proteinlänge von n schon 2n mögliche Faltungsvarianten. Nimmt man an, dass eine Änderung der Konformation etwa 10 −13 Sekunden benötigt, so bräuchte ein 150 Aminosäuren langes Protein im schlechtesten Fall 2 150*10−13 s = 1,4*1032 s = 4,6*1024 y also über 1024 Jahre, um die optimale Konformation zu finden ( → vgl. das Alter der Erde von 4,55*109 Jahren). In Wirklichkeit jedoch haben Proteine meist nur eine Halbwertszeit von wenigen Stunden bis Tagen, und die korrekt gefaltete (native) Form wird normalerweise schnell gefunden (Sekundenbruchteile bis Minuten). Die Faltung kann also nicht durch ein zufälliges Durchprobieren aller Möglichkeiten erklärt werden. Vielmehr gibt es natürliche Mechanismen, die bei der Faltung helfen, wie zum Beispiel das pausing am Ribosom (roter Pfad im rechten folding funnel). Das Vorhandensein verschiedener Strukturen kann beim Kristallisieren von Proteinen zu einem Problem werden: Angenommen ein Protein liegt in Zustand A (asymmetrisch) und B (translationssymmetrisch) vor, so erlaubt Zustand B eine Kristallbildung. Zustand B liegt aber in diesem Beispiel nur zu 1% vor, den Rest macht der häufigere Zustand A aus. Im Zuge der Kristallisation fällt Zustand B aus, aus dem Gleichgewicht zwischen den Zuständen wird B aus A nachgebildet, bis kein A mehr vorhanden ist und als B im Kristall vorliegt. Man hat das Protein zwar erfolgreich kristallisiert, nur leider nicht den repräsentativen Zustand. Die Zustände eines Proteins sind ineinander überführbar, sie stehen im Gleichgewicht. Selbst bei sehr spitzem folding funnel gibt es noch Moleküle, die ausreichend thermische Energie besitzen, um die Energiebarrieren zu überwinden. [2] Im rechten Diagramm sind Übergänge wahrscheinlicher als im linken, es muss nur geringe thermische Energie im System sein. Wenn der kristallisierte Zustand nicht der energetisch günstigste ist, ergibt sich ein fundamentales Problem. Der mehrheitlich vorliegende Zustand muss auch nicht der aktive Zustand sein. Wie soll dann ein Strukturbiologe eine gefundene Struktur argumentieren? Ist die gefundene Struktur für die Funktion relevant? Durch NMR-Spektroskopie wurde festgestellt, dass CREB unter normalen Bedingungen zu 97% kompakt, zu 0,7% als ungefaltetes Ensemble und zu 2,3% mit nur einer einzigen von drei alpha-Helices vorliegt (α3). Winzige Energieunterschiede in der Größenordnung einer einzigen Wasserstoffbrücke führen zu Veränderungen im System. Als Faustregel gilt bei 25°C, dass eine Veränderung von Keq um etwa 100, einen Energieunterschied von 2,8 kcal/Mol beinhaltet. Eine zweite Wasserstoffbrücke erhöht K gemäß Gleichung (4) bereits auf 10000 ( → ln(a)+ln(b) = ln(a*b) ). Das -4- klassische Beispiel für diese logarithmische Abhängigkeit, die oft in der Biologie zu finden ist, ist DNA. Eine einzelne Basenpaarung hat keinen wahnsinnig großen Beitrag zur Stabilität, die Aufteilung auf viele schwache Wechselwirkungen führt aber zu einer winzigen Dissoziationskonstante und daher gewaltigen Stabilität. Bei gleichzeitig hoher Stabilität ist hohe Plastizität erforderlich, um Transkription und Replikation zu ermöglichen. Dabei nutzt die Natur Wechselwirkungen, die für sich allein wenig Energie zur Auflösung beanspruchen und eine lokale Öffnung des Komplexes erlauben. Effektoren können Komplexierungsgleichgewichte verändern. Man spricht dann von Allosterie, der Veränderung der Verteilung der Zustände, oder Strukturen, eines Proteins. Eine Protein-Ligangen-Interaktion wird durch die Komplexbildungskonstante, beziehungsweise der Dissoziationskonstante als Kehrwert, ausgedrückt. K D= [ P][ L] [ PL] (5) Ein σ-Faktor, dessen KD nanomolar ist, bindet im Gegensatz zu einem σ-Faktor mit millimolarem KD viel stärker an DNA, weil ein kleiner KD bedeutet, dass die Anzahl freier Komplexpartner gering ist. Analog verhält es sich mit dem pK a von Säuren. Mit abnehmener Konzentration, liegt immer mehr eines Komplexes dissoziiert vor. Die Konzentrationsabhängigkeit des K D-Wertes hat besondere Konsequenz, wenn man das Ergebnis eines yeast-two-hybrid-Experimentes mittels Koimmunpräzipitation auf falsch-positive Interaktion überprüfen möchte. Erhählt man im Luciferase-readout ein deutliches Signal und beinahe keine Komplexbildung bei KoIP, so schließt man schnell auf unspezifische Interaktion bei zum Beispiel millimolarem K D. Man begründet die Schlussfolgerung mit dem Argument, bei zellulärer Konzentration zu arbeiten. Dies ist aber Selbsttäuschung, weil man die zelluläre Konzentration nur über das Verhältnis Proteinmenge/Zellvolumen schätzt und eigentlich gar nicht kennt. Dabei lässt man außer Acht, dass die Komplexbildung in der Zelle von der lokalen effektiven Konzentration abhängt, die durch Zellkompartimente und akkumulierende Hilfsfaktoren moduliert sein kann. Es gibt Proteine ohne definierte 3D-Struktur, aber deshalb sind sie nicht unstrukturiert. Sie haben trotzdem strukturelle Aspekte, die ein schwer fassbares Kontinuum bilden. Sie unterscheiden sich nur hinsichtlich ihrer Kompaktheit von anderen Proteinen. Dogmatisch muss daher festgehalten werden, dass es so etwas wie random coil nicht gibt. Linderstrǿm-Lang haben eine hierarchische Repräsentation als konzeptuellen Rahmen zur Interpretation von Ergebnissen aufgestellt. Sie erlaubt die Diskussion von Aspekten unter steigendem Abstraktionslevel, das sind gedankliche Ebenen, aus denen sich eine Funktion erschließt. Folgende räumliche Korrelationsebenen der Aminosäuren eines Proteins sind enthalten: • 1° - Primärsequenz: Lineare Abfolge der AS, jede Position ist mit der vorhergehenden und nachfolgenden Position in Kontakt • 2° - Sekundärstruktur: Eine Position kann in Wechselwirkung zB mit i+4 stehen • 3° - Tertiärstruktur: Eine Position kann mit einer Position i+300 wechselwirken • 4° - Quartärstruktur: Korrelation auf molekularer Ebene Am Beispiel von Myoglobin und Hämoglobin wird deutlich, dass sich der Funktionsunterschied erst auf Ebene der Quartärstruktur zeigt. Purinbindende Proteine unter- -5- scheiden sich erst auf Ebene der Primärsequenz, andere Reste sind an der Bindung der Heterocyclen beteiligt. Neben diesem Interpretationskonzept kann man weitere aufstellen, die Festlegung auf ein Konzept beeinflusst in jedem Fall die Interpretation von Ergebnissen. Wenn man von Wechselwirkungen spricht, meint man meist ein paarweise Interaktion zwischen Aminosäuren mit passenden Eigenschaften wie elektrostatische Ladungen oder hydrophoben Seitenketten. Eine AS wird dabei als eigene Einheit mit spezifischen Eigenschaften betrachtet. Ein Glutamat oder Aspartat hat beispielsweise eine (de-)protonierbare COOH-Gruppe mit einem definierten pKa-Wert als freie Aminosäure. In einem Protein muss nicht jeder Glu-Rest den gleichen pKa-Wert haben, weil Effekte einwirken können, die die Anion-Form stabilisieren, als Folge steigt die Säurestärke, andererseits kann die Dissoziation auch durch eine entsprechende Umgebung gehemmt sein. Im folgenden Bild ist die Anion-Form eines Glutamats in Milieu 2 stabilisiert, Milieu 1 begünstigt dagegen die neutrale Form aufgrund der abstoßenden gleichartigen Ladung. In Lysozym, das die Bindung zwischen N-Acetylglucosamin und N-Acetylmuraminsäure mit Hilfe zweier saurer Aminosäurereste spaltet, kann dieses Phänomen beobachtet werden. Rest 1 existiert in der Neutralform und stellt ein Proton bereit, während der zweite Rest deprotoniert als Anion vorliegt (Nukleophil). Bei der Diskussion von Eigenschaften von Aminosäuren im Proteinverband wäre es unverantwortlich, die Werte der Eigenschaften der freien Spezies anzuwenden. Sie entsprechen nicht den tatsächlichen Verhältnissen im Protein! Die klassische Strukturbiologe beschäftigt sich mit der Position und Abständen von Atomen im Raum. Es ist konzeptionell schwierig, Umgebungseffekte zu modellieren, die meistens nicht auf paarweise Wechselwirkungen reduzierbar sind. In einem Beispiel a) hat ein Protein 2 Subdomänen A und B, die jeweils in 2 Energie zuständen, A/A' beziehungsweise B/B' existieren können. Jeder Übergang hat eine Energiedifferenz ΔGAA' und ΔGBB'. Die Subdomänen sind nicht unabhängig voneinander, mehr ist über das Protein nicht bekannt. An B bindet nun ein Ligang (B⇌[B'L]). Was passiert nun mit Domäne A? Durch die Kopplung verändert sich ΔGAA' und -6- Zustand A' könnte nun ebenfalls affin für einen Liganden sein (Positive Allosterie). Die essentiellen Reste für die Kopplung könnten nun mittels Mutationsexperimenten identifiziert werden, man erhält eine deterministische Interpretation anhand der Strukturinformation. In Beispiel b) hat man eine Mutation identifiziert, die auf den ersten Blick irrelevant scheint, weil sie weder an der Ligandenbindungsstelle noch dem Interface der Protein-Protein-Wechselwirkung liegt. Dennoch kann sie ΔGBB' verändern, da AS im System untereinander in Kontakt stehen. Ein Protein ist also ein kooperatives System, das Ergebnis kooperativer Interaktion von Aminosäureresten. Eine Aminosäure kann daher im Protein niemals als selbstständig betrachtet werden. Die Veränderung eines Restes pflanzt sich auf das System fort. Ähnlich verhält es sich, wenn ein Protein erhöhter Temperatur ausgesetzt wird. Das fortschreitende Entfalten bezeichnet man als „Schmelzen“, vom Schmelzpunkt spricht man, wenn 50% der Faltung linearisiert vorliegt. Auch hier zeigt sich die Kooperativität durch den sigmoiden Verlauf. Das Aufklären kausaler Zusammenhänge der Kooperation ist sehr schwierig, denn die Verteilung von Zuständen als biologisches Grundprinzip definiert Struktur und Verhalten eines Proteins. Biologische Systeme sind plastisch, evolvierbar, stabil und bieten die Möglichkeit der Kopplung mit anderen Systemen. Moderate Energiebarrieren erlauben die Bildung situationsabhängiger Komplexe und eine permanente Reaktion auf Zustandsänderungen. Die Schwierigkeit besteht darin, Kopplung auszudrücken, wenn man die einzelnen Kompenenten nicht als isolierte Einheiten betrachten darf. Einen Lösungsversuch stellt die topologische Metastrukturanalyse dar. Ein Punkt steht für eine AS, die verbunden werden, wenn sie räumliche Nachbarn sind. Das ist der Fall, wenn die Strecke Cα-Cα kleiner als 8Å ist. Der konkreten Art der Wechselwirkung wird dabei keine Beachtung geschenkt. Abhängig von der Art der AS kann man kürzeste Wege berechnen: , A , B ,l A , B (6) Wenn man nun tausende Strukturen der Protein Database (PDB) durchrechnet, erhält man eine Verteilung der Abstände zwischen zwei verschiedenen AS und daraus den durchschnittlichen Abstand. Damit kann man nun unter Einbeziehung einer Primärsequenz ein gewisses Maß an Strukturinformation berechnen. Zwei Zahlenwerte pro Rest ergeben eine quantitative Codedarstellung der Struktur: -7- • • Vorraussage der Sekundärstruktur Zahlenwert; Welche Sequenzbereiche scheinen eine Sekundärstruktur zu bilden? Kompaktheit Anzahl der umgebenden Reste; Kehrwert der Summe der kürzesten Strecken; Hydrophobe Bereiche (Proteinkern) haben mehr direkte Nachbarn, lA,B ist klein, daher die Kompaktheit groß. In hydrophilen Abschnitten (Oberfläche, mobile Regionen) sind die Reste weiter entfernt, die Kompaktheit ist gering; Viele Proteine können nicht kristallisiert werden, da sie zu mobil sind. Die Kompaktheit ist ein gutes Maß für die Sinnhaftigkeit eines Kristallisationsversuchs. Unterhalb eines Grenzwerts von 300 pro Rest, ist die Wahrscheinlichkeit, dass das Protein eine rigide Struktur hat, sehr gering. Neben der Berechnung einer Mindestkompaktheit für die Kristallisation erhält man als viel wichtigeren Aspekt eine Aussage über die Ähnlichkeiten von Proteinen. Der Bioinformatiker arbeitet unter anderem mit protein folds. Dabei nimmt er an, dass sich ein fold wie ein Atom verhält und unter allen Bedingungen gleich ist, so wie ein Ca-Atom (fast) immer ein Ca-Atom bleibt und sich klar von einem He-Atom unterscheidet. Ein protein fold verhält sich so aber nicht. Eine Metastruktur braucht nun gar keine folds, man arbeitet nur mit Aminosäuren. Die einzige Annahme ist, dass eine Aminosäuren-Art immer diese Art bleibt, ein Glutamat also immer ein Glutamat. Die Eigenschaften sind zwar kontextabhängig, die Zusammensetzung bleibt aber gleich. Beim Vergleichen von Sequenzen mittels BLOSUM oder BLAST, die auf der statistischen Austauschwahrscheinlichkeit von Aminosäuren beruhen, hat man ein Problem: Um die Austauschwahrscheinlichkeit zu berechnen, benötigt man ein aligment, für das man widerum die Austauschwahrscheinlichkeit braucht. Man läuft in einen Zirkelschluss, weil man die Aminosäure nicht kennt, die an einer bestimmten Position ursprünglich zu finden war. Man muss sich vor Augen halten, dass diese Methoden von Beginn an nur eine Näherung liefern können. Die evolutiven Raten, die dabei genutzt werden, haben mit der Chemie der Aminosäuren nichts zu tun, da ein Austausch in der mRNA codiert vorliegt und von Mutationen der Nukleotide abhängt, die für sich selbst nicht mit gleicher Wahrscheinlichkeit evolvierbar sind. Der Vorteil der Metastrukturanalyse liegt darin, dass ein chemischer Vergleich statt evolutionären Aspekten zur Bildung eines alignments herangezogen wird. Das kann dazu führen, dass man Ähnlichkeiten in der 3D-Struktur findet, die auf Primärebene nicht offensichtlich sind, obwohl man die Struktur nicht kennt. Als wesentliche Folge kann man dann Analysen durchführen, für die man normalerweise eine Struktur braucht. Somit umgeht man die geringe Ausbeute beim Auffinden von Strukturen. Wenn man eine Proteinstruktur eines therapeutischen targets aufgeklärt hat und einen Ligangen kennt, der an dieser Protein an bekannter Stelle bindet, kann man protein structure similarity clustering (PSSC) durchführen. Dabei vergleicht man die Struktur mit anderen Proteinen, von denen man die Struktur nicht kennen muss, und erhält eine Aussage darüber, ob der Ligand auch diese Proteine bindet. [3] Protein meta structure similarity clustering (PMSSC) macht nun auch die sonst notwendige Struktur, gegen die man vergleicht, überflüssig. Wenn man gute Metastrukturen aus der Primärsequenz ableitet, gilt das gleiche Argument, das klassische Dogma der Strukturbiologie, gleiche Struktur hat gleiche Funktion, an. Haben zwei Proteine ähnliche Metastruktur, werden sie mit hoher Wahrscheinlichkeit ähnliche Liganden binden. -8- Ein großes Argument für experimentelle Strukturbiologie ist, die relevanten Positionen eines Proteins zu identifizieren, also der Frage nachzugehen, wie das Protein seine Funktion ausübt. In vielen Fällen ist der Hauptteil eines Proteins nur ein Gerüst, das die Interaktionsstellen bildet beziehungsweise positioniert, daher ist zu einem gegebenen Zeitpunkt immer nur ein winziger Teil von Interesse. Es wäre also praktisch, auf diesen Teil hineinzoomen zu können. Man kann Proteine auf Grund ihrer Sequenz in Bezug auf Interaktionsstellen mittels Metastrukturanalyse voranalysieren. Protein-Protein-Wechselwirkungen involvieren zum Beispiel in erster Linie exponierte Reste, daher kann man bereits verborgene kernnahe Reste ausschließen. Die exponierten Bereiche haben charakteristische Metastrukturmotife. Von einem unbekannten Protein berechnet man nun eine Metastruktur und vergleicht diese paarweise gegen eine Datenbank von bekannten interagierenden Metastrukturen. Das Ergebnis ist ein residue plot, ein Histogramm mit einem Wahrscheinlichkeitswert für jeden Rest, in einer Interaktionsstelle involviert zu sein. Dabei tauchen hot spots von 15-20 AS Länge auf.[4] Ein Beispiel soll die Wirksamkeit dieser Methode illustrieren. Zellen, die mit c-myc transformiert werden, zeigen eine transkriptionelle Inhibierung des Tumorsuppressors BASP1 (brain acid-soluble protein 1).[5] Überexprimiert man das Gen über einen retroviralen Vektor in der Zelle, ist die proliferative Wirkung der c-myc Überexpression aufgehoben und die Zelle geht in Apoptose. In diesem Zellassay wurden weiters Peptide mit gleicher Länge eingesetzt, a) ein Peptid, das nichts mit BASP1 zu tun hat, b) ein Peptid, das nicht als Bindungspartner vorhergesagt wurde und c) ein Peptid, das an eine vorhergesagte Interaktionsstelle binden sollte, um zu zeigen, dass dieser Faktor wirklich entscheidend beim Absterben der Tumorzellen ist. Der tatsächliche Bindungspartner von BASP1 bleibt bis heute unbekannt. Es hat sich gezeigt, dass diese kleinen 18AS-Peptide durchaus eine relevante, nanomolare Affinität haben. Der Vorteil für die Strukturbiologie, der sich daraus ergibt, ist, dass man direkt funktionelle Stellen untersuchen kann, ohne zuerst auf mitunter umständliche Weise Informationen über das Gerüst, also den restlichen Teil des Proteins sammeln zu müssen. Die Affinität von Proteinen und Peptiden ist nicht nur auf andere Proteine beschränkt, auch Nukleinsäuren können mit Sequenzmotifen von Proteinen wechselwirken. -9- Transkriptionsfaktoren enthalten an ihren DNA-Interaktionsstellen sehr oft planare Gruppen von aromatischen (Phe, Tyr, Trp), basischen (Arg, Asn, Gln) oder sauren Aminosäuren. Basische Reste stabilisieren die Wechselwirkung zusätzlich durch die günstige Elektrostatik. Die Wechselwirkung beruht dabei auf dem sogenannten π-stacking, dem Überlappen der π-Orbitale von Nukleobase und planarem Aminosäurerest. Die in der Sequenz folgende Nukleobase wird aus der Doppelhelix herausgeflippt, das durchgehende π-stacking geht verloren, die Leitfähigkeit entlang der Helix ist unterbrochen, der Startpunkt zum Aufschmelzen der DNA somit gesetzt. Das Einlagern von planaren Gruppen zwischen Nukleobasen bezeichnet man als Interkalation. Der Abstand zwischen den Basen nimmt dabei an der interkalierten Stelle zu. 2 – Eigenschaften von Aminosäuren Aminosäuren kann man an Hand von verschiedenen Kriterien gruppieren, zum Beispiel nach Hydrophobizität, Aromatizität, Basizität oder Acidität. Am Beispiel von Phenylalanin zeigt sich aber, dass das nicht immer eindeutig ist, Phe ist aromatisch und hydrophob zugleich. Aminosäure Alanin Cystein Aspartat Glutamat Phenylalanin Glycin Histidin Isoleucin Lysin Leucin Methionin Asparagin Prolin Glutamin Arginin Serin Threonin Valin Tryptophan Tyrosin 3-Letter 1-Letter Ala Cys Asp Glu Phe Gly Hid Ile Lys Leu Met Asn Pro Gln Arg Ser Thr Val Trp Tyr A C D E F G H I K L M N P Q R S T V W Y pI 6,01 5,05 2,85 3,15 5,49 6,06 7,60 6,05 9,60 6,01 5,74 5,41 6,30 5,65 10,76 5,68 5,60 6,00 5,89 5,64 pKa pKa pKa (α-Carboxyl) (α-Amin) (Seitenkette) 2,35 1,92 1,99 2,10 2,20 2,35 1,80 2,32 2,16 2,33 2,13 2,14 1,95 2,17 1,82 2,19 2,09 2,39 2,46 2,20 9,87 10,70 9,90 9,47 9,31 9,78 9,33 9,76 9,06 9,74 9,28 8,72 10,64 9,13 8,99 9,21 9,10 9,74 9,41 9,21 8,18 3,90 4,07 6,04 10,54 12,48 10,46 MW 89,09 121,16 133,10 147,13 165,19 57,07 155,16 131,18 146,19 131,18 149,21 132,12 115,13 146,15 174,20 105,09 119,12 117,15 204,23 181,19 Hydrophobizität 0,616 0,680 0,028 0,043 1,000 0,501 0,165 0,943 0,283 0,943 0,738 0,236 0,711 0,251 0,000 0,359 0,450 0,825 0,878 0,880 pKa-Wert Manche Aminosäuren besitzen (de-)protonierbare Gruppen (Asp, Glu) und daher eine Säure- bzw. Basenkonstante, die bei den genannten Aminosäuren im Bereich von Essigsäure bei 4,7 liegt. Enthält ein Protein beispielsweise 10 Glu, so hat nicht jeder Rest einen pKa von 4.7, die Umgebung übt einen Einfluss auf den pKa-Wert aus, wie früher schon erwähnt. Die pKa-Werte der proteinogenen Aminosäuren sind in der folgenden Tabelle gelistet. Histidin nimmt eine besondere Stellung ein, da man durch den pKa nahe beim Neu- - 10 - tral-pH in biologischen Umgebungen schwer den momentan vorliegenden Zustand abschätzen kann, man muss also eine Gleichverteilung annehmen. Am isoelektrischen Punkt (pI) liegen freie Aminosäuren als Zwitterionen vor. Es ist der pH-Wert, bei dem die effektive Nettoladung null ist. Bei einem pH-Wert ungleich dem isoelektrischen Punkt besitzen sie eine gewisse Nettoladung, die zusammen mit der Teilchengröße die Migrationsgeschwindigkeit und Migrationsrichtung in einer Lösung, die sich in einer Elektrodenkammer befindet, bestimmt. Hydrophobizität und Hydrophilie Manche Aminosäuren haben apolare Kohlenwasserstoffreste als Seitenkette, andere polare und geladene. Die Art der Seitenkette bestimmt die Tendenz, mit Wasser in Kontakt zu treten. Apolare Seitenketten (Phe, Ala, Leu, etc.) zeigen hydrophobes Verhalten im Gegensatz zu hydrophilen Seitenketten (Glu, Asp, etc.). Die Hydrophobizität leistet einen wesentlichen Beitrag bei der Strukturbildung, da hydrobobe Reste die Kontaktfläche mit dem Wasser zu minimieren versuchen. Daher bilden hydrophobe Rest oft Proteinkerne, während hydrophile Reste an der Oberfläche zu finden sind, die die Kontaktfläche zu maximieren suchen. UV-Absorption Aromatische Aminosäuren absorbieren ultraviolette Strahlung zwischen 250-290 nm. Diese Eigenschaft kann man nutzen, um Proteine qualitativ und quantitativ zu detektieren. Dem Lambert-Beer'schen Gesetz zufolge ist die Absorption der Konzentration proportional: E=c Protein∗∗d (7) Die Absorption setzt sich gewöhnlich aus den Beiträgen der drei aromatischen Aminosäuren zusammen, da deren Absorptionsmaxima nahe beieinander liegen. Redoxpotential Cystein kann unter Oxidation Disulfide ausbilden, was zur Stabilisierung und oft erst das Ausbilden einer Proteinstruktur ermöglicht. −1 −1 R–S– S–R ⇌ −2 (8) 2R– S H Disulfidbrücken können intramolekular innerhalb deselben Peptids entstehen (Insulin), aber auch intermolekular, wenn ein Peptid mehr als zwei Cysteine besitzt. Letzteres ist meist unerwünscht, da sich sonst unlösliche inaktive Aggregate bilden können. Daher muss man auf reduktives Milieu achten (Dithiothreitol, DTT; βMercaptoethanol). Dabei muss man widerum die Stöchiometrie beachten, da man nur intermolekulare Disulfide verhindern möchte und keine essentiellen intramolekularen Disulfide brechen möchte. Cystein kommt relativ selten in humanen Proteinen vor (anders als manche Toxine) daher ist das gehäufte Auftreten von Cys, zusammen mit His, Trp oder Met ein Indiz für besondere Funktionen. Koordinative Komplexierung von Metallionen In einer Zelle herrscht nicht überall das gleiche Redoxpotential, die Zellkomparti- - 11 - mente unterscheiden sich dabei oft deutlich. So herrscht im Zellkern ein reduzierendes Milieu vor, das das Bestehen von Disulfiden verhindert. Die Natur hat aber eine alternative Strukturstabilisierung in Form von Metallkomplexen erfunden. In vielen Transkriptionsfaktoren wird Zn2+ durch 4 Cysteine komplexiert, man spricht dann von einem zinc finger protein. Die koordinative Bindung unterscheidet sich von einer klassisch kovalenten dadurch, dass die Bindungselektronen ausschließlich vom Ligangen stammen, hier also von den freien Elektronenpaaren des Schwefels, somit bekommt das Zink sein Oktett voll. Liganden unterscheidet man nach ihrer Zähnigkeit, also der Zahl von Koordinationsstellen. In einem Zinkfinger sind das vier, es bildet sich ein [ML]-Komplex. Im Gegensatz zu einem [ML4]-Komplex, bei dem jede Koordinationsstelle auf einem anderen Ligandenmolekül liegt, ist der Entropieverlust geringer. Gemäß Gleichung (3, Gibbs-Helmholtz-Gleichung) ergibt sich für den [ML]-Komplex eine negativeres ΔG, dieser Komplex bildet sich spontan und ist stabiler: ΔS = -(3R+3T) bei [ML], ΔS = -(9R+9T) bei [ML4]. Man spricht bei diesem Entropieeffekt vom Chelateffekt. Eine Folge der elektronenziehenden Wirkung des Metalls auf den Schwefel ist, dass die Partialladung des Wasserstoffs positiver wird und der pKa-Wert des Thiols steigt, das im Zinkfinger dadurch als Thiolat vorliegt. Das stabilisiert den Komplex zusätzlich. Dieser Effekt wirkt sich auch auf andere Weise aus. In Metalloproteasen wird dadurch die Reaktivität von Carbonylgruppen erhöht, indem der Carbonylsauerstoff ein Metallion komplexiert, wodurch die Partialladung am Carbonylkohlenstoff stark positiv wird und einen nukleophilen Angriff begünstigt Die Carbonanhydrase katalysiert die Bildung von Bicarbonat aus H2O und CO2. CO2 H 2 O ⇌ H 2 CO 3 ⇌ H ⊕ HCO3– (9) Das Enzym enthält ein katalytisches Zink, das zusätzlich zu drei Koordinationsstellen des Peptids, ein Wassermolekül koordiniert, dessen K s von 10-14 auf 10-8 steigt, sodass ein 106-fach reaktiveres Hydroxidion entsteht. - 12 - Beim Verwenden von vorgefertigten Kits, die zum Beispiel einen Mix aus Proteasehemmern enthalten, ist es von essentieller Bedeutung, über alle Bestandteile Bescheid zu wissen. Enthält das Kit beispielsweise EDTA, einen 4-zähnigen Liganden, der 2-wertige Ionen komplexiert, muss man daran denken, dass das Protein, das man untersuchen möchte, ein Zinkfinger-Motif enthalten könnte. EDTA verhindert zwar in so einem Fall richtigerweise die Wirkung von Proteasen, indem es ihnen ihre Metallionen entzieht, aber auch der Zinkfinger wird zerstört. Im Vorfeld kann man die Aminosäure-Sequenz auf Muster wie CXXC~(16-20AS)~CXXC untersuchen. Dieses Sequenzmotif, in dem C durch H, D oder E ausgetauscht sein kann, weist auf das Vorhandensein von Zinkfingern hin, von denen ein Protein auch mehrere enthalten kann. Peptidbindung Eine Peptidbindung ist im chemischen Sinn eine Amidbindung mit partiellem Doppelbindungscharakter, der die Ausbildung eines mesomeren Gleichgewichts erlaubt. Die Doppelbindungsform erlaubt keine freie Drehbarkeit entlang der C-N-Achse auf Grund der Überlappung der π-Orbitale. Als Konsequenz sind die Bindungslängen unterschiedlich, C-O– ist länger als C=O und kürzer als C-OH, C=N ist kürzer als C-N. Bezüglich der Anordnung von benachbarten C-Atomen kann eine cis- und eine transKonfiguration vorliegen, von denen letzte günstiger ist und zu mehr als 90% vorkommt. Nur Prolin macht hier eine Ausnahme, das in beiden Konfigurationen vorliegen kann. Es gibt sogar Enzyme, die diese Isomerisierung durchführen. Als Folge des Mesomeriegleichgewichts ändern sich die chemischen Eigenschaften, die Säure-Base-Eigenschaften im speziellen, die in der Biologie von wesentlicher Bedeutung sind. Der Stickstoff im Amid ist acider in der rechten Grenzstruktur, die Acidität des Wasserstoffs steigt auf Grund des stärkeren Elektronenzugs durch den Stickstoff. Der anionische Sauerstoff wirkt als Protonenakzeptor. Diese Umstände sind die fundamentale Vorraussetzung für das kooperative Verhalten von Proteinen. Die rechte Grenzstruktur erlaubt die Ausbildung von stabilen Wasserstoffbrückenbindungen, die im wesentlichen partielle Deprotonierungen sind. Man spricht dann von low barrier hydrogen bonds (LBHB). Sie sind besonders stark und unterscheiden sich von gewöhnlichen Wasserstoffbrücken in der kurzen Distanz zwischen Donor und Akzeptor. Das Proton kann leicht zwischen beiden Heteroatomen wechseln, es gibt keine klare Zuordnung zu einer Seite. Die niedrige Energiebarriere ist aber nur gegeben, wenn sich die pKa-Werte, die im anderen Fall die Verschiebungsrichtung festlegen, nur marginal unterscheiden. Hat beispielsweise HY einen höheren pKa als HX, so liegt HX bei gegebenem pHWert stärker dissoziiert als HY vor, in Folge wird HY protoniert, das Gleichgewicht, die Wasserstoffbrücke, ist auf die Seite von HY verschoben. Ein beobachtbares Beispiel sind Serinproteasen. Das Histidin der katalytischen Triade shuttelt ein Proton vom Serin, das zum Nukleophil wird, zur Peptidbindung, - 13 - dessen Stickstoff protoniert wird, Serin greift das Carbonyl an. Entgegen der klassischen Vorstellung des rein elektrostatischen Charakters ist eine Wasserstoffbrückenbindung partiell kovalent. Die Kooperativität entsteht nun dadurch, dass die Ausbildung einer LBHB durch Verschiebung des Mesomeriegleichgewichts benachbarte Grenzstrukturen stabilisiert, die in Folge widerum Wasserstoffbrücken bilden und weitere Grenzstrukturen stabilisieren. So pflanzt eine Veränderung auf weitere Kooperationspartner fort. Das Ausmaß von Dynamik in Biomolekülen wird oft unterschätzt. Proteine sind in Lösung sehr plastisch, sie verändern ihr Volumen wie ein atmendes Wesen, Lösungsmittelmoleküle diffundieren mit hoher Geschwindigkeit hinein und wieder hinaus. Mittels NMR-Spektroskopie kann man das Rotationsverhalten quantifizieren. An der C-N-Achse von Dimethylacetamid ist Rotation möglich. Die beiden Methylgruppen A und B unterscheiden sich auf Grund ihrer Nähe zum Carbonylsauerstoff. Wenn dieser nicht in eine Wechselwirkung wie einer Wasserstoffbrücke eingebunden ist, senkt er die Rotation an C-N, da er die Wasserstoffe des Methyls anzieht. Wenn sich die Rotationsdauer der Messzeit annähert, erhält man breite Signale, da sich die Zustandsverteilungen überlagern. Bei hoher Rotation erhält man scharfe Signale. Daher lässt sich in solchen Experimenten die Rotationsgeschwindigkeit messen, die von der Temperatur abhängig ist. Trägt man log(Rotationsgeschwindigkeit) als Funktion der Temperatur 1/T auf, so erhält man als Steigung ΔG, aus der man über die Arrhenius-Gleichung die Aktivierungsenergie EA berechnen kann. Diese gibt Aufschluss darüber was bei einem Übergang von einem Zustand in den nächsten passiert und wie dieser thermodynamisch aussieht. Die Aktivierungsenergie ist außerdem vom Lösungsmittel abhängig. Formamid hat unterschiedliche EA abhängig davon, ob es in D 2O oder Dioxan gelöst vorliegt. D 2O ist sehr polar und bildet untereinander und mit Fremdstoffen Wasserstoffbrücken, Dioxan bildet höchstens eine. D2O verschiebt daher das Gleichgewicht in Richtung Doppelbindungsform, als Folge ist EA um 4-5 kcal/mol größer, weil die Rotation inhibiert ist. Dadurch verschiebt sich das Gleichgewicht um den Faktor 103 bis 104. Neben dem Lösungsmittel kann durch Kofaktoren die Gleichgewichtslage von Peptidbindungen verändert werden. Als Beispiel sei die Glutamat-Mutase (GlmS) aus Clostridium cochlearium genannt. Sie besteht aus zwei Domänen, eine wirkt katalytisch für die Bildung von (2S,3S)-3-Methylaspartat aus (2S)-Glutamat, die andere bindet den Kofaktor 5'-Adenosyl-Cobalamin (Vitamin B 12). Dadurch wird ein zusätzliche Helix (α1) stabilisiert, die in freier Form zwar vorhanden, aber schwach populiert ist. Diese ist für die katalytische Aktivität des Enzyms erforderlich. [6] - 14 - 3 Wechselwirkungen in Proteinen Die Torsionswinkel des Backbones von Proteinen werden • φ (zwischen C' − N − Cα − C') • ψ (zwischen N − Cα − C' − N) und • ω (zwischen Cα − C' − N − Cα) genannt. Dadurch kontrolliert der φ-Winkel den Abstand zweier CarbonylKohlenstoffatome, ψ den Abstand zweier Amid-Stickstoffe und ω den Abstand zweier α-Kohlenstoffe. Die Planarität der Peptidbindung zwingt den ω-Winkel normalerweise auf 180° (die häufige trans-Konformation) oder 0° (die seltene cis-Konformation). Der Abstand zwischen den α-Kohlenstoffatomen beträgt in der trans- und cis-Konformation etwa 3,8 bzw. 2,8Å. Die cis-Konformation ist hauptsächlich in der X-Pro-Peptidbindung zu beobachten (X ist eine beliebige Aminosäure), daher gilt Prolin neben dem achiralen Glycin als Strukturbrecher. Bei den besonders günstigen α-Helices z. B. liegt der φWinkel etwa bei −60°, der ψ-Winkel etwa bei −30°, wobei beide Winkel eine Toleranz von etwa ±30° zulassen. Die mit der Drehung um die Bindung variierende Enthalpie (Torsionsenergie) des Moleküls kann durch eine spezielle Funktion angenähert berechnet werden, aus der sich eine charakteristische Potentialkurve ergibt: E= A∗1cos B∗1−cos2 C∗1cos 3 (10) Durch Torsion entstehen Konformationsisomere, die an Hand folgender Regeln benannt werden: Eine Veränderung der Bindungswinkel führt zu einer Energieänderung, die im Zuge der Proteinfaltung minimiert wird. Die veränderbaren geometrischen Parameter sind: • • • Bindungsabstand Torsionwinkel Bindungswinkel - 15 - Das homology modelling zieht die geometrischen Eigenschaften eines bekannten Proteins heran, um eine wahrscheinliche Struktur eines unbekannten Proteins mit ähnlicher Primärsequenz zu modellieren. Die geometrischen Parameter des ersten Proteins werden als Ausgangswert benutzt, es reicht eine 60-70% Übereinstimmung in der Primärsequenz, um eine brauchbare Struktur des zweiten Proteins zu erhalten. Die sterische Energie setzt sich aus mehreren Energiebeiträgen zusammen. Diese Energiebeiträge ergeben sich hauptsächlich aus 5 Phänomenen: • • • • • Energieänderung Energieänderung Energieänderung Energieänderung Energieänderung bei Bindungsdehnung oder Bindungsstauchung bei Bindungswinkeldehnung oder Bindungswinkelstauchung bei Rotation um eine Bindung (Torsion) durch Van-Der-Waals Interaktionen (Anziehung, Abstoßung) durch elektrostatische Interaktionen (Anziehung, Abstoßung) Die Größe dieser Energiebeiträge liegt im Bereich zwischen der elektrostatischen Wechselwirkung und der Energie von Wasserstoffbrücken, ein Großteil wird durch die kovalente Bindung bestimmt, daher erfordert eine Veränderung der Bindungslänge den größten Energieaufwand. Bindungslängen, Bindungswinkel und Torsionswinkel nehmen Gleichgewichtswerte (optimale Standardwerte) ein. Abweichungen von diesen Gleichgewichtswerten (verursacht durch ungünstige sterische oder elektrostatische Interaktionen zwischen Molekülteilen) erhöhen ebenso wie ungünstige sterische oder elektrostatische Wechselwirkungen mit anderen Molekülen die Energie des Systems. Das Molekül sucht einen energetisch möglichst günstigen strukturellen Kompromiss. Es wird eine Konformation einnehmen, in der die Deformation von Bindungslängen und Bindungswinkeln möglichst gering ist, günstige Torsionswinkel eingenommen werden und möglichst viele attraktive sowie möglichst wenig repulsive van der Waals- und elektrostatische Wechselwirkungen auftreten. Die Gesamtenergie einer bestimmten Konformation setzt sich aus Energietermen zusammen, die die Energieänderungen bei den genannten Phänomenen beschreiben. Es ergibt sich folgende Potentialenergiefunktion: E= Er EE E vdW Eelstat (11) Die Energieterme (Einzelpotentiale) werden unabhängig voneinander berechnet und dann zur Gesamtenergie aufsummiert. Aus der so berechneten Energielage kann die wahrscheinliche Existenz der momentanen Molekülgeometrie abgeleitet werden. Es gilt folgende Hierarchie: E Länge E Bindungswinkel E Torsionswinkel (12) Energieterm der Bindungslänge Er = ∑ K b∗r−r 02 (13) bonds Der Energieterm der Bindungslänge basiert auf dem Hook'schen Gesetz (Federgesetz). Kb gibt dabei die Steifigkeit der Bindung entlang der Achse wieder (Kraftkonstante), die von der Art der Bindung abhängt: Einfachbindungen haben eine geringere Kraftkonstante als Dreifachbindungen. Der Wert r0 definiert die Gleichge- - 16 - wichtslänge, die die Bindung in Abwesenheit jeglicher anderer Kräfte einnehmen würde. Die Gleichung schätzt die Energie ab, die mit der Schwingung um die Gleichgewichtlänge assoziiert ist. Das Modell versagt allerdings, wenn die Bindungsdehnung in den Bereich der Dissoziation des Moleküls gelangt. Wichtig beim Morsepotential ist vorallem der Bereich um r, dem Minimum, da in diesem Bereich harmonische Änderungen stattfinden. Energieterm des Bindungswinkels E = ∑ K ∗−02 (14) angles Der Energieterm des Bindungswinkels basiert auf ähnlichen Modellvorstellungen, er gibt die Energie, die mit der Schwingung um den Gleichgewichtswinkel verbunden ist, wieder. Der Effekt von Kθ besteht in der Steigung der Parabelfunktion, θ0 gibt den Gleichgewichtswinkel in Abwesenheit jeglicher anderer Kräfte an. Der wesentliche Unterschied besteht darin, dass Kb stets größer als Kθ ist. Energieterm des Torsionswinkels E= ∑ A [1cos n−] (15) angles Der günstigste Torsionswinkel liegt bei 180°, dieser wird eingeschlossen, wenn die - 17 - Substituenten in anti-Stellung (trans) stehen. Der Faktor n beschreibt die Periodizität, also den Winkel, nach dem sich die Energiewerte wiederholen, in Ethan beispielsweise alle 120°. Der Phasenfaktor Φ berücksichtigt den Rotationszustand zu Beginn der Aufzeichnung. Der Faktor A gibt die Amplitude der periodischen Funktion an. Energieterm für nicht-kovalente Wechselwirkungen E= ∑∑ i −A ij r 6ij j Bij r 12 ij q ∗q i j ∑ ∑ D∗r i j ij (16) Die erste Komponente des Energieterms (van-der-Waals Term) setzt sich aus einem positiven, repulsiven und daher ungünstigen Teil und einem negativen, attraktiven und daher günstigen Teil zusammen. Man spricht vom Lennard-Jones-(6,12) Potential. Bei kurzen Distanzen zwischen den Interaktionspartnern überwiegt der positive Teil, mit zunehmender Entfernung der attraktive. Bei zu großen Distanzen sind beide null. Die van-der-Waals Wechselwirkung hat sehr kurze Reichweiten im Bereich von 2-3Å, das entspricht der Größenordnung von Atomradien. Bei großen Distanzen spüren sich Atome also nicht, aber es gibt einen Mindestabstand: Bei Annäherung steigt die Repulsion rasant, näher als die Summe der van-der-Waals Radien können sich die Atome nicht kommen, es ist der kürzest mögliche Abstand zwischen zwei Atomen, die nicht aneinander gebunden sind. Der van-der-Waals Radius (R) ist der Radius einer gedachten harten Kugel, die als Modell für das Atomverhalten herangezogen wird (hard sphere model). Atompaar Kontaktabstand [Å] H-H 1.9–2.0 C-H 2.2–2.4 C-C 3.0–3.2 C-O 2.7–2.8 C-N 2.8–2.9 O-O 2.7–2.8 O-N 2.6–2.7 { E AB R= 0 wenn RR A RB ∞ wenn RR A RB } (17) - 18 - Die zweite Komponente des Energieterms (Coulomb Term) beschreibt den elektrostatischen Beitrag zur Energie. Sind die Ladungen q i und qj gleicher Ladung, ist der Term positiv und die Interaktion ist repulsiv. Der Unterschied zur van-der-Waals Wechselwirkung ist, dass die Abhängigkeit von Radius 1/r statt 1/r⁶ bzw. 1/r¹² beträgt und die Reichweite der Wechselwirkung bei 10-20Å liegt. Die Dielektrizitätskonstante D ist ein Korrekturfaktor für Interaktionen, die nicht im Vakuum stattfinden. Die Coulomb-Energie ist in Wasser beispielsweise geringer. Wasser ist ein Dipol, zusammen mit dem Dipolmoment eines gelösten Stoffes wirkt es der Potentialdifferenz in einem elektrischen Feld entgegen, da ein Teil der Energie zur Ausrichtung der Dipolmomente konsumiert wird. Die Ladungen sind nur noch in reduzierter Form wirksam, die effektive Coulomb-Energie ist geringer. Ein polares Medium wirkt also der elektrostatischen Wechselwirkung entgegen, die in Wasser aber trotzdem so groß ist, dass es die erste Wechselwirkung zwischen zwei Molekülen ist. Die Temperatur erschwert die Orientierung der Dipole entsprechend dem elektrischen Feld, da damit mehr Molekularbewegung verbunden ist. Große Moleküle richten sich dementsprechend leichter aus als kleine, die ein stärker turbulentes Verhalten zeigen. Die biologische Bedeutung weitreichender elektrostatischer Wechselwirkungen zeigt sich in der katalytischen Effizienz von Enzymen. Für die Produktbildung sind Zusammenstöße zwischen Enzym und Substrat (manchmal noch zusätzlich Cosubstrat oder Cofaktor) erforderlich, und nicht jeder Aufprall muss auch produktiv sein. Die Aufprallwahrscheinlichkeit bestimmt die Produktbildungsrate. Aber manche Enzyme scheinen bei jedem Zusammenstoß das Produkt zu bilden. Diese mitunter ernorme Erhöhung der Effizienz wird durch weitreichende elektrostatische Wechselwirkungen erzielt, die einen dirigierenden Einfluss auf das Substrat nehmen, wie die Leitstrahlen auf einem Flughafen, ein korrektes Zusammentreffen zwischen Enzym und Substrat vermitteln. Der einfachste Fall elektrostatischer Wechselwirkungen besteht in 2 Punktladungen (q), die durch einen Abstand r voneinander getrennt sind. Es gibt aber auch Dipole (µ) an Bindungen, die einen Ladungsschwerpunkt entsprechend der Elektronegativitäten aufweisen. Daneben kann ein induzierter Dipol (α) durch Veränderung der Elektronendichte-Verteilung entstehen. Das resultierende Dipolmoment besitzt dann elektrostatische Eigenschaften. Die elektrostatische Energie hängt von der Art der Ladungsträger ab, aus denen sich unterschiedliche Distanzabhängigkeiten ergeben. E AB R=f Winkel ,elektr. Parameter , Dielektrikum∗R−n A B Energie n q q Cou 1 q µ Cou 2 µ µ Cou 3 q α Pol 4 µ α Dis 6 µ µ Dis 6 Die Distanzabhängigkeit für Dipole ist dann gegeben, wenn sie fix sind, andernfalls - 19 - spielt die relative Orientierung eine Rolle. Die antiparallele Anordnung der Dipole ist günstiger als die parallele. Sind die Dipole beweglich, muss die mittlere Anordnung und daher durchschnittliche Energie der Dipole berechnet werde. Darüberhinaus sind nicht alle Anordnungen gleich wahrscheinlich. Jede Orientierung besitzt eine gewisse Energie, die Wahrscheinlichkeit für diese Orientierung beträgt e hoch minus der Energie. Durch die Berücksichtigung der Wahrscheinlichkeit wird aus 1/r³ eine Distanzabhängigkeit von 1/r⁶. E v ∗e−E / kT ∫ E AB= ∫ e− E / kT (18) E AB B=e 20 /4 e 0 Ion-Ion B /1 /Rq A q B Ion-Dipol −1 /3 B2 1/ R4 q 2A 2B /kT Dipol-Dipol −2 /3 B2 1/ R6 2A 2B /kT Die Energie für einen Dipol von 1 Debye (2 Ladungen 1nm entfernt) beträgt bei Raumtemperatur 0.07 kJ mol⁻¹. Die kinetische Energie beträgt 3.7 kJ mol⁻¹ (25°C) und ist damit etwa 50-mal größer als die Dipolenergie. Diese reicht nicht aus, um die Dipole zu orientieren. Die Formel drückt aber aus, dass die Dipolmomente zur 4. Potenz eingehen. Vergrößert man das Dipolmoment auf 2D, vergrößert sich die Energie um den Faktor 16, bei 10D um den Faktor 10⁵. Eine kleine Variation im Dipolmoment führt also zu einer dramatischen Änderung der Energie. In einer Helix sind alle Wasserstoffbrücken ungefähr parallel, die Dipolmomente addieren sich, sodass die Helix als ganzes ein makroskopischer Dipol ist. Am CTerminus ist der negative Pol, am N-Terminus der positive. Als Konsequenz binden negativ geladene Reaktanden wie ATP oder P i im Bereich des N-Terminus einer Helix. Der Transkriptionsfaktor myc bildet mit seinem Interaktionspartner max einen dimeren Komplex, in dem 70-75 Reste pro Molekül eine Helix bilden, etwa 150 Reste bilden also einen Dipol. Diesen kann man messen. In einem elektrischen Feld richtet sich der Komplex aus, was dazu führt, dass ein Teil der angelegten Spannung konsumiert wird. Den Abschirmungseffekt kann man in ein Dipolmoment unrechnen. Es hat sich gezeigt, dass der Komplex bei kleiner Konzentration ein Dipolmoment von über 1000D hat, das mit zunehmender Konzentration abnimmt. Warum? Eine Möglichkeit wäre, dass das Dimer aufgeht und die α-Helices nicht mehr existieren, die Dissoziation steigt aber nur mit sinkender Konzentration. Tatsächlich bilden sich bei höherer Konzentration aber binäre Komplexe durch antiparallele Anordnung der Dipole in kooperativer Weise, sodass das effektive Dipolmoment null wird. - 20 - Bei der Transkription spielen außerdem Enhancerelemente eine wichtige Rolle, die meist weit upstream der transkribierten Gene liegen. Proteine wie p53 rekrutieren enhancerbindende Proteine unter Ausbildung eines Proteinkomplexes, myc/max macht das gleiche ohne der Notwendigkeit der Komplexbildung, alleine durch DipolDipol-Wechselwirkung. Die Dipolenergie hat in Lösung bereits dirgierenden Einfluss (1/r⁶), bei DNA-Bindung erhöht sich die Energie der Wechselwirkung nocheinmal (>>1/r⁶). Besonders große Energien werden bei Cytoskelettproteinen erreicht, die viele coiledcoil-Regionen aufweisen. Darin bilden nun 300-700 Reste statt der 150 in myc/max einen Dipol. Man darf dabei nicht vergessen, dass das Dipolmoment zur 4. Potenz steigt! In einer Zelle herrschen also enorme Dipolkräfte und elektrostatische Kräfte, die Energien sind hoch und weitreichend. Daher ist freie Diffusion in Zellen reine Fiktion! Der Unterschied von Dipol-Dipol-Wechselwirkungen und Tetrameranordnungen wird deutlich, wenn man die Situation betrachtet, in der ein Rest der Helix mutiert ist, sodass sich die Helix schlecht bis gar nicht mehr ausbildet. Die Mutation hat keinen Einfluss auf die Wechselwirkungen des Gesamtkonstrukts, da die Wechselwirkung eben nicht von einzelnen Resten abhängt. Clathrate Wasserstoffbrücken liefern in Summe einen hohen Energiebeitrag, weil sie in vorallem in wässrigem Milieu sehr zahlreich sind. Sie besitzt einen teilweise kovalenten Charakter, da das freie Elektronenpaar des Carbonylsauerstoffs beispielsweise in Proteinen das anti-bindende Orbital des Wasserstoffs an der Aminogruppe teilweise besetzt, als Folge wird die N-H-Distanz länger. - 21 - Wasser selbst ist ein Netzwerk aus Wasserstoffbrücken, im hexagonalen Eis nimmt jedes H2O einen Eckpunkt eines Hexagons ein. Dieser Anordnung existieren nun 2 Arten von O-H-Bindungen: Kovalente und Wasserstoffbrücken. Bei tiefer Temperatur kann man diese Zustände separiert voneinander betrachten, der Übergang zwischen ihnen erfordert mehr Energie als im abgekühlten System vorhanden ist. Deshalb erhält man in einem IR-Spektrogramm zwei Signale. Diese Frequenzen ergeben sich aus der Schwingung um eine Gleichgewichtslänge der Bindung, sowie der Art der Atome. Auch als Flüssigkeit hat Wasser eine einzigartige Struktur: Jeder Sauerstoff als Akzeptor hat zwei Koordinationsstellen, jedes Molekül zwei Wasserstoffe als Donor. Dadurch ergeben sich hochgeordnete cluster, die allerdings keineswegs starr sind, sondern in einem dynamischen Gleichgewicht ständiger Ausildung und Zerfall im Picosekunden-Bereich unterliegen. Die entstehenden Käfigstrukturen verdanken ihre Existenz dem kooperativen Verhalten der einzelnen Wassermoleküle. Alle gelösten Stoffe werden hydratisiert: Egal ob Ion oder Protein, alle sind von einer Solvatationshülle umgeben, die auf unterschiedliche Art und Weise gestaltet sein kann. Ionen umgeben sich auf Grund ihrer Koordinationsstellen von oktaedrischen oder anderen geometrisch definierbaren Hüllen, andere Stoffe haben keine ausgeprägten Koordinationsstellen wie Ionen. Die solvent accessible surface (SAS) einer Verbindung legt daher fest, wie die Wechselwirkung zu anderen Molekülen in wässriger oder organischer Phase ist. Kein Biomolekül hat eine ausschließlich hydrophile oder hydrophobe Oberfläche, das Verhältnis bestimmt den empirischen Verteilungskoeffizient logP, der nichts anderes als die Gleichgewichtskonstante der Verteilung der Verbindung zwischen einer wässrigen und organischen Phase ist. Der lopP ist proportional zum Energieunterschied der Verbindung in wässriger und organischer Phase. Wird eine hydrophobe Substanz gelöst, so muss das Wasser darauf reagieren, da zum Beispiel durch CH4 Wasserstoffbrücken gestört werden. Die Wassermoleküle ordnen sich in einer Käfigstruktur um das hydrophobe Molekül an, um es gegenüber dem Rest des Wassers abzuschließen. Die entstehenden Strukturen, in denen Ionen oder Moleküle eingeschlossen werden, bezeichnet man als Clathrate. - 22 - Wie sieht die Thermodynamik dieser Strukturen aus ? Lokal sind sie hochgeordnet im Vergleich zum Rest des Lösungsmittels ( bulk phase). Die Entropie sinkt, daher wird ΔG positiver, entropisch ist der Prozess also ungünstig. Enthalpisch wird der Prozess allerdings begünstigt, da die Käfigstruktur weniger Raum einnimmt, die Kooperativität wird optimal genutzt. Bei tiefen Temperaturen relativiert sich der entropische Anteil, sodass sich die Struktur bei niedrigerer Temperatur leichter bildet. Ein anderer Parameter ist der Druck: Die Käfigstruktur wird bei höherem Druck erleichtert gebildet, da durch die Struktur weniger Volumen eingenommen wird. Das klassiche Beispiel ist die Bildung der Methanlagerstätten. Bei Proteinen ist die Sache nicht so dramatisch. Durch den hydrophobem Effekt als treibende Kraft der Proteinfaltung wird eine Struktur eingenommen, bei der der Kontakt zwischen hydrophoben Bereichen und dem Lösungsmittel minimiert ist, die SAS wird maximiert. Daher findet man hydrophobe Aminosäuren im Kern, hydrophile an der Oberfläche, was aber nicht exakt realisierbar ist. Proteinstrukturen haben Ähnlichkeiten zu Kristallstrukturen. Theoretische Physiker haben Vergleiche zwischen Polymeren und den Aggregatzuständen der Materie gezogen. Fest bedeutet, dass Einzelzellen (Monomere) mit hoher Periodizität translationssyssmetrisch in alle Raumrichtungen angeordnet sind, es eine hohe Korrelation zwischen Nah- und Fernordnung gibt. In einer Flüssigkeit herrscht noch eine große Nahordnung (zum Beispiel Wasserstoffbrücken), mit zunehmender Distanz geht sie aber verloren. In Gasen schließlich gibt es keine Ordnung mehr. In Analogie dazu kann man die Zustände von Polypeptiden sehen. Salopp als random coil bezeichnete Zustände wären demnach gasförmig, da sie wenig bis keine Ordnung aufweisen, bis zum anderen Extrem, der definierten 3D-Struktur als festen Zustand, liegen einige Phasen mit zunehmender Teilordnung dazwischen. Max Born beschäftigte sich unter anderem mit der Theorie atomarer Kristallgitter und stellte dabei fest, dass die Stabilität von Kristallen durch attraktive und repulsive Faktoren erklärt werden kann. Die beiden Triebkräfte, deren physikalische Grundlage zunächst nicht von Bedeutung ist, haben unterschiedliche Distanzabhängigkeiten, nämlich 1/r für Attraktion und 1/r n für Repulsion. In Proteinen ist der attraktive Anteil der hydrophobe Effekt, der repulsive besteht in der Abstoßung gleicher Ladung. Diese Beiträge drängen je nach vorwiegendem - 23 - Anteil, eine bestimmte Struktur einzunehmen. In random coils würde demnach der repulsive Anteil überwiegen. Das Ausmaß der einzelnen Beiträge kann man an Hand der Primärsequenz erkennen. Liegen viele hydrophobe und wenige geladene Reste oder Reste mit alternierenden Ladungen vor, kann sich eine gute Faltung mit ausgeprägtem Energieminimum ausbilden. Der hydrophobe Effekt und anschließende Lennard-Jones-Wechselwirkungen sind die einzige Möglichkeit, gute Minima mit hohem Energiebarrieren zu bilden. Reste, die nicht mit Lennard-Jones-Potentialen kompatibel sind, wie elektrostatische, erhöhen die Repulsion und verbreitern das Minimum. Das Konformationsspektrum erweitert sich. Erniedrigt man den pH-Wert einer Proteinlösung, verändert sich dessen Struktur und das Protein fällt aus. In random coils nimmt die Repulsion ab und es bilden sich partiell Strukturen, da durch Protonierung Ladung verschwindet ( → Glu, Asp ). Ein Beispiel ist pro-Thymosin α, das einen sigmoiden pH-Verlauf zeigt, was wie der sigmoide Temperaturverlauf anderer Proteine auf Kooperativität hinweist. Wieder ein Beispiel dafür, wie unsinnig es ist, von unstrukturierten Proteinen zu sprechen, man muss deren Eigenschaften lediglich bei den richtigen Umgebungsparametern erforschen. Nun könnte man argumentieren, dass ein pH von 3 physiologisch irrelevant ist, dabei vergisst man aber, dass eine Säure nicht notwendigerweise H+ in wässriger Phase sein muss, ein protonierter Lysinrest kann Effekte hervorrufen, die bei pH 2 stattfinden. Auch Salze nehmen Einfluss auf attraktive und repulsive Kräfte innerhalb von Proteinen. Man spricht vom Einsalzen, um die Löslichkeit eines Proteins zu erhöhen, vom Aussalzen, um die Löslichkeit zu verringern. Die Hofmeister-Reihe lautet für Anionen und Kationen: 2F -PO 3+ 4 SO 4 CH 3 COO Cl Br I NO3 ClO 4SCN Cl3 CCOO NH +4Rb+ K + Na+ Li+ Mg 2+Ca 2+ Ba2+ Ionen links werden als antichaotrop (kosmotrop) bezeichnet, sie erhöhen den hydrophoben Effekt und sind daher besonders schonende Fällungsmittel. Die weiter rechts stehenden (chaotropen) Salze vermindern hydrophobe Effekte und führen zur Denaturierung von Proteinen. Salze nehmen durch Veränderung der Enthalpie Einfluss auf die Stabilität der Clathrate. 4 Strukturelemente in Proteinen Die Vielfalt der Proteine kann man auf sich wiederholende Konstruktionen in anderer Kombination zurückführen. Proteine verwenden eine geringe Anzahl an Strukturmotifen. Bei der Ausbildung einer Proteinstruktur, insbesondere des hydrophoben Kerns, lagern sich hydrophobe Seitenketten zusammen, die backbones der Aminosäuren sind allerdings nicht hydrophob. Es müssen sich Wasserstoffbrücken ausbilden, um die Dipolenergie der C=O und N-H auszugleichen. Dafür gibt es grundsätzlich zwei Möglichkeiten. α-helix Lokale Wasserstoffbrücken zwischen Sequenznachbarn. Diese Vorraussetzung führt zu spezifischen geometrischen Eigenschaften. Eine - 24 - Wasserstoffbrücke zwischen den AS i und i+4 legt deterministisch die Wechselwirkungen von i+1, i+2 und i+3 fest, die Reste sind voneinander abhängig. β-sheet Keine Sequenzbeschränkung. Die Sekundärstruktur legt die Anordnung der Seitenketten fest. In einer α-helix stehen alle Seitenketten radial nach außen, während die Wasserstoffbrücken parallel zur Helixachse orientiert sind. Die Ganghöhe beträgt 3,6 Reste, mit einem vertikalen Abstand von 1,5 Å. Aus diesem Parametern lässt sich beispielsweise die Helixlänge aus der Primärsequenz abschätzen, was praktische Konsequenzen hat: Möchte man die Überexpression eines Gens in vivo lokalisieren, so wird man Fluoreszenzlabel verwenden. Dazu stellt man eine Mutante mit 2 Cys in der Helix her, um ein Arsenhältiges Label daran zu besfestigen. Dabei ist es aber notwendig, dass bei der Platzierung diese geometrischen Parameter beachtet werden, sonst liegen beide Reste plötzlich zu weit oder zu nah beieinander, sodass der Fluoreszenzmarker nicht daran bindet. Entsprechend der Ganghöhe zeigen die Seitenketten jeder siebten Aminosäure in die gleiche Richtung. Diese i+7 Beziehung findet man in Strukturmotifen wieder, wie dem Leucin-Zipper, der zu coiled-coil-Proteinen (Transkriptionsfaktoren) führt. Die Erkennungspunkte zwischen den beiden Helices sind dabei nur durch eine bestimmte Aminosäure charakterisiert, die meisten Reste sind mit dem anderen Protein nicht in Kontakt, leisten also keinen Beitrag zur Interaktion, trotzdem bilden sich stabile Komplexe. In der Pharmazie geht man immer mehr dazu über, statt Enzyminhibitoren, direkte Protein-Protein-Wechselwirkungen zu nutzen. Dabei gibt es aber ein Molekulargewichts-Limit (1-1,5kDa), Proteinwirkstoffe mit 20 kDa (übliche Größe eines kleinen Proteins) werden sehr schlecht resorbiert. Die Interaktionstellen zwischen Proteinen seien Helices mit etwa 20AS, der restliche Strukturballast muss eigentlich nicht ins Medikament. Die Interaktionstellen können mit etwas Geschick so nachgeahmt werden, dass alle chemischen Charakteristika enthalten sind, aber anders als in Form von Aminosäuren in eine chemische Gerüststruktur verpackt werden. Solche kleinen Moleküle, die im Übrigen gar keine Peptide sein müssen, bezeichnet man als Helical Mimics. Ein Konstrukt mit vier spezifischen Resten zur Wechselwirkung (Carbonsäure, Isopropyl, Amin, Methyl) - 25 - ergeben bereits einen KD von 10–12. Mit wenig Material kann man also einen hochaffinen Inhibitor erhalten. Die radial abstehenden Reste einer Helix kann man in einem helical wheel darstellen. Das Innere der Spirale stellt die unteren, der Rand der Spirale die oberen Reste dar, wenn man von oben auf eine Helix schaut. Diese Darstellung zeigt die Oberflächenbeschaffenheit einer Helix, daraus kann man ableiten, wo man die Helix finden wird, entweder cytosolisch oder membranständig. Das Enzym in der Mitte hat zur Hälfte apolare (grün) und geladene (rot/blau) Reste, daher spricht von einer amphiphilen Helix. Transmembrantransporter und Ionenkanäle werden oft von heptameren Anordnungen solcher Helices aufgebaut. Neben der α-Helix kennt beziehungsweise vermutet(e) man andere Typen von Helices, deren Geometrie durch andere Beziehungen zwischen Akzeptor und Donor der Wasserstoffbrücken festgelegt ist: α-Helix π-Helix (i+5; 4,1 Reste pro Windung, 1,15Å Ganghöhe) 310 Helix (i+3; 3 Reste pro Windung, 2Å Ganghöhe) Polyprolinmotife nehmen eine pseudohelikale Struktur ein, Wasserstoffbrücken (kein N-H) fehlen aber. Man unterscheidet polyproline helix I und polyproline helix II. Proteindomänen wie SH3 oder WW (Beispiel: Yap65) erkennen polyprolinrepeats, flankierende Aminosäuren sorgen für Spezifität der Wechselwirkung. In β-sheets besteht keine strikte Beziehung bezüglich der Primärdifferenz. Zwei strands bilden eine sheet, entsprechend deren relativen Orientierung und Anordnung der Wasserstoffbrücken unterscheidet man parallele (links) und antiparallele (rechts) β-sheets. - 26 - Dadurch entsteht das namensgebende Faltblatt, dessen Winkelung die Anordnung der Seitenketten bestimmt. In beiden Typen von Faltblättern zeigt jeder 2. Rest in die gleiche Richtung. Ein Ramachandran-Plot zeigt die statistische Verteilung von Diederwinkeln (φ und ψ) eines bestimmten backbones, die auf Grund der Planarität der Peptidbindung und geometrischen Vorgaben durch die sterischen Eigenschaften der Seitenketten nur bestimmte Werte annehmen können. Ramachandran-Plots sind für jeweilige Typen - 27 - von Proteinen charakteristisch. Man kann an Hand eines Ramachandran-Plots auch die Häufigkeit von α-Helices, β-sheets und anderer Sekundärstrukturen im Molekül abschätzen. Der alpha-helikale Bereich (-60/-60) hat eine geringere Variabilität als der beta-sheet Bereich (-120/120), da dieser mehr Freiheitsgrade besitzt und leichter eine Verdrehung oder Verdrillung mitmachen kann, bei der eine Alphahelix bereits nicht mehr existieren kann. Der Bereich 60/40 wird von extended conformation Elementen, wie der Polyprolinhelix, eingenommen. Sekundärstrukturen sind aus der Primärsequenz recht gut vorhersagbar, vor allem weil mittlerweile eine große Datenbasis (55.000+ Sequenzen in der PDB) existiert. Alphahelices sind dabei besser vorhersagbar, da der Kontextbezug auf die nächste Umgebung beschränkt ist, während in Betasheets weit abgelegene AS miteinbezogen werden müssen. Einige prediction server sind: • • • molbiol.soton.ac.uk/compute/GOR.html indy.ipr.serpukhov.su/~rykunov/alb maple.bioc.columbia.edu/pp Sekundärstrukturen können durch andere funktionelle Module verbunden sein. Antiparallele Betasheets bilden sogenannte turns, von denen zwei Formen unterschieden werden. Typ I turns haben ähnliche Diederwinkel wie 3 10 Helices und den Carbonylsauerstoff nach außen stehend, während Typ II turns nur mit Glycin an dieser Stelle und nach innen stehendem Carbonylsauerstoff gebildet werden. Diese beta-hairpin-turns sind mit anderen hairpins kombinierbar, die einfachste Form dieser Kombination sind 3 beta strands, die sich einen mittigen strand teilen. Nun spricht man von beta meanders. - 28 - Auch Helices können mittels turns verbunden sein. In den sogenannten helix-turnhelix Motifen bestimmt der turn die relative Anordnung der Helices, da im turn im Gegensatz zu zwischen Helices Wasserstoffbrücken existieren. Der turn widerum als autonomes Strukturmotif kann beispielsweise Metalle wie Ca 2+ binden. So entsteht ein funktionelles Modul, das als Sensor für die Ca 2+-Konzentration (rechts) in der Umgebung oder als DNA-Bindungsmotif ( links) wirken kann und als EF hand bezeichnet wird. Die Metallkomplexierung bewirkt, dass sich der Winkel zwischen den Helices verändert, was kooperative Effekte im restlichen Protein nach sich ziehen kann. Es wird Calcium gegenüber Zink präferiert, da zur situationsabhängigen Signalübertragung eine reversible Bindung gewährleistet werden, der Sensor nach Abfallen des Stimulus wieder in den Grundzustand übergehen können muss. Zink würde auf Grund des kleineren Ionenradius viel zu stark binden. DNA-Bindungsmotife können auch auf andere Weise durch Dimerisierung an Betasheets zusammengesetzt werden, sodass sich zwei Helices als eigentliche Interaktionsstellen in die major groove der DNA einlagern können (intermolekulare Betasheets). Da dabei so eine gute Passung erreicht wird, kommt es zu keiner nennenswerten Konformationsänderung der DNA. Andere Strukturelemente wie in p53 oder TBP binden an die minor groove. In NMR-Messungen hat man festgestellt, wie die Interaktion zwischen Transkriptionsfaktor tatsächlich geschieht. Es stellt sich natürlich die Frage, wie ein Molekül in einem riesigen Haufen wie dem Chromatin seine Sequenz findet (bei myc CACGGT). Eine diffundierende Fortbewegung mit zufälligen DNA-Kontakten würde Zeiträume von Jahren erfordern, damit endlich das zu aktivierende Gen gefunden würde. Vielmehr folgt einem zunächst unspezifischen Kontakt ( encounter complex) ein Entlanggleiten an der DNA, bis eine spezifische Wechselwirkung entsteht. Proteine, die mehrere Betasheets enthalten, haben mehrere Möglichkeiten diese zu kombinieren. Die Ausbildung intermolekularer Betasheets wie im DNA-Bindungsmotif kann auch Folge einer fehlerhaften Faltung sein. Beim domain swapping ordnen sich beta sheets eines Monomers in die 3D-Struktur eines zweiten Monomers ein, sodass sich präzipitierende Aggregate ( amyloid plaques) oder sogar lineare Polymere ergeben können Dieses Phänomen ist Grundlage der conformational diseases. Serpine (serine protease inhibitors) bilden mit Serinproteasen Komplexe zur Inhibierung. Die Struktur erlaubt selbst in nativen Proteinen ein Umfalten, sodass die inhibitorische Stelle durch domain swapping verdeckt wird (unerwünschte Dimerisierung), die - 29 - Energiebarriere dafür ist aber unter normalen Bedingungen zu groß. Ein Erbdefekt führt nun dazu, dass zwar ein korrektes Protein gebildet wird, aber die Energiebarriere sinkt. Ein Fieberschub reicht nun aus, um domain swapping zu ermöglichen, sodass die inhibitorische Aktivität verloren geht und sich die Leber proteolytisch auflöst. Obwohl Dimerisierung mittels domain swapping hier unerwünscht ist, bietet es doch über Remonomerisierung eine zusätzliche Regulationsebene. Struktur eines domain swapped Antithrombin-Dimers [8][9]. 5 Proteinklassifizierung In der Theorie der erleichterten Variation erklären Marc Kirschner und John Gerhart, wie es zu Variation in der Evolution kommt. Robuste, konservierte Kernprozesse, deren Bestandteile variierbar sind ohne die Integrität zu verletzen, seien modulartig kopplungsfähig. Beispiele für Kernprozesse sind grundlegende Mechanismen der DNA und RNA Verarbeitung sowie die Proteinbiosynthese. Variation ist demnach nicht in den Komponenten eines Systems begründet, sondern in der Art und Weise (räumlich, zeitlich, funktionell), wie ein Prozess an den nächsten gekoppelt ist (weak regulatory linkage). Durch die Kopplung der Einheiten entsteht eine neue Qualität, da die Komponenten nicht mehr unabhängig voneinander sind. Ein System (Protein, Organismus, Ökosystem) wird also zu mehr als der Summe seiner Teile. Im Fall eines Proteins sind die Kernprozesse Sekundärstrukturen, die, in verschiedenster Weise kombiniert, zu Variation führen. Trotz der beschränkten Zahl an Motifen ergibt sich eine Fülle an strukturellen Möglichkeiten. Die CATH protein structure classification versucht eine hierarchische Gliederung basierend auf der Tertiärstruktur. Zunächst wird versucht, eine Struktur in Domänen zu trennen, was nicht immer trivial ist. Hierin liegt ein Unterschied zwischen CATH und SCOP, bei dem ein neuer fold eingeführt wird statt nach bekannten Domänen zu suchen (http://www.cathdb.info/ ).[10] CATH beschreibt Strukturen auf vier Ebenen: C(lass) A(rchitecture) Relative Anteile an Sekundärstrukturen Relative Anordnung im Raum - 30 - T(opology) H(omology) Aussage über Paarung von β-sheets, Arten von turns Clustering auf Grund ähnlicher Sequenz In Konkurrenz dazu steht SCOP (structural classification of proteins). In diesem Ansatz wird das Konzept von folds verfolgt, der Begriff fold hat aber bis heute keine eindeutige Definition, daher beruhen Zuordnungen hier auf subjektiven Ansichten. In gewissem Maß wird ein fold als atomare Einheit, also nicht weiter separierbare Kombination von Sekundärstrukturelementen angesehen (http://scop.mrc[11] lmb.cam.ac.uk/scop/ ). Möchte man ein Protein klassifizieren, das aus zwei Domänen (eine alphahelikal dominiert, die andere hauptsächlich aus β-sheets bestehend) besteht, gelangt man über diese beiden Ansätze zu unterschiedlichen Ergebnissen. Bei CATH wählt man zunächst die Klasse α&β aus, auf der Architekturebene findet sich aber beispielsweise keine passende Gruppe. Nun kann man beide Domänen getrennt vergleichen und man wird möglicherweise etwas passendes finden. In so einem Fall wird bei SCOP allerdings das Protein als neuer fold deklariert, was auf keinerlei objektiv begründbaren Fakten beruht. Als Alternative existiert QSCOP-BLAST ( http://qscop-blast.services.came.sbg.ac.at/ ), eine effiziente Strukturvergleichsmethode, die ausschließlich auf definierten Strukturelementen aufbaut. Es werden mehrere Lösungen geliefert und alle möglichen gemeinsamen Motife aufgelistet. [12] - 31 - 6 Methoden in der Strukturbiologie 6.1 CD-Spektroskopie[13] Linear polarisiertes Licht, das in der CD-Spektroskopie eingesetzt wird, kann man sich als Überlagerung gegenläufig zirkulär polarisierten Lichts mit gleicher Phase und Amplitude vorstellen. Die Schwingung erfolgt in nur einer Ebene, der Polarisationsebene. Wenn dieses Licht eine optisch aktive Substanz passiert, die unterschiedliche Absorption A für beide Komponenten des Strahls hat, wird die stärker absorbierte Komponente eine geringere Amplitude haben als die weniger stark absorbierte. Als Konsequenz der Addition der nun unterschiedlichen Feldvektoren führt zum Auftreten von Elliptizität, was als circular dichroism (CD) bezeichnet wird. Zusätzlich kommt es zur Drehung der Polarisationsebene um einen Winkel α, wenn sich der Brechungsindex n ändert. Die Änderung der optischen Drehung in Abhängigkeit der Wellenlänge wird als optische Rotationsdispersion (ORD) bezeichnet. Die Anwendbarkeit dieser Methode erfordert also die Anwesenheit von Asymmetriezentren in der Probe. Im Fall eines Proteins ist jedes C α ein Asymmetriezentrum, aber manche Aminosäuren haben auch asymmetrische Seitenketten. Daher misst man im Wesentlichen Eigenschaften des backbones und kann auf diesem - 32 - Weg Sekundärstrukturen beziehungsweise Sekundärstrukturanteile bestimmen. Ein CD-Spektrum umfasst Datenpunkte von 190-250nm mit der Elliptizität als Funktion der Wellenlänge. Aus einem experimentellen Spektrum wird mittels Deconvolution, einer numerischen Prozedur, ein fit erstellt, um die prozentualen Anteile an α-Helices (rot), β-Sheets (blau) und Coils (schwarz) zu bestimmen (linkes Spektrum). Die Methode liefert nur gesicherte Aussagen über der Anteil an Helices, weitere Quantifizierungen sind statistisch im verwendeten Wellenlängenbereich nicht zulässig. Am Beispiel vom Myoglobin, α-Helices werden mit einem Anteil von 80% bestimmt, passt das Ergebnis gut zum realen Wert von 77%. R-values (strichlierte rote Linie im rechten Spektrum) steht für den Residualwert des fits. Die Methode stellt verschiedene Anforderungen: • • Proteinkonzentration: Es wird mit 0,5-1 mg/ml recht viel Probe eingesetzt Matrixeffekte: Zusätze wie Puffer oder Detergentien dürfen nicht im verwendeten Wellenlängenbereich absorbieren, da sonst das Proteinsignal maskiert wird, einige Metalle absorbieren beispielsweise bei 190nm . Ebenso stören Verunreinigungen durch andere Proteine Die Auswertung eines CD-Signals beruht als Absorptionseffekt auf dem LambeertBeer'schen Gesetz. Es muss neben der Länge der Messzelle l, das Molekulargewicht M, die Zahl der Reste im Protein sowie die Konzentration in passender Einheit (decimol) berücksichtigt werden. Messwerte werden als mittlere Elliptizität pro Rest angegeben, in einer 1 mM Lösung eines Proteins mit 100 Resten liegen also 100 mM Peptid vor, daher muss man Arbeiten kritisch lesen, die eine quantitative Auswertung behandeln. mr=d∗ M c∗l∗n r ⇒ mrd = [ mr deg∗cm2 10 dmol∗residue ] (19) Welche Aussagen kann man nun mittels CD-Spektroskopie machen ? Man kann die Stabilität eines Proteins in Abhängigkeit vom Lösungsmittel bestimmen. Jede Helix führt zu einer Bande bei 208 nm als Indikator für die Existenz von Helices. Manche zeigen bei 222 nm eine weitere Bande als Indikator für Interaktion zwischen Helices (helical packing), dabei kann man aber keine Aussage über die Molekularität - 33 - machen, ob Helices zweier Monomere zur Bildung eines Dimers führen oder ob intramolekulare Helixinteraktion vorliegt. In einem konkreten Beispiel (myc/max) wurde die Elliptizität bei 222 nm als Funktion der Temperatur aufgetragen, um festzustellen, ob das Protein hier Struktur besitzt (sigmoider Verlauf). Myc ist dabei nur ein loses Arrangement von Strukturmotifen, eine Aussage über die Molekularität kann dadurch aber immer noch nicht getroffen werden. Der sigmoide Verlauf des Heterodimers Myc/Max beziehungsweise des Homodimers Max/Max im Vergleich zum graduellen Verlauf des Homodimers Myc/Myc deutet auf irgendeine Art der Interaktion zwischen Helices, hier helical packing hin, die durch die Bindung an DNA verstärkt wird, auch Myc/Myc nimmt dabei an Helizität zu. Die Dimere haben im ternären Komplex mit DNA darüberhinaus einen höheren Schmelzpunkt. Nun werden die thermodynamischen Parameter interessant. Die Dimerisierung ist eine Reaktion mit folgendem Schema und entsprechender Dissoziationskonstante, deren formaler Ausdruck mit Molenbrüchen f dargestellt werden kann: Ka 2M⇋D Kd K d= [ M ]2 =−K a [ D] f 2M K d =2 c M ∗ 1−f M f 2M 1 K d= cM∗ 2 1−f M (20) homodimer (21) heterodimer Mit der Temperatur wird der Proteinkomplex zunehmend zerstört, in einem kleinen Temperaturintervall ist die Konzentration gleichbleibend, nur die Elliptizität verändert sich linear proportional zur Temperatur. D/M T =D/M T d D/M ∗T dT (22) - 34 - Die Messung der Elliptizität bei einer bestimmten Temperatur ist ein gewichtete Summe der Elliptizitäten der Monomere und Dimere. T =1−f M ∗D T f M ∗M T (23) Aus den Molenbrüchen erhält man die Konzentration des Monomers bei gegebener Temperatur. Am Schmelzpunkt sind die Molenbrüche 0,5. f M= D T −T M T −T (24) In einer Versuchsreihe möchte man nun die freie Reaktionsenthalpie durch Puffervariation bestimmen, dabei trifft man die zulässige Annahme, dass ΔCp = d(ΔH0d)/dT für alle pH-Werte konstant ist. 0 0 G D =−RT∗ln K d = H D C p T −T 0 −T S D C p ln T /T 0 (25) Bei jener Temperatur, an dem ΔG gleich null wird, liegt der Schmelzpunkt. Im Myc/Max-Dimer ist ΔH positiver als im Max/Max-Dimer, das heißt, dass letzteres enthalpisch begünstigt ist, da das Interface zwischen Max besser für eine Wechselwirkung konstruiert ist. Der Myc/Max-Komplex wird allerdings entropisch begünstigt. Hier sieht man ein Beispiel für Enthalpie-Entropie-Kompensation. Wenn bei einer Dimerisierung eine Entropieänderung auftritt, spielen mehrere Komponenten eine Rolle. S D T = She T Srt S other (26) Der Beitrag durch den hydrophoben Effekt, der empirisch bestimmt wird, hängt von der Veränderung der Exposition hydrophober Reste, also der SAS, ab und begünstigt - 35 - in jedem Fall die Dimerisierung (stets negativ). Der Wert wird basierend auf der Struktur berechnet. S he T =−1,34∗ A np∗ln T 386 (27) Der Beitrag durch den Verlust an Freiheitsgraden ist positiv, temperaturunabhängig und ungünstig für die Komplexbildung. Der Wert ist aus der statistischen Mechanik bekannt. S rt =209 J mol -1 K -1 (28) Der dritte Term summiert Beiträge aus der Flexibilität der Seitenketten und ist von der Zahl der Reste R abhängig, die im Faltungsprozess involviert sind. Bei der Proteinfaltung werden manche Seitenketten rigid, sie verlieren Freiheitsgrade, was ungünstig für die Dimerisierung ist. S other =R∗23,4 J mol-1 K -1 (29) Der Faltungsprozess involviert bei Myc/Max 110 Reste, während im Max/Max-Dimer 126 Reste involviert sind. Die Strukturen und CD-Spektren sind in erster Näherung gleich, aber warum sind unterschiedlich viele Reste involviert? Die Antwort findet man in diesem Fall nicht im Endzustand des Systems, sondern im Anfangszustand, dem monomeren Myc, das im Vergleich zum ungeordneteren monomeren Max, teilweise rigid ist (residual structure). Wie ist nun der chemische Mechanismus der Myc-MaxDimerisierung? Max wird konstitutiv exprimiert und liegt als Dimer vor, Myc wird bei Bedarf exprimiert. Dabei muss ein Homodimer aufgebrochen und ein Heterodimer gebildet werden, was auf zwei Arten geschehen kann: Max 2 ⇋ MaxMax ⇋ Myc /Max Im dissoziativen Mechanismus, ähnlich einer SN1-Reaktion, dissoziiert zuerst der Komplex bevor sich das Heterodimer bildet. Die Konzentration von Myc nimmt dabei keinen Einfluss auf die Reaktionsgeschwindigkeit. Max 2Myc ⇋ Myc /MaxMax Im assoziativen Mechanismus, ähnlich einer SN2-Reaktion, ist Myc aktiv beteiligt und verdrängt Max. Die Reaktionsgeschwindigkeit ist daher von der Konzentration von Myc abhängig. In einem stopped flow Experiment, in dem monomere Myc-Lösung in eine dimere Max-Lösung injiziert wird, kann die Anfangsgeschwindigkeit in Abhängigkeit von [Myc] als Zunahme der Elliptizität bei λ = 222 nm gemessen werden. Dabei stellt man fest, dass die Reaktionsgeschwindigkeit mit steigender Konzentraion entgegen der Erwartung sinkt. Der Grund dafür ist, dass mit steigender Konzentration zwei Monomere Myc an ein Max-Dimer transient binden, was die Dissoziation behindert, - 36 - der Mechanimus ist also dissoziativ. Obwohl Myc autokatalytisch die eigene Expression fördert, ist es selbstrepressiv. Die einfachste Konsequenz aus dieser Kopplung von positivem und negativem feedback ist, dass ein Überschießen der Expression verhindert wird. Dieses feedback system enthält also eine aktivierende Komponente, die zur Konzentration linear proportional ist (ein Myc löst Max-Dimer auf), und eine inaktivierende Komponente, die eine quadratische Abhängigkeit hat (zwei Myc schirmen ein Max-Dimer ab). Dieses Prinzip findet man auf mehreren Organisationsebenen. Der belgische Mathematiker Verhulst, der sich unter anderem mit Populationsdynamik beschäftigt hat, beschreibt die Populationsentwicklung in einer ökologischen Nische mit einem einfachen Gleichungssystem, das genauso aktivierende und inaktivierende Terme hat. X n+1 =1R X n −R X n 2 (30) Je mehr Spezies vorhanden sind ( R), desto mehr Bifurcation und Oszillation zwischen verschiedenen diskreten Zuständen findet statt. Wenn eine gewisse Dichte erreicht ist, bei der sich ein konstanter Zustand einstellt. Das heißt die Population variiert zeitlich zwischen diskreten Zuständen, das System erhält einen Rhythmus und generiert diskrete Zeitsignale, beispielsweise in Form von Transkriptionsreignissen. Komplexität resultiert aus Kopplung und nicht aus der Komplexität der Komponenten, die erstaunlich einfach gebaut sind. 6.2 SRCD-Spektroskopie Die synchrotron radiation CD-Spektroskopie erweitert den Wellenlängenbereich auf 120-260 nm. Bereits bei 140-160 nm kann man Signale mit signifikanter Intensität erhalten. Durch die höhere Photonenintensität sind die experimentellen Spektren weniger verrauscht. Die Methode erlaubt eine bessere Quantifizierung von nichthelikalen Sekundärstrukturen wie β-sheets und γ-turns. 6.3 Massenspektrometrie Eine der unzähligen Anwendungen der Massenspektrometrie in der Biologie ist, eine Aussage über die Stabilität einer Proteinstruktur zu treffen. Der Stickstoff der Amidbindung ist acid, daher kann der Wasserstoff durch OH – abstrahiert und durch Deuterium (D) ersetzt werden, wenn man das Protein in schwerem Wasser (D 2O) löst. Diese Reaktion bezeichnet man als HD-Austausch. - 37 - Der Austausch erfolgt nicht so ohne weiteres, der entscheidende Schritt ist die Ausbildung einer Wasserstoffbrücke zwischen N-H und OH –. An Stickstoffen, die bereits eine Wasserstoffbrücke mit einem Carbonylsauerstoff gebildet haben, kann kein Austausch stattfinden. Nun kommt die Kinetik ins Spiel, wobei zwei Fälle unter schieden werden. k−1 NH closed ⇋ NH open (31) k1 EX1 – Die Austauschgeschwindigkeit wird durch k1 bestimmt, sofort nach Öffnen einer Wasserstoffbrücke geschieht der Austausch. EX2 – Die Austauschgeschwindigkeit ist abhängig vom Verhältnis der Konstanten. Die intrinsische Geschwindigkeitskonstante ist für alle Proteine gleich. k hbond = k1 ∗k k −1 intrinsic (32) Das Minimum der Austauschrate liegt bei etwa pH 4-5, Messungen werden aber bei pH 7 durchgeführt. Mit steigendem pH steigt die Austauschrate, da der Stickstoff acider wird. Mit sinkendem pH steigt die Rate ebenfalls, da durch das H + aus der Autoprotolyse des Wassers Carbonylsauerstoffe protoniert werden, was die Einstellung des closed state verhindert. Die Austauschrate ist in einem Protein entsprechend der lokalen Strukturverhältnisse unterschiedlich, daher werden exponierte Teile leichter H gegen D austauschen als Sequenzbereiche, die eine Sekundärstruktur bilden. Als Folge werden sich die Massen der einzelnen Proteinfragmente, die aus dem tryptischen Verdau vor der Messung hervorgehen, unterschiedlich verändern. Daraus lässt sich einerseits die Kinetik des HD-Austauschs verfolgen, andererseits auch feststellen, welche Positionen sich in einer Sekundärstruktur befinden. Eine weitere Anwendung, die auf demselben Prinzip aufbaut, ist das Auffinden von - 38 - Proteininteraktionsstellen. An jenen Positionen, die die Interaktion bewerkstelligen, ist die Austauschrate geringer, das Gewicht der Fragmente verändert sich kaum. 6.4 NMR-Spektroskopie Es gibt generell zwei Methoden zur Strukturaufklärung. Während die Röntgenkristallographie ausschließlich Messungen an Festkörpern durchführt, misst die NMR-Spektroskopie (nuclear magnetic resonance) mehrheitlich im flüssigen Zustand. Die Messung von festen Proben wie Membransystemen gewinnt aber immer mehr an Bedeutung. Unterschied Röntgenkristallographie NMR-Spektroskopie Wellenlänge nm cm bis m Aggregatzustand fest fest/flüssig Folgen einer Messung radiation damage beschädigungsfrei Messprinzip Beugung hochfequenter Strahl- Präzessionfrequenz; Ein ung am Kristall; Zurückrechnen Protein wird im Wesentauf ein 3D-Bild der Elektronen- lichen „gehört“ dichteverteilung und daraus räumliche Position der backbone-Positionen Qualität Sofern man es schafft, einen Kristall zu züchten und das Phasenproblem zu lösen, erhält man im besten Fall eine Struktur Neben dem Auffinden von Strukturinformation können verschiedene Ansätze entwickelt werden, je nach fraglichem Aspekt, beispielsweise eine ProteinLigand-Interaktion Die folgende Abbildung zeigt ein NMR-Spektrum von Lysozym. Jeder Peak entspricht einem individuellen 1H-Atom, beispielsweise bei -2,1 ppm. Die Bereiche weiter links sind Überlagerungen vieler Atome. Das Messprinzip der NMR-Spektroskopie beruht auf einem speziellen physikalischen Phänomen. Manche Atome besitzen ein magnetisches Moment, das aus dem Drehimpuls resultiert, der in jenen Atomen ungleich null ist, in denen entweder die Summe der Neutronen, die Summe der Protonen oder die Summe aller Nukleonen - 39 - ungerade ist. Der Drehimpuls ist eine quantisierte Größe (-½ oder +½) und kann nicht jeden beliebigen Wert annehmen. Ein 12C-Atom kann beispielsweise nicht detektiert werden, da der Kernspin µ null ist.[15], [16] =∗p ... magnetisches Moment des Kerns ... gyromagnetisches Verhältnis p... Drehimpuls (33) Das gyromagnetische Verhältnis ist eine atomsortenspezifische Größe mit individuellen Werten für 1H, 13C, 31P und andere. Durch Anlegen eines Magnetfelds B 0 kommt es zur Aufspaltung in Energieniveaus, die energetisch nicht gleichwertig sind. Die Energie ist minimal, wenn das magnetische Moment und das Magnetfeld parallel sind, maximal, wenn sie antiparallel sind. Die Bloch-Gleichung beschreibt die Bewegung einer Magnetisierung in einem Magnetfeld. d M dT = − B0 x M (34) Bringt man ein Teilchen, welches einen Spin besitzt, in ein äußeres Magnetfeld, so präzediert dieser Spin mit der Larmorfrequenz um das Magnetfeld. Die Präzession des Spins um ein äußeres Magnetfeld ist vergleichbar mit einem Kreisel, dessen Symmetrieachse nicht mit dem Drehimpuls identisch ist. Stimmt die Richtung des Spins nicht mit der Richtung des äußeren Magnetfeldes überein, wirkt auf den Spin eine Kraft ein, die zu einer Präzession des Spins um das Magnetfeld führt. 0=i B (35) Jede Atomsorte hat eine unterschiedliche Präzessionsfrequenz, obwohl alle im gleichen Magnetfeld liegen, was auf das gyromagnetische Verhältnis zurückzuführen ist. Nucleus 1 H γ Lamorfrequenz [Mhz], 14T Iostopenhäufigkeit [%] Sensitivität 100 600 99,98 13 C 25 150 1,10 10⁻⁵ 15 N -10 60 0,37 10⁻⁷ 40 243 100,00 0.07 31 P 1 Eine höhere Feldstärke legt die Sensitivität fest, da der Energieunterschied zwischen den magnetischen Quantenzuständen größer wird und ein Zustand bevorzugt wird (nhigh). Der Unterschied wirkt sich zwar erst in der 5. Nachkommastelle aus, durch die enorme Teilchenzahl in der Probe (10 20 in einer millimolaren Lösung) ergibt sich eine makroskopische Magnetisierung, dargestellt als Überschuss auf einem der Kegelmäntel, mit der man arbeiten kann. nhigh − E /kT =e nlow ⇒ 0.999904 bei 600 MHz - 40 - (36) Die Tatsache, dass die eingesetzte Energie und auftretende Energieänderungen gering sind, ist Vorteil und Nachteil zugleich. Einerseits wird die Detektion recht unempfindlich, andererseits wird es möglich, eine Untersuchung im ungestörten Zustand durchzuführen, es liegen also native Bedingungen in einem Gleichgewicht vor. Damit die Auslenkung aus der Z-Achse detektierbar wird, wird ein RF-Feld B 1 in Form von 5-50 µs Pulsen angelegt. Dadurch wird die Präzession verändert (Nuclei absorbieren Energie der Radiowellen), die Relaxation in den ursprünglichen Zustand induziert in einer Messspule einen oszillierenden Strom. Die Zeit der Relaxation wird mittels Fourier-Transformation in eine Frequenz umgerechnet. Zwei Atome der gleichen Kernsorte haben ein gleiches gyromagnetisches Verhältnis. In Ethanol sind allerdings die lokalen Magnetfelder für Wasserstoff unterschiedlich. Diese Abhängigkeit, die auf chemischen Umgebung eines Atoms beruht, bezeichnet man chemical shift. Das gesamte lokale Magnetfeld ist eine Folge des äußeren stationären Feldes und setzt sich aus dem externen Feld und der Abschirmung (shielding constant σ) zusammen, die chemische Umgebung (Bindungen, diamagnetic shielding) ausübt. Der Abschirmungseffekt bildet die Grundlage der Strukturaufklärung, da auf diese Weise verschiedene Frequenzen entstehen. Bloc = B0− B0 = 1− B0 = Bloc = loc (37) Um die Methode analytisch anzuwenden, muss eine Standardisierung erreicht werden. Man setzt dazu einen internen Standard (Tetramethysilan, TMS) als zusätzliche Komponente ein, um die Abhängigkeit der Frequenz von der magnetischen Feldstärke zu eliminieren. Messwerte werden anschließend relativ zu dieser Standardverbindung angegeben. = Differenz der Resonanzfrequenzen eines Atoms und einer Standardverbindung [ ppm ] Frequenz des RF−Pulses Dadurch erklärt sich auch, warum das Spektrum in ppm skaliert ist. Wenn man zwei Signale hat (4 und 8 ppm), dann ist ersteres upfield (kleinere ppm-Werte) vom zweiten, umgekehrt zweiteres downfield (größere ppm-Werte) vom ersten. Die Tatsache, dass die Frequenz extrem von Veränderungen in der Umgebung abhängt, macht die Stärke dieser Methode aus. Es kann beispielsweise unterschieden werden, ob sich eine Methylgruppe eines Leucins neben (3 ppm) oder unter dem aromatischen Ring eines Phenylalanins (-2,1 ppm) befindet. - 41 - Um eine Struktur zu bestimmen, müssen Korrelationen zwischen den Frequenzen hergestellt werden. Dazu erstellt man 2D-Spektren, die crosspeaks enthalten, aus denen man die erforderlichen Informationen ablesen kann. Bei COSY (correlation spectroscopy) werden Korrelationen auf Grund von chemischen Bindungen hergestellt. NOESY (Nuclear Overhauser Effect Spectroscopy) stellt Korrelationen durch die räumliche Nähe (<6Å) zwischen Frequenzen her. - 42 - Je größer ein Protein ist, desto mehr Frequenzen können sich überlagern, da beispielsweise mehrmals die gleiche Aminosäure vorkommt. Die Aussage könnte man durch Einführung zusätzlicher Frequenzdimensionen verbessern, indem man die Position eines Protons in Verbindung zum Aminostickstoff angibt. Dadurch definiert man eine backbone-Position. Zusätzlich kann man noch den direkt benachbarten Kohlenstoff in die Korrelation miteinbeziehen ( backbone triple resonance). Das Problem ist, dass 15N und andere NMR-aktive Isotope selten vorkommen, daraus würde sich eine sehr geringe Singalintensität ergeben: 0,4% der Stickstoffe und davon widerum nur 1,1% der benachbarten Kohlenstoffe würden zum Signal beitragen. Daher muss man relativ früh (ab einer Peptidlänge von etwa 50AS) Isotope einführen, denn mit der natürlichen Häufigkeit der Isotope kann man hier nicht arbeiten. Multidimensionale NMR mit Isotopen verringert das signal overlapping und verbessert die Auflösung. Um 15N oder 13C als NMR-aktive Kerne mitzuverwenden, muss man dafür sorgen, dass beispielsweise Bakterien das betreffende Protein unter Verwendung von 13C-Glucose oder 15N-Ammoniumchlorid synthetisieren. In einem entsprechendem Experiment könnte eine E. coli Kultur in einem Minimalmedium mit einem Plasmid, das einem induzierbaren Promoter enthält, transformiert werden. Nachdem die Bakterien alle Aminosäuren hergestellt hätten, würde bei einem OD von 0,6-0,8 induziert werden, sodass das Protein mit den gelabelten Aminosäuren synthetisiert werden. - 43 - Die Anwendungen der NMR-Spektroskopie sind vielfältig und im Gegensatz zur Kristallographie nicht auf die Strukturaufklärung beschränkt. Ohne eine 3D-Struktur zu kennen, kann die NMR unabhängig davon Aussagen über die Sekundär-, Tertiärund Quartärstruktur treffen. Aus einem einzigen Experiment erhält man tausende Distanzinformationen, die bei guter Datenqualität eine gute Einschränkung der Strukturmöglichkeiten definieren. Die Aufgabe besteht nun darin, aus diesen Distanzen jene Strukturen zu generieren, die alle diese distance constraints zusammen mit den Kraftfeldbedingungen erfüllen. Das Resultat ist dabei ein Bündel von Strukturen, die sich mehr oder weniger überlagern. Eine schlechte Überlagerung wie im vorigen Bild muss nicht auf schlechte Datenqualität zurückzuführen sein, sondern kann eine inhärente Eigenschaft des Proteins sein. Solche mobilen loop-Regionen können essentielle Aufgaben haben. Das ist immer dann wahrscheinlich, wenn die Verrauschung nicht über die gesamte Struktur gleichverteilt ist. Lässt man ein NMR-System evolvieren, also nimmt man einen Zeitverlauf der crosspeaks auf, wird man feststellen, dass einige peaks verschwinden und manche ihre Intensität verändern. Die unterschiedliche Veränderung ist eine Konsequenz der Mobilität. Allein durch diese zeitliche Veränderung des Peaks ist es möglich die Dynamik eines Moleküls zu messen. Es gibt keine andere experimentelle Methode, mit der man Beweglichkeit mit atomarer Auflösung messen könnte. Die Messung der Sekundärstrukturverteilung erlaubt das Auffinden von mobilen Bereichen, die in der Kristallographie unsichtbar sind, da diese die Herstellung eines Kristalls verhindern. Durch NMR-Spektroskopie wurde festgestellt, dass CREB unter normalen Bedingungen zu 97% kompakt, zu 0,7% als ungefaltetes Ensemble und zu 2,3% mit nur einer einzigen von drei alpha-Helices vorliegt (α3). Winzige Energieunterschiede in der Größenordnung einer einzigen Wasserstoffbrücke führen dabei bereits zu Veränderungen im System. Der dominierende Anteil muss aber nicht notwendigerweise den aktiven, relevanten Zustand repräsentieren. Bei der Probenvorbereitung kann man kreativ sein und biochemische Kontrollsysteme ausnutzen. In einer herkömmlichen isotope labelling Prozedur wird ein Protein uniform gelabelt, was unter Umständen die Auswertung eines Spektrums auf Grund vieler Peaks erschweren könnte. Mit dem Wissen um die biochemischen Synthesewege von Aminosäuren, kann man nun Ketosäuren, Vorstufen der Aminosäuren, zusetzen, sodass Bakterien nur noch den Stickstoff mittels Aminotransferasen darauf transferieren und die Ketosäuren nicht synthetisieren (Poduktinhibierung). Abhängig davon, welche Ketosäuren man ins Medium zusetzt, kann man eine selektive Markierung bestimmter Aminosäuren erreichen. In Bindungsstudien kann die NMR-Spektroskopie eingesetzt werden, um jene Frequenzen und somit Positionen zu finden, die an der Bindung eines Liganden wie Ca2+ beteiligt sind. Die Spektren des reinen Proteins und nach Zugabe des Ions werden verglichen und Veränderungen der Frequenzen werden in einem Bereich des Spektrums und somit in einem Bereich des Proteins geclustert vorkommen. Variiert man die Ca-Konzentration, werden die Frequenzänderungen mit steigender Konzentration ein Plateau erreichen. Aus diesem Verlauf kann man zusätzlich den K DWert aus der Sättigungskurve bestimmen. Eine weitere Anwendung ist das Auffinden von Proteininteraktionsstellen. Zur - 44 - Untersuchung der ribosomalen Proteine S1 und S2, das mit S1 über ein helix-loophelix-Motif interagiert, hat man Spektren von S1 in voller Peptidlänge und jeweils mit abgeschnittenen C- und N-Termini augenommen. Der Vergleich des Vollspektrums und des Spektrum ohne C-Terminus zeigt, dass er nicht für die Bindung verantwortlich ist. Der Vergleich mit dem Spektrum ohne N-Terminus zeigt, dass er auch nicht für die Bindung ausschlaggebend ist, aber eine nascierende Helix enthält, die reversibel auf- und zugeht sowie mit S2 interagiert. Die Flexibilität beider Termini bewegt sich also auf einer unterschiedlich Zeitskala. Durch dieses Experiment erhält man keine Strukturinformation, aber eine Aussage über das Verhalten. Eine Anwendung, die sich erst seit einigen Jahren etabliert hat, ist das fragment based drug discovery, das Auffinden von Ligangen, die eine gewisse Funktionalität besitzen und neben dem Pharmabereich auch in der akademischen Forschung Bedeutung hat. Im pharmazeutischen Sinn sucht man Inhibitoren für disease targets, während in der Grundlagenforschung die biologische Konsequenz der Inhibition einer Kinase beispielsweise im Vordergrund steht. Die Ursache für die geringe Effizienz des rational drug design besteht darin, dass die falschen targets attackiert werden. In einem Protein, das mehrere Epitope besitzt, ist es unwahrscheinlich, dass es nur durch ein einzelnes Molekül inhibiert werden kann. Das große Problem ist, wie man zu neuen Substanzklassen kommt, wenn man in der chemischen Arbeitsweise des Nachbauens existierender Strukturen festsitzt. Es hat sich folgender Zugang zu diesem Problem entwickelt: Man baut Verbindungen von kleinen Komponenten aus neu auf. Man versucht einen privilegierten Satz von Substrukturen zu finden, die für das Proteintarget komplementär sind, das heißt man findet jeweils kleine Moleküle, die in die jeweiligen Taschen des Proteintargets hineinpassen, wobei diese nur eine moderate Affinität aufweisen müssen (mM). Wenn zwei Epitope in einem Molekül realisiert sind und beide Liganden über einen chemischen Linker verbunden werden, dann steigt die Affinität enorm, nämlich auf ΔG1+ΔG2, was dem Produkt der Gleichgewichtskonstanten entspricht. Je mehr Epitope solcherart verknüpft werden, desto höher wird die Affinität zum Proteintarget. In der Biologie ist dieser Ansatz vollkommen nachvollziehbar, da in der Evolution komplexe Einheiten immer aus Kombination einfacher Komponenten entstehen. Wie findet man aber nun diese schwachen Binder ? Es gibt NMR-Experimente, in denen Liganden selektiv, selbst in einer Mischung, gefunden werden, die eine Affinität zu einem Protein besitzen (Vergleich der Spektren). Ein weiterer Vorteil ist, dass nur gemessen wird, was homogen in Lösung ist. Anders bei FRET, das auf einem optischen Effekt basiert, wo Präzipitate leicht zu Fehleren führen. Nachdem Liganden identifiziert wurden, werden Strukturinformationen interessant, die Art und Weise wie der Ligand bindet. Das gibt Aufschluss, wo der Ligand modifiziert und gelinkt werden kann. Trotz dieser Vorgangsweise muss man auswählen, welche Ligangen man testet. Praktisch wäre eine möglichst vollständige Bibliothek an Liganden mit Korrelation zur Proteinstruktur. Dazu wurde ein neues Konzept zur Beschreibung von Strukturen entwickelt, die sogenannte Metastruktur. Die Darstellung beschreibt eine Proteinstruktur nicht in Form einer 3D-Struktur, sondern als Netzwerk, in dem jeder Knoten eine Aminosäure und jede Kante die räumliche Nähe zu einer anderen Aminosäure verzeichnet. So kann man statistisch die durchschnittlich kürzesten Wege zwischen zwei bestimmten Aminosäuren in eine Distanzmatrix eintragen (tausende Strukturen aus einer Strukturdatenbank als Datenbasis). Jetzt kann man aus einer beliebigen Primärsequenz die wahrscheinlichste Topologie berechnen, aus der man die Kompaktheit und die Sekundärstruktur als Funktion des residues extrahieren kann. Diese Zahlenwerte sind eine Codedarstellung der Proteinstruktur, die eigentlich unbekannt ist. Das ermöglicht eine völlig neue Art von sequence alignments - 45 - („Strukturalignment“). Jetzt findet man Homologien zwischen Proteinen, die auf der Primärsequenzebene nicht zu finden wären. Das kann man auf unterschiedliche Weise verwenden, zum Beispiel zur Ligandenfindung. Der Vergleich der aus der Primärsequenz errechneten Metastruktur eines targets mit bekannten Strukturen führt zum Auffinden neuer Liganden für das target, da man dem Prinzip, ähnliche Strukturen binden ähnliche Liganden, folgt. Diese Vorgehensweise umgeht die Notwendigkeit der Kenntnis der 3D-Strukturen von target und template, darüberhinaus ist die Datenbasis für Sequenzen ungleich größer, wodurch man mehr Homologien findet. Zur Illustrierung ein Praxisbeispiel mit Lipocalin, das unterschiedliche Liganden bindet und in Tumoren deutlich überexprimiert ist. In Bakterien beispielsweise Enterobactin, ein Sideophor (Eisenchelator). Lipocalin zeigt Ähnlichkeiten zu einer Lyase, deren Ligand Vanillinsäure ist, dessen Struktur in Enterobactin dreimal vorkommt. Allein der Sequenzvergleich hat ein Fragment gefunden, das auch im natürlichen Ligand vorkommt, obwohl die Proteine nichts mit einander zu tun haben. Lipocalin ist ein geschlossenes Betabarrel, während die Lyase nur zur Hälfte so aussieht wie bei Lipocalin, dafür sehr ähnlich, wo auch die Liganden binden, zwei Vanillinsäuremoleküle pro Lyase. Mit NMR-Spektroskopie kann man nun zeigen, dass Vanillinsäure als vorhergesagter Ligand tatsächlich an Lipocalin bindet. Wie viele binden aber an Lipocalin, wie ist die Stöchiometrie ? Dieser Frage kann man mit isothermaler Calorimetrie (ITC) nachgehen, bei der der Wärmeumsatz einer Reaktion gemessen wird. Man legt Protein vor, setzt den Ligand zu und misst die Wärmeumsetzung. Daraus erhält man eine Titrationskurve, aus der man die thermodynamischen Parameter und den K D-Wert bestimmen kann. Die beobachtete Kurve ist in diesem Fall nur mit zwei gebundenen Vanillinsäuremolekülen erklärbar, wie es auch die Homologie zur Lyase nahe legt. Der erste Ligand hat einen K D von 0,4 mM, der andere von 70 mM, also es bindet fast kein zweiter Ligand. Kombiniert man aber beide Liganden, erhält man einen KD von 25 µM! Das kann man jetzt durch chemische Verlinkung machen oder man sucht einen Liganden, der zwei solche hydroxylierte aromatische Struktureinheiten hat. Das ist ein Beispiel wie man aus der Sequenz ohne Kenntnis der Struktur Ligandengruppen finden kann, um sie zu besser bindenden Molekülen weiterzuentwickeln. Es ist aber immer wichtig zu überprüfen, ob tatsächlich eine authentische Bindung vorliegt und wie es bindet, weil das die Vorraussetzungen für einen Optimierungsprozess sind. Es illustriert, wie man NMR-Spektroskopie mit Sequenztools verbinden kann, um in komplexen Molekülsystem rasch zu Ergebnissen zu kommen. Eine Übersicht der Anwendungen: • • Low resolution technique – Strukturaufklärung steht nicht im Vordergrund, spezifische Eigenschaften von Proteinen und deren Verhalten sind interessant (S1,S2) Screening tool für die Kristallographie - 46 - • • • • Ligandenfindung Strukturaufklärung Bindungsstudien – Wie interagieren Proteine mit anderen Liganden, Kinetische Studien zur Geschwindigkeit von Umfaltungen Ungeordnete Proteine – Präferentielle lokale Strukturen sind auch in mobilen Peptiden so vorgebildet, dass die Struktur, selektiert durch Bindungspartner, erlauben. Als Beispiel Osteopontin, das vorgebildete Strukturen enthält, um bestimmte Liganden zu binden, der Ligand passt perfekt, trotz der Unordnung - 47 - 7 – Quellenangaben Soweit nicht anders angegeben, stammt der Inhalt dieses Skripts aus der eigenen Mitschrift, aus eigenen sowie Audioaufnahmen von KollegInnen und den Vorlesungsfolien. Externe Quellen sind: [1] Kato M, Ito T, Wagner G, Richardson CC, Ellenberger T (2003) Modular architecture of the bacteriophage T7 primase couples RNA primer synthesis to DNA synthesis. Mol Cell 11: 1349–1360 doi: 10.1016/S1097-2765(03)00195-3 http://www.nature.com/emboj/journal/v25/n10/fig_tab/7601112a_F1.html#figure-title [2] Ken A. Dill, Hue Sun Chan (1997) From Levinthal to pathways to funnels. Nature Structural & Molecular Biology 4, 10-19 doi: 10.1038/nsb0197-10 http://www.nature.com/nsmb/journal/v4/n1/pdf/nsb0197-10.pdf [3] Bradley D. Charette, Richard G. MacDonald, Stefan Wetzel, David B. Berkowitz, Herbert Waldmann (2006) Protein Structure Similarity Clustering: Dynamic Treatment of PDB Structures Facilitates Clustering. Angew. Chem. Int. Ed. 2006, 45, 7766 –7770 doi: 10.1002/anie.200602125 http://www.chem.unl.edu/dbb/PDFs/ang_chem_06.pdf [4] Lena Mäler, John Blankenship, Mark Rance, Walter J. Chazin (2000) Site−site communication in the EF-hand Ca2+-binding protein calbindin D9K. Nature Structural Biology 7, 245 – 250 doi: 10.1038/73369 http://www.nature.com/nsmb/journal/v7/n3/full/nsb0300_245.html [5] Markus Hartl, Andrea Nist, M. Imran Khan, Taras Valovka Klaus Bister (2009) Inhibition of Myc-induced cell transformation by brain acid-soluble protein 1 (BASP1). PNAS April 7, 2009 vol.106 no.14, 5604-5609. doi: 10.1073/pnas.0812101106 http://www.pnas.org/content/106/14/5604.full [6] B. Hoffmann, R. Konrat, H. Bothe, W. Buckel, B. Kräutler (2001) Structure and dynamics of the B12-binding subunit of glutamate mutase from Clostridium cochlearium. European Journal of Biochemistry, vol 263, Issue 1, pages 178-188, July (I) doi: 10.1046/j.1432-1327.1999.00482.x http://onlinelibrary.wiley.com/doi/10.1046/j.1432-1327.1999.00482.x/full [7] http://www.chem.arizona.edu/courseweb/MolecularMechanics [8] Yamasaki M, Li W, Johnson DJ, Huntington JA (2008). Crystal structure of a stable dimer reveals the molecular basis of serpin polymerization. Nature 455, 1255-1258. PMID 18923394. doi:10.1038/nature07394 http://www.nature.com/nature/journal/v455/n7217/full/nature07394.html [9] http://tmp.kiwix.org:4201/A/Serpin.html [10] C. A. Orengo, F. M. G. Pearl, J. E. Bray, A. E. Todd, A. C. Martin, L. Lo Conte, J. M. Thornton - 48 - (1999) The CATH Database provides insights into protein structure/function relationships. Nucleic Acids Research 27 (1): 275-279. doi: 10.1093/nar/27.1.275 http://nar.oxfordjournals.org/content/27/1/275.full [11] Murzin AG, Brenner SE, Hubbard T, Chothia C (1995). SCOP: a structural classification of proteins database for the investigation of sequences and structures. J. Mol. Biol. 247 (4): 536–40. PMID 7723011. doi:10.1016/S0022-2836(05)80134-2 [12] Suhrer, S.J., Gruber, M. and Sippl, M.J. (2007) QSCOP-BLAST--fast retrieval of quantified structural information for protein sequences of unknown structure. Nucleic Acids Res. 35 (suppl 2): W411-W415. doi: 10.1093/nar/gkm264 http://nar.oxfordjournals.org/content/35/suppl_2/W411.full [13] http://www.ruppweb.org/cd/cdtutorial.htm [14] Wolfgang Fieber, Martin L. Schneider, Theresia Matt, Bernhard Kräutler, Robert Konrat and Klaus Bister (2001). Structure, function, and dynamics of the dimerization and DNAbinding domain of oncogenic transcription factor v-Myc. Journal of Molecular Biology, Volume 307, Issue 5, 1395-1410 doi: 10.1006/jmbi.2001.4537 http://www.uibk.ac.at/biochemistry/people/bister/kb099_2001.pdf [15] http://www.chem.hope.edu/.../NMR/Principles_of_NMR_Spectroscopy.html [16] http://teaching.shu.ac.uk/hwb/chemistry/tutorials/molspec/nmr1.htm - 49 -