KURSTAG 25 THERMODYNAMISCHE STABILITÄT VON PROTEINEN

K URSTAG 25
T HERMODYNAMISCHE S TABILITÄT VON
P ROTEINEN
Proteine aus thermophilen, mesophile und thermophoben Organismen müssen in ihrer thermodynamischen Stabilität ihren Umgebungsbedingungen angepasst sein. Verständnis für die Anpassungsmechanismen ist nicht nur von einem theoretischen Standpunkt aus interessant, sondern hat auch direkte praktische
Anwendungsmöglichkeiten (z. B. Optimierung von Enzymen in der Waschmittelindustrie). Um die verschiedenen Möglichkeiten der Anpassung zu finden, sollte man natürlich eine möglichst große Anzahl an
verschiedenen Proteinfamilien untersuchen, wobei jede Familie aus Homologen bestehen sollte, die aus
an die unterschiedlichsten Bedingungen angepassten Organismen stammen. Solch eine Untersuchung ist
etwas außerhalb der Möglichkeiten einer eintägigen Übung; hier sollen Sie sich nur exemplarisch zwei
Proteinfamilien ansehen.
Übungen
1. Vergleich zweier homologer Proteine aus einem halophilen und einem „normalen“ Organismus
Haloarcula marismortui ist ein Archaeon aus dem Toten Meer, das insbesondere durch seinen hohen Salzgehalt (ca. 4 M K+ und weitere Salze), einen niedrigen Sauerstoffgehalt und eine hohe
Lichtintensität ausgezeichnet ist. Ähnlich hoch wie im externen Medium ist wohl auch der Salzgehalt im Zellinneren.
Nicht-halophile Cyanobakterien der Gattung Nostoc bildet lange Filamente aus Zellen, die Photosynthese betreiben. Im Zellinneren liegt wohl ein „normaler“ Salzgehalt vor.
Ferredoxine sind kleine Proteine, die Eisen- und Schwefelatome enthalten, die in einem EisenSchwefel-Cluster angeordnet sind. Ferredoxine wirken in biologischen Redoxreaktionen als Elektronenüberträger, da das Eisenatom seine Oxidationsstufe (+2 oder +3) ändern kann.
(a) Die Zugriffscodes in GenBank für die Ferredoxine von H. marismortui bzw. Nostoc sp.
lauten AAV47329.1 bzw. WP_010995602.1.
Suchen Sie zu jeder dieser Sequenzen separat homologe Sequenzen per PsiBLAST. Aus der
jeweiligen Liste selektieren Sie 10 bis 20 Sequenzen und speichern diese in zwei Dateien
im FASTA-Format. In der Kopfzeile zu jeder Sequenz vermerken Sie den Zugriffscode, den
Namen des Organismus und ob es sich um ein Kern- oder sonstwie kodiertes Protein handelt;
die einzelnen Worte hängen Sie am besten mit Unterstrichen aneinander.
Achten Sie darauf, dass Sie erstens nur Volllängen-Proteine in das jeweilige Set aufnehmen
und zweitens auch tatsächlich nur Proteine von Organismen mit ähnlichen Umgebungsbedingungen zusammen gruppieren. Um dies zu bewerkstelligen, nehmen Sie nicht einfach
112
Thermodynamische Stabilität von Proteinen
die von BLAST alignierten (Teil-)Sequenzen, sondern die im jeweiligen Link angegebenen
Volllängen-Sequenzen. Dort finden Sie auch die entsprechenden Organismus-Zuordnungen
in Latein; für weiteres hilft Google und Wikipedia (oder auch ein Biologe?).
Noch ein paar Tipps:
• Unter Choose Search Set → Organism können Sie nicht nur einzelne Organismen, sondern auch komplette Taxa für die Suche ein- bzw. ausschliessen. Zu welchen
übergeordneten Familien gehören Haloarcula bzw. Nostoc?
• Falls eines Ihrer Alignments nur aus Sequenzen besteht, die sich sehr ähnlich sind (z. B.
Coverage ≥ 90%; E-value ≤ 10−50 ; Identity ≥ 85%), hat das Alignment wenig Aussagekraft bezüglich konservierten und/oder variablen Positionen. Sie sollten also relativ viele Sequenzen von BLAST suchen lassen und dann für die Sequenzauswahl
auch mal weit nach unten scrollen . . .
• Falls Sie alle (oder auch nur einen Teil) der gefundenen Sequenzen selektieren, können
Sie sich einen Baum über diese selektierten Sequenzen anzeigen lassen. Das könnte
helfen, nur möglichst verschiedene Sequenzen für das multiple Alignment auszuwählen.
(b) Von beiden Sequenz-Sets separat und auch von der Vereinigung beider Sets machen Sie ein
Alignment per MAFFT. Lassen Sie von MAFFT keine Homologen suchen. Nach der ersten
Ansicht der drei Alignments: Haben Sie die richtigen Optionen gewählt?
Speichern Sie die drei Alignments im FASTA-Format.
Achtung: Machen Sie die drei Alignments in separaten Browser-Fenstern, damit Sie für die
nächsten Punkte leichter wieder an den Ausgangspunkt zurück kommen.
(c) Sehen Sie sich die evolutionären Bäume für die drei Alignments an (Link auf der Ergebnisseite von MAFFT).1 Falls Sie Näheres zu den verfügbaren Algorithmen wissen wollen,
können Sie hier nachsehen: “Neighbor-Joining” (NJ; Saitou & Nei, 1987), “Unweighted Pair
Group Method with Arithmetic mean” (UPGMA; Sokal & C. Michener, 1958), . . .
Falls der Baum zum Set mit allen Sequenzen keine klare Trennung zwischen den extremophilen und den „normalen“ Organismen erkennen lässt, gehen Sie nicht über Los, sondern direkt
zu Punkt 1a; dies gilt ebenfalls, wenn einer der Bäume der einzelnen Sets einen „Ausreißer“
enthält.
(d) Sehen Sie sich per jalview (Link auf der Ergebnisseite von MAFFT)2 die drei Alignments an.
Im Programm können Sie das jeweilige Alignment nach verschiedenen Kriterien einfärben.
Außerdem haben Sie Zugriff auf die Positionen von Aminosäuren in den Originalsequenzen.
Sind die Aminosäuren des „katalytischen Loops“ in allen Sequenzen konserviert? Auch die
Aminosäuren, die das Eisen-Ion binden? Gibt es weitere Auffälligkeiten?
(e) Schreiben Sie ein Perl-Programm, das die von Ihnen erzeugten Alignments im FASTA-Format einliest und die Aminosäure-Zusammensetzung der einzelnen Sequenzen und der Align1
2
Da lokal kein JavaWebStart installiert ist, funktioniert der Link nicht. Daher benutzen Sie am besten neighbor aus dem
Phylip-Paket oder eines der Baum-Programme von T-REX.
Da lokal kein JavaWebStart installiert ist, holen Sie sich von jalview.org das Linux-Programm inkl. der „Java Virtual Machine“, speichern es im Home(!)-Verzeichnis, machen die Datei ausführbar und führen Sie sie aus. Im gestarteten
jalview können Sie dann die von MAFFT erzeugten FASTA-Dateien laden.
1. Übungen
113
ments absolut und prozentual ermittelt und ausgibt. Zusätzlich soll Ihr Programm die Aminosäuregruppen entsprechend den Angaben aus der Vorlesung (Folie 8) bzw. aus dem Buch
(Abb. 8.2, Tab. 8.2) absolut und prozentual ermitteln und ausgeben; berücksichtigen Sie
zumindest die Gruppen sauer, basisch, negativ geladen, positiv geladen, polar, hydrophob,
aliphatisch, groß, mittel und klein. Vergleichen Sie die ermittelten Aminosäure-Zusammensetzungen mit denen aus Tab. 25.1. (Hierzu müssen Sie die Aminosäuren in die gleichen
Gruppen wie in Ihrem Programm zusammenfassen.) Die Ausgabe des Programms könnte
also wie folgt aussehen:
# gaps =
# aa
=
aa #
E
123
D
120
...
Group
small
medium
large
aromatic
...
45
987
%
12.5
12.2
std% factor
6.8 1.8
5.5 2.2
aln
20.8
...
std
21.9
factor
0.9
Die erste Tabelle enthält in den einzelnen Spalten alle Aminosäuren („aa“) geordnet nach
ihrer Häufigkeit in Ihrem Alignment, die absoluten („#“) und relativen („%“) Anzahlen der
Aminosäuren in Ihrem Alignment, die prozentualen Anzahlen der Aminosäuren in SwissProt („std%“) und der Faktor zwischen beiden Prozentwerten. Die zweite Tabelle enthält in
der ersten Spalte die berücksichtigten Gruppen an Aminosäuren, die zweite und dritte die
Häufigkeit der entsprechenden Aminosäuren in Ihrem Alignment („aln“) bzw. in Swiss-Prot
(„std“) und die letzte den Faktor zwischen beiden Häufigkeiten.
Damit Ihnen das Sortieren leicht fällt, sollten Sie welchen Datentyp benutzen?
Welche Auffälligkeiten – insbesondere zwischen den Proteinsets – gibt es?
Welche Aminosäuren würden Sie im Inneren oder auf der Oberfläche eines Proteins erwarten?
(f) Suchen Sie die Röntgenstrukturen 1DOI und 1FRD in der PDB-Datenbank und speichern
Sie die entsprechenden PDB-Dateien komprimiert ab.
Für welche Sequenzen wurden diese Strukturen ermittelt? Sind diese in Ihren Alignments
enthalten?
(g) Laden Sie die beiden PDB-Dateien in RasMol. (Ich finde, dass die folgende Analyse einfacher ist, wenn man die Strukturen in zwei Instanzen lädt, eine geht allerdings auch.) Stellen
Sie die Strukturen als Drahtmodelle dar (wireframe 50). Zeigen Sie die Fe-S-Cluster als
Kalotten in einer bisher unbenutzten Farbe an; da die Cluster in den PDB-Dateien für RasMol
unverständlich annotiert sind, müssen Sie diese über die Gruppennummern selektieren.
Über welche Aminosäuren sind die FeS-Cluster gebunden? (Kennen Sie den Befehl
select within . . . ?) Sind das Aminosäuren, die in den Alignments konserviert sind?
(h) Schalten Sie zusätzlich in den RasMol-Fenstern die schematische Darstellung („ribbon“) an
und positionieren beide Proteine in die möglichst identische Ansicht.
114
Thermodynamische Stabilität von Proteinen
Tabelle 25.1: Aminosäure-Zusammensetzung aller Protein-Sequenzen in Swiss-Prot. Angaben sind in Prozent
und gelten für die Datenbank-Version 2015_12. Beide Tabellen haben identischen Inhalt; die obere ist alphabetisch
sortiert, die untere nach Häufigkeit.
Aminosäure
Ala
Arg
Asn
Asp
Cys
(A)
(R)
(N)
(D)
(C)
Aminosäure
Leu
Ala
Gly
Val
Glu
(L)
(A)
(G)
(V)
(E)
Häufigkeit
8,26
5,53
4,06
5,46
1,37
Häufigkeit
9,65
8,26
7,08
6,87
6,74
Aminosäure
Gln
Glu
Gly
His
Ile
(Q)
(E)
(G)
(H)
(I)
Aminosäure
Ser
Ile
Lys
Arg
Asp
(S)
(I)
(K)
(R)
(D)
Häufigkeit
3,93
6,74
7,08
2,27
5,94
Häufigkeit
6,59
5,94
5,83
5,53
5,46
Aminosäure
Leu
Lys
Met
Phe
Pro
(L)
(K)
(M)
(F)
(P)
Aminosäure
Thr
Pro
Asn
Gln
Phe
(T)
(P)
(N)
(Q)
(F)
Häufigkeit
9,65
5,85
2,41
3,86
4,71
Häufigkeit
5,34
4,71
4,06
3,93
3,86
Aminosäure
Ser
Thr
Trp
Tyr
Val
(S)
(T)
(W)
(Y)
(V)
Aminosäure
Tyr
Met
His
Cys
Trp
(Y)
(M)
(H)
(C)
(W)
Häufigkeit
6,59
5,34
1,09
2,92
6,87
Häufigkeit
2,92
2,41
2,27
1,37
1,09
Falls das Schwierigkeiten macht, laden Sie die Datei 1DOI+1FRD.pdb.gz in RasMol; in
dieser Datei sind beide Strukturen in „passender“ Orientierung enthalten, was das gemeinsame Drehen vereinfacht, aber die Auswahl einzelner Elemente schwieriger gestaltet. (Wie
müssen Sie die PDB-Datei abändern, dass das einfach geht?)
Welche Ähnlichkeiten und welche Differenzen in den Strukturelementen gibt es? (Ziehen
Sie eventuell Ihre multiplen Alignments zu Rate; sollten Sie diese mit dem jetzigen Wissen
vielleicht modifizieren?)
(i) Schalten Sie in den RasMol-Fenstern wieder auf Drahtmodell-Darstellung um. Selektieren
Sie die Aminosäuren mit negativ geladener Seitenkette und stellen Sie dieser in einer anderen
Farbe dar.
Wo liegen diese Aminosäuren in den beiden Proteinen? Für welche Funktion könnten diese
Aminosäuren in welcher Umgebung verantwortlich sein?
(j) Laden Sie die Datei superimposed_1DOI_1FRD.pdb.gz in ein weiteres RasMol.
Schalten Sie auf Banddarstellung um. Färben Sie die zwei Strukturen in verschiedene Farben ein (inkl. der FeS-Cluster); hier sind die beiden Moleküle als Kette A bzw. B annotiert.
In dieser Darstellung sollte spätestens jetzt klar sein, welche Strukturelemente in einer der
beiden Strukturen zusätzlich zur anderen vorhanden sind. Sehen Sie sich die Verteilung der
negativ geladenen Aminosäuren an!
Welche Eigenschaften haben diese zusätzlichen Strukturelemente (Strukturtyp, Ladungsverteilung)?
2. Literatur
115
(k) Aufgrund welcher thermodynamischer Wechselwirkungen unterscheidet sich das halophile
Protein von dem „normalen“? Anders nach dem gleichen Sachverhalt gefragt: Welche Wechselwirkung benutzt das halophile Protein, um mit dem hohen Salzgehalt klar zu kommen?
2. Vergleich zweier homologer Proteine aus einem thermophilen und einem „normalen“ Organismus
(a) Besorgen Sie sich den Übersichtsartikel Razvi & Scholtz (2006).
Die Adressen zu PubMed und der Elektronischen Zeitschriftenbibliothek mit Zeitungen, die
über die Universitätsbibliothek der HHU erhältlich sind, könnten dabei nützlich sein.
(b) In Abb. 1 dieser Publikation ist der Zusammenhang zwischen freier Energie der Proteinfaltung und Temperatur dargestellt. Woraus ergibt sich dieser dargestellte Kurvenverlauf? Was
ist Tm und wie ist diese Temperatur definiert? (Vielleicht helfen die Vorlesungen zu Energetik
von Proteinstruktur (insbesondere Folie 14) und RNA-Struktur (insbesondere Folien 22 und
24–26).)
(c) Die Hypothese der Autoren, dass Proteine drei Möglichkeiten besitzen, sich erhöhter Umgebungstemperatur anzupassen, ist in Abb. 2 der Publikation zusammengefasst. Welches sind
diese drei Möglichkeiten?
(d) Picken Sie sich aus Tab. 1 der Publikation zwei homologe Proteine aus einem thermophilen
und einem mesophilen Organismus und wiederholen mit diesen sinngemäß die Aufgabe 1.
(e) Unterscheiden sich die Mechanismen, mit denen thermophile und halophile Organismen ihren harschen Umgebungsbedingungen trotzen?
Literatur
Razvi, A. & Scholtz, J.M. (2006). Lessons in stability from thermophilic proteins. Protein Sci., 15,
1569–1578. 115
Saitou, N. & Nei, M. (1987). The neighbor-joining method: a new method for reconstructing
phylogenetic trees. Mol. Biol. Evol., 4, 406–425. 112
Sokal, R. & C. Michener, C. (1958). A statistical method for evaluating systematic relationships.
University of Kansas Science Bulletin, 38, 1409–1438. 112