K URSTAG 25 T HERMODYNAMISCHE S TABILITÄT VON P ROTEINEN Proteine aus thermophilen, mesophile und thermophoben Organismen müssen in ihrer thermodynamischen Stabilität ihren Umgebungsbedingungen angepasst sein. Verständnis für die Anpassungsmechanismen ist nicht nur von einem theoretischen Standpunkt aus interessant, sondern hat auch direkte praktische Anwendungsmöglichkeiten (z. B. Optimierung von Enzymen in der Waschmittelindustrie). Um die verschiedenen Möglichkeiten der Anpassung zu finden, sollte man natürlich eine möglichst große Anzahl an verschiedenen Proteinfamilien untersuchen, wobei jede Familie aus Homologen bestehen sollte, die aus an die unterschiedlichsten Bedingungen angepassten Organismen stammen. Solch eine Untersuchung ist etwas außerhalb der Möglichkeiten einer eintägigen Übung; hier sollen Sie sich nur exemplarisch zwei Proteinfamilien ansehen. Übungen 1. Vergleich zweier homologer Proteine aus einem halophilen und einem „normalen“ Organismus Haloarcula marismortui ist ein Archaeon aus dem Toten Meer, das insbesondere durch seinen hohen Salzgehalt (ca. 4 M K+ und weitere Salze), einen niedrigen Sauerstoffgehalt und eine hohe Lichtintensität ausgezeichnet ist. Ähnlich hoch wie im externen Medium ist wohl auch der Salzgehalt im Zellinneren. Nicht-halophile Cyanobakterien der Gattung Nostoc bildet lange Filamente aus Zellen, die Photosynthese betreiben. Im Zellinneren liegt wohl ein „normaler“ Salzgehalt vor. Ferredoxine sind kleine Proteine, die Eisen- und Schwefelatome enthalten, die in einem EisenSchwefel-Cluster angeordnet sind. Ferredoxine wirken in biologischen Redoxreaktionen als Elektronenüberträger, da das Eisenatom seine Oxidationsstufe (+2 oder +3) ändern kann. (a) Die Zugriffscodes in GenBank für die Ferredoxine von H. marismortui bzw. Nostoc sp. lauten AAV47329.1 bzw. WP_010995602.1. Suchen Sie zu jeder dieser Sequenzen separat homologe Sequenzen per PsiBLAST. Aus der jeweiligen Liste selektieren Sie 10 bis 20 Sequenzen und speichern diese in zwei Dateien im FASTA-Format. In der Kopfzeile zu jeder Sequenz vermerken Sie den Zugriffscode, den Namen des Organismus und ob es sich um ein Kern- oder sonstwie kodiertes Protein handelt; die einzelnen Worte hängen Sie am besten mit Unterstrichen aneinander. Achten Sie darauf, dass Sie erstens nur Volllängen-Proteine in das jeweilige Set aufnehmen und zweitens auch tatsächlich nur Proteine von Organismen mit ähnlichen Umgebungsbedingungen zusammen gruppieren. Um dies zu bewerkstelligen, nehmen Sie nicht einfach 112 Thermodynamische Stabilität von Proteinen die von BLAST alignierten (Teil-)Sequenzen, sondern die im jeweiligen Link angegebenen Volllängen-Sequenzen. Dort finden Sie auch die entsprechenden Organismus-Zuordnungen in Latein; für weiteres hilft Google und Wikipedia (oder auch ein Biologe?). Noch ein paar Tipps: • Unter Choose Search Set → Organism können Sie nicht nur einzelne Organismen, sondern auch komplette Taxa für die Suche ein- bzw. ausschliessen. Zu welchen übergeordneten Familien gehören Haloarcula bzw. Nostoc? • Falls eines Ihrer Alignments nur aus Sequenzen besteht, die sich sehr ähnlich sind (z. B. Coverage ≥ 90%; E-value ≤ 10−50 ; Identity ≥ 85%), hat das Alignment wenig Aussagekraft bezüglich konservierten und/oder variablen Positionen. Sie sollten also relativ viele Sequenzen von BLAST suchen lassen und dann für die Sequenzauswahl auch mal weit nach unten scrollen . . . • Falls Sie alle (oder auch nur einen Teil) der gefundenen Sequenzen selektieren, können Sie sich einen Baum über diese selektierten Sequenzen anzeigen lassen. Das könnte helfen, nur möglichst verschiedene Sequenzen für das multiple Alignment auszuwählen. (b) Von beiden Sequenz-Sets separat und auch von der Vereinigung beider Sets machen Sie ein Alignment per MAFFT. Lassen Sie von MAFFT keine Homologen suchen. Nach der ersten Ansicht der drei Alignments: Haben Sie die richtigen Optionen gewählt? Speichern Sie die drei Alignments im FASTA-Format. Achtung: Machen Sie die drei Alignments in separaten Browser-Fenstern, damit Sie für die nächsten Punkte leichter wieder an den Ausgangspunkt zurück kommen. (c) Sehen Sie sich die evolutionären Bäume für die drei Alignments an (Link auf der Ergebnisseite von MAFFT).1 Falls Sie Näheres zu den verfügbaren Algorithmen wissen wollen, können Sie hier nachsehen: “Neighbor-Joining” (NJ; Saitou & Nei, 1987), “Unweighted Pair Group Method with Arithmetic mean” (UPGMA; Sokal & C. Michener, 1958), . . . Falls der Baum zum Set mit allen Sequenzen keine klare Trennung zwischen den extremophilen und den „normalen“ Organismen erkennen lässt, gehen Sie nicht über Los, sondern direkt zu Punkt 1a; dies gilt ebenfalls, wenn einer der Bäume der einzelnen Sets einen „Ausreißer“ enthält. (d) Sehen Sie sich per jalview (Link auf der Ergebnisseite von MAFFT)2 die drei Alignments an. Im Programm können Sie das jeweilige Alignment nach verschiedenen Kriterien einfärben. Außerdem haben Sie Zugriff auf die Positionen von Aminosäuren in den Originalsequenzen. Sind die Aminosäuren des „katalytischen Loops“ in allen Sequenzen konserviert? Auch die Aminosäuren, die das Eisen-Ion binden? Gibt es weitere Auffälligkeiten? (e) Schreiben Sie ein Perl-Programm, das die von Ihnen erzeugten Alignments im FASTA-Format einliest und die Aminosäure-Zusammensetzung der einzelnen Sequenzen und der Align1 2 Da lokal kein JavaWebStart installiert ist, funktioniert der Link nicht. Daher benutzen Sie am besten neighbor aus dem Phylip-Paket oder eines der Baum-Programme von T-REX. Da lokal kein JavaWebStart installiert ist, holen Sie sich von jalview.org das Linux-Programm inkl. der „Java Virtual Machine“, speichern es im Home(!)-Verzeichnis, machen die Datei ausführbar und führen Sie sie aus. Im gestarteten jalview können Sie dann die von MAFFT erzeugten FASTA-Dateien laden. 1. Übungen 113 ments absolut und prozentual ermittelt und ausgibt. Zusätzlich soll Ihr Programm die Aminosäuregruppen entsprechend den Angaben aus der Vorlesung (Folie 8) bzw. aus dem Buch (Abb. 8.2, Tab. 8.2) absolut und prozentual ermitteln und ausgeben; berücksichtigen Sie zumindest die Gruppen sauer, basisch, negativ geladen, positiv geladen, polar, hydrophob, aliphatisch, groß, mittel und klein. Vergleichen Sie die ermittelten Aminosäure-Zusammensetzungen mit denen aus Tab. 25.1. (Hierzu müssen Sie die Aminosäuren in die gleichen Gruppen wie in Ihrem Programm zusammenfassen.) Die Ausgabe des Programms könnte also wie folgt aussehen: # gaps = # aa = aa # E 123 D 120 ... Group small medium large aromatic ... 45 987 % 12.5 12.2 std% factor 6.8 1.8 5.5 2.2 aln 20.8 ... std 21.9 factor 0.9 Die erste Tabelle enthält in den einzelnen Spalten alle Aminosäuren („aa“) geordnet nach ihrer Häufigkeit in Ihrem Alignment, die absoluten („#“) und relativen („%“) Anzahlen der Aminosäuren in Ihrem Alignment, die prozentualen Anzahlen der Aminosäuren in SwissProt („std%“) und der Faktor zwischen beiden Prozentwerten. Die zweite Tabelle enthält in der ersten Spalte die berücksichtigten Gruppen an Aminosäuren, die zweite und dritte die Häufigkeit der entsprechenden Aminosäuren in Ihrem Alignment („aln“) bzw. in Swiss-Prot („std“) und die letzte den Faktor zwischen beiden Häufigkeiten. Damit Ihnen das Sortieren leicht fällt, sollten Sie welchen Datentyp benutzen? Welche Auffälligkeiten – insbesondere zwischen den Proteinsets – gibt es? Welche Aminosäuren würden Sie im Inneren oder auf der Oberfläche eines Proteins erwarten? (f) Suchen Sie die Röntgenstrukturen 1DOI und 1FRD in der PDB-Datenbank und speichern Sie die entsprechenden PDB-Dateien komprimiert ab. Für welche Sequenzen wurden diese Strukturen ermittelt? Sind diese in Ihren Alignments enthalten? (g) Laden Sie die beiden PDB-Dateien in RasMol. (Ich finde, dass die folgende Analyse einfacher ist, wenn man die Strukturen in zwei Instanzen lädt, eine geht allerdings auch.) Stellen Sie die Strukturen als Drahtmodelle dar (wireframe 50). Zeigen Sie die Fe-S-Cluster als Kalotten in einer bisher unbenutzten Farbe an; da die Cluster in den PDB-Dateien für RasMol unverständlich annotiert sind, müssen Sie diese über die Gruppennummern selektieren. Über welche Aminosäuren sind die FeS-Cluster gebunden? (Kennen Sie den Befehl select within . . . ?) Sind das Aminosäuren, die in den Alignments konserviert sind? (h) Schalten Sie zusätzlich in den RasMol-Fenstern die schematische Darstellung („ribbon“) an und positionieren beide Proteine in die möglichst identische Ansicht. 114 Thermodynamische Stabilität von Proteinen Tabelle 25.1: Aminosäure-Zusammensetzung aller Protein-Sequenzen in Swiss-Prot. Angaben sind in Prozent und gelten für die Datenbank-Version 2015_12. Beide Tabellen haben identischen Inhalt; die obere ist alphabetisch sortiert, die untere nach Häufigkeit. Aminosäure Ala Arg Asn Asp Cys (A) (R) (N) (D) (C) Aminosäure Leu Ala Gly Val Glu (L) (A) (G) (V) (E) Häufigkeit 8,26 5,53 4,06 5,46 1,37 Häufigkeit 9,65 8,26 7,08 6,87 6,74 Aminosäure Gln Glu Gly His Ile (Q) (E) (G) (H) (I) Aminosäure Ser Ile Lys Arg Asp (S) (I) (K) (R) (D) Häufigkeit 3,93 6,74 7,08 2,27 5,94 Häufigkeit 6,59 5,94 5,83 5,53 5,46 Aminosäure Leu Lys Met Phe Pro (L) (K) (M) (F) (P) Aminosäure Thr Pro Asn Gln Phe (T) (P) (N) (Q) (F) Häufigkeit 9,65 5,85 2,41 3,86 4,71 Häufigkeit 5,34 4,71 4,06 3,93 3,86 Aminosäure Ser Thr Trp Tyr Val (S) (T) (W) (Y) (V) Aminosäure Tyr Met His Cys Trp (Y) (M) (H) (C) (W) Häufigkeit 6,59 5,34 1,09 2,92 6,87 Häufigkeit 2,92 2,41 2,27 1,37 1,09 Falls das Schwierigkeiten macht, laden Sie die Datei 1DOI+1FRD.pdb.gz in RasMol; in dieser Datei sind beide Strukturen in „passender“ Orientierung enthalten, was das gemeinsame Drehen vereinfacht, aber die Auswahl einzelner Elemente schwieriger gestaltet. (Wie müssen Sie die PDB-Datei abändern, dass das einfach geht?) Welche Ähnlichkeiten und welche Differenzen in den Strukturelementen gibt es? (Ziehen Sie eventuell Ihre multiplen Alignments zu Rate; sollten Sie diese mit dem jetzigen Wissen vielleicht modifizieren?) (i) Schalten Sie in den RasMol-Fenstern wieder auf Drahtmodell-Darstellung um. Selektieren Sie die Aminosäuren mit negativ geladener Seitenkette und stellen Sie dieser in einer anderen Farbe dar. Wo liegen diese Aminosäuren in den beiden Proteinen? Für welche Funktion könnten diese Aminosäuren in welcher Umgebung verantwortlich sein? (j) Laden Sie die Datei superimposed_1DOI_1FRD.pdb.gz in ein weiteres RasMol. Schalten Sie auf Banddarstellung um. Färben Sie die zwei Strukturen in verschiedene Farben ein (inkl. der FeS-Cluster); hier sind die beiden Moleküle als Kette A bzw. B annotiert. In dieser Darstellung sollte spätestens jetzt klar sein, welche Strukturelemente in einer der beiden Strukturen zusätzlich zur anderen vorhanden sind. Sehen Sie sich die Verteilung der negativ geladenen Aminosäuren an! Welche Eigenschaften haben diese zusätzlichen Strukturelemente (Strukturtyp, Ladungsverteilung)? 2. Literatur 115 (k) Aufgrund welcher thermodynamischer Wechselwirkungen unterscheidet sich das halophile Protein von dem „normalen“? Anders nach dem gleichen Sachverhalt gefragt: Welche Wechselwirkung benutzt das halophile Protein, um mit dem hohen Salzgehalt klar zu kommen? 2. Vergleich zweier homologer Proteine aus einem thermophilen und einem „normalen“ Organismus (a) Besorgen Sie sich den Übersichtsartikel Razvi & Scholtz (2006). Die Adressen zu PubMed und der Elektronischen Zeitschriftenbibliothek mit Zeitungen, die über die Universitätsbibliothek der HHU erhältlich sind, könnten dabei nützlich sein. (b) In Abb. 1 dieser Publikation ist der Zusammenhang zwischen freier Energie der Proteinfaltung und Temperatur dargestellt. Woraus ergibt sich dieser dargestellte Kurvenverlauf? Was ist Tm und wie ist diese Temperatur definiert? (Vielleicht helfen die Vorlesungen zu Energetik von Proteinstruktur (insbesondere Folie 14) und RNA-Struktur (insbesondere Folien 22 und 24–26).) (c) Die Hypothese der Autoren, dass Proteine drei Möglichkeiten besitzen, sich erhöhter Umgebungstemperatur anzupassen, ist in Abb. 2 der Publikation zusammengefasst. Welches sind diese drei Möglichkeiten? (d) Picken Sie sich aus Tab. 1 der Publikation zwei homologe Proteine aus einem thermophilen und einem mesophilen Organismus und wiederholen mit diesen sinngemäß die Aufgabe 1. (e) Unterscheiden sich die Mechanismen, mit denen thermophile und halophile Organismen ihren harschen Umgebungsbedingungen trotzen? Literatur Razvi, A. & Scholtz, J.M. (2006). Lessons in stability from thermophilic proteins. Protein Sci., 15, 1569–1578. 115 Saitou, N. & Nei, M. (1987). The neighbor-joining method: a new method for reconstructing phylogenetic trees. Mol. Biol. Evol., 4, 406–425. 112 Sokal, R. & C. Michener, C. (1958). A statistical method for evaluating systematic relationships. University of Kansas Science Bulletin, 38, 1409–1438. 112