4.1. Programme Bei einem Teil der Programme werden Proteine auf der Primärstrukturebene ausgewertet. Dazu dienen Sequenzvergleiche verschiedener Moleküle, Berechnung von Hydrophilie und Hydropathie und Sekundärstrukturberechnungen. In einem weiteren Teil werden die Moleküle als 3D-Modelle betrachtet. 4.1.1. ClustalX (Version 1.64b) [Gibson et al., 1997] Das Programm „ClustalX“ ist die Transformation des Programms „ClustalW“ von der DOSauf die Windows-Ebene. Es ist unter der Adresse ftp://ftp-igbmc.u-strasbg.fr/pub/ClustalX/ erhältlich. Mit dem Programm kann ein Sequenzvergleich von Aminosäure- und DNA-Sequenzen durchgeführt werden. Dazu werden mindestens zwei Sequenzen in das Programm geladen. Das Maximum der Sequenzen, die verarbeitet werden können, beträgt 100 Sequenzen, die höchstens 1500 Aminosäuren lang sein dürfen. An die geladenen Sequenzen können per Append-Befehl weitere Sequenzen angefügt werden. Beim Load-Befehl werden, die im Programm vorhandenen Sequenzen überschrieben. Datenformate, die von „ClustalX“ verarbeitet werden, sind: „NBRF“ / “PIR“, „EMBL“ / „SWISSPROT“ , „Pearson“ („Fasta“), „Clustal“ (*.aln), „GCG/MSF“ (Pileup), „GCG9/RSF“ und „GDE“. Die Ausgabeformate sind „Clustal“, „NBRF“ / „PIR“, „GCG/MSF“, „PHYLIP“ oder „GDE“. Per Cut-Befehl können Sequenzen gelöscht werden. Per Cut- und Paste-Befehl kann die Reihenfolge der Sequenzen geändert werden. Abb. 4-1: Hauptbild des Programms „ClustalX“ (der Sequenzvergleich wurde noch nicht durchgeführt) [Gibson et al., 1997] Die Namen der Sequenzen sind auf der linken Seite angegeben, die Sequenzen auf der rechten Seite. Über den Sequenzen sind über einigen Positionen die Zeichen 1. * 2. : 3. . Das Zeichen * bedeutet, daß alle Aminosäuren einer Position identisch sind. Mit dem Zeichen : wird angezeigt, daß alle folgenden Gruppen vollständig konserviert sind: „STA, NEQK, NHQK, NDEQ, QHRK, MILV, MILF, HY, FYW“. Die Aminosäuren haben ähnliche Eigenschaften wie Größe und / oder Polarität. Mit dem Zeichen . wird angezeigt, daß alle folgenden Gruppen vollständig konserviert sind: „CSA, ATV, SAG, STNK, STPA, SGND, SNDEQK, NDEQHK, NEQHRK, FVLIM, HFY“. Die Ähnlichkeit der Aminosäuren in diesen Gruppen ist nicht so stark ausgeprägt. Unter den Sequenzen befinden sich die Angabe der Position sowie ein Graph, der eine Aussage über den Grad der Übereinstimmung macht. Je höher die Linie des Graphs ist, desto höher ist die Übereinstimmung in der betreffenden Position. Auch an der Farbe der Aminosäuren kann eine Übereinstimmung abgelesen werden. Das Farbschema kann der Tabelle 4-1 entnommen werden. @consensus @color % = 60% w:l:v:i:m:a:f:c:y:h:p g = ORANGE # = 80% w:l:v:i:m:a:f:c:y:h:p p = YELLOW - = 50% e:d t = GREEN if t:S:T:%:# + = 60% k:r s = GREEN if t:S:T:# g = 50% g n = GREEN if n:N:D n = 50% n q = GREEN if q:Q:E:+:K:R q = 50% q:e w = BlUE if %:#:A:C:F:H:I:L:M:V:W:Y:P:p p = 50% p l = BlUE if %:#:A:C:F:H:I:L:M:V:W:Y:P:p t = 50% t:s v = BlUE if %:#:A:C:F:H:I:L:M:V:W:Y:P:p A = 85% a i = BlUE if %:#:A:C:F:H:I:L:M:V:W:Y:P:p C = 85% c m = BlUE if %:#:A:C:F:H:I:L:M:V:W:Y:P:p D = 85% d a = BlUE if %:#:A:C:F:H:I:L:M:V:W:Y:P:p:T:S:s:g E = 85% e f = BlUE if %:#:A:C:F:H:I:L:M:V:W:Y:P:p F = 85% f c = BlUE if %:#:A:F:H:I:L:M:V:W:Y:S:P:p G = 85% g c = PINK if C H = 85% h h = CYAN if %:#:A:C:F:H:I:L:M:V:W:Y:P:p I = 85% i y = CYAN if %:#:A:C:F:H:I:L:M:V:W:Y:P:p K = 85% k e = MAGENTA if -:D:E:q:Q L = 85% l d = MAGENTA if -:D:E:n:N M = 85% m k = RED if +:K:R:Q N = 85% n r = RED if +:K:R:Q P = 85% p Q = 85% q R = 85% r S = 85% s T = 85% t V = 85% v W = 85% w Y = 85% y Tab. 4-1: Zuordnungsschema und Farbschema von „ClustalX“ Beispiele für die Färbung einer Aminosäure: Der Aminosäure Glycin (g) wird immer die Farbe Orange zugeordnet. Der Aminosäure Cystein (c) wird dann die Farbe Rosa auf einer Position zugeordnet, wenn mindestens 85% der Aminosäuren auf dieser Position Cystein sind. Die Aminosäure Arginin (r) bekommt die Hintergrundfarbe Rot, falls eine von folgenden Bedingungen erfüllt sind: 1. 60% der Aminosäuren auf dieser Position sind entweder Lysin (k) oder Arginin (r) 2. 85% der Aminosäuren auf dieser Position sind Lysin 3. 85% der Aminosäuren auf dieser Position sind Arginin 4. 85% der Aminosäuren auf dieser Position sind Glutamin (q) Lücken, hier gekennzeichnet durch Striche, werden bei der prozentualen Berechnung ignoriert, d.h. daß in Abbildung 4-2 die Aminosäure Asparaginsäure (d) an den Positionen 290 und 291 ein Vorkommen von 100% auf dieser Position hat und somit die Farbe Magenta hat. Der Sequenzvergleich wird über das Menü Alignment gestartet. Abb. 4-2: Hauptbild des Programms „ClustalX“ (nach durchgeführtem Sequenzvergleich) Nach durchgeführtem Sequenzvergleich sind die hoch konservierten Bereiche der Sequenzen ersichtlich. Die Linie des unteren Graphes befindet sich in weiten Bereichen in Maximalposition. Das sind die Bereiche, in denen es eine hohe Übereinstimmung der Aminosäuren der verschiedenen Sequenzen auf den gleichen Positionen gibt. Je höher der Grad der Übereinstimmung ist, desto mehr sind die Proteine miteinander verwandt. Bei einer Übereinstimmung von 25 oder mehr Prozent wird von einer gemeinsamen Abstammung der Proteine ausgegangen [Doolittle, 1985]. Die Striche im mittleren Teil der oberen beiden Sequenzen kennzeichnen Lücken, die beim Sequenzvergleich entstehen. Damit kommt eine bessere Übereinstimmung zwischen den Sequenzen zustande. Diese Lücken sind nicht in der Aminosäuresequenz eines Proteins zu finden. Sie kennzeichnen Abweichungen zwischen Proteinen, die entweder durch Deletionen (Auslassungen) in den oberen Sequenzen oder durch Insertionen (Einschübe) der unteren Sequenz entstanden sind. Dieses Programm kann auch sehr gut eingesetzt werden, um zu überprüfen, ob Sequenzen aus unterschiedlichen Datenbanken identisch sind. 4.1.2. Antheprot (Version 3.3) [Deleage und Geourjon, 1996] Das Programm „Antheprot“ ist ein sehr umfangreiches Paket mit vielfältigen Möglichkeiten der Proteinanalyse. „Antheprot“ steht für ANalyse THE PROTeins. Es ist für den privaten und wissenschaftlichen Gebrauch frei verfügbar. Eine Dokumentation und ein Verweis zum Herunterladen des Programms befindet sich hier: http://www.ibcp.fr/ANTHEPROT/Documentation_antheprot.html. Von dem Programm werden nur die Möglichkeiten beschrieben, die sinnvoll in die Arbeit integriert werden können. Das Programm „Antheprot“ Primärstrukturebene. Darüber bietet zahlreiche hinaus Auswertemöglichkeiten können Sekundärstrukturberechnungen vorgenommen werden. mit diesem auf der Programm Abb. 4-3: Eingangsbild des Programms „Antheprot“ [Deleage und Geourjon, 1996] Verarbeitet werden von dem Programm folgende Formate: 1. einzelne Sequenzen (*.SEQ) im „Fasta“-Format 2. eine Datenbasis (*.BAS), welche ein oder mehrere Sequenzen im „Fasta“-Format enthält 3. eine „ClustalV“-, „ClustalW“- oder „ClustalX“- Datei (*.ALN), die einen Sequenzvergleich enthält 4. eine „Multalin 4.1“-Datei (*.MUL), die einen Sequenzvergleich enthält 5. eine „Prosite“-Ergebnisdatei (*.SIT), welche gefundene Bereiche in einer Sequenz enthält 6. eine „PDB“-Datei (*.PDB), die Atomkoordinaten von Molekülen beinhaltet 7. eine Ergebnisdatei (*.CNS) vom IBCP Server (http://www.ibcp.fr/predict.html), der Sekundärstrukturvorhersagen berechnet Zu den wichtigsten Auswertungen auf Primärstrukturebene gehören die Auswertung der Hydrophobie (Hydropathie) und der Hydrophilie. Die aufgeführten Methoden sind über den Menüpunkt „Methods“ erreichbar. Abb. 4-4: Menü „Methods“ mit dem Untermenü „Profiles“ Diese aufgeführten Methoden erzeugen eine graphische Anzeige. In dieser graphischen Anzeige kann ein Cursor per Tastatur verschoben werden. Alternativ kann der Cursor mit der Maus bewegt werden. In der linken oberen Ecke wird die Position des Cursors, die der Position der angezeigten Aminosäure entspricht, angezeigt. Die Aminosäure an der betreffenden Position wird rot angezeigt. Ebenso werden die benachbarten Aminosäuren im Umfeld dieser Aminosäure von den Positionen -5 bis +5 angezeigt. Daneben steht der Wert der Methode für die angezeigte Aminosäure. Eine weitere Gemeinsamkeit dieser Methoden ist, daß jeder Aminosäure ein Wert zugeordnet wird, der experimentell ermittelt (Hydrophilie, Hydrophobie) wurde. Aus diesen zugeordneten Werten werden mit Hilfe einer Summenformel (Hydrophilie, Hydrophobie) die entsprechenden Zahlen berechnet und graphisch dargestellt. Als Parameter kann bei den Summenformeln die „Fensterbreite“ variiert werden. Diese Parameter können nur ungerade positive Zahlen sein. Sie legen fest, wieviele Aminosäuren in der Umgebung mit einberechnet werden. Hat dieser Parameter z.B. einen Wert von fünf, werden die Werte der zwei Aminosäuren von der linken Seite, der Wert der Aminosäure, die umgeben wird und die Werte der zwei Aminosäuren auf der rechten Seite mit einberechnet. Der Parameter legt somit auch die Größe für Minimum und Maximum der berechneten Zahlen fest. Der Wert des Parameters ist die Zahl auf der rechten Seite der oberen Zeile der Abbildung 4-5. Der voreingestellte Parameter ist sieben. 4.1.2.1 Hydrophobie (Hydropathie) Diese Methode gibt Auskunft darüber, welche Regionen sich mit hoher Wahrscheinlichkeit im Kern und welche Regionen sich an der Oberfläche des Proteins befinden. Alle Aminosäuren, die unpolare Seitenketten haben, sind hydrophob. Hydrophobe Aminosäuren stören mit ihren unpolaren Seitenketten die wenig geordnete Struktur von Wasser, in dem es deren Wasserstoffbrückenbindungen zerbricht und die Wassermoleküle um die unpolaren Seitenketten in einen hochgeordneten Zustand, d.h. in einen Zustand mit geringer Entropie, zwingt. Dabei nehmen die Freiheitsgrade der Wassermoleküle, Wasserstoffbrückenbindungen zu bilden, ab. Da aus dem zweitem Hauptsatz der Thermodynamik bekannt ist, daß die Entropie einen Maximum zustrebt, wird ein Minimum an Kontakt zwischen Wasser und unpolaren Seitenketten angestrebt. Dies wird bei der Faltung des Proteins durch die Verdrängung der unpolaren Aminosäuren in das Innere des Proteins bewirkt. Alle Aminosäuren, die nach der Auswertemethode positive Werte haben, befinden sich wahrscheinlich im Inneren des Moleküls. Im Programm wird diese Methode als Hydrophobie bezeichnet. Im Originalartikel [Kyte und Doolittle, 1982], auf dem in der Programmanleitung verwiesen wird, wird die Bezeichnung Hydropathie verwendet. Die Hydropathie wird berechnet aus einem hydrophoben und einem hydrophilen Anteil. Im weiteren Verlauf dieses Abschnittes wird deshalb der Begriff Hydropathie benutzt. Abb. 4-5: Graphische Auswertung der Hydropathie am Beispiel von Nidogen Der Hydropathiewert kann bei einem Parameter von sieben maximal 32 sein und minimal –32 sein. Diese theoretischen Werte kommen dann zustande, wenn in einer Aminosäuresequenz aufeinander sieben Isoleucine (I) bzw. Arginine (R) folgen würden. Diese haben den maximalen bzw. minimalen Hydropathiewert von 4.5 bzw. –4.5 (7 * 4.5 = 31.5; 31.5 wird auf 32 aufgerundet). Alle anderen Werte für die Aminosäuren sind in der unten stehenden Tabelle abgebildet. Die Werte für diese Tabelle wurde von Kyte und Doolitle im Jahre 1982 erstellt. Sie beruhen auf Experimenten, die die Energien bestimmten, die nötig waren, um eine Seitenkette einer Aminosäure von einem polaren zu einem unpolaren Lösungsmittel zu transferieren. Diese Daten sind auch im „Amino Acid Index“ [Nakai et al., 1988] enthalten, der auch als Datenbank im „GenomeNet“ in Japan aufliegt. Tab. 4-2: G -0.4 Q -3.5 S -0.8 Y -1.3 A 1.8 K -3.9 T -0.7 W -0.9 V 4.2 H -3.2 D -3.5 C 2.5 L 3.8 R -4.5 E -3.5 M 1.9 I 4.5 F 2.8 N -3.5 P -1.6 Gemessene Werte für die Hydropathie der Aminosäuren [Kyte und Doolittle, 1982] Der Glutaminrest des Nidogen in Position 726, von dem bekannt ist, daß er mit Transglutaminase reagiert, hat einen Hydropathiewert von –10. Dieser Wert befindet sich im unteren Bereich. Dies ist ein Indiz dafür, daß Nidogen sich nicht im Inneren des Moleküls befindet. 4.1.2.2 Hydrophilie Diese Methode gibt Auskunft darüber, welche Regionen sich höchstwahrscheinlich an der Oberfläche des Proteins befinden. Alle Aminosäuren, die polare oder sogar geladene Seitenketten haben, sind hydrophil und gehen bei der Faltung des Proteins eine Wechselwirkung mit den Wassermolekülen ein. Alle Aminosäuren, die nach der Auswertemethode positive Werte haben, befinden sich an der Oberfläche des Moleküls. Abb. 4-6: Graphische Auswertung der Hydrophilie am Beispiel von Nidogen Der Maximalwert bei dieser Methode ist 21 bei einem Parameter von sieben. Er ergäbe sich bei einer Aneinanderreihung von Lysin (K) und / oder Arginin (R). Der Minimalwert wäre – 24 bei einem 7-stelligen Sequenzabschnitt von Tryptophan (W). Alle anderen gemessenen Werte für die Aminosäuren befinden sich in der nachfolgenden Tabelle. Die Werte für die Tabelle wurde im Jahre 1981 von „Hopp und Woods“ erstellt. Sie können auch im „Amino Acid Index“ [Nakai et al., 1988] gefunden werden. Tab. 4-3: G0 Q 0.2 S 0.3 Y -2.3 A -0.5 K 3.0 T -0.4 W -3.4 V -1.5 H -0.5 D 2.5 C -1.0 L -1.8 R 3.0 E 2.5 M -1.3 I -1.8 F -2.5 N 0.2 P -1.4 Gemessene Werte für die Hydrophilie [Hopp und Woods, 1981] Der Glutaminrest 726 von Nidogen hat einen errechneten Wert von 4. Dies ist ein weiterer Hinweis dafür, daß der Glutaminrest an Position 726 sich an der Oberfläche des Proteins befindet. 4.1.2.3 Sekundärstrukturberechnungen In diesem Programm sind vier verschiedene Berechnungsarten für die Sekundärstruktur enthalten, die entweder einzeln angewählt werden, oder es wird die Option ausgewählt, wo alle Sekundärstrukturberechnungen gleichzeitig durchgeführt werden. Wie auch in den schon oben beschriebenen Methoden, kann hier durch Bewegen des Cursors die Position einer Aminosäure bestimmt werden. Im oberen Teil der Grafik befinden sich die Kurven, die sich aus den Berechnungen ergeben, im unteren Teil wird nur der höchsten Wert auf der jeweiligen Position berücksichtigt, der aussagt in welcher Sekundärstruktur sich die Aminosäure befindet. Bei diesen vier Berechnungen handelt es sich um: • GOR I Methode [Garnier et al., 1978] Die Abkürzung GOR setzt sich zusammen aus den Anfangsbuchstaben der drei Autoren J.Garnier, D.Osguthorpe und B.Robson, die diese Methode entwickelt haben. Für diese Methode wurden von 26 Proteinen mit bekannter 3D-Struktur die Parameter gewonnen, mit welcher Wahrscheinlichkeit sich eine Aminosäure entweder in einer α-Helix, in einem β-Faltblatt (Sheet), in einer β-Schleife (Turn) oder in einer ungeordneten Struktur (Coil) befindet. Der α-Helix wird die Farbe Blau, dem β-Faltblatt die Farbe Gelb, der β-Schleife die Farbe Grün und der ungeordneten Struktur die Farbe Schwarz zugeordnet. Dies gilt auch für alle weiteren Methoden der Sekundärstrukturvorhersage. Abb. 4-7: Sekundärstrukturberechnung nach Garnier [1978] für das Protein Nidogen Nach dieser Berechnungsmethode befindet sich der reaktive Glutaminrest von Nidogen an Position 726 in einer β-Schleife. • GOR II Methode [Gibrat et al., 1987] Diese Methode ist eine Weiterentwicklung der GOR I Methode. Die Parameter für die Aminosäuren wurden hierbei aus einem Satz von 68 Proteinen gewonnen. Hierbei werden aber nur noch die drei Sekundärstrukturmotiven α-Helix, β-Faltblatt (Sheet) und ungeordnete Struktur (Coil) berücksichtigt. Abb. 4-8: Sekundärstrukturberechnung nach Gibrat [1987] für das Protein Nidogen Diese Methode sagt ein Vorkommen des Glutaminrestes 726 in einer ungeordneten Struktur voraus. • Double Prediction Method [Deleage und Roux, 1987] Bei dieser Methode werden zwei Vorhersagen kombiniert. Bei der ersten Vorhersage wurde aus einem Satz von 135 Proteinen die Prozentverteilung der Aminosäuren auf die verschiedenen Sekundärstrukturen bestimmt. In einer zweiten Vorhersage wird durch einen Algorithmus die Verteilung der Aminosäuren auf die Sekundärstrukturelemente berechnet. Diese beiden Vorhersagen werden verglichen. Die daraus gewonnenen Daten werden optimiert und nochmals neu berechnet. Abb. 4-9: Sekundärstrukturberechnung nach Deleage und Roux [1987] für Nidogen Nach dieser Methode ist der Glutaminrest 726 in einer ungeordneten Struktur. • Homologue Method [Levin et al., 1986] Hier wird die Annahme gemacht, daß sich kleine Peptidbruchstücke mit gleicher Primärstruktur in identischen Sekundärstrukturen befinden. Jedes Segment eines Proteins mit einer Länge von sieben Aminosäuren wird mit allen Peptiden gleicher Länge von der Kabsch & Sander Datenbank unter Verwendung der untenstehenden Matrix verglichen (Bei den Proteinen aus der Kabsch & Sander Datenbank sind die Sekundärstrukturen bekannt. Sie wurden aus Proteinen mit bekannten Tertiärstrukturen abgeleitet.). Sekundärstrukturmatrix von Levin et al.[1986 ] G P D E A N Q S T K R H V I M C L F Y W G| 2 0 0 0 0 0 0 0 0 0 0 0 -1 -1 -1 0 -1 -1 -1 -1 P| 0 3 0 -1 -1 0 0 0 0 0 0 0 -1 -1 -1 0 -1 -1 -1 -1 D| 0 0 2 1 0 1 0 0 0 0 0 0 -1 -1 -1 0 -1 -1 -1 -1 E| 0 -1 1 2 1 0 1 0 0 0 0 0 -1 -1 -1 0 -1 -1 -1 -1 A| 0 -1 0 1 2 0 0 1 0 0 0 0 0 0 0 0 0 -1 -1 -1 N| 0 0 1 0 0 3 1 0 0 1 0 0 -1 -1 -1 0 -1 -1 -1 -1 Q| 0 0 0 1 0 1 2 0 0 0 0 0 -1 -1 -1 0 -1 -1 -1 -1 S| 0 0 0 0 1 0 0 2 0 0 0 0 -1 -1 -1 0 -1 -1 -1 -1 T| 0 0 0 0 0 0 0 0 2 0 0 0 0 0 0 0 0 -1 -1 -1 K| 0 0 0 0 0 1 0 0 0 2 1 0 -1 -1 -1 0 -1 -1 -1 -1 R| 0 0 0 0 0 0 0 0 0 1 2 0 -1 -1 -1 0 -1 -1 -1 0 H| 0 0 0 0 0 0 0 0 0 0 0 2 -1 -1 -1 0 -1 -1 0 -1 V|-1 -1 -1 -1 0 -1 -1 -1 0 -1 -1 -1 2 1 0 0 1 0 0 0 I|-1 -1 -1 -1 0 -1 -1 -1 0 -1 -1 -1 1 2 0 0 0 1 0 0 M|-1 -1 -1 -1 0 -1 -1 -1 0 -1 -1 -1 0 0 2 0 2 0 0 0 C| 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 2 0 -1 -1 -1 L|-1 -1 -1 -1 0 -1 -1 -1 0 -1 -1 -1 1 0 2 0 2 0 0 0 F|-1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 0 1 0 -1 0 2 1 0 Y|-1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 0 0 0 0 -1 0 1 2 0 W|-1 -1 -1 -1 -1 -1 -1 -1 -1 -1 0 -1 0 0 0 -1 0 0 0 2 Tab. 4-4: Matrix zum Vergleich von Aminosäuren Dabei werden zwei Peptide mit einer Sequenzlänge von sieben Aminosäuren gegenübergestellt. Das eine Peptid ist ein Sequenzabschnitt von dem zu berechnenden Protein, das andere stammt aus der Kabsch & Sander Datenbank. Aus jeweils zwei gegenüberliegten Aminosäuren ergibt sich der Wert, der aus der Matrix entnommen wird. Liegen sich etwa die Aminosäure Glutamin (Q) und Histidin (H) gegenüber, sucht man den Wert in der Tabelle, wo sich die Spalte von Glutamin und die Zeile von Histidin (oder die Zeile von Glutamin und die Spalte von Histidin) kreuzen. In diesem speziellen Fall führt das zum Wert 0. Die sieben Werte, die sich durch die Gegenüberstellung von den Peptiden ergeben, werden summiert. Ist die Summe kleiner als sieben, wird zum nächsten Peptid aus der Kabsch & Sander Datenbank übergegangen (Außer ein Peptid aus dem zu untersuchenden Protein wird gerade mit dem letzten Peptid der Datenbank verglichen, dann wird zum nächsten Peptid des zu untersuchenden Proteins übergegangen.). Ist die Summe größer als sieben, wird dieser Wert für alle sieben Aminosäuren in eine Tabelle für das Peptid des zu untersuchenden Proteins eingetragen. Die Tabelle ist so aufgeteilt, daß in der ersten Spalte die Aminosäuren des Peptids stehen, dann folgen die Spalten für die Sekundärstrukturmotive und am Schluß die vorhergesagte Sekundärstruktur (Die Spalten für die Peptide aus der Datenbank wurden zur Veranschaulichung eingefügt.). α-Helix β-Faltblatt β-Schleife Ungeordnete Peptid 1 Peptid 2 Peptid 3 VorherStruktur aus DB Aus DB Aus DB Sage 10 H H T H 8 H T E H 13 + 10 C T C C 13 C E E E 13 10 T E C T 13 8 T C H T 8 E C H E Aminosäuren Q 13 + 8 K 13 10 D 8 V 8 + 10 I 8 L 10 T 10 13 C: Coil (Ungeordnete Struktur) E: Sheet (β-Faltblatt) H: Helix (α-Helix) T: Turn (β-Schleife) Tab. 4-5: Tabelle zur Auswertung von Sekundärstrukturen nach Levin et al. [1986] Der Wert wird in die Spalte des Sekundärstrukturmotives der korrespondierenden Aminosäure des Peptides der Datenbank eingetragen. Von dieser Aminosäure ist bekannt, in welchem Strukturmotiv sie sich befindet. Beispielsweise, wie in oberen Beispiel abgebildet, wurden der Wert 13 im Vergleich mit Peptid eins, der Wert acht im Vergleich mit Peptid zwei und der Wert zehn im Vergleich mit Peptid drei ermittelt Die Zahlen innerhalb eines Feldes werden summiert. Der größte Wert in einer Zeile bestimmt dann das Sekundärstrukturmotiv, in der sich die Aminosäure befindet. Die anderen Werte spiegeln sich aber in den Kurven im oberen Teil der Graphik wieder. Diese Methode wird solange durchgeführt, bis das Peptid von dem Protein mit allen Peptiden aus der Kabsch & Sander Datenbank verglichen wurde. Diese Werte werden graphisch abgebildet. Abb. 4-10: Sekundärstrukturberechnung nach Levin [1986] für das Protein Nidogen Auch nach dieser Methode befindet sich der Glutaminrest in einer ungeordneten Struktur. Abschließend noch eine kritische Bemerkung zur Berechnung von Sekundärstrukturen. Obwohl in diesem Beispiel nur die älteste Methode eine abweichende Strukturvorhersage auf dieser Position macht, sind Berechnungen von Sekundärstrukturen mit einer gewissen Skepsis zu betrachten. Die neueste GOR-Methode (GOR IV, Garnier, Gibrat and Robson, 1996), deren Parameter aus einem Satz von 267 Proteinen gewonnen wurde, gibt eine mittlere Genauigkeit von 64,4 % für die Vorhersage an. Ein anderes Programm zur Vorhersage von Sekundärstrukturen (Predator, Frishman und Argos, 1996) gibt eine mittlere Genauigkeit von 68 % an. Die Genauigkeit der oben beschriebenen Methoden wird, da sie auf weniger Daten fußen, eher kleiner sein. Das bestätigt sich auch, wenn die Option im Programm gewählt wird, in der alle Methoden parallel gestartet werden. Die Ergebnisse der Methoden werden graphisch gegenübergestellt. Man erkennt in der Graphik (Abbildung 4-11) deutliche Unterschiede bei den Vorhersagen. Abb. 4-11: Sekundärstrukturberechnung nach allen vier Methoden Deshalb wurde hier so weit wie möglich auf Sekundärstrukturen zurückgegriffen, die aus bekannten Tertiärstrukturen abgeleitet wurden. 4.1.3. Auswertung [Schomburg, 1998] Dieses Programm wurde zu Auswertung der Umgebung von Glutaminresten geschrieben. Es läuft unter Windows95 oder WindowsNT im DOS-Fenster. Die Programmiersprache war awk. (Der Name leitet sich aus den Nachnamen der Autoren ab: Aho, Weinberger, Kernighan). Sie ist ein Standardwerkzeug im Unixbereich und hat Gemeinsamkeiten mit den Programmiersprachen C und Perl. Bei dem Programm werden die Anteile der Aminosäuren in den gesamten Umgebungen, die Anteile auf der N-Seite von Glutamin und die Anteile auf der C-Seite von Glutamin ausgewertet und tabellarisch zusammengestellt. In einer weiteren Tabelle werden die Aminosäuren nach den Positionen von –5 bis +5, anlehnend an die Methode von Coussons, ausgewertet. Anteil der AS in den Umgebungen Aminosäure AnzahlAS (%) links (%) rechts (%) Alanin 1 0.91 0 0.00 1 Arginin 2 1.82 2 3.64 0 1.82 0.00 Aspargin 13 11.82 6 10.91 7 12.73 Asparginsäure 13 11.82 7 12.73 6 10.91 Cystein 0 0.00 0 0.00 0 0.00 Glutamin 2 1.82 1 1.82 1 1.82 Glutaminsäure 7 6.36 5 9.09 2 3.64 Glycin 0 0.00 0 0.00 0 0.00 Histidin 2 1.82 0 0.00 2 3.64 Isoleucin 1 0.91 1 1.82 0 0.00 Leucin 11 10.00 3 5.45 8 14.55 Lysin 10 9.09 7 12.73 3 5.45 Methionin 0 0.00 0 0.00 0 0.00 Phenylalanin 4 3.64 1 1.82 3 5.45 Prolin 9 8.18 6 10.91 3 5.45 Serin 20 18.18 11 20.00 9 16.36 Threonin 11 10.00 4 7.27 7 12.73 Tryptophan 0 0.00 0 0.00 0 0.00 Tyrosin 1 0.91 0 0.00 1 1.82 Valin 3 2.73 1 1.82 2 3.64 negativ 20 18.18 12 21.82 8 14.55 positiv 12 10.91 9 16.36 3 5.45 4 3.64 1 1.82 3 5.45 hydrophob Tab. 4-6: Tabellarische Aufstellung der Anzahl / der Anteile der Aminosäuren in den Umgebungen. Anzahl der Aminosäuren auf den Positionen Q 1 (%) 2 (%) 3 (%) 4 (%) 5 (%) Ala -5 (%) 0 0.0 0 0.0 0 0.0 0 0.0 0 0.0 | 0 0.0 0 0.0 0 0.0 1 9.1 0 0.0 Arg 1 9.1 1 9.1 0 0.0 0 0.0 0 0.0 | 0 0.0 0 0.0 0 0.0 0 0.0 0 0.0 Asn 3 27.3 0 0.0 0 0.0 3 27.3 0 0.0 | 2 18.2 2 18.2 2 18.2 0 0.0 1 9.1 Asp 2 18.2 2 18.2 3 27.3 0 0.0 0 0.0 | 1 9.1 1 9.1 3 27.3 0 0.0 1 9.1 Cys 0 0.0 0 0.0 0 0.0 0 0.0 0 0.0 | 0 0.0 0 0.0 0 0.0 0 0.0 0 0.0 Gln 0 0.0 0 0.0 0 0.0 1 9.1 0 0.0 | 0 0.0 1 9.1 0 0.0 0 0.0 0 0.0 Glu 0 0.0 1 9.1 1 9.1 2 18.2 1 9.1 | 2 18.2 0 0.0 0 0.0 0 0.0 0 0.0 Gly 0 0.0 0 0.0 0 0.0 0 0.0 0 0.0 | 0 0.0 0 0.0 0 0.0 0 0.0 0 0.0 His 0 0.0 0 0.0 0 0.0 0 0.0 0 0.0 | 0 0.0 0 0.0 1 9.1 1 9.1 0 0.0 Ile 0 0.0 0 0.0 1 9.1 0 0.0 0 0.0 | 0 0.0 0 0.0 0 0.0 0 0.0 0 0.0 Leu 0 0.0 1 9.1 1 9.1 1 9.1 0 0.0 | 2 18.2 0 0.0 2 18.2 1 9.1 3 27.3 Lys 1 9.1 1 9.1 2 18.2 0 0.0 3 27.3 | 1 9.1 0 0.0 0 0.0 2 18.2 0 0.0 Met 0 0.0 0 0.0 0 0.0 0 0.0 0 0.0 | 0 0.0 0 0.0 0 0.0 0 0.0 0 0.0 Phe 0 0.0 1 9.1 0 0.0 0 0.0 0 0.0 | 0 0.0 2 18.2 0 0.0 1 9.1 0 0.0 Pro 1 9.1 2 18.2 0 0.0 2 18.2 1 9.1 | 0 0.0 1 9.1 0 0.0 1 9.1 1 9.1 Ser 1 9.1 2 18.2 3 27.3 0 5 45.5 | 1 9.1 1 9.1 1 9.1 3 27.3 3 27.3 Thr 2 18.2 0 0.0 0 0.0 2 18.2 0 0.0 | 2 18.2 2 18.2 1 9.1 1 9.1 1 9.1 Trp 0 0.0 0 0.0 0 0.0 0 0.0 0 0.0 | 0 0.0 0 0.0 0 0.0 0 0.0 0 0.0 Tyr 0 0.0 0 0.0 0 0.0 0 0.0 0 0.0 | 0 0.0 0 0.0 0 0.0 0 0.0 1 9.1 Val 0 0.0 0 0.0 0 0.0 0 0.0 1 9.1 | 0 0.0 1 9.1 1 9.1 0 0.0 0 0.0 neg 2 18.2 3 27.3 4 36.4 2 18.2 1 9.1 | 3 27.3 1 9.1 3 27.3 0 0.0 1 9.1 pos 2 18.2 2 18.2 2 18.2 0 0.0 3 27.3 | 1 9.1 0 0.0 0 0.0 2 18.2 0 0.0 hyd 0 1 0 0 0.0 0 | 0 0.0 2 18.2 0 0.0 1 0 0.0 0.0 Tab. 4-7: -4 (%) 9.1 -3 (%) 0.0 -2 (%) 0.0 -1 (%) 0.0 9.1 Tabellarische Aufstellung der Anzahl / der Anteile der Aminosäuren auf den Positionen von –5 bis +5 vom Glutaminrest Durch die Tabelle 4-7, die durch das Programm „Auswertung“ erzeugt wird, können direkt markant hohe oder niedrige Werte von Aminosäuren auf den Positionen erkannt werden. 4.1.4. Einleitung 3D-Viewer Eine der interessantesten Anwendungen in der Computerauswertung auf dem Gebiet der Biochemie ist die Visualisierung von Molekülen. Strukturen, die für das menschlichen Auge nicht sichtbar sind, können als Modell mit Hilfe des Computers dargestellt werden. Zwar ist dies auch mit Modellen aus Draht und / oder Styropor bzw. Plastik möglich, aber die vielfältigen Möglichkeiten, diese Strukturen zu manipulieren und dies in kürzester Zeit, sind nur am Computer durchführbar. Dies macht solche Programme wertvoll für Forschung und Lehre. Bevor auf die Fähigkeiten der Programme eingegangen wird, werden die gemeinsamen und die speziellen Möglichkeiten dieser 3D-Viewer in einer Tabelle dargestellt. RasMol WebLab SwissPdb X Importformate - PDB (Brookhaven Protein Databank) X X - MOL (Molecular Design Limited, MOL) X X - MOL2 (Tripos, Sybyl Mol2) X X - XYZ (MSC, Xmol XYZ) X X - Alchemy (Tripos, Alchemy) X - Charmm (CHARMm) X - MSV (WebLab Viewer binary file format X (Microsoft Compound document)) - MSL (WebLab Viewer portable file format) X - CAR (Molecular Simulations, Insight II) X - CSD X (Cambridge Structural Database Crystallographic files) - MSF (Molecular Simulations, Quanta) X - MSI (Molecular Simulations, Cerius2) X - CPD (Molecular Simulations, Catalyst) X - SKC (Molecular Design Limited, ISIS) X Exportformate (Molekülformate) - PDB (Brookhaven Protein Databank) X - Alchemy (Tripos' Alchemy file format) X - MSV (WebLab Viewer binary file format X X X (Microsoft compound document)) - MSL (WebLab Viewer portable file format) X - MOL (Molecular Design Limited, MOL) X Exportformate (Bildformate) - GIF (Compuserve Graphics Interchange X Format) X - PPM (Portable Pixmap) X - RAS (Sun rasterfile) X - PS (PostScript) X - EPSF (Encapsulated PostScript) X - MONOPS (Monochrome Encapsulated PostScript) X X X X X - BMP (Microsoft Bitmap) X - PICT (Apple PICT) X - JPG (Joint Photographic Experts Group) X - WRL (VRML World) X - POV3 (Povray 3) - 3DMF (3D Metafiles) Koordinatenmanipulation - Verschieben X X X - Zoomen X X X - Drehen X X X X X X (bei Auswahl per Mausklick - Atome Winkel- / Abstandsmessung) - Aminosäuren - Molekülbereich (mit Ziehen der Maus) X X Auswahl per Menü oder Kommandozeile - Aminosäuren X X - Aminosäuregruppen (z.B. polar) X X - Atome X Darstellungsmöglichkeiten - Skelett-Modell oder Linien-Modell X X - Stab-Modell X X - Kugel-Stab-Modell X X - Kalotten-Modell oder CPK-Modell X X - „Punkte-Oberflächen“-Modell X - „Rückgrat“-Modell X X X - Bänder-Modell X X X - Faden-Modell X X X - Cartoon-Modell oder Schematisches Modell X X X - Polyeder X - Röhren-Modell X - Durchscheinende Oberfläche X X X X X Beschriftung - Atome - Bindungen - Aminosäuren - Ketten X - Moleküle X X X X X X X X Colorierung - Atome X X - Bindungen X X - Aminosäuren X X - Ketten X X - Moleküle X X - Beschriftungen X X Ansicht - Wasserstoffbrücken-Bindungen X X X - SS-Bindungen X X X Stereoansicht X Mehrere Moleküle gleichzeitig laden X X (RasMolucb) Tab. 4-8: Tabellarische Gegenüberstellung der 3D-Viewer RasMol, WebLab und SwissPdb X X 4.1.5. RasMol (Version 2.6) [Sayle, 1995] Der RasMol-Viewer ist der älteste (veröffentlicht 1993) und verbreitetste von den drei Viewern, die hier beschrieben werden. Sein Name ist die Abkürzung von Raster Molecules. Viele Viewer basieren auf ihm. Dies gilt auch für die beiden anderen, auf Seite 43 genannten Viewer, als auch für Chime, das Plug-In für Internetbrowser von der Firma MDL (http://www.mdli.com). Der RasMol-Viewer ist kostenlos verfügbar und steht im Internet (http://www.glaxowellcome.co.uk/software/) zum Herunterladen zur Verfügung. Eine weitere empfehlenswerte Adresse für RasMol ist http://klaatu.oit.umass.edu/microbio/rasmol/index.html. Abb. 4-12: Eingangsbildschirm von RasMol mit α-Lactalbumin als Skelett-Modell Seine großen Vorteile sind die vielfältigen Darstellungsmöglichkeiten und die einfache Bedienbarkeit. Die geladenen Moleküle können entweder mit Hilfe der Maus oder über Kommandos im Fenster RasMol Command Line bewegt werden. Manipulation Maussteuerung Kommando Translation rechte Maustaste Translate <axis><value> Rotation X-Y linke Maustaste Rotate <axis><value> Rotation Z Shift- + rechte Maustaste Rotate <axis><value> Zoom Shift- + linke Maustaste Zoom <value> Tab. 4-9: Bewegungssteuerungen bei RasMol im Überblick Die vielfältigen Darstellungsmöglichkeiten des Viewers werden am α-Lactalbumin demonstriert. Abb. 4-13: α-Lactalbumin Abb. 4-14: Skelett-Modell α-Lactalbumin Stab-Modell Die (roten) Sauerstoffatome, die nicht mit dem Molekül verbunden sind, gehören zu Wassermolekülen. Wasserstoffatome werden nicht dargestellt. Das gleiche gilt auch für das Kalotten-und das „Punkte-Oberflächen“-Modell. Abb. 4-15: Kugel-Stab-Modell α-Lactalbumin Abb. 4-16: α-Lactalbumin Abb. 4-17: α-Lactalbumin „Punkte- Kalotten- Oberflächen“-Modell Modell Die Oberflächen der Kugeln entsprechen den Van-der-Waals Radien. Abb. 4-18: α-Lactalbumin Bänder-Modell Abb. 4-20: α-Lactalbumin Abb. 4-19: α-Lactalbumin Faden-Modell Abb. 4-21: Das Rückgrat- Cartoon-Modell Modell Die gewundenen Bänder des symbolisieren α-Helices, die Pfeile β-Faltblätter. Die restlichen Bereiche sind Ungeordnete Strukturen. α-Lactalbumin Alle hier dargestellten Modelle sind mit Ausnahme des „Punkte-Oberflächen“-Modells über das Menü „Display“ im Hauptfenster anwählbar. Das „Punkte-Oberflächen“-Modell kann mit dem Befehl „dots“ im Fenster “RasMol Command Line” erzeugt werden. Dort können durch Angabe eines Wertes von 0 bis 1000, die Dichte der Punkte variiert werden. Auch bei anderen Darstellungsformen sind mit den entsprechenden Befehlen im Fenster “RasMol Command Line” Werteangaben möglich, die Radien: Skelett-Modell Wert von 0 – 490 Kalotten-Modell Wert von 0 – 500 Rückgrat-Modell Wert von 0 – 490 oder die Weiten: Bänder-Modell Wert von 0 – 1000 Faden-Modell Wert von 0 – 1000 zu spezifizieren. Durch diese Angaben können Bereiche eines Proteins hervorgehoben werden. Die Größenverhältnisse, die dabei entstehen, müssen nichts mit der Realität zu tun haben, sondern dienen nur der Veranschaulichung. Die Stärken aller drei Programme liegen darin, daß Bereiche oder Aminosäuren in Molekülen ausgewählt werden können und diese durch eine andere Darstellungsart gegenüber dem restlichen Molekül herausgehoben werden. Die Auswahl geschieht bei RasMol mit dem Befehl „select“ im Fenster “RasMol Command Line”. Ausgewählt werden können: 1. einzelne Atome über ihre Position, z.B. select atomno=64 2. einzelne Aminosäuren über die Angabe ihrer Position, z.B. select 5 3. mehrere Aminosäuren über die Angaben ihrer Positionen, z.B. select 5, 12, 45 4. ein Bereich von mehreren Aminosäuren, z.B. select 5 – 45 5. alle einzelnen Aminosäuren eines Aminosäuretyps, z.B. select glu 6. vordefinierte Mengen, z.B. select charged Die vordefinierten Mengen auf einen Blick: at acidic acyclic aliphatic alpha amino aromatic backbone basic bonded buried cg charged cyclic cystine helix hetero hydrogen hydrophobic ions large ligand medium neutral nucleic polar protein purine pyrimidine selected sheet sidechain small solvent surface turn water Tab. 4.10: Vordefinierte Mengen bei RasMol Alle Angaben zum select-Befehl können mit boolschen Operatoren “AND”, “OR” und “NOT” verknüpft werden, so daß komplexere Auswahlen getroffen werden können. Beispiele: 1. select charged and not asp 2. select small or aromatic 3. select polar or trp 4. select 5-56 and gln Als besonders günstige Darstellungsmöglichkeiten haben sich bei mir folgende Kombinationen erwiesen: Molekül Hervorgehobener Bereich Skelett-Modell Kugel-Stab-Modell Kalotten-Modell „Punkte-Oberflächen“-Modell Stab-Modell Kalotten-Modell „Punkte-Oberflächen“-Modell Kugel-Stab-Modell Kalotten-Modell „Punkte-Oberflächen“-Modell Bänder-Modell Skelett-Modell Kugel-Stab-Modell Kalotten-Modell „Punkte-Oberflächen“-Modell Faden-Modell Skelett-Modell Kugel-Stab-Modell Kalotten-Modell „Punkte-Oberflächen“-Modell Rückgrat-Modell Skelett-Modell Kugel-Stab-Modell Kalotten-Modell „Punkte-Oberflächen“-Modell Cartoon-Modell Skelett-Modell Kugel-Stab-Modell Kalotten-Modell „Punkte-Oberflächen“-Modell Tab. 4-11: Geeignete Kombinationsmöglichkeiten zur Darstellung von hervorgehobenen Bereichen von Molekülen Durch Beschriftung können diese Bereiche nochmals besonders gekennzeichnet werden. Dies geschieht über das Menü “Options / Labels” oder mit dem Kommando “label”. Über den Befehl “set fontsize” kann die Größe des Textes beeinflußt werden. Ein weiterer Effekt kann durch Colorierung erzielt werden. Dies kann über das Menü “Colours” bewerkstelligt werden. Hierbei können die, durch den “select”-Befehl ausgewählten Bereiche, coloriert werden. Sollen Bindungen oder Beschriftungen coloriert werden, muß dies im “RasMol Command Line” Fenster mit dem Befehl “colour” und der entsprechenden Angabe getan werden. Dieses Bild wurde mit folgenden Befehlen erzeugt: Abb. 4-22: - load „lactalbumin.pdb“ - background white - backbone - colour backbone red - select gln - spacefill - Menü Options / Labels - colour labels blue α-Lactalbumin als Rückgratmodell Die Glutaminreste sind hervorgehoben. Als sehr nützlich kann es sich erweisen, nur ein Teil des Moleküls darzustellen. Entweder zoomt man die gewünschte Stelle bis alle anderen Bereiche des Moleküls nicht mehr auf dem Bildschirm sind oder es wird der „restrict“-Befehl benutzt, der nur die Bereiche anzeigt, für die Angaben gemacht worden sind. Für den „restrict“-Befehl gelten die gleichen Angaben wie für den „select“-Befehl. Um dieses Bild darzustellen, werden folgende Befehle benötigt: - Abb. 4-23: load „lactalbumin.pdb“ background white select 49-59 wireframe 80 zoom 200 translate rotate Menü Options / Labels colour labels blue select 54 dots 1000 α-Lactalbumin als Skelettmodell Die Umgebung des Glutamins ist als Stab-Modell, das Glutamin als „Punkte-Oberflächen“-Modell dargestellt. Wenn einzelne Atome oder Aminosäuren, wie in Abbildung 4-23 gezeigt, nochmals verstärkt aus ihrem Bereich hervorgehoben werden sollen, ist es durchaus sinnvoll drei oder mehr Darstellungsarten zu mischen. 4.1.5.1 RasMenu [Sayle, 1994] Die Erweiterung RasMenu für RasMol integriert viele Möglichkeiten in das Hauptmenü, die sonst bei RasMol nur per Kommandozeile erreichbar sind. RasMenu ist über den gleichen FTP-Server (ftp://ftp.dcs.ed.ac.uk/pub/rasmol/) frei erhältlich wie RasMol. Abb. 4-24: Hauptmenü mit der Erweiterung RasMenu Dadurch ist es beispielsweise möglich, die ganze Auswahl, die sonst nur über den „select“Befehl im RasMol Command Line Fenster möglich ist, über das Menü zu steuern. Abb. 4-25: RasMol Select Menu vom Menü „Edit / Select Zone“ Komplexere Auswahlen können entweder über die Kommandozeile im Fenster des Hauptmenüs oder im Fenster RasMol Command Line getroffen werden. Als Nachteil ist hingegen zu werten, daß RasMol in den Menüs nur bis zur Version 2.5 unterstützt wird, in der Kommandozeile hingegen können auch die Möglichkeiten von Version 2.6 genutzt werden. 4.1.5.2 RasMol-ucb [UC Regents, 1995] Diese überarbeitete Version von RasMol erlaubt es, bis zu fünf Moleküle gleichzeitig zu laden und unabhängig voneinander zu manipulieren. Dadurch können Enzym-SubstratKomplexe visualisiert werden. Auch diese Version von RasMol ist frei und kann über die Adresse (http://mc2.cchem.berkeley.edu/Rasmol/v2.6/) bezogen werden. Ucb steht für University of California, Berkeley. Eine weitere Erweiterung gegenüber RasMol von Roger Sayle ist die Werkzeugleiste, die in Abbildung 4-26 dargestellt ist. Auch hier werden Kommandos, die sonst nur über das Kommandofenster von RasMol erreichbar sind, in die Fenstertechnik integriert. Durch die erste Reihe können Bestimmungen vorgenommen werden. In der zweiten Reihe wird selektiert, welcher Bereich gedreht wird. Im unteren Teil kann ausgewählt werden, welches Molekül bearbeitet wird. Abb. 4-26: Werkzeug-Palette von RasMol-ucb Abb. 4-27: Faktor XIIIa in Wechselwirkung mit Phospholipase A2 Das Rückgrat von dem Enzym Faktor XIIIa ist magenta, die katalytische Triade ist als Kalottenmodell hervorgehoben. Das Rückgrat des Substrates ist grün dargestellt, der reaktive Glutaminyl-Rest ist als kombiniertes StabPunkte-Oberflächen-Modell hervorgehoben. 4.1.6. WebLab Viewerlite (Version 2.01) [Molecular Simulations, 1997] Dieser Viewer ist ein Teil eines Programmpaketes zur Bearbeitung von Proteinen von der Firma „Molecular Simulations“. Die Lite-Version des WebLab Viewers ist frei erhältlich. WebLab ViewerPro Version 3.1 ist als Testversion für 30 Tage nutzbar. Beide Programme sind über den Web-Server (http://www.msi.com/weblab/viewer/info/) von „Molecular Simulations“ erhältlich. Abb. 4-28: Eingangsbildschirm von WebLab Viewer mit α-Lactalbumin als Linien-Modell Der WebLab Viewer zeichnet sich aus durch: 1. seine vielfältigen Im- und Exportformate 2. seine Werkzeugpalette 3. das Selektieren von Molekülen mit der Maus 4. die vielfältigen Darstellungsmöglichkeiten der Moleküle 5. das Zeichnen einer durchscheinenden Umgebung Abb. 4-29: Mit dem Pfeil werden Atome, Moleküle oder Bereiche ausgewählt. Mit dem zweiten Werkzeug kann das Molekül gedreht werden. Mit der Auswahl des dritten Symbols wird das Molekül verschoben Über das vierte Symbol kann das Molekül gezoomt werden. Mit dem letzten Werkzeug kann eine Bindung gedreht werden. Werkzeugpalette des WebLab Viewer Wahlweise kann mit Hilfe eines Rechteckes oder eines Lassos ein Bereich aufgespannt werden, indem alle enthaltenen Moleküle und Atome ausgewählt sind. Alle ausgewählten Moleküle sind gelb gekennzeichnet. Diese können nun getrennt vom restlichen Molekül bearbeitet werden. Abb. 4-30: α-Lactalbumin mit ausgewähltem Bereich Das Selektieren von Atomen oder Aminosäuren über das Menü ist weniger gut gelungen, da es dort nicht möglich ist, Bereiche anzugeben. Abb. 4-31: Das Auswahlmenü im WebLab Viewer Alle mit einem Häkchen versehenen Felder werden mit einem logischen „AND“-Operator verknüpft, so daß im oberen Beispiel alle Sauerstoffatome ausgewählt werden, die in Glutamin enthalten sind. Eine Stärke des Programms sind die vielfältigen Darstellungsmöglichkeiten. Im Menü wird nach Objekten unterschieden, die dargestellt werden. Dazu gehören Atome, Moleküle, die Elementarzelle des Kristalls und Beschriftung und / oder Oberfläche, wenn diese hinzugefügt werden. Diese können über das Menü verändert werden. Abb. 4-32: Darstellungsarten für die Atome Neben dem Ausschalten der Darstellungsart kann zwischen sechs verschiedenen Modellen gewählt werden. Das Linien-Modell ohne Bindungsordnung entspricht dem Skelett-Modell von RasMol und das CPK-Modell (Corey, Pauling und Kultun) entspricht dem KalottenModell. Stab- und Kugel-Stab-Modell sind den Modellen bei RasMol äquivalent. Im Linien-Modell werden im Gegensatz zum Linien-Modell ohne Bindungsordnung auch die Bindungen, z.B. in aromatischen Systemen, angezeigt. Im Polyeder-Modell werden alle Atome mit weniger als vier Bindungen als Linien dargestellt, Atome mit vier oder mehr Bindungen werden als Polyeder gezeichnet. Auf der rechten Seite kann die Colorierung des Moleküls nach einem definierten Schema ausgewählt werden. Ansonsten kann die Farbe aus einer Palette ausgesucht werden. Im unteren Bereich können die Werte für die Größe von Stäben und Kugeln und der Faktor für die Darstellung der van-der-Waals-Radien eingegeben werden. Abb. 4-33: Darstellungsarten für die Beschriftungen Die Beschriftung kann entweder ein- oder ausgestellt werden. Bei der Farbe kann ein voreingestellter Wert benutzt werden oder die Farbe wird aus einer Farbpalette ausgesucht. Weiterhin kann der Schriftstil und die Schriftgröße bestimmt werden. Abb. 4-34: Darstellungsarten für die Proteine Bei der Darstellungsart für Proteine werden die Rückgräter gezeigt. „Ca Wire“, „Ca Stick“ und „Tube“ entsprechen dem Rückgrat-Modell (mit verschiedenen Parametern) in RasMol, außer daß das Protein nicht einheitlich, sondern nach dem Farbschema der Aminosäuren gefärbt ist. Line, Flat und Solid Ribbon entsprechen dem Bänder-Modell (mit verschiedenen Parametern) in RasMol. Das schematische Modell entspricht dem Cartoon-Modell in RasMol. Abb. 4-35: Darstellungsarten für die Zelle Hier wird die Elementarzelle des Moleküls dargestellt. Einstellungsmöglichkeiten sind hier die Dicke der Zellkanten, die Farbe der Zellkanten und ob die Achsen der Zelle beschriftet werden sollen. Abb. 4-36: Darstellungsarten für die Oberfläche Hier kann zwischen einer Lösungsmitteloberfläche, die dem Conolly-Modell entspricht oder einer weichen Oberfläche gewählt werden, die der Lösungsmitteloberfläche ähnlich ist. Für die letztere Oberfläche wird ein schnellerer Algorithmus benutzt, der die Oberfläche aber nicht so genau berechnet. Weiterhin kann auch hier die Farbe spezifiziert werden. Bei der Lösungsmitteloberfläche kann auch der Probenradius eingestellt werden. 1.4 Angstrom ist der Radius von Wasser. Über ein Kontrollkästchen kann die Oberfläche transparent oder undurchsichtig gemacht werden. Durch die transparente Oberfläche können sehr anschauliche Bilder erzielt werden. Abb. 4-37: α-Lactalbumin als Bänder-Modell Die Glutaminreste als Kugel-Stab-Modelle sind hervorgehoben und von einer transparenten Oberfläche umhüllt. Alle oben aufgezählten Darstellungsmöglichkeiten können miteinander kombiniert werden, wobei pro Objekt nur ein Modell ausgewählt werden kann. 4.1.7. Swiss-PdbViewer (Version 3.0) [Guex und Peitsch, 1998] Dieser Viewer ist wie die beiden anderen Viewer kostenlos verfügbar. Er kann über den Expasy-Server (http://expasy.hcuge.ch/spdbv/mainpage.html), auf dem auch die Datenbank SWISS-PROT aufliegt, heruntergeladen werden. Für ihn steht auch ein umfangreiches Handbuch und ein Lehrgang zur Verfügung. Das Konzept des Swiss-PdbViewers geht weit über das Konzept eines reinen Betrachtungsprogramms hinaus. Seine Stärken liegen deshalb auch nicht in den vielfältigen Darstellungsmöglichkeiten, sondern in der Analyse von Proteinen. Mit diesem Programm ist es möglich: 1. Sequenzabschnitte in Molekülen zu suchen 2. Ramachandran Plots anzuzeigen und über diese die Darstellung der Moleküle zu beeinflussen 3. Sequenzvergleiche vorzunehmen 4. Distanzen zwischen zwei Atomen zu bestimmen (mit Hilfe des Werkzeugs Nummer 5) 5. Winkel zwischen zwei Bindungen zu bestimmen (mit Hilfe des Werkzeugs Nummer 6) 6. Dihedral-Winkel zu bestimmen (mit Hilfe des Werkzeugs Nummer 7) 7. 2 Moleküle anzupassen und Proteine über Superimposing zu vergleichen (mit Hilfe des Werkzeugs Nummer 11) 8. Austausch von Seitenketten (mit Hilfe des Werkzeugs Nummer 12) 9. Rotation von Seitenketten (mit Hilfe des Werkzeugs Nummer 13) Die Abschnittssuche in Sequenzen startet man im Menü „Edit / Find Sequence“, die Darstellung von Ramachandran Plots im Menü „Display / Show Ramachandran“. Sequenzvergleiche können ebenfalls über Menü Display ausgewählt werden; „Display / Show Sequence Alignment“. Die anderen Punkte der Liste können mit Hilfe der Werkzeugleiste, die in Abbildung 4-38 zu sehen ist, gestartet werden. 1 Abb. 4-38: 2 3 4 5 6 7 8 9 10 11 12 13 Werkzeugleiste von Swiss-PdbViewer Alle Symbole der Werkzeugliste, die noch nicht berücksichtigt worden sind, haben folgende Bedeutungen: Durch Betätigen des Symbols 8 der Werkzeugleiste erhält man die Herkunft des anzuklickenden Atoms: die Aminosäure, in dem sich das Atom befindet, die Stellung der Aminosäure in der Primärstruktur und das Elementzeichen des Atoms. Mit Symbol 9 können alle Atome angezeigt oder ausgewählt werden, die in einem bestimmten Radius, der frei gewählt werden kann, vom angeklickten Atom entfernt sind. Mit Symbol 10 wird das anzuklickende Atom Zentrum der Darstellung. Die Symbole 2 – 4 dienen der Koordinatenmanipulation. Dabei kann bei angeklicktem: 1. Symbol 2 das Molekül verschoben 2. Symbol 3 das Molekül gezoomt 3. Symbol 4 das Molekül rotiert werden. Bei der Anwahl des Symbols 1 der Werkzeugleiste öffnet sich ein Fenster, in dem Parameter für das Programm eingestellt werden können. Abb. 4-39: Eigenschaftenfenster des Swiss-PdbViewer Das wichtigste Fenster zum Manipulieren der Darstellung ist die Steuerungseinheit. Mit ihr kann ausgewählt werden, ob das Molekül sichtbar und / oder zu bewegen ist. Ferner kann per Mausklick angesteuert werden: 1. jede einzelne Aminosäure 2. jede einzelne Seitenkette 3. jede einzelne Beschriftung 4. die Punkte-Oberfläche für jede einzelne Aminosäure 5. das Bänder-Modell für jede einzelne Aminosäure 6. die Farbe jeder einzelnen Aminosäure Abb. 4-40: Steuerungseinheit des Swiss-PdbViewer Weitere Einstellungen lassen sich über das Menü im Hauptfenster vornehmen, z.B. die Auswahl von Gruppen im Menü Select oder die Einstellung der Farben nach Schemata im Menü Color. Eine weitere besondere Eigenschaft dieses Programms ist das Menü SwissModel. Dahinter verbirgt sich ein Menü, in dem eine Primärstruktur zum Vergleich mit allen Primärstrukturen in der Datenbank SwissModel auf dem Expasy-Server vorbereitet und gesendet wird. Die Moleküle mit Tertiärstrukturen der Datenbank, die der gesendeten Sequenz am ähnlichsten sind, werden zum Herunterladen bereitgestellt. Abb. 4-41: Hauptfenster des Swiss-PdbViewer mit α-Lactalbumin Die Glutaminreste mit dem Punkte-Oberflächen-Modell dargestellt worden sind, bei allen anderen Aminosäuren wurden die Seitenketten entfernt. Der reaktive Glutaminrest ist beschriftet. Um ein Kalotten-Modell (nicht Punkte-Oberflächen-Modell) darstellen zu können, bedient sich der Viewer des Programms QuickDraw von Apple, welches die Wiedergabe dieses Modells berechnet. Dieses Programm muß separat aus dem Internet heruntergeladen werden (http://www.apple.com/quicktime/qd3d/index.html). Abb. 4-42: Abbildung 4-45 gerendert mit QuickDraw mit der Einstellung feste Bänder Es können auch Bilder mit Raytracing erzeugt werden, da eine Schnittstelle von dem Programm Swiss-PdbViewer zu dem Programm Pov-Ray (Persistence of Vision Raytracer) besteht. Pov-Ray ist frei verfügbar (http://www.povray.org/).