4.1. Programme

4.1. Programme
Bei einem Teil der Programme werden Proteine auf der Primärstrukturebene ausgewertet.
Dazu dienen Sequenzvergleiche verschiedener Moleküle, Berechnung von Hydrophilie und
Hydropathie und Sekundärstrukturberechnungen.
In einem weiteren Teil werden die Moleküle als 3D-Modelle betrachtet.
4.1.1. ClustalX (Version 1.64b) [Gibson et al., 1997]
Das Programm „ClustalX“ ist die Transformation des Programms „ClustalW“ von der DOSauf die Windows-Ebene. Es ist unter der Adresse
ftp://ftp-igbmc.u-strasbg.fr/pub/ClustalX/ erhältlich.
Mit dem Programm kann ein Sequenzvergleich von Aminosäure- und DNA-Sequenzen
durchgeführt werden. Dazu werden mindestens zwei Sequenzen in das Programm geladen.
Das Maximum der Sequenzen, die verarbeitet werden können, beträgt 100 Sequenzen, die
höchstens 1500 Aminosäuren lang sein dürfen. An die geladenen Sequenzen können per
Append-Befehl weitere Sequenzen angefügt werden. Beim Load-Befehl werden, die im
Programm vorhandenen Sequenzen überschrieben. Datenformate, die von „ClustalX“
verarbeitet werden, sind: „NBRF“ / “PIR“, „EMBL“ / „SWISSPROT“ , „Pearson“ („Fasta“),
„Clustal“ (*.aln), „GCG/MSF“ (Pileup), „GCG9/RSF“ und „GDE“. Die Ausgabeformate sind
„Clustal“, „NBRF“ / „PIR“, „GCG/MSF“, „PHYLIP“ oder „GDE“.
Per Cut-Befehl können Sequenzen gelöscht werden. Per Cut- und Paste-Befehl kann die
Reihenfolge der Sequenzen geändert werden.
Abb. 4-1:
Hauptbild des Programms „ClustalX“
(der Sequenzvergleich wurde noch nicht durchgeführt)
[Gibson et al., 1997]
Die Namen der Sequenzen sind auf der linken Seite angegeben, die Sequenzen auf der
rechten Seite. Über den Sequenzen sind über einigen Positionen die Zeichen
1. *
2.
:
3.
.
Das Zeichen * bedeutet, daß alle Aminosäuren einer Position identisch sind.
Mit dem Zeichen : wird angezeigt, daß alle folgenden Gruppen vollständig konserviert sind:
„STA, NEQK, NHQK, NDEQ, QHRK, MILV, MILF, HY, FYW“.
Die Aminosäuren haben ähnliche Eigenschaften wie Größe und / oder Polarität.
Mit dem Zeichen . wird angezeigt, daß alle folgenden Gruppen vollständig konserviert sind:
„CSA, ATV, SAG, STNK, STPA, SGND, SNDEQK, NDEQHK, NEQHRK, FVLIM, HFY“.
Die Ähnlichkeit der Aminosäuren in diesen Gruppen ist nicht so stark ausgeprägt.
Unter den Sequenzen befinden sich die Angabe der Position sowie ein Graph, der eine
Aussage über den Grad der Übereinstimmung macht. Je höher die Linie des Graphs ist, desto
höher ist die Übereinstimmung in der betreffenden Position.
Auch an der Farbe der Aminosäuren kann eine Übereinstimmung abgelesen werden.
Das Farbschema kann der Tabelle 4-1 entnommen werden.
@consensus
@color
% = 60% w:l:v:i:m:a:f:c:y:h:p
g = ORANGE
# = 80% w:l:v:i:m:a:f:c:y:h:p
p = YELLOW
- = 50% e:d
t = GREEN if t:S:T:%:#
+ = 60% k:r
s = GREEN if t:S:T:#
g = 50% g
n = GREEN if n:N:D
n = 50% n
q = GREEN if q:Q:E:+:K:R
q = 50% q:e
w = BlUE if %:#:A:C:F:H:I:L:M:V:W:Y:P:p
p = 50% p
l = BlUE if %:#:A:C:F:H:I:L:M:V:W:Y:P:p
t = 50% t:s
v = BlUE if %:#:A:C:F:H:I:L:M:V:W:Y:P:p
A = 85% a
i = BlUE if %:#:A:C:F:H:I:L:M:V:W:Y:P:p
C = 85% c
m = BlUE if %:#:A:C:F:H:I:L:M:V:W:Y:P:p
D = 85% d
a = BlUE if
%:#:A:C:F:H:I:L:M:V:W:Y:P:p:T:S:s:g
E = 85% e
f = BlUE if %:#:A:C:F:H:I:L:M:V:W:Y:P:p
F = 85% f
c = BlUE if %:#:A:F:H:I:L:M:V:W:Y:S:P:p
G = 85% g
c = PINK if C
H = 85% h
h = CYAN if %:#:A:C:F:H:I:L:M:V:W:Y:P:p
I = 85% i
y = CYAN if %:#:A:C:F:H:I:L:M:V:W:Y:P:p
K = 85% k
e = MAGENTA if -:D:E:q:Q
L = 85% l
d = MAGENTA if -:D:E:n:N
M = 85% m
k = RED if +:K:R:Q
N = 85% n
r = RED if +:K:R:Q
P = 85% p
Q = 85% q
R = 85% r
S = 85% s
T = 85% t
V = 85% v
W = 85% w
Y = 85% y
Tab. 4-1:
Zuordnungsschema und Farbschema von „ClustalX“
Beispiele für die Färbung einer Aminosäure:
Der Aminosäure Glycin (g) wird immer die Farbe Orange zugeordnet.
Der Aminosäure Cystein (c) wird dann die Farbe Rosa auf einer Position zugeordnet, wenn
mindestens 85% der Aminosäuren auf dieser Position Cystein sind.
Die Aminosäure Arginin (r) bekommt die Hintergrundfarbe Rot, falls eine von folgenden
Bedingungen erfüllt sind:
1. 60% der Aminosäuren auf dieser Position sind entweder Lysin (k) oder Arginin (r)
2. 85% der Aminosäuren auf dieser Position sind Lysin
3. 85% der Aminosäuren auf dieser Position sind Arginin
4. 85% der Aminosäuren auf dieser Position sind Glutamin (q)
Lücken, hier gekennzeichnet durch Striche, werden bei der prozentualen Berechnung
ignoriert, d.h. daß in Abbildung 4-2 die Aminosäure Asparaginsäure (d) an den Positionen
290 und 291 ein Vorkommen von 100% auf dieser Position hat und somit die Farbe Magenta
hat.
Der Sequenzvergleich wird über das Menü Alignment gestartet.
Abb. 4-2:
Hauptbild des Programms „ClustalX“
(nach durchgeführtem Sequenzvergleich)
Nach durchgeführtem Sequenzvergleich sind die hoch konservierten Bereiche der Sequenzen
ersichtlich. Die Linie des unteren Graphes befindet sich in weiten Bereichen in
Maximalposition. Das sind die Bereiche, in denen es eine hohe Übereinstimmung der
Aminosäuren der verschiedenen Sequenzen auf den gleichen Positionen gibt. Je höher der
Grad der Übereinstimmung ist, desto mehr sind die Proteine miteinander verwandt. Bei einer
Übereinstimmung von 25 oder mehr Prozent wird von einer gemeinsamen Abstammung der
Proteine ausgegangen [Doolittle, 1985].
Die Striche im mittleren Teil der oberen beiden Sequenzen kennzeichnen Lücken, die beim
Sequenzvergleich entstehen. Damit kommt eine bessere Übereinstimmung zwischen den
Sequenzen zustande. Diese Lücken sind nicht in der Aminosäuresequenz eines Proteins zu
finden. Sie kennzeichnen Abweichungen zwischen Proteinen, die entweder durch Deletionen
(Auslassungen) in den oberen Sequenzen oder durch Insertionen (Einschübe) der unteren
Sequenz entstanden sind.
Dieses Programm kann auch sehr gut eingesetzt werden, um zu überprüfen, ob Sequenzen aus
unterschiedlichen Datenbanken identisch sind.
4.1.2. Antheprot (Version 3.3) [Deleage und Geourjon, 1996]
Das Programm „Antheprot“ ist ein sehr umfangreiches Paket mit vielfältigen Möglichkeiten
der Proteinanalyse. „Antheprot“ steht für ANalyse THE PROTeins. Es ist für den privaten
und wissenschaftlichen Gebrauch frei verfügbar. Eine Dokumentation und ein Verweis zum
Herunterladen des Programms befindet sich hier:
http://www.ibcp.fr/ANTHEPROT/Documentation_antheprot.html.
Von dem Programm werden nur die Möglichkeiten beschrieben, die sinnvoll in die Arbeit
integriert werden können.
Das
Programm
„Antheprot“
Primärstrukturebene.
Darüber
bietet
zahlreiche
hinaus
Auswertemöglichkeiten
können
Sekundärstrukturberechnungen vorgenommen werden.
mit
diesem
auf
der
Programm
Abb. 4-3:
Eingangsbild des Programms „Antheprot“
[Deleage und Geourjon, 1996]
Verarbeitet werden von dem Programm folgende Formate:
1. einzelne Sequenzen (*.SEQ) im „Fasta“-Format
2. eine Datenbasis (*.BAS), welche ein oder mehrere Sequenzen im „Fasta“-Format enthält
3. eine
„ClustalV“-,
„ClustalW“-
oder
„ClustalX“-
Datei
(*.ALN),
die
einen
Sequenzvergleich enthält
4. eine „Multalin 4.1“-Datei (*.MUL), die einen Sequenzvergleich enthält
5. eine „Prosite“-Ergebnisdatei (*.SIT), welche gefundene Bereiche in einer Sequenz enthält
6. eine „PDB“-Datei (*.PDB), die Atomkoordinaten von Molekülen beinhaltet
7. eine Ergebnisdatei (*.CNS) vom IBCP Server (http://www.ibcp.fr/predict.html), der
Sekundärstrukturvorhersagen berechnet
Zu den wichtigsten Auswertungen auf Primärstrukturebene gehören die Auswertung der
Hydrophobie (Hydropathie) und der Hydrophilie.
Die aufgeführten Methoden sind über den Menüpunkt „Methods“ erreichbar.
Abb. 4-4:
Menü „Methods“ mit dem Untermenü „Profiles“
Diese aufgeführten Methoden erzeugen eine graphische Anzeige. In dieser graphischen
Anzeige kann ein Cursor per Tastatur verschoben werden. Alternativ kann der Cursor mit der
Maus bewegt werden. In der linken oberen Ecke wird die Position des Cursors, die der
Position der angezeigten Aminosäure entspricht, angezeigt. Die Aminosäure an der
betreffenden Position wird rot angezeigt.
Ebenso werden die benachbarten Aminosäuren im Umfeld dieser Aminosäure von den
Positionen
-5 bis +5 angezeigt. Daneben steht der Wert der Methode für die angezeigte Aminosäure.
Eine weitere Gemeinsamkeit dieser Methoden ist, daß jeder Aminosäure ein Wert zugeordnet
wird, der experimentell ermittelt (Hydrophilie, Hydrophobie) wurde. Aus diesen
zugeordneten Werten werden mit Hilfe einer Summenformel (Hydrophilie, Hydrophobie) die
entsprechenden Zahlen berechnet und graphisch dargestellt. Als Parameter kann bei den
Summenformeln die „Fensterbreite“ variiert werden. Diese Parameter können nur ungerade
positive Zahlen sein. Sie legen fest, wieviele Aminosäuren in der Umgebung mit einberechnet
werden. Hat dieser Parameter z.B. einen Wert von fünf, werden die Werte der zwei
Aminosäuren von der linken Seite, der Wert der Aminosäure, die umgeben wird und die
Werte der zwei Aminosäuren auf der rechten Seite mit einberechnet. Der Parameter legt somit
auch die Größe für Minimum und Maximum der berechneten Zahlen fest. Der Wert des
Parameters ist die Zahl auf der rechten Seite der oberen Zeile der Abbildung 4-5. Der
voreingestellte Parameter ist sieben.
4.1.2.1 Hydrophobie (Hydropathie)
Diese Methode gibt Auskunft darüber, welche Regionen sich mit hoher Wahrscheinlichkeit
im Kern und welche Regionen sich an der Oberfläche des Proteins befinden.
Alle Aminosäuren, die unpolare Seitenketten haben, sind hydrophob. Hydrophobe
Aminosäuren stören mit ihren unpolaren Seitenketten die wenig geordnete Struktur von
Wasser, in dem es deren Wasserstoffbrückenbindungen zerbricht und die Wassermoleküle um
die unpolaren Seitenketten in einen hochgeordneten Zustand, d.h. in einen Zustand mit
geringer Entropie, zwingt. Dabei nehmen die Freiheitsgrade der Wassermoleküle,
Wasserstoffbrückenbindungen zu bilden, ab. Da aus dem zweitem Hauptsatz der
Thermodynamik bekannt ist, daß die Entropie einen Maximum zustrebt, wird ein Minimum
an Kontakt zwischen Wasser und unpolaren Seitenketten angestrebt. Dies wird bei der
Faltung des Proteins durch die Verdrängung der unpolaren Aminosäuren in das Innere des
Proteins bewirkt. Alle Aminosäuren, die nach der Auswertemethode positive Werte haben,
befinden sich wahrscheinlich im Inneren des Moleküls.
Im Programm wird diese Methode als Hydrophobie bezeichnet. Im Originalartikel [Kyte und
Doolittle, 1982], auf dem in der Programmanleitung verwiesen wird, wird die Bezeichnung
Hydropathie verwendet. Die Hydropathie wird berechnet aus einem hydrophoben und einem
hydrophilen Anteil. Im weiteren Verlauf dieses Abschnittes wird deshalb der Begriff
Hydropathie benutzt.
Abb. 4-5:
Graphische Auswertung der Hydropathie am Beispiel von Nidogen
Der Hydropathiewert kann bei einem Parameter von sieben maximal 32 sein und minimal –32
sein.
Diese theoretischen Werte kommen dann zustande, wenn in einer Aminosäuresequenz
aufeinander sieben Isoleucine (I) bzw. Arginine (R) folgen würden. Diese haben den
maximalen bzw. minimalen Hydropathiewert von 4.5 bzw. –4.5 (7 * 4.5 = 31.5; 31.5 wird auf
32 aufgerundet). Alle anderen Werte für die Aminosäuren sind in der unten stehenden Tabelle
abgebildet. Die Werte für diese Tabelle wurde von Kyte und Doolitle im Jahre 1982 erstellt.
Sie beruhen auf Experimenten, die die Energien bestimmten, die nötig waren, um eine
Seitenkette einer Aminosäure von einem polaren zu einem unpolaren Lösungsmittel zu
transferieren. Diese Daten sind auch im „Amino Acid Index“ [Nakai et al., 1988] enthalten,
der auch als Datenbank im „GenomeNet“ in Japan aufliegt.
Tab. 4-2:
G -0.4
Q -3.5
S -0.8
Y
-1.3
A 1.8
K -3.9
T -0.7
W
-0.9
V 4.2
H -3.2
D -3.5
C
2.5
L 3.8
R -4.5
E -3.5
M
1.9
I 4.5
F 2.8
N -3.5
P
-1.6
Gemessene Werte für die Hydropathie der Aminosäuren
[Kyte und Doolittle, 1982]
Der Glutaminrest des Nidogen in Position 726, von dem bekannt ist, daß er mit
Transglutaminase reagiert, hat einen Hydropathiewert von –10. Dieser Wert befindet sich im
unteren Bereich. Dies ist ein Indiz dafür, daß Nidogen sich nicht im Inneren des Moleküls
befindet.
4.1.2.2 Hydrophilie
Diese Methode gibt Auskunft darüber, welche Regionen sich höchstwahrscheinlich an der
Oberfläche des Proteins befinden. Alle Aminosäuren, die polare oder sogar geladene
Seitenketten haben, sind hydrophil und gehen bei der Faltung des Proteins eine
Wechselwirkung mit den Wassermolekülen ein. Alle Aminosäuren, die nach der
Auswertemethode positive Werte haben, befinden sich an der Oberfläche des Moleküls.
Abb. 4-6:
Graphische Auswertung der Hydrophilie am Beispiel von Nidogen
Der Maximalwert bei dieser Methode ist 21 bei einem Parameter von sieben. Er ergäbe sich
bei einer Aneinanderreihung von Lysin (K) und / oder Arginin (R). Der Minimalwert wäre –
24 bei einem 7-stelligen Sequenzabschnitt von Tryptophan (W). Alle anderen gemessenen
Werte für die Aminosäuren befinden sich in der nachfolgenden Tabelle.
Die Werte für die Tabelle wurde im Jahre 1981 von „Hopp und Woods“ erstellt. Sie können
auch im „Amino Acid Index“ [Nakai et al., 1988] gefunden werden.
Tab. 4-3:
G0
Q 0.2
S 0.3
Y
-2.3
A -0.5
K 3.0
T -0.4
W
-3.4
V -1.5
H -0.5
D 2.5
C
-1.0
L -1.8
R 3.0
E 2.5
M
-1.3
I -1.8
F -2.5
N 0.2
P
-1.4
Gemessene Werte für die Hydrophilie [Hopp und Woods, 1981]
Der Glutaminrest 726 von Nidogen hat einen errechneten Wert von 4. Dies ist ein weiterer
Hinweis dafür, daß der Glutaminrest an Position 726 sich an der Oberfläche des Proteins
befindet.
4.1.2.3 Sekundärstrukturberechnungen
In diesem Programm sind vier verschiedene Berechnungsarten für die Sekundärstruktur
enthalten, die entweder einzeln angewählt werden, oder es wird die Option ausgewählt, wo
alle Sekundärstrukturberechnungen gleichzeitig durchgeführt werden. Wie auch in den schon
oben beschriebenen Methoden, kann hier durch Bewegen des Cursors die Position einer
Aminosäure bestimmt werden. Im oberen Teil der Grafik befinden sich die Kurven, die sich
aus den Berechnungen ergeben, im unteren Teil wird nur der höchsten Wert auf der
jeweiligen Position berücksichtigt, der aussagt in welcher Sekundärstruktur sich die
Aminosäure befindet.
Bei diesen vier Berechnungen handelt es sich um:
•
GOR I Methode [Garnier et al., 1978]
Die Abkürzung GOR setzt sich zusammen aus den Anfangsbuchstaben der drei Autoren
J.Garnier, D.Osguthorpe und B.Robson, die diese Methode entwickelt haben.
Für diese Methode wurden von 26 Proteinen mit bekannter 3D-Struktur die Parameter
gewonnen, mit welcher Wahrscheinlichkeit sich eine Aminosäure entweder in einer α-Helix,
in einem β-Faltblatt (Sheet), in einer β-Schleife (Turn) oder in einer ungeordneten Struktur
(Coil) befindet.
Der α-Helix wird die Farbe Blau, dem β-Faltblatt die Farbe Gelb, der β-Schleife die Farbe
Grün und der ungeordneten Struktur die Farbe Schwarz zugeordnet. Dies gilt auch für alle
weiteren Methoden der Sekundärstrukturvorhersage.
Abb. 4-7:
Sekundärstrukturberechnung nach Garnier [1978] für das Protein
Nidogen
Nach dieser Berechnungsmethode befindet sich der reaktive Glutaminrest von Nidogen an
Position 726 in einer β-Schleife.
•
GOR II Methode [Gibrat et al., 1987]
Diese Methode ist eine Weiterentwicklung der GOR I Methode. Die Parameter für die
Aminosäuren wurden hierbei aus einem Satz von 68 Proteinen gewonnen. Hierbei werden
aber nur noch die drei Sekundärstrukturmotiven α-Helix, β-Faltblatt (Sheet) und ungeordnete
Struktur (Coil) berücksichtigt.
Abb. 4-8:
Sekundärstrukturberechnung nach Gibrat [1987] für das Protein Nidogen
Diese Methode sagt ein Vorkommen des Glutaminrestes 726 in einer ungeordneten Struktur
voraus.
•
Double Prediction Method [Deleage und Roux, 1987]
Bei dieser Methode werden zwei Vorhersagen kombiniert. Bei der ersten Vorhersage wurde
aus einem Satz von 135 Proteinen die Prozentverteilung der Aminosäuren auf die
verschiedenen Sekundärstrukturen bestimmt. In einer zweiten Vorhersage wird durch einen
Algorithmus die Verteilung der Aminosäuren auf die Sekundärstrukturelemente berechnet.
Diese beiden Vorhersagen werden verglichen. Die daraus gewonnenen Daten werden
optimiert und nochmals neu berechnet.
Abb. 4-9:
Sekundärstrukturberechnung nach Deleage und Roux [1987] für Nidogen
Nach dieser Methode ist der Glutaminrest 726 in einer ungeordneten Struktur.
•
Homologue Method [Levin et al., 1986]
Hier wird die Annahme gemacht, daß sich kleine Peptidbruchstücke mit gleicher
Primärstruktur in identischen Sekundärstrukturen befinden.
Jedes Segment eines Proteins mit einer Länge von sieben Aminosäuren wird mit allen
Peptiden gleicher Länge von der Kabsch & Sander Datenbank unter Verwendung der
untenstehenden Matrix verglichen (Bei den Proteinen aus der Kabsch & Sander Datenbank
sind die Sekundärstrukturen bekannt. Sie wurden aus Proteinen mit bekannten
Tertiärstrukturen abgeleitet.).
Sekundärstrukturmatrix von Levin et al.[1986 ]
G
P
D
E
A
N
Q
S
T
K
R
H
V
I
M
C
L
F
Y
W
G| 2
0
0
0
0
0
0
0
0
0
0
0
-1
-1
-1
0
-1
-1
-1
-1
P| 0
3
0
-1
-1
0
0
0
0
0
0
0
-1
-1
-1
0
-1
-1
-1
-1
D| 0
0
2
1
0
1
0
0
0
0
0
0
-1
-1
-1
0
-1
-1
-1
-1
E| 0
-1
1
2
1
0
1
0
0
0
0
0
-1
-1
-1
0
-1
-1
-1
-1
A| 0
-1
0
1
2
0
0
1
0
0
0
0
0
0
0
0
0
-1
-1
-1
N| 0
0
1
0
0
3
1
0
0
1
0
0
-1
-1
-1
0
-1
-1
-1
-1
Q| 0
0
0
1
0
1
2
0
0
0
0
0
-1
-1
-1
0
-1
-1
-1
-1
S| 0
0
0
0
1
0
0
2
0
0
0
0
-1
-1
-1
0
-1
-1
-1
-1
T| 0
0
0
0
0
0
0
0
2
0
0
0
0
0
0
0
0
-1
-1
-1
K| 0
0
0
0
0
1
0
0
0
2
1
0
-1
-1
-1
0
-1
-1
-1
-1
R| 0
0
0
0
0
0
0
0
0
1
2
0
-1
-1
-1
0
-1
-1
-1
0
H| 0
0
0
0
0
0
0
0
0
0
0
2
-1
-1
-1
0
-1
-1
0
-1
V|-1
-1
-1
-1
0
-1
-1
-1
0
-1
-1
-1
2
1
0
0
1
0
0
0
I|-1
-1
-1
-1
0
-1
-1
-1
0
-1
-1
-1
1
2
0
0
0
1
0
0
M|-1
-1
-1
-1
0
-1
-1
-1
0
-1
-1
-1
0
0
2
0
2
0
0
0
C| 0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
2
0
-1
-1
-1
L|-1
-1
-1
-1
0
-1
-1
-1
0
-1
-1
-1
1
0
2
0
2
0
0
0
F|-1
-1
-1
-1
-1
-1
-1
-1
-1
-1
-1
-1
0
1
0
-1
0
2
1
0
Y|-1
-1
-1
-1
-1
-1
-1
-1
-1
-1
-1
0
0
0
0
-1
0
1
2
0
W|-1
-1
-1
-1
-1
-1
-1
-1
-1
-1
0
-1
0
0
0
-1
0
0
0
2
Tab. 4-4:
Matrix zum Vergleich von Aminosäuren
Dabei
werden
zwei
Peptide
mit
einer
Sequenzlänge
von
sieben
Aminosäuren
gegenübergestellt. Das eine Peptid ist ein Sequenzabschnitt von dem zu berechnenden
Protein, das andere stammt aus der Kabsch & Sander Datenbank.
Aus jeweils zwei gegenüberliegten Aminosäuren ergibt sich der Wert, der aus der Matrix
entnommen wird. Liegen sich etwa die Aminosäure Glutamin (Q) und Histidin (H)
gegenüber, sucht man den Wert in der Tabelle, wo sich die Spalte von Glutamin und die Zeile
von Histidin (oder die Zeile von Glutamin und die Spalte von Histidin) kreuzen. In diesem
speziellen Fall führt das zum Wert 0. Die sieben Werte, die sich durch die Gegenüberstellung
von den Peptiden ergeben, werden summiert.
Ist die Summe kleiner als sieben, wird zum nächsten Peptid aus der Kabsch & Sander
Datenbank übergegangen (Außer ein Peptid aus dem zu untersuchenden Protein wird gerade
mit dem letzten Peptid der Datenbank verglichen, dann wird zum nächsten Peptid des zu
untersuchenden Proteins übergegangen.).
Ist die Summe größer als sieben, wird dieser Wert für alle sieben Aminosäuren in eine Tabelle
für das Peptid des zu untersuchenden Proteins eingetragen. Die Tabelle ist so aufgeteilt, daß
in der ersten Spalte die Aminosäuren des Peptids stehen, dann folgen die Spalten für die
Sekundärstrukturmotive und am Schluß die vorhergesagte Sekundärstruktur (Die Spalten für
die Peptide aus der Datenbank wurden zur Veranschaulichung eingefügt.).
α-Helix
β-Faltblatt
β-Schleife
Ungeordnete Peptid 1 Peptid 2 Peptid 3 VorherStruktur
aus DB
Aus DB Aus DB Sage
10
H
H
T
H
8
H
T
E
H
13 + 10
C
T
C
C
13
C
E
E
E
13
10
T
E
C
T
13
8
T
C
H
T
8
E
C
H
E
Aminosäuren
Q
13 + 8
K
13
10
D
8
V
8 + 10
I
8
L
10
T
10
13
C: Coil (Ungeordnete Struktur)
E: Sheet (β-Faltblatt)
H: Helix (α-Helix)
T: Turn (β-Schleife)
Tab. 4-5:
Tabelle zur Auswertung von Sekundärstrukturen nach Levin et al. [1986]
Der Wert wird in die Spalte des Sekundärstrukturmotives der korrespondierenden
Aminosäure des Peptides der Datenbank eingetragen. Von dieser Aminosäure ist bekannt, in
welchem Strukturmotiv sie sich befindet.
Beispielsweise, wie in oberen Beispiel abgebildet, wurden der Wert 13 im Vergleich mit
Peptid eins, der Wert acht im Vergleich mit Peptid zwei und der Wert zehn im Vergleich mit
Peptid drei ermittelt Die Zahlen innerhalb eines Feldes werden summiert. Der größte Wert in
einer Zeile bestimmt dann das Sekundärstrukturmotiv, in der sich die Aminosäure befindet.
Die anderen Werte spiegeln sich aber in den Kurven im oberen Teil der Graphik wieder.
Diese Methode wird solange durchgeführt, bis das Peptid von dem Protein mit allen Peptiden
aus der Kabsch & Sander Datenbank verglichen wurde.
Diese Werte werden graphisch abgebildet.
Abb. 4-10:
Sekundärstrukturberechnung nach Levin [1986] für das Protein
Nidogen
Auch nach dieser Methode befindet sich der Glutaminrest in einer ungeordneten Struktur.
Abschließend noch eine kritische Bemerkung zur Berechnung von Sekundärstrukturen.
Obwohl in diesem Beispiel nur die älteste Methode eine abweichende Strukturvorhersage auf
dieser Position macht, sind Berechnungen von Sekundärstrukturen mit einer gewissen Skepsis
zu betrachten. Die neueste GOR-Methode (GOR IV, Garnier, Gibrat and Robson, 1996),
deren Parameter aus einem Satz von 267 Proteinen gewonnen wurde, gibt eine mittlere
Genauigkeit von 64,4 % für die Vorhersage an. Ein anderes Programm zur Vorhersage von
Sekundärstrukturen (Predator, Frishman und Argos, 1996) gibt eine mittlere Genauigkeit von
68 % an. Die Genauigkeit der oben beschriebenen Methoden wird, da sie auf weniger Daten
fußen, eher kleiner sein.
Das bestätigt sich auch, wenn die Option im Programm gewählt wird, in der alle Methoden
parallel gestartet werden. Die Ergebnisse der Methoden werden graphisch gegenübergestellt.
Man erkennt in der Graphik (Abbildung 4-11) deutliche Unterschiede bei den Vorhersagen.
Abb. 4-11:
Sekundärstrukturberechnung nach allen vier Methoden
Deshalb wurde hier so weit wie möglich auf Sekundärstrukturen zurückgegriffen, die aus
bekannten Tertiärstrukturen abgeleitet wurden.
4.1.3. Auswertung [Schomburg, 1998]
Dieses Programm wurde zu Auswertung der Umgebung von Glutaminresten geschrieben. Es
läuft unter Windows95 oder WindowsNT im DOS-Fenster. Die Programmiersprache war
awk. (Der Name leitet sich aus den Nachnamen der Autoren ab: Aho, Weinberger,
Kernighan). Sie ist ein Standardwerkzeug im Unixbereich und hat Gemeinsamkeiten mit den
Programmiersprachen C und Perl.
Bei dem Programm werden die Anteile der Aminosäuren in den gesamten Umgebungen, die
Anteile auf der N-Seite von Glutamin und die Anteile auf der C-Seite von Glutamin
ausgewertet und tabellarisch zusammengestellt. In einer weiteren Tabelle werden die
Aminosäuren nach den Positionen von –5 bis +5, anlehnend an die Methode von Coussons,
ausgewertet.
Anteil der AS in den Umgebungen
Aminosäure
AnzahlAS (%)
links (%)
rechts (%)
Alanin
1
0.91
0
0.00
1
Arginin
2
1.82
2
3.64
0
1.82
0.00
Aspargin
13
11.82
6
10.91
7
12.73
Asparginsäure
13
11.82
7
12.73
6
10.91
Cystein
0
0.00
0
0.00
0
0.00
Glutamin
2
1.82
1
1.82
1
1.82
Glutaminsäure
7
6.36
5
9.09
2
3.64
Glycin
0
0.00
0
0.00
0
0.00
Histidin
2
1.82
0
0.00
2
3.64
Isoleucin
1
0.91
1
1.82
0
0.00
Leucin
11
10.00
3
5.45
8
14.55
Lysin
10
9.09
7
12.73
3
5.45
Methionin
0
0.00
0
0.00
0
0.00
Phenylalanin
4
3.64
1
1.82
3
5.45
Prolin
9
8.18
6
10.91
3
5.45
Serin
20
18.18
11
20.00
9
16.36
Threonin
11
10.00
4
7.27
7
12.73
Tryptophan
0
0.00
0
0.00
0
0.00
Tyrosin
1
0.91
0
0.00
1
1.82
Valin
3
2.73
1
1.82
2
3.64
negativ
20
18.18
12
21.82
8
14.55
positiv
12
10.91
9
16.36
3
5.45
4
3.64
1
1.82
3
5.45
hydrophob
Tab. 4-6:
Tabellarische Aufstellung der Anzahl / der Anteile der
Aminosäuren in den Umgebungen.
Anzahl der Aminosäuren auf den Positionen
Q
1 (%)
2 (%)
3 (%)
4 (%)
5 (%)
Ala
-5 (%)
0
0.0
0
0.0
0
0.0
0
0.0
0
0.0
|
0
0.0
0
0.0
0
0.0
1
9.1
0
0.0
Arg
1
9.1
1
9.1
0
0.0
0
0.0
0
0.0
|
0
0.0
0
0.0
0
0.0
0
0.0
0
0.0
Asn
3 27.3
0
0.0
0
0.0
3 27.3
0
0.0
|
2 18.2
2 18.2
2 18.2
0
0.0
1
9.1
Asp
2 18.2
2 18.2
3 27.3
0
0.0
0
0.0
|
1
9.1
1
9.1
3 27.3
0
0.0
1
9.1
Cys
0
0.0
0
0.0
0
0.0
0
0.0
0
0.0
|
0
0.0
0
0.0
0
0.0
0
0.0
0
0.0
Gln
0
0.0
0
0.0
0
0.0
1
9.1
0
0.0
|
0
0.0
1
9.1
0
0.0
0
0.0
0
0.0
Glu
0
0.0
1
9.1
1
9.1
2 18.2
1
9.1
|
2 18.2
0
0.0
0
0.0
0
0.0
0
0.0
Gly
0
0.0
0
0.0
0
0.0
0
0.0
0
0.0
|
0
0.0
0
0.0
0
0.0
0
0.0
0
0.0
His
0
0.0
0
0.0
0
0.0
0
0.0
0
0.0
|
0
0.0
0
0.0
1
9.1
1
9.1
0
0.0
Ile
0
0.0
0
0.0
1
9.1
0
0.0
0
0.0
|
0
0.0
0
0.0
0
0.0
0
0.0
0
0.0
Leu
0
0.0
1
9.1
1
9.1
1
9.1
0
0.0
|
2 18.2
0
0.0
2 18.2
1
9.1
3 27.3
Lys
1
9.1
1
9.1
2 18.2
0
0.0
3 27.3
|
1
9.1
0
0.0
0
0.0
2 18.2
0
0.0
Met
0
0.0
0
0.0
0
0.0
0
0.0
0
0.0
|
0
0.0
0
0.0
0
0.0
0
0.0
0
0.0
Phe
0
0.0
1
9.1
0
0.0
0
0.0
0
0.0
|
0
0.0
2 18.2
0
0.0
1
9.1
0
0.0
Pro
1
9.1
2 18.2
0
0.0
2 18.2
1
9.1
|
0
0.0
1
9.1
0
0.0
1
9.1
1
9.1
Ser
1
9.1
2 18.2
3 27.3
0
5 45.5
|
1
9.1
1
9.1
1
9.1
3 27.3
3 27.3
Thr
2 18.2
0
0.0
0
0.0
2 18.2
0
0.0
|
2 18.2
2 18.2
1
9.1
1
9.1
1
9.1
Trp
0
0.0
0
0.0
0
0.0
0
0.0
0
0.0
|
0
0.0
0
0.0
0
0.0
0
0.0
0
0.0
Tyr
0
0.0
0
0.0
0
0.0
0
0.0
0
0.0
|
0
0.0
0
0.0
0
0.0
0
0.0
1
9.1
Val
0
0.0
0
0.0
0
0.0
0
0.0
1
9.1
|
0
0.0
1
9.1
1
9.1
0
0.0
0
0.0
neg
2 18.2
3 27.3
4 36.4
2 18.2
1
9.1
|
3 27.3
1
9.1
3 27.3
0
0.0
1
9.1
pos
2 18.2
2 18.2
2 18.2
0
0.0
3 27.3
|
1
9.1
0
0.0
0
0.0
2 18.2
0
0.0
hyd
0
1
0
0
0.0
0
|
0
0.0
2 18.2
0
0.0
1
0
0.0
0.0
Tab. 4-7:
-4 (%)
9.1
-3 (%)
0.0
-2 (%)
0.0
-1 (%)
0.0
9.1
Tabellarische Aufstellung der Anzahl / der Anteile der
Aminosäuren auf den Positionen von –5 bis +5 vom Glutaminrest
Durch die Tabelle 4-7, die durch das Programm „Auswertung“ erzeugt wird, können direkt
markant hohe oder niedrige Werte von Aminosäuren auf den Positionen erkannt werden.
4.1.4. Einleitung 3D-Viewer
Eine der interessantesten Anwendungen in der Computerauswertung auf dem Gebiet der
Biochemie ist die Visualisierung von Molekülen. Strukturen, die für das menschlichen Auge
nicht sichtbar sind, können als Modell mit Hilfe des Computers dargestellt werden. Zwar ist
dies auch mit Modellen aus Draht und / oder Styropor bzw. Plastik möglich, aber die
vielfältigen Möglichkeiten, diese Strukturen zu manipulieren und dies in kürzester Zeit, sind
nur am Computer durchführbar.
Dies macht solche Programme wertvoll für Forschung und Lehre.
Bevor auf die Fähigkeiten der Programme eingegangen wird, werden die gemeinsamen und
die speziellen Möglichkeiten dieser 3D-Viewer in einer Tabelle dargestellt.
RasMol
WebLab
SwissPdb
X
Importformate
-
PDB (Brookhaven Protein Databank)
X
X
-
MOL (Molecular Design Limited, MOL)
X
X
-
MOL2 (Tripos, Sybyl Mol2)
X
X
-
XYZ (MSC, Xmol XYZ)
X
X
-
Alchemy (Tripos, Alchemy)
X
-
Charmm (CHARMm)
X
-
MSV (WebLab Viewer binary file format
X
(Microsoft Compound document))
-
MSL (WebLab Viewer portable file format)
X
-
CAR (Molecular Simulations, Insight II)
X
-
CSD
X
(Cambridge
Structural
Database
Crystallographic files)
-
MSF (Molecular Simulations, Quanta)
X
-
MSI (Molecular Simulations, Cerius2)
X
-
CPD (Molecular Simulations, Catalyst)
X
-
SKC (Molecular Design Limited, ISIS)
X
Exportformate (Molekülformate)
-
PDB (Brookhaven Protein Databank)
X
-
Alchemy (Tripos' Alchemy file format)
X
-
MSV (WebLab Viewer binary file format
X
X
X
(Microsoft compound document))
-
MSL (WebLab Viewer portable file format)
X
-
MOL (Molecular Design Limited, MOL)
X
Exportformate (Bildformate)
-
GIF
(Compuserve
Graphics
Interchange
X
Format)
X
-
PPM (Portable Pixmap)
X
-
RAS (Sun rasterfile)
X
-
PS (PostScript)
X
-
EPSF (Encapsulated PostScript)
X
-
MONOPS
(Monochrome
Encapsulated
PostScript)
X
X
X
X
X
-
BMP (Microsoft Bitmap)
X
-
PICT (Apple PICT)
X
-
JPG (Joint Photographic Experts Group)
X
-
WRL (VRML World)
X
-
POV3 (Povray 3)
-
3DMF (3D Metafiles)
Koordinatenmanipulation
-
Verschieben
X
X
X
-
Zoomen
X
X
X
-
Drehen
X
X
X
X
X
X (bei
Auswahl per Mausklick
-
Atome
Winkel- /
Abstandsmessung)
-
Aminosäuren
-
Molekülbereich (mit Ziehen der Maus)
X
X
Auswahl per Menü oder Kommandozeile
-
Aminosäuren
X
X
-
Aminosäuregruppen (z.B. polar)
X
X
-
Atome
X
Darstellungsmöglichkeiten
-
Skelett-Modell oder Linien-Modell
X
X
-
Stab-Modell
X
X
-
Kugel-Stab-Modell
X
X
-
Kalotten-Modell oder CPK-Modell
X
X
-
„Punkte-Oberflächen“-Modell
X
-
„Rückgrat“-Modell
X
X
X
-
Bänder-Modell
X
X
X
-
Faden-Modell
X
X
X
-
Cartoon-Modell oder Schematisches Modell
X
X
X
-
Polyeder
X
-
Röhren-Modell
X
-
Durchscheinende Oberfläche
X
X
X
X
X
Beschriftung
-
Atome
-
Bindungen
-
Aminosäuren
-
Ketten
X
-
Moleküle
X
X
X
X
X
X
X
X
Colorierung
-
Atome
X
X
-
Bindungen
X
X
-
Aminosäuren
X
X
-
Ketten
X
X
-
Moleküle
X
X
-
Beschriftungen
X
X
Ansicht
-
Wasserstoffbrücken-Bindungen
X
X
X
-
SS-Bindungen
X
X
X
Stereoansicht
X
Mehrere Moleküle gleichzeitig laden
X
X
(RasMolucb)
Tab. 4-8:
Tabellarische Gegenüberstellung der 3D-Viewer RasMol, WebLab und
SwissPdb
X
X
4.1.5. RasMol (Version 2.6) [Sayle, 1995]
Der RasMol-Viewer ist der älteste (veröffentlicht 1993) und verbreitetste von den drei
Viewern, die hier beschrieben werden. Sein Name ist die Abkürzung von Raster Molecules.
Viele Viewer basieren auf ihm. Dies gilt auch für die beiden anderen, auf Seite 43 genannten
Viewer, als auch für Chime, das Plug-In für Internetbrowser von der Firma MDL
(http://www.mdli.com). Der RasMol-Viewer ist kostenlos verfügbar und steht im Internet
(http://www.glaxowellcome.co.uk/software/) zum Herunterladen zur Verfügung.
Eine weitere empfehlenswerte Adresse für RasMol ist
http://klaatu.oit.umass.edu/microbio/rasmol/index.html.
Abb. 4-12:
Eingangsbildschirm von RasMol mit α-Lactalbumin als
Skelett-Modell
Seine großen Vorteile sind die vielfältigen Darstellungsmöglichkeiten und die einfache
Bedienbarkeit. Die geladenen Moleküle können entweder mit Hilfe der Maus oder über
Kommandos im Fenster RasMol Command Line bewegt werden.
Manipulation
Maussteuerung
Kommando
Translation
rechte Maustaste
Translate <axis><value>
Rotation X-Y
linke Maustaste
Rotate <axis><value>
Rotation Z
Shift- + rechte Maustaste
Rotate <axis><value>
Zoom
Shift- + linke Maustaste
Zoom <value>
Tab. 4-9:
Bewegungssteuerungen bei RasMol im Überblick
Die vielfältigen Darstellungsmöglichkeiten des Viewers werden am α-Lactalbumin
demonstriert.
Abb. 4-13:
α-Lactalbumin
Abb. 4-14:
Skelett-Modell
α-Lactalbumin
Stab-Modell
Die (roten) Sauerstoffatome, die nicht
mit dem Molekül verbunden sind,
gehören zu Wassermolekülen.
Wasserstoffatome werden nicht dargestellt.
Das gleiche gilt auch für das Kalotten-und das
„Punkte-Oberflächen“-Modell.
Abb. 4-15:
Kugel-Stab-Modell
α-Lactalbumin
Abb. 4-16:
α-Lactalbumin
Abb. 4-17:
α-Lactalbumin
„Punkte-
Kalotten-
Oberflächen“-Modell
Modell
Die Oberflächen der Kugeln
entsprechen den
Van-der-Waals Radien.
Abb. 4-18:
α-Lactalbumin
Bänder-Modell
Abb. 4-20: α-Lactalbumin
Abb. 4-19:
α-Lactalbumin
Faden-Modell
Abb. 4-21: Das Rückgrat-
Cartoon-Modell
Modell
Die gewundenen Bänder
des
symbolisieren α-Helices,
die Pfeile β-Faltblätter.
Die restlichen Bereiche sind
Ungeordnete Strukturen.
α-Lactalbumin
Alle hier dargestellten Modelle sind mit Ausnahme des „Punkte-Oberflächen“-Modells über
das Menü „Display“ im Hauptfenster anwählbar. Das „Punkte-Oberflächen“-Modell kann mit
dem Befehl „dots“ im Fenster “RasMol Command Line” erzeugt werden. Dort können durch
Angabe eines Wertes von 0 bis 1000, die Dichte der Punkte variiert werden. Auch bei anderen
Darstellungsformen sind mit den entsprechenden Befehlen im Fenster “RasMol Command
Line” Werteangaben möglich,
die Radien:
Skelett-Modell
Wert von 0 – 490
Kalotten-Modell
Wert von 0 – 500
Rückgrat-Modell
Wert von 0 – 490
oder die Weiten:
Bänder-Modell
Wert von 0 – 1000
Faden-Modell
Wert von 0 – 1000
zu spezifizieren.
Durch diese Angaben können Bereiche eines Proteins hervorgehoben werden. Die
Größenverhältnisse, die dabei entstehen, müssen nichts mit der Realität zu tun haben, sondern
dienen nur der Veranschaulichung.
Die Stärken aller drei Programme liegen darin, daß Bereiche oder Aminosäuren in Molekülen
ausgewählt werden können und diese durch eine andere Darstellungsart gegenüber dem
restlichen Molekül herausgehoben werden. Die Auswahl geschieht bei RasMol mit dem
Befehl „select“ im Fenster “RasMol Command Line”.
Ausgewählt werden können:
1. einzelne Atome über ihre Position, z.B. select atomno=64
2. einzelne Aminosäuren über die Angabe ihrer Position, z.B. select 5
3. mehrere Aminosäuren über die Angaben ihrer Positionen, z.B. select 5, 12, 45
4. ein Bereich von mehreren Aminosäuren, z.B. select 5 – 45
5. alle einzelnen Aminosäuren eines Aminosäuretyps, z.B. select glu
6. vordefinierte Mengen, z.B. select charged
Die vordefinierten Mengen auf einen Blick:
at
acidic
acyclic
aliphatic
alpha
amino
aromatic
backbone
basic
bonded
buried
cg
charged
cyclic
cystine
helix
hetero
hydrogen
hydrophobic ions
large
ligand
medium
neutral
nucleic
polar
protein
purine
pyrimidine
selected
sheet
sidechain
small
solvent
surface
turn
water
Tab. 4.10:
Vordefinierte Mengen bei RasMol
Alle Angaben zum select-Befehl können mit boolschen Operatoren “AND”, “OR” und
“NOT” verknüpft werden, so daß komplexere Auswahlen getroffen werden können.
Beispiele:
1. select charged and not asp
2. select small or aromatic
3. select polar or trp
4. select 5-56 and gln
Als
besonders
günstige
Darstellungsmöglichkeiten
haben
sich
bei
mir
folgende
Kombinationen erwiesen:
Molekül
Hervorgehobener Bereich
Skelett-Modell
Kugel-Stab-Modell
Kalotten-Modell
„Punkte-Oberflächen“-Modell
Stab-Modell
Kalotten-Modell
„Punkte-Oberflächen“-Modell
Kugel-Stab-Modell
Kalotten-Modell
„Punkte-Oberflächen“-Modell
Bänder-Modell
Skelett-Modell
Kugel-Stab-Modell
Kalotten-Modell
„Punkte-Oberflächen“-Modell
Faden-Modell
Skelett-Modell
Kugel-Stab-Modell
Kalotten-Modell
„Punkte-Oberflächen“-Modell
Rückgrat-Modell
Skelett-Modell
Kugel-Stab-Modell
Kalotten-Modell
„Punkte-Oberflächen“-Modell
Cartoon-Modell
Skelett-Modell
Kugel-Stab-Modell
Kalotten-Modell
„Punkte-Oberflächen“-Modell
Tab. 4-11:
Geeignete Kombinationsmöglichkeiten zur Darstellung von hervorgehobenen
Bereichen von Molekülen
Durch Beschriftung können diese Bereiche nochmals besonders gekennzeichnet werden.
Dies geschieht über das Menü “Options / Labels” oder mit dem Kommando “label”.
Über den Befehl “set fontsize” kann die Größe des Textes beeinflußt werden.
Ein weiterer Effekt kann durch Colorierung erzielt werden.
Dies kann über das Menü “Colours” bewerkstelligt werden. Hierbei können die, durch den
“select”-Befehl
ausgewählten
Bereiche,
coloriert
werden.
Sollen
Bindungen
oder
Beschriftungen coloriert werden, muß dies im “RasMol Command Line” Fenster mit dem
Befehl “colour” und der entsprechenden Angabe getan werden.
Dieses Bild wurde mit folgenden Befehlen erzeugt:
Abb. 4-22:
-
load „lactalbumin.pdb“
-
background white
-
backbone
-
colour backbone red
-
select gln
-
spacefill
-
Menü Options / Labels
-
colour labels blue
α-Lactalbumin als Rückgratmodell
Die Glutaminreste sind hervorgehoben.
Als sehr nützlich kann es sich erweisen, nur ein Teil des Moleküls darzustellen.
Entweder zoomt man die gewünschte Stelle bis alle anderen Bereiche des Moleküls nicht
mehr auf dem Bildschirm sind oder es wird der „restrict“-Befehl benutzt, der nur die Bereiche
anzeigt, für die Angaben gemacht worden sind. Für den „restrict“-Befehl gelten die gleichen
Angaben wie für den „select“-Befehl.
Um dieses Bild darzustellen, werden folgende Befehle benötigt:
-
Abb. 4-23:
load „lactalbumin.pdb“
background white
select 49-59
wireframe 80
zoom 200
translate
rotate
Menü Options / Labels
colour labels blue
select 54
dots 1000
α-Lactalbumin als Skelettmodell
Die Umgebung des Glutamins ist als Stab-Modell,
das Glutamin als „Punkte-Oberflächen“-Modell dargestellt.
Wenn einzelne Atome oder Aminosäuren, wie in Abbildung 4-23 gezeigt, nochmals verstärkt
aus ihrem Bereich hervorgehoben werden sollen, ist es durchaus sinnvoll drei oder mehr
Darstellungsarten zu mischen.
4.1.5.1 RasMenu [Sayle, 1994]
Die Erweiterung RasMenu für RasMol integriert viele Möglichkeiten in das Hauptmenü, die
sonst bei RasMol nur per Kommandozeile erreichbar sind. RasMenu ist über den gleichen
FTP-Server (ftp://ftp.dcs.ed.ac.uk/pub/rasmol/) frei erhältlich wie RasMol.
Abb. 4-24:
Hauptmenü mit der Erweiterung RasMenu
Dadurch ist es beispielsweise möglich, die ganze Auswahl, die sonst nur über den „select“Befehl im RasMol Command Line Fenster möglich ist, über das Menü zu steuern.
Abb. 4-25:
RasMol Select Menu vom Menü „Edit / Select Zone“
Komplexere Auswahlen können entweder über die Kommandozeile im Fenster des
Hauptmenüs oder im Fenster RasMol Command Line getroffen werden.
Als Nachteil ist hingegen zu werten, daß RasMol in den Menüs nur bis zur Version 2.5
unterstützt wird, in der Kommandozeile hingegen können auch die Möglichkeiten von
Version 2.6 genutzt werden.
4.1.5.2 RasMol-ucb [UC Regents, 1995]
Diese überarbeitete Version von RasMol erlaubt es, bis zu fünf Moleküle gleichzeitig zu
laden und unabhängig voneinander zu manipulieren. Dadurch können Enzym-SubstratKomplexe visualisiert werden. Auch diese Version von RasMol ist frei und kann über die
Adresse (http://mc2.cchem.berkeley.edu/Rasmol/v2.6/) bezogen werden. Ucb steht für
University of California, Berkeley.
Eine weitere Erweiterung gegenüber RasMol von Roger Sayle ist die Werkzeugleiste, die in
Abbildung 4-26 dargestellt ist. Auch hier werden Kommandos, die sonst nur über das
Kommandofenster von RasMol erreichbar sind, in die Fenstertechnik integriert.
Durch die erste Reihe können Bestimmungen
vorgenommen werden.
In der zweiten Reihe wird selektiert,
welcher Bereich gedreht wird.
Im unteren Teil kann ausgewählt werden,
welches Molekül bearbeitet wird.
Abb. 4-26:
Werkzeug-Palette von RasMol-ucb
Abb. 4-27:
Faktor XIIIa in Wechselwirkung mit Phospholipase A2
Das Rückgrat von dem Enzym Faktor XIIIa ist magenta, die katalytische
Triade ist als Kalottenmodell hervorgehoben. Das Rückgrat des Substrates ist
grün dargestellt, der reaktive Glutaminyl-Rest ist als kombiniertes StabPunkte-Oberflächen-Modell hervorgehoben.
4.1.6. WebLab Viewerlite (Version 2.01) [Molecular Simulations, 1997]
Dieser Viewer ist ein Teil eines Programmpaketes zur Bearbeitung von Proteinen von der
Firma „Molecular Simulations“. Die Lite-Version des WebLab Viewers ist frei erhältlich.
WebLab ViewerPro Version 3.1 ist als Testversion für 30 Tage nutzbar. Beide Programme
sind über den Web-Server (http://www.msi.com/weblab/viewer/info/) von „Molecular
Simulations“ erhältlich.
Abb. 4-28:
Eingangsbildschirm von WebLab Viewer mit α-Lactalbumin als
Linien-Modell
Der WebLab Viewer zeichnet sich aus durch:
1. seine vielfältigen Im- und Exportformate
2. seine Werkzeugpalette
3. das Selektieren von Molekülen mit der Maus
4. die vielfältigen Darstellungsmöglichkeiten der Moleküle
5. das Zeichnen einer durchscheinenden Umgebung
Abb. 4-29:
Mit dem Pfeil werden Atome, Moleküle oder Bereiche ausgewählt.
Mit dem zweiten Werkzeug kann das Molekül gedreht werden.
Mit der Auswahl des dritten Symbols wird das Molekül verschoben
Über das vierte Symbol kann das Molekül gezoomt werden.
Mit dem letzten Werkzeug kann eine Bindung gedreht werden.
Werkzeugpalette des WebLab Viewer
Wahlweise kann mit Hilfe eines Rechteckes oder eines Lassos ein Bereich aufgespannt
werden, indem alle enthaltenen Moleküle und Atome ausgewählt sind. Alle ausgewählten
Moleküle sind gelb gekennzeichnet. Diese können nun getrennt vom restlichen Molekül
bearbeitet werden.
Abb. 4-30:
α-Lactalbumin mit ausgewähltem Bereich
Das Selektieren von Atomen oder Aminosäuren über das Menü ist weniger gut gelungen, da
es dort nicht möglich ist, Bereiche anzugeben.
Abb. 4-31:
Das Auswahlmenü im WebLab Viewer
Alle mit einem Häkchen versehenen Felder werden mit einem logischen „AND“-Operator
verknüpft, so daß im oberen Beispiel alle Sauerstoffatome ausgewählt werden, die in
Glutamin enthalten sind.
Eine Stärke des Programms sind die vielfältigen Darstellungsmöglichkeiten. Im Menü wird
nach Objekten unterschieden, die dargestellt werden. Dazu gehören Atome, Moleküle, die
Elementarzelle des Kristalls und Beschriftung und / oder Oberfläche, wenn diese hinzugefügt
werden. Diese können über das Menü verändert werden.
Abb. 4-32:
Darstellungsarten für die Atome
Neben dem Ausschalten der Darstellungsart kann zwischen sechs verschiedenen Modellen
gewählt werden. Das Linien-Modell ohne Bindungsordnung entspricht dem Skelett-Modell
von RasMol und das CPK-Modell (Corey, Pauling und Kultun) entspricht dem KalottenModell. Stab- und Kugel-Stab-Modell sind den Modellen bei RasMol äquivalent.
Im Linien-Modell werden im Gegensatz zum Linien-Modell ohne Bindungsordnung auch die
Bindungen, z.B. in aromatischen Systemen, angezeigt.
Im Polyeder-Modell werden alle Atome mit weniger als vier Bindungen als Linien dargestellt,
Atome mit vier oder mehr Bindungen werden als Polyeder gezeichnet.
Auf der rechten Seite kann die Colorierung des Moleküls nach einem definierten Schema
ausgewählt werden. Ansonsten kann die Farbe aus einer Palette ausgesucht werden.
Im unteren Bereich können die Werte für die Größe von Stäben und Kugeln und der Faktor
für die Darstellung der van-der-Waals-Radien eingegeben werden.
Abb. 4-33:
Darstellungsarten für die Beschriftungen
Die Beschriftung kann entweder ein- oder ausgestellt werden. Bei der Farbe kann ein
voreingestellter Wert benutzt werden oder die Farbe wird aus einer Farbpalette ausgesucht.
Weiterhin kann der Schriftstil und die Schriftgröße bestimmt werden.
Abb. 4-34:
Darstellungsarten für die Proteine
Bei der Darstellungsart für Proteine werden die Rückgräter gezeigt. „Ca Wire“, „Ca Stick“
und „Tube“ entsprechen dem Rückgrat-Modell (mit verschiedenen Parametern) in RasMol,
außer daß das Protein nicht einheitlich, sondern nach dem Farbschema der Aminosäuren
gefärbt ist.
Line, Flat und Solid Ribbon entsprechen dem Bänder-Modell (mit verschiedenen Parametern)
in RasMol. Das schematische Modell entspricht dem Cartoon-Modell in RasMol.
Abb. 4-35:
Darstellungsarten für die Zelle
Hier wird die Elementarzelle des Moleküls dargestellt. Einstellungsmöglichkeiten sind hier
die Dicke der Zellkanten, die Farbe der Zellkanten und ob die Achsen der Zelle beschriftet
werden sollen.
Abb. 4-36:
Darstellungsarten für die Oberfläche
Hier kann zwischen einer Lösungsmitteloberfläche, die dem Conolly-Modell entspricht oder
einer weichen Oberfläche gewählt werden, die der Lösungsmitteloberfläche ähnlich ist. Für
die letztere Oberfläche wird ein schnellerer Algorithmus benutzt, der die Oberfläche aber
nicht so genau berechnet.
Weiterhin kann auch hier die Farbe spezifiziert werden. Bei der Lösungsmitteloberfläche
kann auch der Probenradius eingestellt werden. 1.4 Angstrom ist der Radius von Wasser.
Über ein Kontrollkästchen kann die Oberfläche transparent oder undurchsichtig gemacht
werden.
Durch die transparente Oberfläche können sehr anschauliche Bilder erzielt werden.
Abb. 4-37:
α-Lactalbumin als Bänder-Modell
Die Glutaminreste als Kugel-Stab-Modelle sind hervorgehoben und von einer
transparenten Oberfläche umhüllt.
Alle oben aufgezählten Darstellungsmöglichkeiten können miteinander kombiniert werden,
wobei pro Objekt nur ein Modell ausgewählt werden kann.
4.1.7. Swiss-PdbViewer (Version 3.0) [Guex und Peitsch, 1998]
Dieser Viewer ist wie die beiden anderen Viewer kostenlos verfügbar. Er kann über den
Expasy-Server (http://expasy.hcuge.ch/spdbv/mainpage.html), auf dem auch die Datenbank
SWISS-PROT aufliegt, heruntergeladen werden. Für ihn steht auch ein umfangreiches
Handbuch und ein Lehrgang zur Verfügung.
Das Konzept des Swiss-PdbViewers geht weit über das Konzept eines reinen
Betrachtungsprogramms hinaus. Seine Stärken liegen deshalb auch nicht in den vielfältigen
Darstellungsmöglichkeiten, sondern in der Analyse von Proteinen.
Mit diesem Programm ist es möglich:
1. Sequenzabschnitte in Molekülen zu suchen
2.
Ramachandran Plots anzuzeigen und über diese die Darstellung der Moleküle zu
beeinflussen
3. Sequenzvergleiche vorzunehmen
4. Distanzen zwischen zwei Atomen zu bestimmen (mit Hilfe des Werkzeugs Nummer 5)
5. Winkel zwischen zwei Bindungen zu bestimmen (mit Hilfe des Werkzeugs Nummer 6)
6. Dihedral-Winkel zu bestimmen (mit Hilfe des Werkzeugs Nummer 7)
7. 2 Moleküle anzupassen und Proteine über Superimposing zu vergleichen (mit Hilfe des
Werkzeugs Nummer 11)
8. Austausch von Seitenketten (mit Hilfe des Werkzeugs Nummer 12)
9. Rotation von Seitenketten (mit Hilfe des Werkzeugs Nummer 13)
Die Abschnittssuche in Sequenzen startet man
im Menü „Edit / Find Sequence“, die
Darstellung von Ramachandran Plots im Menü „Display / Show Ramachandran“.
Sequenzvergleiche können ebenfalls über Menü Display ausgewählt werden; „Display / Show
Sequence Alignment“.
Die anderen Punkte der Liste können mit Hilfe der Werkzeugleiste, die in Abbildung 4-38 zu
sehen ist, gestartet werden.
1
Abb. 4-38:
2
3
4
5
6
7
8
9 10 11 12 13
Werkzeugleiste von Swiss-PdbViewer
Alle Symbole der Werkzeugliste, die noch nicht berücksichtigt worden sind, haben folgende
Bedeutungen:
Durch Betätigen des Symbols 8 der Werkzeugleiste erhält man die Herkunft des
anzuklickenden Atoms: die Aminosäure, in dem sich das Atom befindet, die Stellung der
Aminosäure in der Primärstruktur und das Elementzeichen des Atoms.
Mit Symbol 9 können alle Atome angezeigt oder ausgewählt werden, die in einem
bestimmten Radius, der frei gewählt werden kann, vom angeklickten Atom entfernt sind.
Mit Symbol 10 wird das anzuklickende Atom Zentrum der Darstellung.
Die Symbole 2 – 4 dienen der Koordinatenmanipulation.
Dabei kann bei angeklicktem:
1. Symbol 2 das Molekül verschoben
2. Symbol 3 das Molekül gezoomt
3. Symbol 4 das Molekül rotiert
werden.
Bei der Anwahl des Symbols 1 der Werkzeugleiste öffnet sich ein Fenster, in dem Parameter
für das Programm eingestellt werden können.
Abb. 4-39:
Eigenschaftenfenster des Swiss-PdbViewer
Das wichtigste Fenster zum Manipulieren der Darstellung ist die Steuerungseinheit. Mit ihr
kann ausgewählt werden, ob das Molekül sichtbar und / oder zu bewegen ist.
Ferner kann per Mausklick angesteuert werden:
1. jede einzelne Aminosäure
2. jede einzelne Seitenkette
3. jede einzelne Beschriftung
4. die Punkte-Oberfläche für jede einzelne Aminosäure
5. das Bänder-Modell für jede einzelne Aminosäure
6. die Farbe jeder einzelnen Aminosäure
Abb. 4-40:
Steuerungseinheit des Swiss-PdbViewer
Weitere Einstellungen lassen sich über das Menü im Hauptfenster vornehmen, z.B. die
Auswahl von Gruppen im Menü Select oder die Einstellung der Farben nach Schemata im
Menü Color.
Eine weitere besondere Eigenschaft dieses Programms ist das Menü SwissModel. Dahinter
verbirgt sich ein Menü, in dem eine Primärstruktur zum Vergleich mit allen Primärstrukturen
in der Datenbank SwissModel auf dem Expasy-Server vorbereitet und gesendet wird. Die
Moleküle mit Tertiärstrukturen der Datenbank, die der gesendeten Sequenz am ähnlichsten
sind, werden zum Herunterladen bereitgestellt.
Abb. 4-41:
Hauptfenster des Swiss-PdbViewer mit α-Lactalbumin
Die Glutaminreste mit dem Punkte-Oberflächen-Modell dargestellt worden
sind, bei allen anderen Aminosäuren wurden die Seitenketten entfernt. Der
reaktive Glutaminrest ist beschriftet.
Um ein Kalotten-Modell (nicht Punkte-Oberflächen-Modell) darstellen zu können, bedient
sich der Viewer des Programms QuickDraw von Apple, welches die Wiedergabe dieses
Modells berechnet. Dieses Programm muß separat aus dem Internet heruntergeladen werden
(http://www.apple.com/quicktime/qd3d/index.html).
Abb. 4-42:
Abbildung 4-45 gerendert mit QuickDraw mit der Einstellung
feste Bänder
Es können auch Bilder mit Raytracing erzeugt werden, da eine Schnittstelle von dem
Programm Swiss-PdbViewer zu dem Programm Pov-Ray (Persistence of Vision Raytracer)
besteht. Pov-Ray ist frei verfügbar (http://www.povray.org/).