Softwarewerkzeuge der Bioinformatik

Werbung
Softwarewerkzeuge der Bioinformatik
Inhalt dieser Veranstaltung: Softwarewerkzeuge für
I
Sequenzanalyse
II
Analyse von Proteinstruktur
und Ligandenbindung
III
Zell- bzw. Netzwerksimulationen
www.cellzome.com
www.accelrys.com
1. Vorlesung WS 2004/05
Software-Werkzeuge der Bioinformatik
1
„Lernziele“
Lerne aktuelle und bewährte Programme und Datenbanken der Bioinformatik
kennen und erfolgreich einzusetzen um
- Tools kennenzulernen, mit denen man bioinformatische Fragen
bearbeiten kann
- zu wissen, was auf dem Markt ist („das Rad nicht zweimal erfinden“)
- ein Gefühl dafür zu bekommen, wie erfolgreiche Softwareprodukte
aussehen (sollen)
- 3 Mini-Forschungsprojekte zu bearbeiten
Wir werden in der Vorlesung anhand von „Case-studies“ typische Fragestellungen
in Pharma- oder Biotech-Unternehmen behandeln.
Wie stellen Sie sich den Arbeitsalltag als Bioinformatiker in einer Pharma-Firma
vor?
1. Vorlesung WS 2004/05
Software-Werkzeuge der Bioinformatik
2
Organisatorisches
Jede Woche zweistündige Vorlesung
Dozent: Prof. Helms
Freitag 9-11, Hörsaal 1, Geb. 45
Übungen „hands-on“ im CIP-Pool Bioinformatik Raum R 104 im Geb. 45
Freitag 11-13 Uhr.
Betreuer der Übungen
Sequenz-Analyse
Sam Ansari
Proteinstruktur
Dr. Michael Hutter
Zellsimulationen
Dr. Tihamer Geyer
1. Vorlesung WS 2004/05
Software-Werkzeuge der Bioinformatik
3
Welche Bioinformatik-Software gibt es?
1. Vorlesung WS 2004/05
Software-Werkzeuge der Bioinformatik
4
1. Vorlesung WS 2004/05
Software-Werkzeuge der Bioinformatik
5
1. Vorlesung WS 2004/05
Software-Werkzeuge der Bioinformatik
6
1. Vorlesung WS 2004/05
Software-Werkzeuge der Bioinformatik
7
1. Vorlesung WS 2004/05
Software-Werkzeuge der Bioinformatik
8
1. Vorlesung WS 2004/05
Software-Werkzeuge der Bioinformatik
9
1. Vorlesung WS 2004/05
Software-Werkzeuge der Bioinformatik
10
Ein paar Produkte ...
http://www.stratagene.com/softwaresolutions/
1. Vorlesung WS 2004/05
Software-Werkzeuge der Bioinformatik
11
Kommerzielle Software-Pakete sind bereits sehr mächtig
Kommerzielle Software ist sehr teuer,
aber sehr mächtig, da integriert.
Es ist fraglich, ob man in einer universitären
Umgebung (mit kostenloser Software)
bei Anwendungen im Bereich Drug
Development mit Firmen konkurrieren
kann, die solch mächtige Tools einsetzen.
http://www.lionbioscience.com/solutions
1. Vorlesung WS 2004/05
Software-Werkzeuge der Bioinformatik
12
Einsatz von Bioinformatik in der Produkt-Pipeline
http://www.curagen.com/pipeline/approach.asp
1. Vorlesung WS 2004/05
Software-Werkzeuge der Bioinformatik
13
Organisatorisches
Jeder Teilnehmer an den Übungen benötigt einen Rechneraccount für den CIPPool. Diese Accounts werden von der Rechnerbetriebsgruppe des FB Informatik
eingerichtet.
- Haben Sie bereits einen Account auf Uni-Rechnern? Dann muss dieser lediglich
für den CIP-Pool freigeschaltet werden.
Zugang zum CIP-Pool: Für Bioinformatik-Studenten 24/7,
für alle anderen während der Übungsstunden.
Bitte melden Sie sich nach dieser Stunde im Sekretariat
des Zentrums für Bioinformatik bei Frau Alexandra Klasen an.
Der Beginn der Übungen ist diese Woche.
1. Vorlesung WS 2004/05
Software-Werkzeuge der Bioinformatik
14
Organisatorisches: Scheinvergabe
Die Vorlesung zählt 2V + 2P = 9 Leistungspunkte.
Sie kann nach der neuen Prüfungsordnung für den Bachelor-Studiengang in der
Vertiefung „Bioinformatics“ eingebracht werden.
Die Scheine werden benotet.
50% der Benotung ergibt sich aus der mittleren Benotung von drei praktischen
Aufgaben, die während des Semesters von jedem Studenten einzeln zu bearbeiten
sind. Die Aufgaben werden etwa alle 4 Wochen ausgegeben und sind innerhalb
von 2 Wochen zu bearbeiten und durch ein mindestens 5-seitiges Protokoll zu
dokumentieren. Jeder Student muss mindestens zwei der drei praktischen
Aufgaben mit einer Note von 4 und besser bestehen.
Am Ende des Semesters wird eine 2-stündige Klausur über die Inhalte der
Vorlesung und der Übungen geschrieben. Die Klausurnote geht ebenfalls mit 50%
in die Scheinnote mit ein. Die Klausur muss mit einer Note von 4 und besser
bestanden werden.
1. Vorlesung WS 2004/05
Software-Werkzeuge der Bioinformatik
15
Übersicht über Vorlesungsinhalt
III Zellsimulationen
I Sequenz
1
Einführung
10
E-Cell
2
Paarweises Sequenzalignment
11
Virtual Cell
3
Multiples Sequenzalignment
12
Microarrays
4
Datenbanken
13
Protein-Netzwerke
5
Genomweite Sequenzanalyse
II Struktur
6
Proteinstruktur
7
Proteinstrukturvorhersage
8
Liganden-Docking
9
Protein-Protein-Docking
1. Vorlesung WS 2004/05
Software-Werkzeuge der Bioinformatik
16
Was fange ich mit diesen Daten an?
Sequenz des menschlichen Genoms wurde 2001 entschlüsselt.
1. Vorlesung WS 2004/05
Software-Werkzeuge der Bioinformatik
17
1
2 Analyse einer unbekannten Sequenz
Experimentelle
Daten
vorhanden?
Input: neue
Proteinsequenz
Multiples
Sequenzalignment
Gibt es ähnliche
Nein
Sequenz mit
bekannter 3D-Struktur?
Ja
Analyse dieses
Folds, Nachbarn?
Ja
Alignment der Sequenz
mit einer Target-Struktur
3D-Proteinstruktur
Kann man Funktion
zuordnen?
1. Vorlesung WS 2004/05
Zuordnung eines
Protein-Folds
Vorhersage der
Sekundärstruktur
Alignment der
Sekundärstrukturen.
Modellierung der
Proteinstruktur durch
Homologiemodellierung
Erkenne
Domänen
Suche in Sequenzdatenbanken
nach identischer Sequenz bzw.
ähnlichen Sequenzen
Software-Werkzeuge der Bioinformatik
Fold erkannt?
Nein
Ab inito Vorhersage
der Tertiärstruktur
Nach Rob Russell,
http://speedy.embl-heidelberg.de/
gtsp/flowchart2.html
18
Sequenzanalyse
1. Vorlesung WS 2004/05
Software-Werkzeuge der Bioinformatik
19
Ziele
(0) Identifiziere alle menschlichen Proteine (ORFs) und ihre Funktion
Sind dies alle Proteine?
Nein: post-translationelle Modifikationen möglich wie Methylierung,
Phosphorylierung, Glykosilierung …
(1) Identifiziere Gen-Netzwerke. Welche Proteine wechselwirken miteinander?
(2) Identifiziere Module: abgeschlossene Einheiten
(3) Identifiziere Sequenz-Abschnitte, in denen Mutationen für Krankheiten
codieren
1. Vorlesung WS 2004/05
Software-Werkzeuge der Bioinformatik
20
Sequenzen sind verwandt
• Evolution findet auf vielen verschiedenen Ebenen statt :
Mutationen einzelner Aminosäuren, Domänen-Shuffling, Genduplikation,
Genom-Rearrangement
• verwandte Moleküle besitzen in verschiedenen Organismen ähnliche Funktionen
(“Homologe”)
Phylogenetischer Baum für
ribosomale RNA:
Drei Bereiche des Lebens
1. Vorlesung WS 2004/05
Software-Werkzeuge der Bioinformatik
21
Sequenzen sind verwandt, II
Phylogenetischer
Baum für
Globin-Proteine des
Menschen
1. Vorlesung WS 2004/05
Software-Werkzeuge der Bioinformatik
22
gewinne transferierbare Information aus Sequenzvergleich
•
Bestimme
evolutionäre
Beziehungen
•
Vorhersage von
Proteinfunktion und struktur
(Datenbanksuche).
Protein 1: bindet Sauerstoff
Sequenzähnlichkeit
Protein 2: bindet Sauerstoff ?
1. Vorlesung WS 2004/05
Software-Werkzeuge der Bioinformatik
23
Sequenzalignment
Der Zweck eines Sequenzalignments ist, all die Residuen einer
beliebigen Anzahl von Sequenzen untereinander anzuordnen, die
von der gleichen Residuenposition in einem Gen- oder ProteinVorfahren abstammen.
gap = Insertion oder Deletion
1. Vorlesung WS 2004/05
J.Leunissen
Software-Werkzeuge der Bioinformatik
J.Leunissen
24
Needleman-Wunsch Algorithmus
- allgemeiner Algorithmus für Sequenzvergleiche
- maximiert einen Ähnlichkeitsscore
- bester Match = grösste Anzahl an Residuen einer Sequenz, die zu denen
einer anderen Sequenz passen, wobei Deletionen erlaubt sind.
- Der Algorithmus findet durch dynamische Programmierung das bestmögliche
GLOBALE Alignment zweier beliebiger Sequenzen
- NW beinhaltet eine iterative Matrizendarstellung
alle möglichen Residuenpaare (Basen oder Aminosäuren) – je eine von
jeder Sequenz – werden in einem zwei-dimensionalen Gitter dargestellt.
alle möglichen Alignments werden durch Pfade durch dieses Gitter
dargestellt.
Der Algorithmus hat 3 Schritte: 1 Initialisierung 2 Auffüllen 3 Trace-back
1. Vorlesung WS 2004/05
Software-Werkzeuge der Bioinformatik
25
Needleman-Wunsch Algorithm: Initialisierung
Aufgabe: aligniere die Wörter “COELACANTH” und “PELICAN” der Länge
m =10 und n =7. Konstruiere (m+1) × (n+1) Matrix.
Ordne den Elementen der ersten Zeile und Reihe die Werte – m × gap
und – n × gap zu.
Die Pointer dieser Felder zeigen zurück zum Ursprung.
1. Vorlesung WS 2004/05
C
O
E
L
A
C
A
N
T
H
0 -1
-2
-3
-4
-5
-6
-7
-8
-9
-10
P
-1
E
-2
L
-3
I
-4
C
-5
A
-6
N
-7
Software-Werkzeuge der Bioinformatik
26
Needleman-Wunsch Algorithm: Auffüllen
Fülle alle Matrizenfelder mit Werten und Zeigern gemäss von simplen Operationen,
die die Werte der diagonalen, vertikal, und horizontalen Nachbarzellen einschliessen.
Berechne
- match score: Wert der Diagonalzelle links oben + Wert des Alignments (+1 oder -1)
- horizontal gap score: Wert der linken Zelle + gap score (-1)
- vertical gap score: Wert der oberen Zelle + gap score (-1)
ordne der Zelle das Maximum dieser 3 Werte zu. Der Pointer zeigt in Richtung des
maximalen Scores.
C O E L
A C A N T
H
0 -1
max(-1, -2, -2) = -1
P
-1
-1
-2
-3
-4
-5
-6
-7
-8
-9
-10
-2
max(-2, -2, -3) = -2
(Pointer soll bei gleichen Werte immer in eine bestimmte Richtung zeigen, z.B.
entlang der Diagonalen.
1. Vorlesung WS 2004/05
Software-Werkzeuge der Bioinformatik
27
Needleman-Wunsch Algorithmus: Trace-back
Trace-back ergibt das Alignment aus der Matrix.
Starte in Ecke rechts unten und folge den Pfeilen bis in die Ecke links oben.
C
COELACANTH
-PELICAN-P
E
L
I
C
A
N
1. Vorlesung WS 2004/05
O
E
L
A
C
A
N
T
H
0
-1
-2
-3
-4
-5
-6
-7
-8
-9 -10
-1
-1
-2
-3
-4
-5
-6
-7
-8
-9 -10
-2
-2
-2
-1
-2
-3
-4
-5
-6
-7
-8
-3
-3
-3
-2
0
-1
-2
-3
-4
-5
-6
-4
-4
-4
-3
-1
-1
-2
-3
-4
-5
-6
-5
-3
-4
-4
-2
-2
0
-1
-2
-3
-4
-6
-4
-4
-5
-3
-1
-1
1
0
-1
-2
-7
-5
-5
-5
-4
-2
-2
0
2
1
0
Software-Werkzeuge der Bioinformatik
28
Smith-Waterman-Algorithmus
Smith-Waterman ist ein lokaler Alignment-Algorithmus. SW ist eine sehr
einfache Modifikation von Needleman-Wunsch. Lediglich 3 Änderungen:
- die Matrixränder werden auf 0 statt auf ansteigende Gap-Penalties gesetzt.
- der maximale Wert sinkt nie unter 0. Pointer werden nur für Werte grösser als
0 eingezeichnet.
- Trace-back beginnt am grösseten Wert der Matrix und endet bei dem Wert 0.
ELACAN
C
ELICAN
P
E
L
I
C
A
N
1. Vorlesung WS 2004/05
O
E
L
A
C
A
N
T
H
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
0
0
0
2
1
0
0
0
0
0
0
0
0
0
1
1
0
0
0
0
0
0
1
0
0
0
0
2
0
0
0
0
0
0
0
0
0
1
0
3
2
1
0
0
0
0
0
0
0
0
1
4
3
2
Software-Werkzeuge der Bioinformatik
29
Sequenzvergleiche: PAM250 Matrix
Für Sequenzvergleiche werden
Scoring-Matrizen für den
Austausch von Aminosäuren
verwendet.
1. Vorlesung WS 2004/05
Software-Werkzeuge der Bioinformatik
30
Proteinstruktur
Sequenz
Was hat nun Sequenz-Konservierung mit Proteinstrukturen zu tun?
sehr viel!
Die Twilight zone kennzeichnet das Mass an Sequenzidentität, bis zu der zwei
Proteinstrukturen mit hoher Wkt. die gleiche Struktur besitzen.
Richtlinien von Doolittle:
• Sequenzen mit > 150 Residuen und
wahrscheinlich verwandt
25% Sequenzidentität sind
• mit 15-20% Sequenzidentität können sie verwandt sein
• bei <15% Sequenzidentität ist es schwierig zu sagen ob sie verwandt
sind oder nicht ohne weitere strukturelle oder funktionelle Hinweise
TWILIGHT ZONE
1. Vorlesung WS 2004/05
Software-Werkzeuge der Bioinformatik
31
Proteinstruktur,
Wechselwirkung mit Liganden
1. Vorlesung WS 2004/05
Software-Werkzeuge der Bioinformatik
32
Einleitung: Aminosäuren
Aminosäuren sind die Bausteine von Proteinen:
Aminogruppe
H
N
H
O
H
R
1. Vorlesung WS 2004/05
OH
Software-Werkzeuge der Bioinformatik
Carboxylsäure
33
Buchstaben-Code der Aminosäuren
•
Ein- und Drei-Buchstaben-Codes der Aminosäuren
G
A
L
M
F
W
K
Q
E
S
Glycin
Alanin
Leucin
Methionin
Phenylalanin
Tryptophan
Lysin
Glutamin
Glutaminsäure
Serin
Gly
Ala
Leu
Met
Phe
Trp
Lys
Gln
Glu
Ser
Zusätzliche Codes
B Asn/Asp Z Gln/Glu
1. Vorlesung WS 2004/05
P
V
I
C
Y
H
R
N
D
T
Prolin
Pro
Valin
Val
Isoleucin
Ile
Cystein
Cys
Tyrosin
Tyr
Histidin
His
Arginin
Arg
Asparagin
Asn
Asparaginsäure
Threonin
Thr
Asp
X Irgendeine Aminosäure
Software-Werkzeuge der Bioinformatik
34
Einleitung: Peptidbindung
In Peptiden und Proteinen sind die Aminosäuren miteinander als lange
Ketten verknüpft.
Ein Paar ist jeweils über eine „Peptidbindung“ verknüpft.
Die Aminosäuresequenz eines
Proteins bestimmt seinen
„genetischen code“.
Die Kenntnis der Sequenz eines
Proteins allein verrät noch nicht
viel über seine Funktion.
Entscheidend ist seine
drei-dimensionale Struktur.
+
H
O
H3N
R1
+
G>0
O
-
+
H3N
O
R2
O
H3N
H O
H
+
H R2
H O
H3N
H
-
O
N
R1
+
+
H
O
-
H2O
O
N
R1
H R2
O
peptide bond
1. Vorlesung WS 2004/05
Software-Werkzeuge der Bioinformatik
35
Grundlegende Definitionen
•
Primärstruktur
– Die lineare Sequenz der Aminosäuren eines Proteins
•
Sekundärstruktur
– Regionen lokaler Regelmässigkeit
• Z.B. -Helices, -Stränge, -Faltblätter & -Schleifen
1. Vorlesung WS 2004/05
Software-Werkzeuge der Bioinformatik
36
Definition: Super-Sekundärstruktur
Die Anordnung (packing) von Sekundärstrukturelemente zu stabilen Einheiten
wie -barrels,
Einheiten, Greek keys, usw.
1. Vorlesung WS 2004/05
Software-Werkzeuge der Bioinformatik
37
Definition: Tertiärstruktur
•
Die gesamte Faltung einer Kette, die sich aus der Packung der
Sekundärstrukturelemente ergibt.
Grün Fluoreszierendes
Protein. Seine
zylindrische Architektur
wird durch 11 -Stränge
gebildet. (1emb.pdb Brejc
et al. 1997)
1. Vorlesung WS 2004/05
Software-Werkzeuge der Bioinformatik
38
Einleitung: Proteinstruktur
cAMP-abhängige Proteinkinase
(katalytische Untereinheit)
1. Vorlesung WS 2004/05
Software-Werkzeuge der Bioinformatik
Ca2+ Pumpe
(TM Protein)
39
Definition: Quartäre Struktur
Die Anordnung mehrerer Ketten eines Proteins, das mehrere Untereinheiten
besitzt. Beispiel Hämoglobin
1. Vorlesung WS 2004/05
Software-Werkzeuge der Bioinformatik
40
Bedeutung von Sequenzanalyse
•
>900,000 Sequenzen in öffentlichen Datenbanken zugänglich
– Millionen mehr in proprietären dbs
– Anstieg wird mit Sequenzierung von weiteren Genomen weitergehen
– Was tun?
•
In den Sequenzen steckt eine grosse Menge an strukturellen,
funktionellen und evolutionären Informationen
– Sie sind eine sehr wichtige Datenquelle
•
Im Gegensatz dazu gibt es nur etwa 2000 unabhängige Proteinstrukturen
1. Vorlesung WS 2004/05
Software-Werkzeuge der Bioinformatik
41
Sequenz-Struktur Missverhältnis
800
700
600
500
400
300
200
100
1988
2002
Anzahl an nicht-redundanten Sequenzen 1988-2002 (
Entsprechende Zunahme der Zahl an Proteinstrukturen (
1. Vorlesung WS 2004/05
Software-Werkzeuge der Bioinformatik
)
).
42
Der “holy grail” der strukturellen Bioinformatik
1. Vorlesung WS 2004/05
Software-Werkzeuge der Bioinformatik
43
Eigenschaften der Aminosäuren
Aminosäuren unterscheiden sich in ihren physikochemischen Eigenschaften.
1. Vorlesung WS 2004/05
Software-Werkzeuge der Bioinformatik
44
Einleitung: hydrophobe Aminosäuren
Proteine sind aus 20 verschiedenen natürlichen
Aminosäuren aufgebaut
H
H
H
N
5 sind hydrophob.
Sie sind vor allem
Im Proteininneren.
N
O
H
OH
H
N
O
H
CH 3
OH
HC
CH3 CH 3
OH
Alanine
Valine
H
H
N
H
O
H
H
Glycine
O
H
N
O
CH
OH
H
H
CH 2
CH3
OH
H3C
CH3
Leucine
1. Vorlesung WS 2004/05
H
H
Software-Werkzeuge der Bioinformatik
CH 2
CH 3
Isoleucine
45
Einleitung: aromatische Aminosäuren
Es gibt drei voluminöse aromatische Aminosäuren. Tyrosin und Tryptophan
liegen bei Membranproteinen vor allem in der Interface-region.
H
H
H
N
N
O
OH
N
CH 2
CH 2
OH
O
1. Vorlesung WS 2004/05
O
H
N
Phenylalanin
H
O
H
H
CH 2
H
H
H
Tyrosin
Software-Werkzeuge der Bioinformatik
OH
CH
H
Tryptophan
46
Einleitung: Aminosäuren
Es gibt 2 Schwefel enthaltende Aminosäuren und das ungewöhnliche Prolin.
Cysteine können Disulfidbrücken bilden. Prolin ist ein “Helixbrecher”.
H
H
H
N
H
H
OH
CH2 N H
CH2
CH2 H
Methionin
Prolin
N
O
O
H
H
CH 2
S
H
OH
CH 2
O
OH
CH 2
S
CH 3
Cystein
1. Vorlesung WS 2004/05
Software-Werkzeuge der Bioinformatik
47
Einleitung: Aminosäuren
Es gibt zwei Aminosäuren mit terminalen polaren Hydroxlgruppen:
H
H
H
N
O
H
CH 2
CH2
O
Serin
1. Vorlesung WS 2004/05
N
O
H
H
H
OH
CH 2
OH
HC
CH3
O
H
Threonin
Software-Werkzeuge der Bioinformatik
48
Einleitung: Aminosäuren
Es gibt 3 positiv geladene Aminosäuren. Sie liegen vor allem auf der
Proteinoberflächen und in aktiven Zentren.
Thermophile Organismen besitzen besonders viele Ionenpaare auf den Proteinoberflächen.
H
H
H
N
H
H
N
O
CH 2
OH
1. Vorlesung WS 2004/05
OH
H
CH 2
N H
NH2
H N
+
+
Lysin
CH 2
OH
CH2
CH2
NH3
O
H
CH 2
CH2
CH 2
N
O
H
H
H
+
N
H
H
NH2
Arginin
Software-Werkzeuge der Bioinformatik
Histidin
49
Einleitung: Aminosäuren
Es gibt 2 negativ geladene Aminosäuren und ihre zwei neutralen Analoga.
Asp und Glu haben pKa Werte von 2.8. Das heisst, erst unterhalb von pH=2.8
werden ihre Carboxylgruppe protoniert.
H
H
H
N
N
O
CH 2
OH
-
O
N
CH 2
OH
CH2
OH
O
CH 2
Asparagin
OH
CH2
NH 2
-
Software-Werkzeuge der Bioinformatik
N
H
CH 2
O
H
O
H
O
O
Asparaginsäure
Glutaminsäure
1. Vorlesung WS 2004/05
H
H
O
H
H
O
H
H
O
NH2
Glutamin
50
Transmembrandomänen: Hydrophobizitätsskalen
http://blanco.biomol.uci.edu/mpex/
Stephen White group, UC Irvine
1. Vorlesung WS 2004/05
Software-Werkzeuge der Bioinformatik
51
Helikale Räder
Helikale Räder dienen
zur Darstellung von
Helices.
http://cti.itc.Virginia.EDU/~cmg/Demo/wheel/wheelApp.html.
1. Vorlesung WS 2004/05
Software-Werkzeuge der Bioinformatik
52
Analyse einer unbekannten Sequenz
Experimentelle
Daten
vorhanden?
Input: neue
Proteinsequenz
Multiples
Sequenzalignment
Gibt es ähnliche Nein
Sequenz mit
bekannter 3D-Struktur?
Ja
Erkenne
Domänen
Suche in Sequenzdatenbanken
nach identischer Sequenz bzw.
ähnlichen Sequenzen
Zuordnung eines
Protein-Folds
Vorhersage der
Sekundärstruktur
Analyse dieses
Folds, Nachbarn?
Ja
Alignment der
Sekundärstrukturen.
Modellierung der
Proteinstruktur durch
Homologiemodellierung
3D-Proteinstruktur
1. Vorlesung WS 2004/05
Alignment der Sequenz
mit einer Struktur.
Kann man Funktion
transferieren?
Software-Werkzeuge der Bioinformatik
Fold erkannt?
Nein
Vorhersage der
Tertiärstruktur
Nach Rob Russell,
http://speedy.embl-heidelberg.de/
gtsp/flowchart2.html 53
Proteinstruktur
Sequenz
- Konservierung von Residuen sind Indizien für den Verwandtschaftsgrad von
Proteinen, für die Evolution und für die Verwandtschaft von Organismen
- Konservierung von Residuen im aktiven Zentrum
- Konservierung von Residuen, die die Architektur der Proteinstruktur stabilisieren
- Konservierung von Residuen, die während Faltung des Proteins wichtig sind
- Konservierung von Residuen an Bindungsschnittstellen für Liganden und
andere Proteine
1. Vorlesung WS 2004/05
Software-Werkzeuge der Bioinformatik
54
Netzwerke
1. Vorlesung WS 2004/05
Software-Werkzeuge der Bioinformatik
55
metabolische Netzwerke
Formulierung von Biochemie mit Linearer Algebra
1. Vorlesung WS 2004/05
Software-Werkzeuge der Bioinformatik
56
Zellsimulationen
Ziel: verstehe metabolische Abläufe in Zellen
http://ecell.sourceforge.net/index.html
1. Vorlesung WS 2004/05
Software-Werkzeuge der Bioinformatik
57
E-cell
Anwendungen bisher:
- Energie-Metabolismus von E.coli
- e-Rice
- Modell eines menschlichen Erythrozyten
- Zirkadiane Rhythmen
- e-Neuron
- Signalübertragung in der bakteriellen Chemotaxis
1. Vorlesung WS 2004/05
Software-Werkzeuge der Bioinformatik
58
Virtual Cell
http://www.nrcam.uchc.edu/
1. Vorlesung WS 2004/05
Software-Werkzeuge der Bioinformatik
59
Virtual Cell
Left: overall mechanism of Ran-mediated nucleocytoplasmic transport. The image
Right: membrane transport components within the Virtual Cell software.
GTP-bound Ran shuttles between the nuclear and cytoplasmic compartments and
is predominately nuclear at steady-state. The RanGTP nuclear membrane gradient
is essential and required for RanGTP-dependent assembly and dissociation of
transport complexes within the nucleus.
http://www.nrcam.uchc.edu/
1. Vorlesung WS 2004/05
Software-Werkzeuge der Bioinformatik
60
Virtual Cell
Parameter …
1. Vorlesung WS 2004/05
Software-Werkzeuge der Bioinformatik
61
Virtual Cell
This set of images shows the spatiotemporal pattern of nuclear accumulation of
fluorescently labeled Ran after microinjection into the cytosol in a confocal
experiment (grayscale panels) and a Virtual Cell simulation (color scale panels).
http://www.nrcam.uchc.edu/
1. Vorlesung WS 2004/05
Software-Werkzeuge der Bioinformatik
62
Virtual Cell
Calculated 3D distribution of 2 species in the pathway that are not directly visible
by labeling. Injecting fluorescently labeled Ran allows you to experimentally
visualize all the forms of Ran but not the individual bound and free states.
Simulations help dissect what is happening to all the species.
http://www.nrcam.uchc.edu/
1. Vorlesung WS 2004/05
Software-Werkzeuge der Bioinformatik
63
Software
In den Tutorials vorgestellte Software:
0
Datenbankennavigation
SRS
I
Sequenzanalyse: (FASTA) BLAST, PSI-BLAST, CLUSTALW
II
Proteinstruktur:
VMD
Ligandenbindung: FlexX mit Andreas Kämper
III
Zellsimulationen: Virtual Cell
Datenbanken:
Sequenzdatenbanken
Proteinstrukturbanken
Metabolische Datenbanken
1. Vorlesung WS 2004/05
Software-Werkzeuge der Bioinformatik
64
Herunterladen