Docking von starren und flexiblen Proteinen

Werbung
Seminar Bioinformatik, „Theoretical Analysis of Protein-Protein Interactions”
Docking von starren und flexiblen
Proteinen
Präsentation von Andreas Schlicker ([email protected])
Übersicht
Molecular surface recognition:
Docking von starren Proteinen und Liganden mit
Hilfe von Korrelation geometrischer Eigenschaften
Dead-End Elimination theorem (DEE):
Reduktion des Konformations-Suchraums bei
flexiblem Docking
Protein Docking mit flexiblen Seitenketten
2
Molecular surface recognition
Docking von Molekülen anhand geometrischer
Eigenschaften
Form von Interfaces im gebundenen und freien
Zustand häufig sehr ähnlich
Suche im 6-dimensionalen Rotations- und
Translationsraum
3
Repräsentation der Moleküle
Projektion der 3DKoordinaten auf ein
Gitter
Gitterpunkt
innerhalb des
Moleküls, wenn
Atomkern innerhalb
Radius r vorhanden
[1]
[1]
4
Matching von Oberflächen (I)
Korrelation der geometrischen Form
[1]
(:, ;, <) gibt die Verschiebung von Molekül b in
Bezug auf Molekül a an
Kein Kontakt Korrelation = 0
Kontakt Korrelation > 0
je besser der Kontakt, desto größer die Korrelation
5
Matching von Oberflächen (II)
Problem: auch Überlappung liefert positive
Korrelation
Lösung:
E in Gleichung [2a] << 0
H in Gleichung [2b] > 0
Überlappung wird mit
negativer Korrelation bestraft
[1]
6
Berechnung (I)
Direkte Berechnung der Korrelation benötigt
Zeit O(N6)
Verwende Fourier Transformation
[1]
Korrelation wird durch Inverse FourierTransformation erhalten
Benötigte Zeit liegt in O(N³ln(N³))
7
Berechnung (II)
Molekül a wird fixiert, Molekül b wird in allen
Orientierungen getestet
[1]
8
Resultate
Test mit 5 Komplexen, zwei Durchgänge mit
unterschiedlichen Gitter-Größen
[1]
[1]
[1]
9
Vor- und Nachteile
Vorteile:
Schnelle Berechnung
Meistens korrekte Vorhersage
Parameter sind universell einsetzbar
Nachteile:
Starre Moleküle
Keine Berücksichtigung physiko-chemischer
Eigenschaften
10
Dead-End Elimination Theorem
Konformationsraum von Proteinen sehr groß,
selbst bei Verwendung von RotamerBibliotheken
Systematische Suche nach der „global minimum
energy conformation“ (GMEC) praktisch
unmöglich
11
Energie einer Konformation
Potentielle Energie eines Proteins:
[2]
12
„Dead-Ending“ Rotamere
Rotamere, die in der GMEC nicht vorkommen
können
Rotamer ir kann nicht vorkommen, wenn für ein
Paar (ir, it) gilt:
[2]
13
Erweiterung auf Rotamerpaare
Energie eines Rotamerpaares [irjs]
[2]
Interaktionsenergie mit anderen Rotameren
[2]
Rotamerpaar [irjs] ist „dead-ending“, wenn gilt:
[2]
14
Algorithmus
Eliminiere alle Rotamere, die offensichtlich
inkompatibel sind
Eliminiere „dead-ending“ Rotamere mit dem
DEE Theorem
Wende DEE Theorem auf alle Rotamerpaare an
und markiere „dead-ending“ Paare
Iteriere, bis keine weiteren Rotamere mehr
entfallen
15
Resultate (I)
Test mit dem Insulin-Dimer
anfängliche Kombinationsmöglichkeiten: 2,7*1076
Nach 9 Iterationen: 7200
Modellierung des
Proteins liefert 55
richtig vorhergesagte
Residuen
Verborgene Residuen
werden mit 93%
Genauigkeit
vorhergesagt
[2]
16
Resultate (II)
Blind-Test an Limulus polyphemus
194 Aminosäuren, wovon 71 % richtig vorhergesagt
wurden
Viele Fehler durch falsche Salz- und
Wasserstoffbrücken an exponierten Gruppen
17
Vor- und Nachteile
Vorteile:
Schnelle Berechnung (Aufwand steigt „nur“
quadratisch mit Anzahl der Aminosäuren)
Starke Reduzierung des Suchraums
Nachteile:
Ungenauigkeiten durch verwendete Energiefunktion
Benötigt relativ genaues Template
Abhängig von der verwendeten Rotamer-Bibliothek
18
Protein Docking mit flexiblen
Seitenketten
Docking von rigiden Strukturen keine gute
Lösung
Problem des exponentiellen Wachstums des
Konformationsraums bei flexiblen Seitenketten
19
Flexibilität
Alle Residuen flexibel behandeln sehr aufwändig
selbst bei Verwendung von RotamerBibliotheken
Nur Interface-Residuen flexibel
Interface benötigt
Rigides Docking zur Erzeugung von
Anfangsstrukturen
20
Rigides Docking
Verwendet geometrische und einfache
chemische Fitness Funktionen
Von den erzeugten Komplexstrukturen wurden
die 60 besten weiter verfolgt
Oft große Überlappung der Proteine und inkorrekt
platzierte Seitenketten
21
Bestimmung der Bindungsstelle
Residuen, die innerhalb 6 Å eines Atoms des
anderen Proteins liegen
Seitenketten ohne Rotamere (CYS in
Disulfidbrücken, ALA, GLY) werden nicht
berücksichtigt
22
GMEC
GMEC = Kombination der Rotamere, die die
niedrigste Energie liefern
[3]
Anwendung des DEE-Theorems möglich
23
Suche nach der GMEC
Zwei Strategien:
Multi-Greedy Methode
Branch-and-cut basierend auf einem ILP
24
Multi-Greedy Methode (I)
Aufbau eines Enumerations-Baumes mit
möglichen Kombinationen
[3]
25
Integer Linear Program (ILP)
Formulierung als Minimierungs-Problem auf einem
ungerichteten Graphen
Knoten v für alle Rotamere, E(v) = Etplir - Emax
Kanten uv für Rotamer-Paare verschiedener Residuen,
E(uv) = Epwir,js - Emax
k-partiter Graph mit negativen Kanten- und KnotenGewichten
GMEC entspricht Rotamer-Graph mit minimalem
Gewicht
26
ILP (II)
[3]
[3]
27
Branch-and-cut
Lösen der Relaxation des ILPs
Falls Lösung Y nicht optimal, suche nach
fa <= f0, die Y als mögliche Lösung ausschließt
Falls keine Ungleichung gefunden wird,
aufsplitten in zwei Unterprobleme
28
Energieberechnung
Optimierung der GMEC mit AMBER
Freie Bindungsenergie:
[3]
ZGES: elektrostatischer Beitrag
ZGcav: freie Cavitäts-Energie in Wasser
ZGconf: Änderung der Entropie
ZGvdW: Änderung der freien van-der-Waals Energie
29
Algorithmus (I)
Generierung von Ausgangsstrukturen mit Hilfe
von rigidem Docking
Bestimmung der Aminosäuren am Interface
Variation dieser Aminosäuren durch Rotamere
Iterative Anwendung des DEE Theorems zur
Reduktion des Konformationsraumes
30
Algorithmus (II)
Finden der GMEC mit Hilfe der schnellen
Heuristic bzw. des exakten branch-and-cut
Algorithmus
Optimierung der Molekülgeometrien mit Hilfe
eines Molekülmechanik Kraftfeldes
Berechnung der freien Bindungsenergie
31
Resultate (I)
Test mit drei Protein Komplexen
Anwendung des DEE ergibt große
Vereinfachung
[3]
32
Resultate (II)
[3]
33
Resultate (III)
[3]
34
Resultate (IV)
[3]
35
Vor- und Nachteile
Vorteile:
Heuristik liefert schnell gute Annäherung an
optimale Lösung
Branch-and-cut liefert optimale Rotamere
Nachteile:
Keine perfekte Trennung von guten und schlechten
Ergebnissen
Ergebnisse stark von der Wahl des Kraftfeldes
abhängig
36
Zusammenfassung
Rigides Docking nur erfolgreich, wenn native
und Komplexstruktur sehr ähnlich sind
Rigides Docking aber guter Startpunkt für
flexibles Docking
Dead-End elimination starke Vereinfachung bei
flexiblem Docking
37
Referenzen
[1] Katchalski-Katzir, E., Shariv, I., et al., (1992) PNAS, 89, 2195-2199. Molecular
Surface Recognition: Determination of Geometric Fit between Proteins and their
Ligands by Correlation Techniques
[2] Desmet, J., De Maeyer, M., Hazes, B., and Lasters, I., (1992) Nature, 356, 539-542.
DEE Theorem and its Use in Protein Side Chain Positioning
[3] Althaus, E., Kohlbacher, O., Lenhof, H.-P., and Muller, P., (2002) J. Comput. Biol.,
9, 597-612. A Combinatorial Approach to Protein Docking with Flexible Side
Chains
38
Herunterladen