Andreas Schlicker

Seminar Bioinformatik, „Theoretical Analysis of Protein-Protein Interactions”
Docking von starren und flexiblen
Proteinen
Präsentation von Andreas Schlicker ([email protected])
Übersicht

Molecular surface recognition:


Dead-End Elimination theorem (DEE):


Docking von starren Proteinen und Liganden mit
Hilfe von Korrelation geometrischer Eigenschaften
Reduktion des Konformations-Suchraums bei
flexiblem Docking
Protein Docking mit flexiblen Seitenketten
2
Molecular surface recognition

Docking von Molekülen anhand geometrischer
Eigenschaften


Form von Interfaces im gebundenen und freien
Zustand häufig sehr ähnlich
Suche im 6-dimensionalen Rotations- und
Translationsraum
3
Repräsentation der Moleküle

Projektion der 3DKoordinaten auf ein
Gitter

Gitterpunkt
innerhalb des
Moleküls, wenn
Atomkern innerhalb
Radius r vorhanden
[1]
[1]
4
Matching von Oberflächen (I)

Korrelation der geometrischen Form
[1]

(α, β, γ) gibt die Verschiebung von Molekül b in
Bezug auf Molekül a an
Kein
Kontakt  Korrelation = 0
 Korrelation > 0
je besser der Kontakt, desto größer die Korrelation
Kontakt
5
Matching von Oberflächen (II)


Problem: auch Überlappung liefert positive
Korrelation
Lösung:
ρ in Gleichung [2a] << 0
 δ in Gleichung [2b] > 0
 Überlappung wird mit
negativer Korrelation bestraft

[1]
6
Berechnung (I)

Direkte Berechnung der Korrelation benötigt
Zeit O(N6)
 Verwende Fourier Transformation
[1]

Korrelation wird durch Inverse FourierTransformation erhalten
 Benötigte Zeit liegt in O(N³ln(N³))
7
Berechnung (II)

Molekül a wird fixiert, Molekül b wird in allen
Orientierungen getestet
[1]
8
Resultate

Test mit 5 Komplexen, zwei Durchgänge mit
unterschiedlichen Gitter-Größen
[1]
[1]
[1]
9
Vor- und Nachteile

Vorteile:
Schnelle Berechnung
 Meistens korrekte Vorhersage
 Parameter sind universell einsetzbar


Nachteile:
Starre Moleküle
 Keine Berücksichtigung physiko-chemischer
Eigenschaften

10
Dead-End Elimination Theorem

Konformationsraum von Proteinen sehr groß,
selbst bei Verwendung von RotamerBibliotheken

Systematische Suche nach der „global minimum
energy conformation“ (GMEC) praktisch
unmöglich
11
Energie einer Konformation

Potentielle Energie eines Proteins:
[2]
12
„Dead-Ending“ Rotamere


Rotamere, die in der GMEC nicht vorkommen
können
Rotamer ir kann nicht vorkommen, wenn für ein
Paar (ir, it) gilt:
[2]
13
Erweiterung auf Rotamerpaare

Energie eines Rotamerpaares [irjs]
[2]

Interaktionsenergie mit anderen Rotameren
[2]
 Rotamerpaar [irjs] ist „dead-ending“, wenn gilt:
[2]
14
Algorithmus




Eliminiere alle Rotamere, die offensichtlich
inkompatibel sind
Eliminiere „dead-ending“ Rotamere mit dem
DEE Theorem
Wende DEE Theorem auf alle Rotamerpaare an
und markiere „dead-ending“ Paare
Iteriere, bis keine weiteren Rotamere mehr
entfallen
15
Resultate (I)

Test mit dem Insulin-Dimer
anfängliche Kombinationsmöglichkeiten: 2,7*1076
 Nach 9 Iterationen: 7200


Modellierung des
Proteins liefert 55
richtig vorhergesagte
Residuen

Verborgene Residuen
werden mit 93%
Genauigkeit
vorhergesagt
[2]
16
Resultate (II)

Blind-Test an Limulus polyphemus
194 Aminosäuren, wovon 71 % richtig vorhergesagt
wurden
 Viele Fehler durch falsche Salz- und
Wasserstoffbrücken an exponierten Gruppen

17
Vor- und Nachteile

Vorteile:
Schnelle Berechnung (Aufwand steigt „nur“
quadratisch mit Anzahl der Aminosäuren)
 Starke Reduzierung des Suchraums


Nachteile:
Ungenauigkeiten durch verwendete Energiefunktion
 Benötigt relativ genaues Template
 Abhängig von der verwendeten Rotamer-Bibliothek

18
Protein Docking mit flexiblen
Seitenketten

Docking von rigiden Strukturen keine gute
Lösung

Problem des exponentiellen Wachstums des
Konformationsraums bei flexiblen Seitenketten
19
Flexibilität

Alle Residuen flexibel behandeln sehr aufwändig
selbst bei Verwendung von RotamerBibliotheken
 Nur Interface-Residuen flexibel
Interface benötigt
 Rigides Docking zur Erzeugung von
Anfangsstrukturen

20
Rigides Docking


Verwendet geometrische und einfache
chemische Fitness Funktionen
Von den erzeugten Komplexstrukturen wurden
die 60 besten weiter verfolgt

Oft große Überlappung der Proteine und inkorrekt
platzierte Seitenketten
21
Bestimmung der Bindungsstelle

Residuen, die innerhalb 6 Å eines Atoms des
anderen Proteins liegen

Seitenketten ohne Rotamere (CYS in
Disulfidbrücken, ALA, GLY) werden nicht
berücksichtigt
22
GMEC

GMEC = Kombination der Rotamere, die die
niedrigste Energie liefern
[3]
 Anwendung des DEE-Theorems möglich
23
Suche nach der GMEC

Zwei Strategien:
Multi-Greedy Methode
 Branch-and-cut basierend auf einem ILP

24
Multi-Greedy Methode (I)

Aufbau eines Enumerations-Baumes mit
möglichen Kombinationen
[3]
25
Integer Linear Program (ILP)

Formulierung als Minimierungs-Problem auf einem
ungerichteten Graphen


Knoten v für alle Rotamere, E(v) = Etplir - Emax
Kanten uv für Rotamer-Paare verschiedener Residuen,
E(uv) = Epwir,js - Emax
 k-partiter Graph mit negativen Kanten- und KnotenGewichten
 GMEC entspricht Rotamer-Graph mit minimalem
Gewicht
26
ILP (II)
[3]
[3]
27
Branch-and-cut

Lösen der Relaxation des ILPs
 Falls Lösung ā nicht optimal, suche nach
fa <= f0, die ā als mögliche Lösung ausschließt

Falls keine Ungleichung gefunden wird,
aufsplitten in zwei Unterprobleme
28
Energieberechnung


Optimierung der GMEC mit AMBER
Freie Bindungsenergie:
[3]
ΔGES: elektrostatischer Beitrag
 ΔGcav: freie Cavitäts-Energie in Wasser
 ΔGconf: Änderung der Entropie
 ΔGvdW: Änderung der freien van-der-Waals Energie

29
Algorithmus (I)


Generierung von Ausgangsstrukturen mit Hilfe
von rigidem Docking
Bestimmung der Aminosäuren am Interface


Variation dieser Aminosäuren durch Rotamere
Iterative Anwendung des DEE Theorems zur
Reduktion des Konformationsraumes
30
Algorithmus (II)



Finden der GMEC mit Hilfe der schnellen
Heuristic bzw. des exakten branch-and-cut
Algorithmus
Optimierung der Molekülgeometrien mit Hilfe
eines Molekülmechanik Kraftfeldes
Berechnung der freien Bindungsenergie
31
Resultate (I)


Test mit drei Protein Komplexen
Anwendung des DEE ergibt große
Vereinfachung
[3]
32
Resultate (II)
[3]
33
Resultate (III)
[3]
34
Resultate (IV)
[3]
35
Vor- und Nachteile

Vorteile:
Heuristik liefert schnell gute Annäherung an
optimale Lösung
 Branch-and-cut liefert optimale Rotamere


Nachteile:
Keine perfekte Trennung von guten und schlechten
Ergebnissen
 Ergebnisse stark von der Wahl des Kraftfeldes
abhängig

36
Zusammenfassung



Rigides Docking nur erfolgreich, wenn native
und Komplexstruktur sehr ähnlich sind
Rigides Docking aber guter Startpunkt für
flexibles Docking
Dead-End elimination starke Vereinfachung bei
flexiblem Docking
37
Referenzen
[1] Katchalski-Katzir, E., Shariv, I., et al., (1992) PNAS, 89, 2195-2199. Molecular
Surface Recognition: Determination of Geometric Fit between Proteins and their
Ligands by Correlation Techniques
[2] Desmet, J., De Maeyer, M., Hazes, B., and Lasters, I., (1992) Nature, 356, 539-542.
DEE Theorem and its Use in Protein Side Chain Positioning
[3] Althaus, E., Kohlbacher, O., Lenhof, H.-P., and Muller, P., (2002) J. Comput. Biol.,
9, 597-612. A Combinatorial Approach to Protein Docking with Flexible Side
Chains
38