Seminar Bioinformatik, „Theoretical Analysis of Protein-Protein Interactions” Docking von starren und flexiblen Proteinen Präsentation von Andreas Schlicker ([email protected]) Übersicht Molecular surface recognition: Dead-End Elimination theorem (DEE): Docking von starren Proteinen und Liganden mit Hilfe von Korrelation geometrischer Eigenschaften Reduktion des Konformations-Suchraums bei flexiblem Docking Protein Docking mit flexiblen Seitenketten 2 Molecular surface recognition Docking von Molekülen anhand geometrischer Eigenschaften Form von Interfaces im gebundenen und freien Zustand häufig sehr ähnlich Suche im 6-dimensionalen Rotations- und Translationsraum 3 Repräsentation der Moleküle Projektion der 3DKoordinaten auf ein Gitter Gitterpunkt innerhalb des Moleküls, wenn Atomkern innerhalb Radius r vorhanden [1] [1] 4 Matching von Oberflächen (I) Korrelation der geometrischen Form [1] (α, β, γ) gibt die Verschiebung von Molekül b in Bezug auf Molekül a an Kein Kontakt Korrelation = 0 Korrelation > 0 je besser der Kontakt, desto größer die Korrelation Kontakt 5 Matching von Oberflächen (II) Problem: auch Überlappung liefert positive Korrelation Lösung: ρ in Gleichung [2a] << 0 δ in Gleichung [2b] > 0 Überlappung wird mit negativer Korrelation bestraft [1] 6 Berechnung (I) Direkte Berechnung der Korrelation benötigt Zeit O(N6) Verwende Fourier Transformation [1] Korrelation wird durch Inverse FourierTransformation erhalten Benötigte Zeit liegt in O(N³ln(N³)) 7 Berechnung (II) Molekül a wird fixiert, Molekül b wird in allen Orientierungen getestet [1] 8 Resultate Test mit 5 Komplexen, zwei Durchgänge mit unterschiedlichen Gitter-Größen [1] [1] [1] 9 Vor- und Nachteile Vorteile: Schnelle Berechnung Meistens korrekte Vorhersage Parameter sind universell einsetzbar Nachteile: Starre Moleküle Keine Berücksichtigung physiko-chemischer Eigenschaften 10 Dead-End Elimination Theorem Konformationsraum von Proteinen sehr groß, selbst bei Verwendung von RotamerBibliotheken Systematische Suche nach der „global minimum energy conformation“ (GMEC) praktisch unmöglich 11 Energie einer Konformation Potentielle Energie eines Proteins: [2] 12 „Dead-Ending“ Rotamere Rotamere, die in der GMEC nicht vorkommen können Rotamer ir kann nicht vorkommen, wenn für ein Paar (ir, it) gilt: [2] 13 Erweiterung auf Rotamerpaare Energie eines Rotamerpaares [irjs] [2] Interaktionsenergie mit anderen Rotameren [2] Rotamerpaar [irjs] ist „dead-ending“, wenn gilt: [2] 14 Algorithmus Eliminiere alle Rotamere, die offensichtlich inkompatibel sind Eliminiere „dead-ending“ Rotamere mit dem DEE Theorem Wende DEE Theorem auf alle Rotamerpaare an und markiere „dead-ending“ Paare Iteriere, bis keine weiteren Rotamere mehr entfallen 15 Resultate (I) Test mit dem Insulin-Dimer anfängliche Kombinationsmöglichkeiten: 2,7*1076 Nach 9 Iterationen: 7200 Modellierung des Proteins liefert 55 richtig vorhergesagte Residuen Verborgene Residuen werden mit 93% Genauigkeit vorhergesagt [2] 16 Resultate (II) Blind-Test an Limulus polyphemus 194 Aminosäuren, wovon 71 % richtig vorhergesagt wurden Viele Fehler durch falsche Salz- und Wasserstoffbrücken an exponierten Gruppen 17 Vor- und Nachteile Vorteile: Schnelle Berechnung (Aufwand steigt „nur“ quadratisch mit Anzahl der Aminosäuren) Starke Reduzierung des Suchraums Nachteile: Ungenauigkeiten durch verwendete Energiefunktion Benötigt relativ genaues Template Abhängig von der verwendeten Rotamer-Bibliothek 18 Protein Docking mit flexiblen Seitenketten Docking von rigiden Strukturen keine gute Lösung Problem des exponentiellen Wachstums des Konformationsraums bei flexiblen Seitenketten 19 Flexibilität Alle Residuen flexibel behandeln sehr aufwändig selbst bei Verwendung von RotamerBibliotheken Nur Interface-Residuen flexibel Interface benötigt Rigides Docking zur Erzeugung von Anfangsstrukturen 20 Rigides Docking Verwendet geometrische und einfache chemische Fitness Funktionen Von den erzeugten Komplexstrukturen wurden die 60 besten weiter verfolgt Oft große Überlappung der Proteine und inkorrekt platzierte Seitenketten 21 Bestimmung der Bindungsstelle Residuen, die innerhalb 6 Å eines Atoms des anderen Proteins liegen Seitenketten ohne Rotamere (CYS in Disulfidbrücken, ALA, GLY) werden nicht berücksichtigt 22 GMEC GMEC = Kombination der Rotamere, die die niedrigste Energie liefern [3] Anwendung des DEE-Theorems möglich 23 Suche nach der GMEC Zwei Strategien: Multi-Greedy Methode Branch-and-cut basierend auf einem ILP 24 Multi-Greedy Methode (I) Aufbau eines Enumerations-Baumes mit möglichen Kombinationen [3] 25 Integer Linear Program (ILP) Formulierung als Minimierungs-Problem auf einem ungerichteten Graphen Knoten v für alle Rotamere, E(v) = Etplir - Emax Kanten uv für Rotamer-Paare verschiedener Residuen, E(uv) = Epwir,js - Emax k-partiter Graph mit negativen Kanten- und KnotenGewichten GMEC entspricht Rotamer-Graph mit minimalem Gewicht 26 ILP (II) [3] [3] 27 Branch-and-cut Lösen der Relaxation des ILPs Falls Lösung ā nicht optimal, suche nach fa <= f0, die ā als mögliche Lösung ausschließt Falls keine Ungleichung gefunden wird, aufsplitten in zwei Unterprobleme 28 Energieberechnung Optimierung der GMEC mit AMBER Freie Bindungsenergie: [3] ΔGES: elektrostatischer Beitrag ΔGcav: freie Cavitäts-Energie in Wasser ΔGconf: Änderung der Entropie ΔGvdW: Änderung der freien van-der-Waals Energie 29 Algorithmus (I) Generierung von Ausgangsstrukturen mit Hilfe von rigidem Docking Bestimmung der Aminosäuren am Interface Variation dieser Aminosäuren durch Rotamere Iterative Anwendung des DEE Theorems zur Reduktion des Konformationsraumes 30 Algorithmus (II) Finden der GMEC mit Hilfe der schnellen Heuristic bzw. des exakten branch-and-cut Algorithmus Optimierung der Molekülgeometrien mit Hilfe eines Molekülmechanik Kraftfeldes Berechnung der freien Bindungsenergie 31 Resultate (I) Test mit drei Protein Komplexen Anwendung des DEE ergibt große Vereinfachung [3] 32 Resultate (II) [3] 33 Resultate (III) [3] 34 Resultate (IV) [3] 35 Vor- und Nachteile Vorteile: Heuristik liefert schnell gute Annäherung an optimale Lösung Branch-and-cut liefert optimale Rotamere Nachteile: Keine perfekte Trennung von guten und schlechten Ergebnissen Ergebnisse stark von der Wahl des Kraftfeldes abhängig 36 Zusammenfassung Rigides Docking nur erfolgreich, wenn native und Komplexstruktur sehr ähnlich sind Rigides Docking aber guter Startpunkt für flexibles Docking Dead-End elimination starke Vereinfachung bei flexiblem Docking 37 Referenzen [1] Katchalski-Katzir, E., Shariv, I., et al., (1992) PNAS, 89, 2195-2199. Molecular Surface Recognition: Determination of Geometric Fit between Proteins and their Ligands by Correlation Techniques [2] Desmet, J., De Maeyer, M., Hazes, B., and Lasters, I., (1992) Nature, 356, 539-542. DEE Theorem and its Use in Protein Side Chain Positioning [3] Althaus, E., Kohlbacher, O., Lenhof, H.-P., and Muller, P., (2002) J. Comput. Biol., 9, 597-612. A Combinatorial Approach to Protein Docking with Flexible Side Chains 38