14. Vorlesung Simulation und Integration Pathway Prediction Pathways: Krankheiten und Medikamente Vorlesung WS 06/07 Modellierung & Simulation Überblick Diskrete Simulatoren Expertensystem / Brutlag Replikation und Reparatursystem von E. Coli als Expertensystem. Regelbasiertes System! METABOLIKA Regelsystem – Metabolische Regeln! METANET / Michal Kohen Graphentheorie! Vorlesung Modellierung & Simulation 8. Informationssysteme Informationsfluss in einem Expertensystem: Benutzer Dialogkomponente Dynamisches Basismodell Erklärungskomponente Inferenzalgorithmus, Externe Kontrollstrategie Wissensbasis Wissensaquisition Wissenspflege Experte Wissensingenieur Expertensystem Brutlag System – „erste“ KI-Anwendungen in der Molekularen Biologie. Arbeitsbereich: Replikation und Reparatur bei E. Coli Idee: Das Wissen der Arbeitsgruppe a) systematisch zusammentragen, b) durch Wissen aus der Literatur anreichern und c) durch Regeln formal erfassen. Vorlesung Modellierung & Simulation 8. Informationssysteme Expertensystem Brutlag System – „erste“ KI-Anwendungen in der Molekularen Biologie. Parameter: pH-Wert, Konzentrationen, Temperatur, ... Regeln (If-then-else) operieren dann in diesen Wertebereichen. Brutlag, Galper, Millis: Knowledge based simulation of DNA-metabolism: prediction of enzyme action, CABIOS, 7, 9 - 19 (1991). Vorlesung Modellierung & Simulation 8. Informationssysteme Die Simulation erlaubt die Aussage, ob - das Enzym eine Aktion vollzieht - und welche Pathways aktiviert werden? KI-Methoden: Das Produktionssystem besteht aus - einer Menge von Regeln, - einem Arbeitsspeicher und - einer Kontrollstrategie. Jede Regel ist durch eine IF-THEN-Form beschrieben. Vorlesung Modellierung & Simulation 8. Informationssysteme Repräsentation des Wissens: Kontrollstrategie: Literatur: FRAMES Nächste anzuwendende Regel. Breitensuche, Tiefensuche, etc. Biologie = dynamisches Wissen, somit - Komponente der Wissensrepräsentation / Schnittstelle - Konsistenz der Wissensbasis sichern. Benutzerschnittstelle – Idee: Sprache der Biochemiker (anlehnen). Die Erklärungskomponente wurde integriert. Vorlesung Modellierung & Simulation 8. Informationssysteme Der Brutlags Simulator unterstützt zwei verschiedene Modi: a) Vorhersage Der Benutzer gibt Fakten bezüglich eines experimentellen Systems ein. Das System wird eventuell weitere Fakten hinzufügen und Ergebnisse deduktiv erarbeiten. b) Ableitungen Ausgehend von einem Startzustand werden alle möglichen Pathways berechnet. Vorlesung Modellierung & Simulation 8. Informationssysteme Phenotype Genotype Metabolic Pathways Drugs Influence Food Urea Cycle Systems Analysis 1 : 30.000 Geburten ! Key enzymes in regulation of urea cycle in cells. CPS1: Carbamyl phosphate synthetase, EC 6.3.4.16; OTC: Ornithine transcarbamylase, EC 2.1.3.3; ASS: Argininosuccinate synthetase, EC 6.3.4.5; ASL: Argininosuccinate lyase, EC 4.3.2.1; ARG: Arginase, EC 3.5.3.1 Ramedis : Rare Metabolic Diseases Database Web-basierte Datenbank und Publikationswerkzeug für seltene Stoffwechselerkrankungen - Eingebettet in das Deutsche Humangenomprojekt (DHGP). - Weltweite Sammlung seltener Stoffwechselerkrankungen. - Speicherung einzelner Fälle in standardisierter Struktur. - Zugriff über http://www.ramedis.de. Ramedis - Komponenten Datenauswertung Dateneingabe (Java-Anwendung) Oracle-DBS (Web-Browser) CBR-Zyklus Dieser lässt sich abstrakt wie folgt beschreiben: 1. RETRIEVE: Finden des ähnlichsten Falles. 2. REUSE: Wiederverwenden der Information und des Wissens aus diesem Fall, um das Problem zu lösen. 3. RIVISE: Überprüfen und Überarbeiten der vorgeschlagenen Lösung. 4. RETAIN: Aufbewahren der Teile dieser Erfahrung, die wahrscheinlich für das Lösen späterer Probleme nützlich sein werden. Vorlesung Modellierung & Simulation 8. Informationssysteme Neuer Fall Gelernter Fall RETRIEVE RETAIN Fallbasis Selektierter Fall Geprüfter Fall REVISE REUSE Gelöster Fall Vorlesung Modellierung & Simulation 8. Informationssysteme Fall: Problembeschreibung Symptome mit Ausprägung und Laborwerte Problemlösung Diagnose oder Differentialdiagnose Zusatz Infos: Arzt und Krankengeschichte Vorlesung Modellierung & Simulation 8. Informationssysteme Case Based Reasoning Suchanfrage: Ähnlichsten Fall ermitteln Eingabe (WEB Maske): Geschlecht, Symptome (5) und Laborwerte (5) sowie ethnische Herkunft Case Retrieval (Vorauswahl notwendig) Ramedis – Vorauswahl – partielle Gleichheit: Wenn nur ein Symptom oder ein Laborwert übereinstimmt, dann Aufnahme in die Vorauswahl vornehmen. Vorlesung Modellierung & Simulation 8. Informationssysteme Fallbasiertes Suchen Neuer Fall Ähnliche Fälle Urea Cycle Systems Analysis gene therapy Citrullinemia Arginine fumonisin B1 alpha-methyl-dl-aspartate N3-(L-1-carboxy-2-nitroethyl)-L-arginine saccharopine Arginino Succinate Inhibitor of Geneactivation 6.3.4.5 (Argininosuccinate Synthase) Inhibitor of Geneactivation ASSGen Activator adenoviral mediated, problems w ith immune response, death person IFN gamma lipopolysaccharide repressor of CAR1 Interleukin 13 dexamethasone glucagon C/EBPbeta Activator OTCGen Inhibitors 2.1.3.3 (OTC) "HNF-4alpha1", "HNF-4alpha2", "C/EBPalpha" and "C/EBPbeta" Eins M L Argininhydrochlorid, Germany Polilevo® N Drg. Germany ACTIVAROL S buv, France Activital Tonikum, ALITRAQ Pvo. Argentina Inhibitor of Geneactivation Interferone gamma repressor of CAR1 expression BUF Arginine Arginase -Gen 3.5.3.1 (Arginase) Ornithine Argininemia Carbamoyl Phosphat 6.3.4.16 Carbamoylphosphate synthase CO 2 Drawn by Ralf Kaurt ASLGen Argininosuccinase Deficiency Aktivator gene therapy OTCDeficiency 4.3.2.1 (Argininosuccin at-lyase) glucocorticoids actinomycin D cycloheximide Citrulline N(delta)-(N'-sulfodiaminophosphinyl)-l-ornithine alpha-methyl-substituted phosphonylphosphinates N-(phosphonacetyl)-L-ornithine (PALO) acivicin N-(phosphonoacetyl)-L-aspartate (PALA) adenine cycloheximide Alpha-difluoromethylornithine phaseolotoxin Urea monoflurofumarate diflurofumarate N3-(L-1-carboxy-2-nitroethyl)-L-arginine saccharopine a-difluoromethylornithine (DFMO) adenovirus carrying human ASS cDNA Inhibitors ANTOMIOPIC Grag., Spain BIOTASSINA IM 10 F+10 F 3 ML, Italy CARNITINE PLUS LIGNIS, Belgium EPURAM, France ORNITAINE Amp., Argentina PERIFAZO S in FRANCE Inhibitors NH 4+ Adhealth, Australia AMINOFUSIN HEPAR Sol. IV, Spain AMINOPLASMAL 10% elektrolit, CETORNAN, France DYNAMIC-3 Amp. buvables 10 x, Belgium EPURAM Cpr pell, France GLUCOPLASMAL 3,5%, Hungary Hair, Skin & Nails, Australia HEPA-MERZ, Russia IPOAZOTAL COMPLEX 50, Italy Carbamoyl Synthase Deficiency Aktivator IBMX rolipram prolactin Inhibitors N(G) hydroxyarginine S-(2-boronoethyl)-L-cysteine (BEC) L-ornithine L-Valine L-norvaline N(omega)-hydroxy-nor-L-arginine 2(S)-amino-6-boronohexanoic acid l-lysine N omega-hydroxy-D,L-indospicine 4-hydroxyamidino-D,L-phenylalanine (+)-S-2-amino-6iodoacetamidohexanoic acid (+)-S-2-amino-5iodoacetamidopentanoic acid L-canavanine L-homoarginine L-argininamide leucine isoleucine proline threonine R1D81 R2D19 a-difluoromethylornithine (DFMO) • XML Format für metabolische Netzwerke. E S===>P k·S • Ermöglicht den Datenaustausch zwischen Datenbanken, Simulatoren und PetriNetzen. ??? S p1 E p3 t1 k·S • Realisierung: • SBML (BioSpice, DBsolve, Gepasi, Jarnac, Ecell, StochSim, VirtualCell) P p2 • PNML (CPN, RENEW, PNK2…) In Silico Prediction of Metabolic Pathways Remote database layer XMLs MARG Bench XSLT XSLT XSLT XMLs Client layer WWW CellML Other bio-simulators BioPNML literatures ... Other appl. Petri Net Modeling & Simulation Other purposes Urea Cycle Systems Analysis Problems PATHWAY PREDICTION 1. Gegeben sei ein rudimentärer Pathway (Gene, Sequenzen, Enzyme and Metabolite). Wie können wir vollständige metabolische Netzwerke vorhersagen? 2. Gegeben seien zwei oder mehr metabolische Neztwerke. Wie können wir die Ähnlichkeit (Homologie) berechnen? PathAligner – um diese Probleme zu lösen. Vorlesung Modellierung & Simulation Pathway Prediction Wet-Lab Data Genome Database Proteome Database Reaction Database Disease Database Chem./Drug Database ... Internet verification Information Retrieval System Client Petri net editor Data modification Petri net modeling & simulation Other bio-simulators Xml/BioPNML Petri net parser Other applications Hierarchical solver NAE/ODE’s solver Bifurcation analyzer Datafile storage Dynamic graph Simulation result Petri net processor Other functions //apogonidae.techfak.uni-bielefeld.de/mchen/pathaligner/ Bielefelder Bioinformatic Server Bielefelder Bioinformatic Server Bielefelder Bioinformatic Server Alignment Betrachten wir eine Folge von Buchstaben: METBOLIWAY und TABOLIXYZ. Ein gutes Alginment könnte sein: MET-BOLIWAY | | || | TABOLI-XYZ Unser Ansatz: successive enzymatic reactions alignment Vorlesung Modellierung & Simulation Pathway Prediction • • • • • • • Horowitz, 1945: Retrograde evolution, Sequential “disappearance” of key intermediary metabolites induces the recruitment of similar available substrates via new enzymes. Jensen, 1976: Substrate ambiguity, Enzyme recruitment from a pool of ancestral enzymes with basic functions and substrate ambiguity. Ordered regulated pathways envolved from these ancestral enzymes by gene duplication, followed by increased specialisation. Huynen, Dandekar and Bork (1999) – Citric acid cycle – Trends in Microbiology (1999) Dandekar, Schuster, Snel, Huynen and Bork (1999) – Glycolysis – Biochemical Journal (1999) Cordwell – Glycolysis, pentose phosphate pathway, tricarboxylic acid cycle – Archives in Microbiology (1999) Y. Tohsato et al. (2000) proposed a multiple (local) alignment algorithm utilizing information content that is extended to symbols having a hierarchical structure. Forst, C.V. (2001) combined sequence information of involved genes with information of corresponding network. Vorlesung Modellierung & Simulation Pathway Prediction Definition Sei S eine endliche Menge von EC Nummern. S* ist ein pathway (e1e2..en) Länge von E is |E|. Empty string (EC Nummer) ist . Vorlesung Modellierung & Simulation Pathway Prediction Alignment Seien P1=p1p2…pm und P2=p1’p2’…pn’ beliebige metabolic pathways. Ein Alignment von P1 und P2 ist eine Sequenz (11,…,hh) von Edit-Operationen, so dass P1’=1,…,h und P2’ = 1,…, h. Edit-Operation Die Edit-Operation ist ein geordnetes Paar (,) ( {})( {})\{(,)} Eine Edit-Operation (,) wird geschrieben als . Es gibt drei verschiedene Edit-Operationen: deletion von insertion von replacement von durch Bemerkung: ist nicht möglich. Notation Das Alignment A = (2.4.2.32.4.2.4, 3.5.4.5, 3.1.3.53.1.3.5, 2.7.4.9) der Pathways e2.4.2.3e3.5.4.5e3.1.3.5 und e2.4.2.4e3.1.3.5e2.7.4.9 kann wie folgt geschrieben werden: 2.4.2.3 3.5.4.5 3.1.3.5 3.1.3.5 2.7.4.9 2.4.2.4 Vorlesung Modellierung & Simulation Pathway Prediction Similarity function weist jeder Edit-Operation eine positive reelle Zahl zu. (,) und (,) der Edit-Operation (,) und (,) ist 0. Für alle edit operations (,) mit , , say, = d1.d2.d3.d4 und =d1’.d2’.d3’.d4’, (,) : 0, if (d1 d1’); 0.25, if (d1=d1’ and d2 d2’); (,)= 0.5, if (d1=d1’ and d2=d2’ and d3 d3’); 0.75, if (d1=d1’ and d2=d2’ and d3= d3’ and d4 d4’); 1, if (d1=d1’ and d2=d2’ and d3= d3’ and d4 = d4’ i.e. =). Vorlesung Modellierung & Simulation Pathway Prediction Similarity (A) von A=(11,…,hh) ist die Summe aller Werte der beteiligten Edit-Operationen: h ( A) ( i i ) i 1 (E1,E2)=1/4(0.75+0+1+0.75)=0.625