Vorlesung Modellierung & Simulation 8. Informationssysteme

Werbung
14. Vorlesung
Simulation und Integration
Pathway Prediction
Pathways: Krankheiten und Medikamente
Vorlesung WS 06/07
Modellierung & Simulation
Überblick
Diskrete Simulatoren
Expertensystem / Brutlag
Replikation und Reparatursystem von E. Coli als Expertensystem.
Regelbasiertes System!
METABOLIKA
Regelsystem – Metabolische Regeln!
METANET / Michal Kohen
Graphentheorie!
Vorlesung
Modellierung & Simulation
8. Informationssysteme
Informationsfluss in einem Expertensystem:
Benutzer
Dialogkomponente
Dynamisches
Basismodell
Erklärungskomponente
Inferenzalgorithmus,
Externe
Kontrollstrategie
Wissensbasis
Wissensaquisition
Wissenspflege
Experte
Wissensingenieur
Expertensystem Brutlag
System – „erste“ KI-Anwendungen in der Molekularen Biologie.
Arbeitsbereich:
Replikation und Reparatur bei E. Coli
Idee: Das Wissen der Arbeitsgruppe
a) systematisch zusammentragen,
b) durch Wissen aus der Literatur anreichern und
c) durch Regeln formal erfassen.
Vorlesung
Modellierung & Simulation
8. Informationssysteme
Expertensystem Brutlag
System – „erste“ KI-Anwendungen in der Molekularen Biologie.
Parameter:
pH-Wert, Konzentrationen, Temperatur, ...
Regeln (If-then-else) operieren dann in diesen Wertebereichen.
Brutlag, Galper, Millis: Knowledge based simulation of DNA-metabolism: prediction of enzyme
action, CABIOS, 7, 9 - 19 (1991).
Vorlesung
Modellierung & Simulation
8. Informationssysteme
Die Simulation erlaubt die Aussage, ob
- das Enzym eine Aktion vollzieht
- und welche Pathways aktiviert werden?
KI-Methoden:
Das Produktionssystem besteht aus
- einer Menge von Regeln,
- einem Arbeitsspeicher und
- einer Kontrollstrategie.
Jede Regel ist durch eine IF-THEN-Form beschrieben.
Vorlesung
Modellierung & Simulation
8. Informationssysteme
Repräsentation des Wissens:
Kontrollstrategie:
Literatur:
FRAMES
Nächste anzuwendende Regel.
Breitensuche, Tiefensuche, etc.
Biologie = dynamisches Wissen, somit
- Komponente der Wissensrepräsentation / Schnittstelle
- Konsistenz der Wissensbasis sichern.
Benutzerschnittstelle – Idee: Sprache der Biochemiker (anlehnen).
Die Erklärungskomponente wurde integriert.
Vorlesung
Modellierung & Simulation
8. Informationssysteme
Der Brutlags Simulator unterstützt zwei verschiedene Modi:
a) Vorhersage
Der Benutzer gibt Fakten bezüglich eines experimentellen
Systems ein. Das System wird eventuell weitere Fakten
hinzufügen und Ergebnisse deduktiv erarbeiten.
b) Ableitungen
Ausgehend von einem Startzustand werden alle möglichen
Pathways berechnet.
Vorlesung
Modellierung & Simulation
8. Informationssysteme
Phenotype
Genotype
Metabolic
Pathways
Drugs
Influence
Food
Urea Cycle Systems Analysis
1 : 30.000 Geburten !
Key enzymes in regulation of urea cycle in cells.
CPS1: Carbamyl phosphate synthetase, EC 6.3.4.16;
OTC: Ornithine transcarbamylase, EC 2.1.3.3;
ASS: Argininosuccinate synthetase, EC 6.3.4.5;
ASL: Argininosuccinate lyase, EC 4.3.2.1;
ARG: Arginase, EC 3.5.3.1
Ramedis : Rare Metabolic Diseases Database
Web-basierte Datenbank und Publikationswerkzeug für seltene
Stoffwechselerkrankungen
-
Eingebettet in das Deutsche Humangenomprojekt (DHGP).
-
Weltweite Sammlung seltener Stoffwechselerkrankungen.
-
Speicherung einzelner Fälle in standardisierter Struktur.
-
Zugriff über http://www.ramedis.de.
Ramedis - Komponenten
Datenauswertung
Dateneingabe
(Java-Anwendung)
Oracle-DBS
(Web-Browser)
CBR-Zyklus
Dieser lässt sich abstrakt wie folgt beschreiben:
1. RETRIEVE:
Finden des ähnlichsten Falles.
2. REUSE:
Wiederverwenden der Information und
des Wissens aus diesem Fall, um das
Problem zu lösen.
3. RIVISE:
Überprüfen und Überarbeiten der
vorgeschlagenen Lösung.
4. RETAIN:
Aufbewahren der Teile dieser Erfahrung,
die wahrscheinlich für das Lösen späterer
Probleme nützlich sein werden.
Vorlesung
Modellierung & Simulation
8. Informationssysteme
Neuer Fall
Gelernter Fall
RETRIEVE
RETAIN
Fallbasis
Selektierter Fall
Geprüfter Fall
REVISE
REUSE
Gelöster Fall
Vorlesung
Modellierung & Simulation
8. Informationssysteme
Fall:
Problembeschreibung
Symptome mit Ausprägung und Laborwerte
Problemlösung
Diagnose oder Differentialdiagnose
Zusatz
Infos: Arzt und Krankengeschichte
Vorlesung
Modellierung & Simulation
8. Informationssysteme
Case Based Reasoning
Suchanfrage: Ähnlichsten Fall ermitteln
Eingabe (WEB Maske):
Geschlecht, Symptome (5) und Laborwerte (5) sowie ethnische
Herkunft
Case Retrieval (Vorauswahl notwendig)
Ramedis – Vorauswahl – partielle Gleichheit:
Wenn nur ein Symptom oder ein Laborwert übereinstimmt,
dann Aufnahme in die Vorauswahl vornehmen.
Vorlesung
Modellierung & Simulation
8. Informationssysteme
Fallbasiertes Suchen
Neuer Fall
Ähnliche Fälle
Urea Cycle Systems Analysis
gene therapy
Citrullinemia
Arginine
fumonisin B1
alpha-methyl-dl-aspartate
N3-(L-1-carboxy-2-nitroethyl)-L-arginine
saccharopine
Arginino Succinate
Inhibitor of
Geneactivation
6.3.4.5
(Argininosuccinate
Synthase)
Inhibitor of
Geneactivation
ASSGen
Activator
adenoviral mediated, problems
w ith immune response,
death person
IFN gamma
lipopolysaccharide
repressor of CAR1
Interleukin 13
dexamethasone
glucagon
C/EBPbeta
Activator
OTCGen
Inhibitors
2.1.3.3
(OTC)
"HNF-4alpha1",
"HNF-4alpha2",
"C/EBPalpha" and
"C/EBPbeta"
Eins M L Argininhydrochlorid, Germany
Polilevo® N Drg. Germany
ACTIVAROL S buv, France
Activital Tonikum,
ALITRAQ Pvo.
Argentina
Inhibitor of
Geneactivation
Interferone
gamma
repressor of CAR1
expression
BUF
Arginine
Arginase
-Gen
3.5.3.1
(Arginase)
Ornithine
Argininemia
Carbamoyl Phosphat
6.3.4.16
Carbamoylphosphate
synthase
CO 2
Drawn by Ralf Kaurt
ASLGen
Argininosuccinase
Deficiency
Aktivator
gene therapy
OTCDeficiency
4.3.2.1
(Argininosuccin
at-lyase)
glucocorticoids
actinomycin D
cycloheximide
Citrulline
N(delta)-(N'-sulfodiaminophosphinyl)-l-ornithine
alpha-methyl-substituted phosphonylphosphinates
N-(phosphonacetyl)-L-ornithine (PALO)
acivicin
N-(phosphonoacetyl)-L-aspartate (PALA)
adenine
cycloheximide
Alpha-difluoromethylornithine
phaseolotoxin
Urea
monoflurofumarate
diflurofumarate
N3-(L-1-carboxy-2-nitroethyl)-L-arginine
saccharopine
a-difluoromethylornithine (DFMO)
adenovirus
carrying
human ASS cDNA
Inhibitors
ANTOMIOPIC Grag., Spain
BIOTASSINA IM 10 F+10 F 3 ML, Italy
CARNITINE PLUS LIGNIS, Belgium
EPURAM, France
ORNITAINE Amp., Argentina
PERIFAZO S in FRANCE
Inhibitors
NH 4+
Adhealth, Australia
AMINOFUSIN HEPAR Sol. IV, Spain
AMINOPLASMAL 10% elektrolit,
CETORNAN, France
DYNAMIC-3 Amp. buvables 10 x, Belgium
EPURAM Cpr pell, France
GLUCOPLASMAL 3,5%, Hungary
Hair, Skin & Nails, Australia
HEPA-MERZ, Russia
IPOAZOTAL COMPLEX 50, Italy
Carbamoyl Synthase
Deficiency
Aktivator
IBMX
rolipram
prolactin
Inhibitors
N(G) hydroxyarginine
S-(2-boronoethyl)-L-cysteine (BEC)
L-ornithine
L-Valine
L-norvaline
N(omega)-hydroxy-nor-L-arginine
2(S)-amino-6-boronohexanoic acid
l-lysine
N omega-hydroxy-D,L-indospicine
4-hydroxyamidino-D,L-phenylalanine
(+)-S-2-amino-6iodoacetamidohexanoic acid
(+)-S-2-amino-5iodoacetamidopentanoic acid
L-canavanine
L-homoarginine
L-argininamide
leucine
isoleucine
proline
threonine
R1D81
R2D19
a-difluoromethylornithine (DFMO)
• XML Format für metabolische Netzwerke.
E
S===>P
k·S
• Ermöglicht den Datenaustausch zwischen
Datenbanken, Simulatoren und PetriNetzen.
???
S
p1
E
p3
t1
k·S
• Realisierung:
• SBML (BioSpice, DBsolve, Gepasi,
Jarnac, Ecell, StochSim, VirtualCell)
P
p2
• PNML (CPN, RENEW, PNK2…)
In Silico Prediction of Metabolic Pathways
Remote database layer
XMLs
MARG
Bench
XSLT
XSLT
XSLT
XMLs
Client layer
WWW
CellML
Other bio-simulators
BioPNML
literatures
...
Other appl.
Petri Net Modeling & Simulation Other purposes
Urea Cycle Systems Analysis
Problems
PATHWAY PREDICTION
1. Gegeben sei ein rudimentärer Pathway (Gene,
Sequenzen, Enzyme and Metabolite). Wie können
wir vollständige metabolische Netzwerke
vorhersagen?
2. Gegeben seien zwei oder mehr metabolische
Neztwerke. Wie können wir die Ähnlichkeit
(Homologie) berechnen?
PathAligner – um diese Probleme zu lösen.
Vorlesung
Modellierung & Simulation
Pathway Prediction
Wet-Lab
Data
Genome
Database
Proteome
Database
Reaction
Database
Disease
Database
Chem./Drug
Database
...
Internet
verification
Information
Retrieval
System
Client
Petri net editor
Data modification
Petri net modeling
& simulation
Other bio-simulators
Xml/BioPNML
Petri net parser
Other applications
Hierarchical solver
NAE/ODE’s solver
Bifurcation analyzer
Datafile storage
Dynamic graph
Simulation result
Petri net processor
Other functions
//apogonidae.techfak.uni-bielefeld.de/mchen/pathaligner/
Bielefelder
Bioinformatic
Server
Bielefelder
Bioinformatic
Server
Bielefelder
Bioinformatic
Server
Alignment
Betrachten wir eine Folge von Buchstaben:
METBOLIWAY und TABOLIXYZ.
Ein gutes Alginment könnte sein:
MET-BOLIWAY
| | ||
|
TABOLI-XYZ
Unser Ansatz: successive enzymatic reactions alignment
Vorlesung
Modellierung & Simulation
Pathway Prediction
•
•
•
•
•
•
•
Horowitz, 1945: Retrograde evolution, Sequential “disappearance” of key intermediary
metabolites induces the recruitment of similar available substrates via new enzymes.
Jensen, 1976: Substrate ambiguity, Enzyme recruitment from a pool of ancestral
enzymes with basic functions and substrate ambiguity. Ordered regulated pathways
envolved from these ancestral enzymes by gene duplication, followed by increased
specialisation.
Huynen, Dandekar and Bork (1999)
– Citric acid cycle
– Trends in Microbiology (1999)
Dandekar, Schuster, Snel, Huynen and Bork (1999)
– Glycolysis
– Biochemical Journal (1999)
Cordwell
– Glycolysis, pentose phosphate pathway, tricarboxylic acid cycle
– Archives in Microbiology (1999)
Y. Tohsato et al. (2000) proposed a multiple (local) alignment algorithm utilizing
information content that is extended to symbols having a hierarchical structure.
Forst, C.V. (2001) combined sequence information of involved genes with information
of corresponding network.
Vorlesung
Modellierung & Simulation
Pathway Prediction
Definition
Sei S eine endliche Menge von EC Nummern.
S* ist ein pathway (e1e2..en)
Länge von E is |E|.
Empty string (EC Nummer) ist .
Vorlesung
Modellierung & Simulation
Pathway Prediction
Alignment
Seien
P1=p1p2…pm und P2=p1’p2’…pn’
beliebige metabolic pathways.
Ein Alignment von P1 und P2 ist eine Sequenz
(11,…,hh)
von Edit-Operationen, so dass
P1’=1,…,h und P2’ = 1,…, h.
Edit-Operation
Die Edit-Operation ist ein geordnetes Paar
(,)  (  {})(  {})\{(,)}
Eine Edit-Operation (,) wird geschrieben als .
Es gibt drei verschiedene Edit-Operationen:

deletion von 

insertion von 

replacement von  durch 
Bemerkung:  ist nicht möglich.
Notation
Das Alignment
A = (2.4.2.32.4.2.4, 3.5.4.5, 3.1.3.53.1.3.5, 2.7.4.9)
der Pathways
e2.4.2.3e3.5.4.5e3.1.3.5 und e2.4.2.4e3.1.3.5e2.7.4.9
kann wie folgt geschrieben werden:
 
 2.4.2.3 3.5.4.5 3.1.3.5



3.1.3.5 2.7.4.9 
 2.4.2.4
Vorlesung
Modellierung & Simulation
Pathway Prediction
Similarity function 
 weist jeder Edit-Operation eine positive reelle Zahl zu.
 (,) und  (,) der Edit-Operation (,) und (,) ist 0.
Für alle edit operations (,) mit
, , say,  = d1.d2.d3.d4 und =d1’.d2’.d3’.d4’,
 (,) :

0, if (d1 d1’);
0.25, if (d1=d1’ and d2 d2’);
(,)= 0.5, if (d1=d1’ and d2=d2’ and d3 d3’);
0.75, if (d1=d1’ and d2=d2’ and d3= d3’ and d4  d4’);
1, if (d1=d1’ and d2=d2’ and d3= d3’ and d4 = d4’ i.e. =).
Vorlesung
Modellierung & Simulation
Pathway Prediction
Similarity
 (A) von A=(11,…,hh) ist die Summe aller Werte der
beteiligten Edit-Operationen:
h
 ( A)    ( i   i )
i 1
(E1,E2)=1/4(0.75+0+1+0.75)=0.625
Herunterladen