2. Vorlesung SS 07 Motivation Informationsverarbeitung Biologie / Medizin / Medizinische Informatik Grundlagen: Datenbanken und Informationssysteme Vorlesung SS 07 Biomedizinische Informationssysteme INHALTE Medizin 1 Die Wissenschaft von der Krankheitsursache, der Heilung und Vorbeugung von Krankheiten. Medizinische Informatik (Trampisch) Mittels Methoden und Werkzeuge der Informatik sollen Struktur und Wirkungsweise der informationsverarbeitenden Systeme in der Medizin analysiert werden. Hier stehen die Komponenten im Bereich der Gesundheitsversorgung im Mittelpunkt. Es werden Methoden aus der Mathematik (Statistik, usw.), der Informatik, der Linguistik und der Biometrie eingesetzt. Vorlesung Biomedizinische Informationssysteme MOTIVATION Kernpunkte: 2 Automatisierte Datenerfassung und Auswertung: Uninterpretierte Präsentation von Daten, wie z.B. EKG, CT, Labor, Intensiv-Pflege-Überwachung. Elektronische Datenhaltung: Chipkarte und elektronische Krankenakte. Informations-Anwendungen: Interpretierte, sinnvermittelnde Daten, wie z.B. die elektronische Krankenakte. Wissensverarbeitung: Erste Systeme in der Anwendung. Vorlesung Biomedizinische Informationssysteme MOTIVATION 3 American Medical Association (AMA) Medizinische Informatik ist eine Disziplin, die mit der Hilfe von Computern und Netzwerken versucht, Informationen zur Unterstützung der Pflege, der biomedizinischen Forschung und der Lehre bereitzustellen. Die Anwendungen werden in vier Gruppen eingeteilt: (1) Speichern / Wiederfinden (Retrieval) von Informationen, (2) Kommunikation, (3) Aus- und Weiterbildung in der Medizin und (4) entscheidungsunterstützende Systeme in der Medizin. Vorlesung Biomedizinische Informationssysteme MOTIVATION 4 Topics der Medizinischen Informatik - Medizinische Terminologie. - Das Gesundheitsversorgungssystem der BRD. - Medizinische Physik und Biophysik: Tomographie, Mikroskopie, Chromatographie, ... - Bild- und Signalverarbeitung in der Medizin / Biologie: Schnittbilder, Mikroskopie, Laborsysteme, … Vorlesung Biomedizinische Informationssysteme MOTIVATION 5 Topics der Medizinischen Informatik - Krankenhauskommunikations- und -informationssysteme: KKIS, Kommunikationssysteme, Datenbanken, Archivsysteme, Workflow-Modelle, BWL. - Wissensbasierte Systeme. - Laborinformationssysteme. - Bioinformatik dynamischer Systeme. Vorlesung Biomedizinische Informationssysteme MOTIVATION 6 Grundlegende Begriffe Krankheit (im engeren Sinn) Bezeichnet das Vorhandensein von subjektiv Empfindungen bzw. objektiv feststellbaren körperlichen, geistigen bzw. seelischen Veränderungen bzw. Störungen. Symptome Krankheitszeichen, so dass man auch die pathologischen Befunde unter diesen Begriff fassen kann. Deshalb wird von Symptomen gesprochen, obwohl man Symptome und Befunde meint. Vorlesung Biomedizinische Informationssysteme BEGRIFFE 7 Diagnose Die Krankheit erkennen / benennen. Differentialdiagnose Ähnliche Krankheitsbilder unterscheiden. Um eine Krankheit erkennen zu können - Diagnostik: Direkte und indirekte Verfahren - es fallen Daten an. Vorlesung Biomedizinische Informationssysteme BEGRIFFE Informationsquellen für die Diagnose (klassisch): 8 - Anamnese, - Untersuchungsbefunde und - Krankheitsverlauf. Das Krankheitsbild eines Patienten: - Symptome und - pathologische Befunde. Vorlesung Eine Reihe von möglichen Krankheiten (Hypothesenfokus), die diese Symptome erklären können. Biomedizinische Informationssysteme BEGRIFFE 9 Induktion Der Schluss von den Symptomen auf die Krankheiten. 1. Eine der Hypothesen als bestmögliche ansehen. 2. Ableiten, welche weiteren Symptome vorliegen müssten. Dieser Schritt heißt Deduktion! Vorlesung Biomedizinische Informationssysteme BEGRIFFE 10 Therapie Die Behandlung einer Krankheit, die symptomatisch oder kausal sein kann. Medikamente, Operationen, Bestrahlung, etc. Therapeutische Entscheidungen Auf jeder Stufe der Diagnostik kann Therapie erforderlich werden. Vorlesung Biomedizinische Informationssysteme BEGRIFFE 11 Der therapeutischer Entscheidungsprozeß umfasst: 1. Auswahl einer Therapie, 2. Planung und 3. Überwachung. Vorlesung Biomedizinische Informationssysteme BEGRIFFE Molekulare Medizin (Biomedizin) 12 Anwendung der Methoden der Molekularen Biologie im Bereich der Diagnose (z. B. diagnostische Chips) und Therapie (z. B. Gentherapie). Gendefekte / Mutationen Die Biosynthesekette ist unterbrochen, was mehr oder weniger starke Auswirkung auf den Metabolismus hat. Die Reparaturenzyme sind defekt. Die RNA-Moleküle sind defekt. usw. Vorlesung Biomedizinische Informationssysteme BEGRIFFE Molekulare Medizin (Biomedizin) 13 Modelle der Genregulation Grundlegend: Jacob und Monod Modell der Regulation. Britton-Davidson Modell: Klasse der abstrakten Modelle. Abstrakte Modelle: Kauffmans binäres Automatensystem und die logische Repräsentation der metabolischen Netzwerke von Thomas. Vorlesung Biomedizinische Informationssysteme BEGRIFFE 14 METABOLISCHE WIRKNETZE Der Metabolismus umfasst die biochemischen Prozesse einer Zelle: Biosynthese, Proteinsynthese sowie Zellkommunikation. Darüber hinaus docking, um z.B. Gene zu aktivieren, Biosynthesen zu realisieren oder Induktor-Rezeptor Bindungen darzustellen. Vorlesung Biomedizinische Informationssysteme BEGRIFFE 15 METABOLISCHE WIRKNETZE Biosynthese: Enzymatisch gesteuerte biochemische Reaktionen im Metabolismus. Bedingen solche Übergänge einander, so spricht man von metabolic pathways. Enzym: Vorlesung Ein Protein mit der Eigenschaft, biochemische Prozesse zu katalysieren und unverändert aus dieser Reaktion hervorzugehen. Biomedizinische Informationssysteme BEGRIFFE 16 Stoffwechselerkrankungen Erbliche Erkrankungen, deren Symptome durch einen biochemischen Defekt im Stoffwechsel des Organismus verursacht werden. Die Symptome können in ihrer Ausprägung sehr variabel sein. Häufig treten sie innerhalb der ersten Lebenstage des Neugeborenen auf. Therapie Viele dieser Erkrankungen können durch eine diätetische Therapie behandelt werden. Dabei werden z.B. die Substanzen vermieden, die vom Organismus nicht abgebaut werden können, oder alternative Stoffwechselwege werden medikamentös unterstützt. Vorlesung Biomedizinische Informationssysteme BEGRIFFE Biochemische Reaktionsketten: Michal 2007 Bekannt sind u.a. der Zitronensäurezyklus oder der Harnstoffzyklus. 17 18 Phänotype Genotyp Ramedis EMBL OMIM TRANSFAC ... METAGENE Metabolic ... Pathways Influence Drugs KEGG ASDB WIT RListe ... ... Relevante Datenbanken 19 Grundlegende Definitionen Datenbank: Eine Datensammlung, die Fakten über Anwendungen eines modellierten Ausschnittes der Realwelt repräsentiert, die dauerhaft (persistent) und weitgehend redundanzfrei gespeichert wird. Datenbank-Management-System (DBMS): Eine Sammlung von Programmen, die das anwendungsabhängige Erzeugen, Ändern und Löschen einer Datenbank ermöglicht. Vorlesung Biomedizinische Informationssysteme GRUNDLAGEN 20 Datenbanksystem: Kombination eines Datenbank-Management-Systems mit einer oder mehreren, unterscheidbaren Datenbanken. Die Abfrage der Daten - Abfragesprache z.B. die Structured Query Language (SQL). Vorlesung Biomedizinische Informationssysteme GRUNDLAGEN 21 Datenbanksystem Anforderungen an Datenbanksysteme / Codd’schen Regeln: 1. Operationen: Speichern, ändern und suchen. 2. Benutzersichten: Zugriffe auf Datenbankbeschreibungen. 3. Benutzersichten: Nutzerspezifische Auswahl der Daten. 4. Integration: Einheitliche und nichtredundante Datenverwaltung. 5. Konsistenzüberwachung: Korrektheit des Datenbestandes. 6. Datenschutz: Ausschluss unautorisierter Zugriffe. 7. Transaktionen: Mehrere Datenbank-Operationen als funktionelle Einheit. 8. Synchronisation: Parallele Transaktionen koordinieren. 9. Datensicherung: Widerherstellung von Daten und Systemfehlern. Vorlesung Biomedizinische Informationssysteme GRUNDLAGEN 22 Informationssystem (IS): Ein komplexes, zusammengesetztes Softwaresystem mit aufeinander bezogenen informationsverarbeitenden Komponenten. Diese können in Erzeugung, Speicherung, Umformung, Transport und Darstellung gegliedert werden. In der Biomedizin werden die Begriffe Informationssystem und Datenbank häufig synonym verwendet. Vorlesung Biomedizinische Informationssysteme GRUNDLAGEN Nutzer ....... Nutzer Externe DB WWW Anwendungssoftware Schnittstelle/Integration ... DB Aufbau eines Informationssystems I N T E R F A C E 24 Informationssystem (IS) Eigenschaften eines IS:: - Realisiert eine dauerhafte (persistente) Speicherung von Daten. Dabei ist eine Datenbank oder ein Datenbanksystem Bestandteil eines Informationssystems. - Wertet die gespeicherten Daten anwendungsspezifisch aus. - Ist durch Anpassung und Erweiterung dynamisch. - Integriert weitere (externe) Informationsquellen. Vorlesung Biomedizinische Informationssysteme GRUNDLAGEN 25 Datenquelle Sie besteht aus mindestens einem Computer, auf dem Daten gespeichert werden können und auf die über Schnittstellen zugegriffen werden kann. Die Datenquelle ist immer autonom verfügbar. Demgegenüber ist eine Datenbank immer im Kontext mit einem Datenbanksystem zu sehen. Vorlesung Biomedizinische Informationssysteme GRUNDLAGEN 26 Flat-File Eine Datei, die eine bestimmte, implizite Struktur besitzt. Ist ein Flat-File auf einem Rechner verfügbar, so wird diese Kombination auch als Datenquelle verstanden. Ein Flat-File besteht aus verschiedenen Zeilen, in denen Daten häufig in ASCII-Format enthalten sind. Beispiel: Ausschnitt aus der Flat-File Datenbank KEGG: Vorlesung Biomedizinische Informationssysteme GRUNDLAGEN ENTRY EC 2.1.3.3 NAME Ornithine carbamoyltransferase 27 Citrulline phospharylase Ornithine transcarbamylase CLASS Transferases Transferring one-carbon groups Carboxyl- and carbamoyltransferases SYSNAME Carbamoyl-phosphate: L-ornithine carbamoyltransferase ... Das Zeilenende ist durch bestimmte Zeichen gekennzeichnet (in der Regel Enter). Die Trennsymbole (z.B. Sonderzeichen) zur Unterscheidung der Daten innerhalb einer Zeile. Auch eine Unterscheidung innerhalb der Zeile ist möglich, wie in unserem Beispiel dargestellt. So sind auf der linken Seite Schlüsselwörter wie z.B. ENTRY, NAME und SYSNAME zu erkennen. Vorlesung Biomedizinische Informationssysteme GRUNDLAGEN 28 Eine Datenbank soll auch die Redundanzfreiheit sicherstellen. Von einer Datenquelle ist dies nicht zu fordern! Datenintegration Redundanzfreie und einheitliche Verwaltung aller von Anwendungen bzw. von Anwendern benötigten Daten. Weiteres Ziel: Vorlesung Die Zusammenführung von Informationen, die verteilt in Datenquellen vorliegen. Biomedizinische Informationssysteme GRUNDLAGEN 29 Noch größere Anforderungen an die Zusammenführung von Daten bzw. Informationen stellt die Informationsfusion. Informationsfusion Ein Prozess, dessen Aufgabe es ist, Daten oder Informationen aus verschiedenen, zum Teil heterogenen Datenquellen zu kombinieren, zu verdichten, zu interpretieren und daraus Informationen einer neuen Qualität abzuleiten. Vorlesung Biomedizinische Informationssysteme GRUNDLAGEN Grundlegend für Biomedizinische Informationssysteme ist die Integration spezifischer Datenquellen. Die Entwicklung von komplexen Informationssystemen, die über Internet global zugreifbar sind und letztlich eine multidimensionale Datenbank umfassen, die durch Analysealgorithmen gezielt ergänzt wird. Die Integration der relevanten Datenquellen und Analysetools. Grundlegend für unsere Fragestellungen sind die Datenbanken, die die metabolischen Prozesse repräsentieren. Vorlesung Biomedizinische Informationssysteme GRUNDLAGEN 30 BioMed-Informationssysteme 31 1. Elektronische Netzwerke – Fragestellungen direkt im Expertenkreis diskutieren. BIONET-Netzwerk! 2. Erfassen der Datenbestände (Datenbanken) Kann in vielen Bereichen weitgehend automatisiert werden: Sequenzierung, Proteomics, Laborwertbestimmung, usw. 3. Elektronische Datenhaltung erlaubt über Internet den weltweiten direkten Zugriff (Informationssysteme aufbauen). Datenbankabfragesprachen ermöglichen auch erste Methoden der Datenanalyse. Vorlesung Biomedizinische Informationssysteme GRUNDLAGEN Modellentwicklung auf der Basis dieser BioMed-Daten führt direkt auch zur Implementation hypothetischer Welten. Modellierung und Simulation! Informationssystem im Internet – Kennzeichen: 1. Die persistente Speicherung von Daten. 2. Die Möglichkeit der Datenabfrage. 3. Die Auswertung und die Analyse der Daten. 4. Die Einhaltung der Integritätsbedingungen. 5. Die Integration externer Datenquellen. 6. Die Existenz einer Benutzerschnittstelle. 7. Die Möglichkeit der verteilten Modellierung. Vorlesung Biomedizinische Informationssysteme GRUNDLAGEN 32 Dateibasierte Informationssysteme 33 Oft dateibasierte Datenhaltungssysteme, in denen die Daten bereits in HTML-Dateien oder anderen strukturierten Dateien gespeichert sind. Eine Datenunabhängigkeit ist hier nicht gegeben. Die Systeme dienen nur der Repräsentation der Daten, die durch Nutzung des Internets und seiner Dienste erfolgt. Die Änderungen der Datenbestände werden nur von ausgewählten Personen vorgenommen. Zugriff: HTML-Browser. Die Zugriffszeiten sind von der Netzauslastung abhängig. Navigierender Zugriff (Angabe URL). Vorlesung Biomedizinische Informationssysteme GRUNDLAGEN Internet-Schnittstelle 34 CGI-Schnittstellen und Mechanismen aus der Java-Welt wie Servlets oder Applets. Dadurch ist eine komplexe Verarbeitung und Darstellung von Daten möglich. Lokale Installation eines Systems Über das Internet erreichbar - einige Systeme bieten die Möglichkeit eine komplette oder partielle Kopie auf einem lokalen Rechner zu installieren. Vorlesung Biomedizinische Informationssysteme GRUNDLAGEN Verteilte Informationssysteme 35 Hauptaufgabe: Das Zusammenführen von räumlich getrennt gespeicherten aber logisch teilweise zusammengehörenden Daten. Der Zugriff von verschiedenen Rechnern auf verteilte Datenbestände. Klassifikation: Zentrale, verteilte und Multidatenbanksysteme Zentrale DBS: Klassische Systeme - DMBS und Datenbank. Verteilte DBS: Einem DBMS - der Datenbestand ist hier auf mehrere Rechner verteilt. MultiDBsystem: Verbund von mehreren Datenbanksystemen, die jeweils ihr eigenes DBMS besitzen. Vorlesung Biomedizinische Informationssysteme GRUNDLAGEN Datawarehouse 36 Die Daten werden aus teilweise heterogenen Systemen in ein einzelnes darüberliegendes Datenbanksystem extrahiert. Bei der Extraktion der Daten müssen Transformationen bezüglich der unterschiedlichen Datenmodelle und Schemata durchgeführt werden. Die Daten werden der weiteren Analyse unterzogen (Data Mining). Vorlesung Biomedizinische Informationssysteme GRUNDLAGEN 37 Data-Warehouse Datenbanken Analyse Bereinigung Umformatierung DATA Metadaten Visualisierung ... Data-Mining Weitere Dateneingaben