Biomedizinische Informationssysteme GRUNDLAGEN

Werbung
2. Vorlesung SS 07
Motivation
Informationsverarbeitung
Biologie / Medizin / Medizinische Informatik
Grundlagen: Datenbanken und Informationssysteme
Vorlesung SS 07
Biomedizinische Informationssysteme
INHALTE
Medizin
1
Die Wissenschaft von der Krankheitsursache, der Heilung und
Vorbeugung von Krankheiten.
Medizinische Informatik (Trampisch)
Mittels Methoden und Werkzeuge der Informatik sollen Struktur und
Wirkungsweise der informationsverarbeitenden Systeme in der
Medizin analysiert werden. Hier stehen die Komponenten im Bereich
der Gesundheitsversorgung im Mittelpunkt.
Es werden Methoden aus der Mathematik (Statistik, usw.), der
Informatik, der Linguistik und der Biometrie eingesetzt.
Vorlesung
Biomedizinische Informationssysteme
MOTIVATION
Kernpunkte:
2
Automatisierte Datenerfassung und Auswertung:
Uninterpretierte Präsentation von Daten, wie z.B. EKG, CT, Labor,
Intensiv-Pflege-Überwachung.
Elektronische Datenhaltung:
Chipkarte und elektronische Krankenakte.
Informations-Anwendungen:
Interpretierte, sinnvermittelnde Daten, wie z.B. die elektronische
Krankenakte.
Wissensverarbeitung:
Erste Systeme in der Anwendung.
Vorlesung
Biomedizinische Informationssysteme
MOTIVATION
3
American Medical Association (AMA)
Medizinische Informatik ist eine Disziplin, die mit der Hilfe von
Computern und Netzwerken versucht, Informationen zur
Unterstützung der Pflege, der biomedizinischen Forschung und der
Lehre bereitzustellen.
Die Anwendungen werden in vier Gruppen eingeteilt:
(1)
Speichern / Wiederfinden (Retrieval) von Informationen,
(2)
Kommunikation,
(3)
Aus- und Weiterbildung in der Medizin und
(4)
entscheidungsunterstützende Systeme in der Medizin.
Vorlesung
Biomedizinische Informationssysteme
MOTIVATION
4
Topics der Medizinischen Informatik
- Medizinische Terminologie.
- Das Gesundheitsversorgungssystem der BRD.
- Medizinische Physik und Biophysik:
Tomographie, Mikroskopie, Chromatographie, ...
- Bild- und Signalverarbeitung in der Medizin / Biologie:
Schnittbilder, Mikroskopie, Laborsysteme, …
Vorlesung
Biomedizinische Informationssysteme
MOTIVATION
5
Topics der Medizinischen Informatik
- Krankenhauskommunikations- und -informationssysteme:
KKIS, Kommunikationssysteme, Datenbanken,
Archivsysteme, Workflow-Modelle, BWL.
- Wissensbasierte Systeme.
- Laborinformationssysteme.
- Bioinformatik dynamischer Systeme.
Vorlesung
Biomedizinische Informationssysteme
MOTIVATION
6
Grundlegende Begriffe
Krankheit (im engeren Sinn)
Bezeichnet das Vorhandensein von subjektiv Empfindungen
bzw. objektiv feststellbaren körperlichen, geistigen bzw.
seelischen Veränderungen bzw. Störungen.
Symptome
Krankheitszeichen, so dass man auch die pathologischen
Befunde unter diesen Begriff fassen kann. Deshalb wird von
Symptomen gesprochen, obwohl man Symptome und
Befunde meint.
Vorlesung
Biomedizinische Informationssysteme
BEGRIFFE
7
Diagnose
Die Krankheit erkennen / benennen.
Differentialdiagnose
Ähnliche Krankheitsbilder unterscheiden.
Um eine Krankheit erkennen zu können - Diagnostik:
Direkte und indirekte Verfahren - es fallen Daten an.
Vorlesung
Biomedizinische Informationssysteme
BEGRIFFE
Informationsquellen für die Diagnose (klassisch):
8
- Anamnese,
- Untersuchungsbefunde und
- Krankheitsverlauf.
Das Krankheitsbild eines Patienten:
- Symptome und
- pathologische Befunde.

Vorlesung
Eine Reihe von möglichen Krankheiten
(Hypothesenfokus), die diese Symptome
erklären können.
Biomedizinische Informationssysteme
BEGRIFFE
9
Induktion
Der Schluss von den Symptomen auf die Krankheiten.
1. Eine der Hypothesen als bestmögliche ansehen.
2. Ableiten, welche weiteren Symptome vorliegen müssten.
Dieser Schritt heißt Deduktion!
Vorlesung
Biomedizinische Informationssysteme
BEGRIFFE
10
Therapie
Die Behandlung einer Krankheit, die symptomatisch oder
kausal sein kann.
Medikamente, Operationen, Bestrahlung, etc.
Therapeutische Entscheidungen
Auf jeder Stufe der Diagnostik kann Therapie erforderlich
werden.
Vorlesung
Biomedizinische Informationssysteme
BEGRIFFE
11
Der therapeutischer Entscheidungsprozeß umfasst:
1. Auswahl einer Therapie,
2. Planung und
3. Überwachung.
Vorlesung
Biomedizinische Informationssysteme
BEGRIFFE
Molekulare Medizin (Biomedizin)
12
Anwendung der Methoden der Molekularen Biologie im Bereich der
Diagnose (z. B. diagnostische Chips) und
Therapie (z. B. Gentherapie).
Gendefekte / Mutationen
 Die Biosynthesekette ist unterbrochen, was mehr oder weniger
starke Auswirkung auf den Metabolismus hat.
 Die Reparaturenzyme sind defekt.
 Die RNA-Moleküle sind defekt.
 usw.
Vorlesung
Biomedizinische Informationssysteme
BEGRIFFE
Molekulare Medizin (Biomedizin)
13
Modelle der Genregulation
Grundlegend:
Jacob und Monod Modell der Regulation.
Britton-Davidson Modell: Klasse der abstrakten Modelle.
Abstrakte Modelle: Kauffmans binäres Automatensystem und die
logische Repräsentation der metabolischen
Netzwerke von Thomas.
Vorlesung
Biomedizinische Informationssysteme
BEGRIFFE
14
METABOLISCHE WIRKNETZE
Der Metabolismus umfasst die biochemischen Prozesse einer Zelle:
Biosynthese,
Proteinsynthese sowie
Zellkommunikation.
Darüber hinaus docking, um z.B. Gene zu aktivieren, Biosynthesen zu
realisieren oder Induktor-Rezeptor Bindungen darzustellen.
Vorlesung
Biomedizinische Informationssysteme
BEGRIFFE
15
METABOLISCHE WIRKNETZE
Biosynthese: Enzymatisch gesteuerte biochemische Reaktionen im
Metabolismus. Bedingen solche Übergänge einander,
so spricht man von metabolic pathways.
Enzym:
Vorlesung
Ein Protein mit der Eigenschaft, biochemische Prozesse
zu katalysieren und unverändert aus dieser Reaktion
hervorzugehen.
Biomedizinische Informationssysteme
BEGRIFFE
16
Stoffwechselerkrankungen
Erbliche Erkrankungen, deren Symptome durch einen
biochemischen Defekt im Stoffwechsel des Organismus verursacht
werden.
Die Symptome können in ihrer Ausprägung sehr variabel sein.
Häufig treten sie innerhalb der ersten Lebenstage des
Neugeborenen auf.
Therapie
Viele dieser Erkrankungen können durch eine diätetische Therapie
behandelt werden. Dabei werden z.B. die Substanzen vermieden,
die vom Organismus nicht abgebaut werden können, oder
alternative Stoffwechselwege werden medikamentös unterstützt.
Vorlesung
Biomedizinische Informationssysteme
BEGRIFFE
Biochemische Reaktionsketten: Michal 2007
Bekannt sind u.a. der Zitronensäurezyklus oder der Harnstoffzyklus.
17
18
Phänotype
Genotyp
Ramedis
EMBL
OMIM
TRANSFAC
...
METAGENE
Metabolic
...
Pathways
Influence
Drugs
KEGG
ASDB
WIT
RListe
...
...
Relevante Datenbanken
19
Grundlegende Definitionen
Datenbank:
Eine Datensammlung, die Fakten über Anwendungen eines
modellierten Ausschnittes der Realwelt repräsentiert, die dauerhaft
(persistent) und weitgehend redundanzfrei gespeichert wird.
Datenbank-Management-System (DBMS):
Eine Sammlung von Programmen, die das anwendungsabhängige
Erzeugen, Ändern und Löschen einer Datenbank ermöglicht.
Vorlesung
Biomedizinische Informationssysteme
GRUNDLAGEN
20
Datenbanksystem:
Kombination eines Datenbank-Management-Systems mit einer
oder mehreren, unterscheidbaren Datenbanken.
Die Abfrage der Daten - Abfragesprache
z.B. die Structured Query Language (SQL).
Vorlesung
Biomedizinische Informationssysteme
GRUNDLAGEN
21
Datenbanksystem
Anforderungen an Datenbanksysteme / Codd’schen Regeln:
1. Operationen: Speichern, ändern und suchen.
2. Benutzersichten: Zugriffe auf Datenbankbeschreibungen.
3. Benutzersichten: Nutzerspezifische Auswahl der Daten.
4. Integration: Einheitliche und nichtredundante Datenverwaltung.
5. Konsistenzüberwachung: Korrektheit des Datenbestandes.
6. Datenschutz: Ausschluss unautorisierter Zugriffe.
7. Transaktionen: Mehrere Datenbank-Operationen als funktionelle Einheit.
8. Synchronisation: Parallele Transaktionen koordinieren.
9. Datensicherung: Widerherstellung von Daten und Systemfehlern.
Vorlesung
Biomedizinische Informationssysteme
GRUNDLAGEN
22
Informationssystem (IS):
Ein komplexes, zusammengesetztes Softwaresystem mit aufeinander
bezogenen informationsverarbeitenden Komponenten. Diese können
in Erzeugung, Speicherung, Umformung, Transport und Darstellung
gegliedert werden.
In der Biomedizin werden die Begriffe Informationssystem und
Datenbank häufig synonym verwendet.
Vorlesung
Biomedizinische Informationssysteme
GRUNDLAGEN
Nutzer
.......
Nutzer
Externe DB
WWW
Anwendungssoftware
Schnittstelle/Integration
...
DB
Aufbau eines Informationssystems
I
N
T
E
R
F
A
C
E
24
Informationssystem (IS)
Eigenschaften eines IS::
-
Realisiert eine dauerhafte (persistente) Speicherung von
Daten. Dabei ist eine Datenbank oder ein Datenbanksystem
Bestandteil eines Informationssystems.
-
Wertet die gespeicherten Daten anwendungsspezifisch aus.
-
Ist durch Anpassung und Erweiterung dynamisch.
-
Integriert weitere (externe) Informationsquellen.
Vorlesung
Biomedizinische Informationssysteme
GRUNDLAGEN
25
Datenquelle
Sie besteht aus mindestens einem Computer, auf dem Daten
gespeichert werden können und auf die über Schnittstellen
zugegriffen werden kann.
Die Datenquelle ist immer autonom verfügbar.
Demgegenüber ist eine Datenbank immer im Kontext mit einem
Datenbanksystem zu sehen.
Vorlesung
Biomedizinische Informationssysteme
GRUNDLAGEN
26
Flat-File
Eine Datei, die eine bestimmte, implizite Struktur besitzt.
Ist ein Flat-File auf einem Rechner verfügbar, so wird diese
Kombination auch als Datenquelle verstanden.
Ein Flat-File besteht aus verschiedenen Zeilen, in denen Daten häufig
in ASCII-Format enthalten sind.
Beispiel: Ausschnitt aus der Flat-File Datenbank KEGG:
Vorlesung
Biomedizinische Informationssysteme
GRUNDLAGEN
ENTRY
EC 2.1.3.3
NAME
Ornithine carbamoyltransferase
27
Citrulline phospharylase
Ornithine transcarbamylase
CLASS
Transferases
Transferring one-carbon groups
Carboxyl- and carbamoyltransferases
SYSNAME
Carbamoyl-phosphate:
L-ornithine carbamoyltransferase
...
Das Zeilenende ist durch bestimmte Zeichen gekennzeichnet (in der Regel Enter).
Die Trennsymbole (z.B. Sonderzeichen) zur Unterscheidung der Daten innerhalb
einer Zeile.
Auch eine Unterscheidung innerhalb der Zeile ist möglich, wie in unserem Beispiel
dargestellt. So sind auf der linken Seite Schlüsselwörter wie z.B. ENTRY, NAME
und SYSNAME zu erkennen.
Vorlesung
Biomedizinische Informationssysteme
GRUNDLAGEN
28
Eine Datenbank soll auch die Redundanzfreiheit sicherstellen.
Von einer Datenquelle ist dies nicht zu fordern!
Datenintegration
Redundanzfreie und einheitliche Verwaltung aller von
Anwendungen bzw. von Anwendern benötigten Daten.
Weiteres Ziel:
Vorlesung
Die Zusammenführung von Informationen,
die verteilt in Datenquellen vorliegen.
Biomedizinische Informationssysteme
GRUNDLAGEN
29
Noch größere Anforderungen an die Zusammenführung von
Daten bzw. Informationen stellt die Informationsfusion.
Informationsfusion
Ein Prozess, dessen Aufgabe es ist, Daten oder Informationen
aus verschiedenen, zum Teil heterogenen Datenquellen zu
kombinieren, zu verdichten, zu interpretieren und daraus
Informationen einer neuen Qualität abzuleiten.
Vorlesung
Biomedizinische Informationssysteme
GRUNDLAGEN
Grundlegend für Biomedizinische Informationssysteme ist die
Integration spezifischer Datenquellen.

Die Entwicklung von komplexen Informationssystemen, die über Internet global zugreifbar sind und
letztlich eine multidimensionale Datenbank umfassen,
die durch Analysealgorithmen gezielt ergänzt wird.
Die Integration der relevanten Datenquellen und Analysetools.
Grundlegend für unsere Fragestellungen sind die Datenbanken, die
die metabolischen Prozesse repräsentieren.
Vorlesung
Biomedizinische Informationssysteme
GRUNDLAGEN
30
BioMed-Informationssysteme
31
1. Elektronische Netzwerke – Fragestellungen direkt im
Expertenkreis diskutieren.
BIONET-Netzwerk!
2. Erfassen der Datenbestände (Datenbanken)
Kann in vielen Bereichen weitgehend automatisiert werden:
Sequenzierung, Proteomics, Laborwertbestimmung, usw.
3. Elektronische Datenhaltung erlaubt über Internet den weltweiten
direkten Zugriff (Informationssysteme aufbauen).
Datenbankabfragesprachen ermöglichen auch erste Methoden
der Datenanalyse.
Vorlesung
Biomedizinische Informationssysteme
GRUNDLAGEN
Modellentwicklung auf der Basis dieser BioMed-Daten führt direkt
auch zur Implementation hypothetischer Welten.
 Modellierung und Simulation!
Informationssystem im Internet – Kennzeichen:
1. Die persistente Speicherung von Daten.
2. Die Möglichkeit der Datenabfrage.
3. Die Auswertung und die Analyse der Daten.
4. Die Einhaltung der Integritätsbedingungen.
5. Die Integration externer Datenquellen.
6. Die Existenz einer Benutzerschnittstelle.
7. Die Möglichkeit der verteilten Modellierung.
Vorlesung
Biomedizinische Informationssysteme
GRUNDLAGEN
32
Dateibasierte Informationssysteme
33
Oft dateibasierte Datenhaltungssysteme, in denen die Daten bereits in
HTML-Dateien oder anderen strukturierten Dateien gespeichert sind.
Eine Datenunabhängigkeit ist hier nicht gegeben.
Die Systeme dienen nur der Repräsentation der Daten, die durch
Nutzung des Internets und seiner Dienste erfolgt.
Die Änderungen der Datenbestände werden nur von ausgewählten
Personen vorgenommen.
Zugriff:
HTML-Browser.
Die Zugriffszeiten sind von der Netzauslastung abhängig.
Navigierender Zugriff (Angabe URL).
Vorlesung
Biomedizinische Informationssysteme
GRUNDLAGEN
Internet-Schnittstelle
34
CGI-Schnittstellen und Mechanismen aus der Java-Welt wie Servlets
oder Applets.
Dadurch ist eine komplexe Verarbeitung und Darstellung von Daten
möglich.
Lokale Installation eines Systems
Über das Internet erreichbar - einige Systeme bieten die Möglichkeit
eine komplette oder partielle Kopie auf einem lokalen Rechner zu
installieren.
Vorlesung
Biomedizinische Informationssysteme
GRUNDLAGEN
Verteilte Informationssysteme
35
Hauptaufgabe: Das Zusammenführen von räumlich getrennt
gespeicherten aber logisch teilweise
zusammengehörenden Daten.
Der Zugriff von verschiedenen Rechnern auf verteilte Datenbestände.
Klassifikation: Zentrale, verteilte und Multidatenbanksysteme
Zentrale DBS:
Klassische Systeme - DMBS und Datenbank.
Verteilte DBS:
Einem DBMS - der Datenbestand ist hier auf
mehrere Rechner verteilt.
MultiDBsystem:
Verbund von mehreren Datenbanksystemen,
die jeweils ihr eigenes DBMS besitzen.
Vorlesung
Biomedizinische Informationssysteme
GRUNDLAGEN
Datawarehouse
36
Die Daten werden aus teilweise heterogenen Systemen in ein einzelnes darüberliegendes
Datenbanksystem extrahiert.
Bei der Extraktion der Daten müssen Transformationen bezüglich der unterschiedlichen
Datenmodelle und Schemata durchgeführt werden.
Die Daten werden der weiteren Analyse unterzogen (Data Mining).
Vorlesung
Biomedizinische Informationssysteme
GRUNDLAGEN
37
Data-Warehouse
Datenbanken
Analyse
Bereinigung
Umformatierung
DATA
Metadaten
Visualisierung
...
Data-Mining
Weitere Dateneingaben
Herunterladen