Vortrag - GMDS 2006

Werbung
PIPESmed : Ein flexibles Werkzeug
zur Verarbeitung kontinuierlicher Datenströme
in der Medizin
Bernhard Seeger, Jürgen Krämer, Thomas Penzel, Richard Lenz
Philipps-Universität Marburg
Gefördert durch die DFG (Se 553/4-3)
Schlafmedizinisches Labor
Institut für
Medizinische Informatik
Überblick
Motivation und Problemdefinition
Datenstrommanagement
• Anforderungen
• Architekturübersicht
PIPES
• Funktionalität
• Projekte und Ergebnisse
Zusammenfassung
IMI
© 2002Penzel,
Philipps-Universität
Marburg
© Bernhard Seeger, Jürgen Krämer, Thomas
Richard Lenz
2006
Motivation
ƒ Explosion der Kosten im Gesundheitswesen
ƒ Alternde Gesellschaft
ƒ Viele chronisch Kranke
ƒ Lösungsansatz
ƒ Durchgehender Einsatz von Sensoren zum Monitoring
ƒ Stärkung der Eigenverantwortlichkeit
ƒ Selbstständiges Wohnen
ƒ Attraktivität
ƒ Niedrige Kosten für die Datengewinnung durch Sensoren
ƒ Steigende Akzeptanz auf Grund der Miniaturisierung
ƒ Problem
ƒ Verarbeitung der kontinuierlich anfallenden Datenmassen
ƒ Semantische Lücke
ƒ Low-Level Sensordaten ÍÎ Bedarf in der Anwendung
IMI
© 2002Penzel,
Philipps-Universität
Marburg
© Bernhard Seeger, Jürgen Krämer, Thomas
Richard Lenz
2006
Praxis des Monitorings
ƒ
ƒ
ƒ
Firmen
ƒ
ƒ
ƒ
Dräger/Siemens
Philipps
…
Produkte
ƒ
ƒ
Datenerfassung
Direkter Plot der erfassten Daten in Echtzeit auf einem Bildschirm
Produkte je nach Aufgabe (z. B. Produktkatalog von Philipps):
ƒ
ƒ
ƒ
ƒ
ƒ
ƒ
ƒ
ƒ
ƒ
ƒ
Gas Monitoring
Blood Pressure
Capnography
ECG
Hemodynamic
Neurological
Pulse Oximetry
Temperature
Transcutaneous Gases
…
Multiple Datenstöme
ƒIST:
ƒPrinzip: „Anzeigen und Vergessen“
ƒNiedrige Schwellenwerte: Falsch positive Alarme
ƒDesensibilisierung der Mitarbeiter
ƒSOLL:
ƒZeitnahe Interpretation –
Erkennen komplexer Risikosituationen
IMI
© 2002Penzel,
Philipps-Universität
Marburg
© Bernhard Seeger, Jürgen Krämer, Thomas
Richard Lenz
2006
Überblick
Motivation und Problemdefinition
Datenstrommanagement
• Anforderungen
• Architekturübersicht
PIPES
• Funktionalität
• Projekte und Ergebnisse
Zusammenfassung
IMI
© 2002Penzel,
Philipps-Universität
Marburg
© Bernhard Seeger, Jürgen Krämer, Thomas
Richard Lenz
2006
Anforderungen
ƒ Entkopplung der Sensoren von spezifischen
Anwendungen
ƒ Fusion und Transformation der Sensordaten
ƒ auf Basis einer einfachen Anfragesprache
ƒ Flexible Definition von Alarmen
ƒ Multivariate Alarme
ƒ Ausnutzung verschiedener Sensoren
ƒ Berücksichtigung von Patientendaten
ƒ Leistungsgarantien
ƒ Echtzeitverhalten
ƒ Skalierbar in der Anzahl der Nutzer
IMI
© 2002Penzel,
Philipps-Universität
Marburg
© Bernhard Seeger, Jürgen Krämer, Thomas
Richard Lenz
2006
Architektur
Präsentationsebene: z.B. Visualisierung
High-level Datenströme
Applikationsebene:
-Fusion von Datenströmen – Verknüpfung mit Datenbanken
-Filtern – Erkennen ungewöhnlicher Ereignisse - Veredlung
Formatierte und annotierte Datenpakete
Directory-Service:
-Transformation in hardwareunabhängiges Format(z.B. XML)
-Publish/Subscribe Mechanismen
Rohdaten
IMI
© 2002Penzel,
Philipps-Universität
Marburg
© Bernhard Seeger, Jürgen Krämer, Thomas
Richard Lenz
2006
Fokus von PIPES
Präsentationsebene: z.B. Visualisierung
High-level Datenströme
Applikationsebene:
-Fusion von Datenströmen – Verknüpfung mit Datenbanken
-Filtern – Erkennen ungewöhnlicher Ereignisse
Formatierte und annotierte Datenpakete
Directory-Service:
-Transformation in hardwareunabhängiges Format(z.B. XML)
-Publish/Subscribe Mechanismen
Rohdaten
IMI
© 2002Penzel,
Philipps-Universität
Marburg
© Bernhard Seeger, Jürgen Krämer, Thomas
Richard Lenz
2006
Überblick
Motivation und Problemdefinition
Datenstrommanagement
• Anforderungen
• Architekturübersicht
PIPES
• Funktionalität
• Projekte und Ergebnisse
Zusammenfassung
IMI
© 2002Penzel,
Philipps-Universität
Marburg
© Bernhard Seeger, Jürgen Krämer, Thomas
Richard Lenz
2006
Fokus von PIPES
ƒ PIPES:
ƒ Public Infrastructure for Processing and Exploring Data Streams
ƒ Infrastruktur für DSMS (DatenStromManagementSysteme)
ƒ Unterschiede zu DBMS
ƒ Menge von Datensätzen ist potentiell unendlich und zeitbehaftet
ƒ Anfragesemantik entspricht der von temporalen Datenbanken
ƒ Benutzeranforderungen
ƒ Kein Einfluss veralteter Daten auf aktuelle Ergebnisse
ƒ Integration der Daten verschiedener Ströme bzgl. zeitlicher Nähe
ƒ Z. B. zur Definition eines Alarms
ƒ Gleitende Zeitfenster
ƒ Endlicher Ausschnitt des Datenstroms
ƒ Einschränkung der Verarbeitung auf das aktuelle Zeitfenster
IMI
© 2002Penzel,
Philipps-Universität
Marburg
© Bernhard Seeger, Jürgen Krämer, Thomas
Richard Lenz
2006
Gleitende Zeitfenster in Anfragesprachen
ƒ CQL (Continuous Query Language)
Anfragesprache für kontinuierliche Datenströme
ƒ siehe Streams-Projekt der Stanford University (Widom et al)
ƒ Erweiterung von SQL um Zeitfenster
ƒ PressureStream (PatientenID, Pressure, TimeStamp)
“Bei welchen Patienten war der Blutdruck
über einen Zeitraum von 5 Minuten höher als 190?”
SELECT PatientenID
FROM PressureStream [Range 5 minutes]
GROUP BY PatientenID
HAVING (Min(Pressure) > 190);
IMI
© 2002Penzel,
Philipps-Universität
Marburg
© Bernhard Seeger, Jürgen Krämer, Thomas
Richard Lenz
2006
Fusion von Datenströmen
ƒ Sinnvolle Kombination verschiedener Datenströme
Î Definition multivariater Alarme auf Datenströmen
ƒ Beispiel
ƒ Alarmbedingung
ƒ HeartRate > 150 AND Pressure > 180
für ein Zeitraum von 2 Minuten
SELECT PatientenID
FROM PreasureStream [Range 2 minutes],
RateStream [Range 2 minutes]
WHERE PreasureStream.PatientenID = RateStream.PatientenID
GROUP BY PatientenID
HAVING (Min(Pressure) > 190 AND Min(HeartRate) > 150);
IMI
© 2002Penzel,
Philipps-Universität
Marburg
© Bernhard Seeger, Jürgen Krämer, Thomas
Richard Lenz
2006
Verteilungs- und Dichteschätzer
ƒ Ziele
ƒ Kontinuierliche Analyse von Datenströmen
ƒ Schätzung der aktuellen Verteilung des Datenstroms
ƒ Vergleich der Verteilung mit den zuletzt beobachteten
Daten
ƒ Warum Verteilungs- und Dichteschätzer?
ƒ Schätzung wichtiger Kenngrößen des Datenstroms wie z.
B. der Momente und Extrema
ƒ Methoden der nichtparametrischen Statistik
ƒ Keine Modellannahmen
ƒ Schätzung einer unbekannten Verteilung
IMI
© 2002Penzel,
Philipps-Universität
Marburg
© Bernhard Seeger, Jürgen Krämer, Thomas
Richard Lenz
2006
Anwendung
ƒ Ausreißerentdeckung in Datenströmen
ƒ Hat der neue Datensatz einen ungewöhnlichen Wert?
ƒ Gibt es eine Häufung eines Musters in einem
Datenstrom?
ƒ Welche Muster treten häufig zeitlich nah
beieinander auf?
IMI
© 2002Penzel,
Philipps-Universität
Marburg
© Bernhard Seeger, Jürgen Krämer, Thomas
Richard Lenz
2006
Gesamtbild von PIPES
Senken
PIPES
Anfragepläne
Direct. Service
Quellen
Directory Service
IMI
© 2002Penzel,
Philipps-Universität
Marburg
© Bernhard Seeger, Jürgen Krämer, Thomas
Richard Lenz
2006
Anwendungen
ƒ Bestehende Anwendungen von PIPES
ƒ Sensordatenverarbeitung bei Produktionsanlagen
ƒ Kopplung von PIPES mit
kommerziellen Systemen
ƒ Schlaflabor der Uni Marburg
ƒ Online-Analyse der Datenströme
IMI
© 2002Penzel,
Philipps-Universität
Marburg
© Bernhard Seeger, Jürgen Krämer, Thomas
Richard Lenz
2006
Beispiel: Visualisierung
IMI
© 2002Penzel,
Philipps-Universität
Marburg
© Bernhard Seeger, Jürgen Krämer, Thomas
Richard Lenz
2006
Beispiel: Veredlung von Datenströmen
IMI
© 2002Penzel,
Philipps-Universität
Marburg
© Bernhard Seeger, Jürgen Krämer, Thomas
Richard Lenz
2006
Überblick
Motivation und Problemdefinition
Datenstrommanagement
• Anforderungen
• Architekturübersicht
PIPES
• Funktionalität
• Projekte und Ergebnisse
Zusammenfassung
IMI
© 2002Penzel,
Philipps-Universität
Marburg
© Bernhard Seeger, Jürgen Krämer, Thomas
Richard Lenz
2006
Zusammenfassung
ƒ Zunehmende Notwendigkeit zur OnlineVerarbeitung von Datenströmen
ƒ Ziel von PIPES:
ƒ Transformation der low-level Daten in semantisch
relevantere Daten
ƒ Ansatz von PIPES
ƒ Verwendung und Adaption der erfolgreichen Techniken
aus dem Bereich Datenbanken
ƒ Visionäre Anwendung
ƒ Überwachung von Patienten im Intensivbereich
IMI
© 2002Penzel,
Philipps-Universität
Marburg
© Bernhard Seeger, Jürgen Krämer, Thomas
Richard Lenz
2006
Vielen Dank
für Ihre Aufmerksamkeit
IMI
© 2002Penzel,
Philipps-Universität
Marburg
© Bernhard Seeger, Jürgen Krämer, Thomas
Richard Lenz
2006
Informationslandschaft
DBMS
DBMS
DBMS
DBMS
DBMS
Eingabe
DSMS
DBMS
Ausgabe
File System
File System
File System
File System
File System
IMI
© 2002Penzel,
Philipps-Universität
Marburg
© Bernhard Seeger, Jürgen Krämer, Thomas
Richard Lenz
2006
Praxis des Monitorings
ƒ Infinity® Omega
ƒ erstes System zur Patientenüberwachung mit zwei
Bildschirmen
ƒ Weshalb Beschränkung auf zwei Bildschirme?
ƒ Vervielfachung der Anzahl der gleichzeitig angezeigten
Monitoring-Parameter und Kurven
Î Überladene Bildschirm
ƒ Flexible Voreinstellung
ƒ Anzeige relevanter Optionen, einschließlich Parameter,
Kurvenanordnung und Alarmgrenzen
Î Abhängigkeit von der Hardware
IMI
© 2002Penzel,
Philipps-Universität
Marburg
© Bernhard Seeger, Jürgen Krämer, Thomas
Richard Lenz
2006
Alarme
ƒ Definition von Schwellenwerten auf einem
Parameter Î Alarmgrenzen
ƒ Auslösung eines Alarms
ƒ Problem
ƒ Kritische Situationen i. A. abhängig von mehreren
Parametern
ÎKonservative Alarmgrenzen
ÎViele falsche Alarme
ÎDesensibilisierung des Pflegepersonals
IMI
© 2002Penzel,
Philipps-Universität
Marburg
© Bernhard Seeger, Jürgen Krämer, Thomas
Richard Lenz
2006
Directory-Service
ƒ Zweck
ƒ Beschreibung und Bereitstellung in einem hardwareunabhängigen
Format
ƒ Aufgaben
ƒ Transformation der hardwareabhängigen Sensordaten in eine
standardisierte Form
ƒ z. B. XML
ƒ Beschreibung der Sensordaten durch Metadaten
ƒ Zugriff auf die Daten durch Standardprotokolle
ƒ Lösung
ƒ Methoden der Signalverarbeitung
ƒ Publish-Subscribe-Mechanismus
ƒ Anwendungen subskribieren Sensordaten
ƒ Kontinuierliche Weiterleitung der Daten eines Sensors an die beim
Sensor subskribierten Applikationen
IMI
© 2002Penzel,
Philipps-Universität
Marburg
© Bernhard Seeger, Jürgen Krämer, Thomas
Richard Lenz
2006
Applikationsebene
ƒ
ƒ
ƒ
IMI
Zweck
ƒ
Transformation von low-level in high-level Daten
Aufgaben
ƒ
Fusion von Sensordaten
ƒ
ƒ
Anreicherung von Sensordaten mit persistenten Daten
Komplexe Analysen auf Sensordaten
ƒ Kombination verschiedener Sensoren
ƒ Bereitstellung als logischer Sensor
ƒ Erkennen von ungewöhnlichen Daten
Lösung
ƒ
ƒ
Anfragesprache ähnlich zu SQL
Publish/Subscribe-Mechanismus für Anfragen
ƒ Registrierung von Anfragen durch Anwender
ƒ Kontinuierliches Senden der Antworten
© 2002Penzel,
Philipps-Universität
Marburg
© Bernhard Seeger, Jürgen Krämer, Thomas
Richard Lenz
2006
Präsentationsebene
ƒ Zweck
ƒ Bereitstellung der Anfrageergebnisse auf verschiedenen
Hardwareplattformen
ƒ Aufgaben
ƒ Verwaltung von Metadaten zur Beschreibung von
Ausgabegeräten (und Benutzerkontexte)
ƒ Bandbreite
ƒ Lösung
ƒ Bereitstellung kontext-sensitiver Methoden zur
Transformation und Kompression der Daten
IMI
© 2002Penzel,
Philipps-Universität
Marburg
© Bernhard Seeger, Jürgen Krämer, Thomas
Richard Lenz
2006
Sensoren und Datenströme
ƒ Kontinuierliche Folge von Datensätzen
o
o
o
o
o
…
ƒ Zeit als integraler Bestandteil
ƒ Autonome Datenquellen
ƒ Sensoren, mobile Geräte,
Softwareapplikationen, …
ƒ Technologien
ƒ Lokale und globale Vernetzung
IMI
© 2002Penzel,
Philipps-Universität
Marburg
© Bernhard Seeger, Jürgen Krämer, Thomas
Richard Lenz
2006
PIPES
3-Ebenen-Architektur
Präsentationsebene
Applikationsebene
Directory-Service
IMI
© 2002Penzel,
Philipps-Universität
Marburg
© Bernhard Seeger, Jürgen Krämer, Thomas
Richard Lenz
2006
Interner Ablauf der Anfrage
ƒ Fensteroperator (in der from-Klausel)
ƒ Jedes Tupel der Datenströme mit Zeitpunkt t erhält
zusätzlich einen Endzeitpunkt t + 1 + 2 Minuten.
ƒ Ergebnistupel bekommt ebenfalls ein Zeitintervall
ƒ Schnitt der Eingabeintervalle
ƒ Beispiel:
ƒ w = 2 Minuten
ƒ EingabeTupel
ƒ (123, 195, 12:00) Æ (123, 195, 12:00, 12:02)
ƒ (123, 150, 12:01) Æ (123, 150, 12:01, 12:03)
ƒ Ergebnistupel
ƒ (123, 195, 150, 12:01, 12:02)
IMI
© 2002Penzel,
Philipps-Universität
Marburg
© Bernhard Seeger, Jürgen Krämer, Thomas
Richard Lenz
2006
Kumulierter Schätzer
ƒ Idee des Frameworks
ƒ Blockweise Verarbeitung des Datenstroms
ƒ Separater Schätzer für jeden Block
ƒ Iterative Berechnung der konvexen Linearkombination der
Blockschätzer
ƒ Formale Darstellung für endlichen Datenstrom
j
gˆ j ( x ) = ∑ ω i fˆi ( x )
i =1
j
mit
∑ω
i =1
i
= 1, ω i ≥ 0 ∀i = 1,.., j
ƒ Online-Berechnung des kumulierten Schätzers
Kumulierter⎧⎪Schätzer
fˆ1 ( x ), i = 1
gˆ i ( x ) = ⎨
⎪⎩(1 − ω~i ) gˆ i −1 ( x ) + ω~i fˆi ( x ), 2 ≤ i ≤ j
mit ω~i , 0 ≤ ω~i ≤ 1, 2 ≤ i ≤ j , ω~1 = 1
IMI
© 2002Penzel,
Philipps-Universität
Marburg
© Bernhard Seeger, Jürgen Krämer, Thomas
Richard Lenz
2006
Kumulierter Schätzer (2)
Datenstrom
Puffer
Block Nr.
i = 102
Gewicht
~==01.5
ω~ω
2 1
Kontinuierliche
Analyse
Blockschätzer
Kumulierter Schätzer
fˆfˆ21 ( x)
gˆ1 ( x)
gˆ 2 ( x) = (1 − ω~2 ) gˆ1 ( x) +gˆ ω~( x2 )fˆ2 ( x)
2
⎧⎪ fˆ1 ( x), i = 1
gˆ i ( x) = ⎨
⎪⎩(1 − ω~i ) gˆ i −1 ( x) + ω~i fˆi ( x), 2 ≤ i ≤ j
IMI
© 2002Penzel,
Philipps-Universität
Marburg
© Bernhard Seeger, Jürgen Krämer, Thomas
Richard Lenz
2006
Relationale Stromoperatoren
τt
Schnappschuss-Reduzierbarkeit
ƒ
Schnappschus
ƒ
Abbildung eines physischen Datenstroms auf eine nicht-temporale
Relation.
Relation enthält genau die zum Zeitpunkt t gültigen Datensätze
ƒ
S1, …, Sn
R1, …, Rn
Relationaler
Datenstromoperator
Relationaler
Operator
Sout
IMI
Rout
© 2002Penzel,
Philipps-Universität
Marburg
© Bernhard Seeger, Jürgen Krämer, Thomas
Richard Lenz
2006
Framework für Analyseverfahren
ƒ Berechnung nichtparametrischer Schätzer auf
Datenströmen
ƒ Erfüllung der Anforderungen für Analyseverfahren
ƒ Online berechenbar
ƒ Limitierter Speicher
ƒ Eigenschaften des Frameworks
ƒ Kumulierte Schätzer
ƒ Parameter
ƒ Kompressionsschritt
ƒ Konvexer Vereinigungsschritt
ƒ Schätztechnik
ƒ Speicheradaptivität
IMI
© 2002Penzel,
Philipps-Universität
Marburg
© Bernhard Seeger, Jürgen Krämer, Thomas
Richard Lenz
2006
Aktuelle Arbeiten
ƒ Fragestellungen
ƒ Laufzeitumgebung
ƒ Realzeit-Anforderungen
ƒ Scheduling der Operatoren
ƒ Kostenmodelle
ƒ Entwicklung neuer Schätztechniken
ƒ Entwicklung von Strategien für Adaptivität
ƒ Speicheradaptivität
ƒ CPU-Ablaufsteuerung
ƒ Analyseoperatoren
ƒ Medizintypische Operatoren
IMI
© 2002Penzel,
Philipps-Universität
Marburg
© Bernhard Seeger, Jürgen Krämer, Thomas
Richard Lenz
2006
Anfrage in CQL
SELECT PatientenID
FROM PreasureStream [Range 2 minutes],
RateStream [Range 2 minutes]
WHERE PreasureStream.PatientenID = RateStream.PatientenID
GROUP BY PatientenID
HAVING (Min(Pressure) > 190 AND Min(HeartRate) > 150);
Sinnvolle Ausgaben erfordern i. A. noch die Verknüpfung
mit Daten aus persistenten Datenbanken
(z.B. eine strukturierte elektronische Patientenakte).
IMI
© 2002Penzel,
Philipps-Universität
Marburg
© Bernhard Seeger, Jürgen Krämer, Thomas
Richard Lenz
2006
Herunterladen