Visualisierung von Diabetesdaten

Werbung
Visualisierung von Diabetesdaten
Jochen Schneider
30. Oktober 2001
Zusammenfassung
Die Arbeit zeigt Ergebnisse einer Designstudie auf, die sich mit der Visualisierung von Diabetesdaten befasst hat. Dabei stand die Frage im Vordergrund, wie dem behandelnden Arzt in
rascher, übersichtlicher und intuitiv zu erfassender Form die Blutzuckerwerte der letzten Wochen
eines Patienten präsentiert werden können. Zusätzlich stellt sich dann die Frage, wie an Problempunkten die weitern Daten (neben Blutzuckerwerten Insulingaben, Kohlehydrate und sportliche
Aktivität) problemadäduat dargestellt werden können.
Im Rahmen der Studie werden Möglichkeiten der Visualisierung exemplarisch aufgezeigt. Eine konkrete Visualisierungsform, die die Blutzuckerwerte von 4 Wochen in abstrahierter Form
darstellt, wurde als Prototyp in Java realisiert.
Die Studie ist Teil des Projekts Telemedicine, computer assisted data analysis and knowledgebased system support for improving glycemic control in adolescent type I diabetes.
1
Einführung
Im Folgenden wird ein gemeinsames Projekt des Österreichischen Forschungsinstituts für Artificial
Intelligence und des Instituts für Medizinische Kybernetik und Artificial Intelligence der Universitët
Wien (Ansprechpartner: Prof. Dr. Werner Horn) und der Universitätskinderklinik des AKH Wien
(Ansprechpartner: Prof. Dr. Christian Popow, Prof.Dr.Edith Schober) vorgestellt. Es beschäftigt sich
mit der Sammlung und Visualisierung von Daten, welche für die Insulinbehandlung von Kindern und
Jugendlichen mit Diabetes Mellitus relevant sind. Geplant ist, dass Blutzuckerwerte von einem Messgerät gespeichert und über Funk oder einen Desktop-PC und das Internet an den behandelnden
Arzt übermittelt werden. Das entsprechende Verfahren steht noch nicht fest. In diesem Bericht wird
geschildert, wie derart erhobene Daten visualisiert werden können. Zunächst wird der klinische Hintergrund des Projektes beschrieben. In Abschnitt 3 wird eine kurze Einführung in das Projekt selbst
gegeben. In Abschnitt 4 werden verwandte Arbeiten besprochen. In Abschnitt 5 wird die Art und
die Struktur der verwendeten Daten erläutert. In Abschnitt 6 werden Ansätze ihrer Visualisierung
dargelegt. In Abschnitt 7 wird der enwickelte Prototyp besprochen. In Abschnitt 8 werden alternative
Visualisierungsmöglichkeiten vorgestellt. Nach dem Literaturverzeichnis folgt ein kurzer Glossar und
ein Auszug aus einer Datei mit zu visualisierenden Daten.
2
Klinischer Hintergrund
Diabetes Mellitus ist eine Störung (v.a.) des Kohlenhydratstoffwechsels durch mangelnde Bildung
des Hormons Insulin in der Bauchspeicheldrüse. Es werden zwei Arten unterschieden, Typ I und Typ
II. Typ I ist die insulinabhängige Diabetes Mellitus (englisch: Insulin Dependent Diabetes Mellitus,
IDDM). Sie ist chronisch, beginnt im Kindes- und Jugendalter auf und wird durch die regelmäßige
Injektion von Insulin behandelt. Typ II tritt v.a. bei Älteren (aber auch bei übergewichtigen Jugendlichen und Schwangeren) auf. Sie kann in den meisten Fällen durch eine Diät behandelt werden. Die
vorliegenden Ausführungen beziehen sich auf Diabetes Mellitus vom Typ I.
1
Nach dem Beginn und der Dauer ihrer Wirksamkeit wird schnell und langsam wirkendes Insulin
unterschieden. Schnell wirkendes Insulin (auch reguläres, Normal- oder Altinsulin genannt) wird
gewöhnlich nach jeder Mahlzeit injiziert. Es wirkt etwa 4-5h direkt nach Injektion, die stärkste
Wirkung entfaltet es nach 2h. Verzögerungsinsulin (NPH- oder Lente-Insulin) wird gewöhnlich einoder zweimal pro Tag (z.B. morgens und abends) zur Herstellung eines Insulin-Grundspiegels injiziert.
Es wirkt nach etwa 4h für etwa 8-16h. Langzeitinsulin schließlich wirkt etwa 24-32h.
Es werden mehrere Insulin-basierte Therapien der Typ 1-Diabetes unterschieden: Die konventionelle, die intensivierte konventionelle (Basis-Bolus) und die Insulinpumpentherapie. Bei der konventionellen Therapie wird jeweils eine bestimmte Menge langsam und schnell wirkendes Insulin
zu festgelegten Zeiten verabreicht. Die Menge und Zeiten werden bei der Einstellung des Patienten
(im Krankenhaus) festgelegt. Später muss sich der Patient an die Zeiten und Mengen halten; seine
Nahrung muss er ebenfalls nach einem bestimmten Schema einnehmen, in mehreren über den Tag
verteilten Mahlzeiten.
Bei der intensivierten konventionellen Therapie wird ebenfalls schnell und langsam wirkendes
Insulin verwendet. Das langsam wirkende Insulin wird ein- oder zweimal pro Tag zur Grundversorgung, Basis“ genannt, verabreicht. Das schnell wirkende Insulin wird jeweils kurz vor den Mahlzeiten
”
verabreicht, als sogenannter Bolus“, also normale Gabe zur Verarbeitung aufgenommener Gluko”
se. Neben Basis und Bolus gibt es als weitere Intention der Insulinverabreichung die Korrektur“
”
zum Ausgleich zu hoher Werte bspw. nach einer umfangreicheren Mahlzeit. Als dritte Möglichkeit
der Insulin-Therapie gibt es automatisch gesteuerte Pumpen, die für das vorliegende Projekt jedoch
nicht relevant sind.
Der Blutzuckerspiegel kann folgendermaßen bezüglich eines Normbereiches eingeteilt werden:
Bereich
< 60 mg/dl
60-180 mg/dl
180-250 mg/dl
250-350 mg/dl
> 350 mg/dl
Zustand
Hypoglykämie
normal
Überzuckerung
starke Überzuckerung
sehr starke Überzuckerung
Bei der Therapie wird der Blutzuckerspiegel über folgende Faktoren gesteuert:
1. Insulin (senkt den Blutzuckerspiegel)
2. Essen (erhöht den Blutzuckerspiegel)
3. Sport (senkt den Blutzuckerspiegel)
Es existieren weitere Faktoren, die den Blutzuckerspiegel beeinflussen und nur bedingt steuerbar
sind:
1. Infektionen
2. Stress
3. Somogyi-Effekt (siehe Glossar, S. 18)
3
Projekt
Bei der Zielgruppe handelt es sich um Jugendliche mit Diabetes Mellitus vom Typ I. Ziel des Projektes
ist es, ihre Therapie zu verbessern, also die Abweichungen ihrer Blutzuckerwerte vom Normalbereich
zu minimieren. Diese Therapieverbesserung soll erfolgen, ohne die Frequenz der Arztbesuche (durchschnittlich alle 3-6 Monate) zu erhöhen. Erreicht werden soll dies durch weitgehend automatische
2
Übermittlung von Blutmesswerten bei jedem Messen an ein Gesundheitszentrum und dortige Überprüfung durch einen Arzt. Weiterhin sollen sonstige Daten wie Nahrungsaufnahme, Insulingaben,
etc. vom Patienten selbst eingegeben und ebenfalls vom Arzt überprüft werden.
Der Arzt beurteilt die erfassten Messwerte anhand von Visualisierungen und der zugrundeliegenden Zahlen. Der Patient erhält innerhalb kurzer Zeit eine Rückmeldung:
• Bestätigung der erfolgreichen Einstellung
• Empfehlungen für Verbesserungen von Insulindosis, Ernährung
• Aufforderung zur Rücksprache mit dem behandelnden Arzt
• Einweisung in ein Krankenhaus
Die Hypothese für das Projekt lautet, dass die Einstellung mit der neuentwickelten Visualisierung schneller und besser beurteilt werden kann als durch die Konsultation von tabellenförmigen
Datenblättern. Die Patienten, deren Einstellung mit Hilfe des Systems beurteilt werden, fühlen sich
sicherer. Diese Hypothese soll in einer Evaluation überprüft werden.
4
4.1
Verwandte Arbeiten
Horn, Popow, Unterasinger
Die Autoren haben ein System zur Visualisierung von Daten erstellt, welche auf der Intensivstation
zur Beatmung von Säuglingen auftreten [HPU98]. Dabei handelt es sich um Daten des Blutkreislaufes,
der Atmung und der Flüssigkeitszu- und -abfuhr. Diese Daten werden quasi kontinuierlich erfasst.
Bei der Beatmung wird zusätzlich zur Menge angegeben, ob der Säugling selbstständig atmet oder
beatmet wird.
Der Median der Daten einer Stunde werden als Glyph dargestellt. Dieser Glyph besteht aus
geometrischen Elementen: einem Dreieck und drei Rechtecken. In die Elemente sind zusätzlich Striche
und Zeichen eingetragen, die Menge und Art gewisser Beatmungsparameter angeben.
4.2
Kahn
Kahn und Kollegen besitzen ein Patent auf eine Diabetes Data Analysis and Interpretation Me”
thod“ [KHB+ 93]. Dabei werden Daten mit einem Glukosemeter erfasst und in einen PC geladen.
(Es werden sowohl Daten über den Glukoselevel als auch über die Insulindosierung gespeichert.) Im
PC werden die Daten analysiert. Dabei werden Korrespondenzen zwischen den Insulindosen und den
Blutzuckerwerten statistisch ermittelt. Aus den analysierten Daten werden Reports generiert, sowohl
als textliche Zusammenfassung als auch graphisch.
Blutzuckerwerte werden u.a. in Form von Histogrammen dargestellt. Neben den Histogrammen
werden auch der Durchschnitt und die Standardabweichung genannt. Die Messungen können auch
jeweils so dargestellt werden, dass sie bestimmten Zeiten zugeordnet sind wie Tageszeiten (Frühstück,
Mittagessen, Abendessen, Schlafengehenszeit) oder Wochenabschnitte (Wochentage gegenüber Wochenende).
4.3
Shahar
Shahar hat ein wissensbasiertes System zur zeitlichen Abstraktion namens RÉSUMÉ entwickelt
[Sha97]. Das System ist prinzipiell domänenunabhängig. (Neben Anwendungen im medizinischen
Bereich für AIDS- und Diabetes-Therapien wurden auch Verkehrsflüsse damit analysiert.) Zeitliche
Abstraktion wird folgendermaßen definiert: Given a set of time-stamped data, external events, and
”
abstraction goals, produce abstractions of the data that interpret past and present states and trends
3
and that are relevant for the given set of goals“ (ebd.). Eine solche Abstraktion stellt also keine
summarische Diagnose dar, sondern zeigt Zusammenhänge auf. Ein Beispiel für eine solche zeitliche Abstraktion bei der Behandlung eines AIDS-Patienten ist: Grade II anemia for 3 weeks in the
”
context of administration of the drug AZT as part of clinical therapy protocol CCTG-522“ (ebd.).
RÉSUMÉ basiert auf einer wissensbasierten zeitlichen Abstraktionstheorie, aus der eine entsprechende Methode abgeleitet wurde. Die Theorie ist anwendungsunabhängig und basiert auf Zeit, Ereignissen, Parametern und Interpretationszusammenhängen (ebd.). Für eine bestimmte Anwendung
wird eine Ontologie zur zeitlichen Abstraktion benötigt. Sie basiert auf zeitmarkierten Daten, Zeitintervallen, Interpretationskontexten (Propositionen), Kontextintervallen (Interpretationskontexten
mit dazugehörigen Zeitintervallen), Ereignissen, Ereignisintervallen, Parametern, Abstraktionsfunktionen (welche auf Abstraktionen vom Typ Zustand, Änderung, Rate, Beschleunigung, Frequenz
usw. abbilden), Parameterintervallen, Abstraktionen (Parameterintervalle mit abstrakten Parametern), Abstraktionszielen, Abstraktionszielintervallen und Induktionen von Kontextintervallen. Diese
Aspekte sollen hier nicht beleuchtet werden (Shahars Arbeit enthält einen Formalismus, der ihre
Zusammenhänge verdeutlicht.)
Das System RÉSUMÉ enthält ein Modul zum zeitlichen Schließen, eine Datenbank mit der Ontologie der jeweiligen Anwendung und eine mit den Daten der zu betrachtenden Fälle. Mit dem
System können Graphiken erzeugt werden, die Scatterplots mit zusätzlichen Intervallhervorhebungen darstellen. Abbildung 1 zeigt eine solche Graphik von Blutzuckerwerten mit von RÉSUMÉ erzeugten Abstraktionen am oberen Rand. Interessant daran ist die Betrachtung der präprandialen
Blutzuckerwerte vor den drei Hauptmahlzeiten und symbolische Zusammenfassung der jeweiligen
Blutzuckerwerte (hinter der Beschriftung GLSS DM preprandial ).1 Darüber befindet sich die Darstellung des vorherrschenden Blutzuckerwertes vor dem Mittagessen im Betrachtungszeitraum (hoch)
und darüber ein Pfeil nach links für den Betrachtungszeitraum und schließlich am oberen Bildrand
die Hervorhebung des Diagnosezeitpunktes durch einen Pfeil nach rechts.
4.4
4.4.1
Montani, Bellazzi, Larizza und Riva
Arbeiten zur zeitlichen Abstraktion
Bellazzi und Mitarbeiter haben eine Reihe von Arbeiten zur Analyse von Diabetes-Daten veröffentlicht (s. u.a. [BLR97], [LBR97] und [BLR98]). Für das vorliegende Projekt interessant sind dabei die
vorkommenden zeitlichen Abstraktionen und die teilweise vorhandenen graphischen Darstellungen,
bei denen es sich hauptsächlich um Histogramme handelt.
Die Autoren nehmen Daten als Basis, die von Patienten selbst in einem Diabetes-Tagebuch erfasst
werden [LBR97]. Jeder Eintrag in diesem Tagebuch hat folgendes Schema:
• Tag
• Tageszeit (Uhrzeit oder symbolisch, z.B. Frühstück“, s. unten)
”
• Blutzuckerwert
• Urinzucker
• Reguläres Insulin
• NPH-Lente-Insulin (Verzögerungsinsulin)
• Mahlzeit
• Ereignisse (Hypoglykämie, Sport, Infektionen, etc.; häufig nicht erfasst)
1
Durch Buchstaben, N für normal“, L für niedrig“ und H für hoch“.
”
”
”
4
Abbildung 1: Résumé, s. [SM96] für eine ähnliche Darstellung
Der Tag ist in folgende nicht-überlappende Tageszeiten eingeteilt, deren Abbildung auf Zeitabschnitte je nach Patient unterschiedlich ist:
• Frühstück
• Vormittag
• Mittagessen
• Nachmittag
• Abendessen
• Schlafengehenszeit
• Nacht
Die Autoren benutzen zeitliche Abstraktion, um von den Zeitpunkt-basierten Rohdaten zu Zeitintervallen mit jeweils gleichen Eigenschaften zu gelangen (ebd., 321ff). Dazu werden den Messwerten
folgende symbolische Wertebereiche zugewiesen:
Datenwert
Blutzucker
NPH-Insulin
Urinzucker
Sport
symbolischer Datenbereich
Hypoglykämie, normal, Hyperglykämie
niedrig, normal, hoch
vorhanden, nicht vorhanden
normal, mehr als gewöhnlich
5
Aus diesen symbolischen Beschreibungen der Messwerte wird ein typisches Muster durch einfache
statistische Verfahren abgeleitet (also Auftreten von Hypo- und Hyperglykämie, etc.). Der jeweilige
zeitliche Verlauf wird dabei ignoriert, es werden nur Zeitdauern in Histogrammen erfasst (ebd., 327f).
Weiterhin werden für die Blutzucker- und die Insulinwerte Trendabstraktionen definiert (fallend,
gleichbleibend, steigend), die wie die vorherigen Abstraktionen zu einfachen Abstraktionen gehören.
Komplexe Abstraktionen basieren auf einfachen oder komplexen Abstraktionen und stellen deren
zeitlichen Zusammenhang dar (Überlappungen, Nebenläufigkeiten, etc.) (ebd., 322).
Möglicherweise interessant für die vorliegende Arbeit ist der Ansatz, wie Insulingaben und Blutzuckermesswerte in Verbindung gebracht werden. Letztere werden vereinfacht als Effekte von ersteren
verstanden. Für jede Insulingabe wird bestimmt, in welchem Zeitraum sie wirksam ist (ihre competent
time slice) (ebd., 323f). Dabei handelt es sich also um ein stark vereinfachtes Modell des Blutzuckerhaushaltes und einem seiner Faktoren, das aber durchaus der Heuristik entsprechen könnte, die
vermutlich auch Ärzte bei der Analyse von Diabetestagebüchern spontan anwenden (s. Abschnitt 4.5
für ein umfangreicheres Modell).
4.4.2
T-IDDM
Im EU-Projekt Telematic Management of Insulin Dependent Diabetes Mellitus“ (T-IDDM) wur”
de ein verteiltes System entwickelt, dessen Zielsetzung ähnlich der des vorliegenden ist, jedoch auf
Patientenseite stationäre Geräte einsetzt [MBP+ ]. Das T-IDDM-System sollte eine effektive und kostengünstige netzbasierte Technologie bereitstellen, mit der Patienten und Ärzte bei der Behandlung
von IDDM unterstützt werden.
Das System besteht aus Programmen für Ärzte (Medical Units, MUs bzw. Medical Workstations, MWs) und solchen für Patienten (Patient Units, PUs). Sie kommunizieren entweder über das
Telefonnetz oder das Internet. Patienten sammeln Daten über ihre Blutzuckerwerte, Mahlzeiten, Insulingaben und Zucker im Urin. Blutzuckerwerte werden von den Patienten in das PU-Programm
eingegeben oder über ein serielles Kabel aus Glukosemessgeräten übernommen. Die anderen Werte werden von den Patienten in das Programm eingegeben. Die genannten Daten können in einem
Scatterplot einzeln oder gemeinsam angezeigt werden.
Neben diesen eingegebenen und gemessenen Werte enthält das Programm auch einen von einem
Arzt erstellten Therapieplan mit Vorgaben zu Insulingaben und Diät. Es können die Vorgaben vom
Arzt und die tatsächliche Ausführung des Patienten verglichen werden. Die PU erlaubt weiterhin die
Übertragung von Daten und Emails an die MU. Es wird von einem zweiwöchentlichen Datenaustausch
ausgegangen. In Versuchsreihen war die Kommunikationsfrequenz höher, bei Kindern wiederum höher
als bei Erwachsenen. Das System wurde evaluiert. Es hat sich eine bessere Blutzuckerkontrolle ergeben
als ohne System. Das PU-Programm wurde auch auf einem Windows CE-PDA implementiert, diese
Version kam jedoch nicht zum Einsatz.
4.5
Mathematische Modelle: Beispiel AIDA von Lehmann
Für die Visualisierung wäre es sinnvoll, Daten wie Blutzucker und Insulin entsprechend ihres physiologischen Zusammenspiels gemeinsam darzustellen. Ein realistisches Modell der Blutzucker- und
Insulinwerte über die Zeit könnte dazu dienen, die beiden Datenarten in einem Zusammenhang zu
bringen und fehlende Zwischenwerte zu berechnen, so dass sich Wertekurven ergeben.
Das Modell AIDA von Lehmann ([EL94]) basiert rein auf Kohlenhydrateinnahmen und Insulingaben. Bei den vorliegenden Daten sind jedoch auch Glukosemesswerte vorhanden. Solche Werte
müssten als Stützwerte der errechneten Glukosekurve berücksichtigt werden. Bei AIDA werden weiterhin weder Blutzuckersenkung durch Sport noch die Absorbtionszeiten von Kohlenhydraten unterschiedlicher Nahrungsmittel berücksichtigt. Mit der Datenmodellierung zur Analyse beschäftigt sich
auch [BSSdN95].
6
5
Art und Struktur der Daten
Der vorliegende Bericht beschäftigt sich mit der Visualisierung zeitmarkierter Daten. Bei den Daten
handelt es sich grundsätzlich um solche von Kindern und Jugendlichen mit Diabetes Mellitus (Typ I).
Die Daten werden von den Patienten selbst mittels Messgeräten mehrmals täglich erhoben, in prinzipiell unregelmäßigen Abständen, häufig jedoch vor dem Essen. Die Kinder notieren die Messwerte
in einem Protokollbuch. Sie notieren häufig auch Angaben über Insulingaben, Hypoglukosegefühl,
Nahrungsaufnahme und sportliche Betätigung. Zu allen Werten wird die Zeit angegeben, an denen
sie erhoben wurden.2
5.1
Datenbereiche
Blutzucker Die international gebräuchliche Maßeinheit für den Blutzuckerspiegel ist Millimol pro
Liter, mmol/l. Eine ältere, aber sehr gebräuchliche Maßeinheit ist Milligramm pro Deziliter (mg/dl).
Umrechnung: 1 mmol/l = 18,02 mg/dl. In der Praxis können Blutzuckerwerte von etwa 30 bis 1000
mg/dl auftreten. Blutzuckerwerte werden maschinell bestimmt, mit einer Messungenauigkeit von etwa
5%. (Der Blutzuckerspiegel hängt von vielen Faktoren ab, s. S. 2, so dass ein isolierter Blutzuckerwert
wenig Aussagekraft hat.)
Insulin Insulin wird in Insulineinheiten (IE) angegeben. Falls die Art des Insulins und die Intention
der Gabe erfasst wurden, sollen sie auch dargestellt werden. Nach der Intention wird Basis, Bolus
und Korrektur unterschieden. Es gibt die folgenden Insulinarten:
1. kurz wirkendes Insulin
(a) normal
(b) ultraschnell
2. Verzögerungsinsulin
(a) normal
(b) Zn-Insulin (Semi-Lente)
Die genannten Insuline werden injiziert, weil sie im Verdauungstrakt zersetzt werden würden.
Mittlerweile existiert auch Insulin zur nasalen Verabreichung, dass aber z.Z. noch nicht verschrieben
wird (bzw. noch nicht auf dem Markt ist). Wenn dies der Fall sein sollte, ist es entsprechend zu
berücksichtigen.
Kohlenhydrate Kohlenhydrate werden in Broteinheiten (BEs) angegeben. Eine Pizza hat beispielsweise 8 BEs, eine Semmel 2 BEs. Kinder nehmen etwa 12 BEs pro Tag zu sich. 1 Broteinheit
erhöht den Blutzucker um 50-80 mg/dl. 1 IE (Insulineinheit) senkt den Blutzucker um ≈ 30-50
mg/dl, bei niedrigen Glukosewerten ist weniger, bei hohen BZ-Werten mehr Insulin erforderlich. Der
tägliche Insulinbedarf (für die konventionelle Therapie) beträgt 0,5-1,0 E/kg. Der Insulinbedarf pro
Broteinheit (für die intensivierte konventionelle Therapie) ist für jeden Patienten unterschiedlich und
schwankt mit der Tageszeit.
2
Häufig werden Blutzuckermessung, Insulininjektion und Kohlenhydrate einer Mahlzeit mit derselben Zeit notiert,
obwohl zwischen Injektion und Mahlzeit auf das Einsetzen der Insulinwirkung gewartet wird, der sogenannte Spritz”
Ess-Abstand“ eingehalten werden muss.
7
5.2
Datenformat
Als Datenformat wurde ein ASCII-Format mit einem Datensatz pro Zeile gewählt, wobei die einzelnen
Werte eines Datensatzes durch Tabulatorzeichen getrennt sind. Dieses Format wird im Folgenden CSL
genannt. Es gibt jeweils nur einen Datensatz einer bestimmten Uhrzeit.
Datenart
Datum
Zeit
BZ
N-Insulin
V-Insulin
BE
Sport
postprandial
Bemerkung
Format
tt.mm.jjjj
ss:mm
hh:mm
boolesch
Zeichenkette
Beschreibung
geht von 3:00 bis 2:59 (eigentlich des folgenden Tages)
Ganzzahl
Ganzzahl oder Fließpunktzahl mit .5 am Ende
Ganzzahl oder Fließpunktzahl mit .5 am Ende
Ganzzahl oder Fließpunktzahl mit .5 am Ende
Zeit als Fließpunktzahl
0, 1 oder leer (= 0)
nicht in Anführungszeichen eingeschlossen, darf kein Tabulatorzeichen enthalten
Wenn ein Eintrag nicht vorhanden ist, fehlt er einfach in dem entsprechenden Feld, es kommen also zwei Tabulatorzeichen nacheinander. Bei booleschen Werten bedeutet ein fehlender Eintrag falsch. Dezimalbrüche enthalten einen Punkt, kein Komma. Prinzipiell ist es bei der Erfassung
von Daten aus handgeschriebenen Protokollen auch möglich, dass die Uhrzeit fehlt. Diese soll nach
Angabe der beteiligten Ärzte interpoliert“ werden. Hypoglykämie wird implizit als niedriger Blut”
zuckerwert dargestellt, die Tatsache, dass die entsprechende Person ein Gefühl von Hypoglykämie
hatte wird nicht gesondert gespeichert und taucht in den Daten nicht auf, wenn die Person keine
Blutzuckermessung vorgenommen hat. Siehe Anhang B für einen Ausschnitt einer Datei im angegebenen Format. Es wurden vier Dateien im CSL-Format durch Erfassung von Einträgen in DiabetesTagebüchern erfasst. Ihre Namen lauten daten-010422.csl, daten-010429.csl, daten-010507.csl
und daten-010629.csl, die Ziffern geben jeweils das Datum an (als zweistelliges Jahr, Monat und
Datum).
5.3
AIM-Testdaten
Als Testdaten wurden neben den CSL-Daten auch die von dem 1994 AAAI Spring Symposium
”
on Artificial Intelligence in Medicine“ (AIM ’94) benutzt (s. [AIM94]). Diese Testdaten liegen als
70 Dateien vor. Einige Dateien besitzen jedoch Fehler (z.B. den Eintrag 0Hi an der Stelle eines
Blutzuckerwertes).
6
Visualisierung
Ziel ist einerseits die schnelle Überprüfbarkeit auf den Normalzustand der Werte, also die schnelle
Übersicht über viele Werte. Andererseits ist die sichere Erkennung von Ausreißerwerten erforderlich.
Bei den Benutzern handelt es sich um Kinderärzte, sie sind also mit der Problematik und den üblichen
Darstellungsformen und Visualisierungen der Daten vertraut.
In der Praxis werden häufig Tabellen, zur Visualisierung Graphdarstellungen benutzt. Dabei
handelt es sich um Liniengraphen, Scatterplots oder Histogramme. Insbesondere für die Darstellung
von Blutzuckerwerten sind Liniengraphen unangemessen, weil die Verbindung der relativ spärlich
vorhandenen Messpunkte durch Linien von den zugrundeliegenden Zyklen3 und möglicherweise vorhandenen, aber nicht erfassten extremen Schwankungen (z.B. durch den Somogyi-Effekt verursacht)
3
Die Frequenz des metabolischen Systems liegt bei 24 bzw. 48 Zyklen pro Tag für einfache Kohlenhydrate und 2 bis
4 Zyklen pro Tag für Fette und Proteine ([BSSdN95], 527ff, nach [Wor90]).
8
ablenkt. Scatterplots weisen diesen Nachteil nicht auf, bei eng zusammenliegenden Punkten ist jedoch
das Ablesen der zugrundeliegenden Messwerte schwierig.
6.1
Gesamtansicht
Es sollen Werte von vier Wochen auf einmal dargestellt werden, dies ist übersichtlich nur durch
Zusammenfassung möglich, sowohl von Zeitabschnitten als auch Wertebereichen. Die Gesamtschau
soll auch eine Statistik enthalten, wie oft Werte aus welchem Wertebereich aufgetreten sind.
Es wurde eine Zusammenfassung von Zeitabschnitten gewählt, die die folgende Tageseinteilung
ergibt:
3-8
8-11
11-14
14-17
17-20
20-3
Morgen (5h)
Vormittag (3h)
Mittag (3h)
Nachmittag (3h)
Abend (3h)
Nacht (7h)
Für die Uhrzeit sind also Werte von 3:00 bis 23:59 und von 0:00 bis 2:59 zulässig. Die Zeiten
von 0:00h bis 2:59h liegen nach 23:59h und gehören formal zum nächsten Tag, werden aber bei der
Darstellung dem Ende des aktuellen Tag angefügt, weil dies eher den Aufschreibgewohnheiten der
Patienten entspricht. Bei der Rechnung und Darstellung mit Zeiten und Tagen muss dies entsprechend
berücksichtigt werden! (In den implementierten Prototypen wird dieser Zeitübertrag nicht beachtet,
s. Abschnitt 7.)
Die Blutzuckerwerte werden ebenfalls eingeteilt, wie in Abschnitt 2 beschrieben. Werte werden
durch ausgefüllte Balken dargestellt (s. Abbildung 2). In der graphischen Darstellung dient der Normalbereich (s. Abschnitt 2) als Basis, er wird durch einen Rahmen optisch hervorgehoben. Balken
für Werte innerhalb des Normalbereiches und darüber beginnen an der unteren Linie des Rahmens,
Balken für Werte unterhalb des Normalbereiches beginnen entsprechend unterhalb der unteren Linie.
In jedem Zeitabschnitt wird der höchste Blutzuckerwert dargestellt, wenn Hypoglykämie vorlag, auch
der unterste Balken. Durch diese Visualisierung können Werte leicht nach Wochentagen verglichen
werden, weil gleiche Wochentage übereinander stehen. Nachteil der Visualisierung ist, dass Werte
desselben Tagesabschnitts unterschiedlicher Tage nur schlecht verglichen werden können.
Es wurde angedacht, die Balken so zu gestalten, dass deutlich wird, ob der dargestellte höhere Blutzuckerwert vor der Hypoglykämie aufgetreten ist oder nachher, z.B. durch halbe Balken in
der entsprechenden Reihenfolge. Praktisch lässt sich aber keine eindeutige Darstellung finden, weil
mehrere Hypoglykämien und andere Werte in einem Intervall vorhanden sein können.
Das Histogramm bezüglich der Wertebereiche erscheint als Streifen an einer Fensterseite. Fünf
farbige Streifen stellen jeweils einen Wertebereich dar, die relative Größe eines Streifens die relative
Häufigkeit von Werten in dem jeweiligen Bereich. Da Hypoglykämie immer dargestellt wird, wenn es
in einem Zeitabschnitt aufgetreten ist, werden insgesamt möglicherweise mehr Werte dargestellt, als
Zeitabschnitte vorhanden sind. Das Histogramm soll sich nur auf die dargestellten Werte beziehen.
6.2
Detailansicht
In der Detailansicht sollen neben Blutzuckerwerten auch die restlichen vorhandenen Daten dargestellt
werden. Angedacht ist eine Darstellung in einem Koordinatensystem mit Blutzucker nach oben und
Blutzucker und Insulineinheiten nach unten (s. Abbildung 3). Verschiedene Arten von Insulin könnten
in verschiedenen Farben dargestellt werden.
9
Abbildung 2: Prototyp mit Monatsdarstellung (Histogramm am rechten Rand ist im Original farbig)
7
Prototyp
Es wurde ein prototypisches Programm entwickelt, an dem einige der obigen Überlegungen erprobt wurden. Das Programm besitzt eine graphische Benutzungsoberfläche zur Anzeige, mit einem
Menü zur Auswahl einer Datei, die angezeigt werden soll.
7.1
Implementierte Funktionen
Das Programm besteht aus einem Fenster zur Anzeige von Blutzuckermessungen von 28 Tagen, 4
Wochen übereinander, jede Woche beginnend mit Montag (s. Abbildung 2). Jeder Tag wird in der
bereits beschriebenen Form angezeigt, also in 6 Tagesabschnitten, wobei die möglichen Messwerte in
5 Kategorien eingeteilt sind.
Wenn für einen Tag keine Werte vorhanden sind, wird nur der Normalrahmen“ und das Datum
”
dargestellt. Es werden die letzten vier Wochen gezeigt. Wenn die letzte Woche nicht auf einen Sonntag
endet, werden die auf den letzten Tag folgenden Tage als leere dargestellt. Die Datendarstellungen
nehmen die Fensterfläche (bis auf Rand und Beschriftungen) vollständig ein. Sie werden also auf die
verfügbare Fläche hochskaliert. (Nachteil: die Darstellungen werden je nach Fenstergröße verzerrt,
was zu unästhetischen Darstellungen führen kann.)
Es wurde mit der Einbettung von Detaildarstellungen in die Gesamtansicht experimentiert. Zur
Darstellung von Detail und Kontext wurden in den neunziger Jahren einige Arbeiten in einer, zwei
und drei Dimensionen durchgeführt (s. [LA94] für eine Übersicht). Für den hier vorgestellten Prototyp wurde ein nichtkontinuierlicher Zoom für Detaildarstellungen einzelner Tage entwickelt. Dieser
Zoom hat zwar immer noch den Nachteil, dass je nachdem, ob nicht ausgewählte Tage in einer Zeile
oder Spalte mit einem ausgewählten Tag liegen, sie horizontal, vertikal oder in beide Richtung verzerrt werden, im Gegensatz zum kontinuierlichen Zoom erfolgt die Verzerrung zumindest über die
entsprechende Richtung linear (s. Abbildung 4).
10
Blutzucker
6 (mg/dl)
0
-
Zeit
g
g
g
g
g
Kohlenhydrate (BE)
Insulin (IE)
e
Abbildung 3: Mögliche Detaildarstellung eines Tages von Blutzucker, Kohlenhydraten und Insulin
11
Abbildung 4: Prototyp mit Detaildarstellung zweier Tage
Das Programm ist in der Lage, Daten im CSL-Format einzulesen (s. Abschnitt 5.2). (Eine ältere
Version war in der Lage, Daten im AIM-Format, s. Abschnitt 5.3 einzulesen und Daten mit demselben
Zeitstempel zusammenzufassen.) Wenn sich in der ersten Zeile eine Überschrift befindet, so wird diese
überlesen. Es ist eine einfache Druckfunktion implementiert, die eine einzige Seite im Hochkantformat
ausdruckt, abhängig von der aktuellen Fenstergröße.
7.2
Fehlende Funktionen
• Interaktion mit der Darstellung.
• Darstellung von Insulingaben, Sport, aufgenommener Nahrung.
• Detaildarstellung eines Tages mit den obengenannten zusätzlichen Darstellungen.
• Ausdruck der Daten im Querformat, welches eher der Ausrichtung der Visualisierung entspricht
als das derzeit verwendete Hochformat; Anpassung an die aktuelle Papiergröße oder Verteilung
auf mehrere Bögen.
• Blättern und Scrollen in der Zeit.
• Text- oder Listendarstellung der Daten (wurde von den beteiligten Ärzten ausdrücklich geschwünscht).
• Patientenverwaltung (Bisher können nur einzelne Datendateien eingelesen werden, unabhängig
davon, zu welchem Patienten sie gehören.)
• Einfärbung der Blutzuckerwerte entsprechend der Farben des Histogramms, falls gewünscht.
12
8
8.1
Alternative Visualisierungen
Parallele Koordinaten
Parallele Koordinaten dienen der Darstellung von Tupeln mit mehr als zwei Dimensionen in der
Fläche (s. Abb. 5). Die entsprechende Darstellung wurde von Inselberg entwickelt ([Ins85], s.a.
[SM00]). Der Vorteil dieser Darstellung liegt darin, dass neben Zeit und Glukosewert weitere Dimensionen dargestellt werden können. Der Nachteil liegt darin, dass die zeitliche Ordnung verloren
geht (dies kann aber durch Darstellung der Zeit auf einer eigenen Achse teilweise behoben werden).
Weiterhin sind Samples mit gleichen Werten einer bestimmten Dimension optisch kaum getrennt,
und die Darstellungsform ist weniger bekannt als die klassischer Verfahren.
Abbildung 5 zeigt eine Darstellung von echten Patientendaten mittels parallelen Koordinaten. Die
Darstellung wurde mit xgobi erzeugt (http://www.research.att.com/areas/stat/xgobi). Die ersten
drei Linien zeigen drei verschiedene Zeiteinteilungen: fortlaufende Zeit, Zeit innerhalb der Woche
und Zeit innerhalb eines Tages. (Die Zeit innerhalb der Woche ist nicht auf Tage abgerundet, was
für parallele Koordinaten den Vorteil hat, dass die Werte auf der Achse verteilt sind.)
Abbildung 5: Beispiel für Darstellung von Diabetes-Werten durch parallele Koordinaten
8.2
Phillips-Kurve
In einfachen zweidimensionalen Darstellungen wie Scatterplots ohne Überlappungen kann neben der
unabhängigen Variablen Zeit nur eine abhängige Variable dargestellt werden. Überlappende Darstellungen andererseits, durch die die gleichzeitige Darstellung möglich ist, sind jedoch generell eher
13
unübersichtlich. Es gibt jedoch auch Vorbilder für die gemeinsame Darstellung zweier Variablen in
einer Graphik bei zusätzlicher andeutungsweisen Darstellung der Zeit. Abbildung 6 zeigt zwei Variablen über die Zeit in der Fläche (in diesem Fall Inflation und Arbeitslosigkeit). Mit dieser graphischen
Technik könnten z.B. Insulin und Broteinheiten gleichzeitig dargestellt werden. Im Gegensatz zu Liniengraphen kann es zu Überlappungen kommen, die die Darstellung wieder unübersichtlich machen
würden.
Abbildung 6: Darstellung der Veränderung zweier Variablen über die Zeit, in diesem Fall Inflation
und Arbeitslosigkeit ([Tuf83], 48)
14
8.3
Dreidimensionale Darstellung
In einer dreidimensionalen Darstellung kann eine dreiwertige Relation als eine einzige Graphik dargestellt werden. Es wurde mit der Darstellung von Blutzuckerwerten für zwei Zeiteinteilungen (Tageszeit und Wochentag) gleichzeitig experimentiert. Die Darstellung wurde mit dem IBM Data Explorer erzeugt (s. http://www.opendx.org). Der Data Explorer erlaubt die Darstellung in einer, zwei
und drei Dimensionen. Er ist voll programmierbar. Die Programmierung erfolgt in einer visuellen
Datenflusssprache. Die Programme werden in Textform abgespeichert und können in dieser Form
auch erstellt und editiert werden. Der Data Explorer kann Daten aus Textdateien einlesen und aus
Dateien mit Daten im Tabellenformat dreidimensionale Ansichten erzeugen. Leider gibt es keine
Unterstützung für die Verarbeitung von Zeit, sie kann prinzipiell jedoch selbst programmiert werden.
Abbildung 7: Blutzucker nach Stunde und Wochentag, Diagonalsicht
Die Abbildungen 7, 8 und 9 zeigen drei verschiedene Ansichten derselben 3D-Darstellung. Die
Darstellung wurde aus einer Datei mit zwei Zeiteinteilungen und Blutzuckerwerten im Tabellenformat
erzeugt. Bei den Zeiteinteilungen handelt es sich um die nach Wochentag (1 bis 7 für Montag bis
Sonntag) und Stunde (0 bis 24). Die Blutzuckerwerte werden sowohl durch die y-Achse als auch eine
Farbcodierung angegeben (der niedrigste Wert ist blau, der höchste rot).
Die Diagonaldarstellung (s. Abbildung 7) bietet eine Gesamtschau. Die Koordinaten können jedoch nur schwer abgelesen werden. In den Seitenansichten (Abbildungen 8 und 9) können die jewei15
Abbildung 8: Blutzucker nach Stunde
Abbildung 9: Blutzucker nach Wochentag
16
ligen Werte leicht abgelesen werden. Der Vorteil der dreidimensionalen Darstellung liegt darin, dass
zwischen verschiedenen Darstellungen übergangslos gewechselt werden kann. Für diese Manipulation
der Darstellung ist jedoch Erfahrung mit räumlichen Darstellungen notwendig; es ist fraglich, ob die
Zielgruppe dieses Projektes bereit ist, sich entsprechend einzuarbeiten.
Literatur
[AIM94]
AAAI Spring Symposium on Interpreting Clinical Data. Diabetes Data Set, 1994.
ftp://ftp.ics.uci.edu/pub/machine-learning-databases/diabetes/diabetes-data.tar.Z,
ftp://ftp.ci.tuwien.ac.at/pub/mirror/ics.uci/diabetes/diabetes-data.tar.Z.
[Ber73]
Bertin, J.: Semiologie Graphique. Gauthier-Villars, Paris, 2. Auflage, 1973.
[BLR97]
Bellazzi, R., C. Larizza und A. Riva: Temporal Abstractions for Pre-processing and
Interpreting Diabetes Monitoring Time Abstractions. In: Lavrac, N. (Herausgeber):
Intelligent Data Analysis in Medicine and Pharmacology, Workshop Notes of the IJCAI97 Workshop, Seiten 1–10, 1997.
[BLR98]
Bellazi, R., C. Larriza und A. Riva: Temporal Abstractions for Interpreting Diabetic
Patients Monitoring Data. Intelligent Data Analysis, 2(1-4):97–122, 1998.
[BSSdN95] Bellazzi, R., C. Siviero, M. Stefanelli und G. de Nicolao: Adaptive Controllers
for Intelligent Monitoring. Artificial Intelligence in Medicine, 7(6):515–540, 1995.
[CMS99]
Card, S.K., J. Mackinlay und B. Shneiderman (Herausgeber): Readings in Information Visualization: Using Vision to Think. Morgan Kaufmann, 1999.
[EL94]
E.D. Lehmann, T. Deutsch, E.R. Carson P.H. Sonksen: AIDA: an Interactive
Diabetes Advisor. Computer Methods and Programs in Biomedicine, 41:183–203, 1994.
[EW92]
Earnshaw, Rae A. und Norman Wiseman: An Introductory Guide to Scientific Visualization. Springer-Verlag, Berlin, Heidelberg, New York, 1992.
[HPU98]
Horn, W., C. Popow und L. Unterasinger: Metaphor Graphics to Visualize ICU
Data Over Time. In: Intelligent Data Analysis in Medicine and Pharmacology (IDAMAP98), Workshop Notes of the ECAI ’98 Workshop, 1998.
[Ins85]
Inselberg, A.: The Plane With Parallel Coordinates. The Visual Computer, 1:69–91,
1985.
[KHB+ 93] Kahn, Michael G., Dijia Huang, Stephen A. Bussmann, Steve B. Cousins,
Charlene A. Abrams und James C. Beard: Diabetes Data Analysis and Interpretation Method. US-Patent Nr. 5.251.126, 1993.
[LA94]
Leung, Y.K. und M.D. Apperley: A Review and Taxonomy of Distortion-oriented
Presentation Techniques. Transactions on Computer-Human Interaction, 1(2):126–160,
June 1994. Abgedruckt in [CMS99].
[LBR97]
Larizza, C., R. Bellazzi und A. Riva: Temporal Abstractions for Diabetic Patients
Management. In: Keravnou, E. (Herausgeber): Artificial Intelligence in Medicine 6th Conference on Artificial Intelligence in Medicine Europe (AIME’97), Seiten 319–330,
Berlin/Heidelberg/New York/Tokyo, 1997. Springer.
[MBP+ ]
Montani, S., R. Bellazzi, L. Portinale, A. Riva und M. Stefanelli: Multi-Modal
Reasoning in Diabetic Patient Management. In: Horn, W. (Herausgeber): Artificial
Intelligence in Medicine, Seiten 113–122, Berlin. Springer.
17
[REE+ 94] Rosenblum, L., R. Earnshaw, J. Encarnacao, H. Hagen, A. Kaufman, S. Klimenko, G. Nielson, F. Post und D. Thalmann: Scientific Visualization. Academic
Press, 1994.
[Sha97]
Shahar, Y.: A Framework for Knowledge-based Temporal Abstraction. Artificial Intelligence, 90(1-2):79–133, 1997.
[SM96]
Shahar, Y. und M.A. Musen: Knowledge-Based Temporal Abstraction in Clinical Domains. Artificial Intelligence in Medicine, 8(3):267–298, 1996.
[SM00]
Schumann, H. und W. Müller: Visualisierung: Grundlagen und allgemeine Methoden.
Springer, 2000.
[Tuf83]
Tufte, E.D.: The Visual Display of Quantitative Information. Graphics Press, Cheshire,
CT, 1983.
[Tuf90]
Tufte, E.D.: Envisioning Information. Graphics Press, Cheshire, CT, 1990.
[War00]
Ware, C.: Information visualization: perception for design. Morgan Kaufmann, San
Francisco, CA, 2000.
[Wor90]
Worthington, D.: The use of models in the self-management of insulin-dependent
diabetes mellitus. Comp. Meth. and Prog. in Biomed., 32:233–239, 1990. Zitiert in
[BSSdN95].
A
Glossar
Basis Insulingabe zur Grundversorgung, ohne Berücksichtigung der durch Mahlzeiten aufgenommenen Kohlenhydrate.
Bolus Zusätzliche Insulingabe, um einen erwarteten Anstieg des Blutzuckers auszugleichen, z.B.
vor dem Essen.
Dawn-Phänomen Morgendliche Hyperglykämie ohne nächtliche Hypoglykämie (wie sie beim →
Somogyi-Effekt der Fall ist).
HbA1c (hemoglobin A1c bzw. glycosylated hemoglobin) durchschnittliche Blutglukose über mehrere Monate (Glukose an Hemoglobin); entsprechender Test zur Bestimmung der durchschnittlichen
Blutglukose; andere Werte als bei Blutzuckermessung (in Prozent, 4–6% ist normal).
Hyperglykämie
Überzuckerung, Blutzucker oberhalb 250 mg/dl.
Hypoglykämie Unterzuckerung, Blutzucker unterhalb 50–60 mg/dl. (Für den Prototyp wurde die
Grenze auf 60 festgelegt.)
Somogyi-Effekt Überschießende Gegenregulation bei zu niedrigen Blutzuckerwerten (→ Hypoglykämie), v.a. nachts. Wurde laut Literatur früher für ziemlich häufig gehalten, heute jedoch nicht
mehr.
18
B
Beispiel für eine Datei mit zeitmarkierten Diabetes-Daten
Bei den im folgenden abgedruckten Daten handelt es sich um den Anfang der Datei daten-010422.csl.
Die Begriffe in der Überschriftszeile sind gegenüber der Originaldatei leicht gekürzt. Im Original lautet die Kopfzeile: Datum Zeit BZ N-Insulin V-Insulin BE Sport postprandial Bemerkung“, mit
”
jeweils einem Tabulatorzeichen zwischen den Begriffen.
Datum
12.03.2001
12.03.2001
12.03.2001
12.03.2001
12.03.2001
12.03.2001
12.03.2001
13.03.2001
13.03.2001
13.03.2001
13.03.2001
13.03.2001
13.03.2001
13.03.2001
13.03.2001
13.03.2001
13.03.2001
14.03.2001
14.03.2001
14.03.2001
14.03.2001
14.03.2001
14.03.2001
14.03.2001
14.03.2001
15.03.2001
15.03.2001
15.03.2001
15.03.2001
15.03.2001
15.03.2001
15.03.2001
15.03.2001
15.03.2001
16.03.2001
16.03.2001
16.03.2001
16.03.2001
16.03.2001
16.03.2001
16.03.2001
16.03.2001
16.03.2001
17.03.2001
17.03.2001
17.03.2001
17.03.2001
17.03.2001
Zeit
07:00
09:00
10:00
11:30
13:30
18:00
21:00
07:00
09:00
10:00
11:00
12:00
14:00
16:00
18:00
21:00
22:30
07:00
09:00
10:00
12:00
14:00
15:30
18:00
21:00
07:00
09:00
10:00
11:00
12:00
14:00
16:30
18:00
20:30
07:00
09:00
10:00
11:00
13:30
15:00
17:30
19:00
21:00
08:00
11:00
12:00
15:00
17:30
BZ
189
267
178
149
223
57
238
N-Ins.
3
V-Ins.
8
2
3
6
8
132
187
78
66
256
2
6
54
152
3
197
116
73
94
301
362
62
2
1
3
8
6
8
3
1
1
2
4
4.5
2
2
70
43
61
330
3
71
298
3.5
102
115
142
180
171
324
243
82
122
125
86
66
BE
1.5
1
1
3.5
3.5
1.5
3
1.5
1
1
1.5
2
4.5
1.5
2
1
3.5
1.5
1
1
3.5
3.5
2
2
6
8
Sport postprand.
Bemerkung
Ameisen
Ameisen
Ameisen
Ameisen
Kopfweh, muede
1.5
1
1
1.5
3.5
2
1
3
3
1
2.5
2
4.5
2
4
6
8
19
Ameisen
Zugehörige Unterlagen
Herunterladen