Visualisierung von Diabetesdaten Jochen Schneider 30. Oktober 2001 Zusammenfassung Die Arbeit zeigt Ergebnisse einer Designstudie auf, die sich mit der Visualisierung von Diabetesdaten befasst hat. Dabei stand die Frage im Vordergrund, wie dem behandelnden Arzt in rascher, übersichtlicher und intuitiv zu erfassender Form die Blutzuckerwerte der letzten Wochen eines Patienten präsentiert werden können. Zusätzlich stellt sich dann die Frage, wie an Problempunkten die weitern Daten (neben Blutzuckerwerten Insulingaben, Kohlehydrate und sportliche Aktivität) problemadäduat dargestellt werden können. Im Rahmen der Studie werden Möglichkeiten der Visualisierung exemplarisch aufgezeigt. Eine konkrete Visualisierungsform, die die Blutzuckerwerte von 4 Wochen in abstrahierter Form darstellt, wurde als Prototyp in Java realisiert. Die Studie ist Teil des Projekts Telemedicine, computer assisted data analysis and knowledgebased system support for improving glycemic control in adolescent type I diabetes. 1 Einführung Im Folgenden wird ein gemeinsames Projekt des Österreichischen Forschungsinstituts für Artificial Intelligence und des Instituts für Medizinische Kybernetik und Artificial Intelligence der Universitët Wien (Ansprechpartner: Prof. Dr. Werner Horn) und der Universitätskinderklinik des AKH Wien (Ansprechpartner: Prof. Dr. Christian Popow, Prof.Dr.Edith Schober) vorgestellt. Es beschäftigt sich mit der Sammlung und Visualisierung von Daten, welche für die Insulinbehandlung von Kindern und Jugendlichen mit Diabetes Mellitus relevant sind. Geplant ist, dass Blutzuckerwerte von einem Messgerät gespeichert und über Funk oder einen Desktop-PC und das Internet an den behandelnden Arzt übermittelt werden. Das entsprechende Verfahren steht noch nicht fest. In diesem Bericht wird geschildert, wie derart erhobene Daten visualisiert werden können. Zunächst wird der klinische Hintergrund des Projektes beschrieben. In Abschnitt 3 wird eine kurze Einführung in das Projekt selbst gegeben. In Abschnitt 4 werden verwandte Arbeiten besprochen. In Abschnitt 5 wird die Art und die Struktur der verwendeten Daten erläutert. In Abschnitt 6 werden Ansätze ihrer Visualisierung dargelegt. In Abschnitt 7 wird der enwickelte Prototyp besprochen. In Abschnitt 8 werden alternative Visualisierungsmöglichkeiten vorgestellt. Nach dem Literaturverzeichnis folgt ein kurzer Glossar und ein Auszug aus einer Datei mit zu visualisierenden Daten. 2 Klinischer Hintergrund Diabetes Mellitus ist eine Störung (v.a.) des Kohlenhydratstoffwechsels durch mangelnde Bildung des Hormons Insulin in der Bauchspeicheldrüse. Es werden zwei Arten unterschieden, Typ I und Typ II. Typ I ist die insulinabhängige Diabetes Mellitus (englisch: Insulin Dependent Diabetes Mellitus, IDDM). Sie ist chronisch, beginnt im Kindes- und Jugendalter auf und wird durch die regelmäßige Injektion von Insulin behandelt. Typ II tritt v.a. bei Älteren (aber auch bei übergewichtigen Jugendlichen und Schwangeren) auf. Sie kann in den meisten Fällen durch eine Diät behandelt werden. Die vorliegenden Ausführungen beziehen sich auf Diabetes Mellitus vom Typ I. 1 Nach dem Beginn und der Dauer ihrer Wirksamkeit wird schnell und langsam wirkendes Insulin unterschieden. Schnell wirkendes Insulin (auch reguläres, Normal- oder Altinsulin genannt) wird gewöhnlich nach jeder Mahlzeit injiziert. Es wirkt etwa 4-5h direkt nach Injektion, die stärkste Wirkung entfaltet es nach 2h. Verzögerungsinsulin (NPH- oder Lente-Insulin) wird gewöhnlich einoder zweimal pro Tag (z.B. morgens und abends) zur Herstellung eines Insulin-Grundspiegels injiziert. Es wirkt nach etwa 4h für etwa 8-16h. Langzeitinsulin schließlich wirkt etwa 24-32h. Es werden mehrere Insulin-basierte Therapien der Typ 1-Diabetes unterschieden: Die konventionelle, die intensivierte konventionelle (Basis-Bolus) und die Insulinpumpentherapie. Bei der konventionellen Therapie wird jeweils eine bestimmte Menge langsam und schnell wirkendes Insulin zu festgelegten Zeiten verabreicht. Die Menge und Zeiten werden bei der Einstellung des Patienten (im Krankenhaus) festgelegt. Später muss sich der Patient an die Zeiten und Mengen halten; seine Nahrung muss er ebenfalls nach einem bestimmten Schema einnehmen, in mehreren über den Tag verteilten Mahlzeiten. Bei der intensivierten konventionellen Therapie wird ebenfalls schnell und langsam wirkendes Insulin verwendet. Das langsam wirkende Insulin wird ein- oder zweimal pro Tag zur Grundversorgung, Basis“ genannt, verabreicht. Das schnell wirkende Insulin wird jeweils kurz vor den Mahlzeiten ” verabreicht, als sogenannter Bolus“, also normale Gabe zur Verarbeitung aufgenommener Gluko” se. Neben Basis und Bolus gibt es als weitere Intention der Insulinverabreichung die Korrektur“ ” zum Ausgleich zu hoher Werte bspw. nach einer umfangreicheren Mahlzeit. Als dritte Möglichkeit der Insulin-Therapie gibt es automatisch gesteuerte Pumpen, die für das vorliegende Projekt jedoch nicht relevant sind. Der Blutzuckerspiegel kann folgendermaßen bezüglich eines Normbereiches eingeteilt werden: Bereich < 60 mg/dl 60-180 mg/dl 180-250 mg/dl 250-350 mg/dl > 350 mg/dl Zustand Hypoglykämie normal Überzuckerung starke Überzuckerung sehr starke Überzuckerung Bei der Therapie wird der Blutzuckerspiegel über folgende Faktoren gesteuert: 1. Insulin (senkt den Blutzuckerspiegel) 2. Essen (erhöht den Blutzuckerspiegel) 3. Sport (senkt den Blutzuckerspiegel) Es existieren weitere Faktoren, die den Blutzuckerspiegel beeinflussen und nur bedingt steuerbar sind: 1. Infektionen 2. Stress 3. Somogyi-Effekt (siehe Glossar, S. 18) 3 Projekt Bei der Zielgruppe handelt es sich um Jugendliche mit Diabetes Mellitus vom Typ I. Ziel des Projektes ist es, ihre Therapie zu verbessern, also die Abweichungen ihrer Blutzuckerwerte vom Normalbereich zu minimieren. Diese Therapieverbesserung soll erfolgen, ohne die Frequenz der Arztbesuche (durchschnittlich alle 3-6 Monate) zu erhöhen. Erreicht werden soll dies durch weitgehend automatische 2 Übermittlung von Blutmesswerten bei jedem Messen an ein Gesundheitszentrum und dortige Überprüfung durch einen Arzt. Weiterhin sollen sonstige Daten wie Nahrungsaufnahme, Insulingaben, etc. vom Patienten selbst eingegeben und ebenfalls vom Arzt überprüft werden. Der Arzt beurteilt die erfassten Messwerte anhand von Visualisierungen und der zugrundeliegenden Zahlen. Der Patient erhält innerhalb kurzer Zeit eine Rückmeldung: • Bestätigung der erfolgreichen Einstellung • Empfehlungen für Verbesserungen von Insulindosis, Ernährung • Aufforderung zur Rücksprache mit dem behandelnden Arzt • Einweisung in ein Krankenhaus Die Hypothese für das Projekt lautet, dass die Einstellung mit der neuentwickelten Visualisierung schneller und besser beurteilt werden kann als durch die Konsultation von tabellenförmigen Datenblättern. Die Patienten, deren Einstellung mit Hilfe des Systems beurteilt werden, fühlen sich sicherer. Diese Hypothese soll in einer Evaluation überprüft werden. 4 4.1 Verwandte Arbeiten Horn, Popow, Unterasinger Die Autoren haben ein System zur Visualisierung von Daten erstellt, welche auf der Intensivstation zur Beatmung von Säuglingen auftreten [HPU98]. Dabei handelt es sich um Daten des Blutkreislaufes, der Atmung und der Flüssigkeitszu- und -abfuhr. Diese Daten werden quasi kontinuierlich erfasst. Bei der Beatmung wird zusätzlich zur Menge angegeben, ob der Säugling selbstständig atmet oder beatmet wird. Der Median der Daten einer Stunde werden als Glyph dargestellt. Dieser Glyph besteht aus geometrischen Elementen: einem Dreieck und drei Rechtecken. In die Elemente sind zusätzlich Striche und Zeichen eingetragen, die Menge und Art gewisser Beatmungsparameter angeben. 4.2 Kahn Kahn und Kollegen besitzen ein Patent auf eine Diabetes Data Analysis and Interpretation Me” thod“ [KHB+ 93]. Dabei werden Daten mit einem Glukosemeter erfasst und in einen PC geladen. (Es werden sowohl Daten über den Glukoselevel als auch über die Insulindosierung gespeichert.) Im PC werden die Daten analysiert. Dabei werden Korrespondenzen zwischen den Insulindosen und den Blutzuckerwerten statistisch ermittelt. Aus den analysierten Daten werden Reports generiert, sowohl als textliche Zusammenfassung als auch graphisch. Blutzuckerwerte werden u.a. in Form von Histogrammen dargestellt. Neben den Histogrammen werden auch der Durchschnitt und die Standardabweichung genannt. Die Messungen können auch jeweils so dargestellt werden, dass sie bestimmten Zeiten zugeordnet sind wie Tageszeiten (Frühstück, Mittagessen, Abendessen, Schlafengehenszeit) oder Wochenabschnitte (Wochentage gegenüber Wochenende). 4.3 Shahar Shahar hat ein wissensbasiertes System zur zeitlichen Abstraktion namens RÉSUMÉ entwickelt [Sha97]. Das System ist prinzipiell domänenunabhängig. (Neben Anwendungen im medizinischen Bereich für AIDS- und Diabetes-Therapien wurden auch Verkehrsflüsse damit analysiert.) Zeitliche Abstraktion wird folgendermaßen definiert: Given a set of time-stamped data, external events, and ” abstraction goals, produce abstractions of the data that interpret past and present states and trends 3 and that are relevant for the given set of goals“ (ebd.). Eine solche Abstraktion stellt also keine summarische Diagnose dar, sondern zeigt Zusammenhänge auf. Ein Beispiel für eine solche zeitliche Abstraktion bei der Behandlung eines AIDS-Patienten ist: Grade II anemia for 3 weeks in the ” context of administration of the drug AZT as part of clinical therapy protocol CCTG-522“ (ebd.). RÉSUMÉ basiert auf einer wissensbasierten zeitlichen Abstraktionstheorie, aus der eine entsprechende Methode abgeleitet wurde. Die Theorie ist anwendungsunabhängig und basiert auf Zeit, Ereignissen, Parametern und Interpretationszusammenhängen (ebd.). Für eine bestimmte Anwendung wird eine Ontologie zur zeitlichen Abstraktion benötigt. Sie basiert auf zeitmarkierten Daten, Zeitintervallen, Interpretationskontexten (Propositionen), Kontextintervallen (Interpretationskontexten mit dazugehörigen Zeitintervallen), Ereignissen, Ereignisintervallen, Parametern, Abstraktionsfunktionen (welche auf Abstraktionen vom Typ Zustand, Änderung, Rate, Beschleunigung, Frequenz usw. abbilden), Parameterintervallen, Abstraktionen (Parameterintervalle mit abstrakten Parametern), Abstraktionszielen, Abstraktionszielintervallen und Induktionen von Kontextintervallen. Diese Aspekte sollen hier nicht beleuchtet werden (Shahars Arbeit enthält einen Formalismus, der ihre Zusammenhänge verdeutlicht.) Das System RÉSUMÉ enthält ein Modul zum zeitlichen Schließen, eine Datenbank mit der Ontologie der jeweiligen Anwendung und eine mit den Daten der zu betrachtenden Fälle. Mit dem System können Graphiken erzeugt werden, die Scatterplots mit zusätzlichen Intervallhervorhebungen darstellen. Abbildung 1 zeigt eine solche Graphik von Blutzuckerwerten mit von RÉSUMÉ erzeugten Abstraktionen am oberen Rand. Interessant daran ist die Betrachtung der präprandialen Blutzuckerwerte vor den drei Hauptmahlzeiten und symbolische Zusammenfassung der jeweiligen Blutzuckerwerte (hinter der Beschriftung GLSS DM preprandial ).1 Darüber befindet sich die Darstellung des vorherrschenden Blutzuckerwertes vor dem Mittagessen im Betrachtungszeitraum (hoch) und darüber ein Pfeil nach links für den Betrachtungszeitraum und schließlich am oberen Bildrand die Hervorhebung des Diagnosezeitpunktes durch einen Pfeil nach rechts. 4.4 4.4.1 Montani, Bellazzi, Larizza und Riva Arbeiten zur zeitlichen Abstraktion Bellazzi und Mitarbeiter haben eine Reihe von Arbeiten zur Analyse von Diabetes-Daten veröffentlicht (s. u.a. [BLR97], [LBR97] und [BLR98]). Für das vorliegende Projekt interessant sind dabei die vorkommenden zeitlichen Abstraktionen und die teilweise vorhandenen graphischen Darstellungen, bei denen es sich hauptsächlich um Histogramme handelt. Die Autoren nehmen Daten als Basis, die von Patienten selbst in einem Diabetes-Tagebuch erfasst werden [LBR97]. Jeder Eintrag in diesem Tagebuch hat folgendes Schema: • Tag • Tageszeit (Uhrzeit oder symbolisch, z.B. Frühstück“, s. unten) ” • Blutzuckerwert • Urinzucker • Reguläres Insulin • NPH-Lente-Insulin (Verzögerungsinsulin) • Mahlzeit • Ereignisse (Hypoglykämie, Sport, Infektionen, etc.; häufig nicht erfasst) 1 Durch Buchstaben, N für normal“, L für niedrig“ und H für hoch“. ” ” ” 4 Abbildung 1: Résumé, s. [SM96] für eine ähnliche Darstellung Der Tag ist in folgende nicht-überlappende Tageszeiten eingeteilt, deren Abbildung auf Zeitabschnitte je nach Patient unterschiedlich ist: • Frühstück • Vormittag • Mittagessen • Nachmittag • Abendessen • Schlafengehenszeit • Nacht Die Autoren benutzen zeitliche Abstraktion, um von den Zeitpunkt-basierten Rohdaten zu Zeitintervallen mit jeweils gleichen Eigenschaften zu gelangen (ebd., 321ff). Dazu werden den Messwerten folgende symbolische Wertebereiche zugewiesen: Datenwert Blutzucker NPH-Insulin Urinzucker Sport symbolischer Datenbereich Hypoglykämie, normal, Hyperglykämie niedrig, normal, hoch vorhanden, nicht vorhanden normal, mehr als gewöhnlich 5 Aus diesen symbolischen Beschreibungen der Messwerte wird ein typisches Muster durch einfache statistische Verfahren abgeleitet (also Auftreten von Hypo- und Hyperglykämie, etc.). Der jeweilige zeitliche Verlauf wird dabei ignoriert, es werden nur Zeitdauern in Histogrammen erfasst (ebd., 327f). Weiterhin werden für die Blutzucker- und die Insulinwerte Trendabstraktionen definiert (fallend, gleichbleibend, steigend), die wie die vorherigen Abstraktionen zu einfachen Abstraktionen gehören. Komplexe Abstraktionen basieren auf einfachen oder komplexen Abstraktionen und stellen deren zeitlichen Zusammenhang dar (Überlappungen, Nebenläufigkeiten, etc.) (ebd., 322). Möglicherweise interessant für die vorliegende Arbeit ist der Ansatz, wie Insulingaben und Blutzuckermesswerte in Verbindung gebracht werden. Letztere werden vereinfacht als Effekte von ersteren verstanden. Für jede Insulingabe wird bestimmt, in welchem Zeitraum sie wirksam ist (ihre competent time slice) (ebd., 323f). Dabei handelt es sich also um ein stark vereinfachtes Modell des Blutzuckerhaushaltes und einem seiner Faktoren, das aber durchaus der Heuristik entsprechen könnte, die vermutlich auch Ärzte bei der Analyse von Diabetestagebüchern spontan anwenden (s. Abschnitt 4.5 für ein umfangreicheres Modell). 4.4.2 T-IDDM Im EU-Projekt Telematic Management of Insulin Dependent Diabetes Mellitus“ (T-IDDM) wur” de ein verteiltes System entwickelt, dessen Zielsetzung ähnlich der des vorliegenden ist, jedoch auf Patientenseite stationäre Geräte einsetzt [MBP+ ]. Das T-IDDM-System sollte eine effektive und kostengünstige netzbasierte Technologie bereitstellen, mit der Patienten und Ärzte bei der Behandlung von IDDM unterstützt werden. Das System besteht aus Programmen für Ärzte (Medical Units, MUs bzw. Medical Workstations, MWs) und solchen für Patienten (Patient Units, PUs). Sie kommunizieren entweder über das Telefonnetz oder das Internet. Patienten sammeln Daten über ihre Blutzuckerwerte, Mahlzeiten, Insulingaben und Zucker im Urin. Blutzuckerwerte werden von den Patienten in das PU-Programm eingegeben oder über ein serielles Kabel aus Glukosemessgeräten übernommen. Die anderen Werte werden von den Patienten in das Programm eingegeben. Die genannten Daten können in einem Scatterplot einzeln oder gemeinsam angezeigt werden. Neben diesen eingegebenen und gemessenen Werte enthält das Programm auch einen von einem Arzt erstellten Therapieplan mit Vorgaben zu Insulingaben und Diät. Es können die Vorgaben vom Arzt und die tatsächliche Ausführung des Patienten verglichen werden. Die PU erlaubt weiterhin die Übertragung von Daten und Emails an die MU. Es wird von einem zweiwöchentlichen Datenaustausch ausgegangen. In Versuchsreihen war die Kommunikationsfrequenz höher, bei Kindern wiederum höher als bei Erwachsenen. Das System wurde evaluiert. Es hat sich eine bessere Blutzuckerkontrolle ergeben als ohne System. Das PU-Programm wurde auch auf einem Windows CE-PDA implementiert, diese Version kam jedoch nicht zum Einsatz. 4.5 Mathematische Modelle: Beispiel AIDA von Lehmann Für die Visualisierung wäre es sinnvoll, Daten wie Blutzucker und Insulin entsprechend ihres physiologischen Zusammenspiels gemeinsam darzustellen. Ein realistisches Modell der Blutzucker- und Insulinwerte über die Zeit könnte dazu dienen, die beiden Datenarten in einem Zusammenhang zu bringen und fehlende Zwischenwerte zu berechnen, so dass sich Wertekurven ergeben. Das Modell AIDA von Lehmann ([EL94]) basiert rein auf Kohlenhydrateinnahmen und Insulingaben. Bei den vorliegenden Daten sind jedoch auch Glukosemesswerte vorhanden. Solche Werte müssten als Stützwerte der errechneten Glukosekurve berücksichtigt werden. Bei AIDA werden weiterhin weder Blutzuckersenkung durch Sport noch die Absorbtionszeiten von Kohlenhydraten unterschiedlicher Nahrungsmittel berücksichtigt. Mit der Datenmodellierung zur Analyse beschäftigt sich auch [BSSdN95]. 6 5 Art und Struktur der Daten Der vorliegende Bericht beschäftigt sich mit der Visualisierung zeitmarkierter Daten. Bei den Daten handelt es sich grundsätzlich um solche von Kindern und Jugendlichen mit Diabetes Mellitus (Typ I). Die Daten werden von den Patienten selbst mittels Messgeräten mehrmals täglich erhoben, in prinzipiell unregelmäßigen Abständen, häufig jedoch vor dem Essen. Die Kinder notieren die Messwerte in einem Protokollbuch. Sie notieren häufig auch Angaben über Insulingaben, Hypoglukosegefühl, Nahrungsaufnahme und sportliche Betätigung. Zu allen Werten wird die Zeit angegeben, an denen sie erhoben wurden.2 5.1 Datenbereiche Blutzucker Die international gebräuchliche Maßeinheit für den Blutzuckerspiegel ist Millimol pro Liter, mmol/l. Eine ältere, aber sehr gebräuchliche Maßeinheit ist Milligramm pro Deziliter (mg/dl). Umrechnung: 1 mmol/l = 18,02 mg/dl. In der Praxis können Blutzuckerwerte von etwa 30 bis 1000 mg/dl auftreten. Blutzuckerwerte werden maschinell bestimmt, mit einer Messungenauigkeit von etwa 5%. (Der Blutzuckerspiegel hängt von vielen Faktoren ab, s. S. 2, so dass ein isolierter Blutzuckerwert wenig Aussagekraft hat.) Insulin Insulin wird in Insulineinheiten (IE) angegeben. Falls die Art des Insulins und die Intention der Gabe erfasst wurden, sollen sie auch dargestellt werden. Nach der Intention wird Basis, Bolus und Korrektur unterschieden. Es gibt die folgenden Insulinarten: 1. kurz wirkendes Insulin (a) normal (b) ultraschnell 2. Verzögerungsinsulin (a) normal (b) Zn-Insulin (Semi-Lente) Die genannten Insuline werden injiziert, weil sie im Verdauungstrakt zersetzt werden würden. Mittlerweile existiert auch Insulin zur nasalen Verabreichung, dass aber z.Z. noch nicht verschrieben wird (bzw. noch nicht auf dem Markt ist). Wenn dies der Fall sein sollte, ist es entsprechend zu berücksichtigen. Kohlenhydrate Kohlenhydrate werden in Broteinheiten (BEs) angegeben. Eine Pizza hat beispielsweise 8 BEs, eine Semmel 2 BEs. Kinder nehmen etwa 12 BEs pro Tag zu sich. 1 Broteinheit erhöht den Blutzucker um 50-80 mg/dl. 1 IE (Insulineinheit) senkt den Blutzucker um ≈ 30-50 mg/dl, bei niedrigen Glukosewerten ist weniger, bei hohen BZ-Werten mehr Insulin erforderlich. Der tägliche Insulinbedarf (für die konventionelle Therapie) beträgt 0,5-1,0 E/kg. Der Insulinbedarf pro Broteinheit (für die intensivierte konventionelle Therapie) ist für jeden Patienten unterschiedlich und schwankt mit der Tageszeit. 2 Häufig werden Blutzuckermessung, Insulininjektion und Kohlenhydrate einer Mahlzeit mit derselben Zeit notiert, obwohl zwischen Injektion und Mahlzeit auf das Einsetzen der Insulinwirkung gewartet wird, der sogenannte Spritz” Ess-Abstand“ eingehalten werden muss. 7 5.2 Datenformat Als Datenformat wurde ein ASCII-Format mit einem Datensatz pro Zeile gewählt, wobei die einzelnen Werte eines Datensatzes durch Tabulatorzeichen getrennt sind. Dieses Format wird im Folgenden CSL genannt. Es gibt jeweils nur einen Datensatz einer bestimmten Uhrzeit. Datenart Datum Zeit BZ N-Insulin V-Insulin BE Sport postprandial Bemerkung Format tt.mm.jjjj ss:mm hh:mm boolesch Zeichenkette Beschreibung geht von 3:00 bis 2:59 (eigentlich des folgenden Tages) Ganzzahl Ganzzahl oder Fließpunktzahl mit .5 am Ende Ganzzahl oder Fließpunktzahl mit .5 am Ende Ganzzahl oder Fließpunktzahl mit .5 am Ende Zeit als Fließpunktzahl 0, 1 oder leer (= 0) nicht in Anführungszeichen eingeschlossen, darf kein Tabulatorzeichen enthalten Wenn ein Eintrag nicht vorhanden ist, fehlt er einfach in dem entsprechenden Feld, es kommen also zwei Tabulatorzeichen nacheinander. Bei booleschen Werten bedeutet ein fehlender Eintrag falsch. Dezimalbrüche enthalten einen Punkt, kein Komma. Prinzipiell ist es bei der Erfassung von Daten aus handgeschriebenen Protokollen auch möglich, dass die Uhrzeit fehlt. Diese soll nach Angabe der beteiligten Ärzte interpoliert“ werden. Hypoglykämie wird implizit als niedriger Blut” zuckerwert dargestellt, die Tatsache, dass die entsprechende Person ein Gefühl von Hypoglykämie hatte wird nicht gesondert gespeichert und taucht in den Daten nicht auf, wenn die Person keine Blutzuckermessung vorgenommen hat. Siehe Anhang B für einen Ausschnitt einer Datei im angegebenen Format. Es wurden vier Dateien im CSL-Format durch Erfassung von Einträgen in DiabetesTagebüchern erfasst. Ihre Namen lauten daten-010422.csl, daten-010429.csl, daten-010507.csl und daten-010629.csl, die Ziffern geben jeweils das Datum an (als zweistelliges Jahr, Monat und Datum). 5.3 AIM-Testdaten Als Testdaten wurden neben den CSL-Daten auch die von dem 1994 AAAI Spring Symposium ” on Artificial Intelligence in Medicine“ (AIM ’94) benutzt (s. [AIM94]). Diese Testdaten liegen als 70 Dateien vor. Einige Dateien besitzen jedoch Fehler (z.B. den Eintrag 0Hi an der Stelle eines Blutzuckerwertes). 6 Visualisierung Ziel ist einerseits die schnelle Überprüfbarkeit auf den Normalzustand der Werte, also die schnelle Übersicht über viele Werte. Andererseits ist die sichere Erkennung von Ausreißerwerten erforderlich. Bei den Benutzern handelt es sich um Kinderärzte, sie sind also mit der Problematik und den üblichen Darstellungsformen und Visualisierungen der Daten vertraut. In der Praxis werden häufig Tabellen, zur Visualisierung Graphdarstellungen benutzt. Dabei handelt es sich um Liniengraphen, Scatterplots oder Histogramme. Insbesondere für die Darstellung von Blutzuckerwerten sind Liniengraphen unangemessen, weil die Verbindung der relativ spärlich vorhandenen Messpunkte durch Linien von den zugrundeliegenden Zyklen3 und möglicherweise vorhandenen, aber nicht erfassten extremen Schwankungen (z.B. durch den Somogyi-Effekt verursacht) 3 Die Frequenz des metabolischen Systems liegt bei 24 bzw. 48 Zyklen pro Tag für einfache Kohlenhydrate und 2 bis 4 Zyklen pro Tag für Fette und Proteine ([BSSdN95], 527ff, nach [Wor90]). 8 ablenkt. Scatterplots weisen diesen Nachteil nicht auf, bei eng zusammenliegenden Punkten ist jedoch das Ablesen der zugrundeliegenden Messwerte schwierig. 6.1 Gesamtansicht Es sollen Werte von vier Wochen auf einmal dargestellt werden, dies ist übersichtlich nur durch Zusammenfassung möglich, sowohl von Zeitabschnitten als auch Wertebereichen. Die Gesamtschau soll auch eine Statistik enthalten, wie oft Werte aus welchem Wertebereich aufgetreten sind. Es wurde eine Zusammenfassung von Zeitabschnitten gewählt, die die folgende Tageseinteilung ergibt: 3-8 8-11 11-14 14-17 17-20 20-3 Morgen (5h) Vormittag (3h) Mittag (3h) Nachmittag (3h) Abend (3h) Nacht (7h) Für die Uhrzeit sind also Werte von 3:00 bis 23:59 und von 0:00 bis 2:59 zulässig. Die Zeiten von 0:00h bis 2:59h liegen nach 23:59h und gehören formal zum nächsten Tag, werden aber bei der Darstellung dem Ende des aktuellen Tag angefügt, weil dies eher den Aufschreibgewohnheiten der Patienten entspricht. Bei der Rechnung und Darstellung mit Zeiten und Tagen muss dies entsprechend berücksichtigt werden! (In den implementierten Prototypen wird dieser Zeitübertrag nicht beachtet, s. Abschnitt 7.) Die Blutzuckerwerte werden ebenfalls eingeteilt, wie in Abschnitt 2 beschrieben. Werte werden durch ausgefüllte Balken dargestellt (s. Abbildung 2). In der graphischen Darstellung dient der Normalbereich (s. Abschnitt 2) als Basis, er wird durch einen Rahmen optisch hervorgehoben. Balken für Werte innerhalb des Normalbereiches und darüber beginnen an der unteren Linie des Rahmens, Balken für Werte unterhalb des Normalbereiches beginnen entsprechend unterhalb der unteren Linie. In jedem Zeitabschnitt wird der höchste Blutzuckerwert dargestellt, wenn Hypoglykämie vorlag, auch der unterste Balken. Durch diese Visualisierung können Werte leicht nach Wochentagen verglichen werden, weil gleiche Wochentage übereinander stehen. Nachteil der Visualisierung ist, dass Werte desselben Tagesabschnitts unterschiedlicher Tage nur schlecht verglichen werden können. Es wurde angedacht, die Balken so zu gestalten, dass deutlich wird, ob der dargestellte höhere Blutzuckerwert vor der Hypoglykämie aufgetreten ist oder nachher, z.B. durch halbe Balken in der entsprechenden Reihenfolge. Praktisch lässt sich aber keine eindeutige Darstellung finden, weil mehrere Hypoglykämien und andere Werte in einem Intervall vorhanden sein können. Das Histogramm bezüglich der Wertebereiche erscheint als Streifen an einer Fensterseite. Fünf farbige Streifen stellen jeweils einen Wertebereich dar, die relative Größe eines Streifens die relative Häufigkeit von Werten in dem jeweiligen Bereich. Da Hypoglykämie immer dargestellt wird, wenn es in einem Zeitabschnitt aufgetreten ist, werden insgesamt möglicherweise mehr Werte dargestellt, als Zeitabschnitte vorhanden sind. Das Histogramm soll sich nur auf die dargestellten Werte beziehen. 6.2 Detailansicht In der Detailansicht sollen neben Blutzuckerwerten auch die restlichen vorhandenen Daten dargestellt werden. Angedacht ist eine Darstellung in einem Koordinatensystem mit Blutzucker nach oben und Blutzucker und Insulineinheiten nach unten (s. Abbildung 3). Verschiedene Arten von Insulin könnten in verschiedenen Farben dargestellt werden. 9 Abbildung 2: Prototyp mit Monatsdarstellung (Histogramm am rechten Rand ist im Original farbig) 7 Prototyp Es wurde ein prototypisches Programm entwickelt, an dem einige der obigen Überlegungen erprobt wurden. Das Programm besitzt eine graphische Benutzungsoberfläche zur Anzeige, mit einem Menü zur Auswahl einer Datei, die angezeigt werden soll. 7.1 Implementierte Funktionen Das Programm besteht aus einem Fenster zur Anzeige von Blutzuckermessungen von 28 Tagen, 4 Wochen übereinander, jede Woche beginnend mit Montag (s. Abbildung 2). Jeder Tag wird in der bereits beschriebenen Form angezeigt, also in 6 Tagesabschnitten, wobei die möglichen Messwerte in 5 Kategorien eingeteilt sind. Wenn für einen Tag keine Werte vorhanden sind, wird nur der Normalrahmen“ und das Datum ” dargestellt. Es werden die letzten vier Wochen gezeigt. Wenn die letzte Woche nicht auf einen Sonntag endet, werden die auf den letzten Tag folgenden Tage als leere dargestellt. Die Datendarstellungen nehmen die Fensterfläche (bis auf Rand und Beschriftungen) vollständig ein. Sie werden also auf die verfügbare Fläche hochskaliert. (Nachteil: die Darstellungen werden je nach Fenstergröße verzerrt, was zu unästhetischen Darstellungen führen kann.) Es wurde mit der Einbettung von Detaildarstellungen in die Gesamtansicht experimentiert. Zur Darstellung von Detail und Kontext wurden in den neunziger Jahren einige Arbeiten in einer, zwei und drei Dimensionen durchgeführt (s. [LA94] für eine Übersicht). Für den hier vorgestellten Prototyp wurde ein nichtkontinuierlicher Zoom für Detaildarstellungen einzelner Tage entwickelt. Dieser Zoom hat zwar immer noch den Nachteil, dass je nachdem, ob nicht ausgewählte Tage in einer Zeile oder Spalte mit einem ausgewählten Tag liegen, sie horizontal, vertikal oder in beide Richtung verzerrt werden, im Gegensatz zum kontinuierlichen Zoom erfolgt die Verzerrung zumindest über die entsprechende Richtung linear (s. Abbildung 4). 10 Blutzucker 6 (mg/dl) 0 - Zeit g g g g g Kohlenhydrate (BE) Insulin (IE) e Abbildung 3: Mögliche Detaildarstellung eines Tages von Blutzucker, Kohlenhydraten und Insulin 11 Abbildung 4: Prototyp mit Detaildarstellung zweier Tage Das Programm ist in der Lage, Daten im CSL-Format einzulesen (s. Abschnitt 5.2). (Eine ältere Version war in der Lage, Daten im AIM-Format, s. Abschnitt 5.3 einzulesen und Daten mit demselben Zeitstempel zusammenzufassen.) Wenn sich in der ersten Zeile eine Überschrift befindet, so wird diese überlesen. Es ist eine einfache Druckfunktion implementiert, die eine einzige Seite im Hochkantformat ausdruckt, abhängig von der aktuellen Fenstergröße. 7.2 Fehlende Funktionen • Interaktion mit der Darstellung. • Darstellung von Insulingaben, Sport, aufgenommener Nahrung. • Detaildarstellung eines Tages mit den obengenannten zusätzlichen Darstellungen. • Ausdruck der Daten im Querformat, welches eher der Ausrichtung der Visualisierung entspricht als das derzeit verwendete Hochformat; Anpassung an die aktuelle Papiergröße oder Verteilung auf mehrere Bögen. • Blättern und Scrollen in der Zeit. • Text- oder Listendarstellung der Daten (wurde von den beteiligten Ärzten ausdrücklich geschwünscht). • Patientenverwaltung (Bisher können nur einzelne Datendateien eingelesen werden, unabhängig davon, zu welchem Patienten sie gehören.) • Einfärbung der Blutzuckerwerte entsprechend der Farben des Histogramms, falls gewünscht. 12 8 8.1 Alternative Visualisierungen Parallele Koordinaten Parallele Koordinaten dienen der Darstellung von Tupeln mit mehr als zwei Dimensionen in der Fläche (s. Abb. 5). Die entsprechende Darstellung wurde von Inselberg entwickelt ([Ins85], s.a. [SM00]). Der Vorteil dieser Darstellung liegt darin, dass neben Zeit und Glukosewert weitere Dimensionen dargestellt werden können. Der Nachteil liegt darin, dass die zeitliche Ordnung verloren geht (dies kann aber durch Darstellung der Zeit auf einer eigenen Achse teilweise behoben werden). Weiterhin sind Samples mit gleichen Werten einer bestimmten Dimension optisch kaum getrennt, und die Darstellungsform ist weniger bekannt als die klassischer Verfahren. Abbildung 5 zeigt eine Darstellung von echten Patientendaten mittels parallelen Koordinaten. Die Darstellung wurde mit xgobi erzeugt (http://www.research.att.com/areas/stat/xgobi). Die ersten drei Linien zeigen drei verschiedene Zeiteinteilungen: fortlaufende Zeit, Zeit innerhalb der Woche und Zeit innerhalb eines Tages. (Die Zeit innerhalb der Woche ist nicht auf Tage abgerundet, was für parallele Koordinaten den Vorteil hat, dass die Werte auf der Achse verteilt sind.) Abbildung 5: Beispiel für Darstellung von Diabetes-Werten durch parallele Koordinaten 8.2 Phillips-Kurve In einfachen zweidimensionalen Darstellungen wie Scatterplots ohne Überlappungen kann neben der unabhängigen Variablen Zeit nur eine abhängige Variable dargestellt werden. Überlappende Darstellungen andererseits, durch die die gleichzeitige Darstellung möglich ist, sind jedoch generell eher 13 unübersichtlich. Es gibt jedoch auch Vorbilder für die gemeinsame Darstellung zweier Variablen in einer Graphik bei zusätzlicher andeutungsweisen Darstellung der Zeit. Abbildung 6 zeigt zwei Variablen über die Zeit in der Fläche (in diesem Fall Inflation und Arbeitslosigkeit). Mit dieser graphischen Technik könnten z.B. Insulin und Broteinheiten gleichzeitig dargestellt werden. Im Gegensatz zu Liniengraphen kann es zu Überlappungen kommen, die die Darstellung wieder unübersichtlich machen würden. Abbildung 6: Darstellung der Veränderung zweier Variablen über die Zeit, in diesem Fall Inflation und Arbeitslosigkeit ([Tuf83], 48) 14 8.3 Dreidimensionale Darstellung In einer dreidimensionalen Darstellung kann eine dreiwertige Relation als eine einzige Graphik dargestellt werden. Es wurde mit der Darstellung von Blutzuckerwerten für zwei Zeiteinteilungen (Tageszeit und Wochentag) gleichzeitig experimentiert. Die Darstellung wurde mit dem IBM Data Explorer erzeugt (s. http://www.opendx.org). Der Data Explorer erlaubt die Darstellung in einer, zwei und drei Dimensionen. Er ist voll programmierbar. Die Programmierung erfolgt in einer visuellen Datenflusssprache. Die Programme werden in Textform abgespeichert und können in dieser Form auch erstellt und editiert werden. Der Data Explorer kann Daten aus Textdateien einlesen und aus Dateien mit Daten im Tabellenformat dreidimensionale Ansichten erzeugen. Leider gibt es keine Unterstützung für die Verarbeitung von Zeit, sie kann prinzipiell jedoch selbst programmiert werden. Abbildung 7: Blutzucker nach Stunde und Wochentag, Diagonalsicht Die Abbildungen 7, 8 und 9 zeigen drei verschiedene Ansichten derselben 3D-Darstellung. Die Darstellung wurde aus einer Datei mit zwei Zeiteinteilungen und Blutzuckerwerten im Tabellenformat erzeugt. Bei den Zeiteinteilungen handelt es sich um die nach Wochentag (1 bis 7 für Montag bis Sonntag) und Stunde (0 bis 24). Die Blutzuckerwerte werden sowohl durch die y-Achse als auch eine Farbcodierung angegeben (der niedrigste Wert ist blau, der höchste rot). Die Diagonaldarstellung (s. Abbildung 7) bietet eine Gesamtschau. Die Koordinaten können jedoch nur schwer abgelesen werden. In den Seitenansichten (Abbildungen 8 und 9) können die jewei15 Abbildung 8: Blutzucker nach Stunde Abbildung 9: Blutzucker nach Wochentag 16 ligen Werte leicht abgelesen werden. Der Vorteil der dreidimensionalen Darstellung liegt darin, dass zwischen verschiedenen Darstellungen übergangslos gewechselt werden kann. Für diese Manipulation der Darstellung ist jedoch Erfahrung mit räumlichen Darstellungen notwendig; es ist fraglich, ob die Zielgruppe dieses Projektes bereit ist, sich entsprechend einzuarbeiten. Literatur [AIM94] AAAI Spring Symposium on Interpreting Clinical Data. Diabetes Data Set, 1994. ftp://ftp.ics.uci.edu/pub/machine-learning-databases/diabetes/diabetes-data.tar.Z, ftp://ftp.ci.tuwien.ac.at/pub/mirror/ics.uci/diabetes/diabetes-data.tar.Z. [Ber73] Bertin, J.: Semiologie Graphique. Gauthier-Villars, Paris, 2. Auflage, 1973. [BLR97] Bellazzi, R., C. Larizza und A. Riva: Temporal Abstractions for Pre-processing and Interpreting Diabetes Monitoring Time Abstractions. In: Lavrac, N. (Herausgeber): Intelligent Data Analysis in Medicine and Pharmacology, Workshop Notes of the IJCAI97 Workshop, Seiten 1–10, 1997. [BLR98] Bellazi, R., C. Larriza und A. Riva: Temporal Abstractions for Interpreting Diabetic Patients Monitoring Data. Intelligent Data Analysis, 2(1-4):97–122, 1998. [BSSdN95] Bellazzi, R., C. Siviero, M. Stefanelli und G. de Nicolao: Adaptive Controllers for Intelligent Monitoring. Artificial Intelligence in Medicine, 7(6):515–540, 1995. [CMS99] Card, S.K., J. Mackinlay und B. Shneiderman (Herausgeber): Readings in Information Visualization: Using Vision to Think. Morgan Kaufmann, 1999. [EL94] E.D. Lehmann, T. Deutsch, E.R. Carson P.H. Sonksen: AIDA: an Interactive Diabetes Advisor. Computer Methods and Programs in Biomedicine, 41:183–203, 1994. [EW92] Earnshaw, Rae A. und Norman Wiseman: An Introductory Guide to Scientific Visualization. Springer-Verlag, Berlin, Heidelberg, New York, 1992. [HPU98] Horn, W., C. Popow und L. Unterasinger: Metaphor Graphics to Visualize ICU Data Over Time. In: Intelligent Data Analysis in Medicine and Pharmacology (IDAMAP98), Workshop Notes of the ECAI ’98 Workshop, 1998. [Ins85] Inselberg, A.: The Plane With Parallel Coordinates. The Visual Computer, 1:69–91, 1985. [KHB+ 93] Kahn, Michael G., Dijia Huang, Stephen A. Bussmann, Steve B. Cousins, Charlene A. Abrams und James C. Beard: Diabetes Data Analysis and Interpretation Method. US-Patent Nr. 5.251.126, 1993. [LA94] Leung, Y.K. und M.D. Apperley: A Review and Taxonomy of Distortion-oriented Presentation Techniques. Transactions on Computer-Human Interaction, 1(2):126–160, June 1994. Abgedruckt in [CMS99]. [LBR97] Larizza, C., R. Bellazzi und A. Riva: Temporal Abstractions for Diabetic Patients Management. In: Keravnou, E. (Herausgeber): Artificial Intelligence in Medicine 6th Conference on Artificial Intelligence in Medicine Europe (AIME’97), Seiten 319–330, Berlin/Heidelberg/New York/Tokyo, 1997. Springer. [MBP+ ] Montani, S., R. Bellazzi, L. Portinale, A. Riva und M. Stefanelli: Multi-Modal Reasoning in Diabetic Patient Management. In: Horn, W. (Herausgeber): Artificial Intelligence in Medicine, Seiten 113–122, Berlin. Springer. 17 [REE+ 94] Rosenblum, L., R. Earnshaw, J. Encarnacao, H. Hagen, A. Kaufman, S. Klimenko, G. Nielson, F. Post und D. Thalmann: Scientific Visualization. Academic Press, 1994. [Sha97] Shahar, Y.: A Framework for Knowledge-based Temporal Abstraction. Artificial Intelligence, 90(1-2):79–133, 1997. [SM96] Shahar, Y. und M.A. Musen: Knowledge-Based Temporal Abstraction in Clinical Domains. Artificial Intelligence in Medicine, 8(3):267–298, 1996. [SM00] Schumann, H. und W. Müller: Visualisierung: Grundlagen und allgemeine Methoden. Springer, 2000. [Tuf83] Tufte, E.D.: The Visual Display of Quantitative Information. Graphics Press, Cheshire, CT, 1983. [Tuf90] Tufte, E.D.: Envisioning Information. Graphics Press, Cheshire, CT, 1990. [War00] Ware, C.: Information visualization: perception for design. Morgan Kaufmann, San Francisco, CA, 2000. [Wor90] Worthington, D.: The use of models in the self-management of insulin-dependent diabetes mellitus. Comp. Meth. and Prog. in Biomed., 32:233–239, 1990. Zitiert in [BSSdN95]. A Glossar Basis Insulingabe zur Grundversorgung, ohne Berücksichtigung der durch Mahlzeiten aufgenommenen Kohlenhydrate. Bolus Zusätzliche Insulingabe, um einen erwarteten Anstieg des Blutzuckers auszugleichen, z.B. vor dem Essen. Dawn-Phänomen Morgendliche Hyperglykämie ohne nächtliche Hypoglykämie (wie sie beim → Somogyi-Effekt der Fall ist). HbA1c (hemoglobin A1c bzw. glycosylated hemoglobin) durchschnittliche Blutglukose über mehrere Monate (Glukose an Hemoglobin); entsprechender Test zur Bestimmung der durchschnittlichen Blutglukose; andere Werte als bei Blutzuckermessung (in Prozent, 4–6% ist normal). Hyperglykämie Überzuckerung, Blutzucker oberhalb 250 mg/dl. Hypoglykämie Unterzuckerung, Blutzucker unterhalb 50–60 mg/dl. (Für den Prototyp wurde die Grenze auf 60 festgelegt.) Somogyi-Effekt Überschießende Gegenregulation bei zu niedrigen Blutzuckerwerten (→ Hypoglykämie), v.a. nachts. Wurde laut Literatur früher für ziemlich häufig gehalten, heute jedoch nicht mehr. 18 B Beispiel für eine Datei mit zeitmarkierten Diabetes-Daten Bei den im folgenden abgedruckten Daten handelt es sich um den Anfang der Datei daten-010422.csl. Die Begriffe in der Überschriftszeile sind gegenüber der Originaldatei leicht gekürzt. Im Original lautet die Kopfzeile: Datum Zeit BZ N-Insulin V-Insulin BE Sport postprandial Bemerkung“, mit ” jeweils einem Tabulatorzeichen zwischen den Begriffen. Datum 12.03.2001 12.03.2001 12.03.2001 12.03.2001 12.03.2001 12.03.2001 12.03.2001 13.03.2001 13.03.2001 13.03.2001 13.03.2001 13.03.2001 13.03.2001 13.03.2001 13.03.2001 13.03.2001 13.03.2001 14.03.2001 14.03.2001 14.03.2001 14.03.2001 14.03.2001 14.03.2001 14.03.2001 14.03.2001 15.03.2001 15.03.2001 15.03.2001 15.03.2001 15.03.2001 15.03.2001 15.03.2001 15.03.2001 15.03.2001 16.03.2001 16.03.2001 16.03.2001 16.03.2001 16.03.2001 16.03.2001 16.03.2001 16.03.2001 16.03.2001 17.03.2001 17.03.2001 17.03.2001 17.03.2001 17.03.2001 Zeit 07:00 09:00 10:00 11:30 13:30 18:00 21:00 07:00 09:00 10:00 11:00 12:00 14:00 16:00 18:00 21:00 22:30 07:00 09:00 10:00 12:00 14:00 15:30 18:00 21:00 07:00 09:00 10:00 11:00 12:00 14:00 16:30 18:00 20:30 07:00 09:00 10:00 11:00 13:30 15:00 17:30 19:00 21:00 08:00 11:00 12:00 15:00 17:30 BZ 189 267 178 149 223 57 238 N-Ins. 3 V-Ins. 8 2 3 6 8 132 187 78 66 256 2 6 54 152 3 197 116 73 94 301 362 62 2 1 3 8 6 8 3 1 1 2 4 4.5 2 2 70 43 61 330 3 71 298 3.5 102 115 142 180 171 324 243 82 122 125 86 66 BE 1.5 1 1 3.5 3.5 1.5 3 1.5 1 1 1.5 2 4.5 1.5 2 1 3.5 1.5 1 1 3.5 3.5 2 2 6 8 Sport postprand. Bemerkung Ameisen Ameisen Ameisen Ameisen Kopfweh, muede 1.5 1 1 1.5 3.5 2 1 3 3 1 2.5 2 4.5 2 4 6 8 19 Ameisen