Wissensbasierte Diagnosesysteme Sibylle Schwarz Westsächsische Hochschule Zwickau Dr. Friedrichs-Ring 2a, RII 263 http://wwwstud.fh-zwickau.de/~sibsc/ [email protected] WS 2011/2012 Motivation Ziel: Hilfe beim schnellen und fehlerfreien Treffen von Entscheidungen (z.B. in medizinischen Fragen) Analogie zum menschlichen Denken Grundlegende Fragen: I Was ist Wissen? I Wie lässt es sich darstellen? I Wie wird es genutzt, um Probleme zu lösen? I Wie lässt es sich erweitern / ändern? Einordnung in die Informatik Informatik Lehre von Darstellung und Verarbeitung von Information Information (neue) Auskunft über ein Ereignis, einen Tatbestand oder einen Sachverhalt, Beseitigung von Ungewissheit Einordnung in die Teilgebiete der Informatik: theoretische Informatik: Grundlagen Logik, formale Sprachen technische Informatik: Anwendung technische Diagnose, z.B. Hardware praktische Informatik: Grundlagen Algorithmen für Suche, Planen, Regelauswertung angewandte Informatik: Grundlagen Expertensysteme, Wissensverarbeitende Systeme, Datenbanken Anwendung, z.B. in Medizin Inhalt der Lehrveranstaltung I I Daten, Information, Wissen Wissensrepräsentation I I I I Wiederholung Logik (Aussagen- und Prädikatenlogik) Entscheidungsbäume, BDDs, Entscheidungstabellen Regelsysteme Wissensverarbeitung (Problemlösen) I I I Entscheidungsunterstützung Klassifizierung Planung I Darstellung und Verarbeitung unsicheren und unscharfen Wissens I Ontologien, Beschreibungslogik Literatur Folien zur aktuellen Vorlesung unter http://wwwstud.fh-zwickau.de/~sibsc/lehre/ ws11/wbds/ Bücher zu wissensbasierten Systemen: I Cord Spreckelsen, Klaus Spitzer: Wissensbasen und Expertensysteme in der Medizin (Teubner, 2008) I Ingo Boersch, Jochen Heinsohn, Rolf Socher: Wissensverarbeitung (Spektrum, 2007) I Ronald Brachman, Hector Levesque: Knowledge Representation and Reasoning (Morgan Kaufmann 2004) I Stuart Russell, Peter Norvig: Künstliche Intelligenz (Pearson 2004) I George Luger: Künstliche Intelligenz (Pearson 2001) Expertensystemshell d3web: I http://d3web.sourceforge.net/ Organisation der Lehrveranstaltung Vorlesungen bis Weihnachten 5 Termine, jeweils Doppel-LV: I Vorlesung I schriftliche Übungen praktische Einführung in Expertensystem-Shell d3web Praktikum im Januar 2012 (Vorleistung) I Diagnosesystem zu einem (medizinischen) Thema Ihrer Wahl (vor Weihnachten angeben) I Gruppen zu je zwei Studenten I Präsentation aller Projekte am 24.1.2012, je Gruppe 20-30 min Vortrag, 10-15 min Diskussion mündliche Prüfung: 30 min (zusammen mit „Medizinische Terminologie“) Intelligente Systeme Umwelt System Eindrücke, Reize Wahrnehmen, Beobachten Daten Erkennen, Verstehen Information Anwenden, Können Wissen Lernen, Reflektieren Intelligenz Wissen, Information, Daten Daten Darstellungsform (Syntax) Zeichenketten, Bilder, Ton, . . . Information Bedeutung der Daten (Semantik) in einem bestimmten Kontext Wissen Information mit einem Nutzen Anwendung beim Problemlösen Beispiel: Daten: Information: Wissen: 39.7 Körpertemperatur= 39.7◦ Fieber (behandeln) Fakten- und Regelwissen Faktenwissen Fakten, Aussagen, Zusammenhänge, . . . Beispiel: I Tom ist ein Kind von Paul. I Paul ist ein Kind von Anton. Regelwissen kann zur Problemlösung (z.B. durch Herleitung neuen Wissens) angewendet werden Regeln, Algorithmen, Funktionen, . . . Beispiel: I Jedes Kind eines Kindes einer Person X ist ein Enkel von X . Aber: Repräsentationen von Regeln und Funktionen sind auch Daten. (deklarative Programmierung) Explizites und implizites Wissen implizit „unbewusst“ angewendtes Wissen z.B. Bewegungsabläufe, Erkennen von Personen (Objekten), Reflexe explizit kommunizierbares Wissen oft formale Darstellung z.B. Personendaten, Gebrauchsanweisung, Spielregeln Lernvorgänge sind oft Transformationen explizites → implizites Wissen z.B. Autofahren, Grammatik in Fremdsprachen zur maschinellen Wissensverarbeitung ist explizites Wissen notwendig Transformation notwendig: implizites → explizites Wissen anspruchsvoll, nicht immer möglich Wissensbasis Ziel: geeignete Darstellung des Wissens über einen bestimmten Anwendungsbereich Methode: Formalisierung, symbolische Darstellung spezielle Form der Daten in der Wissensbasis abhängig von I Problembereich I geplante Verwendung Wissensbasis Wissen in Wissensbasis ist immer Abstraktion, beschreibt Modelle der Realität I Auswahl von (für den Anwendungsbereich) wichtigem Wissen I Vernachlässigung unwichtiger Details Beispiele: I Liniennetzplan I Grundriss I Stundenplan I Kostenplan I Patientenakte Wissensrepräsentation Repräsentation des Wissens über einen Problembereich Ziele: I für Problembereiche und Aufgabenstellung geeigneter Repräsentationsformalismus (Sprache mit Syntax und Semantik) I geeignete Begriffswelt (Ontologie) I geeignete Verfahren zur Verarbeitung des formalisierten Wissens (z.B. logisches Schließen) Expertenwissen I fachspezifisches Wissen in einem Anwendungsgebiet I Fähigkeit zur Lösung von speziellen Problemen auf diesem Gebiet (Kenntnis fachspezifischer Problemlöseverfahren) I Dialogfähigkeit I Fähigkeit, geeignete Rückfragen zu stellen I Einordnung in Kontextwissen (z.B. Alltagswissen) I Kenntnis der Grenzen des eigenen Wissens I Lernfähigkeit (Fachliteratur, Gespräche) Welche dieser Eigenschaften lassen sich mechanisieren? Wissensverarbeitung I kombinatorische Suchprobleme I I algorithmische Suche in Zustandsräumen logisches Schließen Beispiel: n-Damen-Problem, kürzeste Wege in Graphen I Planen Finden einer Folge von Aktionen zum Erreichen eines Zieles Beispiel: morgens Ankleiden I Klassifikation Finden von Klassen (Diagnosen) anhand der Merkmalswerte (Symptome) Beispiel: Fahrzeugtypen, Krankheiten I Entscheidungsunterstützung Bispiel: Kreditvergabe, Auswahl von Therapien, Auswahl von Spielzügen Wissensbasierte Systeme Zentrale Komponenten: I Wissensbasis I Problemlösekomponente Hilfs-Komponenten, z.B. für Interview Abfrage fallspezifischer Information Nutzer-Dialog Erklärung Begründung der vorgeschlagenen Lösung Nutzer-Dialog Wissenserwerb konsistente Erweiterung der Wissensbasis Experten-Dialog Anwendungsbereiche Analyse-Probleme ,z.B. I medizinische Diagnosen I technische Diagnosen I Überwachung technischer Vorgänge Synthese-Probleme ,z.B. I Beratung (z.B. Finanzprodukte) I Planung I Konfiguration Klassische medizinische Expertensysteme MYCIN (1976) bakterielle Infektionskrankheiten Trennung von Wissensbasis und Problemlösekomponente gewichtete Regeln, Rückwärtsverkettung PIP (1976) Nierenkrankheiten simuliert das differentialdiagnostische Vorgehen des Arztes Ein- und Ausschlusskriterien CASNET (1978) Augenkrankheiten strukturierte Wissensbasis, kausales Netz INTERNIST-1/CADUCEUS (1982) innere Medizin Generierung und schrittweiser Ausschluss von Verdacht-Diagnosen anhand Merkmalskombinationen, gezielte Rückfragen APACHE III (1991) Sterberisiko in Intensivmedizin dauerhaft eingesetzt, kommerziell erfolgreich Kombination gewichteter Merkmalswerte Moderne Einsatzgebiete wissensverarbeitender Systeme im klinischen Routineeinsatz I akutmedizinische Systeme (z.B. Überwachung, Beatmung) I Entscheidungsunterstützung (z.B. bei Bluthochdruck) I Interpretation von Labortests I Systeme zu medizinischen Bildverarbeitung I Administration I Aus- und Weiterbildung (z.B. Training an simulierten Fällen) I Qualitätssicherung Anforderungen für den Einsatz im medizinischen Alltag I Datenintegration: Nutzung vorhandener Daten, z.B über Patienten, Krankheiten, Therapien I Funktionsintegration in Standardprozesse im Krankenhaus-Informationsmanagement I Kompetenzintegration effektive Kombination der Kompetenzfelder von Arzt und Maschine, passende Interaktionsmodelle Voraussetzungen für medizinischen Einsatz technisch: I genügend aussagefähige Modelle für Diagnose und Therapie (fachliche und theoretische Grundlagen) I zuverlässige Verarbeitung unsicheren Wissens I leistungsstarke und zuverlässige Geräte (z.B. Sensoren, Messgeräte, Rechner) I IT-Infrastruktur in medizinischen Einrichtungen, Datenintegration I regelmäßige Aktualisierung psychologisch: I Bedarf I Referenzmodelle I Effektivitätssteigerung gegenüber klinischen Routinen tatsächlicher Einsatz selten, wegen I Mangel an Vertrauen in maschinelle Verfahren I hohen Entwicklungskosten Qualitätskriterien der Wissensbasis I für Problembereich geeignete Abstraktion enthält keine unwichtigen Informationen I vollständig enthält alle zur Problemlösung notwendigen Informationen I effektiv, redundanzfrei enthält keinen Informationen, die sich ableiten lassen I verständlich I erweiterbar Repräsentationsformalismen Anforderungen: I hinreichende Ausdrucksstärke I syntaktisch und semantisch eindeutig I Möglichkeit der maschinellen Verarbeitung I klassische Aussagenlogik AL(P) I I I I klassische Prädikatenlogik (der ersten Stufe) FOL I I I I hinreichende Ausdrucksstärke: oft ja syntaktisch und semantisch eindeutig: ja Möglichkeit der maschinellen Verarbeitung: ja (algorithmische Entscheidbarkeit) hinreichende Ausdrucksstärke: meist ja syntaktisch und semantisch eindeutig: ja Möglichkeit der maschinellen Verarbeitung: meist ja (Unentscheidbarkeit) Alternativen: nichtklassische Logiken, z.B. I I Modallogik, Beschreibungslogiken, Temporallogiken mehrwertige Logiken, Fuzzy-Logik, probabilistische Logiken Wissensrepräsentation und -verarbeitung in Logiken Wissensbasis Formelmenge Φ Problem (Fragestellung): Formel ψ Folgt ψ aus Φ? Lösung I I ja / nein erfüllende Belegung Möglichkeiten zum Ableiten neuen Wissens (Formel) aus einer Wissensbasis (Formelmenge) Folgern (semantisch): z.B. Wahrheitswerttabellen Schließen (syntaktisch): z.B. Resolution Beispiel Wissensbasis Wenn der Zug zu spät kommt und kein Taxi am Bahnhof steht, ist Tom nicht pünktlich. Der Zug kam zu spät und Tom ist pünktlich. Modellierung: z – Zugverspätung, t – Taxi da, p – pünktlich Φ = {z ∧ ¬t → ¬p, z ∧ p} Problem Stand ein Taxi am Bahnhof? ψ = t Folgt ψ aus Φ? Lösung ?