Organisatorisches Wissensmodellierung und wissensbasierte Systeme Kontakt: Vorlesung im Hauptstudium Vorlesung: Thorsten Liebig Übungen: Universität Ulm Institut für Künstliche Intelligenz Dr. Thorsten Liebig: [email protected] Tel.: (50) 24207 Raum: O27/423 Dienstag 14:15 – 15:45 Uhr Raum 3211 Donnerstag 14:15 – 15:45 Uhr Raum 1002 nach Bedarf (Bleistiftübungen, kleinere Projekte, ...) Olaf Noppens [email protected] Tel.: (50) 24113 Raum: O27/422 Voraussetzungen: ◮ Logik (wie für Vordiplom Informatik) ◮ Einführung in die KI (empfehlenswert) Vorlesungsunterlagen: SS 2007 ◮ Folienkopien ◮ Web-Seiten zur Vorlesung http://www.informatik.uni-ulm.de/ki/Edu/Vorlesungen/Wimo07/ SS07, T. Liebig, Uni Ulm 0 -1 SS07, T. Liebig, Uni Ulm Inhalte und Einführung 0 -2 Inhalte und Einführung Warum Wissensmodellierung? Allgemeine Problemstellungen: Teil I ◮ Strategische Planung (Berücksichtigung von Kontextinformationen) ◮ Konfiguration (z. B. Komponenten komplexer Systeme) ◮ Diagnose (Medizin, technische Anlagen, ...) ◮ Textverstehen (z. B. in einem Auskunftssystem) / Übersetzung (vgl. Verbmobil) ◮ “Konservierung” von Expertenwissen in einem Unternehmen (corporate knowledge) ◮ Zusammenführung von Experten mit spezifischen Problemstellungen Software-Agenten im WWW Inhalte und Einführung ◮ ◮ ◮ E-Commerce ◮ ◮ SS07, T. Liebig, Uni Ulm 1 -3 Finde Telefonnummer von der Person, die die Übungen zur Vorlesung X leitet Finde die drei billigsten Web-Shops für Produkt Y mit Eurocard Zahlungsmöglichkeit ... SS07, T. Liebig, Uni Ulm 1 -4 Inhalte und Einführung Inhalte und Einführung Aktuelle Beispiele: BMI Aktuelle Beispiele: Google Interview mit Google-Mitarbeiter Urs Hölzle (c’t, Nr. 5/2002): Man kann [..] nicht vom Benutzer erwarten, dass ihm oder ihr immer die richtigen Stichwörter einfallen. In solchen Fällen wäre es schön, wenn Google mehr zum Beispiel über Synonyme wüsste, um den Benutzern helfen zu können, die Queries zu verfeinern. Pressemitteilung des BMI vom 1.2.2002 bzgl. eines europäischen Polizei-Informationssystem INPOL-neu: Für anspruchsvolle kriminalpolizeiliche Recherchen wird [..] eine [..] Datenbank erstellt. Über diese Datenbank können beispielsweise Querbezüge zwischen mehreren Tatverdächtigen, Tatorten und -waffen sichtbar gemacht werden. Anfragebeispiel: Suche VW Kombi (schließt Passat Variant mit ein) Bisher jedoch lediglich “Ähnliche Seiten” Funktionalität. Anfragebeispiel: Finde Person Z1 aus der Gegend G1 mit Kontakt zu Person Z2 mit Vorstrafe bzgl. Waffenmissbrauch W1 Jedoch: Forschungsdirektorin Monika Lenzinger in der FAZ v. 7.2.2005 (Nr. 31, S. 19) [..] Maschinen müssen besser verstehen, welche Themengebiete der Nutzer meint. [Angegebene] Interessengebiete lenken dann die Suchergebnisse in die gewünschte Richtung. Die Mehrheit der [Internetnutzer] geht falsch an die Sache heran. Die Nutzer [müssen] Worte eingeben, die auf der Ergebnisseite vorkommen sollen. Die meisten Nutzer denken nicht auf diese Art. SS07, T. Liebig, Uni Ulm Laut technischem Gutachten ein System mit “Problematischer Gesamtkomplexität, das an die Grenzen dessen geht, was derzeit mit verfügbarer Technologie zu machen ist.” 1 -5 SS07, T. Liebig, Uni Ulm Inhalte und Einführung 1 -6 Inhalte und Einführung Vision: persönlicher Reiseagent Persönlicher Reiseagent: Zielsetzung Aufgabe: Reiseplanung und -buchung zum Fischerstechen in Ulm. Szenario: Automatisierte Reiseplanung zu beliebigen Zielorten unter Berücksichtigung individueller Präferenzen. Gegeben: • Ursprungsort • Webseite der Veranstaltung Zunächst: Identifikation der Eckdaten der Reise. Annahme: Kein Reiseportal kann jemals alle denkbaren Reiseziele und Präferenzen bedienen. SS07, T. Liebig, Uni Ulm 1 -7 SS07, T. Liebig, Uni Ulm 1 -8 Inhalte und Einführung Inhalte und Einführung Persönlicher Reiseagent: Anreiseplanung Persönlicher Reiseagent: Unterkunft SS07, T. Liebig, Uni Ulm 1 -9 SS07, T. Liebig, Uni Ulm Inhalte und Einführung Inhalte und Einführung Persönlicher Reiseagent: Reiseplan Aufgaben des persönlichen Reiseagenten Lässt sich ein solcher Reiseagent auf der Basis derzeitiger Web-Technologie (Sprachen, Formate, Standards, usw.) realisieren? ◮ Identifikation der relevanten Reisedaten: Wo und Wann? “Begriffsklärung”: Reichsstadt Ulm = Universitätsstadt Ulm? ◮ Grobentwurf der Reise: Zur Verfügung stehende Reisemittel: Taxi, Bus, Zug, Mietwagen, Flugzeug, ... ◮ Wenn ja, wie? Wenn nein, wo liegen die Probleme? ◮ ◮ ◮ ◮ 1 - 11 Reiseentfernung zum Ziel (auch zwecks Zeitplanung) Laufweite ↔ Interkontinentalflug Lokalisierung entsprechender Web-Anbieter Kombination verschiedener Reisemittel Auswahl einer Übernachtungsmöglichkeit ◮ SS07, T. Liebig, Uni Ulm 1 - 10 geographische Nähe zur Veranstaltung (hier Donau): Benutzung von Stadtplänen, Routenplaner (alternativ in Neu-Ulm suchen) persönliche Präferenzen, z. B. best. Restaurant oder Arzt in der Nähe ◮ Reservierung/Verhandlung und Buchung Rückmeldungen bzw. Rückfragen an Auftraggeber ◮ Präsentation der Reisedaten mit individuell zusammengestellten Informationen SS07, T. Liebig, Uni Ulm 1 - 12 Inhalte und Einführung Inhalte und Einführung Gemeinsamkeiten der Problemstellungen Datenbanken (Datenverarbeitung) vs. Wissensverarbeitung ◮ Unvollständiges manchmal unsicheres Wissen im Kontext der Wissensrepräsentation vs. Zurückweisung. ◮ Darstellung hochkomplexer, heterogener Wissenseinheiten im Gegensatz zu großen Mengen relativ homogen strukturierter Daten: Es wird heterogenes “Wissen” über einen mehr oder weniger umfangreichen Problembereich (Domäne) vorausgesetzt. ◮ Dieses Wissen muss in geeigneter Form im Rechner dargestellt werden. ◮ Flexible maschinelle Verarbeitung des Wissens muss möglich sein. → Abfrage von Wissen / Schlussfolgerungen erfordert die (manuelle) Erstellung vieler und oftmals wenig genutzer Reihen oder Zusatztabellen (großer Designoverhead/Effizienzproblem), oder Hinzunahm von “freien Textfeldern”/BLOBs (binary large obj.) (dann aber keine sinnvolle maschinelle Weiterverarbeitung). ◮ Verarbeitungsablauf nur implizit oder gar nicht vorgegeben vs. explizit festgelegt. ◮ WB-System kann im Prinzip den ausgeführten Verarbeitungsprozess erklären und begründen vs. Verarbeitungsprozess nur vom Programmierer erklärbar. Wissensaustausch (insb. im Internet) erfordert eine (im gewissen Umfang) standardisierte Darstellung. ◮ Gewisser Grad an Deklarativität erforderlich vs. primitive Datentypen. ◮ Bedeutung von Begriffen spielt die zentrale Rolle vs. reine syntaktische Verarbeitung. Inhaltsbezogene statt syntaktischer Informationsverarbeitung ◮ ... Was ist mit “konventionellen” Lösungen wie z. B. Datenbanken? SS07, T. Liebig, Uni Ulm 1 - 13 SS07, T. Liebig, Uni Ulm Inhalte und Einführung 1 - 14 Inhalte und Einführung Vorgriff: Idee und Vision des “Semantic Web” Vorlesungsinhalte (Teil 1) The Semantic Web is a vision: The idea of having data on the web defined and linked in a way, that it can be used by machines – not just for display purposes, but for using it in various applications. [http://www.w3.org/2001/sw/] Die Modellierung und Verarbeitung von Wissen ist eines der zentralen Gebiete in der KI (Wissen oftmals Voraussetzung für “intelligente Systeme”) ◮ Einführung in die Thematik ◮ Logik-basierte Wissensmodellierung ◦ Historische Entwicklung der Wissensrepräsentation Problem: ◮ Großes Angebot an Informationen (Texte, Bilder, Ton, Video, ...) ◮ Lediglich syntaktische “Beziehung” zwischen diese Ressourcen (implizite Bedeutung) ◮ Fokussierung auf visuelle Bedürfnisse ◦ ◦ ◦ ◦ Logische Grundlagen und Begriffe (PL1) Semantische Netze Frames Beschreibungslogiken ◮ ◮ ◮ Idee: Erweiterung des Web durch “Anreicherung” von Ressourcen und Beziehungen mit explizit definierter (und damit maschinell verarbeitbarer) Bedeutung (→ Knowledge Web). ◮ ◮ Sprachen und Konstruktoren Semantik Systeme und Systemdienste Anwendungsgebiete Algorithmen Kombination von Methoden der Wissensrepräsentation mit Techniken und Standards des WWW SS07, T. Liebig, Uni Ulm 1 - 15 SS07, T. Liebig, Uni Ulm 1 - 16 Inhalte und Einführung Inhalte und Einführung Vorlesungsinhalte (Teil 2) Vorlesungsinhalte (Teil 3) Wissensverarbeitung mit wechselnder Beachtung in der Forschungshistorie. Renaissance im Zusammenhang mit aktuellen Aktivitäten im Internet. Ontologien haben in der Informationstechnologie inzwischen eine große Bedeutung. ◮ Ontologien und Wissensbasen ◮ ◮ ◮ Informationsdarstellung im Internet ◮ Grundlagen des Semantic Web ◦ Entwicklung des (hyperlinked) WWW ◦ Repräsentationsformen und Typen von Ontologien ◦ Verwandte Repräsentationsformalismen UML ER-Diagramme ◦ ◦ ◦ ◦ ◦ ◦ Beispiele und Anwendungen ◮ ◮ ◮ ◮ WordNet UMLS SUO Cyc ◮ ◦ Formale Analyse von Ontologien ◮ Aktueller Stand des Semantic Web ◦ Schnittstellen ◦ Werkzeuge ◦ Prototypische Anwendungen OntoClean ◦ Tools und Editoren SS07, T. Liebig, Uni Ulm Motivation, Vision XML, XML Schema, URI, Namespaces, (XSL & XSLT) RDF, RDF Schema Repräsentation von Ontologien (OWL) Web Services 1 - 17 SS07, T. Liebig, Uni Ulm Inhalte und Einführung 1 - 18 Inhalte und Einführung Allgemein: Was ist Wissen, was Information, was Daten? Wissen, Informationen und Daten in der KI In der VL unterscheiden wir wie folgt: Wissen (knowledge) und Information und auch Daten werden im Alltag häufig nicht unterschieden und mehr oder weniger als Synonyme verwendet. Daten Sequenz von nicht mehr zerlegbaren Einheiten. Unterschiedliche Kodierungen möglich. Z. B.: “· · · − − − · · ·”, “53 4F 53”, “SOS”, ... Webster’s Third International Dictionary: Knowledge applies to any body of known facts or to any body of ideas inferred from such facts or accepted as truths on good grounds. Information generally applies to knowledge, commonly accepted as true, of a factual kind usually gathered form others or from books. Data is information in numerical form that can be digitally transmitted or processed. Information Fakten. Abstraktion von der jeweiligen Kodierung. “SOS = Save Our Souls = Rettet unsere Seelen” Wissen (knowledge) Schließt die Interpretation der Informationen mit ein. Explizitmachen von impliziten Informationen. Berücksichtigung von Kontext(wissen), Regeln, Heuristiken, ... (→ Begriffe wie Widerspruch, Redundanz, usw. erst auf dieser Ebene möglich). “Save Our Souls: Internationaler Hilferuf → Rettungsaktion starten” Wissen.de Wissen: Inbegriff von rationaler Erkenntnis; dabei auch das Innewerden einer spezifische Gewissheit (intuitives Wissen) → Wissen schließt das Ableiten (inference/Innewerden) von Fakten mit ein. Hier: Abstraktion von mentalen Sichtweisen wie Meinung, Erwartung, Glaube, ... SS07, T. Liebig, Uni Ulm 1 - 19 SS07, T. Liebig, Uni Ulm 1 - 20 Inhalte und Einführung Inhalte und Einführung Wissensrepräsentation und Schlussfolgerungen Wissenrepräsentation und Intelligenz (1) Repräsentation: ◮ Gruppen von Symbolen, die für eine Aussage stehen. Wissensrepräsentationshypothese [Smith 1985]: ◮ Die Wissensrepräsentation beschäftigt sich mit formalen Symbolen, welche die Menge von Aussagen eines Agenten/Experten/... repräsentieren. Any mechanically embodied intelligent process will be comprised of structural ingredients that ◮ (a) we as external observers naturally take to represent a propositional account of the knowledge that the overall process exhibits, and Hier: Einschränkung auf endliche Menge von Symbolen. Schlussfolgern: ◮ Schlussfolgern ist die formale Manipulation von Symbolen (welche Aussagen repräsentieren) um zu Repräsentationen von neuen Symbolen zu gelangen. ◮ Eine adäquate Repräsentation von Wissen ist hier unumgänglich – Aussagen sind abstrakt; ihre Repräsentation kann jedoch leicht manipuliert werden. ◮ Schlussfolgern (kann) einfach wie “Rechnen” (sein): raining is true raining implies wet-street is true wet-street is true SS07, T. Liebig, Uni Ulm (b) independent of such external semantical attribution, play a formal but causal and essential role in engendering the behavior that manifests that knowledge. Das relevante Wissen ist “propositional” explizit repräsentiert und vom außenstehenden Betrachter als eine “natürliche” Beschreibung dieses Wissens angesehen. System-Verhalten ist unmittelbar durch die Propositionen bedingt und für den Betrachter mit der Bedeutung dieser Propositionen konsistent. 1 - 21 SS07, T. Liebig, Uni Ulm Inhalte und Einführung Inhalte und Einführung Wissenrepräsentation und Intelligenz (2) Semantik der Repräsentation von Wissen Prozedural: Wissen ist kodiert in einem Programm; die Bedeutung ergibt sich aus dem Verhalten des Programms. Das Wissen ist quasi “versteckt”, schwer analysier- und kommunizierbar. The Knowledge Level [Newell 1982]: Knowledge is to be characterized entirely functionally, in terms of what it does, not structurally, in terms of physical objects with particular properties and relations. Principle of Rationality: If an agent has knowledge that one of its actions will lead to one of its goals, then the agent will select that action. Deklarativ: Abbildung der symbolischen Ausdrücke (Symbolebene) auf Abstraktionsebene der zu repräsentierenden Sachverhalte (Wissensebene). Wissen ist logisch analysierbar, kommunizierbar und verifizierbar. Auf Wissensebene sind Wissensinhalte zu sehen, nicht aber die interne Struktur, in denen sich die Inhalte manifestieren (Was). Diese Strukturen werden erst auf Symbolebene sichtbar (Wie). Vgl. mit abstrakten Datentypen (Abstrakter Datentyp spezifiziert ein best. Verhalten aber abstrahiert von der Realisierung dieses Verhaltens). Extern: Abbildung bezieht sich auf externe zu modellierende Entitäten, nicht auf im Rechner existierende Objekte (mit interner Semantik). ⇒ SS07, T. Liebig, Uni Ulm 1 - 22 1 - 23 Wissensrepräsentationssystemen basieren in der Regel auf einer deklarativen Semantik, häufig über eine Abbildung auf eine formale Logik. SS07, T. Liebig, Uni Ulm 1 - 24 Inhalte und Einführung Inhalte und Einführung Wissenrepräsentation und KI Kriterien der Wissensrepräsentation Hauptziel der KI-Forschung: Entwicklung intelligenter rechnergestützter Systeme. Korrektheit: Ist ein Verfahren bezüglich der Semantik korrekt? Ist es möglich falsche Schlussfolgerungen zu ziehen? Stark vereinfacht: Vollständigkeit: KI-System = Wissensrepäsentation + Problemlösungstechnik + Benutzerschnittstelle Ist es möglich alle korrekten Schlüsse zu ziehen? Entscheidbarkeit: Existiert eine immer terminierender Algorithmus, der das Schlussfolgerungsproblem löst? Annahme: Das hierzu notwendige Wissen, das auch vom Menschen in diesen Situationen (bewusst oder unbewusst) benutzt wird, muss in geeigneter Form in einem solchen System “eingebracht” werden. Adäquatheit: Können die zu lösenden Probleme verständlich und natürlich formuliert werden? Komplexität: Dieses Wissen kann sich auf eine spezielle, eng eingrenzbare Domäne beschränken, oder von allgemeinem Umfang sein. SS07, T. Liebig, Uni Ulm Welcher Aufwand ist für den Prozess der Lösungsfindung notwendig? 1 - 25 SS07, T. Liebig, Uni Ulm Inhalte und Einführung 1 - 26 Inhalte und Einführung The AI Hype Potenziale und Grenzen wissensbasierter Systeme Große Erwartungen (und Befürchtungen) Ender der siebziger Jahre. Misserfolge und die Analyse der verwendeten Methodiken führten bald zu einer Ernüchterung. Heute eine sehr viel abgeklärtere Betrachtung von Expertensystemen / wissensbasierten Systemen. → “If it works, it’s not AI” (Historisches siehe z. B. [Phillips, 1999]) Probleme: ◮ Wissensbasierte Systeme beschränken sich auf ein festgelegtes Einsatzgebiet (keine Abschätzung der eigenen Grenzen und Kompetenzen; keine Reflektion). ◮ Menschliche Experten verfügen neben Fachwissen stets auch über Alltagswissen. ◮ Es ist schwierig das Wissen eines Experten explizit zu machen. Anwendung sog. stillschweigendem Wissens (tacit knowledge). ◮ Formale Spezifikation und Verifikation nahezu unmöglich. SS07, T. Liebig, Uni Ulm 1 - 27 SS07, T. Liebig, Uni Ulm 1 - 28 Inhalte und Einführung Inhalte und Einführung Literatur zu Teil 1 ◮ Literatur zu Teil 2 Standard-Lehrbücher der KI ◦ Einf. in die/Handbuch der Künstliche Intelligenz (Görz, 2000); insb. Kap. “Wissensrep. & Logik” QAA 705/2000 G ◦ Knowledge Representation (Sowa, 2000) QAA 705/2000 Sb ◦ Wissensverarbeitung (Heinsohn & Ambrosius, 1999) QAA 706/1999 H ◮ Speziell Logik / Beschreibungslogik: ◦ Logik für Informatiker (Schöning, 2000) ◦ Logical Foundations of AI (Genesereth/Nilson, 1986) ◦ The Description Logic Handbook (Baader et. al., 2003) ◮ QAA 206/2000 S QAA 705/1988 G QAA 705/2003 B Handbook on Ontologies (Staab, Studer, 2004) ◮ Ontologies: A Silver Bullet for Knowledge Management and Electronic Commerce (Fensel, 2001) ◮ Formal Ontology in Information Systems (Guarino, 1998) ◮ Diverse Web-Quellen; Einen guten Überblick bieten: QAA 705/2004 S ◦ “KBS/Ontology Projects and Groups” unter [http://www.cs.utexas.edu/users/mfkb/related.html ] Konferenzen / Workshops ◦ Cyc [http://www.cyc.org/] ◦ Int. Conf. on Principles of Knowledge Representation and Reasoning (KR) (zweijährig) [http://www.kr.org/] ◦ Int. Workshop on Description Logics (DL) (jährlich) [http://dl.kr.org/] ◮ ◮ ◦ SUMO (Suggested Upper Merged Ontology) [http://suo.ieee.org/] Diverse Web-Quellen; Interessanter Einstiegspunkte ist: ◦ ◦ “AI on the Web” unter [http://www.cs.berkeley.edu/~russell/ai.html ] SS07, T. Liebig, Uni Ulm 1 - 29 SS07, T. Liebig, Uni Ulm Inhalte und Einführung 1 - 30 Inhalte und Einführung Literatur zu Teil 3 Ziele der Lehrveranstaltung (Noch) keine (allg. anerkannte) Standard-Einführung in die Thematik! ◮ XML in a Nutshell (Harold/Means, 2000) ◮ Creating the Semantic Web with RDF (Hjelm, 2001) ◮ Spinning the Semantic Web (Fensel, 2003) ◮ Dictionary of XML Technologies and the Semantic Web (Geroimenko, 2004) QAA 592.X5/2004 G Web-Ressourcen: ◮ ◦ ◦ ◦ ◦ ◦ Verständnis für die Problematik wecken. ◮ Grundlagen für die Modellierung und rechnergestützte Verarbeitung von Wissen vermitteln. ◮ Vorstellung von potenziellen Anwendungsbereichen und existierenden Systemen. ◮ Erläuterung der neuesten Entwicklungen und Darstellung des Stands der aktuellen Forschung und Entwicklung. ◮ Aufzeigen von Trends und Visionen. QAA 720/2001 H QAA 420.I6/2003 F World Wide Web Consortium [http://www.w3.org] Semantic Web Activity des W3C [http://www.w3.org/2001/sw/] [http://www.SemanticWeb.org/ ] “The Semantic Web” (Scientific American 05/ 2001 von Tim Berners-Lee) OWL Web Ontology Language [http://www.w3c.org/sw/] SS07, T. Liebig, Uni Ulm ◮ QAA 592.X5/2001 H 1 - 31 SS07, T. Liebig, Uni Ulm 1 - 32 Inhalte und Einführung Literatur zum Kapitel [Smith 1985] B. Smith: Prologue to “Reflection and Semantics in a Procedural Language”, in Readings in Knowledge Representation, edited by R. J. Brachman & H. J. Levesque, Morgan Kaufmann, 1985. [Newell 1982] A. Newell: The Knowledge Level. Artificial Intelligence, 18:87-127, 1982. [Phillips 1999] E. Phillips, If It Work’s, It’s Not AI, Bachelor thesis, MIT, USA, 1999. SS07, T. Liebig, Uni Ulm 1 - 33