University of Bielefeld Spezielle Themen der KI Wissensrepräsentation General Purpose Wissensrepräsentationen in der KI Marc Erich Latoschik AI & VR Lab, Faculty of Technology University of Bielefeld [email protected] University of Bielefeld Übersicht Ziel: Übersicht über oft benutzte General-Purpose Wissensrepäsentationsformalismen in der KI. • • • • • • Semantische Netze Strukturierte Repräsentationen Regel-basierte Systeme Weitere Repräsentationen: Decision Trees, Constraint-Netze und Kontrastierung mit einer Art von Special-Purpose Wissensrepäsentation Analoge Repräsentationen Abbildungen z.T. aus • G. F. Luger & W.A. Stubblefield. Artificial Intelligence: Structures and Strategies for Complex Problem Solving. Benjamin/Cummings, 1992. • P. H. Winston. Artificial Intelligence. Third Edition. Addison Wesley, 1992. 2 1 University of Bielefeld Klassifikation von Repräsentationsformalismen • • Logische Repräsentationsformalismen deklarativ; z.B. PL1, modale/temporale u.a. Erweiterungen von PL1, PROLOG Repräsentationsschemata – Netzwerk-artige Repräsentationsformalismen Graphen: Knoten = Konzepte oder Objekte, Kanten = Relationen / Assoziationen z.B. semantische Netze, Conceptual Dependency, Conceptual Graphs – Strukturierte Repräsentationsformalismen Erweiterung der Netzwerkrepräsentationen: Knoten als komplexe Datenstrukturen mit benannten Slots, Slotwerte: numerisch, symbolisch, Zeiger auf andere Knoten; procedural attachment z.B. Frames, Scripts • Prozedurale Repräsentationsformalismen Wissen in Form von Instruktionen z.B. if..then..Regeln (->Produktionssysteme) nach Mylopopoulos & Levesque (1984) 3 University of Bielefeld Wissenrepräsentationen In der KI existieren drei wesentliche Verfahren der Wissensrepräsentation: I. Logik (Aussagenlogik, Prädikatenlogik, etc.) • z.B. “Alle Fische schwimmen” ∀X ( fish( X ) → swims( X )) • ¾ ¾ Wohl definierte Syntax und Semantik Was ist bei Einschränkungen von Folgerungsklassen? Wie werden Zeit, Meinungen oder Unsicherheit repräsentiert? 4 2 University of Bielefeld Wissenrepräsentationen II. Repräsentationsschemata • • • Einfache und natürliche Schemata (Frames, Semantische Netze, etc.) Algorithmen für die Manipulation wird explizit angegeben, nicht notwendigerweise eine formale Liste der Semantik Wissen als Sammlung von Objekten und Beziehungen 5 University of Bielefeld Wissenrepräsentationen III. Bedingungs-Aktions-Regeln (condition-action-rules) IF krank THEN arzt-gehen • • • • Regelbasierte Systeme Algorithmen für den Umgang mit Regeln notwendig Schwerpunkt auf prozeduralen und nicht deklarativen Aspekten (wie bei Logik) Häufig in Expertensystemen 6 3 University of Bielefeld Semantische Netze • Ein Semantisches Netz ist ein Graph, wobei – Knoten Konzepte / Instanzen repräsentieren – und Kanten Relationen zwischen Konzepten repräsentieren – Besondere Relationen: isa, ako – Vererbung von Merkmalen kann einfach berechnet werden, indem isa und ako Relationen verfolgt werden – (Im einfachen Fall) ist Repräsentation kompakt, verständlich und - für Berechnung von Defaults heuristisch adäquat – Quillian (1968) konnte psychologische Plausibiltät nachweisen 7 University of Bielefeld Semantische Netze Allgemein: Knoten = Konzepte/Objekte, Kanten = Relationen; besondere Relationen: isa (inst_of), ako (is_a) Knoten und Kanten können auf unterschiedlichen Ebenen verstanden werden (Brachman, 1979): • Implementationsebene: Kanten sind Zeiger auf andere Objekte • Logische Ebene: Sem. Netz entspricht logischen Formeln (+Indizierungsschema) • Epistemologische Ebene: Definition von Konzepten durch Beziehungen zu anderen Konzepten z.B. KL-ONE • Konzeptuelle Ebene: Knoten repräsentieren sprachunabhängige Konzepte, z.B. PTRANS, Kanten repräsentieren thematische Rollen, z.B. AGENT, INSTRUMENT, ... z.B. Conceptual Graphs, Conceptual Dependeny • Linguistische Ebene: Knoten sind Worte, Kanten Verweise auf andere Worte (wie in Lexikon); Worte mit kontext-abhängiger Bedeutung z.B. Quillian, 1967 8 4 University of Bielefeld Semantische Netze und Sprachverstehen • Semantische Netze schon früh zum Sprachverstehen eingesetzt (z.B. Masterman, 1962) The dog bytes the postman 9 University of Bielefeld Semantische Netze Quillian, 1967 Semantisches Netz repräsentiert (englisches) Lexikon Knoten sind Wort-Konzepte Kanten Assoziationen z.B. drei Bedeutungen von „plant“ Zielanwendung: sprachverstehendes System, das kontextabhängige Wortbedeutung versteht 10 5 University of Bielefeld Semantische Netze Marker Passing Quillian‘s Programm findet Beziehungen zwischen Paaren von Worten. Kürzester Pfad zwischen zwei Worten wird durch Marker Passing entlang Kanten gefunden (symbolische Variante der Aktivtationsausbreitung im Konnektionismus). Bsp. für Schlussfolgerung des Programms: cry 2 is among other things to make a sad sound. To comfort 3 can be to make 2 something less sad (Quillian, 1967) 11 University of Bielefeld Semantische Netze und Ausdrucksstärke (I) • Repräsentation allgemeiner Aussagen in ursprünglichen semantischen Netzen nicht möglich • Hendrix (1979) schlägt Erweiterung auf volle Ausdrucksstärke der PL1 vor (damit übertragen sich auch Berechnungseigenschaften) ∀x (dog ( x ) ⇒ ∃y ( postman ( y ) & bites ( x, y ))) Every dog bytes a postman 12 6 University of Bielefeld Semantische Netze Conceptual Dependency Schank, 1970er Jahre, Knoten + Kanten repräsentieren sprachunabhängiges, „konzeptuelles“ Wissen. Extreme Einchränkung der erlaubten Knoten und Kanten, z.B. für Lokation, Besitz, Prädikation, Zustandsänderung und tempale/kausale Beziehungen. Ziele der Theorie: • Unterstützung von Inferenzen auf Basis von Sätzen. • Unabhängigkeit von konkreter Ausformulierung der Äußerungen. “For any 2 (or more) sentences that are identical in meaning there should be only one representation of that meaning.” CD bietet: • Eine Struktur zur Einbettung Informationsknoten • Einen speziellen Satz von Primitiven einer bestimmten Granularität Sätze sind als Aktionsdiagramme abstrakter und realer Situationen repräsentiert. • Die Agenten und Objekte sind repräsentiert • Aktionen auf Basis einer Menge primitiver Aktionen (mit Modifikation der Zeit). 13 University of Bielefeld Semantische Netze Conceptual Dependency • • • • • • • • • • • • ATRANS PTRANS PROPEL MTRANS MBUILD SPEAK ATTEND MOVE GRASP INGEST EXPEL … ¾ ¾ ¾ ¾ ¾ ¾ ¾ ¾ ¾ ¾ ¾ Transfer of an abstract relationship. e.g. give. Transfer of the physical location of an object. e.g. go. Application of a physical force to an object. e.g. push. Transfer of mental information. e.g. tell. Construct new information from old. e.g. decide. Utter a sound. e.g. say. Focus a sense on a stimulus. e.g. listen, watch. Movement of a body part by owner. e.g. punch, kick. Actor grasping an object. e.g. clutch. Actor ingesting an object. e.g. eat. Actor getting rid of an object from body. e.g. ????. 14 7 University of Bielefeld Semantische Netze Conceptual Dependency 15 University of Bielefeld Semantische Netze Conceptual Graphs Knoten repräsentieren Konzepte oder konzeptuelle Relationen; Kanten haben keine Labels n-stellige konzeptuelle Relation repräsentiert als Knoten mit n Kanten Mächtigkeit der PL1; aber Unterstützung spezieller Inferenzmechanismen, z.B. join zur Kombination zweier Graphen zu einen Graph Sowa, 1980er Jahre 16 8 University of Bielefeld Semantische Netze Psychologische Plausibilität Hierarchische Speicherorganisation beim Menschen. Eigenschaften auf höchstmöglicher Ebene der Taxonomie gespeichert. Struktur des Netzes von Collins und Quillian basierte auf Untersuchungen mit Versuchspersonen. Collins & Quillian, 1969 17 University of Bielefeld Semantische Netze Strukturierte Repräsentationen Inheritance Networks • • Konzepte mit Attributen is-a und instance-of Relationen Probleme: • Konflikte bei Mehrfachvererbung • Überschreiben von Eigenschaften in Spezialisierungen (wenn Pinguin ein Vogel ist, der nicht fliegt, wieso nicht Stein als Vogel modellieren, der nicht fliegt, nicht lebt, und keine Federn hat?) 18 9 University of Bielefeld Semantische Netze Strukturierte Repräsentationen Semantische Netze Frames 19 University of Bielefeld Strukturierte Repräsentationen - Frames • • • • • Erweiterung der Inheritance Networks um Procedural Attachment Generische Frames beschreiben Klassen, Instanzen einzelne Objekte Vererbung, i.a. auch Mehrfachvererbung und Überschreiben von Eigenschaften Frames haben Slots, jeder Slot hat einen oder mehrere Werte „Dämonen“-Prozeduren an Slots gebunden um Seiteneffekte bei SlotZugriff zu modellieren – – – – – – – – if-added: aufgerufen, wenn neuer Wert in Slot eingetragen wird if-removed: aufgerufen, wenn Wert aus Slot entfernt wird if-replaced: aufgerufen, wenn Wert des Slots geändert wird if-needed: aufgerufen, wenn fehlender Wert eines Instanz-Frames aus generischen Frame berechnet werden muß. Facette cache bedeutet, daß Wert in Instanz gespeichert wird if-new: aufgerufen, wenn neuer Instanz-Frame erzeugt wird range: überprüft Wertebereich eines neues Frames help: wird aufgerufen, wenn range-Test Fehler liefert o.ä. 20 10 University of Bielefeld Frames Beispiel cylinder ako object with height: range number(new value) and new value > 0 help print("Height must be a positive number") if_needed ask if_removed remove volume from this cylinder cache yes; radius: range number(new value) and new value > 0 help print("Radius must be a positive number") if_needed ask if_removed remove cross_section from this cylinder cache yes; cross_section:... volume: ... 21 University of Bielefeld Frames Minsky, 1975 • (Generische) Frames repräsentieren stereotype Situationen, z.B Wohnzimmer, die auf spezifische Situation angepaßt werden Schank & Abelson, 1977 • Scripts sind spezielle Frames, die typische Verläufe von Ereignissen beschreiben, z.B. Restaurant-Script 1970er / 1980er Jahre • Frame-Systeme FRL, KRL, ...; auf Allgemeinheit ausgelegt • Behandlung von Mehrfachvererbung, siehe z.B. Winston, 1993 • KL-ONE und Nachfolger: formale, deklarative Semantik • Inheritance Networks mit Ausnahmen: formale Semantik z.B. Abb. auf nichtmonotone Logik CYC-Projekt • Ziel: Modellierung von Commonsense-Wissen; über 5000 Frames (Stand 1993) heute • eher spezialisierte Systeme; in Bielefeld z.B. ERNEST (Bild- und Sprachverstehen), COAR • prominent: OWL Web Ontology Language (http://www.w3.org/TR/owl-ref/) 22 11 University of Bielefeld Semantische Netze und Frames als alternative Notationen • • • Bem: Für prozedurales Attachment in Frames gibt es in sem. Netzen keine Entsprechung Hayes (1980) gibt eine Übersetzung von Frames nach PL1 an (ohne prozedurales Attachment) Damit wird auch die logische Rekonstruktion semantischer Netze (und damit deren semantischer Status) zum Thema 23 University of Bielefeld Was ist „semantisch“ an Semantischen Netzen? Was ist hier modelliert? • John‘s Finger ist Teil eines Orchesters? John kämpft mit sich selbst? • Brathühner machen Musik? Henny Penny paßt gut zu Estragon (einem Gewürz)? ¾ Problem früher semantischer Netze: Keine Semantik für Konzepte und Relationen! 24 12