Wissensmodellierung und wissensbasierte Systeme

Werbung
Organisatorisches
Wissensmodellierung und wissensbasierte Systeme
Kontakt:
Vorlesung im Hauptstudium
Vorlesung:
Thorsten Liebig
Übungen:
Universität Ulm
Institut für Künstliche Intelligenz
Dr. Thorsten Liebig: [email protected]
Tel.: (50) 24207 Raum: O27/423
Dienstag
14:15 – 15:45 Uhr Raum 3211
Donnerstag
14:15 – 15:45 Uhr Raum 1002
nach Bedarf (Bleistiftübungen, kleinere Projekte, ...)
Olaf Noppens
[email protected]
Tel.: (50) 24113 Raum: O27/422
Voraussetzungen:
◮
Logik (wie für Vordiplom Informatik)
◮
Einführung in die KI (empfehlenswert)
Vorlesungsunterlagen:
SS 2007
◮
Folienkopien
◮
Web-Seiten zur Vorlesung
http://www.informatik.uni-ulm.de/ki/Edu/Vorlesungen/Wimo07/
SS07, T. Liebig, Uni Ulm
0 -1
SS07, T. Liebig, Uni Ulm
Inhalte und Einführung
0 -2
Inhalte und Einführung
Warum Wissensmodellierung?
Allgemeine Problemstellungen:
Teil I
◮
Strategische Planung (Berücksichtigung von Kontextinformationen)
◮
Konfiguration (z. B. Komponenten komplexer Systeme)
◮
Diagnose (Medizin, technische Anlagen, ...)
◮
Textverstehen (z. B. in einem Auskunftssystem) / Übersetzung (vgl.
Verbmobil)
◮
“Konservierung” von Expertenwissen in einem Unternehmen (corporate
knowledge)
◮
Zusammenführung von Experten mit spezifischen Problemstellungen
Software-Agenten im WWW
Inhalte und Einführung
◮
◮
◮
E-Commerce
◮
◮
SS07, T. Liebig, Uni Ulm
1 -3
Finde Telefonnummer von der Person, die die Übungen zur Vorlesung X
leitet
Finde die drei billigsten Web-Shops für Produkt Y mit Eurocard
Zahlungsmöglichkeit
...
SS07, T. Liebig, Uni Ulm
1 -4
Inhalte und Einführung
Inhalte und Einführung
Aktuelle Beispiele: BMI
Aktuelle Beispiele: Google
Interview mit Google-Mitarbeiter Urs Hölzle (c’t, Nr. 5/2002):
Man kann [..] nicht vom Benutzer erwarten, dass ihm oder ihr
immer die richtigen Stichwörter einfallen. In solchen Fällen wäre
es schön, wenn Google mehr zum Beispiel über Synonyme wüsste,
um den Benutzern helfen zu können, die Queries zu verfeinern.
Pressemitteilung des BMI vom 1.2.2002 bzgl. eines europäischen
Polizei-Informationssystem INPOL-neu:
Für anspruchsvolle kriminalpolizeiliche Recherchen wird [..] eine
[..] Datenbank erstellt. Über diese Datenbank können beispielsweise
Querbezüge zwischen mehreren Tatverdächtigen, Tatorten und
-waffen sichtbar gemacht werden.
Anfragebeispiel: Suche VW Kombi (schließt Passat Variant mit ein)
Bisher jedoch lediglich “Ähnliche Seiten” Funktionalität.
Anfragebeispiel: Finde Person Z1 aus der Gegend G1 mit Kontakt zu Person Z2 mit Vorstrafe bzgl. Waffenmissbrauch W1
Jedoch: Forschungsdirektorin Monika Lenzinger in der FAZ v. 7.2.2005 (Nr.
31, S. 19)
[..] Maschinen müssen besser verstehen, welche Themengebiete der
Nutzer meint. [Angegebene] Interessengebiete lenken dann die
Suchergebnisse in die gewünschte Richtung.
Die Mehrheit der [Internetnutzer] geht falsch an die Sache heran.
Die Nutzer [müssen] Worte eingeben, die auf der Ergebnisseite
vorkommen sollen. Die meisten Nutzer denken nicht auf diese Art.
SS07, T. Liebig, Uni Ulm
Laut technischem Gutachten ein System mit “Problematischer
Gesamtkomplexität, das an die Grenzen dessen geht, was derzeit mit
verfügbarer Technologie zu machen ist.”
1 -5
SS07, T. Liebig, Uni Ulm
Inhalte und Einführung
1 -6
Inhalte und Einführung
Vision: persönlicher Reiseagent
Persönlicher Reiseagent: Zielsetzung
Aufgabe:
Reiseplanung und
-buchung zum Fischerstechen in Ulm.
Szenario:
Automatisierte Reiseplanung zu beliebigen
Zielorten unter Berücksichtigung individueller
Präferenzen.
Gegeben:
• Ursprungsort
• Webseite der Veranstaltung
Zunächst:
Identifikation der Eckdaten der Reise.
Annahme:
Kein Reiseportal kann jemals alle denkbaren Reiseziele und Präferenzen
bedienen.
SS07, T. Liebig, Uni Ulm
1 -7
SS07, T. Liebig, Uni Ulm
1 -8
Inhalte und Einführung
Inhalte und Einführung
Persönlicher Reiseagent: Anreiseplanung
Persönlicher Reiseagent: Unterkunft
SS07, T. Liebig, Uni Ulm
1 -9
SS07, T. Liebig, Uni Ulm
Inhalte und Einführung
Inhalte und Einführung
Persönlicher Reiseagent: Reiseplan
Aufgaben des persönlichen Reiseagenten
Lässt sich ein solcher
Reiseagent auf der
Basis derzeitiger
Web-Technologie
(Sprachen, Formate,
Standards, usw.)
realisieren?
◮
Identifikation der relevanten Reisedaten: Wo und Wann?
“Begriffsklärung”: Reichsstadt Ulm = Universitätsstadt Ulm?
◮
Grobentwurf der Reise:
Zur Verfügung stehende Reisemittel: Taxi, Bus, Zug, Mietwagen,
Flugzeug, ...
◮
Wenn ja, wie?
Wenn nein, wo liegen
die Probleme?
◮
◮
◮
◮
1 - 11
Reiseentfernung zum Ziel (auch zwecks Zeitplanung)
Laufweite ↔ Interkontinentalflug
Lokalisierung entsprechender Web-Anbieter
Kombination verschiedener Reisemittel
Auswahl einer Übernachtungsmöglichkeit
◮
SS07, T. Liebig, Uni Ulm
1 - 10
geographische Nähe zur Veranstaltung (hier Donau): Benutzung von
Stadtplänen, Routenplaner (alternativ in Neu-Ulm suchen)
persönliche Präferenzen, z. B. best. Restaurant oder Arzt in der Nähe
◮
Reservierung/Verhandlung und Buchung
Rückmeldungen bzw. Rückfragen an Auftraggeber
◮
Präsentation der Reisedaten mit individuell zusammengestellten
Informationen
SS07, T. Liebig, Uni Ulm
1 - 12
Inhalte und Einführung
Inhalte und Einführung
Gemeinsamkeiten der Problemstellungen
Datenbanken (Datenverarbeitung) vs. Wissensverarbeitung
◮ Unvollständiges manchmal unsicheres Wissen im Kontext der
Wissensrepräsentation vs. Zurückweisung.
◮ Darstellung hochkomplexer, heterogener Wissenseinheiten im
Gegensatz zu großen Mengen relativ homogen strukturierter Daten:
Es wird heterogenes “Wissen” über einen mehr oder weniger umfangreichen
Problembereich (Domäne) vorausgesetzt.
◮
Dieses Wissen muss in geeigneter Form im Rechner dargestellt werden.
◮
Flexible maschinelle Verarbeitung des Wissens muss möglich sein. →
Abfrage von Wissen / Schlussfolgerungen
erfordert die (manuelle) Erstellung vieler und oftmals wenig genutzer Reihen
oder Zusatztabellen (großer Designoverhead/Effizienzproblem), oder
Hinzunahm von “freien Textfeldern”/BLOBs (binary large obj.) (dann aber
keine sinnvolle maschinelle Weiterverarbeitung).
◮ Verarbeitungsablauf nur implizit oder gar nicht vorgegeben vs. explizit
festgelegt.
◮ WB-System kann im Prinzip den ausgeführten Verarbeitungsprozess
erklären und begründen vs. Verarbeitungsprozess nur vom
Programmierer erklärbar.
Wissensaustausch (insb. im Internet) erfordert eine (im gewissen Umfang)
standardisierte Darstellung.
◮ Gewisser Grad an Deklarativität erforderlich vs. primitive Datentypen.
◮ Bedeutung von Begriffen spielt die zentrale Rolle vs. reine syntaktische
Verarbeitung.
Inhaltsbezogene statt syntaktischer Informationsverarbeitung
◮ ...
Was ist mit “konventionellen” Lösungen wie z. B. Datenbanken?
SS07, T. Liebig, Uni Ulm
1 - 13
SS07, T. Liebig, Uni Ulm
Inhalte und Einführung
1 - 14
Inhalte und Einführung
Vorgriff: Idee und Vision des “Semantic Web”
Vorlesungsinhalte (Teil 1)
The Semantic Web is a vision:
The idea of having data on the web defined and
linked in a way, that it can be used by machines
– not just for display purposes, but for using it in
various applications.
[http://www.w3.org/2001/sw/]
Die Modellierung und Verarbeitung von Wissen ist eines der zentralen
Gebiete in der KI
(Wissen oftmals Voraussetzung für “intelligente Systeme”)
◮
Einführung in die Thematik
◮
Logik-basierte Wissensmodellierung
◦ Historische Entwicklung der Wissensrepräsentation
Problem:
◮
Großes Angebot an Informationen (Texte, Bilder, Ton, Video, ...)
◮
Lediglich syntaktische “Beziehung” zwischen diese Ressourcen
(implizite Bedeutung)
◮
Fokussierung auf visuelle Bedürfnisse
◦
◦
◦
◦
Logische Grundlagen und Begriffe (PL1)
Semantische Netze
Frames
Beschreibungslogiken
◮
◮
◮
Idee: Erweiterung des Web durch “Anreicherung” von Ressourcen und
Beziehungen mit explizit definierter (und damit maschinell
verarbeitbarer) Bedeutung (→ Knowledge Web).
◮
◮
Sprachen und Konstruktoren
Semantik
Systeme und Systemdienste
Anwendungsgebiete
Algorithmen
Kombination von Methoden der Wissensrepräsentation mit Techniken
und Standards des WWW
SS07, T. Liebig, Uni Ulm
1 - 15
SS07, T. Liebig, Uni Ulm
1 - 16
Inhalte und Einführung
Inhalte und Einführung
Vorlesungsinhalte (Teil 2)
Vorlesungsinhalte (Teil 3)
Wissensverarbeitung mit wechselnder Beachtung in der Forschungshistorie.
Renaissance im Zusammenhang mit aktuellen Aktivitäten im Internet.
Ontologien haben in der Informationstechnologie inzwischen eine große
Bedeutung.
◮
Ontologien und Wissensbasen
◮
◮
◮
Informationsdarstellung im Internet
◮
Grundlagen des Semantic Web
◦ Entwicklung des (hyperlinked) WWW
◦ Repräsentationsformen und Typen von Ontologien
◦ Verwandte Repräsentationsformalismen
UML
ER-Diagramme
◦
◦
◦
◦
◦
◦ Beispiele und Anwendungen
◮
◮
◮
◮
WordNet
UMLS
SUO
Cyc
◮
◦ Formale Analyse von Ontologien
◮
Aktueller Stand des Semantic Web
◦ Schnittstellen
◦ Werkzeuge
◦ Prototypische Anwendungen
OntoClean
◦ Tools und Editoren
SS07, T. Liebig, Uni Ulm
Motivation, Vision
XML, XML Schema, URI, Namespaces, (XSL & XSLT)
RDF, RDF Schema
Repräsentation von Ontologien (OWL)
Web Services
1 - 17
SS07, T. Liebig, Uni Ulm
Inhalte und Einführung
1 - 18
Inhalte und Einführung
Allgemein: Was ist Wissen, was Information, was Daten?
Wissen, Informationen und Daten in der KI
In der VL unterscheiden wir wie folgt:
Wissen (knowledge) und Information und auch Daten werden im Alltag häufig
nicht unterschieden und mehr oder weniger als Synonyme verwendet.
Daten
Sequenz von nicht mehr zerlegbaren Einheiten. Unterschiedliche
Kodierungen möglich. Z. B.: “· · · − − − · · ·”, “53 4F 53”, “SOS”, ...
Webster’s Third International Dictionary:
Knowledge applies to any body of known facts or to any body of
ideas inferred from such facts or accepted as truths on good
grounds.
Information generally applies to knowledge, commonly accepted as
true, of a factual kind usually gathered form others or from books.
Data is information in numerical form that can be digitally
transmitted or processed.
Information
Fakten. Abstraktion von der jeweiligen Kodierung.
“SOS = Save Our Souls = Rettet unsere Seelen”
Wissen (knowledge)
Schließt die Interpretation der Informationen mit ein. Explizitmachen
von impliziten Informationen. Berücksichtigung von Kontext(wissen),
Regeln, Heuristiken, ...
(→ Begriffe wie Widerspruch, Redundanz, usw. erst auf dieser
Ebene möglich).
“Save Our Souls: Internationaler Hilferuf → Rettungsaktion starten”
Wissen.de
Wissen: Inbegriff von rationaler Erkenntnis; dabei auch das
Innewerden einer spezifische Gewissheit (intuitives Wissen)
→ Wissen schließt das Ableiten (inference/Innewerden) von Fakten mit ein.
Hier: Abstraktion von mentalen Sichtweisen wie Meinung, Erwartung,
Glaube, ...
SS07, T. Liebig, Uni Ulm
1 - 19
SS07, T. Liebig, Uni Ulm
1 - 20
Inhalte und Einführung
Inhalte und Einführung
Wissensrepräsentation und Schlussfolgerungen
Wissenrepräsentation und Intelligenz (1)
Repräsentation:
◮
Gruppen von Symbolen, die für eine Aussage stehen.
Wissensrepräsentationshypothese [Smith 1985]:
◮
Die Wissensrepräsentation beschäftigt sich mit formalen Symbolen,
welche die Menge von Aussagen eines Agenten/Experten/...
repräsentieren.
Any mechanically embodied intelligent process will be comprised of structural
ingredients that
◮
(a) we as external observers naturally take to represent a propositional
account of the knowledge that the overall process exhibits, and
Hier: Einschränkung auf endliche Menge von Symbolen.
Schlussfolgern:
◮
Schlussfolgern ist die formale Manipulation von Symbolen (welche
Aussagen repräsentieren) um zu Repräsentationen von neuen
Symbolen zu gelangen.
◮
Eine adäquate Repräsentation von Wissen ist hier unumgänglich –
Aussagen sind abstrakt; ihre Repräsentation kann jedoch leicht
manipuliert werden.
◮
Schlussfolgern (kann) einfach wie “Rechnen” (sein):
raining is true
raining implies wet-street is true
wet-street is true
SS07, T. Liebig, Uni Ulm
(b) independent of such external semantical attribution, play a formal but
causal and essential role in engendering the behavior that manifests that
knowledge.
Das relevante Wissen ist “propositional” explizit repräsentiert und vom
außenstehenden Betrachter als eine “natürliche” Beschreibung dieses
Wissens angesehen. System-Verhalten ist unmittelbar durch die
Propositionen bedingt und für den Betrachter mit der Bedeutung dieser
Propositionen konsistent.
1 - 21
SS07, T. Liebig, Uni Ulm
Inhalte und Einführung
Inhalte und Einführung
Wissenrepräsentation und Intelligenz (2)
Semantik der Repräsentation von Wissen
Prozedural: Wissen ist kodiert in einem Programm; die Bedeutung ergibt
sich aus dem Verhalten des Programms. Das Wissen ist
quasi “versteckt”, schwer analysier- und kommunizierbar.
The Knowledge Level [Newell 1982]:
Knowledge is to be characterized entirely functionally, in terms of what it
does, not structurally, in terms of physical objects with particular properties
and relations.
Principle of Rationality: If an agent has knowledge that one of its actions will
lead to one of its goals, then the agent will select that action.
Deklarativ: Abbildung der symbolischen Ausdrücke (Symbolebene) auf
Abstraktionsebene der zu repräsentierenden Sachverhalte
(Wissensebene). Wissen ist logisch analysierbar,
kommunizierbar und verifizierbar.
Auf Wissensebene sind Wissensinhalte zu sehen, nicht aber die interne
Struktur, in denen sich die Inhalte manifestieren (Was). Diese Strukturen
werden erst auf Symbolebene sichtbar (Wie).
Vgl. mit abstrakten Datentypen (Abstrakter Datentyp spezifiziert ein best.
Verhalten aber abstrahiert von der Realisierung dieses Verhaltens).
Extern: Abbildung bezieht sich auf externe zu modellierende
Entitäten, nicht auf im Rechner existierende Objekte (mit
interner Semantik).
⇒
SS07, T. Liebig, Uni Ulm
1 - 22
1 - 23
Wissensrepräsentationssystemen basieren in der Regel auf einer deklarativen Semantik, häufig über eine Abbildung auf eine formale Logik.
SS07, T. Liebig, Uni Ulm
1 - 24
Inhalte und Einführung
Inhalte und Einführung
Wissenrepräsentation und KI
Kriterien der Wissensrepräsentation
Hauptziel der KI-Forschung: Entwicklung intelligenter rechnergestützter
Systeme.
Korrektheit:
Ist ein Verfahren bezüglich der Semantik korrekt? Ist es möglich falsche
Schlussfolgerungen zu ziehen?
Stark vereinfacht:
Vollständigkeit:
KI-System = Wissensrepäsentation + Problemlösungstechnik +
Benutzerschnittstelle
Ist es möglich alle korrekten Schlüsse zu ziehen?
Entscheidbarkeit:
Existiert eine immer terminierender Algorithmus, der das
Schlussfolgerungsproblem löst?
Annahme:
Das hierzu notwendige Wissen, das auch vom Menschen in diesen
Situationen (bewusst oder unbewusst) benutzt wird, muss in
geeigneter Form in einem solchen System “eingebracht” werden.
Adäquatheit:
Können die zu lösenden Probleme verständlich und natürlich formuliert
werden?
Komplexität:
Dieses Wissen kann sich auf eine spezielle, eng eingrenzbare Domäne
beschränken, oder von allgemeinem Umfang sein.
SS07, T. Liebig, Uni Ulm
Welcher Aufwand ist für den Prozess der Lösungsfindung notwendig?
1 - 25
SS07, T. Liebig, Uni Ulm
Inhalte und Einführung
1 - 26
Inhalte und Einführung
The AI Hype
Potenziale und Grenzen wissensbasierter Systeme
Große Erwartungen (und Befürchtungen) Ender der siebziger Jahre.
Misserfolge und die Analyse der verwendeten Methodiken führten bald zu
einer Ernüchterung.
Heute eine sehr viel abgeklärtere Betrachtung von Expertensystemen /
wissensbasierten Systemen.
→ “If it works, it’s not AI” (Historisches siehe z. B. [Phillips, 1999])
Probleme:
◮
Wissensbasierte Systeme beschränken sich auf ein festgelegtes
Einsatzgebiet (keine Abschätzung der eigenen Grenzen und
Kompetenzen; keine Reflektion).
◮
Menschliche Experten verfügen neben Fachwissen stets auch über
Alltagswissen.
◮
Es ist schwierig das Wissen eines Experten explizit zu machen.
Anwendung sog. stillschweigendem Wissens (tacit knowledge).
◮
Formale Spezifikation und Verifikation nahezu unmöglich.
SS07, T. Liebig, Uni Ulm
1 - 27
SS07, T. Liebig, Uni Ulm
1 - 28
Inhalte und Einführung
Inhalte und Einführung
Literatur zu Teil 1
◮
Literatur zu Teil 2
Standard-Lehrbücher der KI
◦ Einf. in die/Handbuch der Künstliche Intelligenz (Görz, 2000);
insb. Kap. “Wissensrep. & Logik”
QAA 705/2000 G
◦ Knowledge Representation (Sowa, 2000)
QAA 705/2000 Sb
◦ Wissensverarbeitung (Heinsohn & Ambrosius, 1999)
QAA 706/1999 H
◮
Speziell Logik / Beschreibungslogik:
◦ Logik für Informatiker (Schöning, 2000)
◦ Logical Foundations of AI (Genesereth/Nilson, 1986)
◦ The Description Logic Handbook (Baader et. al., 2003)
◮
QAA 206/2000 S
QAA 705/1988 G
QAA 705/2003 B
Handbook on Ontologies (Staab, Studer, 2004)
◮
Ontologies: A Silver Bullet for Knowledge Management and Electronic
Commerce (Fensel, 2001)
◮
Formal Ontology in Information Systems (Guarino, 1998)
◮
Diverse Web-Quellen; Einen guten Überblick bieten:
QAA 705/2004 S
◦ “KBS/Ontology Projects and Groups” unter
[http://www.cs.utexas.edu/users/mfkb/related.html ]
Konferenzen / Workshops
◦ Cyc [http://www.cyc.org/]
◦ Int. Conf. on Principles of Knowledge Representation and Reasoning (KR)
(zweijährig) [http://www.kr.org/]
◦ Int. Workshop on Description Logics (DL) (jährlich) [http://dl.kr.org/]
◮
◮
◦ SUMO (Suggested Upper Merged Ontology) [http://suo.ieee.org/]
Diverse Web-Quellen; Interessanter Einstiegspunkte ist:
◦
◦ “AI on the Web” unter [http://www.cs.berkeley.edu/~russell/ai.html ]
SS07, T. Liebig, Uni Ulm
1 - 29
SS07, T. Liebig, Uni Ulm
Inhalte und Einführung
1 - 30
Inhalte und Einführung
Literatur zu Teil 3
Ziele der Lehrveranstaltung
(Noch) keine (allg. anerkannte) Standard-Einführung in die Thematik!
◮
XML in a Nutshell (Harold/Means, 2000)
◮
Creating the Semantic Web with RDF (Hjelm, 2001)
◮
Spinning the Semantic Web (Fensel, 2003)
◮
Dictionary of XML Technologies and the Semantic Web
(Geroimenko, 2004)
QAA 592.X5/2004 G
Web-Ressourcen:
◮
◦
◦
◦
◦
◦
Verständnis für die Problematik wecken.
◮
Grundlagen für die Modellierung und rechnergestützte
Verarbeitung von Wissen vermitteln.
◮
Vorstellung von potenziellen Anwendungsbereichen und
existierenden Systemen.
◮
Erläuterung der neuesten Entwicklungen und Darstellung des
Stands der aktuellen Forschung und Entwicklung.
◮
Aufzeigen von Trends und Visionen.
QAA 720/2001 H
QAA 420.I6/2003 F
World Wide Web Consortium [http://www.w3.org]
Semantic Web Activity des W3C [http://www.w3.org/2001/sw/]
[http://www.SemanticWeb.org/ ]
“The Semantic Web” (Scientific American 05/ 2001 von Tim Berners-Lee)
OWL Web Ontology Language [http://www.w3c.org/sw/]
SS07, T. Liebig, Uni Ulm
◮
QAA 592.X5/2001 H
1 - 31
SS07, T. Liebig, Uni Ulm
1 - 32
Inhalte und Einführung
Literatur zum Kapitel
[Smith 1985] B. Smith: Prologue to “Reflection and Semantics in a
Procedural Language”, in Readings in Knowledge
Representation, edited by R. J. Brachman & H. J. Levesque,
Morgan Kaufmann, 1985.
[Newell 1982] A. Newell: The Knowledge Level. Artificial Intelligence,
18:87-127, 1982.
[Phillips 1999] E. Phillips, If It Work’s, It’s Not AI, Bachelor thesis, MIT, USA,
1999.
SS07, T. Liebig, Uni Ulm
1 - 33
Herunterladen