VL Wissensmodellierung SS 2010

Logik-basierte Wissensmodellierung
Logik-basierte Wissensmodellierung
Abstrakter Datentyp Wissensbasis
Interaktion mit der Wissensbasis:
mitteilen (tell): (Wissen × Aussage)Problemlösungstechnik
anfragen (ask): (Wissen × Anfrage)Problemlösungstechnik
Teil I
−→ Wissen
−→ Ergebnis
Das repräsentierte Wissen ist anwendungsabhängig.
Die verwendete Problemlösungstechnik ist unabhängig von der
Anwendungsdomäne.
Logik-basierte Wissensmodellierung
Vorteil: Hoher Grad an Modularität, Trennung von Kontrollstruktur und
Wissen, Unabhängigkeit von Wissenseinheiten.
Vorsicht: Es ist noch nichts darüber ausgesagt, wie zu einer Anfrage ein
Ergebnis generiert wird, oder wie neu mitgeteiltes Wissen in bestehendes
Wissen integriert wird.
SS10, Inst. für KI, Uni Ulm
1 -1
SS10, Inst. für KI, Uni Ulm
Logik-basierte Wissensmodellierung
1 -2
Logik-basierte Wissensmodellierung
Programmiersprachen vs. deklarative Wissensverarbeitung
Architektur eines wissensbasierten Systems (vereinfacht)
Programme in (konventionellen) Programmiersprachen beschreiben wie
etwas getan werden soll.
Benutzer
In einem deklarativen System (z. B. Prolog) wird beschrieben was getan
werden soll.
Abfragekomponente
Beispiel:
Bestimmung des numerisch größten Elements einer Liste/Feld:
In Java:
int x = liste[0];
for (int i=0; i<liste.length; i++)
if (x<liste[i]) x=liste[i];
Experte
Bedienungsschnittstelle
Wissenserwerbskomponente
Steuerungssystem
Problemlösungstechnik
(Inferenzkomponente)
In Prolog:
maxliste(X,L) :- element(X,L),
groesser_liste(X,L).
groesser_liste(X,[]).
groesser_liste(X,[Y|Rest]) :- X >= Y,
groesser_liste(X,Rest).
SS10, Inst. für KI, Uni Ulm
bereichsbezogenes
Fachwissen
x ∈L
x gdw. |L| = 1
...
fallbasiertes Wissen
Wissen
x ≥ y , ∀y ∈ L
1 -3
SS10, Inst. für KI, Uni Ulm
1 -4
Logik-basierte Wissensmodellierung
Logik-basierte Wissensmodellierung
Gruppen logischer Schlussfolgerungssysteme
Prädikatenlogik
Theorembeweiser / logische Programmiersprachen: Verwendung von
Resolution (oder anderen Schlussfolgerungsmethoden) zur
Beweisfindung von Theoremen in PL1. Mitteilungen entsprechen
zusätzlichen Termen; Anfragen entsprechen Beweisen mit zugehörigen
Variablenbindungen.
Auffrischung der wichtigsten Begriffe der Prädikatenlogik 1. Stufe (PL1 / FOL)
als Referenzsprache für die nachfolgenden Themen.
Semantische Netze und Framesysteme: Abbildung von Objekten als Knoten
in einem Graph mit hierarchischer Strukturierung und binären
Beziehungen als Kanten oder Slots.
Motivation:
In der Aussagenlogik sind atomare Aussagen die einzig möglichen Bausteine
(keine interne Struktur)
Beschreibungslogiken: Weiterentwicklung Semantischer Netze mit formaler
Semantik und hierarchischer Strukturierung als primärem
Organisationsprinzip. Komplexe Begriffe werden aus atomaren
Begriffen und Beziehungen mittels einer Menge von Konstruktoren
erzeugt.
Keine Aussagen und Ableitungen möglich wie:
Produktionssysteme: Verwendung von Implikationen als primäres
Repräsentationsprinzip. Die Konsequenz jeder Implikation entspricht
einer Operation (z. B. Einfügung/Löschung) auf Wissensbasis.
Produktionssysteme basieren auf vorwärts-verkettetem Kontrollfluss mit
Konfliktresolution.
In PL1 erlauben durch die Verwendung von Prädikaten, Funktionen,
Variablen und Quantoren solche Aussagen.
SS10, Inst. für KI, Uni Ulm
Alle Studenten im Hauptstudium beherrschen formale Logik.
Peter ist ein Student im Hauptstudium.
� Peter beherrscht formale Logik.
1 -5
SS10, Inst. für KI, Uni Ulm
Logik-basierte Wissensmodellierung
1 -6
Logik-basierte Wissensmodellierung
Warum Logik?
Syntax von PL1 (Symbole & Terme)
Die Syntax legt die Bezeichner fest und definiert damit die Sprache in der
logische Aussagen formuliert werden können.
Primitive Symbole:
Konstantensymbole: (0-stellige Funktionssymbole) mit z. T. indizierten
Bezeichnern wie c1 , k1 , s1 , frodo, sam, ...
Funktionssymbole: mit kleingeschr. Bezeichnern wie f(..), alter von(..),
freunde(..), ...
Variablensymbole: mit unindizierten Bezeichnern wie x, y , z, ...
Prädikatsymbole: mit großgeschr. Bezeichnern P(..), Motor(..),
HatAlsTeil(..), ...
Die Menge der primitiven Symbole zusammen mit ihrer Stelligkeit bilden eine
Signatur.
Aus dem Vorwort von Josef Mich, Grundriß der Logik, 3. Auflage, Verlag von
Buchholz & Diebel, 1877
SS10, Inst. für KI, Uni Ulm
Terme:
1 -7
t
SS10, Inst. für KI, Uni Ulm
→
|
|
x
f (t1 , . . . , tn )
c1
Variable
Funktionsanwendung
Konstante
1 -8
Logik-basierte Wissensmodellierung
Logik-basierte Wissensmodellierung
Syntax von PL1 (Formeln)
Formeln:
φ, ψ
→
|
|
|
|
|
|
|
|
|
Semantik von PL1 (Idee)
P(t1 , . . . , tn )
T
F
¬φ
φ∨ψ
φ∧ψ
φ⇒ψ
Wie in der Aussagenlogik kann einer PL1-Formel φ der Wahrheitswert wahr
oder falsch in Abhängigkeit einer gegebenen Interpretation zugeordnet
werden. I : φ → {T , F }
Atomare Formel
Wahr
Falsch
Negation
Disjunktion
Konjunktion
Implikation
Diese Interpretation I bildet wie folgt in das Universum (universe of
discourse) mit entsprechender Stelligkeit ab (Tarski-Modell):
Konstantensymbole auf Objekte des Universums
Prädikatsymbole auf Relationen über Objekte des Universums
Funktionssymbole auf funktionale Relationen über Objekte des
Universums
Äquivalenz
Universelle Quantifikation
Existentielle Quantifikation
φ⇔ψ
∀x(φ)
∃x(φ)
Gibt es eine Interpretation I für eine Formel φ, die diese erfüllt, ist diese ein
Modell für die Formel. Geschreiben I |= φ bzw. I �|= φ wenn I kein Modell
darstellt.
Quantoren binden eine Variable. Nicht gebundene Variablen heissen freie
Variablen.
Üblicherweise betrachtet man alle potentiellen nicht-leeren Universen.
Grundterme, Grundatome, usw. sind Terme, Atome, usw. ohne
Variablenvorkommen. Z. B. freunde(frodo, sam)
SS10, Inst. für KI, Uni Ulm
Erfüllbarkeit und Gültigkeit wird bzgl. dieser Strukturen betrachtet.
1 -9
SS10, Inst. für KI, Uni Ulm
Logik-basierte Wissensmodellierung
1 - 10
Logik-basierte Wissensmodellierung
Formale Semantik von PL1 (Interpretation)
Formale Semantik von PL1 (Beispiel)
Interpretation I = (D, ·I ) mit D �= ∅ und Interpretationsfunktion ·I , die alle:
n-stelligen Funktionssymbole auf n-stellige funkionale Relationen:
f I ∈ [Dn → D],
D
n-stelligen Prädikatssymbole auf n-stellige Relationen: P I ⊆ Dn abbildet.
Interpretation von Grundtermen:
(f (t1 , . . . , tn ))
I
=
f
I
(t1I , . . . , tnI )
SS10, Inst. für KI, Uni Ulm
gdw.
�t1I , . . . , tnI �
=
d1
I
1
=
d2
2I
=
..
.
2
EvenI
=
succI
=
{2, 4, 6, . . .}
=
=
BlockI
=
RedI
=
{d1 }
∈P
I
I
I
1 - 11
|=
�|=
{1, 2, 3, . . .}
D
D
(∈ D)
Erfüllbarkeit von von Grundatomen:
I |= P(t1 , . . . , tn )
{d1 , . . . , dn } mit n > 1
bI
a
Konstantensymbole (als Spezialfälle von Funktionen) auf Objekte:
aI ∈ D,
=
I
Red(b)
Block(b)
SS10, Inst. für KI, Uni Ulm
I
I
�|=
|=
1
{(1 �→ 2), (2 �→ 3), . . .}
Even(3)
Even(succ(3))
1 - 12
Logik-basierte Wissensmodellierung
Logik-basierte Wissensmodellierung
Formale Semantik von Variablen in PL1
Formale Semantik von PL1 (Fortsetzung des Beispiels)
Abbildung von Variablen:
Funktion α : V → D (Menge aller Variablen V ).
Notation:
α[x/d] ist identisch zu α bis auf die Variable x. Für x gilt
α[x/d](x) = d.
=
I
=
bI
=
d2
BlockI
=
I
=
{d1 }
a
Für die Interpretation von Grundtermen bzgl. I und α folgt:
x I,α
=
α(x)
aI,α
=
aI
(f (t1 , . . . , tn ))I,α
=
f I (t1I,α , . . . , tnI,α )
{d1 , . . . , dn } mit n > 1
D
Red
d1
α
=
I, α
|=
I, α� [z/d1 ]
|=
I, α
D
�|=
{(x �→ d1 ), (y �→ d2 )}
Red(x)
Block(y )
Block(z)
Dergleichen für Grundatome:
I, α |= P(t1 , . . . , tn )
gdw.
�t1I,α , . . . , tnI,α � ∈ P I
SS10, Inst. für KI, Uni Ulm
1 - 13
SS10, Inst. für KI, Uni Ulm
Logik-basierte Wissensmodellierung
Logik-basierte Wissensmodellierung
Erfüllbarkeit von Formeln in PL1
Terminologie (1)
Eine PL-Formel mit den Teilformeln φ und ψ und folgenden Konstruktoren ist
erfüllbar durch I unter α wenn folgendes gilt:
I, α |= T
und
I, α |= P(t1 , . . . , tn )
gdw.
I, α |= φ ∨ ψ
gdw.
I, α |= φ ⇒ ψ
gdw.
I, α |= ∀x(φ)
gdw.
I, α |= ¬φ
gdw.
I, α |= φ ∧ ψ
gdw.
I, α |= φ ⇔ ψ
gdw.
I, α |= ∃x(φ)
gdw.
1 - 14
I, α �|= F
Interpretation:
I, α : φ → {T , F }
Modell:
I, α |= φ
I, α �|= φ
(I, α ein Modell der Formel φ, gdw. I, α : φ → T )
(I, α kein Modell der Formel φ, gdw. I, α : φ → F )
Es werden vier Fälle unterschieden: Eine Formel heisst
erfüllbar, falls sie sie mindestens eine Interpretation besitzt, sodass
die Formel wahr wird.
falsifizierbar, falls sie mindestens eine Interpretation besitzt, sodass
die Formel falsch wird.
allgemein gültig oder Tautologie, falls sie unter jeder Interpretation
wahr wird.
unerfüllbar, falls keine Interpretation existiert, die sie wahr macht.
�t1I,α , . . . , tnI,α � ∈ P I
I, α �|= φ
I, α |= φ oder I, α |= ψ
I, α |= φ und I, α |= ψ
falls I, α |= φ dann I, α |= ψ
I, α |= φ gdw. I, α |= ψ
für alle d ∈ D gilt, dass I, α[x/d] |= φ
allg. gültige
Formeln
es ein d ∈ D gibt, so dass I, α[x/d] |= φ
erfüllbare, aber
nicht gültige unerfüllbare
Formeln
Formeln
Menge erfüllbarer Formeln = allg. gültige F. ∪ erfüllbaren, aber nicht gültigen F.
Menge falsifizierbare Formeln = unerfüllbare F. ∪ erfüllbaren, aber nicht gültigen F.
SS10, Inst. für KI, Uni Ulm
1 - 15
SS10, Inst. für KI, Uni Ulm
1 - 16
Logik-basierte Wissensmodellierung
Logik-basierte Wissensmodellierung
Terminologie (2)
Formale Semantik von PL1 (Fortsetzung des Beispiels)
Zwei Formeln sind logisch äquivalent (φ ≡ ψ) gdw. für alle I, α gilt:
I, α |= φ gdw. I, α |= ψ.
Für Mengen von Formeln Θ gilt (Endlichkeitssatz / compactness theorem):
I, α |= Θ
gdw.
Θ
I, α |= ψ für alle ψ ∈ Θ
Im Kontext der logik-basierten Wissensrepräsentation ist folgende
Fragestellung interessant:
=
bI
=
1
2
3
I, α |= ψ für alle Modelle I, α für die gilt I, α |= Θ
4
5
6
SS10, Inst. für KI, Uni Ulm
1 - 17
Θ
=
Ist ψ eine logische Folgerung von Θ?
Block(a), Block(b),
∀x(Block(x) ⇒ Red(x))
BlockI
=
d1
RedI
=
d2
α
=
{d1 , . . . , dn } mit n > 1
�
{d1 }
D
{(x �→ d1 ), (y �→ d2 )}
I, α |= Block(a) ∨ ¬Block(a)?
I, α |= Block(x) ⇒ (Block(x) ∨ ¬Block(y ))?
I, α |= Block(x) ⇒ Block(y )?
I, α |= Block(a) ∧ Block(x)?
I |= ∀x(Block(x) ⇒ Red(x))?
I |= Θ?
SS10, Inst. für KI, Uni Ulm
Logik-basierte Wissensmodellierung
1 - 18
Logik-basierte Wissensmodellierung
Beispiel: Logische Folgerung


 Top(k1 ),

Top(z) ∨ ¬Clear(z),


On(x, y ) ⇒ ¬Top(y )
�
Fragestellungen:
Geschrieben Θ |= ψ
gdw.
=
I
a
“Wird eine Formel ψ durch eine gegebenen Mengen von Formeln Θ
impliziert?”
“Ist ψ eine logische Folgerung von Θ?”
Θ |= ψ
D
=
Inferenzprozeduren
D
=
ψ
=
{a, b, c}
Gesucht: automatisierbares Verfahren zur Berechnung logischer
Folgerungen → Inferenzprozedur
{On(x, y ) ⇒ ¬Clear(y )}
Zunächst Aussagenlogik:
?
Θ |= ψ
Naives Verfahren: Wahrheitstabelle
Einfache Schlussregeln:
Modus ponens:
Jedoch:
A→B
B
A
SS10, Inst. für KI, Uni Ulm
1 - 19
SS10, Inst. für KI, Uni Ulm
A→B
A
B
Modus tolens:
A→B
¬B
¬A
i. S. des log. Folgerungsbegriffs keine korrekte Schlussregel!
1 - 20
Logik-basierte Wissensmodellierung
Logik-basierte Wissensmodellierung
Ableitbarkeit
Korrektheit / Vollständigkeit von Inferenzprozeduren
Schlüsselkriterien von Inferenzprozeduren mit Inferenzprozedur i,
Formelmenge Θ, Formel ψ und Inferenzergebnis Ai :
Unterscheidung zwischen zwei Ebenen der Folgerung:
Semantische Ebene mit der logischen Folgerung, d. h. Θ |= φ
Korrektheit
Inferenzebene mit syntaktischer Ableitbarkeit
Die Prozedur i is korrekt, falls immer wenn Θ �i ψ wahr ist, auch Θ |= ψ wahr
ist.
Ableitbarkeit:
Eine Formel φ ist aus der Formelmenge Θ mit Hilfe einer Inferenzprozedur i
ableitbar, geschrieben
Vollständigkeit:
Die Prozedur i is vollständig, falls immer wenn Θ |= ψ wahr ist, auch Θ �i ψ
wahr ist.
Θ �i φ
wenn eine endliche Folge von Inferenzschritten existiert, sodass man von Θ
zu φ gelangt.
Entscheidbarkeit:
Die Aussage φ lässt sich (durch Anw. der Prozedur i) aus der Menge der
Aussagen Θ ableiten.
Ai =
Bemerkung: Ableitbarkeit hängt offensichtlich von der zugrundeliegenden
Inferenzprozedur ab.
�
1,
0,
falls Θ �i ψ
falls Θ ��i ψ
Komplexität:
Fragestellung, ob i ∈ P
SS10, Inst. für KI, Uni Ulm
1 - 21
SS10, Inst. für KI, Uni Ulm
Logik-basierte Wissensmodellierung
1 - 22
Logik-basierte Wissensmodellierung
Inferenzprozedur Resolution
Logik: Zusammenfassung
Widerspruchsbeweis: Θ |= φ äquivalent mit Θ ∧ ¬φ ist widersprüchlich.
Idee: Reduktion von PL1 auf aussagenlogische Erfüllbarkeit:
1
Pränex-Normalform (Quantoren + Matrix); Eliminieren von Implikation
und Äquivalenz; Negation nach innen; Quantoren nach außen
2
Skolemisierung (Eleminierung von existentiellen Quantoren)
� Skolem-Normalform (Pränex-Normalform ohne Existenzquantoren)
3
Umwandlung in KNF (Klauselmenge)
4
Herbrand-Interpretation/Modell:
Universum besteht aus allen möglichen Grundtermen (mind. einer
Konstante); beliebige Interpretation der Prädikate; Funktionen
syntaktisch interpretiert.
5
Logik erlaubt die Axiomatisierung einer Anwendungsdomäne und das
Schlussfolgern auf diesem Wissen
Eckpunkte:
Syntax
Semantik
Kriterium: Korrekte und vollständige Schlussfolgerungsprozedur
Probleme:
Wiederholte Anwendung der Inferenzregel (Ziel: leere Klausel � als
Resolvente).
Unerfüllbarkeit und Gültigkeit von PL1 semi-entscheidbar.
Resolution als Inferenzprozedur:
Eine Inferenzregel:
Seine C1 und C2 Klauseln und L ein Literal mit L ∈ C1 und ¬L ∈ C2 , dann
heisst die Klausel (C1 \{L}) ∪ (C2 \{¬L}) Resolvente von C1 und C2 .
Wenig zielgerichtete Problemlösungverfahren
Z. T. schlecht erweiterbar.
Schlussfolgerungsprozess i. d. R. ungeeignet für Begründung/Erklärung.
Theorem: Menge von Formeln hat ein Modell gdw. sie ein Herbrand-Modell
hat.
SS10, Inst. für KI, Uni Ulm
1 - 23
SS10, Inst. für KI, Uni Ulm
1 - 24