Logische Agenten

Werbung
Logische Agenten
Einführung in die Wissensverarbeitung
2 VO 708.560 + 1 UE 442.072
SS 2012
Institut für Signalverarbeitung und Sprachkommunikation
TU Graz
Inffeldgasse 12/1
www.spsc.tugraz.at
Institut für Grundlagen der Informationsverarbeitung
TU Graz
Inffeldgasse 16b/1
www.igi.tugraz.at
Einführung i.d. Wissensverarbeitung
SS 2012 (VO 708.560)
Lehrveranstaltungsübersicht
IGI
Kapitel 1
Grundbegriffe des maschinellen Lernens
Kapitel 2
Neuronale Netze
Kapitel 3
Klassische Klassifikationsalgorithmen
Kapitel 4
Modellselektion
Kapitel 5
Logik
Einführung i.d. Wissensverarbeitung
SS 2012 (VO 708.560)
2
Wissensverarbeitung
Bisher:
Wissensgewinnung durch Methoden aus CI.
Jetzt:
Entwurf eines Agenten, welcher allgemein Wissen über die Welt
repräsentieren kann
... und eines Schlußfolgerungsprozesses, welcher neue
Repräsentationen ableitet und diese dazu nutzt, um zu schließen,
was zu tun ist (Gewinnung von neuem Wissen).
Einführung i.d. Wissensverarbeitung
SS 2012 (VO 708.560)
3
Beispiel Wumpus-Welt
Leistungsmaß:
Gold +1000, Tod -1000
-1 pro Schritt, -10 Pfeilschuß
Umgebung:
Quadrate neben dem Wumpus stinken
Quadrate neben der Falltüre sind luftig.
Glitzern falls Gold im selben Quadrat
Abschießen des einzigen Pfeils töten den Wumpus
Greifen nimmt das Gold im selben Quadrat auf.
Sensoren: Gestank, Luftzug, Glitzern, Stoß (Mauer), Schrei (Tod des Wumpus)
Aktuatoren: Linksdrehung, Rechtsdrehung, Vorwärts, Greifen, Pfeilschuß
Einführung i.d. Wissensverarbeitung
SS 2012 (VO 708.560)
4
Erkundung der Wumpus-Welt
Grundlegende Eigenschaft des logischen Schließens:
In jedem Fall, wo der Agent einen Schluss aus verfügbaren Information zieht,
ist dieser Schluss garantiert korrekt, wenn die verfügbaren Information korrekt ist.
Einführung i.d. Wissensverarbeitung
SS 2012 (VO 708.560)
5
Wissensbasis (Knowledge Base, KB)
Deklarativer Ansatz:
Eine Wissensbasis enthält einer Menge von Sätzen in einer
formalen Sprache, welche spezifische Information über die Welt enthalten.
Ein domänenunabhängiger Schlußfolgerungsprozess leitet neues Wissen ab.
Erwünschte Interaktionen mit der Wissensbasis:
Teile dem Agenten mit (Tell) was er wissen soll.
Den Agenten (Ask) fragt die KB was er tun soll.
Einführung i.d. Wissensverarbeitung
SS 2012 (VO 708.560)
6
Plan für heute: Kapitel 5
Wie wird Logik allgemein zur Wissensverarbeitung verwendet?
Wie kann Wissen durch Aussagenlogik (AL) repräsentiert werden?
Wie können Probleme durch Inferenz in der Aussagenlogik gelöst werden?
Wumpuswelt basierend auf Aussagenlogik.
Einführung i.d. Wissensverarbeitung
SS 2012 (VO 708.560)
7
Wissensverarbeitung
Ziel:
Wir wollen Logik dazu verwenden aus bestehendem Wissen neues Wissen
durch Inferenz zu gewinnen.
Der Agent nimmt keinen Luftzug auf Feld [1,1] wahr.
Der Agent kennt die Regeln der Wumpuswelt.
Befindet sich eine Falltüre auf Feld [1,2]?
Einführung i.d. Wissensverarbeitung
SS 2012 (VO 708.560)
8
Logik allgemein
Logiken sind formale Sprachen zur Repräsentation von Information, sodass
Schlüsse gezogen werden können.
Syntax definiert die Sätze der Sprache
Semantik definiert die Bedeutung der Sätze, genauer gesagt den
Wahrheitsgehalt von Sätzen im Hinblick auf jede mögliche Welt.
Einführung i.d. Wissensverarbeitung
SS 2012 (VO 708.560)
9
Logische Konsequenz
Logische Konsequenz bedeuted, dass ein Satz logisch aus einem anderen Satz
folgt:
α╞ β
Defintion: α ╞ β gilt genau dann, wenn in jeder Welt, in der α wahr ist, auch
β wahr ist
Einführung i.d. Wissensverarbeitung
SS 2012 (VO 708.560)
10
Modelle
Modelle sind mathematische Abstraktionen der Welt, die festlegen, ob Sätze
wahr oder falsch sind.
m ist ein Modell des Satzes α, wenn α in m wahr ist.
M(α) ist die Menge aller Modelle von α.
M(KB) ist die Menge aller Modelle von KB.
Logische Konsequenz:
KB ╞ α genau dann, wenn M(KB) ⊆ M(α)
Einführung i.d. Wissensverarbeitung
SS 2012 (VO 708.560)
11
Inferenzalgorithmus
KB ├i α bedeuted, dass Satz α von KB mittels Inferenzalgorithmus i
abgeleitet werden kann.
Erwünschte Eigenschaften:
Korrektheit: (wahrheitserhaltenden)
Ein Inferenzalgorithmus i ist korrekt, falls KB├i α, dann ist auch KB╞ α wahr.
Vollständigkeit:
Ein Inferenzalgorithmus i ist vollständig wenn er jeden folgerbaren Satz
ableiten kann, d.h. falls KB╞ α, dann ist auch KB├i α wahr.
Einführung i.d. Wissensverarbeitung
SS 2012 (VO 708.560)
12
Inferenzalgorithmus Modell-Checking
Beispiel:
Situation nachdem nichts in Quadrat [1,1] und ein Luftzug in Quadrat [2,1]
wahrgenommen wurde.
3 mögliche Felder mit Falltüren ⇒ Insgesamt 8 mögliche Modelle
Einführung i.d. Wissensverarbeitung
SS 2012 (VO 708.560)
13
Inferenzalgorithmus Modell-Checking
Definition:
Alle möglichen Modelle werden aufgelistet, um die logische Konsequenz zu
überprüfen, d.h. Zu testen ob α in allen Modellen wahr ist in denen KB wahr ist.
Einführung i.d. Wissensverarbeitung
SS 2012 (VO 708.560)
14
Wumpus-Welt Modelle
KB = Wumpuswelt Regeln + Beobachtungen
Einführung i.d. Wissensverarbeitung
SS 2012 (VO 708.560)
15
Wumpus-Welt Modelle
KB = Wumpuswelt Regeln + Beobachtungen
α1 = "[1,2] ist sicher"
Einführung i.d. Wissensverarbeitung
SS 2012 (VO 708.560)
16
Wumpus-Welt Modelle
KB = Wumpuswelt Regeln + Beobachtungen
α2 = "[2,2] ist sicher"
Einführung i.d. Wissensverarbeitung
SS 2012 (VO 708.560)
17
Kapitel 5
Wie kann Wissen durch Aussagenlogik (AL) repräsentiert werden?
Einführung i.d. Wissensverarbeitung
SS 2012 (VO 708.560)
18
Wissensrepräsentation in der AL
Ziel:
Wir wollen Wissen der folgenden Form repräsentieren.
Auf Feld [1,2] befindet sich eine Falltüre.
Falls auf Feld [1,1] ein Luftzug ist, befindet sich auf Feld [1,2] oder [2,1] eine
Falltüre.
Falls auf Feld [1,1] ein Gestank ist, befindet sich auf Feld [1,2] oder Feld
[2,1] eine Falltüre.
Einführung i.d. Wissensverarbeitung
SS 2012 (VO 708.560)
19
Aussagenlogik (AL)
Es werden einfache Verknüpfungen von atomaren Sätzen A1, A2... untersucht
A1 = „Paris ist die Hauptstadt von Frankreich“
A2 = „Mäuse jagen Elefanten“
Eigenschaften:
Jeder dieser Sätze ist entweder wahr oder falsch.
Es gibt atomare Sätze mit fixer Bedeutung: true ist immer wahr,
false immer falsch
Einführung i.d. Wissensverarbeitung
SS 2012 (VO 708.560)
20
Syntax
Eine formale Sprache ist definiert als eine Menge von Sätzen
(z.B. bezeichnet durch α, β, P, Q, R, ...), wobei jeder Satz eine Folge der Symbole
Ai, ¬, ( und ) ist.
Sätze werden induktiv definiert:
1. Alle atomaren Sätze Ai sind Sätze
2. Für alle Sätze P und Q sind (P Q) Sätze
(genannt Konjunktion).
3. Für alle Sätze P und Q sind (P Q) Sätze
(genannt Disjunktion).
4. Für jeden Satz P ist ¬P ein Satz
(genannt Negation).
Einführung i.d. Wissensverarbeitung
SS 2012 (VO 708.560)
21
Backus-Naur-Form (BNF)
Def. Syntax der Aussagenlogik:
Satz
AtomarerSatz
Symbol
 AtomarerSatz | KomplexerSatz
 true | false | Symbol
 A1 | A2 | A3 | …
KomplexerSatz  ¬Satz | (Satz Satz) | (Satz Satz)
| (Satz Satz) | (Satz Satz)
Klammersetzung ist wichtig, kann aber meist mittels der Prioritätsreihenfolge
¬, 
(von der höchsten zur niedrigsten) weggelassen werden.
Einführung i.d. Wissensverarbeitung
SS 2012 (VO 708.560)
22
Semantik
Definiert die Regeln, wie die Wahrheit eines Satzes in Hinblick auf ein bestimmtes
Modell ermittelt wird.
Semantik atomarer Sätze:
Ein Modell legt die Wahrheitswerte – true und false - für jeden atomaren Satz fest.
Die Semnatik definiert eine Funktion A(Ai), welche jedem auftretenden atomaren
Satz (Aussagensymbol) den Wert true oder false zuordnet.
Einführung i.d. Wissensverarbeitung
SS 2012 (VO 708.560)
23
Semantik komplexer Sätze
1. ¬P
ist genau dann true, wenn P false ist.
2. (P Q)
ist genau dann true, wenn P und Q true sind.
3. (P Q)
ist genau dann true, wenn P oder Q (oder beide) true sind.
4. (P Q)
ist genau dann false, wenn P false ist und Q true ist.
5. (P Q)
ist genau dann true, wenn (P Q) und (Q P) true sind.
Wahrheitswerte beliebiger Sätze werden durch rekursive Prozeduren ermittelt::
Einführung i.d. Wissensverarbeitung
SS 2012 (VO 708.560)
24
Aussagenlogik: Semantik
Zusammenfassung in einer Wahrheitstabelle:
Einführung i.d. Wissensverarbeitung
SS 2012 (VO 708.560)
25
Bsp: Sätze der Wumpus-Welt
Logisches Bikonditional P Q:
Regeln der Wumpus-Welt werden am besten mit Hilfe von angegeben.
B1,1 PP2
B1,1 PP2 ist wahr aber unvollständig, da B1,1 false und Ptrue sein kann.
Einführung i.d. Wissensverarbeitung
SS 2012 (VO 708.560)
26
Bsp: Wissenbasis der Wumpus-Welt
Atomare Sätze:
Pi,jist true, wenn sich in Quadrat [i,j] eine Falltüre befindet.
Bi,jist true, wenn sich auf Quadrat [i,j] ein Luftzug vorhanden ist.
Wumpus-Welt Wissensbasis (KB):
¬P1,1
(Keine Falltüre auf [1,1])
R2:
B1,1 PP2
Luftzugregel
R3:
B2,1 PP2P3
Luftzugregel
R4:
¬B1,1
Luftzugwahrnehmung
R5:
B2,1
R1:
Luftzugwahrnehmung
KB = R1 R2 R3 R4 R5
(„=“ gibt an, dass zwei Zeichenketten identisch sind)
Einführung i.d. Wissensverarbeitung
SS 2012 (VO 708.560)
27
Bsp: Modell-Checking Welt
α1 = "[1,2] ist sicher", KB ╞ α1
Überprüfung der logischen Konzequenz für alle (der endlich vielen) Modelle.
(n Symbole, O(2n) Zeitkomplexität, O(n) Speicherkomplexität)
Einführung i.d. Wissensverarbeitung
SS 2012 (VO 708.560)
28
Beweismethoden allgemein
Beweismethoden können in zwei Arten eingeteilt werden:
1) Modell-Checking
2) Anwendung von Inferenzregeln:
Korrektes Erzeugen neuer Sätze aus alten wahren Sätzen
Beweis: Ist eine Sequenz von Anwendungen von Inferenzregeln.
Einführung i.d. Wissensverarbeitung
SS 2012 (VO 708.560)
29
Kapitel 5
Wie können Probleme durch Inferenz in der Aussagenlogik gelöst werden?
Einführung i.d. Wissensverarbeitung
SS 2012 (VO 708.560)
30
Wissensgewinnung mit AL
Ziel:
Wir können wir logische Schlüsse folgender Art mittels StandardInferenzschemata in der Aussagenlogik ziehen?
Ist eine Falltüre auf Feld [1,2]?
KB ╞ α ?
KB = (B1,1  (P1,2  P2,1)) ¬B1,1 
α = ¬P1,2
Einführung i.d. Wissensverarbeitung
SS 2012 (VO 708.560)
31
Inferenzregeln
Modus Ponens:
α β, α
β
Notation:
Wenn Sätze der From α β und α vorgegeben sind, kann β geschlossen werden.
α β
α
Und-Eliminierung:
Alle logischen Äquivalenzen:
z.B.:
α β
αβ) βα)
(All Regeln können mittels Modell-Checking verifiziert werden)
Einführung i.d. Wissensverarbeitung
SS 2012 (VO 708.560)
32
Logische Äquivalenz
Zwei Sätze sind genau dann logisch (semantisch) äquivalent, wenn Sie in der
selben Modellmenge true sind.
α β
genau dann, wenn α╞ β und β╞ α
Kommutativität von 
Kommutativität von 
Assoziativität von 
Assoziativität von 
Eliminierung der doppelten Negation
Kontraposition
Implikationseliminierung
Bikonditionaleliminierung
de Morgan
de Morgan
Distributivität von über
Distributivität von über 
Einführung i.d. Wissensverarbeitung
SS 2012 (VO 708.560)
33
Bsp: Inferenz in der Wumpus-Welt
Sätze der Wumpus-Welt Wissensbasis KB:
R1:
¬P1,1
R2:
B1,1 PP2
R3:
R4:
R5:
B2,1 PP2P3
¬B1,1
B2,1
Wie beweisen wir, dass ¬P1,2 ?
R6:
(B1,1 PP2(PP2B1,1 
(Bikonditionale-Elemin.)
R7:
PP2B1,1
(Und-Eleminierung)
R8:
¬B1,1 ¬PP2
(Kontraposition)
R9:
¬PP2
(Modus Ponens)
R10: ¬P¬P2
(de Morgan)
(letzter Schritt ?)
Einführung i.d. Wissensverarbeitung
SS 2012 (VO 708.560)
34
Vollständige Inferenz?
Bisher gezeigt: Korrektheit der Inferenzregeln
Frage: Sind diese Inferenzregeln vollständig?
Einführung i.d. Wissensverarbeitung
SS 2012 (VO 708.560)
35
Semantische Eigenschaft von Sätzen
Allgemeingültigkeit
Erfüllbarkeit
Einführung i.d. Wissensverarbeitung
SS 2012 (VO 708.560)
36
Allgemeingültigkeit
Ein Satz ist allgemeingültig, wenn er in allen Modellen wahr (true) ist.
z.B.
true,
P ¬P,
P  P,
(P  (P  Q))  Q
Die Beziehung von Allgemeingültigkeit und Inferenz: Deduktionstheorem
KB ╞ α genau dann, wenn (KB  α) allgemeingültig ist
Einführung i.d. Wissensverarbeitung
SS 2012 (VO 708.560)
37
Erfüllbarkeit
Ein Satz ist erfüllbar, wenn er in mindestens einem Modell wahr ist.
z.B.:
P Q, R
Ein Satz ist unerfüllbar, wenn er in keinem Modell wahr ist.
z.B.:
¬P P
¬α ist genau dann unerfüllbar, wenn α allgemeingültig ist.
Die Beziehung von Unerfüllbarkeit und der logischen Konsequenz.
KB ╞ α genau, dann wenn
Einführung i.d. Wissensverarbeitung
(KB ¬α) unerfüllbar ist
(Beweis d. Widerspruch)
SS 2012 (VO 708.560)
38
Vollständiger Inferenzalgorithmus:
Resolution
Voraussetzung:
Gegeben ist ein Satz in konjunktiver Normalform (KNF).
Def. konjunktiver Normalform (KNF)
Ein Satz P ist in konjunktiver Normalform, falls er aus Konjunktion von
Disjunktionen Di von Literalen Lj besteht

D = L L …L  
P = D 1D2 …Dn
i
Literale Lj:
1
2
m
i=1,...,n
Di
j=1,...,m
Lj
Symbole Ak oder deren Negationen ¬Ak
Jeder Satz der Aussagenlogik ist logisch äquivalent mit einem Satz in KNF.
Einführung i.d. Wissensverarbeitung
SS 2012 (VO 708.560)
39
Resolutionsregel
Definition:
li …  lk,
m1  …  mn
li  …  li-1 li+1  …  lk  m1  …  mj-1  mj+1 ...  mn
l,m sind Literale wobei li und mj komplementäre sind.
Einführung i.d. Wissensverarbeitung
SS 2012 (VO 708.560)
40
Korrektheit
Auf Grund der Transitivität der Implikation
P  Q,
Q R
PR
folgt für die zwei Sätze li …  lk und m1  …  mn und li  ¬mj
¬(li  …  li-1 li+1  …  lk) li,
¬mj  (m1  …  mj-1  mj+1 ...  mn)
¬(li  …  li-1 li+1  …  lk)  (m1  …  mj-1  mj+1 ...  mn)
durch Anwendung der Implikationseleminierung (A  B) ≡ (¬A B)
li …  lk,
m1  …  mn
li  …  li-1 li+1  …  lk  m1  …  mj-1  mj+1 ...  mn
Einführung i.d. Wissensverarbeitung
SS 2012 (VO 708.560)
41
Resolutionstheorem
Genau dann, wenn eine Menge von Klauseln S unerfüllbar ist, enthält
der Resolutionsschluss RC(S) dieser Klauseln die leere Klausel □.
Def. Resolutionsschluss RC(S):
Menge aller duch Anwendung der Resolutionsregel auf S erzeugten Klauseln.
Einführung i.d. Wissensverarbeitung
SS 2012 (VO 708.560)
42
Resolutionsalgorithmus
Beweis durch Widerspruch, d.h. zeige dass KB ¬α unerfüllbar ist
(KB ╞ α genau dann, wenn (KB ¬α) unerfüllbar ist)
1. Es gibt keine neuen Klauseln und keine leere Klausel, dann ist KB ╞ α
2. Die Resolutionsregel leitet die leer Klausel ab,dann ist α aus KB folgerbar.
Anmerkung:
Die Resolution ist widerlegungsvollständig, d.h. die Resolution kann immer
verwendet werden, um einen Satz zu bestätigen oder zu widerlegen,
(Sie kann nicht verwendet werden, um wahre Sätze aufzulisten)
Einführung i.d. Wissensverarbeitung
SS 2012 (VO 708.560)
43
Bsp. Wumpus-Welt
Die Herleitung der leeren Klausel beweist, dass keine Falltüre auf [1,2] ist.
KB = (B1,1  (P1,2  P2,1)) ¬B1,1
α = ¬P1,2
KB = (¬B1,1  P1,2  P2,1 ) ¬PB ¬PB¬B1,1
Zeige, dass (KB ¬α) unerfüllbar ist:
Einführung i.d. Wissensverarbeitung
SS 2012 (VO 708.560)
44
Kapitel 5
Wumpuswelt basierend auf Aussagenlogik.
Einführung i.d. Wissensverarbeitung
SS 2012 (VO 708.560)
45
Wissensbasis für die Physik
Startfeld:
¬P1,1, ,
¬W1,1
Für jedes weitere Feld:
Wumpus:
Bx,y ⇔ (Px,y+1  Px,y-1  Px+1,y  Px-1,y)
(Luftzug)
Sx,y ⇔ (Wx,y+1  Wx,y-1  Wx+1,y  Wx-1,y)
(Gestank)
W1,1  W1,2  …  W4,4
(es gibt mindestens einen Wumpus)
¬W1,1  ¬W1,2
…
(es gibt höchstens einen Wumpus)
⇒ 64 Symbole, 155 Sätze
Einführung i.d. Wissensverarbeitung
SS 2012 (VO 708.560)
46
Vollständige Wumpus-Welt
Programm:
Wahrnehmungen werden der Wissensbasis mitgeteilt.
Auswahl welche Randquadrate (Quadrate neben bereits besuchten
Quadraten) als nächstes besucht werden:
Ein Quadrat [i,j] ist sicher wenn (¬Pi,j  ¬Wi,j) aus der KB folgerbar ist.
264 Zeilen in der Wahrheitstabelle
Einführung i.d. Wissensverarbeitung
SS 2012 (VO 708.560)
47
Grenzen der Aussagenlogik
Für einen ausschließlich aussagenlogischen Agenten:
Symbole für die Position des Agenten wie Lx,y müssen eingeführt werden.
Für jeden Zeitschritt t und Position Lx,y benötigen wir Sätze wie
Ltx,y  FacingRight t  Forward t ⇒ Lt+1x+1,y
100 x100 Welt mit 100 Zeitschritten sprengt Kapazität derzeitiger Computer.
Einfachere Repräsentation der Wumpus-Welt in der Prädikatenlogik möglich.
Einführung i.d. Wissensverarbeitung
SS 2012 (VO 708.560)
48
Herunterladen