Logische Agenten Einführung in die Wissensverarbeitung 2 VO 708.560 + 1 UE 442.072 SS 2012 Institut für Signalverarbeitung und Sprachkommunikation TU Graz Inffeldgasse 12/1 www.spsc.tugraz.at Institut für Grundlagen der Informationsverarbeitung TU Graz Inffeldgasse 16b/1 www.igi.tugraz.at Einführung i.d. Wissensverarbeitung SS 2012 (VO 708.560) Lehrveranstaltungsübersicht IGI Kapitel 1 Grundbegriffe des maschinellen Lernens Kapitel 2 Neuronale Netze Kapitel 3 Klassische Klassifikationsalgorithmen Kapitel 4 Modellselektion Kapitel 5 Logik Einführung i.d. Wissensverarbeitung SS 2012 (VO 708.560) 2 Wissensverarbeitung Bisher: Wissensgewinnung durch Methoden aus CI. Jetzt: Entwurf eines Agenten, welcher allgemein Wissen über die Welt repräsentieren kann ... und eines Schlußfolgerungsprozesses, welcher neue Repräsentationen ableitet und diese dazu nutzt, um zu schließen, was zu tun ist (Gewinnung von neuem Wissen). Einführung i.d. Wissensverarbeitung SS 2012 (VO 708.560) 3 Beispiel Wumpus-Welt Leistungsmaß: Gold +1000, Tod -1000 -1 pro Schritt, -10 Pfeilschuß Umgebung: Quadrate neben dem Wumpus stinken Quadrate neben der Falltüre sind luftig. Glitzern falls Gold im selben Quadrat Abschießen des einzigen Pfeils töten den Wumpus Greifen nimmt das Gold im selben Quadrat auf. Sensoren: Gestank, Luftzug, Glitzern, Stoß (Mauer), Schrei (Tod des Wumpus) Aktuatoren: Linksdrehung, Rechtsdrehung, Vorwärts, Greifen, Pfeilschuß Einführung i.d. Wissensverarbeitung SS 2012 (VO 708.560) 4 Erkundung der Wumpus-Welt Grundlegende Eigenschaft des logischen Schließens: In jedem Fall, wo der Agent einen Schluss aus verfügbaren Information zieht, ist dieser Schluss garantiert korrekt, wenn die verfügbaren Information korrekt ist. Einführung i.d. Wissensverarbeitung SS 2012 (VO 708.560) 5 Wissensbasis (Knowledge Base, KB) Deklarativer Ansatz: Eine Wissensbasis enthält einer Menge von Sätzen in einer formalen Sprache, welche spezifische Information über die Welt enthalten. Ein domänenunabhängiger Schlußfolgerungsprozess leitet neues Wissen ab. Erwünschte Interaktionen mit der Wissensbasis: Teile dem Agenten mit (Tell) was er wissen soll. Den Agenten (Ask) fragt die KB was er tun soll. Einführung i.d. Wissensverarbeitung SS 2012 (VO 708.560) 6 Plan für heute: Kapitel 5 Wie wird Logik allgemein zur Wissensverarbeitung verwendet? Wie kann Wissen durch Aussagenlogik (AL) repräsentiert werden? Wie können Probleme durch Inferenz in der Aussagenlogik gelöst werden? Wumpuswelt basierend auf Aussagenlogik. Einführung i.d. Wissensverarbeitung SS 2012 (VO 708.560) 7 Wissensverarbeitung Ziel: Wir wollen Logik dazu verwenden aus bestehendem Wissen neues Wissen durch Inferenz zu gewinnen. Der Agent nimmt keinen Luftzug auf Feld [1,1] wahr. Der Agent kennt die Regeln der Wumpuswelt. Befindet sich eine Falltüre auf Feld [1,2]? Einführung i.d. Wissensverarbeitung SS 2012 (VO 708.560) 8 Logik allgemein Logiken sind formale Sprachen zur Repräsentation von Information, sodass Schlüsse gezogen werden können. Syntax definiert die Sätze der Sprache Semantik definiert die Bedeutung der Sätze, genauer gesagt den Wahrheitsgehalt von Sätzen im Hinblick auf jede mögliche Welt. Einführung i.d. Wissensverarbeitung SS 2012 (VO 708.560) 9 Logische Konsequenz Logische Konsequenz bedeuted, dass ein Satz logisch aus einem anderen Satz folgt: α╞ β Defintion: α ╞ β gilt genau dann, wenn in jeder Welt, in der α wahr ist, auch β wahr ist Einführung i.d. Wissensverarbeitung SS 2012 (VO 708.560) 10 Modelle Modelle sind mathematische Abstraktionen der Welt, die festlegen, ob Sätze wahr oder falsch sind. m ist ein Modell des Satzes α, wenn α in m wahr ist. M(α) ist die Menge aller Modelle von α. M(KB) ist die Menge aller Modelle von KB. Logische Konsequenz: KB ╞ α genau dann, wenn M(KB) ⊆ M(α) Einführung i.d. Wissensverarbeitung SS 2012 (VO 708.560) 11 Inferenzalgorithmus KB ├i α bedeuted, dass Satz α von KB mittels Inferenzalgorithmus i abgeleitet werden kann. Erwünschte Eigenschaften: Korrektheit: (wahrheitserhaltenden) Ein Inferenzalgorithmus i ist korrekt, falls KB├i α, dann ist auch KB╞ α wahr. Vollständigkeit: Ein Inferenzalgorithmus i ist vollständig wenn er jeden folgerbaren Satz ableiten kann, d.h. falls KB╞ α, dann ist auch KB├i α wahr. Einführung i.d. Wissensverarbeitung SS 2012 (VO 708.560) 12 Inferenzalgorithmus Modell-Checking Beispiel: Situation nachdem nichts in Quadrat [1,1] und ein Luftzug in Quadrat [2,1] wahrgenommen wurde. 3 mögliche Felder mit Falltüren ⇒ Insgesamt 8 mögliche Modelle Einführung i.d. Wissensverarbeitung SS 2012 (VO 708.560) 13 Inferenzalgorithmus Modell-Checking Definition: Alle möglichen Modelle werden aufgelistet, um die logische Konsequenz zu überprüfen, d.h. Zu testen ob α in allen Modellen wahr ist in denen KB wahr ist. Einführung i.d. Wissensverarbeitung SS 2012 (VO 708.560) 14 Wumpus-Welt Modelle KB = Wumpuswelt Regeln + Beobachtungen Einführung i.d. Wissensverarbeitung SS 2012 (VO 708.560) 15 Wumpus-Welt Modelle KB = Wumpuswelt Regeln + Beobachtungen α1 = "[1,2] ist sicher" Einführung i.d. Wissensverarbeitung SS 2012 (VO 708.560) 16 Wumpus-Welt Modelle KB = Wumpuswelt Regeln + Beobachtungen α2 = "[2,2] ist sicher" Einführung i.d. Wissensverarbeitung SS 2012 (VO 708.560) 17 Kapitel 5 Wie kann Wissen durch Aussagenlogik (AL) repräsentiert werden? Einführung i.d. Wissensverarbeitung SS 2012 (VO 708.560) 18 Wissensrepräsentation in der AL Ziel: Wir wollen Wissen der folgenden Form repräsentieren. Auf Feld [1,2] befindet sich eine Falltüre. Falls auf Feld [1,1] ein Luftzug ist, befindet sich auf Feld [1,2] oder [2,1] eine Falltüre. Falls auf Feld [1,1] ein Gestank ist, befindet sich auf Feld [1,2] oder Feld [2,1] eine Falltüre. Einführung i.d. Wissensverarbeitung SS 2012 (VO 708.560) 19 Aussagenlogik (AL) Es werden einfache Verknüpfungen von atomaren Sätzen A1, A2... untersucht A1 = „Paris ist die Hauptstadt von Frankreich“ A2 = „Mäuse jagen Elefanten“ Eigenschaften: Jeder dieser Sätze ist entweder wahr oder falsch. Es gibt atomare Sätze mit fixer Bedeutung: true ist immer wahr, false immer falsch Einführung i.d. Wissensverarbeitung SS 2012 (VO 708.560) 20 Syntax Eine formale Sprache ist definiert als eine Menge von Sätzen (z.B. bezeichnet durch α, β, P, Q, R, ...), wobei jeder Satz eine Folge der Symbole Ai, ¬, ( und ) ist. Sätze werden induktiv definiert: 1. Alle atomaren Sätze Ai sind Sätze 2. Für alle Sätze P und Q sind (P Q) Sätze (genannt Konjunktion). 3. Für alle Sätze P und Q sind (P Q) Sätze (genannt Disjunktion). 4. Für jeden Satz P ist ¬P ein Satz (genannt Negation). Einführung i.d. Wissensverarbeitung SS 2012 (VO 708.560) 21 Backus-Naur-Form (BNF) Def. Syntax der Aussagenlogik: Satz AtomarerSatz Symbol AtomarerSatz | KomplexerSatz true | false | Symbol A1 | A2 | A3 | … KomplexerSatz ¬Satz | (Satz Satz) | (Satz Satz) | (Satz Satz) | (Satz Satz) Klammersetzung ist wichtig, kann aber meist mittels der Prioritätsreihenfolge ¬, (von der höchsten zur niedrigsten) weggelassen werden. Einführung i.d. Wissensverarbeitung SS 2012 (VO 708.560) 22 Semantik Definiert die Regeln, wie die Wahrheit eines Satzes in Hinblick auf ein bestimmtes Modell ermittelt wird. Semantik atomarer Sätze: Ein Modell legt die Wahrheitswerte – true und false - für jeden atomaren Satz fest. Die Semnatik definiert eine Funktion A(Ai), welche jedem auftretenden atomaren Satz (Aussagensymbol) den Wert true oder false zuordnet. Einführung i.d. Wissensverarbeitung SS 2012 (VO 708.560) 23 Semantik komplexer Sätze 1. ¬P ist genau dann true, wenn P false ist. 2. (P Q) ist genau dann true, wenn P und Q true sind. 3. (P Q) ist genau dann true, wenn P oder Q (oder beide) true sind. 4. (P Q) ist genau dann false, wenn P false ist und Q true ist. 5. (P Q) ist genau dann true, wenn (P Q) und (Q P) true sind. Wahrheitswerte beliebiger Sätze werden durch rekursive Prozeduren ermittelt:: Einführung i.d. Wissensverarbeitung SS 2012 (VO 708.560) 24 Aussagenlogik: Semantik Zusammenfassung in einer Wahrheitstabelle: Einführung i.d. Wissensverarbeitung SS 2012 (VO 708.560) 25 Bsp: Sätze der Wumpus-Welt Logisches Bikonditional P Q: Regeln der Wumpus-Welt werden am besten mit Hilfe von angegeben. B1,1 PP2 B1,1 PP2 ist wahr aber unvollständig, da B1,1 false und Ptrue sein kann. Einführung i.d. Wissensverarbeitung SS 2012 (VO 708.560) 26 Bsp: Wissenbasis der Wumpus-Welt Atomare Sätze: Pi,jist true, wenn sich in Quadrat [i,j] eine Falltüre befindet. Bi,jist true, wenn sich auf Quadrat [i,j] ein Luftzug vorhanden ist. Wumpus-Welt Wissensbasis (KB): ¬P1,1 (Keine Falltüre auf [1,1]) R2: B1,1 PP2 Luftzugregel R3: B2,1 PP2P3 Luftzugregel R4: ¬B1,1 Luftzugwahrnehmung R5: B2,1 R1: Luftzugwahrnehmung KB = R1 R2 R3 R4 R5 („=“ gibt an, dass zwei Zeichenketten identisch sind) Einführung i.d. Wissensverarbeitung SS 2012 (VO 708.560) 27 Bsp: Modell-Checking Welt α1 = "[1,2] ist sicher", KB ╞ α1 Überprüfung der logischen Konzequenz für alle (der endlich vielen) Modelle. (n Symbole, O(2n) Zeitkomplexität, O(n) Speicherkomplexität) Einführung i.d. Wissensverarbeitung SS 2012 (VO 708.560) 28 Beweismethoden allgemein Beweismethoden können in zwei Arten eingeteilt werden: 1) Modell-Checking 2) Anwendung von Inferenzregeln: Korrektes Erzeugen neuer Sätze aus alten wahren Sätzen Beweis: Ist eine Sequenz von Anwendungen von Inferenzregeln. Einführung i.d. Wissensverarbeitung SS 2012 (VO 708.560) 29 Kapitel 5 Wie können Probleme durch Inferenz in der Aussagenlogik gelöst werden? Einführung i.d. Wissensverarbeitung SS 2012 (VO 708.560) 30 Wissensgewinnung mit AL Ziel: Wir können wir logische Schlüsse folgender Art mittels StandardInferenzschemata in der Aussagenlogik ziehen? Ist eine Falltüre auf Feld [1,2]? KB ╞ α ? KB = (B1,1 (P1,2 P2,1)) ¬B1,1 α = ¬P1,2 Einführung i.d. Wissensverarbeitung SS 2012 (VO 708.560) 31 Inferenzregeln Modus Ponens: α β, α β Notation: Wenn Sätze der From α β und α vorgegeben sind, kann β geschlossen werden. α β α Und-Eliminierung: Alle logischen Äquivalenzen: z.B.: α β αβ) βα) (All Regeln können mittels Modell-Checking verifiziert werden) Einführung i.d. Wissensverarbeitung SS 2012 (VO 708.560) 32 Logische Äquivalenz Zwei Sätze sind genau dann logisch (semantisch) äquivalent, wenn Sie in der selben Modellmenge true sind. α β genau dann, wenn α╞ β und β╞ α Kommutativität von Kommutativität von Assoziativität von Assoziativität von Eliminierung der doppelten Negation Kontraposition Implikationseliminierung Bikonditionaleliminierung de Morgan de Morgan Distributivität von über Distributivität von über Einführung i.d. Wissensverarbeitung SS 2012 (VO 708.560) 33 Bsp: Inferenz in der Wumpus-Welt Sätze der Wumpus-Welt Wissensbasis KB: R1: ¬P1,1 R2: B1,1 PP2 R3: R4: R5: B2,1 PP2P3 ¬B1,1 B2,1 Wie beweisen wir, dass ¬P1,2 ? R6: (B1,1 PP2(PP2B1,1 (Bikonditionale-Elemin.) R7: PP2B1,1 (Und-Eleminierung) R8: ¬B1,1 ¬PP2 (Kontraposition) R9: ¬PP2 (Modus Ponens) R10: ¬P¬P2 (de Morgan) (letzter Schritt ?) Einführung i.d. Wissensverarbeitung SS 2012 (VO 708.560) 34 Vollständige Inferenz? Bisher gezeigt: Korrektheit der Inferenzregeln Frage: Sind diese Inferenzregeln vollständig? Einführung i.d. Wissensverarbeitung SS 2012 (VO 708.560) 35 Semantische Eigenschaft von Sätzen Allgemeingültigkeit Erfüllbarkeit Einführung i.d. Wissensverarbeitung SS 2012 (VO 708.560) 36 Allgemeingültigkeit Ein Satz ist allgemeingültig, wenn er in allen Modellen wahr (true) ist. z.B. true, P ¬P, P P, (P (P Q)) Q Die Beziehung von Allgemeingültigkeit und Inferenz: Deduktionstheorem KB ╞ α genau dann, wenn (KB α) allgemeingültig ist Einführung i.d. Wissensverarbeitung SS 2012 (VO 708.560) 37 Erfüllbarkeit Ein Satz ist erfüllbar, wenn er in mindestens einem Modell wahr ist. z.B.: P Q, R Ein Satz ist unerfüllbar, wenn er in keinem Modell wahr ist. z.B.: ¬P P ¬α ist genau dann unerfüllbar, wenn α allgemeingültig ist. Die Beziehung von Unerfüllbarkeit und der logischen Konsequenz. KB ╞ α genau, dann wenn Einführung i.d. Wissensverarbeitung (KB ¬α) unerfüllbar ist (Beweis d. Widerspruch) SS 2012 (VO 708.560) 38 Vollständiger Inferenzalgorithmus: Resolution Voraussetzung: Gegeben ist ein Satz in konjunktiver Normalform (KNF). Def. konjunktiver Normalform (KNF) Ein Satz P ist in konjunktiver Normalform, falls er aus Konjunktion von Disjunktionen Di von Literalen Lj besteht D = L L …L P = D 1D2 …Dn i Literale Lj: 1 2 m i=1,...,n Di j=1,...,m Lj Symbole Ak oder deren Negationen ¬Ak Jeder Satz der Aussagenlogik ist logisch äquivalent mit einem Satz in KNF. Einführung i.d. Wissensverarbeitung SS 2012 (VO 708.560) 39 Resolutionsregel Definition: li … lk, m1 … mn li … li-1 li+1 … lk m1 … mj-1 mj+1 ... mn l,m sind Literale wobei li und mj komplementäre sind. Einführung i.d. Wissensverarbeitung SS 2012 (VO 708.560) 40 Korrektheit Auf Grund der Transitivität der Implikation P Q, Q R PR folgt für die zwei Sätze li … lk und m1 … mn und li ¬mj ¬(li … li-1 li+1 … lk) li, ¬mj (m1 … mj-1 mj+1 ... mn) ¬(li … li-1 li+1 … lk) (m1 … mj-1 mj+1 ... mn) durch Anwendung der Implikationseleminierung (A B) ≡ (¬A B) li … lk, m1 … mn li … li-1 li+1 … lk m1 … mj-1 mj+1 ... mn Einführung i.d. Wissensverarbeitung SS 2012 (VO 708.560) 41 Resolutionstheorem Genau dann, wenn eine Menge von Klauseln S unerfüllbar ist, enthält der Resolutionsschluss RC(S) dieser Klauseln die leere Klausel □. Def. Resolutionsschluss RC(S): Menge aller duch Anwendung der Resolutionsregel auf S erzeugten Klauseln. Einführung i.d. Wissensverarbeitung SS 2012 (VO 708.560) 42 Resolutionsalgorithmus Beweis durch Widerspruch, d.h. zeige dass KB ¬α unerfüllbar ist (KB ╞ α genau dann, wenn (KB ¬α) unerfüllbar ist) 1. Es gibt keine neuen Klauseln und keine leere Klausel, dann ist KB ╞ α 2. Die Resolutionsregel leitet die leer Klausel ab,dann ist α aus KB folgerbar. Anmerkung: Die Resolution ist widerlegungsvollständig, d.h. die Resolution kann immer verwendet werden, um einen Satz zu bestätigen oder zu widerlegen, (Sie kann nicht verwendet werden, um wahre Sätze aufzulisten) Einführung i.d. Wissensverarbeitung SS 2012 (VO 708.560) 43 Bsp. Wumpus-Welt Die Herleitung der leeren Klausel beweist, dass keine Falltüre auf [1,2] ist. KB = (B1,1 (P1,2 P2,1)) ¬B1,1 α = ¬P1,2 KB = (¬B1,1 P1,2 P2,1 ) ¬PB ¬PB¬B1,1 Zeige, dass (KB ¬α) unerfüllbar ist: Einführung i.d. Wissensverarbeitung SS 2012 (VO 708.560) 44 Kapitel 5 Wumpuswelt basierend auf Aussagenlogik. Einführung i.d. Wissensverarbeitung SS 2012 (VO 708.560) 45 Wissensbasis für die Physik Startfeld: ¬P1,1, , ¬W1,1 Für jedes weitere Feld: Wumpus: Bx,y ⇔ (Px,y+1 Px,y-1 Px+1,y Px-1,y) (Luftzug) Sx,y ⇔ (Wx,y+1 Wx,y-1 Wx+1,y Wx-1,y) (Gestank) W1,1 W1,2 … W4,4 (es gibt mindestens einen Wumpus) ¬W1,1 ¬W1,2 … (es gibt höchstens einen Wumpus) ⇒ 64 Symbole, 155 Sätze Einführung i.d. Wissensverarbeitung SS 2012 (VO 708.560) 46 Vollständige Wumpus-Welt Programm: Wahrnehmungen werden der Wissensbasis mitgeteilt. Auswahl welche Randquadrate (Quadrate neben bereits besuchten Quadraten) als nächstes besucht werden: Ein Quadrat [i,j] ist sicher wenn (¬Pi,j ¬Wi,j) aus der KB folgerbar ist. 264 Zeilen in der Wahrheitstabelle Einführung i.d. Wissensverarbeitung SS 2012 (VO 708.560) 47 Grenzen der Aussagenlogik Für einen ausschließlich aussagenlogischen Agenten: Symbole für die Position des Agenten wie Lx,y müssen eingeführt werden. Für jeden Zeitschritt t und Position Lx,y benötigen wir Sätze wie Ltx,y FacingRight t Forward t ⇒ Lt+1x+1,y 100 x100 Welt mit 100 Zeitschritten sprengt Kapazität derzeitiger Computer. Einfachere Repräsentation der Wumpus-Welt in der Prädikatenlogik möglich. Einführung i.d. Wissensverarbeitung SS 2012 (VO 708.560) 48