Informatik I Sommersemester 2005 Dozent: [email protected] Einführung Was ist Informatik? Programmierung? Kooperationspartnerin / Hilfswissenschaft? Das klassische Dreisäulen-Prinzip: Theoretische, praktische und technische Informatik. Kandidatin für eine vierte Säule ist die „sozial-orientierte“ Informatik. Der Denkansatz der Informatik ist es, Aspekte „intelligenten“1 Verhaltens formal zu modellieren. Beispiele für Intelligenzaspekte sind: Zahlenrechnen Gestalterkennung Logisches Schlussfolgern Aufmerksamkeitssteuerung Suchen, Sortieren Szenenanalyse /- interpretation Formelmanipulation Diagnostizieren Analyse, Übersetzung Sprachen Reflektieren / Nachdenken Planen Reagieren Autonomes Handeln Lernen Verarbeitung natürlicher Sprache Klassifikation formaler Konfigurieren Klassisch wird die Informatik als Computerwissenschaft aufgefasst: Informatik = INFORmation + AutoMATIK. Eine andere Auffassung ist: Informatik = INtelligenzFORMAlisierungsTechnIK. 1 Siehe dazu beispielsweise den Eintrag “Intelligence” in der Encyclopedia of artificial intelligence, Stuart Charles Shapiro [Hrsg.], New York 1990. UB Duisburg: 01 TTS1360-1+1. 1 Zu den Aufgaben der Informatik gehört es, Daten/Informationen/Wissen zu gewinnen, (wiederauffindbar) zu speichern, zu verarbeiten, anzuwenden (Intelligenz erfordernde Aufgaben zu erledigen). Ein Informatiksystem ist die technische Realisierung eines formalen Modells. Modellbildung: Von der Realität zum formalen Modell Dieser Übergang findet nicht durch Abstraktion (die das Detail als unwichtig impliziert), sondern durch Reduktion statt, also die Zurückführen einer Sache (der Realität) auf eine ganz andere Sache (die formale Beschreibung eines Informatiksystems) Formale Modelle sind bestimmt durch die zu modellierenden Realitätsaspekte, die theoretischen Möglichkeiten und Grenzen für formale Beschreibungen, die Eigenschaften der zu konstruierenden Informatiksysteme. Was ist Logik? Als Logik bezeichnet man die Wissenschaft von den Gesetzen und Formen des Denkens. Es ist die Lehre vom richtigen Schließen. Durch Algorithmen beschrieben und in formalisierter Form wird logisches Schließen kalkulierbar, also auch vom Computer ausführbar. Selbständige Schlussfolgerungen sind zentrale Leistungen der menschlichen Intelligenz. Somit ist formale Logik eine der Grundlagen der Künstlichen Intelligenz. 2 Aussagenlogik Wenn der Bildschirm dunkel ist, dann ist der Computer ausgeschaltet, oder der Strom ist ausgefallen. Wenn der Computer nicht ausgeschaltet ist und der Strom ausfällt, dann wird der Bildschirm dunkel. Wenn der Bildschirm hell ist, dann ist der Computer ausgeschaltet, oder der Strom ist nicht ausgefallen. Formale Logiken werden in der Computerlinguistik benutzt, um unser Denken, Schlussfolgern und insbesondere bestimmte Aspekte unserer sprachlichen Äußerungen über die Welt zu bestimmen. Die einfachste solche Logik ist die Aussagenlogik als Teil der „Prädikatenlogik erster Stufe“. Ein aussagenlogischer Ausdruck (eine Aussage) beschreibt bestimmte Eigenschaften einzelner Gegenstände. Diese Eigenschaften können zutreffen oder auch nicht; entsprechend ist die betreffende Aussage WAHR oder FALSCH. Der Bildschirm ist dunkel. Der Bildschirm ist nicht dunkel. Hat man mehrere gültige Aussagen, so kann man manchmal auf die Gültigkeit anderer Aussagen schließen: Wenn der Bildschirm ausgeschaltet ist oder der Strom ausgefallen ist, ist der Bildschirm dunkel. Der Strom ist ausgefallen. Ist der Bildschirm dunkel? Ist der Bildschirm ausgeschaltet? Ist der Strom ausgefallen, wenn der Computer nicht ausgeschaltet und der Bildschirm dunkel ist? D.h. ist die Aussage „Wenn der Computer nicht ausgeschaltet ist und der Bildschirm dunkel ist, ist dann der Strom ausgefallen.“ unter den obengenannten Bedingungen wahr? 3 Voraussetzungen Es ist genau festgelegt (wohldefiniert) um welche Gegenstände es sich jeweils bezeichnet jeder Name genau ein Individuum) ob eine Eigenschaft auf ein bestimmtes Individuum zutrifft oder nicht (ob ein Prädikat für ein bestimmtes Argument gilt oder nicht, eine Aussage wahr oder falsch ist) welche Schlüsse man daraus ziehen kann, dass bestimmte Prädikate gelten handelt, (beispielsweise Logische Operatoren und natürlichsprachliche Aussagen Die obengenannten Voraussetzungen sind in natürlichsprachlichen Aussagen nicht gegeben: Oft ist nicht klar, auf welchen Gegenstand sich ein Wort bezieht oder wann eine Eigenschaft gilt oder nicht. Stell den Bildschirm dunkler/heller. – Welchen Bildschirm, hell/dunkel genug? Die logischen Operatoren entsprechen nicht den sprachlichen Ausdrücken „und“, „oder“, „wenn –dann“ usw. Geh jetzt und du brauchst nicht wiederzukommen! Aus der Sicht des Logikkalküls ist es außerdem völlig gleichgültig, ob eine bestimmte Aussage für uns sinnvoll ist oder nicht. Wenn der Bildschirm hell ist, dann ist der Computer ausgeschaltet, oder der Strom ist nicht ausgefallen. Abhilfe komplexe Logiken (z.B. mehrwertige Logiken, „mögliche Welten“) Einsicht, welche sprachlichen Phänomene bzw. “Bereiche der Welt“ sich logisch formalisieren lassen. 4 Verknüpfungen - Rechnen mit Wahrheitswerten Indem man für jede Kombination der beiden Werte „wahr“ und „falsch“ ein Verknüpfungsergebnis festlegt – eine sog. Wahrheitstafel – lassen sich beliebige Verknüpfungen definieren (für die vier häufigsten, zweistelligen Verknüpfungen 24=16 Verknüpfungen). Am häufigsten werden benutzt: Konjunktion Disjunktion Implikation Koimplikation Hinzu kommt der einstellige Operator Negation Negation ("nicht"): Symbol: p p w f f w Der Computer ist nicht eingeschaltet. Es ist nicht der Fall, dass der Computer eingeschaltet ist. Viele sprachliche Äußerungen enthalten allerdings mehrere Aussagen, so dass unklar sein kann, worauf sich die Negation bezieht: Gegendarstellung: Es ist nicht der Fall, dass ich den Geliebten meiner Frau in ihrem Kleiderschrank gefunden und mit 12 faulen Tomaten beworfen habe. 5 Konjunktion ("und"): Symbol: p q pq w w w w f f f w f f f f Die Konjunktion und hat noch weitere Bedeutungsdimensionen: distributive vs. kollektive Lesart bei Nominalphrasen: Alfred schuldet Berta und Carl (je) 50 DM. Alfred schuldet Berta und Carl (zusammen) 50 DM. zeitliche Sequenz: Gunnar legte sich aufs Bett und starb. Gunnar starb und legte sich aufs Bett. Außerdem kann es auch als Implikation statt als logische Konjunktion verwendet werden: Rühr mich an, und du kannst was erleben! Disjunktion ("oder"): Symbol: p q pq w w w w f w f w w f f f Das Kind hat sicher Durst oder Hunger, oder es ist müde. 6 Neben diesem "inklusiven oder" gibt es ein "exklusives oder" (entweder – oder, „XOR“), das für wahres p und q den Wert "falsch" ergibt: Ich habe am Mittwoch in der Mensa oder im Restaurant gegessen (aber nicht zu Hause). Sie können als Nachtisch Eis oder Käse haben. Ich werde Julia oder Sabine heiraten. Implikation ("wenn, dann"): Symbol p q pq w w w w f f f w w f f w Wenn es regnet, ist die Straße nass. (wahre Aussage) Wenn die Straße nass ist, regnet es. (falsche Aussage) Zu beachten: Aus einer falschen Prämisse können beliebige Schlüsse gezogen werden. Dies widerspricht unserer Intuition: Wenn der Mond aus grünem Käse ist, heiße ich Otto. Es ist wahr, dass ich Otto heiße, wenn der Mond aus grünem Käse ist. Eine Implikation kann auch zwischen zwei Aussagen gelten, die nicht kausal voneinander abhängig sind: Wenn der Tag 24 Stunden hat, ist drei mal drei gleich neun. Die Wörter wenn - dann werden häufig folgendermaßen benutzt zur Beschreibung von Möglichkeiten: Wenn ich reich wäre, würde ich euch alle einladen. 7 zur Angabe von Regeln: Wenn du einem Hund tief in die Augen schaust, beißt er dich nicht. um einen Zeitablauf (mit-)auszudrücken: Wenn Petra vier Äpfel hat und Paul davon zwei gibt, hat sie noch zwei. Koimplikation ("genau dann, wenn"): Symbol p q p q w w w w f f f w f f f w (Genau dann, ) wenn es Mitternacht schlägt, kommen die Gespenster. (Genau dann) wenn die Gespenster kommen, schlägt es Mitternacht. Bindungsstärken Wenn mehrere Verknüpfungen in einer Aussage auftreten, so gilt folgende Rangfolge: stärkste Bindung ¬ , schwächste Bindung Abweichungen von dieser Rangfolge müssen durch Klammerung deutlich gemacht werden. 8 Beispiel: Spielzeug-Welt Gegeben sei eine Welt. Diese enthält mehrere mit Namen eindeutig identifizierbare Objekte. Diese Objekte haben bestimmte Eigenschaften, wie beispielsweise eine Farbe, eine Form, eine Größe. Die Aussagen, die wir über diese Welt machen können, beschreiben Eigenschaften von Objekten und werden im folgenden Prädikate genannt. Prädikate werden üblicherweise in Präfix-Notation angegeben, d.h. die Argumente werden nach dem Prädikat in Klammern notiert. Die Reihenfolge der Argumente ist wichtig, ebenso die korrekte Anzahl (Stelligkeit)! würfelchen(x) grün (x) gehört (x, "Simone Sommer") liegt_auf(x, y) Ob ein Prädikat, bezogen auf bestimmte Argumente, wahr oder falsch ist, hängt von der aktuellen Spielzeug-Welt ab, d.h. von den Objekten und deren Eigenschaften. Aus atomaren Aussagen, die nur aus einem Prädikat bestehen, lassen sich durch Verknüpfungsoperationen komplexere Aussagen erzeugen. grün(x) gehört (x, "Simone Sommer") ¬liebt(y,x) dumm(y) liebt(y,x) ¬ dumm(y) (dumm(y) liebt(y,x)) ¬ dumm(y) dumm(y) liebt(y,x) ¬ dumm(y) Kleiner Vorgriff: Komplexe Aussagen können einen Wahrheitswert haben, der unabhängig von der aktuellen Welt immer wahr oder immer falsch ist. 9 Computer und Wahrheitswerte (Fast) alle Computer arbeiten ausschließlich mit zwei Werten: elektrischer Zustand: Strom an - Strom aus arithmetische Interpretation: 0 logische Interpretation: wahr - - 1 falsch Für diese beiden Werte werden Verknüpfungen definiert. arithmetisch: z.B. Addition logisch: z.B. Konjunktion ("und-Verknüpfung") 0 + 0 = 0 0 + 1 = 1 1 + 0 = 1 1 + 1 = 10 w w = w w f = f f w = f f f = f Sowohl Arithmetik als auch Logik sind exakt definierte Kalküle. Sie sollen jedoch Gegebenheiten der Welt abbilden, dabei entsprechen die Zahlen z.B. der Anzahl von Gegenständen, die logischen Werte den Wahrheitswerten von Aussagen: w: f: Der April hat 30 Tage. Jeder Tag hat 25 Stunden. w f =f Der April hat 30 Tage, und jeder Tag hat 25 Stunden. Wie bereits gesehen, funktioniert diese Abbildung bei der Logik leider nicht ganz so gut wie bei der Arithmetik: Aussagen müssen sprachlich formuliert werden; sprachliche Ausdrücke wie "und" und "oder" haben aber eine etwas andere Bedeutung als die logischen Verknüpfungen. Logisch korrekte Schlüsse entsprechen nicht immer unserer Intuition. 10 Anwendungsbeispiel: Expertensystem Fakten A: B: C: D: E: F: Albert ist männlich. Edward ist männlich. Alice ist weiblich. Victoria ist weiblich. Edward's Eltern sind Victoria und Albert. Alice's Eltern sind Victoria und Albert. Regel für "Schwester" (X ist weiblich) (X hat Mutter M und Vater V) (Y hat Mutter M und Vater V) X ist Schwester von Y. Das Expertensystem kann jetzt maschinell zeigen, wer wessen Schwester ist. 11 Eigenschaften von Aussagen Äquivalenz (a b) Verschiedene Aussagen können stets denselben Wahrheitswert haben, unabhängig vom Wahrheitswert der einzelnen Prädikate: p q q p Man kann dies nachweisen, indem man sämtliche möglichen Wahrheitswerte durchprüft: p q p q w w w ¬q ¬p ¬q ¬p w f f w f f w f f f w w f w w f f w w w w Unterschied Äquivalenz - Koimplikation: Die Äquivalenzrelation ist eine Metarelation, die stets gültig ist. Die Koimplikation ist eine Verknüpfung zweier Aussagen zu einer neuen Aussage, die wahr oder falsch sein kann. Folgerung (ab) Eine Aussage (b) folgt stets logisch aus einer Aussage (a) genau dann, wenn b stets wahr ist, wenn a wahr ist. (pq) q q 12 Überprüfen Sie das Beispiel anhand der Wahrheitstafel. P q pq (pq) q Häufig verwendete Äquivalenzen: Idempotenz: Kommutativität: p p p p p p p q q p p q q p (p q) r p q r) Assoziativität: (p q) r p q r) (p q) r p rq r) Distributivität: (p q) r (p rq r) Doppelnegation: p p de Morgansche Regeln: (p q) p q (p q) p q Auflösung der Implikation: p q p q Auflösung der Koimplikation: p q p q) q p) Vereinfachung: (pq) p p 13 Tautologie und Kontradiktion: Manche Aussagen sind stets wahr (Tautologie), andere stets falsch (Kontradiktion). Beispiele: (p q) (p r) Tautologie: Kontradiktion: (p q) (p r) p q p r (p (p q)) Nicht kontradiktorische Aussagen heißen erfüllbar. Wird eine kontradiktorische Aussage negiert, erhält man eine Tautologie. Es gilt: p q r genau dann, wenn (pq) r eine Tautologie ist und damit p q r genau dann, wenn (pq) r eine Kontradiktion ist. Folgerungen aus Tautologien und Kontradiktionen Eine wichtige Anwendung der Logik besteht darin, eine Menge wahrer Aussagen aufzustellen und aus diesen Schlüsse auf weitere wahre Aussagen zu ziehen (beispielsweise um Fragen zu beantworten). Tetraeder (a) LeftOf (a,b) LeftOf (a,b) RightOf (b,a) Tetraeder (a) RightOf (b,a) Hierfür ist jedoch wichtig, dass es sich bei diesen Aussagen nicht um Tautologien handelt. In diesem Fall sind nämlich keine sinnvollen Folgerungen möglich (d.h. nur solche, die wiederum Tautologien sind): 14 (Tetraeder (a) Tetraeder (a)) (Tetraeder (a) (LeftOf (a,b) Tetraeder (a))) (Tetraeder (a) Dodekaeder (a) Cube (a)) Tetraeder (a) Tetraeder (a) Umgekehrt sind aus einer Kontradiktion logisch gesehen alle Schlüsse möglich: (Tetraeder (a) Dodekaeder (b)) (Dodekaeder (b) Cube c)) (Tetraeder (a) Tetraeder (c)) Tetraeder (c) Cube (c) Gründe für Äquivalenz etc. Die bisher genannten Beispiele für Äquivalenz- und Folgerungsbeziehungen sowie für Tautologien und Kontradiktionen beruhten sämtlich auf den Definitionen der logischen Operatoren. Dass zwei Aussagen äquivalent sind oder dass eine bestimmte Aussage tautologisch ist, lässt sich daher per Wahrheitstafel überprüfen: (p q) p p p p (Tautologie) p q pq p pp w w f f w f w f w f f f w f w w (pq)p w w f f Andere Aussagen sind aufgrund der Bedeutungen der verwendeten Prädikate innerhalb einer bestimmten Welt äquivalent, tautologisch usw. Vom logischen Standpunkt aus sind solche Eigenschaften uninteressant, da sie sich verändern, sobald sich die Welt bzw. die Bedeutungen der Prädikate verändern. 15 Beispiele - eine Welt in der es nur Small, Medium und Large gibt: larger (a,c) larger (b,c) large (a) large (b) medium (a) medium (b) small (c) large (a) medium (a) small (a) ist tautologisch large (a) medium (a) small (a) ist kontradiktorisch Die Gültigkeit dieser Aussagen ist jedoch abhängig von der Welt, auf die sie angewandt werden. Anwendungsbeispiel Ausgangssituation: Es liegt eine Menge von Aussagen vor, die als wahr angenommen werden. Diese Menge kann als eine einzige Aussage mit konjunktiven Verknüpfungen der Einzelaussagen betrachtet werden. Fragen: Welche Aussagen lassen sich hieraus folgern? Handelt es sich um eine Tautologie (dann lässt sich nichts folgern) oder um eine Kontradiktion (dann lässt sich alles folgern)? Was passiert, wenn eine weitere Aussage dazukommt? Beispiel Ein Angestellter der Bahn legt die folgenden Regeln für die Steuerung von Zugverbindungen fest. 1. anschluss (IC283, IC595) anschluss (IC283, EC44) anschluss (IC283,EC27) 2. puenktlich (IC283) anschluss (IC283,IC595) 3. anschluss (IC283,IC595) anschluss (IC283,EC44) 4. anschluss (IC283,EC27) anschluss(IC283,EC44) 5. puenktlich (IC283) anschluss (IC283,EC44) Fragen: 1. Ist diese Regelmenge erfüllbar (möglich)? 2. Welche Anschlussverbindungen gelten, wenn IC 283 pünktlich bzw. unpünktlich ist. 16 Lösungsweg 1 - Aufstellung von Folgerungen aus (1)-(5) aufgrund der folgenden Regeln: I (pq) (pr) q r II (pq) p q III (pq) q p Lösungsweg 2: Überprüfen der Erfüllbarkeit per Wahrheitstafel p283 a595 A44 a27 W w W w W w W f W w F w W w F f W f W w W f W f W f F w W f F f F w W w F w W f F w F w F w F f F f W w F f W f F f F w F f F f (1) (2) (3) (4) (5) Sowohl die Überprüfung der Erfüllbarkeit als auch die Suche nach gültigen Aussagen und der Rest auf Ableitbarkeit bestimmter Aussagen lassen sich systematisieren, indem man eine Aussage in konjunktive Normalform bringt. 17 Konjunktive Normalform Definition: Eine Aussage befindet sich in konjunktiver Normalform (KNF), wenn sie aus einer Menge von Konjunktionen besteht und jedes dieser Konjunktionsglieder ausschließlich Disjunktionen von (möglicherweise negierten) Literalen enthält. Für jede Formel gibt es eine äquivalente Formel in KNF. Diese lässt sich herleiten, indem zunächst alle Koimplikationen und Implikationen aufgelöst werden und anschließend die de Morgansche Regeln und die Distributivitätsregel angewendet werden. Beispiel 1. anschluss (IC283, IC595) anschluss (IC283, EC44) anschluss (IC283,EC27) 2. puenktlich (IC283) anschluss (IC283,IC595) 3. anschluss (IC283,IC595) anschluss (IC283,EC44) 4. anschluss (IC283,EC27) anschluss(IC283,EC44) 5. puenktlich (IC283) anschluss (IC283,EC44) entspricht 1. anschluss (IC283, IC595) anschluss (IC283, EC44) anschluss (IC283,EC27) 2. puenktlich (IC283) anschluss (IC283,IC595) 3. anschluss (IC283,IC595) anschluss (IC283,EC44) 4. anschluss (IC283,EC27) anschluss(IC283,EC44) anschluss (IC283,EC27) anschluss(IC283,EC44) 5. puenktlich (IC283) anschluss (IC283,EC44) 18 Resolution Aus jeweils zwei Konjunktionsgliedern einer Formel in KNF lässt sich ein neues, drittes erzeugen („resolvieren“), wenn dasselbe Literal in dem einen in negierter und in dem anderen in nicht-negierter Form auftritt. Hierzu werden die folgenden Äquivalenzen verwendet: p (p q) (p p) (p q) p q bzw. p (p q) (p p) (p q) p q Erster Fall: Das eine Konjunktionsglied besteht nur aus einem Literal puenktlich (IC283) anschluss (IC283,IC595) puenktlich (IC283) anschluss (IC283,IC595) puenktlich (IC283) Zweiter Fall: beide Konjunktionsglieder bestehen aus mehreren Literalen (p q) (p r) (p q) (p r) (q r) 2. puenktlich (IC283) anschluss (IC283,IC595) 5. puenktlich (IC283) anschluss (IC283,EC44) 2. puenktlich (IC283) anschluss (IC283,IC595) 5. puenktlich (IC283) anschluss (IC283,EC44) 7. anschluss (IC283,IC595) anschluss (IC283,EC44) Dritter Fall: beide Konjunktionsglieder bestehen aus einem Literal 6. puenktlich (IC283) 8. puenktlich (IC283) Es handelt sich um eine Kontradiktion! 19 Anmerkung: Oft werden die Konjunktionsglieder statt als Disjunktion als Menge von Literalen notiert; sie werden dann als „Klauseln“ bezeichnet. Indem man, ausgehend von der ursprünglichen Formel, alle möglichen Resolventen bildet und diese wiederum in den Resolutionsprozess einbezieht, kann man ermitteln, ob es sich bei der Formel um eine Kontradiktion handelt und ob es Literale gibt, die auf jeden Fall wahr sein müssen, wenn die gesamte Formel wahr sein soll. Je nach Gestalt der Formel kann dieses Verfahren sehr umständlich sein – fast so umständlich wie die Überprüfung per Wahrheitstafel. Meist geht es allerdings auch nicht darum, alle möglichen gültigen Literale zu ermitteln, sondern nur ein bestimmtes. Hierzu verwendet man folgenden Trick: Wenn man aus der Gültigkeit einer Formel p auf die Gültigkeit von q schließen kann, also p p q, dann ist p q eine Tautologie. Dann ist (p q ) (pq) p q eine Kontradiktion. Will man also beweisen, dass q sich aus p folgern lässt, zeigt man, dass pq zu einem Widerspruch führt. Beispiele: 1. Annahme: EC 27 hat stets Anschluss an IC283 Beweis: Die Annahme des Gegenteils führt zu einer Kontradiktion. 1. a595 a44 a27 2. p a595 3. a595 a44 4. a27 a44 a27 a44 5. p a44 6. a27 20 2. Annahme: IC 595 hat stets Anschluss an IC 283. 1. a595 a44 a27 2. p a595 3. a595 a44 4. a27 a44 a27 a44 5. p a44 6. a595 3. Annahme: EC 44 hat nie Anschluss an IC 283. 1. a595 a44 a27 2. p a595 3. a595 a44 4. a27 a44 a27 a44 5. p a44 6. a44 Anmerkung: Besonders einfach lassen sich Kontradiktionen erkennen, wenn eine Formel in KNF nur aus solchen Disjunktionen besteht, die höchstens ein nicht-negiertes Literal enthalten (sog. Hornformeln). Allerdings gibt es nicht zu jeder Formel eine äquivalente Hornformel. 21 Zusammenfassung Ein Prädikat (oder allgemeiner: eine Aussage, eine atomare Formel) ist - zu einem bestimmten Zeitpunkt, in einer bestimmten (Situation unserer) Welt wahr oder falsch. Aussagen lassen sich zu neuen Aussagen (nicht-atomaren Formeln) verknüpfen; diese haben wiederum einen Wahrheitswert, der durch die Wahrheitstafel der verwendeten Verknüpfung festgelegt wird. Solche nicht-atomaren Formeln können allein aufgrund ihrer Verknüpfungsstruktur, unabhängig von den möglichen Wahrheitswerten der in ihnen enthaltenen Prädikate, stets denselben Wahrheitswert wie eine bestimmte andere haben (zu ihr äquivalent sein), stets wahr sein (Tautologie) oder stets falsch sein (Kontradiktion). Des Weiteren wurde mit der KNF eine Darstellung eingeführt, welche es erlaubt, systematisch die Erfüllbarkeit einer nicht-atomaren Formel zu überprüfen den Wahrheitsgehalt eines einzelnen Literals zu bestimmen, ohne alle wahren Literale zu ermitteln, unter gewissen Bedingungen neue Literale zu resolvieren. 22 Prädikatenlogik Die Aussagen, um deren Wahrheitswerte es in der Aussagenlogik geht, können folgendermaßen beschrieben werden: Statt als Ganzes lässt sich eine Aussage als Prädikat-Argument-Struktur betrachten. Ob eine Aussage wahr oder falsch ist, hängt davon ab, ob das, was man über bestimmte Gegenstände (Individuen) sagt (das Prädikat), auf diese Individuen zutrifft oder nicht. Beispiele: hungrig (Peter) Bundeskanzler (Schroeder_Gerhard) Bundeskanzler (Sabine_Leutheusser-Schnarrenberger) größer (Peter, Helmut) Prädikate können eines oder mehrere Argumente haben ("Stelligkeit"). In der Aussagenlogik besitzt jede atomare Formel einen festen Wahrheitswert. Dabei spielt keine Rolle, ob diese atomare Formel aus einem Prädikat besteht oder schlicht aus einer Variablen wie p oder q, die einen der Werte "wahr" oder "falsch" annehmen kann (sog. Satzvariable). Prädikate werden erst interessant, wenn sie sich nicht auf ein bestimmtes Individuum beziehen (sog. Individuenkonstante), sondern wenn geprüft wird, ob sie auf irgend eines oder vielleicht auf alle einer Menge von Individuen zutreffen. Diese Individuen werden in einer prädikatenlogischen Formel durch Variablen vertreten: bibliothek (x) ermordet (x, y) "x ist in der Bibliothek" "x ermordet y" Eine solche Formel erhält erst dann einen Wahrheitswert, wenn entweder die Variable wieder durch eine Konstante ersetzt wird oder aber durch einen zusätzlichen Quantor behauptet wird, die betreffende Aussage gelte für alle oder für mindestens ein Element des zugrundegelegten Individuenbereiches. 23 Allquantor ( x bibliothek (x) alle sind in der Bibliothek (wahr oder falsch) x y größer (x,y) kleiner (x,y) (falsch, es gibt auch gleich große) x mensch (x) sterblich (x) alle Menschen sind sterblich (wahr) x mensch (x) sterblich (x) alle Elemente des Individuenbereiches sind Menschen, und alle sind sterblich (stimmt nur, wenn der Individuenbereich nur Menschen umfasst) x bibliothek (minna) Küche (x) wenn Minna in der Bibliothek ist, sind alle in der Küche (falsch) x bibliothek (x) ¬ Küche (x) wer in der Bibliothek ist, kann nicht gleichzeitig in der Küche sein (wahr) Existenzquantor (, V) x bibliothek (x) jemand ist in der Bibliothek (wahr oder falsch) x y größer (x,y) kleiner (x,y) (wahr) 24 Bei der Kombination von Quantoren ist die Reihenfolge wichtig: x y liebt (y, x) Es gibt jemanden, den alle lieben. y x liebt (y, x) Alle haben jemanden, den sie lieben. Bei Negationen ist streng zu unterscheiden, ob der Quantor in den Geltungsbereich der Negation einbezogen wird oder nicht: x y ¬liebt (y, x) Es gibt jemanden, den niemand liebt. x ¬y liebt (y, x) Es gibt jemanden, den nicht alle lieben. ¬x y liebt (y, x) Es gibt keinen, den alle lieben. 25 Einige Regeln: x p(x) ¬x ¬p(x) x p(x) ¬x ¬p(x) ¬x p(x) x ¬p(x) ¬x p(x) x ¬p(x) x y F y x F x y F y x F (x F) (x G) x (F G) xF) xG) x (F G) Ebenso wie aussagenlogische Formeln können auch prädikatenlogische Formeln allein aufgrund ihrer Struktur tautologisch, erfüllbar oder unerfüllbar sein: x (p(x) ¬ p(x)) und (x p(x)) ¬ x p(x)) sind unerfüllbar, x (p(x) ¬ p(x)) und (x p(x)) ¬x¬ p(x)) sind tautologisch, (x p(x)) x ¬p (x)) ist erfüllbar. Allerdings gibt es für prädikatenlogische Formeln kein Verfahren, das in allen Fällen entscheidet, ob eine Formel unerfüllbar, erfüllbar oder eine Tautologie ist. 26 Einige potentielle Formalisierung: Fallstricke bei der prädikatenlogischen Verknüpfung von Prädikaten bzw. Quantoren: Allquantoren erfordern Implikationen, Existenzquantoren erfordern Konjunktionen: Jedes Huhn legt ein Ei. xy (huhn(x)(ei(y) legt(x,y))) Auch ein blindes Huhn findet einmal ein Korn. xy ((huhn(x) blind(x)) (korn(y) findet(x,y)) Eine Amsel hat alle Körner gefressen. xy(amsel(x) (korn(y)frißt(x,y)) Konstanten und Prädikate: Individuen können durch ihren Namen (Individuenkonstante) oder durch ihre Eigenschaften (Prädikate) identifiziert werden: Alle Bürger von NRW kennen Johannes Rau. x (bürger(x,NRW)kennt(x,Johannes_Rau)) Alle Bürger von NRW kennen den Ministerpräsidenten. yx(ministerpräsident(y) (bürger(x,NRW) kennt(x,y)) 27 Generische vs. indivduelle Lesart: Ein Duisburger Bürger kennt Rau persönlich. x (bürger(x,duisburg)) kennt(x,rau)) Ein Duisburger Bürger geht wählen. x (bürger (x,duisburg) geht_wählen (x)) Prädikatenlogische Ableitung Zunächst gelten dieselben Regeln wie in der Aussagenlogik: Wenn alle Leute mit dem Auto fahren, gibt es einen Stau. x y (mensch(x) auto(y) fahren(x,y))) z (stau(z)) Alle Leute fahren mit dem Auto. x y (mensch(x) auto(y) fahren(x,y)) z (stau(z)) (ohne Erfassung des temporalen Aspekts) Modus ponens (a b) a b [ (a b) a (¬a b) a b a b] Modus tollens (a b) ¬b ¬a [ (a b) ¬b (¬a b) ¬b ¬a ¬b ¬a Transitivität: (a b) (b c) a c) [ (a b) (b c) (a b) (b c) a c) 28 ] ] Alle Menschen sind sterblich. x (mensch(x) sterblich(x)) x (koch(x) mensch(x)) Ein Koch ist ein Mensch. Also ist ein Koch sterblich. x (koch(x) sterblich(x)) x (mensch(x) sterblich(x)) x x ((mensch(x) sterblich(x)) x (koch(x) sterblich(x)) (koch(x) mensch(x)) (koch(x) mensch(x))) Für andere Schlüsse reicht dies jedoch nicht aus: Alle Menschen sind sterblich. x (mensch(x)sterblich(x)) Goethe ist ein Mensch. mensch(Goethe) Also ist Goethe sterblich. sterblich(Goethe) Manche Autofahrer sind verrückt. x (autofahrer(x) verrückt(x)) Autofahrer sind Menschen. x (autofahrer(x) mensch(x)) Also sind manche Menschen verrückt. x (mensch(x) verrückt(x)) Für solche Schlüsse ist ein Bezug zwischen quantifizierten Formeln und der Gültigkeit von Prädikaten für bestimmte Individuen notwendig: Universale Instantiierung: Ein Prädikat, das für alle Elemente eines Individuenbereichs gilt, insbesondere für ein bestimmtes (z.B. "c" oder „Goethe“): 29 gilt x (p(x)) p(c) x (mensch(x) sterblich(x)) (mensch(Goethe) sterblich(Goethe)) Umgekehrt – Existentielle Generalisierung: p(c) x (p(x)) sterblich(Goethe) x (sterblich(x)) Existentielle Instantiierung: Wenn es ein Individuum gibt, für das ein Prädikat gilt, kann man dem Individuum einen fiktiven Namen geben, der in der Formel noch nicht verwendet wird. x (p(x)) p(dummy) Beispiel (alle durchnummerierten Formeln seien konjunktiv verknüpft): 1. x (autofahrer(x)verrückt(x)) 2. x (autofahrer(x) mensch(x)) Exist. Instant. von 1 3. autofahrer(dummy) verrückt(dummy) univ. Instant. von 2 4. mod.ponens aus 3,4 5.mensch(dummy)) Exist.General. von3,5 6.x (mensch(x) verrückt(x)) autofahrer(dummy) mensch(dummy) 30 Mit diesen Mitteln lässt sich das Resolutionsverfahren auch auf prädikatenlogische Formeln anwenden. Beispiel: Lässt sich aus 1. bis 3. die folgende Formel ableiten? ¬xy (Cube(x) Cube(y) LeftOf(x,y)) Es wird nachgewiesen, Kontradiktion führt: dass die Negation dieser Formel zu einer 1. xy (LeftOf(x,y) Larger(x,y)) 2. xy ((Small(x) Small(y)) ¬Larger(x,y)) 3. x (Cube(x) Small(x)) Annahme der Negation der nachzuweisenden Formel 4. xy (Cube(x) Cube(y) LeftOf(x,y)) Exist. Instant. von 4 5. Cube(a) Cube(b) LeftOf(a,b) univ. Instant. von 3 6. Cube(a) Small(a) univ. Instant. von 3 7. Cube(b) Small(b) mod.ponens aus 5,6 8. Small(a) mod.ponens aus 5,7 9. Small(b) Univ.Instant. von2 10. (Small(a) Small(b)) ¬Larger(a,b) mod.ponens aus 8,9,10 11. ¬Larger(a,b) univ. Instant. von 1 12. LeftOf(a,b) Larger(a,b) mod.tollens aus 11,12 13. ¬LeftOf(a,b) Widerspruch zwischen 5 und 13, q.e.d. 31 Universale Generalisierung: Die universale Instantiierung lässt sich auch wieder rückgängig machen: p(c) x (p(x)) Alle Würfel sind groß. x (Cube(x)Large(x)) Es sind nur Würfel da. x (Cube(x)) Alle Gegenstände sind groß. x (Large(x)) Dies gilt jedoch nur für Konstanten c, die durch universale Instantiierung eingeführt wurden! Außerdem darf die zu generalisierende Formel keine weitere Konstante enthalten, die nach der Einführung von c durch existentielle Instantiierung eingeführt wurde. Beispiel: Pseudobeweis dafür, dass es eine größte natürliche Zahl gibt 1. Jede Zahl ist kleiner als eine andere. 2. Sei n eine beliebige Zahl. 3. Sei m eine Zahl, die größer ist als n; d.h. n<m. 4. Weil n aber eine beliebige Zahl ist, ist jede Zahl kleiner m. 5. Also gibt es eine größte natürliche Zahl. xy (x<y) Univ. Instant. von 1 2.y (n<y) Exist. Instant. von 2 3. n<m Univ. General. von 3 4. x (x<m) Exist. General. von 4 5. yx 32 (x<y) Probleme bei der prädikatenlogischen Repräsentation von Wort- und Satzbedeutungen Sozialwahl findet früher statt Nicht erst am Stichtag 26. Mai, sondern schon jetzt muss die Stimme zur Sozialwahl 1999 abgeben werden. Darauf weist die TechnikerKrankenkasse in Hamburg hin. Pfingsten ist letzte Gelegenheit. Wer dann nicht den roten Sozialwahl-Umschlag in den Briefkasten geworfen hat, kommt zu spät. NRZ 19.5.99 xyz ((sozialwahlumschlag (y) briefkasten (z) einwerfen (x,y,z,pfingsten)) zuspät (x)) aber... Modellierung von muss; sehr „individuelle“ Modellierung des Zeitpunktes pfingsten; ... 100 000 Demonstranten erwartet Die Polizei erwartet in Köln im Umfeld des EU- und G8-Gipfels im Juni bei vier Demonstrationen insgesamt rund 100 000 Teilnehmer. Die Sicherheit der Gipfelteilnehmer müsse gewährleistet werden, sagte der Kölner Polizeipräsident Jürgen Roters in Köln. Die Polizei werde Großdemonstrationen nicht auflösen, sondern gewalttätige Demonstranten „aussondern“. NRZ 19.5.99 xyz (polizist (x) (demo (y,köln,juni) teilnehmer (z,y) erwarten (x,z))) aber... die Polizei erwartet... – alle Polizisten, wie viele....; erwartet... glauben (teilnehmen (y, demo, köln, july)), Prädikatenlogik 2. Stufe (Prädikate über Prädikate); rund 100 000 Teilnehmer; Großdemonstration; gewährleistet sein; gewalttätig, etc. 33 Sicherheit; muss Erweiterungen der Prädikatenlogik - Nicht-Standard-Logiken – Um die erwähnten Probleme zu lösen, gibt es verschiedene Ansätze zur Erweiterung der klassischen Prädikatenlogik. 1. Einführung zusätzlicher Wahrheitswerte (Fuzzy-Logik, Probabilistik) eine Amsel ist ein typischerer Vogel als ein Strauß eine Großdemonstration umfasst mindestens 1000, eher 10000 Teilnehmer auf Regen folgt meist Sonnenschein schlendern = ca. 2km/h, laufen = 5 km/h , rennen = 15 km/ h (erlaubte Unschärfe x%) 2. Einführung weiterer Quantoren Kaum jemand versteht das Wenige verstehen das Einige...; Nicht viele...; Nicht alle...; Viele...; Die meisten...; Fast alle... 3. Einführung zusätzlicher Parameter für "Zeitpunkt" und "Welt", zu dem bzw. in der eine bestimmte Aussage gilt (" Mögliche-Welten-Semantik", „nicht-monotone Logik“). Auf dieser Basis lässt sich z.B. die Bedeutung von Vorgängen und von Modalausdrücken darstellen. 4. Einführung von Standardannahmen („default-Werten“) zur Behandlung des Problems, dass Schlüsse nur aus explizit bekannten Fakten gezogen werden dürfen. Behandlung von Modalausdrücken Die sog. „Mögliche-Welten-Semantik“ unterscheidet zwischen Aussagen, die notwendigerweise wahr sind, und solchen, die zufällig wahr sind, aber auch unter anderen Bedingung, d.h. in einer anderen „Welt“ – falsch sein können. M p „es ist möglich, dass“ ist wahr, wenn es mindestens eine Welt gibt, in der p wahr ist. 34 N p „es ist nötig, dass“ ist wahr, wenn p in allen Welten wahr ist. Der Dekan muss/kann den Vorsitz übernehmen. vs. Der Dekan übernimmt den Vorsitz. Zu beachten ist, dass Modalverben unterschiedliche Bedeutungen haben. Der Dekan muss die Sitzung leiten. Es ist nötig, dass der Dekan die Sitzung leitet. Der Dekan wird gezwungen, die Sitzung zu leiten. Der Dekan will unbedingt die Sitzung leiten. Der Dekan kann die Sitzung leiten. Es ist möglich, dass der Dekan die Sitzung leitet. Der Dekan darf die Sitzung leiten. Der Dekan ist in der Lage, eine Sitzung zu leiten. In der sog. deontischen Logik (der Logik der normativen Begriffe, insbesondere des Gebotenen, Erlaubten, und Verbotenen) wird der folgende zusätzliche Operator eingeführt: P x := die Handlung x ist erlaubt Die Anwendung von Modaloperatoren ergibt wiederum einen logischen Ausdruck, der mit anderen kombiniert werden kann. Insbesondere lassen sich durch verschiedene Stellungen der Modaloperatoren Bedeutungsunterschiede und Fokussierungen darstellen. Der Dekan muss die Sitzung leiten (und niemand anders). x (sitzung (x) Ny (dekan (y) leiten (x,y))) Der Dekan muss die Sitzung leiten (neben anderen Aufgaben). y (dekan (y) Nx (sitzung (x) leiten (y,x))) Der Dekan muss die Sitzung leiten (zügig, diplomatisch..) y (dekan (y) x (sitzung (x) N leiten (y,x))) Interessant ist auch die Kombination mit der Negation: 35 Px es ist nicht erlaubt, ... P x Es ist erlaubt, nicht ... Bei der Verwendung von Modaloperatoren gelten nicht mehr alle Folgerungen und Äquivalenzen der klassischen Logik: P x <=> Px Px > P x, aber P x => Px (weitgehend anerkannt) wie steht es mit... Px Py <=> P (x y) ??? Px Py <=> P (x y) ??? Nicht-monotone Logik Gegeben sei eine Menge von gültigen Aussagen. Bei einer monotonen Logik wie der klassischen Prädikatenlogik bleiben alle diese Aussagen gültig, wenn man weitere Aussagen hinzufügt. Um darzustellen, dass ein Pinguin nicht fliegen kann (3), müsste man daher auf (1) oder (2) verzichten: (1) x vogel(x)fliegen(x) (2) x pinguin(x)vogel(x) (3) x pinguin(x)¬fliegen(x) Eine zweite Möglichkeit besteht darin, die Aussage (1) abzuschwächen: "Wenn x ein Vogel ist und nicht bekannt ist, dass x nicht fliegen kann, dann kann x fliegen." (sog. Default-Regel) Notationsvarianten: x vogel(x) : fliegen(x) fliegen (x) x vogel(x) M fliegen(x) fliegen (x) Modaloperator: M = "es spricht nichts dagegen, dass" x vogel(x) ¬L ¬fliegen(x) fliegen (x) Modaloperator: L = "es ist sicher, dass" 36 Aufgrund dieser Default-Regel können, bezogen auf eine gegebene Wissensbasis (Aussagen), Schlüsse gezogen werden. Neu hinzukommende Aussagen können die Anwendung der Regel jedoch nachträglich verbieten, so dass die bereits gezogenen Schlüsse hinfällig werden. Durch neue Aussagen kann also die Gesamtmenge der wahren Aussagen schrumpfen, was man als „Nicht-Monotonie“ bezeichnet. Probleme: Die Verwaltung einer Wissensbasis wird viel schwieriger, weil zu jeder Default-Regel notiert werden muss, zu welchen Schlüssen sie benutzt wurde ("Truth Maintenance- System"). Wenn eine neue Aussage hinzukommt, müssten theoretisch alle DefaultRegeln auf mögliche Konsequenzen überprüft werden (sog. FrameProblem). Der Nutzen einer Regel (Implikation) besteht darin, rasche Schlüsse zu erlauben. Nunmehr ist ein Schluss (der Vogel meines Nachbarn wird wohl fliegen können) nur möglich, wenn alle Defaultannahmen überprüft wurden (der Vogel meines Nachbarn ist kein Pinguin, kein Strauß, er ist nicht krank, hat keine gestutzten Federn etc.). Dies ist erstens sehr aufwendig. Zweitens dürften die meisten dieser Fakten überhaupt nicht erwähnt sein. Closed World Assumption: Alle Aussagen, die nicht ausdrücklich (als wahr) genannt sind, sind falsch. x M¬ p(x)¬ p(x) (auch problematisch: aus a b folgen per CWA sowohl ¬a als auch ¬b) 37 Fuzzy Logic und Probabilistisches Schließen In vielen sprachlichen Bereichen bzw. linguistischen Kategorien gibt es graduelle Unterschiede zwischen den Werten statt scharfer Grenzen.2 Phonetik: Zuordnung von Lauten zu Phonemen Morphologie: Akzeptabilität bestimmter Formen Syntax: Optionale Valenzstellen, graduelle Akzeptabilität Semantik: Zugehörigkeit zu einer semantischen Klasse (Prototypikalität) , Quantoren, Heckenausdrücke (einschränkende Adverbiale wie „eigentlich“, „oder?“, etc.) Pragmatik: Äußerung von Vermutungen Fuzzy Logik und Probabilistische Logik sind zwei prominente Ansätze, um unsicheres bzw. unscharfes Wissen zu modellieren. Fuzzy Logik Erweiterung des Wertebereichs der zweiwertigen Logik auf ein Intervall: Wahrheitswert einer Aussage w(A) [0;1] Die Vorlesung ist fast beendet. Wir sind beinahe eingeschlafen. Beispiel bzw. mengentheoretische Entsprechung - unscharfe Zugehörigkeit eines Elements zu einer Kategorie (Wert der charakteristischen Funktion [0;1]) Möbel := {(Sofa, 1.0), (Stehlampe, 0.7), (Teppich, 0.5), (Vorhang, 0.4), (Türklingel, 0.05)} laufen := {(spazieren, 0.9), (hopsen, 0.5), (krabbeln, 0.1)} attraktives_Ereignis := {(Mittagspause, 1.0), (Dienstbesprechung, 0.4), (Zahnarztbesuch, 0.2) } 2 John R. Taylor: Linguistic Categorization. Oxford: Clarendon, 2. Ed. 1995. 38 Diskussion - Fuzzy Logik 1. Wie kommt man zu diesen Werten? Umfragen? 2. Was sagen diese Werte aus bzw. welche Gültigkeit können solche Werte beanspruchen: Durchschnittsbildung über (nicht explizit genannte) Eigenschaften? Durchschnittsbildung über Verwendungssituationen? Durchschnittsbildung über subjektive Urteile? 3. Kontextabhängigkeit von Quantoren falls Paul 7 Töpfe besitzt, gilt: w(Paul besitzt einige Töpfe) = 0.8 w(Paul besitzt viele Töpfe) = 0.6 aber wann gilt: w(Paul hat nur noch wenige Haare) = 1.0 w(Paula hat viele Ehemänner überlebt) = 1.0 4. Was ist das Verknüpfungsergebnis solcher Prädikate? Duisburg ist eine weltberühmte Metropole. w( Metropole (Du) ) = 0.2 w( weltberühmt(Du) ) = 0.3 w( weltberühmt(Du) Metropole(Du) ) = ? Konjunktion: Kleinster Wert (w(xy)=min{w(x),w(y)}) ? Bewahrt Assoziativität, im Gegensatz z.B. zur Durchschnittsbildung Das ist kein Urlaubswetter. w (Urlaubswetter(W)) = 0.2 w (¬Urlaubswetter(W)) = 0.8 Negation: w(¬x) = 1 - w(x) 5. Fuzzy-Logik bietet den Vorteil, dass sie die Verarbeitung gradueller Bewertungen ermöglicht. Graduelle Bewertungen reichen jedoch nicht immer aus. (1) Vögel können typischerweise fliegen. w(x vogel(x)fliegen(x)) = 0.8 39 (2) Ein Pinguin ist ein untypischer Vogel. w(x pinguin(x)vogel(x)) = 0.3 (3) Kann ein Pinguin fliegen? w(x pinguin(x)fliegen(x)) = min (0.8, 0.3) = 0.3 -> ein wenig!!!! Um die gewünschte Antwort "nein!" zu erhalten, muss ausdrücklich bekannt sein: (4) w(x pinguin(x)fliegen(x)) = 0.0 Dies steht aber im Widerspruch zu (1) und (2). Probabilistische Logik Probabilistische Logik wird eingesetzt, um auszudrücken, dass nicht genügend Information für einen verlässlichen Schluss vorliegt, d.h. dass der Schluss nur wahrscheinlich wahr ist. Die Wahrscheinlichkeit (p, Probabilität) einer Aussage wird mit einem Wert zwischen 0 und 1 ausgezeichnet. Der Wert "falsch" der klassischen Logik kann als '0' ("unendlich unwahrscheinlich) und "wahr" als '1' aufgefasst werden. p(Paula ist jetzt zu Hause) = 0.8 kann beispielsweise ausdrücken "Paula ist um diese Uhrzeit normalerweise bereits zu Hause" Im Gegensatz dazu bedeutet die Fuzzy Logic - Aussage w(Paula ist jetzt zu Hause) = 0.8 beispielsweise, dass Paula "fast zu Hause" ist, also gerade das Auto abschließt und zu ihrer Wohnung läuft. Die probabilistische Bewertung einer Aussage beschreibt die Wahrscheinlichkeit des Wahrheitswertes. Wenn Paula mit der Wahrscheinlichkeit p(0.8) zu Hause ist, ist es mit p(0.2) immer noch möglich, dass Paula woanders ist, z.B. auf den Fidschi-Inseln. 40 Im Gegensatz dazu beschreibt Fuzzy Logic graduelle Wahrheitswerte bei vollständiger Information. D.h., was über Paula bekannt ist, ist verlässlich bekannt, allerdings ist es nur teilweise wahr. Fuzzy oder Wahrscheinlichkeit? Heute gibt es vermutlich Nudeln. Das Essen schmeckt mir eigentlich. Er ist ca. 1.80m groß. Er wird wohl Hunger haben. Diskussion - Probabilistisches Schließen 1. Auf Wahrscheinlichkeit basierendes Schließen 2. Im Ggs. zu Fuzzy Logic umfangreiche Grundlagen aus der Statistik vorhanden 3. Wahrscheinlichkeiten können einfach und effizient empirisch abgeleitet werden (Gesetz der großen Zahl) 4. Konjunktive Verknüpfung von Wahrscheinlichkeiten durch Multiplikation. Widerstrebt der Intuition, eignet sich aber für probabilistisches Schließen. Beispiel: POS-Tagging als Probabilistisches Schliessen POS-Tagging, das Zuweisen (Taggen) von Wortarten (Part-of-Speech). POSTagging kann als Suche nach dem wahrscheinlichsten Pfad durch die "Matrix der möglichen Wortarten" beschrieben werden. Im Lexikoneintrag von "die" steht, dass diese Wortform sowohl Demonstrativpronomen, Artikel als auch Relativpronomen sein kann. In einem Korpus haben wir die Wortform "die" 1000 mal gezählt und haben daraus die globale Wahrscheinlichkeit p für die beobachteten Wortarten abgeleitet. 41 Wortform: "die", globale Frequenz 1000, davon 800 als Artikel -> p(Art(die))=0.8 100 als RelPron -> p(RelPron(die))=0.1 100 als DemPron -> p(DemPron(die))=0.1 Außerdem verfügen wir über die Übergangswahrscheinlichkeiten, d.h. wir wissen für jede Wortart, welche Wortart mit welcher Wahrscheinlichkeit folgt. Die folgende Tabelle, der Ausschnitt aus einer Übergangsmatrix, führt alle Wortarten einmal in der ersten Spalte und einmal in der ersten Zeile auf. Die Zahlen geben die Wahrscheinlichkeit des Übergangs von jeder Wortart zu jeder anderen. Diese Werte können ebenfalls aus einem Korpus abgeleitet (ausgezählt) werden. $, DemPron Art RelPron … $, 0 0.1 0.01 … DemPron 0.1 0.08 0.0 … Art 0.2 0.02 0.0 … RelPron 0.4 0.05 0.0 … Pron 0.4 0.01 0.05 0.3 … Um die wahrscheinlichste Wortart für "die" zu finden, also den optimalsten Pfad zu finden, kombinieren wir die Wahrscheinlichkeiten. Wie oben erwähnt, multiplizieren wir diese miteinander. Berücksichtigt werden die globale Wahrscheinlichkeit der Wortart, die Übergangswahrscheinlichkeiten t jedoch auf die Position davor (t1) und danach (t2): Pfad p(t1) p(t2) $,-DemPron-Pron $,-Art-Pron $,-RelPron-Pron 0.1 0.2 0.4 0.01 0.05 0.3 p(Wortart, global) 0.1 0.8 0.1 p (Wortart, lokal) 0.00001 0.008 0.012 Die gesuchte lokale Wahrscheinlichkeit wird zwar mit jedem zusätzlichen Hinweis (jeder zusätzlichen Wahrscheinlichkeit) kleiner, dies ist aber unerheblich, da wir nicht an einem absoluten Wert interessiert sind, sondern einzig am Pfad mit der höchsten Wahrscheinlichkeit. 42 Beispiel: Word Sense Disambiguation (WSD) WSD: Disambiguierung von Polysemen / Homonymen Wird Ente in der Bedeutung von Auto, Falschmeldung oder Vogel verwendet? Die Geflügelzüchterin fährt eine Ente. Eine Ente fährt die Geflügelzüchterin. Eine Ente fährt die Geflügelzüchterin zum Tierarzt. Beobachtungen, die zur WSD nützlich erscheinen: 1. Die Bedeutung Vogel ist häufiger als Auto, und diese ist häufiger als Falschmeldung. 2. Das Subjekt steht in der Regel am Satzanfang. 3. Das Subjekt von fahren ist in der Regel ein Fahrzeug. 4. Das Subjekt von etwas fahren ist in der Regel ein Mensch. 5. Ein Tierarzt behandelt in der Regel Tiere. Diese werden dazu in der Regel zu ihm gebracht. 6. Eine Geflügelzüchterin züchtet Geflügel. 7. Eine Ente ist im Sinne von Vogel ist ein ziemlich typisches Geflügel. 8. etc. Modellieren eines Phänomens Diese Beobachtungen müssen nun in eine Form gebracht werden, die eine Voraussage erlaubt. Dies kann üblicherweise in Form von Regeln ausgedrückt werden. Anschließend müssen diese Regeln bzw. einzelnen Aspekte in ein Modell gebracht werden. 43 R1: Wenn das zu disambiguierende Wort in der Nähe des Verbs steht und die Lesart-x1 zum Verb passt oder die Lesart-x2 nicht zum Verb passt, ist Lesart-x1 richtig. x1 x2 w( Nähe (Ente,fährt)) = 0.8 w( passt (Auto,fährt)) = 1.0 w( passt (Vogel,fährt)) = 0.4 R2: Wenn ein anderes Wort (z.B. Nomen) in der Nähe des zu disambiguierenden Wortes steht und Lesart-x zu diesem Wort passt, ist Lesart-x richtig. w( Nähe(Züchterin,Ente)) = 0.7 w( passt(Züchterin,Auto)) = 0.5 w( passt(Züchterin,Vogel)) = 1.0 Bei mehreren Regeln wird es unweigerlich vorkommen, dass Regeln widersprüchliche Ergebnisse liefern! -> Gewichtung / Bewertung der Regeln nach Verlässlichkeit Um diese Werte bzw. Bewertungen zu erhalten, benötigen wir ein Korpus, aus dem die Verlässlichkeit der Regeln getestet bzw. gezählt werden kann. Um die vielfältigen Beobachtungen in ein Modell zu bringen und uns vor (z.B. statistischen) Fallgruben zu beschützen, benötigen wir ein geeignetes Verfahren. Beispiele hierfür sind Naive Bayes, Maximum Entropy, Support Vector Machines, Hidden Markov Modelle, ... Wir haben die bekannten Gefilde der Logik, des regelbasierten Schließens verlassen und befinden uns nun im Bereich der statistischen Modellierung bzw. des Maschinellen Lernens. Solche Methoden sind im Bereich der Computerlinguistik seit Anfang der 90er Jahre zunehmend von größerer Bedeutung und haben auch eine Wirkung auf die klassische Linguistik. 44 Deduktion, Induktion, Abduktion - Formen des Schließens Deduktion Alle Menschen sind Sokrates ist ein Mensch. Induktion Abduktion sterblich. Hans ist Mensch und Kim ist Mensch und Uli ist Mensch und raucht. raucht. Alle Pflanzen raucht. Das T-Shirt ist grün. sind Sokrates ist sterblich Alle Menschen rauchen ? Das T-Shirt ist eine Pflanze ? x mensch(x)sterblich(x) mensch(Hans)raucht(Hans) x(Pflanze(x)grün(x)) (mensch(Goethe) mensch(Kim) raucht(Kim) grün (mein_T-Shirt) grün. mensch(Uli) raucht(Uli) sterblich(Goethe) x mensch(x)raucht(x) ? Pflanze(mein_T-Shirt)? Zwingend wahres Schließen; apodiktisch, d.h. notwendig wahr Je nach Anzahl der Belegfälle wahrscheinliches Schließen; dialektisch, das heißt nicht zwingend wahr Spekulierendes Schließen; wahrscheinlicher durch Statistik; rhetorisch, das heißt vielleicht wahr; potenziell Wahrheit entdeckend. Schließen der Mathematik und Logik; Wahrheit bewahrend und insofern konservativ Empirische Wissenschaft; (maschinelles) Lernen; Generalisierung Detektiv, Arzt, Nobelpreisträger What is Abductive Reasoning ? Man: "Hi there new neighbour, it sure is a mighty nice day to be moving." Neighbour: "Yes, it is and people around here seem extremely friendly." Man: "So what is your do for a living?" Neighbour: "I am a professor at the University, I teach abductive reasoning." Man: "Abductive reasoning, what is that?" Neighbour: "Let me give you an example. I see you have a dog house out back. By that I abduce that you have a dog." Man: "That is right." Neighbour: "The fact you have a dog, leads me to abduce that you have a family." Man: "Right again." Neighbour: "Since you have a family I abduce that you have a wife." Man: "Correct." Neighbour: "And since you have a wife I can abduce that you are heterosexual." Man: "Yup." Neighbour: "That is abductive reasoning." Man: "Cool." 45 Later that same day... Man: "Hey I was talking to that new guy who moved in next door." Neighbor2: "Is he a nice guy?" Man: "Yes, and he has an interesting job." Neighbor2: "Oh, yeah what does he do?" Man: "He is a professor of abductive reasoning at the University." Neighbor2: "Abductive reasoning, what is that?" Man: "Let me give you an example. Do you have a dog house?" Neighbor2: "No." Man: "Fag." Inhaltsverzeichnis Einführung................................................................................................................... 1 Was ist Informatik? .............................................................................................. 1 Was ist Logik? ...................................................................................................... 2 Aussagenlogik ............................................................................................................. 3 Voraussetzungen ..................................................................................................... 4 Logische Operatoren und natürlichsprachliche Aussagen .................................... 4 Abhilfe .................................................................................................................. 4 Verknüpfungen - Rechnen mit Wahrheitswerten .................................................... 5 Negation ("nicht"): ............................................................................................... 5 Konjunktion ("und"): ............................................................................................ 6 Disjunktion ("oder"): ............................................................................................ 6 Implikation ("wenn, dann"): ................................................................................ 7 Koimplikation ("genau dann, wenn"): .................................................................. 8 Bindungsstärken ...................................................................................................... 8 Beispiel: Spielzeug-Welt .......................................................................................... 9 Computer und Wahrheitswerte.............................................................................. 10 Anwendungsbeispiel: Expertensystem ............................................................... 11 Eigenschaften von Aussagen ..................................................................................... 12 Äquivalenz (a b) ................................................................................................ 12 Unterschied Äquivalenz - Koimplikation............................................................. 12 Folgerung (ab) .................................................................................................... 12 Häufig verwendete Äquivalenzen: ......................................................................... 13 Folgerungen aus Tautologien und Kontradiktionen ............................................... 14 Gründe für Äquivalenz etc. .................................................................................... 15 Anwendungsbeispiel .......................................................................................... 16 Konjunktive Normalform ....................................................................................... 18 Resolution .............................................................................................................. 19 Beispiele ................................................................................................................ 20 Zusammenfassung ................................................................................................. 22 Prädikatenlogik ......................................................................................................... 23 Allquantor ( ................................................................................................. 24 Existenzquantor (, V) ........................................................................................ 24 Einige Regeln...................................................................................................... 26 Einige potentielle Fallstricke bei der prädikatenlogischen Formalisierung ........ 27 Prädikatenlogische Ableitung ................................................................................ 28 Probleme bei der prädikatenlogischen Repräsentation von Wort- und Satzbedeutungen ................................................................................................... 33 Erweiterungen der Prädikatenlogik - Nicht-Standard-Logiken – ............................. 34 Behandlung von Modalausdrücken ........................................................................ 34 Nicht-monotone Logik ........................................................................................... 36 Fuzzy Logic und Probabilistisches Schließen ............................................................. 38 Fuzzy Logik ......................................................................................................... 38 Probabilistische Logik ........................................................................................ 40 Beispiel: POS-Tagging als Probabilistisches Schliessen ..................................... 41 Beispiel: Word Sense Disambiguation (WSD) .................................................... 43 Deduktion, Induktion, Abduktion- Formen des Schließens .................................... 45 46 Semantic Web – das Web maschinenlesbar machen Beispiel 1: Bilder- Filmsuche Finde Bilder vom Eiffelturm/Düsseldorfer Hauptbahnhof Finde Bilder vom MSV-Spiel am 17.5. in Duisburg Beispiel 2: Mailing Schicke postalisch folgende Einladung an alle Forscher Wissenschaftsgemeinde in allen deutschsprachigen Ländern. Finde alle Forscher meiner Community Finde alle Adressen der besagten Leute Erstelle die richtige Postadresse und die richtige Anrede meiner Ontologien/Inferenzen/Agenten Beispiel 2: Reiseplanung Reserviere ein Zimmer für den 25. 8.2005 in einem Hotel in der Nähe des Frankfurter Flughafens, in dem für meinen Hund gesorgt wird. Suche ein Restaurant für denselben Abend, welches auch vegetarische Gerichte serviert und reserviere einen Tisch. Finde ein Kino in der Nähe, in dem interessante Filme laufen (die ich noch nicht gesehen habe). Was hat das mit Logik und mit Computerlinguistik zu tun? 1 Semantic Web Begrifflichkeiten und Abgrenzungen (Aus der FAQ der ontoprise GmbH (http://www.ontoprise.de/company/faq) Was beschreibt der Begriff "Semantic Web"? Das Semantic Web ist eine Erweiterung des jetzigen WWW, in welchem Inhalte mit einer wohldefinierten Bedeutung versehen werden. Ziel ist es, die Kommunikation zwischen Mensch und Maschine zu verbessern. Oder in eine einfache Formel gefasst: „Evolution von maschinenlesbaren hin zu maschinenverständlichen Daten“. Dabei werden Inhalte mit Semantik, d.h. mit maschinenverständlicher Bedeutung, versehen. Mehr unter www.semanticweb.org Was versteht man unter "Semantischen Netzen"? Es handelt sich hier nicht um die deutsche Übersetzung zu „Semantic Web“, sondern um Vorläufer von Ontologien im wissenschaftlichen Umfeld. Semantische Netze dienen ebenfalls der Modellierung von Weltausschnitten, sind allerdings weniger stark formalisiert. Was beschreibt der Begriff "Ontologie"? Eine Ontologie ist ein Modell einer Wissensdomäne. Sie legt gemeinsam verwendete Begrifflichkeiten, deren Beziehungen untereinander und Regeln über diese Beziehungen fest. Wesentlich für die in diesem Kontext verwendeten Ontologien ist die Eigenschaft, dass sie sowohl für den Menschen als auch für die Maschine verständlich sind. ontoprise® bietet hierzu eine Reihe von Workshops, Werkzeugen und Anwendungen an. Was versteht man unter "Ontologiesprachen"? Ontologiesprachen erlauben es, Ressourcen im Netz mit Semantik zu versehen. Konkrete Annotierungen damit führen zu so genannten Metadaten. Die bekanntesten Sprachen sind RDF (S) und DAML+OIL. Was verbirgt sich hinter dem Kürzel "RDF"? RDF steht für Resource Description Framework und dient als Basistechnologie zur Repräsentation von Metadaten. Es handelt sich um einen W3C-Standard. Die Syntax baut auf XML auf. RDF (S) ist das 2 zugehörige Schema. Was beschreibt der Begriff Inferenz? In | fe | renz (lat) die; -en: aufbereitetes Wissen, das aufgrund von logischen Schlussfolgerungen gewonnen wurde. Inferenzmaschinen generieren mittels eines formalen Logikkalkül durch automatische Ableitung neues Wissen. ontoprise bietet mit dem OntoBroker® eine semantische Middleware mit integrierter Inferenzmaschine an. Was beschreibt der Begriff "Annotation"? Annotation bezeichnet zum einen Auf-, Einzeichnung, Vermerk, zum anderen einen erläuternder Vermerk zu einem Begriff innerhalb eines Dokumentes bezüglich einer Ontologie. ontoprise bietet mit OntoAnnotate® ein Tool, um die Bedeutung der Informationen qualitativ hochwertig aus beliebigen Dokumenten herauszulösen. Welche Rolle spielen Agenten im Umfeld des Semantic Web? Als Nutznießer des Semantic Web werden insbesondere intelligente Softwareagenten angesehen. Agenten führen autonom Dienste für den Benutzer aus. Sie profitieren dabei von semantisch annotierten Ressourcen, da sie Inhalte maschinell verstehen und weiterverarbeiten können. Ohne die Verwendung sind derartige Szenarien nicht sinnvoll möglich. Was unterscheidet Ontologien von Topic Maps? TopicMaps bestehen aus Topics (Knoten), Relationen und zugeordneten Dokumenten (engl. Occurences). Die Stärken der TopicMaps liegen in der Navigation. Die Navigation erfolgt über Ausprägungen (Instanzen) und die Relationen. Sie bieten verschiedene Sichten auf die Wissensbasis. Es existiert ein ISO-Standard. Als gravierende Nachteile gegenüber Ontologien stehen fehlende Integration von Datenmodellen, das Fehlen einer Abfragesprache und das Fehlen von Axiomen (Regeln). Was unterscheidet Ontologien von Taxonomien? Taxonomien sind hierarchische Strukturen. Sie können entsprechend als Grundlage der Ontologiemodellierung verwendet werden. Oft sind diese in den Unternehmen bereits vorhanden. Die weitere Modellierung, z.B. von Regeln und Abhängigkeiten erfolgt in einer speziell für diese Belange von 3 ontoprise entwickelten Modellierungsumgebungen: OntoEdit®. Als gravierende Nachteile von Taxonomien gegenüber Ontologien stehen fehlende Integration von Datenmodellen, jegliches Fehlen einer Abfragesprache und Axiome (Regeln). Was unterscheidet Ontologien von Thesauri? Thesauri kommen ursprünglich aus der Bibliographie (vgl. Terminologien u. Klassifikationen). Oft werden Thesauri auch beschrieben als Graph mit Primitiven. Es ist nicht möglich, Relationen selbst zu definieren. Vorhandene Relationen sind "ähnlich wie", Synonym zu" und "Unterbegriff von". Ebenso ist keine Abbildung von Instanzen (spezielle Ausprägungen) möglich. > Recent Google co-founder Sergey Brin said (in speaking about RDF) "I'd > rather make progress by having computers understand what humans write, > than by forcing humans to write in ways computers can understand." [PPT]Einführung in Ontologien Dateiformat: Microsoft Powerpoint 97 - HTML-Version Einführung In Ontologien. ... Inhalt. Was ist eine Ontologie ? Anwendungen in Systemen. ... Semantic Web Workshop WWW-10: http://semweb2001.aifb.uni-karlsruhe.de. ... www.math.tu-dresden.de/~rudolph/Dresden_Workshop.ppt - Ähnliche Seiten 4