UniversitŠt Bielefeld UniversitŠt Bielefeld Syntaktisches Parsing hier nur am Beispiel kontextfreier Grammatiken Problem: 7 Sprache und Kommunikation Gegeben ein Satz als Folge von Wörtern. Finde den zugehörigen Syntaxbaum. 21. Vorlesung: Syntaktisches Parsen; Semantische Interpretation 1. Grundmethode: Bottom-up Parsing Idee: --> Beispiel 1 Die Syntaxregeln werden "rückwärts" benutzt, bis sich der Satz auf das Startsymbol der Grammatik zurückführen läßt. Methoden der KŸnstlichen Intelligenz 2. Grundmethode: Ipke Wachsmuth Top-down Parsing ÊWS 2000/2001 Idee: --> Beispiel 2 Beginne mit dem Startsymbol der Grammatik und expandiere durch Ausdrücke, die nach den Grammatikregeln möglich sind. 21. Vorlesung UniversitŠt Bielefeld 2 UniversitŠt Bielefeld Beispiel 1: Bottom-up-Parsing Beispiel 1: Bottom-up-Parsing he s-maj –> s final-punc s –> np vp vp –> verb np np –> det noun np –> proper-noun np –> pronoun det –> the det –> a noun –> boy noun –> frog verb –> ate verb –> loves proper-noun –> Jack proper-noun –> Bill pronoun –> he final-punc –> . 21. Vorlesung Methoden der KŸnstlichen Intelligenz ate a frog np . s-maj –> s final-punc s –> np vp vp –> verb np np –> det noun np –> proper-noun np –> pronoun det –> the det –> a noun –> boy noun –> frog verb –> ate verb –> loves proper-noun –> Jack proper-noun –> Bill pronoun –> he final-punc –> . pronoun he ate a frog . np pronoun he ate a frog . np pronoun he verb ate Methoden der KŸnstlichen Intelligenz a frog . 3 21. Vorlesung pronoun he verb det ate a frog verb det noun ate a frog . np pronoun he np pronoun he . final-punc verb det noun ate a frog Methoden der KŸnstlichen Intelligenz . 4 UniversitŠt Bielefeld UniversitŠt Bielefeld Beispiel 1: Bottom-up-Parsing s final-punc np Schwierigkeit bei bottom-up • Die Ersetzungsregeln sind zu interpretieren als final-punc np "<linke Seite> kann ersetzt werden durch <rechte Seite>". vp • Wenn mehrere Regeln anwendbar sind, kann ein begonnener pronoun he np verb pronoun det noun a frog ate . np verb he Syntaxbaum u.U. nicht konsistent weitergebaut werden. det noun a frog ate np . That can made him sick. noun –> can np pronoun he ate s np verb det noun a frog pronoun 21. Vorlesung np vp Einziger Weg: ate • Solange durchprobieren, bis eine Kombination von Regelanwen- np verb det he That can make him sick. final-punc np . modal –> can s-maj final-punc vp a dungen gefunden wird, die einen vollständigen Syntaxbaum liefert. noun frog Methoden der KŸnstlichen Intelligenz • Bei mehreren voneinander unabhängigen Ambiguitäten: . 5 UniversitŠt Bielefeld exponentiell viele Möglichkeiten! 21. Vorlesung Methoden der KŸnstlichen Intelligenz UniversitŠt Bielefeld Syntaktisches Parsing Beispiel 2: Top-down-Parsing hier nur am Beispiel kontextfreier Grammatiken Problem: s-maj –> s final-punc s –> np vp vp –> verb np np –> det noun np –> proper-noun np –> pronoun det –> the det –> a noun –> boy noun –> frog verb –> ate verb –> loves proper-noun –> Jack proper-noun –> Bill pronoun –> he final-punc –> . Gegeben ein Satz als Folge von Wörtern. Finde den zugehörigen Syntaxbaum. 1. Grundmethode: Bottom-up Parsing Idee: --> Beispiel 1 Die Syntaxregeln werden "rückwärts" benutzt, bis sich der Satz auf das Startsymbol der Grammatik zurückführen läßt. 2. Grundmethode: Top-down Parsing Idee: --> Beispiel 2 Beginne mit dem Startsymbol der Grammatik und expandiere durch Ausdrücke, die nach den Grammatikregeln möglich sind. 21. Vorlesung 6 Methoden der KŸnstlichen Intelligenz 7 21. Vorlesung Beginne mit dem Startsymbol der Grammatik und expandiere durch Ausdrücke, die nach den Grammatikregeln möglich sind, bis der Satz dasteht. s-maj s final-punc np pronoun he vp verb ate Methoden der KŸnstlichen Intelligenz np det noun a frog . 8 UniversitŠt Bielefeld UniversitŠt Bielefeld Parse-Tree in Listen-Notation Vergleich bottom-up/top-down • Für bestimmte Sätze ist "top-down" besser als "bottom-up", für (s-maj (s (np (pronoun he)) (vp (verb ate) (np (det a) (noun frog)))) (final-punc . )) andere schlechter – keine Methode ist grundsätzlich überlegen. s-maj s Did final-punc you hit Bill? Hilfsverb np vp • Striktes top-down parsing beginnt mit s –> np vp und würde (hier ohne Ergebnis) erst alle Möglichkeiten suchen, np zu expandieren. pronoun verb np • In vielen Fällen werden top-down Parser vorgezogen (einfacher zu realisieren). det noun • Sehr bekannte top-down Parser sind die sogenannten ATN-Parser. (Augmented Transition Networks) he 21. Vorlesung ate a frog . Methoden der KŸnstlichen Intelligenz 9 UniversitŠt Bielefeld 21. Vorlesung Methoden der KŸnstlichen Intelligenz 10 UniversitŠt Bielefeld Beispiel zur Sprachanalyse u ATN-Parsing als Suchproblem u Anfängliche Wahl der ersten Regel zieht weitere Festlegungen nach sich (was für eine np? usw.) Von Syntax zu Semantik Grammatik mit Regeln s -> np vp s -> aux np vp Syntaktische Analyse Parse Tree Semantische Analyse Symbolische ReprŠsentation Bisher: Natürlichsprachlicher Satz Jetzt: Syntaxbaum –> –> Syntaxbaum interne Repräsentation semantische Analyse > vereinfachte Betrachtung > Hauptzweck: Motivation Zwei Teilaufgaben: • Disambiguierung von Wortsinn und Referenz • Überführung in eine symbolische Repräsentation (in der gewählten internen Repräsentationssprache) 21. Vorlesung Methoden der KŸnstlichen Intelligenz 11 21. Vorlesung Methoden der KŸnstlichen Intelligenz 12 UniversitŠt Bielefeld UniversitŠt Bielefeld Tiefenstruktur & ReprŠsentation Bsp.: Definite Beschreibungen gegeben durch definite Nominalphrasen (definite noun phrases) u Analyse der syntaktischen Struktur natürlicher Sprache ist ein Schritt in Richtung zur internen Repräsentation Beschreibung der Szene durch Fakten (in assertional notation) block-1 (inst table-1 table) u Tiefenstruktur (deep structure): l l l l (inst block-1 block) verschiedene Anteile sprachlicher Konstruktionen sind aufgelöst (mit Hilfe von Transformationsregeln), z.B. passive Konstruktionen Bezüge von Reflexivpronomen (Ich wusch mich.) Wichtig: Die ursprüngliche Bedeutung des Satzes ändert sich nicht. u Tiefenstruktur ist nicht = interne Repräsentation: l enthält noch Wörter der natürlichen Sprache, während die interne Repräsentation Ausdrücke einer Repräsentationssprache enthält. 21. Vorlesung Methoden der KŸnstlichen Intelligenz 13 UniversitŠt Bielefeld block-2 block-3 (color block-1 red) (supported-by block-1 block-2) (inst block-2 block) table-1 (color block-2 blue) "the red block" (supported-by block-2 table-1) • Erwartung: bezieht sich auf einen definiten Referenten 21. Vorlesung (color block-3 yellow) (supported-by block-3 table-1) • muß Bezug auf "Weltmodell" (hier: die faktische Szenenbeschreibung) auslösen wie folgt: (retrieve-val Õ?x Õ(and (inst ?x block) (color ?x red))) (inst block-3 pyramid) (wäre hier: x = block-1) Methoden der KŸnstlichen Intelligenz 14 UniversitŠt Bielefeld Semantische Interpretation Syntaktisch-semantische Analyse (anderer Ansatz) Aufbau der Repräsentation für "the red block" erfordert: Prinzip der kompositionellen Semantik. • Die interne Repräsentation wird • Zuordnung von Bedeutungen zu den einzelnen Wörtern (zu finden in einem Konzept-Lexikon): (Theorie über Verstehen der Bedeutung von Sprache) 1. Syntaktische Analyse 2. Ableitung der Bedeutung red --> (color ?x red) block --> (inst ?x block) the --> retrieve-val Einbezug der semantischen Interpretation bereits bei zur gleichen Zeit aufgebaut wie der Syntaxanalyse, um den Parser zu führen (unsinnige die syntaktischen Beziehungen. Analysen der Satzkonstituentenstruktur auszuschalten). • Dazu werden in die (z.B. ATN-) Grammatik Regeln einbezogen, • Kombination der einzelnen Wortbedeutungen, um Bedeutung der Wortgruppen zu erhalten: Ich las einen Artikel über den Vietnamkrieg in der Zeitung. Fakten in einer Datenbasis des Ganzen aus der Bedeutung der Teile. assertieren: interne Repräsentation. red block --> the red block --> Es gibt andere Formen der semantischen Interpretation. (and(inst ?x block)(color ?x red) Ich las einen Artikel über den Vietnamkrieg in der Zeitung. (retrieve-val '?x '(and (inst ?x block) (color ?x red))) Beispiel: Einführung von Referenten für Nominalphrasen [Hier nicht weiter betrachtet.] • Anbindung dieser Prozesse an den syntaktischen Parser 21. Vorlesung die parallel zur Syntaxanalyse Methoden der KŸnstlichen Intelligenz 15 21. Vorlesung Methoden der KŸnstlichen Intelligenz 16 UniversitŠt Bielefeld UniversitŠt Bielefeld AmbiguitŠtsprobleme Wissen Ÿber die Welt ... beweglich - Müllers sahen die Alpen, während sie nach Italien flogen. (Wer oder was fliegt hier?) GelŠndeformation - Ich nahm das Essen mit Messer und Gabel ein. - Ich nahm das Essen mit Erwin und Gabi ein. Mensch false isa isa - Can companies litter the environment (?) Reisender Gebirge Fortbewegung inst fahren Ich sah den Mann im Park mit dem Fernrohr inst the man in the park with the telescope. Methoden der KŸnstlichen Intelligenz Flugreisender Frau MŸller ...und es hatte den Anschein, daß er den Mond betrachtete. 21. Vorlesung isa Fortbewegung isa Autoreisender true fliegen Alpen ...nur undeutlich, da meine Linse schmutzig war. (noch schlimmer:) I saw beweglich 17 UniversitŠt Bielefeld inst Herr MŸller Müllers (r1) sahen die Alpen (r2), während sie (r1) nach Italien flogen. 21. Vorlesung Methoden der KŸnstlichen Intelligenz 18 UniversitŠt Bielefeld Semantische Parser-Steuerung Alternativ: Blackboard-Modell (HEARSAY II, 1980) u Der Suchraum eines Syntax-Parsers kann dadurch eingeschränkt werden, daß Semantikbetrachtungen zur Steuerung des Parsers herangezogen werden. Phonologie Syntax, Semantik (und alle weiteren Prozesse) arbeiten separat, aber parallel. u entspricht der Verwendung einer Zustandsbewertungsfunktion für einen Suchalgorithmus search: l l l Input Schätzung der Distanz zum nächsten Zielzustand bzw. der Kosten für den nächsten Zielzustand Kostenmaß wäre anzugeben für die semantische Plausibilität von Teil-„Parses“ Effekt: semantisch plausiblere Zerlegungen würden zuerst weiter exploriert werden. 21. Vorlesung Methoden der KŸnstlichen Intelligenz Alles, was auf der Blackboard steht, wird von den anderen Prozessen genutzt. 19 21. Vorlesung Syntax Blackboard Weltwissen Semantik Methoden der KŸnstlichen Intelligenz 20 UniversitŠt Bielefeld UniversitŠt Bielefeld Blick aufs Ganze: Dialogsysteme SHRDLU und die Blockwelt nach dem alten Code „ETAOIN SHRDLU“, mit dem Linotype-Setzer Satzfehler in Zeitungsspalten markierten ... Probleme bei der Verarbeitung von sprachlichen Eingaben: u ein Programm soll (englisch gestellte) Fragen über eine simulierte Blockwelt verstehen u Strukturelle Analyse der natürlichen Sprache l Syntaxproblem u Erfassen der Bedeutung unter Bezug auf ein Weltmodell l Semantikproblem u Ableitung einer Antwort (in symbolischer Repräsentation) l Inferenzproblem u Generierung einer Antwort in natürlicher Sprache l Methoden der KŸnstlichen Intelligenz u (auf englisch gegebene) Instruktionen verstehen, um die Klötzchen zu verschieben u jede Instruktion in eine Reihenfolge von Operationen, die das Programm ausführen kann, zerlegen u „verstehen“, was getan wurde und warum Generierungsproblem 21. Vorlesung u auf solche Fragen (auf englisch) eine Antwort geben u ausgeführte Handlungen und Gründe dafür beschreiben 21 UniversitŠt Bielefeld 21. Vorlesung Methoden der KŸnstlichen Intelligenz 22 UniversitŠt Bielefeld SHRDLU (1972) Leseempfehlung heute Terry Winograd Ÿber Parsing etc.: u Charniak & McDermott, Kap.4, S.194 ff; S.223 ff Ÿber SHRDLU z.B.: u D. Hofstadter, “Gödel, Escher, Bach” S.624 ff 21. Vorlesung Methoden der KŸnstlichen Intelligenz 23 21. Vorlesung Methoden der KŸnstlichen Intelligenz 24