Syntaktisches Parsing Beispiel 1: Bottom-up

Werbung
UniversitŠt Bielefeld
UniversitŠt Bielefeld
Syntaktisches Parsing
hier nur am Beispiel kontextfreier Grammatiken
Problem:
7 Sprache und Kommunikation
Gegeben ein Satz als Folge von Wörtern.
Finde den zugehörigen Syntaxbaum.
21. Vorlesung: Syntaktisches Parsen;
Semantische Interpretation
1. Grundmethode:
Bottom-up Parsing
Idee:
--> Beispiel 1
Die Syntaxregeln werden "rückwärts" benutzt, bis sich der Satz
auf das Startsymbol der Grammatik zurückführen läßt.
Methoden der KŸnstlichen Intelligenz
2. Grundmethode:
Ipke Wachsmuth
Top-down Parsing
ÊWS 2000/2001
Idee:
--> Beispiel 2
Beginne mit dem Startsymbol der Grammatik und expandiere
durch Ausdrücke, die nach den Grammatikregeln möglich sind.
21. Vorlesung
UniversitŠt Bielefeld
2
UniversitŠt Bielefeld
Beispiel 1: Bottom-up-Parsing
Beispiel 1: Bottom-up-Parsing
he
s-maj –> s final-punc
s –> np vp
vp –> verb np
np –> det noun
np –> proper-noun
np –> pronoun
det –> the
det –> a
noun –> boy
noun –> frog
verb –> ate
verb –> loves
proper-noun –> Jack
proper-noun –> Bill
pronoun –> he
final-punc –> .
21. Vorlesung
Methoden der KŸnstlichen Intelligenz
ate
a
frog
np
.
s-maj –> s final-punc
s –> np vp
vp –> verb np
np –> det noun
np –> proper-noun
np –> pronoun
det –> the
det –> a
noun –> boy
noun –> frog
verb –> ate
verb –> loves
proper-noun –> Jack
proper-noun –> Bill
pronoun –> he
final-punc –> .
pronoun
he
ate
a
frog
.
np
pronoun
he
ate
a
frog
.
np
pronoun
he
verb
ate
Methoden der KŸnstlichen Intelligenz
a
frog
.
3
21. Vorlesung
pronoun
he
verb
det
ate
a
frog
verb
det
noun
ate
a
frog
.
np
pronoun
he
np
pronoun
he
.
final-punc
verb
det
noun
ate
a
frog
Methoden der KŸnstlichen Intelligenz
.
4
UniversitŠt Bielefeld
UniversitŠt Bielefeld
Beispiel 1: Bottom-up-Parsing
s
final-punc
np
Schwierigkeit bei bottom-up
• Die Ersetzungsregeln sind zu interpretieren als
final-punc
np
"<linke Seite> kann ersetzt werden durch <rechte Seite>".
vp
• Wenn mehrere Regeln anwendbar sind, kann ein begonnener
pronoun
he
np
verb
pronoun
det
noun
a
frog
ate
.
np
verb
he
Syntaxbaum u.U. nicht konsistent weitergebaut werden.
det
noun
a
frog
ate
np
.
That can made him sick.
noun –> can
np
pronoun
he
ate
s
np
verb
det
noun
a
frog
pronoun
21. Vorlesung
np
vp
Einziger Weg:
ate
• Solange durchprobieren, bis eine Kombination von Regelanwen-
np
verb
det
he
That can make him sick.
final-punc
np
.
modal –> can
s-maj
final-punc
vp
a
dungen gefunden wird, die einen vollständigen Syntaxbaum liefert.
noun
frog
Methoden der KŸnstlichen Intelligenz
• Bei mehreren voneinander unabhängigen Ambiguitäten:
.
5
UniversitŠt Bielefeld
exponentiell viele Möglichkeiten!
21. Vorlesung
Methoden der KŸnstlichen Intelligenz
UniversitŠt Bielefeld
Syntaktisches Parsing
Beispiel 2: Top-down-Parsing
hier nur am Beispiel kontextfreier Grammatiken
Problem:
s-maj –> s final-punc
s –> np vp
vp –> verb np
np –> det noun
np –> proper-noun
np –> pronoun
det –> the
det –> a
noun –> boy
noun –> frog
verb –> ate
verb –> loves
proper-noun –> Jack
proper-noun –> Bill
pronoun –> he
final-punc –> .
Gegeben ein Satz als Folge von Wörtern.
Finde den zugehörigen Syntaxbaum.
1. Grundmethode:
Bottom-up Parsing
Idee:
--> Beispiel 1
Die Syntaxregeln werden "rückwärts" benutzt, bis sich der Satz
auf das Startsymbol der Grammatik zurückführen läßt.
2. Grundmethode:
Top-down Parsing
Idee:
--> Beispiel 2
Beginne mit dem Startsymbol der Grammatik und expandiere
durch Ausdrücke, die nach den Grammatikregeln möglich sind.
21. Vorlesung
6
Methoden der KŸnstlichen Intelligenz
7
21. Vorlesung
Beginne mit dem Startsymbol der Grammatik und expandiere
durch Ausdrücke, die nach den Grammatikregeln möglich sind,
bis der Satz dasteht.
s-maj
s
final-punc
np
pronoun
he
vp
verb
ate
Methoden der KŸnstlichen Intelligenz
np
det
noun
a
frog
.
8
UniversitŠt Bielefeld
UniversitŠt Bielefeld
Parse-Tree in Listen-Notation
Vergleich bottom-up/top-down
• Für bestimmte Sätze ist "top-down" besser als "bottom-up", für
(s-maj (s (np (pronoun he))
(vp (verb ate)
(np (det a) (noun frog))))
(final-punc . ))
andere schlechter – keine Methode ist grundsätzlich überlegen.
s-maj
s
Did
final-punc
you hit Bill?
Hilfsverb
np
vp
• Striktes top-down parsing beginnt mit s –> np vp und würde (hier
ohne Ergebnis) erst alle Möglichkeiten suchen, np zu expandieren.
pronoun
verb
np
• In vielen Fällen werden top-down Parser vorgezogen (einfacher zu
realisieren).
det
noun
• Sehr bekannte top-down Parser sind die sogenannten ATN-Parser.
(Augmented Transition Networks)
he
21. Vorlesung
ate
a
frog
.
Methoden der KŸnstlichen Intelligenz
9
UniversitŠt Bielefeld
21. Vorlesung
Methoden der KŸnstlichen Intelligenz
10
UniversitŠt Bielefeld
Beispiel zur Sprachanalyse
u ATN-Parsing als Suchproblem
u Anfängliche Wahl der ersten
Regel zieht weitere
Festlegungen nach sich (was
für eine np? usw.)
Von Syntax zu Semantik
Grammatik mit Regeln
s -> np vp
s -> aux np vp
Syntaktische
Analyse
Parse Tree
Semantische
Analyse
Symbolische
ReprŠsentation
Bisher:
Natürlichsprachlicher Satz
Jetzt:
Syntaxbaum
–>
–>
Syntaxbaum
interne Repräsentation
semantische Analyse
> vereinfachte Betrachtung
> Hauptzweck: Motivation
Zwei Teilaufgaben:
• Disambiguierung von Wortsinn und Referenz
• Überführung in eine symbolische Repräsentation
(in der gewählten internen Repräsentationssprache)
21. Vorlesung
Methoden der KŸnstlichen Intelligenz
11
21. Vorlesung
Methoden der KŸnstlichen Intelligenz
12
UniversitŠt Bielefeld
UniversitŠt Bielefeld
Tiefenstruktur & ReprŠsentation
Bsp.: Definite Beschreibungen
gegeben durch definite Nominalphrasen (definite noun phrases)
u Analyse der syntaktischen Struktur natürlicher Sprache ist
ein Schritt in Richtung zur internen Repräsentation
Beschreibung der Szene durch Fakten
(in assertional notation)
block-1
(inst table-1 table)
u Tiefenstruktur (deep structure):
l
l
l
l
(inst block-1 block)
verschiedene Anteile sprachlicher Konstruktionen sind aufgelöst
(mit Hilfe von Transformationsregeln), z.B.
passive Konstruktionen
Bezüge von Reflexivpronomen (Ich wusch mich.)
Wichtig: Die ursprüngliche Bedeutung des Satzes ändert sich nicht.
u Tiefenstruktur ist nicht = interne Repräsentation:
l
enthält noch Wörter der natürlichen Sprache, während die interne
Repräsentation Ausdrücke einer Repräsentationssprache enthält.
21. Vorlesung
Methoden der KŸnstlichen Intelligenz
13
UniversitŠt Bielefeld
block-2
block-3
(color block-1 red)
(supported-by block-1 block-2)
(inst block-2 block)
table-1
(color block-2 blue)
"the red block"
(supported-by block-2 table-1)
• Erwartung: bezieht sich auf einen definiten Referenten
21. Vorlesung
(color block-3 yellow)
(supported-by block-3 table-1)
• muß Bezug auf "Weltmodell" (hier: die faktische
Szenenbeschreibung) auslösen wie folgt:
(retrieve-val Õ?x Õ(and (inst ?x block) (color ?x red)))
(inst block-3 pyramid)
(wäre hier: x = block-1)
Methoden der KŸnstlichen Intelligenz
14
UniversitŠt Bielefeld
Semantische Interpretation
Syntaktisch-semantische Analyse
(anderer Ansatz)
Aufbau der Repräsentation für "the red block" erfordert:
Prinzip der
kompositionellen Semantik.
• Die interne Repräsentation wird
• Zuordnung von Bedeutungen zu den einzelnen Wörtern
(zu finden in einem Konzept-Lexikon):
(Theorie über Verstehen der
Bedeutung von Sprache)
1. Syntaktische Analyse
2. Ableitung der Bedeutung
red
-->
(color ?x red)
block
-->
(inst ?x block)
the
-->
retrieve-val
Einbezug der semantischen Interpretation bereits bei
zur gleichen Zeit aufgebaut wie
der Syntaxanalyse, um den Parser zu führen (unsinnige
die syntaktischen Beziehungen.
Analysen der Satzkonstituentenstruktur auszuschalten).
• Dazu werden in die (z.B. ATN-)
Grammatik Regeln einbezogen,
• Kombination der einzelnen Wortbedeutungen, um Bedeutung
der Wortgruppen zu erhalten:
Ich las einen Artikel über den Vietnamkrieg in der Zeitung.
Fakten in einer Datenbasis
des Ganzen aus der
Bedeutung der Teile.
assertieren: interne Repräsentation.
red block
-->
the red block -->
Es gibt andere Formen der
semantischen Interpretation.
(and(inst ?x block)(color ?x red)
Ich las einen Artikel über den Vietnamkrieg in der Zeitung.
(retrieve-val '?x
'(and (inst ?x block)
(color ?x red)))
Beispiel: Einführung von Referenten
für Nominalphrasen
[Hier nicht weiter betrachtet.]
• Anbindung dieser Prozesse an den syntaktischen Parser
21. Vorlesung
die parallel zur Syntaxanalyse
Methoden der KŸnstlichen Intelligenz
15
21. Vorlesung
Methoden der KŸnstlichen Intelligenz
16
UniversitŠt Bielefeld
UniversitŠt Bielefeld
AmbiguitŠtsprobleme
Wissen Ÿber die Welt ...
beweglich
- Müllers sahen die Alpen, während sie nach Italien flogen.
(Wer oder was fliegt hier?)
GelŠndeformation
- Ich nahm das Essen mit Messer und Gabel ein.
- Ich nahm das Essen mit Erwin und Gabi ein.
Mensch
false
isa
isa
- Can companies litter the environment
(?)
Reisender
Gebirge
Fortbewegung
inst
fahren
Ich sah den Mann im Park mit dem Fernrohr
inst
the man in the park with the telescope.
Methoden der KŸnstlichen Intelligenz
Flugreisender
Frau
MŸller
...und es hatte den Anschein, daß er den Mond betrachtete.
21. Vorlesung
isa Fortbewegung
isa
Autoreisender
true
fliegen
Alpen
...nur undeutlich, da meine Linse schmutzig war.
(noch schlimmer:) I saw
beweglich
17
UniversitŠt Bielefeld
inst
Herr
MŸller
Müllers (r1) sahen die Alpen (r2),
während sie (r1) nach Italien flogen.
21. Vorlesung
Methoden der KŸnstlichen Intelligenz
18
UniversitŠt Bielefeld
Semantische Parser-Steuerung
Alternativ: Blackboard-Modell
(HEARSAY II, 1980)
u Der Suchraum eines Syntax-Parsers kann dadurch
eingeschränkt werden, daß Semantikbetrachtungen
zur Steuerung des Parsers herangezogen werden.
Phonologie
Syntax, Semantik
(und alle weiteren
Prozesse) arbeiten
separat, aber parallel.
u entspricht der Verwendung einer Zustandsbewertungsfunktion für einen Suchalgorithmus search:
l
l
l
Input
Schätzung der Distanz zum nächsten Zielzustand
bzw. der Kosten für den nächsten Zielzustand
Kostenmaß wäre anzugeben für die semantische Plausibilität
von Teil-„Parses“
Effekt: semantisch plausiblere Zerlegungen würden zuerst
weiter exploriert werden.
21. Vorlesung
Methoden der KŸnstlichen Intelligenz
Alles, was auf der
Blackboard steht,
wird von den anderen
Prozessen genutzt.
19
21. Vorlesung
Syntax
Blackboard
Weltwissen
Semantik
Methoden der KŸnstlichen Intelligenz
20
UniversitŠt Bielefeld
UniversitŠt Bielefeld
Blick aufs Ganze: Dialogsysteme
SHRDLU und die Blockwelt
nach dem alten Code „ETAOIN SHRDLU“, mit dem Linotype-Setzer
Satzfehler in Zeitungsspalten markierten ...
Probleme bei der Verarbeitung von sprachlichen Eingaben:
u ein Programm soll (englisch gestellte) Fragen über eine
simulierte Blockwelt verstehen
u Strukturelle Analyse der natürlichen Sprache
l
Syntaxproblem
u Erfassen der Bedeutung unter Bezug auf ein Weltmodell
l
Semantikproblem
u Ableitung einer Antwort (in symbolischer Repräsentation)
l
Inferenzproblem
u Generierung einer Antwort in natürlicher Sprache
l
Methoden der KŸnstlichen Intelligenz
u (auf englisch gegebene) Instruktionen verstehen, um die
Klötzchen zu verschieben
u jede Instruktion in eine Reihenfolge von Operationen, die
das Programm ausführen kann, zerlegen
u „verstehen“, was getan wurde und warum
Generierungsproblem
21. Vorlesung
u auf solche Fragen (auf englisch) eine Antwort geben
u ausgeführte Handlungen und Gründe dafür beschreiben
21
UniversitŠt Bielefeld
21. Vorlesung
Methoden der KŸnstlichen Intelligenz
22
UniversitŠt Bielefeld
SHRDLU (1972)
Leseempfehlung heute
Terry Winograd
Ÿber Parsing etc.:
u Charniak & McDermott,
Kap.4, S.194 ff; S.223 ff
Ÿber SHRDLU z.B.:
u D. Hofstadter, “Gödel,
Escher, Bach” S.624 ff
21. Vorlesung
Methoden der KŸnstlichen Intelligenz
23
21. Vorlesung
Methoden der KŸnstlichen Intelligenz
24
Herunterladen