SYNTAX: SATZAUFBAU, STRUKTURANALYSE UND

Werbung
SYNTAX: SATZAUFBAU, STRUKTURANALYSE UND
Die syntaktische Ebene
GRAMMATIKFORMALISMEN
Beschreibung (“korrekter”) Sätze durch Kompositionsregeln
Die grammatische Abbildung
Syntax als Abstraktion bzgl. der zulässigen Anordnung von Wörtern; autonom
Konstituenz und Dependenz
gegenüber semantischen und pragmatischen Bedingungen
Forderungen an eine Grammatik für das Deutsche
Segmentierung in Untereinheiten (Konstituenten, “Phrasen”) und Zuordnung
Konstituentenstruktur: Kontextfreie Grammatiken
einer hierarchischen Anordnung dieser Segmente
Generativität syntaktischer Regeln: Unendlicher Gebrauch von endlichen Mitteln
Generative Transformationsgrammatik
Schnittstelle zur semantischen und pragmatischen Verarbeitung
Kategorialgrammatik
1
G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8
c G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8
2
Hinweise
Grammatik und Satzbegriff
Die Grammatik beschreibt notwendige, aber nicht hinreichende Bedingungen für die
Formulierung von Äusserungen.
Was Sätze sind, hängt von variierenden Gebrauchsbedingungen ab; u.a. logische,
Der Satz als traditionell hierarchisch höchste Einheit der Syntax muss kritisch
rhetorische, ästhetische Kriterien.
hinterfragt werden.
Alternativvorschlag: Satz bezeichnet Mengen ähnlicher Verwendungsweisen von
Zur Vertiefung des Syntaxkapitels:
Typen niedriger Hierarchieebenen — Phrasen und Wörtern. (Stetter)
K. Bücher: Vorlesung Grammatiktheorien
Chomsky hat das Problem der Satzdefinition durch ein extensionales
W. Menzel (U. Hamburg): Vorlesung Sprachorientierte KI: Syntax
Annäherungsverfahren zu lösen versucht, nachdem eine intensionale Definition des
Satzbegriffs nicht möglich war:
Bei hinreichend vielen deskriptiv adäquaten Beschreibungen einzelner Sätze bildet
sich eine generative Grammatik heraus, deren Extension die (Teil-) Menge der
erzeugbaren Sätze approximiert.
3
G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8
c G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8
4
Empirie und Strukturtests
Gewinnung von “Beobachtungs”daten für die Modellierung — was soll
Grammatik — syntaktische Theorien — Universalgrammatik
“gemessen” werden?
Deskriptive vs. präskriptive Grammatik
Korrektheitsurteile; graduierte Akzeptabilität — abhängig von der
Universalgrammatik
Verwendungssituation!
– Historisch: Mentalistisch/intellektualistisch (“Sprache des Geistes”)
Strukturtests: gezielte Stellungsveränderungen und Konsequenzen für
– Chomsky: Biologisch orientierter Ansatz (LAD)
Akzeptabilität
– Ersetzungsprobe: Welche Satzteile lassen sich durch welche anderen
Prinzipien
ersetzen?
Parameter
– Pronominalisierungsprobe: Auf welche Satzteile kann man sich durch ein
Prinzip der strukturellen Determiniertheit: Alle grammatischen Regeln sind
Pronomen beziehen?
strukturabhängig (Bildung der Frageform, Passivform)
– Weglaßprobe: Welche Satzteile können weggelassen werden? (Spezialfall:
(Kompetenzbasierte) Idealisierungen
bei Ellipsenbildung)
– Fragetest: Welche Satzbestandteile kann man erfragen?
– Koordinationstest: Welche Satzteile kann man koordinativ verknüpfen?
5
G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8
c G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8
6
Die grammatische Abbildung
Zentrale Aufgabe der Syntaxanalyse:
Realisierung der grammatischen Abbildung
Bestimmung der grammatischen Relationen für jede zulässige Zeichenkette:
– Verschiebeprobe: Welche Satzteile kann man an eine andere Satzposition
verschieben?
Jeder sprachlichen Äußerung wird eine (oder mehrere) Strukturbeschreibung(en)
V.a.: Fragesatzbildung, Topikalisierung (“given”–”new”), Ausklammerung
zugeordnet, die ihren Inhalt repräsentiert.
Modularisierung:
– Reguläre Transformationen: Passivbildung
1. Feststellung sequentiell angeordneter diskreter Einheiten
(c) Menzel
2. Zuordnung unterschiedlicher Kategorien zu diesen Einheiten
3. Gruppierung der kategorisierten Einheiten (Konstituenten)
4. Zuschreibung grammatischer Funktionen (z.B. Subjekt, Prädikat, Objekt)
5. Identifikation von Dependenzen zwischen funktionalen Einheiten (z.B.
Kongruenz)
7
G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8
c G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8
8
Grammatik, Parser und Generator
Forderungen an die Realisierung der grammatischen Abbildung
(Kaplan/Bresnan)
Kreativität: Wie werden über unendlichem Definitions- und Wertebereich
Repräsentationen gebildet?
Endliche Kapazität: Endlich viele Operationen über endlichen Ressourcen
Zuverlässigkeit: effektive Berechenbarkeit
Ordnungsfreie Komposition: Monotone Inklusion
Universalität: Einzelsprachen übergreifend
9
G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8
c G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8
10
Konstituentenstrukturgrammatik (Phrasenstrukturgrammatik, PSG)
Konstituenz und Dependenz (1)
definiert System komplexer (nichtterminaler) Kategorien;
Konstituenz: Teil-Ganzes-Relation
gestattet, syntaktische Strukturen durch Segmentierung in kleinere Einheiten zu
beschreibt, wie Ketten von Elementen zusammengesetzt sind.
analysieren,
Ausgangssituation: Lineare Folge von Wörtern in zeitlicher Anordnung;
und diese durch ihre Stellung im Ganzen zu erklären.
Reihenfolge und grammatische Nachbarschaft
Einfachste uniforme Möglichkeit zur Beschreibung von Konstituentenstrukturen
Konstituenten sind sprachliche Einheiten, die Teile größerer sprachlicher Einheiten
durch rekursive Muster .
sind.
Randbedingungen: Ökonomieprinzip der Minimalität und Redundanzfreiheit
11
G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8
c G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8
12
Konstituenz und Dependenz (2)
Dependenz und Konstituenz
Dependenz als zweite syntaktische Grundrelation
geht über das Kriterium der bloßen Form hinaus;
bezeichnet Abhängigkeitsverhältnis sprachlicher Elemente durch eine
Vorkommensrelation
(aus dem Vorkommen eines Elements kann auf das anderer Elemente
geschlossen werden).
Dependenzgrammatiken fassen den Satz als ein durch eine Abhängigkeitsrelation
festgelegtes, hierarchisch geordnetes Ganzes auf.
Ziel der Beschreibung: Hierarchische Struktur, die nicht bloß auf der Form, sondern
auf “inhaltlichen” Charakteristika beruht.
“Standardmodell”: Verb hat zentrale Position, alle nominalen Einheiten hängen
direkt von ihm ab — Valenztheorie (Tesnière 1965)
Konstituenz und Dependenz ergänzen einander
13
G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8
c G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8
14
Syntaktische Phänomene (Menzel)
Konstituenz: Unmittelbare Konstituenten (Segmentierung); s. Strukturtests
Forderungen an eine Grammatik für das Deutsche
Dependenz: Abhängigkeitsverhältnis zwischen sprachlichen Einheiten
1. Flexions- und Kongruenzregeln
Valenz: Eigenschaft von Verben (auch Substantiven), Leerstellen zu eröffnen,
Person-Numerus-Kongruenz zwischen Verb und Subjekt,
die durch andere Satzglieder abgesättigt werden können.
z.B. “ich gebe”, “du gibst”
Aktanten (Komplemente): obligatorische Verbergänzungen
Kasus-Genus-Numerus-Kongruenz zwischen den Elementen einer
Anordnung: Starke (NP, PP) und schwache Anordnungsrestriktionen; Einfluss
Nominalgruppe,
der Satzperspektive (Thema/Rhema)
z.B. “einem großen Bären”
Rektion/Selektion: Forderung eines bestimmten Merkmals bei einem Aktanten
Syntaktische Restriktionen des Verbs bzgl. seiner Ergänzungen: Rektion,
(Rektion: morphologisches Merkmal, insbes. Kasus)
z.B. “jemanden einer Sache verdächtigen”, “auf jemanden böse sein”
Kongruenz: Übereinstimmung von Wortformen bgzl. strukturell definierter
Vom Artikelwort bestimmte starke oder schwache Flexion des Adjektivs,
morphosyntaktischer Mermale (Kasus, Person, Numerus, Genus):
z.B. “ein großer Irrtum”, “der große Irrtum”
Subjekt–Verb, Artikel–Adjektiv–Nomen, Relativpronomen–Bezugsnomen,
Possesivpronomen–Antezedent, Reflexivpronomen–Subjekt
15
G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8
c G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8
16
2. Variable Satzgliedstellung
3. Diskontinuierliche Konstituenten
Wortordnung im Deutschen ist grundsätzlich fixiert, aber es gibt beträchtliche
Freiheitsgrade in der Anordnung einiger Typen von Konstituenten wie
Konstituenten, deren Teile nicht unmittelbar aufeinanderfolgen, sondern durch
Nominalgruppen oder Adverbialgruppen — z.B. für Subjekt, direktes und
eine variable Zahl anderer Konstituenten voneinander getrennt sind.
indirektes Objekt (vgl. Uszkoreit 1983).
Verbalklammer : Bei zusammengesetzten Verbalgruppen im Hauptsatz steht
Beispiel: In dem Satz
der finite Teil des Verbs an zweiter Stelle im Satz, alle anderen am Ende des
“Dann hatte der Schaffner dem Mann die Fahrkarte gegeben.”
Mittelfelds, z.B. in
ist jede Permutation der drei Nominalgruppen zulässig, doch gibt es einige
“Er wird sicher innerhalb der nächsten Stunde ankommen.”
Grundregeln, die ihre Anordnung beeinflussen:
(wichtigster Fall)
Die unmarkierte Satzstellung ist Subjekt — indirektes Objekt — direktes
Trennung der Nebensätze vom Bezugsobjekt, vor allem Nominalattribute in
Objekt (Beispielsatz); kann primär zur Auflösung struktureller
Nebensatzform,
Mehrdeutigkeiten herangezogen werden.
z.B. Relativsätze wie in
Kommentar (oder Fokus) folgt auf Nicht-Kommentar.
“Ich habe meine Meinung Dir gegenüber nie verheimlicht, daß Du die Reise
Personalpronomina stehen vor anderen Nominalgruppen.
nicht unternehmen solltest.”
Betonung erfolgt im Vorfeld, “leichte” Konstituenten stehen vor “schweren”.
17
G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8
c G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8
18
Semantische Probleme in der grammatischen Analyse
4. Koordination
Problem: Unter bestimmten inhaltlichen Bedingungen können faktisch beliebige
Frageoperatoren
warum, wie
Koordination
Peter und Maria sind verheiratet
Vage Quantoren
viele
Komplexe Quantoren
Ungefähr die Hälfte dieser 20–30 Teile
“Hecken”
ziemlich, weniger
Adjektiv-Attribute und Komparativkonstruktionen,
Modalpartikel
vielleicht, hoffentlich
z.B. “Die phantastische überwältigende überzeugende Lösung.”
Komparative
der größere von beiden
Nominalgruppen, z.B. “Krieg und Frieden.”
Deixis
dort, davor, du
Sequenzen koordiniert werden.
Wichtigste Fälle:
Präpositional-Attribute,
z.B. “Der Dicke in meinem Abteil mit dem riesigen Koffer auf dem Sitz neben
sich.”
19
G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8
c G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8
20
Konstituentenstruktur: Kontextfreie Grammatiken
Theorie der formalen Sprachen: Klassifikation der Ausdrucksstärke von
Kontinua
Wasser, Verkehr
Metaphern
Kopf (-zeile)
Ellipsen
diesen auch?
Anaphern
das, Ich tue es!
Kataphern
das folgende
Präsuppositionen
Ich komme mit dem VW.
Grammatiken bzw. der von ihnen erzeugten Sprachen
Chomsky–Hierarchie
– Typ 0: Turing-äquivalente
– Typ 1: kontextsensitive
– Typ 2: kontextfreie
– Typ 3: reguläre Sprachen
– Es gibt einen VW
These: Kontextfreie Sprachen sind zur Beschreibung der Konstitutentenstruktur
– Ich habe einen VW
natürlicher Sprachen besonders geeignet.
Zentrale Frage: Adäquatheit der Beschreibung?
21
G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8
c G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8
22
Beispiel einer kontextfreien Grammatik
Definition:
Eine kontextfreie (Chomsky-) Grammatik ist ein Quadrupel
Kontextfreie Regeln
S
wobei
VP
NP
N die Menge der nichtterminalen Symbole,
V
Det N
23
c G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8
Hund Knochen
hat
der ein einen
Det
S das ausgezeichnete nichtterminale Startsymbol ist.
G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8
V NP
,
N
P eine endliche Menge von Produktionen der Form
und
NP VP
Terminalregeln (Lexikon als Teil der Grammatik)
T die Menge der terminalen Symbole bezeichnet,
mit
G = (N,T,P,S)
24
Ableitungsbaum
(Konstituentenstrukturbaum) des Satzes
“Der Hund hat einen Knochen.”
S
NP
VP
V
Hund
hat
VP V hat NP Det einen N Knochen
NP
Det
Der
N
S NP Det Der N Hund
Det
Ableitungsbaum als Klammerstruktur
einen
N
Knochen
25
G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8
c G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8
26
Verschiedene Beziehungen in Phrasenstrukturbäumen
Exkurs: Analysestrategien
Top-Down: Beginne mit dem Startsymbol S, “expandiere” dann NP und VP, bis
die terminalen Symbole erreicht sind.
Bottom-Up: beginne mit den terminalen Symbolen, wende Regeln “umgekehrt”
an, bis das Startsymbol S erreicht ist.
Orthogonal dazu: Breite-zuerst und Tiefe-zuerst
27
G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8
c G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8
28
Beispiel: “Andi sieht Anna mit dem Fernglas.”
Syntaktische Mehrdeutigkeit
Zwei mögliche Ableitungsbäume
Kontextfreie Grammatik:
S
VP
V NP VP PP
NP
NP PP Det N PN
PP
Präp NP
PN
Andi Anna
N
Fernglas
V
sieht
Det
dem
Präp
mit
NP
PN
VP
V
NP
NP
PN
Andi
29
Anna
Präp
mit
NP
Det
N
dem
Fernglas
G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8
sieht
PP
NP VP
S
c G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8
30
Syntaktische Mehrdeutigkeit
S
“Time flies like an arrow”
VP
NP
PN
VP
V
PP
NP
Präp
NP
Det
N
dem
Fernglas
PN
Andi
sieht
Anna
31
G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8
mit
c G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8
32
Chomsky-Normalform
Eine kontextfreie Grammatik ist in Chomsky-Normalform, falls alle Regeln in
die
Umformung in Chomsky-Normalform bedeutet, daß man solche Regeln eliminieren
Form
oder ergänzen muß, auf deren rechter Seite
oder
haben mit
und
Regeln der Form
nur ein Nichtterminal steht,
.
mehr als zwei Elemente stehen,
nennt man binäre Regeln.
Zu jeder kontextfreien Grammatik
äquivalente Grammatik
mit
Terminale und Nichtterminale gemischt vorkommen.
existiert eine schwach
in Chomsky- Normalform.
33
G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8
c G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8
34
Probleme mit Kontextfreien Grammatiken (1)
Probleme mit Kontextfreien Grammatiken (2)
Merkmals-Übereinstimmung
“Welche Limonaden , die es hier gibt , möchtest Du haben ?”
Andere diskontinuierliche Komponenten
“Der Mann zog den Hund, den er hatte, hinter sich her”
Zuweisung ähnlicher Sturkturen an ähnliche Sätze, z.B. Aktiv–Passiv
“Ich habe dieses Auto gekauft”
“Dieses Auto wurde von mir gekauft”
(nach Winograd)
35
G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8
c G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8
36
Oberflächenstruktur und Tiefenstruktur (1)
Das Modell der Generativen Transformationsgrammatik
37
G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8
c G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8
Oberflächenstruktur und Tiefenstruktur (2)
Transformationskomponente
39
G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8
38
c G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8
40
Standard-Theorie und Erweiterungen (1)
GTG-Beispiel (Standard-Theorie)
41
G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8
c G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8
42
Standard-Theorie und Erweiterungen (2)
Standard-Theorie und Erweiterungen (3)
43
G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8
c G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8
44
Minimalismus
Probabilistische (kontextfreie) Grammatiken
Kontextfreies Regelgerüst
Annotation der Regeln mit Wahrscheinlichkeiten
Kombination der Wahrscheinlichkeiten nicht unproblematisch
Eine probabilistische kontextfreie Grammatik ist eine kontextfreie Grammatik, bei
der jeder Produktion ein Wahrscheinlichkeitswert zugeordnet ist, wobei gilt:
Die Wahrscheinlichkeiten aller Produktionen zu einem bestimmten nicht-terminalen
Symbol müssen sich zu 1 aufsummieren.
G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8
c G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8
45
46
PCFG – Beispiel
S
NP
NP
NP VP
DET N
NP PP
(1.0)
(0.7)
(0.3)
PP
VP
VP
Sei folgende Grammatik gegeben:
Kategorialgrammatik
P NP
V NP
VP PP
(1.0)
(0.6)
(0.4)
Grammatische Information zum größten Teil im Lexikon
Grundkategorien
S — Satz
N — Nomen
(NP — Nominalphrase)
Ableitungsbäume
S
1.0
0.06174
VP
0.08232
S
1.0
0.6
NP
VP
PP
NP
0.7
0.7
DET
N
V
DET
1.0
N
PP
VP
NP
NP
0.7
0.7
P DET
N
Die Frau sieht das Kind mit dem Fernglas
DET
N
0.6
V
1.0
NP
0.7
DET
N
S NP — Verben
NP/N — Artikel, Quantoren
N/N — Adjektive
NP
Funktorkategorien
0.4
0.3
NP
0.7
N
P DET
Die Frau sieht das Kind mit dem Fernglas
(Die Werte für die Lexikoneinträge sind der Übersichtlichkeit halber weggelassen)
47
G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8
c G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8
48
Regeln
Funktionale Applikation als einzige Operation (“Wegkürzen”)
A/B B
B A B
A
A
Bemerkung: Regeln können auch als Merkmalsterme ausgedrückt werden
(Attribute: Funktor und Argumente)
Erweiterungen um Unifikationsformalismus: UCG, CUG
49
G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8
c G. Görz, K. Bücher, M. Klarner, FAU Erlangen-Nürnberg, Inf. 8
50
Herunterladen