Folien

Werbung
Grammatiktheorien
Teil 5
Theoriebildung
Grammatikformalismen (1)
Inhalt der Vorlesung
•
•
•
•
•
Begriffsklärung
Historisches zur Grammatik(-theorie)
Grammatikmodelle
Grundbegriffe der syntaktischen Analyse
Grammatiktheorien
– Überblick
– Anwendungen
Sprachtheorie
• System von Hypothesen zur Erklärung der
verschiedensten natürlichsprachlichen Phänomene
• Anspruch auf Universalität
universelle Eigenschaften
• Subtheorien der Sprachtheorie
–
–
–
–
Grammatiktheorie
Spracherwerbstheorie
Sprachveränderungstheorie
Sprachverwendungstheorie
Grammatiktheorie
• Theorie über die Charakteristika von
Grammatiken
• Gerüst von Hypothesen und Teiltheorien
über die Art und Organisation der Elemente
von Grammatik(en)
• Zentraler Bestandteil einer allgemeinen
Sprachtheorie
Theorie und Hypothese
• Theorie
Eine Theorie ist ein System von Hypothesen oder eine
Menge von solchen Systemen, die zur Erklärung
bestimmter Phänomenbereiche entwickelt werden.
• Hypothese
Eine Hypothese ist eine empirische Verallgemeinerung
über einer Menge von Beobachtungsdaten.
Phasen der Theoriebildung
1. Sammlung und Beschreibung von
empirischen Daten
2. Hypothesenbildung
3. Theoriebildung
4. Überprüfung
Ziel der Theoriebildung: Erklärung
Ein Phänomen oder Datum kann erklärt werden …
– …durch die Benennung anderer Daten, die als Ursache,
Veranlassung, Symptom oder Disposition für das erste Datum
gelten können.
– … dadurch, dass ein allgemeiner struktureller und funktionaler
Zusammenhang von Daten genannt wird, aus dem logisch
gefolgert oder wenigstens plausibel gemacht werden kann, dass
dieses Datum (notwendig) so ist, wie es ist.
Diese Art von Erklärungen entspricht weitgehend jenen in
den Wissenschaften verfolgten Erklärungen.
 Linguistik als Wissenschaft
Theoriebildung Phase 1
• Bestimmte Phänomene (Daten) werden …
– … gesammelt
– … beschrieben und
– … klassifiziert
 Datenerhebung
 Korpusbildung/-erfassung
• Beispiel
Verbstellung im Deutschen
Sammlung von Haupt- und Nebensätzen
Theoriebildung Phase 1 - Beispiel
• Datensammlung
Luisa schreit den ganzen Tag, obwohl Lena mit ihr spielt.
Das grüne Krokodil liebt die Abwechslung.
Weil der Elefant nichts vergisst, heißt er Memory.
Schläfst Du schon?
• Beobachtung
In den Sätzen taucht an irgendeiner Stelle ein Verb auf.
Manchmal steht das Verb weiter vorne im Satz,
manchmal ganz am Schluss.
• Klassifizierung
Unterteilung in Haupt- und Nebensätze
Theoriebildung Phase 2
• Bildung von Hypothesen auf Grundlage der
klassifizierten Beobachtungsdaten
• Beispiel
Hypothesen zur Verbstellung
H1: Im deutschen Hauptsatz folgt das Verb auf die
erste Konstituente (Ausnahme: Ja/Nein-Frage).
H2: Im Nebensatz steht das Verb an letzter Stelle.
Die Hypothesen stehen in dieser Phase noch
zusammenhanglos nebeneinander
Theoriebildung Phase 3
• Erkennen eines Zusammenhangs zwischen
den Hypothesen
• Formulierung allgemeiner Prinzipien zur
Erläuterung der Beziehungen zwischen den
Hypothesen
• Allgemeine Prinzipien als theoretische
Konstrukte
Theoriebildung Phase 3 - Beispiel
• Zusammenhang
Die Verbstellung unterscheidet sich je nach Satzart.
Nebensätze werden durch subordinierende
Konjunktionen eingeleitet. Das Verb steht hier nicht an
zweiter Position, sondern ganz hinten.
• Erklärung
Die Struktur des deutschen Satzes lässt sich mithilfe des
topologischen Feldermodells erfassen.
Die linke Satzklammer ist im Hauptsatz durch das finite
Verb besetzt. Im Nebensatz steht hier die subordinierende Konjunktion. Deshalb muss das Verb in
seiner Ausgangsposition bleiben.
Theoriebildung Phase 4
• Die Überprüfung der Theorie durch
Falsifizierung anhand von Beispielen, die …
• … nicht durch die Theorie erklärt werden können
• … im Widerspruch zu den Vorhersagen der Theorie stehen
• Eine Theorie ist gültig, solange sie nicht
falsifiziert worden ist.
• Wenn auch scheinbare Gegenbeispiele durch die
allgemeinen Prinzipien der Theorie erfasst werden
können, aber der ursprünglichen Hypothese
widersprechen, ist nur die Hypothese, nicht aber
die Theorie falsifiziert.
Theoriebildung Phase 4 - Beispiel
• Falsifizierung
Luisa hat heute nicht geschlafen.
• In diesem Hauptsatz steht das Verb am Schluss.
• Erklärung: Die linke Satzklammer ist die Position
für das finite Verb, in diesem Fall das Hilfsverb.
Nicht-finite Verben und Verbteile stehen in der
rechten Satzklammer.
Er nahm die Nachricht gut auf.
Negative Evidenz
• Zur Verifizierung von Hypothesen müssen
Beispiele konstruiert werden, die nach den
Vorhersagen der Theorie nicht erlaubt sind.
• Diese müssen von kompetenten Sprechern
als ungrammatisch beurteilt werden.
 Auch ein Sprecher, dessen Urteile nicht
den Vorhersagen der Theorie entsprechen,
ist kompetent!
Negative Evidenz - Beispiel
• Sätze mit unbesetzter linker Satzklammer
sind ungrammatisch:
*Luisa den ganzen Tag geschrieen hat
• Die Satzklammer kann nicht durch
Konjunktion und Verb besetzt sein:
*Weil schreit Luisa den ganzen Tag.
Beschränkungsbasierte
Grammatikformalismen
• Engl. Constraint-based formalisms
• Auch: unifikationsbasiert
Unifikationsgrammatik
• Merkmalsstrukturen zur Repräsentation
detaillierter Informationen über morphologische,
syntaktische und semantische Merkmale
 Verarbeitung kontextfreier Grammatiken
• Effiziente Verarbeitung der Semantik
syntaktischer Repräsentationen
Beschränkungen
Die Verknüpfung von Phrasen zu größeren Einheiten
ist nicht ohne Einschränkung möglich
– Kongruenz zwischen Adjektivattribut und Nomen
NP  AdjP N
Ein groß-er Mann vs. *Ein groß-es Mann
–
–
–
–
Kongruenz zwischen Artikel und NP
Kongruenz zwischen Subjekt und Verb
Kasusrektion des Objekts durch das Verb
Etc.
Kodierung der Beschränkungen
• Durch Regeln, die mit erweiterten grammatischen
Kategorien arbeiten und so explizit morphologische Merkmale erfassen
3sg.mask.NP  3sg.mask.AdjP 3sg.mask.N
3pl.mask.NP  3pl.mask.AdjP 3pl.mask.N
3sg.fem.NP  3sg.fem.AdjP 3sg.fem.N
…
sehr große Menge grammatischer Kategorien
 sehr viele und redundante Grammatikregeln
 Kopplung von struktureller Information mit Informationen
über Kongruenz und Abhängigkeiten
schlechte Wartbarkeit, Verständlichkeit,…
Kodierung der Beschränkungen (2)
• Durch Regeln, die mit allgemeiner
gehaltenen Beschränkungen arbeiten
• Beispiel
Regel:
Beschränkung:
 Equality test
• Merkmalsstrukturen
• Unifikation
NP  AdjP N
Agr N = Agr AdjP
Merkmalsstrukturen
• Auch Attribut-Wert-Terme,
engl. feature structures
• Menge von Merkmal-Wert-Paaren
– Merkmal: nicht weiter teilbares Symbol aus einer
finiten Menge solcher Symbole
• cat (Kategorie), pers (Person), num (Numerus), gen (Genus),
agr (Agreeement), …
– Wert: atomare Symbole oder Merkmalsstrukturen
• NP, 3, pl, fem, {cat: NP, pers: 3, num: pl}, …
 Merkmalsstrukturen beliebiger Komplexität
Darstellung von Merkmalsstrukturen
• Attribut-Wert-Matrix
Cat: NP
Pers: 3
Num: pl
cat:
agr:
NP
pers: 3
num: pl
• Klammerstruktur
{cat: NP, pers: 3, num: pl}
Darstellung von Merkmalsstrukturen (2)
• Gerichteter Graph
VP
cat:
finite
head:
pl
form:
number:
subj:
agr:
person:
3
Elementare und komplexe
Merkmalsstrukturen
• Elementare
Merkmalsstrukturen
Der Wert des Attributs ist atomar
Cat:
Pers:
Num:
NP
3
pl
• Komplexe
Merkmalsstruktur
Der Wert des Attributs ist selbst
eine Merkmalsstruktur
cat:
agr:
NP
pers:
3
num: pl
Ein Pfad in einer Merkmalsstruktur ist eine Folge von Merkmalen,
die in der Merkmalsstruktur unmittelbar aufeinander folgen.
Der Wert eines Pfades ist die Merkmalsstruktur am Ende des
Pfades.
Reentranz
• Eine Merkmalsstruktur heißt reentrant, wenn
zwei Merkmale in der Struktur einen
gemeinsamen Wert aufweisen, d.h. zwei
Merkmale teilen sich eine gemeinsame Struktur.
• Auch: token-identisch, koreferent
• Kennzeichnung/Wiedergabe durch einen Index
(tags)
• Z.B. bei Subjekt-Verb-Kongruenz
Reentranz – Beispiel
Subjekt-Verb-Kongruenz: Luisa schreit.
PHON luisa
SUBJ
AGR 1
PRED
NUM sg
PER 3
PHON schreit
AGR 1
 Reentranz darf nicht mit Wertgleichheit
verwechselt werden!
Subsumption
• Merkmalsstrukturen können nach ihrem Wert geordnet
werden.
• Eine Merkmalsstruktur A subsumiert eine
Merkmalsstruktur B (A  B), wenn der Informationsgehalt
von A kleiner oder gleich ist verglichen mit B.
• Ist der Informationsgehalt einer Merkmalsstruktur A
kleiner/gleich gegenüber dem einer Merkmalsstruktur B, so
ist die Zahl der durch A charakterisierten Objekte
größer/gleich als der durch B charakterisierten Objekte.
•  Subsumption wird oft auch genau umgekehrt definiert.
Unifikation
• Unifikation
ist eine Operation, die den Informationsgehalt zweier
Merkmalsstrukturen miteinander kombiniert, sofern
beide miteinander kompatibel sind.
• Definition:
M1, M2 und M3 seien Merkmalsstrukturen. M3 ist genau
dann Unifikation von M1 und M2 (M3 = M1  M2),
wenn
• M3 von M1 und M2 subsumiert wird und
• M3 alle anderen Merkmalsstrukturen M subsumiert, die
ebenfalls von M1 und M2 subsumiert werden.
Unifikation (2)
• Scheitern der Unifikation bei inkompatiblen
Merkmalsstrukturen:
[num: sg]
[num: pl]
• Die leere Merkmalsstruktur ist das neutrale
Element der Unifikation
• Eigenschaften
– Idempotenz
M1  M1 = M1
– Kommutativgesetz
M1  M2 = M2  M1
Unifikation (3)
• Weitere Eigenschaften
– Assoziativgesetz
M1  (M2  M3) = (M1  M2)  M3
– Subsumptionsgesetz
(M1 << M2)  (M1  M2 = M2)
– Monotonie
Bei einer Unifikation bleibt die Information gleich
oder es wird Information hinzugefügt, niemals aber
abgezogen.
Typisierte Merkmalsstrukturen
• Unterscheidung von Merkmalstypen
• Merkmalstyp als Index an der Merkmalsmatrix
• Typfunktion für die Zuordnung der erlaubten
Merkmale (und deren Werten) zu den
entsprechenden Typen
• Beispiel: Typ agr
Merkmalsstrukturen vom Typ agr
haben immer die Merkmale
NUM (Numerus) vom Typ num
und PER (Person) vom Typ per.
PER
per
NUM num
agr
Zusammenfassung
Unifikationsgrammatik
• Komplexe Merkmalsstrukturen für lexikalische
Elemente und grammatische Kategorien
• Unifikation als Beschränkung für Konstituenten
und deren Verknüpfung in PS-Regeln
• Zur Erfassung linguistischer Phänomene wie
– Kongruenz
– Merkmalperkolation vom Kopf zur maximalen
Projektion
– Subkategorisierung
Wichtige constraint-basierte
Grammatikformalismen
• LFG Lexikalisch-Funktionale Grammatik
(Bresnan, Kaplan)
• HPSG Head-oriented PSG (Pollard, Sag)
• FUG Funktionale Unifikationsgrammatik (Kay)
• PATR-II „Parsing and Translation“ (Shieber)
• GPSG Generalisierte PSG (Gazdar et al.)
• DCG Definite Clause Grammar (Colmerauer,
Pereira/Warren)
Vorträge
Zur Vorbereitung für die Vorträge und als
Einführung für die verschiedenen Theorien:
Sells, Peter. Lectures on contemporary syntactic theories: an
introduction to government-binding theory, generalized phrase
structure grammar, and lexical-functional grammar. Stanford,
Californien: CSLI, 1985.
Allgemein u.a.:
http://www.fb10.uni-bremen.de/linguistik/khwagner/theorie/literatur.htm
Weitere Literatur und Links auf den Seiten zum Seminar
Vorträge
• Entscheidung für eine Grammatiktheorie
(spätestens bis Weihnachten)
• Mindestens ein linguistisches Phänomen
(deutsch oder englisch) mit dem
Instrumentarium der gewählten Theorie
analysieren und diese Analyse (idealerweise
in Auseinandersetzung mit anderen
Theorien) vorstellen
Herunterladen