Grammatiktheorien Teil 5 Theoriebildung Grammatikformalismen (1) Inhalt der Vorlesung • • • • • Begriffsklärung Historisches zur Grammatik(-theorie) Grammatikmodelle Grundbegriffe der syntaktischen Analyse Grammatiktheorien – Überblick – Anwendungen Sprachtheorie • System von Hypothesen zur Erklärung der verschiedensten natürlichsprachlichen Phänomene • Anspruch auf Universalität universelle Eigenschaften • Subtheorien der Sprachtheorie – – – – Grammatiktheorie Spracherwerbstheorie Sprachveränderungstheorie Sprachverwendungstheorie Grammatiktheorie • Theorie über die Charakteristika von Grammatiken • Gerüst von Hypothesen und Teiltheorien über die Art und Organisation der Elemente von Grammatik(en) • Zentraler Bestandteil einer allgemeinen Sprachtheorie Theorie und Hypothese • Theorie Eine Theorie ist ein System von Hypothesen oder eine Menge von solchen Systemen, die zur Erklärung bestimmter Phänomenbereiche entwickelt werden. • Hypothese Eine Hypothese ist eine empirische Verallgemeinerung über einer Menge von Beobachtungsdaten. Phasen der Theoriebildung 1. Sammlung und Beschreibung von empirischen Daten 2. Hypothesenbildung 3. Theoriebildung 4. Überprüfung Ziel der Theoriebildung: Erklärung Ein Phänomen oder Datum kann erklärt werden … – …durch die Benennung anderer Daten, die als Ursache, Veranlassung, Symptom oder Disposition für das erste Datum gelten können. – … dadurch, dass ein allgemeiner struktureller und funktionaler Zusammenhang von Daten genannt wird, aus dem logisch gefolgert oder wenigstens plausibel gemacht werden kann, dass dieses Datum (notwendig) so ist, wie es ist. Diese Art von Erklärungen entspricht weitgehend jenen in den Wissenschaften verfolgten Erklärungen. Linguistik als Wissenschaft Theoriebildung Phase 1 • Bestimmte Phänomene (Daten) werden … – … gesammelt – … beschrieben und – … klassifiziert Datenerhebung Korpusbildung/-erfassung • Beispiel Verbstellung im Deutschen Sammlung von Haupt- und Nebensätzen Theoriebildung Phase 1 - Beispiel • Datensammlung Luisa schreit den ganzen Tag, obwohl Lena mit ihr spielt. Das grüne Krokodil liebt die Abwechslung. Weil der Elefant nichts vergisst, heißt er Memory. Schläfst Du schon? • Beobachtung In den Sätzen taucht an irgendeiner Stelle ein Verb auf. Manchmal steht das Verb weiter vorne im Satz, manchmal ganz am Schluss. • Klassifizierung Unterteilung in Haupt- und Nebensätze Theoriebildung Phase 2 • Bildung von Hypothesen auf Grundlage der klassifizierten Beobachtungsdaten • Beispiel Hypothesen zur Verbstellung H1: Im deutschen Hauptsatz folgt das Verb auf die erste Konstituente (Ausnahme: Ja/Nein-Frage). H2: Im Nebensatz steht das Verb an letzter Stelle. Die Hypothesen stehen in dieser Phase noch zusammenhanglos nebeneinander Theoriebildung Phase 3 • Erkennen eines Zusammenhangs zwischen den Hypothesen • Formulierung allgemeiner Prinzipien zur Erläuterung der Beziehungen zwischen den Hypothesen • Allgemeine Prinzipien als theoretische Konstrukte Theoriebildung Phase 3 - Beispiel • Zusammenhang Die Verbstellung unterscheidet sich je nach Satzart. Nebensätze werden durch subordinierende Konjunktionen eingeleitet. Das Verb steht hier nicht an zweiter Position, sondern ganz hinten. • Erklärung Die Struktur des deutschen Satzes lässt sich mithilfe des topologischen Feldermodells erfassen. Die linke Satzklammer ist im Hauptsatz durch das finite Verb besetzt. Im Nebensatz steht hier die subordinierende Konjunktion. Deshalb muss das Verb in seiner Ausgangsposition bleiben. Theoriebildung Phase 4 • Die Überprüfung der Theorie durch Falsifizierung anhand von Beispielen, die … • … nicht durch die Theorie erklärt werden können • … im Widerspruch zu den Vorhersagen der Theorie stehen • Eine Theorie ist gültig, solange sie nicht falsifiziert worden ist. • Wenn auch scheinbare Gegenbeispiele durch die allgemeinen Prinzipien der Theorie erfasst werden können, aber der ursprünglichen Hypothese widersprechen, ist nur die Hypothese, nicht aber die Theorie falsifiziert. Theoriebildung Phase 4 - Beispiel • Falsifizierung Luisa hat heute nicht geschlafen. • In diesem Hauptsatz steht das Verb am Schluss. • Erklärung: Die linke Satzklammer ist die Position für das finite Verb, in diesem Fall das Hilfsverb. Nicht-finite Verben und Verbteile stehen in der rechten Satzklammer. Er nahm die Nachricht gut auf. Negative Evidenz • Zur Verifizierung von Hypothesen müssen Beispiele konstruiert werden, die nach den Vorhersagen der Theorie nicht erlaubt sind. • Diese müssen von kompetenten Sprechern als ungrammatisch beurteilt werden. Auch ein Sprecher, dessen Urteile nicht den Vorhersagen der Theorie entsprechen, ist kompetent! Negative Evidenz - Beispiel • Sätze mit unbesetzter linker Satzklammer sind ungrammatisch: *Luisa den ganzen Tag geschrieen hat • Die Satzklammer kann nicht durch Konjunktion und Verb besetzt sein: *Weil schreit Luisa den ganzen Tag. Beschränkungsbasierte Grammatikformalismen • Engl. Constraint-based formalisms • Auch: unifikationsbasiert Unifikationsgrammatik • Merkmalsstrukturen zur Repräsentation detaillierter Informationen über morphologische, syntaktische und semantische Merkmale Verarbeitung kontextfreier Grammatiken • Effiziente Verarbeitung der Semantik syntaktischer Repräsentationen Beschränkungen Die Verknüpfung von Phrasen zu größeren Einheiten ist nicht ohne Einschränkung möglich – Kongruenz zwischen Adjektivattribut und Nomen NP AdjP N Ein groß-er Mann vs. *Ein groß-es Mann – – – – Kongruenz zwischen Artikel und NP Kongruenz zwischen Subjekt und Verb Kasusrektion des Objekts durch das Verb Etc. Kodierung der Beschränkungen • Durch Regeln, die mit erweiterten grammatischen Kategorien arbeiten und so explizit morphologische Merkmale erfassen 3sg.mask.NP 3sg.mask.AdjP 3sg.mask.N 3pl.mask.NP 3pl.mask.AdjP 3pl.mask.N 3sg.fem.NP 3sg.fem.AdjP 3sg.fem.N … sehr große Menge grammatischer Kategorien sehr viele und redundante Grammatikregeln Kopplung von struktureller Information mit Informationen über Kongruenz und Abhängigkeiten schlechte Wartbarkeit, Verständlichkeit,… Kodierung der Beschränkungen (2) • Durch Regeln, die mit allgemeiner gehaltenen Beschränkungen arbeiten • Beispiel Regel: Beschränkung: Equality test • Merkmalsstrukturen • Unifikation NP AdjP N Agr N = Agr AdjP Merkmalsstrukturen • Auch Attribut-Wert-Terme, engl. feature structures • Menge von Merkmal-Wert-Paaren – Merkmal: nicht weiter teilbares Symbol aus einer finiten Menge solcher Symbole • cat (Kategorie), pers (Person), num (Numerus), gen (Genus), agr (Agreeement), … – Wert: atomare Symbole oder Merkmalsstrukturen • NP, 3, pl, fem, {cat: NP, pers: 3, num: pl}, … Merkmalsstrukturen beliebiger Komplexität Darstellung von Merkmalsstrukturen • Attribut-Wert-Matrix Cat: NP Pers: 3 Num: pl cat: agr: NP pers: 3 num: pl • Klammerstruktur {cat: NP, pers: 3, num: pl} Darstellung von Merkmalsstrukturen (2) • Gerichteter Graph VP cat: finite head: pl form: number: subj: agr: person: 3 Elementare und komplexe Merkmalsstrukturen • Elementare Merkmalsstrukturen Der Wert des Attributs ist atomar Cat: Pers: Num: NP 3 pl • Komplexe Merkmalsstruktur Der Wert des Attributs ist selbst eine Merkmalsstruktur cat: agr: NP pers: 3 num: pl Ein Pfad in einer Merkmalsstruktur ist eine Folge von Merkmalen, die in der Merkmalsstruktur unmittelbar aufeinander folgen. Der Wert eines Pfades ist die Merkmalsstruktur am Ende des Pfades. Reentranz • Eine Merkmalsstruktur heißt reentrant, wenn zwei Merkmale in der Struktur einen gemeinsamen Wert aufweisen, d.h. zwei Merkmale teilen sich eine gemeinsame Struktur. • Auch: token-identisch, koreferent • Kennzeichnung/Wiedergabe durch einen Index (tags) • Z.B. bei Subjekt-Verb-Kongruenz Reentranz – Beispiel Subjekt-Verb-Kongruenz: Luisa schreit. PHON luisa SUBJ AGR 1 PRED NUM sg PER 3 PHON schreit AGR 1 Reentranz darf nicht mit Wertgleichheit verwechselt werden! Subsumption • Merkmalsstrukturen können nach ihrem Wert geordnet werden. • Eine Merkmalsstruktur A subsumiert eine Merkmalsstruktur B (A B), wenn der Informationsgehalt von A kleiner oder gleich ist verglichen mit B. • Ist der Informationsgehalt einer Merkmalsstruktur A kleiner/gleich gegenüber dem einer Merkmalsstruktur B, so ist die Zahl der durch A charakterisierten Objekte größer/gleich als der durch B charakterisierten Objekte. • Subsumption wird oft auch genau umgekehrt definiert. Unifikation • Unifikation ist eine Operation, die den Informationsgehalt zweier Merkmalsstrukturen miteinander kombiniert, sofern beide miteinander kompatibel sind. • Definition: M1, M2 und M3 seien Merkmalsstrukturen. M3 ist genau dann Unifikation von M1 und M2 (M3 = M1 M2), wenn • M3 von M1 und M2 subsumiert wird und • M3 alle anderen Merkmalsstrukturen M subsumiert, die ebenfalls von M1 und M2 subsumiert werden. Unifikation (2) • Scheitern der Unifikation bei inkompatiblen Merkmalsstrukturen: [num: sg] [num: pl] • Die leere Merkmalsstruktur ist das neutrale Element der Unifikation • Eigenschaften – Idempotenz M1 M1 = M1 – Kommutativgesetz M1 M2 = M2 M1 Unifikation (3) • Weitere Eigenschaften – Assoziativgesetz M1 (M2 M3) = (M1 M2) M3 – Subsumptionsgesetz (M1 << M2) (M1 M2 = M2) – Monotonie Bei einer Unifikation bleibt die Information gleich oder es wird Information hinzugefügt, niemals aber abgezogen. Typisierte Merkmalsstrukturen • Unterscheidung von Merkmalstypen • Merkmalstyp als Index an der Merkmalsmatrix • Typfunktion für die Zuordnung der erlaubten Merkmale (und deren Werten) zu den entsprechenden Typen • Beispiel: Typ agr Merkmalsstrukturen vom Typ agr haben immer die Merkmale NUM (Numerus) vom Typ num und PER (Person) vom Typ per. PER per NUM num agr Zusammenfassung Unifikationsgrammatik • Komplexe Merkmalsstrukturen für lexikalische Elemente und grammatische Kategorien • Unifikation als Beschränkung für Konstituenten und deren Verknüpfung in PS-Regeln • Zur Erfassung linguistischer Phänomene wie – Kongruenz – Merkmalperkolation vom Kopf zur maximalen Projektion – Subkategorisierung Wichtige constraint-basierte Grammatikformalismen • LFG Lexikalisch-Funktionale Grammatik (Bresnan, Kaplan) • HPSG Head-oriented PSG (Pollard, Sag) • FUG Funktionale Unifikationsgrammatik (Kay) • PATR-II „Parsing and Translation“ (Shieber) • GPSG Generalisierte PSG (Gazdar et al.) • DCG Definite Clause Grammar (Colmerauer, Pereira/Warren) Vorträge Zur Vorbereitung für die Vorträge und als Einführung für die verschiedenen Theorien: Sells, Peter. Lectures on contemporary syntactic theories: an introduction to government-binding theory, generalized phrase structure grammar, and lexical-functional grammar. Stanford, Californien: CSLI, 1985. Allgemein u.a.: http://www.fb10.uni-bremen.de/linguistik/khwagner/theorie/literatur.htm Weitere Literatur und Links auf den Seiten zum Seminar Vorträge • Entscheidung für eine Grammatiktheorie (spätestens bis Weihnachten) • Mindestens ein linguistisches Phänomen (deutsch oder englisch) mit dem Instrumentarium der gewählten Theorie analysieren und diese Analyse (idealerweise in Auseinandersetzung mit anderen Theorien) vorstellen