Inhalt der Vorlesung Grammatiktheorien Teil 5 Theoriebildung Grammatikformalismen (1) • • • • • Begriffsklärung Historisches zur Grammatik(-theorie) Grammatikmodelle Grundbegriffe der syntaktischen Analyse – Überblick – Anwendungen Sprachtheorie Grammatiktheorie • System von Hypothesen zur Erklärung der verschiedensten natürlichsprachlichen Phänomene • Anspruch auf • Theorie über die Charakteristika von Grammatiken • Gerüst von Hypothesen und Teiltheorien über die Art und Organisation der Elemente von Grammatik(en) • Zentraler Bestandteil einer allgemeinen Sprachtheorie • !#"$! % universelle Eigenschaften (& '*)(+-,.0/12 .03 der Sprachtheorie – 465-789897;: < =: >$? @5-< ? – Spracherwerbstheorie – Sprachveränderungstheorie – Sprachverwendungstheorie Theorie und Hypothese • ACBDEFG D Eine Theorie ist ein System von Hypothesen oder eine Menge von solchen Systemen, die zur Erklärung bestimmter Phänomenbereiche entwickelt werden. • HJI(KL$M-NO0PO Eine Hypothese ist eine empirische Verallgemeinerung über einer Menge von Beobachtungsdaten. Phasen der Theoriebildung 1. Sammlung und Beschreibung von empirischen Daten 2. Hypothesenbildung 3. Theoriebildung 4. Überprüfung 1 Ziel der Theoriebildung: Erklärung Ein Phänomen oder Datum kann erklärt werden … – …durch die Benennung anderer Daten, die als Ursache, Veranlassung, Symptom oder Disposition für das erste Datum gelten können. – … dadurch, dass ein allgemeiner struktureller und funktionaler Zusammenhang von Daten genannt wird, aus dem logisch gefolgert oder wenigstens plausibel gemacht werden kann, dass dieses Datum (notwendig) so ist, wie es ist. Diese Art von Erklärungen entspricht weitgehend jenen in den Wissenschaften verfolgten Erklärungen. Linguistik als Wissenschaft Q Theoriebildung Phase 1 - Beispiel • • • Bestimmte Phänomene (Daten) werden … m – … – … – … n RS TVUW9W9S X Y Z[ \V] ^ _-` [Z[ a b0c deVeVf g f hif jk#l und Datenerhebung Korpusbildung/-erfassung • Beispiel o Verbstellung im Deutschen Sammlung von Haupt- und Nebensätzen Theoriebildung Phase 2 pq r#s0{;|-t} ~u(q~ vw vw } x y - tz ## # ;#-V# #{; #(} -} -0~ $} (-~i; #-$ # V } } - } i(V -~ |V ( } - - #V } ~ ;} ~ ~ V } - (- ; ¡ ~ (|(~ -#;¢ £9¤0¥ ¦§¨0©(ª#«¬­ • Bildung von »J¼½¾¿ ÀÁÂ0Áà auf Grundlage der klassifizierten Beobachtungsdaten • ÄCÅÆ Ç0ÈÆ ÅÉ ®°¯ ±²²³ ´V³ µ³ ¶0·¸¹º Die Hypothesen stehen in dieser Phase noch zusammenhanglos nebeneinander In den Sätzen taucht an irgendeiner Stelle ein Verb auf. Manchmal steht das Verb weiter vorne im Satz, manchmal ganz am Schluss. • Theoriebildung Phase 1 Unterteilung in Haupt- und Nebensätze Theoriebildung Phase 3 • Erkennen eines Zusammenhangs zwischen den Hypothesen • Formulierung allgemeiner Prinzipien zur Erläuterung der Beziehungen zwischen den Hypothesen • Allgemeine Prinzipien als theoretische Konstrukte Hypothesen zur Verbstellung H1: Im deutschen Hauptsatz folgt das Verb auf die erste Konstituente (Ausnahme: Ja/Nein-Frage). H2: Im Nebensatz steht das Verb an letzter Stelle. Theoriebildung Phase 3 - Beispiel • Zusammenhang Die Verbstellung unterscheidet sich je nach Satzart. Nebensätze werden durch subordinierende Konjunktionen eingeleitet. Das Verb steht hier nicht an zweiter Position, sondern ganz hinten. • Erklärung Die Struktur des deutschen Satzes lässt sich mithilfe des topologischen Feldermodells erfassen. Die linke Satzklammer ist im Hauptsatz durch das finite Verb besetzt. Im Nebensatz steht hier die subordinierende Konjunktion. Deshalb muss das Verb in seiner Ausgangsposition bleiben. 2 Theoriebildung Phase 4 ÊËÌ ÍÎ Ï#Î Ð$Î ÑÒÓÔÕ • Die Überprüfung der Theorie durch anhand von Beispielen, die … • … nicht durch die Theorie erklärt werden können • … im Widerspruch zu den Vorhersagen der Theorie stehen • Eine Theorie ist gültig, solange sie nicht falsifiziert worden ist. • Wenn auch scheinbare Gegenbeispiele durch die allgemeinen Prinzipien der Theorie erfasst werden können, aber der ursprünglichen Hypothese widersprechen, ist nur die Hypothese, nicht aber die Theorie falsifiziert. Theoriebildung Phase 4 - Beispiel Ö(×Ø ÙVÚÛÚ0ÜÛ0Ý ×;Ü ÝÞ0Ø ß-Û0Ü;àÝ#Ù#ß-Û0á Ú âÝ-Þ ã • Falsifizierung • In diesem Hauptsatz steht das Verb am Schluss. • Erklärung: Die linke Satzklammer ist die Position für das finite Verb, in diesem Fall das Hilfsverb. Nicht-finite Verben und Verbteile stehen in der rechten Satzklammer. ä*å(æçèé êë ì(íîç0ï#è0å#ë ï-èð;ñ$ò;ð;çò ó ô Negative Evidenz • Zur Verifizierung von Hypothesen müssen Beispiele konstruiert werden, die nach den Vorhersagen der Theorie nicht erlaubt sind. • Diese müssen von kompetenten Sprechern ungrammatisch beurteilt werden. õ alsAuch ein Sprecher, dessen Urteile nicht den Vorhersagen der Theorie entsprechen, ist kompetent! Negative Evidenz - Beispiel • Sätze mit unbesetzter linker Satzklammer sind ungrammatisch: ö#÷îøù úûüý;þÿûþý;þ û ÿÿ(ýúù ý0ý;þ û • Die Satzklammer kann nicht durch Konjunktion und Verb besetzt sein: ! "!#!$"% Beschränkungsbasierte Grammatikformalismen • Engl. &(')*+ ,-/. )+ 021-*3465',78-9 . *78* • Auch: unifikationsbasiert : Unifikationsgrammatik • Merkmalsstrukturen zur Repräsentation detaillierter Informationen über morphologische, syntaktische und semantische Merkmale ; Verarbeitung kontextfreier Grammatiken • Effiziente Verarbeitung der Semantik syntaktischer Repräsentationen Beschränkungen Die Verknüpfung von Phrasen zu größeren Einheiten ist nicht ohne Einschränkung möglich – Kongruenz zwischen Adjektivattribut und Nomen <=?>A@B C D6E FG HIJ K LM N OQPARTSTSVU W XY Z[ S\] ^ _` a bQcAdTefe – – – – Kongruenz zwischen Artikel und NP Kongruenz zwischen Subjekt und Verb Kasusrektion des Objekts durch das Verb Etc. 3 Kodierung der Beschränkungen Kodierung der Beschränkungen (2) • Durch Regeln, die mit erweiterten grammatischen Kategorien arbeiten und so explizit morphologische Merkmale erfassen g2h ij klTh m2j no?prq2s tu vwfs x2u yz { |}q2s tu vwfs x2u ~ q u vwTs xTu ~|?r f T } f T 2 T ?r2 T / }2 2 / ¡ ¢ £ • Durch Regeln, die mit allgemeiner gehaltenen Beschränkungen arbeiten • Beispiel Regel: Beschränkung: ¥§¦/¨©ª« ¬ ­ ®A­ ¯f°T­ sehr große Menge grammatischer Kategorien sehr viele und redundante Grammatikregeln Kopplung von struktureller Information mit Informationen über Kongruenz und Abhängigkeiten schlechte Wartbarkeit, Verständlichkeit,… Merkmalsstrukturen • Merkmalsstrukturen • Unifikation Darstellung von Merkmalsstrukturen • Auch Attribut-Wert-Terme, engl. ±²³´ µ¶²A·´ ¶µ¸´ µ¶²· • Menge von Merkmal-Wert-Paaren • ÈÉQÉQÊË Ì(Í(ÉQÎ ÏÑÐÊÉQÎQÒÔÓ6ÉQÊË Õ Cat: NP Pers: 3 Num: pl ¹ º¼Q½¾À¿Á : nicht weiter teilbares Symbol aus einer – » finiten Menge solcher Symbole • cat (Kategorie), pers (Person), num (Numerus), gen (Genus), agr (Agreeement), … – ÂÄÃÅTÆ : atomare Symbole oder Merkmalsstrukturen Ç NP ¤ AdjP N Agr N = Agr AdjP • NP, 3, pl, fem, {cat: NP, pers: 3, num: pl}, … cat: agr: NP pers: 3 num: pl • ÖØ× Ù6ÚÛÚÛÜÝÞàßQÝá(â(ßá(Ý {cat: NP, pers: 3, num: pl} Merkmalsstrukturen beliebiger Komplexität Elementare und komplexe Merkmalsstrukturen Darstellung von Merkmalsstrukturen (2) í î ïQðÀïQñò óàôfï • 6 Merkmalsstrukturen • ãØäåæ çè(éQäéQäåêãØåë6ì(è VP Der Wert des Attributs ist atomar cat: finite head: Cat: Pers: Num: pl form: number: subj: NP 3 pl õ ö÷8øù úQûú • A Merkmalsstruktur Der Wert des Attributs ist selbst eine Merkmalsstruktur cat: agr: NP pers: 3 num: pl Ein üý þfÿ in einer Merkmalsstruktur ist eine Folge von Merkmalen, die in der Merkmalsstruktur unmittelbar aufeinander folgen. agr: person: 3 ist die Merkmalsstruktur am Ende des Der Pfades. 4 Reentranz Reentranz – Beispiel • Eine Merkmalsstruktur heißt , wenn zwei Merkmale in der Struktur einen gemeinsamen Wert aufweisen, d.h. zwei Merkmale !" #%$&' #(&'*)+,-#.#-/, . • Auch: 0132/45768 9#45708 :;< , =/>?@A@?@B7C • Kennzeichnung/Wiedergabe durch einen Index (DEF3GH • Z.B. bei Subjekt-Verb-Kongruenz Subjekt-Verb-Kongruenz: IKJML NOPNQRMSTL U V AGR 1 d z | Reentranz darf nicht mit Wertgleichheit verwechselt werden! w x y • }K~# /3` 3~ ist eine Operation, die den Informationsgehalt zweier Merkmalsstrukturen miteinander kombiniert, sofern beide miteinander sind. • K ` # 3 : , und { • Scheitern der Unifikation bei ¸ ¹#º/»3¼'½#¾3¿¸ À#Á ¹ Merkmalsstrukturen: [num: pl] • Die Merkmalsstruktur ist das Ã#ÄÅ7ÆÇÈÉ Ä Ê É ÄË'leere ÄÃ7Æ der Unifikation • Eigenschaften – Ì`ÍÎÏ*ÐÑÓÒ ÎÔÕ M1 ∪ M1 = M1 – Ö°×Ø*ØlÙÚ ÛÚ Ü ÝÞßà`ßÚ á M1 ∪ M2 = M2 ∪ M1 * ist genau ¢£ ¤¥ ¦g§ ∪ ¨© ), seien Merkmalsstrukturen. dann Unifikation von und ( = wenn • • ª%« %± ² ¬*­ ¡ ®°¯ ´lµ ¶%· von und subsumiert wird und alle anderen Merkmalsstrukturen subsumiert, die und subsumiert werden. ebenfalls von Unifikation (2) [num: sg] PHON AGR 1 Unifikation • Merkmalsstrukturen können nach ihrem Wert geordnet werden. • Eine Merkmalsstruktur eine Merkmalsstruktur ⊆ , wenn der Informationsgehalt von kleiner oder gleich ist verglichen mit . • Ist der Informationsgehalt einer Merkmalsstruktur kleiner/gleich gegenüber dem einer Merkmalsstruktur , so ist die Zahl der durch charakterisierten Objekte größer/gleich als der durch charakterisierten Objekte. • Subsumption wird oft auch genau umgekehrt definiert. v NUM sg PER 3 \ ] ^`_ a b c PRED Subsumption egf`h3if`h3jlk mno p q s tu r WX YZ [ PHON SUBJ ³ Unifikation (3) • Weitere Eigenschaften – âKããäåçæ è3éæ ê+ë3ìãìé å – í7î/ï#ðî/ñóò7ôõ ö3÷#ðøùðùô ú – ûýü3þ/üçÿüþ M1 ∪ (M2 ∪ M3) = (M1 ∪ M2) ∪ M3 (M1 << M2) ⇔ (M1 ∪ M2 = M2) Bei einer Unifikation bleibt die Information gleich oder es wird Information hinzugefügt, niemals aber abgezogen. 5 Typisierte Merkmalsstrukturen • Unterscheidung von • Merkmalstyp als Index an der Merkmalsmatrix • !" #$ für die Zuordnung der erlaubten Merkmale (und deren Werten) zu den entsprechenden Typen • Beispiel: Typ %$&(' <=>@?ACB Merkmalsstrukturen vom Typ )+*, -/haben .$0 immer die Merkmale (Numerus) vom Typ 1243 und 5(6(7 (Person) vom Typ 89;: . D EHGJILKLM F NO B Zusammenfassung Unifikationsgrammatik • Komplexe Merkmalsstrukturen für lexikalische Elemente und grammatische Kategorien • Unifikation als Beschränkung für Konstituenten und deren Verknüpfung in PS-Regeln • Zur Erfassung linguistischer Phänomene wie – Kongruenz – Merkmalperkolation vom Kopf zur maximalen Projektion – Subkategorisierung Wichtige constraint-basierte Grammatikformalismen • LFG Lexikalisch-Funktionale Grammatik (Bresnan, Kaplan) • HPSG Head-oriented PSG (Pollard, Sag) • FUG Funktionale Unifikationsgrammatik (Kay) • PATR-II „Parsing and Translation“ (Shieber) • GPSG Generalisierte PSG (Gazdar et al.) • DCG Definite Clause Grammar (Colmerauer, Pereira/Warren) Vorträge Zur Vorbereitung für die Vorträge und als Einführung für die verschiedenen Theorien: Sells, Peter. P4Q RTS UV Q WXYR XYCS Q Z+[XV \;V ]W ]CYCS \;RTS ^ R(S _;Q XV ^ Q W `\Y ^ YCS V XaURTS ^ XYS XLb4Xc Q V YZQ YCS d e^ Ya;^ Y bFS _;Q XV ]Cf b+Q Y;Q V \;g ^ h Q a[_V \W Q W S V URTS UV Qb+V \Z(Z\;V fT\Yag Q i;^ R \;g d jUTY;RTS ^ XTY\;g b+V \Z(Z\;V k Stanford, Californien: CSLI, 1985. Allgemein u.a.: http://www.fb10.uni-bremen.de/linguistik/khwagner/theorie/literatur.htm Weitere Literatur und Links auf den Seiten zum Seminar Vorträge • Entscheidung für eine Grammatiktheorie (spätestens bis Weihnachten) • Mindestens ein linguistisches Phänomen (deutsch oder englisch) mit dem Instrumentarium der gewählten Theorie analysieren und diese Analyse (idealerweise in Auseinandersetzung mit anderen Theorien) vorstellen 6