Grammatikentwicklung Frederik Fouvry, Stephan Oepen, Melanie Siegel Über dieses Seminar Ziele: Methoden: Einführung in die Grammatikentwicklungsumgebung LKB Grundlagen der Formalisierung von Grammatiken in getypten Featurestrukturen Tägliche Kurzeinführungen und dann Übungen Anpassen und Weiterentwickeln von einfachen HPSG Grammatiken in LKB Scheine: Übungsaufgaben lösen Eigene Implementierung eines Grammatikfragments mit Dokumentation Wofür braucht man Implementierungen von Grammatiken? Forschung: Formalisierung von linguistischen Theorien, komplexe Interaktionen von Sprachphänomenen, cross-linguale Generalisierungen Didaktik: Lehre von Theorien oder Analysen in formaler Morphologie, Syntax und Semantik. Experimente von StudentInnen. Anwendungen: Forschungsprototypen oder kommerzielle Anwendungen, z.B. Informationsextraktion, automatische emailBeantwortung, Grammar Checking,... LKB Grammatikentwicklungsumgebung für HPSG Grammatiken Mit Entwicklungshilfen zum Debuggen wie z.B. Chart Display, Vergleich von Feature Strukuren, Baum-Display, TypenhierarchieDisplay. Läuft mit Lisp. Anbindung an Evaluationstool [incr tsdb()] zum Testen größerer Datenmengen. Grammatikregeln Zum Beispiel head-specifier-rule: phrase HEAD SPR 0 < > 1 , H phrase HEAD SPR Head-specifier-rule := phrase & [HEAD #0, SPR < >, ARGS < phrase & #1 & [SPR < >], phrase & [HEAD #0, SPR < #1 >] >]. 0 <1 > Lexikoneinträge Zum Beispiel „lacht“: Feature-Struktur: word ORTH „lacht“ HEAD verb SPR < [HEAD noun] > COMPS < > Eintrag im Lexikon: lacht := word & [ORTH „lacht“ HEAD verb, SPR < [HEAD noun] >, COMPS < >]. Typen - Motivation Warum Klassifikation in Typen? Vermeidung von unsinnigen FeatureSpezifikationen, z.B. Kasus bei Verben Möglichkeit, Restriktionen für ganze Typen von Elementen anzugeben. Hierarchische Anordnung erlaubt Generalisierungen und vermindert Redundanzen (und damit auch Fehler). Typen - Beispiel feat-struc := *top*. syn-struc := feat-struc & feat-struc [ HEAD pos, SPR *list*, syn-struc COMPS *list* ]. pos pos := feat-struc. noun := pos. verb := pos. phrase word noun verb det det := pos. phrase := syn-struc & [ ARGS *list* ]. word := syn-struc & root [ ORTH string ]. root := phrase & [ HEAD verb, SPR < >, COMPS < > ]. Unifikation: Kombination von Information, Sicherung von Kompatibilität TFS1: FOO a BAR x x TFS2: FOO a BAR FOO BAR b BAZ y x x TFS4: FOO 1 x a BAR 1 TFS3: TFS1 π TFS2 TFS2 ; x y TFS1 π TFS3 TFS3 ;TFS3 π TFS4 FOO BAR x b BAZ y a FOO 1 y BAR 1 x b BAZ Subkategorisierung und Kongruenz Die COMPS und SPR Features eines lexikalischen Items spezifizieren eine Liste von subkategorisierten FeatureStrukturen und Kongruenzrestriktionen für diese Strukturen. Die head-complement und head-specifier Regeln spezifizieren, wie Bäume zusammengesetzt werden. Listen: COMPS < phrase > COMPS < phrase, phrase > COMPS [ne-list FIRST phrase, REST *null* ]. COMPS [ne-list FIRST phrase, REST [FIRST phrase, REST *null* ]]. Literatur usw. On-Line User-Manual für LKB: Kursmaterialien: Literatur: http://www-csli.stanford.edu/~aac/lkb.html http://www.coli.uni-sb.de/~fouvry/grammatikentwicklung Kommt im Sommer für einen Vortrag! Sag, Ivan A. And Thomas Wasow (1999). Syntactic Theory. A Formal Introduction. Stanford, CA: CSLI Publications. Ann A. Copestake (2002). An Introduction to Grammar Engineering in the LKB. Stanford, CA: CSLI Publications. LinGO project at CSLI Stanford: http://lingo.stanford.edu