Funktionale Unifikations-Grammatik (FUG) Hauptmerkmale der FUG Funktionale Unifikationsgrammatik Die Functional Unification Grammar (FUG) ist ein von Martin Kay seit 1979 entwickelter Grammatikformalismus der Generativen Grammatik und das erste Modell der Familie der Unifikationsgrammatiken im engeren Sinn (Unifikation von Merkmalstrukturen). Auch die Regeln der FUG sind Merkmalstrukturen. Die FUG war die Grundlage zahlreicher experimenteller Sprachverarbeitunssystem. Funktionale Unifikationsgrammatik Vorrang der funktionalen Aspekte der Sprache (kommunikative Funktion) gegenüber logischen Aspekten Sprachstrukturen werden primär auf der Grundlage der Funktionen beschrieben, die Teile in einem Ganzen haben: grammatische Funktionen (Subjekt, Objekt, Attribut) semantische Funktionen (Agens, Patiens, Source, Goal) rhetorische Funktionen (Thema, Rhema, Fokus) Merkmalstrukturen sind (partielle) Funktionen in einem mathematischen Sinn Funktionale Beschreibungen Sprachliche Ausdrücke werden durch funktionale Beschreibungen oder Deskriptionen (engl. functional descriptions, FD) beschrieben Eine einfache funktionale Deskription besteht aus einer Menge von Deskriptoren (engl. descriptor) Ein Deskriptor kann sein eine Konstituentenmenge (engl. constituent set, C-set) ein Strukturmuster (engl. pattern) ein Merkmal, d.h. ein Attribut-Wert-Paar Attribute und Werte CAT SUBJ DOBJ VERB TENSE VOICE =PRON CAT GENDER =MASC = CASE =NOM NUMBER =SING PERSON =3 =PRON CAT GENDER =FEM = CASE =ACC NUMBER =SING PERSON =3 =SEE =PAST =ACTIVE =S CAT SUBJ DOBJ VERB TENSE VOICE =PRON CAT GENDER =FEM = CASE =NOM NUMBER =SING PERSON =3 =PRON CAT GENDER =MASC = CASE =ACC NUMBER =SING PERSON =3 =SEE =PAST =PASSIVE =S Grammatische vs. Semantische Funktionen CAT SUBJ DOBJ VERB TENSE VOICE =PRON CAT GENDER =MASC = CASE =NOM NUMBER =SING PERSON =3 =PRON CAT GENDER =FEM = CASE =ACC NUMBER =SING PERSON =3 =SEE =PAST =ACTIVE =S CAT PROT GOAL VERB TENSE = PRON CAT GENDER = MASC = NUMBER = SING PERSON = 3 = PRON CAT GENDER = FEM = NUMBER = SING PERSON = 3 =SEE =PAST =S Unifikation kompatibler FDD CAT SUBJ = PROT DOBJ = GOAL VERB TENSE VOICE = PRON CAT GENDER = MASC = CASE = NOM NUMBER = SING PERSON = 3 = PRON CAT GENDER = FEM = CASE = ACC NUMBER = SING PERSON =3 = SEE = PAST = ACTIVE =S Alternation inkompatibler FDD CAT GENDER CASE NUMBER PERSON CAT GENDER CASE NUMBER PERSON = PRON = MASC = NOM = SING =3 = PRON = FEM = ACC = SING =3 CAT GENDER CASE NUMBER PERSON CAT GENDER CASE NUMBER PERSON = PRON = MASC = NOM = SING =3 = PRON = FEM = ACC = SING =3 Strukturelle Ambiguität He likes writing books CAT SUBJ DOBJ VERB TENSE VOICE = he = NP CAT HEAD = books = CAT = PRESP MOD = LEX = WRITE = LIKE = PRES = ACTIVE =S CAT SUBJ DOBJ VERB TENSE VOICE =S = he = NP CAT =S CAT VERB = CAT = PRESP = LEX = WRITE HEAD = = NP CAT DOBJ = HEAD = books = LIKE = PRES = ACTIVE Vereinigung inkompatibler FDD Inkompatible einfache FDD F1, ..., Fk können zu einer einzigen komplexen FD {F1, ..., Fk } vereinigt werden, welche die Vereinigung der Objektmengen beschreibt, die durch ihre Komponenten beschrieben werden. Diese Notation erlaubt es, gemeinsame Komponenten in üblicher Weise auszuklammern und so große Klassen disparater Objekte in kompakter Weise zu beschreiben. Vereinigung inkompatibler FDD CAT SUBJ DOBJ VERB TENSE VOICE =S = he CAT = NP HEAD = books CAT = PRESP MOD = LEX = WRITE = =S CAT VERB = CAT = PRESP LEX = WRITE HEAD = = NP CAT DOBJ = HEAD = books = LIKE = PRES = ACTIVE Pfade Eine Folge von Attributen (dargestellt von Atomen) in Spitzklammern bildet einen Pfad: DOBJ HEAD VERB CAT Für jeden Wert in einer FD gibt es wenigsten einen Pfad durch den er identifiziert wird, z.B. für den Wert books: DOBJ HEAD DOBJ HEAD Der Pfad a1, a2, ..., ak identifiziert den Wert des Attributs ak in der FD, die den Wert des Pfades a1, a2, ..., ak-1 darstellt. Es kann gelesen werden als das ak des ak-1,... des a1. Gleichheit vs. Identität von FDD In der FUG werden Pfade auch in FDD verwendet, z.B. um auszudrücken, dass Attribute identische Werte haben. Es ist wichtig, zwischen der Identität und der Gleichheit von Werten zu unterscheiden. Mit dem Ausdruck [A = B = X] wird ausgedrückt, dass die Attribute A und B den identischen Wert X haben. A und B sind hier sozusagen verschiedene Namen für dasselbe Objekt. Würde der Informationsgehalt für X geändert, würden sich dadurch gleichzeitig A und B ändern. Verwendung von Pfaden in FDD A = X B = X Hier wird nur die "Gleichheit" von Werten ausgedrückt A = X B = A Durch den Pfad <A> wird die "Identität" der Werte von A und B ausgedrückt A = B = C X A = B = X C = A B Merkmale Ein Paar, das aus einem Pfad in einer FD und einem Wert besteht, zu dem der Pfad führt, ist ein Merkmal (engl. feature) des beschriebenen Objektes. Ist der Wert ein Symbol (Atom), ist das Paar ein Basismerkmal (engl. basic feature) der FD. Jede FD kann als eine Liste von Basismerkmalen dargestellt werden. Dadurch wird allerdings der Unterschied zwischen Merkmalen und Strukturen verwischt. Merkmale und Strukturen He had seen her CAT SUBJ = PROT DOBJ = GOAL VERB TENSE VOICE ASPECT = PRON CAT GENDER = MASC = CASE = NOM NUMBER = SING PERSON = 3 = PRON CAT GENDER = FEM = CASE = ACC NUMBER = SING PERSON =3 = VERB CAT = WORD = SEE = PAST = ACTIVE = + PERFECT = PROGRESSIVE = =S Merkmallisten CAT S SUBJ CAT PRON SUBJ GENDER MASC PROT NUMBER SING PROT PERSON 3 OBJ CAT PRON SUBJ CASE NOM OBJ GENDER FEM SUBJ NUMBER SING OBJ CASE ACC SUBJ PERSON 3 PROT CAT PRON PROT GENDER MASC PROT CASE NOM GOAL CASE FEM GOAL NUMBER SING GOAL PERSON 3 VERB CAT VERB VERB WORD SEE OBJ NUMBER SING TENSE PAST OBJ PERSON 3 VOICE ACTIVE GOAL CAT PRON GOAL GENDER FEM ASPECT PERFECT ASPECT PROGRESSIVE Unifikation Wenn zwei oder mehr einfache FDD kompatibel sind, können sie zu einer einfachen FD kombiniert werden, welche die Dinge beschreibt, die welche die Ausgangs-FDD beschreiben. Dieser Prozess heißt Unifikation. In der FUG ist "=" das Zeichen für die Unifikation. Der Ausdruck bezeichnet also das Ergebnis der Unifikation von und Unifikation einfacher FDD = VERB CAT = VERB CAT LEX NUM = SING = RUN TENSE = PRES PERS = 3 CAT LEX TENSE NUM PERS = VERB CAT = VERB CAT LEX TENSE = PAST = RUN TENSE = PRES PERS =3 NIL = VERB = RUN = PRES = SING =3 Unifikation einfacher FDD = PP CAT PREP = MIT CAT = NP CASE = DAT HEAD = CASE = CASE CAT PREP CASE HEAD = DAT = NP CAT = CASE = CASE = PP = MIT Unifikation komplexer FDD TENSE FORM TENSE FORM = PRES = is = VERB CAT TENSE = PAST = PAST = was = VERB CAT TENSE = PAST FORM = was Constituent-sets und Patterns C-set Pattern CAT SUBJ = PROT SUBJ = GOAL VERB TENSE VOICE ASPECT = (SUBJ VERB OBJ) =S = PRON CAT GENDER = MASC = CASE = NOM NUMBER = SING PERSON = 3 = PRON CAT GENDER = MASC = CASE = NOM NUMBER = SING PERSON = 3 CAT = VERB = WORD = SEE = PAST = ACTIVE = + PERFECT = PROGRESSIVE = = (SUBJ VERB OBJ) FDD und Syntaxregeln Pattern = (SUBJ VERB ...) CAT = S SUBJ = CAT = NP SCOMP = NONE Pattern = (... SCOMP) SCOMP = CAT = S CAT = NP CAT = VERB S NP VERB (S)