Funktionale Unifikations-Grammatik (FUG)
Hauptmerkmale der FUG
Funktionale Unifikationsgrammatik
Die Functional Unification Grammar (FUG) ist ein von Martin
Kay seit 1979 entwickelter Grammatikformalismus der
Generativen Grammatik und das erste Modell der Familie
der Unifikationsgrammatiken im engeren Sinn (Unifikation
von Merkmalstrukturen).
Auch die Regeln der FUG sind Merkmalstrukturen.
Die FUG war die Grundlage zahlreicher experimenteller
Sprachverarbeitunssystem.
Funktionale Unifikationsgrammatik
Vorrang der funktionalen Aspekte der Sprache
(kommunikative Funktion) gegenüber logischen Aspekten
Sprachstrukturen werden primär auf der Grundlage der
Funktionen beschrieben, die Teile in einem Ganzen haben:
grammatische Funktionen (Subjekt, Objekt, Attribut)
semantische Funktionen (Agens, Patiens, Source, Goal)
rhetorische Funktionen (Thema, Rhema, Fokus)
Merkmalstrukturen sind (partielle) Funktionen in einem
mathematischen Sinn
Funktionale Beschreibungen
Sprachliche Ausdrücke werden durch funktionale
Beschreibungen oder Deskriptionen (engl. functional
descriptions, FD) beschrieben
Eine einfache funktionale Deskription besteht aus einer
Menge von Deskriptoren (engl. descriptor)
Ein Deskriptor kann sein
eine Konstituentenmenge (engl. constituent set, C-set)
ein Strukturmuster (engl. pattern)
ein Merkmal, d.h. ein Attribut-Wert-Paar
Attribute und Werte
CAT
SUBJ
DOBJ
VERB
TENSE
VOICE
=PRON
CAT
GENDER =MASC
= CASE
=NOM
NUMBER
=SING
PERSON =3
=PRON
CAT
GENDER =FEM
= CASE
=ACC
NUMBER
=SING
PERSON =3
=SEE
=PAST
=ACTIVE
=S
CAT
SUBJ
DOBJ
VERB
TENSE
VOICE
=PRON
CAT
GENDER =FEM
= CASE
=NOM
NUMBER
=SING
PERSON =3
=PRON
CAT
GENDER =MASC
= CASE
=ACC
NUMBER
=SING
PERSON =3
=SEE
=PAST
=PASSIVE
=S
Grammatische vs. Semantische Funktionen
CAT
SUBJ
DOBJ
VERB
TENSE
VOICE
=PRON
CAT
GENDER =MASC
= CASE
=NOM
NUMBER
=SING
PERSON =3
=PRON
CAT
GENDER =FEM
= CASE
=ACC
NUMBER
=SING
PERSON =3
=SEE
=PAST
=ACTIVE
=S
CAT
PROT
GOAL
VERB
TENSE
= PRON
CAT
GENDER = MASC
=
NUMBER = SING
PERSON = 3
= PRON
CAT
GENDER = FEM
=
NUMBER = SING
PERSON
=
3
=SEE
=PAST
=S
Unifikation kompatibler FDD
CAT
SUBJ = PROT
DOBJ = GOAL
VERB
TENSE
VOICE
= PRON
CAT
GENDER = MASC
= CASE
= NOM
NUMBER
=
SING
PERSON = 3
= PRON
CAT
GENDER = FEM
= CASE
= ACC
NUMBER
=
SING
PERSON =3
= SEE
= PAST
= ACTIVE
=S
Alternation inkompatibler FDD
CAT
GENDER
CASE
NUMBER
PERSON
CAT
GENDER
CASE
NUMBER
PERSON
= PRON
= MASC
= NOM
= SING
=3
= PRON
= FEM
= ACC
= SING
=3
CAT
GENDER
CASE
NUMBER
PERSON
CAT
GENDER
CASE
NUMBER
PERSON
= PRON
= MASC
= NOM
= SING
=3
= PRON
= FEM
= ACC
= SING
=3
Strukturelle Ambiguität
He likes writing books
CAT
SUBJ
DOBJ
VERB
TENSE
VOICE
= he
= NP
CAT
HEAD = books
=
CAT = PRESP
MOD =
LEX
=
WRITE
= LIKE
= PRES
= ACTIVE
=S
CAT
SUBJ
DOBJ
VERB
TENSE
VOICE
=S
= he
= NP
CAT
=S
CAT
VERB = CAT = PRESP
=
LEX = WRITE
HEAD =
= NP
CAT
DOBJ
=
HEAD
=
books
= LIKE
= PRES
= ACTIVE
Vereinigung inkompatibler FDD
Inkompatible einfache FDD F1, ..., Fk können zu einer
einzigen komplexen FD {F1, ..., Fk } vereinigt werden, welche
die Vereinigung der Objektmengen beschreibt, die durch ihre
Komponenten beschrieben werden.
Diese Notation erlaubt es, gemeinsame Komponenten in
üblicher Weise auszuklammern und so große Klassen
disparater Objekte in kompakter Weise zu beschreiben.
Vereinigung inkompatibler FDD
CAT
SUBJ
DOBJ
VERB
TENSE
VOICE
=S
= he
CAT = NP
HEAD = books
CAT
=
PRESP
MOD =
LEX = WRITE
=
=S
CAT
VERB = CAT = PRESP
LEX = WRITE
HEAD =
= NP
CAT
DOBJ
=
HEAD = books
= LIKE
= PRES
= ACTIVE
Pfade
Eine Folge von Attributen (dargestellt von Atomen) in
Spitzklammern bildet einen Pfad:
DOBJ HEAD VERB CAT
Für jeden Wert in einer FD gibt es wenigsten einen Pfad
durch den er identifiziert wird, z.B. für den Wert books:
DOBJ HEAD DOBJ HEAD
Der Pfad a1, a2, ..., ak identifiziert den Wert des Attributs ak
in der FD, die den Wert des Pfades a1, a2, ..., ak-1 darstellt. Es
kann gelesen werden als das ak des ak-1,... des a1.
Gleichheit vs. Identität von FDD
In der FUG werden Pfade auch in FDD verwendet, z.B.
um auszudrücken, dass Attribute identische Werte haben.
Es ist wichtig, zwischen der Identität und der Gleichheit
von Werten zu unterscheiden. Mit dem Ausdruck [A = B
= X] wird ausgedrückt, dass die Attribute A und B den
identischen Wert X haben. A und B sind hier sozusagen
verschiedene Namen für dasselbe Objekt. Würde der
Informationsgehalt für X geändert, würden sich dadurch
gleichzeitig A und B ändern.
Verwendung von Pfaden in FDD
A = X
B = X
Hier wird nur die "Gleichheit"
von Werten ausgedrückt
A = X
B = A
Durch den Pfad <A> wird die
"Identität" der Werte von A
und B ausgedrückt
A = B = C X
A = B = X
C
=
A
B
Merkmale
Ein Paar, das aus einem Pfad in einer FD und einem Wert
besteht, zu dem der Pfad führt, ist ein Merkmal (engl.
feature) des beschriebenen Objektes.
Ist der Wert ein Symbol (Atom), ist das Paar ein
Basismerkmal (engl. basic feature) der FD.
Jede FD kann als eine Liste von Basismerkmalen dargestellt
werden. Dadurch wird allerdings der Unterschied zwischen
Merkmalen und Strukturen verwischt.
Merkmale und Strukturen
He had seen her
CAT
SUBJ = PROT
DOBJ = GOAL
VERB
TENSE
VOICE
ASPECT
= PRON
CAT
GENDER = MASC
= CASE
= NOM
NUMBER = SING
PERSON = 3
= PRON
CAT
GENDER = FEM
= CASE
= ACC
NUMBER = SING
PERSON =3
= VERB
CAT
=
WORD = SEE
= PAST
= ACTIVE
= +
PERFECT
=
PROGRESSIVE =
=S
Merkmallisten
CAT S
SUBJ CAT PRON
SUBJ GENDER MASC
PROT NUMBER SING
PROT PERSON 3
OBJ CAT PRON
SUBJ CASE NOM
OBJ GENDER FEM
SUBJ NUMBER SING
OBJ CASE ACC
SUBJ PERSON 3
PROT CAT PRON
PROT GENDER MASC
PROT CASE NOM
GOAL CASE FEM
GOAL NUMBER SING
GOAL PERSON 3
VERB CAT VERB
VERB WORD SEE
OBJ NUMBER SING
TENSE PAST
OBJ PERSON 3
VOICE ACTIVE
GOAL CAT PRON
GOAL GENDER FEM
ASPECT PERFECT
ASPECT PROGRESSIVE
Unifikation
Wenn zwei oder mehr einfache FDD kompatibel sind,
können sie zu einer einfachen FD kombiniert werden,
welche die Dinge beschreibt, die welche die Ausgangs-FDD
beschreiben. Dieser Prozess heißt Unifikation.
In der FUG ist "=" das Zeichen für die Unifikation. Der
Ausdruck bezeichnet also das Ergebnis der Unifikation
von und
Unifikation einfacher FDD
= VERB CAT = VERB
CAT
LEX
NUM = SING
=
RUN
TENSE = PRES PERS = 3
CAT
LEX
TENSE
NUM
PERS
= VERB CAT
= VERB
CAT
LEX
TENSE = PAST
=
RUN
TENSE = PRES PERS
=3
NIL
= VERB
= RUN
= PRES
= SING
=3
Unifikation einfacher FDD
= PP
CAT
PREP = MIT
CAT
=
NP
CASE = DAT HEAD =
CASE = CASE
CAT
PREP
CASE
HEAD
= DAT
= NP
CAT
=
CASE
=
CASE
= PP
= MIT
Unifikation komplexer FDD
TENSE
FORM
TENSE
FORM
= PRES
= is
= VERB
CAT
TENSE
=
PAST
= PAST
= was
= VERB
CAT
TENSE = PAST
FORM = was
Constituent-sets und Patterns
C-set
Pattern
CAT
SUBJ = PROT
SUBJ = GOAL
VERB
TENSE
VOICE
ASPECT
= (SUBJ VERB OBJ)
=S
= PRON
CAT
GENDER = MASC
= CASE
= NOM
NUMBER = SING
PERSON = 3
= PRON
CAT
GENDER = MASC
= CASE
= NOM
NUMBER
=
SING
PERSON = 3
CAT
=
VERB
=
WORD = SEE
= PAST
= ACTIVE
= +
PERFECT
=
PROGRESSIVE =
= (SUBJ VERB OBJ)
FDD und Syntaxregeln
Pattern = (SUBJ VERB ...)
CAT
=
S
SUBJ = CAT = NP
SCOMP = NONE
Pattern = (... SCOMP)
SCOMP = CAT = S
CAT = NP
CAT = VERB
S NP VERB (S)