Folien

Werbung
Inhalt der Vorlesung
Grammatiktheorien
Teil 5
Theoriebildung
Grammatikformalismen (1)
•
•
•
•
•
Begriffsklärung
Historisches zur Grammatik(-theorie)
Grammatikmodelle
Grundbegriffe der syntaktischen Analyse
– Überblick
– Anwendungen
Sprachtheorie
Grammatiktheorie
• System von Hypothesen zur Erklärung der
verschiedensten natürlichsprachlichen Phänomene
• Anspruch auf
• Theorie über die Charakteristika von
Grammatiken
• Gerüst von Hypothesen und Teiltheorien
über die Art und Organisation der Elemente
von Grammatik(en)
• Zentraler Bestandteil einer allgemeinen
Sprachtheorie
•
!#"$!
% universelle Eigenschaften
(& '*)(+-,.0/12 .03 der Sprachtheorie
– 465-789897;: < =: >$?
@5-< ?
– Spracherwerbstheorie
– Sprachveränderungstheorie
– Sprachverwendungstheorie
Theorie und Hypothese
•
ACBDEFG D
Eine Theorie ist ein System von Hypothesen oder eine
Menge von solchen Systemen, die zur Erklärung
bestimmter Phänomenbereiche entwickelt werden.
•
HJI(KL$M-NO0PO
Eine Hypothese ist eine empirische Verallgemeinerung
über einer Menge von Beobachtungsdaten.
Phasen der Theoriebildung
1. Sammlung und Beschreibung von
empirischen Daten
2. Hypothesenbildung
3. Theoriebildung
4. Überprüfung
1
Ziel der Theoriebildung: Erklärung
Ein Phänomen oder Datum kann erklärt werden …
– …durch die Benennung anderer Daten, die als Ursache,
Veranlassung, Symptom oder Disposition für das erste Datum
gelten können.
– … dadurch, dass ein allgemeiner struktureller und funktionaler
Zusammenhang von Daten genannt wird, aus dem logisch
gefolgert oder wenigstens plausibel gemacht werden kann, dass
dieses Datum (notwendig) so ist, wie es ist.
Diese Art von Erklärungen entspricht weitgehend jenen in
den Wissenschaften verfolgten Erklärungen.
Linguistik als Wissenschaft
Q
Theoriebildung Phase 1 - Beispiel
•
•
• Bestimmte Phänomene (Daten) werden …
m
– …
– …
– …
n
RS
TVUW9W9S
X Y
Z[
\V]
^ _-` [Z[
a
b0c deVeVf g f hif jk#l
und
Datenerhebung
Korpusbildung/-erfassung
• Beispiel
o
Verbstellung im Deutschen
Sammlung von Haupt- und Nebensätzen
Theoriebildung Phase 2
pq r#s0{;|-t} ~u(q~ vw€ 
vw‚ ƒ } „x y…-ƒ t†z ‡#†#ˆ ƒ †Š‰# ‡;‹#Œ-VŽŒ#
#{;ƒ †#(} „-} -‚0~ ‘$} ƒ  „ ’
“(-~i‡;‚ ”#†-ƒ$•‚ Œ#– ŒV…
} 
 } ƒ -„ …
} ƒi—(VŽƒ € -~  |V† ‡’
˜(ƒ } -…-ƒ ‚™ ƒ š #†„V†
} € „ ~› ƒ ‚ ‡;} ~ ~ „ ‹V
ƒ }œ„ ƒ ‚-žƒ (Œ-‚ Ÿ;’
€ 
 ¡ š ~ „ “(|(~ € -Œ#†;¢
£9¤0¥ ¦§¨0©(ª#«¬­
• Bildung von »J¼ž½¾¿
ÀÁÂ0ÁÃ auf Grundlage der
klassifizierten Beobachtungsdaten
• ÄCÅÆ Ç0ÈÆ ÅÉ
®°¯ ±²²³ ´V³ µ³ ¶0·¸¹º
Die Hypothesen stehen in dieser Phase noch
zusammenhanglos nebeneinander
In den Sätzen taucht an irgendeiner Stelle ein Verb auf.
Manchmal steht das Verb weiter vorne im Satz,
manchmal ganz am Schluss.
•
Theoriebildung Phase 1
Unterteilung in Haupt- und Nebensätze
Theoriebildung Phase 3
• Erkennen eines Zusammenhangs zwischen
den Hypothesen
• Formulierung allgemeiner Prinzipien zur
Erläuterung der Beziehungen zwischen den
Hypothesen
• Allgemeine Prinzipien als theoretische
Konstrukte
Hypothesen zur Verbstellung
H1: Im deutschen Hauptsatz folgt das Verb auf die
erste Konstituente (Ausnahme: Ja/Nein-Frage).
H2: Im Nebensatz steht das Verb an letzter Stelle.
Theoriebildung Phase 3 - Beispiel
• Zusammenhang
Die Verbstellung unterscheidet sich je nach Satzart.
Nebensätze werden durch subordinierende
Konjunktionen eingeleitet. Das Verb steht hier nicht an
zweiter Position, sondern ganz hinten.
• Erklärung
Die Struktur des deutschen Satzes lässt sich mithilfe des
topologischen Feldermodells erfassen.
Die linke Satzklammer ist im Hauptsatz durch das finite
Verb besetzt. Im Nebensatz steht hier die subordinierende Konjunktion. Deshalb muss das Verb in
seiner Ausgangsposition bleiben.
2
Theoriebildung Phase 4
ÊËÌ ÍÎ Ï#Î Ð$Î ÑÒÓÔÕ
• Die Überprüfung der Theorie durch
anhand von Beispielen, die …
• … nicht durch die Theorie erklärt werden können
• … im Widerspruch zu den Vorhersagen der Theorie stehen
• Eine Theorie ist gültig, solange sie nicht
falsifiziert worden ist.
• Wenn auch scheinbare Gegenbeispiele durch die
allgemeinen Prinzipien der Theorie erfasst werden
können, aber der ursprünglichen Hypothese
widersprechen, ist nur die Hypothese, nicht aber
die Theorie falsifiziert.
Theoriebildung Phase 4 - Beispiel
Ö(×Ø ÙVÚÛÚ0ÜÛ0Ý
×;Ü ÝÞ0Ø ß-Û0Ü;àÝ#Ù#ß-Û0á Ú âÝ-Þ ã
• Falsifizierung
• In diesem Hauptsatz steht das Verb am Schluss.
• Erklärung: Die linke Satzklammer ist die Position
für das finite Verb, in diesem Fall das Hilfsverb.
Nicht-finite Verben und Verbteile stehen in der
rechten Satzklammer.
ä*å(æçèé êë ì(íîç0ï#è0å#ë ï-èð;ñ$ò;ð;çò ó ô
Negative Evidenz
• Zur Verifizierung von Hypothesen müssen
Beispiele konstruiert werden, die nach den
Vorhersagen der Theorie nicht erlaubt sind.
• Diese müssen von kompetenten Sprechern
ungrammatisch beurteilt werden.
õ alsAuch
ein Sprecher, dessen Urteile nicht
den Vorhersagen der Theorie entsprechen,
ist kompetent!
Negative Evidenz - Beispiel
• Sätze mit unbesetzter linker Satzklammer
sind ungrammatisch:
ö#÷îøù úûüý;þÿûþý;þ û ÿÿ(ýúù ý0ý;þ
û
• Die Satzklammer kann nicht durch
Konjunktion und Verb besetzt sein:
!
"!#!$"%
Beschränkungsbasierte
Grammatikformalismen
• Engl. &(')*+ ,-/. )+ 021-*3465',78-9 . *78*
• Auch:
unifikationsbasiert
:
Unifikationsgrammatik
• Merkmalsstrukturen zur Repräsentation
detaillierter Informationen über morphologische,
syntaktische und semantische Merkmale
;
Verarbeitung kontextfreier Grammatiken
• Effiziente Verarbeitung der Semantik
syntaktischer Repräsentationen
Beschränkungen
Die Verknüpfung von Phrasen zu größeren Einheiten
ist nicht ohne Einschränkung möglich
– Kongruenz zwischen Adjektivattribut und Nomen
<=?>A@B C D6E
FG HIJ K LM N OQPARTSTSVU W XY Z[ S\] ^ _` a bQcAdTefe
–
–
–
–
Kongruenz zwischen Artikel und NP
Kongruenz zwischen Subjekt und Verb
Kasusrektion des Objekts durch das Verb
Etc.
3
Kodierung der Beschränkungen
Kodierung der Beschränkungen (2)
• Durch Regeln, die mit erweiterten grammatischen
Kategorien arbeiten und so explizit morphologische Merkmale erfassen
g2h ij klTh m2j no?prq2s tu vwfs x2u yz { |}q2s tu vwfs x2u ~
q € u vwTs xTu ~|?r‚ ƒ„ … †‡fˆ ‰T… Š‹ Œ }‚ ƒ„ … †‡fˆ ‰T… Ž
‚2ˆ …T‘ †… Ž?’r“2” •–—T˜ ™/– š› œ }“2” •–—2˜ ™/– ž
Ÿ
¡
¢
£
• Durch Regeln, die mit allgemeiner
gehaltenen Beschränkungen arbeiten
• Beispiel
Regel:
Beschränkung:
¥§¦/¨©ª« ¬ ­ ®A­ ¯f°T­
sehr große Menge grammatischer Kategorien
sehr viele und redundante Grammatikregeln
Kopplung von struktureller Information mit Informationen
über Kongruenz und Abhängigkeiten
schlechte Wartbarkeit, Verständlichkeit,…
Merkmalsstrukturen
• Merkmalsstrukturen
• Unifikation
Darstellung von Merkmalsstrukturen
• Auch Attribut-Wert-Terme,
engl. ±²³´ µ¶²A·´ ¶µ¸´ µ¶²·
• Menge von Merkmal-Wert-Paaren
• ÈÉQÉQÊË Ì(Í(ÉQÎ ÏÑÐÊÉQÎQÒÔÓ6ÉQÊË Õ
Cat: NP
Pers: 3
Num: pl
¹ º¼Q½¾À¿Á : nicht weiter teilbares Symbol aus einer
– »
finiten Menge solcher Symbole
• cat (Kategorie), pers (Person), num (Numerus), gen (Genus),
agr (Agreeement), …
– ÂÄÃÅTÆ : atomare Symbole oder Merkmalsstrukturen
Ç
NP ¤ AdjP N
Agr N = Agr AdjP
• NP, 3, pl, fem, {cat: NP, pers: 3, num: pl}, …
cat:
agr:
NP
pers: 3
num: pl
• ÖØ× Ù6ÚÛÚÛÜÝÞàßQÝá(â(ßá(Ý
{cat: NP, pers: 3, num: pl}
Merkmalsstrukturen beliebiger Komplexität
Elementare und komplexe
Merkmalsstrukturen
Darstellung von Merkmalsstrukturen (2)
í î ïQðÀïQñò óàôfï
• 6
Merkmalsstrukturen
• ãØäåæ çè(éQäéQäåêãØåë6ì(è
VP
Der Wert des Attributs ist atomar
cat:
finite
head:
Cat:
Pers:
Num:
pl
form:
number:
subj:
NP
3
pl
õ ö÷8øù úQûú
• A
Merkmalsstruktur
Der Wert des Attributs ist selbst
eine Merkmalsstruktur
cat:
agr:
NP
pers:
3
num: pl
Ein üý þfÿ in einer Merkmalsstruktur ist eine Folge von Merkmalen,
die in der Merkmalsstruktur unmittelbar aufeinander folgen.
agr:
person:
3
ist die Merkmalsstruktur am Ende des
Der
Pfades.
4
Reentranz
Reentranz – Beispiel
• Eine Merkmalsstruktur heißt , wenn
zwei Merkmale in der Struktur einen
gemeinsamen Wert aufweisen, d.h. zwei
Merkmale !" #%$&' #(&'*)+,-#.#-/, .
• Auch: 0132/45768 9#45708 :;< , =/>?@A@?@B7C
• Kennzeichnung/Wiedergabe durch einen Index
(DEF3GH
• Z.B. bei Subjekt-Verb-Kongruenz
Subjekt-Verb-Kongruenz: IKJML NOPNQRMSTL U V
AGR 1
d
z
|
Reentranz darf nicht mit Wertgleichheit
verwechselt werden!
w
x
y
•
}K~# € /‚3ƒ` „3~
ist eine Operation, die den Informationsgehalt zweier
Merkmalsstrukturen miteinander kombiniert, sofern
beide miteinander
sind.
•
K– ‘`— ’ “#’ ”’ •3“ :
, ˜š™ und ›œ
{
• Scheitern der Unifikation bei ¸ ¹#º/»3¼'½#¾3¿¸ À#Á ¹
Merkmalsstrukturen:
[num: pl]
• Die
Merkmalsstruktur ist das Ã#ÄÅ7ÆÇÈÉ Ä
Ê É ÄË'leere
ÄÃ7Æ der Unifikation
• Eigenschaften
–
Ì`ÍÎÏ*ÐÑÓÒ ÎÔÕ
M1 ∪ M1 = M1
–
Ö°×Ø*ØlÙÚ ÛÚ Ü ÝÞßà`ßÚ á
M1 ∪ M2 = M2 ∪ M1
…†‡*ˆ‰Š ‹ ŒŽ
žšŸ ist genau
¢£ ¤š¥ ¦g§ ∪ ¨š© ),
seien Merkmalsstrukturen.
dann Unifikation von
und
( =
wenn
•
•
ª%«
%± ²
¬*­
¡
®°¯
´lµ ¶%·
von
und
subsumiert wird und
alle anderen Merkmalsstrukturen subsumiert, die
und
subsumiert werden.
ebenfalls von
Unifikation (2)
[num: sg]
PHON
AGR 1
Unifikation
• Merkmalsstrukturen können nach ihrem Wert geordnet
werden.
• Eine Merkmalsstruktur
eine
Merkmalsstruktur
⊆ , wenn der Informationsgehalt
von kleiner oder gleich ist verglichen mit .
• Ist der Informationsgehalt einer Merkmalsstruktur
kleiner/gleich gegenüber dem einer Merkmalsstruktur , so
ist die Zahl der durch charakterisierten Objekte
größer/gleich als der durch charakterisierten Objekte.
•
Subsumption wird oft auch genau umgekehrt definiert.
v
NUM sg
PER 3
\ ] ^`_ a b c
PRED
Subsumption
egf`h3if`h3jlk mno
p q s tu
r
WX YZ [
PHON
SUBJ
³
Unifikation (3)
• Weitere Eigenschaften
–
âKããäåçæ è3éæ ê+ë3ìãìé å
–
í7î/ï#ðî/ñóò7ôõ ö3÷#ðøùðùô ú
–
ûýü3þ/üçÿüþ M1 ∪ (M2 ∪ M3) = (M1 ∪ M2) ∪ M3
(M1 << M2) ⇔ (M1 ∪ M2 = M2)
Bei einer Unifikation bleibt die Information gleich
oder es wird Information hinzugefügt, niemals aber
abgezogen.
5
Typisierte Merkmalsstrukturen
• Unterscheidung von • Merkmalstyp als Index an der Merkmalsmatrix
• !" #$ für die Zuordnung der erlaubten
Merkmale (und deren Werten) zu den
entsprechenden Typen
• Beispiel: Typ %$&('
<=>@?ACB
Merkmalsstrukturen vom Typ )+*,
-/haben
.$0 immer die Merkmale
(Numerus) vom Typ 1243
und 5(6(7 (Person) vom Typ 89;: .
D EHGJILKLM
F
NO B
Zusammenfassung
Unifikationsgrammatik
• Komplexe Merkmalsstrukturen für lexikalische
Elemente und grammatische Kategorien
• Unifikation als Beschränkung für Konstituenten
und deren Verknüpfung in PS-Regeln
• Zur Erfassung linguistischer Phänomene wie
– Kongruenz
– Merkmalperkolation vom Kopf zur maximalen
Projektion
– Subkategorisierung
Wichtige constraint-basierte
Grammatikformalismen
• LFG Lexikalisch-Funktionale Grammatik
(Bresnan, Kaplan)
• HPSG Head-oriented PSG (Pollard, Sag)
• FUG Funktionale Unifikationsgrammatik (Kay)
• PATR-II „Parsing and Translation“ (Shieber)
• GPSG Generalisierte PSG (Gazdar et al.)
• DCG Definite Clause Grammar (Colmerauer,
Pereira/Warren)
Vorträge
Zur Vorbereitung für die Vorträge und als
Einführung für die verschiedenen Theorien:
Sells, Peter. P4Q
RTS UV Q WXYR XYCS Q Z+[XV \;V ]W ]CYCS \;RTS ^ R(S _;Q XV ^ Q W `\Y
^ YCS V XaURTS ^ XYS XLb4Xc Q V YZQ YCS d e^ Ya;^ Y bFS _;Q XV ]Cf b+Q Y;Q V \;g ^ h Q a[_V \W Q
W S V URTS UV Qb+V \Z(Z\;V fT\Yag Q i;^ R \;g d jUTY;RTS ^ XTY\;g b+V \Z(Z\;V k Stanford,
Californien: CSLI, 1985.
Allgemein u.a.:
http://www.fb10.uni-bremen.de/linguistik/khwagner/theorie/literatur.htm
Weitere Literatur und Links auf den Seiten zum Seminar
Vorträge
• Entscheidung für eine Grammatiktheorie
(spätestens bis Weihnachten)
• Mindestens ein linguistisches Phänomen
(deutsch oder englisch) mit dem
Instrumentarium der gewählten Theorie
analysieren und diese Analyse (idealerweise
in Auseinandersetzung mit anderen
Theorien) vorstellen
6
Herunterladen