Aufgabenblatt 1 Syntax Universität München, CIS, SS 2009 H.Leiß, J.Robeischl, CIS, Universität München Abgabetermin: Mi, 6.5.2009 Aufgabe 1.1 Nehmen sie sich eine Grammatik des Deutschen (z.B. eine der auf den Folien genannten) und geben Sie wieder, welche Wortarten sie für das Deutsche angibt, jeweils mit den Formdimensionen. Vergleichen Sie, welche der Wortarten in der Klassifizierung von Dionysos Thrax vorkamen und welche nicht. (5 Punkte) Aufgabe 1.2 In dieser und den folgenden Aufgaben sollen Sie überlegen, ob und wie man den Begriff der Distribution von Wortformen anpassen könnte, um zu einem Distributionsbegriff für Wörter und Wortarten zu kommen. Wichtig für das strukturalistische Verständnis von Wortarten ist die Annahme, dass für je zwei Wörter (nicht: Wortformen) derselben Wortart gelten soll, dass sie distributiv äquivalent sind. Legt man folgende Definitionen Def. 1: Die Distribution eines Wortes w liegt in der Distribution eines Wortes w′ , gdw im Kontext eines beliebigen Satzes s, jede in s vorkommende Wortform von w durch eine Wortform von w′ ersetzt werden kann, wobei die durch die Ersetzung entstehende Wortfolge s′ wieder ein Satz ist. Def. 2: Ein Wort w ist distributiv äquivalent zu einem Wort w′ , wenn die Distribution von w in der von w′ und die Distribution von w′ in der von w liegt. zu Grunde, so ist die gewünschte Eigenschaft aber nicht der Fall: Bei der Einsetzung des Nomens ”Mann” für das Nomen ”Frau” im Satz ”Die Frau kam spät aus der Vorstellung.” entsteht ”Die Mann kam spät aus der Vorstellung.” - was wegen ”Die Mann” kein deutscher Satz ist; entsprechend, wenn man andere Formen von ”Mann” einsetzt. (a) Verbessern Sie Def. 1, sodass dieses Problem nicht mehr auftaucht, also ”Mann” und ”Frau” doch distributiv äquivalent im Sinne von Def. 2 sind. ′ (Hinweis: Man verwende eine komplexere Ersetzungsoperation s[wF /w′F ] einer Form wF ′ von w durch eine Form w′F von w′ , die auch Wortformen im Kontext ändern darf; erlauben Sie eine ausreichende, aber nicht zu wilde Änderung des Kontexts.) (3 Punkte) (b) Gelten die folgenden Aussagen, unter Verwendung Ihrer Verbesserung der Definition? a) Das Wort ”Käse” ist distributiv äquivalent zu dem Wort ”Semmel”. 1 b) ”bevor” ist distributiv äquivalent zu ”nachdem”. c) ”sterben” und ”lieben” sind distributiv äquivalent. Begründen Sie Ihre Auffassung. Falls Sie die Aussage für falsch halten, reicht ein Satzpaar als Gegenbeispiel. Wenn eine Aussage richtig ist, geben Sie mehrere Beispiele an und versuchen Sie, systematisch zu argumentieren. (3 Punkte) Aufgabe 1.3 Erweitern wir den Begriff der Distribution auf Wortarten durch Def. 3 Die Distribution einer Wortart W liegt in der Distribution einer Wortart W ′ , gdw die Distribution aller Wörter der Wortart W in der Distribution aller Wörtern der Wortart W ′ liegt. Def. 4 Eine Wortart W ist distributiv äquivalent zu einer Wortart W ′ , gdw die Distribution von W in W ′ und die von W ′ in W liegt. Gelten, wenn in Def. 3 mit “Distribution eines Worts” Ihre Lösung von Aufgabe ?? verwendet wird, dann die folgenden Aussagen a) Die Distribution von Eigennamen (Hans, Peter,...) liegt in jener der Nomen. b) Demonstrativpronomen (dieser,. . . ) und Artikel (der,. . . ) sind distributiv äquivalent. und entsprechen diese Ergebnisse Ihren Intuitionen zum Begriff der Wortart? (3 Punkte) Aufgabe 1.4 Als nächstes versuchen wir, durch Distributionsklassen (von Wörtern) und Kontexten (aus solchen Distributionsklassen) die Wortarten zu definieren. Def. 5: Eine Distributionsklasse W ist eine Menge von Wörtern, die miteinander distributiv äquivalent sind. Def. 6: Sei w ein Wort. Die Distributionsklasse (oder: Substitutionsklasse) von w sei S(w) := { w′ ∈ Wörter | w′ ist distributiv äquivalent mit w }. Def. 7 Eine Folge von Distributionsklassen hW1 , ..., Wn i ist ein Satzteilschema, gdw für alle Wörter w1 ∈ W1 , . . . , wn ∈ Wn gilt: w1 hat eine Wortform w1F1 , ..., und wn hat eine Wortform wnFn , sodass die Wortformfolge w1F1 . . . wnFn Bestandteil (= Teilfolge der Wortformfolge) eines korrekten Satzes ist. Def. 8 Das Syntagma eines Wortes w sei definiert als Menge von Kontexten: { (hW1 , ..., Wi i, hWj , ..., Wk i) | hW1 , ..., Wi , S(w), Wj , ..., Wk i ist ein Satzteilschema }. Beispiel 1.1 Sei Art der bestimmte Artikel im Deutschen, mit den Formen { der, die, das,...}, und setze Nomen := { n ∈ Wort | (hArti,hi) ∈ Syntagma(n) }. (D.h. grob, Nomen sind Wörter, die auf Artikel folgen - und genau?) Unter Verwendung des Beispielssatzes 2 S0. Der Mann schwieg. kann nun eine Ableitung angegeben werden, die ”Mann” als Nomen erweist: A: A1. A2. A3. A4. Art Mann schwieg. hArti Mann hi schwieg. hArti Mann hi (hArti,hi) ”Der” durch den Bezeichner seiner Distributionsklasse ersetzen Einen geeigneten Vor- und Nachkontext in A1 isolieren. Elemente vor dem Vor- und nach dem Nachkontext löschen. Aus Vor- und Nachkontext den Kontext bilden. Sind alle so definierten ”Nomen” distributiv äquivalent? Was ist mit Sätzen wie: S1. Der Peter weiß schon, was er tut. S2. Der alte Mann wußte keinen Rat mehr. Nach der Nomendefinition geht aus S1 hervor, dass ”Peter” und ”alte” Nomen sind. Verbessern Sie die Definition so, dass das ”Peter” und ”alte” aus S2 nicht mehr als Nomen erkannt werden. Die Definition soll das Format X := { x ∈ Wort | Bedingung1 (x), . . . , Bedingungn (x) } haben, wobei die einzelnen Bedingungen im Prinzip mit einem Programm überprüfbar sein sollen, z.B. von folgender Form sind: (a) ein bestimmter Kontext kommt (nicht) in Syntagma(x) vor, (b) x hat bestimmte Flexionssuffixe oder erfüllt gewisse Schreibkonventionen, (c) x ist ein (kein) Wort einer bestimmten Wortart Y , die zusätzlich definiert wird. (d) x ist eines von endlich vielen bestimmten Wörtern. (Hinweis: Eigennamen lassen sich endlich auflisten, Adjektive aber nicht: das vorletzte Jahr, das vorvorletzte Jahr, das vorvorvorletzte ...) (4 Punkte) Aufgabe 1.5 Schließlich betrachten wir neben der obigen Definition von Nomen noch folgende für Verb und Adjektiv: Verb := { v ∈ Wort | (hNomeni, hi) ∈ Syntagma(v) }. Adjektiv := { a ∈ Wort | (hArti, hNomeni) ∈ Syntagma(a) }. a) Geben Sie mit S2 eine Ableitung für ”alte” als Adjektiv und ”wußte” als Verb an. b) Erweitern Sie die Definitionen für Nomen, Adjektiv und Verb so, daß ”ging” ”gegangen” ”jung” in ”Es ging aber nicht.” in ”Er ist zu der Frau gegangen.” in ”Der Mann ist jung.” als Verb, als Verb, als Adjektiv abgeleitet werden können. Geben Sie entsprechende Ableitungen an. (3 Punkte) Begründen Sie, warum ”nicht” ”einen” ”Jäger” in ”Der Mann ist nicht jung.” in ”Er machte dem Mädchen einen Antrag.” in ”Er ist Jäger.” nicht als Adjektiv, nicht als Verb, nicht als Adjektiv abgeleitet werden können. (3 Punkte) Versuchen Sie ad-hoc-Lösungen zu vermeiden, die nur ein Beispiel betreffen. 3 Aufgabe 1.6 Bei der Angabe weniger Abfolgeschema sind die Definitionen meist nicht operational anwendbar. Stellen Sie sich vor, Sie wollen unter Verwendung Ihrer Nomendefinition ein Programm schreiben, um in einem Textkorpus zur Erstellung eines Lexikons alle Nomen zu finden. Das Nomen ”Experiment” kommt aber zufällig darin nur in diesen Sätzen vor: S3. Kein Experiment konnte bisher die Thesen untermauern. S4. Am Experiment nahmen drei Versuchsgruppen teil. Bisher kann mit Hilfe der Nomendefinition keine Ableitung für ”Experiment” angegeben werden. a) Erweitern Sie Ihre Nomendefinition um 5 weitere Kontexte und geben Sie für jeden Kontext einen Beispielsatz an, mit dem Sie eine Ableitung des Nomens nach dem Muster von A vornehmen. Mit der neuen Definition soll ”Experiment” außerdem in dem Minikorpus {S3, S4} als Nomen abgeleitet werden können. Geben Sie auch diese beiden Ableitungen an. b) Angenommen, man darf Wortarten mit Hilfe der Angabe von Kontexten und Wortsyntagmen wechselseitig definieren, wie Nomen und Verb in (hArti,hi), Ihre 5 Schemata, Nomen := n| (hi, hVerbi) sind Elemente von Syntagma(n) Verb := { v | (hi, hArt, Nomeni) ist Element von Syntagma(v) } Erweitern Sie nun die Verbdefinition um 2 Abfolgeschemata, die auf Nomen Bezug nehmen, sodass sich mit ihnen ”ging” und ”stand” in den Sätzen: S. Er ging früh ins Bett. S. Langsam stand Peter auf. als Verben erkannen lassen. Geben Sie die dazugehörigen Ableitungen an. c) Geben Sie schließlich noch eine Definition der Wortart der Adjektive an, mit der Sie die Adjektive aus 5 Beispielsätzen von einer Web Seite Ihrer Wahl ableiten können. Dabei können Sie auf die Nomen und Verbdefinitionen zurückgreifen. Geben Sie die Quelle der Beispielsätze und die Ableitungen an. 4