Einleitung Morphologie Einleitung Morphologie Gliederung Natürlichsprachliche Systeme I – Materialien zur Vorlesung 1 Einleitung 2 Morphologie Morpheme Morphologische Prozesse Morphologie D. Rösner Flexion Derivation Komposition Klitisierung Institut für Wissens- und Sprachverarbeitung Fakultät für Informatik Otto-von-Guericke Universität Magdeburg c WS 2010/11, 19. Oktober 2010, 2010, 2011 D.Rösner D. Rösner NSS I 2010/11 . . . 1 D. Rösner NSS I 2010/11 . . . Einleitung Morphologie 2 Einleitung Morphologie Motivation Morphologisches Parsing nicht alle englischen Wörter haben die simple Unterscheidung zwischen singular und plural durch angehängtes ’s’ Beispiele (vgl. [JM08], Ch. 3): Parsing . . . allgemein: einer Eingabe eine linguistische Struktur zuordnen fox – foxes peccary – peccaries goose – geese fish – fish vgl. [JM08], Ch. 3 Arten von benötigten Regeln: orthographische Regeln morphologische Regeln D. Rösner NSS I 2010/11 . . . 3 D. Rösner NSS I 2010/11 . . . 4 Einleitung Morphologie Einleitung Morphologie Morphologisches Parsing Morphologisches Parsing morphologisches Parsing . . . Zerlegung von Wörtern in sog. Morpheme Beispiele: Frage: Warum ist Ablegen aller (Oberflächen-)Formen und morphologisches Parsen durch Nachschlagen (lookup) keine wirkliche Alternative? morphologische Regeln sind produktiv foxes zerlegen in Grundform fox und Plural-Morphem -es Eingabe (oder Oberflächenform) going zerlegen in Grundform und -ing-Morphem als Parsing-Ergebnis darstellbar z.B. als VERB-go + GERUND-ing Beispiel: an jedes Verb kann -ing-Morphem angehängt werden für Neologismen müssen die unterschiedlichen Formen gebildet und erkannt werden können morphologisches Parsing insbesondere wichtig für Sprachen mit reichhaltiger Morphologie (z.B. Deutsch, Russisch, Türkisch, Finnisch, . . . ) vgl. [JM08], Ch. 3 vgl. [JM08], Ch. 3 D. Rösner NSS I 2010/11 . . . Einleitung Morphologie D. Rösner NSS I 2010/11 . . . 5 Morpheme Morphologische Prozesse Einleitung Morphologie Morphologie 6 Morpheme Morphologische Prozesse Morphologie Unterscheidung in Morphologie . . . wie werden Wörter aus kleineren bedeutungstragenden Einheiten aufgebaut? Stämme Affixe Morphem . . . definiert als kleinste bedeutungstragende Einheit einer Sprache Stamm trägt die Hauptbedeutung, Affixe fügen dieser Ergänzungen hinzu vgl. [JM08], Ch. 3.1 vgl. [JM08], Ch. 3.1 D. Rösner NSS I 2010/11 . . . 7 D. Rösner NSS I 2010/11 . . . 9 Einleitung Morphologie Morpheme Morphologische Prozesse Einleitung Morphologie Morphologie Morpheme Morphologische Prozesse Morphologie Beispiele für unterschiedliche Affixe (vgl. [JM08], Ch. 3.1) Präfix: engl. Verb unbuckle aus Stamm buckle und Präfix un- Affixe weiter unterschieden in Präfixe, Suffixe, Infixe, Circumfixe Suffix: engl. Verb runs aus Stamm run und Suffix -s Circumfix: bei einigen dt. Verben wird Partizip Perfekt durch Voranstellen von ge- und Anfügen von -t gebildet Beispiele: geliebt, gelacht, . . . Frage: andere Formen des Partizip Perfekt im Deutschen? vgl. [JM08], Ch. 3.1 D. Rösner NSS I 2010/11 . . . Einleitung Morphologie 10 D. Rösner NSS I 2010/11 . . . Morpheme Morphologische Prozesse Einleitung Morphologie Morphologie 11 Morpheme Morphologische Prozesse Wortbildung durch morphologische Prozesse vier hauptsächliche Formen der Kombination von Morphemen zu Wörtern: Beispiele für unterschiedliche Affixe (vgl. [JM08], Ch. 3.1) Infix: Flexion (engl. inflection), philippinische Sprache Tagalog: Morphem um zur Markierung des Handelnden einer Aktion wird in den Stamm, z.B. hingi (für (ent)leihen, engl. borrow), eingefügt Form dann humingi Derivation, Komposition, Klitisierung (engl. cliticization) vgl. [JM08], Ch. 3.1 D. Rösner NSS I 2010/11 . . . 12 D. Rösner NSS I 2010/11 . . . 14 Einleitung Morphologie Morpheme Morphologische Prozesse Einleitung Morphologie Derivation Morpheme Morphologische Prozesse Komposition Derivation . . . Kombination eines Wortstamms mit einem grammatischen Morphem Komposition (engl. compounding) . . . Verknüpfung mehrerer Wortstämme führt oft zu Wort in einer anderen Wortklasse Beispiel: lighthouse Beispiel: aus Verbstamm les und grammatischem Morphem -bar wird Adjektiv lesbar gebildet im Englischen werden sog. ’noun compounds’ meist durch Aneinanderreihung mit Leerzeichen gebildet Beispiel: aus engl. Verben, die dabei oft auf -ize enden, werden mit grammatischem Morphem -ation Nomen gebildet (z.B. computerize wird zu computerization ) Beispiel: machine language translation vgl. [JM08], Ch. 3.1.2 D. Rösner NSS I 2010/11 . . . Einleitung Morphologie 15 D. Rösner NSS I 2010/11 . . . Morpheme Morphologische Prozesse Einleitung Morphologie Komposition 16 Morpheme Morphologische Prozesse Klitisierung im Deutschen gilt bei Nominalkomposita nach gültiger Rechtschreibung die direkte Zusammenschreibung, in manchen Fällen die Zusammenschreibung mit Bindestrichen Klitikon (pl. Klitika) . . . Einheiten, deren Status zwischen dem eines Affix und dem eines Worts liegt Klitika oft unterschieden in vorangestellte (Proklitika) und nachgestellte (Enklitika) Beispiele: Kreiswehrersatzamt, aber Richard-Wagner-Allee im Englischen gibt es Klitika zu Formen von Hilfsverben manche Zusammenschreibung erfordert dabei ein sog. Fugenmorphem Beispiel: she’s für she is oder she has Beispiele: Börse-n-kurs, Wirtschaft-s-ministerium D. Rösner NSS I 2010/11 . . . 17 D. Rösner NSS I 2010/11 . . . 18 Einleitung Morphologie Morpheme Morphologische Prozesse Literatur: I Daniel Jurafsky and James H. Martin. Speech and Language Processing: An introduction to natural language processing, computational linguistics, and speech recognition. Prentice Hall, 2nd (May 26, 2008) edition, 2008. Christopher D. Manning and Hinrich Schütze. Foundations of Statistical Natural Language Processing. MIT Press, fifth printing edition, 2002. D. Rösner NSS I 2010/11 . . . 19