Ling 331 Machine Language Processing WS 2008/ 09 29.10.08 Übung 2 Aufgabe 2-1: Text für nächste Stunde Lesen Sie als Vorbereitung für die nächste Sitzung Kapitel 1, S. 23-30 aus Bird, Klein, Loper 2008 (Das Buch zu NLTK: http://nltk.sourceforge.net/index.php/Book). Die Übungen brauchen Sie nicht zu machen. Es geht darum, dass Sie einen ersten Eindruck von dem System bekommen, mit dem wir in den nächsten Stunden arbeiten werden. Diesmal müssen SIe keine Fragen zum Text beantworten. Sie sollten, falls es möglich ist, auf ihrem eigenen Rechner Python und NLTK installieren. Ein Python-Version, die hilfreiche Packete beinhaltet ist z.B. epd, die für akademischen Gebrauch kostenfrei ist. Falls Sie Probleme bei der Installation haben, werden wir sie nächste Woche besprechen. Falls Sie die Programme gar nicht installieren können, haben Sie auf jeden Fall die Möglichkeit, alle Übungen im Computer-Lab zu machen! Referenzen: • Text o • • Steven Bird, Ewan Klein und Edward Loper. Natural Language Processing in Python. http://nltk.sourceforge.net/index.php/Book Python o epd: https://www.enthought.com/products NLTK o http://nltk.sourceforge.net/index.php/Download Aufgabe 2-2: Reguläre Ausdrücke und endliche Automaten a. Die Wortformen baue, baust, baut und bauen lassen sich zu einem Zeichenmuster vereinfachen. Schreiben Sie einen regulären Ausdruck, der alle Formen abbilden kann. b. Schreiben Sie einen Erkenner in der Form eines endlichen Automaten, der die Wortformen baue, baust, baut und bauen erkennt. Abgabe von 2-2 bis Dienstag, 04.11.08, 24:00 Uhr per E-Mail: Christine.Enzinger @ uni-kn ... cc: Heike. Zinsmeister @ uni-kn... Bitte die Datei folgendermaßen benennen: Name_Übungsnummer In der Datei bitte ebenfalls zuerst den eigenen Namen und die Übungsnummer angeben. Heike Zinsmeister 1