Übung 2

Werbung
Ling 331
Machine Language Processing
WS 2008/ 09
29.10.08
Übung 2
Aufgabe 2-1: Text für nächste Stunde
Lesen Sie als Vorbereitung für die nächste Sitzung Kapitel 1, S. 23-30 aus Bird, Klein,
Loper 2008 (Das Buch zu NLTK: http://nltk.sourceforge.net/index.php/Book). Die
Übungen brauchen Sie nicht zu machen. Es geht darum, dass Sie einen ersten Eindruck
von dem System bekommen, mit dem wir in den nächsten Stunden arbeiten werden.
Diesmal müssen SIe keine Fragen zum Text beantworten. Sie sollten, falls es möglich ist,
auf ihrem eigenen Rechner Python und NLTK installieren. Ein Python-Version, die
hilfreiche Packete beinhaltet ist z.B. epd, die für akademischen Gebrauch kostenfrei ist.
Falls Sie Probleme bei der Installation haben, werden wir sie nächste Woche
besprechen. Falls Sie die Programme gar nicht installieren können, haben Sie auf jeden
Fall die Möglichkeit, alle Übungen im Computer-Lab zu machen!
Referenzen:
• Text
o
•
•
Steven Bird, Ewan Klein und Edward Loper. Natural Language Processing
in Python. http://nltk.sourceforge.net/index.php/Book
Python
o epd: https://www.enthought.com/products
NLTK
o http://nltk.sourceforge.net/index.php/Download
Aufgabe 2-2: Reguläre Ausdrücke und endliche Automaten
a. Die Wortformen baue, baust, baut und bauen lassen sich zu einem Zeichenmuster
vereinfachen. Schreiben Sie einen regulären Ausdruck, der alle Formen abbilden kann.
b. Schreiben Sie einen Erkenner in der Form eines endlichen Automaten, der die Wortformen
baue, baust, baut und bauen erkennt.
Abgabe von 2-2
bis Dienstag, 04.11.08, 24:00 Uhr per E-Mail:
Christine.Enzinger @ uni-kn ...
cc: Heike. Zinsmeister @ uni-kn...
Bitte die Datei folgendermaßen benennen: Name_Übungsnummer
In der Datei bitte ebenfalls zuerst den eigenen Namen und die Übungsnummer angeben.
Heike Zinsmeister
1
Herunterladen