YASP Yet Another Synthetic Poem Ein Studienprojekt von Hendrik Niederlich, Steffen Eger Und Peter Stadler Abstract YASP ist ein in Java geschriebenes Programm zur Analyse und - so weit als möglich - Synthese deutscher Gedichte. Dabei sollen strukturelle (syntaktische) poetische Merkmale (Figuren) wie Reimschema, Versmaß, Strophenzahl, Alliteration, Assonanz, Anaphern und Epiphern sowie Parallelismus untersucht werden. Das Programm liest dazu Texte in beliebigem - offenen - Format ein, die mithilfe existierender Konverter nach ASCII überführt werden, das als Ausgangsformat der Verarbeitung dient. Die Ausgabe erfolgt in HTML mit entsprechender Markierung erkannter Strukturen. Ein zweiter Schritt ist die Synthese neuer Gedichte, die in zwei Varianten erfolgt. Erstens kann sich der/die Benutzerin durch Manipulation der genannten Parameter das Ausgangs-Gedicht in modifizierter Weise wiedergeben lassen. Zweitens bietet eine weitere Komponente des Programms die Synthese genuin neuer Gedichte an, indem Gedichtkorpora mit dem Ziel des Aufbaus eines Lexikons untersucht werden. Ziel des Projekts ist die Etablierung im Schulunterricht: wir sind überzeugt, dass YASP innerhalb kurzer Zeit aus dem Unterricht der Jahrgangsstufen neun bis dreizehn nicht mehr wegzudenken sein wird. Erreichte Ziele • Programmiersprache • Analyse von – – – – – – Versmaß Reimschema Alliteration Anaphern Epiphern Repetition • Ausgabe in XML und HTML Nicht erreicht • Synthese von Gedichten • Analyse von – Assonanz – Parallelismus • Unterstützung diverser Eingabeformate Das Programm pstadler@ella:~/Studienprojekt/yasp$ java YaspApplication -h For a documentation of the YASP-Project see http://wiki.cl.uni-heidelberg.de/moin/YetAnotherSyntheticPoem Usage: java YaspApplication [-acfhprsv] filename1 filename2 ... Examples: java YaspApplication Mondnacht.txt java YaspApplication -a -r Mondnacht.txt java YaspApplication -s -p Mondnacht.txt Erlkoenig.txt Without any parameter the given poem(s) is (are) analyzed and the output is written to stdout as an XML-file. With parameters given, only part of the information is displayed. Known parameters: -a print the Accentuation scheme to stdout -c print the Complete YaspWords to stdout -f print the Figures (including graphemes) to stdout -h print this Help -p print the Phonetic representation to stdout -r print the Rhyme scheme (including phonetics) to stdout -s print the Syllables to stdout -v get a more verbose output All parameters may be combined. They are then processed for all input files. For Linux machines the input files should be iso-8859-1. XML-Output pstadler@ella:~/Studienprojekt/yasp$ java YaspApplication poems/Erlkoenig.txt | head -30 <?xml version="1.0" encoding="iso-8859-1" standalone="yes"?> <!-- YASP XML Output File --> <!-- http://wiki.cl.uni-heidelberg.de/moin/YetAnotherSyntheticPoem --> <!DOCTYPE poem SYSTEM "./libs/yasppoem.dtd"> <poem> <title>erlkönig</title> <stanza no="1"> <verse no="1" rhyme="a" measure="1"> <figure al="1">wer</figure> <figure>reitet</figure> <figure>so</figure> <figure>spät</figure> <figure>durch</figure> <figure>nacht</figure> <figure>und</figure> <figure al="1">wind</figure> </verse> <verse no="2" rhyme="a" measure="2"> <figure>es</figure> <figure>ist</figure> <figure>der</figure> <figure>vater</figure> <figure>mit</figure> <figure>seinem</figure> <figure>kind</figure> </verse> <verse no="3" rhyme="b" measure="1"> <figure an="1">er</figure> <figure>hat</figure> Transformation nach HTML • Für die Transformation nach HTML wird xsltproc verwendet • und das eigene XSL-Stylesheet „poem.xsl“ UML-Überblick Gedicht-Verarbeitung Wort-Verarbeitung Known Problems (Auswahl) • Encodings • Apostrophe • Phonemator-Ausgabe Abhängig hiervon sind: ß Accentuator ß MeasureDetective ß RhymeDetective • Keine POS-Information • Keine Morphologische Information Danksagungen • Petra Wagner • Markus Demleitner • Hendrik Niederlich