Yasp-Presentation.

Werbung
YASP
Yet Another
Synthetic Poem
Ein Studienprojekt von
Hendrik Niederlich,
Steffen Eger
Und Peter Stadler
Abstract
YASP ist ein in Java geschriebenes Programm zur Analyse und - so
weit als möglich - Synthese deutscher Gedichte. Dabei sollen
strukturelle
(syntaktische)
poetische
Merkmale
(Figuren)
wie
Reimschema, Versmaß, Strophenzahl, Alliteration, Assonanz, Anaphern
und Epiphern sowie Parallelismus untersucht werden. Das Programm
liest dazu Texte in beliebigem - offenen - Format ein, die mithilfe
existierender Konverter nach ASCII überführt werden, das als
Ausgangsformat der Verarbeitung dient. Die Ausgabe erfolgt in HTML
mit entsprechender Markierung erkannter Strukturen. Ein zweiter
Schritt ist die Synthese neuer Gedichte, die in zwei Varianten
erfolgt. Erstens kann sich der/die Benutzerin durch Manipulation der
genannten Parameter das Ausgangs-Gedicht in modifizierter Weise
wiedergeben lassen. Zweitens bietet eine weitere Komponente des
Programms die Synthese genuin neuer Gedichte an, indem Gedichtkorpora
mit dem Ziel des Aufbaus eines Lexikons untersucht werden. Ziel des
Projekts ist die Etablierung im Schulunterricht: wir sind überzeugt,
dass
YASP
innerhalb
kurzer
Zeit
aus
dem
Unterricht
der
Jahrgangsstufen neun bis dreizehn nicht mehr wegzudenken sein wird.
Erreichte Ziele
• Programmiersprache
• Analyse von
–
–
–
–
–
–
Versmaß
Reimschema
Alliteration
Anaphern
Epiphern
Repetition
• Ausgabe in XML und HTML
Nicht erreicht
• Synthese von Gedichten
• Analyse von
– Assonanz
– Parallelismus
• Unterstützung diverser
Eingabeformate
Das Programm
pstadler@ella:~/Studienprojekt/yasp$ java YaspApplication -h
For a documentation of the YASP-Project see
http://wiki.cl.uni-heidelberg.de/moin/YetAnotherSyntheticPoem
Usage: java YaspApplication [-acfhprsv] filename1 filename2 ...
Examples: java YaspApplication Mondnacht.txt
java YaspApplication -a -r Mondnacht.txt
java YaspApplication -s -p Mondnacht.txt Erlkoenig.txt
Without any parameter the given poem(s) is (are) analyzed and the
output is written to stdout as an XML-file.
With parameters given, only part of the information is displayed.
Known parameters:
-a print the Accentuation scheme to stdout
-c print the Complete YaspWords to stdout
-f print the Figures (including graphemes) to stdout
-h print this Help
-p print the Phonetic representation to stdout
-r print the Rhyme scheme (including phonetics) to stdout
-s print the Syllables to stdout
-v get a more verbose output
All parameters may be combined. They are then
processed for all input files.
For Linux machines the input files should be iso-8859-1.
XML-Output
pstadler@ella:~/Studienprojekt/yasp$ java YaspApplication poems/Erlkoenig.txt | head -30
<?xml version="1.0" encoding="iso-8859-1" standalone="yes"?>
<!-- YASP XML Output File -->
<!-- http://wiki.cl.uni-heidelberg.de/moin/YetAnotherSyntheticPoem -->
<!DOCTYPE poem SYSTEM "./libs/yasppoem.dtd">
<poem>
<title>erlkönig</title>
<stanza no="1">
<verse no="1" rhyme="a" measure="1">
<figure al="1">wer</figure>
<figure>reitet</figure>
<figure>so</figure>
<figure>spät</figure>
<figure>durch</figure>
<figure>nacht</figure>
<figure>und</figure>
<figure al="1">wind</figure>
</verse>
<verse no="2" rhyme="a" measure="2">
<figure>es</figure>
<figure>ist</figure>
<figure>der</figure>
<figure>vater</figure>
<figure>mit</figure>
<figure>seinem</figure>
<figure>kind</figure>
</verse>
<verse no="3" rhyme="b" measure="1">
<figure an="1">er</figure>
<figure>hat</figure>
Transformation nach HTML
• Für die Transformation nach HTML
wird xsltproc verwendet
• und das eigene XSL-Stylesheet
„poem.xsl“
UML-Überblick
Gedicht-Verarbeitung
Wort-Verarbeitung
Known Problems
(Auswahl)
• Encodings
• Apostrophe
• Phonemator-Ausgabe
Abhängig hiervon sind:
ß Accentuator
ß MeasureDetective
ß RhymeDetective
• Keine POS-Information
• Keine Morphologische
Information
Danksagungen
• Petra Wagner
• Markus Demleitner
• Hendrik Niederlich
Herunterladen