der digitale heine – ein internetportal als integriertes

Werbung
DER DIGITALE HEINE –
EIN INTERNETPORTAL ALS
INTEGRIERTES INFORMATIONSSYSTEM
Ich bin kein Gelehrter, ich gehöre nicht zu den 700 Weisen Deutschlands. Ich stehe mit dem großen Haufen vor
den Pforten ihrer Weisheit, und ist da irgend eine Wahrheit durchgeschlüpft, und ist diese Wahrheit bis zu mir
gelangt, dann ist sie weit genug: - ich schreibe sie mit hübschen Buchstaben auf Papier und gebe sie dem Setzer;
der setzt sie in Bley und giebt sie dem Drucker; dieser druckt sie und sie gehören dann der ganzen Welt.
Heinrich Heine[1]
Abstract
Since autumn 2002 this project is established as a cooperation between the Heinrich-Heine-Institut in
Düsseldorf and the Competence Center for Information Retrieval and Electronic Publishing in the
Humanities at the University of Trier. The corporation’s studies is the first complete unification and
the electronic publishing of the works and letters of Heine in an open source internet portal, which can
be expanded if required. The Düsseldorfer Historisch-kritische Ausgabe (DHA) and the volumes
which contain the collection of letters of the Weimarer Säkularausgabe (HSA) act as referential
editions for the portal, which includes more than just the provision of these texts: the portal provides a
connection to the manuscripts and a digital picture gallery. In a second phase an extensive HeineBibliography will be added to the portal. Altogehter a global platform of information about Heinrich
Heine will be generated. The course of the project is divided into three major steps: An exact analysis
of the existing documents is being followed by the diagraming of structural and typographical
characteristics of the texts with the help of an encoding compliant to TUSTEP. Afterwards the now
digit texts are marked up according to the rules of the TEI. Finally the electronical publication of the
database is being realised by employing the Content Management System ZOPE.
Aus diesem Grund, nämlich weil sie nach Heines Ansicht der ganzen Welt gehören, soll auch die
ganze Welt an Heines schönen Buchstaben teilhaben können. Wie würde das in der heutigen Zeit
besser zu realisieren sein als über das Medium Internet?! Seit September 2002 fördert die Deutsche
Forschungsgemeinschaft (DFG) im Rahmen des Programmes Retrospektive Digitalisierung von
Bibliotheksbeständen[2] ein Kooperationsprojekt zwischen dem Heinrich-Heine-Institut der Stadt
Düsseldorf und dem Kompetenzzentrum für elektronische Erschließungs- und Publikationsverfahren
an der Universität Trier, welches in einem Zeitraum von insgesamt fünf Jahren eben dieses Ziel
verfolgt: eine digitale Heine-Ausgabe weltweit zur Verfügung zu stellen[3]. Fragen sich nun manche
Buchliebhaber nach dem Sinn einer digitalen Edition, so können hier mit gutem Gewissen drei
Vorteile benannt werden, die diese dem Buch gegenüber besitzt: Zunächst ermöglicht eine solche
Publikation von Texten eine schnelle Suche von Zeichenketten über lange Textpassagen hinweg.
Zudem können komplexe Textbeziehungen sichtbar gemacht werden. Außerdem eröffnet eine digitale
Edition die Möglichkeit, das Textmaterial ständig und nachhaltig zu verbessern und zu bearbeiten,
ohne dass gleich ein Neudruck vonnöten wäre[4].
1. Projektvorstellung
Das Heinrich-Heine-Portal (HHP) wird die Werke und den Briefwechsel Heines als integriertes
Informationssystem auf der Basis moderner Datenstandards (SGML/XML) im Internet zugänglich
machen. Für den Inhalt und die wissenschaftliche Präsentation ist das Heine-Institut verantwortlich,
die Textauszeichnung sowie die Entwicklung der graphischen Oberfläche werden vom
Kompetenzzentrum durchgeführt.
Die gemeinsame Grundlage für diese digitale Edition bilden die beiden historisch-kritischen HeineGesamtausgaben, die parallel in der Bundesrepublik und der DDR entstanden: die 1973-1997
erschienene Düsseldorfer Heine-Ausgabe (DHA)[5], herausgegeben von Manfred Windfuhr und die
1970-1984 erschienenen Briefbände der Heine-Säkularausgabe (HSA)[6], herausgegeben von den
Nationalen Forschungs- und Gedenkstätten der klassischen deutschen Literatur in Weimar (heute
Stiftung Weimarer Klassik) und dem Centre National de la Recherche Scientifique in Paris. Damit
wird erstmals eine einheitliche und vollständige Gesamtausgabe von Heines Werken und Briefen
vorgelegt, die zusätzlich auch die zwischenzeitlich neu oder wieder gefundenen Briefe einbezieht.
Insgesamt müssen 26.500 Textseiten, die mit circa 72 Millionen Zeichen bedruckt sind, für die
elektronische Publikation vorbereitet werden. Zusätzlich werden digitale Faksimiles zu Briefen und
Werken sowie Bildmaterialien aus den Beständen des Heinrich-Heine-Instituts in das Portal
eingegliedert. Geplant ist, dem Portal in einer zweiten Förderphase die fünf in Buchform vorliegenden
Heine-Bibliographien (erfassen existierende Literatur bis 1995), hinzuzufügen und die seit dieser Zeit
erschienenen Sekundärwerke zu Heine mittels einer seit einigen Jahren im Heine-Institut gepflegten
Datenbank zur Bibliographie zu vervollständigen.
2. Dokumentanalyse
Die Datenerfassung wurde von der Firma TQY Double-Key in Nanjing/China durchgeführt.
Ein solches Vorgehen besitzt neben dem finanziellen Vorteil noch einen viel wesentlicheren Vorzug:
die chinesischen Datentypisten sprechen kein Deutsch. Somit sind sie darauf angewiesen, Zeichen für
Zeichen vom Papier auf die Tastatur zu übertragen. Fehler, die sich durch Sprachgefühl einschleichen,
werden so vermieden.
Bevor jedoch mit der Eingabe der Daten begonnen werden konnte, mussten die Dokumente zunächst
genau betrachtet und beschrieben werden. In den beiden kritischen Heine-Ausgaben sind Texte
versammelt, die einer Vielzahl verschiedener Texttypen (Lyrik, Drama, Prosa, Briefe, Kommentare,
Apparate und so weiter) zuzuordnen sind und dementsprechend gänzlich unterschiedlichen
Strukturprinzipien unterliegen. Die Erfassung dieser Texte zielt auf eine ›saubere‹ Datengrundlage ab,
auf deren Basis ein TEI-konformes Markup möglichst automatisiert durchgeführt werden kann[7]. Dies
kann nur gelingen, wenn die strukturellen Eigenarten der Text-, Kommentar- und Registerbände von
DHA und HSA genau beschrieben und alle typographischen beziehungsweise auf das Layout der Texte
bezogenen Charakteristika schon bei der Erfassung mit spezifischen Kodierungen versehen werden.
Deshalb wurden alle Texte sorgfältig in Bezug auf ihre Makro- und Mikrostruktur hin analysiert,
wobei zunächst die strukturell einfacheren Brief- und Kommentarbände der HSA und erst im
Anschluss die eine Vielzahl unterschiedlicher Textsorten vereinigenden Bände der DHA beschrieben
wurden. Ergebnis dieser Analyse waren genaue Aufstellungen über typographische Merkmale und
Sonderzeichen, die die Basis für die Ausarbeitung einer exakten Anweisung zur Erfassung aller Texte
darstellen. Für diese Erfassungsanweisungen wurden Tabellen erstellt, in denen alle im Text
vorkommenden Phänomene in Bezug auf Layout und Sonderzeichen festgehalten und kurz erläutert
wurden. Jedes Phänomen erhielt eine Kodierung nach TUSTEP-Konventionen (Tübinger System von
Textverarbeitungsprogrammen) und wurde mit einem Muster belegt. Diese Muster sind den Texten
entnommene Beispiele, auf denen die in der Tabelle beschriebenen Phänomene entsprechend markiert
wurden, so dass jede typographische Besonderheit anhand eines Beispiels aus der Vorlage
dokumentiert wurde. Dies diente dazu, den chinesischen Datentypisten ein exaktes ›Regelwerk‹ zur
Erfassung an die Hand zu geben. Um Informationsverluste zu vermeiden, wurden die Ergebnisse der
Analyse ins Chinesische übertragen. Mit Hilfe von @@1@ (vergleiche zu den Kodierungen
Abbildung 2) kodieren die Chinesen beispielsweise eine Kopfzeile, @@3@ gibt an, dass an der Stelle
ein Fußtext beginnt. Mit <p> werden verschiedene Absatztypen kodiert und <E> bzw. <E+1>/<E+X>
zeigen an, um wie viele Stufen Einzug es sich handelt. Auch für Verszeilen (paariges <shi>), Tabellen
(paariges <biaoge>), Marginalien rechts (paariges <you>) und links (paariges <zuo>) und so weiter
wurden Markierungen vergeben; <konghang> steht für einen größeren Durchschuss. Nach Anlaufen
der Erfassungsarbeiten wurden diese en fonction erweitert und optimiert, um so die ohnehin sehr
geringe Fehlerdichte weiter zu verringern. Ein Beispiel hierfür ist die paarige Kennung
<djys>...</djys>, die eine Art chinesisches Akronym für vielstufige Einzüge darstellt und die somit
auch für die häufig vorkommenden vielfachen Einzüge gebraucht wird.
Einige Sonderzeichen haben im Vorhinein noch keine Kennung erhalten, zum Beispiel die Symbole
für Mann und Frau (HSA Band 22 und 26) oder ungewöhnliche Ligaturen (zum Beispiel die zwischen
H und D in HSA Band 24K). An diesen Stellen fügten die Datentypisten eine dafür vorgesehene
Zweifelskennung ein ({?AZIFU}), die während des Datenabgleichs durch XML-gerechtes Markup
ersetzt wurde.
2.313 |$0 <konghang>
|$00038.31 <P><A+1>16. #/+An Heinrich Straube in
2.314
Göttingen#/-</A+1></P>
|$00038.32
2.315 <P>______________________________#/+Göttingen, 5.
Februar 1821,
|Montag#/-</P>
2.316 |$0 <konghang>
|$00038.33 <shi>Wenn der Frühling kommt mit dem
2.317
Sonnenschein
2.318 |$00038.34 Dann knospen und blühen die Blümlein auf;
|$00038.35 <zuo>35</zuo>Wenn der Mond beginnt seinen
Stralenlauf
2.320 |$00038.36 Dann schwimmen die Sternlein hintendrein;</shi>
2.321 |$0 @@1@#/+März 1821#/-<S39>
2.322 |$00039.01 <shi>Wenn der Sänger zwey süße Äuglein sieht
2.323 |$00039.02 Dann quellen ihm Lieder aus tiefem Gemüth
2.324 |$00039.03 Doch Lieder und Sterne und Blümelei
2.325 |$00039.04 Und Äuglein und Mondglanz und Sonnenschein
2.326 |$00039.05 Wie sehr das Zeug auch gefällt,<you>5</you>
2.327 |$00039.06 Ist es doch noch lang nicht die Welt!</shi>
2.328 |$0 <konghang>
|$00039.07 <P>__Ja, die Welt besteht noch aus andern
2.329
Ingredienzen. Wenn Du mahl in
2.319
|meinem
|$00039.08 großen Naturepos lesen wirst von den unzähligen
Goldäderchen die den Welt
|$00039.09 körper durchweben, so wisse nur daß ich darunter
2.331
Ducaten, Louisd'ore un
|$00039.10 Frd'ore verstehe. Ich denke heut mit meinen
2.332
Spießen auf's Reine zu
2.330
|kommen.<you>10</you>
2.333
|$00039.11 Bin jetzt am Packen. Schick mir gleich auf der
Stelle: 1° Rousseaus Brief
|2°
|$00039.12 den Manfred und 3° das englische Buch. Vergiß
nicht, Lausangel.</P>
2.335 |$00039.13 <P>__Dein Dich herzlich liebender.</P>
|$00039.14 <P>______________________________Freund
2.336
und Gönner</P>
|$00039.15
2.337 <P>________________________________________H.
Heine Stud
2.334
|Juris.</P><you>15</you>
Abb.2: Brieftext HSA 20, Nr.16, im TUSTEP-Format
3. Texterfassung und Korrekturabgleich
Während die Dokumentanalyse der DHA noch andauerte, wurde bereits mit der Erfassung der HSABriefbände begonnen. Im März 2003 wurden Band 20 und Band 20K nach Trier übermittelt, so dass
die Arbeiten für die automatisierte TEI-konforme Auszeichnung der Brieftexte und der zugehörigen
Kommentare in Angriff genommen werden konnten. Die Erfassung aller HSA-Briefbände wurde im
Mai 2003 abgeschlossen. Seit Juli 2003 liegen alle Text- und Kommentarbände der HSA-Briefe (HSA
20-27) sowie der Registerband (HSA 20-27R) in abgeglichenen, quasi ausgabendiplomatischen
Versionen vor und stehen dem Kompetenzzentrum sowie dem DFG-geförderten Projekt Heine-Portal
als TUSTEP- und als reine Textdateien zur Verfügung.
Die Erfassung der DHA wurde im September 2003 abgeschlossen, die Differenzprotokolle bis Ende
Dezember 2003 abgeglichen: So standen zu Beginn des Jahres 2004 alle Daten von HSA und DHA
quasi ausgabendiplomatisch im TUSTEP- und im ASCII-Format zur Verfügung.
4. SGML- konforme Auszeichnung
Durch die genaue digitale Abbildung der Texte ist schon ein erstes Ziel erreicht: Die Texte sind bereits
voll recherchierbar, erste Anfragen an den Inhalt können durchgeführt werden. Nun sollen aber auch
spezielle Suchen möglich sein. Um dies zu erreichen, sind weitere inhaltliche Beschreibungen der
Texte notwendig. Informationen, nach denen der Benutzer suchen könnte, werden mit in die
Kodierung aufgenommen. Dazu benötigt man die TEI (Text Encoding Initiaitve)[8], die auf der
Grundlage von SGML/XML (Standard Generalized Markup Language/ eXtensible Markup
Language)[9] basiert. Jeder Text wird einem bestimmten Dokumententyp zugeordnet, im Falle der
Heine-Texte wären dies zum Beispiel Lyrik (%TEI.verse.dtd, Kurz: vedtd), Drama (%TEI.drama.dtd,
kurz: drdtd) oder Prosa (%TEI.prose.dtd, kurz: prdtd). Der Brief wird zunächst als Einheit
geklammert. Dazu setzt man sowohl vor die Nummer des Briefes, die ebenfalls einzeln getaggt wird,
die Kennung "Brief" als auch an das Ende des Briefes ein entsprechendes Endtag "Brief" ein. Nach der
Briefnummer steht die Anrede. Dann folgt der Brieftext. Dieser wird so geklammert, dass vor dem
Text ein öffnendes Tag steht, welches nach dem Textende wieder geschlossen wird. Auf diese Art und
Weise werden alle Elemente eines Textes identifiziert und mit den ihnen zukommenden Namen
mittels XML-Code nach den Regeln der TEI (Text Encoding Initiative) etikettiert. Diese
Auszeichnungen sind notwendige Anker, mit denen man auf die einzelnen Bestandteile eines Textes
zurückgreifen kann. Die Suchmöglichkeiten, die der Nutzer des HHP einmal haben wird, hängen von
den bei der Auszeichnung gesetzten Markierungen ab. Jede Markierung enthält eine Metainformation
über den Text und bildet einen Absatzpunkt für eine Suchmaschine. Diese wird so konzipiert, dass sie
einen Text einlesen kann und genau an den gesetzten Ankern anhält und diese sammelt. Dann werden
die aufgefundenen Anker als Ergebnisse eines Suchvorgangs ausgegeben. Je genauer ein Text
ausgezeichnet wird, desto komfortabler gestaltet sich später die Suche darin.
Hier zeigen sich bereits die Vorteile einer SGML-Kodierung. Durch die Gliederung in verschiedene
Ebenen, zum Beispiel durch Bezeichnung der Textsorte oder des Inhalts wird dem Benutzer mehr
geboten als eine einfache Volltextsuche. Es kann en fonction der ausgezeichneten Elemente eine
Suchmaschine aufgebaut werden, die detaillierte Abfragen gestattet.
Um nach der Publikation der Brieftexte möglichst vielfältige Zugriffe auf einzelne Briefe oder
Briefserien zu erhalten, wurden standardisierte Briefköpfe im TEI-Format erarbeitet, die Auskunft
geben über: Absender/Empfänger, Aufenthaltsort des Absenders/Empfängers, Datierung (Datum und
Wochentag), Textsorte (Brief, Widmung, Albumblatt, Stammbuchblatt et cetera), Thema
(Schlagwörter) oder die in einem Brief verwendete Sprache (vergleiche Abbildung 3).
Diese Informationen sind allesamt in ein Element <div3 type=“head“> ... </div3> (vergleiche
Abbildung 3) geklammert. Nach der Content Declaration dieses Elements darf <div3> jedoch nur
verwendet werden, wenn mindestens ein <p> ... </p> eingeklammert wird. Da die meisten Briefköpfe
jedoch keine mit <p> ... </p> zu markierenden Passagen enthalten und die Dokumente somit nicht
gültig validiert werden könnten, wurde letztlich per Programm vor alle </div3> ein ›leerer‹ Paragraph
<p rend=“none“></p> eingefügt, der bei der späteren Ausgabe auf einen Browser unterdrückt werden
muss und nur steht, um den Erfordernissen der TEI-DTD formal Rechnung zu tragen. Die Stimmigkeit
der Auszeichnungsarbeiten wird durch einen SGML- Parser gewährleistet, der, ausgelöst durch einen
bestimmten Kode, den Textkörper nach fehlerhaften Kodierungen durchsucht.
<div2 type="letter" id="W20B0003">
<div3 type="metainfo">
<lb n="00019.05.01">
<label rend="briefnr">3</label>
<byline>Von <name type="absender">Heinrich Heine</name>
in <name type="place">Hamburg</name>,
<date rend="datum" n="20111816">20. November 1816</date>,
<date rend="day" n="3">Mittwoch</date><lb>
an <name type="adressat">Christian <name
type="lastname">Sethe</name></name>
in <name type="place">Hamburg</name>
<ref type="lang">Deutsch</ref>
<ref type="faksimile" n="07">W20B0003.JPG</ref>
<ref type="prev" target="W20B0002">Vorangehender Brief von
Heine an Sethe</ref>
<ref type="next" target="W20B0028">Nachfolgender Brief von
Heine an Sethe</ref>
</byline>
</div3>
</div2>
Abb.3: Standardisierter Briefkopf zum Brief HSA 20, Nr.3
Auf der Grundlage der in den Briefköpfen angelegten Informationen können Indices erzeugt werden,
über die etwa die chronologische, personenbezogene oder thematische Sortierung von Briefkorpora
möglich ist. So kann man zum Beispiel von einem bestimmten Brief ausgehend direkt auf das
dazugehörige Antwortschreiben zugreifen. Außerdem enthalten die standardisierten Briefköpfe
Referenzen auf elektronische Faksimiles der Briefe, die mit den Texten verknüpft werden und auf
Wunsch auf dem Bildschirm angezeigt werden sollen.
5. Elektronische Publikation
Ausgangsbasis für die elektronische Publikation sind die XML-kodierten Daten. Jeder erfasste und
ausgezeichnete HSA -Band bildet ein eigenes XML-Dokument. Zu jedem dieser Dokumente gibt es
eine zugehörige Datei, die die Briefköpfe enthält. Sie werden ihrem jeweiligen Brief vorangestellt.
Dabei ergibt sich eine eindeutige Zuweisung von Briefkopf, Brieftext, Briefkommentar und Faksimile
(falls vorhanden), denn alle zusammengehörenden Elemente besitzen dieselbe Identifikationsnummer
(id). Diese funktioniert wie eine Hausnummer: sie bezeichnet eine einzige Adresse, unter der man also
alle Komponenten, die einen Brief ausmachen, finden kann. Sie sind somit eindeutige Identifikatoren
(vergleiche Abbildung 4).
W
20
B
0001
a
Weimarer Band Brief Nummer des
Ausgabe im
Ausgabe
Briefes gemäß der Anhang
Ausgabe
(Zusatz für
nachträglich
bearbeitete
Briefe)
Abb. 4: Aufbau einer id
Mit den Informationen aus den Briefköpfen und den Textdaten werden mehrere Tabellen einer
Datenbank auf Basis des Datenbank-Management-Systems MySQL[10] aufgebaut. Dieser Datenimport
wird durch zahlreiche Scripte durchgeführt, die in der Sprache Tcl/Tk[11] unter Verwendung der
SGML und XML verarbeitenden Erweiterung CoST[12] (Copenhagener SGML-Tool) implementiert
wurden. Ein Script liest und verarbeitet den Brieftext, ein weiteres ist speziell für den Kommentar
konzipiert und ein drittes filtert die relevanten Informationen aus den Dateien für die Briefköpfe.
Bevor die Scripte die SGML/XML-Daten verarbeiten können, muss die Datenbank für das HHP
initialisiert werden, das heißt es müssen die benötigten Tabellen definiert werden, um dann die
Datensätze eintragen zu können. Zu diesem Zweck erzeugt das Programm sogenannte »tables«,
(beispielsweise mit dem Kommando »create table letterinfo« eine Tabelle für die
Briefkopfinformationen). Durch Kommas abgetrennt folgt die Aufzählung der Namen der Spalten und
ihres Datentyps (zum Beispiel Informationen über Absender, Adressat, Datum, Typ des Briefes,
Sprache, und so weiter). Für jeden Brief wird so eine Zeile in die Tabelle geschrieben.
Neben den Kopfinformationen lesen die CoST-Scripte die XML-Dateien für die Brieftexte und kommentare und generieren HTML-Versionen, die ebenfalls in Datenbanktabellen abgelegt werden.
Alle derart angelegten Tabellen bilden die gesamte Datenbank, die HHPdatabase. Die InternetApplikation greift auf diese Datenbank zu, sie ist ihre Ausgangsbasis. Von dort werden sämtliche
Informationen abgerufen und in der graphischen Oberfläche angezeigt.
6. Content Management mit ZOPE
Das Portal wurde mit dem Content Management System ZOPE[13] (Z Object Publishing Environment)
erstellt, einer einheitlichen Arbeitsumgebung, in der man nur einen Internetbrowser benötigt, da alle
Vorgänge über HTML-Seiten ablaufen. Damit besitzt das Portal den enormen Vorteil, nicht
plattformgebunden zu sein. Überdies handelt es sich bei ZOPE um ein Open Source Produkt, das
heißt, es ist kostenfrei verfügbar.
Die Hauptseite des Portals, in der ZOPE-Appliaktion »index_html« genannt, stellt die am Projekt
beteiligten Organisationen (Kompetenzzentrum, HHI, Kunststiftung NRW und DFG) vor und führt
auf die zugehörigen Internetseiten. Überdies werden hier bereits die aktuellsten Informationen zum
Projekt geboten.
Über den Titel »Das Heinrich-Heine-Portal« als Hyperlink wird der Einstieg in das Portal ermöglicht.
Die Methode »start« wird geladen. Auf dem Bildschirm erscheint »Herzlich willkommen« und eine
Erläuterung dessen, was der Benutzer im Portal finden wird. Diese Methode baut framesets auf, die
die Bildschirmeinteilung einrichten. Vier frames von oben nach unten angeordnet, title, menu, path,
main, laden jeweils eine Seite oder Methode.
»Title« lädt den Titel (Seite), der in der obersten Zeile steht und Angaben zu was, wer und wann gibt.
Diese Zeile bleibt innerhalb des Portals immer unverändert. »Menu« lädt Menu (Seite) und es
erscheinen die Karteikartenreiter, die dem Benutzer die Möglichkeiten des Portals aufzeigen (gelbe
Zeile). »Path« ruft die Methode pathdisplay auf, welche wiederum eine andere, aus einem PythonScript generierte Methode aufruft, die ermittelt, wo im Portal man sich befindet und den Weg angibt
(dunkelgelbe Zeile). Schließlich lädt »main« die welcome-Seite und der Nutzer gelangt zur Einleitung
(»Herzlich willkommen«).
Nun wählt man aus den dargebotenen Karteikartenreitern nach dem persönlichen
Interessenschwerpunkt eine der Abteilungen »Aktuelles«, »Über Heinrich Heine«, »Werke«,
»Briefwechsel«, »Bildmaterial«, »Einstellungen«, »Über das Projekt« und »Kontakt und Hilfe« aus.
Bisher liegt eine ZOPE- Applikation für den Bereich der Briefe vor. Die Briefe von Heinrich Heine
aus den HSA-Bänden 20 und 21 sowie die Antwortschreiben seiner Korrespondenten aus Band 24 sind
ebenso wie der jeweilige Kommentar bereits im Netz recherchierbar. Wählt man die Briefabteilung,
erscheint links eine Navigationsleiste, die die verschiedenen Möglichkeiten, in der HSA zu lesen,
anbietet. So kann man zunächst die Bände ausgabenreferenziell konsultieren, was den Vorteil der
Zitierfähigkeit der Internetversion beinhaltet. Außerdem ist chronologisches Vorgehen sowie
alphabetische Suche nach Adressaten im Portal inbegriffen. Am Beispiel des Weges über die Ausgabe
soll die Nutzbarkeit deutlich werden. Unter »Weimarer Ausgabe« wird Band 20 geöffnet. Es erscheint
eine Liste aller Briefe des Bandes, die einem gewöhnlichen Inhaltsverzeichnis nachempfunden ist. Vor
den jeweiligen Einträgen steht manchmal ein kleines Icon: das bedeutet, dass zu diesem Brief ein
digitales Faksimile existiert, welches ebenfalls aufgerufen werden kann. Um das zu demonstrieren
kann man zum Beispiel den dritten Brief aus Band 20 anklicken, den Heine an Christian Sethe
geschrieben hat. Sobald der Benutzer sich für einen Brief entschieden hat, teilt sich der Bildschirmteil,
in dem zuvor »Briefwechsel« stand, in drei, virtuell sogar in vier Bereiche auf.
Abb 5: Parallele Darstellung von Brief- und Kommentartext
Die obere Zeile enthält Informationen, die in der gedruckten Version so nicht erscheinen. Es handelt
sich hierbei um zusätzlich von den Mitarbeitern des HHP erstellte standardisierte Briefköpfe, die eine
Kurzinformation über den folgenden Brief bieten, nämlich Absender, Empfänger, Ort, Datum,
Sprache, Original, Kategorie und so weiter. Neben diesen Angaben, die man über einen Brief erhält,
hat man auch die Möglichkeit, zum jeweiligen Antwortschreiben zu gelangen oder auch zu sehen,
welcher Brief in der Korrespondenz mit dieser Person dem aktuell betrachteten vorausgegangen ist.
Auf diesem Weg kann der gesamte Schriftverkehr Heines mit einer einzelnen Person verfolgt werden.
Hier besticht das Portal durch seinen eindeutigen Mehrwert der Buchausgabe gegenüber, da langes
und mühseliges Suchen in den HSA- Bänden nun entfällt.
Abb. 6: Parallele Darstellung von Brieftext und Original
In der linken Hälfte des mittleren Fensters erscheint der eigentliche Brieftext als exakte Wiedergabe
der Buchfassung, das heißt, dass das genaue Seitenlayout (zum Beispiel Seiten- und Zeilenumbrüche)
nachempfunden wurde. Gleiches gilt für die Typograhie (so sind zum Beispiel kursive
Herausgeberzusätze erkennbar und Sperrungen und Ähnliches werden beibehalten). Somit ist die
Zitierfähigkeit der elektronischen Ausgabe gesichert. Da die HSA jedoch auch einige Fehler enthält,
die von den Düsseldorfer Heine-Philologen sorgfältig korrigiert werden, müssen diese Korrekturen
sichtbar gemacht werden, damit einerseits die Referenz zur digitalisierten Ausgabe nicht gefährdet
wird und gleichzeitig der Mehrwert der überarbeiteten Fassung deutlich hervortritt. Neben dem rot
markierten Originaltext der HSA findet der Benutzer einen neuen schwarzen Text, der den eigentlichen
Inhalt des Heinetextes wiedergibt.
Hier wurde zum Beispiel ein Hochkomma durch ein Ausrufezeichen ersetzt oder ein ›und‹
ausgetauscht, das Heine abgekürzt nur ›u‹ schrieb.
Die rechte Hälfte des Fensters zeigt synoptisch zum Text den dazugehörigen Kommentar an. Auch
hier wurde dafür gesorgt, dass durch die ausgabengetreue Abbildung die Zitierfähigkeit gewahrt
bleibt. Der Kommentar beinhaltet als wichtigste Komponenten »Datum«, »Überlieferung« und
»Erläuterungen«. Dabei sind besonders die Erläuterungen interessant, sie sind Hyperlinks, das heißt,
die dunkelrot hinterlegten Worte sind anklickbar und führen direkt zu der gewünschten Information. In
dieser rechten Hälfte kann nun auch der zuvor erwähnte vierte Bereich konsultiert werden: die
handschriftliche Version der Briefe Heines.
Wie bereits angesprochen erscheint neben der Auflistung der Briefe immer ein kleines Symbol,
welches darauf verweist, dass zu diesem Brief ein Faksimile der Handschrift existiert. Wählt man nun
diesen Menüpunkt oben in der Kopfleiste aus, wird das Kommentarfenster durch die erste Seite des
Faksimiles ersetzt. In der Kopfinformation findet man auch zwei kleine Pfeile, mit deren Hilfe man
innerhalb eines Briefes vorwärts und rückwärts blättern kann. Insgesamt werden ungefähr 13.000
solcher Bilder in das Portal eingebunden. Dazu werden sie, um schnellere Ladezeiten zu
gewährleisten, natürlich in kleinerer Auflösung abgespeichert. Möchte der Benutzer jedoch die
nichtreduzierte Form eines Faksimiles betrachten, so ist auch dies problemlos: neben den Vorwärts/Rückwärts-Pfeilen gibt es einen Knopf, mit dem man das Bild vergrößern kann.
Das ist das bisherige Ergebnis innerhalb der Abteilung mit den Briefen. Die weiteren Bände der HSA
sind bereit zur Aufnahme in das Portal. Zur Zeit liegt der Schwerpunkt der Arbeiten auf der
Auszeichnung der Werke der DHA. Dazu wird dann, wie man an der Auflistung der Karteikartenreiter
auf der Startseite sehen kann, ein anderer Bereich auf der Oberfläche konzipiert. Auch dafür müssen
wieder die Bedürfnisse, die der Benutzer an das Portal haben könnte, sorgfältig erarbeitet und als
Auszeichnungen in den Text eingebracht werden, um die Suchmöglichkeiten entsprechend
bereitstellen zu können. Dies soll bis zum Ende der ersten Förderphase im Februar nächsten Jahres
abgeschlossen sein. Die aktuelle Version des HHP ist online zugänglich unter der Projektadresse
<www.hhp.uni-trier.de>(25.10.2004).
Nathalie Groß (Trier)
Nathalie Groß
Kompetenzzentrum für elektronische
Erschließungs- und Publikationsverfahren
in den Geisteswissenschaften
an der Universität Trier
Universitätsring 15
D-54286 Trier
[email protected]
(7. Januar 2005)
Heinrich Heine: Zur Geschichte der Religion und Philosophie in Deutschland. In: Heinrich Heine: Historischkritische Gesamtausgabe der Werke. Hg v. Manfred Windfuhr. Bd. VIII. Hamburg: Hoffmann und Campe 19731997, S. 13f.
[2] <http://www.dl-forum.de/Foerderung/Programme/RetroDigitalisierung/>(25.10.2004).
[3] Bernd Füllner/Christian Liedtke: Volltext, "Web" und "Hyperlinks". Das Heinrich-Heine-Portal und die digitale
Heine-Edition. In: Joseph A. Kruse (Hg.): Heine Jahrbuch 42 (3002), S. 178-187.
[4] Vgl. Fotis Jannidis: Wider das Altern elektronischer Texte: philologische Textauszeichnung mit TEI. In: editio 2
(1997), S. 152-177, bes. S. 152.
[5] Heinrich Heine: Historisch-kritische Gesamtausgabe der Werke. Hg v. Manfred Windfuhr/Heinrich-HeineInstitut. Hamburg: Hoffmann und Campe 1973-1997.
[6] Heinrich Heine: Säkularausgabe. Werke, Briefwechsel, Lebenszeugnisse. Hg. v den Nationalen Forschungs- und
Gedenkstätten der klassischen deutschen Literatur in Weimar (seit 1991 Stiftung Weimarer Klassik) und dem Centre
National de la Recherche Scientifique in Paris. Berlin: Akademie-Verlag/Paris: Edition du CNRS 1970 ff.
[7] Bernd Füllner/Johannes Fournier: Das Heinrich-Heine-Portal. Ein integriertes Informationssystem. In: Thomas
Burch u.a. (Hg.): Standards und Methoden der Volltextdigitalisierung. Beiträge des Internationalen Kolloquiums an
der Universität Trier, 8./9. Oktober 2001. Stuttgart: Franz Steiner Verlag 2003, S. 239-263.
[8] Zum besseren Verständnis der TEI: Fotis Jannidis: TEI in Praxis. An overview and summary of TEI in practice.
In: Jahrbuch für Computerphilologie online (1997) <http://computerphilologie.unimuenchen.de/praxis/teiprax.html> (25.10.04).
[9] SGML als Markierungssprache basiert auf dem 1969 von Charles Goldfarb entwickelten Vorläufer GML und
wurde 1986 von der International Standardization Organisation (ISO) als Standard veröffentlicht. Im Laufe des
Einsatzes von SGML zeigte sich, dass viele der dort vorgesehenen Kodierungsmöglichkeiten im normalen Gebrauch
nicht eingesetzt wurden und insbesondere die Sprache und die sie verarbeitende Software zu komplex werden ließen.
Aus diesem Grunde wurde 1997 XML als Vereinfachung von SGML eingeführt, ohne dadurch entscheidende
Verluste in der Mächtigkeit der Methode in Kauf nehmen zu müssen. Siehe zu SGML: Charles F. Goldfarb: The
SGML Handbook. Oxford: University Press 1990.
[10] Bei MySQL handelt es sich um ein frei verfügbares Datenbank-Management-System, mit dem sich besonders
leicht Datenbankserver für Internetapplikationen einrichten lassen. Weitere Informationen unter
<http://www.mysql.com> (25.10.2004).
[11] Tcl (Tool Command Language) ist eine einfache Scriptsprache, die leicht portierbar ist, d.h. sie arbeitet auf allen
gängigen Plattformen (Windows, Macintosh, Linux/UNIX). Weitere Informationen unter
<http://www.scriptics.com> (25.10.2004).
[12] Weitere Informationen zu CoST (Copenhagener SGML Tool) unter <http://www.flightlab.com/cost>
(25.20.2004).
[13] ZOPE (Z Object Publishing Environment) ist der führende Open-Source Webanwendungs-Server. Weitere
Informationen unter <http://www.zope.org>.
[1]
Herunterladen