DER DIGITALE HEINE – EIN INTERNETPORTAL ALS INTEGRIERTES INFORMATIONSSYSTEM Ich bin kein Gelehrter, ich gehöre nicht zu den 700 Weisen Deutschlands. Ich stehe mit dem großen Haufen vor den Pforten ihrer Weisheit, und ist da irgend eine Wahrheit durchgeschlüpft, und ist diese Wahrheit bis zu mir gelangt, dann ist sie weit genug: - ich schreibe sie mit hübschen Buchstaben auf Papier und gebe sie dem Setzer; der setzt sie in Bley und giebt sie dem Drucker; dieser druckt sie und sie gehören dann der ganzen Welt. Heinrich Heine[1] Abstract Since autumn 2002 this project is established as a cooperation between the Heinrich-Heine-Institut in Düsseldorf and the Competence Center for Information Retrieval and Electronic Publishing in the Humanities at the University of Trier. The corporation’s studies is the first complete unification and the electronic publishing of the works and letters of Heine in an open source internet portal, which can be expanded if required. The Düsseldorfer Historisch-kritische Ausgabe (DHA) and the volumes which contain the collection of letters of the Weimarer Säkularausgabe (HSA) act as referential editions for the portal, which includes more than just the provision of these texts: the portal provides a connection to the manuscripts and a digital picture gallery. In a second phase an extensive HeineBibliography will be added to the portal. Altogehter a global platform of information about Heinrich Heine will be generated. The course of the project is divided into three major steps: An exact analysis of the existing documents is being followed by the diagraming of structural and typographical characteristics of the texts with the help of an encoding compliant to TUSTEP. Afterwards the now digit texts are marked up according to the rules of the TEI. Finally the electronical publication of the database is being realised by employing the Content Management System ZOPE. Aus diesem Grund, nämlich weil sie nach Heines Ansicht der ganzen Welt gehören, soll auch die ganze Welt an Heines schönen Buchstaben teilhaben können. Wie würde das in der heutigen Zeit besser zu realisieren sein als über das Medium Internet?! Seit September 2002 fördert die Deutsche Forschungsgemeinschaft (DFG) im Rahmen des Programmes Retrospektive Digitalisierung von Bibliotheksbeständen[2] ein Kooperationsprojekt zwischen dem Heinrich-Heine-Institut der Stadt Düsseldorf und dem Kompetenzzentrum für elektronische Erschließungs- und Publikationsverfahren an der Universität Trier, welches in einem Zeitraum von insgesamt fünf Jahren eben dieses Ziel verfolgt: eine digitale Heine-Ausgabe weltweit zur Verfügung zu stellen[3]. Fragen sich nun manche Buchliebhaber nach dem Sinn einer digitalen Edition, so können hier mit gutem Gewissen drei Vorteile benannt werden, die diese dem Buch gegenüber besitzt: Zunächst ermöglicht eine solche Publikation von Texten eine schnelle Suche von Zeichenketten über lange Textpassagen hinweg. Zudem können komplexe Textbeziehungen sichtbar gemacht werden. Außerdem eröffnet eine digitale Edition die Möglichkeit, das Textmaterial ständig und nachhaltig zu verbessern und zu bearbeiten, ohne dass gleich ein Neudruck vonnöten wäre[4]. 1. Projektvorstellung Das Heinrich-Heine-Portal (HHP) wird die Werke und den Briefwechsel Heines als integriertes Informationssystem auf der Basis moderner Datenstandards (SGML/XML) im Internet zugänglich machen. Für den Inhalt und die wissenschaftliche Präsentation ist das Heine-Institut verantwortlich, die Textauszeichnung sowie die Entwicklung der graphischen Oberfläche werden vom Kompetenzzentrum durchgeführt. Die gemeinsame Grundlage für diese digitale Edition bilden die beiden historisch-kritischen HeineGesamtausgaben, die parallel in der Bundesrepublik und der DDR entstanden: die 1973-1997 erschienene Düsseldorfer Heine-Ausgabe (DHA)[5], herausgegeben von Manfred Windfuhr und die 1970-1984 erschienenen Briefbände der Heine-Säkularausgabe (HSA)[6], herausgegeben von den Nationalen Forschungs- und Gedenkstätten der klassischen deutschen Literatur in Weimar (heute Stiftung Weimarer Klassik) und dem Centre National de la Recherche Scientifique in Paris. Damit wird erstmals eine einheitliche und vollständige Gesamtausgabe von Heines Werken und Briefen vorgelegt, die zusätzlich auch die zwischenzeitlich neu oder wieder gefundenen Briefe einbezieht. Insgesamt müssen 26.500 Textseiten, die mit circa 72 Millionen Zeichen bedruckt sind, für die elektronische Publikation vorbereitet werden. Zusätzlich werden digitale Faksimiles zu Briefen und Werken sowie Bildmaterialien aus den Beständen des Heinrich-Heine-Instituts in das Portal eingegliedert. Geplant ist, dem Portal in einer zweiten Förderphase die fünf in Buchform vorliegenden Heine-Bibliographien (erfassen existierende Literatur bis 1995), hinzuzufügen und die seit dieser Zeit erschienenen Sekundärwerke zu Heine mittels einer seit einigen Jahren im Heine-Institut gepflegten Datenbank zur Bibliographie zu vervollständigen. 2. Dokumentanalyse Die Datenerfassung wurde von der Firma TQY Double-Key in Nanjing/China durchgeführt. Ein solches Vorgehen besitzt neben dem finanziellen Vorteil noch einen viel wesentlicheren Vorzug: die chinesischen Datentypisten sprechen kein Deutsch. Somit sind sie darauf angewiesen, Zeichen für Zeichen vom Papier auf die Tastatur zu übertragen. Fehler, die sich durch Sprachgefühl einschleichen, werden so vermieden. Bevor jedoch mit der Eingabe der Daten begonnen werden konnte, mussten die Dokumente zunächst genau betrachtet und beschrieben werden. In den beiden kritischen Heine-Ausgaben sind Texte versammelt, die einer Vielzahl verschiedener Texttypen (Lyrik, Drama, Prosa, Briefe, Kommentare, Apparate und so weiter) zuzuordnen sind und dementsprechend gänzlich unterschiedlichen Strukturprinzipien unterliegen. Die Erfassung dieser Texte zielt auf eine ›saubere‹ Datengrundlage ab, auf deren Basis ein TEI-konformes Markup möglichst automatisiert durchgeführt werden kann[7]. Dies kann nur gelingen, wenn die strukturellen Eigenarten der Text-, Kommentar- und Registerbände von DHA und HSA genau beschrieben und alle typographischen beziehungsweise auf das Layout der Texte bezogenen Charakteristika schon bei der Erfassung mit spezifischen Kodierungen versehen werden. Deshalb wurden alle Texte sorgfältig in Bezug auf ihre Makro- und Mikrostruktur hin analysiert, wobei zunächst die strukturell einfacheren Brief- und Kommentarbände der HSA und erst im Anschluss die eine Vielzahl unterschiedlicher Textsorten vereinigenden Bände der DHA beschrieben wurden. Ergebnis dieser Analyse waren genaue Aufstellungen über typographische Merkmale und Sonderzeichen, die die Basis für die Ausarbeitung einer exakten Anweisung zur Erfassung aller Texte darstellen. Für diese Erfassungsanweisungen wurden Tabellen erstellt, in denen alle im Text vorkommenden Phänomene in Bezug auf Layout und Sonderzeichen festgehalten und kurz erläutert wurden. Jedes Phänomen erhielt eine Kodierung nach TUSTEP-Konventionen (Tübinger System von Textverarbeitungsprogrammen) und wurde mit einem Muster belegt. Diese Muster sind den Texten entnommene Beispiele, auf denen die in der Tabelle beschriebenen Phänomene entsprechend markiert wurden, so dass jede typographische Besonderheit anhand eines Beispiels aus der Vorlage dokumentiert wurde. Dies diente dazu, den chinesischen Datentypisten ein exaktes ›Regelwerk‹ zur Erfassung an die Hand zu geben. Um Informationsverluste zu vermeiden, wurden die Ergebnisse der Analyse ins Chinesische übertragen. Mit Hilfe von @@1@ (vergleiche zu den Kodierungen Abbildung 2) kodieren die Chinesen beispielsweise eine Kopfzeile, @@3@ gibt an, dass an der Stelle ein Fußtext beginnt. Mit <p> werden verschiedene Absatztypen kodiert und <E> bzw. <E+1>/<E+X> zeigen an, um wie viele Stufen Einzug es sich handelt. Auch für Verszeilen (paariges <shi>), Tabellen (paariges <biaoge>), Marginalien rechts (paariges <you>) und links (paariges <zuo>) und so weiter wurden Markierungen vergeben; <konghang> steht für einen größeren Durchschuss. Nach Anlaufen der Erfassungsarbeiten wurden diese en fonction erweitert und optimiert, um so die ohnehin sehr geringe Fehlerdichte weiter zu verringern. Ein Beispiel hierfür ist die paarige Kennung <djys>...</djys>, die eine Art chinesisches Akronym für vielstufige Einzüge darstellt und die somit auch für die häufig vorkommenden vielfachen Einzüge gebraucht wird. Einige Sonderzeichen haben im Vorhinein noch keine Kennung erhalten, zum Beispiel die Symbole für Mann und Frau (HSA Band 22 und 26) oder ungewöhnliche Ligaturen (zum Beispiel die zwischen H und D in HSA Band 24K). An diesen Stellen fügten die Datentypisten eine dafür vorgesehene Zweifelskennung ein ({?AZIFU}), die während des Datenabgleichs durch XML-gerechtes Markup ersetzt wurde. 2.313 |$0 <konghang> |$00038.31 <P>&lt;A+1>16. #/+An Heinrich Straube in 2.314 Göttingen#/-</A+1></P> |$00038.32 2.315 <P>______________________________#/+Göttingen, 5. Februar 1821, |Montag#/-</P> 2.316 |$0 <konghang> |$00038.33 <shi>Wenn der Frühling kommt mit dem 2.317 Sonnenschein 2.318 |$00038.34 Dann knospen und blühen die Blümlein auf; |$00038.35 <zuo>35</zuo>Wenn der Mond beginnt seinen Stralenlauf 2.320 |$00038.36 Dann schwimmen die Sternlein hintendrein;</shi> 2.321 |$0 @@1@#/+März 1821#/-<S39> 2.322 |$00039.01 <shi>Wenn der Sänger zwey süße Äuglein sieht 2.323 |$00039.02 Dann quellen ihm Lieder aus tiefem Gemüth 2.324 |$00039.03 Doch Lieder und Sterne und Blümelei 2.325 |$00039.04 Und Äuglein und Mondglanz und Sonnenschein 2.326 |$00039.05 Wie sehr das Zeug auch gefällt,<you>5</you> 2.327 |$00039.06 Ist es doch noch lang nicht die Welt!</shi> 2.328 |$0 <konghang> |$00039.07 <P>__Ja, die Welt besteht noch aus andern 2.329 Ingredienzen. Wenn Du mahl in 2.319 |meinem |$00039.08 großen Naturepos lesen wirst von den unzähligen Goldäderchen die den Welt |$00039.09 körper durchweben, so wisse nur daß ich darunter 2.331 Ducaten, Louisd'ore un |$00039.10 Frd'ore verstehe. Ich denke heut mit meinen 2.332 Spießen auf's Reine zu 2.330 |kommen.<you>10</you> 2.333 |$00039.11 Bin jetzt am Packen. Schick mir gleich auf der Stelle: 1° Rousseaus Brief |2° |$00039.12 den Manfred und 3° das englische Buch. Vergiß nicht, Lausangel.</P> 2.335 |$00039.13 <P>__Dein Dich herzlich liebender.</P> |$00039.14 <P>______________________________Freund 2.336 und Gönner</P> |$00039.15 2.337 <P>________________________________________H. Heine Stud 2.334 |Juris.</P><you>15</you> Abb.2: Brieftext HSA 20, Nr.16, im TUSTEP-Format 3. Texterfassung und Korrekturabgleich Während die Dokumentanalyse der DHA noch andauerte, wurde bereits mit der Erfassung der HSABriefbände begonnen. Im März 2003 wurden Band 20 und Band 20K nach Trier übermittelt, so dass die Arbeiten für die automatisierte TEI-konforme Auszeichnung der Brieftexte und der zugehörigen Kommentare in Angriff genommen werden konnten. Die Erfassung aller HSA-Briefbände wurde im Mai 2003 abgeschlossen. Seit Juli 2003 liegen alle Text- und Kommentarbände der HSA-Briefe (HSA 20-27) sowie der Registerband (HSA 20-27R) in abgeglichenen, quasi ausgabendiplomatischen Versionen vor und stehen dem Kompetenzzentrum sowie dem DFG-geförderten Projekt Heine-Portal als TUSTEP- und als reine Textdateien zur Verfügung. Die Erfassung der DHA wurde im September 2003 abgeschlossen, die Differenzprotokolle bis Ende Dezember 2003 abgeglichen: So standen zu Beginn des Jahres 2004 alle Daten von HSA und DHA quasi ausgabendiplomatisch im TUSTEP- und im ASCII-Format zur Verfügung. 4. SGML- konforme Auszeichnung Durch die genaue digitale Abbildung der Texte ist schon ein erstes Ziel erreicht: Die Texte sind bereits voll recherchierbar, erste Anfragen an den Inhalt können durchgeführt werden. Nun sollen aber auch spezielle Suchen möglich sein. Um dies zu erreichen, sind weitere inhaltliche Beschreibungen der Texte notwendig. Informationen, nach denen der Benutzer suchen könnte, werden mit in die Kodierung aufgenommen. Dazu benötigt man die TEI (Text Encoding Initiaitve)[8], die auf der Grundlage von SGML/XML (Standard Generalized Markup Language/ eXtensible Markup Language)[9] basiert. Jeder Text wird einem bestimmten Dokumententyp zugeordnet, im Falle der Heine-Texte wären dies zum Beispiel Lyrik (%TEI.verse.dtd, Kurz: vedtd), Drama (%TEI.drama.dtd, kurz: drdtd) oder Prosa (%TEI.prose.dtd, kurz: prdtd). Der Brief wird zunächst als Einheit geklammert. Dazu setzt man sowohl vor die Nummer des Briefes, die ebenfalls einzeln getaggt wird, die Kennung "Brief" als auch an das Ende des Briefes ein entsprechendes Endtag "Brief" ein. Nach der Briefnummer steht die Anrede. Dann folgt der Brieftext. Dieser wird so geklammert, dass vor dem Text ein öffnendes Tag steht, welches nach dem Textende wieder geschlossen wird. Auf diese Art und Weise werden alle Elemente eines Textes identifiziert und mit den ihnen zukommenden Namen mittels XML-Code nach den Regeln der TEI (Text Encoding Initiative) etikettiert. Diese Auszeichnungen sind notwendige Anker, mit denen man auf die einzelnen Bestandteile eines Textes zurückgreifen kann. Die Suchmöglichkeiten, die der Nutzer des HHP einmal haben wird, hängen von den bei der Auszeichnung gesetzten Markierungen ab. Jede Markierung enthält eine Metainformation über den Text und bildet einen Absatzpunkt für eine Suchmaschine. Diese wird so konzipiert, dass sie einen Text einlesen kann und genau an den gesetzten Ankern anhält und diese sammelt. Dann werden die aufgefundenen Anker als Ergebnisse eines Suchvorgangs ausgegeben. Je genauer ein Text ausgezeichnet wird, desto komfortabler gestaltet sich später die Suche darin. Hier zeigen sich bereits die Vorteile einer SGML-Kodierung. Durch die Gliederung in verschiedene Ebenen, zum Beispiel durch Bezeichnung der Textsorte oder des Inhalts wird dem Benutzer mehr geboten als eine einfache Volltextsuche. Es kann en fonction der ausgezeichneten Elemente eine Suchmaschine aufgebaut werden, die detaillierte Abfragen gestattet. Um nach der Publikation der Brieftexte möglichst vielfältige Zugriffe auf einzelne Briefe oder Briefserien zu erhalten, wurden standardisierte Briefköpfe im TEI-Format erarbeitet, die Auskunft geben über: Absender/Empfänger, Aufenthaltsort des Absenders/Empfängers, Datierung (Datum und Wochentag), Textsorte (Brief, Widmung, Albumblatt, Stammbuchblatt et cetera), Thema (Schlagwörter) oder die in einem Brief verwendete Sprache (vergleiche Abbildung 3). Diese Informationen sind allesamt in ein Element <div3 type=“head“> ... </div3> (vergleiche Abbildung 3) geklammert. Nach der Content Declaration dieses Elements darf <div3> jedoch nur verwendet werden, wenn mindestens ein <p> ... </p> eingeklammert wird. Da die meisten Briefköpfe jedoch keine mit <p> ... </p> zu markierenden Passagen enthalten und die Dokumente somit nicht gültig validiert werden könnten, wurde letztlich per Programm vor alle </div3> ein ›leerer‹ Paragraph <p rend=“none“></p> eingefügt, der bei der späteren Ausgabe auf einen Browser unterdrückt werden muss und nur steht, um den Erfordernissen der TEI-DTD formal Rechnung zu tragen. Die Stimmigkeit der Auszeichnungsarbeiten wird durch einen SGML- Parser gewährleistet, der, ausgelöst durch einen bestimmten Kode, den Textkörper nach fehlerhaften Kodierungen durchsucht. <div2 type="letter" id="W20B0003"> <div3 type="metainfo"> <lb n="00019.05.01"> <label rend="briefnr">3</label> <byline>Von <name type="absender">Heinrich Heine</name> in <name type="place">Hamburg</name>, <date rend="datum" n="20111816">20. November 1816</date>, <date rend="day" n="3">Mittwoch</date><lb> an <name type="adressat">Christian <name type="lastname">Sethe</name></name> in <name type="place">Hamburg</name> <ref type="lang">Deutsch</ref> <ref type="faksimile" n="07">W20B0003.JPG</ref> <ref type="prev" target="W20B0002">Vorangehender Brief von Heine an Sethe</ref> <ref type="next" target="W20B0028">Nachfolgender Brief von Heine an Sethe</ref> </byline> </div3> </div2> Abb.3: Standardisierter Briefkopf zum Brief HSA 20, Nr.3 Auf der Grundlage der in den Briefköpfen angelegten Informationen können Indices erzeugt werden, über die etwa die chronologische, personenbezogene oder thematische Sortierung von Briefkorpora möglich ist. So kann man zum Beispiel von einem bestimmten Brief ausgehend direkt auf das dazugehörige Antwortschreiben zugreifen. Außerdem enthalten die standardisierten Briefköpfe Referenzen auf elektronische Faksimiles der Briefe, die mit den Texten verknüpft werden und auf Wunsch auf dem Bildschirm angezeigt werden sollen. 5. Elektronische Publikation Ausgangsbasis für die elektronische Publikation sind die XML-kodierten Daten. Jeder erfasste und ausgezeichnete HSA -Band bildet ein eigenes XML-Dokument. Zu jedem dieser Dokumente gibt es eine zugehörige Datei, die die Briefköpfe enthält. Sie werden ihrem jeweiligen Brief vorangestellt. Dabei ergibt sich eine eindeutige Zuweisung von Briefkopf, Brieftext, Briefkommentar und Faksimile (falls vorhanden), denn alle zusammengehörenden Elemente besitzen dieselbe Identifikationsnummer (id). Diese funktioniert wie eine Hausnummer: sie bezeichnet eine einzige Adresse, unter der man also alle Komponenten, die einen Brief ausmachen, finden kann. Sie sind somit eindeutige Identifikatoren (vergleiche Abbildung 4). W 20 B 0001 a Weimarer Band Brief Nummer des Ausgabe im Ausgabe Briefes gemäß der Anhang Ausgabe (Zusatz für nachträglich bearbeitete Briefe) Abb. 4: Aufbau einer id Mit den Informationen aus den Briefköpfen und den Textdaten werden mehrere Tabellen einer Datenbank auf Basis des Datenbank-Management-Systems MySQL[10] aufgebaut. Dieser Datenimport wird durch zahlreiche Scripte durchgeführt, die in der Sprache Tcl/Tk[11] unter Verwendung der SGML und XML verarbeitenden Erweiterung CoST[12] (Copenhagener SGML-Tool) implementiert wurden. Ein Script liest und verarbeitet den Brieftext, ein weiteres ist speziell für den Kommentar konzipiert und ein drittes filtert die relevanten Informationen aus den Dateien für die Briefköpfe. Bevor die Scripte die SGML/XML-Daten verarbeiten können, muss die Datenbank für das HHP initialisiert werden, das heißt es müssen die benötigten Tabellen definiert werden, um dann die Datensätze eintragen zu können. Zu diesem Zweck erzeugt das Programm sogenannte »tables«, (beispielsweise mit dem Kommando »create table letterinfo« eine Tabelle für die Briefkopfinformationen). Durch Kommas abgetrennt folgt die Aufzählung der Namen der Spalten und ihres Datentyps (zum Beispiel Informationen über Absender, Adressat, Datum, Typ des Briefes, Sprache, und so weiter). Für jeden Brief wird so eine Zeile in die Tabelle geschrieben. Neben den Kopfinformationen lesen die CoST-Scripte die XML-Dateien für die Brieftexte und kommentare und generieren HTML-Versionen, die ebenfalls in Datenbanktabellen abgelegt werden. Alle derart angelegten Tabellen bilden die gesamte Datenbank, die HHPdatabase. Die InternetApplikation greift auf diese Datenbank zu, sie ist ihre Ausgangsbasis. Von dort werden sämtliche Informationen abgerufen und in der graphischen Oberfläche angezeigt. 6. Content Management mit ZOPE Das Portal wurde mit dem Content Management System ZOPE[13] (Z Object Publishing Environment) erstellt, einer einheitlichen Arbeitsumgebung, in der man nur einen Internetbrowser benötigt, da alle Vorgänge über HTML-Seiten ablaufen. Damit besitzt das Portal den enormen Vorteil, nicht plattformgebunden zu sein. Überdies handelt es sich bei ZOPE um ein Open Source Produkt, das heißt, es ist kostenfrei verfügbar. Die Hauptseite des Portals, in der ZOPE-Appliaktion »index_html« genannt, stellt die am Projekt beteiligten Organisationen (Kompetenzzentrum, HHI, Kunststiftung NRW und DFG) vor und führt auf die zugehörigen Internetseiten. Überdies werden hier bereits die aktuellsten Informationen zum Projekt geboten. Über den Titel »Das Heinrich-Heine-Portal« als Hyperlink wird der Einstieg in das Portal ermöglicht. Die Methode »start« wird geladen. Auf dem Bildschirm erscheint »Herzlich willkommen« und eine Erläuterung dessen, was der Benutzer im Portal finden wird. Diese Methode baut framesets auf, die die Bildschirmeinteilung einrichten. Vier frames von oben nach unten angeordnet, title, menu, path, main, laden jeweils eine Seite oder Methode. »Title« lädt den Titel (Seite), der in der obersten Zeile steht und Angaben zu was, wer und wann gibt. Diese Zeile bleibt innerhalb des Portals immer unverändert. »Menu« lädt Menu (Seite) und es erscheinen die Karteikartenreiter, die dem Benutzer die Möglichkeiten des Portals aufzeigen (gelbe Zeile). »Path« ruft die Methode pathdisplay auf, welche wiederum eine andere, aus einem PythonScript generierte Methode aufruft, die ermittelt, wo im Portal man sich befindet und den Weg angibt (dunkelgelbe Zeile). Schließlich lädt »main« die welcome-Seite und der Nutzer gelangt zur Einleitung (»Herzlich willkommen«). Nun wählt man aus den dargebotenen Karteikartenreitern nach dem persönlichen Interessenschwerpunkt eine der Abteilungen »Aktuelles«, »Über Heinrich Heine«, »Werke«, »Briefwechsel«, »Bildmaterial«, »Einstellungen«, »Über das Projekt« und »Kontakt und Hilfe« aus. Bisher liegt eine ZOPE- Applikation für den Bereich der Briefe vor. Die Briefe von Heinrich Heine aus den HSA-Bänden 20 und 21 sowie die Antwortschreiben seiner Korrespondenten aus Band 24 sind ebenso wie der jeweilige Kommentar bereits im Netz recherchierbar. Wählt man die Briefabteilung, erscheint links eine Navigationsleiste, die die verschiedenen Möglichkeiten, in der HSA zu lesen, anbietet. So kann man zunächst die Bände ausgabenreferenziell konsultieren, was den Vorteil der Zitierfähigkeit der Internetversion beinhaltet. Außerdem ist chronologisches Vorgehen sowie alphabetische Suche nach Adressaten im Portal inbegriffen. Am Beispiel des Weges über die Ausgabe soll die Nutzbarkeit deutlich werden. Unter »Weimarer Ausgabe« wird Band 20 geöffnet. Es erscheint eine Liste aller Briefe des Bandes, die einem gewöhnlichen Inhaltsverzeichnis nachempfunden ist. Vor den jeweiligen Einträgen steht manchmal ein kleines Icon: das bedeutet, dass zu diesem Brief ein digitales Faksimile existiert, welches ebenfalls aufgerufen werden kann. Um das zu demonstrieren kann man zum Beispiel den dritten Brief aus Band 20 anklicken, den Heine an Christian Sethe geschrieben hat. Sobald der Benutzer sich für einen Brief entschieden hat, teilt sich der Bildschirmteil, in dem zuvor »Briefwechsel« stand, in drei, virtuell sogar in vier Bereiche auf. Abb 5: Parallele Darstellung von Brief- und Kommentartext Die obere Zeile enthält Informationen, die in der gedruckten Version so nicht erscheinen. Es handelt sich hierbei um zusätzlich von den Mitarbeitern des HHP erstellte standardisierte Briefköpfe, die eine Kurzinformation über den folgenden Brief bieten, nämlich Absender, Empfänger, Ort, Datum, Sprache, Original, Kategorie und so weiter. Neben diesen Angaben, die man über einen Brief erhält, hat man auch die Möglichkeit, zum jeweiligen Antwortschreiben zu gelangen oder auch zu sehen, welcher Brief in der Korrespondenz mit dieser Person dem aktuell betrachteten vorausgegangen ist. Auf diesem Weg kann der gesamte Schriftverkehr Heines mit einer einzelnen Person verfolgt werden. Hier besticht das Portal durch seinen eindeutigen Mehrwert der Buchausgabe gegenüber, da langes und mühseliges Suchen in den HSA- Bänden nun entfällt. Abb. 6: Parallele Darstellung von Brieftext und Original In der linken Hälfte des mittleren Fensters erscheint der eigentliche Brieftext als exakte Wiedergabe der Buchfassung, das heißt, dass das genaue Seitenlayout (zum Beispiel Seiten- und Zeilenumbrüche) nachempfunden wurde. Gleiches gilt für die Typograhie (so sind zum Beispiel kursive Herausgeberzusätze erkennbar und Sperrungen und Ähnliches werden beibehalten). Somit ist die Zitierfähigkeit der elektronischen Ausgabe gesichert. Da die HSA jedoch auch einige Fehler enthält, die von den Düsseldorfer Heine-Philologen sorgfältig korrigiert werden, müssen diese Korrekturen sichtbar gemacht werden, damit einerseits die Referenz zur digitalisierten Ausgabe nicht gefährdet wird und gleichzeitig der Mehrwert der überarbeiteten Fassung deutlich hervortritt. Neben dem rot markierten Originaltext der HSA findet der Benutzer einen neuen schwarzen Text, der den eigentlichen Inhalt des Heinetextes wiedergibt. Hier wurde zum Beispiel ein Hochkomma durch ein Ausrufezeichen ersetzt oder ein ›und‹ ausgetauscht, das Heine abgekürzt nur ›u‹ schrieb. Die rechte Hälfte des Fensters zeigt synoptisch zum Text den dazugehörigen Kommentar an. Auch hier wurde dafür gesorgt, dass durch die ausgabengetreue Abbildung die Zitierfähigkeit gewahrt bleibt. Der Kommentar beinhaltet als wichtigste Komponenten »Datum«, »Überlieferung« und »Erläuterungen«. Dabei sind besonders die Erläuterungen interessant, sie sind Hyperlinks, das heißt, die dunkelrot hinterlegten Worte sind anklickbar und führen direkt zu der gewünschten Information. In dieser rechten Hälfte kann nun auch der zuvor erwähnte vierte Bereich konsultiert werden: die handschriftliche Version der Briefe Heines. Wie bereits angesprochen erscheint neben der Auflistung der Briefe immer ein kleines Symbol, welches darauf verweist, dass zu diesem Brief ein Faksimile der Handschrift existiert. Wählt man nun diesen Menüpunkt oben in der Kopfleiste aus, wird das Kommentarfenster durch die erste Seite des Faksimiles ersetzt. In der Kopfinformation findet man auch zwei kleine Pfeile, mit deren Hilfe man innerhalb eines Briefes vorwärts und rückwärts blättern kann. Insgesamt werden ungefähr 13.000 solcher Bilder in das Portal eingebunden. Dazu werden sie, um schnellere Ladezeiten zu gewährleisten, natürlich in kleinerer Auflösung abgespeichert. Möchte der Benutzer jedoch die nichtreduzierte Form eines Faksimiles betrachten, so ist auch dies problemlos: neben den Vorwärts/Rückwärts-Pfeilen gibt es einen Knopf, mit dem man das Bild vergrößern kann. Das ist das bisherige Ergebnis innerhalb der Abteilung mit den Briefen. Die weiteren Bände der HSA sind bereit zur Aufnahme in das Portal. Zur Zeit liegt der Schwerpunkt der Arbeiten auf der Auszeichnung der Werke der DHA. Dazu wird dann, wie man an der Auflistung der Karteikartenreiter auf der Startseite sehen kann, ein anderer Bereich auf der Oberfläche konzipiert. Auch dafür müssen wieder die Bedürfnisse, die der Benutzer an das Portal haben könnte, sorgfältig erarbeitet und als Auszeichnungen in den Text eingebracht werden, um die Suchmöglichkeiten entsprechend bereitstellen zu können. Dies soll bis zum Ende der ersten Förderphase im Februar nächsten Jahres abgeschlossen sein. Die aktuelle Version des HHP ist online zugänglich unter der Projektadresse <www.hhp.uni-trier.de>(25.10.2004). Nathalie Groß (Trier) Nathalie Groß Kompetenzzentrum für elektronische Erschließungs- und Publikationsverfahren in den Geisteswissenschaften an der Universität Trier Universitätsring 15 D-54286 Trier [email protected] (7. Januar 2005) Heinrich Heine: Zur Geschichte der Religion und Philosophie in Deutschland. In: Heinrich Heine: Historischkritische Gesamtausgabe der Werke. Hg v. Manfred Windfuhr. Bd. VIII. Hamburg: Hoffmann und Campe 19731997, S. 13f. [2] <http://www.dl-forum.de/Foerderung/Programme/RetroDigitalisierung/>(25.10.2004). [3] Bernd Füllner/Christian Liedtke: Volltext, "Web" und "Hyperlinks". Das Heinrich-Heine-Portal und die digitale Heine-Edition. In: Joseph A. Kruse (Hg.): Heine Jahrbuch 42 (3002), S. 178-187. [4] Vgl. Fotis Jannidis: Wider das Altern elektronischer Texte: philologische Textauszeichnung mit TEI. In: editio 2 (1997), S. 152-177, bes. S. 152. [5] Heinrich Heine: Historisch-kritische Gesamtausgabe der Werke. Hg v. Manfred Windfuhr/Heinrich-HeineInstitut. Hamburg: Hoffmann und Campe 1973-1997. [6] Heinrich Heine: Säkularausgabe. Werke, Briefwechsel, Lebenszeugnisse. Hg. v den Nationalen Forschungs- und Gedenkstätten der klassischen deutschen Literatur in Weimar (seit 1991 Stiftung Weimarer Klassik) und dem Centre National de la Recherche Scientifique in Paris. Berlin: Akademie-Verlag/Paris: Edition du CNRS 1970 ff. [7] Bernd Füllner/Johannes Fournier: Das Heinrich-Heine-Portal. Ein integriertes Informationssystem. In: Thomas Burch u.a. (Hg.): Standards und Methoden der Volltextdigitalisierung. Beiträge des Internationalen Kolloquiums an der Universität Trier, 8./9. Oktober 2001. Stuttgart: Franz Steiner Verlag 2003, S. 239-263. [8] Zum besseren Verständnis der TEI: Fotis Jannidis: TEI in Praxis. An overview and summary of TEI in practice. In: Jahrbuch für Computerphilologie online (1997) <http://computerphilologie.unimuenchen.de/praxis/teiprax.html> (25.10.04). [9] SGML als Markierungssprache basiert auf dem 1969 von Charles Goldfarb entwickelten Vorläufer GML und wurde 1986 von der International Standardization Organisation (ISO) als Standard veröffentlicht. Im Laufe des Einsatzes von SGML zeigte sich, dass viele der dort vorgesehenen Kodierungsmöglichkeiten im normalen Gebrauch nicht eingesetzt wurden und insbesondere die Sprache und die sie verarbeitende Software zu komplex werden ließen. Aus diesem Grunde wurde 1997 XML als Vereinfachung von SGML eingeführt, ohne dadurch entscheidende Verluste in der Mächtigkeit der Methode in Kauf nehmen zu müssen. Siehe zu SGML: Charles F. Goldfarb: The SGML Handbook. Oxford: University Press 1990. [10] Bei MySQL handelt es sich um ein frei verfügbares Datenbank-Management-System, mit dem sich besonders leicht Datenbankserver für Internetapplikationen einrichten lassen. Weitere Informationen unter <http://www.mysql.com> (25.10.2004). [11] Tcl (Tool Command Language) ist eine einfache Scriptsprache, die leicht portierbar ist, d.h. sie arbeitet auf allen gängigen Plattformen (Windows, Macintosh, Linux/UNIX). Weitere Informationen unter <http://www.scriptics.com> (25.10.2004). [12] Weitere Informationen zu CoST (Copenhagener SGML Tool) unter <http://www.flightlab.com/cost> (25.20.2004). [13] ZOPE (Z Object Publishing Environment) ist der führende Open-Source Webanwendungs-Server. Weitere Informationen unter <http://www.zope.org>. [1]