Papyrus Portal - [svnextern.dl.uni-leipzig.de] Index of

Werbung
Papyrus Portal
Umsetzung einer
Portallösung für alle Papyrussammlungen
in Deutschland
von
Stefan Freitag (Uni Leipzig)
Marius Gerhardt (Uni Leipzig)
Jens Kupferschmidt (Uni Leipzig)
Prof. Reinhold Scholl (Uni Leipzig)
Leipzig, 07/04/2017
Version 1.1.1
Abstrakt
Das 'Papyrus Portal' ist ein Projekt, das dem Nutzer eine effiziente Suche durch alle
digitalisierten und elektronisch katalogisierten Papyrussammlungen Deutschlands und eine
einheitliche Präsentation der Suchergebnisse mit den wichtigsten Informationen zu einem
Papyrus ermöglicht. Außerdem wird auf die umfangreicheren und detaillierten Daten der
Originaldatenbanken verlinkt. Die inhaltlichen und informationstechnologischen Unterschiede
in den einzelnen Datenbanken auszugleichen, ist eine wesentliche Aufgabe des 'Papyrus
Portals'. Dafür wurden ein Standard für die Erschließungskategorien und Festlegungen für
Metadaten geschaffen. Das 'Papyrus Portal' ist kompatibel mit dem Advanced Papyrological
Information System (APIS) und anderen Metadatenbanken. Unter Verwendung der Open
Source Software 'MyCoRe' und aufbauend auf den Erfahrungen im 'Papyrusprojekt HalleJena-Leipzig' fand der Aufbau des 'Papyrus Portal' mit der finanziellen Unterstützung der
Deutschen Forschungsgemeinschaft statt.
Die vorliegende Dokumentation gliedert sich in folgende Teile:


Allgemeine Projektbeschreibung und Anleitung zur Benutzung des Systems
Beschreibung der inhaltlichen und informationstechnischen Umsetzung mit MyCoRe in
Verbindung zu anderen Datenbanken
Version 1.1.1
2
Änderungen
Version
1.0.0
1.0.1
1.0.2
Datum
09.08.2007
20.11.2007
22.01.2008
1.0.3
25.07.2008
1.0.4
1.0.5
1.1.0
1.1.1
24.09.2008
01.10.2008
10.10.2008
13.10.2008
Version 1.1.1
Autor
Jens Kupferschmidt, URZ der Uni Leipzig
Jens Kupferschmidt, URZ der Uni Leipzig
Jens Kupferschmidt, URZ der Uni Leipzig
Stefan Freitag, UBL
Marius Gerhardt, UBL
Stefan Freitag, UBL
Marius Gerhardt, UBL
Marius Gerhardt, UBL
Stefan Freitag, UBL
Stefan Freitag, UBL
Marius Gerhardt, UBL
Stefan Freitag, UBL
3
Abkürzungen
Kürzel
Erläuterung
ACL
Access Control List – eine Technologie für die Zugriffskontrolle auf Daten.
API
Application Programming Interface – eine allgemeine Bezeichnung der
Programmierschnittstellen in einem Projekt.
HSQLDB
Dies ist eine zu 100% in Java geschriebene SQL-Datenbank.
ID
Identifikator, eine eindeutige Marke
JAVA
Eine objektorientierte, weit verbreitete Programmiersprache.
JDBC
Java Database Connectivity – eine Schnittstelle zum einheitlichen Zugriff
auf relationale Datenbanken.
Jetty
Ein Servlet-Engine-Produkt.
SQL
Structured Query Language – eine vereinheitlichte Abfragesprache für
relationale Datenbanken.
UBL
Universitätsbibliothek Leipzig
URZ
Universitätsrechenzentrum der Universität Leipzig
XML
Extensible Markup Language – ein Standard zur Notation von Daten.
XPath
Ein Standard zum Zugriff auf XML-Daten.
XSLT
Extensible
Stylesheet
Language
for
Transformation
Beschreibungssprache zur Transformation von XML Daten.
Version 1.1.1
–
eine
4
Inhaltsverzeichnis
1 Projektbeschreibung und Benutzeranleitung ........................................................................... 7
1.1 Allgemeiner Stand der digitalisierten Papyrussammlungen in Deutschland .................... 7
1.2 Das 'Papyrus Portal' als virtuelle Zusammenführung der Sammlungen ........................... 8
1.3 Benutzung des 'Papyrus Portals'........................................................................................ 8
1.3.1 Aufbau der Homepage ................................................................................................ 8
1.3.1.1 Allgemeines .......................................................................................................... 8
1.3.1.2 Die Kurzbeschreibungen der teilnehmenden Sammlungen ................................. 9
1.3.2 Die Recherche........................................................................................................... 10
1.3.2.1 Die Suche in den Klassifikationsfeldern ............................................................ 10
1.3.2.2 Die Suche in den restlichen Feldern ................................................................... 10
1.3.2.3 Die Datumssuche................................................................................................ 11
1.3.2.4 Beispielsuchen .................................................................................................... 11
2 Technische und inhaltliche Umsetzung................................................................................. 12
2.1 Allgemeine Voraussetzungen und Ausgangslage ........................................................... 12
2.2 Die Portallösung .............................................................................................................. 14
2.3 Allgemeines zu MyCoRe ................................................................................................ 14
2.4 Zugriff auf die Datenbanken ........................................................................................... 15
2.4.1 Beteiligte Einrichtungen und ihre Anbindung .......................................................... 16
2.5 Die Client-Software ........................................................................................................ 16
2.5.1 Der Client ................................................................................................................. 16
2.5.2 Möglichkeiten und Grenzen des Clients ................................................................... 17
2.6 Felder der Suche und der Trefferliste im Portal .............................................................. 18
2.6.1 Inventarnummern (Port01) ....................................................................................... 18
2.6.2 Sammlung (Port02)................................................................................................... 19
2.6.3 Sprache (Port03) ....................................................................................................... 19
2.6.4 Textart (Port04) ........................................................................................................ 19
2.6.5 Titel (Port05) ............................................................................................................ 19
2.6.6 Datierung (Port06a und 06b) .................................................................................... 19
2.6.7 Herkunft (Port07 und 08) ......................................................................................... 20
2.6.8 Material (Port09) ...................................................................................................... 20
2.6.9 Inhalt (Port10)........................................................................................................... 20
2.6.10 Publikationsnummer (Port11)................................................................................. 20
2.6.11 Statischer Link (Port12).......................................................................................... 20
2.6.12 Weitere Links (Port13) ........................................................................................... 20
2.6.13 Freitext (Port14) ..................................................................................................... 21
2.6.14 Datum Erwerbung (Port 15) ................................................................................... 21
2.6.15 Text Erwerbung (Port16) ........................................................................................ 21
2.7 Mapping der Metadaten .................................................................................................. 21
2.8 Harmonisierung ............................................................................................................... 23
2.9 Korrekturen und Konkordanzen...................................................................................... 23
2.9.1 Konkordanz zur Klassifikationsliste des Materials .................................................. 24
2.9.2 Konkordanz zur Klassifikationsliste der Textart ...................................................... 24
2.9.3 Konkordanz zur Klassifikationsliste der Sprache ..................................................... 24
2.9.4 Konkordanz zur Klassifikationsliste des Ortes ......................................................... 24
2.9.5 Konkordanz zur Klassifikationsliste des Gaues ....................................................... 25
2.10 Klassifikationen ........................................................................................................... 25
2.10.1 Teilnehmende Sammlungen ................................................................................... 26
2.10.2 Klassifikationsliste Sprache .................................................................................... 26
2.10.3 Klassifikationsliste Textart ..................................................................................... 27
2.10.4 Klassifikationslisten Herkunft ................................................................................ 27
2.10.4.1 Klassifikationsliste Herkunft Gau .................................................................... 27
Version 1.1.1
5
2.10.4.2 Klassifikationsliste Herkunft Ort ..................................................................... 29
2.10.5 Klassifikationsliste Material ................................................................................... 33
3 Glossar ................................................................................................................................... 34
4 Anhang .................................................................................................................................. 35
4.1 Projektbeteiligte .............................................................................................................. 35
4.1.1 Projektleitung............................................................................................................ 35
4.1.2 Mitarbeiter ................................................................................................................ 35
4.1.3 Design ....................................................................................................................... 35
4.1.4 Hilfskräfte ................................................................................................................. 35
4.1.5 Antragsteller ............................................................................................................. 36
4.2 Checkliste für momentane und zukünftige Teilnehmer am 'Papyrus Portal' .................. 37
4.3 Client Dokumentation ..................................................................................................... 38
4.3.1 Zusammenfassung .................................................................................................... 38
4.3.2 Installation des Clients.............................................................................................. 38
4.3.3 Einstellungen der Filemaker-Datenbank .................................................................. 38
4.3.4 Konfiguration des Clients ......................................................................................... 39
4.3.5 Starten des Clients .................................................................................................... 40
4.3.6 Technische Informationen ........................................................................................ 40
4.3.6.1 Zuweisung von Feldern aus der Datenbank ....................................................... 40
4.3.6.2 Einstellen der Suchschärfe ................................................................................. 41
4.3.7 Die Properties-Datei ................................................................................................. 42
4.3.8 Datenanbindung zwischen Client und Portal............................................................ 42
4.3.9 Datenbankzugriffe .................................................................................................... 42
Version 1.1.1
6
1 Projektbeschreibung und Benutzeranleitung
1.1 Allgemeiner Stand der digitalisierten Papyrussammlungen in
Deutschland
Einige deutsche Papyrussammlungen haben ihre Bestände bereits digitalisiert und elektronische und im Internet benutzbare Kataloge angefertigt. So ist es möglich, die Papyri in
Heidelberg, Köln, Trier, Bonn, Giessen, Halle, Jena, Leipzig und Würzburg zu durchsuchen.
Einige der genannten Sammlungen haben ihre Katalogisierung und Digitalisierung noch nicht
abgeschlossen, andere wie z.B. Bonn haben gerade erst begonnen. Schließlich wird auch
Deutschlands größte Papyrussammlung, in Berlin, in naher Zukunft damit beginnen, ihre
Bestände zu digitalisieren und elektronische Kataloge im Internet zur Verfügung zu stellen.
Die Projekte zur Digitalisierung und elektronischen Katalogisierung fanden in den letzten
beiden Dekaden statt, was zur Folge hat, daß sie mit verschiedenen Entwicklungsstufen
geeigneter Software konfrontiert waren. So entwickelten sich auch verschiedene Lösungen,
um die jeweilige Papyrussammlung im Internet zu präsentieren.
In Giessen wurde mit Allegro C (Hans) eine Katalogisierungsoftware für Bibliotheken
verwendet. In Heidelberg, Köln, Trier und Bonn wurden auf der Grundlage der
Datenbanksoftware FileMaker unterschiedliche Lösungen entwickelt. Schließlich wurde auf
Grundlage von MyCoRe eine dritte Möglichkeit geschaffen, die zunächst im Papyrusprojekt
Halle-Jena-Leipzig Verwendung fand und dann auch von anderen Sammlungen übernommen
wurde.
Aufgrund dieser Vielfalt ist es bisher nicht möglich, alle deutschen Papyrussammlungen
gleichzeitig zu durchsuchen, wie man beispielsweise über das Advanced Papyrological Information System (APIS) alle teilnehmenden amerikanischen (und einige andere) Papyrussammlungen gleichzeitig durchsuchen kann. Deswegen wurde die Idee geboren, ein Instrument zu entwickeln, mit dem man auch die deutschen Papyrussammlungen gleichzeitig
durchsuchen kann. Damit soll nicht nur eine Vereinheitlichung der verschiedenen Lösungen
in den Papyrussammlungen erreicht, sondern darüber hinaus auch ein Standard geschaffen
werden, wie in der Zukunft Papyrussammlungen zu katalogisieren sind.
Die nachfolgende Tabelle beschreibt die konkreten Stadien der einzelnen digitalen Präsentationen der Papyrussammlungen, die bereits von Beginn an am Portal teilnahmen.
Lokation
Datenbank
Heidelberg
Filemaker (Version 8.5 Server), 3 separate Datenbanken
Trier
Filemaker (Version 8.5 Pro)
Köln
Filemaker (Version 7), online: statische HTML-Seiten; Migration
auf MyCoRe (Version 2.0)
Bonn
Filemaker (Version 9 Pro)
Gießen
Allegro C (HANS)
Halle-Jena-Leipzig
MyCoRe (Version 2.0)
Würzburg
MyCoRe (Version 2.0)
Tabelle 1: Beteiligte Papyrussammlungen
Version 1.1.1
7
1.2 Das 'Papyrus Portal' als virtuelle Zusammenführung der
Sammlungen
Die Zusammenführung der Sammlungen im Papyrus Portal erfolgt nur virtuell. Die Projektbeteiligten hatten sich im Vorfeld der Projektkonzeption gegen ein Harvesting der Daten
durch eine zentrale Instanz ausgesprochen. Somit werden zum Zeitpunkt einer Anfrage alle
beteiligten Systeme direkt abgefragt. Die Systeme in den Lokationen arbeiten völlig autonom.
Das nachfolgende Bild zeigt den allgemeinen Ablauf der Arbeit des Portals. Dabei geht es
vorrangig darum, was innerhalb der Portalanwendung abläuft. Funktionalitäten in den
einzelnen Lokationen werden dabei nicht berücksichtigt. Diese obliegen auch weiterhin der
Verantwortlichkeit und Gestaltung der jeweiligen Einrichtung.
Abbildung 1: Allgemeiner Ablauf der Suche
1.3 Benutzung des 'Papyrus Portals'
1.3.1 Aufbau der Homepage
1.3.1.1 Allgemeines
Der Internetauftritt des 'Papyrus Portals' ist relativ einfach und übersichtlich gestaltet, um dem
Benutzer einen schnellen Überblick und somit eine rasche Benutzung zu ermöglichen. Hier
werden kurz die einzelnen Punkte der Homepage erläutert.
Auf der Startseite gibt es die Möglichkeit, die Sprache zu wählen, in denen die Portalseiten
angezeigt werden sollen. Momentan sind das "Deutsch" und "Englisch". Durch die Wahl des
entsprechenden Buttons gelangt man auf die Hauptseite des 'Papyrus Portals'. Zwischen den
Sprachen kann man auch später und jederzeit wechseln, indem man in der schwarzen Leiste
rechts oben die jeweils andere Sprache wählt. Dabei wird direkt an der Stelle in die neu
gewählte Sprache gewechselt, an der man sich gerade befindet. Ein Neustart des 'Papyrus Portals' ist nicht notwendig.
Version 1.1.1
8
Abbildung 2: Hauptseite des 'Papyrus Portals'
Auf der Hauptseite des 'Papyrus Portals' sind alle weiteren, für den Benutzer relevanten Verweise zu finden. Grundlegend ist dabei, daß sich lediglich der mittlere, blaßgrüne Bereich ändert. Alle übrigen Bereiche der Homepage sind immer sichtbar und zu jedem Zeitpunkt benutzbar. Man gelangt dann immer auf die jeweils gewünschte Seite.
In der oberen schwarzen Leiste befinden sich neben der eben schon genannten Möglichkeit,
die Sprache zu wechseln, auf der linken Seite die Verweise, mit denen man jederzeit wieder
auf die Hauptseite gelangt ("Start") und sich eine Übersicht der gesamten 'Papyrus Portal'Homepage anzeigen lassen kann ("Sitemap").
In der linken Menüleiste befinden sich die meisten wichtigen Verweise des 'Papyrus Portals'.
Unter dem Punkt "Allgemeines" findet sich eine kurze Beschreibung des Projektes. Unter
"Recherche", dem wohl wichtigsten Menüpunkt des 'Papyrus Portals', liegt die Suchmaske.
"Teilnehmer" beinhaltet eine Karte, auf der die teilnehmenden Sammlungen verzeichnet sind.
Unter "Mitarbeiter" sind alle Antragsteller und Projektmitarbeiter des 'Papyrus Portals' aufge-
listet. Das "Glossar" bietet eine Liste von relevanten fachlichen Begriffen mit Erklärungen.
Diese Liste wird beständig mit einer vergleichbaren Liste des Papyrusprojektes Halle-JenaLeipzig abgeglichen und laufend ergänzt. Die "Dokumentation" enhält dieses Schriftstück und
weitere Dokumente, die den Hintergrund und die Arbeitsweise des 'Papyrus Portals' erklären.
Unter dem Verweis "Hilfe" sind einige allgemeinere Hinweise für eine Suche und Beispielsuchen zusammengefaßt worden. Der "Disclaimer" enthält den Haftungsausschluß. Unter
"Kontakt" sind relevante Kontaktpersonen und deren Adressen aufgelistet.
1.3.1.2 Die Kurzbeschreibungen der teilnehmenden Sammlungen
Die Verweise zu den Kurzbeschreibungen der teilnehmenden Sammlungen befinden sich am
rechten oberen Rand des zentralen Bereiches. Hier sind alphabetisch die Orte der
entsprechenden Sammlungen verzeichnet worden.
Die Kurzbeschreibungen selbst sind möglichst einheitlich gehalten. Hier findet man die Kontaktdaten der einzelnen Sammlungen und Verweise auf existierende Internetseiten, Datenbanken etc. auf der linken Seite und eine kurze Beschreibung der Sammlung, besonderer
Stücke und eine Liste der wichtigsten Literatur über die jeweilige Sammlung und ihre BestänVersion 1.1.1
9
de auf der rechten Seite. Zusätzlich ist eine kleine Abbildung eines besonderen Objektes jeder
Sammlung aufgenommen worden.
Bei jeder dieser Kurzbeschreibungen ist das Layout durch das 'Papyrus Portal' angefertigt und
vorgegeben worden. Die enthaltenen Inhalte der Seiten wurden jedoch von den jeweiligen
Sammlungen bestimmt. Diese sind auch für eine Aktualisierung dieser Seite verantwortlich.
Abbildung 3: Kurzbeschreibung der Leipziger Papyrus- und Ostrakasammlung
1.3.2 Die Recherche
Die Recherche ist das Kernstück des 'Papyrus Portals'. Im Folgenden sollen einige allgemeine
Suchhilfen und Beispiele gegeben werden, die die Suche über das 'Papyrus Portal' erleichtern
sollen. Kurze Hinweise und spezielle Suchhilfen für einzelne Felder (insb. zur Datumssuche)
finden man auch in den Hilfebuttons neben den einzelnen Suchfeldern, die mit einem “?”
gekennzeichnet sind.
1.3.2.1 Die Suche in den Klassifikationsfeldern
Für viele Felder erfolgt die Suche mit Hilfe von vorgegebenen Listen, in denen Sie den gewünschten Suchbegriff auswählen können. Das betrifft folgende Felder: Sprache, Textart, Ort,
Gau und Material. In den Listen sind alle Einträge der angeschlossenen Datenbanken aufgenommen worden, die in diesen Feldern vorkommen. Darüber hinaus sind verschiedene Varianten (z.B. unterschiedliche Schreibweisen) eines Eintrages vereinheitlicht bzw. zusammengefaßt worden. (s.u. Klassifikationen und Konkordanzen)
1.3.2.2 Die Suche in den restlichen Feldern
Version 1.1.1
10
Für eine Suche in den anderen Feldern (Inventarnummer, Titel, Datierung, Inhalt, Freitext)
gibt man den Suchbegriff direkt in eines der vorgesehenen Felder ein. Dabei kann man Worte
auch trunkieren und nur einen Teil eines Wortes eingeben, z.B. *klav* für eine Suche nach
"Sklave", "Haussklave", "Sklavenkauf" etc. Umlaute sind in ihre Grundbuchstaben aufzulösen
und in zwei Buchstaben abzubilden, z. B. ä als ae. Zu beachten ist, daß die Schreibweise (z.B.
vollständige Inventarnummern) sehr verschieden sein kann, so daß schon aufgrund eines fehlenden Leerzeichens ein Datensatz nicht gefunden werden kann.
Eine Kombination mehrerer Suchbegriffe in einem Feld ist möglich und wird automatisch als
logische "und"-Verknüpfung ausgeführt. Ebenso werden auch Einträge in verschiedenen
Feldern automatisch durch "und" verbunden. Eine gleichzeitige Suche nach verschiedenen
Begriffen, die nicht durch "und" verbunden werden sollen ("oder"-Verknüpfung), teilt man in
ihre Bestandteile auf und führt die Suchen nacheinander durch.
1.3.2.3 Die Datumssuche
Für eine Datumssuche müssen die Datumsangaben für den gesuchten Zeitraum eingeben
werden. Bei der Suche nach der Datierung wird immer nach einem Zeitraum gesucht. Deswegen werden die Datumsangaben immer in ein Startdatum und ein Enddatum aufgeteilt.
Daher sind auch bei exakten Datumsangaben immer beide Felder auszufüllen, z.B. für eine
Suche nach dem 12. Januar 31 n.Chr. ist in das "nicht vor" und in das "und nicht nach"-Feld
jeweils "12.01.31" einzugeben. Bei größeren Zeiträumen (z.B. Jahrhunderten) steht das "nicht
vor"-Datum für den Beginn und das "und nicht nach"-Datum für das Ende der Zeitspanne,
z.B. für eine Suche nach dem 1 Jh.n.Chr. ist in das "nicht vor"-Feld "1" und in das "und nicht
nach"-Feld "99" einzugeben.
1.3.2.4 Beispielsuchen
Gesucht sind alle Steuerlisten aus Hermupolis
Eingabe: "Hermupolis" aus der Liste im Feld "Ort" wählen, "Steuerliste" oder eine
entsprechend trunkierte Form (z.B. "Steuer*") im Feld "Inhalt" eingeben.
Gesucht sind alle Dokumente aus dem 3. Jh.v.Chr., die Sklaven betreffen
Eingabe: in den Datierungsfeldern "-299" in das Feld "nicht vor" und "-200" in das Feld "und
nicht nach" eingeben, "Sklav*" im Feld "Inhalt" eingeben.
Gesucht sind Texte aus dem Jahre 138 aus dem Arsinoites, in denen eine Person namens Pasion vorkommt
Eingabe: "Arsinoites" aus der Liste im Feld "Gau" wählen, "Pasion" oder eine entsprechend
trunkierte Form im Feld "Inhalt" eingeben, in den Datierungsfeldern "138" in das Feld "nicht
vor" und in das Feld "und nicht nach" eingeben.
Gesucht sind paraliterarische Texte aus Krokodilopolis
Eingabe: "Krokodilopolis" aus der Liste im Feld "Ort" wählen, "paraliterarisch" aus der Liste
im Feld "Textart" wählen.
Gesucht demotische Orakelfragen
Eingabe: "demotisch" aus der Liste im Feld "Sprache" wählen, "Orakelfrage" oder eine
entsprechend trunkierte Form (z.B. "Orakel*") im Feld "Inhalt" eingeben.
Version 1.1.1
11
2 Technische und inhaltliche Umsetzung
2.1 Allgemeine Voraussetzungen und Ausgangslage
Etliche deutsche Papyrussammlungen haben ihre Bestände bereits digitalisiert und Informationen über sie in Form von durchsuchbaren Datenbanken online der Öffentlichkeit zur
Verfügung gestellt. So können mittlerweile Informationen über die Papyri, Ostraka etc. folgender Sammlungen im Internet recherchiert und eingesehen werden: Bonn, Giessen, Halle,
Heidelberg, Jena, Köln, Leipzig, Trier, Würzburg. In den meisten dieser Standorte sind bereits
die kompletten Bestände online vorhanden und werden regelmäßig mit neuen Informationen
aktualisiert. In einigen Sammlungen ist diese Arbeit aber noch im Gange. Außerdem werden
auch in der Zukunft weitere Papyrussammlungen dieser Entwicklung folgen und ihre Bestände online den Wissenschaftlern und der Öffentlichkeit zur Verfügung stellen. Das betrifft
insbesondere Deutschlands größte Papyrussammlung in Berlin.
Nun ist es zwar möglich, jede der genannten Sammlungen online zu durchsuchen, doch ist das
ein zeitaufwendigen Unterfangen, da jede Datenbank separat durchsucht werden muß. Je
mehr Papyrussammlungen ihre Daten ins Internet stellen, desto aufwendiger wird eine solche
Suche also werden. Um diesen Makel zu beseitigen, wurde die Idee geboren, ein Instrument
zu schaffen, mit dem man all diese Papyrussammlungen zur gleichen Zeit durchsuchen kann.
Gleichzeitig sollte damit auch ein Standard geschaffen werden, wie in Zukunft Informationen
über Papyri, Ostraka etc. in einer Datenbank abgelegt werden sollen. Eine Standardisierung
der Einträge in den einzelnen Datenbanken war auch notwendig, um eine einheitliche Suche
und Trefferanzeige zu ermöglichen.
Ausgangspunkt der Überlegungen zu einem Instrument, mit dem man gleichzeitig alle angeschlossenen Papyrussammlungen durchsuchen kann, waren die Unterschiede zwischen den
einzelnen Datenbanken. Dabei war jedoch noch grundlegender zu beachten, daß diese
einzelnen Datenbanken auch auf verschiedenen Systemen laufen. Die folgende Tabelle gibt
eine Übersicht über die einzelnen Betriebssysteme, in denen die Datenbanken der jeweiligen
Papyrussammlungen laufen.
Lokation
Betriebssystem
Heidelberg
Windows Server 2003
Trier
Mac OS 10.5 Leopard
Bonn
Windows Server 2003
Giessen
Windows/Linux
Köln,
Würzburg,
(MyCoRe)
Halle-Jena-Leipzig Suse Linux 10.3
Tabelle 2: Beteiligte Lokationen und die verwendeten Betriebssysteme
Wie in der Tabelle zu sehen ist, sind alle drei größeren Betriebssysteme vorhanden, wodurch
bei einer Kommunikation der Standorte untereinander mit Kompatibilitätsschwierigkeiten zu
rechnen ist. Hinzu kommt, daß diese Betriebssysteme sich in der Zukunft verändern werden.
so ist davon auszugehen, daß nach ein paar Jahren auf dem jeweiligen Server eine neue Version des Betriebssystems installiert wird (Windows XP zu Windows Vista, Mac OS 10.5
Leopard zu Snow Leopard etc.). Zwar sind zukünftige Entwicklungen nicht vollständig
voraussehbar, doch gibt es bei allen Systemen Konstanten, die bei einer Entwicklung eines
Instruments für eine gleichzeitige Suche in allen Papyrussammlungen berücksichtigt werden
müssen.
Version 1.1.1
12
Von weitaus größerer Wichtigkeit sind jedoch die einzelnen Datenbanken, in denen die
jeweiligen Sammlungen die Daten zu ihren Beständen gesammelt haben. In der folgenden
Tabelle sind alle Datenbanktypen in den einzelnen Sammlungen.
Lokation
Systemtyp
Heidelberg
Filemaker (Version 8.5 Server)
Trier
Filemaker (Version 8.5 Pro)
Köln
Filemaker (Version 7), MyCoRe (Version 2.0)
Bonn
Filemaker (Version 9 Pro)
Giessen
Allegro HANS
Halle-Jena-Leipzig
MyCoRe (Version 2.0)
Würzburg
MyCoRe (Version 2.0)
Tabelle 3: Beteiligte Datenbanktypen
Eine mögliche Anbindung der einzelnen Datenbanken konnte mit allen Sammlungen
diskutiert werden.
Halle-Jena-Leipzig, Würzburg und Köln auf MyCoRe Basis (My Content Repository).
MyCoRe ist ein Open Source Projekt zur Entwicklung eines Systems für digitale Bibliotheken
und Archivlösungen. Auf der Basis eines Softwarekerns, der als Open Source unter der
“GNU-General Public License” verfügbar ist, können spezifische Anwendungen an den
jeweiligen Standorten realisiert werden. Mit der bestehenden, in ihrer strukturellen Bearbeitung neuartigen MyCoRe 2.0 Version können mehrere Instanzen nebeneinander arbeiten, da
es sich um eine neutrale Software handelt, die auf PC und Macintosh (Unix-Kern) funktioniert. Daten und Programm sind voneinander getrennt. Die Metadaten werden als XML-Daten
gespeichert. Die Bilder werden getrennt davon gehalten. Es gibt verschiedene Rechte und
damit verschiedene Informationen: Mitglied einer Sammlung, Mitglied eines Projektes und
Gäste.
Allegro C (HANS)
Bei allegro-Hans handelt es sich um eine auf allegro-C basierende Datenbanksoftware, die
speziell für die elektronische Erfassung von Handschriften, Autographen, Nachlässen und
Sonderbeständen konzipiert wurde. HANS ist keine Datenbank im eigentlichen Sinne,
sondern ein Datensystem, welches per Web-Anbindung Daten ex- und importieren und diese
in verschiedenen Formaten anzeigen kann.
Filemaker
Es existieren Datenbanken auf der Basis von FileMaker in Heidelberg, Köln, Bonn und Trier,
Diese bauen jedoch auf verschiedenen FileMaker Versionen auf. Trotz vieler Gemeinsamkeiten ist jede dieser Datenbanken in ihrer Struktur unterschiedlich. Die Datenbanken sind untereinander nicht kompatibel. Während die Datenbanken in Heidelberg, Bonn und Trier in der
Online-Version frei durchsuchbar sind, ist das in Köln nicht möglich. Es können dort lediglich die einzelnen erhobenen Datenfelder zu den jeweiligen Publikationsbänden angezeigt
werden. Man hat aber die Möglichkeit, sich die Daten nach den wichtigen Feldern sortiert anzeigen zu lassen.
Zu diesen Sammlungsdatenbanken kommt noch das Heidelberger Gesamtverzeichnis (HGV),
das wegen seiner andersartigen Zielsetzung nicht in ein deutsches Papyrus Portal integriert
werden kann; es erfaßt nämlich einerseits Papyri weltweit andererseits aber nur die bereits
publizierten, und nochmals eingeschränkt nur die dokumentarischen Papyri.
Version 1.1.1
13
2.2 Die Portallösung
Für eine Verbindung verschiedener Papyrusdatenbanken gibt es zwei Möglichkeiten. Bei der
einen Möglichkeit verbleiben alle Daten auf den lokalen Servern in den einzelnen
Papyrussammlungen und werden lediglich von einer zentralen Suchmaschine abgefragt. Das
hat den Vorteil, daß alle Daten autonom und die einzelnen Sammlungen direkt für ihre
Datenbanken und deren Inhalte verantwortlich bleiben. Außerdem könnte eine solche Lösung
einfach um weitere Sammlungen erweitert werden. Die Nachteile dieser Lösung sind ihre
Abhängigkeit von der Geschwindigkeit und der Auslastung der Netzwerke der einzelnen
Institutionen und dem Fakt, dass alle lokalen Sammlungen ihre Datenbanken auf jeweiligen
Serversystemen rund um die Uhr zur Verfügung stellen müssen.
Die zweite Möglichkeit ist das sogenannte Harvesting. Dabei werden alle Daten der lokalen
Papyrussammlungen in einer zentralen Datenbank gesammelt, die dann für eine Metasuche
zur Verfügung steht. Diese Lösung würde die Harmonisierung der Daten sehr einfach
machen. Suchen wären nicht mehr von der Geschwindigkeit und der Auslastung der
Netzwerke abhängig. Der Nachteil dieser Lösung ist der Umstand, dass alle Daten zur
gleichen Zeit sowohl in der lokalen Datenbank als auch in der zentralen Datenbank vorhanden
sind. Diese Daten müssten immer auf dem gleichen Stand gehalten werden, was nicht nur
arbeitsaufwendig ist sondern mitunter auch Probleme bei der Konsistenz der Daten beinhaltet.
Auf einem Workshop in Leipzig im November 2005 wurden die beiden Möglichkeiten mit
den Vertretern aller deutschen Papyrussammlungen diskutiert. Das Ergebnis war eine
Entscheidung für die Portallösung, bei der lediglich eine zentrale Suchmaschine die Daten in
den lokalen Sammlungen abfragt, und gegen die Harvestinglösung. Einzig für die Sammlung
in Giessen wurde ein partielles Harvesting entwickelt. Der Grund liegt in der
Anbindungsmöglichkeit der Allegro/Hans-Datenbank. Diese verfügt einzig über eine OAISchnittstelle, die ihre Daten via HTTP versendet. Aus der großen Anzahl von Datensätzen
und dem Kommunikationsmedium resultiert die Notwendigkeit eines vorherigen Erfassens
der Informationen. Andernfalls wäre die Geschwindigkeit einer Abfrage für eine
Echtzeitsuche nicht mehr zumutbar (Zugriffszeit für ca. 3000 Datensätze lag bei ca. 20
Minuten). Mögliche Treffer in Giessen werden dann wieder direkt mit den
Originaldatensätzen der Datenbank in Giessen verlinkt.
Aufgrund der guten Erfahrung, die im Papyrusprojekt Halle-Jena-Leipzig mit MyCoRe
gemacht worden waren, entschied man sich dafür, daß 'Papyrus Portal' auf der Grundlage von
MyCoRe zu erstellen.
2.3 Allgemeines zu MyCoRe
MyCoRe1 ist eigentlich als Repository für Dokumente und Sammlungen gedacht und implementiert worden. Da eine Vielzahl von Funktionalitäten wie ein Remote-Suchsystem, Verarbeitung mehrsprachiger statischer Web-Seiten und ein einfaches WCMS (Web Content
Management System) integraler Bestandteil sind, wurde von den Teilnehmern beschlossen,
das Papyrus-Portal-Projekt mit dieser Software zu realisieren. Hinzu kommt, dass diese Software durch ihre Open-Source-Lizensierung (GPL Version 2) frei verfügbar ist.
...
1 siehe http://www.mycore.de/
Version 1.1.1
14
2.4 Zugriff auf die Datenbanken
Der Zugriff des Portals auf die Datenbanken erfolgt mittels Connector/Client-Systemen. Diese
implementieren ein Interface zwischen der MyCoRe-Suche und den Sammlungen und
ermöglichen den Zugriff auf die entsprechenden Datenbanken. Bedingt durch die
unterschiedliche Struktur der Datenbanken sind hier verschiedene Techniken anzuwenden.



Zugriff über eine WebService-Schnittstelle zu allen MyCoRe-Papyrusprojekten
Zugriff über eine Socket-Dataobjekt-Schnittstelle unter Zuhilfenahme eines JDBCTreiber auf die FileMaker Datenbanken
Zugriff über eine Open-Archive-Schnittstelle auf die Allegro/Hans-Datenbank und
Extraktion von relevanten Suchinformationen
Abbildung 4: Schema des verteilten Zugriffes
Innerhalb der Clients werden alle sammlungsspezifischen Mappings durchgeführt. Darüber
hinaus verfügen die Clients über leistungsstarke Suchmaschinen für eine kombinierte
SQL/Information-Retrieval-Suche. Weiterhin sind die Clients für die Umsetzung spezieller
Konkordanzen zuständig. Das Resultat wird einheitlich entsprechend der Vorgabe für das
Portal zurückgegeben.
2.4.1 Beteiligte Einrichtungen und ihre Anbindung
Version 1.1.1
15
Lokation
Systemtyp
Anbindung
Heidelberg
Filemaker (Version 8.5 Server) JDBC-Abfrage, Client vor Ort installieren
Trier
Filemaker (Version 8.5 Pro)
Köln
Filemaker
(Version
MyCoRe (Version 2.0)
Bonn
Filemaker (Version 9 Pro)
JDBC-Abfrage, Client vor Ort installieren
Giessen
Allegro HANS
Partielles Harvesting2
Halle-Jena-Leipzig
MyCoRe (Version 2.0)
WebService
Würzburg
MyCoRe (Version 2.0)
WebService
JDBC-Abfrage, Client vor Ort installieren
7), Migration auf MyCoRe 2 bzw. Eingabe neuer Daten
direkt in MyCoRe 2, WebService
Tabelle 4: Beteiligte Datenbanktypen und ihre Anbindung
Tabelle 4 zeigt die beteiligten Sammlungen und spezifiziert ihre technischen Parameter. Die
Sammlungsanbindungen teilen sich in die Client-Systeme, die MyCoRe-WebServices und in
ein partielles Harvesting unter Verwendung der OAI-Schnittstelle.
2.5 Die Client-Software
2.5.1 Der Client
Für den Zugriff auf Standorte mit FileMaker-Datenbanken ist eine spezielle Software
erforderlich. Das Programm wird lokal beim jeweiligen Partner installiert und verfügt über
drei separate Schnittstellen. Die JDBC-Treiber-Anbindung der Datenbank stellt eine der
Schnittstellen dar. Die beiden verbleibenden Schnittstellen werden für die Kommunikation
mit dem Portal benötigt. Die Suchanfragen der Eingabemaske werden via Java-Socket durch
Kapselung als Datenobjekt an den Clienten versandt. Dieses Objekt versteht sich als Hülle für
den Transport der Suchinformationen. Im Client werden die Daten aufbereitet und als
dynamische partielle SQL-Suchanfragen über die JDBC-Schnittstelle an die FileMakerDatenbank weitergegeben.
Die Client-Anwendung kann auf die Datenbank ausschließlich lesend zugreifen. Ein
Schreibzugriff ist nicht möglich. Der Indexwert3 relevanter Suchergebnisse wird wiederum
durch Datenkapselung an die Portal-Applikation zurückgeschickt und in der Trefferliste
verarbeitet. Sobald ein Treffer in der Anzeige ausgegeben werden soll, findet wieder ein
Aufruf über Java-Socket zum Clienten statt. Die Daten werden nun per HTTP-Anfrage als
Datenstrom übertragen. Innerhalb des Datenstroms gekapselt findet sich die identifizierende
Identifikationsnummer wieder. Über diese ID wird der Datensatz aufgefunden. Ein XMLGerüst nimmt die Daten auf und sendet diese an die Anzeigeapplikation des Portals zurück.
Analog zu einer MyCoRe-MyCore-Anfrage werden die Daten dargestellt. Jeder angezeigte
Datensatz ist mit der Web-Publishing-Anwendung der FileMaker-Datenbank am Zielort
verlinkt.
2 Die Allegro-Hans-Datenbank bieten nur über OAI eine Anbindungsmöglichkeit. Diese Schnittstelle hat
jedoch Defizite in der Geschwindigkeit, so dass Informationen vor einer Anfrage bereits gesammelt werden
müssen, um dann eine zeitnahe Informationsauswertung und Antwortweiterleitung gewährleisten zu können.
3 Jeder Datenbankeintrag wird über einen Index eindeutig identifiziert.
Version 1.1.1
16
Abbildung 5: Schematische Darstellung der Clientanbindung
2.5.2 Möglichkeiten und Grenzen des Clients
Um den Client möglichst eigenständig und wartungsarm betreiben zu können, verfügt das
Programm über diverse Einstellungsmöglichkeiten, um auf Änderungen der Umgebung
reagieren zu können. Der Client enthält bei der Installation bereits die Konfigurationen der
einzellen Datenbankfelder wie sie in der Datenbank vorgehalten werden. Da hier mit
Klartextnamen gearbeitet wird, können diese Felder auch im Nachhinein angepasst und ggf.
verändert werden. Die dafür nötigen Informationen befinden sich in der
„config_sammlungsname.xml“-Datei. Durch die Nutzung zweier „Joker“-Felder können auch
nachträglich Feldinformationen ausgegeben werden. In der „properties.xml“-Datei werden
relevante Daten zum Datenbankzugang gespeichert. Dies gliedert sich im Einzelnen in
Benutzername, Passwort und Datenbankname. Für die Sammlung Heidelberg können 2
zusätzliche Datenbanknamen definiert werden. Neben diesen grundlegenden Aufgaben erfüllt
der Client aber auch Datenkonvertierung, beispielsweise für die Datumssuche. Da sich die
Dokumente im Zeitraum vor Christus (BC) und nach Christus (AD) befinden können, werden
alle gregorianischen Datumsangaben in das julianische Datum umgerechnet. So ist eine
genaue und effiziente Suche in den Datensätzen möglich.
Wie jedes Softwareprodukt sind dem Client aber auch Grenzen gesetzt. Das Programm
arbeitet auf verschiedenen Systemen mit verschiedenen Datenbanken zusammen. Hinzu
kommen sammlungsspezifische Besonderheiten, die unter den Aspekt des „Information
Retrieval“ fallen und vom Client nur bedingt vereinheitlicht werden können.
Kommt es zu einem Ausfall der Datenbank, so kann der Client natürlich keine Informationen
mehr sammeln und es kommt zum Ausfall des betreffenden Standortes im Portal. Fehler, die
durch unsachgemäße Datenverwaltung in der Filemaker-Datenbank entstehen, können vom
Client nicht korrigiert werden. Kommt es schlussendlich zu einem Ausfall des Clients, so
kann nur ein Neustart vor Ort das System wieder in Gang bringen.
Zu beachten ist außerdem, dass der Client nur in einem bestimmten Umfang getestet werden
konnte. Zum Zeitpunkt der Erstellung dieser Dokumentation läuft das Clientprogramm auf
Betriebssystemen wie „Mac OS 10“ und höher, sowie „Windows Server 2003“. Tests unter
„Windows XP“ und „Suse Linux 10.3“ waren ebenfalls erfolgreich. Mögliche
Wechselwirkungen mit bestimmten Programmen der beschriebenen Betriebssysteme können
die Funktionsweise des Clients beeinflussen, auch wenn die Wahrscheinlichkeit dafür relativ
gering ist.
Version 1.1.1
17
2.6 Felder der Suche und der Trefferliste im Portal
In der nachfolgenden Tabelle sind alle für das Portal festgelegten Felder für die Suche und
Trefferlistenanzeige notiert. Diese Felder erhalten zur besseren Orientierung Nummern, die
sie eindeutig im 'Papyrus Portal' identifizieren.
Nr.
Suche
Anzeige
Bemerkung
Port01
Inventarnummer
Inventarnummer
Text oder Textteile mit Trunkierung (*), Link zum
lokalen Datensatz
Port02
Sammlung
Sammlung
Auswahlliste
(s.
Klassifikation),
Sammlungsvorstellung
Port03
Sprache
Sprache
Auswahlliste (s. Klassifikation)
Port04
Textart
Textart
Auswahlliste (s. Klassifikation)
Port05
Titel
Titel
Text oder Textteile mit Trunkierung (*)
Port06v
Startdatum
Startdatum
Datum (von) in gregorianischer Schreibweise
Port06b
Enddatum
Enddatum
Datum (bis) in gregorianischer Schreibweise
Port07
Herkunft Gau
Herkunft Gau
Auswahlliste (s. Klassifikation)
Port08
Herkunft Ort
Herkunft Ort
Auswahlliste (s. Klassifikation)
Port09
Material
Material
Auswahlliste (s. Klassifikation)
Port10
Inhalt
Inhalt
Text oder Textteile mit Trunkierung (*)
Port11
Publikationsnummer
Port12
statischer Link
Verweis zum Originaldatensatz
Port13
weitere Links
z.B. zum HGV usw.
Link
zu
Port14
Freitext
Freitextsuche über alle Suchfelder, Text oder Textteile
mit Trunkierung (*)
Port15
Datum Erwerbung
Datum als Text
Port16
Text Erwerbung
Text oder Textteile mit Trunkierung (*)
Tabelle 5: Such- und Anzeigefelder für das 'Papyrus Portal'
Im Folgenden wird die Suche und Anzeige der einzelnen Felder beschrieben.
2.6.1 Inventarnummern (Port01)
Inventarnummern werden durchsucht, um dem Benutzer die Möglichkeit zu bieten, eine
Inventarnummer zu finden, ohne zu wissen, in welcher Sammlung das entsprechende Stück
aufbewahrt wird. Außerdem kann man in vielen Fällen so an Informationen über kleinere
Sammlungen innerhalb großer Sammlungen gelangen. Wegen der vielen Varianten und
Möglichkeiten der Darstellung von Inventarnummern in den einzelnen Datenbanken wird die
Suche automatisch als Freitextsuche im Feld „Inventarnummer“ vollzogen. Es können auch
Teile der Inventarnummer gesucht werden, z.B. nur die Zahl. Die Trunkierung erfolgt bei den
Zahlen automatisch, ansonsten durch "*". Für die Anzeigen wird der Inhalt des
entsprechenden Feldes aus der lokalen Datenbank komplett übernommen, doch sind i.d.R.
Ergänzungen nötig (z.B. „P. UB Trier S“ für die Trierer Inventarnummern). Diese ergeben
sich jedoch aus der Datenbank, aus der die Daten stammen. Die Inventarnummer dient
gleichzeitg als direkter Link zum entsprechenden Datensatz der lokalen Datenbank.
Version 1.1.1
18
2.6.2 Sammlung (Port02)
Die durchsuchbaren Sammlungen werden als Liste (s. Klassifikationen) angeboten, in der
Sammlungen durch ein Häkchen ausgewählt werden können. Möglich sind eine Suche durch
eine einzelne Sammlung, mehrere selbst kombinierte Sammlungen und alle Sammlungen
gleichzeitig. Für Heidelberg werden immer automatisch alle drei Kataloge durchsucht, eine
Auswahl einzelner Heidelberger Kataloge ist nicht möglich. Da mit Ausnahme der MyCoReDatenbanken dieses Feld in den lokalen Datenbanken nicht vorhanden ist, wird bei der
Anzeige in diesen Fällen automatisch die betreffende Sammlung eingesetzt.
2.6.3 Sprache (Port03)
Die möglichen Sprachen werden als Auswahlliste (s. Klassifikationen) angeboten.
"Ägyptisch" ist als einzige Sprache in ihre Schriften aufgeteilt worden: Hieroglyphisch,
Hieratisch und Demotisch. Nur diese können gesucht werden. Dies erschien notwendig, da
das Interesse des Benutzers einer Datenbank eher den einzelnen Schriften des Ägyptischen
gilt. Obwohl in Heidelberg für jede Sprache eine eigene Datenbank angelegt wurde, ist
trotzdem ein Feld „Sprachen“ vorhanden, so daß auch hier kein Sonderfall vorliegt. In der
Trefferliste wird immer der Eintrag des lokalen Datensatzes angezeigt.
2.6.4 Textart (Port04)
Die Textart gibt eine grobe inhaltliche Klassifizierung der Texte an. Die Suchmöglichkeiten
werden als Auswahlliste (s. Klassifikationen) angeboten. In der Trefferliste wird immer der
Eintrag des lokalen Datensatzes angezeigt.
2.6.5 Titel (Port05)
Die Suche erfolgt als Freitextsuche im Feld „Titel“, das in allen Datenbanken vorhanden ist.
Es wird nur dieses Feld in den Datenbanken durchsucht. Angaben in anderen Feldern werden
nicht berücksichtigt. Wegen der vielen Varianten und Möglichkeiten der Darstellung einer
Titelangabe können auch Teile des Titels oder eines Titelwortes gesucht werden. Die
Trunkierung erfolgt durch "*". Angezeigt wird das Feld „Titel“ aus der lokalen Datenbank.
2.6.6 Datierung (Port06a und 06b)
In allen Datenbanken wird zwischen einem Anzeigefeld und verschiedenen Suchfeldern
unterschieden. In den Suchfeldern ist die Eingabe der Daten allerdings nicht einheitlich. In
den Datenbanken nach Heidelberger Vorbild beispielsweise existieren separate Felder für die
Eingabe von Jahren und Jahrhunderten. All diese Felder werden in eine Datumssuche
einbezogen. Bei der Eingabe wird immer eine Zeitspanne („von“ – „bis“) in gregorianischer
Schreibweise eingegeben. Dabei können Tagesdaten oder auch nur Jahreszahlen eingegeben
werden. Für Datierung v.Chr. muß vor die komplette Datumsangabe ein "-" gesetzt werden,
z.B. -13.10.265 für den 13. Oktober 265 v.Chr. Bei einer Suche nach einem genauen Datum
(z.B. 18.10.31) muß dieses in beide Felder eingegeben werden.
Es findet immer eine scharfe Suche ohne jegliche Toleranz statt. Während der Suche wird das
gesuchte Datum und das Datum der Datensätze von MyCoRe bzw. von den Clients in ein
julianisches Datum umgerechnet und an die Erfordernisse der Suche angepasst. Für die
Version 1.1.1
19
Darstellung wird das Feld der lokalen Datenbanken ausgelesen und angezeigt. Eventuelle
Ungereimtheiten in diesen Feldern wurden den lokalen Datenbanken vorher mitgeteilt und
behoben.
2.6.7 Herkunft (Port07 und 08)
Die Suche nach der Herkunft ist in die Suche nach dem Ort und die Suche nach dem Gau
unterteilt. Für beide Suchen werden Auswahllisten (s. Klassifikationen) angeboten. Die Suche
in den lokalen Datenbank ist aufgrund der unterschiedlichen Eingabevarianten als
Freitextsuche in den entsprechenden Feldern gestaltet. Es fehlt häufig eine der beiden
Angaben. Die Anzeige wird aus dem Feldinhalt der lokalen Datenbank gespeist, da dort
zusätzliche Informationen (z.B. Fragezeichen) vorhanden sind, die so auch angezeigt werden
können.
2.6.8 Material (Port09)
Die möglichen Materialien werden als Auswahlliste (s. Klassifikationen) angeboten. In der
Trefferliste wird immer der Eintrag des lokalen Datensatzes angezeigt.
2.6.9 Inhalt (Port10)
Die Suche erfolgt ähnlich der Titelsuche als Freitextsuche, die sich ausschließlich auf das
Feld „Inhalt“ der jeweiligen Datenbanken erstreckt. Wegen der vielen Varianten und
Möglichkeiten der Eingabe eines Inhalts können auch Teile des Inhalts oder eines Wortes
gesucht werden. Die Trunkierung erfolgt durch "*". Angezeigt wird das Feld Inhalt der
lokalen Datenbank.
2.6.10 Publikationsnummer (Port11)
Nach den Publikationsnummern wird im 'Papyrus Portal' nicht gesucht. Das entsprechende
Feld in den lokalen Datenbanken wird aber in der Trefferliste angezeigt.
2.6.11 Statischer Link (Port12)
Hierbei handelt es sich um einen generierten Link, der direkt auf den entsprechenden
Datensatz der lokalen Datenbank führt. Dieser ist mit der Inventarnummer verknüpft, so daß
ein Anklicken der Inventarnummer direkt zum entsprechenden Datensatz der lokalen
Datenbank führt.
2.6.12 Weitere Links (Port13)
Mit "Weitere Links" sind Verweise zu anderen Metadatenbanken gemeint, z.B. HGV, CPP,
LDAB etc., die insbesondere für publizierte Stücke interessant sind. Dieses Feld wird vom
'Papyrus Portal' in den lokalen Datenbanken nicht durchsucht. Das entprechende Feld wird
jedoch ausgelesen und wird in der Trefferliste angezeigt.
Version 1.1.1
20
2.6.13 Freitext (Port14)
Die Suche erfolgt als Freitextsuche über alle Felder der Datenbank (mit Ausnahme der
Datumsfelder). Wegen der vielen Varianten und Möglichkeiten der Eingabe der
Informationen in den einzelnen Feldern können auch Teile eines Wortes gesucht werden. Die
Trunkierung erfolgt durch "*". In den MyCoRe-Datenbanken werden die mit
Klassifikationslisten versehenen Felder nicht in die Freitextsuche eingeschlossen. Angezeigt
werden jeweils die separaten Felder (s. unter den einzelnen Feldern für Spezifika).
2.6.14 Datum Erwerbung (Port 15)
Anders als bei der Datierungssuche erfolgt die Suche nach dem Datum der Erwerbung als
Freitextsuche, d.h. die eingegebenen Datumsangaben und die in den Sammlungsdatenbanken
vorhanden Datumsangaben in gregorianischer Schreibweise werden nicht in ein julianisches
Datum umgewandelt. Stattdessen wird die Zahlefolge (z.B. "1904") im entsprechenden Feld
der lokalen Datenbank gesucht. Angezeigt wird das Feld des Erwerbungsdatums der lokalen
Datenbank.
2.6.15 Text Erwerbung (Port16)
Die Suche erfolgt ähnlich der Titelsuche als Freitextsuche, die sich ausschließlich auf das
Feld „Erwerbung“ (u.ä.) der jeweiligen Datenbanken erstreckt. Wegen der vielen Varianten
und Möglichkeiten der Eingabe können auch einzelne Worte oder Teile eines Wortes gesucht
werden. Die Trunkierung erfolgt durch "*". Angezeigt wird das Feld "Erwerbung" der lokalen
Datenbank.
2.7 Mapping der Metadaten
Diesen soeben vorgestellten Feldern der Suche und Anzeige im 'Papyrus Portal' werden in den
einzelnen Datenbanken Felder eindeutig zugeordnet (Mapping). Dies ist in der folgenden
Tabelle dargestellt. Dabei ist zu beachten, daß immer nur die angegebenen Felder der lokalen
Datenbanken durchsucht und angezeigt werden. Alle anderen Felder bleiben unberücksichtigt.
Das bedeutet, daß auch nur gefunden werden kann, was in diesen Feldern eingetragen worden
ist. Die Verantwortlichkeit für die Inhalte liegt bei den lokalen Sammlungen.
Legende:
Es sind zunächst die Bezeichnungen der Felder angegeben worden, wie sie auch in den entsprechenden Such- und/oder Eingabemasken verwendet werden. Bei der Giessener Datenbank
sind die Bezeichnungen für die entsprechenden, über OAI ausgegebenen DC-Properties angegeben worden.
„Port”+Nr.: bezeichnet das Feld im 'Papyrus Portal'
„st“+Nr.: bezeichnet ein Feld im Schriftträgerdatensatz der MyCoRe-Datenbank
„te“+Nr.: bezeichnet ein Feld im Textdatensatz der MyCoRe-Datenbank
Version 1.1.1
21
Papyrusportal
Heidelberg
Bonn
Trier
MyCoRe (Halle, Jena, Köln, Giessen
Leipzig, Würzburg)
Inventarnummer
(Port01)
P_Heid_Inv_L
P.Bonn.Inv.
Inventarnummer
Inventarnummer (st02)
source.call_number
Sammlung
(Port02)
„Heidelberg“
„Bonn“
„Trier“
Sammlung (st04)
„Giessen“
Sprache (Port03)
Sprache
Sprache_Schrift
Sprache1, Sprache2
Sprache (st27)
language.text, language.script
Textart (Port04)
Art
Textart
Art
Textart (st24)
type
Titel (Port05)
Originaltitel
Titel
Titel
Titel (st01)
title.publication
Datierung
(Port06)
T, M, J, T2, M2, J2, Jh, Jh2, Tag, Monat, Jahr, Tag2, Monat2, Tag1, Monat1, Jahr1, Tag2, Monat2, Datierung: (st28/text) - „nicht date
Datierung
Jahr2, Jh, Jh2, Datierung
Jahr2, Jh1, Jh2, DatierungText
vor“ (st28/ivon), „und nicht
nach“ (st28/ibis)
Gau (Port07)
Herkunft
Nomos
Herkunft
Herkunft Gau (st29b)
coverage.origin
Ort (Port08)
Herkunft
Ort
Herkunft
Herkunft Ort (st29a)
coverage.origin
Material
(Port09)
Material
Material
Material
Material (st09)
format
Inhalt
(Port10)
Inhalt
Textinhalt
Inhalt
Inhalt (te07)
subject.subject_heading
subject.geographical_heading
subject.personal_names
Publ.Nr.
(Port11)
PublikationsL
Publikation
PublikationText
Publikationsnummer (st08)
source.publication_number
Statische URL
(Port12)
-
-
-
??
identifier
Weitere Links
(Port13)
*
*
*
Referenzwerke (te28)
-
Freitext
(Port14)
alles
alles
alles
alles
alles
Datum
Erwerbung
(Port15)
erworben durch: Jahr
Datum
Fundort
Kaufdatum (st06)
subject.aquisition_supplier
Text Erwerbung Fundort, erworben
(Port 16)
Name, Erw. Bem.
durch: Erwerb
Fundort
Erwerbung (st06)
Subject.aquisition_date
+
+
Tabelle 6: Mapping der Datenfelder
* Die entsprechenden Felder in den Datenbanken der Sammlungen Heidelberg, Bonn und Trier werden von diesen direkt eingetragen (Joker).
Version 1.1.1
22
2.8 Harmonisierung
Um eine möglichst effiziente Suche und eine korrekte Treffermenge zu erzielen, ist es sinnvoll, die Einträge in den verschiedenen lokalen Datenbanken für die Suche zu harmonisieren.
Das folgende Beispiel mag verdeutlichen, wie unterschiedlich die Einträge in den lokalen
Datenbanken sein können.
Beispiel: Hermupolis
Trier
Heidelberg
Bonn
Giessen
MyCoRe
Hermupolis
Hermupolis,
Hermopolis
-
Hermu Polis
Hermupolis
Tabelle 7: Harmonisierung
Die Differenzen zwischen den einzelnen Datenbanken auszugleichen, ist bei einer gleichzeitigen Suche über verschiedene Datenbanken sinnvoll, da ansonsten jede Möglichkeit separat
gesucht werden müßte. Eine gemeinsame Anzeige aller Treffer wäre dann nicht möglich. Deswegen sollten die verschiedenen Versionen harmonisiert werden.
Wie an diesem Beispiel auch sichtbar ist, können die Differenzen auch innerhalb einer Datenbank auftreten. Durch eine Harmonisierung der Daten erfolgt demnach auch eine qualitative
Aufwertung der Inhalte der lokalen Datenbanken.
2.9 Korrekturen und Konkordanzen
Um eine Harmonisierung unterschiedlicher Einträge in den lokalen Datenbanken zu erreichen,
gibt es prinzipiell zwei Möglichkeiten:

Korrektur vor Ort: Die Einträge in den lokalen Datenbanken werden durch Korrektur
an den im 'Papyrus Portal' verwendeten Standard angeglichen. Damit wird gleichzeitig
eine Datenpflege betrieben, die die Qualität der Inhalte der lokalen Datenbank
verbessert.

Konkordanz: In der Suchmaschine des 'Papyrus Portals' wird eine Konkordanz erstellt,
die automatisch bei einer Suche im 'Papyrus Portal' neben dem Standardeintrag auch
die Alternative sucht. Damit müssen in den lokalen Datenbanken keine weiteren Arbeiten vorgenommen werden. Außerdem würde auch der Arbeitsaufwand für derartige
Dinge bei Teilnehmern am 'Papyrus Portal' mit den gleichen Phänomenen stark verringert werden. Nachtteilig wirken sich Konkordanzen in großer Masse allerdings auf
die Suchgeschwindigkeit aus. Zudem kann die Trefferanzeige durch die vielen
verschiedenen Varianten sehr uneinheitlich wirken.
Da ein Standard in der Regel nur in den Feldern entwickelt wurde, die Klassifikationen enthalten, betrifft diese Harmonisierung vorrangig auch nur diese Felder. Nichtsdestotrotz erfordern vor allem auch die Datumsfelder einen Standard, damit sie von der Suchmaschine
korrekt ausgewertet werden können. Hier bieten sich allerdings lediglich Korrekturen in den
lokalen Datenbanken an, die den lokalen Datenbanken in derartigen Fällen auch mitgeteilt
wurden.
Die Konkordanzen sind den Klassifikationslisten (s.u.) zugeordnet. Bei einer Suche wird automatisch verglichen, ob es für einen Eintrag in der Klassifikationsliste auch einen Konkordanzeintrag vorhanden ist. Exisitiert er, wird er in die Suche einbezogen.
Version 1.1.1
Im Folgenden werden die einzelnen Konkordanzlisten vorgestellt. Sie sind jederzeit
erweiterbar, so daß auch weitere Varianten berücksichtigt werden können. Zu beachten ist,
daß wie bei den unten beschriebenen Klassifikationen lediglich die Inhalte der am 'Papyrus
Portal' beteiligten Sammlungsdatenbanken berücksichtigt wurden. Darüber hinaus ist keine
Vollständigkeit angestrebt worden.
2.9.1 Konkordanz zur Klassifikationsliste des Materials
Dateiname: PapyrusPortal_class_00000002.properties
Klassifikationseintrag
Konkordanz
andere
Bronze, Leder, Leinen, Rinde, Silber, Stein
Ostrakon
Ton
Hadernpapier
Papier
Wachstafel
Tabelle 8: Konkordanzliste Material
Wachs
2.9.2 Konkordanz zur Klassifikationsliste der Textart
Dateiname: PapyrusPortal_class_00000007.properties
Klassifikationseintrag
paraliterarisch
Tabelle 9: Konkordanzliste Textart
Konkordanz
semi-literarisch, halbliterarisch
2.9.3 Konkordanz zur Klassifikationsliste der Sprache
Dateiname: PapyrusPortal_class_00000009.properties
Klassifikationseintrag
Konkordanz
Lateinisch
Latein
Hieroglyphisch
Tabelle 10: Konkordanzliste Sprache
Hieroglyphen
2.9.4 Konkordanz zur Klassifikationsliste des Ortes
Dateiname: PapyrusPortal_class_00000011.properties
Klassifikationseintrag
Konkordanz
Alexandria, Hauptstadt Ägyptens
Alexandria, Alexandreia
Ankyron Polis
Ankyron, Ankyronon
Antinoopolis
Antinoupolis
Apollonopolis Mikra
Apollonospolis Mikra
Apollonopolis Megale
Apollonospolis Magna
Apollonopolis
Apollonos Polis
Version 1.1.1
Athribis
Atribis
Berenikis Thesmophoru
Berenike Thesmophoru
Demetriu Epoikion
Demetriu
Euhemeria
Euhemereia
Kloster Hathor
Hathor
Hermupolis
Hermopolis, Hermu polis
Krokodilopolis
Krokodilon Polis
Philadelphia
Philadelpheia
Philopator Apiados
Philopator
Philopator alias Theogenes
Philopator-Theogenes
Samaria
Samareia
Theadelphia
Theadelpheia
Theben
Diospolis Megale
Temgenuthis
Tegmenuthis
Troia
Tura
Terythis
Tabelle 11: Konkordanzliste Ort
Therythis
2.9.5 Konkordanz zur Klassifikationsliste des Gaues
Dateiname: PapyrusPortal_class_00000012.properties
Klassifikationseintrag
Konkordanz
gaufrei
Alexandria, Alexandreia
Arsinoites
Herakleidu Meris, Polemonos Meris, Themistu Meris
außerhalb Ägyptens
Tabelle 12: Konkordanzliste Gaues
Iudaea, Griechenland
2.10 Klassifikationen
Die Klassifikationen haben mehrere Funktionen. Zunächst sollen sie ganz sichtbar dem Benutzer vorgeben, was in den jeweiligen Feldern gesucht werden kann. Deshalb sind alle
Einträge in den entsprechenden Feldern der einzelnen Datenbanken in die Klassifikationen
aufgenommen worden. Somit enthält eine Klassifikation alles, was über das 'Papyrus Portal'
in den einzelnen Datenbanken gefunden werden kann.
Darüber hinaus wurden die Einträge in den Klassifikationen und den lokalen Datenbanken
vereinheitlicht. (s. Korrektur und Konkordanzen) Dadurch können auch verschiedene
Schreibweisen etc. eines Eintrages gleichzeitig gefunden werden. Gleichzeitig wird dem Benutzer die Suche erleichtert, da nun nicht mehr durch falsche Eingabe der Suchtermini falsche
bzw. unvollständige Ergebnisse gefunden werden können.
Die Klassifikationen sind jederzeit erweiterbar. Neue Einträge in den lokalen Datenbanken,
die eine Änderung oder Ergänzung der Klassifikationen des 'Papyrus Portals' zur Folge haben,
werden mit den Klassifikationen abgeglichen und führen zu deren Modifizierung und Ergänzung. Dies ist auch notwendig, weil der Datensatz mit den neuen Einträgen ansonsten über
das 'Papyrus Portal' nicht gefunden werden kann.
Version 1.1.1
Für die Anzeige der Treffer werden die Klassifikationen nicht mehr verwendet. Stattdessen
wird immer der komplette Inhalt des entsprechenden Feldes des gefundenen lokalen Datensatzes ausgelesen und angezeigt.
2.10.1 Teilnehmende Sammlungen
Dateiname: PapyrusPortal_class_00000001.xml
Sammlung
Bemerkungen
Bonn
FileMaker-Datenbank
Giessen
Allegro C (Hans) - Datenbank
Halle
Teil der MyCoRe-Datenbank Halle-Jena-Leipzig
Heidelberg
3 separate FileMaker-Datenbanken
Jena
Teil der MyCoRe-Datenbank Halle-Jena-Leipzig
Köln
FileMaker-Datenbank – nicht online, Daten werden als statische
Webseiten präsentiert, Beginn der Eingabe neuer Datensätze in
eigenständige MyCoRe-Datenbank
Leipzig
Teil der MyCoRe-Datenbank Halle-Jena-Leipzig
Tier
FileMaker-Datenbank
Würzburg
Eigenständige MyCoRe-Datenbank
Tabelle 13: Teilnehmende Sammlungen
2.10.2 Klassifikationsliste Sprache
Dateiname: PapyrusPortal_class_00000009.xml
Sprache
Bemerkungen
Arabisch
Aramäisch
Demotisch
Gotisch
Griechisch
Hebräisch
Hieratisch
Hieroglyphisch
Konkordanz: Hieroglyphen
Koptisch
Lateinisch
Konkordanz: Latein
Syrisch
unidentifiziert
"unidentifiziert" umfasst alles, was nicht identifiziert werden konnte oder
keine Sprache ist (z.B. Fälschungen, Zeichnungen).
Tabelle 14: Klassifikationsliste Sprachen
Sonderfall: Ägyptisch
Anstelle der Sprache "Ägyptisch" wurden deren Schriften aufgenommen, da in vielen
Sammlungen zwischen Sprache und Schrift nicht unterschieden wird. Da sich eine
Version 1.1.1
Konkordanz hier nicht schreiben läßt, sollte "Ägyptisch" nicht mehr als Sprache getragen
werden bzw. nur in Verbindung mit der Angabe der Schrift (Doppelkodierung).
2.10.3 Klassifikationsliste Textart
Dateiname: PapyrusPortal_class_00000007.xml
Textart
Bemerkungen
dokumentatisch
literarisch
nicht bestimmbar
paraliterarisch
Konkordanz: semi-literarisch, halbliterarisch
Tabelle 15: Klassifikationsliste Textart
2.10.4 Klassifikationslisten Herkunft
Es gibt zwei Klassifikationslisten für die Herkunftsangaben: eine für den Gau und eine für
den Ort. Aufgenommen wurde immer nur die griechischen Name, insb. für Attribute (Mikra
etc.). Arabischen, koptischen und demotischen Namen wurden nicht berücksichtigt. Sie
erscheinen in den lokalen Datenbanken auch nur sehr selten.
Die historische Entwicklung wird auch nicht berücksichtigt, da dies einem data-mining
gleichgekommen wäre. Das war aber im 'Papyrus Portal' nicht beabsichtigt. Deswegen sollten
in zweifelhaften Fällen immer mehrere Namen eingetragen werden, z.B. Theben und
Diospolis Magna. Solche Fälle tauchen aber in den lokalen Datenbanken kaum auf.
Vorhandene Ortsteile wurden aufgenommen. Da keine data-mining vorgenommen wird, ist es
allerdings anzuraten, jeweils den Ortsteilname und den Ortsname anzugeben, z.B. Iuliopolis
und Alexandria, damit der Datensatz auch bei einer Suche nach dem Ortsnamen gefunden
werden kann. Außer den drei arsinoitischen Merides werden keine weiteren Gauteile
aufgenommen.
2.10.4.1 Klassifikationsliste Herkunft Gau
Dateiname: PapyrusPortal_class_00000012.xml
Gauname
Ägypten
Bemerkungen
"Ägypten" ist aufgenommen worden, weil es in einigen Datenbanken
erscheint. Es sollte aber nicht mehr verwendet werden und möglichst
durch genauere Angaben ersetzt werden. Außerdem kann man in diesen
Fällen immer noch "unbekannt" kodieren. Eine Konkordanz läßt sich hier
nicht anwenden.
Antaiopolites
Antinoopolites
Aphroditopolites
Apollonopolites
Apollonopolites Heptakomias
Arkadia
Arsinoites
Version 1.1.1
Konkordanz: Herakleidu Meris, Polemonos Meris, Themistu Meris
Athribites
Bubastites
Diopolites Mikros
Eileithyiopolites
Heliopolites
Herakleidu Meris
Herakleopolites
Hermonthites
Hermopolites
Hypselites
Koptites
Kynopolites
Latopolites
Letopolites
Lykopolites
Memphites
Mendesios
Oasis Megale (Oasites)
Oasis Mikra (Oasites)
Oberägypten
"Oberägypten" ist aufgenommen worden, weil es in einigen Datenbanken
erscheint. Es sollte aber nicht mehr verwendet werden und möglichst
durch genauere Angaben ersetzt werden. Außerdem kann man in diesen
Fällen immer noch "unbekannt" kodieren. Eine Konkordanz läßt sich hier
nicht anwenden.
Ombites
Oxyrhynchites
Panopolites
Pathyrites
Peri Thebas
Polemonos Meris
Prosopites
Tanites
Tentyrites
Thebais
Themistu Meris
Thinites
unbekannt
gaufrei
Konkordanz: Alexandria, Alexandreia
nicht zuordenbar
"nicht zuordenbar" steht für Orte, die in mehreren Gauen vorkommen und
für die keine konkrete Zuordnung getroffen werden kann. Das sollte aber
möglichst die Ausnahme bleiben, da man für Orte, wo es nur wenige
(z.B. 3 oder 4) Gaue als Möglichkeiten gibt, auch einfach eine Liste
dieser Gaue verwenden könnte, so daß diese Datensätze bei einer Suche
nach den Gauen gefunden werden können.
außerhalb Ägyptens
Konkordanz: Iudaea, Griechenland
Tabelle 16: Klassifikationsliste Herkunft Gau
Version 1.1.1
2.10.4.2 Klassifikationsliste Herkunft Ort
Dateiname: PapyrusPortal_class_00000011.xml
Ortsname
Bemerkungen
Akanthon Polis
Akoris
Alabanthis
Alexandria, Hauptstadt Ägyptens
Konkordanz: Alexandria, Alexandreia
Ammonias
Andromachis
Ankyron Polis
Konkordanz: Ankyron, Ankyronon
Antaiupolis
Antinoopolis
Konkordanz: Antinoupolis
Anubias
Apa-Apollon Kloster zu Bawit
Aphrodites Polis
Aphrodito
Apias
Apollonopolis
s. Calderini, Alternative: Apollonos Polis
Apollonopolis Heptakomias
Apollonopolis Megale
Konkordanz: Apollonospolis Magna
Apollonopolis Mikra
Konkordanz: Apollonospolis Mikra
Areos Kome
Arsinoe
Arsinoiton Polis
Athribis
Konkordanz: Atribis
Babylon
Bakchias
Berenikis Thesmophoru
Konkordanz: Berenike Thesmophoru
Bompae
Bubastos
Bukolon Kome
Demetriu Epoikion
Konkordanz: Demetriu
Dinnis
Diokletianupolis
Dionysias
Diospolis Megale
Eileithyias Polis
Elephantine
Euergetis
Euhemeria
Version 1.1.1
Konkordanz: Euhemereia
Heliu Kome
Hephaistias
Herakleonos Epoikion
Herakleopolis
Hermonthis
Hermupolis
Konkordanz: Hermopolis, Hermu polis
Hiera Nesos
Hypsele
Ibion
Itos
Iuliopolis
Ortsteil von Alexandria, immer auch „Alexandria“ eintragen
Kaine
Kaisareia
Kaminon
Kanopos
Karanis
Kerke
Kerkeesis
Kerkeosiris
Kerkesephis
Kerkesucha
Kerkesucha Orus
Kerkeura
Kloster Hathor
Konkordanz: Hathor
Koba
Koptos
Krokodilopolis
Latopolis
Leukogion
Leukos Pyrgos
Lykopolis
Machor
Magdola Mire
Memnonia
Memphis
Mendes
Mermertha
Metne
Moeris
Moithymis
Monimu
Mothis
Naboo
Version 1.1.1
Konkordanz: Krokodilon Polis
Nebna
Nemaris
Nesla
Nesoi
Neson Kome
Nikopolis
Ortsteil von Alexandria, immer auch „Alexandria“ eintragen
Omboi
Ophis
Oxyrhyncha
Oxyrhynchos
Pakerkeesis
Pallos
Panopolis
Papa
Papa megale
Pathyris
Peenno
Pekty
Pela
Pelusion
Pentakomia
Pesla
Petne
Pharbaithos
Phathor
Phebichis
Philadelphia
Konkordanz: Philadelpheia
Philopator alias Theogenes
Konkordanz: Philopator-Theogenes
Philopator Apiados
Konkordanz: Philopator
Philoteris
Phnebieus
Phobou
Phys
Pois
Psenaryo
Psenbelakai
Psenbelaki
Psenbella
Psenbelochis
Ptolemais
Ptolemais Euergetis
Ptolemais Hermiu
Ptolemais Hormu
Version 1.1.1
Samaria
Konkordanz: Samareia
Seryphis
Sesphtha
Side
Sinary
Sinkepha
Soknopaiu Nesos
Styra
Syene
Syron Kome
Talao
Talei
Tamais (Tamauis)
Tanais
Tanis
Tanyaithis
Tarrhuthis
Tebetny
Tebtynis
Temgenuthis
Ortsteil von Oxyrhynchos, immer auch „Oxyrhynchos“ eintragen,
Konkordanz: Tegmenuthis
Temseu Skordon
Tentyra
Terenuthis
Tertembythis
Tertonpsembe
Terythis
Teslot (Tachlut)
Theadelphia
Konkordanz: Theadelpheia
Theben
Konkordanz: Diospolis Megale
Theodosiopolis
Theogonis
Theoxenis
Thesmophoriu amphodon
Ortsteil von Arsinoe, immer auch „Arsinoe“ eintragen
Tholthis
Tinteris
Tisichis
Tou
Troia
Konkordanz: Tura
unbekannt
Tabelle 17: Klassifikationsliste Herkunft Ort
Version 1.1.1
2.10.5 Klassifikationsliste Material
Dateiname: PapyrusPortal_class_00000002.xml
Textart
andere
Bemerkungen
"andere" ist die Sammelkategorie, die alle Materialien aufnimmt, die
entweder zu selten vorkommen, um einzeln verzeichnet zu werden, oder
noch gar nicht aufgenommen wurden. Konkordanz: Stein, Bronze, Leder,
Leinen, Rinde, Silber.
Blei
Hadernpapier
Konkordanz: Papier
Holz
Ostrakon
Konkordanz: Ton
Papyrus
Pergament
unbekannt
Wachstafel
Konkordanz: Wachs
Tabelle 18: Klassifikationsliste Material
Version 1.1.1
3 Glossar
Harvesting
Als Harvesting, also eine Ernte, bezeichnet man ein Verfahren bei dem Daten durch ein
Leseverfahren von räumlich entfernten Servern eingesammelt werden. Die so gewonnenen
Daten werden nun als Dienst Clients zur Verfügung gestellt. Bekanntester Vertreter ist das
OAI-Projekt.
Metadaten
Unter Metadaten sind alle zum eigentlichen Objekt (in diesem Falle Papyri oder Dokumente)
gehörenden beschreibenden Daten zu physikalischen und inhaltlichen Angaben zu verstehen.
Servlet-Engine
Servlets sind Programmteile, welche mit einen Web-Browser kommunizieren können und dynamische Web-Inhalte erzeugen. Die Servlet-Engine steuert den Zugriff auf die darin konfigurierten Servlets. Typische Vertreter sind die Projekte Tomcat und Jetty.
Version 1.1.1
4 Anhang
4.1 Projektbeteiligte
4.1.1 Projektleitung

Herr Prof. Dr. Reinhold Scholl,
Leiter des Projektes
Universitätsbibliothek Leipzig, Universität Leipzig
[email protected]

Herr Dipl.-Inf. Jens Kupferschmidt,
IT Verantwortlicher des Projektes
Universitätsrechenzentrum, Universität Leipzig
[email protected]
4.1.2 Mitarbeiter

Herr Marius Gerhardt, M.A.,
Wissenschaftlicher Mitarbeiter
Universitätsbibliothek, Universität Leipzig
[email protected]

Herr Dipl.-Inf. Stefan Freitag,
Informatiker
Universitätsbibliothek, Universität Leipzig
[email protected]
4.1.3 Design

Frau Marianne Schiller,
Designerin
Thüringer Universitäts- und Landesbibliothek Jena
4.1.4 Hilfskräfte

Frau Margit Homann, B.A.,
Studentische Hilfskraft
Universitätsbibliothek, Universität Leipzig

Herr Frank Ursin,
Studentische Hilfskraft
Universitätsbibliothek, Universität Leipzig

Herr Abde Ssamad Karmoun,
Studentische Hilfskraft
Universitätsbibliothek, Universität Leipzig
4.1.5 Antragsteller

Herr Prof. Dr. Andreas Mehl,
Institut für Altertumswissenschaften, Universität Halle
Version 1.1.1

Herr Prof. Dr. Ulrich Schneider,
Universitätsbibliothek Leipzig, Universität Leipzig

Herr Prof. Dr. Reinhold Scholl,
Universitätsbibliothek Leipzig, Universität Leipzig

Herr Prof. Dr. Rainer Thiel,
Institut für Altertumswissenschaften, Universität Jena

Frau Dr. Sabine Wefers,
Thüringer Universitäts- und Landesbibliothek Jena
Version 1.1.1
4.2 Checkliste für momentane und zukünftige Teilnehmer am
'Papyrus Portal'
1. Technische Anforderungen (s. auch Client Dokumentation)

kompatible Datenbank mit JDBC-Schnittstelle (z.B. FileMaker Pro/Server) oder Content Repository System (z.B. MyCoRe)

schnelle Internetanbindung (mind. 768kBit/s)

offene Kommunikationsstruktur


konfigurierbare Firewall

keine sonstige Barrieren oder Einschränkungen (z.B. vonseiten
vorgeschalteter Institutionen wie Rechenzentrum)
Datenbank muß immer online aktiv sein
2. Inhaltliche Anforderungen (s. auch Portaldokumentation)

Erstellung eines Feldmappings (Feldzuordnungen) zwischen Datenbankfeldern und
Portalfeldern

Übernahme der Portal-Klassifikationen für die relvanten Felder – Mitteilung von
Ergänzungen (insb. für die Konkordanzen)

Normalisierung der Datumsangaben




Angabe von Tag, Monat, Jahr oder Jahrhundert




Datierungsbeginn und Datierungsende (von ... bis ...)
Grundsätzlich ist eine enge Absprache mit Portalbetreiber notwendig.
Version 1.1.1
4.3 Client Dokumentation
4.3.1 Zusammenfassung
Dieses Programm wurde für die Anbindung einer Filemaker-Datenbank an das MyCoReSystem entwickelt. Über den mitgelieferten JDBC-Treiber der Filemaker-Datenbank werden
die Daten über Standard-SQL-Befehle abgerufen. Eine TCP/IP-Verbindung realisiert den
Datenaustausch mit der entfernten MyCoRe-Anwendung 'Papyrus Portal'.
Dieses Programm kann ausschließlich lesend auf die Datenbank zugreifen. Es werden keine
Modifikationen, Updates, Löschungen oder anderweitige datenmanipulierende Zugriffe auf
die Datensätze unterstützt oder ausgeführt.
4.3.2 Installation des Clients
Das Clientprogramm benötigt für den Betrieb eine Java Virtual Machine (JVM). Bei den
meisten Computersystemen ist eine JVM bereits vorinstalliert. Sie können dies über den
Befehl „java -version“ in der Kommandokonsole überprüfen. Sollte hier keine Version
gefunden werden, so können Sie das Java-Paket aus dem Internet manuell nachinstallieren
(http://java.sun.com).
Das Clientprogramm selbst kann bequem per Doppelklick auf die entsprechende JAR-Datei
installiert werden (client-Sammlungsname-install.jar). Danach erfolgt eine teilautomatisierte
interaktive Installation. Hier haben Sie die Möglichkeit einen Installationspfad zu wählen und
Entscheidungen über die Installationsauswahl zu treffen (Core  Kern, erforderlich; Source
 Quellcode, nicht erforderlich).
4.3.3 Einstellungen der Filemaker-Datenbank
Damit eine Kommunikation zwischen Client und Datenbank stattfinden kann, müssen
Einstellungen im Filemaker-Programm getroffen werden.
Abbildung 6: Menüauswahl für das JDBC-Sharing
Version 1.1.1
Abbildung 6 zeigt den Auswahlpunkt „ODBC/JDBC“ im Menü „Datei“. Die FilemakerDatenbank besitzt die Möglichkeit, Informationen aus einer Datenbank über eine Schnittstelle
anzubieten. Diese Option muss allerdings vorher aktiviert werden. Öffnen Sie dazu die
Datenbank(en) und rufen Sie das ODBC/JDBC-Menü aus dem Sharing-Bereich auf.
Hier finden Sie zunächst die geöffneten Datenbanken im linken Fenster. Wählen Sie nun die
Datenbanken aus und stellen Sie den Schalter „ODBC/JDBC-Sharing“ auf „Ein“ (siehe
Abbildung 4).
Abbildung 7: Sharing-Fenster (ohne geöffnete Datenbank)
Für den Betrieb sind zusätzlich die Tabellennamen der Datenbanken relevant (siehe Punkt
4.3.4: Konfiguration des Clients).
Abbildung 8: Datenbankverwaltung
Um den Tabellennamen zu identifizieren rufen Sie das Menü „Datei“ mit dem Unterpunkt
„Verwalten“ auf. Wählen Sie dort den Eintrag „Datenbank“. Sie erhalten dann ein ähnliches
Fenster wie inAbbildung 8 zu sehen ist. Im Reiter „Felder“ erscheint oben im Pulldown-Menü
der Tabellenname. Er wird zwingend für die Konfiguration des Clients benötigt.
4.3.4 Konfiguration des Clients
Die Client-Programme für die jeweiligen Sammlungen sind bereits vorkonfiguriert. Einzig die
Angaben für den Benutzernamen, das Passwort und der Datenbank-Tabellenname sind
nachzutragen. Nach dem ersten Start des Clients erscheint dafür ein Popup-Fenster mit einer
kurzen Beschreibung.
Hier lautet die Abfolge: „username“, „password“ und „database“. Für die Sammlung in
Heidelberg folgt zudem noch die Abfrage für „database2“ und „database3“.
Version 1.1.1
Neben den genannten Einstellungen existiert eine Konfiguration für die Feldnamen innerhalb
der Datenbanken. Dies ist bei der Auslieferung bereits fest eingerichtet. Sollte es eine
inhaltstechnische Änderung an der Datenbankstruktur geben, so kann hier eine Korrektur
durchgeführt werden.
Eine detailierte Feldnamenauflistung findet sich unter Punkt 5: Technische Informationen.
In der Konfiguration existieren zwei „Joker“-Feldnamen, die momentan keine Belegung
besitzen. Sollte im Laufe des Projektes die Notwendigkeit einer zusätzlichen
Feldinhaltsausgabe auftreten, so kann mittels eines Jokers die Ausgabe und Abfrage realisiert
werden.
4.3.5 Starten des Clients
Abbildung 9: Das Popup-Fenster
erwartet den Benutzernamen.
Im Installationsverzeichnis des Clientprogramms findet sich ein Unterordner „bin“. Über die
dortige Datei „clientstart.jar“ kann via Doppelklick der Client aktiviert werden. Achten Sie
bitte darauf, dass die Filemaker-Datenbank(en) vor dem Start des Clients arbeiten.
Andernfalls informiert Sie das Clientprogramm mit einer Popup-Warnung über die fehlende
Datenquelle. Sobald die Datenbank(en) gestartet sind, nimmt der Client dann seine Arbeit
wieder auf.
Beachten Sie bitte auch, dass der Client manuell nach einem Neustart des Computers gestartet
werden muss. Selbstverständlich besteht die Möglichkeit die „clientstart.jar“ automatisiert
aufrufen zu lassen. Von der Installation her ist dies aber nicht vorgesehen.
Für einen korrekten Betrieb des Clients werden vier offene Ports zum Internet benötigt. In
Punkt 4.3.6: Technische Informationen finden Sie die genauen Portnummern.
Die Arbeit des Clients können Sie mit Hilfe einer integrierten Monitoring-Anwendung
kontrollieren. Nach dem erfolgreichen Start des Clientprogramms kann der Monitor über
einen Browser und der Adresse http://localhost:55556 erreicht werden. Sollte hier keine Seite
verfügbar sein lässt dies auf eine Fehlfunktion des Clients schließen.
4.3.6 Technische Informationen
4.3.6.1 Zuweisung von Feldern aus der Datenbank
Das Papyrusportal erfasst 13 Feldern für die Anzeige von gefundenen Datensätzen.
Dazu zählt:
- Inventarnummer
- Sammlung
- Sprache
- Textart
- Titel
Version 1.1.1
(suchbar)
(suchbar; kein Feld, wird vom Portal vorgegeben)
(suchbar)
(suchbar)
(suchbar)
- Datierung
- Herkunft-Gau
- Herkunft-Ort
- Material
- Inhalt
- Publikationsnummer
- Statischer Link
- Weitere Links
- Erwerbungsdatum
- Erwerbungstext
(suchbar)
(suchbar)
(suchbar)
(suchbar)
(suchbar)
(suchbar, aber standardmäßig nicht anzeigbar)
(suchbar, aber standardmäßig nicht anzeigbar)
Um über den Client an die Daten zu gelangen, wird über die JDBC-Schnittstelle eine SQLVerbindung aufgebaut. Jedes Datenfeld besitzt eine spezielle Identifikationsnummer, über die
dann die Feldinhalte zugreifbar sind. Dabei kann diese ID von Sammlung zu Sammlung
unterschiedlich sein, abhängig von dem strukturellen Aufbau der Datenbank.
Eine Zuordnung zwischen Feldname und Identifikationsnummer befindet sich in der
„config_sammlung.xml“-Datei („sammlung“ steht für die jeweilige Institution), die sich im
„config“- Ordner befindet. Diese stellt sich wie folgt dar:
<?xml version="1.0" encoding="UTF-8"?>
<configuration>
<dating params/>
<language params/>
<inventory_number>value</inventory_number>
<collection>value</collection>
<type_of_text>value</type_of_text>
<title>value</title>
<provenance_place>value</provenance_place>
<provenance_area>value</provenance_area>
<material>value</material>
<content>value</content>
<publication>value</publication>
<joker1>value</joker1>
<joker2>value</joker2>
<sharpness>value</sharpness>
<acquisition_text>value</acquisition_text>
<acquisition_text2>value</acquisition_text2>
<acquisition_text3>value</acquisition_text3>
<acquisition_date>value</acquisition_date>
</configuration>
Eine besondere
Rolle spielen die
„acquisition“-Einträge. Generell spezifizieren diese Felder die Erwerbungssuche. Zu beachten
ist hier, dass im Client alle vier Felder zu einem Suchstring zusammengefasst bearbeitet
werden. So lässt sich die unterschiedliche Informationstiefe der einzelnen Sammlungen
ausgleichen. Die gefundenen Informationen werden nur als allgemeiner Datensatz
ausgegeben. Sollten Ausgaben zu den gesuchten Erwerbungsfeldern gewünscht werden, so
sind diese über die Joker-Felder zu benennen.
4.3.6.2 Einstellen der Suchschärfe
Version 1.1.1
In der Datei „config_sammlung.xml“ befindet sich neben den Einträgen für die Suchfelder
auch ein Eintrag für die Genauigkeit der Datumssuche. Das Schlüsselwort „sharpness“
definiert die Toleranz, die bei der Suche nach einer Datierung hinzugefügt werden soll. Die
Portalbetreiber haben eine Null-Toleranz festgelegt; jede Suche befindet sich damit in exakt
den eingegebenen Grenzen. Eine Änderung des voreingestellten Wertes bewirkt eine
Grenzverschiebung um die angegebene Zahl in Jahren.
Die Einstellung „<sharpness>10</sharpness>“ modifiziert beispielsweise die Suchgrenzen
um jeweils 10 Jahre. Das heißt 10 Jahre vor dem eingegebenen Start-Datum und 10 Jahre
nach dem eingegebenen End-Datum.
4.3.7 Die Properties-Datei
Im „config“-Ordner befindet sich neben der Konfigurationsdatei „config-sammlung.xml“
auch die „properties.xml“-Datei. Diese enthält alle relevanten Informationen über die
Datenbankanbindung. Im Einzelnen sind das der Benutzername, das Passwort und der/die
Datenbankname(n).
<?xml version="1.0" encoding="UTF-8" standalone="no"?>
<!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd">
<properties>
<comment>Propertylist for database used by client.</comment>
<entry key="password">password</entry>
<entry key="database3"/>
<entry key="database2"/>
<entry key="database">UB_Sammlung</entry>
<entry key="username">username</entry>
</properties>
4.3.8 Datenanbindung zwischen Client und Portal
Die Kommunikation zwischen dem Portalserver in Leipzig und den angeschlossenen Clients
erfolgt über das Hypertext Transfer Protocol (HTTP) und das Transmission Control Protocol /
Internet Protocol (TCP/IP). Für einen reibungslosen Betrieb benötigt das Clientprogramm vier
offene Ports auf diesen Protokollen:
Port
Nutzung
Protokoll
55554
Datensatzbereitstellung
HTTP
55555
Portal-Datenbank-Zugang
TCP/IP
55556
Monitoring
HTTP
55557
Debug-Schnittstelle
TCP/IP
Normalerweise sollten diese Ports standardmäßig offen sein. Durch den Einsatz von Firewalls
oder durch die Rechenzentren kann es aber sein, dass kein Zugriff möglich ist. Bitte wenden
Sie sich in diesem Fall an das Rechenzentrum Ihrer Institution und/oder prüfen Sie die
Einstellung ihrer Firewall.
Version 1.1.1
4.3.9 Datenbankzugriffe
Filemaker benötigt für eine Datenbereitstellung über JDBC-Schnittstelle einen
Benutzernamen und ein Passwort für eine Datenbank, die über den Tabellennamen definiert
wird. Diese Informationen werden beim ersten Start des Clients von Ihnen abgefragt und in
der Datei „properties.xml“ im „config“-Ordner gespeichert. Sollte eine nachträgliche
Änderung vorzunehmen sein, dann löschen Sie bitte die Datei komplett, oder modifizieren Sie
die dort befindlichen Einträge. Beachten Sie bitte, dass das Datenbank-Passwort im Klartext
in der Datei gespeichert ist. Dies erfolgt aus technischen Gründen. Die Betreiber des 'Papyrus
Portals' oder der Entwickler des Clientprogrammes haben jedoch keinerlei Kenntnis oder
Möglichkeit, dieses Passwort auszulesen.
Der Zugriff auf die Datensätze erfolgt im Client über die Structured Query Language (SQL).
Die Suchanfragen werden in Echtzeit mit den Datensätzen abgeglichen. Bei dem
Programmstart des Clientprogrammes wird eine Inventarliste erzeugt, die eine Zuordnung
zwischen Inventarnummer und Datensatzidentifikationsnummer enthält. Hierüber werden
später die Anfragen für die Trefferlisten vom Portal beantwortet. In Abhängigkeit der Anzahl
der Datensätze und der Rechnerperformance kann die Erstellung der Liste einige Sekunden
beanspruchen.
Die Clients können ausschließlich lesend auf die Datensätze zugreifen. Es sind keine
Methoden für manipulative Interaktionen mit den Daten integriert.
Version 1.1.1
Tabellenverzeichnis
Tabelle 1: Beteiligte Papyrussammlungen ..............................................................................................................7
Tabelle 2: Beteiligte Lokationen und die verwendeten Betriebssysteme .............................................................. 12
Tabelle 3: Beteiligte Datenbanktypen ................................................................................................................... 13
Tabelle 4: Beteiligte Datenbanktypen und ihre Anbindung .................................................................................. 16
Tabelle 5: Such- und Anzeigefelder für das 'Papyrus Portal' ................................................................................ 18
Tabelle 6: Mapping der Datenfelder ..................................................................................................................... 22
Tabelle 7: Harmonisierung .................................................................................................................................... 23
Tabelle 8: Konkordanzliste Material ..................................................................................................................... 24
Tabelle 9: Konkordanzliste Textart ....................................................................................................................... 24
Tabelle 10: Konkordanzliste Sprache ................................................................................................................... 24
Tabelle 11: Konkordanzliste Ort ........................................................................................................................... 25
Tabelle 12: Konkordanzliste Gaues ...................................................................................................................... 25
Tabelle 13: Teilnehmende Sammlungen ............................................................................................................... 26
Tabelle 14: Klassifikationsliste Sprachen ............................................................................................................. 27
Tabelle 15: Klassifikationsliste Textart................................................................................................................. 27
Tabelle 16: Klassifikationsliste Herkunft Gau ...................................................................................................... 29
Tabelle 17: Klassifikationsliste Herkunft Ort ....................................................................................................... 33
Tabelle 18: Klassifikationsliste Material ............................................................................................................... 33
Version 1.1.1
Abbildungsverzeichnis
Abbildung 1: Allgemeiner Ablauf der Suche ...........................................................................................................8
Abbildung 2: Hauptseite des 'Papyrus Portals' .........................................................................................................9
Abbildung 3: Kurzbeschreibung der Leipziger Papyrus- und Ostrakasammlung .................................................. 10
Abbildung 4: Schema des verteilten Zugriffes ....................................................................................................... 15
Abbildung 5: Schematische Darstellung der Clientanbindung............................................................................... 17
Abbildung 6: Menüauswahl für das JDBC-Sharing ............................................................................................... 38
Abbildung 7: Sharing-Fenster (ohne geöffnete Datenbank)................................................................................... 39
Abbildung 8: Datenbankverwaltung ...................................................................................................................... 39
Abbildung 9: Das Popup-Fenster erwartet den Benutzernamen. ........................................................................... 40
Version 1.1.1
Herunterladen