DOMESTIC nutzen

Werbung
Oktober 2009
DOMESTIC nutzen
(ergänzt am 10.11.2010)
Eine Einführung in die Verwendung und Vorgehensweise
Einleitung
Der Nutzen von DOMESTIC besteht darin:
Von Objekten, 10.000 bis zu einer Million und mehr, Beschreibungen über das Internet zu erfassen
und so einem großen Kreis zum Wiederauffinden, Retrieval, über logisch verknüpfte, formale und
inhaltliche Kriterien suchbar zur Verfügung zu stellen.
DOMESTIC unterstützt ein kontrolliertes Vokabular. D. h. einmal festgelegte Begriffe, Deskriptoren,
werden immer in derselben Schreibweise verwendet und wiedergegeben. Abweichende
Schreibweisen, Synonyme, Abkürzungen und Übersetzungen weisen als Nicht-Deskriptoren auf
den Deskriptor hin. Deskriptoren können weiteren Deskriptoren als Ober- und Unterbegriffe
zugeordnet werden. So lässt sich dynamisch ein Thesaurus aufbauen und in einer laufenden
Anwendung fortschreiben.
DOMESTIC ist mit seinen globalen Funktionen ein Datenbank-, Pflege- und Renovierungssystem.
Die Änderung der Schreibweise eines Deskriptors oder das Zusammenlegen zweier wird über den
gesamten Datenbestand durchgeführt.
Kategorien-Inhalte können verschoben oder zusammen gelegt werden. Damit kann eine
Datenbank sich ändernden und hinzu kommenden Anforderungen anpassen. Ähnliches gibt es
auch, wenn unterschiedlich entstandene Datenbasen zusammengefasst werden sollen.
DOMESTIC kann gleichzeitig das Nachweissystem zu beliebig vieler unterschiedlicher Archiven
und Sammlungen sein. In DOMESTIC werden die Beschreibungen der einzelnen Objekte oder zu
Teilen eines Objektes oder von Zusammenfassungen und Akten gesammelt. Eine Recherche
endet mit den relevanten Beschreibungen und der Archiv-Adresse des Objektes. Handelt es sich
um ein digitales Objekt in einem elektronischen Archiv oder im Internet wird der Link darauf zum
Anklicken geboten.
Zum Verständnis von DOMESTIC ist vielleicht folgende logische Reihenfolge hilfreich:
Kategorien/Datenfelder:
Der Anwender legt fest, welche Daten, Autoren, Herausgeber, Erfinder, Übersetzer, Titel, …
erfasst werden sollen und wie sie intern suchbar gemacht werden.
Erfassungsmasken:
Sie bestehen aus einer Untermenge der Kategorien, die bestimmt wird durch den jeweiligen
Dokumenttyp, Zeitschriftenaufsatz, Patentschrift, Foto usw.
DOMESTIC Oktober 2009
Dokumentarische Einheit, DE
Alle Kategorien, die in einer Maske erfasst werden, werden zusammen unter einer Adresse
gespeichert. Ein Suchergebnis besteht aus solchen Einheiten. Sie hat viele Namen: Dokument,
besser: DOMESTIC Dokument, Nachweis, Referenz, Fakt, Metadaten und wie hier am Anfang des
Artikels „Beschreibung“. Während wir das eigentliche Dokument, das Buch, das Foto, die
Internetveröffentlichung, das Video „Original“ nennen.
Lässt man über die DEs eine Volltextinvertierung laufen – die übrigens DOMESTIC auch
zusätzlich einsetzt – so hat man eine Suchmaschine. DOMESTIC unterstützt jedoch die
intellektuelle Verschlagwortung an Hand der Deskriptoren.
Deskriptoren und Kategorien sind die Bausteine einer vom Anwender zu gestaltenden Anwendung.
Teil I - Datenbank modulieren, Dokumente nachweisen
Originale und Nachweise
In der Regel erfasst man mit DOMESTIC den Nachweis zu einem Original. Ein Nachweis besteht
aus formalen und inhaltlich beschreibenden Daten. Formale Daten zu einem Fachzeitschriftenaufsatz sind diejenigen, die man vom Original abschreiben kann, Titel, Autor(en), Abstrakt, Quelle,
Erscheinungsjahr und dergleichen mehr. Aber auch die Dokumentart gehört dazu, also auch
beschreibende Schlagwörter.
Die inhaltliche Beschreibung geschieht durch intellektuelle Zuweisung von Schlagwörtern aus
einem kontrollierten Wortschatz bis hin zu einem Thesaurus, Ontologie. Jeder Nachweis bildet ein
DOMESTIC Dokument. Diese werden auch Metadaten zu Daten genannt.
DOMESTIC Dokument Adresse
Eine Dokumentadresse zu einem DOMESTIC Dokument besteht aus einem Buchstaben und einer
Zahl mit bis zu 6 Ziffern, z. B. M123456. Die Buchstaben bilden Dokumentgruppen. Bei der
Neuanlage eines Dokuments muss die Gruppe vorgegeben werden. Das neue Dokument erhält
automatisch die nächst höhere Nummer innerhalb der Gruppe als Adresse.
Die Verwendung der Dokumentgruppen ist dem Anwender freigestellt. Er kann Dokumentgruppen
für unterschiedliche Dokumentarten und/oder unterschiedliche Benutzergruppen verwenden.
Zu beachten ist jedoch, dass bei der Ausgabe eines Suchergebnisses – sofern nicht ein Sortieren
vorgeschaltet ist –, das Ergebnis alphabetisch nach den Gruppen und innerhalb der Gruppe nach
absteigenden Nummern – das jüngste zuerst – ausgegeben, wird.
Die DOMESTIC Adresse ist nicht die einzige Möglichkeit, direkt auf ein Dokument zuzugreifen.
Alternative Adressen sind ISBN Nummern, Signaturen, Zählungen und Kenn-Nummern aus
anderen Systemen.
DOMESTIC Oktober 2009
2
Dokument-Kategorien
Ein DOMESTIC Dokument besteht aus mehreren Kategorien – beziehungsweise in der Sprache
der EDV: ein Datensatz besteht aus mehreren Datenfeldern. Die Länge der Kategorien ist variabel
und quasi nicht begrenzt.
Die Autoren eines Werkes erfasst man in einer Autorenkategorie, die Titel und Untertitel in einer
Titelkategorie oder separat in einer Titel- und Untertitelkategorie, das Erscheinungsdatum in einer
Datumskategorie usw.
Kategorien sind allen Bibliotheks-, Archiv- und Dokumentationssystemen gemein. Man spricht von
strukturierten Daten. Die erlauben, jede einzelne Kategorie zu adressieren und so über
Formatanweisungen unterschiedliche Zusammenstellungen - Kurz- oder Langausgaben - von
Dokumenten zu steuern. Ebenso lässt sich die Suche auf vorgegebenen Kategorien einschränken,
z. B.: nur Suche in Titeln.
Die Kategorien sind Vorläufer und vergleichbar mit XML formatierten Daten – jedem Datenfeld geht
eine Benennung voraus. Bibliothekarische/dokumentarische Regeln beschreiben jedoch auch, wie
der Inhalt einer Kategorie zu erfassen – oder besser –; anzusetzen ist; z. B. Namen immer in der
inversen Form und ohne Titel: Hamm Brücher, Hildegard.
In einer Anwendung bestimmt die Wahl der Kategorien wesentlich die zukünftige Leistungsfähigkeit, aber auch den Erfassungsaufwand des Datenbanksystems. Die Brisanz solcher
Entscheidungen kann an Folgendem nachvollzogen werden.
Für die postalische Adresse kann man eine Kategorie vorsehen, in der die Adresse so eingegeben
und angeordnet wird, wie sie auf einem Brief zu drucken ist. Oder man kann jede Information –
Herr, Frau, Titel, Vorname, Familienname, c/o, Straße, Nr., Ort usw. in je einer Kategorie erfassen.
Im letzteren Fall kann die so strukturierte Information benutzt werden, um eine Adressliste sortiert
nach Orten und Straßen zu erstellen oder nach Familiennamen zu suchen. Ohne weitere
Kategorien wäre es aber nicht möglich, eine amerikanische Adresse zu erfassen. Eine noch so
exotische Adresse – „An das Brautpaar“ … - kann jedoch ohne Schwierigkeiten und
Sonderregelungen im ersten Fall, wenn die gesamte Adresse in einem Feld steht, erfasst werden.
Wir haben es mit einer Schere zu tun. Je weniger Kategorien beziehungsweise geringere
Strukturierung der Daten, umso größer die Flexibilität bei der Erfassung und umso kleiner die
Auswertungsmöglichkeiten der Information. Je mehr Kategorien beziehungsweise feinere
Strukturierung, umso größer der Erfassungsaufwand und die Fehlermöglichkeiten dabei, aber auch
umso mehr Auswertungsmöglichkeiten.
Es dürfte evident sein, dass jeder Anwender hier eigene Vorstellungen über sein Kategorienschema hat. Folglich bietet DOMESTIC dem Anwender die Möglichkeit, seine Kategorien selber zu
wählen.
Auch ist davon auszugehen, dass im Laufe von Jahren die Anforderung und das Anwendungsgebiet der Dokumentation sich ändern werden. Nichts ändert sich so sehr, als dasjenige, das
eigentlich für alle Zeiten festgelegt worden ist.
DOMESTIC Oktober 2009
3
Als zusätzliche Aufgabe hat es DOMESTIC daher gesehen, dem Anwender auch die Möglichkeit
zu bieten, in einer laufenden Anwendung nach Jahren zusätzliche Kategorien anzulegen,
vorhandene zusammenzulegen oder aufzuteilen und weiteres mehr.
Andererseits kann sich der Anwender auch an Standard Kategorienschemata halten, wie MAB2,
MARC21 und dergleichen.
Unterschiedliche Dokumentarten
Ein Buch hat unter anderem die Kategorien: Autor, Herausgeber, Titel, Untertitel, Verlag. Ein
Zeitschriftenaufsatz hat Autor, Titel, Untertitel, Zeitschriftenreihe, Heft. Ein Patent hat einen
Erfinder und einen Anmelder.
Unterschiedliche Dokumentarten haben unterschiedliche Kategorienschemata. Ein Schema zu
einer Dokumentart besteht aus Kategorien, die sowohl in anderen Dokumentarten vorkommen als
auch aus Kategorien, die nur zu dieser Art passen.
In DOMETSTIC müssen zuerst die gewünschten Kategorien und ihre Eigenschaften erfasst
werden. Dokumentarten ergeben sich dann aus den unterschiedlichen Zusammenstellungen der
Kategorien. Dies steuert der Anwender durch Erfassungsmasken, die er selbst anlegen kann. In
der Wahl der Kategorien und der Dokumentart ist der Anwender vollkommen frei.
Anlegen einer Kategorie
Kategoriencode
Der Kategoriencode besteht aus einer vierstellige Ziffernfolge. Damit kennt DOMESTIC 10.000
Kategorien. Auf Wunsch können auch an der letzten Stelle - MAB2 kompatibel - Buchstaben
verwendet werden. Der Kategoriencode aufsteigend bestimmt die Reihenfolge der Ausgabe der
Kategorien bei der Dokumentausgabe. Zusätzlich gibt es auch eine oder mehrere programmierte
Ausgaben gemäß den Wünschen des Anwenders, die von dieser Reihenfolge abweichen können.
Der Kategoriencode wird zur Festlegung von Formaten und in der Suche benutzt. Mit der
Dokumentadresse und dem Kategorien Code ist eine einzelne Kategorie ansprechbar.
Kategorienbenennung
Autor, Titel ist eine Kategorienbenennung. Es gibt zwei Benennungen je Kategorie, einmal für die
Ausgabe und eine weitere für die Kategorie in der Erfassungsmaske, die identisch oder letztere
präziser gefasst sein sollte.
Zugriffsberechtigung und Weiteres
Zu einer Kategorie werden weitere Angaben zur Zugriffsberechtigung verlangt, die im Helptext
erläutert sind.
DOMESTIC Oktober 2009
4
Verarbeitungskennzeichen, VKZ, Beispiele
a) Autoren
In der Autorenkategorie soll die Eingabe „Hamm Brücher, Hildegard # Scheel, Walter“ so
intern verarbeitet werden, dass beide Namen in einem Personenregister aufgelistet werden
und zwar in der Form
Hamm Brücher, Hildegar
…
Scheel, Walter
D. h. wir brauchen eine interne Verarbeitung, die den Gartenzaun oder das Semikolon als
Trenner zwischen den Phrasen erkennt, sowie jede der Phrasen in das angegebene
Register für Personen einfügt. Ferner sollen die Dokumente über diese Phrasen –
mehrwortiger Ausdruck – suchbar sein.
b) Titel
„DOMESTIC Aufbau, Pflege und Nutzung einer Datenbank mit DOMESTIC“ ist ein Titel
Von dieser Kategorie wünscht man sich, dass der Titel auch über „Aufbau“ und „Pflege“
gefunden wird. D. h. er soll über die Volltextsuche suchbar sein.
c) Erscheinungsdatum
In diese Kategorie wird als Eingabe ein Datum TT.MM.JJJJ erwartet, aber auch eventuell
nur MM.JJJJ oder JJJJ. Einerseits soll bei der Eingabe formal überprüft werden, ob die
Eingaben einem Datum oder einem Teil davon entsprechen. Andererseits soll eine Suche
nach einem konkreten Datum, aber auch mit Intervallen – von – bis – möglich sein.
Interne Verarbeitung
Drei Kategorien sind oben betrachtet worden. Jede verlangt aber, anders behandelt zu werden.
Dies geschieht dadurch, dass bei der Erfassung einer Kategorie dieser ein VKZ, ein Verarbeitungskennzeichen, zugeordnet wird. DOMESTIC bietet die diverse VKZs. Kategorien gleichen Typs –
Anmeldedatum, Veröffentlichungsdatum usw. – ist jeweils das gleiche VKZ zuzuordnen.
DOMESTIC ist intern so aufgebaut, dass bei Bedarf eine neue Verarbeitungsart realisiert werden
kann, ohne dass die vorhandenen dadurch tangiert oder geändert werden. Allein das Neue muss
programmiert werden. So lassen sich neue Anforderungen einfach realisieren.
Volltextsuche zusätzlich
Neben der vom Kategorientyp abhängigen internen über die VKZ gesteuerte Verarbeitung, die im
einzelnen im online Helptext beschrieben sind, ist der gesamte Inhalt der Dokumente als Volltext
suchbar. Das Dokument mit dem Autor „Hamm Brücher, Hildegard“ ist auch über das Stichwort
„Hamm“ zu finden. Sensible Kategorien – Datenschutz – können davon ausgenommen werden.
DOMESTIC Oktober 2009
5
Deskriptoren
DOMESTIC widmet sich sehr den ‚Beschreibern’. Einerseits wird mit ihnen in dem Nachweis das
Original beschrieben und andererseits wird die Suche mit ihnen formuliert. Deskriptoren können
Namen von Personen, Namen von Institutionen, Firmen, Behörden, Namen von Produkten, Namen
von geographischen Einheiten, Stadt, Land, Fluss usw. sein und nicht zuletzt inhaltlich
beschreibende Begriffe. Ein Deskriptor kann ein mehrwortiger Ausdruck mit bis zu 250 Zeichen
lang sein.
Nicht-Deskriptoren
Neben seiner einmal festgelegten Vorzugsbenennung können einem Deskriptor beliebig viele
weitere Benennungen, wie Synonyme, Quasi-Synonyme, Abkürzungen, Notationen,
Übersetzungen usw. zugeordnet werden, mit denen man statt des Deskriptors suchen kann. Bei
Zuweisung zu einem Dokument werden sie durch die Vorzugsbenennung, den Deskriptor, ersetzt.
In DOMESTIC sprechen wir von Deskriptoren und Nicht-Deskriptoren. Deskriptoren werden als
Ganzheiten behandelt, d. h. ihre Zeichenfolge kann nicht in einem Dokument geändert werden. Sie
können nur durch Klicken zugewiesen oder gelöscht werden. Siehe Deskriptorpflege
Register, Lexikon
Jeder Deskriptorkategorie ordnet man ein zweistelliges Kürzel für ein Register zu, z. B. den
Kategorien Autor, persönlicher Herausgeber, Interviewer, Erfinder, Komponist, Dirigent usw. das
Kürzel ‚PE’ für Personennamen. Alle Einträge in diesen Dokumentkategorien werden in dem
Register ‚PE’ in alphabetischer Ordnung aufgelistet.
Der Anwender kann aber auch Komponisten und Dirigenten in einem Musiker-Register sammeln,
indem er den beiden Kategorien ‚MS’ als Register zuordnet.
Meistens gibt es etwa folgende Deskriptorenregister:
Namen von Personen
Korporationen
geographische Einheiten
formale Deskriptoren
freie Schlagwörter
Thesaurusbegriffe
Verwaltungsdeskriptoren
Da ein Benutzer nicht wissen kann, ob z. B. ein Begriff im Thesaurus steht oder ein freier Begriff
oder Ähnliches ist, werden alle Deskriptoren und ihre Nicht-Deskriptoren noch einmal zusammen in
einem sogenannten Lexikon ausgegeben. Ein Deskriptor und auch seine Nicht-Deskriptoren
können nicht gleichzeitig in mehreren Registern vorkommen. Die Register werden auch SubRegister des Lexikons genannt.
Nicht-Deskriptoren werden in der Regel in dem gleichen Sub-Register wie der Deskriptor geführt.
Die Nicht-Deskriptoren, z. B. Übersetzungen, können aber auch einem eigenen Sub-Register
zugewiesen werden und bilden dann z. B. einen englischen Thesaurus. Gemeinsam mit dem
Deskriptor und all seinen Nicht-Deskriptoren kommen sie immer im Lexikon vor. Neben dem
Lexikon, das immer alle Deskriptoren und Nicht-Deskriptoren aus allen Sub-Registern führt,
DOMESTIC Oktober 2009
6
können für den Dialog auch zusätzlich zwei oder drei Sub-Register zusammengemischt werden, z.
B. freie Schlagwörter und Thesaurus-Begriffe in einem Misch-Register.
Über VKZ=10 kann man auch erreichen, dass Deskriptoren in selbständigen Registern, die nicht
auch im Lexikon verzeichnet sind, geführt werden. Auch unabhängige Register genannt, da vom
Lexikon unabhängig. Damit sind auch gleich lautende Phrasen in mehreren unabhängigen
Registern möglich. Im Helptext sind noch weitere spezielle Register für Signaturen, ISBN, ISSN
und URLs beschrieben.
Anordnung der Kategorien
Unterschiedliche Dokumente haben teilweise die gleichen, aber auch unterschiedliche Kategorien.
Um seine Datenbank entsprechend zu modulieren, schafft man sich am besten mit einer Tabelle
eine Übersicht.
Die Tabellenspalten beinhalten die Dokumentarten, Buch, Zeitschriftenaufsatz, Patentschrift usw.
Die Zeilen stellen unterschiedliche Kategorien, wie Autor, Herausgeber, Erfinder, wobei man
ähnliche Kategorien über die Dokumentarten bündelt, z. B. erst alle persönlichen Verursacher,
dann Titel, Untertitel, Originaltitel, übersetzter Titel. Die einzelnen Kategoriengruppierungen sollte
durch entsprechende Kategoriencodes gruppiert werden. Sinnvoll ist es, zwischen den Gruppen
Platz zu lassen, um eventuell hier später weitere eintragen zu können.
Einige DOMESTIC Konventionen gibt es, die aber auch geändert werden können. Die Kategorie
100 wird oft für Zeitschriftentitel verwendet, in 9007schreibt DOMESTIC automatisch das
Ersterfassungsdatum, in 9017 das Datum der letzten Korrektur und in 9018 die letzen fünf
Änderungsstempel. Ein Stempel besteht aus der UserID des Ändernden und dem Tagesdatum.
Die Kategorie kann vom Benutzer nicht geändert werden. Der Stempel ist aus Datenschutzgründen
nicht suchbar.
Die Kategorienstammdaten bestehen im Endeffekt aus einer Liste - geordnet nach dem
Kategoriencode -, indem die Kategorienschemata für jede gewünschte Dokumentart horizontal,
zusammen gelegt sind.
Änderungen an KAST in einer laufenden Anwendung
Das Erstellen der Kategorienstammdaten ist sicherlich einfacher, wenn bekannt ist, was zu einem
späteren Zeitpunkt, wenn bereits Dokumente erfasst wurden, diese wieder geändert werden
können.
Man kann jederzeit neue Kategorien hinzufügen, die Benennung der Kategorien ändern und die
Eingangskontrolle verändern. Sobald die Änderungen, die interne Verarbeitung, die bereits
erfassten Daten betreffen, bietet DOMESTIC folgende Möglichkeit:
Die Daten der zu ändernden Kategorie oder Kategorien werden auf dem Server unter Mitnahme
der Dokumentadresse in eine Datei exportiert und in der Anwendung inklusive ihrer internen
Verarbeitung gelöscht. Nicht gelöscht werden Deskriptoren, auch wenn ihre Häufigkeit damit Null
wird. Anschließend werden die gewollten Veränderungen, z. B. ein anderes VKZ, oder ein anderes
Register in den Kategorienstammdaten eingetragen und die Daten wieder importiert. Der Import
verarbeitet die Kategorieninhalte dann entsprechend der neuen Angaben in KAST.
DOMESTIC Oktober 2009
7
Die exportierten Daten können vorher auch durch Programme verändert werden. Kategorien
können zusammengelegt oder aufgeteilt werden. Der Kategoriencode kann mit ‚Suche’ und
‚Ersetze’ geändert und so die Kategorie in der Anwendung verschoben werden. Es gibt eigentlich
nichts, was in einer laufenden Anwendung innerhalb von Stunden nicht verändert werden kann,
was im laufenden Betrieb möglich, jedoch nicht empfehlenswert ist. An Hand der gesicherten
Exportdatei kann bei einem Irrtum der ursprüngliche Zustand wieder hergestellt werden.
Erfassungsmasken
Um einen Nachweis zu einen Zeitschriftenaufsatz in DOMESTIC im Dialog zu erfassen, braucht
man einen Bildschirm, auf dem die einzelnen Kategorien, die zu einem ZeitschriftenaufsatzNachweis gehören, als leere Felder präsentiert werden. Wir nennen das Masken.
DOMESTIC bietet einen Maskeneditor: Mit der Maus können die gewünschten Kategorien aus
einer Auflistung in die Masken hineingezogen werden. Die Reihenfolge der Kategorien in der
Maske ist beliebig und sollte mit der Abfolge auf der Vorlage abgestimmt sein. Masken können von
jedem User, der in der Datenbank schreiben darf, und für jeden Zweck, für die Erfassung,
Korrekturen und Nachträge, ad hoc erstellt werden. Masken können schnell online generiert
werden. Jede Kategorie erscheint in einer neuen Zeile mit einem gleich großem Eingabefeld, das
sich bei Bedarf vergrößert.
Formulare
Formulare, die programmiert werden müssen, können wesentlich komfortabler gestaltet werden.
DOMESTIC selber verwendet z. B. für die Rechtevergabe an die User ein Formular. Formulare
können sein wie Steuererklärungen mit viel Text als Fragen, mit Ja/Nein ankreuzen, mit
vorgegebenen formatierten Eingabefeldern, multiple choice Fragen und das, was der Anwender
möchte. Sie richten sich an den ungeübten Nutzer oder komplexere Eingaben.
Deskriptorkategorien, indirekte Eingabe
Alle Kategorien in einer Maske, die nicht Deskriptorkategorien sind, präsentieren ein Eingabefeld
mit einem normalen Texteditor. Der Dokumentar gibt den Inhalt über die Tastatur ein und springt
mit TAB zum nächsten Feld.
Nicht so bei Kategorien, in denen Deskriptoren erwartet werden. Um eine hohe Konsistenz der
Datenbank zu gewähren, werden hier nur Phrasen, die vorhandene Deskriptoren sind, als Eingabe
akzeptiert. Der Dokumentar kann die Deskriptoren aus den Registern durch Klicken als Ganzes
übernehmen, oder sich für eine Neuaufnahme entschließen. Der Masken-Editor kennt die VKZ der
Kategorie und unterscheidet selbständig zwischen Text- und Deskriptor-Editor.
Natürlich können Deskriptoren oder ihre Abkürzungen auch direkt in das Eingabefeld geschrieben
werden. Alle bekannten übernimmt DOMESTIC sofort, unbekannte werden zurückgewiesen.
Mit dem Befehl ADD können auch neue Deskriptoren erfasst werden. Zur Überwachung der
Konsistenz der Datenbank werden neue und geänderte Deskriptoren zentral protokolliert.
DOMESTIC Oktober 2009
8
Kopieren
DOMESTIC unterstützt weitgehend das Kopieren von bereits Vorhandenem in der Datenbank, z.
B. die Übernahme aus einer vorhergehenden Erfassung desselben Users, wenn mehrere Aufsätze
aus dem gleichen Zeitschriftenheft übernommen werden. Weitere Kopiermöglichkeiten sind dem
Online-Helptext von DOCO, der Dokumenterfassung und -korrektur, zu entnehmen.
Copy Kategorie
Hierunter wird eine Pseudokategorie verstanden, in die ein strukturierter Text hinein kopiert wird, z.
B. die MAB2 formatierten Angaben zu einem Buch, das von einem Bibliotheksverbund bereits
erfasst wurde. DOMESTIC entnimmt der Kopie die Daten wie Autor, Titel usw. und fügt diese in die
entsprechenden Kategorien der DOMESTIC Anwendung ein. Die Copy Kategorie selber ist
anschließend wieder leer. Copy Cataloging wird dies im Englischen genannt. Das Gegenteil, die
Ausgabe von DOMESTIC Dokumenten in einem vorgegebenen Fremdformat, z. B. Endnot, wird
ebenso geboten.
Eingabekontrolle, Workflow
Datumskategorien und ISBN werden immer formal überprüft. Durch eine sogenannte Vorverarbeitung, VVA, kann mit Hilfe eines Programms jede Eingabe soweit wie möglich auf Plausibilität
überprüft werden. In der Regel ist die Überprüfung spezifisch für die Kategorie und nicht für die
Maske. Die VVA entweder eine von den bereits vorhandenen oder eine eigens zu
programmierende ist mit ihrem Namen bei der Kategorie in KAST anzugeben. Siehe auch den
Helptext dort.
Endkontrolle
Eine Maske oder ein Formular für einen Arbeitsschritt können einer Endkontrolle zugeordnet
werden. Dies ist von KTS zu erstellen oder bereits vorhanden. Ist die Überprüfung der Eingaben
positiv, kann dies in einer Statuskategorie vermerkt werden: ‚Ist formal vollständig’. Ist die
Überprüfung negativ, wird dies gemeldet und der Status nicht verändert. So kann ein Workflow in
einer Anwendung eingerichtet werden.
Kategorienstammdaten, KAST
Mehrfach wurde bereits KAST erwähnt.
Jede Datenbank muss vom Anwender moduliert werden. DOMESTIC verwendet eine SQL
Datenbank, Nachfolger der relationalen Datenbanksysteme wie früher Oracle und DB2.
DOMESTIC verwendet MySQL, könnte aber auch eine der anderen verwenden. Modulieren
bedeutet, man teilt dem Datenbanksystem in der SQL Sprache mit, welche Tabellen man benutzen
will, um seine Daten abzuspeichern. Dies ist bereits in DOMESTIC geschehen. Der Anwender
muss nur noch im Dialog DOMESTIC mitteilen, welche Kategorie er verwenden möchte, um
DOMESTIC zu modulieren. Der Zugriff auf die Kategorienstammdaten kann in einer Anwendung
auf einen oder mehrere Verwalter beschränkt werden. Vom Anwender werden keine
Programmierkenntnisse erwartet. Das Modulieren einer Datenbank geschieht allein über einen
Internet-Browser und ist möglich von jedem Ort der Welt
DOMESTIC Oktober 2009
9
Zeichensatz
DOMESTIC speichert die Daten in UNICODE in der Codierung UTF-8 mit Ausnahme der Code
0300-0370 Combining Diacritical Marks ab.
Damit sind alle Zeichen der Welt erlaubt und auch im Volltext gemäß der Eigenheit der jeweiligen
Sprache suchbar. Für die Verwendung aller Zeichen, auch als Deskriptoren, liegen bis jetzt
Anwendungen für alle lateinischen, inklusive der Diakritika, kyrillischen, griechischen und
hebräischen Zeichen vor.
Zwei Deskriptoren sind identisch, wenn sie in den Grundzeichen gleich sind. René ist gleich rene,
d. h. Unterschiede in Groß-/Kleinschreibung und Diakritika werden ignoriert. Im Deutschen betrifft
dies die Umlaute. München ist gleich Munchen und nicht gleich Muenchen, wenn nicht letzteres als
Nicht-Deskriptor eingegeben wurde.
DOMESTIC folgt hier einer übernationalen Regel für mehrsprachige Register. Auch wenn nur eine
Sprache verwendet wird, ist das Autoren-Register immer mehrsprachig.
Transliteration oder Umschriften von nicht-lateinischen Schriften in Lateinisch mit „Diakritika“
können Zeichen enthalten, die nicht von UNICODE unterstützt werden und eventuell einer
Sonderbehandlung und Einschränkung bedürfen. UNICODE kennt alle Schriften, jedoch nicht
Transliterationen.
Teil II - Deskriptoren, Thesaurus, Fakten
Teil I berichtet über alles das, was man wissen muss, um eine Datenbank einzurichten, in der
strukturierte Dokumentnachweise erfasst und gespeichert werden. Es wurde bereits dort von
Deskriptoren und Nicht-Deskriptoren geredet. Eine DOMESTIC Anwendung setzt keinen
Thesaurus voraus. In einer laufenden Anwendung kann mit DOMESTIC dynamisch ein in den
Dokumentbestand integrierter Thesaurus entwickelt werden. (Alleinstellungsmerkmal von
DOMESTIC 2009)
Thesaurus
Was ein kontrolliertes Vokabular zu einem Thesaurus macht, wurde bereits 1976 in der Norm DIN
1468 definiert.
Danach müssen zu einem Deskriptor die Nicht-Deskriptoren, die Ober- und Unterbegriffe sowie
‚Siehe auch’ oder auch verwandte Begriffe und wenn möglich, eine Definition oder Anwendungsregel, ausgewiesen werden. Statt Thesaurus hört man heute (2009) auch das Wort Ontologie.
DOMESTIC ordnet jedem neuen Deskriptor ein Dokument mit einer Adresse bestehend aus
Dollarzeichen und der nächst höheren laufenden Nummer zu. Alles, was früher über DOMESTIC
Dokumente gesagt wurde, trifft auch für diese Hintergrunddokumente, auch Hintergrundinformation, HGI, genannt, zu. Auch sie bestehen aus Kategorien. Der Deskriptor selbst befindet sich
immer in der Kategorie B0100. Alle anderen Codes kann der Anwender frei wählen.
DOMESTIC Oktober 2009
10
DOMESTIC kennt damit zwei Dokumentklassen, einmal die DOMESTIC Dokumente, auch
Nachweise, Referenzen und Literaturdokumente genannt, und zum anderen die Hintergrundinformationen. Auf Kategorieebene wird zwischen den Dokumentklassen mit den Buchstaben L
und B vor dem Kategoriencode unterschieden, L für Literaturdokumente und B für Hintergrund
beziehungsweise Backgroundinformationen, L0110 oder B1010.
Speziell bei einem Thesaurus wird statt HGI oft auch von einem Thesaurusdokument gesprochen.
Der Anwender kann mehrere Nicht-Deskriptorkategorien anlegen, z. B. für Synonyme, für
Abkürzungen, für andersartige Schreibweisen, Foto, Photo, für Übersetzungen ins Englische oder
Französische oder beides.
In der Regel folgen nach den Nicht-Deskriptorkategorien die Ober- und Unterbegriffskategorien. Im
Prinzip sind sie identisch den Deskriptorkategorien zur Verschlagwortung von Dokumenten, d. h.
hier können Deskriptoren zugewiesen werden. Die HGIs sind auch über diese Deskriptoren
suchbar.
Ordnet man den Begriff ‚Kraftwerk’ dem Begriff ‚Windkraftwerk’ als Unterbegriff zu, so ist eigentlich
in dem Moment bekannt, dass das ‚Kraftwerk’ der Oberbegriff von ‚Windkraftwerk’ ist. Gibt man in
KAST zu der Oberbegriffskategorie die Unterbegriffskategorie und umgekehrt an, so erledigt
DOMESTIC die inverse Beziehung automatisch. Es wird Cross Entry genannt.
Die Kategorie für die ‚Siehe auch Begriffe’ ist eine normale Deskriptorkategorie, und für die
Definition wird eine Textkategorie verwendet, so dass die HGI auch über Stichwörter der Definition
gefunden werden kann.
Dem Anwender ist es überlassen, hier weitere Kategorien, z. B. für die Zuordnung des Deskriptors
zu einem Begriffsumfeld, auch Micro-Thesaurus genannt, oder Verwaltungskategorien anzulegen.
Hierarchische Darstellung eines Thesaurus
In der Hintergrundinformation eines Deskriptors wird nur die nächste Stufe der Unterbegriffe des
Deskriptors wiedergegeben. Aber jeder Unterbegriff ist selbst ein Deskriptor und kann wieder
Unterbegriffe haben und so weiter.
DOMESTIC kennzeichnet im Register und Lexikon solche Deskriptoren, die Unterbegriffe haben,
mit einem Kreuz in einem gelben Kästchen. Klickt man darauf, so erhält man den Deskriptor, seine
Oberbegriff und den ersten Unterbegriff, wenn dieser selbst Unterbegriffe hat, diesen und eventuell
die Unterbegriffe von diesem usw. Die ganze Hierarchie nach unten.
Die Information dazu wird den Thesaurusdokumenten entnommen. Um bei dieser Darstellung
Schleifen zu vermeiden, kontrolliert DOMESTIC bei der Eingabe, ob ein Deskriptor nicht innerhalb
eines Hierarchiezweiges mehrfach vorkommt.
Klassifikationen
In der Regel steht dem jeweiligen Begriff beziehungsweise der Klasse eine Notation voran und das
Auflisten soll gemäß der Notation erfolgen. Auch Klassifikationen lassen sich mit DOMESTIC
handhaben.
DOMESTIC Oktober 2009
11
Manche Klassifikationen entziehen sich einem einfachen alphanumerischen Sortieren, z. B. die
Internationale Patentklassifikation, IPC. Hier muss dann neben der externen Notation eine
zusätzliche interne für die Sortierfolge verwendet werden.
Hintergrundinformationen, allgemein
HGI ist über den Deskriptor erreichbar. Sieht man den Deskriptor ‚Friedensverhandlungen’ in
einem Register/Lexikon oder als Verschlagwortung in einem Dokument oder irgendwo in
DOMESTIC, genügt ein Klick und ein EXPAND, um die HGI zu dem Deskriptor auszugeben.
Jeder Deskriptor in DOMESTIC hat potenziell ein Hintergrunddokument. Was spricht dagegen, in
die HGI des Springer Verlags seine Adresse, Telefonnummer, Ansprechpartner und mehr zu
hinterlegen? All dies wird nur einmal in DOMESTIC gespeichert und ist nur einmal zu aktualisieren,
wenn sich z. B. die Telefonnummer ändert.
Zugriff auf die Daten hat man von jedem DOMESTIC Dokument, in dem ‚Springer’ erwähnt wird.
Eine HGI kann selbst wieder mit Deskriptoren verschlagwortet werden. Die Suche
‚Wissenschaftlicher Verlag’ findet alle so erfassten Verlage.
Faktendokumentation
Die publizierten Referate einer Fachtagung werden wie Fachzeitschriftenaufsätze referenziert. Um
ihre Herkunft zu dokumentieren, wird man sie mit dem Deskriptor für die Tagung, z. B.
‚Dokumentar Tag 2002, Frankfurt’ indexieren.
Nichts spricht dagegen, die Hintergrundinformation des Deskriptors zu nutzen, um darin die
Tagung selbst zu dokumentieren: Thema der Tagung, Veranstalter, Tagungsdauer und -ort, Link
auf die Teilnehmerliste, weiteres und eine Verschlagwortung.
Diese Art der Dokumentation, die nicht mehr eine Referenz auf die eigentliche Information,
sondern die Information selbst enthält, wird Faktendokumentation genannt. Fakten können zu
Personen (Datenschutz!), Firmen, Verlagen, Konferenzen/Tagungen, Verträgen/Abkommen und
mehr erfasst und laufend aktualisiert werden. Die Kategorienstammdaten zu den
Hintergrundinformationen müssen um jeweils zu den Fakten passende Kategorien erweitert
werden.
Ein Paradebeispiel über die Nützlichkeit der Faktendokumentation lautet: Jemand hat ein für sich
relevantes Dokument gefunden und sieht in dem Dokument den Namen der Tagung. Mit EXPAND
öffnet er die HGI zu der Tagung und stellt fest, dass das Thema der Tagung genau zu seiner
Recherche passt. Mit einer Suche mit dem Namen der Tagung findet er weiteres Relevantes.
Alles, was für Thesaurusdokumente beschrieben wurde, kann auch hier verwendet werden, so
auch Cross Entry.
Deskriptorpflege
DOMESTIC bietet als Dialogfunktionen einen ganzen Werkzeugkasten, um Deskriptoren
nachträglich auch in den Dokumenten zu ändern. So kann die Schreibweise eines Deskriptors
DOMESTIC Oktober 2009
12
global geändert, zwei Deskriptoren zusammen gelegt, ein Deskriptor einer durch die Suche
bestimmte Menge von Dokumenten hinzugefügt oder gelöscht werden und mehr.
Renovierung einer Datenbank
Datenbanken können alt werden, heute 30 Jahre und in Zukunft mehr. In 30 Jahren hat sich die
Computertechnik wesentlich geändert. Das Kategorienschema wurde mehrfach geändert und
erweitert. Fremddaten nach anderen Regeln erfasst, sind in die Datenbank integriert worden. Der
Thesaurus wurde um einen zweiten fremden erweitert. Auf die Dauer gesehen, geht es nicht nur
um Datenerfassung und Retrieval, sondern permanent auch um Umstellungen und Anpassungen
der Datenbank an die mit der Zeit von Außen kommenden Anforderungen. Die DOMESTIC
Deskriptorpflege, und der Export/Import sind Werkzeuge für den Anwender dazu. KTS berät hier
die Anwender gerne oder übernimmt auch komplizierte Aufgaben.
Teil III – Originale, Langzeit archivieren
Natürlich können Sie in DOMESTIC beliebig lange Dokumente, Fotos und mehr erfassen. Doch
empfohlen wird, DOMESTIC als reines Nachweissystem als Metadatenbank zu betreiben und die
Originale, soweit es elektronische Kopien sind, auf einem Web Server wie Apache zu speichern
und mit einem Hyperlink aus DOMESTIC direkt aufrufbar zu machen.
Dieses Vorgehen, Nachweissystem und Archiv zu trennen, hat vielfache Vorteile und bietet große
Flexibilität. Aus dokumentarischer Sicht ist es ein gravierender Fehler, Volltext und
Verschlagwortung in einem System zusammen zu erfassen.
DOMESTIC kann mit mehreren Archiven zusammenarbeiten. Dies können sein: öffentlich
zugängliche, aber auch solche, die einen Bezahlmodus davor schalten, eine besondere
Sicherheitsstufe verlangen oder einfach ein zweites Archiv, wenn das erste es nicht mehr schafft.
Technisch verlangen die beiden Systeme Retrieval/und Dokumenterfassung und eine
Langzeitarchivierung auch unterschiedliche Behandlung und unterschiedliches Vorgehen bei
technischem Fortschritt.
Internetveröffentlichungen
Auf den ersten Blick ist eine Internetveröffentlichung nicht viel anders als ein Fachzeitschriftenaufsatz in DOMESTIC zu referieren.
Doch es gibt einige Besonderheiten. Das Original ist über einen URL aufzurufen und dies
möglichst mit einem Klick auf den Link im DOMESTIC Dokument. Alle erfassten URLs würde man
gern in einem Register einsehen können, aus dem man sowohl die Referenz als auch die
Veröffentlichung im Internet aufrufen möchte. Alle diese Anforderungen erfüllt DOMESTIC mit der
VKZ=12.
Archiv Assistent, ArAs
Im Internet ist nicht garantiert, dass eine Veröffentlichung dort immer unter dem gleichen URL und
in nicht veränderter Version zu erreichen ist. Der ArAs erlaubt dem Benutzer über seinen Browser
im Internet – remote - bei Angabe des URLs, eine Backup Kopie auf einem zentralen Archiv Server
DOMESTIC Oktober 2009
13
zu hinterlegen. Über eine Copy Kategorie wird in DOMESTIC der Zugriff auf das Backup, der
Original-URL und mehr übernommen. Auch Dateien auf seinem Rechner kann der Benutzer
dauerhaft mit dem ArAs ins Archiv einstellen und referenzieren.
Teil IV - Mehrsprachigkeit
DOMESTIC gibt alle Deskriptoren in Dokumenten, in Registern, in der Hierarchie, und sonst wo in
einer gewählten Sprache aus, soweit Übersetzungen der Deskriptoren vorhanden sind.
Die Übersetzungen müssen in der HGI des Deskriptors in einer Kategorie hinterlegt werden. Die
Kategorie enthält das VKZ für Nicht-Deskriptoren mit einem eigenen Subregister, z. B. ET für
englischen Thesaurus.
Dem Engländer wird damit ein englischer Thesaurus geboten. Mit den englischen Begriffen kann er
suchen oder auch Dokumente verschlagworten, und in dem Dokument sieht er englische
Deskriptoren. Die Retrieval Oberfläche und die Kategorienbenennung können ebenfalls in Englisch
sein. Will man die Mehrsprachigkeit verwenden, ist noch Einiges mehr zu beachten.
Teil V – Hier: Nicht-Behandeltes von DOMESTIC
DOMESTIC ADP
Aufbereitung zu Druckprodukten
DOMESTIC libri
Ausleihe, Leserverwaltung, Barcode, RFID, selbst verbuchte Rückgabe, E-Mails
DOMESTIC Journal
DOMESTIC Zeitschriftenverwaltung, Abonnement-Verwaltung, Eingangskontrolle
DOMESTIC URL Checker
Kontrolle von Internetveröffentlichungen
DOMESTIC Dialog
Portal, Laiensuche, Bewertung von Dokumenten
DOMESTIC Community
Social tagging und mehr
DOMESTIC Mobil
Zugriff auf DOMESTIC Community über Smartphones mit dem Android Betriebssystem
DOMESTIC Oktober 2009
14
Herunterladen