Oktober 2009 DOMESTIC nutzen (ergänzt am 10.11.2010) Eine Einführung in die Verwendung und Vorgehensweise Einleitung Der Nutzen von DOMESTIC besteht darin: Von Objekten, 10.000 bis zu einer Million und mehr, Beschreibungen über das Internet zu erfassen und so einem großen Kreis zum Wiederauffinden, Retrieval, über logisch verknüpfte, formale und inhaltliche Kriterien suchbar zur Verfügung zu stellen. DOMESTIC unterstützt ein kontrolliertes Vokabular. D. h. einmal festgelegte Begriffe, Deskriptoren, werden immer in derselben Schreibweise verwendet und wiedergegeben. Abweichende Schreibweisen, Synonyme, Abkürzungen und Übersetzungen weisen als Nicht-Deskriptoren auf den Deskriptor hin. Deskriptoren können weiteren Deskriptoren als Ober- und Unterbegriffe zugeordnet werden. So lässt sich dynamisch ein Thesaurus aufbauen und in einer laufenden Anwendung fortschreiben. DOMESTIC ist mit seinen globalen Funktionen ein Datenbank-, Pflege- und Renovierungssystem. Die Änderung der Schreibweise eines Deskriptors oder das Zusammenlegen zweier wird über den gesamten Datenbestand durchgeführt. Kategorien-Inhalte können verschoben oder zusammen gelegt werden. Damit kann eine Datenbank sich ändernden und hinzu kommenden Anforderungen anpassen. Ähnliches gibt es auch, wenn unterschiedlich entstandene Datenbasen zusammengefasst werden sollen. DOMESTIC kann gleichzeitig das Nachweissystem zu beliebig vieler unterschiedlicher Archiven und Sammlungen sein. In DOMESTIC werden die Beschreibungen der einzelnen Objekte oder zu Teilen eines Objektes oder von Zusammenfassungen und Akten gesammelt. Eine Recherche endet mit den relevanten Beschreibungen und der Archiv-Adresse des Objektes. Handelt es sich um ein digitales Objekt in einem elektronischen Archiv oder im Internet wird der Link darauf zum Anklicken geboten. Zum Verständnis von DOMESTIC ist vielleicht folgende logische Reihenfolge hilfreich: Kategorien/Datenfelder: Der Anwender legt fest, welche Daten, Autoren, Herausgeber, Erfinder, Übersetzer, Titel, … erfasst werden sollen und wie sie intern suchbar gemacht werden. Erfassungsmasken: Sie bestehen aus einer Untermenge der Kategorien, die bestimmt wird durch den jeweiligen Dokumenttyp, Zeitschriftenaufsatz, Patentschrift, Foto usw. DOMESTIC Oktober 2009 Dokumentarische Einheit, DE Alle Kategorien, die in einer Maske erfasst werden, werden zusammen unter einer Adresse gespeichert. Ein Suchergebnis besteht aus solchen Einheiten. Sie hat viele Namen: Dokument, besser: DOMESTIC Dokument, Nachweis, Referenz, Fakt, Metadaten und wie hier am Anfang des Artikels „Beschreibung“. Während wir das eigentliche Dokument, das Buch, das Foto, die Internetveröffentlichung, das Video „Original“ nennen. Lässt man über die DEs eine Volltextinvertierung laufen – die übrigens DOMESTIC auch zusätzlich einsetzt – so hat man eine Suchmaschine. DOMESTIC unterstützt jedoch die intellektuelle Verschlagwortung an Hand der Deskriptoren. Deskriptoren und Kategorien sind die Bausteine einer vom Anwender zu gestaltenden Anwendung. Teil I - Datenbank modulieren, Dokumente nachweisen Originale und Nachweise In der Regel erfasst man mit DOMESTIC den Nachweis zu einem Original. Ein Nachweis besteht aus formalen und inhaltlich beschreibenden Daten. Formale Daten zu einem Fachzeitschriftenaufsatz sind diejenigen, die man vom Original abschreiben kann, Titel, Autor(en), Abstrakt, Quelle, Erscheinungsjahr und dergleichen mehr. Aber auch die Dokumentart gehört dazu, also auch beschreibende Schlagwörter. Die inhaltliche Beschreibung geschieht durch intellektuelle Zuweisung von Schlagwörtern aus einem kontrollierten Wortschatz bis hin zu einem Thesaurus, Ontologie. Jeder Nachweis bildet ein DOMESTIC Dokument. Diese werden auch Metadaten zu Daten genannt. DOMESTIC Dokument Adresse Eine Dokumentadresse zu einem DOMESTIC Dokument besteht aus einem Buchstaben und einer Zahl mit bis zu 6 Ziffern, z. B. M123456. Die Buchstaben bilden Dokumentgruppen. Bei der Neuanlage eines Dokuments muss die Gruppe vorgegeben werden. Das neue Dokument erhält automatisch die nächst höhere Nummer innerhalb der Gruppe als Adresse. Die Verwendung der Dokumentgruppen ist dem Anwender freigestellt. Er kann Dokumentgruppen für unterschiedliche Dokumentarten und/oder unterschiedliche Benutzergruppen verwenden. Zu beachten ist jedoch, dass bei der Ausgabe eines Suchergebnisses – sofern nicht ein Sortieren vorgeschaltet ist –, das Ergebnis alphabetisch nach den Gruppen und innerhalb der Gruppe nach absteigenden Nummern – das jüngste zuerst – ausgegeben, wird. Die DOMESTIC Adresse ist nicht die einzige Möglichkeit, direkt auf ein Dokument zuzugreifen. Alternative Adressen sind ISBN Nummern, Signaturen, Zählungen und Kenn-Nummern aus anderen Systemen. DOMESTIC Oktober 2009 2 Dokument-Kategorien Ein DOMESTIC Dokument besteht aus mehreren Kategorien – beziehungsweise in der Sprache der EDV: ein Datensatz besteht aus mehreren Datenfeldern. Die Länge der Kategorien ist variabel und quasi nicht begrenzt. Die Autoren eines Werkes erfasst man in einer Autorenkategorie, die Titel und Untertitel in einer Titelkategorie oder separat in einer Titel- und Untertitelkategorie, das Erscheinungsdatum in einer Datumskategorie usw. Kategorien sind allen Bibliotheks-, Archiv- und Dokumentationssystemen gemein. Man spricht von strukturierten Daten. Die erlauben, jede einzelne Kategorie zu adressieren und so über Formatanweisungen unterschiedliche Zusammenstellungen - Kurz- oder Langausgaben - von Dokumenten zu steuern. Ebenso lässt sich die Suche auf vorgegebenen Kategorien einschränken, z. B.: nur Suche in Titeln. Die Kategorien sind Vorläufer und vergleichbar mit XML formatierten Daten – jedem Datenfeld geht eine Benennung voraus. Bibliothekarische/dokumentarische Regeln beschreiben jedoch auch, wie der Inhalt einer Kategorie zu erfassen – oder besser –; anzusetzen ist; z. B. Namen immer in der inversen Form und ohne Titel: Hamm Brücher, Hildegard. In einer Anwendung bestimmt die Wahl der Kategorien wesentlich die zukünftige Leistungsfähigkeit, aber auch den Erfassungsaufwand des Datenbanksystems. Die Brisanz solcher Entscheidungen kann an Folgendem nachvollzogen werden. Für die postalische Adresse kann man eine Kategorie vorsehen, in der die Adresse so eingegeben und angeordnet wird, wie sie auf einem Brief zu drucken ist. Oder man kann jede Information – Herr, Frau, Titel, Vorname, Familienname, c/o, Straße, Nr., Ort usw. in je einer Kategorie erfassen. Im letzteren Fall kann die so strukturierte Information benutzt werden, um eine Adressliste sortiert nach Orten und Straßen zu erstellen oder nach Familiennamen zu suchen. Ohne weitere Kategorien wäre es aber nicht möglich, eine amerikanische Adresse zu erfassen. Eine noch so exotische Adresse – „An das Brautpaar“ … - kann jedoch ohne Schwierigkeiten und Sonderregelungen im ersten Fall, wenn die gesamte Adresse in einem Feld steht, erfasst werden. Wir haben es mit einer Schere zu tun. Je weniger Kategorien beziehungsweise geringere Strukturierung der Daten, umso größer die Flexibilität bei der Erfassung und umso kleiner die Auswertungsmöglichkeiten der Information. Je mehr Kategorien beziehungsweise feinere Strukturierung, umso größer der Erfassungsaufwand und die Fehlermöglichkeiten dabei, aber auch umso mehr Auswertungsmöglichkeiten. Es dürfte evident sein, dass jeder Anwender hier eigene Vorstellungen über sein Kategorienschema hat. Folglich bietet DOMESTIC dem Anwender die Möglichkeit, seine Kategorien selber zu wählen. Auch ist davon auszugehen, dass im Laufe von Jahren die Anforderung und das Anwendungsgebiet der Dokumentation sich ändern werden. Nichts ändert sich so sehr, als dasjenige, das eigentlich für alle Zeiten festgelegt worden ist. DOMESTIC Oktober 2009 3 Als zusätzliche Aufgabe hat es DOMESTIC daher gesehen, dem Anwender auch die Möglichkeit zu bieten, in einer laufenden Anwendung nach Jahren zusätzliche Kategorien anzulegen, vorhandene zusammenzulegen oder aufzuteilen und weiteres mehr. Andererseits kann sich der Anwender auch an Standard Kategorienschemata halten, wie MAB2, MARC21 und dergleichen. Unterschiedliche Dokumentarten Ein Buch hat unter anderem die Kategorien: Autor, Herausgeber, Titel, Untertitel, Verlag. Ein Zeitschriftenaufsatz hat Autor, Titel, Untertitel, Zeitschriftenreihe, Heft. Ein Patent hat einen Erfinder und einen Anmelder. Unterschiedliche Dokumentarten haben unterschiedliche Kategorienschemata. Ein Schema zu einer Dokumentart besteht aus Kategorien, die sowohl in anderen Dokumentarten vorkommen als auch aus Kategorien, die nur zu dieser Art passen. In DOMETSTIC müssen zuerst die gewünschten Kategorien und ihre Eigenschaften erfasst werden. Dokumentarten ergeben sich dann aus den unterschiedlichen Zusammenstellungen der Kategorien. Dies steuert der Anwender durch Erfassungsmasken, die er selbst anlegen kann. In der Wahl der Kategorien und der Dokumentart ist der Anwender vollkommen frei. Anlegen einer Kategorie Kategoriencode Der Kategoriencode besteht aus einer vierstellige Ziffernfolge. Damit kennt DOMESTIC 10.000 Kategorien. Auf Wunsch können auch an der letzten Stelle - MAB2 kompatibel - Buchstaben verwendet werden. Der Kategoriencode aufsteigend bestimmt die Reihenfolge der Ausgabe der Kategorien bei der Dokumentausgabe. Zusätzlich gibt es auch eine oder mehrere programmierte Ausgaben gemäß den Wünschen des Anwenders, die von dieser Reihenfolge abweichen können. Der Kategoriencode wird zur Festlegung von Formaten und in der Suche benutzt. Mit der Dokumentadresse und dem Kategorien Code ist eine einzelne Kategorie ansprechbar. Kategorienbenennung Autor, Titel ist eine Kategorienbenennung. Es gibt zwei Benennungen je Kategorie, einmal für die Ausgabe und eine weitere für die Kategorie in der Erfassungsmaske, die identisch oder letztere präziser gefasst sein sollte. Zugriffsberechtigung und Weiteres Zu einer Kategorie werden weitere Angaben zur Zugriffsberechtigung verlangt, die im Helptext erläutert sind. DOMESTIC Oktober 2009 4 Verarbeitungskennzeichen, VKZ, Beispiele a) Autoren In der Autorenkategorie soll die Eingabe „Hamm Brücher, Hildegard # Scheel, Walter“ so intern verarbeitet werden, dass beide Namen in einem Personenregister aufgelistet werden und zwar in der Form Hamm Brücher, Hildegar … Scheel, Walter D. h. wir brauchen eine interne Verarbeitung, die den Gartenzaun oder das Semikolon als Trenner zwischen den Phrasen erkennt, sowie jede der Phrasen in das angegebene Register für Personen einfügt. Ferner sollen die Dokumente über diese Phrasen – mehrwortiger Ausdruck – suchbar sein. b) Titel „DOMESTIC Aufbau, Pflege und Nutzung einer Datenbank mit DOMESTIC“ ist ein Titel Von dieser Kategorie wünscht man sich, dass der Titel auch über „Aufbau“ und „Pflege“ gefunden wird. D. h. er soll über die Volltextsuche suchbar sein. c) Erscheinungsdatum In diese Kategorie wird als Eingabe ein Datum TT.MM.JJJJ erwartet, aber auch eventuell nur MM.JJJJ oder JJJJ. Einerseits soll bei der Eingabe formal überprüft werden, ob die Eingaben einem Datum oder einem Teil davon entsprechen. Andererseits soll eine Suche nach einem konkreten Datum, aber auch mit Intervallen – von – bis – möglich sein. Interne Verarbeitung Drei Kategorien sind oben betrachtet worden. Jede verlangt aber, anders behandelt zu werden. Dies geschieht dadurch, dass bei der Erfassung einer Kategorie dieser ein VKZ, ein Verarbeitungskennzeichen, zugeordnet wird. DOMESTIC bietet die diverse VKZs. Kategorien gleichen Typs – Anmeldedatum, Veröffentlichungsdatum usw. – ist jeweils das gleiche VKZ zuzuordnen. DOMESTIC ist intern so aufgebaut, dass bei Bedarf eine neue Verarbeitungsart realisiert werden kann, ohne dass die vorhandenen dadurch tangiert oder geändert werden. Allein das Neue muss programmiert werden. So lassen sich neue Anforderungen einfach realisieren. Volltextsuche zusätzlich Neben der vom Kategorientyp abhängigen internen über die VKZ gesteuerte Verarbeitung, die im einzelnen im online Helptext beschrieben sind, ist der gesamte Inhalt der Dokumente als Volltext suchbar. Das Dokument mit dem Autor „Hamm Brücher, Hildegard“ ist auch über das Stichwort „Hamm“ zu finden. Sensible Kategorien – Datenschutz – können davon ausgenommen werden. DOMESTIC Oktober 2009 5 Deskriptoren DOMESTIC widmet sich sehr den ‚Beschreibern’. Einerseits wird mit ihnen in dem Nachweis das Original beschrieben und andererseits wird die Suche mit ihnen formuliert. Deskriptoren können Namen von Personen, Namen von Institutionen, Firmen, Behörden, Namen von Produkten, Namen von geographischen Einheiten, Stadt, Land, Fluss usw. sein und nicht zuletzt inhaltlich beschreibende Begriffe. Ein Deskriptor kann ein mehrwortiger Ausdruck mit bis zu 250 Zeichen lang sein. Nicht-Deskriptoren Neben seiner einmal festgelegten Vorzugsbenennung können einem Deskriptor beliebig viele weitere Benennungen, wie Synonyme, Quasi-Synonyme, Abkürzungen, Notationen, Übersetzungen usw. zugeordnet werden, mit denen man statt des Deskriptors suchen kann. Bei Zuweisung zu einem Dokument werden sie durch die Vorzugsbenennung, den Deskriptor, ersetzt. In DOMESTIC sprechen wir von Deskriptoren und Nicht-Deskriptoren. Deskriptoren werden als Ganzheiten behandelt, d. h. ihre Zeichenfolge kann nicht in einem Dokument geändert werden. Sie können nur durch Klicken zugewiesen oder gelöscht werden. Siehe Deskriptorpflege Register, Lexikon Jeder Deskriptorkategorie ordnet man ein zweistelliges Kürzel für ein Register zu, z. B. den Kategorien Autor, persönlicher Herausgeber, Interviewer, Erfinder, Komponist, Dirigent usw. das Kürzel ‚PE’ für Personennamen. Alle Einträge in diesen Dokumentkategorien werden in dem Register ‚PE’ in alphabetischer Ordnung aufgelistet. Der Anwender kann aber auch Komponisten und Dirigenten in einem Musiker-Register sammeln, indem er den beiden Kategorien ‚MS’ als Register zuordnet. Meistens gibt es etwa folgende Deskriptorenregister: Namen von Personen Korporationen geographische Einheiten formale Deskriptoren freie Schlagwörter Thesaurusbegriffe Verwaltungsdeskriptoren Da ein Benutzer nicht wissen kann, ob z. B. ein Begriff im Thesaurus steht oder ein freier Begriff oder Ähnliches ist, werden alle Deskriptoren und ihre Nicht-Deskriptoren noch einmal zusammen in einem sogenannten Lexikon ausgegeben. Ein Deskriptor und auch seine Nicht-Deskriptoren können nicht gleichzeitig in mehreren Registern vorkommen. Die Register werden auch SubRegister des Lexikons genannt. Nicht-Deskriptoren werden in der Regel in dem gleichen Sub-Register wie der Deskriptor geführt. Die Nicht-Deskriptoren, z. B. Übersetzungen, können aber auch einem eigenen Sub-Register zugewiesen werden und bilden dann z. B. einen englischen Thesaurus. Gemeinsam mit dem Deskriptor und all seinen Nicht-Deskriptoren kommen sie immer im Lexikon vor. Neben dem Lexikon, das immer alle Deskriptoren und Nicht-Deskriptoren aus allen Sub-Registern führt, DOMESTIC Oktober 2009 6 können für den Dialog auch zusätzlich zwei oder drei Sub-Register zusammengemischt werden, z. B. freie Schlagwörter und Thesaurus-Begriffe in einem Misch-Register. Über VKZ=10 kann man auch erreichen, dass Deskriptoren in selbständigen Registern, die nicht auch im Lexikon verzeichnet sind, geführt werden. Auch unabhängige Register genannt, da vom Lexikon unabhängig. Damit sind auch gleich lautende Phrasen in mehreren unabhängigen Registern möglich. Im Helptext sind noch weitere spezielle Register für Signaturen, ISBN, ISSN und URLs beschrieben. Anordnung der Kategorien Unterschiedliche Dokumente haben teilweise die gleichen, aber auch unterschiedliche Kategorien. Um seine Datenbank entsprechend zu modulieren, schafft man sich am besten mit einer Tabelle eine Übersicht. Die Tabellenspalten beinhalten die Dokumentarten, Buch, Zeitschriftenaufsatz, Patentschrift usw. Die Zeilen stellen unterschiedliche Kategorien, wie Autor, Herausgeber, Erfinder, wobei man ähnliche Kategorien über die Dokumentarten bündelt, z. B. erst alle persönlichen Verursacher, dann Titel, Untertitel, Originaltitel, übersetzter Titel. Die einzelnen Kategoriengruppierungen sollte durch entsprechende Kategoriencodes gruppiert werden. Sinnvoll ist es, zwischen den Gruppen Platz zu lassen, um eventuell hier später weitere eintragen zu können. Einige DOMESTIC Konventionen gibt es, die aber auch geändert werden können. Die Kategorie 100 wird oft für Zeitschriftentitel verwendet, in 9007schreibt DOMESTIC automatisch das Ersterfassungsdatum, in 9017 das Datum der letzten Korrektur und in 9018 die letzen fünf Änderungsstempel. Ein Stempel besteht aus der UserID des Ändernden und dem Tagesdatum. Die Kategorie kann vom Benutzer nicht geändert werden. Der Stempel ist aus Datenschutzgründen nicht suchbar. Die Kategorienstammdaten bestehen im Endeffekt aus einer Liste - geordnet nach dem Kategoriencode -, indem die Kategorienschemata für jede gewünschte Dokumentart horizontal, zusammen gelegt sind. Änderungen an KAST in einer laufenden Anwendung Das Erstellen der Kategorienstammdaten ist sicherlich einfacher, wenn bekannt ist, was zu einem späteren Zeitpunkt, wenn bereits Dokumente erfasst wurden, diese wieder geändert werden können. Man kann jederzeit neue Kategorien hinzufügen, die Benennung der Kategorien ändern und die Eingangskontrolle verändern. Sobald die Änderungen, die interne Verarbeitung, die bereits erfassten Daten betreffen, bietet DOMESTIC folgende Möglichkeit: Die Daten der zu ändernden Kategorie oder Kategorien werden auf dem Server unter Mitnahme der Dokumentadresse in eine Datei exportiert und in der Anwendung inklusive ihrer internen Verarbeitung gelöscht. Nicht gelöscht werden Deskriptoren, auch wenn ihre Häufigkeit damit Null wird. Anschließend werden die gewollten Veränderungen, z. B. ein anderes VKZ, oder ein anderes Register in den Kategorienstammdaten eingetragen und die Daten wieder importiert. Der Import verarbeitet die Kategorieninhalte dann entsprechend der neuen Angaben in KAST. DOMESTIC Oktober 2009 7 Die exportierten Daten können vorher auch durch Programme verändert werden. Kategorien können zusammengelegt oder aufgeteilt werden. Der Kategoriencode kann mit ‚Suche’ und ‚Ersetze’ geändert und so die Kategorie in der Anwendung verschoben werden. Es gibt eigentlich nichts, was in einer laufenden Anwendung innerhalb von Stunden nicht verändert werden kann, was im laufenden Betrieb möglich, jedoch nicht empfehlenswert ist. An Hand der gesicherten Exportdatei kann bei einem Irrtum der ursprüngliche Zustand wieder hergestellt werden. Erfassungsmasken Um einen Nachweis zu einen Zeitschriftenaufsatz in DOMESTIC im Dialog zu erfassen, braucht man einen Bildschirm, auf dem die einzelnen Kategorien, die zu einem ZeitschriftenaufsatzNachweis gehören, als leere Felder präsentiert werden. Wir nennen das Masken. DOMESTIC bietet einen Maskeneditor: Mit der Maus können die gewünschten Kategorien aus einer Auflistung in die Masken hineingezogen werden. Die Reihenfolge der Kategorien in der Maske ist beliebig und sollte mit der Abfolge auf der Vorlage abgestimmt sein. Masken können von jedem User, der in der Datenbank schreiben darf, und für jeden Zweck, für die Erfassung, Korrekturen und Nachträge, ad hoc erstellt werden. Masken können schnell online generiert werden. Jede Kategorie erscheint in einer neuen Zeile mit einem gleich großem Eingabefeld, das sich bei Bedarf vergrößert. Formulare Formulare, die programmiert werden müssen, können wesentlich komfortabler gestaltet werden. DOMESTIC selber verwendet z. B. für die Rechtevergabe an die User ein Formular. Formulare können sein wie Steuererklärungen mit viel Text als Fragen, mit Ja/Nein ankreuzen, mit vorgegebenen formatierten Eingabefeldern, multiple choice Fragen und das, was der Anwender möchte. Sie richten sich an den ungeübten Nutzer oder komplexere Eingaben. Deskriptorkategorien, indirekte Eingabe Alle Kategorien in einer Maske, die nicht Deskriptorkategorien sind, präsentieren ein Eingabefeld mit einem normalen Texteditor. Der Dokumentar gibt den Inhalt über die Tastatur ein und springt mit TAB zum nächsten Feld. Nicht so bei Kategorien, in denen Deskriptoren erwartet werden. Um eine hohe Konsistenz der Datenbank zu gewähren, werden hier nur Phrasen, die vorhandene Deskriptoren sind, als Eingabe akzeptiert. Der Dokumentar kann die Deskriptoren aus den Registern durch Klicken als Ganzes übernehmen, oder sich für eine Neuaufnahme entschließen. Der Masken-Editor kennt die VKZ der Kategorie und unterscheidet selbständig zwischen Text- und Deskriptor-Editor. Natürlich können Deskriptoren oder ihre Abkürzungen auch direkt in das Eingabefeld geschrieben werden. Alle bekannten übernimmt DOMESTIC sofort, unbekannte werden zurückgewiesen. Mit dem Befehl ADD können auch neue Deskriptoren erfasst werden. Zur Überwachung der Konsistenz der Datenbank werden neue und geänderte Deskriptoren zentral protokolliert. DOMESTIC Oktober 2009 8 Kopieren DOMESTIC unterstützt weitgehend das Kopieren von bereits Vorhandenem in der Datenbank, z. B. die Übernahme aus einer vorhergehenden Erfassung desselben Users, wenn mehrere Aufsätze aus dem gleichen Zeitschriftenheft übernommen werden. Weitere Kopiermöglichkeiten sind dem Online-Helptext von DOCO, der Dokumenterfassung und -korrektur, zu entnehmen. Copy Kategorie Hierunter wird eine Pseudokategorie verstanden, in die ein strukturierter Text hinein kopiert wird, z. B. die MAB2 formatierten Angaben zu einem Buch, das von einem Bibliotheksverbund bereits erfasst wurde. DOMESTIC entnimmt der Kopie die Daten wie Autor, Titel usw. und fügt diese in die entsprechenden Kategorien der DOMESTIC Anwendung ein. Die Copy Kategorie selber ist anschließend wieder leer. Copy Cataloging wird dies im Englischen genannt. Das Gegenteil, die Ausgabe von DOMESTIC Dokumenten in einem vorgegebenen Fremdformat, z. B. Endnot, wird ebenso geboten. Eingabekontrolle, Workflow Datumskategorien und ISBN werden immer formal überprüft. Durch eine sogenannte Vorverarbeitung, VVA, kann mit Hilfe eines Programms jede Eingabe soweit wie möglich auf Plausibilität überprüft werden. In der Regel ist die Überprüfung spezifisch für die Kategorie und nicht für die Maske. Die VVA entweder eine von den bereits vorhandenen oder eine eigens zu programmierende ist mit ihrem Namen bei der Kategorie in KAST anzugeben. Siehe auch den Helptext dort. Endkontrolle Eine Maske oder ein Formular für einen Arbeitsschritt können einer Endkontrolle zugeordnet werden. Dies ist von KTS zu erstellen oder bereits vorhanden. Ist die Überprüfung der Eingaben positiv, kann dies in einer Statuskategorie vermerkt werden: ‚Ist formal vollständig’. Ist die Überprüfung negativ, wird dies gemeldet und der Status nicht verändert. So kann ein Workflow in einer Anwendung eingerichtet werden. Kategorienstammdaten, KAST Mehrfach wurde bereits KAST erwähnt. Jede Datenbank muss vom Anwender moduliert werden. DOMESTIC verwendet eine SQL Datenbank, Nachfolger der relationalen Datenbanksysteme wie früher Oracle und DB2. DOMESTIC verwendet MySQL, könnte aber auch eine der anderen verwenden. Modulieren bedeutet, man teilt dem Datenbanksystem in der SQL Sprache mit, welche Tabellen man benutzen will, um seine Daten abzuspeichern. Dies ist bereits in DOMESTIC geschehen. Der Anwender muss nur noch im Dialog DOMESTIC mitteilen, welche Kategorie er verwenden möchte, um DOMESTIC zu modulieren. Der Zugriff auf die Kategorienstammdaten kann in einer Anwendung auf einen oder mehrere Verwalter beschränkt werden. Vom Anwender werden keine Programmierkenntnisse erwartet. Das Modulieren einer Datenbank geschieht allein über einen Internet-Browser und ist möglich von jedem Ort der Welt DOMESTIC Oktober 2009 9 Zeichensatz DOMESTIC speichert die Daten in UNICODE in der Codierung UTF-8 mit Ausnahme der Code 0300-0370 Combining Diacritical Marks ab. Damit sind alle Zeichen der Welt erlaubt und auch im Volltext gemäß der Eigenheit der jeweiligen Sprache suchbar. Für die Verwendung aller Zeichen, auch als Deskriptoren, liegen bis jetzt Anwendungen für alle lateinischen, inklusive der Diakritika, kyrillischen, griechischen und hebräischen Zeichen vor. Zwei Deskriptoren sind identisch, wenn sie in den Grundzeichen gleich sind. René ist gleich rene, d. h. Unterschiede in Groß-/Kleinschreibung und Diakritika werden ignoriert. Im Deutschen betrifft dies die Umlaute. München ist gleich Munchen und nicht gleich Muenchen, wenn nicht letzteres als Nicht-Deskriptor eingegeben wurde. DOMESTIC folgt hier einer übernationalen Regel für mehrsprachige Register. Auch wenn nur eine Sprache verwendet wird, ist das Autoren-Register immer mehrsprachig. Transliteration oder Umschriften von nicht-lateinischen Schriften in Lateinisch mit „Diakritika“ können Zeichen enthalten, die nicht von UNICODE unterstützt werden und eventuell einer Sonderbehandlung und Einschränkung bedürfen. UNICODE kennt alle Schriften, jedoch nicht Transliterationen. Teil II - Deskriptoren, Thesaurus, Fakten Teil I berichtet über alles das, was man wissen muss, um eine Datenbank einzurichten, in der strukturierte Dokumentnachweise erfasst und gespeichert werden. Es wurde bereits dort von Deskriptoren und Nicht-Deskriptoren geredet. Eine DOMESTIC Anwendung setzt keinen Thesaurus voraus. In einer laufenden Anwendung kann mit DOMESTIC dynamisch ein in den Dokumentbestand integrierter Thesaurus entwickelt werden. (Alleinstellungsmerkmal von DOMESTIC 2009) Thesaurus Was ein kontrolliertes Vokabular zu einem Thesaurus macht, wurde bereits 1976 in der Norm DIN 1468 definiert. Danach müssen zu einem Deskriptor die Nicht-Deskriptoren, die Ober- und Unterbegriffe sowie ‚Siehe auch’ oder auch verwandte Begriffe und wenn möglich, eine Definition oder Anwendungsregel, ausgewiesen werden. Statt Thesaurus hört man heute (2009) auch das Wort Ontologie. DOMESTIC ordnet jedem neuen Deskriptor ein Dokument mit einer Adresse bestehend aus Dollarzeichen und der nächst höheren laufenden Nummer zu. Alles, was früher über DOMESTIC Dokumente gesagt wurde, trifft auch für diese Hintergrunddokumente, auch Hintergrundinformation, HGI, genannt, zu. Auch sie bestehen aus Kategorien. Der Deskriptor selbst befindet sich immer in der Kategorie B0100. Alle anderen Codes kann der Anwender frei wählen. DOMESTIC Oktober 2009 10 DOMESTIC kennt damit zwei Dokumentklassen, einmal die DOMESTIC Dokumente, auch Nachweise, Referenzen und Literaturdokumente genannt, und zum anderen die Hintergrundinformationen. Auf Kategorieebene wird zwischen den Dokumentklassen mit den Buchstaben L und B vor dem Kategoriencode unterschieden, L für Literaturdokumente und B für Hintergrund beziehungsweise Backgroundinformationen, L0110 oder B1010. Speziell bei einem Thesaurus wird statt HGI oft auch von einem Thesaurusdokument gesprochen. Der Anwender kann mehrere Nicht-Deskriptorkategorien anlegen, z. B. für Synonyme, für Abkürzungen, für andersartige Schreibweisen, Foto, Photo, für Übersetzungen ins Englische oder Französische oder beides. In der Regel folgen nach den Nicht-Deskriptorkategorien die Ober- und Unterbegriffskategorien. Im Prinzip sind sie identisch den Deskriptorkategorien zur Verschlagwortung von Dokumenten, d. h. hier können Deskriptoren zugewiesen werden. Die HGIs sind auch über diese Deskriptoren suchbar. Ordnet man den Begriff ‚Kraftwerk’ dem Begriff ‚Windkraftwerk’ als Unterbegriff zu, so ist eigentlich in dem Moment bekannt, dass das ‚Kraftwerk’ der Oberbegriff von ‚Windkraftwerk’ ist. Gibt man in KAST zu der Oberbegriffskategorie die Unterbegriffskategorie und umgekehrt an, so erledigt DOMESTIC die inverse Beziehung automatisch. Es wird Cross Entry genannt. Die Kategorie für die ‚Siehe auch Begriffe’ ist eine normale Deskriptorkategorie, und für die Definition wird eine Textkategorie verwendet, so dass die HGI auch über Stichwörter der Definition gefunden werden kann. Dem Anwender ist es überlassen, hier weitere Kategorien, z. B. für die Zuordnung des Deskriptors zu einem Begriffsumfeld, auch Micro-Thesaurus genannt, oder Verwaltungskategorien anzulegen. Hierarchische Darstellung eines Thesaurus In der Hintergrundinformation eines Deskriptors wird nur die nächste Stufe der Unterbegriffe des Deskriptors wiedergegeben. Aber jeder Unterbegriff ist selbst ein Deskriptor und kann wieder Unterbegriffe haben und so weiter. DOMESTIC kennzeichnet im Register und Lexikon solche Deskriptoren, die Unterbegriffe haben, mit einem Kreuz in einem gelben Kästchen. Klickt man darauf, so erhält man den Deskriptor, seine Oberbegriff und den ersten Unterbegriff, wenn dieser selbst Unterbegriffe hat, diesen und eventuell die Unterbegriffe von diesem usw. Die ganze Hierarchie nach unten. Die Information dazu wird den Thesaurusdokumenten entnommen. Um bei dieser Darstellung Schleifen zu vermeiden, kontrolliert DOMESTIC bei der Eingabe, ob ein Deskriptor nicht innerhalb eines Hierarchiezweiges mehrfach vorkommt. Klassifikationen In der Regel steht dem jeweiligen Begriff beziehungsweise der Klasse eine Notation voran und das Auflisten soll gemäß der Notation erfolgen. Auch Klassifikationen lassen sich mit DOMESTIC handhaben. DOMESTIC Oktober 2009 11 Manche Klassifikationen entziehen sich einem einfachen alphanumerischen Sortieren, z. B. die Internationale Patentklassifikation, IPC. Hier muss dann neben der externen Notation eine zusätzliche interne für die Sortierfolge verwendet werden. Hintergrundinformationen, allgemein HGI ist über den Deskriptor erreichbar. Sieht man den Deskriptor ‚Friedensverhandlungen’ in einem Register/Lexikon oder als Verschlagwortung in einem Dokument oder irgendwo in DOMESTIC, genügt ein Klick und ein EXPAND, um die HGI zu dem Deskriptor auszugeben. Jeder Deskriptor in DOMESTIC hat potenziell ein Hintergrunddokument. Was spricht dagegen, in die HGI des Springer Verlags seine Adresse, Telefonnummer, Ansprechpartner und mehr zu hinterlegen? All dies wird nur einmal in DOMESTIC gespeichert und ist nur einmal zu aktualisieren, wenn sich z. B. die Telefonnummer ändert. Zugriff auf die Daten hat man von jedem DOMESTIC Dokument, in dem ‚Springer’ erwähnt wird. Eine HGI kann selbst wieder mit Deskriptoren verschlagwortet werden. Die Suche ‚Wissenschaftlicher Verlag’ findet alle so erfassten Verlage. Faktendokumentation Die publizierten Referate einer Fachtagung werden wie Fachzeitschriftenaufsätze referenziert. Um ihre Herkunft zu dokumentieren, wird man sie mit dem Deskriptor für die Tagung, z. B. ‚Dokumentar Tag 2002, Frankfurt’ indexieren. Nichts spricht dagegen, die Hintergrundinformation des Deskriptors zu nutzen, um darin die Tagung selbst zu dokumentieren: Thema der Tagung, Veranstalter, Tagungsdauer und -ort, Link auf die Teilnehmerliste, weiteres und eine Verschlagwortung. Diese Art der Dokumentation, die nicht mehr eine Referenz auf die eigentliche Information, sondern die Information selbst enthält, wird Faktendokumentation genannt. Fakten können zu Personen (Datenschutz!), Firmen, Verlagen, Konferenzen/Tagungen, Verträgen/Abkommen und mehr erfasst und laufend aktualisiert werden. Die Kategorienstammdaten zu den Hintergrundinformationen müssen um jeweils zu den Fakten passende Kategorien erweitert werden. Ein Paradebeispiel über die Nützlichkeit der Faktendokumentation lautet: Jemand hat ein für sich relevantes Dokument gefunden und sieht in dem Dokument den Namen der Tagung. Mit EXPAND öffnet er die HGI zu der Tagung und stellt fest, dass das Thema der Tagung genau zu seiner Recherche passt. Mit einer Suche mit dem Namen der Tagung findet er weiteres Relevantes. Alles, was für Thesaurusdokumente beschrieben wurde, kann auch hier verwendet werden, so auch Cross Entry. Deskriptorpflege DOMESTIC bietet als Dialogfunktionen einen ganzen Werkzeugkasten, um Deskriptoren nachträglich auch in den Dokumenten zu ändern. So kann die Schreibweise eines Deskriptors DOMESTIC Oktober 2009 12 global geändert, zwei Deskriptoren zusammen gelegt, ein Deskriptor einer durch die Suche bestimmte Menge von Dokumenten hinzugefügt oder gelöscht werden und mehr. Renovierung einer Datenbank Datenbanken können alt werden, heute 30 Jahre und in Zukunft mehr. In 30 Jahren hat sich die Computertechnik wesentlich geändert. Das Kategorienschema wurde mehrfach geändert und erweitert. Fremddaten nach anderen Regeln erfasst, sind in die Datenbank integriert worden. Der Thesaurus wurde um einen zweiten fremden erweitert. Auf die Dauer gesehen, geht es nicht nur um Datenerfassung und Retrieval, sondern permanent auch um Umstellungen und Anpassungen der Datenbank an die mit der Zeit von Außen kommenden Anforderungen. Die DOMESTIC Deskriptorpflege, und der Export/Import sind Werkzeuge für den Anwender dazu. KTS berät hier die Anwender gerne oder übernimmt auch komplizierte Aufgaben. Teil III – Originale, Langzeit archivieren Natürlich können Sie in DOMESTIC beliebig lange Dokumente, Fotos und mehr erfassen. Doch empfohlen wird, DOMESTIC als reines Nachweissystem als Metadatenbank zu betreiben und die Originale, soweit es elektronische Kopien sind, auf einem Web Server wie Apache zu speichern und mit einem Hyperlink aus DOMESTIC direkt aufrufbar zu machen. Dieses Vorgehen, Nachweissystem und Archiv zu trennen, hat vielfache Vorteile und bietet große Flexibilität. Aus dokumentarischer Sicht ist es ein gravierender Fehler, Volltext und Verschlagwortung in einem System zusammen zu erfassen. DOMESTIC kann mit mehreren Archiven zusammenarbeiten. Dies können sein: öffentlich zugängliche, aber auch solche, die einen Bezahlmodus davor schalten, eine besondere Sicherheitsstufe verlangen oder einfach ein zweites Archiv, wenn das erste es nicht mehr schafft. Technisch verlangen die beiden Systeme Retrieval/und Dokumenterfassung und eine Langzeitarchivierung auch unterschiedliche Behandlung und unterschiedliches Vorgehen bei technischem Fortschritt. Internetveröffentlichungen Auf den ersten Blick ist eine Internetveröffentlichung nicht viel anders als ein Fachzeitschriftenaufsatz in DOMESTIC zu referieren. Doch es gibt einige Besonderheiten. Das Original ist über einen URL aufzurufen und dies möglichst mit einem Klick auf den Link im DOMESTIC Dokument. Alle erfassten URLs würde man gern in einem Register einsehen können, aus dem man sowohl die Referenz als auch die Veröffentlichung im Internet aufrufen möchte. Alle diese Anforderungen erfüllt DOMESTIC mit der VKZ=12. Archiv Assistent, ArAs Im Internet ist nicht garantiert, dass eine Veröffentlichung dort immer unter dem gleichen URL und in nicht veränderter Version zu erreichen ist. Der ArAs erlaubt dem Benutzer über seinen Browser im Internet – remote - bei Angabe des URLs, eine Backup Kopie auf einem zentralen Archiv Server DOMESTIC Oktober 2009 13 zu hinterlegen. Über eine Copy Kategorie wird in DOMESTIC der Zugriff auf das Backup, der Original-URL und mehr übernommen. Auch Dateien auf seinem Rechner kann der Benutzer dauerhaft mit dem ArAs ins Archiv einstellen und referenzieren. Teil IV - Mehrsprachigkeit DOMESTIC gibt alle Deskriptoren in Dokumenten, in Registern, in der Hierarchie, und sonst wo in einer gewählten Sprache aus, soweit Übersetzungen der Deskriptoren vorhanden sind. Die Übersetzungen müssen in der HGI des Deskriptors in einer Kategorie hinterlegt werden. Die Kategorie enthält das VKZ für Nicht-Deskriptoren mit einem eigenen Subregister, z. B. ET für englischen Thesaurus. Dem Engländer wird damit ein englischer Thesaurus geboten. Mit den englischen Begriffen kann er suchen oder auch Dokumente verschlagworten, und in dem Dokument sieht er englische Deskriptoren. Die Retrieval Oberfläche und die Kategorienbenennung können ebenfalls in Englisch sein. Will man die Mehrsprachigkeit verwenden, ist noch Einiges mehr zu beachten. Teil V – Hier: Nicht-Behandeltes von DOMESTIC DOMESTIC ADP Aufbereitung zu Druckprodukten DOMESTIC libri Ausleihe, Leserverwaltung, Barcode, RFID, selbst verbuchte Rückgabe, E-Mails DOMESTIC Journal DOMESTIC Zeitschriftenverwaltung, Abonnement-Verwaltung, Eingangskontrolle DOMESTIC URL Checker Kontrolle von Internetveröffentlichungen DOMESTIC Dialog Portal, Laiensuche, Bewertung von Dokumenten DOMESTIC Community Social tagging und mehr DOMESTIC Mobil Zugriff auf DOMESTIC Community über Smartphones mit dem Android Betriebssystem DOMESTIC Oktober 2009 14