Internet-Datenbanken. Probleme und Perspektiven Die Dummen haben das Pulver nicht erfunden, aber sie schießen damit (Gerhard Uhlenbruck) Überlegungen zum geisteswissenschaftlichen Umgang mit Informationstechnologien aus der Sicht eines potentiellen Gesamthaushaltes Datenbanken Datenbanken reflektieren und verwalten Informationen aller Funktionsumgebungen moderner Gesellschaften Datenbanken reflektieren einen Teil der »realen« Welt in einer strukturieren Miniwelt Datenbanken allein können die etxrem anwachsenden Datenmengen der Klassischen Archäologie strukturell zugänglich erhalten und ihre intellektuelle Erfaßbarkeit verbessern Internet Zusammenschluß vieler unterschiedlicher, territorial oder organisatorisch begrenzter Netze, die an den Backbones (Leitungssystem, das alle bedeutenden Rechenzentren der Welt miteinander verbindet) hängen verschiedene Betriebssysteme, unterschiedliche Hardware u. a. seit 1993 Popularisierung Internet-Datenbanken Internet-Datenbanken sind demnach die Möglichkeit der strukturierten Informationsverwaltung auf weltweit zugänglicher Basis es entsteht ein potentiell verfügbarer Gesamthaushalt von Informationen, zu dem man sich verhalten kann Fazit in einer geisteswissenschaftlichen Disziplin, die sich schwerpunktmäßig mit Denkmälern der materiellen Kultur befaßt, könnten Überlegungen zum Umgang mit Informationsressourcen auf der Basis der Informationsverarbeitung als sinnvoll erkannt werden Internet-Datenbanken. Aspekte des nachhaltigen Umgangs mit Informationen als denkbares Anliegen Datenrecycling für nichtdigitale Informationssysteme Beazley-Kartei und ähnliches nicht alle, aber manche Informationssammlungen von Forschern werden ähnlich angelegt und gepflegt nicht alle, aber manche Informationssammlungen von Forschern sind in der Validität ihrer Daten ähnlich bedeutend in ihnen ist ein extrem hoher Input akkumuliert: Anstrengung, Wissen, Erfahrung und evtl. öffentliche Mittel Ergebnis: gedruckte Publikationen, d. h. Information in strukturierter und validierter Form, aber nicht vernetzbar oder abfragbar Abfall: Informationsbasis, obwohl nicht in allen Fällen nur unstrukturiert und unvalidiert viele Informationen der Materialsammlung kommen in der Publikation nicht zum Tragen Retrospektive Verarbeitung in der Beazley-Kartei ist sie geleistet worden, s. die Internet-Datenbank des Beazley-Archivs denkbare Kandidaten: Corpora, die noch immer rein in Buchform betrieben werden - Informationen der gedruckten Publikation sind in strukturierter und gewollter Form aufbereitet, aber nicht vernetzbar oder abfragbar Nachlässe oder nach anderen Gesichtspunkten angelegte Informationssammlungen erfordern für die Digitalisierung einen hohen Strukturierungsaufwand Digitalisierungsgewinn kann erheblich sein (Beazley-Vasenkartei über die Beazley-Datenbank im Web, Fittschen-Porträtkartei über Arachne im Web, Realkataloge des DAI über DYABOLA im Web) Internet-Datenbanken. Aspekte des nachhaltigen Umgangs mit Informationen als denkbares Anliegen Datenrecycling für nichtdigitale Informationssysteme Prospektive Verarbeitung Vorbereitung: Informationssammlungen zur Vorbereitung von Magister-, Dissertations-, Habilitations- und sonstigen Forschungsprojekten können gleich auf Datenbankbasis angelegt werden dadurch werden von Beginn an viele spätere Verwendungsszenarien offengehalten Publikation: separate, evtl. an der analytischen Vorgehensweise der gedruckten Abhandlung orientierte, flankierende Datenbankpublikation Abschottung von Daten Informationen der Datenbankpublikationen können, trotz großer inhaltlicher und sachlicher Nähe sowie derselben Basissoftware, ebenfalls unvernetzbar, also nicht mit anderen Beständen gemeinsam abfragbar sein oder gemacht werden money for nothing: derart gewollte kommerzielle und/oder konzeptionelle Abschottung wird teilweise noch immer, aber mit rückläufgem Trend, aus öffentlichen Mitteln gefördert die Urheberrechtsproblematik bezüglich der Internetwiedergabe von Bild- und Textrechten ist jüngst im Rahmen des § 52 a des Urheberrechtsgesetzes neu gefaßt worden darüberhinausgehende Verträge zwischen geisteswissenschaftlichen Institutionen und Softwarefirmen sollten nicht abgeschlossen werden, da sie die Zugänglichkeit von Daten zusätzlich einschränken durch kostenpflichtigen Internetzugriff auf Daten, deren Erstellung aus öffentlichen Mitteln gefördert worden ist durch Urheberrechtsabtretung für die erstellten Daten an die Firmen, die diese Daten erstellt haben öffentliche Institutionen sollten niemals Urheberrechte zu ihren Daten an die Ersteller abtreten Internet-Datenbanken. Aspekte des nachhaltigen Umgangs mit Informationen als denkbares Anliegen Datenrecycling für nichtdigitale Informationssysteme Fazit häufiges Skepsisargument: die reale, aber oft irrational argumentierte Gefahr des digitalen Informationsverlustes (mit bestimmten Vorkehrungen nicht unbeherrschbar. Substantiell: auf den Prometheus-Seiten der Vortrag von Prof. Dr. Rudolf Gschwind über eine Studie, die für das Schweizer Bundesamt für Zivilschutz, Sektion Kulturgüterschutz erstellt wurde) hingenommen werden stattdessen: erhebliche Zugänglichkeits- und Informationsverluste durch Nichtdigitalisierung erhebliche Informationsverluste durch technische oder juristische Abschottung in der deutschen Klassischen Archäologie könnte man sich die Frage stellen, ob das so gewollt sein kann Internet-Datenbanken. Aspekte des nachhaltigen Umgangs mit Informationen als denkbares Anliegen Datenrecycling bei digitalen Informationssystemen XML-Frontends. Integration von ARACHNE im Cross Dataset Searching Project. Website hosted by each partner (Tailored to each organisation) ®Greg Parker, Beazley Archive, Oxford HTML Results Search Distributing Script XML Client Web Browser Result Formatting Script Universität zu Köln, Forschungsarchiv Apache Arachne File Maker/ MySQL Internet-Datenbanken. Aspekte des nachhaltigen Umgangs mit Informationen als denkbares Anliegen Datenrecycling bei digitalen Informationssystemen XML-Frontends. Integration von ARACHNE im Cross Dataset Searching Project. Website hosted by each partner (Tailored to each organisation) ®Greg Parker, Beazley Archive, Oxford University of Oxford, Beazley Archive Search Request Search Request HTML Results Search Distributing Script XML Client Web Browser Result Formatting Script Active Server Pages Script Universität zu Köln, Forschungsarchiv University of Paris X (LIMC) Musée du Louvre (Antiquities) Apache Perl Scripts Access Database SQL Server Database Perl Scripts Oracle Database File Maker/ MySQL Internet-Datenbanken. Aspekte des nachhaltigen Umgangs mit Informationen als denkbares Anliegen Datenrecycling bei digitalen Informationssystemen XML-Frontends. ARACHNE in UBI ERAT LUPA ®Kurt Schaller Internet-Datenbanken. Aspekte des nachhaltigen Umgangs mit Informationen als denkbares Anliegen Datenrecycling bei digitalen Informationssystemen Interoperabilität Von Seiten der Benutzer (der Archäologie) aus ist Interoperabilität = Nutzen, fehlende I. = Schaden Technische Inseln muß es nicht mehr geben Datenbank-Management-Systeme sind nur selten »technisch inkompatibel« Import- und Exportfähigkeit über Formate wie XML sind die technische Ebene für die gegenseitige Öffnung nahezu aller Datenbank-Management-Systeme und damit auch aller Datenbanken Geistige Inseln verbleibendes Problem, das auch XML nur unvollkommen lösen kann: inhaltliche Unterschiede der Eingabefelder Lösungsmöglichkeit: Thesauroi und ihre gegenseitige Abstimmung Iconclass: umfassendes, aber nicht einfach zu handhabendes Klassifikationssystem der Kunstgeschichte Gesellschaft für Klassifikation: Beispiel für grundlegende Bedeutung dieses Aspektes Anwendungsmöglichkeiten liegen zwischen nicht mehr anwendbarer Perfektion und gar nichts interner Austausch zu Thesauroi und externe Wahrnehmung (zur Schematisierung von Thesauroi s. www.w3.org) in der Klassischen Archäologie weitgehend inexistent Frontends Frontends (Oxford, Prometheus, Lupa) - meist aus praktischen Gründen auf eher oberflächliche Eingriffstiefe beschränkt (Standardfelder), da geisteswissenschaftliche Datenbanken zu Heterogenität tendieren tiefer eingreifende und vermittelnde Mediatoren sind noch ein Desiderat Internet-Datenbanken. Aspekte des nachhaltigen Umgangs mit Informationen als denkbares Anliegen Datenrecycling bei digitalen Informationssystemen Fazit potentiell sinnvoll wären konzeptionelle Anstrengungen, die Zahl der Insellösungen nicht weiter zu vergrößern durch rechtzeitige Abstimmung über Thesauroi und XML-Kompatibilität könnte späterer manueller Aufwand erspart und sinvoller in weitere Digitalisierungsfortschritte investiert werden Etikettenschwindel: mit »kompatiblen« Datenbanken wird von ganz unterschiedlichen Anbietern geworben - in Wirklichkeit sind sie dann oft durch die Felddefinitionen oder zusätzlich durch die Datenmodellierung und kommerzielle Politik doch nur wieder zu Insellösungen Internet-Datenbanken. Aspekte des nachhaltigen Umgangs mit Informationen als denkbares Anliegen Aspekte praktischer Entwicklungsszenarien »Täter« Informatiker Experten Informatiker sind im Denken stark naturwissenschaftlich geprägt ein geisteswissenschaftliches Studium ist nicht durch Autodidaktik kompensierbar Laien Anwender »Opfer« archäologische »Computerexperten« sind keine Informatiker und werden auch keine ein Informatikstudium ist nicht durch Autodidaktik kompensierbar nicht hinnehmbare Situation, Ausweg: professionelles IT-Konzept Kontinuität der Software-Weiterentwicklung Anforderungsanalyse und technische Umsetzung professionelles IT-Konzept ohne eigene IT-Abteilung? universitäre Kooperationen Spezifizierte Öffnung der Anwender und Informatiker HKI- und/oder Pharos-Thesen: Informatiker kommen generell aus dem mathematisch-naturwissenschaftlichen Bereich sie basieren auf Datenstrukturen, die präzise, eindeutig und homogen sind, und erwarten diese auch hinsichtlich des zu repräsentierenden Inhaltes Geisteswissenschaftler beschäftigen sich generell mit Wissensdomänen, die aus ungenauen, mehrdeutigen und heterogenen Bedeutungen bestehen können Fazit die Repräsentation spezifisch geisteswissenschaftlicher Informationsstrukturen in elektronischen Datenstrukturen ist zu Beginn fast ein Widerspruch in sich ihn aufzulösen bedingt die Eröffnung eines interdisziplinären Diskurses zwischen Computerwissenschaften und Geisteswissenschaften dies ist der Beginn eines Weges, nicht die sofortige Lösung - was schnelle Realisierungen nicht ausschließt Internet-Datenbanken. Aspekte der Lebenserwartung von Technik aus der Sicht menschlicher Sozialisierung Aspekte praktischer Entwicklungsszenarien Nachhaltigkeit der Softwareentwicklung eine institutionalisierte Internet-Datenbank ist nie »fertig« ist daher kein Arbeitsplatz für Einzeltäter, die sich in der potentiellen Ahnungslosigkeit ihrer Umgebung ohne professionelle Distanz (Informatikstudium), ein Denkmal setzen wollen geht früher oder später durch viele Hände von Entwicklern und Verantwortlichen sollte, um sich weiterentwickeln zu können, nicht an personellen Übergängen scheitern conditiones, sine quae non bei jeglicher konzeptioneller Designentscheidung Bemühung um größtmögliche Tansparenz parallel zur Entwicklung in sinnvollem Umfang technische und systematische Dokumentation niemals Geld investieren für technisch nicht vollkommen offengelegte (und vom Käufer natürlich vertraulich zu behandelnde) Lösungen oder Teillösungen die verwendeten Werkzeuge und Elemente sollten, soweit irgend möglich, offene Werkzeuge ohne firmeneigene Standards sein sollten bei allgemeinen Scriptsprachen möglichst wenig programmspezifischen Code enthalten (etwa Javascript-Versionen oder Javascripts, die nur von wenigen html-Editoren verwendet oder nicht von allen wichtigen Browsern verstanden werden etc.) Fazit auch ohne viel technisches Verständnis wäre es von Seiten einer Geisteswissenschaft theoretisch möglich, eine soziale und dienstliche Einwirkung für die Einhaltung sinnvoller Kriterien auszuüben Internet-Datenbanken. Zur Lebenserwartung aus der Sicht des Umgangs mit Technik Aspekte praktischer Entwicklungsszenarien die Datenbanken (»Container«) man kann die einzig geniale Datenbank oder das einzig geniale Frontend programmieren lassen man kann sogar vergessen, daß man das alles nicht selbst gemacht hat man kann besonders teure Datenbank-Produkte kaufen und: alles bleibt leer was ist passiert? die Inhalte (»Content«) es fehlen Eingaben Frontends und Datenbanken bleiben leer oder völlig überdimensioniert, wenn keine adäquate Herstellung von Inhalten stattfindet schwieriger als alles andere ist, einen kontinuierlichen Digitalisierungsvorgang von wissenschaftlichen Daten und Bilddaten aufrechtzuerhalten, d. h. finanziell darzustellen Probleme im Arbeitsablauf das verwendete Datenbank-Management-System ist nicht eingabefreundlich Probleme in der Förderung in Förderungskonzepten werden aufgrund knapper Mittel Denken und Dokumentieren als gegensätzliche Bereiche überkonturiert »wir wollen keine Datenfriedhöfe fördern« ruft es Nachts von den Denkfriedhöfen man kann das natürlich auch alles überflüssig finden, so überflüssig wie ... Tonfilm (H. M. Warner of Warner Bros., 1927: "Who the hell wants to hear actors talk?“) oder Computer (Thomas Watson, IBM Chairman, 1943: "I think there is a world market for maybe five computers.“) oder Home Computer (Ken Olsen, Digital Equipment Corp. founder, 1977: "There is no reason for any individual to have a computer in their home.“) und natürlich Arbeitsspeicher (Bill Gates, Microsoft founder, 1981: "640 KB of memory ought to be enough for anybody.“) “Hier könnte später stehen, was S i e 2003 für überflüssig gehalten haben." (NN, 2003) Aber bedenken Sie: lustig sind diese Beispiele nur, weil die Firmen noch existieren, und dies tun sie nur, weil sie sich noch rechtzeitig umentschieden haben...