Internet-Datenbanken. Probleme und Perspektiven

Werbung
Internet-Datenbanken. Probleme und Perspektiven
Die Dummen haben das Pulver nicht erfunden, aber sie schießen damit (Gerhard Uhlenbruck)
Überlegungen zum geisteswissenschaftlichen Umgang mit Informationstechnologien aus der Sicht eines
potentiellen Gesamthaushaltes
Datenbanken
 Datenbanken reflektieren und verwalten Informationen aller Funktionsumgebungen moderner Gesellschaften
 Datenbanken reflektieren einen Teil der »realen« Welt in einer strukturieren Miniwelt
 Datenbanken allein können die etxrem anwachsenden Datenmengen der Klassischen Archäologie strukturell
zugänglich erhalten und ihre intellektuelle Erfaßbarkeit verbessern
Internet
 Zusammenschluß vieler unterschiedlicher, territorial oder organisatorisch begrenzter Netze, die an den
Backbones (Leitungssystem, das alle bedeutenden Rechenzentren der Welt miteinander verbindet) hängen
 verschiedene Betriebssysteme, unterschiedliche Hardware u. a.
 seit 1993 Popularisierung
Internet-Datenbanken
 Internet-Datenbanken sind demnach die Möglichkeit der strukturierten Informationsverwaltung auf weltweit
zugänglicher Basis
 es entsteht ein potentiell verfügbarer Gesamthaushalt von Informationen, zu dem man sich verhalten kann
Fazit
 in einer geisteswissenschaftlichen Disziplin, die sich schwerpunktmäßig mit Denkmälern der materiellen Kultur
befaßt, könnten Überlegungen zum Umgang mit Informationsressourcen auf der Basis der
Informationsverarbeitung als sinnvoll erkannt werden
Internet-Datenbanken. Aspekte des nachhaltigen Umgangs mit Informationen
als denkbares Anliegen
Datenrecycling für nichtdigitale Informationssysteme
Beazley-Kartei und ähnliches
 nicht alle, aber manche Informationssammlungen von Forschern werden ähnlich angelegt und gepflegt
 nicht alle, aber manche Informationssammlungen von Forschern sind in der Validität ihrer Daten ähnlich
bedeutend
 in ihnen ist ein extrem hoher Input akkumuliert: Anstrengung, Wissen, Erfahrung und evtl. öffentliche Mittel
 Ergebnis: gedruckte Publikationen, d. h. Information in strukturierter und validierter Form, aber nicht vernetzbar
oder abfragbar
 Abfall: Informationsbasis, obwohl nicht in allen Fällen nur unstrukturiert und unvalidiert
 viele Informationen der Materialsammlung kommen in der Publikation nicht zum Tragen
Retrospektive Verarbeitung
 in der Beazley-Kartei ist sie geleistet worden, s. die Internet-Datenbank des Beazley-Archivs
 denkbare Kandidaten: Corpora, die noch immer rein in Buchform betrieben werden - Informationen der
gedruckten Publikation sind in strukturierter und gewollter Form aufbereitet, aber nicht vernetzbar oder abfragbar
 Nachlässe oder nach anderen Gesichtspunkten angelegte Informationssammlungen erfordern für die
Digitalisierung einen hohen Strukturierungsaufwand
 Digitalisierungsgewinn kann erheblich sein (Beazley-Vasenkartei über die Beazley-Datenbank im Web,
Fittschen-Porträtkartei über Arachne im Web, Realkataloge des DAI über DYABOLA im Web)
Internet-Datenbanken. Aspekte des nachhaltigen Umgangs mit Informationen
als denkbares Anliegen
Datenrecycling für nichtdigitale Informationssysteme
Prospektive Verarbeitung
 Vorbereitung: Informationssammlungen zur Vorbereitung von Magister-, Dissertations-, Habilitations- und
sonstigen Forschungsprojekten können gleich auf Datenbankbasis angelegt werden
 dadurch werden von Beginn an viele spätere Verwendungsszenarien offengehalten
 Publikation: separate, evtl. an der analytischen Vorgehensweise der gedruckten Abhandlung orientierte,
flankierende Datenbankpublikation
Abschottung von Daten
 Informationen der Datenbankpublikationen können, trotz großer inhaltlicher und sachlicher Nähe sowie derselben
Basissoftware, ebenfalls unvernetzbar, also nicht mit anderen Beständen gemeinsam abfragbar sein oder
gemacht werden
 money for nothing: derart gewollte kommerzielle und/oder konzeptionelle Abschottung wird teilweise noch immer,
aber mit rückläufgem Trend, aus öffentlichen Mitteln gefördert
 die Urheberrechtsproblematik bezüglich der Internetwiedergabe von Bild- und Textrechten ist jüngst im Rahmen
des § 52 a des Urheberrechtsgesetzes neu gefaßt worden
 darüberhinausgehende Verträge zwischen geisteswissenschaftlichen Institutionen und Softwarefirmen sollten
nicht abgeschlossen werden, da sie die Zugänglichkeit von Daten zusätzlich einschränken
durch kostenpflichtigen Internetzugriff auf Daten, deren Erstellung aus öffentlichen Mitteln gefördert
worden ist
durch Urheberrechtsabtretung für die erstellten Daten an die Firmen, die diese Daten erstellt haben
 öffentliche Institutionen sollten niemals Urheberrechte zu ihren Daten an die Ersteller abtreten
Internet-Datenbanken. Aspekte des nachhaltigen Umgangs mit Informationen
als denkbares Anliegen
Datenrecycling für nichtdigitale Informationssysteme
Fazit
 häufiges Skepsisargument: die reale, aber oft irrational argumentierte Gefahr des digitalen Informationsverlustes
(mit bestimmten Vorkehrungen nicht unbeherrschbar. Substantiell: auf den Prometheus-Seiten der Vortrag von
Prof. Dr. Rudolf Gschwind über eine Studie, die für das Schweizer Bundesamt für Zivilschutz, Sektion
Kulturgüterschutz erstellt wurde)
 hingenommen werden stattdessen:
erhebliche Zugänglichkeits- und Informationsverluste durch Nichtdigitalisierung
erhebliche Informationsverluste durch technische oder juristische Abschottung
 in der deutschen Klassischen Archäologie könnte man sich die Frage stellen, ob das so gewollt sein kann
Internet-Datenbanken. Aspekte des nachhaltigen Umgangs mit Informationen
als denkbares Anliegen
Datenrecycling bei digitalen Informationssystemen
XML-Frontends. Integration von ARACHNE im Cross Dataset Searching Project. Website hosted by each partner
(Tailored to each organisation) ®Greg Parker, Beazley Archive, Oxford
HTML
Results
Search Distributing
Script
XML
Client
Web Browser
Result Formatting
Script
Universität zu Köln,
Forschungsarchiv
Apache
Arachne
File Maker/
MySQL
Internet-Datenbanken. Aspekte des nachhaltigen Umgangs mit Informationen
als denkbares Anliegen
Datenrecycling bei digitalen Informationssystemen
XML-Frontends. Integration von ARACHNE im Cross Dataset Searching Project. Website hosted by each partner
(Tailored to each organisation) ®Greg Parker, Beazley Archive, Oxford
University of Oxford, Beazley Archive
Search Request
Search Request
HTML
Results
Search Distributing
Script
XML
Client
Web Browser
Result Formatting
Script
Active
Server
Pages
Script
Universität zu Köln,
Forschungsarchiv
University of Paris X (LIMC) Musée du Louvre (Antiquities)
Apache
Perl
Scripts
Access
Database
SQL
Server
Database
Perl
Scripts
Oracle
Database
File Maker/
MySQL
Internet-Datenbanken. Aspekte des nachhaltigen Umgangs mit Informationen
als denkbares Anliegen
Datenrecycling bei digitalen Informationssystemen
XML-Frontends. ARACHNE in UBI ERAT LUPA ®Kurt Schaller
Internet-Datenbanken. Aspekte des nachhaltigen Umgangs mit Informationen
als denkbares Anliegen
Datenrecycling bei digitalen Informationssystemen
Interoperabilität
 Von Seiten der Benutzer (der Archäologie) aus ist Interoperabilität = Nutzen, fehlende I. = Schaden
Technische Inseln
 muß es nicht mehr geben
 Datenbank-Management-Systeme sind nur selten »technisch inkompatibel«
 Import- und Exportfähigkeit über Formate wie XML sind die technische Ebene für die gegenseitige Öffnung
nahezu aller Datenbank-Management-Systeme und damit auch aller Datenbanken
Geistige Inseln
 verbleibendes Problem, das auch XML nur unvollkommen lösen kann: inhaltliche Unterschiede der Eingabefelder
 Lösungsmöglichkeit: Thesauroi und ihre gegenseitige Abstimmung
 Iconclass: umfassendes, aber nicht einfach zu handhabendes Klassifikationssystem der Kunstgeschichte
 Gesellschaft für Klassifikation: Beispiel für grundlegende Bedeutung dieses Aspektes
 Anwendungsmöglichkeiten liegen zwischen nicht mehr anwendbarer Perfektion und gar nichts
 interner Austausch zu Thesauroi und externe Wahrnehmung (zur Schematisierung von Thesauroi s. www.w3.org)
in der Klassischen Archäologie weitgehend inexistent
Frontends
 Frontends (Oxford, Prometheus, Lupa) - meist aus praktischen Gründen auf eher oberflächliche Eingriffstiefe
beschränkt (Standardfelder), da geisteswissenschaftliche Datenbanken zu Heterogenität tendieren
 tiefer eingreifende und vermittelnde Mediatoren sind noch ein Desiderat
Internet-Datenbanken. Aspekte des nachhaltigen Umgangs mit Informationen
als denkbares Anliegen
Datenrecycling bei digitalen Informationssystemen
Fazit
 potentiell sinnvoll wären konzeptionelle Anstrengungen, die Zahl der Insellösungen nicht weiter zu vergrößern
 durch rechtzeitige Abstimmung über Thesauroi und XML-Kompatibilität könnte späterer manueller Aufwand
erspart und sinvoller in weitere Digitalisierungsfortschritte investiert werden
 Etikettenschwindel: mit »kompatiblen« Datenbanken wird von ganz unterschiedlichen Anbietern geworben - in
Wirklichkeit sind sie dann oft durch die Felddefinitionen oder zusätzlich durch die Datenmodellierung und
kommerzielle Politik doch nur wieder zu Insellösungen
Internet-Datenbanken. Aspekte des nachhaltigen Umgangs mit Informationen
als denkbares Anliegen
Aspekte praktischer Entwicklungsszenarien
»Täter« Informatiker
Experten
Informatiker sind im Denken stark
naturwissenschaftlich geprägt
ein geisteswissenschaftliches Studium ist
nicht durch Autodidaktik kompensierbar
Laien
Anwender
»Opfer«
archäologische »Computerexperten« sind keine
Informatiker und werden auch keine
ein Informatikstudium ist nicht durch Autodidaktik
kompensierbar
nicht hinnehmbare Situation, Ausweg: professionelles IT-Konzept
Kontinuität der Software-Weiterentwicklung
Anforderungsanalyse und technische Umsetzung
professionelles IT-Konzept ohne eigene IT-Abteilung?
universitäre Kooperationen
Spezifizierte Öffnung der Anwender und Informatiker
HKI- und/oder Pharos-Thesen:
 Informatiker kommen generell aus dem mathematisch-naturwissenschaftlichen Bereich
 sie basieren auf Datenstrukturen, die präzise, eindeutig und homogen sind, und erwarten diese auch hinsichtlich
des zu repräsentierenden Inhaltes
 Geisteswissenschaftler beschäftigen sich generell mit Wissensdomänen, die aus ungenauen, mehrdeutigen und
heterogenen Bedeutungen bestehen können
Fazit
 die Repräsentation spezifisch geisteswissenschaftlicher Informationsstrukturen in elektronischen Datenstrukturen
ist zu Beginn fast ein Widerspruch in sich
 ihn aufzulösen bedingt die Eröffnung eines interdisziplinären Diskurses zwischen Computerwissenschaften und
Geisteswissenschaften
 dies ist der Beginn eines Weges, nicht die sofortige Lösung - was schnelle Realisierungen nicht ausschließt
Internet-Datenbanken. Aspekte der Lebenserwartung von Technik aus der
Sicht menschlicher Sozialisierung
Aspekte praktischer Entwicklungsszenarien
Nachhaltigkeit der Softwareentwicklung
 eine institutionalisierte Internet-Datenbank
 ist nie »fertig«
 ist daher kein Arbeitsplatz für Einzeltäter, die sich in der potentiellen Ahnungslosigkeit ihrer Umgebung
ohne professionelle Distanz (Informatikstudium), ein Denkmal setzen wollen
 geht früher oder später durch viele Hände von Entwicklern und Verantwortlichen
 sollte, um sich weiterentwickeln zu können, nicht an personellen Übergängen scheitern
 conditiones, sine quae non
 bei jeglicher konzeptioneller Designentscheidung Bemühung um größtmögliche Tansparenz
 parallel zur Entwicklung in sinnvollem Umfang technische und systematische Dokumentation
 niemals Geld investieren für technisch nicht vollkommen offengelegte (und vom Käufer natürlich
vertraulich zu behandelnde) Lösungen oder Teillösungen
 die verwendeten Werkzeuge und Elemente
 sollten, soweit irgend möglich, offene Werkzeuge ohne firmeneigene Standards sein
 sollten bei allgemeinen Scriptsprachen möglichst wenig programmspezifischen Code enthalten (etwa
Javascript-Versionen oder Javascripts, die nur von wenigen html-Editoren verwendet oder nicht von allen
wichtigen Browsern verstanden werden etc.)
Fazit
 auch ohne viel technisches Verständnis wäre es von Seiten einer Geisteswissenschaft theoretisch möglich, eine
soziale und dienstliche Einwirkung für die Einhaltung sinnvoller Kriterien auszuüben
Internet-Datenbanken. Zur Lebenserwartung aus der Sicht des Umgangs mit
Technik
Aspekte praktischer Entwicklungsszenarien
die Datenbanken (»Container«)
 man kann die einzig geniale Datenbank oder das einzig geniale Frontend programmieren lassen
 man kann sogar vergessen, daß man das alles nicht selbst gemacht hat
 man kann besonders teure Datenbank-Produkte kaufen
 und: alles bleibt leer
 was ist passiert?
die Inhalte (»Content«)
 es fehlen Eingaben
 Frontends und Datenbanken bleiben leer oder völlig überdimensioniert, wenn keine adäquate
Herstellung von Inhalten stattfindet
 schwieriger als alles andere ist, einen kontinuierlichen Digitalisierungsvorgang von
wissenschaftlichen Daten und Bilddaten aufrechtzuerhalten, d. h. finanziell darzustellen
 Probleme im Arbeitsablauf
 das verwendete Datenbank-Management-System ist nicht eingabefreundlich
 Probleme in der Förderung
 in Förderungskonzepten werden aufgrund knapper Mittel Denken und Dokumentieren als
gegensätzliche Bereiche überkonturiert
 »wir wollen keine Datenfriedhöfe fördern«
 ruft es Nachts von den Denkfriedhöfen
man kann das natürlich auch alles überflüssig finden, so überflüssig wie ...
Tonfilm (H. M. Warner of Warner Bros., 1927: "Who the hell wants to hear actors talk?“)
oder
Computer (Thomas Watson, IBM Chairman, 1943: "I think there is a world market for maybe five computers.“)
oder
Home Computer (Ken Olsen, Digital Equipment Corp. founder, 1977: "There is no reason for any individual to have
a computer in their home.“)
und natürlich
Arbeitsspeicher (Bill Gates, Microsoft founder, 1981: "640 KB of memory ought to be enough for anybody.“)
“Hier könnte später stehen, was S i e 2003 für überflüssig gehalten haben." (NN, 2003)
Aber bedenken Sie:
lustig sind diese Beispiele nur, weil die Firmen noch existieren,
und dies tun sie nur, weil sie sich noch rechtzeitig umentschieden haben...
Herunterladen