EDM - wozu? Ideen, Konzepte, Anwendungen im Semantic Web der Linked Open Data Mapping-Konferenz Berlin, Bundesarchiv, 02.11.2011 Prof. Dr. Stefan Gradmann Humboldt-Universität zu Berlin / School of Library and Information Science Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis (DGI) [email protected] 1 Überblick Zur Motivation des EDM Das Linked Data Web EDM: Europeana als Teil des LoD-Web Anwendungspotential Für die Digitalen Geisteswissenschaften EDM - wozu? Semantische Anwendungsszenarien Mapping-Konferenz, Berlin, Bundesarchiv, 02.11.2011 2 Zur Motivation des EDM EDM - wozu? Semantische Anwendungsszenarien Mapping-Konferenz, Berlin, Bundesarchiv, 02.11.2011 3 Motivation des EDM Reichere, stärker differenzerte Objektrepräsentation im Vergleich zu ESE Ein 'Brückenmodell', nicht ein kleinster gemeinsamer Nenner Erlaubt einen Pluralismus von Objektrepräsentationen Baut konsequent auf existierende Standards Macht Europeana zum Teil des Linked Open Data Web Unterstützt Nutzungsszenarien weit jenseits von Search & Retrieval Ist eine notwendige (wenn auch nicht hinreichende) Bedingung für neue wissenschaftliche Heuristiken im Umfeld der Europeana EDM - wozu? Semantische Anwendungsszenarien Mapping-Konferenz, Berlin, Bundesarchiv, 02.11.2011 4 Das 'Linked Data Web' EDM - wozu? Semantische Anwendungsszenarien Mapping-Konferenz, Berlin, Bundesarchiv, 02.11.2011 5 Vom Web der Dokumente zum Linked Data Web Das Web der Dokumente: Information Management: A Proposal (TBL, 1989). Baut auf Dokumenten („Information Resources“) Untypisierten HTTP links Das Web der Linked Open Data ist eine Erweiterung des Web der Dokumente in Syntax (RDF) im Umfang (unter Einschluss der Repräsentationen von „noninformation resources“, 'Dingen', 'Daten') EDM - wozu? Semantische Anwendungsszenarien Mapping-Konferenz, Berlin, Bundesarchiv, 02.11.2011 6 Entitäten und Links im Web der Dokumente Wir haben HTTP URIs als Identifikatoren von Entitäten und Links zwischen diesen – aber es fehlt Entscheidendes! Was für Arten von Entitäten sind 'Louvre.html' und 'LaJoconde.jpg'? Das kann eine Maschine nicht herausfinden. Menschen können dies: wir erkennen implizierten Kontext! Und wie genau verhalten sich diese Entitäten zueinander? Auch dies kann eine Maschine nicht herausfinden. Menschen können auch dies: auch hier kommt wieder impliziter Kontext ins Spiel! EDM - wozu? Semantische Anwendungsszenarien Mapping-Konferenz, Berlin, Bundesarchiv, 02.11.2011 7 Syntaktische Erweiterung des Web der Dokumente (1) Also definieren wir eine maschinell prozessierbare Syntax für Aussagen über Entitäten und Beziehungen: RDF Oder, allgemeiner gesprochen Tripel ... … in denen S und P durch URIs identifizierte Web-Entitäten sein müssen und O eine Web-Entität oder ein Literal ist. EDM - wozu? Semantische Anwendungsszenarien Mapping-Konferenz, Berlin, Bundesarchiv, 02.11.2011 8 Syntaktische Erweiterung des Web der Dokumente (2) Hinzu kommt eine Schema-Sprache (RDFS) mit Elementen wie Klassen, Hierarchien von Klassen und Eigenschaften, Vererbung ... … und damit Unterstützung einfacher Schlussysteme. So werden Strukturen in Tripel-Aggregationen modellierbar - eine Basis für leichtgewichtige 'Ontologien': EDM - wozu? Semantische Anwendungsszenarien Mapping-Konferenz, Berlin, Bundesarchiv, 02.11.2011 9 Erweiterung des Umfangs des Web: wie es nicht funktioniert Was stimmt an diesem Bild nicht? Taken from Ronald Carpentier's Blog at http://carpentier.wordpress.com/2007/08/08/1-2-3/ EDM - wozu? Semantische Anwendungsszenarien Mapping-Konferenz, Berlin, Bundesarchiv, 02.11.2011 10 … und die Erweiterung des 'WWW der Dokumente' um ein Web der Dinge ... EDM - wozu? Semantische Anwendungsszenarien Mapping-Konferenz, Berlin, Bundesarchiv, 02.11.2011 11 Tripel, Kontext und logische Schlüsse (1) EDM - wozu? Semantische Anwendungsszenarien Mapping-Konferenz, Berlin, Bundesarchiv, 02.11.2011 12 Tripel, Kontext und logische Schlüsse (2) EDM - wozu? Semantische Anwendungsszenarien Mapping-Konferenz, Berlin, Bundesarchiv, 02.11.2011 13 Tripel, Kontext und logische Schlüsse (3) → Kontext erlaubt einfache logische Schlüsse und schlussbasierte Verfahren EDM - wozu? Semantische Anwendungsszenarien Mapping-Konferenz, Berlin, Bundesarchiv, 02.11.2011 14 EDM ... EDM - wozu? Semantische Anwendungsszenarien Mapping-Konferenz, Berlin, Bundesarchiv, 02.11.2011 15 EDM: Klassen EDM - wozu? Semantische Anwendungsszenarien Mapping-Konferenz, Berlin, Bundesarchiv, 02.11.2011 16 EDM: Eigenschaften EDM - wozu? Semantische Anwendungsszenarien Mapping-Konferenz, Berlin, Bundesarchiv, 02.11.2011 17 Les Fleurs du Mal: UNIMARC http://catalogue.bnf.fr/ark:/12148/cb37367035f 000 nam 22 450 001FRBNF373670350000003 009http://catalogue.bnf.fr/ark:/12148/cb37367035f 039 $oGEA$a000288182 100 $a19920409d1857 m y0frey50 ba 1010 $afre 102 $aFR 105 $a||||z 00||| 106 $ar 2001 $aˆLes ‰fleurs du mal$bTexte imprimé$fpar Charles Baudelaire 210 $aParis$cPoulet-Malassis et De Broise$d1857 215 $a248 p.$d19 cm 676 $a841.8$v22 686 $a840$2Cadre de classement de la Bibliographie nationale française 700 |$311890582$aBaudelaire$bCharles$4070 801 0$aFR$bBNF$c19920409$gAFNOR$2intermrc EDM - wozu? Semantische Anwendungsszenarien Mapping-Konferenz, Berlin, Bundesarchiv, 02.11.2011 18 Les Fleurs du Mal: Gallica http://gallica.bnf.fr/ark:/12148/bpt6k70861t EDM - wozu? Semantische Anwendungsszenarien Mapping-Konferenz, Berlin, Bundesarchiv, 02.11.2011 19 Les Fleurs du Mal in EDM Digitale Repräsentationen Aggregation Semantic Kontext Proxy Cultural Heritage Object (CHO) EDM - wozu? Semantische Anwendungsszenarien Mapping-Konferenz, Berlin, Bundesarchiv, 02.11.2011 20 … und LoD EDM - wozu? Semantische Anwendungsszenarien Mapping-Konferenz, Berlin, Bundesarchiv, 02.11.2011 21 Eine Aggregation ... EDM - wozu? Semantische Anwendungsszenarien Mapping-Konferenz, Berlin, Bundesarchiv, 02.11.2011 22 … und Kontext EDM - wozu? Semantische Anwendungsszenarien Mapping-Konferenz, Berlin, Bundesarchiv, 02.11.2011 23 … mehr Kontext EDM - wozu? Semantische Anwendungsszenarien Mapping-Konferenz, Berlin, Bundesarchiv, 02.11.2011 24 … und das 'Big Picture' EDM - wozu? Semantische Anwendungsszenarien Mapping-Konferenz, Berlin, Bundesarchiv, 02.11.2011 25 Die Semantische Datenschicht Überbrückt Informationsinseln und verbindet Objektrepräsentationen unterschiedlicher Provenienz durch Vokabular- und Konzeptmappings Bibliothek Archiv EDM - wozu? Semantische Anwendungsszenarien Mapping-Konferenz, Berlin, Bundesarchiv, 02.11.2011 Museum 26 26 EDM und Linked Open Data Kontexdaten •DBpedia •GND •Geonames •LCSH •… EDM - wozu? Semantische Anwendungsszenarien Mapping-Konferenz, Berlin, Bundesarchiv, 02.11.2011 27 … und was kann man damit machen? EDM - wozu? Semantische Anwendungsszenarien Mapping-Konferenz, Berlin, Bundesarchiv, 02.11.2011 28 → Tripel und Kontext visualisieren © Eytan Adar EDM - wozu? Semantische Anwendungsszenarien Mapping-Konferenz, Berlin, Bundesarchiv, 02.11.2011 29 → Kulturellen Kontext visualisieren Mapping the Republic of Letters: https://republicofletters.stanford.edu/#maps Oder ein finnisches Beispiel (Kultuurisampo): http://www.kulttuurisampo.fi/kulsa/historiallisetKartat.shtml Was ist vorhanden? Was fehlt aus geisteswissenschaftlicher Sicht? Wie steht es um Herkunft, Versionierung, Authentizität, Referenzierbarkeit von Mikrostrukturen? ... EDM - wozu? Semantische Anwendungsszenarien Mapping-Konferenz, Berlin, Bundesarchiv, 02.11.2011 30 Verarbeitung von Quelldaten in den Geisteswissenschaften: Aggregation ... EDM - wozu? Semantische Anwendungsszenarien Mapping-Konferenz, Berlin, Bundesarchiv, 02.11.2011 31 ... Modellierung ... EDM - wozu? Semantische Anwendungsszenarien Mapping-Konferenz, Berlin, Bundesarchiv, 02.11.2011 32 ... und Digitale Heuristiken? Europeana EDM - wozu? Semantische Anwendungsszenarien Mapping-Konferenz, Berlin, Bundesarchiv, 02.11.2011 33 Discovery Korpus: Digitalisierte Manuskripte EDM - wozu? Semantische Anwendungsszenarien Mapping-Konferenz, Berlin, Bundesarchiv, 02.11.2011 34 Aggregation EDM - wozu? Semantische Anwendungsszenarien Mapping-Konferenz, Berlin, Bundesarchiv, 02.11.2011 35 “To work towards making all good things part of the common good and all things free to those who are free” EDM - wozu? Semantische Anwendungsszenarien Mapping-Konferenz, Berlin, Bundesarchiv, 02.11.2011 36 HyperNietzsche: Digitalisierung, Präsentation (1) EDM - wozu? Semantische Anwendungsszenarien Mapping-Konferenz, Berlin, Bundesarchiv, 02.11.2011 37 HyperNietzsche: Digitalisierung, Präsentation (2) EDM - wozu? Semantische Anwendungsszenarien Mapping-Konferenz, Berlin, Bundesarchiv, 02.11.2011 38 HyperNietzsche: Transkription, Präsentation (1) EDM - wozu? Semantische Anwendungsszenarien Mapping-Konferenz, Berlin, Bundesarchiv, 02.11.2011 39 HyperNietzsche: Transkription, Präsentation (2) EDM - wozu? Semantische Anwendungsszenarien Mapping-Konferenz, Berlin, Bundesarchiv, 02.11.2011 40 HyperNietzsche: Quellen, Ausgaben (synoptisch) EDM - wozu? Semantische Anwendungsszenarien Mapping-Konferenz, Berlin, Bundesarchiv, 02.11.2011 41 HyperNietzsche: Mehr Synoptik EDM - wozu? Semantische Anwendungsszenarien Mapping-Konferenz, Berlin, Bundesarchiv, 02.11.2011 42 Talia: Neugestaltung von Hyper mit Semantic Web Technologie EDM - wozu? Semantische Anwendungsszenarien Mapping-Konferenz, Berlin, Bundesarchiv, 02.11.2011 43 Stemma-Generierung als inferenzbasierte Operation (1) EDM - wozu? Semantische Anwendungsszenarien Mapping-Konferenz, Berlin, Bundesarchiv, 02.11.2011 44 Stemma-Generierung als inferenzbasierte Operation (2) EDM - wozu? Semantische Anwendungsszenarien Mapping-Konferenz, Berlin, Bundesarchiv, 02.11.2011 45 Interpretation EDM - wozu? Semantische Anwendungsszenarien Mapping-Konferenz, Berlin, Bundesarchiv, 02.11.2011 46 SwickyNotes: ontologiebasierte Annotation als Linked Open Data EDM - wozu? Semantische Anwendungsszenarien Mapping-Konferenz, Berlin, Bundesarchiv, 02.11.2011 47 SwickyNotes: Ontologieauswahl EDM - wozu? Semantische Anwendungsszenarien Mapping-Konferenz, Berlin, Bundesarchiv, 02.11.2011 48 Alle Kreter lügen … annotiert! EDM - wozu? Semantische Anwendungsszenarien Mapping-Konferenz, Berlin, Bundesarchiv, 02.11.2011 49 Alle Kreter lügen … in Perseus! EDM - wozu? Semantische Anwendungsszenarien Mapping-Konferenz, Berlin, Bundesarchiv, 02.11.2011 50 Perseus EDM - wozu? Semantische Anwendungsszenarien Mapping-Konferenz, Berlin, Bundesarchiv, 02.11.2011 51 → Lidell-Scott … und weiter! → Europeana, → Isidore → Digitised Manuscripts to Europeana (DM2E) ------------Weniger XML-Baumstrukturen als RDF-Netzstrukturen! Fernziel ist das Mapping in verteilten Strukturen EDM - wozu? Semantische Anwendungsszenarien Mapping-Konferenz, Berlin, Bundesarchiv, 02.11.2011 52