GI-Workshop „Grundlagen von Datenbanken“ Anwendung von Quellenbeschreibungen zur Integration Digitaler Bibliotheken Eike Schallehn, Martin Endig 13.-16. Juni 2000 Otto-von-Guericke-Universität Magdeburg Institut für Technische und Betriebliche Informationssysteme Postfach 4120 D-39016 Magdeburg Gliederung • Einordnung des Projektes – Problemdarstellung • Lösungsansatz – Architektur • Adapterebene – Quellenbeschreibung – Ergebnis Transformation • Stand der Projektarbeit • Zusammenfassung und Ausblick Eike Schallehn Martin Endig GI-Workshop „Grundlagen von Datenbanken“ 13.-16. Juni 2000 2 Einordung des Projektes • Projekttitel: „Föderierungsdienste für heterogene Dokumentenquellen“ • Teilprojekt von „Global Info“ – Förderkonzept von BMBF • Laufzeit: 2 Jahre • Ziel: Föderierungsdienst zur Literaturrecherche • Zusammenarbeit mit: – verschiedenen Universitäten – Verlagen Eike Schallehn Martin Endig GI-Workshop „Grundlagen von Datenbanken“ 13.-16. Juni 2000 3 Problemdarstellung • Begriffsbestimmung – bibliographische Metadaten zu Publikationen – Beispiel: Autoren, Titel, Jahr, Verlag, ... • Vielzahl von Datensammlungen vorhanden – auf bestimmte Anwendungsbereiche beschränkt – herstellerspezifisch – unterschiedliche Granularität • Problem für den Benutzer – Wissen über Ort, Qualität, ... zu Referenzen erforderlich • Ziel: einheitliche Zugriffsschnittstelle Eike Schallehn Martin Endig GI-Workshop „Grundlagen von Datenbanken“ 13.-16. Juni 2000 4 Allgemeine Lösungsarchitektur Einheitliche Benutzerschnittstelle Arbeitsbereiche Höherwertige Dienste Föderationsdienste Föderierungsebene Adapter Adapter Springer Spektrum Verlag Verlag Adapter Adapter ... DBN Adapter Generierung/ Implementierung DBLP Eike Schallehn Martin Endig GI-Workshop „Grundlagen von Datenbanken“ 13.-16. Juni 2000 5 Adapterebene (1) • einheitlicher Zugriff auf Datenquellen – Überwindung der Heterogenität • Generelle Unterteilung von Datenlieferanten – kooperative / nicht kooperative • unterschiedliche Adapter erforderlich – WebJDBC für nicht kooperative Datenlieferanten – XML Adapter für kooperative Datenlieferanten • für Adapter Implementierung von Bedeutung – verteilte Anfragebearbeitung – Anfrageergebnis Transformation Eike Schallehn Martin Endig GI-Workshop „Grundlagen von Datenbanken“ 13.-16. Juni 2000 6 Adapterebene (2) FRA QL Query Processor Source Description Query Translator Result Translator ... XML Parser XSLT ... ... Query Evaluator XML ... Eike Schallehn Martin Endig GI-Workshop „Grundlagen von Datenbanken“ 13.-16. Juni 2000 7 Quellenbeschreibung (1) • Zugriff auf lokale Datenquellen hängt ab von: – Fähigkeit der Quelle – lokale Anfrageschnittstelle • Beispiel: Internet-Quellen – Konstantenselektion ( a > 5 ) – vordefinierte Vergleichsoperatoren entsprechende Beschreibung erforderlich – Attribute + mögliche Vergleichsoperatoren – Kombination von möglichen Attributen Eike Schallehn Martin Endig GI-Workshop „Grundlagen von Datenbanken“ 13.-16. Juni 2000 8 Quellenbeschreibung (2) • Mögliche Beschreibung von Quellen: SrcDesc RelDesc Pred RelDesc 2 ComDescr Pred Attr 2 Attr ComDescr 2 , , , , , , LIKE • Beispiel: SrcDesc1 = ({( BookStore,{ (authors, {=}), (title,{=}) }, { {authors}, {title}, {authors, title} } )}) Eike Schallehn Martin Endig GI-Workshop „Grundlagen von Datenbanken“ 13.-16. Juni 2000 9 Quellenbeschreibung (3) select * from Publications where title=´ODBMS´ and authors=´Saake´ or authors=´Heuer´; authors´Heuer´ authors´Saake´ authors´Heuer´ title´ODBMS´ title´ODBMS´ (BookStore) Eike Schallehn Martin Endig (BookStore) authors´Saake´ (Books) GI-Workshop „Grundlagen von Datenbanken“ 13.-16. Juni 2000 (Books) 10 Ergebnis Transformation (1) • XML zum Datenaustausch von Metadaten – kooperative Datenlieferanten – Lieferanten-spezifische DTD – unterschiedliche Schemata und Datenmodelle vorhanden Transformation in interne DTD erforderlich – Bearbeitung der Anfrageergebnis auf Föderierungsebene – Format in Anlehnung an objekt-relationales Modell • Anwendung von XSLT im Adapter – Stylesheet Sprache zur Transformation – spezifische XSLT Informationen erforderlich Eike Schallehn Martin Endig GI-Workshop „Grundlagen von Datenbanken“ 13.-16. Juni 2000 11 Ergebnis Transformation (2) Beispielanfrage: Ergebnis: <ROWSET> <ROW num=„1“> select * <ID>1</ID> from Publications <TITLE>ODBMS</TITLE> where tilte like ´ODBMS´; <AUTHORS>Heuer, A.</AUTHORS> </ROW> ... </ROWSET> Eike Schallehn Martin Endig GI-Workshop „Grundlagen von Datenbanken“ 13.-16. Juni 2000 12 Ergebnis Transformation (3) <xsl:stylesheet version="1.0"> <xsl:template match="ROWSET"> <COLLECTION> <RESULTSET> <xsl:apply-templates select="ROW"> </xsl:apply-templates> </RESULTSET> </COLLECTION> </xsl:template> <xsl:template match="ROW"> <RECORD> <xsl:apply-templates select="ID"> </xsl:apply-templates> <xsl:apply-templates select="TITLE"> </xsl:apply-templates> </RECORD> </xsl:template> ... Eike Schallehn Martin Endig ... <xsl:template match="TITLE"> <FIELDVALUE> <xsl:attribute name="name"> TITLE </xsl:attribute> <xsl:value-of select="."/> </FIELDVALUE> </xsl:template> ... </xsl:stylesheet> GI-Workshop „Grundlagen von Datenbanken“ 13.-16. Juni 2000 13 Ergebnis Transformation (4) <COLLECTION> <RESULTSET tablename="PUBLICATIONS"> <RECORD> <FIELDVALUE name="ID"> 1 </FIELDVALUE> <FIELDVALUE name="TITLE"> ODBMS </FIELDVALUE> <FIELDVALUE name="AUTHORS"> Heuer </FIELDVALUE> </RECORD> ... </RESULTSET> </COLLECTION> Eike Schallehn Martin Endig GI-Workshop „Grundlagen von Datenbanken“ 13.-16. Juni 2000 14 Stand der Projektarbeit • Anwendung von FRAQL für Föderationsdienste – Anfragesprache für objekt-relationale DB Föderation – Erweiterung von SQL • Implementierung von verschiedenen Adaptern • XML Adapter für kooperative Datenlieferanten – Integration der Quellenbeschreibung – Implementierung XML/XSLT-Transformation Eike Schallehn Martin Endig GI-Workshop „Grundlagen von Datenbanken“ 13.-16. Juni 2000 15 Zusammenfassung und Ausblick • Anwendung von Konzepte aus Bereich föderierter DB zur Integration von Digitale Bibliotheken – Verwendung einer bekannten Architektur Adapter Ebene zum Zugriff auf verschiedene Quellen • 2 Aspekte zur Adapter Implementierung wichtig – Quellenbeschreibung + Anfragebearbeitung – Ergebnis Transformation auf Basis von XML/XSLT • Integration der Quellenbeschreibung in FRAQL • Bereitstellung weiterer Adapter (z.B. für Z39.50) Eike Schallehn Martin Endig GI-Workshop „Grundlagen von Datenbanken“ 13.-16. Juni 2000 16