Kein Folientitel - ITI - Otto-von-Guericke

Werbung
GI-Workshop „Grundlagen von Datenbanken“
Anwendung von Quellenbeschreibungen
zur Integration Digitaler Bibliotheken
Eike Schallehn, Martin Endig
13.-16. Juni 2000
Otto-von-Guericke-Universität Magdeburg
Institut für Technische und Betriebliche Informationssysteme
Postfach 4120
D-39016 Magdeburg
Gliederung
• Einordnung des Projektes
– Problemdarstellung
• Lösungsansatz
– Architektur
• Adapterebene
– Quellenbeschreibung
– Ergebnis Transformation
• Stand der Projektarbeit
• Zusammenfassung und Ausblick
Eike Schallehn
Martin Endig
GI-Workshop „Grundlagen von Datenbanken“
13.-16. Juni 2000
2
Einordung des Projektes
• Projekttitel: „Föderierungsdienste für heterogene
Dokumentenquellen“
• Teilprojekt von „Global Info“
– Förderkonzept von BMBF
• Laufzeit: 2 Jahre
• Ziel: Föderierungsdienst zur Literaturrecherche
• Zusammenarbeit mit:
– verschiedenen Universitäten
– Verlagen
Eike Schallehn
Martin Endig
GI-Workshop „Grundlagen von Datenbanken“
13.-16. Juni 2000
3
Problemdarstellung
• Begriffsbestimmung
– bibliographische Metadaten zu Publikationen
– Beispiel: Autoren, Titel, Jahr, Verlag, ...
• Vielzahl von Datensammlungen vorhanden
– auf bestimmte Anwendungsbereiche beschränkt
– herstellerspezifisch
– unterschiedliche Granularität
• Problem für den Benutzer
– Wissen über Ort, Qualität, ... zu Referenzen erforderlich
• Ziel: einheitliche Zugriffsschnittstelle
Eike Schallehn
Martin Endig
GI-Workshop „Grundlagen von Datenbanken“
13.-16. Juni 2000
4
Allgemeine Lösungsarchitektur
Einheitliche Benutzerschnittstelle
Arbeitsbereiche
Höherwertige Dienste
Föderationsdienste
Föderierungsebene
Adapter
Adapter
Springer
Spektrum
Verlag
Verlag
Adapter
Adapter
...
DBN
Adapter
Generierung/
Implementierung
DBLP
Eike Schallehn
Martin Endig
GI-Workshop „Grundlagen von Datenbanken“
13.-16. Juni 2000
5
Adapterebene (1)
• einheitlicher Zugriff auf Datenquellen
– Überwindung der Heterogenität
• Generelle Unterteilung von Datenlieferanten
– kooperative / nicht kooperative
• unterschiedliche Adapter erforderlich
– WebJDBC für nicht kooperative Datenlieferanten
– XML Adapter für kooperative Datenlieferanten
• für Adapter Implementierung von Bedeutung
– verteilte Anfragebearbeitung
– Anfrageergebnis Transformation
Eike Schallehn
Martin Endig
GI-Workshop „Grundlagen von Datenbanken“
13.-16. Juni 2000
6
Adapterebene (2)
FRA QL Query Processor
Source
Description
Query
Translator
Result
Translator
...
XML Parser
XSLT
...
...
Query
Evaluator
XML
...
Eike Schallehn
Martin Endig
GI-Workshop „Grundlagen von Datenbanken“
13.-16. Juni 2000
7
Quellenbeschreibung (1)
• Zugriff auf lokale Datenquellen hängt ab von:
– Fähigkeit der Quelle
– lokale Anfrageschnittstelle
• Beispiel: Internet-Quellen
– Konstantenselektion ( a > 5 )
– vordefinierte Vergleichsoperatoren
 entsprechende Beschreibung erforderlich
– Attribute + mögliche Vergleichsoperatoren
– Kombination von möglichen Attributen
Eike Schallehn
Martin Endig
GI-Workshop „Grundlagen von Datenbanken“
13.-16. Juni 2000
8
Quellenbeschreibung (2)
• Mögliche Beschreibung von Quellen:
SrcDesc    RelDesc
Pred
RelDesc  2
 ComDescr
Pred  Attr  2
Attr
ComDescr  2
  , , , , , , LIKE
• Beispiel:
SrcDesc1 = ({( BookStore,{ (authors, {=}), (title,{=}) },
{ {authors}, {title}, {authors, title} } )})
Eike Schallehn
Martin Endig
GI-Workshop „Grundlagen von Datenbanken“
13.-16. Juni 2000
9
Quellenbeschreibung (3)
select * from Publications
where title=´ODBMS´ and authors=´Saake´ or authors=´Heuer´;



 authors´Heuer´
 authors´Saake´   authors´Heuer´
 title´ODBMS´
title´ODBMS´
(BookStore)
Eike Schallehn
Martin Endig
(BookStore)
 authors´Saake´
(Books)
GI-Workshop „Grundlagen von Datenbanken“
13.-16. Juni 2000
(Books)
10
Ergebnis Transformation (1)
• XML zum Datenaustausch von Metadaten
– kooperative Datenlieferanten
– Lieferanten-spezifische DTD
– unterschiedliche Schemata und Datenmodelle vorhanden
 Transformation in interne DTD erforderlich
– Bearbeitung der Anfrageergebnis auf Föderierungsebene
– Format in Anlehnung an objekt-relationales Modell
• Anwendung von XSLT im Adapter
– Stylesheet Sprache zur Transformation
– spezifische XSLT Informationen erforderlich
Eike Schallehn
Martin Endig
GI-Workshop „Grundlagen von Datenbanken“
13.-16. Juni 2000
11
Ergebnis Transformation (2)
Beispielanfrage:
Ergebnis:
<ROWSET>
<ROW num=„1“>
select *
<ID>1</ID>
from Publications
<TITLE>ODBMS</TITLE>
where tilte like ´ODBMS´;
<AUTHORS>Heuer, A.</AUTHORS>
</ROW>
...
</ROWSET>
Eike Schallehn
Martin Endig
GI-Workshop „Grundlagen von Datenbanken“
13.-16. Juni 2000
12
Ergebnis Transformation (3)
<xsl:stylesheet version="1.0">
<xsl:template match="ROWSET">
<COLLECTION>
<RESULTSET>
<xsl:apply-templates select="ROW">
</xsl:apply-templates>
</RESULTSET>
</COLLECTION>
</xsl:template>
<xsl:template match="ROW">
<RECORD>
<xsl:apply-templates select="ID">
</xsl:apply-templates>
<xsl:apply-templates select="TITLE">
</xsl:apply-templates>
</RECORD>
</xsl:template>
...
Eike Schallehn
Martin Endig
...
<xsl:template match="TITLE">
<FIELDVALUE>
<xsl:attribute name="name">
TITLE
</xsl:attribute>
<xsl:value-of select="."/>
</FIELDVALUE>
</xsl:template>
...
</xsl:stylesheet>
GI-Workshop „Grundlagen von Datenbanken“
13.-16. Juni 2000
13
Ergebnis Transformation (4)
<COLLECTION>
<RESULTSET tablename="PUBLICATIONS">
<RECORD>
<FIELDVALUE name="ID"> 1 </FIELDVALUE>
<FIELDVALUE name="TITLE"> ODBMS </FIELDVALUE>
<FIELDVALUE name="AUTHORS"> Heuer </FIELDVALUE>
</RECORD>
...
</RESULTSET>
</COLLECTION>
Eike Schallehn
Martin Endig
GI-Workshop „Grundlagen von Datenbanken“
13.-16. Juni 2000
14
Stand der Projektarbeit
• Anwendung von FRAQL für Föderationsdienste
– Anfragesprache für objekt-relationale DB Föderation
– Erweiterung von SQL
• Implementierung von verschiedenen Adaptern
• XML Adapter für kooperative Datenlieferanten
– Integration der Quellenbeschreibung
– Implementierung XML/XSLT-Transformation
Eike Schallehn
Martin Endig
GI-Workshop „Grundlagen von Datenbanken“
13.-16. Juni 2000
15
Zusammenfassung und Ausblick
• Anwendung von Konzepte aus Bereich föderierter
DB zur Integration von Digitale Bibliotheken
– Verwendung einer bekannten Architektur
 Adapter Ebene zum Zugriff auf verschiedene Quellen
• 2 Aspekte zur Adapter Implementierung wichtig
– Quellenbeschreibung + Anfragebearbeitung
– Ergebnis Transformation auf Basis von XML/XSLT
• Integration der Quellenbeschreibung in FRAQL
• Bereitstellung weiterer Adapter (z.B. für Z39.50)
Eike Schallehn
Martin Endig
GI-Workshop „Grundlagen von Datenbanken“
13.-16. Juni 2000
16
Herunterladen