Evaluation verschiedener Triple

Werbung
Evaluation verschiedener Triple-Stores zum
Speichern von Metadaten im Kontext des
Forschungsdatenmanagements
Sarah Bensberg - Seminarvortrag - 08.02.2017
Inhaltsverzeichnis
• Motivation - Forschungsdatenmanagement an der RWTH Aachen
• Techniken für den Umgang mit Metadaten
• Evaluation ausgewählter Triple-Stores
• Fazit & Ausblick
2
Evaluation verschiedener Triple-Stores zum Speichern von Metadaten im Kontext
des Forschungsdatenmanagements |
Sarah Bensberg | Ausbildungsgruppe MATSE | 08.02.2017
Motivation - Forschungsdatenmanagement
an der RWTH Aachen
Motivation - Forschungsdatenmanagement an der RWTH Aachen
Forschungsdatenmanagement
Sammlung von Daten
(Forschungsdaten)
4
Auswertung
Evaluation verschiedener Triple-Stores zum Speichern von Metadaten im Kontext
des Forschungsdatenmanagements |
Sarah Bensberg | Ausbildungsgruppe MATSE | 08.02.2017
Archivierung der
Forschungsdaten
Motivation - Forschungsdatenmanagement an der RWTH Aachen
Forschungsdatenmanagement
•
Ziel
Nachvollziehen und Nachnutzung von Forschungsdaten
•
Problem
Unspezifische Formate
•
Lösung
Abspeichern von Metadaten
5
Evaluation verschiedener Triple-Stores zum Speichern von Metadaten im Kontext
des Forschungsdatenmanagements |
Sarah Bensberg | Ausbildungsgruppe MATSE | 08.02.2017
Motivation - Forschungsdatenmanagement an der RWTH Aachen
PID generieren
Workflow
Metadaten
verknüpfen
Metadaten
formalisieren
Forschungsdaten
verknüpfen
Metadaten
abspeichern
Forschungsdaten
beschreiben
Forschungsdaten
erstellen
6
Evaluation verschiedener Triple-Stores zum Speichern von Metadaten im Kontext
des Forschungsdatenmanagements |
Sarah Bensberg | Ausbildungsgruppe MATSE | 08.02.2017
Forschungsdaten
abspeichern
Techniken für den Umgang mit Metadaten
Grundlagen
Semantic Web - Resource Description Framework (RDF)
- Darstellung von Informationen im Web
- Ablage von Daten-Tripeln:
Objekt
Subjekt
Literal
- Elemente: leere Knoten, Datentyp-Literale oder Internationalized Resource
Identifier (IRIs)
8
Evaluation verschiedener Triple-Stores zum Speichern von Metadaten im Kontext
des Forschungsdatenmanagements |
Sarah Bensberg | Ausbildungsgruppe MATSE | 08.02.2017
Grundlagen
Graphdatenbanken
• Graphen zur Abbildung von Informationen
• Knoten und Kanten mit Eigenschaften bilden einen Graphen
• Triple-Stores
 Abspeichern von Tripeln (RDF)
 SPARQL als Abfragesprache
9
Evaluation verschiedener Triple-Stores zum Speichern von Metadaten im Kontext
des Forschungsdatenmanagements |
Sarah Bensberg | Ausbildungsgruppe MATSE | 08.02.2017
Grundlagen
Semantic Web - SPARQL Protocol And RDF Query Language (SPARQL)
• Abfragesprache
• Beispiel SQL:
• Beispiel SPARQL Query:
10
Evaluation verschiedener Triple-Stores zum Speichern von Metadaten im Kontext
des Forschungsdatenmanagements |
Sarah Bensberg | Ausbildungsgruppe MATSE | 08.02.2017
Evaluation verschiedener Triple-Stores
Evaluation verschiedener Triple-Stores
Betrachtete Triple-Stores
Ontotext GraphDB
Apache Jena Fuseki
12
Stardog
Blazegraph
BrightstarDB
OpenLink Virtuoso
Evaluation verschiedener Triple-Stores zum Speichern von Metadaten im Kontext
des Forschungsdatenmanagements |
Sarah Bensberg | Ausbildungsgruppe MATSE | 08.02.2017
Evaluation verschiedener Triple-Stores
Anforderung
Bewertungskategorien
Unterstützung von RDF
Funktionalität
SPARQL-Abfragen < 2s
SPARQL Abfrage allgemein
Gesamtexport aller abgelegter
Daten
SPARQL Abfrage Zeitmessung
Einfügen und Löschen einzelner
Tripel
Import Gesamtspeicherverbrauch
Programmatisches Abspeichern
von Dateien im RDF-Modell
Import Speicherverbrauch Dataset
Ordner
Abspeichern der Daten sollte
< 2s dauern
13
Import allgemein
Import Zeitmessung
Verfügbarkeit
Verfügbarkeit
Dokumentation
Dokumentation
Benötigter Speicher Installation
Stabilität / Wartbarkeit
Leistungsüberwachung
Evaluation verschiedener Triple-Stores zum Speichern von Metadaten im Kontext
des Forschungsdatenmanagements |
Sarah Bensberg | Ausbildungsgruppe MATSE | 08.02.2017
Evaluation verschiedener Triple-Stores
Bewertungskategorie „SPARQL Abfrage Zeitmessung“
14
Evaluation verschiedener Triple-Stores zum Speichern von Metadaten im Kontext
des Forschungsdatenmanagements |
Sarah Bensberg | Ausbildungsgruppe MATSE | 08.02.2017
Evaluation verschiedener Triple-Stores
Bewertungskategorie „SPARQL Abfrage Zeitmessung“
600
500
Dauer in ms
400
GraphDB
Virtuoso
300
Apache Jena
BrightstarDB
200
Stardog
100
0
Query 1
15
Query 2
Query 3
Query 4
SPARQL Anfragen
Evaluation verschiedener Triple-Stores zum Speichern von Metadaten im Kontext
des Forschungsdatenmanagements |
Sarah Bensberg | Ausbildungsgruppe MATSE | 08.02.2017
Query 5
Query 6
Evaluation verschiedener Triple-Stores
Bewertungskategorie „SPARQL Abfrage Zeitmessung“
Gesamtauswertung SPARQL
Abfragen
250
Dauer in ms
200
150
100
50
0
GraphDB
16
Virtuoso
Apache Jena
Triple-Stores
Evaluation verschiedener Triple-Stores zum Speichern von Metadaten im Kontext
des Forschungsdatenmanagements |
Sarah Bensberg | Ausbildungsgruppe MATSE | 08.02.2017
BrightstarDB
Stardog
Evaluation verschiedener Triple-Stores
Auswertung
erzielte Gesamtpunktzahl
Bewertung der Triple-Stores, welche den
Anforderungen entsprechen
50
40
39
41
36
37
30
20
10
0
GraphDB
17
Virtuoso
Apache Jena
Triple-Stores
Evaluation verschiedener Triple-Stores zum Speichern von Metadaten im Kontext
des Forschungsdatenmanagements |
Sarah Bensberg | Ausbildungsgruppe MATSE | 08.02.2017
BrightstarDB
Fazit & Ausblick
Fazit & Ausblick
Fazit
Triple-Store als Umsetzungsmöglichkeit
Verwendung von Virtuoso oder GraphDB
19
Evaluation verschiedener Triple-Stores zum Speichern von Metadaten im Kontext
des Forschungsdatenmanagements |
Sarah Bensberg | Ausbildungsgruppe MATSE | 08.02.2017
Fazit & Ausblick
Ausblick
• Nähere Betrachtung von Virtuoso und GraphDB
• Umsetzung der Suche in den Metadaten
20
Evaluation verschiedener Triple-Stores zum Speichern von Metadaten im Kontext
des Forschungsdatenmanagements |
Sarah Bensberg | Ausbildungsgruppe MATSE | 08.02.2017
Quellenverzeichnis
•
Quellen:






•
Bilder:






21
M. Politze und F. Krämer. „Towards a distributed research data management system“. 2016
T. Eifert. Forschungsdatenmanagement an der RWTH Aachen. 2014. URL:
https://sharepoint.ecampus.rwth-aachen.de/units/rz/Vortrge/ForschungsdatenMgmt.pdf
S. Decker u. a. „The Semantic Web: the roles of XML and RDF“. 2000
T. Tikwinski. Verknüpfte Daten abfragen mit SPARQL. 2008. URL: http://www.w3ctag.de/2008/Tikwinski_SPARQL.pdf
K. Alexander. The Difference Between a Triplestore and a Relational Database. URL:
http://www.krisalexander.com/innovation/2013/07/16/the-difference-between-a-triplestore-and-arelational-database
Zugehörige Seminararbeit „Evaluation verschiedener Triple-Stores zum Speichern von Metadaten
im Kontext des Forschungsdatenmanagements“
GraphDB:
http://ontotext.com/wp-content/uploads/2017/01/graphdb-logo_200x200.png
Stardog:
http://stardog.com/img/sdog.png
Blazegraph: https://blog.blazegraph.com/wp-content/uploads/2016/03/Blazegraph-LogoSquare_300x300.png
Apache Jena Fuseki: Apache Jena Fuseki Workbench
BrightstarDB: http://brightstardb.com/images/logo-black-notext.png
Virtuoso:
http://docs.openlinksw.com/virtuoso/vdbenginefirebdlink/images/ui/lora1.png
Evaluation verschiedener Triple-Stores zum Speichern von Metadaten im Kontext
des Forschungsdatenmanagements |
Sarah Bensberg | Ausbildungsgruppe MATSE | 08.02.2017
Vielen Dank für Ihre Aufmerksamkeit!
22
Evaluation verschiedener Triple-Stores zum Speichern von Metadaten im Kontext
des Forschungsdatenmanagements |
Sarah Bensberg | Ausbildungsgruppe MATSE | 08.02.2017
Herunterladen