Evaluation verschiedener Triple-Stores zum Speichern von Metadaten im Kontext des Forschungsdatenmanagements Sarah Bensberg - Seminarvortrag - 08.02.2017 Inhaltsverzeichnis • Motivation - Forschungsdatenmanagement an der RWTH Aachen • Techniken für den Umgang mit Metadaten • Evaluation ausgewählter Triple-Stores • Fazit & Ausblick 2 Evaluation verschiedener Triple-Stores zum Speichern von Metadaten im Kontext des Forschungsdatenmanagements | Sarah Bensberg | Ausbildungsgruppe MATSE | 08.02.2017 Motivation - Forschungsdatenmanagement an der RWTH Aachen Motivation - Forschungsdatenmanagement an der RWTH Aachen Forschungsdatenmanagement Sammlung von Daten (Forschungsdaten) 4 Auswertung Evaluation verschiedener Triple-Stores zum Speichern von Metadaten im Kontext des Forschungsdatenmanagements | Sarah Bensberg | Ausbildungsgruppe MATSE | 08.02.2017 Archivierung der Forschungsdaten Motivation - Forschungsdatenmanagement an der RWTH Aachen Forschungsdatenmanagement • Ziel Nachvollziehen und Nachnutzung von Forschungsdaten • Problem Unspezifische Formate • Lösung Abspeichern von Metadaten 5 Evaluation verschiedener Triple-Stores zum Speichern von Metadaten im Kontext des Forschungsdatenmanagements | Sarah Bensberg | Ausbildungsgruppe MATSE | 08.02.2017 Motivation - Forschungsdatenmanagement an der RWTH Aachen PID generieren Workflow Metadaten verknüpfen Metadaten formalisieren Forschungsdaten verknüpfen Metadaten abspeichern Forschungsdaten beschreiben Forschungsdaten erstellen 6 Evaluation verschiedener Triple-Stores zum Speichern von Metadaten im Kontext des Forschungsdatenmanagements | Sarah Bensberg | Ausbildungsgruppe MATSE | 08.02.2017 Forschungsdaten abspeichern Techniken für den Umgang mit Metadaten Grundlagen Semantic Web - Resource Description Framework (RDF) - Darstellung von Informationen im Web - Ablage von Daten-Tripeln: Objekt Subjekt Literal - Elemente: leere Knoten, Datentyp-Literale oder Internationalized Resource Identifier (IRIs) 8 Evaluation verschiedener Triple-Stores zum Speichern von Metadaten im Kontext des Forschungsdatenmanagements | Sarah Bensberg | Ausbildungsgruppe MATSE | 08.02.2017 Grundlagen Graphdatenbanken • Graphen zur Abbildung von Informationen • Knoten und Kanten mit Eigenschaften bilden einen Graphen • Triple-Stores Abspeichern von Tripeln (RDF) SPARQL als Abfragesprache 9 Evaluation verschiedener Triple-Stores zum Speichern von Metadaten im Kontext des Forschungsdatenmanagements | Sarah Bensberg | Ausbildungsgruppe MATSE | 08.02.2017 Grundlagen Semantic Web - SPARQL Protocol And RDF Query Language (SPARQL) • Abfragesprache • Beispiel SQL: • Beispiel SPARQL Query: 10 Evaluation verschiedener Triple-Stores zum Speichern von Metadaten im Kontext des Forschungsdatenmanagements | Sarah Bensberg | Ausbildungsgruppe MATSE | 08.02.2017 Evaluation verschiedener Triple-Stores Evaluation verschiedener Triple-Stores Betrachtete Triple-Stores Ontotext GraphDB Apache Jena Fuseki 12 Stardog Blazegraph BrightstarDB OpenLink Virtuoso Evaluation verschiedener Triple-Stores zum Speichern von Metadaten im Kontext des Forschungsdatenmanagements | Sarah Bensberg | Ausbildungsgruppe MATSE | 08.02.2017 Evaluation verschiedener Triple-Stores Anforderung Bewertungskategorien Unterstützung von RDF Funktionalität SPARQL-Abfragen < 2s SPARQL Abfrage allgemein Gesamtexport aller abgelegter Daten SPARQL Abfrage Zeitmessung Einfügen und Löschen einzelner Tripel Import Gesamtspeicherverbrauch Programmatisches Abspeichern von Dateien im RDF-Modell Import Speicherverbrauch Dataset Ordner Abspeichern der Daten sollte < 2s dauern 13 Import allgemein Import Zeitmessung Verfügbarkeit Verfügbarkeit Dokumentation Dokumentation Benötigter Speicher Installation Stabilität / Wartbarkeit Leistungsüberwachung Evaluation verschiedener Triple-Stores zum Speichern von Metadaten im Kontext des Forschungsdatenmanagements | Sarah Bensberg | Ausbildungsgruppe MATSE | 08.02.2017 Evaluation verschiedener Triple-Stores Bewertungskategorie „SPARQL Abfrage Zeitmessung“ 14 Evaluation verschiedener Triple-Stores zum Speichern von Metadaten im Kontext des Forschungsdatenmanagements | Sarah Bensberg | Ausbildungsgruppe MATSE | 08.02.2017 Evaluation verschiedener Triple-Stores Bewertungskategorie „SPARQL Abfrage Zeitmessung“ 600 500 Dauer in ms 400 GraphDB Virtuoso 300 Apache Jena BrightstarDB 200 Stardog 100 0 Query 1 15 Query 2 Query 3 Query 4 SPARQL Anfragen Evaluation verschiedener Triple-Stores zum Speichern von Metadaten im Kontext des Forschungsdatenmanagements | Sarah Bensberg | Ausbildungsgruppe MATSE | 08.02.2017 Query 5 Query 6 Evaluation verschiedener Triple-Stores Bewertungskategorie „SPARQL Abfrage Zeitmessung“ Gesamtauswertung SPARQL Abfragen 250 Dauer in ms 200 150 100 50 0 GraphDB 16 Virtuoso Apache Jena Triple-Stores Evaluation verschiedener Triple-Stores zum Speichern von Metadaten im Kontext des Forschungsdatenmanagements | Sarah Bensberg | Ausbildungsgruppe MATSE | 08.02.2017 BrightstarDB Stardog Evaluation verschiedener Triple-Stores Auswertung erzielte Gesamtpunktzahl Bewertung der Triple-Stores, welche den Anforderungen entsprechen 50 40 39 41 36 37 30 20 10 0 GraphDB 17 Virtuoso Apache Jena Triple-Stores Evaluation verschiedener Triple-Stores zum Speichern von Metadaten im Kontext des Forschungsdatenmanagements | Sarah Bensberg | Ausbildungsgruppe MATSE | 08.02.2017 BrightstarDB Fazit & Ausblick Fazit & Ausblick Fazit Triple-Store als Umsetzungsmöglichkeit Verwendung von Virtuoso oder GraphDB 19 Evaluation verschiedener Triple-Stores zum Speichern von Metadaten im Kontext des Forschungsdatenmanagements | Sarah Bensberg | Ausbildungsgruppe MATSE | 08.02.2017 Fazit & Ausblick Ausblick • Nähere Betrachtung von Virtuoso und GraphDB • Umsetzung der Suche in den Metadaten 20 Evaluation verschiedener Triple-Stores zum Speichern von Metadaten im Kontext des Forschungsdatenmanagements | Sarah Bensberg | Ausbildungsgruppe MATSE | 08.02.2017 Quellenverzeichnis • Quellen: • Bilder: 21 M. Politze und F. Krämer. „Towards a distributed research data management system“. 2016 T. Eifert. Forschungsdatenmanagement an der RWTH Aachen. 2014. URL: https://sharepoint.ecampus.rwth-aachen.de/units/rz/Vortrge/ForschungsdatenMgmt.pdf S. Decker u. a. „The Semantic Web: the roles of XML and RDF“. 2000 T. Tikwinski. Verknüpfte Daten abfragen mit SPARQL. 2008. URL: http://www.w3ctag.de/2008/Tikwinski_SPARQL.pdf K. Alexander. The Difference Between a Triplestore and a Relational Database. URL: http://www.krisalexander.com/innovation/2013/07/16/the-difference-between-a-triplestore-and-arelational-database Zugehörige Seminararbeit „Evaluation verschiedener Triple-Stores zum Speichern von Metadaten im Kontext des Forschungsdatenmanagements“ GraphDB: http://ontotext.com/wp-content/uploads/2017/01/graphdb-logo_200x200.png Stardog: http://stardog.com/img/sdog.png Blazegraph: https://blog.blazegraph.com/wp-content/uploads/2016/03/Blazegraph-LogoSquare_300x300.png Apache Jena Fuseki: Apache Jena Fuseki Workbench BrightstarDB: http://brightstardb.com/images/logo-black-notext.png Virtuoso: http://docs.openlinksw.com/virtuoso/vdbenginefirebdlink/images/ui/lora1.png Evaluation verschiedener Triple-Stores zum Speichern von Metadaten im Kontext des Forschungsdatenmanagements | Sarah Bensberg | Ausbildungsgruppe MATSE | 08.02.2017 Vielen Dank für Ihre Aufmerksamkeit! 22 Evaluation verschiedener Triple-Stores zum Speichern von Metadaten im Kontext des Forschungsdatenmanagements | Sarah Bensberg | Ausbildungsgruppe MATSE | 08.02.2017