Klausur • • • • • Wann: Freitag 16. Februar 2007 Start: 10:00 Uhr Dauer: 120 Minuten Ort: Magnushörsaal Ihr braucht: Stift(e), Lichtbildausweis, Studentenausweis! Keine Anmeldung einfach kommen! WS2006/2007 Vorlesung: Datenbanken und Internet Copyright 2006 – DBIS/Dr. Karsten Tolle Ontologie • Unter einer Ontologie versteht man ein formal definiertes System von Begriffen und Relationen. Zusätzlich enthalten Ontologien Inferenz- und Integritätsregeln, das heißt, Regeln der Schlussfolgerung und zur Gewährleistung ihrer Gültigkeit. • Formalisiertes Modell der (Sub-)Welt! • Informatik, insb. Wissensmanagement WS2006/2007 Vorlesung: Datenbanken und Internet Copyright 2006 – DBIS/Dr. Karsten Tolle Inferenz- und Integritätsregeln Begriffe und Relationen teilw. Inferenzregeln WS2006/2007 Vorlesung: Datenbanken und Internet Copyright 2006 – DBIS/Dr. Karsten Tolle Semantic Web Scenarios • looking for a free space in a doctors time table and fix an appointment • providing further search or filtering opportunities, i.e. find a specific business near your home • comparing prices of products with specific criteria like duration of warranty WS2006/2007 Vorlesung: Datenbanken und Internet Copyright 2006 – DBIS/Dr. Karsten Tolle Anwendungsarten • Datenintegration – Ontologie Middleware • Wissensmanagement – Automatisches Finden und Lösen von Problemstellungen • Wissensgenerierung – Ableiten neuen Wissens aus den vorhandenen Daten WS2006/2007 Vorlesung: Datenbanken und Internet Copyright 2006 – DBIS/Dr. Karsten Tolle Anwendungsarten • Semanische Portale – bieten neue Suchmöglichkeiten • Annotationen – RDF in Kombination mit HTML (vergl. Eingangssuchbeispiel) • Autonome Datenabhängige Agenten • … WS2006/2007 Vorlesung: Datenbanken und Internet Copyright 2006 – DBIS/Dr. Karsten Tolle Problem of understanding Semantic!? Yesterday our team won!-) ?????? Context?!?! WS2006/2007 Vorlesung: Datenbanken und Internet Copyright 2006 – DBIS/Dr. Karsten Tolle Kontext • Als Kontext wird ein Zusammenhang oder Umfeld beispielsweise eines Wortes oder einer Handlung bezeichnet. Im Falle eines Wortes bezieht sich der Kontext auf das sprachliche Umfeld wie den Text. • Bertrand Russel bezeichnet Kontext als „endloses ungebundenes Ding“ • Kontext für Wissensbasen ... ??? WS2006/2007 Vorlesung: Datenbanken und Internet Copyright 2006 – DBIS/Dr. Karsten Tolle … und ohne Kontext? • Daten := Fakten, Bilder, Nummern, die ohne Kontext präsentiert werden. • Informationen := organisierte Daten, die in ihrem Kontext repräsentiert werden. • Wissen := Informationen zusammen mit dem Verständnis, wie diese zu nutzen sind. Frei übersetzt aus: Annie Brooking: Corporate Memory. Thomson Business Press, ISBN 1-86152-268-1, 1999 WS2006/2007 Vorlesung: Datenbanken und Internet Copyright 2006 – DBIS/Dr. Karsten Tolle Resource Description Framework (RDF) subject WS2006/2007 predicate Vorlesung: Datenbanken und Internet object Copyright 2006 – DBIS/Dr. Karsten Tolle Context and RDF • external context – provenance / source information – circumstances during storing the data • internal context – surrounding RDF Graph • additional context – triple identification – privileges for insertion and access – ... WS2006/2007 Vorlesung: Datenbanken und Internet Copyright 2006 – DBIS/Dr. Karsten Tolle Source Information in RDF • The storage of source information for triples is not part of the RDF Model. Source information is important for: – check the data (up-to-date?) – getting further information (HTML) – trust / confidence • Everybody can say anything about everything. WS2006/2007 Vorlesung: Datenbanken und Internet Copyright 2006 – DBIS/Dr. Karsten Tolle Trust / Confidence • Are the data correct? http://www.abc.com at 11.11.2004 ???? http://www.abc.com at 11.11.2004 WS2006/2007 Vorlesung: Datenbanken und Internet Copyright 2006 – DBIS/Dr. Karsten Tolle Darstellungsarten für Kontext in RDF • Reified Statements & Container • Quadruples (Quads) – Named Graphs als Abwandlung • Triples With Context Node < subject, predicate, object, context > WS2006/2007 Vorlesung: Datenbanken und Internet Copyright 2006 – DBIS/Dr. Karsten Tolle Frage: • Wie speichert man RDF (SW Data)? – Wie speichert man Kontext? • Wie stellt man Anfragen an RDF (SW Data)? – Wie bezieht man den Kontext ein? WS2006/2007 Vorlesung: Datenbanken und Internet Copyright 2006 – DBIS/Dr. Karsten Tolle Wie speichert man RDF? • Triepelorientiert – S,P,O,[C] – Generische Repräsentation (Monolitischer Ansatz) • Grundidee alle Statements in einer Tabelle • Verbesserung von Speicherplatz und Zugriffszeit durch Nutzung von ID-Verweisen und Namensraum Verweisen anstelle von vollen URIs. Pablo paints Guernica triple WS2006/2007 subj pred obj Pablo paints Guernica Vorlesung: Datenbanken und Internet Copyright 2006 – DBIS/Dr. Karsten Tolle Wie speichert man RDF? • Eigenschaftsorientiert – P(S,O,[C]) – Für jede Eigenschaft eine eigene Tabelle – Kontextspeicherung möglich paints subj obj Pablo Guernica WS2006/2007 Vorlesung: Datenbanken und Internet Copyright 2006 – DBIS/Dr. Karsten Tolle Wie speichert man RDF? • Schemaspezifische Repräsentation – Wir auch graphbasierte Repräsentation genannt. – Eigene Tabellen für: Eigenschaften, Klassen und weitere RDF Konstrukte – Kontextspeicherung schwierig WS2006/2007 Vorlesung: Datenbanken und Internet Copyright 2006 – DBIS/Dr. Karsten Tolle Wie speichert man RDF? • Kombinierte Repräsentation – Redundante Speicherung: in generisch und schemaorientiert! – Kontextspeicherung schwierig (in RDF-S3 realisiert), jedoch begrenzt auf “Quellinformation” siehe nächste Folie … WS2006/2007 Vorlesung: Datenbanken und Internet Copyright 2006 – DBIS/Dr. Karsten Tolle WS2006/2007 Vorlesung: Datenbanken und Internet Copyright 2006 – DBIS/Dr. Karsten Tolle Was ist zu beachten? • • • • • • Was wird angefragt? Wie sind die Daten gespeichert? Was für Daten liegen vor? Ändern sich die Daten? Wie verändert sich die Datenmenge? … WS2006/2007 Vorlesung: Datenbanken und Internet Copyright 2006 – DBIS/Dr. Karsten Tolle Übersicht Modellierungstools Produkt Quellcod e Bemerkung Lizenz / Kosten Betriebssystem Protégé Java gut für große Ontologien Open Source / free unabhängig IsaViz Java Fokus liegt auf der Visualisierung GPL kompatibel unabhängig SemanticWorks – 30 Tage Testversion Windows NT, XP, 2000, 03 InferEd – bietet die Herleitung abgeleiteter Aussagen zurzeit Beta-Phase (kostenlos) Windows 2000 / XP / NT SMORE Java für Einsteiger, jedoch mit begrenzter Funktionalität GPL unabhängig OntoStudio – WS2006/2007 von Altova (XMLSpy) sehr gute Visualisierung als unabhängig Hauptspeicherver sion kostenlos Vorlesung: Datenbanken und Internet erhältlich Copyright 2006 – DBIS/Dr. Karsten Tolle Übersicht Speichertools Produkt Quellcode Datenbanken Anfragesprach en Betriebssystem Jena Java MySQL, Oracle, PostgreSQL SPARQL, RDQL unabhängig RDFSuite Java / C PostgreSQL – obj.relational RQL Solaris / Linux RDF-S3 Java DB2, MySQL eRQL unabhängig Sesame Java PostgreSQL RDQL, RQL unabhängig RDF Gateway – enthalten – deduktiv RDFQL Windows 2000 / XP / NT Redland C Berkeley DB, SQLLite, AKT Triplestore, MySQL SPARQL, RDQL Linux, Solaris, OSF/1, FreeBSD, MacOS X Kowari Java WS2006/2007 enthalten iTQL, (RDQL, unabhängig (Eigenentwicklung) SPARQL) Vorlesung: Datenbanken und Internet Copyright 2006 – DBIS/Dr. Karsten Tolle Übersicht Anfragesprachen Anfragesprache Bemerkung / Besonderheit RDQL sehr hohen Verbreitungsgrad SPARQL Nachfolger von RDQL mit Erweiterungen zur Unterstützung von Quadrupel, eventuell zukünftiger W3C Standard RQL mächtiger als RDQL mit Fokus auf Schemaabfragen eRQL sehr einfach zu lernen, basiert nicht auf SQL, jedoch noch nicht marktreif RDFQL Script-Sprache mit der Möglichkeit Regeln zum Ableiten neuer Aussagen zu integrieren iTQL bietet zusätzliche Funktionen wie Daten Manipulation und Data Mining Operationen WS2006/2007 Vorlesung: Datenbanken und Internet Copyright 2006 – DBIS/Dr. Karsten Tolle