Ontologie

Werbung
Klausur
•
•
•
•
•
Wann: Freitag 16. Februar 2007
Start: 10:00 Uhr
Dauer: 120 Minuten
Ort: Magnushörsaal
Ihr braucht: Stift(e), Lichtbildausweis,
Studentenausweis!
Keine Anmeldung einfach kommen!
WS2006/2007
Vorlesung: Datenbanken und Internet
Copyright 2006 – DBIS/Dr. Karsten Tolle
Ontologie
• Unter einer Ontologie versteht man ein
formal definiertes System von Begriffen
und Relationen. Zusätzlich enthalten
Ontologien Inferenz- und Integritätsregeln,
das heißt, Regeln der Schlussfolgerung
und zur Gewährleistung ihrer Gültigkeit.
• Formalisiertes Modell der (Sub-)Welt!
• Informatik, insb. Wissensmanagement
WS2006/2007
Vorlesung: Datenbanken und Internet
Copyright 2006 – DBIS/Dr. Karsten Tolle
Inferenz- und Integritätsregeln
Begriffe und Relationen
teilw. Inferenzregeln
WS2006/2007
Vorlesung: Datenbanken und Internet
Copyright 2006 – DBIS/Dr. Karsten Tolle
Semantic Web Scenarios
• looking for a free space in a doctors
time table and fix an appointment
• providing further search or filtering
opportunities, i.e. find a specific
business near your home
• comparing prices of products with
specific criteria like duration of warranty
WS2006/2007
Vorlesung: Datenbanken und Internet
Copyright 2006 – DBIS/Dr. Karsten Tolle
Anwendungsarten
• Datenintegration – Ontologie Middleware
• Wissensmanagement – Automatisches
Finden und Lösen von Problemstellungen
• Wissensgenerierung – Ableiten neuen
Wissens aus den vorhandenen Daten
WS2006/2007
Vorlesung: Datenbanken und Internet
Copyright 2006 – DBIS/Dr. Karsten Tolle
Anwendungsarten
• Semanische Portale – bieten neue
Suchmöglichkeiten
• Annotationen – RDF in Kombination mit
HTML (vergl. Eingangssuchbeispiel)
• Autonome Datenabhängige Agenten
• …
WS2006/2007
Vorlesung: Datenbanken und Internet
Copyright 2006 – DBIS/Dr. Karsten Tolle
Problem of understanding
Semantic!?
Yesterday our team won!-)
??????
Context?!?!
WS2006/2007
Vorlesung: Datenbanken und Internet
Copyright 2006 – DBIS/Dr. Karsten Tolle
Kontext
• Als Kontext wird ein Zusammenhang oder
Umfeld beispielsweise eines Wortes oder
einer Handlung bezeichnet. Im Falle eines
Wortes bezieht sich der Kontext auf das
sprachliche Umfeld wie den Text.
• Bertrand Russel bezeichnet Kontext als
„endloses ungebundenes Ding“
• Kontext für Wissensbasen ... ???
WS2006/2007
Vorlesung: Datenbanken und Internet
Copyright 2006 – DBIS/Dr. Karsten Tolle
… und ohne Kontext?
• Daten := Fakten, Bilder, Nummern, die ohne
Kontext präsentiert werden.
• Informationen := organisierte Daten, die in
ihrem Kontext repräsentiert werden.
• Wissen := Informationen zusammen mit dem
Verständnis, wie diese zu nutzen sind.
Frei übersetzt aus: Annie Brooking: Corporate Memory.
Thomson Business Press, ISBN 1-86152-268-1, 1999
WS2006/2007
Vorlesung: Datenbanken und Internet
Copyright 2006 – DBIS/Dr. Karsten Tolle
Resource Description Framework (RDF)
subject
WS2006/2007
predicate
Vorlesung: Datenbanken und Internet
object
Copyright 2006 – DBIS/Dr. Karsten Tolle
Context and RDF
• external context
– provenance / source information
– circumstances during storing the data
• internal context
– surrounding RDF Graph
• additional context
– triple identification
– privileges for insertion and access
– ...
WS2006/2007
Vorlesung: Datenbanken und Internet
Copyright 2006 – DBIS/Dr. Karsten Tolle
Source Information in RDF
• The storage of source information for triples is
not part of the RDF Model. Source information is
important for:
– check the data (up-to-date?)
– getting further information (HTML)
– trust / confidence
• Everybody can say anything about everything.
WS2006/2007
Vorlesung: Datenbanken und Internet
Copyright 2006 – DBIS/Dr. Karsten Tolle
Trust / Confidence
• Are the data correct?
http://www.abc.com at 11.11.2004
????
http://www.abc.com at 11.11.2004
WS2006/2007
Vorlesung: Datenbanken und Internet
Copyright 2006 – DBIS/Dr. Karsten Tolle
Darstellungsarten für
Kontext in RDF
• Reified Statements & Container
• Quadruples (Quads)
– Named Graphs als Abwandlung
• Triples With Context Node
< subject, predicate, object, context >
WS2006/2007
Vorlesung: Datenbanken und Internet
Copyright 2006 – DBIS/Dr. Karsten Tolle
Frage:
• Wie speichert man RDF (SW Data)?
– Wie speichert man Kontext?
• Wie stellt man Anfragen an RDF (SW
Data)?
– Wie bezieht man den Kontext ein?
WS2006/2007
Vorlesung: Datenbanken und Internet
Copyright 2006 – DBIS/Dr. Karsten Tolle
Wie speichert man RDF?
• Triepelorientiert – S,P,O,[C]
– Generische Repräsentation (Monolitischer Ansatz)
• Grundidee alle Statements in einer Tabelle
• Verbesserung von Speicherplatz und Zugriffszeit durch
Nutzung von ID-Verweisen und Namensraum Verweisen
anstelle von vollen URIs.
Pablo
paints
Guernica
triple
WS2006/2007
subj
pred
obj
Pablo
paints
Guernica
Vorlesung: Datenbanken und Internet
Copyright 2006 – DBIS/Dr. Karsten Tolle
Wie speichert man RDF?
• Eigenschaftsorientiert – P(S,O,[C])
– Für jede Eigenschaft eine eigene Tabelle
– Kontextspeicherung möglich
paints
subj
obj
Pablo
Guernica
WS2006/2007
Vorlesung: Datenbanken und Internet
Copyright 2006 – DBIS/Dr. Karsten Tolle
Wie speichert man RDF?
• Schemaspezifische Repräsentation
– Wir auch graphbasierte Repräsentation genannt.
– Eigene Tabellen für: Eigenschaften, Klassen und
weitere RDF Konstrukte
– Kontextspeicherung schwierig
WS2006/2007
Vorlesung: Datenbanken und Internet
Copyright 2006 – DBIS/Dr. Karsten Tolle
Wie speichert man RDF?
• Kombinierte Repräsentation
– Redundante Speicherung: in generisch und
schemaorientiert!
– Kontextspeicherung schwierig (in RDF-S3
realisiert), jedoch begrenzt auf “Quellinformation”
 siehe nächste Folie …
WS2006/2007
Vorlesung: Datenbanken und Internet
Copyright 2006 – DBIS/Dr. Karsten Tolle
WS2006/2007
Vorlesung: Datenbanken und Internet
Copyright 2006 – DBIS/Dr. Karsten Tolle
Was ist zu beachten?
•
•
•
•
•
•
Was wird angefragt?
Wie sind die Daten gespeichert?
Was für Daten liegen vor?
Ändern sich die Daten?
Wie verändert sich die Datenmenge?
…
WS2006/2007
Vorlesung: Datenbanken und Internet
Copyright 2006 – DBIS/Dr. Karsten Tolle
Übersicht Modellierungstools
Produkt
Quellcod
e
Bemerkung
Lizenz / Kosten
Betriebssystem
Protégé
Java
gut für große
Ontologien
Open Source / free
unabhängig
IsaViz
Java
Fokus liegt auf der
Visualisierung
GPL kompatibel
unabhängig
SemanticWorks
–
30 Tage Testversion
Windows NT, XP,
2000, 03
InferEd
–
bietet die Herleitung
abgeleiteter
Aussagen
zurzeit Beta-Phase
(kostenlos)
Windows 2000 /
XP / NT
SMORE
Java
für Einsteiger, jedoch
mit begrenzter
Funktionalität
GPL
unabhängig
OntoStudio
–
WS2006/2007
von Altova
(XMLSpy)
sehr gute
Visualisierung
als
unabhängig
Hauptspeicherver
sion kostenlos
Vorlesung: Datenbanken und Internet erhältlich
Copyright 2006 – DBIS/Dr. Karsten Tolle
Übersicht Speichertools
Produkt
Quellcode
Datenbanken
Anfragesprach
en
Betriebssystem
Jena
Java
MySQL, Oracle,
PostgreSQL
SPARQL,
RDQL
unabhängig
RDFSuite
Java / C
PostgreSQL – obj.relational
RQL
Solaris / Linux
RDF-S3
Java
DB2, MySQL
eRQL
unabhängig
Sesame
Java
PostgreSQL
RDQL, RQL
unabhängig
RDF Gateway
–
enthalten –
deduktiv
RDFQL
Windows 2000 / XP
/ NT
Redland
C
Berkeley DB, SQLLite,
AKT Triplestore,
MySQL
SPARQL,
RDQL
Linux, Solaris,
OSF/1,
FreeBSD,
MacOS X
Kowari
Java
WS2006/2007
enthalten
iTQL, (RDQL,
unabhängig
(Eigenentwicklung)
SPARQL)
Vorlesung: Datenbanken und Internet
Copyright 2006 – DBIS/Dr. Karsten Tolle
Übersicht Anfragesprachen
Anfragesprache
Bemerkung / Besonderheit
RDQL
sehr hohen Verbreitungsgrad
SPARQL
Nachfolger von RDQL mit Erweiterungen zur Unterstützung von
Quadrupel, eventuell zukünftiger W3C Standard
RQL
mächtiger als RDQL mit Fokus auf Schemaabfragen
eRQL
sehr einfach zu lernen, basiert nicht auf SQL, jedoch noch nicht
marktreif
RDFQL
Script-Sprache mit der Möglichkeit Regeln zum Ableiten neuer
Aussagen zu integrieren
iTQL
bietet zusätzliche Funktionen wie Daten Manipulation und Data
Mining Operationen
WS2006/2007
Vorlesung: Datenbanken und Internet
Copyright 2006 – DBIS/Dr. Karsten Tolle
Herunterladen