Idee und Realisierung des Internet der Zukunft Ein Vortrag von Lucia Tietz und Manuel Kaess “Das Web wird sein volles Potenzial erst dann ausschöpfen, wenn es zu einer Umgebung wird, in der Daten nicht nur von Menschen, sondern auch von automatischen Werkzeugen getauscht und verarbeitet werden können.” Web-Miterfinder Tim Berners-Lee Die Anfänge des World Wide Web Die Anfänge des World Wide Web • Seiten werden von Autoren erstellt (statisch) • Hyperlinks erlauben das Navigieren zwischen Seiten und zu Email-Adressen • Aufkommen von mehr und mehr Seiten im Web macht Suchmaschinen notwendig • Verschlagwortung von Webseiten mit keywords und anderen Meta-Tags Derzeitiger Trend: Web 2.0 Derzeitiger Trend: Web 2.0 Interaktion mit dem Betrachter Unterhaltungen / Soziale Aspekte Ständig wechselnde Inhalte der Seiten Leistungsfähigere Suchmaschinen Nutzung von Multimedia Blogs, Podcasts, Wikis, Chats, Foren, Videoportale, online Betriebssysteme, … Derzeitige Problematik • • • • • Unendlich viele Seiten im Web vorhanden Alle Information liegt irgendwo im Web verborgen Suchmaschinen liefern viele Ergebnisse Problem: Auffinden und Aussortieren des Wichtigen Wunsch: • Suchmaschinen, die bestehendes Wissen im Web durchforsten und genau die Informationen liefern, die gesucht werden • Leistungsfähige Agenten für vielfältige Aufgaben (z.B. Reise buchen) • Verwertung des bisher gesammelten Wissens zu Erzeugung neuen Wissens Lösung: Semantic Web • Wissen soll in Taxonomien und Ontologien abgebildet werden • Dadurch sind Maschinen in der Lage Inhalte von Webseiten zu „verstehen“ und Schlüsse zu ziehen • Agenten können so das Web durchsuchen und Informationen anzeigen oder erschließen • Erfordert das Erstellen von maschinenlesbarem Code Grundlagen: Taxonomien Klassifikation einfacher hierarchischer Strukturen – monohierarchisch Baumstruktur von Wurzel zu Blatt nimmt der Informationsgehalt zu Grundlagen: Ontologien Wissensrepräsentation von Begriffen und Relationen Regeln zur Schlussfolgerung und Gültigkeit Netzwerk von Informationen mit logischer Gliederung Instanzen - repräsentieren das Wissen Relationen - Beziehungen zwischen Instanzen Vererbung von Instanzen und Relationen Axiome - Aussagen, die immer wahr sind, werden repräsentiert (nicht ableitbares Wissen) Techniken: Dublin Core Metadatenschema zur Beschreibung von Elementen im Internet erstellt von „Dublin Core Metadata Initiative“ (DCMI) Beschreibung für 15 verschiedene Elemente (Identifier, Format, Type, Language, Title, Subject, Coverage, Description, Creator, Publisher, Contributor, Rights, Source, Relation, Date) Techniken: RDF formale Sprache zur Erstellung von Metadaten im Internet grafisches Modell sowie XML-Syntax Sprachelemente: Ressourcen - (Subjekt) - Eigenschaften - (Prädikat) - Objekte - Verweise auf externe Namespaces (z.B. Dublin Core, ...) Techniken: RDF Angabe von Sprachelement-Tripeln (N3 Notation von Berner Lee): <http://de.wikipedia.org/wiki/Resource_Description_Framework> has <http://purl.org/dc/elements/1.1/title>"Resource Description Framework" . <http://de.wikipedia.org/wiki/Resource_Description_Framework> has <http://purl.org/dc/elements/1.1/publisher> "Wikipedia - Die freie Enzyklopädie" Techniken: RDF Vorhergehende Tripel in XML-Syntax: <?xml version="1.0" encoding="UTF-8" ?> <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:dc="http://purl.org/dc/elements/1.1/"> <rdf:Description rdf:about="http://de.wikipedia.org/wiki/Resource_Description_Framework"> <dc:title>Resource Description Framework</dc:title> <dc:publisher>Wikipedia - Die freie Enzyklopädie</dc:publisher> </rdf:Description> </rdf:RDF> Techniken: RDFS RDF-Schema vergleichbar mit DTD bei XML Klassen und Eigenschaften werden mit Dublin Core repräsentiert Projekte mit RDF FOAF: Friend of a Friend - soziale Beziehungen werden semantisch dargestellt. DAOC: Description of a Career - Darstellung von Lebensläufen in RDF. Relationen zwischen Personen und Fähigkeiten können einfach verknüpft werden. Beispiel DOAC <foaf:Person> <foaf:name>Ramon Antonio Parada</foaf:name> <foaf:mbox rdf:resource="mailto:[email protected]" /> <foaf:homepage rdf:resource="http://ramonantonio.net/" /> <doac:experience> <doac:WorkExperience> <doac:title>Website Mantainer</doac:title> <doac:organization>Equus Zebra</doac:organization> <doac:start-date>2000-06-15</doac:start-date> <doac:end-date>2000-06-15</doac:end-date> </doac:WorkExperience> </doac:experience> <doac:education> <doac:Degree> <doac:title>Systems Engineer</doac:title> <doac:organization>University of a Corunha</doac:organization> <doac:start-date>2000-06-01</doac:start-date> <doac:end-date>2000-06-15</doac:end-date> </doac:Degree> </doac:education> Beispiel DOAC <doac:skill> <doac:LanguageSkill> <doac:language>es</doac:language> <doac:reads rdf:resource="http://ramonantonio.net/doac/0.1/#nativelevel"/> <doac:writes rdf:resource="http://ramonantonio.net/doac/0.1/#nativelevel"/> <doac:speaks rdf:resource="http://ramonantonio.net/doac/0.1/#nativelevel"/> </doac:LanguageSkill> </doac:skill> <doac:skill> <doac:LanguageSkill> <doac:language>en</doac:language> <doac:reads rdf:resource="http://ramonantonio.net/doac/0.1/#highlevel"/> <doac:writes rdf:resource="http://ramonantonio.net/doac/0.1/#highlevel"/> <doac:speaks rdf:resource="http://ramonantonio.net/doac/0.1/#highlevel"/> </doac:LanguageSkill> </doac:skill> </foaf:Person> Techniken: OWL Steht für Web Ontology Language Weiterentwicklung von RDF um prädikatenlogische Aspekte und Mengenrelationen Beschreibung von Dingen der realen Welt in Maschinenlesbare Sprache Erstellung von Relationen zwischen den Objekten der einzelnen Klassen Verschieden mächtige ausprägungen: OWL Lite, OWL DL und OWL Full Techniken: OWL <owl :Class rdf: ID="Wine"> <rdfs : subClassOfrdf:resource="&food ; PotableLiquid "/><rdfs:subClassOf> <owl :Restriction> <owl :onProperty rdf:resource="#madeFromGrape"/> <owl :minCardinality rdf:datatype="&xsd ; nonNegativeInteger">1 </owl :minCardinality> </owl :Restriction> </rdfs:subClassOf> ... </owl :Class> Techniken: OWL Ein Beispiel: an der Universität von Stanford entwickelter Wine Agent Ausblick Noch keine „Killerapplikation“ verfügbar Haupteinsatzgebiet bisher: Forschung, Wissenschaft Viele ungeklärte Fragen Datensicherheit?, Richtigkeit der Daten?, Vertrauen in Maschine? Bisher wenige grafische Tools Akzeptanz der Nutzer wird entscheiden Vielen Dank für das Interesse!