Diplomarbeit Semantic Web Techniken für E-Learning Younous El Moustafid Juni 2003 Betreuer: Prof. Dr. Paul Müller Dipl. Inform. Andreas Rippel Fachbereich Informatik AG Integrierte Kommunikationssysteme Universität Kaiserslautern Postfach 3049 Kaiserslautern 67653 Ich versichere, dass ich die vorliegende Diplomarbeit selbständig verfasst und keine anderen als die angegebenen Quellen und Hilfsmittel verwendet habe. (Younous El Moustafid) Widmung Jetzt, wo der Moment gekommen ist, mich bei meinen Förderern zu bedanken, fehlen mir die Worte. Ich versuche es aber trotzdem. Diese Arbeit, die einen langen Weg erfolgreich abschließt, widme ich meinen liebsten Menschen, die mich während meines ganzen Studiums begleitet haben, und jetzt stolz auf mich sind. Allen voran meinen verstorbenen Eltern, die mir diesen Werdegang mit viel Liebe und Unterstützung erst möglich gemacht haben. Meiner Frau und meinem Sohn, die mich immer wieder aufgebaut haben, und vor dem Aufgeben bewahrt haben. Meinen Geschwistern und meiner Schwiegerfamilie für ihre moralische Unterstützung. Bei dieser Gelegenheit möchte ich mich auch bei allen Professoren bedanken, die mir was gelehrt haben. Ein großes Dankeschön aber auch an alle Personen (AAA, Dekanat , etc... ), die mir mit Rat und Tat gestanden haben. Semantic Web Techniken für E-Learning ABSTRACT Mit der zunehmenden Vernetzung entstehen immer mehr und größere Informationsquellen, allen voran das World Wide Web. Immer mehr Wissen wird immer „leichter“ verfügbar. Dadurch entstehen aber neue Probleme: wie findet man in der gewaltigen Menge genau die Informationen, die man sucht, oder wie findet man die Nadel im Heuhaufen? Hier ein Zitat von John Naisbitt “ Wir ertrinken in Informationen und hungern nach Wissen“ 1. Eine Lösung könnten die Topic Maps sein, in dem sie das Wissen in bestimmten Netzen beschreiben und Möglichkeiten zur Navigation in solchen Netzen bereitstellen. Topic Maps sind „semantische Netze“, die bestehende Wissensnetze inhaltlich beschreiben. Sie stellen eine standardisierte Darstellung über die Struktur von Informationsbetriebsmitteln zur Verfügung, um Themen und deren Verhältnisse untereinander austauschbar zu machen. Dabei müssen keine bestehenden Dokumente geändert werden, sondern Topic Maps (auf Deutsch: Themendiagramme) stellen eine zweite Schicht oberhalb der Dokumentenschicht dar, die das vorhandene Wissen beschreiben und zueinander in Verbindung setzen. Im Allgemeinen umfassen die strukturellen Informationen, die von Themendiagrammen übermittelt werden: Zusammenfassung der ansprechbaren Informationen zu den Themen und die Verhältnisse und Beziehungen zwischen den Themen. Ein Topic Map definiert einen mehr dimensionalen Themenraum, einen Raum, in dem die Themen sind, und in welchem die Abstände wischen denen in der Zahl der dazwischen liegenden Themen ausgedrückt messbar sind. Dabei kann auch die Art der Verbindungen und Themen, die auf dem Pfad liegen, berücksichtigt werden. Als Beispiel sei hier der Begriff Kette. Ein Anwender möchte sich genauer über das Thema „Kette“ informieren. Gibt er diesen Begriff ein, werden ihm dann alle möglichen Gebiete aufgezeigt, in denen, er was zum Thema „Kette“ findet, zum Beispiel: Aus der Chemie (Kette als Molekülform) oder aus der Informatik (Kette „Liste“ als 1 Smolnik Topic Maps Darmstädter Kongress . Copyright © [email protected] v Semantic Web Techniken für E-Learning Datenstruktur) etc. Mit Topic Maps kann der Anwender damit schneller zu seinen Informationen gelangen. Im Rahmen eines Projektes zum elektronischen Lernen werden Onlineressourcen, wie Skripte und Tutorials, erfasst, die von Lehrkräften im Rahmen des universitären Lehrbetriebs zur Verfügung gestellt werden. Diese Ressourcen werden von den Erstellern mit verschiedenen Attributen wie Schlagworten versehen. Mit diesen Attributen kann nachfolgend gesucht werden. Um den Aufbau dieses Schlagwortkataloges zu strukturieren werden Themendiagramme eingesetzt. Schlagworte: Topic Maps, XTM, XML, TMQL, HTML, Suchmaschinen, RDF, Hytime, ISO 13250, E-Learning, semantische Netze... Copyright © [email protected] vi Inhaltsverzeichnis Inhaltsverzeichnis Copyright © [email protected] 9 1 Von den Suchmaschinen zum Semantic Web 2 2.1 2.2 2.3 2.3.1 2.3.2 2.3.3 2.3.4 Topic Maps Geschichte der Topic Maps: Die Entwurfsziele von XTM: XML Topic Maps XML Younous El Moustafid ( wo ist Name und Vorname? ) in HTML und XML XTM Tutorial HTML und XTM 21 23 44 3 3.1 3.1.1 3.1.2 3.1.3 3.2 3.2.1 3.2.2 3.3 3.4 3.4.1 3.4.2 Die TopicMaps-Tools und Abfragesprachen Die kommerziellen Tools: Ontopia USU Intelligent Views Freie TopicMapsTools: TopicMaps-designer: Semantext Fazit: Abfragesprachen Tolog TMQL 46 46 46 52 54 57 57 59 63 64 64 65 4 4.1 4.2 4.3 4.3.1 4.3.2 Einsatzgebiete von TopicMaps Der Einsatz von Topic-Maps in Webkatalogen Der Einsatz von Topic-Maps in den Suchmaschinen TopicMaps und E-Learning: E-Learning mit dem Omnigator E-Learning Tracker: 67 67 67 68 70 72 5 5.1 TopicMaps Suchmaschinen KartOO 79 79 vii 16 16 17 19 19 Inhaltsverzeichnis Copyright © [email protected] 5.2 Lumrix 80 6 Zusammenfassung und Ausblick 83 7 Abkürzungsverzeichnis 87 8 Literatur 88 9 Anhang 91 10 Abbildungen 109 11 Tabellenverzeichnis 111 viii Semantic Web Techniken für E-Learning 1 Von den Suchmaschinen zum Semantic Web Das Web hat heutzutage an Bedeutung immens gewonnen. Das ist die erste Adresse weltweit, an die man sich wendet, um nach Informationen zu suchen. Vor allem wegen der „scheinbaren“ Einfachheit der Handhabung, der leichten Zugänglichkeit und der rund um die Uhr Verfügbarkeit dieser Variante der Informationssuche. Man braucht nur einen Internetzugang, um mit der Informationssuche zu beginnen. Bei Milliarden von Informationen und Daten im Internet – Tendenz steigend – braucht man einen Leitfaden um dadurch zu blicken. Die Lösung war – Anfangs – Suchmaschinen zum Beispiel: Lycos, Google, Metacrawler oder Altavista. Die haben aber selbst große Schwierigkeiten der unüberschaubar großen Menge an Informationsressourcen und Dokumenten im World Wide Web gerecht zu werden. Die Themenkataloge wie Yahoo zum Beispiel, bieten zwar eine gute Alternative zu diesen Suchmaschinen, da die Aufnahme neuer Seiten in diesen manuell betreuten Suchdiensten und deren Einordnung in die Datenbank von einer (menschlichen) Redaktion vorgenommen wird, die neu angemeldete WWW-Seiten besucht, anschließend nach bestimmten Kriterien klassifiziert und in eine thematisch orientierte Kategorie einordnet. Das hat aber auch den Nachteil, dass dieser Webkatalog nur in einem stark eingeschränkten Themenbereich oder Spielraum sucht. Da entsteht wiederum das Problem, wie man diese Suchmaschinen vernünftig benutzen kann. Gibt es eine Regel, wie man im Netz sucht und – vor allem – findet? Maurice Godelier2 hat es auf den Punkt gebracht, in dem er sagte: „Mais faut- il qu’[un chercheur] sache autre chose que sa discipline pour excercer sa discipline. Cela va de soi...Pourtant je ne crois pas (...)qu’ en faisant cela on devienne interdisciplinaire. L’ interdisciplinarite est autre chose. Elle ne peut se construire qu a partir d un travail d’equipe (…) sur la base d ‘un presuppose evident, a savoir qu aucune approche specialisee n epuise la connaissance d un objet, d une realite...“ Das heißt wohl, muss ein Wissenschaftler mehr als auf seinem Gebiet Wissen erwerben um auf seinem Gebiet tätig zu sein? Dies bedeutet interdisziplinär zu arbeiten. Interdisziplinarität bedeutet aber was anderes, sie kann nur aus der Mitarbeit einer kompletten Gruppe entstehen. 2 Goldmedaille Gewinner bei CNRS 2001 zum Thema Suchmaschinen . Copyright © [email protected] 9 Semantic Web Techniken für E-Learning Es gibt leider keine Regel, die Erfolg bei der Suche garantiert, dafür aber gibt es zwei Varianten, wie man eine Suche durchführt: KeyWord Suche: der Benutzer – kennt sich aus und – weiß ganz genau und exakt was er sucht. Dem entsprechend formuliert auch seine Anfrage. Information Browsing: der Benutzer weiß zwar, was er sucht, kann das aber nicht richtig formulieren; und fängt mit einer allgemeinen Anfrage an, die sich im Laufe der Suche konkretisiert. Die zweite Variante ist – Laut einer Umfrage von Delphi – die meist benutzte, denn fast 70 % der Suche im Internet verläuft auf dieser Weise. Eine andere Möglichkeit ist: der Suchende kennt den exakten URL eines Dokuments (was voraussetzt, dass man über dessen Existenz bereits im Bilde ist) und benutzt es auch, oder man findet ein Dokument (von dessen Existenz man bis dato noch nichts wusste) dadurch, dass man einem Link in einem bereits bekannten bzw. gefundenen Dokument folgt. Zwar gibt es Berechnungen, die besagen, dass zwei beliebige Dokumente im World Wide Web statistisch betrachtet nie mehr als 19 "Klicks" von einander entfernt liegen3, doch erscheint es angesichts vieler Millionen von im Netz verfügbaren Dokumenten als relativ aussichtslos, bei einer gezielten Themensuche ausgehend von einem bekannten Dokument genau die richtigen 19 "Klicks" zu tätigen, um schließlich zu einem anderen Dokument zu gelangen, welches genau diejenige Information bereithält, dessen man gerade bedarf. Resultat eines solchen Online-Recherchierens nach dem "Schneeballsystem" ist in der Regel nicht ein Gefühl der Befriedigung, sondern das oft beschriebene - und eher frustrierende - "Lost in Cyberspace". Unter Suchdiensten versteht man meistens Webkataloge und Suchmaschinen, da man mit Hilfe dieser zwei Techniken seine Information im Internet suchen kann. SSuucchhdm ieancshtein e n W e b - K a t a lo g e S u c h m a s c h in e n Abbildung 1: Verschiedene Suchdienste 3 Tom Schimmeck Copyright © [email protected] 10 Semantic Web Techniken für E-Learning Und wie arbeiten jetzt diese verschiedenen Suchdienste? Warum sollte Topic Maps anders sein? Wie man bereits gesehen hat, sitzen bei den Web- Katalogen meistens Menschen hinter dem Bildschirm und nehmen neue Seiten in die Datenbank und ordnen sie ein. Diese neuen Seiten werden dann besucht und per Hand nach bestimmten Kriterien und Gebieten einer bestimmten Kategorie einsortiert. Die bekanntesten deutschen Web- Kataloge sind Yahoo (www.yahoo.de) und Web (www.web.de). Bei den Suchmaschinen und Suchrobotern setzt man auf maschinelle Texterkennung. Dadurch erreicht man ein Vielfaches an Seiten, die ein Mensch niemals erreichen wird. Diese Maschinen besitzen voll automatisierte Suchprogramme (so genannte "robots", "crawler" oder "Webspinnen"), die stets das Netz nach neu hinzugekommenen Seiten durchsuchen. Das ist aber meistens mehr Masse statt Klasse. Das liegt darin, dass diese Suchprogramme eine Strategie verfolgen, die die Frequenz bestimmter Schlüsselwörter bestimmt. Letztlich jedoch indizieren die "Crawler" bei einer neu aufgefundenen Seite den kompletten Volltext, d.h. jedes im Text der Seite auftauchende Wort. Häufiger auftauchenden Wörtern wird dabei eine höhere Relevanz für den Inhalt der jeweiligen Seite beigemessen als nur einzeln auftauchenden Wörtern. Ein gutes Beispiel um die Uneffektivität mancher Suchmaschinen zu zeigen, ist die Suche nach dem Stichwort "Thomas Mann". Bei „Altavista“ (eine Suchmaschine, die auf (fast) jede Anfrage eine (nicht unbedingt richtige) Antwort hat) erhält man mehrere Tausend Treffer, von denen allerdings diejenigen als erste aufgeführt werden, denen das Programm auf der Grundlage seiner Berechnungen die größte Relevanz beimisst. So kann es bei einer Suchanfrage "Thomas Mann", die aus zwei suchrelevanten Ausdrücken (nämlich "Thomas" und "Mann") besteht, geschehen, dass man beispielsweise auch die Seite einer privaten Homepage als Treffer ausgegeben bekommt, auf welcher der Autor über einen Kinobesuch mit seinem Freund Thomas berichtet: "Mann, Thomas, sagte ich, lass uns doch mal wieder ins Kino gehen...".4 Die bekanntesten deutschen Suchmaschinen sind Altavista (www.altavista.de) und Lycos (www.lycos.de). Dagegen ist die Suchmaschine Google (www.google.de) ein Beispiel intelligenter Suchmaschinen, sie geht ein Stückchen weiter und sortiert Webseiten nach den Links, die auf diese Seite verweisen. Jede Referenz kommt einer Empfehlung gleich, das heißt, je mehr Links direkt oder indirekt auf die Webseite zeigen, desto höher das Ranking5. 4’6’ Tom Schimmeck 5 Henning Behme Copyright © [email protected] 11 Semantic Web Techniken für E-Learning "Der Clou bei Google ist eine spezielle Software, die ihre Erfinder PageRank getauft haben. Sie saugt nicht nur einfach Daten von Hunderttausenden von Servern ab, sie untersucht auch das Beziehungsgeflecht im Web, stellt fest, welche Links wohin verweisen. Und die Anzahl der Querverweise auf eine bestimmte Seite entscheidet über deren Prominenz auf der GoogleErgebnisliste. Dabei spielt auch die Qualität der Seite eine Rolle, von der aus ein Link eingerichtet worden ist: So zählt etwa ein von einer seriösen Nachrichtenagentur ausgehender Hinweis mehr als der von einer privaten Homepage“ 6. Also suchen die Suchmaschinen nur und wirklich nur nach der Häufigkeit des gesuchten Begriffs in den verschiedenen Quellen, und je nach Vorkommen dieses Begriffs werden diese Seiten dann absteigend sortiert und angezeigt. Der Metacrawler ist etwas effizienter in dieser Hinsicht, da er beide Techniken der Suchdienste benutzt. Bei einer Anfrage an einem Metacrawler, schickt die Maschine die Anfrage an verschiedene Suchmaschinen und Web-Kataloge weiter, nimmt deren Ergebnisse und vergleicht sie mit den Ergebnissen ihrer eigenen Datenbank. Das ist insofern (für den Benutzer) sehr gut, da er nicht mehr viele Suchmaschinen besuchen muss, um eine gute Antwort zubekommen. Dies wird ihm abgenommen. Diese Mischung aus Maschinen (Suchmaschinen) und Menschen (Web-Kataloge) führt zu beachtlichen und annehmbaren Ergebnissen. Die bekanntesten Metacrawler sind www.metacrawler.com , auch in Deutschland die in Hannover entwickelte Crawlermaschine www.metaGer.de. Natürlich ist die Suche im Web besser und effektiver, vor allem durch Google und Metacrawler. Am Schluss bleibt aber es trotzdem nur eine Suche nach dem Begriff und nicht nach seinem Sinn. Ausschlaggebend für diese Suche oder die manchmal Unmengen von Ergebnissen, die trotzdem nicht richtig sind, ist ja, dass in HTML eine inhaltliche Beschreibung dieser Links bzw. dieser Relationen zwischen den Links fehlt. Das Problem wird deutlicher, wenn man einen Begriff sucht, der völlig verschiedene Bedeutungen hat; man nehme das Webdominierende Wort Java, was eine Programmiersprache sein kann, eine Insel oder gar ein Kaffee. Dies führt dazu, dass bei der Suche nach Java, die ersten - 50 - Seiten nur die Programmiersprache Java anzeigen, und gar nichts zu den anderen Bedeutungen. Und da erfahrungsgemäß die Webbenutzer nur die ersten 10 bis 20 Suchergebnisse sichten, verzweifeln die meisten und geben die Suche erfolglos auf. Copyright © [email protected] 12 Semantic Web Techniken für E-Learning Ein erster Begriff zur Behebung dieser Problematik ist unzweifelhaft XML, das das Licht der Welt im Jahr 1997 erblickt hat. Dessen Aufgabe ist es, Dokumente zu strukturieren und einzelnen Abschnitten durch eigene, frei definierbare Tags zu identifizieren und eine Bedeutung zu verleihen. Denn, XML erlaubt über HTML hinaus die Definition von Elementen, die sich für die explizite Auszeichnung von Textinhalten verwenden lassen. Der XML Text <Prüfungsergebnisse> XML Vorlesung</ Prüfungsergebnisse > ermöglicht es einem Programm, den Zusammenhang zwischen XML und Vorlesung zu erkennen. Darüber hinaus klassifiziert das Element den Zusammenhang als Ergebnisse einer Prüfung. XML stößt aber auch an ihre Grenze bei komplizierten Anfragen. So hat man angefangen an diesem Problem zu arbeiten, um eine Lösung zu finden 7. Von „Topic Maps“ verspricht man eine einfachere und vor allem eine kürzere und erfolgreiche Suche. Der Standard ISO 13250 definiert eine austauschbare Darstellung von Topic Maps in der Terminologie einer SGML Architektur. SGML ist die Bezeichnung für die Standard Generalized Markup Language. Es handelt sich hierbei um eine komplexe Metasprache, die 1986 standardisiert wurde. SGML gewährleistet die Unabhängigkeit der Auszeichnung8 von Informationen, mit semantischen Elementen9, von der Ausgabe.10 Eine Topic Map ist im Grunde ein SGML (oder XML) Dokument, in dem verschiedene Elementtypen, abgeleitet von einer Basismenge von Architekturmasken, benutzt werden um Topics, Occurrences von Topics und Beziehungen zwischen Topics zu modellieren.11 Die Abkürzung XML steht für eXtensible Markup Language. XML ist eine vereinfachte Teilmenge von SGML, die für Web-Umgebungen optimiert wurde, also für kurzlebige Informationen. 1999 begann die Arbeitsgruppe TopicMap.org einen Webstandard für Topic Maps, basierend auf der ISO 13250, zu entwickeln. Dieser Standard wird als XTM bezeichnet. Die Abkürzung XTM steht für XML Topic Maps. Das Erstellen und Anwenden von Topic Maps zu erleichtern ist die Zielsetzung von Topic Map.org, allerdings nicht nur beschränkt auf Internetanwendungen. „Topic Maps“ ist ein Standard, Wissensstrukturen zu beschreiben und diese mit Informationsressourcen zu verbinden12. Holger Rath von „Empolis“ bezeichnet Topic Maps als Lösung zur Organisation und Navigation der immer größer werdenden Informationsmengen13. Topic Maps basieren auf XML, Dadurch wird gewährleistet, dass die Texte durch entsprechende explizite Auszeichnungen semantisch qualifiziert werden, damit sie kontextbezogen verwertet werden können - im Gegensatz zur einfachen 7 IX 11/2002 Seite 104. 8 Behme, H./Mintert. 9 Rath, H. H. (1999). 10 Behme, H./Mintert. 11 Rath, H. H. (1999). 12 Pepper. 13 Holger Rath. Copyright © [email protected] 13 Semantic Web Techniken für E-Learning Volltextsuche in HTML-Dokumente. Während die Volltextsuche nur die Inhalte der Informationsquellen auflisten kann, wertet dieser neue Ansatz Metastrukturen über die eigentlichen Inhalte aus. Die Trennung von Struktur und Dokumenten ermöglicht dabei die Pflege und Nutzung der Struktur unabhängig von den Dokumenten. Warum die Autoren – und die immer mehr werdenden Firmen bzw. Benutzer dieser Technik auf „Topic Maps“ schwören, wird ausführlich in den nächsten Kapiteln behandelt. In dieser Einleitung hat man einige Techniken der Suchmaschinen, Metacrawler gesehen. Dann hat man den Weg von HTML über XML zu XTM verfolgt. Im nächsten Kapitel wird man die Geschichte von TopicMaps betrachten, die schon Anfang der Neunziger Jahre begann. Dazu kommen noch drei Beispiele, in denen dann diese Technik nach und nach erklärt wird. 2003 1997 Semantic 1991 Universal Unified http:// XML Topic Maps ? Abbildung2: „The 3rd Prophecy“ von Tim Berners-Lee14 14 W3C-Direktor . Copyright © [email protected] 14 Semantic Web Techniken für E-Learning Abbildung 2 stammt von Tim Berners-Lee, der damit aussagen will, dass die Idee des Semantic Web nach HTTP und XML als die dritte InternetRevolution gilt15. 15 Tim Berners-Lee. Copyright © [email protected] 15 Semantic Web Techniken für E-Learning 2 Topic Maps 2.1 Geschichte der Topic Maps: Die Geschichte der Topic Maps liegt über einen Jahrzehnt zurück. Sie begann 1991. Unterschiedliche Firmen aus der Computerindustrie hatten ein Problem, über das dann die ACM-Hypertext Konferenz in Texas diskutiert wurde. Das Problem fasst Steven Newcomb so zusammen: „Zu dieser Zeit hatte die „Digital Equipement Corporation“, der Verlag O’Reilly and Associates, die „Open Software Foundation“ und andere ein Problem: Sie wollten alle O’Reillys "X-Window" Dokumentation gemeinsam mit ihren eigenen Usermanuals für Equipment und Systeme verwenden. Die Idee tauchte auf, dafür einen Masterindex zu schaffen, der alles beinhalten sollte. Sie wollten also alles miteinander kombinieren, sodass User nicht mehr in sechs verschiedenen Indizes nachsehen müssten, sondern nur mehr in einem einzigen, um das zu finden was sie suchen."16 Der Versuch der Davenport Group einen Master Index über Hardware, UnixBetriebssystem und den verfügbaren Programmen zu erstellen, scheiterte schließlich. Jedoch blieben Michel Biezunski und Steven Newcomb dran, an der Lösung des Problems. So begann die Geschichte des Topic Maps, das 1996 ein ISO-Projekt wurde. 1999 wurde Topic Maps der ISO-Standard mit der Nummer 13250 verliehen. Anfang des Jahres 2000 wurde von einem unabhängigen Konsortium TopicMaps.Org unter Vorsitz von Biezunski und Newcomb gegründet, mit dem Ziel, die Anwendbarkeit des Paradigmas auf das WWW zu entwickeln, um sein enormes Potential beim Auffinden und der Verwaltung von Information zu verbessern. Es hat also fast ein Jahrzehnt gedauert, bis die Systematik, die Stichwortverzeichnissen innewohnt, als Topic Map-Standard hervorging: Das Stichwort verbunden mit dem Vorkommen bildet das „TAO“ der Topic Map: 16 matrix.orf.at/bkframe/020616_1.html . Copyright © [email protected] 16 Semantic Web Techniken für E-Learning Bezeichner Analogie Beispiel Topic Stichwort, Begriff, Thema Prof. Müller, Mozart, Tisch Assoziation Verbindung, Beziehung „lehrt in“, „geboren in“, „isst“ Occurence Auftreten, Vorkommen Webseite, Artikel, Video Tabelle 1: Bedeutung des TAOs „Allgemein kann man sagen dass Topic Maps ein standardisiertes Modell und eine Architektur für die gezielte Navigation, Informationssuche und – Auffindung in großen Datenmengen darstellt, in dem sie ein semantisch strukturiertes Netzwerk innerhalb dieser Informationsmengen bilden“17. Trotz (oder vielleicht gerade aufgrund) der Trivialität dieses Modells ist es mit Topic Maps möglich, recht komplexe Strukturen abzubilden oder bestehende zu erweitern. Was sind aber die Entwurfsziele dieser Technologie? Was kann man mit dieser erreichen? 2.2 Die Entwurfsziele von XTM: XTM wurde entwickelt mit dem Ziel, die Anfragen durchzuführen, bei denen andere Techniken versagen. Eine solche Anfrage wäre zum Beispiel: „ Welche Opern wurden von deutschen Komponisten komponiert, die von Mozart beeinflusst waren?“. Die Struktur der Topic Maps sieht einfach aus, ist sie ja auch, aber es steckt ein gezieltes Prinzip dahinter. Nämlich, Topic Maps sind (ISO-Standard ISO/IEC 13250) eine den konkreten Dokumenten übergeordnete Struktur, die Verknüpfungen thematisch miteinander zusammenhängender Dokumente ermöglicht. Was für Topic Maps spricht, sei dass, sie die Strukturierung von großen Datenmengen vereinfachen. Damit ermöglichen sie eine Erleichterung der Suche und Navigation in großen Datenbeständen und vor allem und das ist sehr wichtig zu erwähnen, sie bieten eine dokumentenunabhängige Möglichkeit zur Strukturierung von Informationen (siehe Abbildungen 3 und 4). Sie werden daher von Hans Holger Rath und anderen Entwickler dieser Technik als das „GPS des Web“ bezeichnet. 17 Smolnik/TopicMapsKongress in Darmstadt. Copyright © [email protected] 17 Semantic Web Techniken für E-Learning BRD http://www.brd.de/ Abbildung 3: Topic BRD und seine Occurences (Bild, Dokumente, URL) In der ersten Schicht sind die Topics, in der zweiten und in der dritten Schicht sind dann ihre Vorkommnisse (Occurences). Copyright © [email protected] 18 Semantic Web Techniken für E-Learning Abbildung 4: Topic Map in 3D Darstellung [Quelle: le grand 18 WWW 2001] Hier werden einige Ziele von Topic Maps: 2.3 Einfache Anwendung von XTM im Internet Unterstützung zahlreicher Anwendungen durch XTM Kompatibilität von XTM mit XML, XLink und ISO 13250 Einfache Erstellung von Anwendungen, die XTM Dokumente verarbeiten Die Anzahl der optionalen Merkmale in XTM soll auf einem absoluten Minimum gehalten werden (im besten Fall keine) Gute Lesbarkeit und Verständlichkeit von XTM-Dokumenten Schnelle Erstellung des XTM-Designs Das XTM-Design soll formal und knapp sein XTM-Dokumente sollen einfach zu erstellen sein Der Umfang der XTM- Auszeichnung (markup) ist von geringerer Bedeutung. XML Topic Maps XML Topic Maps ist das Ergebnis der Portierung des auf HyTime und SGML beruhenden ISO-Standards nach XML. Im nächsten Abschnitt wird erklärt, warum man bei der Erstellung von Topic Maps auf XML und nicht auf HTML gesetzt hat. Aber davor, eine kurze Erläuterung, zu XML, danach kommt ein kleines Beispiel, um die Unterschiede HTML XML zu zeigen. 2.3.1 XML Diese erweiterte Markup-Sprache XML (eXtensible Markup Language) ist ein Dokumentenverarbeitungsstandard, der vom World-Wide-Web-Konsortium (W3C) vorgeschlagen wurde – demselben Gremium, das auch für die Überwachung des HTML-Standards verantwortlich ist. Als sie 1997 das Licht der Welt erblickte, hat man HTML wenig Überlebenszeit im Netz eingeräumt [HTML wird aber trotzdem überleben, denn Web-Seiten werden auf lange Sicht auch weiterhin in HTML entwickelt. Für eine private Homepage oder Informationsseiten mit Daten, die sich nicht ständig ändern und automatisiert angepasst werden müssen, ist es nicht unbedingt erforderlich, XML zu lernen oder gar zu benutzen]. Denn HTML war „begrenzt“; man hat ein bestimmtes Kontingent von Tags, das man benutzen kann, und mit dem man zu Recht 18 www.rp.lip6.fr/~blergrand/indexEng.html. Copyright © [email protected] 19 Semantic Web Techniken für E-Learning kommen muss. Das Manko bei HTML sind die strikten Vorgaben, die man folgen muss, und somit entfällt die Möglichkeit eigene Tags zu definieren. Dazu kommt noch, dass in HTML nichts über den Inhalt ausgedrückt wird. Man hat nur den Text und HTML verhilft einem, das so aussehen zu lassen, wie man es haben will. XML dagegen macht das möglich. Sie gibt einem die Möglichkeit seine eigenen Tags zu definieren, um so mehr aus seinen Informationen zu machen. Diese Tags werden meistens semantische Tags genannt, weil sie dadurch dem Inhalt eine Semantik geben. XML ist nicht nur sehr präsent in den Topic Maps (RDF und anderen Techniken ...), sondern ist das Lebenswerk dieser neuen Technologien, denn ohne sie wären diese Technologien gar nicht entstanden. Robert Eckstein formulierte XML, in seinem XML- Buch, so: „ XML ist eine Metasprache, die es erlaubt, eigene Dokumenten- Markups (auch Tags genannt) zu schaffen und ein Dokument damit zu formatieren“ 19. So wie HTML festgelegt und normiert ist und daher für den weltweiten Austausch und die Übertragung und Verwendung von Webpages zwischen vielen verschiedenen Web-Servern und Web-Browsern geeignet ist, so kann man mit XML eigene Datei-Strukturen für verschiedene Zwecke definieren und normieren, die dann ebenfalls von vielen Personen mit vielen verschiedenen Programmen und auf vielen verschiedenen Rechnern verwendet werden können. Mit der Hilfe von Style-Sheets können XMLDokumente ebenfalls, so wie HTML-Files, von Web-Browsern dargestellt und ausgedruckt werden. Wofür kann man nun solche mit XML definierten Markup-Sprachen, so genannte "XML-Applikationen", verwenden? Welchen Zweck kann es haben, mit XML solche Sprachen festzulegen und zu normieren? Welche Vorteile haben solche XML-Anwendungen gegenüber HTML oder anderen DateiFormaten, und wann stößt XML an ihre Grenzen? Mit XML kann man die logische Bedeutung von Daten, Informationen und Texten definieren - ähnlich wie die Tabellen- und Spalten-Bezeichnungen in Datenbanken und Tabellenkalkulationen. XML ermöglicht im Gegensatz zu HTML die Definition eigener oder zusätzlicher "Befehle" (Tags) - ähnlich wie bei der Definition von Macros in der Textverarbeitung. XML- Applikationen eignen sich als Plattform- und Software-unabhängiges Austausch-Format für Daten zwischen verschiedenen Programmen und Rechnern - ähnlich wie RTF für Texte, CVS für Tabellen, EDI für kommerzielle Anwendungen - aber in einem einheitlichen, allgemein verwendbaren, Hersteller-unabhängigen Format20. 19 Robert Eckstein. 20 Hubert Partl. Copyright © [email protected] 20 Semantic Web Techniken für E-Learning 2.3.2 Younous El Moustafid ( wo ist Name und Vorname? ) in HTML und XML Um die Unterschiede HTML XML besser verstehen zu können, gerade im Hinblick auf Web Semantic, betrachte man den folgenden HTML-Kode. <p> <em>Younous <b>EL Moustafid</b></em> <br> studiert in <br> <em> Kaiserslautern </em> <br> Geburtsmonat August </p> bewirkt eine Darstellung wie: Younous EL Moustafid studiert in Kaiserslautern Geburtsmonat August Hier wird höchstens El Moustafid fett angezeigt und zusammen mit Kaiserslautern und Younous hervorgehoben. Aber, dass es sich um einen (gerade als nicht europäischer Name, bei dem man sowieso nicht den Nachnamen vom Vornamen unterscheiden kann) geht oder Vornamen, kann man nur erahnen. Aber wie geht das denn bei XML? Wie kann man was hervorheben? Für die Modellierung in XML kann man Tags definieren, die die Bedeutung der Informationen angeben. Mit einer geeigneten DTD (Eine DTD beschreibt die Struktur einer Klasse von SGML oder XML- Dokumenten, also einer mit Hilfe eines Text-Files, das alle Syntax-Regeln in einem von SGML vorgeschriebenen Format enthält. Beispielsweise ist jede HTML- Version durch eine DTD definiert) kann die obige Information also in einem XMLDokument in der folgenden Form enthalten sein: <vorname> Younous </vorname> <nachname> El Moustafid </nachname> studiert in <ort> Kaiserslautern </ort> <geburtsmonat> August </geburtsmonat> Mit einem geeigneten Style-Sheet „XSL“ bewirkt das XML-Dokument genau dieselbe Darstellung wie das obige HTML-Dokument. Und da kann eine Suchmaschine El Moustafid die Bedeutung Nachname zuordnen. Das ist wichtig, wenn man die logische Bedeutung einer Information haben will um die Information verarbeiten zu können. Copyright © [email protected] 21 Semantic Web Techniken für E-Learning Als Beispiel nehme man die Suche innerhalb von Absätzen <p> in HTMLFiles der obigen Struktur nach dem Geburtsmonat August. Als Ergebnis kriegt man nicht nur die Personen geliefert, die im August geboren sind, sondern auch den Prinz mit dem Namen Prinz Von August sowie alle Personen, die in der Augusterstraße wohnen. Eine Suche nach dem Wort "August" innerhalb der in den XML- Files mit <Geburtsmonat> bezeichneten Elemente würde hingegen wirklich nur die Personen liefern, die in diesem Monat Geburtstag haben. Andere Feinheiten (oder Notwendigkeiten) bietet XML , wie zum Beispiel die Möglichkeit , die in den XML- Files beschriebenen Personen leicht nach den einzelnen Datenfeldern sortiert zu bekommen, also z.B. nach der Postleitzahl oder nach dem Geburtsjahr, oder das Durchschnittsalter berechnen oder andere Verarbeitungen der Daten vornehmen21. . Mit Hilfe von XML hat man jetzt den Begriffen Younous, El Moustafid und Kaiserslautern eine Bedeutung gegeben, wie kann man aber das gleiche mit dem Verhältnis zwischen El Moustafid und Kaiserslautern machen, nämlich der Relation „studiert in“ eine Semantik geben. „studiert in“ ist in XML nicht anderes als ein unstrukturierter Text ohne Bedeutung, dagegen ist Younous ein Vorname, El Moustafid ein Nachname und Kaiserslautern ein Ort. Das ganze kann man umgehen, in dem man ein neues Tag definiert (Aussage), das wiederum aus den Tags Student und Ort besteht. Und dies sieht dann so aus: <Aussage> <Student> Younous El Moustafid </Student> <Ort> Kaiserslautern </Ort> </Aussage> So hat man dann eine Aussage, von der man verstehen kann, dass „Younous EL Moustafid“ Student ist, und sein Ort Kaiserslautern ist. Anderes kann man das nicht formulieren. An dieser Stelle weiß XML nicht weiter, und genau hier zeichnet sich XTM aus und löst dieses Problem ganz geschickt, in dem sie „studiert in“ als Relation definiert (Stärken von TM) und als solche wird sie auch von den (XTM) Suchmaschinen verstanden. In diesem Ausblick hat man schon den Unterschied zwischen HTML und XML gesehen, und dabei gesehen, wie weit man mit XML gehen kann; man hat aber auch gesehen, dass XML gerade bei unstrukturierten Texten auch nicht mehr weiß, und dass trotz der Möglichkeit selbst eigene Tags definieren zu können, man manches nicht mit XML realisieren kann. Im nächsten Kapitel geht es um die Techniken der Topic Maps, ihre Grundlagen, ihre Vor- und Nachteile, gerade im Hinblick auf Relationen. 21 Hubert Partl. Copyright © [email protected] 22 Semantic Web Techniken für E-Learning 2.3.3 XTM Tutorial In diesem Tutorial werden Anhand von Beispielen die Schritte erläutert, die man durchgehen muss, um zu einer „TopicMap“ zu gelangen. Dabei werden die Tags ausführlich erklärt, die benutzt werden. Unter www.topicmaps.org sind aktuelle Tutorials verfügbar. In XTM wird man häufig diese drei Begriffe hören: Topics (Themen), Associations (Assoziationen) und Occurrences (Vorkommensangaben) [Abbildung 5]- das TAO des Standards. Sie sind die Bausteine einer Topic Map. Die Themen spiegeln die Konzepte, Ideen, Objekte, Dinge etc wider, über die die TopicMap etwas aussagen soll. Ein Thema trägt einen oder mehrere Namen. Vorkommensangaben verbinden die Themen mit Ressourcen (Dokumente, Bilder, Audio, Video und so weiter), die relevante Information zu dem Thema enthalten. Assoziationen schließlich beschreiben die semantischen Beziehungen zwischen Themen. Abbildung5: TAO (topics, Associations und Occurrences) Eine Assoziation ist nicht nur eine Verbindung zwischen zwei Themen. Sie kann beliebig viele Themen (Association Members, Mitspieler) in eine Beziehung stellen. Und welche Rolle die Themen in der Beziehung spielen, definieren Member Roles (Mitspielerrollen). Jedes assoziierte Thema spielt genau eine Rolle - die wiederum ist ebenfalls ein Thema. Das Rollenkonzept bestimmt, dass eine Assoziation keine Richtung besitzt. Die ausgedrückte Beziehung gilt dementsprechend für jedes der beteiligten Themen. Themen, Assoziationen und Vorkommensangaben lassen sich klassifizieren, das heißt, sie können Instanzen einer oder, im Fall von Themen, mehrerer Klassen sein. Das Besondere ist, dass die Klassen selbst Themen sind - die wiederum Instanzen anderer Klassen sein können. Topic Maps sind deshalb eines der wenigen Paradigmen mit Klassen, die gleichzeitig wieder Instanzen sein können. Ein mächtiges Modellierungsmittel mit Tücken. Man kann leicht durcheinander kommen. Ein gut vorbereitetes Design hilft (siehe Copyright © [email protected] 23 Semantic Web Techniken für E-Learning Abbildung11), die Übersicht zu behalten, deshalb am besten immer ein Schema vor den Augen halten, um die Topic Maps richtig zu implementieren. Hier wurde bewusst das Wort „implementieren“ benutzt, da XTM auch als Programmiersprache in Betracht gezogen werden kann. Als Beispiel nehme man das Ontopiatool Omnigator. Das Tool compiliert die XTMDatei bevor es sie darstellt, und gibt Fehlermeldungen aus, wenn ein Fehler aufgetreten ist. Abbildung6: Fehler beim „kompilieren“ einer XTM-Datei Um eine Topic Map darzustellen, soll man ihr erstmal einen Namen geben, am besten einen über den Inhalt der TopicMap aussagenden Namen, den man auch nach Jahren wieder erkennen kann, und muss mit dem Tag <topicMap> beginnen. Und wie bei XML, muss man natürlich die Tags auch beenden, das geschieht normalerweise mit dem verwendeten Tag, davor der Schrägstrich, in diesem Falle dann </topicMap>. 2.3.3.1 Beispiel1: Copyright © [email protected] 24 Semantic Web Techniken für E-Learning Das nächste Beispiel wird nach und nach mit Informationen gefüllt und die Tags nach und nach erklärt und hinzugefügt. Die Tags werden zuerst so erklärt, wie es in dem TAO der topicmaps.org steht, und dann auf deutsch zusammengefasst. <topicMap>: [is collection of topics and associations between them] Im TAO der www.topicmaps.org wird <topicMap> so erklärt 1. A collection of topics, associations, and scopes that may exist in one of two forms: 1. a serialized interchange format (e.g. as a topic map document expressed in XTM syntax), or 2. some application-internal form, as constrained by the XTM Processing Requirements defined in Annex F. 2. The document element (<topicMap>) of a topic map document expressed using XTM syntax. Hier aber erstmal ein Beispiel, das den Begriff Maus zeigt, mal als Tier und mal als Fachbegriff in der Computerwelt. Copyright © [email protected] 25 Semantic Web Techniken für E-Learning Abbildung7: Beispiel einer Topic Map22. „Käse“, „Maus“, „Speedy Gonzales“, „Tastatur“ sind alle Topics. „frisst“, „is a“, „erfindet“ etc... sind die Associations. Das Bild von „Douglas Engelbart“, „seine Biographie“ etc sind in diesem Falle Occurences. Hier kann man zwei Scopes (wird später erklärt) sehen, Tierwelt und Computer. Definition: Jede TopicMap beginnt mit dem Tag <topicMap>. Dadurch wird die Kennzeichnung einer Topic Map vorgenommen. Topic Map generell ist eine Ansammlung von TAO, nämlich Topics (Themen, oder wie Richard Wilhalm23 es in seinem Buch genannt hat: Ding), Assoziationen(oder Relationen) und Occurences (Vorkommnisse). Die Topics sind durch 22 www.hypermedia-texte.de. Copyright © [email protected] 26 Semantic Web Techniken für E-Learning Relationen oder Assoziationen liiert, und vorhanden in den verschiedenen Occurences. Diese Topics spielen alle in der Assoziation eine Rolle. Rolle: Das Tag <TopicMap> erlaubt man die Deklaration einer TopicMap. Der Name der TopicMap ist optional und kann deshalb auch leer bleiben . Syntax: Die Deklaration von <topicMap> geschieht normalerweise immer am Anfang jeder XTM-Datei. Und zwar genau nach der Deklaration der XMLVersion. Hier ein Beispiel der Deklaration der TopicMap: <topicMap id=“TomatenTopicMap“ xmlns=http://www.topicmaps.org/xtm/1.0 xmlns:xlink=http://www.w3.org/1999/xlink> ... Inhalt der TopicMap ... </topicMap> Nach <topicMap> kommt als erstes die Deklaration der verwendeten Topics. <topic>: Subjects“– anything worth describing (names, properties, documents ...) Was ist ein Topic? Antwort: alles24. Abbildung 8: Beispiel einiger Topics Definition: Die Topics sind sehr wichtig in einer TopicMap. Die sind die Hauptelemente einer TopicMap. Ein Topic ist ein elementares Subjekt im Kontext des modellierten Wissens, eine Entität. Es kann alles Beschreibbare 23, 24 Herausgeber des Buchs: Topic Maps SpringerVerlag 2002. Copyright © [email protected] 27 Semantic Web Techniken für E-Learning sein, eine Person, ein Ausspruch, ein Land, ein Gegenstand, ein Wort, eine Zahl, oder ganz einfach ein Ding. Rolle: Mit dem Tag <topic> (definiert) kreiert man ein Topic in einer TopicMap. Syntax: <topic id=“Tomaten”“> Hier kommt der Inhalt des Topics </topic> Tomaten http://www.tomaten.de/gesc.html Abbildung 9: TomatenTopic und seine Occurences <baseName> und <baseNameString>: A child element (<baseName>) of a <topic> element. A name characteristic of a topic that is provided by the content of a <baseNameString> element. Base names must be unique within a given scope Copyright © [email protected] 28 Semantic Web Techniken für E-Learning Definition: Mit baseName wird der Name des Topics deklariert. Das ist eine Zeichenkette, die mittels <baseNameString> als Name eines Topics spezifiziert wird. Dieser Name ist die Identifikation des Topics in der Außenwelt. Rolle: Mit baseString kriegt das Topic eine Bezeichnung, mit der es in der ganzen TopicMap identifiziert und angesprochen wird. Syntax: <topic id=“Tomaten“> <baseName> <baseNameString> Tomaten</baseNameString> </baseName> </topic> Mit der eindeutigen Nummer "id", die jedes Topic innerhalb der Topic Map kriegt, wird dieses Topic intern identifiziert, und angesprochen; Mit dem baseName wird dieses Topic für die externe Welt sichtbar und bekannt. <occurence> und <ressourceRef>: occurrence is a child element (<occurrence>) of a <topic> element. occurrence type One of the classes of topic occurrence. The class of topic occurrence specified by an <occurrence> element's <instanceOf> child element. An occurrence may belong to only one class. A topic whose subject is a class of topic occurrence. Definition: Mit topic-occurrence bezeichnet man den Ort, in dem sich die relevanten Ressourcen dieses Topics befinden. Beispiele für Ressourcen können Bücher, Artikel, Grafiken, Internetseiten oder Personen sein. Rolle: Mit dem Tag <occurence> leitet man den Informationssucher weiter, und zwar in der Seite in der das Dokument zu finden ist. Es können mehrere Occurences pro Topic eintreten. Sogar Videobänder, Bilder oder Personen können mögliche Occurences sein. In der nächsten Abbildung sieht man die Occurences des Topics Tomaten, das sind ein Bild, eine URL und einige Kochbücher mit Tomaten... Max Müller Copyright © [email protected] 29 Semantic Web Techniken für E-Learning Abbildung10: Occurences oder die reale Ausprägung der Topics Syntax: <topic id=”Tomaten”> <occurence> <resourceRef xlink:href=”Tomaten.gif”/> </occurence> </topic> Mittels eines <resourceRef> Elements referenziert man auf eine Ressource, die der Gegenstand ist. <subjectIdentify> und <subjectIndicatorRef> A subject indicator is a resource that is intended by the topic map author to provide a positive, unambiguous indication of the identity of a subject. When two topics use the same resource to indicate their subject, they are by definition “about” the same thing, and must therefore be merged during processing Mit <resourceRef> (das bereits oben benutzt wurde), topicRef-Element und das subjectIndicatorRef-Element kennzeichnet man Subjekt Indikatoren, die in XTM definiert sind, um die Identität eines Subjekts eindeutig zu beschreiben, bzw. die Identität eines Subjektes anzuzeigen. Zu den „Subject Indicators“ sagte Steve Pepper25: „Topic Maps orientieren sich nicht am Namen, sondern sozusagen an einer eigens definierten Identifikationsnummer, eben den subject Indicators. Diese entsprechen der Idee der Postleitzahlen oder Sozialversicherungsnummern“. Definition: Unter subjectIdentify kann man einen Personalausweis verstehen, der dieses Subjekt identifiziert, und von anderen Subjekten unterscheidet. Jedes Subjekt kann nur eine einzige Identifikation haben. Rolle: <subjectIdentify> hat als Rolle, das Topic eine genaue Bezeichnung zu geben, damit nicht nur der Mensch was darunter versteht, sondern auch eine Maschine. Um dies zu realisieren wird auf die Referenz <subjectIndicatorRef> verwiesen. In diesem Beispiel ist das eine Internetadresse (diese Seite ist erfunden und existiert nicht) der Firma Tomaten. Syntax: <topic id=”Tomaten”> <subjectIdentity> < subjectIndicatorRef xlink:href=”http://www.tomaten.de/tomaten.html”/> 25 Steve Pepper Copyright © [email protected] 30 Semantic Web Techniken für E-Learning </ subjectIdentity > </topic> <scope> und <topicRef> scope 1. The extent of the validity of a topic characteristic assignment. The context in which a name or an occurrence is assigned to a given topic, and the context in which topics are related through associations. 2. The set of topics specified via a <scope> element Ein Zitat von einem XTM-Entwickler Steve Pepper zu Scopes: „The purpose of scope, simply stated, is to allow the topic map author to express the limits within which such assertions (or characteristic assignments) have validity. “ SCOPE ermöglicht dem User also verschiedene Ansichten, Sichtweisen oder Weltanschauungen auszudrücken, welche von einem vorliegenden Kontext abhängen. Scope aus dem englischen übersetzt, hat viele Bedeutungen wie zum Beispiel: Abgrenzung, Handlungsspielraum, Zuständigkeitsbereich, Rahmen etc... In XTM wird nur der Begriff Gültigkeitsbereich benutzt, da jedes Topic (Themen, Assoziation oder Occurence) nur in einem bestimmten Bereich dann Gütigkeit hat. Definition: Scope oder Gültigkeitsbereich ist der Kontext, in dem dann diese Topics gelten und vorallen Dingen, die Relationen zwischen den Topics. Wichtiger noch sind die Vorkommnisse (Occurences), denn je nach Bedarf, Sicherheit, Gebrauch oder Sprache kann man seinen Topics verschiedenen Occurences zuweisen. Mit <baseName> gibt man dem Topic einen „Sinn“. Denn die Id ist nur für interne Zwecke gedacht. <baseName> ist für die externe Bezeichnung zuständig. Ein Student aus dem französischen Raum würde Schwierigkeiten haben, den Sinn eines Topicnamen „Frieden“ zu verstehen. So definiert man pro Scope einen <baseName>(Siehe unten) , in dem auch der Name verständlich ist, für die Leute , die in diesem Scope arbeiten oder passen. So anstatt „Frieden“, kann man das gleiche Topic mit dem Namen „Paix“ aber in einem anderen Scope (für französisch) definieren. Rolle: Mit dem Tag <scope> kann man den Kontext eingrenzen, innerhalb dem die Namen und Ressourcen als die Namen-, Ressourcen- und RelationsMerkmale des topics betrachtet werden können Syntax: Scopes helfen nicht nur um die Topics in anderen Sprachen zu definieren - dazu kommt noch ein Beispiel – sondern um Gültigkeitsbereiche klar zu defnieren: privat oder public, vertraulich oder nicht vertraulich, dick oder dünn, mit Vordiplom oder ohne...letzteres kann man bei Kursen im ELearning benutzen, man kann Vorlesungen nach Niveaus definieren, zum Beispiel ein Student im Grundstudium darf keinen Zugriff auf Vorlesungen des Hauptstudiums haben. Gerade bei begriffen wie Java, Paris, Kette oder wie in Copyright © [email protected] 31 Semantic Web Techniken für E-Learning der Abbildung 7 Maus, also generell Worte, die Mehrdeutigkeiten haben, ist es wichtiger ihre Gültigkeitsbereiche einzugrenzen. Ein Beispiel hierfür ist das Wort „Bank“. Das kann ein Geldinstitut sein, kann aber auch ein Holzstück sein, auf dem man sitzen kann. Um diese verschiedenen Gütigkeistbereiche des gleichen Begriffs dann auseinander zu halten, benutzt man eben diese Scopes. Die Scopes müssen aber auch deklariert bzw. definiert werden ( nicht vergessen: Alles ist ein Topic), un das geht wie folgt aus: <topic id=“Fr“> <subjectIdentity> <subjectIndificatorRef xlink:href=://www.topicmaps.org/xtm/1.0/language.xtm#fr“/> </ subjectIdentity > </topic> <topic id=“de“> <subjectIdentity> <subjectIndificatorRef xlink:href=://www.topicmaps.org/xtm/1.0/language.xtm#de“/> </ subjectIdentity > </topic> Hier werden dann die scopes definiert, die später benutzen werden. Mit xlink:href=://www.topicmaps.org/xtm/1.0/language.xtm#de verweist man auf die topicmaps.org Seite, in der dann die Sprachen eindeutig definiert sind. So und nun kommen wir zu den Topics einerseits auf Deutsch, und anderseits auf Französisch: <topic id=“Tomaten“> //Der Name des Topics <baseName> // jetzt kommt der Scope, in dem dieser Name gültig ist <scope> // Hier beginnt der Gültigkeitsbereich <topicRef xlink:href=“de“/> // Verweis auf das Topic „de“ </scope> // Ende des Scopes <baseNameString> Tomaten </baseNameString> // Hier ist nur Tomaten relevant </baseName> // Ende des BaseNamen <baseName> <scope> <topicRef xlink:href=“fr“/> </scope> <baseNameString> tomates </baseNameString> </baseName> </topic> Copyright © [email protected] // Ende des Topics Tomaten 32 Semantic Web Techniken für E-Learning So, es ist bis jetzt alles schön und gut, was bisher gemacht wurde; Aber bisher hat man die große Kunst (meiner Meinung nach) der XTM noch gar nicht erwähnt, nämlich diese Relationen oder Assoziationen zwischen den verschiedenen Topics. Zu jeder Relation gehören (wie bekannt ist) zwei Seiten. Diese Seiten sind in diesem Falle Topics (noch mal, alles was mit XTM zutun hat, ist ein Topic, sogar diese Relationen sind ja auch Topics, später mehr), die Mitglieder einer Relation sind, und dabei jeder eine Rolle spielt und übernimmt. <association> und <member>: Links between topics – they are nodes of a certain type – they link topics by assigning roles An association is a relationship between one or more topics, each of which plays a role as a member of that association. The roles a topic plays in associations are among the characteristics that can be assigned to it and are therefore governed by scope. Each individual association is an instance of a single class of association (also known as an association type) that may or may not be indicated explicitly. The default association type is defined by the “association” published subject. There is no directionality inherent in an association. (Associations describe relationships: If A is related to B, then B must also be related to A. The issue is rather, what is the type of the relationship, and what roles are played by its members. The question of how to label a relationship is one of naming, not direction.) <member> : A member is a set of topics that play a particular role in an association. Definition: Assoziation ist eine Relation, die zwischen mindestens Zwei Topics besteht. Sie wird auch durch ein Topic definiert, dessen Name sie in der XTM tragen wird. Rolle : <association> drückt den Zusammenhang zwischen verschiedenen Topics verständlich aus. Dabei kriegt jedes beteiligte Topic eine Rolle in dieser Relation. Syntax : Eine Assoziation tritt in Erscheinung, wenn man mindestens zwei Topics hat, die was miteinander zu tun haben. Also muss man erstmal ein zweites Topic deklarieren, das am besten zum Topic Tomaten passt. <topic id=“Salat“> <baseName> <baseNameString>der Salat </baseNameString> </baseName> </topic> So, jetzt hat man zwei Topics „DieTomaten“ und „Salat“, und die müssen mit einer Assoziation vereint werden, die jetzt (Einfachheitshalber) den Namen: „association_Tomaten_Salat“ kriegt. Mit Member wird betont, dass dieses Topic ein Mitglied dieser Relation ist. Copyright © [email protected] 33 Semantic Web Techniken für E-Learning <association id=“association_Tomaten_Salat“> // Deklaration der Association <member> // Deklaration des ersten Mitglieds <topicref xlink: href=”Tomaten”/> // Verweis aud das erste Topic </member> // Ende der ersten Mitgliedsdeklaration <member> // Deklaration des zweiten Mitglieds <topicref xlink: href=”Salat”/> // Verweis auf das Zweite Topic </member> // Ende der zweiten Mitgliedsdeklaration </association> // Ende der Asssociation Erwähnt wurden auch Rollen, die jedes Topic einer Relation auch spielt. Dies wird mit Hilfe des Tags <roleSpec> gemacht. TomatenSalat Assoziaton Tomaten Abbildung11: Salat Relation zwischen Tomaten und Salat <roleSpec>: The <roleSpec> element specifies the role played by a member in an association. Definition: Dieses Tag bestimmt die Rolle aller zu einer Relation gehörenden Topics. Natürlich kann das gleiche Topic mehrere Rollen in verschiedenen Associationen spielen, wie zum Beispiel: Schröder hat die Rolle Bundeskanzler in der Relation „regiert“, und Deutschland die Rolle „Land“. Also Schröder regiert Deustchland. Eine andere Rolle kann er auch spielen, z.B: MinisterPräsident des Bundeslandes Niedersachsen, also Schröder hat die Rolle: Ministerpräsident, Nidersachsen die Rolle: ein Bundesland, und die Relation koennte heissen: „Schroeder_Ministerpräsident _Niedersachsen“ . Rolle: Das Element <roleSpec> gibt die Art der Rolle an, die das Thema in einer relation oder Association einnimmt. Syntax : <association id=“association_Tomaten_Salat“> <member> <roleSpec> Copyright © [email protected] 34 Semantic Web Techniken für E-Learning <topicRef xlink : href=”Zutaten”> </roleSpec> <topicRef xlink : href = “Tomaten“> </member> <member> <roleSpec> <topicRef xlink : href=”Vorspeise”> </roleSpec> <topicRef xlink : href = “Salat“> </member> </association> Zutaten Tomaten Vorspeise TomatenSalat Assoziaton Salat Abbildung12: Rollen in der Assoziation Hier spielt der Salat die Rolle: Vorspeise, und das Topic Tomaten die Rolle: Zutaten. Zutaten und Vorspeise wurden schon benutzt, aber noch nicht deklariert, denn jedes benutzte „Ding“ muss (wie mehrfalls erwähnt) deklariert werden, das wird jetzt nachgeholt: <topic id=“Salat“> <baseName> <baseNameString>Salat </baseNameString> </baseName> </topic> <topic id=“Zutaten“> <baseName> <baseNameString> Zutaten </baseNameString> </baseName> </topic> Hier wurde ein kleines Beispiel erläutert, in dem ein Paar Tags erklärt wurden. Natürlich gehören mehrere Tags noch zu XML TopicMaps, von denen auch einige im nächsten Beispiel vorkommen werden. XTM basiert ja vor allem auf den Begriffen <instanceOf>, Oberklassen und Unterklassen. In dem zweiten Beispiel , werden dann die Begriffe Unterklassen, Oberklassen und Instanzen vorkommen und werden klargemacht, begleitet von einem Schema oder Design, das die Arbeit vereinfachen wird. 2.3.3.2 Beispiel 2 Copyright © [email protected] 35 Semantic Web Techniken für E-Learning In diesem Beispiel, werden nur die Tags ausführlich erklärt, die im ersten Beispiel nicht erwähnt worden sind, oder zu kurz gekommen sind. Hier geht es um eine Diplomarbeit. Zuerst deklariert man die Topics: Die Personen, die in diesem Projekt „Meine DA“ mitwirken, sind Younous (ich), der Betreuer Andreas Rippel und der Leiter der Arbeitsgruppe Prof. Dr. P. Müller. Prof. Müller ist Leiter der RHRK, lehrt Informatik an der UniversitätKaiserslautern. Andreas Rippel ist Assistent von Prof. Müller, betreut Praktikum, und diese D.A. Younous ist Student an der Uni Kaiserslautern, macht eine D.A. Die Topics “Younous”, ”Rippel” und ”Prof. Mueller” werden deklariert: <topic id="younous"> <instanceOf><topicRef xlink:href="# mitarbeiter "/> </instanceOf> <baseName> <baseNameString>Younous EL Moustafid</baseNameString> </baseName> <occurrence> <instanceOf> <topicRef xlink:href="#website"/> </instanceOf> <resourceRef xlink:href=”http://www.younous.de/ ”/> </occurence> </topic> <!-- weiterer Mitarbeiter --> <topic id="rippel "> <instanceOf><topicRef xlink:href="# mitarbeiter "/> </instanceOf> <baseName> <baseNameString>Andreas Rippel </baseNameString> </baseName> <occurrence> <instanceOf> <topicRef xlink:href="#website"/> </instanceOf> <resourceRef xlink:href=”http://www.icsy.de/personen/mitarbeiter/rippel”/> </occurence> </topic> <!-- weiterer Mitarbeiter --> Copyright © [email protected] 36 Semantic Web Techniken für E-Learning <topic id="mueller"> <instanceOf><topicRef xlink:href="# mitarbeiter "/> </instanceOf> <baseName> <baseNameString>Prof. Dr. Paul Mueller </baseNameString> </baseName> <occurrence> <instanceOf> <topicRef xlink:href="#website"/> </instanceOf> <resourceRef xlink:href=”http:// www.icsy.de/personen/leiter/”/> </occurence> <occurrence> <instanceOf> <topicRef xlink:href="#website"/> </instanceOf> <resourceRef xlink:href=”http:// www-agmueller.informatik.de/leiter/”/> </occurence> </topic> Bei Professor Müller sind zwei Occurrences vorhanden, um zu zeigen, dass es möglich ist, mehrere Occurences gleichzeitig zu haben. Diese Occurences können alles Mögliche sein, nicht nur URL. Es können die Mailadresse, ein Bild, ein Worddokument oder eine Telefonnummer sein. Hier hat man 3 Topics als Instanzen vom Topic Mitarbeiter deklariert, das noch gar nicht existiert. Das wird jetzt nachgeholt, die Reihenfolge der Topics ist unwichtig. Also jetzt wird Mitarbeiter als Oberklasse mit der Id „mitarbeiter“ deklariert: <topic id=”mitarbeiter”> <baseName> <baseNameString> Mitarbeiter der AG Mueller </baseNameString> </basename> </topic> …das gleiche mit dem Topic “Website” <topic id=”website”> <baseName> <baseNameString> die Webseite </baseNameString> </basename> </topic> Hier wird diese Diplomarbeit als Instanzen von Arbeit deklariert (die wiederum auch deklariert werden muss). <topic id=”DA”> Copyright © [email protected] 37 Semantic Web Techniken für E-Learning <instanceOf> <topicRef Xlink:href=“#arbeit“> </instanceOf> <baseName> <baseNameString> Diplomarbeit </baseNameString> </basename> </topic> <topic id=”arbeit”> <baseName> <baseNameString> Arbeit </baseNameString> </basename> </topic> <topic id=”uni-kl”> <baseName> <baseNameString> Universität Kaiserslautern </baseNameString> </basename> </topic> <topic id=”RHRK”> <baseName> <baseNameString> das Rechenzentrum </baseNameString> </basename> </topic> <topic id=”Praktikum”> <baseName> <baseNameString> Praktikum </baseNameString> </basename> </topic> Es wurden also folgende Topics deklariert: Younous, Mueller, Rippel als Instanzen von Mitarbeiter Uni-kl, RHRK, Praktikum und Arbeit. Diplomarbeit als Instanz von Arbeit. Jetzt werden die Assoziationen deklariert, um die Zusammenhänge zwischen den Verschiedenen Topics klarzustellen. <association id=“sucht“> <member> <topicRef xlink : href = “#younous“> </member> <member> <topicRef xlink : href = “arbeit“> </member> </association> Copyright © [email protected] 38 Semantic Web Techniken für E-Learning <association id=“betreut“> <member> <topicRef xlink : href = “#rippel “> </member> <member> <topicRef xlink : href = “#DA“> </member> </association> <association id=“leitet“> <member> <topicRef xlink : href = “#mueller “> </member> <member> <topicRef xlink : href = “#rhrk“> </member> </association> um das zu verkürzen, wird nur auf diese Relationen, und Topics beschränkt. Ein ausführlicheres Beispiel unserer elektronischen Universität ist am Schluss der Ausarbeitung zu finden. In Komplexeren Wissensnetzen bilden Themen-Klassen eine Hierarchie (Taxonomie). Sie lassen sich nicht mit der Klasse-Instanz-Realtion erstellen. Hierzu ein Beispiel, anlehnend an dieser Stelle am Beispiel von Holger Rath26, nämlich: Younous ist eine Instanz der Klasse Mensch, Mensch ist eine Instanz der Klasse Spezies, Mensch ist eine Unterklasse der Klasse Säugetier, Für Younous gilt: er ist eine Instanz der Klasse Säugetier, aber er ist keine Instanz der Klasse Spezies. Somit sieht man, dass die Oberklasse-Unterklasse-Relation transitiv ist, die Klasse-Instanz-Relation hingegen nicht. Das schon benutzte Topic „Person“... <topic id=”person”> <baseName> <baseNameString> Personen </baseNameString> </basename> </topic> 26 Holger Rath ist Mitglied des ISO-Gremiums. Copyright © [email protected] 39 Semantic Web Techniken für E-Learning Und Jetzt wird die Oberklasse-Unterklasse-Relation deklariert <association id=“personSuperklasseVonMitarbeiter“> <instanceOf> <subjectIndicatorRef xlink:href= "http://www.topicmaps.org/xtm/1.0/core.xtm#superclasssubclass"/> </instanceOf> <member> <roleSpec> <subjectIndicatorRef xlink:href= "http://www.topicmaps.org/xtm/1.0/core.xtm#superclass"/> </roleSpec> <topicRef xlink:href="#person"/> </member> <member> <roleSpec> <subjectIndicatorRef xlink:href= "http://www.topicmaps.org/xtm/1.0/core.xtm#subclass"/> </roleSpec> <topicRef xlink:href="#mitarbeiter"/> </member> </association> „Person“ ist die Superklasse von „Mitarbeiter“. Und umgekehrt ist „Mitarbeiter“ eine Subklasse von „Person“. Dies wird durch die Assoziation „personSuperklasseVonMitarbeiter“. Während HyTime völlig offen lässt, wie eine solche Relation in einer Topic Map angegeben werden kann, definiert XTM drei PSIs für die AssoziationsKlasse Superclass - Subclass und deren Rollen Ober- und Unterklasse, die später benutzt werden. Copyright © [email protected] 40 Semantic Web Techniken für E-Learning Personen ist Unterklass e von Arbeit sucht Mitarbeiter www.ag-müller.informatik.uni-kl.de www.ElMoustafid.de ElMoustafid Rippel Prof.Müller assistiert studiert uni-kl macht lehrt Informatik betreut Diplom Arbeit Praktikum leitet uni-kl www.icsy.de/ Personen/ Leiter RHRK www.icsy.de/personen/mitarbeiter/ rippel Abbildung 13: Topics, Occurences und Relationen In der Assoziation „personSuperklasseVonMitarbeiter“ wird <subjectIndicatorRef> benutzt, das ist ein sehr wichtiges und nützliches Tag in XTM. Das ist ein Link zu einer beliebigen digitalen Ressource, die ein Element eindeutig definiert. Mit Hilfe dieser Published Subject Indicators (PSIs) wird auf die Topics anderer Topic Maps verwiesen, wenn diesen dieselbe Idee (Subject) innewohnt. So könnte ein Topic Map-Prozessor die „Bedeutung“ eines speziellen Topics nachverfolgen und Topics aus externer Quelle, z. B. beim Zusammenführen (merging) mehrerer Topic Maps, als ein Topic ansehen, dem die gleiche Idee innewohnt zum Beispiel PSI für Sprachen oder Länder ( siehe erstes Beispiel). Künftig will OASIS(Organisation for the Advencement of Structured Information Standard) die Registrierung und Definition der PSIs übernehmen. Apropos merging: Man kann auch verschiedene Topic Maps verschmelzen lassen, wenn sie vom gleichen Thema reden. Angenommen, man hätte ein Thema komplett entwickelt, und gleichzeitig hätte jemand anderes das gleiche an der Universität Paris in Frankreich gemacht, die ja mit der Universität Kaiserslautern kooperiert. So, wie kann man dann aus zwei eins machen, oder wie kann man beide miteinander verschmelzen lassen? Was passiert mit den Charakteristika der Themen beim Zusammenführen? Themen werden zusammengeführt, wenn sie das gleiche Subjekt repräsentieren. Die Namensgleichheit der Themen ist kein ausreichendes Kriterium für die Identität der repräsentierten Subjekte (siehe nur das Beispiel: Bank als Geldinstitut oder Bank als Sitzmöglichkeit; Java als Copyright © [email protected] 41 Semantic Web Techniken für E-Learning Programmiersprache oder Java als Kaffee). Themen, die das gleiche Subjekt meinen, können in den Topic Maps wiederum unterschiedliche Namen haben. Erste Regel ist: besitzen zwei Themen den gleichen Namen im gleichen Scope, dann können sie zusammengeführt werden. Die zweite Regel ist: Wenn Themen auf ein Subjekt mit gleichen SubjektIndikator verweisen, werden sie ebenfalls gemergt. Das ist auch einer der Hauptgründe, warum man Subjekt-Identitäten definiert hat. Mischen findet auch beim Importieren einer XTM- Datei in eine Software beziehungsweise beim interaktiven Anlegen neuer Themen statt. Nicht vergessen, dass beim Mischen die Vereinigungsmengen der Charakteristiken zu bilden sind. Für Namen und Vorkommensangaben ist das einfach. In Assoziationen spielt das `neue', zusammengeführte Thema die Rollen der Ausgangsthemen. Duplikate werden entfernt. Der Mischprozess ist so lange durchzuführen, bis keine Themen mehr zusammengeführt werden müssen. Das ist soweit sehr wichtig, da man das auf Grund der Größe der Topic Maps das kaum mit der Hand machen kann27. 2.3.3.3 Linear Topic Map LTM Linear Topic Map Notation ist eine abkürzende Schreibweise für Topic Maps. Wurde von der Firma Ontopia entwickelt und wird noch nicht von vielen Tools unterstützt. Sie stellt zur Verfügung die Topic Maps im Textformat und nicht mehr im XMLFormat. Dadurch soll das ganze kompakter und einfacher werden28. Steve Pepper hatte die Idee, eine lineare Notation für Topic Maps analog zu der der konzeptionellen Graphen zu entwickeln. Diese Notation kann in jedem Editor geschrieben und gelesen werden, und wird von manchen (nicht von allen) TopicMapsTools unterstützt. Man könnte dieses Format auch mit den entsprechenden Tools wie dem Omnigator in XML Format konvertieren und sich das dann ganz normal mit den verschiedenen Tools als XTM angucken. Unter der folgenden Webseite kann man sich diese Notation ausführlich anschauen http://www.ontopia.net/download/ltm.html#N60. Hier wird ein Beispiel diese spezielle Notation ans Licht bringen. Es werden ein Paar Topics deklariert sowohl im XTMFormat als auch im LTMFormat um die Unterschiede sichtbar zu machen. Younous EL Moustafid ist Student. Also muss erstmal das (ober)topic Student deklariert werden. 27 Holger Rath. 28 http://www.ontopia.net/download/ltm.html#N60 Copyright © [email protected] 42 Semantic Web Techniken für E-Learning Mit [student] hat man eigentlich das schon realisiert. Es ist sogar möglich darauf zu verzichten und der LTMProzessor das für den Autor automatisch machen zu lassen, das geht so: [Younous: student = “Younous EL Moustafid“]. Das hat die gleiche Wirkung wie unter XTM folgendes: <topic id=”student”> <baseName> <baseNameString> Student </baseNameString> </basename> </topic> <topic id=”younous”> <instanceOf> <topicRef Xlink:href=“#student“> </instanceOf> <baseName> <baseNameString> Younous EL Moustafid </baseNameString> </basename> </topic> Hier sieht man schon den Riesenarbeitsaufwand den man mehr aufbringen will, wenn man das in XTM Format schreiben will, das war ein sehr kleines Beispiel. Das heißt, dass bei großen Daten in der Zukunft LTM eine große Rolle spielen wird, vor allem wenn die Toolshersteller mitziehen und diese in ihrer Entwicklung mit berücksichtigen. Copyright © [email protected] 43 Semantic Web Techniken für E-Learning 2.3.4 HTML und XTM Graphische Veranschaulischung der Topic Maps der AG. Prof. Müller und der Verweise auf die Informationsquellen AG.Prof.Mueller Betreut h sic igt t f hä sc mit Be Bie tet Und auc hm it Netzwerke Praktikum zur Bildkompression Fritz-Walter-Stiftung Ins ta vo nce n - nceInsta n vo für Zus tän dig für dig tän Zus VorlesungAlsWebDatei Zuständig für Zus tän dig für Zus tänd ig fü r TCP-IP r ig fü tänd Zus ATM Alles rund ums Internet AllgemeinesZurAG.doc A. Rippel 555-3333 M. Hillenbrand B.Reuther 555-3333 Abbildung 14: AG.Prof.Müller als TopicMap Das Bild zeigt ein “Gesamtbild” mit Hilfe von Topic Maps über die Arbeitsgruppe von Prof. P. Müller an der Universität Kaiserslautern. Die Arbeitsgruppe wird als <TopicMap> dargestellt und zeigt folgendes: „Netzwerke“, „Fritz-Walter-Stiftung“, „Praktikum zur Bildkompression“ und „alles rund ums Internet“ sind Topics. Die Assoziationen sind zwischen den verschiedenen Topics zu sehen, Beispiel „beschäftigt sich mit“, „betreut“ und „zuständig für“ etc... Die Occurences sind die Blätter dieser Zeichnung, zum Beispiel „AllgemeinesZurAG.doc“, „B.Reuther 555-3333“ etc... Der folgende Code ist ein Ansatz, wie man das machen kann. <topic id=“AG.Prof.Mueller”> <baseName> <baseNameString> Die Arbeitsgruppe vom Professor Mueller </baseNameString> </baseName> Copyright © [email protected] 44 Semantic Web Techniken für E-Learning <occurrence> <resourceRef xlink:href=“http://www.icsy.de/AllgemeinesZurAG.doc”/> </occurrence> <occurrence> <resourceData> B. Reuther, Tel. 555-3333 </resourceData> </occurrence> </topic> Wie man das ausführlich realisieren kann, soll man im Unterkapitel 2.3.3 nachschauen. Folgendes Bild zeigt, eine mögliche Realisierung in HTML. Abbildung 15: AG.Prof.Müller in HTML In der Abbildung 14 kann man schon die ganze Struktur der Arbeitsgruppe sehen, in der Abbildung 15 muss man sich durch die Topics durchklicken. Copyright © [email protected] 45 Semantic Web Techniken für E-Learning 3 Die TopicMaps-Tools und Abfragesprachen Eine Teilaufgabe dieser Diplomarbeit bestand darin, die Topic-Maps Tools, die auf dem Markt sind, durchzuchecken, denn davon gibt es mittlerweile eine Menge sowohl kostenlose als auch kommerzielle. Es gibt eine Reihe von kommerziellen TopicMapsTools, die viel versprechen. Man muss diese (logischerweise) allerdings kaufen, um mit denen arbeiten zu können. Es wurde bei einigen Firmen wegen Testversionen angefragt, leider waren viele in dieser Hinsicht trotz intensiven Bemühungen wenig kooperativ, und so blieben diese Anfragen meistens ohne Erfolg. Es besteht aber die Möglichkeit, sich ein Bild von diesen Tools zu machen, mit Hilfe deren Onlineversionen. Hier eine Reihe von Topic Maps Tools: Kommerzielle Topic Maps Tools: o o o o o o o o www.ontopia.net www.usu.de www.i-views.de www.mondeca.com www.oasis-open.org/cover/ontopiaNavigator20001117.html www.empolis.de www.wideman-one.com/gv/xm/index.html www.agi-imc.de freie Topic Maps Tools: o o o o o o www.topicmap-designer.com www.semantext.com www.techquila.com nexist.sourceforge.net/ www.goose-works.org protege.stanford.edu/ Von diesen Tools werden Ontopia, USU, i-views, TopicMaps-Designer und Semantext betrachtet: 3.1 Die kommerziellen Tools: 3.1.1 Ontopia Ontopia ist eine in Oslo beheimatete Firma, die sich auf Topic Maps spezialisiert hat. Sie befasst sich mit der Entwicklung, der Auswertung und der Forschung von Topic Maps. Sie ist die erste Firma, die den Schritt Richtung Vermarktung dieser Technik gegangen ist, da sie davon überzeugt war. Das ist soweit verständlich, wenn man weiß, dass der Gründer der Firma Copyright © [email protected] 46 Semantic Web Techniken für E-Learning Ontopia Steve Pepper29 ist. Diese Firma verwirklicht die SoftwareAnwendungen auf der Basis von Topic Maps. Lösungen für Portale, Erstellung von Content Management Systemen oder Intranet Applikationen. Topic Map Engine und Web Navigator finden sich im Portfolio der Firma. Topic Maps können auch unterschiedliche Softwareprogramme dazu bewegen, gemeinsam auf einer anderen Ebene zusammen zu arbeiten. Sozusagen auf neutralem Gebiete miteinander zu kommunizieren. Abbildung 16: „Overview of Ontopia Knowledge Suite“ Der Ontopia Knowledge Suite besteht aus30’31: 29 www.ontopia.net 30 Smolnik, TopicMaps- Kongress Darmstadt 10/04/03 31 http://www.ontopia.net/solutions/products.html Copyright © [email protected] 47 Semantic Web Techniken für E-Learning Web Editor Framework -> zur Entwicklung von Webapplikationen zur kollaborativen Pflege von Topic Maps. Ful-text Search Integration –> Indexierung und Suche von Text. Topic Map Query Engine -> „tolog“(proprietär; Migration auf TMQL geplant. Ontopia Navigator Framework o XML-basierte Skriptsprache zur Topic-MapApplikationsentwicklung (J2EE-Konform). o Tag-Bibliotheken o Plug-ins (Statistik-Ausgabe, Merging, Export, Validating, Query) Ontopia kann man recht einfach downloaden und installieren. Nach der Registrierung bei Ontopia32 erhält man eine E-Mail mit dem Link, von dem man den Omnigator runterladen kann. Die Installationsvoraussetzung ist eine Java2 Plattform und ein J2EE konformer Webserver (Jakarta-Tomcat v4.0.4). Der Omnigator ist ein frei verfügbarer Topic Map Browser, der auch Bestandteil des von Ontopia angebotenen Knowledge Suite Paketes, bestehend aus Ontopia Topic Map Engine, Ontopia Navigator Framework, Full-Text Search Integration und Topic Map Query Engine. Abbildung 17: Welcome to the Omnigator Die Topic Maps sind in zwei Variationen oben links zu sehen, im Hytime Format und im XTM-Format. Zum Verstehen der Topic Map Konzepte, bietet der Omnigator schon auf der Startseite einige Topic Maps, die man laden kann, um das Prinzip zu verstehen. Man kann auch seine eigenen Topic Maps ins Verzeichnis laden, in dem sich auch die anderen Topic Maps befinden, um sich diese anzusehen. Das Verzeichnis ist: „/jakarta-tomcat/webapps/omnigator/WEB32 www.ontopia.net/download/freedownload.html Copyright © [email protected] 48 Semantic Web Techniken für E-Learning INF/topicmaps“. Omnigator stellt dann die vorgeladene Topic Map als einfache Hyperlinkstruktur, in der man mit Mausklicken recht weit und erfolgreich kommen kann. Um dieses Tool verstehen zu können, wird eine Topic Map Jill.xtm geladen und einige Suchen durchgeführt. .xtm ist die Endung aller Topic Maps des XTM-Standards; .hytime ist die Endung der Topic Maps des Vorgängers des ISO-13250. Omnigator unterstützt auch LTM (linear Topic Map), ein Format, das neu ist, und ist dabei sich durchzusetzen(siehe Beispiel 2.3.3.3 Linear Topic Map). Abbildung 18: Jill’s First TM Wenn man die Topic Map Jill’s First TM lädt, sieht man unter Subject alle definierten Topics, darunter die Relationen, die Rollen und die Ressourcen. Wenn man jetzt auf employment klickt, erscheinen dann alle Topics, die mit employement zu tun haben. Jill Hacker als Mitarbeiter und Ontopia als Arbeitgeber. Copyright © [email protected] 49 Semantic Web Techniken für E-Learning Abbildung 19: employement-Portal Unter der Rubrik Names stehen weitere Topics; wichtig hier sind die Scopes, die die verschiedenen Gültigkeitsbereiche der Topics eingrenzen. Welches Ergebnis man erhält, wenn man den employe Jill Hacker auswählt, ist im folgenden Bilde zu sehen. Diese Seite charakterisiert das Topic Jill Hacker, sie ist sozusagen das Portal für diesen Mitarbeiter. Copyright © [email protected] 50 Semantic Web Techniken für E-Learning Abbildung 20: Jill Hacker-Portal Der Mitarbeiter Jill Hacker besitzt die Assoziation „employed by“ in Zusammenhang mit dem Topic „Ontopia“. Wenn man sich dann für Ontopia interessiert kann man auf Ontopia gehen, und sich weitere Informationen zum Unternehmen holen. Abbildung 21 : Ontopia vom Type Company Ontopia ist vom Typ Company, das heißt sie ist eine Instanz von einem anderen Topic namens Company, hat eine Relation mit dem Topic „Jill Hacker“ .Auf der rechten Seite sieht man die external Resources, in diesem Copyright © [email protected] 51 Semantic Web Techniken für E-Learning Falle eine Webseite, die wiederum ein Topic ist. www.ontopia.net ist die Occurence, also die reale Ausprägung, des Topics Ontopia. Der Omnigator holt alles raus, was in einer TopicMap stecken kann, und stellt sie in Listen dar. Die Darstellung der Inhalte dieser Topicmaps und Zusammenhänge erfolgt bei Ontopia rein auf Textbasis. Man kann von einem Topic zum nächsten navigieren, eine graphische Sicht oder Repräsentation der Topics oder Assoziationen wird aber nicht angeboten. Durch diese textuelle Hyperlinkung kann man alle Topics der Topicmap problemlos erreichen. Das Problem ist, dass man vorher wissen muss, wo sich dieses Topic befindet. Eine Visualisierung, die einen schnellen und einfachen Überblick über die gesamte Topic Maps ist nicht vorhanden, was ein Nachteil für dieses Tool mit sich bringt. Das Tool bietet auch folgende Funktionalitäten: Scopes, die Topic Map in verschiedenen Gültigkeitsbereichen teilt, was zu einer effektiven und schnellen Suche führt. Merging von verschiedenen Topic Maps. Indexierung der Topic Map, die man per Hand explizit machen muss, um in der Topic Map suchen zu können (das sollte man eigentlich automatisieren, denn das wird meistens übersehen, was das Können des Tools erheblich beschränkt). Einige Buttons in der Omnigatorleiste, bieten zusätzliche Funktionen, wie zum Beispiel: o Customising: Anpassung der Userinterface o Manage: Managen der Topic Maps o Full-Text Indexierung: zur Indexierung der Topic Map Suchanfragen mit Hilfe der eigenen Sprache TOLOG Mischen oder zusammenfassen von Topic Maps 3.1.2 USU USU hat ein Engine mit dem Namen USU KnowledgeMiners entwickelt, das dem ISO Standard 13250 entspricht und Topic Maps basiert ist. Dieses Tool ist in Java programmiert und benötigt nur einen gängigen Browser auf der User-Seite. Es verfügt über ein XML-API. Es ist in der Lage, Dokumente zu analysieren, die Inhalte zu qualifizieren und in einer linguistischen Datenbank abzuspeichern. Copyright © [email protected] 52 Semantic Web Techniken für E-Learning Abbildung 22: KnowledgeMiner von USU Die technische Umsetzung des KnowledgeMiners erfolgt über Apache als Webserver, Tomcat als Servlet-Engine und einem relationalen Datenbankmanagementsystem (RDBMS) 33. Es ist dem Benutzer möglich, durch verschiedene Suchansätze ein Thema zu finden und weitere Informationen abzufragen. Der Benutzer kann sogar sich von einem Begriff zum nächsten bewegen. 33 www.usu.de Copyright © [email protected] 53 Semantic Web Techniken für E-Learning Abbildung 23: Graphische Darstellung Einige Vorteile dieses Tools sind34: Die Möglichkeit der Suche in unstrukturierten und strukturierten Daten. Visualisierung der Begriffsstruktur Semantische Suche in heterogenen Datenquellen durch den Einsatz von Topic Maps Suchen in Metadaten von Datenquellen durch den Einsatz von Topic Maps Kategorisierung von Dokumenten Konfigurierbarer Filter Graphische Darstellung des Wissens, mit Kanten für Beziehungen und Knoten für die Topics, so erhält der Anwender einen schnellen Themenüberblick und dadurch eine gute Suchmöglichkeit (was man ja auch von Topic Maps erwartet). Der USU KnowledgeMiner nutzt den Vorteil der Trennung der Struktur von den ursprünglichen Dokumenten, was dazu führt, dass die Nutzung und vor allem die Pflege der Struktur unabhängig von den Dokumenten ermöglichen. 3.1.3 Intelligent Views Intelligent Views (i-views) ist 1997 aus dem Forschungszentrum Informationstechnik, GMS-PSI, jetzt FhG-IPSI, hervorgegangen. Sie beschäftigt sich mit dem Thema Wissensnetz. Unter der URL http://www.iviews.de/web/online_direkt.htm kann man die Onlineversion testen. Wissensnetz wie Topic Maps verknüpft Daten zu einem sinnvollen Ganzen. Aus einzelnen Informationen wird zusammenhängendes Wissen. Dabei bildet das Wissensnetz eine eigene Schicht die Informationen, aus der man gezielt und schnell auf seine Informationsobjekte zugreifen kann35. Die Produkte von Intelligent Views lassen sich in drei Kategorien einordnen36: Usage-Tools (Gebrauch und Auswertung) 34 TopicMapsKongress April2003 Vortrag von Smolnik 35 TopicMapsKongress April2003 Vortrag von Smolnik 36 http://www.i-views.de/web/pdfs/Whitepaper-K-Infinity.pdf Copyright © [email protected] 54 Semantic Web Techniken für E-Learning o Net-Navigator o Layout-Engine Editing-Tools (Entwurf und Erstellung) o Knowledge-Builder o Knowledge-Accelerator Server-Tools (Integration in bestehende Umgebungen) o K-Infinity Server o Semantic-Matcher o Volltext-Search-Engine Ein Vorteil dieser Software liegt auf der graphischen Darstellung und der semantischen Suche von Inhalten und Zusammenhängen. Außerdem gibt es Werkzeuge, die es ermöglichen, Dokumente auszuwerten und Begriffen zuzuordnen. Eine Suche nach dem Begriff „Obst“ würde folgendes Ergebnis liefern: Copyright © [email protected] 55 Semantic Web Techniken für E-Learning Abbildung 24: Liste von Ergebnissen Der i-Views-Net-Navigator liefert folgendes graphisches Bild aus: Copyright © [email protected] 56 Semantic Web Techniken für E-Learning Abbildung 25: Graphische Darstellung eines Topics Die graphische Oberfläche verhilft dem Benutzern ein grobes Bild über die verschiedenen Topics zu werfen. Wenn man dann auf ein Topic klickt, wird es dann in die Mitte gerückt, und die mit ihm verwandten Topics werden darum abgebildet. 3.2 Freie TopicMapsTools: Unter den vielen freien TopicMapsTools, die im Netz sind, werden hier Semantext, TopicMaps-Designer betrachtet: 3.2.1 TopicMaps-designer: Topic Map Designer ist ein „Tool“, das aus einer Diplomarbeit an der Universität Dresden im Jahre 2001 entstanden ist. Das Programm kann man aus der Seite http://www.topicmap-design.com/en/topicmap-designer.htm runterladen und problemlos installieren. Zur Installation dieses Tools soll man die Zip-Dateien TMDesignGER.zip und TMDcoreGER.zip runterladen, entpacken und setup.exe starten. Das Programm kann XML-Dateien laden und darstellen (ausdrücklich XML Dateien, da das Programm leider XTM-Files nicht öffnen kann). Nach dem Öffnen der Datei werden alle Assoziationen und Topics aufgelistet (siehe Abbildung TopicMapDesigner). Das Laden der Datei funktioniert mit Datei>öffnen->eine XML-Datei auswählen. Copyright © [email protected] 57 Semantic Web Techniken für E-Learning Abbildung 26: TopicMapDesigner Wenn man ein Topic auswählt, als Beispiel Olivia (siehe Abbildung), sieht man auf der rechten Seite den Typ: female bzw. person. Weitere Topicnamen werden (wenn vorhanden) auch angezeigt unter Sortname und Displayname. Die letzteren Begriffe waren Elemente von Hytime zur Anzeige und zum Sortieren von Namen. Die wurden in XTM durch das allgemeinere Element <variantName>. Unter Association sieht man „die Association“, in der das Topic Mitglied ist; in diesem Beispiel ist „Olivia“ vom Type „child“. Also „Olivia“ ist eine Instanz von „child“. Natürlich bietet das Tool auch die Möglichkeit neue Topics, Assoziationen einzufügen bzw. die vorhandenen upzudaten. Unter der Rubrik „Viewer“ kann man seine XML-Datei dann als einen Baum sehen, hin und her navigieren, und die Topics werden mit ihren Relationen dann gezeigt (siehe nächste Abbildung). Copyright © [email protected] 58 Semantic Web Techniken für E-Learning Abbildung 27: TopicMapDesigner-Viewer Allgemein bietet das Tool einen Überblick in dieser Technologie, und vor allem ein Beispiel der (veralteten) Hytime Technologie. 3.2.2 Semantext Semantext ist eine Prototypeanwendung, die von Eric Freese speziell dafür entwickelt wurde, um zu zeigen, wie der ISO13250 TMStandard benutzt werden kann, um semantischen Netze darzustellen. Das Installieren dieses Tools ist überhaupt nicht selbstverständlich. Zur Installation braucht man folgendes: semantext.zip (das man aus der Seite: www.semantext.com/semantext.zip) downloaden kann Zuletzt veröffentlicht (April 1999). Python 1.5.2 wxPython 2.3.0 (Normal wxPython) Copyright © [email protected] 59 Semantic Web Techniken für E-Learning PyXML 0.6.6 Die letzten drei Komponenten kann man bei www.python.org runterladen. Bei PyXML 0.6.6 muss man genau (und lange) suchen, da man mittlerweile bei der 0.8.2 Version ist. Das Problem des Semantext ist, dass es nur mit diesen Komponenten läuft, mit den neuen war dies nicht möglich. Folgende Dateien sind dann auszuführen: Die XML Dateien Family und music sind als Beispiel Dateien dabei. Es wird wie beim TopicMapDesigner mit der Datei Family.xml experimentiert. Die Datei kann man dann als Topic Map laden, mit File->import TopicMap öffnet man die Datei und kann sie sich im Viewer als HTML-Format oder Button-Format. Copyright © [email protected] 60 Semantic Web Techniken für E-Learning Abbildung 28: Olivia’s Portal Das Topic mit der (internen) ID Olivia ist eine Instanz von den verschiedenen Topics: Female, Person, Sibling und Cousin. Es steht in Relationen mit anderen Topics. Mit Hilfe dieses Tools kann man auch das File editieren, nämlich topics, Assoziationen hinzufügen, löschen oder updaten. Copyright © [email protected] 61 Semantic Web Techniken für E-Learning Abbildung 29: Funktionen des Semantext Semantext bietet eine wichtige Funktion, nämlich die Umwandlung des Files in ein XTM-File. Dies wurde ausprobiert und erfolgreich durchgeführt wie die nächste Abbildung zeigt. Copyright © [email protected] 62 Semantic Web Techniken für E-Learning Abbildung 30: Olivia’s Portal (Omnigator screenshot) Der Vergleich beider Scrennshots zeigt keinen Unterschied in der Funktionalität beider Tools. Bei Olivia werden bei beiden Tools, die Superklassen gezeigt, die Relationen mit anderen Topics. In dieser Hinsicht sind beide Tools gleich gut. Bei Semantext fehlt das BackButton, was die Arbeit etwas umständlicher macht. Für Datenbanken ist das nicht geeignet, da es nur für XML-Files geschaffen worden ist. Es hängt sich, wenn man versucht damit ein XTM-File zu öffnen, obwohl es die Umwandlung zu diesem Format ohne Probleme vollzieht. Bei Semantext können Regeln definiert werden und auf die Wissensbasis angewendet werden, um neues Wissen auf Basis der Relationen zwischen Topics zu generieren. 3.3 Fazit: Ontopia nutzt als eine der wenigen Firmen die Topicmap- Spezifikation (die ISO13250 standardisierte Hytime, und die XTM 1.0) als Datenquelle konsequent aus und bietet umfangreiche Möglichkeiten der Integration in bestehende Umgebungen. Das große Manko ist das Fehlen der graphischen Visualisierung, denn die Informationen zu den verschiedenen Datenquellen sind „nur“ Text-basiert. Copyright © [email protected] 63 Semantic Web Techniken für E-Learning Darüber hinaus gilt jedes Download nur ein Monat, so dass man jeden Monat die kostenlose Version runterladen muss. Beim Autor war es ständig nötig bei jeder (auch kleinen)Änderung der Topic Map, Omnigator zu stoppen, neu zu starten und den Browser auch neu zu starten, was einem viel Zeit kostet. Omnigator bietet keine Hilfe an, wenn man sich verschreibt, oder den gesuchten Begriff nicht kennt, so dass man ergebnislos die Sitzung beenden muss. Der Omnigator ist ein sehr gutes Tool zum lernen von Topic Maps, zum erstellen von Topic Maps und die Einleitung ist einfach erklärt. Das beste Produkt, das ich getestet habe. Wichtiger noch, mit dem Omnigator kann man seine erstellten Topic Maps auf Richtigkeit kontrollieren. Beim TMDesigner funktioniert das Exportieren der XML-Files nicht, aber vor allem die fehlende Unterstützung von Scopes ist das große Manko. Dieses Tool wurde seit 2001 nicht mehr weiter entwickelt, und der Autor ist auch nicht mehr in diesem Gebiet tätig37, so dass es keine weiteren Entwicklungen zu erwarten sind. Das Tool kennt keine mächtige Abfragesprache. Da es keine Datenbank im Hintergrund hat (das ganze wird im Speicher gehalten) kann es natürlich kein Mehrbenutzersystem anbieten, was eigentlich sehr wichtig für eine elektronische Lehre ist, da sie von mehreren Usern benutzt werden kann. Bei dieser Gelegenheit möchte der Autor darauf hinweisen, dass es weitere Forschungsprojekte in dieser Hinsicht gibt, unter anderem: 3.4 Topic Maps Visualization (le Grande)38 Groupware-based Topic Maps (Smolnik)39 Abfragesprachen 3.4.1 Tolog Mit Tolog (orientiert sich an der Programmiersprache Prolog) bietet Ontopia ihren Kunden eine eigene Anfragesprache, die einfach zu erlernen40 ist, und 37 mail von Roland Heckel an den Autor dieser D.A vom 080103 38 www.rp.lip6.fr/~blergrand/indexEng.html 39 http://gtm.upb.de Copyright © [email protected] 64 Semantic Web Techniken für E-Learning die leider nur Gültigkeit im Omnigator und TM4J hat, was natürlich nicht ermutigt, sie zu lernen, da man sie nicht überall einsetzen kann. Ein Beispiel einer Anfrage: Abbildung 31 : Eine TOLOG-Anfrage Ontopia arbeitet aktiv mit, um die neue einheitliche TMQL (Topic Map Query Language) mitzudefinieren und zu entwickeln, und sobald diese Anfragesprache feststeht, wird selbst Ontopia auf diese Anfragesprache umsteigen. Tolog beschränkt sich grundsätzlich auf Anfragen auf Beziehungen41. 3.4.2 TMQL TMQL steht für Topic Map Query Language soll in die Nachfolge von Tolog treten. TMQL ist ein Standardisierungs-Gemeinschaftsprojekt von ISO (JTC1 SC34 WG3) und Topicmaps.org, gegründet 2001. Das Ziel der Arbeitsgruppe ist eine auf XML basierende Anfragesprache, die SQL ähnlich sein soll. 40 www.ontopia.net/omnigator/docs/query/tutorial.html 41 www.ontopia.net/omnigator/docs/query/tutorial.html Copyright © [email protected] 65 Semantic Web Techniken für E-Learning TMQL hat ihre eigene Notation, was zur Unabhängigkeit von ISO- bzw. XTMStandard führt. Sie soll als übergreifende Abfragesprache für verschiedene Topic Map-Standards gültig sein. TMQL soll folgende Basisfunktionalitäten für Topic Map Anfragen und Updates auf Topic Maps bieten: SELECT, ADD, REMOVE Definieren von (Select) Anfragen, die als Ergebnis Topics oder gar TopicMaps als Ergebnis liefern: Select alle Topics vom Typ „Creator“? o Select topic[x] from topic-type [“Creator”].[x] o Ergebnis wäre: Prof. Müller, Rippel, Younous Select alle Typen vom Topic „Younous“? o Select topic[t] from topic-type[t].topic [“Younous”] o Ergebnis wäre: Student, Creator, Mensch Addieren von Informationen in die TopicMaps (a la INSERT von SQL) Entfernen von Informationen aus den TopicMaps( a la deleteMethode von SQL). Zur Realisierung und Zukunft von TMQL ein Zitat von Holger Rath: „Die Validierung einer beliebigen Topic Map gegen ein Schema mit Regeln und Rahmenbedingungen ist das Ziel von TMCL. Für jede Klasse soll vorgegeben werden können, welche Charakteristiken deren Instanzen haben sollen oder haben müssen. Wie sehen die Namen aus, welche Gültigkeitsbereiche sind zulässig, sind nur bestimmte Vorkommensangaben bestimmter Klassen erlaubt und wie viele, in welchen Assoziationen dürfen oder müssen die Instanzen eine Rolle spielen, welche Rollen hat eine Assoziation und wie viele Mitspieler sind zugelassen. Dies ist nur eine kleine Auswahl an denkbaren Randbedingungen, die für konsistentere Topic Maps sorgen dürften. TMQL hingegen beschreibt die Abfrage und Modifikation von Inhalten. Die Sprache soll dieselbe Stellung für TM-Software einnehmen, wie SQL für relationale Datenbanken: eine normierte Schnittstelle, über die beliebige Topic-Map-Software in eine Applikation integriert werden kann. TMCL und TMQL setzen auf SAM auf. Beide befinden sich noch in der Anforderungsanalyse. TMCL wird für die Formulierung der Randbedingungen sicherlich Bestandteile von TMQL übernehmen“ 42. 42 Ix 06/2002 Seite 120 Copyright © [email protected] 66 Semantic Web Techniken für E-Learning 4 Einsatzgebiete von TopicMaps Das Einsatzpotential von Topic Maps ist sehr vielfältig. Gerade als Lösung für die Suche im Internet, das an einer Informationsflut leidet. Diese führt oft zu ungenauen oder gar falschen Suchergebnissen. Um gegen diese Informationsflut zu kämpfen soll man Änderungen schon bei den Webkatalogen und Suchmaschinen vollziehen. Ein möglicher Fortschritt wäre der Einsatz der TopicMaps-Technik. In diesem Kapitel werden einige Möglichkeiten des Einsatzes von Topic Maps in den Suchmaschinen, Webkatalogen und im E-Learning. Es wird dann ein Beispielszenario durchgeführt mit dem Ontopiatool Omnigator zur Verwirklichung des E-Learnings. Am Ende dieses Kapitels wird dann das „E-Learning Tracker“, das als Teil dieser Diplomarbeit entwickelt worden ist, beschrieben. 4.1 Der Einsatz von Topic-Maps in Webkatalogen Themenkataloge sind „per Hand“ durchsuchte Seiten, die dem Thema oder Gebiet entsprechend einsortiert werden, was zu einer hohen Qualität der ausgewählten Links führt. Das ist eine sehr gute Voraussetzung für Topic Maps, da die Redakteure schon die Hauptarbeit gemacht haben, nämlich das Filtern, Lesen und die semantische Aufbereitung der Ressourcen. Topic Maps können in diesem Gebiet wie folgt eingesetzt werden: Wenn man diese Ressourcen, die in bestimmten Kategorien (wie Informatik, Sport, etc) eingeordnet sind, zusätzlich mit Kommentaren versieht, führt das dann zu einer Verbesserung der Recherche in diesen Artikeln. Mögliche Kommentare wären Informationen zum Autor, zum Ort, zur Gültigkeitsdauer (ein Artikel über „Leipzig aus der DDR“ kann nur in einem bestimmten Zeitraum 1949-1989 Gültigkeit haben) und vor allem zu den verwandten Themen. 4.2 Der Einsatz von Topic-Maps in den Suchmaschinen Bei der Größe der Suchmaschinentreffer ist es wahrscheinlich nicht einfach diese Treffer dann verschiedenen Topics zuzuordnen. Da es noch kein TopicMap-Tool gibt ( Stand Mai 2003), das eigenständig die Daten sortieren, filtern und sogar mit Kommentaren versehen kann, wird es schwierig sein, Topic Maps in irgend einer Weise dort einzusetzen. Das obwohl die gefundenen Seiten von den Suchrobotern indiziert werden. Eine mögliche Alternative wäre eine Kombination aus den indizierten Ergebnissen der Suchmaschinen und Copyright © [email protected] 67 Semantic Web Techniken für E-Learning der menschlichen Hand, die die Themen dann den entsprechenden Topics zuordnen. Eine Automassierung dieses Vorganges ist schwer vorstellbar. 4.3 TopicMaps und E-Learning: E-Learning wird meistens mit Universitären Einrichtungen zusammengebracht. Das ist nicht ganz richtig. Denn viele Firmen wollen auch ihre Mitarbeiter weiterbilden und greifen zu dieser billigen Maßnahme. Billig in dem Sinne, dass man weitergebildet werden kann, ohne viele Kosten zu verursachen. Zum Beispiel Kosten für Anfahrt zum Ausbildungsort, Übernachtungskosten und Ausbildungskosten, denn wenn man ein ELearning anbietet dann für eine ganze Mannschaft, Kosten werden kaum durch die Anzahl der geschulten erhöht, im Gegensatz zu den herkömmlichen Methoden. Man kann es noch effektiver nutzen, um den Studenten zum Beispiel die Möglichkeit zu geben, selbstständig und ohne Zeitvorgaben ihre Vorlesungen zu besuchen, ihre Unterlagen zu holen und ihre Fragen zu stellen. Um den gezielten Informations- und Wissenstransfer auf die individuellen Bedürfnisse ihrer Mitarbeiter und Aufgaben zu befriedigen, haben z.B. zahlreiche Unternehmen (z.B. Bertelsmann, Deutsche Bank, Lufthansa, etc.) eigene Unternehmens-Universitäten (Corporate Universities) gegründet. Spitzenreiter ist das Kredit- und Versicherungsgewerbe, bei dem bereits mehr als zwei Drittel43 der Großunternehmen E-Learning einsetzen, da sie ständig ihre Programme und Software ändern um die Datenflut Herr zu werden. Wenn man von Lernen spricht, gerade in Bezug auf Schulen oder Universitäten, denkt man automatisch an einen Lehrer oder Professor, der vorne an der Tafel steht um sein Wissen an die Studenten weiterzugeben. Die Studenten müssen präsent sein um am Kurs oder an der Vorlesung teilzunehmen. Fällt der Lehrer aus, findet der Unterricht nicht statt. Wenn der Student fällt, kann er zwar den Stoff zusammentragen, aber die Stunde nicht mehr nachholen. E-Learning bringt aber auch Probleme mit sich, zum Beispiel, die fehlende persönliche Kommunikation, dafür aber den Vorteil, dass Lernende jederzeit Lernumgebungen benutzen können. Grosse vernetzte Daten (Lern-)Mengen müssen zur Verfügung stehen. 43 Manager-Magazin vom 29.11.2001 Copyright © [email protected] 68 Semantic Web Techniken für E-Learning Abbildung 32: E-Learning Das Bild44 stammt von der Firma Fujitsu, die das E-Learning zur Weiterbildung ihrer Mitarbeiter nutzt. In dem Bild sind verschiedene Sichten zu sehen. Auf einer Seite sieht man die Lehrer, die ihr Wissen und ihre Vorlesungen ablegen. Auf der anderen Seite sind Mitarbeiter, die ihre Anfrage schicken, Vorlesungen abrufen oder mit ihren Kollegen Informationen austauschen. Für die Realisierung sind Tools nötig, um dieses Wissen effizient verwalten und überschauen zu können. Es sollte den Studenten auch möglich sein unterschiedliche Lernpfade einzuschlagen, weil jeder seine Lernart hat. Die Navigation zwischen den artverwandten Themenpunkte ist eine wichtige Säule des E-Learnings. Das wichtigste ist den Studierenden eine Suchfunktion anzubieten, mit der sie schneller und effektiver ihre Informationen abrufen können. Den Lehrern 44 http://interstage.fujitsu.com/jp/service/img/e-learning.gif Copyright © [email protected] 69 Semantic Web Techniken für E-Learning sollen natürlich auch die Möglichkeiten angeboten werden, ihre Vorlesungen, Übungen kontrolliert an die Studenten anzubieten, die gewisse Vorraussetzungen erfüllen, wie zum Beispiel Studenten im Grundstudium dürfen Zugang zu den Vorlesungen oder Praktika vom Hauptstudium erst nach Bestehen des Vordiploms erhalten. Topic Maps sind ein Ansatz, um dieses Problem zu lösen und aus der zur Verfügung stehenden Datenmenge, die für die lernende Person relevanten Daten rauszufiltern. Der Begriff Topic Map kann frei übersetzt werden mit „Wissenskarte“. Sie sind ein Hilfsmittel zur Navigation in unbekannten Wissensgebieten. Topic Maps liegen als Metaebene über den Materialien, die durch sie erschlossen werden. Durch Assoziationen zwischen einzelnen Topics entsteht ein semantisches Netz – darin liegt der besondere Wert und auch Nutzen der Topic Maps. 4.3.1 E-Learning mit dem Omnigator Der Omnigator wurde ausführlich in dem Kapitel „Topic Maps Tools“ beschrieben und getestet. Zum Verwenden des Tools braucht man eine XTMDatei, die eine elektronische Lehre darstellt. In dieser Datei sind Schlagworte, Veranstaltungen, Creatoren (Autoren), Publisher und die verschiedenen Fachrichtungen (Architektur, Informatik...) als Topics deklariert. Copyright © [email protected] 70 Semantic Web Techniken für E-Learning Abbildung 33: E-Learning mit dem Omnigator Ein Student möchte sich zu einem Thema informieren, das (als Beispiel) das Schlagwort „Kette“ enthält. In der Query gibt er dann seine Suche ein, und erhält folgende Antwort (siehe Bild 2). Kette ist dann vom Type Schlagwort, oder genauer gesagt ist eine Instanz vom Topic Schlagwort. Dieser Begriff „befindet sich in“ (ist eine Relation) drei verschiedenen Fachrichtungen, nämlich: „Multimedia“, „organische Chemie“ und „SVG und XML“. Abbildung 34: Kette als Schlagwort Der Student wählt dann das Thema aus, wofür er sich interessiert, in dem er auf den entsprechenden Namen klickt. Als Beispiel nehme man hier „Multimedia“. Copyright © [email protected] 71 Semantic Web Techniken für E-Learning Abbildung 35: Multimedia- Portal Im Bild findet man neben dem Link (unter External Resources -> web site) zur realen Ausprägung des gesuchten Begriffs, weitere informative Hinweise zu diesem Begriff, die einiges darüber aussagen. Zum Beispiel befindet sich „Kette“ in Multimedia, Multimedia ist eine Vorlesung (siehe scope: Vorlesung). Weitere Informationen zur Vorlesung kann man erhalten, indem man auf Multimedia klickt. So erhält man den Autor angezeigt, und weitere Autoren, die zu diesem Thema etwas geschrieben haben, und so kann man sich quer über den Datenbestand bewegen, und weitere Informationen erhalten. 4.3.2 E-Learning Tracker: Im Rahmen dieser Diplomarbeit sollte ein Tool zur Verwaltung einer elektronischen Lehre entwickelt werden, das ähnliche Funktionalitäten unterstützt, wie die von TopicMaps. Die Daten (Vorlesungen, Autoren, Benutzer ...) sind in einer MySQL Datenbank gespeichert. Es gibt drei verschiedene Benutzer: Studenten, die Schlagworte suchen, Autoren oder Lehrer, die ihre Daten in dieser Datenbank ablegen und Administratoren, die die gleichen Rechte haben, wie die Autoren, zusätzlich haben sie die Möglichkeit Daten anderer Autoren zu bearbeiten oder löschen. Copyright © [email protected] 72 Semantic Web Techniken für E-Learning Dieses Tool bietet ein Webinterface, das die Ersteller von Onlineressourcen bei der Auszeichnung von Attributen unterstützt. Abbildung 36: Architektur des Trackers Das System wird jetzt anhand eines Beispielszenarios nach und nach erklärt. Der User (Student, Autor oder Administrator) muss sich über ein Webinterface anmelden. Die Rechte, die in einer Tabelle gespeichert sind, werden geprüft, und je nach Recht erscheint ein Menü. Copyright © [email protected] 73 Semantic Web Techniken für E-Learning Abbildung 37 : Login des E-Learning-Trackers Nach dem erfolgreichen Einloggen, erhält man eine Auswahl von Funktionen, die dieses Tool anbietet. Bei Benutzern mit dem Recht „nichtautorisiert“(wie Studenten zum Beispiel) fehlt die Option „Neuer Eintrag“, da sie nicht berechtigt sind, neue Einträge in die Datenbank einzufügen. Unter User steht dann der gerade eingeloggte Benutzer (Rippel in diesem Falle). Es sind noch zwei Buttons vorhanden, mit „Logout“ verlässt man das Programm, und mit „Menue“ werden dann die schon genannten Optionen angezeigt. Copyright © [email protected] 74 Semantic Web Techniken für E-Learning Abbildung 38: Menü des Trackers Das Beispiel wird erstmal den Fall zeigen, bei dem der Benutzer ein Student ist, der das Schlagwort „Kette“ enthält. Abbildung 39: Search for Entry Copyright © [email protected] 75 Semantic Web Techniken für E-Learning Als Ergebnis erhält der Student (Younes) eine Liste von Topics, die den Begriff „Kette“ enthalten. In dieser Liste kann der Student seine Anfrage verfeinern, in dem er die Vorlesung anklickt, deren Titel dem entspricht, was er gerade sucht. Als Beispiel wird die Vorlesung „Datenstrukturen“ ausgesucht. Abbildung 40: Ergebnis der Anfrage „Kette“ Datenstrukturen ist eine Vorlesung, die von Professor Müller gelehrt wird. Sie enthält unter anderem Kette als Schlagwort, und wird von der Universität Kaiserslautern veröffentlicht. Das Dokument ist unter „resource_identifier“ zu finden. Dort ist die Vorlesung abrufbar bzw. erreichbar. Abbildung 41: Kette in der Vorlesung Datenstrukturen Wenn man sich für weitere Vorlesungen von Professor Müller interessiert, kommt man mit einem Klick, auf das Topic „Prof.Mueller“, auf das Portal der Copyright © [email protected] 76 Semantic Web Techniken für E-Learning Vorlesungen vom Professor Müller, unabhängig vom Publisher. man beachte, dass dem Studenten nur die „back“ Möglichkeit zusätzlich angeboten wird, was anderes nicht, weil er nichts anderes darf. Den Unterschied wird später klar, wenn man das Beispiel mit einem anderen „Recht“ durchführt. Abbildung 42: Vorlesungen von Prof. Müller Professor Müller bietet weitere Vorlesungen an, nämlich Multimedia, Datenstrukturen und noch ein Internetpraktikum. Man kann sogar seine Suche eingrenzen, indem man ein Schlagwort eingibt und eine andere Option, wie zum Beispiel der Name des Autors, oder die Universität, die den Artikel veröffentlicht hat. So kann man Umwege vermeiden. Insgesamt geht die Suche schneller, da man sofort eine Liste der Topics angezeigt bekommt, die man weiter durchsuchen kann. Jetzt wird der Fall betrachtet, bei dem ein Autor (der berechtigt ist) neue Daten in die Datenbank einfügen will. Unter „Menue->Neuer Eintrag“ wird eine Maske angezeigt, in der die Daten eingetragen werden und mit Einfügen, in die Datenbank übertragen. Der Autor (der in diesem Beispiel das höchste Recht besitzt) kann sich alle Daten anschauen, updaten oder gar löschen, wie das nächste Bild zeigt. Copyright © [email protected] 77 Semantic Web Techniken für E-Learning Abbildung 43: Display Entry Dieses Recht wird nur dem Administrator eingeräumt, damit er die Einträge kontrollieren kann. Die anderen Autoren dürfen nur ihre eigenen Daten löschen bzw. bearbeiten. Das Anschauen oder Lesen von Daten ist jedem zugänglich. Hier ging es darum, einen Rahmen zu schaffen, in dem die Lernobjekte im Kontext eines Kurses eingebunden werden können. Also um die Verwaltung von Kursen, Teilnehmer, Lernobjekte, Autoren und deren Beziehungen zueinander: Zuordnung von Lernobjekten untereinander Zuordnung der Lernobjekte zu den Kursen Zuordnung von Teilnehmern zu Kursen Zuordnung von Autoren zu den Kursen Copyright © [email protected] 78 Semantic Web Techniken für E-Learning 5 TopicMaps Suchmaschinen Mit der Entwicklung von Topic Maps, war der erste Schritt getan, für die Umrüstung einiger Suchmaschinen oder für die Entstehung neuer Suchmaschinen. Meistens sind diese Suchmaschinen kommerzieller Art, und einige benutzen nur die Idee der Topic Maps, und genauer gesagt die Idee der „semantischen Netze“. Hier werden folgende Suchmaschinen geführt: KartOO und Lumrix. 5.1 KartOO KartOO wurde aus einem Forschungsprogramm 1998 gegründet. Ziel war die Ergebnisse der Suchanfragen nicht mehr als Listen mit Zusammenfassung (wie bei den herkömmlichen Suchmaschinen) zu liefern, sondern mit einer kartographischen und interaktiven Schnittstelle zu präsentieren. Abbildung 44: KartOO-Ergebnisse auf Java-Anfrage KartOO45, liefert die Ergebnisse als Karte mit vielen Gebieten (wenn vorhanden), was dem Benutzer die Möglichkeit gibt, seine Anfrage zu 45 http://www.kartoo.com Copyright © [email protected] 79 Semantic Web Techniken für E-Learning verfeinern in dem er auf das gewünschte Gebiet klickt. Wenn man mit der Maus auf eine Antwort geht, erhält man einige Informationen zu diesem Link. 5.2 Lumrix Lumrix entstand auch aus einer Forschung in dem Institut für Medizinische Informatik der Justus-Liebig-Universität Giessen, das sich mit der Auszeichnungssprache XML intensiv beschäftigt. Die Idee, die dahinter steckt, ist die Ordnung und Struktur von Informationen zu „belohnen“ 46. Lumrix nutzt die TopicMaps-Technik, was dazu führt, dass sie im Vergleich zu den Volltextsuchmaschinen relevantere Ergebnisse liefert, denn VolltextSuchmaschinen suchen Begriffe, Lumrix sucht Begriffszusammenhänge. Sie liefert eine bessere Ergebnisquote, da sich ihre Technik nicht auf die Wortdistanz verlässt, sondern auf die vom Autor dokumentierten Beziehungen in Form von XML Topic Maps, XML-Markierungen, Satz-Interpunktionen, etc. Bei Lumrix werden alle möglichen Texte indiziert: XTM, RDF, XML, HTML, PDF, RTF, TXT, etc. Bilder können zum Beispiel über XTM verschlagwortet werden, d.h. man kann auch multimediale Informationen suchen. Ein Beispiel eines Suchvorganges von Lumrix mit dem Unterschied zwischen XML- und XTM- Dokumenten47, die Ergebnisse werden als Listen angezeigt: 46 iX 11/2002 Seiten 104-107 47 http://www.lumrix.net Copyright © [email protected] 80 Semantic Web Techniken für E-Learning Abbildung 45: Ergebnisse als Liste bei Lumrix Lumrix hat eine besondere Vorgehensweise bei der Suche nach Begriffen; Sucht man zum Beispiel nach „Behandlung Karzinom Niere“, verbindet Lumrix zunächst die Begriffe „Karzinom“ und „Niere“ zu einer Diagnose, für die man anschließend eine Behandlung sucht. Mittels XTM kann beispielsweise eine synonyme Beziehung zwischen den Begriffen „Karzinom“ und „Krebs“ hergestellt werden. Die Suchmaschine findet dann auch alle Seiten zum Thema Nierenkrebs. Topic Maps erlauben die gezielte Ausbildung von Beziehungen zwischen Ressourcen. Ein Beispiel: Ein XML-Element dokumentiert eine medizinische Diagnose: <diagnose>AIDS Phobie</diagnose>. Eine XTM definiert ferner eine "Ursache-Wirkungs-Beziehung zwischen HIV und AIDS". Aufgrund des gewonnenen Beziehungswissens findet Lumrix alles zum Thema "HIV Phobie". Entscheidend ist dabei nicht, dass die beiden Suchbegriffe "HIV" und "Phobie" in derselben Seite auftreten. Tatsächlich kommt der Begriff "HIV" noch nicht einmal in der Seite vor. Entscheidend ist die Tatsache, dass unabhängige Autoren - direkt oder indirekt - einen sinnvollen Zusammenhang der Begriffe dokumentiert haben. Unabhängig von der Form und der Verteilung des Beziehungswissens entstehen neue Suchpfade, die eine hohe Präzision und Vollständigkeit der Suche garantieren“ 48. 48 http://www.lumrix.net Copyright © [email protected] 81 Semantic Web Techniken für E-Learning Copyright © [email protected] 82 Semantic Web Techniken für E-Learning 6 Zusammenfassung und Ausblick Die vorliegende Arbeit versucht, das Thema „Topic Maps“ von verschiedenen Perspektiven zu betrachten. „Topic Maps“ sind geordnete Wissensnetze. Sie stellen ein Hilfsmittel dar, um sich in der immer größer werdenden Informationsvielfalt zurechtzufinden und beim Navigieren trotz einer möglichen Informationsüberflutung die Übersicht zu behalten. Wie ein Stichwortverzeichnis in einem guten Fachbuch, helfen sie, die genau gesuchte Information zu finden. Die Tatsache, dass elektronische Informationen in größerem Umfang als die Seiten eines Buches vorliegen und auf heterogenen Plattformen gespeichert sind, zieht die Konsequenz mit sich, dass Topic Maps nicht nur aus einer Liste alphabetisch sortierter Stichworte bestehen. Vielmehr werden mit Hilfe von Topic Maps logische Konzepte entworfen, die Wissensnetze semantisch modellieren. In Zusammenhang mit Topic Maps spricht Tim Berner-Lee von der dritten Revolution des Internets. Die XTM-Arbeitsgruppe wirbt sogar mit dem Slogan „Das GPS des Web“. So wie eine Landkarte eine schematische Sicht auf eine reale Landschaft ermöglicht und bestimmte Merkmale der Landschaft (z.B. Städte, Straßen, Flüsse) markiert, sind Topic Map in der Lage wichtige Merkmale eines Informationsbestandes festzuhalten und in Bezug zueinander zu setzen. So wie ein GPS-Empfänger die eigene Position auf der Karte feststellt, kann eine Topic Map die Orientierung in einer virtuellen Welt vernetzter Dokumente herstellen. Das klingt etwas exotisch, hat jedoch durchaus praktische und sehr weit gefächerte Anwendungen. In dieser Arbeit wurde zuerst der Übergang von Suchmaschinen zu einem semantischen Web beschrieben. Im zweiten Kapitel wurden die Topic Maps ausführlicher behandelt. Angefangen bei der Geschichte von Topic Maps, über die Entwurfsziele bis hin zu einem XTM-Tutorial . In diesem Tutorial wurden verschiedene Beispiele durchgeführt und die Lineare Topic Map von Ontopia vorgestellt. Abschließend wurde anhand eines Beispiels eine mögliche Realisierung von Topic Maps mit HTML. Das dritte Kapitel wurde den TopicMaps-Tools und Anfragesprachen gewidmet. Es wurden kommerzielle sowie freiverfügbare Tools vorgestellt und miteinander verglichen. Danach wurden die beiden Anfragesprachen Tolog und TMQL eingeführt. Im vierten Kapitel wurden die beiden Einsatzgebiete von Topic Maps behandelt. Das sind zum einen die Webkataloge und die Suchmaschinen. Zum anderen ist es möglich, auch im Rahmen vom E-Learning von dem Konzept der Topic Maps zu profitieren. In diesem Zusammenhang wurde erst der Omnigator von Ontopia vorgestellt. Dann wurde das im Laufe dieser Copyright © [email protected] 83 Semantic Web Techniken für E-Learning Arbeit entwickelte Topic Maps Tool E-Learning -Tracker ausgeführt und erklärt. Im fünften Kapitel wurden die neuen Suchmaschinen, die ausschließlich auf dem Konzept der Topic Maps basieren und diese Technik auch tatsächlich verwenden, angesprochen und mit Beispielanfragen erläutert. In dieser Diplomarbeit wurden wegen dem großen Einsatzpotential von Topic Maps, viele Gebiete angesprochen, angefangen bei den Webkatalogen über Suchmaschinen bis hin zum E-Learning. Mit XML Topic Maps gibt man den Beziehungen zwischen den verschiedenen Topics die Chance sich auszuzeichnen. Damit erreicht die Suche eine neue, bis dahin unmögliche Qualität. Mit einer Topic Map lassen sich beispielsweise die klassischen Navigationselemente technischer Dokumentation (Inhalt, Index, Glossar etc.) in einheitlicher Weise beschreiben; eine andere Topic Map könnte die inhaltliche Vernetzung von Artikeln in einem Lexikon ausdrücken (z.B. Person A wurde geboren in Stadt B, B liegt in Land C, Oper D wurde komponiert von A, Person E war Zeitgenosse von A) und für "siehe auch"-Verweise sorgen (andere Werke dieses Komponisten, andere Städte in diesem Land etc.). Es klingt wie die Lösung aller Suchprobleme. Allerdings nur in der Theorie. Denn Tools, die in der Lage sind, das Wissen oder die Riesendaten in Topicmaps automatisch zu generieren, sind noch Mangelware, was die Ausbreitung von Topic Maps hemmt. Der Aufbau solcher Netze erfordert sehr viel Zeit und sehr viel "Handarbeit" - und damit auch viel Geld, was viele Firmen davon abhält Topic Maps zu benutzen49. Trotz alledem bleibt diese Technik keine graue Theorie. Denn obwohl es spürbare Schwierigkeiten auf dem Weg zur Popularität gibt, wird sie eines Tages das Web beherrschen. Microsoft hat sogar versucht, einige Leute und Entwickler von Topic Maps abzuwerben50, was ihr missglückt ist. Dies ist als ein Hinweis zu verstehen, dass diese Technik Interesse bei einigen Herrschern in der Informatikindustrie. Auch andere Industriebereiche wie die Automobilindustrie und andere zeigen bereits großes Interesse, wie auf dem Darmstädter Kongress zu sehen und zu hören war. Dort waren nämlich auch Firmen anwesend, die sich über diese Technik informieren wollten und wissen wollten wie sie ihre Daten Topic Maps konform machen können. Darunter fallen Namen wie Volkswagen, die bereits ein Tool von USU benutzen, aber auch Mercedes und andere. 49 Diskussion über TopicMaps beim Darmstädter Kongress 50 H.H.Rath in der Diskussion über TopicMaps beim Darmstädter Kongress Copyright © [email protected] 84 Semantic Web Techniken für E-Learning Interessanterweise haben Verlage das Konzept der Topic Maps als erste adaptiert. Als erstes Unternehmen weltweit hat 1999 die Wienerzeitung ihre Daten Topic Maps mäßig bearbeitet, was zu einer großen Effektivität bei der Gestaltung der Daten geführt hat51. Heute nach 4 Jahren Erfahrung mit Topic Maps, sieht die Wienerzeitung die Vorteile des TM-Einsatzes darin, dass sie ihre Daten in einem klaren, wartbaren und flexiblem System geordnet haben. Bertelsmanns Wissensportal wissen.de benutzt Topic Maps, um die graphische Anzeige von Wissenszusammenhängen mit Inhalt zu füttern. Der französische Verlag Quid hat sein Online-Lexikon als Topic Map organisiert. Firmen der weltweit operierenden Wolters-Kluwer-Verlagsgruppe setzen auf Topic Maps zur besseren Verwaltung ihrer Inhalte und zur intelligenteren Aufbereitung ihrer Websites. Einige Sites der norwegischen Regierung sind komplett als Topic Map strukturiert und bieten optimale Navigation in den angebotenen Informationsmengen. Laut einer Studie der Meta Group ist 16 Prozent der deutschen Unternehmen XTM im Kontext Wissensmanagement ein Begriff und gut ein Drittel hält sie für eine relevante WissensmanagementTechnik. Die Pressetext Austria AG52 setzt diesen Standard ab 2001 für ihre Content Syndikation (www.newsfox.com) ein. "Pressetext wird den Metadatenstandard Topic Maps einsetzen, um seine Informationsangebote für den Kunden maßgeschneidert strukturieren und punktgenau ausliefern zu können", erklärt der technische Direktor von Pressetext, Markus Schranz. Ein Topic umfasst dabei für jede Information in der Datenbank eine Kurzbeschreibung und eine semantische Kategorisierung der Inhalte. Über frei konfigurierbare assoziative Verbindungen zwischen den Topics können für den Kunden maßgeschneiderte Selektionskriterien aufgesetzt werden. So z.B. können einem Handy-Portalbetreiber Nachrichten aus verschiedensten Informationskanälen zum Thema Handy, WAP und SMS geliefert werden. In Asien hat diese Technologie angefangen neue Freunde zu gewinnen. Dazu ein Zitat von Steve Pepper53: "Interessant ist auch, dass östliche Länder sehr viel Interesse an Topic Maps zeigen. Besonders Japan und Korea. Es ist seltsam, weil mir erzählt wurde, dass vor allem in Japan XML Probleme hätte sich durch zu setzen. - Es war nicht so wie in den Staaten, wo plötzlich jeder über XML geredet hat. Aber dem Konzept der Topic Maps wird dort weit mehr Interesse entgegen gebracht. Es ist fast so, als entspräche es deren Psyche über Semantik, Bedeutung und Informationen zu reden, als über langweilige alte Syntax“. 51 E-Mail von der Zeitung an den Autor bzgl. Topic Maps 52 http://www.pressetext.at/ 53 http://matrix.orf.at/bkframe/020616_1.htm Copyright © [email protected] 85 Semantic Web Techniken für E-Learning Die Strukturierung und Ordnung von Information verursacht erheblichen Aufwand. Wegen der wachsenden Informationsmenge wird man diese Arbeit jedoch leisten müssen, um eine Verschlechterung der Suchqualität zu vermeiden. XML ist ohne Zweifel ein guter Ansatz in dieser Richtung, aber Aufgrund des Mangels an XML-Suchmaschinen, werden die XML-Dokumente vor der Auslieferung nach HTML transformiert. Gebe es mehrere XML- bzw. XTM-Dokumente im Web, würde das erheblich die Suchqualität verbessern. Diese semantischen Netze werden auch im E-Learning eine große Rolle spielen. Die Vorteile dieser Technik spiegeln sich vor allem in der für den Nutzer klareren Vernetzung der einzelnen Topics (Lerneinheiten), d.h. der Nutzer (Student, Professor etc.) erhält einen besseren Überblick über die Struktur des Lernstoffes. Die Beziehungen zwischen den verschiedenen Schwerpunkten einer Lehrveranstaltung werden transparenter abgebildet, was für den Lernprozess und auch bei der Vorbereitung des Stoffes für eine Lehrveranstaltung hilfreich sein kann54. Dies zeigt, dass Topic Maps in verschiedenen Gebieten bereits Einsatz gefunden haben, aber immer noch viel Aufwand gebracht werden muss, um die Vorzüge der Topic Maps hervorzuheben und damit eine breite Annerkennung zu erreichen. 54 Manuella Kunze XTM Darmstädter Kongress Copyright © [email protected] 86 Semantic Web Techniken für E-Learning 7 Abkürzungsverzeichnis Abb. Abbildung BRD Bundesrepublik Deutschland bzw. beziehungsweise DBMS Datenbankmanagementsystem de Deutsch d. h. das heißt E-Mail Electronic Mail engl. English fr Französisch GPS global-positioning system HTML Hypertext Markup Language ISO International Standards Organization SGML Standard Generalized Markup Language SMS short message service SQL Structured Query Language WWW World Wide Web XML eXtensible Markup Language XTM XML Topic Maps z. B. zum Beispiel TMQL Topic Map Quary Language RDF Ressource Description Framework WAP wireless application protocol Copyright © [email protected] 87 Semantic Web Techniken für E-Learning 8 Literatur 1, 17, 30, 34, 35 Stefan Smolnik Universität Paderborn. XML Topic Maps Darmstädter Kongress April 2003 Marktüberblick über kommerzielle und frei verfügbare TM-Tools 2 Maurice Godelier Goldmedaille Gewinner bei CNRS 2001 zum Thema Suchmaschinen 3, 4, 6 Tom Schimmeck: Wegweiser im World Wide Web. Die Herrscher der Portale. In: Geo Wissen 27. 2001, S. 130 -137 5 Henning Behme; Buchmarkt; Mehr KBytes, SVG; iX 12/2002, S. 146 7 iX 11/2002 Seite 104. 8, 0 Behme, H./Mintert, S. (2000), S. 503 XML in der Praxis – Professionelles Web-Publishing mit der Extensible Markup Language, 2. Auflage, AddisonWesley, München. 9, 11 Rath, H. H. (1999): Technical Issues on Topic Maps, http://www.doctypes.org/xtm/home.html#documents. 2 Steve Pepper. http://www.gca.org/papers/xmleurope2000/papers /s11-01.html 13, 24, 26, 27 14, 5 Holger Rath Mitglied des ISO-Gremiums. http://www.empolis.com Tim Berners-Lee. W3C-Direktor http://www.w3.org/People/Berners-Lee/ 6 matrix.orf.at/bkframe/020616_1.html 8 http://ww.rp.lip6.fr/~blergrand/indexEng.html. 9 Robert Eckstein. XML kurz und gut Copyright © [email protected] 88 Semantic Web Techniken für E-Learning 20, 21 Hubert Partl. http://www.boku.ac.at/ 22 http://www.hypermedia-texte.de. 23, 24 Richard Widhalm Herausgeber des Buchs: Topic Maps, Springer Verlag 2002 25 http://www.ontopia.net/download/ltm.html#N60 28, 29 http://www.ontopia.net 3, 32 http://www.ontopia.net/download/freedownload.html 33 http://www.usu.de 36 http://www.i-views.de/web/pdfs/Whitepaper-K-Infinity.pdf 37 E-Mail von Roland Heckel an den Autor dieser D.A vom 080103 38 www.rp.lip6.fr/~blergrand/indexEng.html 39 Groupware Competence Center http://gtm.upb.de 40, 41 http://www.ontopia.net/omnigator/docs/query/tutorial.html 42 iX 06/2002 Seite 120 43 Manager-Magazin vom 29.11.2001 44 http://interstage.fujitsu.com/jp/service/img/e-learning.gif 45 http://www.kartoo.com 46 iX 11/2002 Seiten 104-107 47, 48 http://www.lumrix.net Copyright © [email protected] 89 Semantic Web Techniken für E-Learning 49 Diskussion über TopicMaps beim Darmstädter Kongress Mit unter anderem A.Sigel, H.H.Rath, Dr. H.Beier, Dr.S.Wess, Dr. S.Staab an dem auch der Autor teilgenommen hat. 50 H.H.Rath in der Diskussion über TopicMaps beim Darmstädter Kongress 51 E-Mail von der Zeitung an den Autor bzgl. Topic Maps 52 http://www.pressetext.at/ 53 http://matrix.orf.at/bkframe/020616_1.htm 54 Manuella Kunze Universität Mageburg. XML Topic Maps Darmstädter Kongress April 2003 TM zur Beschreibung von extrahierten Daten und Lehrmaterialen Copyright © [email protected] 90 Semantic Web Techniken für E-Learning 9 Anhang HyTime (Hypermedia/Time-based Structuring Language) ist ein internationaler Standard (ISO/IEC 10744) zur strukturierten Repräsentation von Hypermedia-Informationen. HyTime ist eine Anwendung der Standard GeneraIized Markup Language (SGML) SGML Die Standard Generalized Markup Language - SGML - ist der Standard zur Beschreibung von Dokumenten der International Standardization Organization (ISO), der unter der Nummer ISO 8879 im Jahr 1986 veröffentlicht wurde. SGML ist sehr umfangreich, leistungsfähig und komplex; die Muttersprache von XML. ISO Der ISO-Standard zu XML Topic Maps erweitert den früheren, auf SGML bezogenen und definiert, wie Topic Maps mit XML und XLink auszutauschen sind. Außerdem beantwortet er Unklarheiten, die der bisherige Standard offen gelassen hatte: XML Diese erweiterte Markup-Sprache XML (eXtensible Markup Language) ist ein Dokumentenverarbeitungsstandard, der vom Worls-wide-WebKonsortium (W3C) vorgeschlagen wurde – demselben Gremium, das auch für die Überwachung des HTML-Standards verantwortlich ist HTML Steht für „Hyper Text Markup Language“, zu Deutsch etwa "HypertextAuszeichnungssprache", einer im Web genutzten kleinen SGML Anwendung. Sie definiert eine sehr einfache Klasse berichtsartiger Dokumente mit Absatzüberschriften, Absätzen, Listen, Tabellen und Illustrationen. Sie enthält außerdem einige informative und für die Präsentation gedachte Elemente sowie etwas Hypertext und Multimedia. W3C World Wide Web Consortium XTM ISO-Standard 13250 für die Kodierung so genannter semantischer Netze, d.h. konzeptioneller Landkarten (Maps), mit denen sich ein thematischer Bezug zwischen interessanten Punkten (Topics) einer Informationslandschaft herstellen lässt. Ursprünglich für die Verschlagwortung im Verlagsbereich entwickelt, werden Topic Maps mittlerweile als universelles Medium für die Beschreibung von Relationen innerhalb beliebiger Informationsbestände benutzt. Topic Maps sind zugleich interessante Methodik und Basistechnologie für Wissensmanagement-Systeme. RDF Resource Description Framework. Universeller XML-basierter Standard für die Katalogisierung von Dokumenten. Ursprünglich von Netscape für die Beschreibung von Web Channels entworfen, findet es Copyright © [email protected] 91 Semantic Web Techniken für E-Learning zunehmend Einsatz im Umfeld webbasierter Informationssysteme, bei Dokumenten- und Wissensmanagement. XTM konkurrieren mit RDF im Umfeld des Semantic Web. Inwieweit beide sich durchsetzen können, ist noch unklar. Aber die Tendenz geht mehr Richtung Zusammenarbeit und Kooperation als Richtung Rivalität. Cascading Stylesheets Eigentlich für HTML bestimmt, lässt sich aber auch in XML verwenden. Mit CSS lassen layout bezogene Eigenschaften von Elementen festlegen. Die Definition findet extern statt. Die Einbindung in XML findet unter dem Prolog statt. Das Ergebnis ist dann die Ausgabe “Hello World“ im Browser DTD Die DTD (Document Type Definition) ist ein wichtiger Teil eines XML Dokumentes. Hier werden neue Tags definiert. Außerdem wird definiert, dass es Verschachtelungen geben darf, welche Attribute bei welchen Tags zum Einsatz kommen dürfen. Kurz gesagt Sie bestimmen das “Wie“ des XML Dokumentes. Unterschieden wird diese DTD in interne und externe. Wie der Name schon sagt steht die innere DTD innerhalb des Dokumentes und die externe DTD in einer externen Datei. Im Dokument findet sich dann ein Verweis auf diese Datei. Tags Bestehend aus Start(<...>)- und Endtag(</...>). Starttags müssen wieder geschlossen werden und es dürfen auch keine anderen Tags geöffnet werden bevor das erste nicht geschlossen worden ist, in HTML war dies nicht immer so. XSL ist extensible Markup Language, sie eigens für XML geschrieben worden, hat das gleich Ziel wie CSS, nämlich das der Inhalt eines Dokumentes sichtbar gemacht werden soll. Ist aber leistungsfähiger als CSS. Mit XSL lassen sich auch XML-Dokumente in HTML-Dokumente wandeln. Xlink und XPointer Eigentlich sind in XML keine Hyperlinks vorgesehen. Xlink soll die Linksprache für XML werden. Mit dieser Sprache lassen sich Verweise auf Zieladressen im Dokument oder im World Wide Web starten. Mit XPointer kann man Verweise auf vorher markierte Dokumente starten. Diese markierten Punkte nennt man ID. TMQL steht für “Topic Map Query Language”, und ist eine XML- basierte Erweiterung von SQL.TMQL ist eine noch nicht standardisierte Anfragesprache die den besonderen Anforderungen der Topic Maps deutlich mehr gerecht wird als eine Anfragesprache, die allgemein auf XML Dokumente bezogen ist. Copyright © [email protected] 92 Semantic Web Techniken für E-Learning SVG Scalable Vector Graphics. Neues XML-basiertes Dateiformat für Vektor- und Rastergrafiken im Bereich Web und Print. Geeignet für ein breites Spektrum von Anwendungen (z.B. Illustrationen, Diagramme, Karten/geographische Informationssysteme, technische Zeichnungen, Webgrafik). Möglichkeit zur Beschreibung von Animation (z.B. Bewegung und Überblendeffekte) und Benutzer-Interaktion (z.B. Klicken und Ziehen). Erlaubt es, bestimmte Methoden des Content Managements und des Content Engineerings aus dem Textbereich (z.B. Volltextsuche, Übersetzungsmanagement, Hypertext) auch auf grafische Inhalte anzuwenden. Copyright © [email protected] 93 Semantic Web Techniken für E-Learning <?xml version="1.0" encoding="ISO-8859-1"?> <!-- DOCTYPE topicMap SYSTEM "xtm1.dtd" --> <topicMap id="elektronischeUni1006" xmlns="http://www.topicmaps.org/xtm/1.0/" xmlns:xlink="http://www.w3.org/1999/xlink" xml:base="http://www.uni-kaiserslautern.de/"> <!--Die Topic Map elktronischeUni1006.xtm enthaelt elementare Informationen ueber die elektronische Universitaet --> <!-- Definiere die Fachbereiche... --> <topic id="study_field"> <baseName> <baseNameString>Study_field</baseNameString> </baseName> </topic> <!-- Informatik ist nur eine Instanz von der Klasse Study_field --> <topic id="informatik"> <instanceOf><topicRef xlink:href="#study_field"/></instanceOf> <baseName> <baseNameString>Fachbereich Informatik</baseNameString> </baseName> </topic> <!-- Chemie ist nur eine Instanz von der Klasse Study_field--> <topic id="chemie"> <instanceOf><topicRef xlink:href="#study_field"/></instanceOf> <baseName> <baseNameString>Fachbereich Chemie</baseNameString> </baseName> </topic> <!-- Physik ist nur eine Instanz von der Klasse Study_field--> <topic id="physik"> Copyright © [email protected] 94 Semantic Web Techniken für E-Learning <instanceOf><topicRef xlink:href="#study_field"/></instanceOf> <baseName> <baseNameString>Fachbereich Physik</baseNameString> </baseName> </topic> <!-- Jetzt werden alle moeglischen Hochschulen deklariert--> <topic id="publisher"> <baseName> <baseNameString>Publisher</baseNameString> </baseName> </topic> <!-- fh-darmstadt als Instanz von topic Publisher --> <topic id="fh-darmstadt"> <instanceOf><topicRef xlink:href="#publisher"/></instanceOf> <baseName> <baseNameString>Fachhochschule Darmstadt</baseNameString> </baseName> <occurrence> <instanceOf> <topicRef xlink:href="#website"/> </instanceOf> <resourceRef xlink:href="http://www.fh-darmstadt.de/"/> </occurrence> </topic> <!-- Uni-kl als Instanz von topic Publisher --> <topic id="uni-kl"> <instanceOf><topicRef xlink:href="#publisher"/></instanceOf> <baseName> <baseNameString>Universitaet Kaiserslautern</baseNameString> </baseName> <instanceOf> <topicRef xlink:href="#website"/> </instanceOf> <occurrence> <resourceRef xlink:href="http://www.uni-kl.de/"/> </occurrence> </topic> Copyright © [email protected] 95 Semantic Web Techniken für E-Learning <!-- fh-kl als Instanz von topic Publisher --> <topic id="fh-kl"> <instanceOf><topicRef xlink:href="#publisher"/></instanceOf> <baseName> <baseNameString>Fachhochschule Kaiserslautern</baseNameString> </baseName> <occurrence> <instanceOf> <topicRef xlink:href="#website"/> </instanceOf> <resourceRef xlink:href="http://www.fh-kl.de/"/> </occurrence> </topic> <!-- Topic Dozent bezeichnet die Dozenten --> <topic id="creator"> <baseName> <baseNameString>Creator</baseNameString> </baseName> </topic> <!-- Prof Mueller als Dozent deklariert --> <topic id="Prof. Mueller"> <instanceOf><topicRef xlink:href="#creator"/></instanceOf> <baseName> <baseNameString>Professor Mueller</baseNameString> </baseName> <occurrence> <instanceOf> <topicRef xlink:href="#website"/> </instanceOf> <resourceRef xlink:href="http://www.icsy.de/personen/leiter"/> </occurrence> </topic> <!-- Prof Scherer als Dozent deklariert --> <topic id="Prof. Scherer"> Copyright © [email protected] 96 Semantic Web Techniken für E-Learning <instanceOf><topicRef xlink:href="#creator"/></instanceOf> <baseName> <baseNameString>Professor Scherer</baseNameString> </baseName> <occurrence> <instanceOf> <topicRef xlink:href="#website"/> </instanceOf> <resourceRef xlink:href="http://www.uni-kl.de/FBChemie/Scherer/Scherer.html"/> </occurrence> </topic> <!-- Prof Stark als Dozent deklariert --> <topic id="Prof. Diehl"> <instanceOf><topicRef xlink:href="#creator"/></instanceOf> <baseName> <baseNameString>Professor Diehl</baseNameString> </baseName> <occurrence> <instanceOf> <topicRef xlink:href="#website"/> </instanceOf> <resourceRef xlink:href="http://www.fhkl.de/professoren/diehl/index.html"/> </occurrence> </topic> <topic id="rippel"> <instanceOf><topicRef xlink:href="#creator"/></instanceOf> <baseName> <baseNameString>Andreas Rippel</baseNameString> </baseName> <occurrence> <instanceOf> <topicRef xlink:href="#website"/> </instanceOf> <resourceRef xlink:href="http://www.icsy.de/mitarbeiter/rippel.html"/> </occurrence> </topic> <topic id="younous"> Copyright © [email protected] 97 Semantic Web Techniken für E-Learning <instanceOf><topicRef xlink:href="#creator"/></instanceOf> <baseName> <baseNameString>Younous El Moustafid</baseNameString> </baseName> <occurrence> <instanceOf> <topicRef xlink:href="#website"/> </instanceOf> <resourceRef xlink:href="http://www.rhrk.uni-kl.de/~elmousta"/> </occurrence> </topic> <!-- Topic Vorlesung bezeichnet alle Vorlesungen --> <topic id="titel"> <baseName> <baseNameString>Titel der Veranstaltung</baseNameString> </baseName> </topic> <topic id="MultiMedia Vorlesung"> <instanceOf><topicRef xlink:href="#titel"/></instanceOf> <baseName> <baseNameString>MultiMedia </baseNameString> </baseName> <occurrence> <scope><topicRef xlink:href="#vorlesung"/></scope> <instanceOf> <topicRef xlink:href="#website"/> </instanceOf> <resourceRef xlink:href="http://venture.informatik.unikl.de:11000/index.html"/> </occurrence> </topic> <topic id="Organische Chemie"> <instanceOf><topicRef xlink:href="#titel"/></instanceOf> <baseName> <baseNameString>Organische Chemnie</baseNameString> </baseName> <occurrence> <scope><topicRef xlink:href="#vortrag"/></scope> <instanceOf> Copyright © [email protected] 98 Semantic Web Techniken für E-Learning <topicRef xlink:href="#website"/> </instanceOf> <resourceRef xlink:href="http://www.uni-kl.de/FBChemie/Scherer/Vorlesungen/OrganischeChemie.pdf"/> </occurrence> </topic> <topic id="SVGundXML"> <instanceOf><topicRef xlink:href="#titel"/></instanceOf> <baseName> <baseNameString>SVG und XML </baseNameString> </baseName> <occurrence> <scope><topicRef xlink:href="#vorlesung"/></scope> <instanceOf> <topicRef xlink:href="#website"/> </instanceOf> <resourceRef xlink:href="http://www.fhkl.de/SVGvorlesung.html"/> </occurrence> <occurrence> <scope><topicRef xlink:href="#seminar"/></scope> <instanceOf> <topicRef xlink:href="#website"/> </instanceOf> <resourceRef xlink:href="http://www.unikl.de/SVGseminar.html"/> </occurrence> </topic> <!--Hier kommen alle moeglischen Schlagwoerter , die in den verschiedenen Vorlesungen zu finden sind --> <topic id="schlagwort"> <baseName> <baseNameString>Schlagwort</baseNameString> </baseName> </topic> <topic id="kette"> <instanceOf><topicRef xlink:href="#schlagwort"/></instanceOf> <baseName> Copyright © [email protected] 99 Semantic Web Techniken für E-Learning <baseNameString>Kette</baseNameString> </baseName> </topic> <topic id="netze"> <instanceOf><topicRef xlink:href="#schlagwort"/></instanceOf> <baseName> <baseNameString>Netze</baseNameString> </baseName> </topic> <topic id="ATM"> <instanceOf><topicRef xlink:href="#schlagwort"/></instanceOf> <baseName> <baseNameString>ATM</baseNameString> </baseName> </topic> <!-- Jetzt kommt der grosse Vorteil von TopicMaps, naemlich die Zuordnung bzw. die Relationen (Beziehungen) zwischen den verschiedenen Topics (Themen) --> <topic id="ist-teil-von"> <baseName> <baseNameString>ist Teil der</baseNameString> </baseName> </topic> <association> <instanceOf> <topicRef xlink:href="#ist-teil-von"/> </instanceOf> <member> <roleSpec><topicRef xlink:href="#study_field"/></roleSpec> <topicRef xlink:href="#informatik"/> </member> <member> <roleSpec><topicRef xlink:href="#publisher"/></roleSpec> <topicRef xlink:href="#uni-kl"/> </member> </association> <association> <instanceOf> Copyright © [email protected] 100 Semantic Web Techniken für E-Learning <topicRef xlink:href="#ist-teil-von"/> </instanceOf> <member> <roleSpec><topicRef xlink:href="#study_field"/></roleSpec> <topicRef xlink:href="#informatik"/> </member> <member> <roleSpec><topicRef xlink:href="#publisher"/></roleSpec> <topicRef xlink:href="#fh-kl"/> </member> </association> <association> <instanceOf> <topicRef xlink:href="#ist-teil-von"/> </instanceOf> <member> <roleSpec><topicRef xlink:href="#Study_field"/></roleSpec> <topicRef xlink:href="#chemie"/> </member> <member> <roleSpec><topicRef xlink:href="#publisher"/></roleSpec> <topicRef xlink:href="#uni-kl"/> </member> </association> <topic id="lehrt in"> <baseName> <baseNameString>lehrt in</baseNameString> </baseName> </topic> <association> <instanceOf> <topicRef xlink:href="#lehrt in"/> </instanceOf> <member> <roleSpec><topicRef xlink:href="#creator"/></roleSpec> <topicRef xlink:href="#Prof. Mueller"/> </member> <member> Copyright © [email protected] 101 Semantic Web Techniken für E-Learning <roleSpec><topicRef xlink:href="#publisher"/></roleSpec> <topicRef xlink:href="#uni-kl"/> </member> </association> <association> <instanceOf> <topicRef xlink:href="#lehrt in"/> </instanceOf> <member> <roleSpec><topicRef xlink:href="#creator"/></roleSpec> <topicRef xlink:href="#Prof. Scherer"/> </member> <member> <roleSpec><topicRef xlink:href="#publisher"/></roleSpec> <topicRef xlink:href="#fh-kl"/> </member> </association> <topic id="befindet sich in"> <baseName> <baseNameString>befindet sich in</baseNameString> </baseName> </topic> <association> <instanceOf> <topicRef xlink:href="#befindet sich in"/> </instanceOf> <member> <roleSpec><topicRef xlink:href="#schlagwort"/></roleSpec> <topicRef xlink:href="#kette"/> </member> <member> <roleSpec><topicRef xlink:href="#titel"/></roleSpec> <topicRef xlink:href="#MultiMedia Vorlesung"/> </member> </association> <association> <instanceOf> <topicRef xlink:href="#befindet sich in"/> </instanceOf> Copyright © [email protected] 102 Semantic Web Techniken für E-Learning <member> <roleSpec><topicRef xlink:href="#schlagwort"/></roleSpec> <topicRef xlink:href="#kette"/> </member> <member> <roleSpec><topicRef xlink:href="#titel"/></roleSpec> <topicRef xlink:href="#Organische Chemie"/> </member> </association> <association> <instanceOf> <topicRef xlink:href="#befindet sich in"/> </instanceOf> <member> <roleSpec><topicRef xlink:href="#schlagwort"/></roleSpec> <topicRef xlink:href="#kette"/> </member> <member> <roleSpec><topicRef xlink:href="#titel"/></roleSpec> <topicRef xlink:href="#SVGundXML"/> </member> </association> <topic id="website"> <baseName> <baseNameString> web site </baseNameString> </baseName> </topic> <topic id="agrar"> <instanceOf><topicRef xlink:href="#study_field"/></instanceOf> <baseName> <baseNameString>Agrar Forst- und Ernaehrungswissenschaften</baseNameString> </baseName> </topic> <topic id="101-101"> <instanceOf> <topicRef xlink:href="#agrar"/> </instanceOf> Copyright © [email protected] 103 Semantic Web Techniken für E-Learning <baseName> <baseNameString>Landwirtschaft</baseNameString> </baseName> </topic> <topic id="1000-1999"> <instanceOf><topicRef xlink:href="#study_field"/></instanceOf> <baseName> <baseNameString>Humanmedizin</baseNameString> </baseName> </topic> <topic id="1001-1001"> <instanceOf> <topicRef xlink:href="#1000-1999"/> </instanceOf> <baseName> <baseNameString>Medizin</baseNameString> </baseName> </topic> <topic id="1101-1101"> <instanceOf> <topicRef xlink:href="#1000-1999"/> </instanceOf> <baseName> <baseNameString>Zahnmedizin</baseNameString> </baseName> </topic> <topic id="2000-2999"> <instanceOf><topicRef xlink:href="#study_field"/></instanceOf> <baseName> <baseNameString>Ingenieurwissenschaften</baseNameString> </baseName> </topic> Copyright © [email protected] 104 Semantic Web Techniken für E-Learning <topic id="2001-2030"> <instanceOf> <topicRef xlink:href="#2000-2999"/> </instanceOf> <baseName> <baseNameString>Architektur</baseNameString> </baseName> </topic> <topic id="2011-2011"> <instanceOf> <topicRef xlink:href="#2001-2030"/> </instanceOf> <baseName> <baseNameString>Architektur</baseNameString> </baseName> </topic> <topic id="2016-2016"> <instanceOf> <topicRef xlink:href="#2001-2030"/> </instanceOf> <baseName> <baseNameString>Innenarchitektur</baseNameString> </baseName> </topic> <topic id="2021-2021"> <instanceOf> <topicRef xlink:href="#2001-2030"/> </instanceOf> <baseName> <baseNameString>Raum- und Umweltplanung</baseNameString> </baseName> </topic> <topic id="2026-2026"> <instanceOf> Copyright © [email protected] 105 Semantic Web Techniken für E-Learning <topicRef xlink:href="#2001-2030"/> </instanceOf> <baseName> <baseNameString>Stadtplanung</baseNameString> </baseName> </topic> <topic id="2031-2031"> <instanceOf> <topicRef xlink:href="#2000-2999"/> </instanceOf> <baseName> <baseNameString>Architektur</baseNameString> </baseName> </topic> <topic id="3000-3999"> <instanceOf><topicRef xlink:href="#study_field"/></instanceOf> <baseName> <baseNameString>Kunst, Kunstwissenschaft</baseNameString> </baseName> </topic> <topic id="4000-4999"> <instanceOf><topicRef xlink:href="#study_field"/></instanceOf> <baseName> <baseNameString>Mathematik, Naturwissenschaften</baseNameString> </baseName> </topic> <topic id="5000-5999"> <instanceOf><topicRef xlink:href="#study_field"/></instanceOf> <baseName> <baseNameString>echts-, Wirtschafts- und Sozialwissenschaften</baseNameString> </baseName> Copyright © [email protected] 106 Semantic Web Techniken für E-Learning </topic> <topic id="6000-6999"> <instanceOf><topicRef xlink:href="#study_field"/></instanceOf> <baseName> <baseNameString>Sport</baseNameString> </baseName> </topic> <topic id="7000-7999"> <instanceOf><topicRef xlink:href="#study_field"/></instanceOf> <baseName> <baseNameString>Sprach- und Kulturwissenschaften</baseNameString> </baseName> </topic> <!-- Jetzt kommt ein weiterer Vorteil von TopicMaps, naemlich die Scopes --> <topic id="vorlesung"> <baseName> <baseNameString>Vorlesung</baseNameString> </baseName> </topic> <topic id="vortrag"> <baseName> <baseNameString>Vortrag</baseNameString> </baseName> </topic> <topic id="kurs"> <baseName> <baseNameString>Kurs</baseNameString> </baseName> </topic> Copyright © [email protected] 107 Semantic Web Techniken für E-Learning <topic id="seminar"> <baseName> <baseNameString>Seminar</baseNameString> </baseName> </topic> <topic id="videokonferenz"> <baseName> <baseNameString>Kurs</baseNameString> </baseName> </topic> <topic id="proseminar"> <baseName> <baseNameString>Kurs</baseNameString> </baseName> </topic> </topicMap> Copyright © [email protected] 108 Semantic Web Techniken für E-Learning 10 Abbildungen Abb. 1: Verschiedene Suchdienste _________________________________ 10 Abb. 2: „The 3rd Prophecy“ von Tim Berners-Lee _____________________ 10 Abb. 3: Topic BRD und seine Occurences (Bild, Dokumente, URL) ________ 17 Abb. 4: Topic Maps in 3D-Darstellung [Quelle: le Grand 2001] ___________ 17 Abb. 5: TAO (topics, Associations und Occurrences) ___________________ 22 Abb. 6: Fehler beim „compilieren“ einer XTM-Datei ____________________ 23 Abb. 7: Beispiel einer Topic Map __________________________________ 24 Abb. 8: Beispiel einiger Topics ____________________________________ 26 Abb. 9: TomatenTopic und seine Occurences ________________________ 27 Abb. 10: Occurences oder die reale Ausprägung der Topics _____________ 28 Abb. 11: Relation zwischen Tomaten und Salat _______________________ 33 Abb. 12: Rollen in der Assoziation _________________________________ 34 Abb. 13: Topics, Occurences und Relationen _________________________ 39 Abb. 14: AG.Prof.Müller als TopicMap ______________________________ 42 Abb. 15: AG.Prof.Müller in HTML __________________________________ 43 Abb. 16: „Overview of Ontopia Knowledge Suite“ ______________________ 45 Abb. 17: Welcome to the Omnigator ________________________________ 46 Abb. 18: Jill’s First TM ___________________________________________ 47 Abb. 19: employement-Portal _____________________________________ 48 Abb. 20: Jill Hacker-Portal _______________________________________ 49 Abb. 21: Ontopia vom Type company _______________________________ 49 Abb. 22: KnowledgeMiner von USU ________________________________ 51 Abb. 23: Graphische Darstellung __________________________________ 51 Abb. 24: Liste von Ergebnissen ___________________________________ 53 Copyright © [email protected] 109 Semantic Web Techniken für E-Learning Abb. 25: Graphische Darstellung eines Topics ________________________ 54 Abb. 26: TopicMapDesigner ______________________________________ 55 Abb. 27: TopicMapDesigner-Viewer ________________________________ 56 Abb. 28: Olivia’s Portal __________________________________________ 58 Abb. 29: Funktionen des Semantext ________________________________ 59 Abb. 30: Olivia’s Portal (Omnigator screenshot) _______________________ 60 Abb. 31: Eine TOLOG-Anfrage ____________________________________ 62 Abb. 32: E-Learning ____________________________________________ 66 Abb. 33: E-Learning mit dem Omnigator _____________________________ 67 Abb. 34: Kette als Schlagwort _____________________________________ 68 Abb. 35: Multimedia- Portal _______________________________________ 69 Abb. 36: Architektur des Trackers __________________________________ 70 Abb. 37: Login des E-Learning-Trackers ____________________________ 71 Abb. 38: Menü des Trackers ______________________________________ 72 Abb. 39: Search for Entry ________________________________________ 72 Abb. 40: Ergebnis der Anfrage „Kette“ ______________________________ 73 Abb. 41: Kette in der Vorlesung Datenstrukturen ______________________ 73 Abb. 42: Vorlesungen von Prof. Müller ______________________________ 74 Abb. 43: Display Entry __________________________________________ 75 Abb. 44: KartOO-Ergebnisse auf Java-Anfrage _______________________ 76 Abb. 45: Ergebnisse als Liste bei Lumrix Copyright © [email protected] 110 ___________________________ 78 Semantic Web Techniken für E-Learning 11 Tabellenverzeichnis Tabelle 1: Copyright © [email protected] Bedeutung des TAOs 111 17