1 Von den Suchmaschinen zum Semantic Web

Werbung
Diplomarbeit
Semantic Web Techniken
für
E-Learning
Younous El Moustafid
Juni 2003
Betreuer: Prof. Dr. Paul Müller
Dipl. Inform. Andreas Rippel
Fachbereich Informatik
AG Integrierte Kommunikationssysteme
Universität Kaiserslautern
 Postfach 3049
Kaiserslautern

67653
Ich versichere, dass ich die vorliegende Diplomarbeit selbständig verfasst und keine anderen
als die angegebenen Quellen und Hilfsmittel verwendet habe.
(Younous El Moustafid)
Widmung
Jetzt, wo der Moment gekommen ist, mich bei meinen Förderern zu bedanken,
fehlen mir die Worte. Ich versuche es aber trotzdem.
Diese Arbeit, die einen langen Weg erfolgreich abschließt, widme ich meinen
liebsten Menschen, die mich während meines ganzen Studiums begleitet haben, und
jetzt stolz auf mich sind. Allen voran meinen verstorbenen Eltern, die mir diesen
Werdegang mit viel Liebe und Unterstützung erst möglich gemacht haben. Meiner
Frau und meinem Sohn, die mich immer wieder aufgebaut haben, und vor dem
Aufgeben bewahrt haben. Meinen Geschwistern und meiner Schwiegerfamilie für
ihre moralische Unterstützung.
Bei dieser Gelegenheit möchte ich mich auch bei allen Professoren bedanken, die
mir was gelehrt haben. Ein großes Dankeschön aber auch an alle Personen (AAA,
Dekanat , etc... ), die mir mit Rat und Tat gestanden haben.
Semantic Web Techniken für E-Learning
ABSTRACT
Mit der zunehmenden Vernetzung entstehen immer mehr und größere
Informationsquellen, allen voran das World Wide Web. Immer mehr Wissen wird
immer „leichter“ verfügbar. Dadurch entstehen aber neue Probleme: wie findet man in
der gewaltigen Menge genau die Informationen, die man sucht, oder wie findet man
die Nadel im Heuhaufen?
Hier ein Zitat von John Naisbitt “ Wir ertrinken in Informationen und hungern nach
Wissen“ 1.
Eine Lösung könnten die Topic Maps sein, in dem sie das Wissen in bestimmten
Netzen beschreiben und Möglichkeiten zur Navigation in solchen Netzen bereitstellen.
Topic Maps sind „semantische Netze“, die bestehende Wissensnetze inhaltlich
beschreiben. Sie stellen eine standardisierte Darstellung über die Struktur von
Informationsbetriebsmitteln zur Verfügung, um Themen und deren Verhältnisse
untereinander austauschbar zu machen. Dabei müssen keine bestehenden
Dokumente geändert werden, sondern Topic Maps (auf Deutsch: Themendiagramme)
stellen eine zweite Schicht oberhalb der Dokumentenschicht dar, die das vorhandene
Wissen beschreiben und zueinander in Verbindung setzen. Im Allgemeinen umfassen
die strukturellen Informationen, die von Themendiagrammen übermittelt werden:

Zusammenfassung der ansprechbaren Informationen zu den Themen
und

die Verhältnisse und Beziehungen zwischen den Themen.
Ein Topic Map definiert einen mehr dimensionalen Themenraum, einen Raum, in dem
die Themen sind, und in welchem die Abstände wischen denen in der Zahl der
dazwischen liegenden Themen ausgedrückt messbar sind. Dabei kann auch die Art
der Verbindungen und Themen, die auf dem Pfad liegen, berücksichtigt werden. Als
Beispiel sei hier der Begriff Kette. Ein Anwender möchte sich genauer über das
Thema „Kette“ informieren. Gibt er diesen Begriff ein, werden ihm dann alle möglichen
Gebiete aufgezeigt, in denen, er was zum Thema „Kette“ findet, zum Beispiel: Aus der
Chemie (Kette als Molekülform) oder aus der Informatik (Kette „Liste“ als
1 Smolnik Topic Maps Darmstädter Kongress
.
Copyright © [email protected]
v
Semantic Web Techniken für E-Learning
Datenstruktur) etc. Mit Topic Maps kann der Anwender damit schneller zu seinen
Informationen gelangen.
Im Rahmen eines Projektes zum elektronischen Lernen werden Onlineressourcen, wie
Skripte und Tutorials, erfasst, die von Lehrkräften im Rahmen des universitären
Lehrbetriebs zur Verfügung gestellt werden. Diese Ressourcen werden von den
Erstellern mit verschiedenen Attributen wie Schlagworten versehen. Mit diesen
Attributen kann nachfolgend gesucht werden. Um den Aufbau dieses
Schlagwortkataloges zu strukturieren werden Themendiagramme eingesetzt.
Schlagworte:
Topic Maps, XTM, XML, TMQL, HTML, Suchmaschinen, RDF, Hytime, ISO 13250,
E-Learning, semantische Netze...
Copyright © [email protected]
vi
Inhaltsverzeichnis
Inhaltsverzeichnis
Copyright © [email protected]
9
1
Von den Suchmaschinen zum Semantic Web
2
2.1
2.2
2.3
2.3.1
2.3.2
2.3.3
2.3.4
Topic Maps
Geschichte der Topic Maps:
Die Entwurfsziele von XTM:
XML Topic Maps
XML
Younous El Moustafid ( wo ist Name und Vorname? ) in
HTML und XML
XTM Tutorial
HTML und XTM
21
23
44
3
3.1
3.1.1
3.1.2
3.1.3
3.2
3.2.1
3.2.2
3.3
3.4
3.4.1
3.4.2
Die TopicMaps-Tools und Abfragesprachen
Die kommerziellen Tools:
Ontopia
USU
Intelligent Views
Freie TopicMapsTools:
TopicMaps-designer:
Semantext
Fazit:
Abfragesprachen
Tolog
TMQL
46
46
46
52
54
57
57
59
63
64
64
65
4
4.1
4.2
4.3
4.3.1
4.3.2
Einsatzgebiete von TopicMaps
Der Einsatz von Topic-Maps in Webkatalogen
Der Einsatz von Topic-Maps in den Suchmaschinen
TopicMaps und E-Learning:
E-Learning mit dem Omnigator
E-Learning Tracker:
67
67
67
68
70
72
5
5.1
TopicMaps Suchmaschinen
KartOO
79
79
vii
16
16
17
19
19
Inhaltsverzeichnis
Copyright © [email protected]
5.2
Lumrix
80
6
Zusammenfassung und Ausblick
83
7
Abkürzungsverzeichnis
87
8
Literatur
88
9
Anhang
91
10
Abbildungen
109
11
Tabellenverzeichnis
111
viii
Semantic Web Techniken für E-Learning
1
Von den Suchmaschinen zum Semantic Web
Das Web hat heutzutage an Bedeutung immens gewonnen. Das ist die erste
Adresse weltweit, an die man sich wendet, um nach Informationen zu suchen.
Vor allem wegen der „scheinbaren“ Einfachheit der Handhabung, der leichten
Zugänglichkeit und der rund um die Uhr Verfügbarkeit dieser Variante der
Informationssuche. Man braucht nur einen Internetzugang, um mit der
Informationssuche zu beginnen.
Bei Milliarden von Informationen und Daten im Internet – Tendenz steigend –
braucht man einen Leitfaden um dadurch zu blicken. Die Lösung war –
Anfangs – Suchmaschinen zum Beispiel: Lycos, Google, Metacrawler oder
Altavista. Die haben aber selbst große Schwierigkeiten der unüberschaubar
großen Menge an Informationsressourcen und Dokumenten im World Wide
Web gerecht zu werden.
Die Themenkataloge wie Yahoo zum Beispiel, bieten zwar eine gute
Alternative zu diesen Suchmaschinen, da die Aufnahme neuer Seiten in
diesen manuell betreuten Suchdiensten und deren Einordnung in die
Datenbank von einer (menschlichen) Redaktion vorgenommen wird, die neu
angemeldete WWW-Seiten besucht, anschließend nach bestimmten Kriterien
klassifiziert und in eine thematisch orientierte Kategorie einordnet. Das hat
aber auch den Nachteil, dass dieser Webkatalog nur in einem stark
eingeschränkten Themenbereich oder Spielraum sucht.
Da entsteht wiederum das Problem, wie man diese Suchmaschinen
vernünftig benutzen kann. Gibt es eine Regel, wie man im Netz sucht und –
vor allem – findet?
Maurice Godelier2 hat es auf den Punkt gebracht, in dem er sagte:
„Mais faut- il qu’[un chercheur] sache autre chose que sa discipline pour
excercer sa discipline. Cela va de soi...Pourtant je ne crois pas (...)qu’ en
faisant cela on devienne interdisciplinaire. L’ interdisciplinarite est autre
chose. Elle ne peut se construire qu a partir d un travail d’equipe (…) sur la
base d ‘un presuppose evident, a savoir qu aucune approche specialisee n
epuise la connaissance d un objet, d une realite...“
Das heißt wohl, muss ein Wissenschaftler mehr als auf seinem Gebiet Wissen
erwerben um auf seinem Gebiet tätig zu sein? Dies bedeutet interdisziplinär
zu arbeiten. Interdisziplinarität bedeutet aber was anderes, sie kann nur aus
der Mitarbeit einer kompletten Gruppe entstehen.
2 Goldmedaille Gewinner bei CNRS 2001 zum Thema Suchmaschinen
.
Copyright © [email protected]
9
Semantic Web Techniken für E-Learning
Es gibt leider keine Regel, die Erfolg bei der Suche garantiert, dafür aber gibt
es zwei Varianten, wie man eine Suche durchführt:
KeyWord Suche: der Benutzer – kennt sich aus und – weiß ganz genau und
exakt was er sucht. Dem entsprechend formuliert auch seine Anfrage.
Information Browsing: der Benutzer weiß zwar, was er sucht, kann das aber
nicht richtig formulieren; und fängt mit einer allgemeinen Anfrage an, die sich
im Laufe der Suche konkretisiert.
Die zweite Variante ist – Laut einer Umfrage von Delphi – die meist benutzte,
denn fast 70 % der Suche im Internet verläuft auf dieser Weise.
Eine andere Möglichkeit ist: der Suchende kennt den exakten URL eines
Dokuments (was voraussetzt, dass man über dessen Existenz bereits im
Bilde ist) und benutzt es auch, oder man findet ein Dokument (von dessen
Existenz man bis dato noch nichts wusste) dadurch, dass man einem Link in
einem bereits bekannten bzw. gefundenen Dokument folgt.
Zwar gibt es Berechnungen, die besagen, dass zwei beliebige Dokumente im
World Wide Web statistisch betrachtet nie mehr als 19 "Klicks" von einander
entfernt liegen3, doch erscheint es angesichts vieler Millionen von im Netz
verfügbaren Dokumenten als relativ aussichtslos, bei einer gezielten
Themensuche ausgehend von einem bekannten Dokument genau die
richtigen 19 "Klicks" zu tätigen, um schließlich zu einem anderen Dokument
zu gelangen, welches genau diejenige Information bereithält, dessen man
gerade bedarf. Resultat eines solchen Online-Recherchierens nach dem
"Schneeballsystem" ist in der Regel nicht ein Gefühl der Befriedigung,
sondern das oft beschriebene - und eher frustrierende - "Lost in Cyberspace".
Unter Suchdiensten versteht man meistens Webkataloge und
Suchmaschinen, da man mit Hilfe dieser zwei Techniken seine Information im
Internet suchen kann.
SSuucchhdm
ieancshtein e n
W e b - K a t a lo g e
S u c h m a s c h in e n
Abbildung 1: Verschiedene Suchdienste
3
Tom Schimmeck
Copyright © [email protected]
10
Semantic Web Techniken für E-Learning
Und wie arbeiten jetzt diese verschiedenen Suchdienste? Warum sollte Topic
Maps anders sein?
Wie man bereits gesehen hat, sitzen bei den Web- Katalogen meistens
Menschen hinter dem Bildschirm und nehmen neue Seiten in die Datenbank
und ordnen sie ein. Diese neuen Seiten werden dann besucht und per Hand
nach bestimmten Kriterien und Gebieten einer bestimmten Kategorie
einsortiert. Die bekanntesten deutschen Web- Kataloge sind Yahoo
(www.yahoo.de) und Web (www.web.de).
Bei den Suchmaschinen und Suchrobotern setzt man auf maschinelle
Texterkennung. Dadurch erreicht man ein Vielfaches an Seiten, die ein
Mensch niemals erreichen wird. Diese Maschinen besitzen voll automatisierte
Suchprogramme (so genannte "robots", "crawler" oder "Webspinnen"), die
stets das Netz nach neu hinzugekommenen Seiten durchsuchen. Das ist aber
meistens mehr Masse statt Klasse. Das liegt darin, dass diese
Suchprogramme eine Strategie verfolgen, die die Frequenz bestimmter
Schlüsselwörter bestimmt. Letztlich jedoch indizieren die "Crawler" bei einer
neu aufgefundenen Seite den kompletten Volltext, d.h. jedes im Text der Seite
auftauchende Wort. Häufiger auftauchenden Wörtern wird dabei eine höhere
Relevanz für den Inhalt der jeweiligen Seite beigemessen als nur einzeln
auftauchenden Wörtern.
Ein gutes Beispiel um die Uneffektivität mancher Suchmaschinen zu zeigen,
ist die Suche nach dem Stichwort "Thomas Mann". Bei „Altavista“ (eine
Suchmaschine, die auf (fast) jede Anfrage eine (nicht unbedingt richtige)
Antwort hat) erhält man mehrere Tausend Treffer, von denen allerdings
diejenigen als erste aufgeführt werden, denen das Programm auf der
Grundlage seiner Berechnungen die größte Relevanz beimisst. So kann es
bei einer Suchanfrage "Thomas Mann", die aus zwei suchrelevanten
Ausdrücken (nämlich "Thomas" und "Mann") besteht, geschehen, dass man
beispielsweise auch die Seite einer privaten Homepage als Treffer
ausgegeben bekommt, auf welcher der Autor über einen Kinobesuch mit
seinem Freund Thomas berichtet: "Mann, Thomas, sagte ich, lass uns doch
mal wieder ins Kino gehen...".4 Die bekanntesten deutschen Suchmaschinen
sind Altavista (www.altavista.de) und Lycos (www.lycos.de).
Dagegen ist die Suchmaschine Google (www.google.de) ein Beispiel
intelligenter Suchmaschinen, sie geht ein Stückchen weiter und sortiert
Webseiten nach den Links, die auf diese Seite verweisen. Jede Referenz
kommt einer Empfehlung gleich, das heißt, je mehr Links direkt oder indirekt
auf die Webseite zeigen, desto höher das Ranking5.
4’6’ Tom Schimmeck
5
Henning Behme
Copyright © [email protected]
11
Semantic Web Techniken für E-Learning
"Der Clou bei Google ist eine spezielle Software, die ihre Erfinder PageRank
getauft haben. Sie saugt nicht nur einfach Daten von Hunderttausenden von
Servern ab, sie untersucht auch das Beziehungsgeflecht im Web, stellt fest,
welche Links wohin verweisen. Und die Anzahl der Querverweise auf eine
bestimmte Seite entscheidet über deren Prominenz auf der GoogleErgebnisliste. Dabei spielt auch die Qualität der Seite eine Rolle, von der aus
ein Link eingerichtet worden ist: So zählt etwa ein von einer seriösen
Nachrichtenagentur ausgehender Hinweis mehr als der von einer privaten
Homepage“ 6.
Also suchen die Suchmaschinen nur und wirklich nur nach der Häufigkeit des
gesuchten Begriffs in den verschiedenen Quellen, und je nach Vorkommen
dieses Begriffs werden diese Seiten dann absteigend sortiert und angezeigt.
Der Metacrawler ist etwas effizienter in dieser Hinsicht, da er beide Techniken
der Suchdienste benutzt. Bei einer Anfrage an einem Metacrawler, schickt die
Maschine die Anfrage an verschiedene Suchmaschinen und Web-Kataloge
weiter, nimmt deren Ergebnisse und vergleicht sie mit den Ergebnissen ihrer
eigenen Datenbank. Das ist insofern (für den Benutzer) sehr gut, da er nicht
mehr viele Suchmaschinen besuchen muss, um eine gute Antwort
zubekommen. Dies wird ihm abgenommen. Diese Mischung aus Maschinen
(Suchmaschinen) und Menschen (Web-Kataloge) führt zu beachtlichen und
annehmbaren Ergebnissen.
Die bekanntesten Metacrawler sind www.metacrawler.com , auch in
Deutschland die in Hannover entwickelte Crawlermaschine www.metaGer.de.
Natürlich ist die Suche im Web besser und effektiver, vor allem durch Google
und Metacrawler. Am Schluss bleibt aber es trotzdem nur eine Suche nach
dem Begriff und nicht nach seinem Sinn. Ausschlaggebend für diese Suche
oder die manchmal Unmengen von Ergebnissen, die trotzdem nicht richtig
sind, ist ja, dass in HTML eine inhaltliche Beschreibung dieser Links bzw.
dieser Relationen zwischen den Links fehlt.
Das Problem wird deutlicher, wenn man einen Begriff sucht, der völlig
verschiedene Bedeutungen hat; man nehme das Webdominierende Wort
Java, was eine Programmiersprache sein kann, eine Insel oder gar ein
Kaffee.
Dies führt dazu, dass bei der Suche nach Java, die ersten - 50 - Seiten nur
die Programmiersprache Java anzeigen, und gar nichts zu den anderen
Bedeutungen.
Und da erfahrungsgemäß die Webbenutzer nur die ersten 10 bis 20
Suchergebnisse sichten, verzweifeln die meisten und geben die Suche
erfolglos auf.
Copyright © [email protected]
12
Semantic Web Techniken für E-Learning
Ein erster Begriff zur Behebung dieser Problematik ist unzweifelhaft XML, das
das Licht der Welt im Jahr 1997 erblickt hat. Dessen Aufgabe ist es,
Dokumente zu strukturieren und einzelnen Abschnitten durch eigene, frei
definierbare Tags zu identifizieren und eine Bedeutung zu verleihen. Denn,
XML erlaubt über HTML hinaus die Definition von Elementen, die sich für die
explizite Auszeichnung von Textinhalten verwenden lassen.
Der XML Text <Prüfungsergebnisse> XML Vorlesung</ Prüfungsergebnisse >
ermöglicht es einem Programm, den Zusammenhang zwischen XML und
Vorlesung zu erkennen. Darüber hinaus klassifiziert das Element den
Zusammenhang als Ergebnisse einer Prüfung. XML stößt aber auch an ihre
Grenze bei komplizierten Anfragen. So hat man angefangen an diesem
Problem zu arbeiten, um eine Lösung zu finden 7. Von „Topic Maps“ verspricht
man eine einfachere und vor allem eine kürzere und erfolgreiche Suche.
Der Standard ISO 13250 definiert eine austauschbare Darstellung von Topic
Maps in der Terminologie einer SGML Architektur. SGML ist die Bezeichnung
für die Standard Generalized Markup Language. Es handelt sich hierbei um
eine komplexe Metasprache, die 1986 standardisiert wurde. SGML
gewährleistet die Unabhängigkeit der Auszeichnung8 von Informationen, mit
semantischen Elementen9, von der Ausgabe.10 Eine Topic Map ist im Grunde
ein SGML (oder XML) Dokument, in dem verschiedene Elementtypen,
abgeleitet von einer Basismenge von Architekturmasken, benutzt werden um
Topics, Occurrences von Topics und Beziehungen zwischen Topics zu
modellieren.11 Die Abkürzung XML steht für eXtensible Markup Language.
XML ist eine vereinfachte Teilmenge von SGML, die für Web-Umgebungen
optimiert wurde, also für kurzlebige Informationen.
1999 begann die Arbeitsgruppe TopicMap.org einen Webstandard für Topic
Maps, basierend auf der ISO 13250, zu entwickeln. Dieser Standard wird als
XTM bezeichnet. Die Abkürzung XTM steht für XML Topic Maps. Das
Erstellen und Anwenden von Topic Maps zu erleichtern ist die Zielsetzung
von Topic Map.org, allerdings nicht nur beschränkt auf Internetanwendungen.
„Topic Maps“ ist ein Standard, Wissensstrukturen zu beschreiben und diese
mit Informationsressourcen zu verbinden12. Holger Rath von „Empolis“
bezeichnet Topic Maps als Lösung zur Organisation und Navigation der
immer größer werdenden Informationsmengen13. Topic Maps basieren auf
XML, Dadurch wird gewährleistet, dass die Texte durch entsprechende
explizite Auszeichnungen semantisch qualifiziert werden, damit sie
kontextbezogen verwertet werden können - im Gegensatz zur einfachen
7
IX 11/2002 Seite 104.
8
Behme, H./Mintert.
9
Rath, H. H. (1999).
10
Behme, H./Mintert.
11
Rath, H. H. (1999).
12
Pepper.
13
Holger Rath.
Copyright © [email protected]
13
Semantic Web Techniken für E-Learning
Volltextsuche in HTML-Dokumente. Während die Volltextsuche nur die
Inhalte der Informationsquellen auflisten kann, wertet dieser neue Ansatz
Metastrukturen über die eigentlichen Inhalte aus. Die Trennung von
Struktur und Dokumenten ermöglicht dabei die Pflege und Nutzung der
Struktur unabhängig von den Dokumenten.
Warum die Autoren – und die immer mehr werdenden Firmen bzw. Benutzer dieser Technik auf „Topic Maps“ schwören, wird ausführlich in den nächsten
Kapiteln behandelt.
In dieser Einleitung hat man einige Techniken der Suchmaschinen,
Metacrawler gesehen. Dann hat man den Weg von HTML über XML zu XTM
verfolgt.
Im nächsten Kapitel wird man die Geschichte von TopicMaps betrachten, die
schon Anfang der Neunziger Jahre begann. Dazu kommen noch drei
Beispiele, in denen dann diese Technik nach und nach erklärt wird.
2003
1997
Semantic
1991
Universal
Unified
http://
XML
Topic Maps ?
Abbildung2: „The 3rd Prophecy“ von Tim Berners-Lee14
14 W3C-Direktor .
Copyright © [email protected]
14
Semantic Web Techniken für E-Learning
Abbildung 2 stammt von Tim Berners-Lee, der damit aussagen will, dass die
Idee des Semantic Web nach HTTP und XML als die dritte InternetRevolution gilt15.
15 Tim Berners-Lee.
Copyright © [email protected]
15
Semantic Web Techniken für E-Learning
2
Topic Maps
2.1
Geschichte der Topic Maps:
Die Geschichte der Topic Maps liegt über einen Jahrzehnt zurück. Sie begann
1991. Unterschiedliche Firmen aus der Computerindustrie hatten ein Problem,
über das dann die ACM-Hypertext Konferenz in Texas diskutiert wurde. Das
Problem fasst Steven Newcomb so zusammen:
„Zu dieser Zeit hatte die „Digital Equipement Corporation“, der Verlag O’Reilly
and Associates, die „Open Software Foundation“ und andere ein Problem: Sie
wollten alle O’Reillys "X-Window" Dokumentation gemeinsam mit ihren
eigenen Usermanuals für Equipment und Systeme verwenden. Die Idee
tauchte auf, dafür einen Masterindex zu schaffen, der alles beinhalten sollte.
Sie wollten also alles miteinander kombinieren, sodass User nicht mehr in
sechs verschiedenen Indizes nachsehen müssten, sondern nur mehr in einem
einzigen, um das zu finden was sie suchen."16
Der Versuch der Davenport Group einen Master Index über Hardware, UnixBetriebssystem und den verfügbaren Programmen zu erstellen, scheiterte
schließlich. Jedoch blieben Michel Biezunski und Steven Newcomb dran, an
der Lösung des Problems. So begann die Geschichte des Topic Maps, das
1996 ein ISO-Projekt wurde. 1999 wurde Topic Maps der ISO-Standard mit
der Nummer 13250 verliehen.
Anfang des Jahres 2000 wurde von einem unabhängigen Konsortium
TopicMaps.Org unter Vorsitz von Biezunski und Newcomb gegründet, mit
dem Ziel, die Anwendbarkeit des Paradigmas auf das WWW zu entwickeln,
um sein enormes Potential beim Auffinden und der Verwaltung von
Information zu verbessern.
Es hat also fast ein Jahrzehnt gedauert, bis die Systematik, die
Stichwortverzeichnissen innewohnt, als Topic Map-Standard hervorging: Das
Stichwort verbunden mit dem Vorkommen bildet das „TAO“ der Topic Map:
16 matrix.orf.at/bkframe/020616_1.html
.
Copyright © [email protected]
16
Semantic Web Techniken für E-Learning
Bezeichner
Analogie
Beispiel
Topic
Stichwort, Begriff,
Thema
Prof. Müller, Mozart,
Tisch
Assoziation
Verbindung, Beziehung
„lehrt in“, „geboren in“,
„isst“
Occurence
Auftreten, Vorkommen
Webseite, Artikel, Video
Tabelle 1: Bedeutung des TAOs
„Allgemein kann man sagen dass Topic Maps ein standardisiertes Modell
und eine Architektur für die gezielte Navigation, Informationssuche und –
Auffindung in großen Datenmengen darstellt, in dem sie ein semantisch
strukturiertes Netzwerk innerhalb dieser Informationsmengen bilden“17.
Trotz (oder vielleicht gerade aufgrund) der Trivialität dieses Modells ist es mit
Topic Maps möglich, recht komplexe Strukturen abzubilden oder bestehende
zu erweitern.
Was sind aber die Entwurfsziele dieser Technologie? Was kann man mit
dieser erreichen?
2.2
Die Entwurfsziele von XTM:
XTM wurde entwickelt mit dem Ziel, die Anfragen durchzuführen, bei denen
andere Techniken versagen. Eine solche Anfrage wäre zum Beispiel:
„ Welche Opern wurden von deutschen Komponisten komponiert, die von
Mozart beeinflusst waren?“.
Die Struktur der Topic Maps sieht einfach aus, ist sie ja auch, aber es steckt
ein gezieltes Prinzip dahinter. Nämlich, Topic Maps sind (ISO-Standard
ISO/IEC 13250) eine den konkreten Dokumenten übergeordnete Struktur, die
Verknüpfungen thematisch miteinander zusammenhängender Dokumente
ermöglicht.
Was für Topic Maps spricht, sei dass, sie die Strukturierung von großen
Datenmengen vereinfachen. Damit ermöglichen sie eine Erleichterung der
Suche und Navigation in großen Datenbeständen und vor allem und das ist
sehr wichtig zu erwähnen, sie bieten eine dokumentenunabhängige
Möglichkeit zur Strukturierung von Informationen (siehe Abbildungen 3 und
4). Sie werden daher von Hans Holger Rath und anderen Entwickler dieser
Technik als das „GPS des Web“ bezeichnet.
17 Smolnik/TopicMapsKongress in Darmstadt.
Copyright © [email protected]
17
Semantic Web Techniken für E-Learning
BRD
http://www.brd.de/
Abbildung 3: Topic BRD und seine Occurences (Bild, Dokumente, URL)
In der ersten Schicht sind die Topics, in der zweiten und in der dritten Schicht
sind dann ihre Vorkommnisse (Occurences).
Copyright © [email protected]
18
Semantic Web Techniken für E-Learning
Abbildung 4: Topic Map in 3D Darstellung [Quelle: le grand 18 WWW 2001]
Hier werden einige Ziele von Topic Maps:
2.3

Einfache Anwendung von XTM im Internet

Unterstützung zahlreicher Anwendungen durch XTM

Kompatibilität von XTM mit XML, XLink und ISO 13250

Einfache Erstellung von Anwendungen, die XTM Dokumente
verarbeiten

Die Anzahl der optionalen Merkmale in XTM soll auf einem
absoluten Minimum gehalten werden (im besten Fall keine)

Gute Lesbarkeit und Verständlichkeit von XTM-Dokumenten

Schnelle Erstellung des XTM-Designs

Das XTM-Design soll formal und knapp sein

XTM-Dokumente sollen einfach zu erstellen sein

Der Umfang der XTM- Auszeichnung (markup) ist von
geringerer Bedeutung.
XML Topic Maps
XML Topic Maps ist das Ergebnis der Portierung des auf HyTime und SGML
beruhenden ISO-Standards nach XML. Im nächsten Abschnitt wird erklärt,
warum man bei der Erstellung von Topic Maps auf XML und nicht auf HTML
gesetzt hat. Aber davor, eine kurze Erläuterung, zu XML, danach kommt ein
kleines Beispiel, um die Unterschiede HTML XML zu zeigen.
2.3.1 XML
Diese erweiterte Markup-Sprache XML (eXtensible Markup Language) ist ein
Dokumentenverarbeitungsstandard, der vom World-Wide-Web-Konsortium
(W3C) vorgeschlagen wurde – demselben Gremium, das auch für die
Überwachung des HTML-Standards verantwortlich ist. Als sie 1997 das Licht
der Welt erblickte, hat man HTML wenig Überlebenszeit im Netz eingeräumt
[HTML wird aber trotzdem überleben, denn Web-Seiten werden auf lange
Sicht auch weiterhin in HTML entwickelt. Für eine private Homepage oder
Informationsseiten mit Daten, die sich nicht ständig ändern und automatisiert
angepasst werden müssen, ist es nicht unbedingt erforderlich, XML zu lernen
oder gar zu benutzen]. Denn HTML war „begrenzt“; man hat ein bestimmtes
Kontingent von Tags, das man benutzen kann, und mit dem man zu Recht
18 www.rp.lip6.fr/~blergrand/indexEng.html.
Copyright © [email protected]
19
Semantic Web Techniken für E-Learning
kommen muss. Das Manko bei HTML sind die strikten Vorgaben, die man
folgen muss, und somit entfällt die Möglichkeit eigene Tags zu definieren.
Dazu kommt noch, dass in HTML nichts über den Inhalt ausgedrückt wird.
Man hat nur den Text und HTML verhilft einem, das so aussehen zu lassen,
wie man es haben will. XML dagegen macht das möglich. Sie gibt einem die
Möglichkeit seine eigenen Tags zu definieren, um so mehr aus seinen
Informationen zu machen. Diese Tags werden meistens semantische Tags
genannt, weil sie dadurch dem Inhalt eine Semantik geben. XML ist nicht nur
sehr präsent in den Topic Maps (RDF und anderen Techniken ...), sondern ist
das Lebenswerk dieser neuen Technologien, denn ohne sie wären diese
Technologien gar nicht entstanden.
Robert Eckstein formulierte XML, in seinem XML- Buch, so: „ XML ist eine
Metasprache, die es erlaubt, eigene Dokumenten- Markups (auch Tags
genannt) zu schaffen und ein Dokument damit zu formatieren“ 19.
So wie HTML festgelegt und normiert ist und daher für den weltweiten
Austausch und die Übertragung und Verwendung von Webpages zwischen
vielen verschiedenen Web-Servern und Web-Browsern geeignet ist, so kann
man mit XML eigene Datei-Strukturen für verschiedene Zwecke definieren
und normieren, die dann ebenfalls von vielen Personen mit vielen
verschiedenen Programmen und auf vielen verschiedenen Rechnern
verwendet werden können. Mit der Hilfe von Style-Sheets können XMLDokumente ebenfalls, so wie HTML-Files, von Web-Browsern dargestellt und
ausgedruckt werden.
Wofür kann man nun solche mit XML definierten Markup-Sprachen, so
genannte "XML-Applikationen", verwenden? Welchen Zweck kann es haben,
mit XML solche Sprachen festzulegen und zu normieren? Welche Vorteile
haben solche XML-Anwendungen gegenüber HTML oder anderen DateiFormaten, und wann stößt XML an ihre Grenzen?
Mit XML kann man die logische Bedeutung von Daten, Informationen und
Texten definieren - ähnlich wie die Tabellen- und Spalten-Bezeichnungen in
Datenbanken und Tabellenkalkulationen.
XML ermöglicht im Gegensatz zu HTML die Definition eigener oder
zusätzlicher "Befehle" (Tags) - ähnlich wie bei der Definition von Macros in
der Textverarbeitung.
XML- Applikationen eignen sich als Plattform- und Software-unabhängiges
Austausch-Format für Daten zwischen verschiedenen Programmen und
Rechnern - ähnlich wie RTF für Texte, CVS für Tabellen, EDI für
kommerzielle Anwendungen - aber in einem einheitlichen, allgemein
verwendbaren, Hersteller-unabhängigen Format20.
19 Robert Eckstein.
20 Hubert Partl.
Copyright © [email protected]
20
Semantic Web Techniken für E-Learning
2.3.2 Younous El Moustafid ( wo ist Name und Vorname? ) in HTML und
XML
Um die Unterschiede HTML XML besser verstehen zu können, gerade im
Hinblick auf Web Semantic, betrachte man den folgenden HTML-Kode.
<p>
<em>Younous <b>EL Moustafid</b></em>
<br>
studiert in
<br>
<em> Kaiserslautern </em>
<br>
Geburtsmonat August
</p>
bewirkt eine Darstellung wie:
Younous EL Moustafid
studiert in
Kaiserslautern
Geburtsmonat August
Hier wird höchstens El Moustafid fett angezeigt und zusammen mit
Kaiserslautern und Younous hervorgehoben. Aber, dass es sich um einen
(gerade als nicht europäischer Name, bei dem man sowieso nicht den
Nachnamen vom Vornamen unterscheiden kann) geht oder Vornamen, kann
man nur erahnen. Aber wie geht das denn bei XML? Wie kann man was
hervorheben?
Für die Modellierung in XML kann man Tags definieren, die die Bedeutung
der Informationen angeben. Mit einer geeigneten DTD (Eine DTD beschreibt
die Struktur einer Klasse von SGML oder XML- Dokumenten, also einer mit
Hilfe eines Text-Files, das alle Syntax-Regeln in einem von SGML
vorgeschriebenen Format enthält. Beispielsweise ist jede HTML- Version
durch eine DTD definiert) kann die obige Information also in einem XMLDokument in der folgenden Form enthalten sein:
<vorname> Younous </vorname>
<nachname> El Moustafid </nachname>
studiert in
<ort> Kaiserslautern </ort>
<geburtsmonat> August </geburtsmonat>
Mit einem geeigneten Style-Sheet „XSL“ bewirkt das XML-Dokument genau
dieselbe Darstellung wie das obige HTML-Dokument. Und da kann eine
Suchmaschine El Moustafid die Bedeutung Nachname zuordnen. Das ist
wichtig, wenn man die logische Bedeutung einer Information haben will um
die Information verarbeiten zu können.
Copyright © [email protected]
21
Semantic Web Techniken für E-Learning
Als Beispiel nehme man die Suche innerhalb von Absätzen <p> in HTMLFiles der obigen Struktur nach dem Geburtsmonat August. Als Ergebnis kriegt
man nicht nur die Personen geliefert, die im August geboren sind, sondern
auch den Prinz mit dem Namen Prinz Von August sowie alle Personen, die in
der Augusterstraße wohnen.
Eine Suche nach dem Wort "August" innerhalb der in den XML- Files mit
<Geburtsmonat> bezeichneten Elemente würde hingegen wirklich nur die
Personen liefern, die in diesem Monat Geburtstag haben.
Andere Feinheiten (oder Notwendigkeiten) bietet XML , wie zum Beispiel die
Möglichkeit , die in den XML- Files beschriebenen Personen leicht nach den
einzelnen Datenfeldern sortiert zu bekommen, also z.B. nach der Postleitzahl
oder nach dem Geburtsjahr, oder das Durchschnittsalter berechnen oder
andere Verarbeitungen der Daten vornehmen21. .
Mit Hilfe von XML hat man jetzt den Begriffen Younous, El Moustafid und
Kaiserslautern eine Bedeutung gegeben, wie kann man aber das gleiche mit
dem Verhältnis zwischen El Moustafid und Kaiserslautern machen, nämlich
der Relation „studiert in“ eine Semantik geben. „studiert in“ ist in XML nicht
anderes als ein unstrukturierter Text ohne Bedeutung, dagegen ist Younous
ein Vorname, El Moustafid ein Nachname und Kaiserslautern ein Ort.
Das ganze kann man umgehen, in dem man ein neues Tag definiert
(Aussage), das wiederum aus den Tags Student und Ort besteht. Und dies
sieht dann so aus:
<Aussage>
<Student> Younous El Moustafid </Student>
<Ort> Kaiserslautern </Ort>
</Aussage>
So hat man dann eine Aussage, von der man verstehen kann, dass „Younous
EL Moustafid“ Student ist, und sein Ort Kaiserslautern ist. Anderes kann man
das nicht formulieren. An dieser Stelle weiß XML nicht weiter, und genau hier
zeichnet sich XTM aus und löst dieses Problem ganz geschickt, in dem sie
„studiert in“ als Relation definiert (Stärken von TM) und als solche wird sie
auch von den (XTM) Suchmaschinen verstanden.
In diesem Ausblick hat man schon den Unterschied zwischen HTML und XML
gesehen, und dabei gesehen, wie weit man mit XML gehen kann; man hat
aber auch gesehen, dass XML gerade bei unstrukturierten Texten auch nicht
mehr weiß, und dass trotz der Möglichkeit selbst eigene Tags definieren zu
können, man manches nicht mit XML realisieren kann.
Im nächsten Kapitel geht es um die Techniken der Topic Maps, ihre
Grundlagen, ihre Vor- und Nachteile, gerade im Hinblick auf Relationen.
21 Hubert Partl.
Copyright © [email protected]
22
Semantic Web Techniken für E-Learning
2.3.3 XTM Tutorial
In diesem Tutorial werden Anhand von Beispielen die Schritte erläutert, die
man durchgehen muss, um zu einer „TopicMap“ zu gelangen. Dabei werden
die Tags ausführlich erklärt, die benutzt werden. Unter www.topicmaps.org
sind aktuelle Tutorials verfügbar.
In XTM wird man häufig diese drei Begriffe hören: Topics (Themen),
Associations (Assoziationen) und Occurrences (Vorkommensangaben)
[Abbildung 5]- das TAO des Standards. Sie sind die Bausteine einer Topic
Map. Die Themen spiegeln die Konzepte, Ideen, Objekte, Dinge etc wider,
über die die TopicMap etwas aussagen soll. Ein Thema trägt einen oder
mehrere Namen. Vorkommensangaben verbinden die Themen mit
Ressourcen (Dokumente, Bilder, Audio, Video und so weiter), die relevante
Information zu dem Thema enthalten. Assoziationen schließlich beschreiben
die semantischen Beziehungen zwischen Themen.
Abbildung5:
TAO (topics, Associations und Occurrences)
Eine Assoziation ist nicht nur eine Verbindung zwischen zwei Themen. Sie
kann beliebig viele Themen (Association Members, Mitspieler) in eine
Beziehung stellen. Und welche Rolle die Themen in der Beziehung spielen,
definieren Member Roles (Mitspielerrollen). Jedes assoziierte Thema spielt
genau eine Rolle - die wiederum ist ebenfalls ein Thema. Das Rollenkonzept
bestimmt, dass eine Assoziation keine Richtung besitzt. Die ausgedrückte
Beziehung gilt dementsprechend für jedes der beteiligten Themen.
Themen, Assoziationen und Vorkommensangaben lassen sich klassifizieren,
das heißt, sie können Instanzen einer oder, im Fall von Themen, mehrerer
Klassen sein. Das Besondere ist, dass die Klassen selbst Themen sind - die
wiederum Instanzen anderer Klassen sein können. Topic Maps sind deshalb
eines der wenigen Paradigmen mit Klassen, die gleichzeitig wieder Instanzen
sein können. Ein mächtiges Modellierungsmittel mit Tücken. Man kann leicht
durcheinander kommen. Ein gut vorbereitetes Design hilft (siehe
Copyright © [email protected]
23
Semantic Web Techniken für E-Learning
Abbildung11), die Übersicht zu behalten, deshalb am besten immer ein
Schema vor den Augen halten, um die Topic Maps richtig zu implementieren.
Hier wurde bewusst das Wort „implementieren“ benutzt, da XTM auch als
Programmiersprache in Betracht gezogen werden kann. Als Beispiel nehme
man das Ontopiatool Omnigator. Das Tool compiliert die XTMDatei bevor es
sie darstellt, und gibt Fehlermeldungen aus, wenn ein Fehler aufgetreten ist.
Abbildung6:
Fehler beim „kompilieren“ einer XTM-Datei
Um eine Topic Map darzustellen, soll man ihr erstmal einen Namen geben,
am besten einen über den Inhalt der TopicMap aussagenden Namen, den
man auch nach Jahren wieder erkennen kann, und muss mit dem Tag
<topicMap> beginnen. Und wie bei XML, muss man natürlich die Tags auch
beenden, das geschieht normalerweise mit dem verwendeten Tag, davor der
Schrägstrich, in diesem Falle dann </topicMap>.
2.3.3.1 Beispiel1:
Copyright © [email protected]
24
Semantic Web Techniken für E-Learning
Das nächste Beispiel wird nach und nach mit Informationen gefüllt und die
Tags nach und nach erklärt und hinzugefügt. Die Tags werden zuerst so
erklärt, wie es in dem TAO der topicmaps.org steht, und dann auf deutsch
zusammengefasst.
<topicMap>: [is collection of topics and associations between them]
Im TAO der www.topicmaps.org wird <topicMap> so erklärt
1. A collection of topics, associations, and scopes that may exist in one of two forms:
1. a serialized interchange format (e.g. as a topic map document expressed in
XTM syntax), or
2. some application-internal form, as constrained by the XTM Processing
Requirements defined in Annex F.
2. The document element (<topicMap>) of a topic map document expressed using
XTM syntax.
Hier aber erstmal ein Beispiel, das den Begriff Maus zeigt, mal als Tier und
mal als Fachbegriff in der Computerwelt.
Copyright © [email protected]
25
Semantic Web Techniken für E-Learning
Abbildung7: Beispiel einer Topic Map22.
„Käse“, „Maus“, „Speedy Gonzales“, „Tastatur“ sind alle Topics.
„frisst“, „is a“, „erfindet“ etc... sind die Associations.
Das Bild von „Douglas Engelbart“, „seine Biographie“ etc sind in diesem Falle
Occurences.
Hier kann man zwei Scopes (wird später erklärt) sehen, Tierwelt und
Computer.
Definition: Jede TopicMap beginnt mit dem Tag <topicMap>. Dadurch wird
die Kennzeichnung einer Topic Map vorgenommen. Topic Map generell ist
eine Ansammlung von TAO, nämlich Topics (Themen, oder wie Richard
Wilhalm23 es in seinem Buch genannt hat: Ding), Assoziationen(oder
Relationen) und Occurences (Vorkommnisse). Die Topics sind durch
22 www.hypermedia-texte.de.
Copyright © [email protected]
26
Semantic Web Techniken für E-Learning
Relationen oder Assoziationen liiert, und vorhanden in den verschiedenen
Occurences. Diese Topics spielen alle in der Assoziation eine Rolle.
Rolle: Das Tag <TopicMap> erlaubt man die Deklaration einer TopicMap. Der
Name der TopicMap ist optional und kann deshalb auch leer bleiben .
Syntax: Die Deklaration von <topicMap> geschieht normalerweise immer am
Anfang jeder XTM-Datei. Und zwar genau nach der Deklaration der XMLVersion. Hier ein Beispiel der Deklaration der TopicMap:
<topicMap id=“TomatenTopicMap“
xmlns=http://www.topicmaps.org/xtm/1.0
xmlns:xlink=http://www.w3.org/1999/xlink>
... Inhalt der TopicMap ...
</topicMap>
Nach <topicMap> kommt als erstes die Deklaration der verwendeten Topics.
<topic>: Subjects“– anything worth describing (names, properties,
documents ...)
Was ist ein Topic? Antwort: alles24.
Abbildung 8: Beispiel einiger Topics
Definition: Die Topics sind sehr wichtig in einer TopicMap. Die sind die
Hauptelemente einer TopicMap. Ein Topic ist ein elementares Subjekt im
Kontext des modellierten Wissens, eine Entität. Es kann alles Beschreibbare
23, 24 Herausgeber des Buchs: Topic Maps SpringerVerlag 2002.
Copyright © [email protected]
27
Semantic Web Techniken für E-Learning
sein, eine Person, ein Ausspruch, ein Land, ein Gegenstand, ein Wort, eine
Zahl, oder ganz einfach ein Ding.
Rolle: Mit dem Tag <topic> (definiert) kreiert man ein Topic in einer
TopicMap.
Syntax:
<topic id=“Tomaten”“>
Hier kommt der Inhalt des Topics
</topic>
Tomaten
http://www.tomaten.de/gesc.html
Abbildung 9: TomatenTopic und seine Occurences
<baseName> und <baseNameString>:
A child element (<baseName>) of a <topic> element.
A name characteristic of a topic that is provided by the content of a
<baseNameString> element. Base names must be unique within a given
scope
Copyright © [email protected]
28
Semantic Web Techniken für E-Learning
Definition: Mit baseName wird der Name des Topics deklariert. Das ist eine
Zeichenkette, die mittels <baseNameString> als Name eines Topics
spezifiziert wird. Dieser Name ist die Identifikation des Topics in der
Außenwelt.
Rolle: Mit baseString kriegt das Topic eine Bezeichnung, mit der es in der
ganzen TopicMap identifiziert und angesprochen wird.
Syntax:
<topic id=“Tomaten“>
<baseName>
<baseNameString> Tomaten</baseNameString>
</baseName>
</topic>
Mit der eindeutigen Nummer "id", die jedes Topic innerhalb der Topic Map
kriegt, wird dieses Topic intern identifiziert, und angesprochen; Mit dem
baseName wird dieses Topic für die externe Welt sichtbar und bekannt.
<occurence> und <ressourceRef>:
occurrence is a child element (<occurrence>) of a <topic> element.
occurrence type
One of the classes of topic occurrence.
The class of topic occurrence specified by an <occurrence> element's
<instanceOf> child element. An occurrence may belong to only one class.
A topic whose subject is a class of topic occurrence.
Definition: Mit topic-occurrence bezeichnet man den Ort, in dem sich die
relevanten Ressourcen dieses Topics befinden. Beispiele für Ressourcen
können Bücher, Artikel, Grafiken, Internetseiten oder Personen sein.
Rolle: Mit dem Tag <occurence> leitet man den Informationssucher weiter,
und zwar in der Seite in der das Dokument zu finden ist. Es können mehrere
Occurences pro Topic eintreten. Sogar Videobänder, Bilder oder Personen
können mögliche Occurences sein. In der nächsten Abbildung sieht man die
Occurences des Topics Tomaten, das sind ein Bild, eine URL und einige
Kochbücher mit Tomaten...
Max Müller
Copyright © [email protected]
29
Semantic Web Techniken für E-Learning
Abbildung10: Occurences oder die reale Ausprägung der Topics
Syntax:
<topic id=”Tomaten”>
<occurence>
<resourceRef xlink:href=”Tomaten.gif”/>
</occurence>
</topic>
Mittels eines <resourceRef> Elements referenziert man auf eine Ressource,
die der Gegenstand ist.
<subjectIdentify> und <subjectIndicatorRef>
A subject indicator is a resource that is intended by the topic map author to
provide a positive, unambiguous indication of the identity of a subject. When
two topics use the same resource to indicate their subject, they are by
definition “about” the same thing, and must therefore be merged during
processing
Mit <resourceRef> (das bereits oben benutzt wurde), topicRef-Element und
das subjectIndicatorRef-Element kennzeichnet man Subjekt Indikatoren, die
in XTM definiert sind, um die Identität eines Subjekts eindeutig zu
beschreiben, bzw. die Identität eines Subjektes anzuzeigen.
Zu den „Subject Indicators“ sagte Steve Pepper25:
„Topic Maps orientieren sich nicht am Namen, sondern sozusagen an einer
eigens definierten Identifikationsnummer, eben den subject Indicators. Diese
entsprechen der Idee der Postleitzahlen oder Sozialversicherungsnummern“.
Definition: Unter subjectIdentify kann man einen Personalausweis verstehen,
der dieses Subjekt identifiziert, und von anderen Subjekten unterscheidet.
Jedes Subjekt kann nur eine einzige Identifikation haben.
Rolle: <subjectIdentify> hat als Rolle, das Topic eine genaue Bezeichnung zu
geben, damit nicht nur der Mensch was darunter versteht, sondern auch eine
Maschine. Um dies zu realisieren wird auf die Referenz <subjectIndicatorRef>
verwiesen. In diesem Beispiel ist das eine Internetadresse (diese Seite ist
erfunden und existiert nicht) der Firma Tomaten.
Syntax:
<topic id=”Tomaten”>
<subjectIdentity>
< subjectIndicatorRef
xlink:href=”http://www.tomaten.de/tomaten.html”/>
25 Steve Pepper
Copyright © [email protected]
30
Semantic Web Techniken für E-Learning
</ subjectIdentity >
</topic>
<scope> und <topicRef>
scope
1. The extent of the validity of a topic characteristic assignment. The
context in which a name or an occurrence is assigned to a given topic, and
the context in which topics are related through associations.
2. The set of topics specified via a <scope> element
Ein Zitat von einem XTM-Entwickler Steve Pepper zu Scopes: „The purpose
of scope, simply stated, is to allow the topic map author to express the limits
within which such assertions (or characteristic assignments) have validity. “
SCOPE ermöglicht dem User also verschiedene Ansichten, Sichtweisen oder
Weltanschauungen auszudrücken, welche von einem vorliegenden Kontext
abhängen.
Scope aus dem englischen übersetzt, hat viele Bedeutungen wie zum
Beispiel: Abgrenzung, Handlungsspielraum, Zuständigkeitsbereich, Rahmen
etc... In XTM wird nur der Begriff Gültigkeitsbereich benutzt, da jedes Topic
(Themen, Assoziation oder Occurence) nur in einem bestimmten Bereich
dann Gütigkeit hat.
Definition: Scope oder Gültigkeitsbereich ist der Kontext, in dem dann diese
Topics gelten und vorallen Dingen, die Relationen zwischen den Topics.
Wichtiger noch sind die Vorkommnisse (Occurences), denn je nach Bedarf,
Sicherheit, Gebrauch oder Sprache kann man seinen Topics verschiedenen
Occurences zuweisen. Mit <baseName> gibt man dem Topic einen „Sinn“.
Denn die Id ist nur für interne Zwecke gedacht. <baseName> ist für die
externe Bezeichnung zuständig. Ein Student aus dem französischen Raum
würde Schwierigkeiten haben, den Sinn eines Topicnamen „Frieden“ zu
verstehen. So definiert man pro Scope einen <baseName>(Siehe unten) , in
dem auch der Name verständlich ist, für die Leute , die in diesem Scope
arbeiten oder passen. So anstatt „Frieden“, kann man das gleiche Topic mit
dem Namen „Paix“ aber in einem anderen Scope (für französisch) definieren.
Rolle: Mit dem Tag <scope> kann man den Kontext eingrenzen, innerhalb
dem die Namen und Ressourcen als die Namen-, Ressourcen- und RelationsMerkmale des topics betrachtet werden können
Syntax: Scopes helfen nicht nur um die Topics in anderen Sprachen zu
definieren - dazu kommt noch ein Beispiel – sondern um Gültigkeitsbereiche
klar zu defnieren: privat oder public, vertraulich oder nicht vertraulich, dick
oder dünn, mit Vordiplom oder ohne...letzteres kann man bei Kursen im ELearning benutzen, man kann Vorlesungen nach Niveaus definieren, zum
Beispiel ein Student im Grundstudium darf keinen Zugriff auf Vorlesungen des
Hauptstudiums haben. Gerade bei begriffen wie Java, Paris, Kette oder wie in
Copyright © [email protected]
31
Semantic Web Techniken für E-Learning
der Abbildung 7 Maus, also generell Worte, die Mehrdeutigkeiten haben, ist
es wichtiger ihre Gültigkeitsbereiche einzugrenzen. Ein Beispiel hierfür ist das
Wort „Bank“. Das kann ein Geldinstitut sein, kann aber auch ein Holzstück
sein, auf dem man sitzen kann. Um diese verschiedenen Gütigkeistbereiche
des gleichen Begriffs dann auseinander zu halten, benutzt man eben diese
Scopes.
Die Scopes müssen aber auch deklariert bzw. definiert werden ( nicht
vergessen: Alles ist ein Topic), un das geht wie folgt aus:
<topic id=“Fr“>
<subjectIdentity>
<subjectIndificatorRef
xlink:href=://www.topicmaps.org/xtm/1.0/language.xtm#fr“/>
</ subjectIdentity >
</topic>
<topic id=“de“>
<subjectIdentity>
<subjectIndificatorRef
xlink:href=://www.topicmaps.org/xtm/1.0/language.xtm#de“/>
</ subjectIdentity >
</topic>
Hier werden dann die scopes definiert, die später benutzen werden. Mit
xlink:href=://www.topicmaps.org/xtm/1.0/language.xtm#de verweist man auf
die topicmaps.org Seite, in der dann die Sprachen eindeutig definiert sind.
So und nun kommen wir zu den Topics einerseits auf Deutsch, und anderseits
auf Französisch:
<topic id=“Tomaten“> //Der Name des Topics
<baseName>
// jetzt kommt der Scope, in dem dieser Name gültig ist
<scope>
// Hier beginnt der Gültigkeitsbereich
<topicRef xlink:href=“de“/> // Verweis auf das Topic „de“
</scope>
// Ende des Scopes
<baseNameString> Tomaten </baseNameString> // Hier ist nur Tomaten relevant
</baseName>
// Ende des BaseNamen
<baseName>
<scope>
<topicRef xlink:href=“fr“/>
</scope>
<baseNameString> tomates </baseNameString>
</baseName>
</topic>
Copyright © [email protected]
// Ende des Topics Tomaten
32
Semantic Web Techniken für E-Learning
So, es ist bis jetzt alles schön und gut, was bisher gemacht wurde; Aber
bisher hat man die große Kunst (meiner Meinung nach) der XTM noch gar
nicht erwähnt, nämlich diese Relationen oder Assoziationen zwischen den
verschiedenen Topics. Zu jeder Relation gehören (wie bekannt ist) zwei
Seiten. Diese Seiten sind in diesem Falle Topics (noch mal, alles was mit
XTM zutun hat, ist ein Topic, sogar diese Relationen sind ja auch Topics,
später mehr), die Mitglieder einer Relation sind, und dabei jeder eine Rolle
spielt und übernimmt.
<association> und <member>: Links between topics
– they are nodes of a certain type
– they link topics by assigning roles
An association is a relationship between one or more topics, each of which
plays a role as a member of that association. The roles a topic plays in
associations are among the characteristics that can be assigned to it and are
therefore governed by scope. Each individual association is an instance of a
single class of association (also known as an association type) that may or
may not be indicated explicitly. The default association type is defined by the
“association” published subject.
There is no directionality inherent in an association. (Associations describe
relationships: If A is related to B, then B must also be related to A. The issue
is rather, what is the type of the relationship, and what roles are played by its
members. The question of how to label a relationship is one of naming, not
direction.)
<member> : A member is a set of topics that play a particular role in an
association.
Definition: Assoziation ist eine Relation, die zwischen mindestens Zwei
Topics besteht. Sie wird auch durch ein Topic definiert, dessen Name sie in
der XTM tragen wird.
Rolle : <association> drückt den Zusammenhang zwischen verschiedenen
Topics verständlich aus. Dabei kriegt jedes beteiligte Topic eine Rolle in
dieser Relation.
Syntax : Eine Assoziation tritt in Erscheinung, wenn man mindestens zwei
Topics hat, die was miteinander zu tun haben. Also muss man erstmal ein
zweites Topic deklarieren, das am besten zum Topic Tomaten passt.
<topic id=“Salat“>
<baseName>
<baseNameString>der Salat </baseNameString>
</baseName>
</topic>
So, jetzt hat man zwei Topics „DieTomaten“ und „Salat“, und die müssen mit
einer Assoziation vereint werden, die jetzt (Einfachheitshalber) den Namen:
„association_Tomaten_Salat“ kriegt. Mit Member wird betont, dass dieses
Topic ein Mitglied dieser Relation ist.
Copyright © [email protected]
33
Semantic Web Techniken für E-Learning
<association id=“association_Tomaten_Salat“> // Deklaration der Association
<member>
// Deklaration des ersten Mitglieds
<topicref xlink: href=”Tomaten”/>
// Verweis aud das erste Topic
</member>
// Ende der ersten
Mitgliedsdeklaration
<member>
// Deklaration des zweiten Mitglieds
<topicref xlink: href=”Salat”/> // Verweis auf das Zweite Topic
</member>
// Ende der zweiten
Mitgliedsdeklaration
</association>
// Ende der Asssociation
Erwähnt wurden auch Rollen, die jedes Topic einer Relation auch spielt. Dies
wird mit Hilfe des Tags <roleSpec> gemacht.
TomatenSalat
Assoziaton
Tomaten
Abbildung11:
Salat
Relation zwischen Tomaten und Salat
<roleSpec>:
The <roleSpec> element specifies the role played by a member in an
association.
Definition: Dieses Tag bestimmt die Rolle aller zu einer Relation gehörenden
Topics. Natürlich kann das gleiche Topic mehrere Rollen in verschiedenen
Associationen spielen, wie zum Beispiel: Schröder hat die Rolle
Bundeskanzler in der Relation „regiert“, und Deutschland die Rolle „Land“.
Also Schröder regiert Deustchland. Eine andere Rolle kann er auch spielen,
z.B: MinisterPräsident des Bundeslandes Niedersachsen, also Schröder hat
die Rolle: Ministerpräsident, Nidersachsen die Rolle: ein Bundesland, und die
Relation koennte heissen: „Schroeder_Ministerpräsident _Niedersachsen“ .
Rolle: Das Element <roleSpec> gibt die Art der Rolle an, die das Thema in einer
relation oder Association einnimmt.
Syntax :
<association id=“association_Tomaten_Salat“>
<member>
<roleSpec>
Copyright © [email protected]
34
Semantic Web Techniken für E-Learning
<topicRef xlink : href=”Zutaten”>
</roleSpec>
<topicRef xlink : href = “Tomaten“>
</member>
<member>
<roleSpec>
<topicRef xlink : href=”Vorspeise”>
</roleSpec>
<topicRef xlink : href = “Salat“>
</member>
</association>
Zutaten
Tomaten
Vorspeise
TomatenSalat
Assoziaton
Salat
Abbildung12: Rollen in der Assoziation
Hier spielt der Salat die Rolle: Vorspeise, und das Topic Tomaten die Rolle:
Zutaten. Zutaten und Vorspeise wurden schon benutzt, aber noch nicht
deklariert, denn jedes benutzte „Ding“ muss (wie mehrfalls erwähnt) deklariert
werden, das wird jetzt nachgeholt:
<topic id=“Salat“>
<baseName>
<baseNameString>Salat </baseNameString>
</baseName>
</topic>
<topic id=“Zutaten“>
<baseName>
<baseNameString> Zutaten </baseNameString>
</baseName>
</topic>
Hier wurde ein kleines Beispiel erläutert, in dem ein Paar Tags erklärt wurden.
Natürlich gehören mehrere Tags noch zu XML TopicMaps, von denen auch
einige im nächsten Beispiel vorkommen werden. XTM basiert ja vor allem auf
den Begriffen <instanceOf>, Oberklassen und Unterklassen. In dem zweiten
Beispiel , werden dann die Begriffe Unterklassen, Oberklassen und Instanzen
vorkommen und werden klargemacht, begleitet von einem Schema oder
Design, das die Arbeit vereinfachen wird.
2.3.3.2 Beispiel 2
Copyright © [email protected]
35
Semantic Web Techniken für E-Learning
In diesem Beispiel, werden nur die Tags ausführlich erklärt, die im ersten
Beispiel nicht erwähnt worden sind, oder zu kurz gekommen sind. Hier geht
es um eine Diplomarbeit.
Zuerst deklariert man die Topics:
Die Personen, die in diesem Projekt „Meine DA“ mitwirken, sind Younous
(ich), der Betreuer Andreas Rippel und der Leiter der Arbeitsgruppe Prof. Dr.
P. Müller.
Prof. Müller ist Leiter der RHRK, lehrt Informatik an der UniversitätKaiserslautern.
Andreas Rippel ist Assistent von Prof. Müller, betreut Praktikum, und diese
D.A.
Younous ist Student an der Uni Kaiserslautern, macht eine D.A.
Die Topics “Younous”, ”Rippel” und ”Prof. Mueller” werden deklariert:
<topic id="younous">
<instanceOf><topicRef xlink:href="# mitarbeiter "/>
</instanceOf>
<baseName>
<baseNameString>Younous EL Moustafid</baseNameString>
</baseName>
<occurrence>
<instanceOf>
<topicRef xlink:href="#website"/>
</instanceOf>
<resourceRef xlink:href=”http://www.younous.de/ ”/>
</occurence>
</topic>
<!-- weiterer Mitarbeiter -->
<topic id="rippel ">
<instanceOf><topicRef xlink:href="# mitarbeiter "/>
</instanceOf>
<baseName>
<baseNameString>Andreas Rippel </baseNameString>
</baseName>
<occurrence>
<instanceOf>
<topicRef xlink:href="#website"/>
</instanceOf>
<resourceRef
xlink:href=”http://www.icsy.de/personen/mitarbeiter/rippel”/>
</occurence>
</topic>
<!-- weiterer Mitarbeiter -->
Copyright © [email protected]
36
Semantic Web Techniken für E-Learning
<topic id="mueller">
<instanceOf><topicRef xlink:href="# mitarbeiter "/>
</instanceOf>
<baseName>
<baseNameString>Prof. Dr. Paul Mueller </baseNameString>
</baseName>
<occurrence>
<instanceOf>
<topicRef xlink:href="#website"/>
</instanceOf>
<resourceRef xlink:href=”http:// www.icsy.de/personen/leiter/”/>
</occurence>
<occurrence>
<instanceOf>
<topicRef xlink:href="#website"/>
</instanceOf>
<resourceRef xlink:href=”http:// www-agmueller.informatik.de/leiter/”/>
</occurence>
</topic>
Bei Professor Müller sind zwei Occurrences vorhanden, um zu zeigen, dass
es möglich ist, mehrere Occurences gleichzeitig zu haben. Diese Occurences
können alles Mögliche sein, nicht nur URL. Es können die Mailadresse, ein
Bild, ein Worddokument oder eine Telefonnummer sein.
Hier hat man 3 Topics als Instanzen vom Topic Mitarbeiter deklariert, das
noch gar nicht existiert. Das wird jetzt nachgeholt, die Reihenfolge der Topics
ist unwichtig.
Also jetzt wird Mitarbeiter als Oberklasse mit der Id „mitarbeiter“ deklariert:
<topic id=”mitarbeiter”>
<baseName>
<baseNameString> Mitarbeiter der AG Mueller </baseNameString>
</basename>
</topic>
…das gleiche mit dem Topic “Website”
<topic id=”website”>
<baseName>
<baseNameString> die Webseite </baseNameString>
</basename>
</topic>
Hier wird diese Diplomarbeit als Instanzen von Arbeit deklariert (die wiederum
auch deklariert werden muss).
<topic id=”DA”>
Copyright © [email protected]
37
Semantic Web Techniken für E-Learning
<instanceOf>
<topicRef Xlink:href=“#arbeit“>
</instanceOf>
<baseName>
<baseNameString> Diplomarbeit </baseNameString>
</basename>
</topic>
<topic id=”arbeit”>
<baseName>
<baseNameString> Arbeit </baseNameString>
</basename>
</topic>
<topic id=”uni-kl”>
<baseName>
<baseNameString> Universität Kaiserslautern
</baseNameString>
</basename>
</topic>
<topic id=”RHRK”>
<baseName>
<baseNameString> das Rechenzentrum
</baseNameString>
</basename>
</topic>
<topic id=”Praktikum”>
<baseName>
<baseNameString> Praktikum </baseNameString>
</basename>
</topic>
Es wurden also folgende Topics deklariert:
Younous, Mueller, Rippel als Instanzen von Mitarbeiter
Uni-kl, RHRK, Praktikum und Arbeit.
Diplomarbeit als Instanz von Arbeit.
Jetzt werden die Assoziationen deklariert, um die Zusammenhänge zwischen
den Verschiedenen Topics klarzustellen.
<association id=“sucht“>
<member>
<topicRef xlink : href = “#younous“>
</member>
<member>
<topicRef xlink : href = “arbeit“>
</member>
</association>
Copyright © [email protected]
38
Semantic Web Techniken für E-Learning
<association id=“betreut“>
<member>
<topicRef xlink : href = “#rippel “>
</member>
<member>
<topicRef xlink : href = “#DA“>
</member>
</association>
<association id=“leitet“>
<member>
<topicRef xlink : href = “#mueller “>
</member>
<member>
<topicRef xlink : href = “#rhrk“>
</member>
</association>
um das zu verkürzen, wird nur auf diese Relationen, und Topics beschränkt.
Ein ausführlicheres Beispiel unserer elektronischen Universität ist am Schluss
der Ausarbeitung zu finden.
In Komplexeren Wissensnetzen bilden Themen-Klassen eine Hierarchie
(Taxonomie). Sie lassen sich nicht mit der Klasse-Instanz-Realtion erstellen.
Hierzu ein Beispiel, anlehnend an dieser Stelle am Beispiel von Holger
Rath26, nämlich:

Younous ist eine Instanz der Klasse Mensch,

Mensch ist eine Instanz der Klasse Spezies,

Mensch ist eine Unterklasse der Klasse Säugetier,

Für Younous gilt: er ist eine Instanz der Klasse Säugetier, aber er ist
keine Instanz der Klasse Spezies.
Somit sieht man, dass die Oberklasse-Unterklasse-Relation transitiv ist, die
Klasse-Instanz-Relation hingegen nicht.
Das schon benutzte Topic „Person“...
<topic id=”person”>
<baseName>
<baseNameString> Personen </baseNameString>
</basename>
</topic>
26 Holger Rath ist Mitglied des ISO-Gremiums.
Copyright © [email protected]
39
Semantic Web Techniken für E-Learning
Und Jetzt wird die Oberklasse-Unterklasse-Relation deklariert
<association id=“personSuperklasseVonMitarbeiter“>
<instanceOf>
<subjectIndicatorRef xlink:href=
"http://www.topicmaps.org/xtm/1.0/core.xtm#superclasssubclass"/>
</instanceOf>
<member>
<roleSpec>
<subjectIndicatorRef xlink:href=
"http://www.topicmaps.org/xtm/1.0/core.xtm#superclass"/>
</roleSpec>
<topicRef xlink:href="#person"/>
</member>
<member>
<roleSpec>
<subjectIndicatorRef xlink:href=
"http://www.topicmaps.org/xtm/1.0/core.xtm#subclass"/>
</roleSpec>
<topicRef xlink:href="#mitarbeiter"/>
</member>
</association>
„Person“ ist die Superklasse von „Mitarbeiter“. Und umgekehrt ist „Mitarbeiter“
eine Subklasse von „Person“. Dies wird durch die Assoziation
„personSuperklasseVonMitarbeiter“.
Während HyTime völlig offen lässt, wie eine solche Relation in einer Topic
Map angegeben werden kann, definiert XTM drei PSIs für die AssoziationsKlasse Superclass - Subclass und deren Rollen Ober- und Unterklasse, die
später benutzt werden.
Copyright © [email protected]
40
Semantic Web Techniken für E-Learning
Personen
ist
Unterklass
e von
Arbeit
sucht
Mitarbeiter
www.ag-müller.informatik.uni-kl.de
www.ElMoustafid.de
ElMoustafid
Rippel
Prof.Müller
assistiert
studiert
uni-kl
macht
lehrt
Informatik
betreut
Diplom Arbeit
Praktikum
leitet
uni-kl
www.icsy.de/
Personen/
Leiter
RHRK
www.icsy.de/personen/mitarbeiter/
rippel
Abbildung 13: Topics, Occurences und Relationen
In der Assoziation „personSuperklasseVonMitarbeiter“ wird
<subjectIndicatorRef> benutzt, das ist ein sehr wichtiges und nützliches Tag
in XTM. Das ist ein Link zu einer beliebigen digitalen Ressource, die ein
Element eindeutig definiert. Mit Hilfe dieser Published Subject Indicators
(PSIs) wird auf die Topics anderer Topic Maps verwiesen, wenn diesen
dieselbe Idee (Subject) innewohnt. So könnte ein Topic Map-Prozessor die
„Bedeutung“ eines speziellen Topics nachverfolgen und Topics aus externer
Quelle, z. B. beim Zusammenführen (merging) mehrerer Topic Maps, als ein
Topic ansehen, dem die gleiche Idee innewohnt zum Beispiel PSI für
Sprachen oder Länder ( siehe erstes Beispiel). Künftig will
OASIS(Organisation for the Advencement of Structured Information Standard)
die Registrierung und Definition der PSIs übernehmen.
Apropos merging: Man kann auch verschiedene Topic Maps verschmelzen
lassen, wenn sie vom gleichen Thema reden. Angenommen, man hätte ein
Thema komplett entwickelt, und gleichzeitig hätte jemand anderes das gleiche
an der Universität Paris in Frankreich gemacht, die ja mit der Universität
Kaiserslautern kooperiert. So, wie kann man dann aus zwei eins machen,
oder wie kann man beide miteinander verschmelzen lassen? Was passiert mit
den Charakteristika der Themen beim Zusammenführen?
Themen werden zusammengeführt, wenn sie das gleiche Subjekt
repräsentieren. Die Namensgleichheit der Themen ist kein ausreichendes
Kriterium für die Identität der repräsentierten Subjekte (siehe nur das Beispiel:
Bank als Geldinstitut oder Bank als Sitzmöglichkeit; Java als
Copyright © [email protected]
41
Semantic Web Techniken für E-Learning
Programmiersprache oder Java als Kaffee). Themen, die das gleiche Subjekt
meinen, können in den Topic Maps wiederum unterschiedliche Namen haben.
Erste Regel ist: besitzen zwei Themen den gleichen Namen im gleichen
Scope, dann können sie zusammengeführt werden.
Die zweite Regel ist: Wenn Themen auf ein Subjekt mit gleichen SubjektIndikator verweisen, werden sie ebenfalls gemergt. Das ist auch einer der
Hauptgründe, warum man Subjekt-Identitäten definiert hat. Mischen findet
auch beim Importieren einer XTM- Datei in eine Software beziehungsweise
beim interaktiven Anlegen neuer Themen statt. Nicht vergessen, dass beim
Mischen die Vereinigungsmengen der Charakteristiken zu bilden sind. Für
Namen und Vorkommensangaben ist das einfach. In Assoziationen spielt das
`neue', zusammengeführte Thema die Rollen der Ausgangsthemen. Duplikate
werden entfernt. Der Mischprozess ist so lange durchzuführen, bis keine
Themen mehr zusammengeführt werden müssen. Das ist soweit sehr wichtig,
da man das auf Grund der Größe der Topic Maps das kaum mit der Hand
machen kann27.
2.3.3.3 Linear Topic Map LTM
Linear Topic Map Notation ist eine abkürzende Schreibweise für Topic Maps.
Wurde von der Firma Ontopia entwickelt und wird noch nicht von vielen Tools
unterstützt. Sie stellt zur Verfügung die Topic Maps im Textformat und nicht
mehr im XMLFormat. Dadurch soll das ganze kompakter und einfacher
werden28.
Steve Pepper hatte die Idee, eine lineare Notation für Topic Maps analog zu
der der konzeptionellen Graphen zu entwickeln. Diese Notation kann in
jedem Editor geschrieben und gelesen werden, und wird von manchen (nicht
von allen) TopicMapsTools unterstützt. Man könnte dieses Format auch mit
den entsprechenden Tools wie dem Omnigator in XML Format konvertieren
und sich das dann ganz normal mit den verschiedenen Tools als XTM
angucken.
Unter der folgenden Webseite kann man sich diese Notation ausführlich
anschauen http://www.ontopia.net/download/ltm.html#N60.
Hier wird ein Beispiel diese spezielle Notation ans Licht bringen. Es werden
ein Paar Topics deklariert sowohl im XTMFormat als auch im LTMFormat um
die Unterschiede sichtbar zu machen.
Younous EL Moustafid ist Student. Also muss erstmal das (ober)topic Student
deklariert werden.
27 Holger Rath.
28 http://www.ontopia.net/download/ltm.html#N60
Copyright © [email protected]
42
Semantic Web Techniken für E-Learning
Mit [student] hat man eigentlich das schon realisiert. Es ist sogar möglich
darauf zu verzichten und der LTMProzessor das für den Autor automatisch
machen zu lassen, das geht so:
[Younous: student = “Younous EL Moustafid“].
Das hat die gleiche Wirkung wie unter XTM folgendes:
<topic id=”student”>
<baseName>
<baseNameString> Student </baseNameString>
</basename>
</topic>
<topic id=”younous”>
<instanceOf>
<topicRef Xlink:href=“#student“>
</instanceOf>
<baseName>
<baseNameString> Younous EL Moustafid </baseNameString>
</basename>
</topic>
Hier sieht man schon den Riesenarbeitsaufwand den man mehr aufbringen
will, wenn man das in XTM Format schreiben will, das war ein sehr kleines
Beispiel. Das heißt, dass bei großen Daten in der Zukunft LTM eine große
Rolle spielen wird, vor allem wenn die Toolshersteller mitziehen und diese in
ihrer Entwicklung mit berücksichtigen.
Copyright © [email protected]
43
Semantic Web Techniken für E-Learning
2.3.4 HTML und XTM
Graphische Veranschaulischung der Topic Maps der AG. Prof.
Müller und der Verweise auf die Informationsquellen
AG.Prof.Mueller
Betreut
h
sic
igt
t
f
hä
sc mit
Be
Bie
tet
Und
auc
hm
it
Netzwerke
Praktikum zur
Bildkompression
Fritz-Walter-Stiftung
Ins
ta
vo nce
n
-
nceInsta n
vo
für
Zus
tän
dig
für
dig
tän
Zus
VorlesungAlsWebDatei
Zuständig für
Zus
tän
dig
für
Zus
tänd
ig fü
r
TCP-IP
r
ig fü
tänd
Zus
ATM
Alles rund ums
Internet
AllgemeinesZurAG.doc
A. Rippel 555-3333
M. Hillenbrand
B.Reuther 555-3333
Abbildung 14: AG.Prof.Müller als TopicMap
Das Bild zeigt ein “Gesamtbild” mit Hilfe von Topic Maps über die
Arbeitsgruppe von Prof. P. Müller an der Universität Kaiserslautern.

Die Arbeitsgruppe wird als <TopicMap> dargestellt und zeigt
folgendes: „Netzwerke“, „Fritz-Walter-Stiftung“, „Praktikum zur
Bildkompression“ und „alles rund ums Internet“ sind Topics.

Die Assoziationen sind zwischen den verschiedenen Topics zu
sehen, Beispiel „beschäftigt sich mit“, „betreut“ und „zuständig
für“ etc...

Die Occurences sind die Blätter dieser Zeichnung, zum Beispiel
„AllgemeinesZurAG.doc“, „B.Reuther 555-3333“ etc...
Der folgende Code ist ein Ansatz, wie man das machen kann.
<topic id=“AG.Prof.Mueller”>
<baseName>
<baseNameString> Die Arbeitsgruppe vom Professor Mueller </baseNameString>
</baseName>
Copyright © [email protected]
44
Semantic Web Techniken für E-Learning
<occurrence>
<resourceRef xlink:href=“http://www.icsy.de/AllgemeinesZurAG.doc”/>
</occurrence>
<occurrence>
<resourceData> B. Reuther, Tel. 555-3333 </resourceData>
</occurrence>
</topic>
Wie man das ausführlich realisieren kann, soll man im Unterkapitel 2.3.3
nachschauen.
Folgendes Bild zeigt, eine mögliche Realisierung in HTML.
Abbildung 15: AG.Prof.Müller in HTML
In der Abbildung 14 kann man schon die ganze Struktur der Arbeitsgruppe
sehen, in der Abbildung 15 muss man sich durch die Topics durchklicken.
Copyright © [email protected]
45
Semantic Web Techniken für E-Learning
3
Die TopicMaps-Tools und Abfragesprachen
Eine Teilaufgabe dieser Diplomarbeit bestand darin, die Topic-Maps Tools,
die auf dem Markt sind, durchzuchecken, denn davon gibt es mittlerweile eine
Menge sowohl kostenlose als auch kommerzielle.
Es gibt eine Reihe von kommerziellen TopicMapsTools, die viel versprechen.
Man muss diese (logischerweise) allerdings kaufen, um mit denen arbeiten zu
können. Es wurde bei einigen Firmen wegen Testversionen angefragt, leider
waren viele in dieser Hinsicht trotz intensiven Bemühungen wenig kooperativ,
und so blieben diese Anfragen meistens ohne Erfolg. Es besteht aber die
Möglichkeit, sich ein Bild von diesen Tools zu machen, mit Hilfe deren
Onlineversionen. Hier eine Reihe von Topic Maps Tools:

Kommerzielle Topic Maps Tools:
o
o
o
o
o
o
o
o

www.ontopia.net
www.usu.de
www.i-views.de
www.mondeca.com
www.oasis-open.org/cover/ontopiaNavigator20001117.html
www.empolis.de
www.wideman-one.com/gv/xm/index.html
www.agi-imc.de
freie Topic Maps Tools:
o
o
o
o
o
o
www.topicmap-designer.com
www.semantext.com
www.techquila.com
nexist.sourceforge.net/
www.goose-works.org
protege.stanford.edu/
Von diesen Tools werden Ontopia, USU, i-views, TopicMaps-Designer und
Semantext betrachtet:
3.1
Die kommerziellen Tools:
3.1.1 Ontopia
Ontopia ist eine in Oslo beheimatete Firma, die sich auf Topic Maps
spezialisiert hat. Sie befasst sich mit der Entwicklung, der Auswertung und
der Forschung von Topic Maps. Sie ist die erste Firma, die den Schritt
Richtung Vermarktung dieser Technik gegangen ist, da sie davon überzeugt
war. Das ist soweit verständlich, wenn man weiß, dass der Gründer der Firma
Copyright © [email protected]
46
Semantic Web Techniken für E-Learning
Ontopia Steve Pepper29 ist. Diese Firma verwirklicht die SoftwareAnwendungen auf der Basis von Topic Maps. Lösungen für Portale,
Erstellung von Content Management Systemen oder Intranet Applikationen.
Topic Map Engine und Web Navigator finden sich im Portfolio der Firma.
Topic Maps können auch unterschiedliche Softwareprogramme dazu
bewegen, gemeinsam auf einer anderen Ebene zusammen zu arbeiten.
Sozusagen auf neutralem Gebiete miteinander zu kommunizieren.
Abbildung 16: „Overview of Ontopia Knowledge Suite“
Der Ontopia Knowledge Suite besteht aus30’31:
29
www.ontopia.net
30
Smolnik, TopicMaps- Kongress Darmstadt 10/04/03
31
http://www.ontopia.net/solutions/products.html
Copyright © [email protected]
47
Semantic Web Techniken für E-Learning



Web Editor Framework -> zur Entwicklung von
Webapplikationen zur kollaborativen Pflege von Topic Maps.
Ful-text Search Integration –> Indexierung und Suche von Text.
Topic Map Query Engine -> „tolog“(proprietär; Migration auf

TMQL geplant.
Ontopia Navigator Framework
o XML-basierte Skriptsprache zur Topic-MapApplikationsentwicklung (J2EE-Konform).
o Tag-Bibliotheken
o Plug-ins (Statistik-Ausgabe, Merging, Export, Validating,
Query)
Ontopia kann man recht einfach downloaden und installieren. Nach der
Registrierung bei Ontopia32 erhält man eine E-Mail mit dem Link, von dem
man den Omnigator runterladen kann. Die Installationsvoraussetzung ist eine
Java2 Plattform und ein J2EE konformer Webserver (Jakarta-Tomcat v4.0.4).
Der Omnigator ist ein frei verfügbarer Topic Map Browser, der auch
Bestandteil des von Ontopia angebotenen Knowledge Suite Paketes,
bestehend aus Ontopia Topic Map Engine, Ontopia Navigator Framework,
Full-Text Search Integration und Topic Map Query Engine.
Abbildung 17: Welcome to the Omnigator
Die Topic Maps sind in zwei Variationen oben links zu sehen, im Hytime
Format und im XTM-Format.
Zum Verstehen der Topic Map Konzepte, bietet der Omnigator schon auf der
Startseite einige Topic Maps, die man laden kann, um das Prinzip zu
verstehen. Man kann auch seine eigenen Topic Maps ins Verzeichnis laden,
in dem sich auch die anderen Topic Maps befinden, um sich diese
anzusehen. Das Verzeichnis ist: „/jakarta-tomcat/webapps/omnigator/WEB32
www.ontopia.net/download/freedownload.html
Copyright © [email protected]
48
Semantic Web Techniken für E-Learning
INF/topicmaps“. Omnigator stellt dann die vorgeladene Topic Map als
einfache Hyperlinkstruktur, in der man mit Mausklicken recht weit und
erfolgreich kommen kann.
Um dieses Tool verstehen zu können, wird eine Topic Map Jill.xtm geladen
und einige Suchen durchgeführt. .xtm ist die Endung aller Topic Maps des
XTM-Standards; .hytime ist die Endung der Topic Maps des Vorgängers des
ISO-13250. Omnigator unterstützt auch LTM (linear Topic Map), ein Format,
das neu ist, und ist dabei sich durchzusetzen(siehe Beispiel 2.3.3.3 Linear
Topic Map).
Abbildung 18: Jill’s First TM
Wenn man die Topic Map Jill’s First TM lädt, sieht man unter Subject alle
definierten Topics, darunter die Relationen, die Rollen und die Ressourcen.
Wenn man jetzt auf employment klickt, erscheinen dann alle Topics, die mit
employement zu tun haben. Jill Hacker als Mitarbeiter und Ontopia als
Arbeitgeber.
Copyright © [email protected]
49
Semantic Web Techniken für E-Learning
Abbildung 19: employement-Portal
Unter der Rubrik Names stehen weitere Topics; wichtig hier sind die Scopes,
die die verschiedenen Gültigkeitsbereiche der Topics eingrenzen.
Welches Ergebnis man erhält, wenn man den employe Jill Hacker auswählt,
ist im folgenden Bilde zu sehen.
Diese Seite charakterisiert das Topic Jill Hacker, sie ist sozusagen das Portal
für diesen Mitarbeiter.
Copyright © [email protected]
50
Semantic Web Techniken für E-Learning
Abbildung 20: Jill Hacker-Portal
Der Mitarbeiter Jill Hacker besitzt die Assoziation „employed by“ in
Zusammenhang mit dem Topic „Ontopia“. Wenn man sich dann für Ontopia
interessiert kann man auf Ontopia gehen, und sich weitere Informationen zum
Unternehmen holen.
Abbildung 21 : Ontopia vom Type Company
Ontopia ist vom Typ Company, das heißt sie ist eine Instanz von einem
anderen Topic namens Company, hat eine Relation mit dem Topic „Jill
Hacker“ .Auf der rechten Seite sieht man die external Resources, in diesem
Copyright © [email protected]
51
Semantic Web Techniken für E-Learning
Falle eine Webseite, die wiederum ein Topic ist. www.ontopia.net ist die
Occurence, also die reale Ausprägung, des Topics Ontopia.
Der Omnigator holt alles raus, was in einer TopicMap stecken kann, und stellt
sie in Listen dar. Die Darstellung der Inhalte dieser Topicmaps und
Zusammenhänge erfolgt bei Ontopia rein auf Textbasis. Man kann von einem
Topic zum nächsten navigieren, eine graphische Sicht oder Repräsentation
der Topics oder Assoziationen wird aber nicht angeboten.
Durch diese textuelle Hyperlinkung kann man alle Topics der Topicmap
problemlos erreichen. Das Problem ist, dass man vorher wissen muss, wo
sich dieses Topic befindet. Eine Visualisierung, die einen schnellen und
einfachen Überblick über die gesamte Topic Maps ist nicht vorhanden, was
ein Nachteil für dieses Tool mit sich bringt.
Das Tool bietet auch folgende Funktionalitäten:
 Scopes, die Topic Map in verschiedenen Gültigkeitsbereichen
teilt, was zu einer effektiven und schnellen Suche führt.
 Merging von verschiedenen Topic Maps.
 Indexierung der Topic Map, die man per Hand explizit machen
muss, um in der Topic Map suchen zu können (das sollte man
eigentlich automatisieren, denn das wird meistens übersehen,
was das Können des Tools erheblich beschränkt).
 Einige Buttons in der Omnigatorleiste, bieten zusätzliche
Funktionen, wie zum Beispiel:
o Customising: Anpassung der Userinterface
o Manage: Managen der Topic Maps
o Full-Text Indexierung: zur Indexierung der Topic Map


Suchanfragen mit Hilfe der eigenen Sprache TOLOG
Mischen oder zusammenfassen von Topic Maps
3.1.2 USU
USU hat ein Engine mit dem Namen USU KnowledgeMiners entwickelt, das
dem ISO Standard 13250 entspricht und Topic Maps basiert ist. Dieses Tool
ist in Java programmiert und benötigt nur einen gängigen Browser auf der
User-Seite. Es verfügt über ein XML-API. Es ist in der Lage, Dokumente zu
analysieren, die Inhalte zu qualifizieren und in einer linguistischen Datenbank
abzuspeichern.
Copyright © [email protected]
52
Semantic Web Techniken für E-Learning
Abbildung 22: KnowledgeMiner von USU
Die technische Umsetzung des KnowledgeMiners erfolgt über Apache als
Webserver, Tomcat als Servlet-Engine und einem relationalen
Datenbankmanagementsystem (RDBMS) 33.
Es ist dem Benutzer möglich, durch verschiedene Suchansätze ein Thema zu
finden und weitere Informationen abzufragen. Der Benutzer kann sogar sich
von einem Begriff zum nächsten bewegen.
33 www.usu.de
Copyright © [email protected]
53
Semantic Web Techniken für E-Learning
Abbildung 23: Graphische Darstellung
Einige Vorteile dieses Tools sind34:

Die Möglichkeit der Suche in unstrukturierten und strukturierten
Daten.

Visualisierung der Begriffsstruktur

Semantische Suche in heterogenen Datenquellen durch den
Einsatz von Topic Maps

Suchen in Metadaten von Datenquellen durch den Einsatz von
Topic Maps

Kategorisierung von Dokumenten

Konfigurierbarer Filter

Graphische Darstellung des Wissens, mit Kanten für
Beziehungen und Knoten für die Topics, so erhält der Anwender
einen schnellen Themenüberblick und dadurch eine gute
Suchmöglichkeit (was man ja auch von Topic Maps erwartet).
Der USU KnowledgeMiner nutzt den Vorteil der Trennung der Struktur von
den ursprünglichen Dokumenten, was dazu führt, dass die Nutzung und vor
allem die Pflege der Struktur unabhängig von den Dokumenten ermöglichen.
3.1.3 Intelligent Views
Intelligent Views (i-views) ist 1997 aus dem Forschungszentrum
Informationstechnik, GMS-PSI, jetzt FhG-IPSI, hervorgegangen. Sie
beschäftigt sich mit dem Thema Wissensnetz. Unter der URL http://www.iviews.de/web/online_direkt.htm kann man die Onlineversion testen.
Wissensnetz wie Topic Maps verknüpft Daten zu einem sinnvollen Ganzen.
Aus einzelnen Informationen wird zusammenhängendes Wissen. Dabei bildet
das Wissensnetz eine eigene Schicht die Informationen, aus der man gezielt
und schnell auf seine Informationsobjekte zugreifen kann35.
Die Produkte von Intelligent Views lassen sich in drei Kategorien einordnen36:

Usage-Tools (Gebrauch und Auswertung)
34 TopicMapsKongress April2003 Vortrag von Smolnik
35 TopicMapsKongress April2003 Vortrag von Smolnik
36 http://www.i-views.de/web/pdfs/Whitepaper-K-Infinity.pdf
Copyright © [email protected]
54
Semantic Web Techniken für E-Learning
o Net-Navigator
o Layout-Engine

Editing-Tools (Entwurf und Erstellung)
o Knowledge-Builder
o Knowledge-Accelerator

Server-Tools (Integration in bestehende
Umgebungen)
o K-Infinity Server
o Semantic-Matcher
o Volltext-Search-Engine
Ein Vorteil dieser Software liegt auf der graphischen Darstellung und der
semantischen Suche von Inhalten und Zusammenhängen. Außerdem gibt es
Werkzeuge, die es ermöglichen, Dokumente auszuwerten und Begriffen
zuzuordnen.
Eine Suche nach dem Begriff „Obst“ würde folgendes Ergebnis liefern:
Copyright © [email protected]
55
Semantic Web Techniken für E-Learning
Abbildung 24: Liste von Ergebnissen
Der i-Views-Net-Navigator liefert folgendes graphisches Bild aus:
Copyright © [email protected]
56
Semantic Web Techniken für E-Learning
Abbildung 25: Graphische Darstellung eines Topics
Die graphische Oberfläche verhilft dem Benutzern ein grobes Bild über die
verschiedenen Topics zu werfen. Wenn man dann auf ein Topic klickt, wird es
dann in die Mitte gerückt, und die mit ihm verwandten Topics werden darum
abgebildet.
3.2
Freie TopicMapsTools:
Unter den vielen freien TopicMapsTools, die im Netz sind, werden hier
Semantext, TopicMaps-Designer betrachtet:
3.2.1 TopicMaps-designer:
Topic Map Designer ist ein „Tool“, das aus einer Diplomarbeit an der
Universität Dresden im Jahre 2001 entstanden ist. Das Programm kann man
aus der Seite http://www.topicmap-design.com/en/topicmap-designer.htm
runterladen und problemlos installieren.
Zur Installation dieses Tools soll man die Zip-Dateien TMDesignGER.zip und
TMDcoreGER.zip runterladen, entpacken und setup.exe starten.
Das Programm kann XML-Dateien laden und darstellen (ausdrücklich XML
Dateien, da das Programm leider XTM-Files nicht öffnen kann). Nach dem
Öffnen der Datei werden alle Assoziationen und Topics aufgelistet (siehe
Abbildung TopicMapDesigner). Das Laden der Datei funktioniert mit Datei>öffnen->eine XML-Datei auswählen.
Copyright © [email protected]
57
Semantic Web Techniken für E-Learning
Abbildung 26: TopicMapDesigner
Wenn man ein Topic auswählt, als Beispiel Olivia (siehe Abbildung), sieht
man auf der rechten Seite den Typ: female bzw. person. Weitere Topicnamen
werden (wenn vorhanden) auch angezeigt unter Sortname und Displayname.
Die letzteren Begriffe waren Elemente von Hytime zur Anzeige und zum
Sortieren von Namen. Die wurden in XTM durch das allgemeinere Element
<variantName>. Unter Association sieht man „die Association“, in der das
Topic Mitglied ist; in diesem Beispiel ist „Olivia“ vom Type „child“. Also „Olivia“
ist eine Instanz von „child“.
Natürlich bietet das Tool auch die Möglichkeit neue Topics, Assoziationen
einzufügen bzw. die vorhandenen upzudaten.
Unter der Rubrik „Viewer“ kann man seine XML-Datei dann als einen Baum
sehen, hin und her navigieren, und die Topics werden mit ihren Relationen
dann gezeigt (siehe nächste Abbildung).
Copyright © [email protected]
58
Semantic Web Techniken für E-Learning
Abbildung 27: TopicMapDesigner-Viewer
Allgemein bietet das Tool einen Überblick in dieser Technologie, und vor
allem ein Beispiel der (veralteten) Hytime Technologie.
3.2.2
Semantext
Semantext ist eine Prototypeanwendung, die von Eric Freese speziell dafür
entwickelt wurde, um zu zeigen, wie der ISO13250 TMStandard benutzt
werden kann, um semantischen Netze darzustellen. Das Installieren dieses
Tools ist überhaupt nicht selbstverständlich. Zur Installation braucht man
folgendes:

semantext.zip (das man aus der Seite:
www.semantext.com/semantext.zip) downloaden kann Zuletzt
veröffentlicht (April 1999).

Python 1.5.2

wxPython 2.3.0 (Normal wxPython)
Copyright © [email protected]
59
Semantic Web Techniken für E-Learning

PyXML 0.6.6
Die letzten drei Komponenten kann man bei www.python.org runterladen.
Bei PyXML 0.6.6 muss man genau (und lange) suchen, da man mittlerweile bei der
0.8.2 Version ist. Das Problem des Semantext ist, dass es nur mit diesen
Komponenten läuft, mit den neuen war dies nicht möglich.
Folgende Dateien sind dann auszuführen:
Die XML Dateien Family und music sind als Beispiel Dateien dabei.
Es wird wie beim TopicMapDesigner mit der Datei Family.xml experimentiert.
Die Datei kann man dann als Topic Map laden, mit File->import TopicMap
öffnet man die Datei und kann sie sich im Viewer als HTML-Format oder
Button-Format.
Copyright © [email protected]
60
Semantic Web Techniken für E-Learning
Abbildung 28: Olivia’s Portal
Das Topic mit der (internen) ID Olivia ist eine Instanz von den verschiedenen
Topics: Female, Person, Sibling und Cousin. Es steht in Relationen mit
anderen Topics.
Mit Hilfe dieses Tools kann man auch das File editieren, nämlich topics,
Assoziationen hinzufügen, löschen oder updaten.
Copyright © [email protected]
61
Semantic Web Techniken für E-Learning
Abbildung 29: Funktionen des Semantext
Semantext bietet eine wichtige Funktion, nämlich die Umwandlung des Files
in ein XTM-File. Dies wurde ausprobiert und erfolgreich durchgeführt wie die
nächste Abbildung zeigt.
Copyright © [email protected]
62
Semantic Web Techniken für E-Learning
Abbildung 30: Olivia’s Portal (Omnigator screenshot)
Der Vergleich beider Scrennshots zeigt keinen Unterschied in der
Funktionalität beider Tools. Bei Olivia werden bei beiden Tools, die
Superklassen gezeigt, die Relationen mit anderen Topics. In dieser Hinsicht
sind beide Tools gleich gut. Bei Semantext fehlt das BackButton, was die
Arbeit etwas umständlicher macht.
Für Datenbanken ist das nicht geeignet, da es nur für XML-Files geschaffen
worden ist. Es hängt sich, wenn man versucht damit ein XTM-File zu öffnen,
obwohl es die Umwandlung zu diesem Format ohne Probleme vollzieht. Bei
Semantext können Regeln definiert werden und auf die Wissensbasis
angewendet werden, um neues Wissen auf Basis der Relationen zwischen
Topics zu generieren.
3.3
Fazit:
Ontopia nutzt als eine der wenigen Firmen die Topicmap- Spezifikation (die
ISO13250 standardisierte Hytime, und die XTM 1.0) als Datenquelle
konsequent aus und bietet umfangreiche Möglichkeiten der Integration in
bestehende Umgebungen. Das große Manko ist das Fehlen der graphischen
Visualisierung, denn die Informationen zu den verschiedenen Datenquellen
sind „nur“ Text-basiert.
Copyright © [email protected]
63
Semantic Web Techniken für E-Learning
Darüber hinaus gilt jedes Download nur ein Monat, so dass man jeden Monat
die kostenlose Version runterladen muss. Beim Autor war es ständig nötig bei
jeder (auch kleinen)Änderung der Topic Map, Omnigator zu stoppen, neu zu
starten und den Browser auch neu zu starten, was einem viel Zeit kostet.
Omnigator bietet keine Hilfe an, wenn man sich verschreibt, oder den
gesuchten Begriff nicht kennt, so dass man ergebnislos die Sitzung beenden
muss.
Der Omnigator ist ein sehr gutes Tool zum lernen von Topic Maps, zum
erstellen von Topic Maps und die Einleitung ist einfach erklärt. Das beste
Produkt, das ich getestet habe. Wichtiger noch, mit dem Omnigator kann man
seine erstellten Topic Maps auf Richtigkeit kontrollieren.
Beim TMDesigner funktioniert das Exportieren der XML-Files nicht, aber vor
allem die fehlende Unterstützung von Scopes ist das große Manko. Dieses
Tool wurde seit 2001 nicht mehr weiter entwickelt, und der Autor ist auch nicht
mehr in diesem Gebiet tätig37, so dass es keine weiteren Entwicklungen zu
erwarten sind. Das Tool kennt keine mächtige Abfragesprache. Da es keine
Datenbank im Hintergrund hat (das ganze wird im Speicher gehalten) kann es
natürlich kein Mehrbenutzersystem anbieten, was eigentlich sehr wichtig für
eine elektronische Lehre ist, da sie von mehreren Usern benutzt werden
kann.
Bei dieser Gelegenheit möchte der Autor darauf hinweisen, dass es weitere
Forschungsprojekte in dieser Hinsicht gibt, unter anderem:
3.4

Topic Maps Visualization (le Grande)38

Groupware-based Topic Maps (Smolnik)39
Abfragesprachen
3.4.1 Tolog
Mit Tolog (orientiert sich an der Programmiersprache Prolog) bietet Ontopia
ihren Kunden eine eigene Anfragesprache, die einfach zu erlernen40 ist, und
37 mail von Roland Heckel an den Autor dieser D.A vom 080103
38 www.rp.lip6.fr/~blergrand/indexEng.html
39 http://gtm.upb.de
Copyright © [email protected]
64
Semantic Web Techniken für E-Learning
die leider nur Gültigkeit im Omnigator und TM4J hat, was natürlich nicht
ermutigt, sie zu lernen, da man sie nicht überall einsetzen kann.
Ein Beispiel einer Anfrage:
Abbildung 31 : Eine TOLOG-Anfrage
Ontopia arbeitet aktiv mit, um die neue einheitliche TMQL (Topic Map Query
Language) mitzudefinieren und zu entwickeln, und sobald diese
Anfragesprache feststeht, wird selbst Ontopia auf diese Anfragesprache
umsteigen. Tolog beschränkt sich grundsätzlich auf Anfragen auf
Beziehungen41.
3.4.2 TMQL
TMQL steht für Topic Map Query Language soll in die Nachfolge von Tolog
treten. TMQL ist ein Standardisierungs-Gemeinschaftsprojekt von ISO (JTC1
SC34 WG3) und Topicmaps.org, gegründet 2001. Das Ziel der Arbeitsgruppe
ist eine auf XML basierende Anfragesprache, die SQL ähnlich sein soll.
40
www.ontopia.net/omnigator/docs/query/tutorial.html
41
www.ontopia.net/omnigator/docs/query/tutorial.html
Copyright © [email protected]
65
Semantic Web Techniken für E-Learning
TMQL hat ihre eigene Notation, was zur Unabhängigkeit von ISO- bzw. XTMStandard führt. Sie soll als übergreifende Abfragesprache für verschiedene
Topic Map-Standards gültig sein.
TMQL soll folgende Basisfunktionalitäten für Topic Map Anfragen und
Updates auf Topic Maps bieten: SELECT, ADD, REMOVE

Definieren von (Select) Anfragen, die als Ergebnis Topics oder gar
TopicMaps als Ergebnis liefern:
Select alle Topics vom Typ „Creator“?
o Select topic[x] from topic-type [“Creator”].[x]
o Ergebnis wäre: Prof. Müller, Rippel, Younous
Select alle Typen vom Topic „Younous“?
o Select topic[t] from topic-type[t].topic [“Younous”]
o Ergebnis wäre: Student, Creator, Mensch

Addieren von Informationen in die TopicMaps (a la INSERT von
SQL)

Entfernen von Informationen aus den TopicMaps( a la
deleteMethode von SQL).
Zur Realisierung und Zukunft von TMQL ein Zitat von Holger Rath:
„Die Validierung einer beliebigen Topic Map gegen ein Schema mit Regeln
und Rahmenbedingungen ist das Ziel von TMCL. Für jede Klasse soll
vorgegeben werden können, welche Charakteristiken deren Instanzen haben
sollen oder haben müssen. Wie sehen die Namen aus, welche
Gültigkeitsbereiche sind zulässig, sind nur bestimmte Vorkommensangaben
bestimmter Klassen erlaubt und wie viele, in welchen Assoziationen dürfen
oder müssen die Instanzen eine Rolle spielen, welche Rollen hat eine
Assoziation und wie viele Mitspieler sind zugelassen. Dies ist nur eine kleine
Auswahl an denkbaren Randbedingungen, die für konsistentere Topic Maps
sorgen dürften.
TMQL hingegen beschreibt die Abfrage und Modifikation von Inhalten. Die
Sprache soll dieselbe Stellung für TM-Software einnehmen, wie SQL für
relationale Datenbanken: eine normierte Schnittstelle, über die beliebige
Topic-Map-Software in eine Applikation integriert werden kann.
TMCL und TMQL setzen auf SAM auf. Beide befinden sich noch in der
Anforderungsanalyse. TMCL wird für die Formulierung der Randbedingungen
sicherlich Bestandteile von TMQL übernehmen“ 42.
42 Ix 06/2002 Seite 120
Copyright © [email protected]
66
Semantic Web Techniken für E-Learning
4
Einsatzgebiete von TopicMaps
Das Einsatzpotential von Topic Maps ist sehr vielfältig. Gerade als Lösung für
die Suche im Internet, das an einer Informationsflut leidet. Diese führt oft zu
ungenauen oder gar falschen Suchergebnissen. Um gegen diese
Informationsflut zu kämpfen soll man Änderungen schon bei den
Webkatalogen und Suchmaschinen vollziehen. Ein möglicher Fortschritt wäre
der Einsatz der TopicMaps-Technik.
In diesem Kapitel werden einige Möglichkeiten des Einsatzes von Topic Maps
in den Suchmaschinen, Webkatalogen und im E-Learning. Es wird dann ein
Beispielszenario durchgeführt mit dem Ontopiatool Omnigator zur
Verwirklichung des E-Learnings.
Am Ende dieses Kapitels wird dann das „E-Learning Tracker“, das als Teil
dieser Diplomarbeit entwickelt worden ist, beschrieben.
4.1
Der Einsatz von Topic-Maps in Webkatalogen
Themenkataloge sind „per Hand“ durchsuchte Seiten, die dem Thema oder
Gebiet entsprechend einsortiert werden, was zu einer hohen Qualität der
ausgewählten Links führt. Das ist eine sehr gute Voraussetzung für Topic
Maps, da die Redakteure schon die Hauptarbeit gemacht haben, nämlich das
Filtern, Lesen und die semantische Aufbereitung der Ressourcen.
Topic Maps können in diesem Gebiet wie folgt eingesetzt werden:
Wenn man diese Ressourcen, die in bestimmten Kategorien (wie Informatik,
Sport, etc) eingeordnet sind, zusätzlich mit Kommentaren versieht, führt das
dann zu einer Verbesserung der Recherche in diesen Artikeln. Mögliche
Kommentare wären Informationen zum Autor, zum Ort, zur Gültigkeitsdauer
(ein Artikel über „Leipzig aus der DDR“ kann nur in einem bestimmten
Zeitraum 1949-1989 Gültigkeit haben) und vor allem zu den verwandten
Themen.
4.2
Der Einsatz von Topic-Maps in den Suchmaschinen
Bei der Größe der Suchmaschinentreffer ist es wahrscheinlich nicht einfach
diese Treffer dann verschiedenen Topics zuzuordnen. Da es noch kein TopicMap-Tool gibt ( Stand Mai 2003), das eigenständig die Daten sortieren, filtern
und sogar mit Kommentaren versehen kann, wird es schwierig sein, Topic
Maps in irgend einer Weise dort einzusetzen. Das obwohl die gefundenen
Seiten von den Suchrobotern indiziert werden. Eine mögliche Alternative wäre
eine Kombination aus den indizierten Ergebnissen der Suchmaschinen und
Copyright © [email protected]
67
Semantic Web Techniken für E-Learning
der menschlichen Hand, die die Themen dann den entsprechenden Topics
zuordnen. Eine Automassierung dieses Vorganges ist schwer vorstellbar.
4.3
TopicMaps und E-Learning:
E-Learning wird meistens mit Universitären Einrichtungen
zusammengebracht. Das ist nicht ganz richtig. Denn viele Firmen wollen auch
ihre Mitarbeiter weiterbilden und greifen zu dieser billigen Maßnahme. Billig in
dem Sinne, dass man weitergebildet werden kann, ohne viele Kosten zu
verursachen. Zum Beispiel Kosten für Anfahrt zum Ausbildungsort,
Übernachtungskosten und Ausbildungskosten, denn wenn man ein ELearning anbietet dann für eine ganze Mannschaft, Kosten werden kaum
durch die Anzahl der geschulten erhöht, im Gegensatz zu den herkömmlichen
Methoden. Man kann es noch effektiver nutzen, um den Studenten zum
Beispiel die Möglichkeit zu geben, selbstständig und ohne Zeitvorgaben ihre
Vorlesungen zu besuchen, ihre Unterlagen zu holen und ihre Fragen zu
stellen.
Um den gezielten Informations- und Wissenstransfer auf die individuellen
Bedürfnisse ihrer Mitarbeiter und Aufgaben zu befriedigen, haben z.B.
zahlreiche Unternehmen (z.B. Bertelsmann, Deutsche Bank, Lufthansa, etc.)
eigene Unternehmens-Universitäten (Corporate Universities) gegründet.
Spitzenreiter ist das Kredit- und Versicherungsgewerbe, bei dem bereits mehr
als zwei Drittel43 der Großunternehmen E-Learning einsetzen, da sie ständig
ihre Programme und Software ändern um die Datenflut Herr zu werden.
Wenn man von Lernen spricht, gerade in Bezug auf Schulen oder
Universitäten, denkt man automatisch an einen Lehrer oder Professor, der
vorne an der Tafel steht um sein Wissen an die Studenten weiterzugeben. Die
Studenten müssen präsent sein um am Kurs oder an der Vorlesung
teilzunehmen. Fällt der Lehrer aus, findet der Unterricht nicht statt. Wenn der
Student fällt, kann er zwar den Stoff zusammentragen, aber die Stunde nicht
mehr nachholen.
E-Learning bringt aber auch Probleme mit sich, zum Beispiel, die fehlende
persönliche Kommunikation, dafür aber den Vorteil, dass Lernende jederzeit
Lernumgebungen benutzen können. Grosse vernetzte Daten (Lern-)Mengen
müssen zur Verfügung stehen.
43 Manager-Magazin vom 29.11.2001
Copyright © [email protected]
68
Semantic Web Techniken für E-Learning
Abbildung 32: E-Learning
Das Bild44 stammt von der Firma Fujitsu, die das E-Learning zur
Weiterbildung ihrer Mitarbeiter nutzt. In dem Bild sind verschiedene Sichten
zu sehen. Auf einer Seite sieht man die Lehrer, die ihr Wissen und ihre
Vorlesungen ablegen. Auf der anderen Seite sind Mitarbeiter, die ihre Anfrage
schicken, Vorlesungen abrufen oder mit ihren Kollegen Informationen
austauschen.
Für die Realisierung sind Tools nötig, um dieses Wissen effizient verwalten
und überschauen zu können. Es sollte den Studenten auch möglich sein
unterschiedliche Lernpfade einzuschlagen, weil jeder seine Lernart hat. Die
Navigation zwischen den artverwandten Themenpunkte ist eine wichtige
Säule des E-Learnings.
Das wichtigste ist den Studierenden eine Suchfunktion anzubieten, mit der sie
schneller und effektiver ihre Informationen abrufen können. Den Lehrern
44 http://interstage.fujitsu.com/jp/service/img/e-learning.gif
Copyright © [email protected]
69
Semantic Web Techniken für E-Learning
sollen natürlich auch die Möglichkeiten angeboten werden, ihre Vorlesungen,
Übungen kontrolliert an die Studenten anzubieten, die gewisse
Vorraussetzungen erfüllen, wie zum Beispiel Studenten im Grundstudium
dürfen Zugang zu den Vorlesungen oder Praktika vom Hauptstudium erst
nach Bestehen des Vordiploms erhalten. Topic Maps sind ein Ansatz, um
dieses Problem zu lösen und aus der zur Verfügung stehenden Datenmenge,
die für die lernende Person relevanten Daten rauszufiltern.
Der Begriff Topic Map kann frei übersetzt werden mit „Wissenskarte“. Sie sind ein
Hilfsmittel zur Navigation in unbekannten Wissensgebieten. Topic Maps liegen als
Metaebene über den Materialien, die durch sie erschlossen werden.
Durch Assoziationen zwischen einzelnen Topics entsteht ein semantisches
Netz – darin liegt der besondere Wert und auch Nutzen der Topic Maps.
4.3.1
E-Learning mit dem Omnigator
Der Omnigator wurde ausführlich in dem Kapitel „Topic Maps Tools“
beschrieben und getestet. Zum Verwenden des Tools braucht man eine XTMDatei, die eine elektronische Lehre darstellt.
In dieser Datei sind Schlagworte, Veranstaltungen, Creatoren (Autoren),
Publisher und die verschiedenen Fachrichtungen (Architektur, Informatik...)
als Topics deklariert.
Copyright © [email protected]
70
Semantic Web Techniken für E-Learning
Abbildung 33: E-Learning mit dem Omnigator
Ein Student möchte sich zu einem Thema informieren, das (als Beispiel) das
Schlagwort „Kette“ enthält. In der Query gibt er dann seine Suche ein, und
erhält folgende Antwort (siehe Bild 2).
Kette ist dann vom Type Schlagwort, oder genauer gesagt ist eine Instanz
vom Topic Schlagwort. Dieser Begriff „befindet sich in“ (ist eine Relation) drei
verschiedenen Fachrichtungen, nämlich: „Multimedia“, „organische Chemie“
und „SVG und XML“.
Abbildung 34: Kette als Schlagwort
Der Student wählt dann das Thema aus, wofür er sich interessiert, in dem er
auf den entsprechenden Namen klickt. Als Beispiel nehme man hier
„Multimedia“.
Copyright © [email protected]
71
Semantic Web Techniken für E-Learning
Abbildung 35: Multimedia- Portal
Im Bild findet man neben dem Link (unter External Resources -> web site) zur
realen Ausprägung des gesuchten Begriffs, weitere informative Hinweise zu
diesem Begriff, die einiges darüber aussagen. Zum Beispiel befindet sich
„Kette“ in Multimedia, Multimedia ist eine Vorlesung (siehe scope: Vorlesung).
Weitere Informationen zur Vorlesung kann man erhalten, indem man auf
Multimedia klickt. So erhält man den Autor angezeigt, und weitere Autoren,
die zu diesem Thema etwas geschrieben haben, und so kann man sich quer
über den Datenbestand bewegen, und weitere Informationen erhalten.
4.3.2 E-Learning Tracker:
Im Rahmen dieser Diplomarbeit sollte ein Tool zur Verwaltung einer
elektronischen Lehre entwickelt werden, das ähnliche Funktionalitäten
unterstützt, wie die von TopicMaps.
Die Daten (Vorlesungen, Autoren, Benutzer ...) sind in einer MySQL Datenbank gespeichert. Es gibt drei verschiedene Benutzer: Studenten, die
Schlagworte suchen, Autoren oder Lehrer, die ihre Daten in dieser Datenbank
ablegen und Administratoren, die die gleichen Rechte haben, wie die Autoren,
zusätzlich haben sie die Möglichkeit Daten anderer Autoren zu bearbeiten
oder löschen.
Copyright © [email protected]
72
Semantic Web Techniken für E-Learning
Dieses Tool bietet ein Webinterface, das die Ersteller von Onlineressourcen
bei der Auszeichnung von Attributen unterstützt.
Abbildung 36: Architektur des Trackers
Das System wird jetzt anhand eines Beispielszenarios nach und nach erklärt.
Der User (Student, Autor oder Administrator) muss sich über ein Webinterface
anmelden. Die Rechte, die in einer Tabelle gespeichert sind, werden geprüft,
und je nach Recht erscheint ein Menü.
Copyright © [email protected]
73
Semantic Web Techniken für E-Learning
Abbildung 37 : Login des E-Learning-Trackers
Nach dem erfolgreichen Einloggen, erhält man eine Auswahl von Funktionen,
die dieses Tool anbietet. Bei Benutzern mit dem Recht „nichtautorisiert“(wie
Studenten zum Beispiel) fehlt die Option „Neuer Eintrag“, da sie nicht
berechtigt sind, neue Einträge in die Datenbank einzufügen. Unter User steht
dann der gerade eingeloggte Benutzer (Rippel in diesem Falle).
Es sind noch zwei Buttons vorhanden, mit „Logout“ verlässt man das
Programm, und mit „Menue“ werden dann die schon genannten Optionen
angezeigt.
Copyright © [email protected]
74
Semantic Web Techniken für E-Learning
Abbildung 38:
Menü des Trackers
Das Beispiel wird erstmal den Fall zeigen, bei dem der Benutzer ein Student
ist, der das Schlagwort „Kette“ enthält.
Abbildung 39: Search for Entry
Copyright © [email protected]
75
Semantic Web Techniken für E-Learning
Als Ergebnis erhält der Student (Younes) eine Liste von Topics, die den
Begriff „Kette“ enthalten. In dieser Liste kann der Student seine Anfrage
verfeinern, in dem er die Vorlesung anklickt, deren Titel dem entspricht, was
er gerade sucht. Als Beispiel wird die Vorlesung „Datenstrukturen“
ausgesucht.
Abbildung 40: Ergebnis der Anfrage „Kette“
Datenstrukturen ist eine Vorlesung, die von Professor Müller gelehrt wird. Sie
enthält unter anderem Kette als Schlagwort, und wird von der Universität
Kaiserslautern veröffentlicht. Das Dokument ist unter „resource_identifier“ zu
finden. Dort ist die Vorlesung abrufbar bzw. erreichbar.
Abbildung 41: Kette in der Vorlesung Datenstrukturen
Wenn man sich für weitere Vorlesungen von Professor Müller interessiert,
kommt man mit einem Klick, auf das Topic „Prof.Mueller“, auf das Portal der
Copyright © [email protected]
76
Semantic Web Techniken für E-Learning
Vorlesungen vom Professor Müller, unabhängig vom Publisher. man beachte,
dass dem Studenten nur die „back“ Möglichkeit zusätzlich angeboten wird,
was anderes nicht, weil er nichts anderes darf. Den Unterschied wird später
klar, wenn man das Beispiel mit einem anderen „Recht“ durchführt.
Abbildung 42:
Vorlesungen von Prof. Müller
Professor Müller bietet weitere Vorlesungen an, nämlich Multimedia,
Datenstrukturen und noch ein Internetpraktikum. Man kann sogar seine
Suche eingrenzen, indem man ein Schlagwort eingibt und eine andere
Option, wie zum Beispiel der Name des Autors, oder die Universität, die den
Artikel veröffentlicht hat. So kann man Umwege vermeiden. Insgesamt geht
die Suche schneller, da man sofort eine Liste der Topics angezeigt bekommt,
die man weiter durchsuchen kann.
Jetzt wird der Fall betrachtet, bei dem ein Autor (der berechtigt ist) neue
Daten in die Datenbank einfügen will. Unter „Menue->Neuer Eintrag“ wird eine
Maske angezeigt, in der die Daten eingetragen werden und mit Einfügen, in
die Datenbank übertragen. Der Autor (der in diesem Beispiel das höchste
Recht besitzt) kann sich alle Daten anschauen, updaten oder gar löschen, wie
das nächste Bild zeigt.
Copyright © [email protected]
77
Semantic Web Techniken für E-Learning
Abbildung 43: Display Entry
Dieses Recht wird nur dem Administrator eingeräumt, damit er die Einträge
kontrollieren kann. Die anderen Autoren dürfen nur ihre eigenen Daten
löschen bzw. bearbeiten. Das Anschauen oder Lesen von Daten ist jedem
zugänglich.
Hier ging es darum, einen Rahmen zu schaffen, in dem die Lernobjekte im
Kontext eines Kurses eingebunden werden können. Also um die Verwaltung
von Kursen, Teilnehmer, Lernobjekte, Autoren und deren Beziehungen
zueinander:

Zuordnung von Lernobjekten untereinander

Zuordnung der Lernobjekte zu den Kursen

Zuordnung von Teilnehmern zu Kursen

Zuordnung von Autoren zu den Kursen
Copyright © [email protected]
78
Semantic Web Techniken für E-Learning
5
TopicMaps Suchmaschinen
Mit der Entwicklung von Topic Maps, war der erste Schritt getan, für die
Umrüstung einiger Suchmaschinen oder für die Entstehung neuer
Suchmaschinen. Meistens sind diese Suchmaschinen kommerzieller Art, und
einige benutzen nur die Idee der Topic Maps, und genauer gesagt die Idee
der „semantischen Netze“. Hier werden folgende Suchmaschinen geführt:
KartOO und Lumrix.
5.1
KartOO
KartOO wurde aus einem Forschungsprogramm 1998 gegründet. Ziel war die
Ergebnisse der Suchanfragen nicht mehr als Listen mit Zusammenfassung
(wie bei den herkömmlichen Suchmaschinen) zu liefern, sondern mit einer
kartographischen und interaktiven Schnittstelle zu präsentieren.
Abbildung 44: KartOO-Ergebnisse auf Java-Anfrage
KartOO45, liefert die Ergebnisse als Karte mit vielen Gebieten (wenn
vorhanden), was dem Benutzer die Möglichkeit gibt, seine Anfrage zu
45 http://www.kartoo.com
Copyright © [email protected]
79
Semantic Web Techniken für E-Learning
verfeinern in dem er auf das gewünschte Gebiet klickt. Wenn man mit der
Maus auf eine Antwort geht, erhält man einige Informationen zu diesem Link.
5.2
Lumrix
Lumrix entstand auch aus einer Forschung in dem Institut für Medizinische
Informatik der Justus-Liebig-Universität Giessen, das sich mit der
Auszeichnungssprache XML intensiv beschäftigt. Die Idee, die dahinter
steckt, ist die Ordnung und Struktur von Informationen zu „belohnen“ 46.
Lumrix nutzt die TopicMaps-Technik, was dazu führt, dass sie im Vergleich
zu den Volltextsuchmaschinen relevantere Ergebnisse liefert, denn VolltextSuchmaschinen suchen Begriffe, Lumrix sucht Begriffszusammenhänge. Sie
liefert eine bessere Ergebnisquote, da sich ihre Technik nicht auf die
Wortdistanz verlässt, sondern auf die vom Autor dokumentierten Beziehungen
in Form von XML Topic Maps, XML-Markierungen, Satz-Interpunktionen, etc.
Bei Lumrix werden alle möglichen Texte indiziert: XTM, RDF, XML, HTML,
PDF, RTF, TXT, etc. Bilder können zum Beispiel über XTM verschlagwortet
werden, d.h. man kann auch multimediale Informationen suchen.
Ein Beispiel eines Suchvorganges von Lumrix mit dem Unterschied zwischen
XML- und XTM- Dokumenten47, die Ergebnisse werden als Listen angezeigt:
46 iX 11/2002 Seiten 104-107
47 http://www.lumrix.net
Copyright © [email protected]
80
Semantic Web Techniken für E-Learning
Abbildung 45: Ergebnisse als Liste bei Lumrix
Lumrix hat eine besondere Vorgehensweise bei der Suche nach Begriffen;
Sucht man zum Beispiel nach „Behandlung Karzinom Niere“, verbindet Lumrix
zunächst die Begriffe „Karzinom“ und „Niere“ zu einer Diagnose, für die man
anschließend eine Behandlung sucht. Mittels XTM kann beispielsweise eine
synonyme Beziehung zwischen den Begriffen „Karzinom“ und „Krebs“
hergestellt werden. Die Suchmaschine findet dann auch alle Seiten zum
Thema Nierenkrebs.
Topic Maps erlauben die gezielte Ausbildung von Beziehungen zwischen
Ressourcen. Ein Beispiel: Ein XML-Element dokumentiert eine medizinische
Diagnose: <diagnose>AIDS Phobie</diagnose>. Eine XTM definiert ferner
eine "Ursache-Wirkungs-Beziehung zwischen HIV und AIDS". Aufgrund des
gewonnenen Beziehungswissens findet Lumrix alles zum Thema "HIV
Phobie". Entscheidend ist dabei nicht, dass die beiden Suchbegriffe "HIV" und
"Phobie" in derselben Seite auftreten. Tatsächlich kommt der Begriff "HIV"
noch nicht einmal in der Seite vor. Entscheidend ist die Tatsache, dass
unabhängige Autoren - direkt oder indirekt - einen sinnvollen Zusammenhang
der Begriffe dokumentiert haben. Unabhängig von der Form und der
Verteilung des Beziehungswissens entstehen neue Suchpfade, die eine hohe
Präzision und Vollständigkeit der Suche garantieren“ 48.
48 http://www.lumrix.net
Copyright © [email protected]
81
Semantic Web Techniken für E-Learning
Copyright © [email protected]
82
Semantic Web Techniken für E-Learning
6
Zusammenfassung und Ausblick
Die vorliegende Arbeit versucht, das Thema „Topic Maps“ von verschiedenen
Perspektiven zu betrachten. „Topic Maps“ sind geordnete Wissensnetze. Sie
stellen ein Hilfsmittel dar, um sich in der immer größer werdenden
Informationsvielfalt zurechtzufinden und beim Navigieren trotz einer
möglichen Informationsüberflutung die Übersicht zu behalten. Wie ein
Stichwortverzeichnis in einem guten Fachbuch, helfen sie, die genau
gesuchte Information zu finden.
Die Tatsache, dass elektronische Informationen in größerem Umfang als die
Seiten eines Buches vorliegen und auf heterogenen Plattformen gespeichert
sind, zieht die Konsequenz mit sich, dass Topic Maps nicht nur aus einer
Liste alphabetisch sortierter Stichworte bestehen. Vielmehr werden mit Hilfe
von Topic Maps logische Konzepte entworfen, die Wissensnetze semantisch
modellieren.
In Zusammenhang mit Topic Maps spricht Tim Berner-Lee von der dritten
Revolution des Internets. Die XTM-Arbeitsgruppe wirbt sogar mit dem Slogan
„Das GPS des Web“. So wie eine Landkarte eine schematische Sicht auf eine
reale Landschaft ermöglicht und bestimmte Merkmale der Landschaft (z.B.
Städte, Straßen, Flüsse) markiert, sind Topic Map in der Lage wichtige
Merkmale eines Informationsbestandes festzuhalten und in Bezug zueinander
zu setzen. So wie ein GPS-Empfänger die eigene Position auf der Karte
feststellt, kann eine Topic Map die Orientierung in einer virtuellen Welt
vernetzter Dokumente herstellen. Das klingt etwas exotisch, hat jedoch
durchaus praktische und sehr weit gefächerte Anwendungen.
In dieser Arbeit wurde zuerst der Übergang von Suchmaschinen zu einem
semantischen Web beschrieben. Im zweiten Kapitel wurden die Topic Maps
ausführlicher behandelt. Angefangen bei der Geschichte von Topic Maps,
über die Entwurfsziele bis hin zu einem XTM-Tutorial . In diesem Tutorial
wurden verschiedene Beispiele durchgeführt und die Lineare Topic Map von
Ontopia vorgestellt. Abschließend wurde anhand eines Beispiels eine
mögliche Realisierung von Topic Maps mit HTML.
Das dritte Kapitel wurde den TopicMaps-Tools und Anfragesprachen
gewidmet. Es wurden kommerzielle sowie freiverfügbare Tools vorgestellt und
miteinander verglichen. Danach wurden die beiden Anfragesprachen Tolog
und TMQL eingeführt.
Im vierten Kapitel wurden die beiden Einsatzgebiete von Topic Maps
behandelt. Das sind zum einen die Webkataloge und die Suchmaschinen.
Zum anderen ist es möglich, auch im Rahmen vom E-Learning von dem
Konzept der Topic Maps zu profitieren. In diesem Zusammenhang wurde erst
der Omnigator von Ontopia vorgestellt. Dann wurde das im Laufe dieser
Copyright © [email protected]
83
Semantic Web Techniken für E-Learning
Arbeit entwickelte Topic Maps Tool E-Learning -Tracker ausgeführt und
erklärt.
Im fünften Kapitel wurden die neuen Suchmaschinen, die ausschließlich auf
dem Konzept der Topic Maps basieren und diese Technik auch tatsächlich
verwenden, angesprochen und mit Beispielanfragen erläutert.
In dieser Diplomarbeit wurden wegen dem großen Einsatzpotential von Topic
Maps, viele Gebiete angesprochen, angefangen bei den Webkatalogen über
Suchmaschinen bis hin zum E-Learning.
Mit XML Topic Maps gibt man den Beziehungen zwischen den verschiedenen
Topics die Chance sich auszuzeichnen. Damit erreicht die Suche eine neue,
bis dahin unmögliche Qualität.
Mit einer Topic Map lassen sich beispielsweise die klassischen
Navigationselemente technischer Dokumentation (Inhalt, Index, Glossar etc.)
in einheitlicher Weise beschreiben; eine andere Topic Map könnte die
inhaltliche Vernetzung von Artikeln in einem Lexikon ausdrücken (z.B. Person
A wurde geboren in Stadt B, B liegt in Land C, Oper D wurde komponiert von
A, Person E war Zeitgenosse von A) und für "siehe auch"-Verweise sorgen
(andere Werke dieses Komponisten, andere Städte in diesem Land etc.).
Es klingt wie die Lösung aller Suchprobleme. Allerdings nur in der Theorie.
Denn Tools, die in der Lage sind, das Wissen oder die Riesendaten in
Topicmaps automatisch zu generieren, sind noch Mangelware, was die
Ausbreitung von Topic Maps hemmt. Der Aufbau solcher Netze erfordert sehr
viel Zeit und sehr viel "Handarbeit" - und damit auch viel Geld, was viele
Firmen davon abhält Topic Maps zu benutzen49.
Trotz alledem bleibt diese Technik keine graue Theorie. Denn obwohl es
spürbare Schwierigkeiten auf dem Weg zur Popularität gibt, wird sie eines
Tages das Web beherrschen. Microsoft hat sogar versucht, einige Leute und
Entwickler von Topic Maps abzuwerben50, was ihr missglückt ist. Dies ist als
ein Hinweis zu verstehen, dass diese Technik Interesse bei einigen
Herrschern in der Informatikindustrie.
Auch andere Industriebereiche wie die Automobilindustrie und andere zeigen
bereits großes Interesse, wie auf dem Darmstädter Kongress zu sehen und
zu hören war. Dort waren nämlich auch Firmen anwesend, die sich über diese
Technik informieren wollten und wissen wollten wie sie ihre Daten Topic Maps
konform machen können. Darunter fallen Namen wie Volkswagen, die bereits
ein Tool von USU benutzen, aber auch Mercedes und andere.
49 Diskussion über TopicMaps beim Darmstädter Kongress
50 H.H.Rath in der Diskussion über TopicMaps beim Darmstädter Kongress
Copyright © [email protected]
84
Semantic Web Techniken für E-Learning
Interessanterweise haben Verlage das Konzept der Topic Maps als erste
adaptiert. Als erstes Unternehmen weltweit hat 1999 die Wienerzeitung ihre
Daten Topic Maps mäßig bearbeitet, was zu einer großen Effektivität bei der
Gestaltung der Daten geführt hat51. Heute nach 4 Jahren Erfahrung mit Topic
Maps, sieht die Wienerzeitung die Vorteile des TM-Einsatzes darin, dass sie
ihre Daten in einem klaren, wartbaren und flexiblem System geordnet haben.
Bertelsmanns Wissensportal wissen.de benutzt Topic Maps, um die
graphische Anzeige von Wissenszusammenhängen mit Inhalt zu füttern. Der
französische Verlag Quid hat sein Online-Lexikon als Topic Map organisiert.
Firmen der weltweit operierenden Wolters-Kluwer-Verlagsgruppe setzen auf
Topic Maps zur besseren Verwaltung ihrer Inhalte und zur intelligenteren
Aufbereitung ihrer Websites. Einige Sites der norwegischen Regierung sind
komplett als Topic Map strukturiert und bieten optimale Navigation in den
angebotenen Informationsmengen. Laut einer Studie der Meta Group ist 16
Prozent der deutschen Unternehmen XTM im Kontext Wissensmanagement
ein Begriff und gut ein Drittel hält sie für eine relevante WissensmanagementTechnik.
Die Pressetext Austria AG52 setzt diesen Standard ab 2001 für ihre Content
Syndikation (www.newsfox.com) ein. "Pressetext wird den Metadatenstandard
Topic Maps einsetzen, um seine Informationsangebote für den Kunden
maßgeschneidert strukturieren und punktgenau ausliefern zu können", erklärt
der technische Direktor von Pressetext, Markus Schranz. Ein Topic umfasst
dabei für jede Information in der Datenbank eine Kurzbeschreibung und eine
semantische Kategorisierung der Inhalte. Über frei konfigurierbare assoziative
Verbindungen zwischen den Topics können für den Kunden
maßgeschneiderte Selektionskriterien aufgesetzt werden. So z.B. können
einem Handy-Portalbetreiber Nachrichten aus verschiedensten
Informationskanälen zum Thema Handy, WAP und SMS geliefert werden.
In Asien hat diese Technologie angefangen neue Freunde zu gewinnen. Dazu
ein Zitat von Steve Pepper53:
"Interessant ist auch, dass östliche Länder sehr viel Interesse an Topic Maps
zeigen. Besonders Japan und Korea. Es ist seltsam, weil mir erzählt wurde,
dass vor allem in Japan XML Probleme hätte sich durch zu setzen. - Es war
nicht so wie in den Staaten, wo plötzlich jeder über XML geredet hat. Aber
dem Konzept der Topic Maps wird dort weit mehr Interesse entgegen
gebracht. Es ist fast so, als entspräche es deren Psyche über Semantik,
Bedeutung und Informationen zu reden, als über langweilige alte Syntax“.
51 E-Mail von der Zeitung an den Autor bzgl. Topic Maps
52 http://www.pressetext.at/
53 http://matrix.orf.at/bkframe/020616_1.htm
Copyright © [email protected]
85
Semantic Web Techniken für E-Learning
Die Strukturierung und Ordnung von Information verursacht erheblichen
Aufwand. Wegen der wachsenden Informationsmenge wird man diese Arbeit
jedoch leisten müssen, um eine Verschlechterung der Suchqualität zu
vermeiden. XML ist ohne Zweifel ein guter Ansatz in dieser Richtung, aber
Aufgrund des Mangels an XML-Suchmaschinen, werden die XML-Dokumente
vor der Auslieferung nach HTML transformiert. Gebe es mehrere XML- bzw.
XTM-Dokumente im Web, würde das erheblich die Suchqualität verbessern.
Diese semantischen Netze werden auch im E-Learning eine große Rolle
spielen. Die Vorteile dieser Technik spiegeln sich vor allem in der für den
Nutzer klareren Vernetzung der einzelnen Topics (Lerneinheiten), d.h. der
Nutzer (Student, Professor etc.) erhält einen besseren Überblick über die
Struktur des Lernstoffes. Die Beziehungen zwischen den verschiedenen
Schwerpunkten einer Lehrveranstaltung werden transparenter abgebildet,
was für den Lernprozess und auch bei der Vorbereitung des Stoffes für eine
Lehrveranstaltung hilfreich sein kann54.
Dies zeigt, dass Topic Maps in verschiedenen Gebieten bereits Einsatz
gefunden haben, aber immer noch viel Aufwand gebracht werden muss, um
die Vorzüge der Topic Maps hervorzuheben und damit eine breite
Annerkennung zu erreichen.
54 Manuella Kunze XTM Darmstädter Kongress
Copyright © [email protected]
86
Semantic Web Techniken für E-Learning
7
Abkürzungsverzeichnis
Abb.
Abbildung
BRD
Bundesrepublik Deutschland
bzw.
beziehungsweise
DBMS
Datenbankmanagementsystem
de
Deutsch
d. h.
das heißt
E-Mail
Electronic Mail
engl.
English
fr
Französisch
GPS
global-positioning system
HTML
Hypertext Markup Language
ISO
International Standards Organization
SGML
Standard Generalized Markup Language
SMS
short message service
SQL
Structured Query Language
WWW
World Wide Web
XML
eXtensible Markup Language
XTM
XML Topic Maps
z. B.
zum Beispiel
TMQL
Topic Map Quary Language
RDF
Ressource Description Framework
WAP
wireless application protocol
Copyright © [email protected]
87
Semantic Web Techniken für E-Learning
8
Literatur
1, 17, 30, 34, 35
Stefan Smolnik Universität Paderborn.
XML Topic Maps Darmstädter Kongress April 2003
Marktüberblick über kommerzielle und frei verfügbare
TM-Tools
2
Maurice Godelier
Goldmedaille Gewinner bei CNRS 2001 zum Thema
Suchmaschinen
3, 4, 6
Tom Schimmeck: Wegweiser im World Wide Web. Die
Herrscher der Portale. In: Geo Wissen 27. 2001,
S. 130 -137
5
Henning Behme; Buchmarkt; Mehr KBytes, SVG;
iX 12/2002, S. 146
7
iX 11/2002 Seite 104.
8, 0
Behme, H./Mintert, S. (2000), S. 503
XML in der Praxis – Professionelles Web-Publishing mit
der Extensible Markup Language, 2. Auflage, AddisonWesley, München.
9, 11
Rath, H. H. (1999): Technical Issues on Topic Maps,
http://www.doctypes.org/xtm/home.html#documents.
2
Steve Pepper.
http://www.gca.org/papers/xmleurope2000/papers
/s11-01.html
13, 24, 26, 27
14, 5
Holger Rath Mitglied des ISO-Gremiums.
http://www.empolis.com
Tim Berners-Lee. W3C-Direktor
http://www.w3.org/People/Berners-Lee/
6
matrix.orf.at/bkframe/020616_1.html
8
http://ww.rp.lip6.fr/~blergrand/indexEng.html.
9
Robert Eckstein. XML kurz und gut
Copyright © [email protected]
88
Semantic Web Techniken für E-Learning
20, 21
Hubert Partl.
http://www.boku.ac.at/
22
http://www.hypermedia-texte.de.
23, 24
Richard Widhalm
Herausgeber des Buchs: Topic Maps,
Springer Verlag 2002
25
http://www.ontopia.net/download/ltm.html#N60
28, 29
http://www.ontopia.net
3, 32
http://www.ontopia.net/download/freedownload.html
33
http://www.usu.de
36
http://www.i-views.de/web/pdfs/Whitepaper-K-Infinity.pdf
37
E-Mail von Roland Heckel an den Autor dieser D.A
vom 080103
38
www.rp.lip6.fr/~blergrand/indexEng.html
39
Groupware Competence Center
http://gtm.upb.de
40, 41
http://www.ontopia.net/omnigator/docs/query/tutorial.html
42
iX 06/2002 Seite 120
43
Manager-Magazin vom 29.11.2001
44
http://interstage.fujitsu.com/jp/service/img/e-learning.gif
45
http://www.kartoo.com
46
iX 11/2002 Seiten 104-107
47, 48
http://www.lumrix.net
Copyright © [email protected]
89
Semantic Web Techniken für E-Learning
49
Diskussion über TopicMaps beim Darmstädter
Kongress
Mit unter anderem A.Sigel, H.H.Rath, Dr. H.Beier,
Dr.S.Wess, Dr. S.Staab an dem auch der Autor
teilgenommen hat.
50
H.H.Rath in der Diskussion über TopicMaps beim
Darmstädter Kongress
51
E-Mail von der Zeitung an den Autor bzgl. Topic Maps
52
http://www.pressetext.at/
53
http://matrix.orf.at/bkframe/020616_1.htm
54
Manuella Kunze Universität Mageburg.
XML Topic Maps Darmstädter Kongress April 2003
TM zur Beschreibung von extrahierten Daten und
Lehrmaterialen
Copyright © [email protected]
90
Semantic Web Techniken für E-Learning
9
Anhang
HyTime (Hypermedia/Time-based Structuring Language) ist ein
internationaler Standard (ISO/IEC 10744) zur strukturierten
Repräsentation von Hypermedia-Informationen. HyTime ist eine
Anwendung der Standard GeneraIized Markup Language (SGML)
SGML Die Standard Generalized Markup Language - SGML - ist der
Standard zur Beschreibung von Dokumenten der International
Standardization Organization (ISO), der unter der Nummer ISO 8879
im Jahr 1986 veröffentlicht wurde. SGML ist sehr umfangreich,
leistungsfähig und komplex; die Muttersprache von XML.
ISO
Der ISO-Standard zu XML Topic Maps erweitert den früheren, auf
SGML bezogenen und definiert, wie Topic Maps mit XML und XLink
auszutauschen sind. Außerdem beantwortet er Unklarheiten, die der
bisherige Standard offen gelassen hatte:
XML Diese erweiterte Markup-Sprache XML (eXtensible Markup Language)
ist ein Dokumentenverarbeitungsstandard, der vom Worls-wide-WebKonsortium (W3C) vorgeschlagen wurde – demselben Gremium, das
auch für die Überwachung des HTML-Standards verantwortlich ist
HTML Steht für „Hyper Text Markup Language“, zu Deutsch etwa "HypertextAuszeichnungssprache", einer im Web genutzten kleinen SGML
Anwendung. Sie definiert eine sehr einfache Klasse berichtsartiger
Dokumente mit Absatzüberschriften, Absätzen, Listen, Tabellen und
Illustrationen. Sie enthält außerdem einige informative und für die
Präsentation gedachte Elemente sowie etwas Hypertext und
Multimedia.
W3C World Wide Web Consortium
XTM ISO-Standard 13250 für die Kodierung so genannter semantischer
Netze, d.h. konzeptioneller Landkarten (Maps), mit denen sich ein
thematischer Bezug zwischen interessanten Punkten (Topics) einer
Informationslandschaft herstellen lässt. Ursprünglich für die
Verschlagwortung im Verlagsbereich entwickelt, werden Topic Maps
mittlerweile als universelles Medium für die Beschreibung von
Relationen innerhalb beliebiger Informationsbestände benutzt. Topic
Maps sind zugleich interessante Methodik und Basistechnologie für
Wissensmanagement-Systeme.
RDF Resource Description Framework. Universeller XML-basierter Standard
für die Katalogisierung von Dokumenten. Ursprünglich von Netscape
für die Beschreibung von Web Channels entworfen, findet es
Copyright © [email protected]
91
Semantic Web Techniken für E-Learning
zunehmend Einsatz im Umfeld webbasierter Informationssysteme, bei
Dokumenten- und Wissensmanagement.
XTM
konkurrieren mit RDF im Umfeld des Semantic Web. Inwieweit beide
sich durchsetzen können, ist noch unklar. Aber die Tendenz geht mehr
Richtung Zusammenarbeit und Kooperation als Richtung Rivalität.
Cascading Stylesheets Eigentlich für HTML bestimmt, lässt sich aber auch
in XML verwenden. Mit CSS lassen layout bezogene Eigenschaften
von Elementen festlegen. Die Definition findet extern statt. Die
Einbindung in XML findet unter dem Prolog statt.
Das Ergebnis ist dann die Ausgabe “Hello World“ im Browser
DTD Die DTD (Document Type Definition) ist ein wichtiger Teil eines XML
Dokumentes. Hier werden neue Tags definiert. Außerdem wird
definiert, dass es Verschachtelungen geben darf, welche Attribute bei
welchen Tags zum Einsatz kommen dürfen. Kurz gesagt Sie
bestimmen das “Wie“ des XML Dokumentes.
Unterschieden wird diese DTD in interne und externe. Wie der Name
schon sagt steht die innere DTD innerhalb des Dokumentes und die
externe DTD in einer externen Datei. Im Dokument findet sich dann ein
Verweis auf diese Datei.
Tags Bestehend aus Start(<...>)- und Endtag(</...>). Starttags müssen
wieder geschlossen werden und es dürfen auch keine anderen Tags
geöffnet werden bevor das erste nicht geschlossen worden ist, in
HTML war dies nicht immer so.
XSL
ist extensible Markup Language, sie eigens für XML geschrieben
worden, hat das gleich Ziel wie CSS, nämlich das der Inhalt eines
Dokumentes sichtbar gemacht werden soll. Ist aber leistungsfähiger als
CSS. Mit XSL lassen sich auch XML-Dokumente in HTML-Dokumente
wandeln.
Xlink und XPointer Eigentlich sind in XML keine Hyperlinks vorgesehen.
Xlink soll die Linksprache für XML werden. Mit dieser Sprache lassen
sich Verweise auf Zieladressen im Dokument oder im World Wide Web
starten.
Mit XPointer kann man Verweise auf vorher markierte Dokumente
starten. Diese markierten Punkte nennt man ID.
TMQL steht für “Topic Map Query Language”, und ist eine XML- basierte
Erweiterung von SQL.TMQL ist eine noch nicht standardisierte
Anfragesprache die den besonderen Anforderungen der Topic Maps
deutlich mehr gerecht wird als eine Anfragesprache, die allgemein auf
XML Dokumente bezogen ist.
Copyright © [email protected]
92
Semantic Web Techniken für E-Learning
SVG Scalable Vector Graphics. Neues XML-basiertes Dateiformat für
Vektor- und Rastergrafiken im Bereich Web und Print. Geeignet für ein
breites Spektrum von Anwendungen (z.B. Illustrationen, Diagramme,
Karten/geographische Informationssysteme, technische Zeichnungen,
Webgrafik). Möglichkeit zur Beschreibung von Animation (z.B.
Bewegung und Überblendeffekte) und Benutzer-Interaktion (z.B.
Klicken und Ziehen). Erlaubt es, bestimmte Methoden des Content
Managements und des Content Engineerings aus dem Textbereich
(z.B. Volltextsuche, Übersetzungsmanagement, Hypertext) auch auf
grafische Inhalte anzuwenden.
Copyright © [email protected]
93
Semantic Web Techniken für E-Learning
<?xml version="1.0" encoding="ISO-8859-1"?>
<!-- DOCTYPE topicMap SYSTEM "xtm1.dtd" -->
<topicMap
id="elektronischeUni1006"
xmlns="http://www.topicmaps.org/xtm/1.0/"
xmlns:xlink="http://www.w3.org/1999/xlink"
xml:base="http://www.uni-kaiserslautern.de/">
<!--Die Topic Map elktronischeUni1006.xtm enthaelt elementare Informationen
ueber die elektronische Universitaet -->
<!-- Definiere die Fachbereiche... -->
<topic id="study_field">
<baseName>
<baseNameString>Study_field</baseNameString>
</baseName>
</topic>
<!-- Informatik ist nur eine Instanz von der Klasse
Study_field -->
<topic id="informatik">
<instanceOf><topicRef xlink:href="#study_field"/></instanceOf>
<baseName>
<baseNameString>Fachbereich Informatik</baseNameString>
</baseName>
</topic>
<!-- Chemie ist nur eine Instanz von der Klasse Study_field-->
<topic id="chemie">
<instanceOf><topicRef xlink:href="#study_field"/></instanceOf>
<baseName>
<baseNameString>Fachbereich Chemie</baseNameString>
</baseName>
</topic>
<!-- Physik ist nur eine Instanz von der Klasse Study_field-->
<topic id="physik">
Copyright © [email protected]
94
Semantic Web Techniken für E-Learning
<instanceOf><topicRef xlink:href="#study_field"/></instanceOf>
<baseName>
<baseNameString>Fachbereich Physik</baseNameString>
</baseName>
</topic>
<!-- Jetzt werden alle moeglischen Hochschulen deklariert-->
<topic id="publisher">
<baseName>
<baseNameString>Publisher</baseNameString>
</baseName>
</topic>
<!-- fh-darmstadt als Instanz von topic Publisher -->
<topic id="fh-darmstadt">
<instanceOf><topicRef xlink:href="#publisher"/></instanceOf>
<baseName>
<baseNameString>Fachhochschule Darmstadt</baseNameString>
</baseName>
<occurrence>
<instanceOf>
<topicRef xlink:href="#website"/>
</instanceOf>
<resourceRef xlink:href="http://www.fh-darmstadt.de/"/>
</occurrence>
</topic>
<!-- Uni-kl als Instanz von topic Publisher -->
<topic id="uni-kl">
<instanceOf><topicRef xlink:href="#publisher"/></instanceOf>
<baseName>
<baseNameString>Universitaet Kaiserslautern</baseNameString>
</baseName>
<instanceOf>
<topicRef xlink:href="#website"/>
</instanceOf>
<occurrence>
<resourceRef xlink:href="http://www.uni-kl.de/"/>
</occurrence>
</topic>
Copyright © [email protected]
95
Semantic Web Techniken für E-Learning
<!-- fh-kl als Instanz von topic Publisher -->
<topic id="fh-kl">
<instanceOf><topicRef xlink:href="#publisher"/></instanceOf>
<baseName>
<baseNameString>Fachhochschule
Kaiserslautern</baseNameString>
</baseName>
<occurrence>
<instanceOf>
<topicRef xlink:href="#website"/>
</instanceOf>
<resourceRef xlink:href="http://www.fh-kl.de/"/>
</occurrence>
</topic>
<!-- Topic Dozent bezeichnet die Dozenten -->
<topic id="creator">
<baseName>
<baseNameString>Creator</baseNameString>
</baseName>
</topic>
<!-- Prof Mueller als Dozent deklariert -->
<topic id="Prof. Mueller">
<instanceOf><topicRef xlink:href="#creator"/></instanceOf>
<baseName>
<baseNameString>Professor Mueller</baseNameString>
</baseName>
<occurrence>
<instanceOf>
<topicRef xlink:href="#website"/>
</instanceOf>
<resourceRef xlink:href="http://www.icsy.de/personen/leiter"/>
</occurrence>
</topic>
<!-- Prof Scherer als Dozent deklariert -->
<topic id="Prof. Scherer">
Copyright © [email protected]
96
Semantic Web Techniken für E-Learning
<instanceOf><topicRef xlink:href="#creator"/></instanceOf>
<baseName>
<baseNameString>Professor Scherer</baseNameString>
</baseName>
<occurrence>
<instanceOf>
<topicRef xlink:href="#website"/>
</instanceOf>
<resourceRef xlink:href="http://www.uni-kl.de/FBChemie/Scherer/Scherer.html"/>
</occurrence>
</topic>
<!-- Prof Stark als Dozent deklariert -->
<topic id="Prof. Diehl">
<instanceOf><topicRef xlink:href="#creator"/></instanceOf>
<baseName>
<baseNameString>Professor Diehl</baseNameString>
</baseName>
<occurrence>
<instanceOf>
<topicRef xlink:href="#website"/>
</instanceOf>
<resourceRef xlink:href="http://www.fhkl.de/professoren/diehl/index.html"/>
</occurrence>
</topic>
<topic id="rippel">
<instanceOf><topicRef xlink:href="#creator"/></instanceOf>
<baseName>
<baseNameString>Andreas Rippel</baseNameString>
</baseName>
<occurrence>
<instanceOf>
<topicRef xlink:href="#website"/>
</instanceOf>
<resourceRef
xlink:href="http://www.icsy.de/mitarbeiter/rippel.html"/>
</occurrence>
</topic>
<topic id="younous">
Copyright © [email protected]
97
Semantic Web Techniken für E-Learning
<instanceOf><topicRef xlink:href="#creator"/></instanceOf>
<baseName>
<baseNameString>Younous El Moustafid</baseNameString>
</baseName>
<occurrence>
<instanceOf>
<topicRef xlink:href="#website"/>
</instanceOf>
<resourceRef xlink:href="http://www.rhrk.uni-kl.de/~elmousta"/>
</occurrence>
</topic>
<!-- Topic Vorlesung bezeichnet alle Vorlesungen -->
<topic id="titel">
<baseName>
<baseNameString>Titel der Veranstaltung</baseNameString>
</baseName>
</topic>
<topic id="MultiMedia Vorlesung">
<instanceOf><topicRef xlink:href="#titel"/></instanceOf>
<baseName>
<baseNameString>MultiMedia </baseNameString>
</baseName>
<occurrence>
<scope><topicRef xlink:href="#vorlesung"/></scope>
<instanceOf>
<topicRef xlink:href="#website"/>
</instanceOf>
<resourceRef xlink:href="http://venture.informatik.unikl.de:11000/index.html"/>
</occurrence>
</topic>
<topic id="Organische Chemie">
<instanceOf><topicRef xlink:href="#titel"/></instanceOf>
<baseName>
<baseNameString>Organische Chemnie</baseNameString>
</baseName>
<occurrence>
<scope><topicRef xlink:href="#vortrag"/></scope>
<instanceOf>
Copyright © [email protected]
98
Semantic Web Techniken für E-Learning
<topicRef xlink:href="#website"/>
</instanceOf>
<resourceRef xlink:href="http://www.uni-kl.de/FBChemie/Scherer/Vorlesungen/OrganischeChemie.pdf"/>
</occurrence>
</topic>
<topic id="SVGundXML">
<instanceOf><topicRef xlink:href="#titel"/></instanceOf>
<baseName>
<baseNameString>SVG und XML </baseNameString>
</baseName>
<occurrence>
<scope><topicRef xlink:href="#vorlesung"/></scope>
<instanceOf>
<topicRef xlink:href="#website"/>
</instanceOf>
<resourceRef xlink:href="http://www.fhkl.de/SVGvorlesung.html"/>
</occurrence>
<occurrence>
<scope><topicRef xlink:href="#seminar"/></scope>
<instanceOf>
<topicRef xlink:href="#website"/>
</instanceOf>
<resourceRef xlink:href="http://www.unikl.de/SVGseminar.html"/>
</occurrence>
</topic>
<!--Hier kommen alle moeglischen Schlagwoerter , die in den verschiedenen
Vorlesungen zu finden sind -->
<topic id="schlagwort">
<baseName>
<baseNameString>Schlagwort</baseNameString>
</baseName>
</topic>
<topic id="kette">
<instanceOf><topicRef
xlink:href="#schlagwort"/></instanceOf>
<baseName>
Copyright © [email protected]
99
Semantic Web Techniken für E-Learning
<baseNameString>Kette</baseNameString>
</baseName>
</topic>
<topic id="netze">
<instanceOf><topicRef
xlink:href="#schlagwort"/></instanceOf>
<baseName>
<baseNameString>Netze</baseNameString>
</baseName>
</topic>
<topic id="ATM">
<instanceOf><topicRef xlink:href="#schlagwort"/></instanceOf>
<baseName>
<baseNameString>ATM</baseNameString>
</baseName>
</topic>
<!-- Jetzt kommt der grosse Vorteil von TopicMaps, naemlich die Zuordnung bzw.
die Relationen (Beziehungen)
zwischen den verschiedenen Topics (Themen) -->
<topic id="ist-teil-von">
<baseName>
<baseNameString>ist Teil der</baseNameString>
</baseName>
</topic>
<association>
<instanceOf>
<topicRef xlink:href="#ist-teil-von"/>
</instanceOf>
<member>
<roleSpec><topicRef xlink:href="#study_field"/></roleSpec>
<topicRef xlink:href="#informatik"/>
</member>
<member>
<roleSpec><topicRef xlink:href="#publisher"/></roleSpec>
<topicRef xlink:href="#uni-kl"/>
</member>
</association>
<association>
<instanceOf>
Copyright © [email protected]
100
Semantic Web Techniken für E-Learning
<topicRef xlink:href="#ist-teil-von"/>
</instanceOf>
<member>
<roleSpec><topicRef xlink:href="#study_field"/></roleSpec>
<topicRef xlink:href="#informatik"/>
</member>
<member>
<roleSpec><topicRef xlink:href="#publisher"/></roleSpec>
<topicRef xlink:href="#fh-kl"/>
</member>
</association>
<association>
<instanceOf>
<topicRef xlink:href="#ist-teil-von"/>
</instanceOf>
<member>
<roleSpec><topicRef xlink:href="#Study_field"/></roleSpec>
<topicRef xlink:href="#chemie"/>
</member>
<member>
<roleSpec><topicRef xlink:href="#publisher"/></roleSpec>
<topicRef xlink:href="#uni-kl"/>
</member>
</association>
<topic id="lehrt in">
<baseName>
<baseNameString>lehrt in</baseNameString>
</baseName>
</topic>
<association>
<instanceOf>
<topicRef xlink:href="#lehrt in"/>
</instanceOf>
<member>
<roleSpec><topicRef xlink:href="#creator"/></roleSpec>
<topicRef xlink:href="#Prof. Mueller"/>
</member>
<member>
Copyright © [email protected]
101
Semantic Web Techniken für E-Learning
<roleSpec><topicRef xlink:href="#publisher"/></roleSpec>
<topicRef xlink:href="#uni-kl"/>
</member>
</association>
<association>
<instanceOf>
<topicRef xlink:href="#lehrt in"/>
</instanceOf>
<member>
<roleSpec><topicRef xlink:href="#creator"/></roleSpec>
<topicRef xlink:href="#Prof. Scherer"/>
</member>
<member>
<roleSpec><topicRef xlink:href="#publisher"/></roleSpec>
<topicRef xlink:href="#fh-kl"/>
</member>
</association>
<topic id="befindet sich in">
<baseName>
<baseNameString>befindet sich in</baseNameString>
</baseName>
</topic>
<association>
<instanceOf>
<topicRef xlink:href="#befindet sich in"/>
</instanceOf>
<member>
<roleSpec><topicRef xlink:href="#schlagwort"/></roleSpec>
<topicRef xlink:href="#kette"/>
</member>
<member>
<roleSpec><topicRef xlink:href="#titel"/></roleSpec>
<topicRef xlink:href="#MultiMedia Vorlesung"/>
</member>
</association>
<association>
<instanceOf>
<topicRef xlink:href="#befindet sich in"/>
</instanceOf>
Copyright © [email protected]
102
Semantic Web Techniken für E-Learning
<member>
<roleSpec><topicRef xlink:href="#schlagwort"/></roleSpec>
<topicRef xlink:href="#kette"/>
</member>
<member>
<roleSpec><topicRef xlink:href="#titel"/></roleSpec>
<topicRef xlink:href="#Organische Chemie"/>
</member>
</association>
<association>
<instanceOf>
<topicRef xlink:href="#befindet sich in"/>
</instanceOf>
<member>
<roleSpec><topicRef xlink:href="#schlagwort"/></roleSpec>
<topicRef xlink:href="#kette"/>
</member>
<member>
<roleSpec><topicRef xlink:href="#titel"/></roleSpec>
<topicRef xlink:href="#SVGundXML"/>
</member>
</association>
<topic id="website">
<baseName>
<baseNameString> web site </baseNameString>
</baseName>
</topic>
<topic id="agrar">
<instanceOf><topicRef xlink:href="#study_field"/></instanceOf>
<baseName>
<baseNameString>Agrar Forst- und
Ernaehrungswissenschaften</baseNameString>
</baseName>
</topic>
<topic id="101-101">
<instanceOf>
<topicRef xlink:href="#agrar"/>
</instanceOf>
Copyright © [email protected]
103
Semantic Web Techniken für E-Learning
<baseName>
<baseNameString>Landwirtschaft</baseNameString>
</baseName>
</topic>
<topic id="1000-1999">
<instanceOf><topicRef xlink:href="#study_field"/></instanceOf>
<baseName>
<baseNameString>Humanmedizin</baseNameString>
</baseName>
</topic>
<topic id="1001-1001">
<instanceOf>
<topicRef xlink:href="#1000-1999"/>
</instanceOf>
<baseName>
<baseNameString>Medizin</baseNameString>
</baseName>
</topic>
<topic id="1101-1101">
<instanceOf>
<topicRef xlink:href="#1000-1999"/>
</instanceOf>
<baseName>
<baseNameString>Zahnmedizin</baseNameString>
</baseName>
</topic>
<topic id="2000-2999">
<instanceOf><topicRef xlink:href="#study_field"/></instanceOf>
<baseName>
<baseNameString>Ingenieurwissenschaften</baseNameString>
</baseName>
</topic>
Copyright © [email protected]
104
Semantic Web Techniken für E-Learning
<topic id="2001-2030">
<instanceOf>
<topicRef xlink:href="#2000-2999"/>
</instanceOf>
<baseName>
<baseNameString>Architektur</baseNameString>
</baseName>
</topic>
<topic id="2011-2011">
<instanceOf>
<topicRef xlink:href="#2001-2030"/>
</instanceOf>
<baseName>
<baseNameString>Architektur</baseNameString>
</baseName>
</topic>
<topic id="2016-2016">
<instanceOf>
<topicRef xlink:href="#2001-2030"/>
</instanceOf>
<baseName>
<baseNameString>Innenarchitektur</baseNameString>
</baseName>
</topic>
<topic id="2021-2021">
<instanceOf>
<topicRef xlink:href="#2001-2030"/>
</instanceOf>
<baseName>
<baseNameString>Raum- und
Umweltplanung</baseNameString>
</baseName>
</topic>
<topic id="2026-2026">
<instanceOf>
Copyright © [email protected]
105
Semantic Web Techniken für E-Learning
<topicRef xlink:href="#2001-2030"/>
</instanceOf>
<baseName>
<baseNameString>Stadtplanung</baseNameString>
</baseName>
</topic>
<topic id="2031-2031">
<instanceOf>
<topicRef xlink:href="#2000-2999"/>
</instanceOf>
<baseName>
<baseNameString>Architektur</baseNameString>
</baseName>
</topic>
<topic id="3000-3999">
<instanceOf><topicRef xlink:href="#study_field"/></instanceOf>
<baseName>
<baseNameString>Kunst, Kunstwissenschaft</baseNameString>
</baseName>
</topic>
<topic id="4000-4999">
<instanceOf><topicRef xlink:href="#study_field"/></instanceOf>
<baseName>
<baseNameString>Mathematik,
Naturwissenschaften</baseNameString>
</baseName>
</topic>
<topic id="5000-5999">
<instanceOf><topicRef xlink:href="#study_field"/></instanceOf>
<baseName>
<baseNameString>echts-, Wirtschafts- und
Sozialwissenschaften</baseNameString>
</baseName>
Copyright © [email protected]
106
Semantic Web Techniken für E-Learning
</topic>
<topic id="6000-6999">
<instanceOf><topicRef xlink:href="#study_field"/></instanceOf>
<baseName>
<baseNameString>Sport</baseNameString>
</baseName>
</topic>
<topic id="7000-7999">
<instanceOf><topicRef xlink:href="#study_field"/></instanceOf>
<baseName>
<baseNameString>Sprach- und
Kulturwissenschaften</baseNameString>
</baseName>
</topic>
<!-- Jetzt kommt ein weiterer Vorteil von TopicMaps, naemlich die Scopes -->
<topic id="vorlesung">
<baseName>
<baseNameString>Vorlesung</baseNameString>
</baseName>
</topic>
<topic id="vortrag">
<baseName>
<baseNameString>Vortrag</baseNameString>
</baseName>
</topic>
<topic id="kurs">
<baseName>
<baseNameString>Kurs</baseNameString>
</baseName>
</topic>
Copyright © [email protected]
107
Semantic Web Techniken für E-Learning
<topic id="seminar">
<baseName>
<baseNameString>Seminar</baseNameString>
</baseName>
</topic>
<topic id="videokonferenz">
<baseName>
<baseNameString>Kurs</baseNameString>
</baseName>
</topic>
<topic id="proseminar">
<baseName>
<baseNameString>Kurs</baseNameString>
</baseName>
</topic>
</topicMap>
Copyright © [email protected]
108
Semantic Web Techniken für E-Learning
10
Abbildungen
Abb. 1: Verschiedene Suchdienste _________________________________ 10
Abb. 2: „The 3rd Prophecy“ von Tim Berners-Lee _____________________ 10
Abb. 3: Topic BRD und seine Occurences (Bild, Dokumente, URL) ________ 17
Abb. 4: Topic Maps in 3D-Darstellung [Quelle: le Grand 2001] ___________ 17
Abb. 5: TAO (topics, Associations und Occurrences) ___________________ 22
Abb. 6: Fehler beim „compilieren“ einer XTM-Datei ____________________ 23
Abb. 7: Beispiel einer Topic Map __________________________________ 24
Abb. 8: Beispiel einiger Topics ____________________________________ 26
Abb. 9: TomatenTopic und seine Occurences ________________________ 27
Abb. 10: Occurences oder die reale Ausprägung der Topics _____________ 28
Abb. 11: Relation zwischen Tomaten und Salat _______________________ 33
Abb. 12: Rollen in der Assoziation _________________________________ 34
Abb. 13: Topics, Occurences und Relationen _________________________ 39
Abb. 14: AG.Prof.Müller als TopicMap ______________________________ 42
Abb. 15: AG.Prof.Müller in HTML __________________________________ 43
Abb. 16: „Overview of Ontopia Knowledge Suite“ ______________________ 45
Abb. 17: Welcome to the Omnigator ________________________________ 46
Abb. 18: Jill’s First TM ___________________________________________ 47
Abb. 19: employement-Portal _____________________________________ 48
Abb. 20: Jill Hacker-Portal _______________________________________ 49
Abb. 21: Ontopia vom Type company _______________________________ 49
Abb. 22: KnowledgeMiner von USU ________________________________ 51
Abb. 23: Graphische Darstellung __________________________________ 51
Abb. 24: Liste von Ergebnissen ___________________________________ 53
Copyright © [email protected]
109
Semantic Web Techniken für E-Learning
Abb. 25: Graphische Darstellung eines Topics ________________________ 54
Abb. 26: TopicMapDesigner ______________________________________ 55
Abb. 27: TopicMapDesigner-Viewer ________________________________ 56
Abb. 28: Olivia’s Portal __________________________________________ 58
Abb. 29: Funktionen des Semantext ________________________________ 59
Abb. 30: Olivia’s Portal (Omnigator screenshot) _______________________ 60
Abb. 31: Eine TOLOG-Anfrage ____________________________________ 62
Abb. 32: E-Learning ____________________________________________ 66
Abb. 33: E-Learning mit dem Omnigator _____________________________ 67
Abb. 34: Kette als Schlagwort _____________________________________ 68
Abb. 35: Multimedia- Portal _______________________________________ 69
Abb. 36: Architektur des Trackers __________________________________ 70
Abb. 37: Login des E-Learning-Trackers ____________________________ 71
Abb. 38: Menü des Trackers ______________________________________ 72
Abb. 39: Search for Entry ________________________________________ 72
Abb. 40: Ergebnis der Anfrage „Kette“ ______________________________ 73
Abb. 41: Kette in der Vorlesung Datenstrukturen ______________________ 73
Abb. 42: Vorlesungen von Prof. Müller ______________________________ 74
Abb. 43: Display Entry __________________________________________ 75
Abb. 44: KartOO-Ergebnisse auf Java-Anfrage _______________________ 76
Abb. 45: Ergebnisse als Liste bei Lumrix
Copyright © [email protected]
110
___________________________ 78
Semantic Web Techniken für E-Learning
11
Tabellenverzeichnis
Tabelle 1:
Copyright © [email protected]
Bedeutung des TAOs
111
17
Herunterladen