Informationsaufbereitung und Wissensorganisation in

Werbung
Informationsaufbereitung und
Wissensorganisation in transnationalen
Konzernen
Konzeption eines Informationssystems für große und geographisch verteilte
Unternehmen mit dem Hyperwave Information System
Victor Manuel García Barrios
Informationsaufbereitung und Wissensorganisation in
transnationalen Konzernen
Konzeption eines Informationssystems für große und geographisch verteilte
Unternehmen mit dem Hyperwave Information System
Diplomarbeit
an der
Technischen Universität Graz
vorgelegt von
Victor Manuel García Barrios
Institut für Informationsverarbeitung und Computergestützte neue Medien (IICM)
Technische Universität Graz
A-8010 Graz, Österreich
August 2002
© Copyright 2002, Victor Manuel García Barrios
Diese Arbeit ist in deutscher Sprache verfaßt.
Begutachter:
Betreuer:
o.Univ-Prof. Dr. Dr.h.c.mult. Hermann Maurer
Dipl.-Ing. Christian Gütl
Information Enhancing and Knowledge Organisation in
Corporate Enterprises
Conception of an information system for big and geographically distributed enterprises
with the Hyperwave Information System
Master’s Thesis
at
Graz University of Technology
submitted by
Victor Manuel García Barrios
Institute for Information Processing and Computer Supported New Media (IICM)
Graz University of Technology
A-8010 Graz, Austria
August 2002
© Copyright 2002 by Victor Manuel García Barrios
This thesis is written in german language.
Advisor:
Supervisor:
o.Univ-Prof. Dr. Dr.h.c.mult. Hermann Maurer
Dipl.-Ing. Christian Gütl
Kurzfassung
Transnationale Konzerne haben einen dringenden Bedarf an einer umfassenden Lösung für ihre
Intranetsysteme. Die spezifischen Anforderungen an ein wissensbasiertes Informationssystem
sind vielfältig, die kritischsten davon sind aber allgemein gültig und ergeben sich aufgrund der
stark vernetzten und geographisch verteilten Struktur des Konzerns. In unterschiedlichen
Wissensdisziplinen,
insbesondere
Wissensmanagement,
Informationsmanagement,
Datenmanagement und Wissensorganisation, versucht man, oftmals in den einzelnen
Disziplinen isoliert, die Erfüllung spezifischer Anforderungen zu implementieren. Nicht selten
auf eine ineffektive Weise. Die nachfolgende Arbeit verfolgt deshalb einen ganzheitlichen
Ansatz über die Wissensdisziplinen, um den umfangreichen Anforderungen gerecht werden zu
können.
Im Untersuchungsbereich der vorliegenden Arbeit wird die Problematik aus der Sicht der
wichtigsten involvierten Wissensdisziplinen beleuchtet, um nach vorhandenen bzw. etablierten
Lösungsansätzen zu suchen. Die spezifischen Einflussbereiche der Disziplinen auf
Intranetlösungen werden überprüft und kritischen Aspekten von Anforderungen (beispielsweise
’starke örtliche Verteilung vs. Systemtransparenz’, ’Replikationsmaßnahmen vs.
Systemperformanz’ oder ’semantische Wissensmodelle vs. bedarfsgerechten Wissenszugang)
gegenübergestellt. Jede Disziplin bietet effiziente und effektive Lösungen für unterschiedliche
Aspekte, es konnte jedoch kein umfassendes Gestaltungsmodell, welches die spezifischen
Lösungsansätze der Disziplinen vereint, im Rahmen des Rechercheprozesses identifiziert
werden.
Aufgrund des oben beschriebenen Sachverhalts wird im Gestaltungsbereich dieser Arbeit ein
zweiteiliges Technisches Gestaltungsmodell vorgestellt. Es besteht aus einem strategischen
Analyseschema und einem funktionalen Komponentenschema, und berücksichtigt die
Einflussbereiche oben erwähnter Wissensdisziplinen. Basierend auf der konkreten Anforderung
einer Intranetlösung für einen transnationalen - und anonymisiert dargestellten - Konzern, wird
das vorgestellte Modell angewandt, und auf Basis des Hyperwave Information Servers die
technische Umsetzung eines wissensbasierten Informationssystems, von dem beispielhaft zwei
Module näher beschrieben werden, gezeigt.
Abstract
Corporate Enterprises have an increased demand on extensive solutions for their intranet
systems. There are various specific requirements for a knowledge-based information system.
However, the most critical of them always arise from the heavily cross-linked and
geographically distributed corporate structure. Diverse knowledge centred disciplines, in
particular Knowledge Management, Information Management, Data Management and
Knowledge Organisation, attempt, often separately, to implement the specific requirements.
Often this does not happen in an optimally integrated way. The subsequent thesis follows a
hollistic approach to the knowledge centred disciplines in order to meet the extensive
requirements.
In the theoretical section of this thesis, the above depicted problem will be addressed form the
point of view of the distinct disciplines in order to search for given or established solution
approaches. The specific scopes of impact of the disciplines will be verified and confronted with
the critical aspects of requirements, e.g. ’strong locality distribution vs. system transparency’,
’replication measures vs. system performance’ or ’semantic knowledge models vs. needsdependent knowledge acquisition’. Each discipline offers efficient and effective solution
methods for different aspects, but no comprehensive design model, unifying the specific
solution approaches of each discipline, could be found within the scope of an investigation
process carried out as part of this thesis work.
By reason of the above depicted facts, a two-part Technical Design Model will be presented in
the practical section of this thesis. The model consists of one strategic analysis schema and one
functional components schema, and takes into account the scopes of impact of the above
mentioned knowledge centred disciplines. The application of the Technical Design Model will
take place according to the concrete requirement to implement an intranet solution for an
(anonymous kept) corporate enterprise by means of the Hyperwave Information Server. In order
to exemplify the implemented solution, two modules of the concept will be described closer.
Ich versichere hiermit, diese Arbeit selbständig verfaßt, andere als die angegebenen Quellen
und Hilfsmittel nicht benutzt und mich auch sonst keiner unerlaubten Hilfsmittel bedient zu
haben.
I hereby certify that the work presented in this thesis is my own and that work performed by
others is appropriately cited.
Meinen Eltern.
A mis padres.
Inhaltsverzeichnis
1 Einleitung ................................................................................................................................... 1
1.1 Ausgangssituation und Motivation ..................................................................................... 1
1.2 Transnationale Konzerne .................................................................................................... 2
1.3 Gliederung und Inhalt der Arbeit ........................................................................................ 6
Teil I – UNTERSUCHUNGSBEREICH
2 Wissensmanagement ................................................................................................................ 11
2.1 Allgemeines ...................................................................................................................... 11
2.1.1 Wissen ....................................................................................................................... 11
2.1.2 Intellektuelles Kapital................................................................................................ 14
2.1.3 Modelle des Wissensmanagements ........................................................................... 15
2.1.4 Wissensmanagement ................................................................................................. 17
2.2 Kritische Aspekte.............................................................................................................. 20
2.2.1 Unternehmensstruktur und Systemarchitektur .......................................................... 21
2.2.2 Projektmanagement und Sichtweisen ........................................................................ 22
2.2.3 Technologien und Modularität .................................................................................. 24
2.2.4 Wissensbausteine....................................................................................................... 24
2.2.5 Soziale und kulturelle Barrieren ................................................................................ 26
2.3 Schlußbemerkung ............................................................................................................. 27
3 Informationsmanagement......................................................................................................... 29
3.1 Allgemeines ...................................................................................................................... 29
3.1.1 Informationsmanagement .......................................................................................... 30
3.1.2 Informationssysteme.................................................................................................. 31
3.1.3 Verteilte Systeme....................................................................................................... 31
3.1.4 Internationale Informationssysteme .......................................................................... 32
3.1.5 Systemarchitekturen für transnational tätige Konzerne............................................. 32
3.1.6 Informationstechnisches Wissensmanagement ......................................................... 33
3.1.7 Intranet....................................................................................................................... 34
3.2 Kritische Aspekte verteilter Informationssysteme............................................................ 35
3.2.1 Unternehmensweites Informationsmanagement........................................................ 36
3.2.2 Verteilte Systeme....................................................................................................... 37
3.2.3 Zuverlässigkeit und Systemstabilität ......................................................................... 39
3.2.4 Einflüsse aufgrund starker geographischer Verteilung.............................................. 39
3.3 Schlußbemerkung ............................................................................................................. 40
4 Datenmanagement ................................................................................................................... 43
4.1 Verteilte Datenbanksysteme ............................................................................................. 44
4.1.1 Datenmanagement ..................................................................................................... 44
4.1.2 Datenbanksysteme ..................................................................................................... 44
4.1.3 Verteilte Datenbanksysteme ...................................................................................... 46
4.1.4 Organisationsgedächtnis............................................................................................ 47
4.2 Datenreplikation................................................................................................................ 49
4.2.1 Allgemeines............................................................................................................... 49
4.2.2 Replizierende Datenbanken....................................................................................... 50
4.2.3 Allgemeine Kriterien für Datenreplikation................................................................ 50
4.2.4 Replikation in verteilten Datenbanken und verteilten Systemen............................... 52
4.2.5 Andere Modelle und Lösungsansätze........................................................................ 59
4.3 Schlußbemerkung ............................................................................................................. 60
5 Wissensorganisation................................................................................................................. 63
5.1 Allgemeines ...................................................................................................................... 63
5.1.1 Wissensorganisation .................................................................................................. 64
5.1.2 Document Management und Content Management .................................................. 65
5.1.3 Information Retrieval und Resource Discovery ........................................................ 68
5.1.4 Library Science und Archival Science ...................................................................... 71
5.2 Semantik ........................................................................................................................... 73
5.2.1 Semantic Web............................................................................................................ 75
5.2.2 Metadaten .................................................................................................................. 76
5.2.3 Ontologien ................................................................................................................. 79
5.2.4 Inhaltserschließung und Inhaltsanalyse ..................................................................... 81
5.3 Organisationssysteme ....................................................................................................... 81
5.3.1 Typen von Organisationssystemen ............................................................................ 82
5.3.2 Begriffslisten ............................................................................................................. 84
5.3.3 Beziehungsstrukturen ................................................................................................ 84
5.3.4 Themenhierarchien .................................................................................................... 88
5.3.5 Clustering .................................................................................................................. 94
5.3.6 Beispiele aus der Praxis............................................................................................. 96
5.4 Sichtweisen ..................................................................................................................... 100
5.4.1 Modellierung ........................................................................................................... 100
5.4.2 Knowledge Mapping ............................................................................................... 102
5.4.3 Concept Maps.......................................................................................................... 103
5.4.4 Topic Maps.............................................................................................................. 104
5.4.5 Andere Modelle ....................................................................................................... 107
5.4.6 Mehrdimensionale Ansätze ..................................................................................... 108
5.5 Schlußbemerkung ........................................................................................................... 110
Teil II – GESTALTUNGSBEREICH
6 Lösungsvorschlag................................................................................................................... 115
6.1 Grundanalyse zur Konzeption eines allgemeinen Lösungsmodells................................ 116
6.1.1 Wirkungsbereiche der Analyse................................................................................ 116
6.1.2 Arbeitsmodell zur allgemeinen Sichtweise der Lösung .......................................... 120
6.1.3 Informationsfluß ...................................................................................................... 122
6.1.4 Spezielle Sichtweisen des Informationssystems...................................................... 124
6.2 Technisches Gestaltungsmodell zur Konzeption eines wissensbasierten
Informationssystems ............................................................................................................. 126
6.2.1 Teil 1 - Grundlegendes Schema............................................................................... 128
6.2.2 Teil 2 - Funktionales Schema .................................................................................. 130
6.2.3 Anforderungen eines transnationalen Konzerns an ein wissensbasiertes
Informationssystem .......................................................................................................... 133
6.2.4 Anfoderungsprofil für eine iterative Lösungsmethode............................................ 138
6.3 Zusammenfassung .......................................................................................................... 143
7 Implementierung des Systems................................................................................................ 144
7.1 Hyperwave Information Server....................................................................................... 144
7.2 Allgemeine Problembeschreibung .................................................................................. 148
7.2.1 Beschreibung des Konzerns..................................................................................... 148
7.2.2 Auflistung kritischer Aspekte.................................................................................. 151
7.3 Technische Implementierung.......................................................................................... 154
7.3.1 Allgemeine Lösung ................................................................................................. 155
7.3.2 Modul 1 - Metadatensätze ....................................................................................... 164
7.3.3 Modul 2 - News Applikation ................................................................................... 170
7.4 Zusammenfassung .......................................................................................................... 177
8 Zusammenfassung und Ausblick ........................................................................................... 179
Teil III - ANHANG UND VERZEICHNISSE
Anhang ...................................................................................................................................... 185
Abbildungsverzeichnis .............................................................................................................. 187
Tabellenverzeichnis................................................................................................................... 191
Literatur- und Quellenverzeichnis............................................................................................. 193
Kapitel 1 - EINLEITUNG
Seite 1
Kapitel 1
Einleitung
„Zweifel ist der Schlüssel zum Wissen..“
Spruch aus dem Iran.
1.1 Ausgangssituation und Motivation
Die Web Applications Group (WAG), eine Forschungs- und Entwicklungsgruppe des Instituts
für Informationsverarbeitung und Computergestützte neue Medien (IICM) an der Technischen
Universität Graz, Österreich, beschäftigt sich, unter anderem, mit der Entwicklung von
Knowledge Management Systemlösungen, insbesondere für das Hyperwave Information
System [Hyperwave 2001a]. Die Durchführung der vorliegenden Diplomarbeit entstand aus der
konkreten Anforderung einer Intranetlösung für einen weltweit operierenden technischen
Konzern.
Die Tatsache, dass Wissen die bedeutendste Quelle der Wertschöpfung in modernen
Organisationen darstellt, wird heutzutage praktisch überall anerkannt. Das schnelle Wachstum
und die steigende gemeinsame Nutzung von Wissen, sowie die Virtualisierung von
Unternehmen und die neuen Möglichkeiten der Informationstechnologie zwingen Konzerne
immer wieder dazu, eine systematische und aktive Verwaltung der Ressource Wissen
festzulegen. Dies geschieht in der Regel durch Mechanismen, welche die Modellierung der
funktionalen und strukturellen Merkmale des Konzerns sowie deren Abbildung auf das
Informationssystem erlauben. Die Suche nach geeigneten Technologien, welche diese
Mechanismen unterstützen, ist eine der zu lösenden Aufgaben der vorliegenden Arbeit.
Eine weitere Herausforderung bei der Gestaltung eines wissensbasierten Informationssystems
für transnationale Konzerne liegt in der starken Verteiltheit der Information auf geographisch
unterschiedliche Standorte, sowie in der verteilten Administration. Verteilte Systeme setzen
nicht nur rein technische Lösungen voraus, die mit der Funktionalität und Stabilität des
gesamten Informationssystems abhängen, sie bedürfen ebenfalls einer genau zu planenden
Strategie für die allgemeine Verwaltung von Wissenseinheiten d.h. für ihre effiziente
Aufbereitung in Zusammenhang mit strukturellen, funktionalen, organisatorischen und
zweckgebundenen Unternehmensaspekten.
Weiters sollte das Informationssystem in der Lage sein, Wissenseinheiten semantisch zu
verwalten. Aus diesem Grund stellen eine geeignete Themenhierarchie, die Verwendung von
geeigneten Metastrukturen sowie der Zugang zu den Informationseinheiten über
unterschiedliche Sichtweisen optimale Lösungswege für die Wissensverwaltung und für die
semantische Wiederauffindung von Information dar. Die Themenhierarchie repräsentiert die
semantische Abbildung der unterschiedlichen Unternehmensbereiche, Geschäftsprozesse und
Wissenseinheiten in einem Konzern über fachspezifische und einheitlich gehaltene Vokabulare.
Zusatzinformationen (Metadaten) können für die semantische Verarbeitung von Inhalten und
Dokumenten verwendet werden. Unterschiedliche Sichtweisen des Systems können
beispielsweise durch das Zusammenwirken von Wissenslandkarten, Benutzerrollenverwaltung
und Klassifikationsschemata realisiert werden.
In Bezug auf Metadaten und Themenhierarchien sind vorzugsweise etablierte Modellansätze zu
verwenden, die eine ausbaufähige, standardisierte Lösung bieten. Die Benutzung bzw.
Kapitel 1 - EINLEITUNG
Seite 2
Einbindung von Standards in der Implementierung des Informationssystems stellen eine
langfristige, integrationsfähige, wiederverwendbare, und somit kosteneffizientere Möglichkeit
zur Verfügung, um das System zu erweitern oder zu verbessern. Die Untersuchung diverser
Möglichkeiten, welche für transnationale Konzerne eine effiziente Lösung für die Verwaltung
von Metadaten und Themenhierarchien anbieten, stellt ein weiteres Anliegen des
Untersuchungsbereichs der vorliegenden Arbeit dar.
Eine Intranetlösung für transnationale Konzerne sollte auch diverse Profile von Benutzern
unterstützen, um ihnen dementsprechend eine personalisierte bzw. bedarfsgerechte Sichtweise
auf das Informationssystem zu liefern. In dieser Beziehung ist die statisch oder dynamisch
erzeugte, transparente Inhaltspräsentation gemeint. Eine unternehmensweite, konsistente
Benutzerverwaltung über die stark verteilte Architektur des Systems sollte also mit einer
effektiven Dokumentenverwaltung harmonieren.
Weiters stellt die geographische Komponente (d.h. der kritische Aspekt aufgrund weltweit
verteilter Standorte) in Hinblick auf Netzwerktechnologien und –topologien einen großen
Einflußfaktor dar. Gemeinsam mit einem effizienten Informationszugang und einer optimalen
Wissensverwaltung könnte man die Möglichkeit der Datenreplikation in Betracht ziehen (falls
zum Beispiel die lokalen Gegebenheiten eines Unternehmensbereichs keinen ’schnellen’
Datentransfer für große oder zeitkritische Dokumente erlauben). Hierbei spielen nicht nur die
technischen Lösungsaspekte von Replikationsmechanismen, sondern auch die strategischen
Entscheidungskriterien eine wichtige Rolle. Ein Mechanismus zur effizienten Aktualisierung
und Synchronisation von Replikaten soll derart erarbeitet werden, dass die Konsistenz,
Fehlertoleranz und Performanz des Speichersystems optimiert werden. Es bleibt somit die Frage
offen, welche Replikationsmechanismen für das Informationssystem eines transnationalen
Konzerns am besten geeignet sind, und warum.
Die oben erwähnten Problembereiche stellen einige der immens wichtigen Aspekte dar, die
beim Erstellen eines Intranetkonzeptes für große und geographisch verteilte Unternehmen eine
bedeutende und unentbehrliche Rolle spielen. Diese und weitere spezifischen Aspekte, sowie
ihren Einfluss auf die technische Lösungssuche sollen in dieser Diplomarbeit untersucht
werden.
Der heutzutage auftretende Begriffsdschungel in den Bereichen Wissensmanagement,
Informationsmanagement, Datenmanagement und Wissensorganisation, sowie das
interdisziplinäre Wesen dieser Sparten, führt oft zu Mißverständnissen bei der Planung und
Implementierung bzw. zu lückenhaften Betrachtungen von Lösungskonzepten. Ein besonders
wichtiges Anliegen des Autors der vorliegenden Arbeit ist es, ein wenig ’Klarheit’ in diesem
Zusammenhang zu verschaffen.
Im nachfolgenden Abschnitt sollen die grundlegendsten Eigenschaften und Problembereiche
von großen und geographisch verteilten Unternehmen dargestellt werden, um einen globalen
Überblick der hier behandelten Unternehmensstrukturen zu geben.
1.2 Transnationale Konzerne
Dieser Abschnitt soll einen Einblick in die funktionalen und strukturellen Eigenschaften eines
transnationalen Konzerns ermöglichen. Die in diesem Unterkapitel beschriebenen, allgemein
gültigen Charakteristika von großen und geographisch verteilten Unternehmen stellen kritische
Problembereiche, welche besonderes Augenmerk bei der Konzeption eines Web-basierten
Informationssystems erfordern, dar.
Kapitel 1 - EINLEITUNG
Seite 3
Der Autor dieser Arbeit verwendet abwechselnd unterschiedliche Bezeichnungen für große und
räumlich ausgebreitete Organisationsstrukturen. Im allgemeinen Fall wird der Begriff große und
geographisch verteilte Unternehmen verwendet, um Organisationen zu beschreiben, die eine
große, stark vernetzte und räumlich ausgebreitete Struktur aufweisen. Diese Auffassung des
Begriffs impliziert nicht nur eine Verteilung der geographischen Präsenz, sondern auch der
Tätigkeitsfelder. Hiermit werden also Unternehmen gemeint, die zwar eine relativ starke
funktionale und strukturelle Verteilung aufweisen, aber nicht unbedingt eine Ausbreitung über
nationale Grenzen hinweg aufweisen.
Um große und geographisch verteilte Unternehmen zu beschreiben, deren Struktur und
Geschäftsfelder sich über Ländergrenzen hinweg ausbreiten und durch den Zusammenschluss
mehrerer Organisationen zustande kommen, wird der Begriff transnationale Konzerne
verwendet.
Beide Unternehmenstypen - große und geographisch verteilte Unternehmen wie auch
transnationale Konzerne - werden ausschließlich aus der Sicht der graphischen Repräsentation
analysiert. Die nachfolgenden Beschreibungen und graphischen Darstellungen lehnen sich an
die in [Janko 2001] definierten ’Organisationsformen’ und sollen einen einführenden Blick in
die Komplexität solcher Unternehmensstrukturen ermöglichen.
Die graphische Darstellung eines Unternehmens kann als eine Wiedergabe der dazugehörigen
Organisation aufgefaßt werden. Das wesentlichste Merkmal einer Organisation stellt dessen
’dauerhafte’ Strukturierung dar. Befaßt sich der Begriff Organisation mit Strukturfragen, so
spricht man vom ’Aufbau’ des Unternehmens. Sollten hingegen Prozesse behandelt werden, so
spricht man von ’Ablauf’ der Organisation [Janko 2001].
Große und geographisch verteilte Unternehmen besitzen in der Regel eine hierarchische
organisationale Verteilung in Sub-Unternehmen. Diese hierarchische Struktur repräsentiert das
Organigramm des Unternehmens. Die einzelnen Knoten einer solchen ’Hierarchiestruktur’
werden beispielsweise durch Divisionen, Geschäftsbereiche, Sparten, Funktionen,
Unternehmensbereiche, Kompetenzen oder Standorte dargestellt. Die Verbindungen zwischen
den unterschiedlichen Hierarchieebenen stellen Wechselwirkungen, Interaktionen oder
Abhängigkeiten dar.
Einige Beispiele von Organisationsformen sind - laut [Janko 2001] und in der vorliegenden
Arbeit lediglich partiell und verallgemeinert wiedergegeben - wie folgt definierbar:
•
Funktionale Gliederung
•
Produktionale Gliederug
•
Regionale Gliederung
•
Matrixorganisation
•
Tensororganisation
Die funktionale Gliederung wird auch ’Verrichtungszentralisation’ genannt und führt zur
Darstellung der typischen Hauptabteilungen Fertigung (bzw. Produktion), Beschaffung,
Vertrieb (bzw. Marketing und Verkauf) und Verwaltung. In [Abb. 1.1] wird ein Beispiel hierfür
graphisch dargestellt.
Kapitel 1 - EINLEITUNG
Seite 4
Abbildung 1.1: Beispiel für eine funktionale Organisationsform [Janko 2001]
Eine Produktionale Gliederung oder ’Objektzentralisation’ – wie beispielsweise in [Abb. 1.2]
dargestellt - führt zur typischen zusammengefassten Darstellung von Hauptabteilungen nach
Erzeugnisgruppen, Verfahrenstechniken oder Kundenkreisen. Die sich aus dieser
Organisationsform ergebenden Elemente werden auch Divisionen, Geschäftsbereiche, Sparten,
Unternehmensbereiche oder einfach Teilbereiche genannt.
Abbildung 1.2: Beispiel für eine produktionale Gliederung) [Janko 2001]
Die Regionale Gliederung erfolgt nach geographischen Gesichtspunkten und ist vor allem bei
Unternehmen mit international gestreuten Tätigkeitsspektrum zu beobachten. Die Gliederung
erfolgt hier häufig nach Kontinenten oder Ländergruppen bzw. beiden. So eine
Darstellungsform besitzt typischerweise als oberste Schichte eine höhere Leitungsebene,
wodurch sich eine geographische Kompetenzendarstellung ergeben kann (siehe [Abb. 1.3]).
Abbildung 1.3: Beispiel für eine regionale Organisationsform [Janko 2001]
Kapitel 1 - EINLEITUNG
Seite 5
Bei Matrix- und Tensororganisation kommt es zur gleichzeitigen Berücksichtigung des
Verrichtungs- und Objektaspekts. Die Matrixorganisationsform ist durch gleichzeitige
funktionale und produktionale bzw. regionale Gliederung gekennzeichnet. Die
Tensororganisationen ist eine dreidimensionale Darstellungsform. Hierbei wird nach einem
bestimmten Merkmal - wie beispielsweise der regionalen Gliederung - die Matrixorganisation
weiter untergliedert. Tensororganisationen kommen gewöhnlich nur bei großen und
geographisch verteilten Unternehmen vor. Beispiele für diese Organisationsformen werden
graphisch in [Abb. 1.4] und [Abb. 1.5] dargestellt.
Abbildung 1.4: Beispiel für eine Matrixorganisation [Janko 2001]
Abbildung 1.5: Beispiel für eine Tensororganisation [Janko 2001]
Die obere Behandlung dieser Organisationsformen sollte nicht nur die Vielfalt der
Möglichkeiten, sondern insbesondere die Komplexität der zusammengesetzten Varianten
(Matrix- und Tensororganisation) verdeutlichen. Diese mehrdimensionalen Darstellungsformen
Kapitel 1 - EINLEITUNG
Seite 6
stellen ’genau’ jene Strukturierungen dar, welche vom verteilten wissensbasierten
Informationssystem abstrahiert und verwaltet werden sollen.
Auch bei der Betrachtung einer einzigen Darstellungsform sollte man die Querverbindungen
(Abhängigkeiten bzw. Wechselwrikungen) zwischen den explizit zusammengehängten
Elementen nicht übersehen. Folgende Szenarien (fiktive Beispiele) stellen also nicht zu
unterschätzende Einflußfaktoren dar: a) eine Fertigungsabteilung des Unterbereichs ’B’ in
Spanien kann organisatorisch und funktionell stark mit einer Lieferungsabteilung des
Hauptbereichs ’B’ in Guatemala oder einem Entwicklungs-Unterbereich in Indien verbunden
sein, oder b) eine technische Gebrauchsanweisung könnte während ihres Erstellungsprozesses
nicht nur vertikal mehrere Hierarchieknoten, sondern auch horizontal mehrere Abteilungen in
unterschiedlichen und regional verteilten Unterbereichen durchlaufen. Diese Betrachtung der
verteilten und kollaborativen Geschäftsprozesse soll auch durch das Informationssystem richtig
erkannt und verarbeitet werden.
Zusammenschlüsse von Unternehmen zu großen Konzernen, aber auch das Outsourcing (das
Weitergeben von Teilaufgaben) verändern zunehmend die Anforderungen, die an große
Informationssysteme gestellt werden. Damit eng verbunden ist die Anforderung an die
Informationstechnologie, Information und Wissen auch bei einer Verteilung der
Wissenseinheiten (humane ebenso wie elektronisch erfassten Ressourcen) effizient und effektiv
zur Verfügung stellen zu können.
Die Aufgabe der vorliegenden Arbeit besteht infolgedessen darin, nach existierenden
Mechanismen zu suchen, welche die Problematik der starken Verteilung von
Informationseinheiten technisch abstrahiert und vereinfacht. Das heißt, diese Mechanismen
sollen einen transparenten Zugang zu verteilten Informationseinheiten sowie eine
bedarfsgerechte und effiziente Informationsauffindung ermöglichen. Hierfür ist eine
semantische Vernetzung des kollektiven Wissens erforderlich, um zum Beispiel die Umsetzung
von funktionalen Prozessen zu optimieren.
Die einzelnen Kapitel der vorliegenden Arbeit stellen einen Rahmen aus übergeordneten
Konzepten dar, die bei der Realisierung eines Informationssystems für große und geographisch
verteilte Unternehmen – insbesondere transnationale Konzerne - beachtet werden sollten. Der
Untersuchungsbereich soll es ermöglichen, die darin behandelte Thematik speziell für die
evaluierte Unternehmensform – zumindest in allgemeiner Form – zu behandeln, d.h. einen
’ersten’ Lösungsvorschlag zu formulieren. Die Gliederung der damit zusammenhängenden
Schwerpunkte, und somit der prinzipielle Aufbau der vorliegenden Arbeit, wird im nächsten
Unterkapitel kurz dargestellt.
1.3 Gliederung und Inhalt der Arbeit
Aufbauend auf den Untersuchungsbereich - welcher die Kapiteln 2 bis 5 umfasst und respektive
die Themen Wissensmanagement, Informationsmanagement, Datenmanagement und
Wissensorganisation behandelt - werden ein erster allgemeiner Lösungsvorschlag und
beispielhaft zwei für das Hyperwave Information System umgesetzte Applikationen im
Gestaltungsbereich (Kapitel 6 und 7) erarbeitet und dargestellt. Teilbereiche aus dem
vorgestellten Gestaltungsmodell wurden konkret für einen - in dieser Arbeit anonymisiert
dargestellten - transnationalen technischen Konzern als Module implementiert (auf der Basis
des Hyperwave Information Servers) und sind im Gestaltungsbereich beschrieben.
Im Kapitel 2 Wissensmanagement werden die theoretischen Grundlagen und die praktischen
Hintergründe im Bereich Knowledge Management untersucht. Dabei wird die heutzutage oft
Kapitel 1 - EINLEITUNG
Seite 7
verwendete und stets unterschiedlich interpretierte Terminologie näher betrachtet. Unter dem
Gesichtspunkt eines transnationalen Konzerns wird hier auf die informationstechnologische und
betriebsspezifische Problematik der Wissensaufbereitung hingewiesen.
Mit den aus Kapitel 2 gewonnenen Erkenntnissen wird im Kapitel 3 Informationsmanagement
die technologische Seite von verteilten Informationssystemen behandelt. Die praxisrelevanten
Einflussfaktoren und kritischen Aspekte, die für die Lösungssuche und somit die Konzeption
einer verteilten Informationsarchitektur eine wichtige Rolle spielen, werden in diesem Kapitel
dargelegt.
Kapitel 4 Datenmanagement beschäftigt sich mit der physikalischen Verwaltung von Daten,
insbesondere mit dem kritischen Aspekt der Datenreplikation in weltweit verteilten
Systemarchitekturen. Zunächst werden die theoretischen Grundlagen im Bereich der verteilten
Datenbanken und der Organisationsgedächtnisse eingeführt. Anschließend werden die
unterschiedlichen Replikationsmechanismen analysiert. Es wird dabei vor allem versucht, die
wichtigsten Entscheidungskriterien herauszufinden, um die Kernfragen „was, wann und wie
wird repliziert?“ zu beantworten.
Der Bereich Wissensorganisation und die damit verwandten Disziplinen - wie zum Beispiel
Document Management, Content Management, Information Retrieval, Resource Discovery,
Library Science und Archival Science - werden im Kapitel 5 Wissensorganisation eingehend
untersucht und gegenübergestellt. Weiters befasst sich Kapitel 5 mit dem Thema Semantik,
wobei Metadaten und Ontologien den Schwerpunkt bilden. Die Hauptthemen des Kapitels 5
bilden aber die Abschnitte 5.3 ’Organisationssysteme’ und 5.4 ’Sichtweisen’. Der Abschnitt
’Organisationssysteme’ befasst sich mit semantischen Begriffsstrukturen. Dabei werden die
Themen Begriffslisten, Beziehungsstrukturen, Themenhierarchien (Klassifikationssysteme,
Taxonomien und Kategoriesysteme) und Clustering ausführlich und aus der Sicht von
transnationalen Konzernen untersucht. Der Abschnitt ’Sichtweisen’ präsentiert die Grundlagen
von Wissenmodellierung und –mapping sowie unterschiedliche Technologien der semantischen
Wissenskartographie.
Aufbauend auf die im Untersuchungsbereich gewonnenen Erkenntnisse, wird in Kapitel 6
Lösungsvorschlag ein erster Gesstaltungsvorschlag, welcher die allgemeinen Anforderungen
eines transnationalen Konzerns erfüllen soll, vorgestellt. Es ist dies ein neuartiger, entwickelter
Modellansatz - ein Framework – zur Planung und Gestaltung von Intranetsystemen für
transnationale Konzerne.
Im Kapitel 7 Implementierung des Systems wird, anhand der konkreten Anforderungen eines
anonymisiert dargestellten transnationalen Konzerns, ein komplettes Gestaltungsmodell für ein
wissensbasiertes Informationssystem auf der Basis des Hyperwave Information Servers
beschrieben. Zwei Teillösungen aus dem allgemeinen Modell werden anschließend als getrennte
Module (Metadatensätze und News Applikation) ins Detail präsentiert. Im Kapitel 8 werden
letztlich Rückschlüsse aus der gesamten Arbeit zusammengefasst. Erweiterungs- und
Verbesserungsmöglichkeiten des in der vorliegenden Arbeit dargelegten Lösungsmodells
werden im gleichen Kapitel aufgezählt
Kapitel 1 - EINLEITUNG
Seite 8
Teil I - UNTERSUCHUNGSBEREICH
Seite 9
Teil I
UNTERSUCHUNGSBEREICH
Teil I - UNTERSUCHUNGSBEREICH
Seite 10
Kapitel 2 - WISSENSMANAGEMENT
Seite 11
Kapitel 2
Wissensmanagement
„Die Zukunft lebt vom Austausch des Wissens.“
Albert Einstein
Mit diesem Kapitel soll das erste und grundlegendste mit einem modernen Informationssystem
verfolgte Ziel, das Wissensmanagement, erläutert werden. Dabei wird zunächst auf die
wichtigsten Definitionen bezüglich dieser Disziplin eingegangen. Da eine nähere Betrachtung
dieser Grundlagen ein Themenkomplex für sich darstellt, und diese Diplomarbeit die Thematik
aus der Sicht eines transnationalen Unternehmens behandelt, erhalten hier die mit
Wissensmanagement verfolgten strategischen Ansätze mehr Bedeutung. Im Unterkapitel 2.2
’Kritische Aspekte’ werden die für transnationale Konzerne wichtigsten Entscheidungskriterien
und Anforderungen eines Wissensmanagementsystems präsentiert und analysiert.
2.1 Allgemeines
Um den Begriff Wissensmanagement zu verstehen, benötigt man einerseits den
zugrundeliegenden Wissensbegriff als ’Bausubstanz’, und andererseits das Verständnis vom
Managementbegriff als ’Steuerelement’. Management als Steuerelement, weil man damit
unternehmerische und menschliche Aspekte einer Organisation (d.h. Unternehmens- und
Personalführung) zielgerichtet zu steuern versucht.
2.1.1 Wissen
Das bekannteste Definitionsmodell für Wissen beruht auf einer begrifflichen Trennung von
Daten, Information und Wissen innerhalb einer hierarchischen Sichtweise, wobei Daten an
unterster Stelle platziert sind, da sie als Voraussetzung für die weitere Analysen gelten. Die
Hierarchie stellt sowohl eine wertabhängige Anordnung als auch eine chronologische Abfolge
dar [Rollett 2000].
Daten sind unstrukturierte, isolierte und kontext-unabhängige Fakten. Sie existieren einfach,
und besitzen keine Bedeutung jenseits ihrer Existenz. Daten stellen die Grundlage für
Information und Wissen dar [Rollett 2000].
Information gewinnt man aus vom Menschen bewerteten Daten. Informationen sind Daten, die
eine Bedeutung durch assoziative Beziehungen bekommen:
„Information besteht aus Daten, die durch den Verstand von Personen gelaufen
sind und aussagekräftig gefunden wurden.“ [Huang 1998] 1
Aus prozessorientierter Perspektive identifizieren Informationsmodelle unterschiedliche
Mechanismen, durch die man Information aus Daten erstellen kann. Diese sind
Kontextualisierung, Kategorisierung, Berechnung, Korrektur und Komprimierung [Davenport et
al. 1997a].
1
“Information consists of data passed through a person’s mind and found meaningful [Huang 1998].”
Kapitel 2 - WISSENSMANAGEMENT
Seite 12
Wissen besitzt heutzutage mindestens zwei Bedeutungen. Wissen als Objekt, wie zum Beispiel
die Definitionen (Erkenntnisse) in einem Wörterbuch oder einer Enzyklopädie, und Wissen als
Prozess, wie die Qualifikationserfahrungen, die sich im Handeln eines Experten zeigen. Wissen
beinhaltet also viel mehr als Information [Rollett 2000]:
„Wissen könnte als Information definiert werden, die mit Erfahrung, Kontext,
Interpretation und Nachdenken kombiniert worden ist.“ [Davenport et al. 1997b]
2
[Röpnack et al. 1998] geben eine allgemeinere Definition von Wissen an, wobei der Mensch
nicht explizit im Prozess involviert ist:
„Wissen ist Information verknüpft mit einem spezifizierten Kontext, und wird
durch eine intelligente Komponente verarbeitet.“ [Röpnack et al. 1998] 3
Eine entgegengesetzt gerichtete Sichtweise, bei der Wissen als gegeben vorausgesetzt wird, um
daraus Information durch Strukturieren zu gewinnen, wird in [Tuomi 1999] präsentiert. In
diesem Modell entstehen Daten erst am Ende des zeitlichen Prozesses, und zwar als
Zusatzprodukt des kognitiven Prozesses, bei dem die aus der Information gewonnenen
Strukturen interpretiert werden.
Die zwei zuletzt besprochenen Sichtweisen (von H. Röpnack und I. Tuomi) basieren auf einer in
Bezug auf Information gemeinsamen Tatsache: sie behandeln Information nicht als statisches
Phänomen, sondern als Aktion bzw. Prozeß. Die sehr bekannte und oft zitierte Devise – siehe
z.B. [Capurro 2000a] oder [Bergermann 1999] - des deutschen Informationswissenschaftlers
Rainer Kuhlen4, bringt den Sachverhalt kurz und prägnant zum Punkt:
„... Information ist Wissen in Aktion.“ 5
Dem Modell von Russell Ackoff zufolge, ein Systemtheoretiker und Professor für
’Organizational Change’, kann der menschliche Verstand in fünf Kategorien klassifiziert
werden: Daten, Information, Wissen, Verständnis und Weisheit. Daten sind Symbole.
Information gewinnt man aus Daten, die verarbeitet werden, um nutzbar zu sein. Information
liefert Antworten auf ’Wer’-, ’Was’-, ’Wo’- und ’Wann’-Fragen. Wissen ist die Anwendung
von Daten und Information, und liefert Antworten auf ’Wie’-Fragen. Verständnis ist die
Einschätzung des ’Warum’. Weisheit wird als persönliche Beurteilung bzw. Erkennung des
verstandenen Wissens definiert [Bellinger et al. 2001a].
Die ersten vier Kategorien beziehen sich auf die Vergangenheit, da sie mit existierenden Fakten
oder vorhandenem Wissen zu tun haben. Bloß die fünfte Kategorie, die Weisheit, bezieht sich
auf die Zukunft, weil sie Vision und Entwurf einschließt. Um aber Weisheit zu erlangen, muss
2
“Knowledge could be defined as information that has been combined with experience, context,
interpretation, and reflection [Davenport et al. 1997b].”
3
“Knowledge is information associated with a specified context and is processed by an intelligent
component [Röpnack et al. 1998].”
4
Rainer Kuhlen: „Hypertext - ein nicht-lineares Medium zwischen Buch und Wissensbank“ - Addison
Wesley, Berlin. Springer, Heidelberg - 1991
5
Zitat aus [Bergermann 1999]: „... mit dem Begriff ’Wissen’ des Informatikers Kuhlen...: ’Information
hat keinen quasi objektiven Charakter, sie muß unter Berücksichtigung der Rahmenbedingungen erst aus
Wissen bzw. der Darstellung von Wissen verarbeitet werden. Informationen können nicht wie Daten
verarbeitet werden, sondern werden erst unter Berücksichtigung konkreter Bedürfnisse und
Handlungssituationen erarbeitet. Information ist - wenn man es in eine Formel packen wollte - Wissen in
Aktion’.“
Kapitel 2 - WISSENSMANAGEMENT
Seite 13
man sich sequentiell durch die ersten Kategorien bewegen [Bellinger et al. 2001b]. Wissen ist in
diesem Modell als deterministischer Prozess zu betrachten, während Verständnis kognitiv und
analytisch ist. Der Unterschied zwischen Wissen und Verständnis ist wie Merken (sich etwas
einprägen) und Lernen. Erst wenn Menschen etwas verstanden haben, können sie neues Wissen
aus vorhandenem Wissen generieren. Zum Beispiel, es hilft sehr wenig zu wissen, dass 5 x 9 =
45 und 12 x 12 = 144, wenn man das Multiplizieren nicht versteht und schwierigere Aufgaben
bewältigen will, etwa 144 x 45. Schließlich wird in [Bellinger et al. 2001a] erläutert, dass
Weisheit ein extrapolativer, nicht probabilistischer und nicht deterministischer Prozess ist. Sie
ist die Grundlage der philosophischen Erforschung, der Prozeß durch den wir erkennen und
beurteilen können ob etwas richtig oder falsch, gut oder schlecht ist.
Die fünf Kategorien dieses Wissensmodells lassen sich, wie in [Abb 2.1] gezeigt, graphisch
darstellen, wobei die Kategorie Verständnis kein eigener Ebenenpunkt, sondern eine Achse
repräsentiert. Der Daten-zu-Weisheit-Übergangsvektor (DWÜV) symbolisiert in der Abbildung
nicht einen morphologischen, sondern den semiotischen Übergang von Daten zu Weisheit über
den Verständnisparameter, wobei die drei Verständnis-Teilübergänge (VerständnisBeziehungen, -Muster und -Prinzipien) vom Autor der vorliegenden Arbeit bidirektional (d.h.
auch in Richtung Ursprung) dargestellt wurden, da der umgekehrte Weg durchaus möglich ist
(in Übereinstimmung mit dem in [Tuomi 1999] präsentierten Modell).
Kontextabhängigkeit
Weisheit
DWÜV
Wissen
Information
Daten
V-Prinzipien
V-Muster
V-Beziehungen
Verständnis (V)
Abbildung 2.1: Fünf Kategorien Modell nach Ackoff [Bellinger et al. 2001b]
In [Bellinger et al. 2001b] wird zusätzlich auf Csikszentmihalyis Interpretation der Komplexität
Bezug genommen. Wie komplex etwas ist oder nicht, läßt sich laut Csikszentmihalyi durch
Differenzierung und Integration (analog zu Analyse und Synthese) definieren. Der Grad an
Komplexität ergibt sich somit, wie in [Abb. 2.2] graphisch dargelegt, innerhalb der Grenzen
eines entstehenden ’Komplexitätskorridors’ (graue Fläche).
Differenziert
Kompliziert
Komplexität
Banal
Integriert
Abbildung 2.2: Interpretation des Komplexitätbegriffs nach Csikszentmihalyi [Bellinger et al. 2001b]
Kapitel 2 - WISSENSMANAGEMENT
Seite 14
Wenn man beide Diagramme übereinander legt, entsteht plötzlich eine neue Sichtweise mit
interessanten Überlappungen, zum Beispiel die Äquivalenz der Richtung des Daten-zuWeisheit-Übergangsvektors (DWÜV) mit dem Entfaltungsfluß der Komplexität (Ausrichtung
des Komplexitätskorridors). Das resultierende Diagramm wird in [Abb. 2.3] dargestellt. Dieser
Sachverhalt unterstützt also viele Thesen, die Daten als ’einfachere’ und Wissenseinheiten als
’komplexere’ Gebilde auffassen.
Kontextabhängigkeit
(differenziert)
Weisheit
DWÜV
Wissen
Information
Daten
itä
ex
l
p
om
K
or
id
r
r
ko
ts
Verständnis (integriert)
Abbildung 2.3: Modellerweiterung. Korrelation des Wissensmodells von Ackoff mit dem
Komplexitätsmodel von Csikszentmihalyi [Bellinger et al. 2001b]
Abschließend zum Thema Wissen sei hier auf folgende, in [Reinmann 2001] erscheinende
Anmerkungen hingewiesen. Da Wissensmanagement wissenschaftlich von der
Interdisziplinarität lebt und sich in der Praxis mit unterschiedlicheren Gebieten innerhalb einer
Organisation auseinandersetzt, könnte es sogar kontraproduktiv sein, das Wesen des Wissens
verstehen zu wollen. Um mit Wissen umgehen zu können, wird das Phänomen mit dem Begriff
Zeit verglichen. Jeder glaubt zu wissen und zu verstehen was Zeit ist, und kommt damit auch
sehr gut zurecht. Sobald man aber versucht Zeit genauer zu definieren, entzieht sich einem das
Wesen der Zeit. Simultan wird jedem klar, dass man Zeit gar nicht erkenntnistheoretisch
verstehen muß, um damit umgehen zu können [Reinmann 2001].
2.1.2 Intellektuelles Kapital
Aus der Sicht eines großen Unternehmens kann man Wissen - beispielsweise - in Dokumenten
finden. Dies können Texte, Grafiken, Statistiken, E-mails oder ausgefüllte Formulare sein, die
ausgewertete Informationen über Kunden, Produkte, Geschäftsprozesse, usw. enthalten. Im
Allgemeinen wird all das relevante Wissen eines Unternehmens (die Summe des in den Köpfen
ihrer Mitarbeiter gespeicherten Wissens, jegliche Dokumente und Datenbankbestände,
Geschäftsprozesse und –beziehungen, usw.) intellektuelles Kapital genannt.
Aus der betriebswirtschaftlich orientierten Sicht des Wissens kann man leicht die Bedeutung
vom Intellektuellen Kapital für ein Unternehmen extrahieren:
“... Wissen ist, durch Forschung, Untersuchung oder Erfahrung internalisierte
Information, die einen Wert für die Organisation hat [Kerssens et al. 1996] 6.”
6
“... knowledge is information internalized by means of research, study or experience, that has value for
the organization [Kerssens et al. 1996].”
Kapitel 2 - WISSENSMANAGEMENT
Seite 15
Demzufolge kann man Intellektuelles Kapital als die in Kapitalwerten ausgedrückte
unternehmerische Wissensbasis definieren. Es beinhaltet strukturelles Kapital, humanes Kapital
und kundenspezifisches Kapital.
Das Innenleben moderner Konzerne erfährt derzeit einen technischen Umschwung,
Managementstrukturen werden abgeglichen, Mitarbeiter bekommen mehr Teilnahme an
unternehmerischer Macht. Diese für das Ende des 20. Jahrhunderts typischen Einflußfaktoren
verlagern somit den Mittelpunkt mehrerer Analysen auf die Wissensarbeiter (engl.: ’knowledge
workers’). Die neuen Produktionswerkzeuge sind Spezialistenkompetenz und Wissen – also
intellektuelles Kapital [Stevenson 1995]:
“Die grundsätzlichen Werkzeuge der Produktion sind heutzutage nicht Anlagen
und Ausrüstung, sondern die Ideen und Talente der Menschen. Das intellektuelle
Kapital des Wissenschaftlers, des Anlagenbetreibers und des Programmierers
stellt heutzutage die kritische Ressource dar, so dass die Inhaber dieser
intellektuellen Produktionswerkzeuge – die Menschen – zur Ausübung effektiver
Macht kommen werden [Stevenson 1995] 7.“
Es schaut so aus, als müssten viele Unternehmer Struktur, Philosophie und Funktionsziele ihrer
Organisationen überdenken, um denjenigen mehr Stimmrecht zu geben, die dieses Kapital
besitzen – den Arbeitern [Stevenson 1995].
2.1.3 Modelle des Wissensmanagements
Nur wenige Modelle des Wissensmanagements haben sich bisher durchsetzen können, d.h. sie
haben große Verbreitung, Akzeptanz und Anerkennung gefunden. Diese drei Kriterien werden
vor allem vom Spiralmodell der Japaner Ikujiro Nonaka & Hirotaka Takeuchi, vom
Bausteinmodell der Gruppe um Gilbert Probst, aber auch vom prozessorientierten Modell von
Chun Wei Choo erfüllt.
Im Spiralmodell von [Nonaka et al. 1995] wird primär eine Klassifikation des Wissens
durchgeführt:
a) Explizites Wissen ist objektiv, kodifiziert, transferierbar und formaler Natur.
b) Implizites oder verborgenes Wissen, im englischsprachigen Raum auch ’tacit
knowledge’ genannt, ist subjektiv, persönlich, und somit auf individuelle
Erfahrungen, Kultur, Emotionen und Werte basierend. Implizites Wissen besteht aus
Können, Handlungsroutinen, Überzeugungen, Glaubenssätzen und geistigen
Schemata [Forst1999].
Das dazugehörige Modell wird in [Abb. 2.4] graphisch gezeigt. Das Explizitmachen eines
impliziten Kontexts ist eine wesentliche Voraussetzung für die Schaffung neuen Wissens. Dabei
ist zu betonen, dass in diesem Modell verschiedene Formen der Wissensumwandlung
stattfinden [Nonaka et al. 1995]:
a) Sozialisation
(vom impliziten zum impliziten Wissen)
7
“The principle tools of production today are not machinery and equipment, but the ideas and talents of
the people. Today, the intellectual capital of the scientist, the machinist, and the programmer is the
critical resource, so the possessors of the intellectual tools of production - people - will come to exercise
effective power [Stevenson 1995].”
Kapitel 2 - WISSENSMANAGEMENT
Seite 16
b) Externalisierung
(vom impliziten zum expliziten Wissen)
c) Kombination
(vom expliziten zum expliziten Wissen)
d) Internalisierung
(vom expliziten zum impliziten Wissen)
Sozialisation, Kombination und Internalisierung sind in gängigen Organisationstheorien zu
identifizieren. Die Kombination ist außerdem eine zu lernende Fähigkeit von
Informationsmanagern. Das Neue bei diesem Ansatz ist nicht nur das Hervorheben der bislang
unbeachteten Dimension des impliziten Wissens, man stellt sie in einen dynamischen
Zusammenhang mit anderen Formen des Wissenstransfers, der als ein spiralförmiges
Zusammenwirken aufzufassen ist [Nonaka et al. 1995].
Explizites
Wissen
Internalisierung
Explizites
Wissen
Kombination
Externalisierung
Sozialisation
Implizites
Wissen
Implizites
Wissen
Abbildung 2.4: Wissensspirale von Nonaka & Takeuchi
Im Prozeßmodell von [Choo 1998] ist keine streng begriffliche Trennung zwischen Information
und Wissen zu identifizieren. Er definiert drei strategische Prozeßklassen für das Einsetzen von
Information:
a) Bedeutungsbestimmung (engl.: ’sensemaking’) heißt Ereignisse und Aktivitäten des
Unternehmens interpretieren und ihnen eine spezifische Bedeutung zuordnen.
b) Wissensschaffung (engl.: ’knowledge creating’) ist die individuelle Gewinnung von
Erkenntnissen und deren Weitergabe an die Organisation.
c) Entscheidungsfindung (engl.: ’decision making’) bedeutet die zielorientierte
Anwendung des Wissens beim Treffen von Entscheidungen.
Das Bausteinmodell von [Probst et al. 1999], dessen graphische Darstellung in [Abb. 2.5]
gezeigt wird, identifiziert wissensbezogene Aktivitäten, die als geschlossenes System (ohne
externe Einflüsse) miteinander interagieren.
Kapitel 2 - WISSENSMANAGEMENT
Seite 17
Zielsetzung
Wissensidentifikation
Wissenserwerb
Feedback
Wissensentwicklung
Wissens(ver)teilung
Wissensbewahrung
Messung
Wissensnutzung
Abbildung 2.5: Bausteinmodell des Wissensmanagements [Probst et al. 1999]
Die Anordnung der Bausteine folgt zwei Prinzipien. Ein äußerer Kreislauf mit den
Komponenten Wissensziele (Zielsetzung), Wissensumsetzung (rechter Teil in [Abb. 2.5]) und
Wissensbewertung (Messung) bildet einen Managementprozeß ab. Dieser äußere Regelkreis
verdeutlicht die Wichtigkeit strategischer Aspekte und die Bedeutung eindeutiger und konkreter
Zielsetzungen.
Im inneren Kreislauf befinden sich die Bausteine Wissenstransparenz, Wissenserwerb,
Wissensentwicklung, Wissens(ver)teilung, Wissensbewahrung und Wissensnutzung. Das
Auftauchen vieler Wissensprobleme in Unternehmen ist darauf zurückzuführen, dass die
Organisation einem oder mehreren dieser Bausteine zu wenig Beachtung schenkt und somit den
Regelkreis stört. Dies könnte geschehen wenn zum Beispiel keine Transparenz über intern
erstellte Dokumentationen bzgl. Forschungsstudien besteht. Somit können diese Informationen
nicht im Prozeß weiterer Produktentwicklungen genutzt werden. Falls einzelne Prozesse
während einer Problemlösung nicht dokumentiert werden, können sie dem
Organisationsgedächtnis entfallen und die Wiederholung einer erfolgreich durchgeführten
Entwicklung unmöglich machen [Probst et al. 1999].
Das Festlegen dieser Bausteine hat mehrere Vorteile: es ermöglicht eine logische Strukturierung
des Managementprozesses in logische Phasen, bietet Investitionsansätze und liefert ein
erprobtes Raster für die Suche nach den Ursachen von Wissensproblemen [Rollett 2000].
2.1.4 Wissensmanagement
Um den Begriff Wissensmanagement zu verstehen, wurde schon das Wesen seiner Bausubstanz,
des Wissens, auf theoretische Weise erklärt. Um nun das Wesen des Managements zu verstehen,
wird hier zunächst der Vergleich eines Managers mit einem Steuermann gezogen.
Das altgriechische Wort für Steuermann ist ’Kybernetes’. Demzufolge ist es nicht erstaunlich,
dass die gängige Vorstellung von Management einem kybernetischen Regelkreismodell gleicht.
Kapitel 2 - WISSENSMANAGEMENT
Seite 18
Man versucht, einen bestimmten Sollzustand zu erreichen oder aufrecht zu erhalten und
ablaufende Vorgänge zu berechnen. Die alleinige Anwendung von Berechnungsformeln (d.h.
eines algorithmischen Modells) ist in Bezug auf Management nicht vollständig
zufriedenstellend [Reinmann 2001].
Wenn es aber um die im weitesten Sinne technische Seite eines großen Unternehmens (z.B.
verteilte Infrastrukturen oder komplex verbundene Geschäftsmodelle) geht, stellt sich ein
algorithmisches Denken als durchaus funktional heraus. Management im Sinne von
Unternehmensführung gehorcht großteils den Gesetzen berechenbarer technischer Systeme.
Geht es um die menschliche Seite der Organisation, so stößt man mit diesem Denkmodell an
Grenzen. Management in Bezug auf Mitarbeiterführung gehorcht den Gesetzen biologischer
und ökologischer Systeme, deren Verhalten zwar determiniert, aber nicht vorhersehbar und mit
Unsicherheitsfaktoren behaftet ist. In diesem Fall kommt man leichter mit einem heuristischen
Modell (Denken in Faustregeln) weiter [Reinmann 2001].
Beim Wissensmanagement hat man es mit beiden Systemarten zu tun. Naheliegend ist daher
eine Kombination des algorithmischen und des heuristischen Modells, also Management als
Gestaltung evolutionsähnlicher Prozesse, d.h. als Gleichgewicht zwischen Moderieren und
Kontrollieren, zwischen Metasteuerung und direkter Regelung [Reinmann 2001].
Somit ergibt sich für Wissensmanagement eine Ebene des Untenehmensmanagements als
Steuerungmechanismus unter der Berücksichtigung des Wissensaspektes. Es geht im
allgemeinen um eine möglichst nützliche organisationale und technologische Ausbeutung der
unternehmerischen Wissensbasis und um ein integratives Erkennen und Ergreifen aller
Maßnahmen (d.h. geschäftliche, organisatorische, technische und menschliche Aspekte
inbegriffen), die hierfür notwendig sind. Für große Unternehmungen geht es, aus technischer
Sicht, hauptsächlich um das transparente, problembezogene Verfügbarmachen des Wissens.
Nach [Neumann et al. 1998] umfassen die durch Wissensmanagement ergriffenen Maßnahmen
mehrere Dimensionen:
a) strategische und operative,
b) planende, steuernde und kontrollierende,
c) organisatorische und technologische, und
d) kulturelle und mitarbeiterbezogene.
Will man aber die Zeitdimension als Hauptparameter eines Modells festlegen, so entstehen
meist Lebenszyklen durch Teilprozesse. Der in [Scheer et al. 1999] beschriebene Lebenszyklus
ist eines dieser Modelle und setzt sich aus den Teilkomponenten Wissensakquisition,
Wissenspräsentation, Wissenstransfer, Wissensnutzen und Wissensentfernung [Rollett 2000].
Die meist genannten Komponenten des Wissensmanagements werden in [Rollet 2000] als
Summe von Prozessen identifiziert, die den gesamten Umfang dieses interdisziplinären
Begriffes abdecken. Diese dort erkannten Komponenten sind Identifikation, Bewertung,
Erwerb, Entwicklung, Bewahrung, Aufbereitung, Klassifikation, Speicherung, Verteilung,
Nutzung und Transfer von Wissen. Einige der in Zusammenhang mit diesen Komponenten
liegenden kritischen Aspekte während der Konzeption eines Informationssystems für große
Unternehmen werden im nächsten Abschnitt näher betrachtet.
Aus unternehmerischer Sicht, vor allem für transnational tätige Konzerne, ist eines der
Hauptziele des Wissensmanagements einen Wettbewerbsvorteil zu erlangen oder aufrecht zu
Kapitel 2 - WISSENSMANAGEMENT
Seite 19
erhalten. Dabei stellt Wissen bzw. intellektuelles Kapital die Basis von Innovationen bei
Produkten und Prozessen dar. Die daraus resultierenden Innovationen sind der Motor für den
Ausbau bzw. die Sicherstellung eines Wettbewerbsvorteils. Letztlich sichert der erlangte
Wettbewerbsvorteil den nachhaltigen Bestand des Unternehmens. Ein strategisch ausgeklügeltes
System für solche Unternehmen sollte somit das Aufbauen und effektive Nutzen von
intellektuellem Kapital einbeziehen. Insbesondere sind damit Marktreichweite,
Mitarbeiterkompetenz, geistiges Eigentum und Infrastrukturelemente (Organisation, Prozessen,
Systemen und Methoden) gemeint [Godbout 1998].
Mit Wissensmanagement kann man, wie im ’White Paper’ von Lotus Development Corporation
erwähnt [Lotus 2001], Operationskosten reduzieren, organisationale Effektivität steigern,
Marktanteile verteidigen oder vergrössern, Kundenstock beibehalten oder vergrössern,
Innovationsprozesse beschleunigen, Produktionszyklen minimieren, und neue Möglichkeiten
schneller als die Konkurrenz identifizieren. Die drei hier interagierenden Hauptkomponenten
sind Menschen, Orte (virtuelle Arbeitsräume), und Dinge (Inhalte: Daten, Informationen oder
Prozesse jeglicher Art).
Die Lotus Development Corporation glaubt außerdem an die Existenz von fünf
Haupttechnologien, die Wissensmanagement untermauern. Diese werden Betriebsintelligenz,
Kollaboration, Wissenstransfer, Wissensentdeckung, und Standort des Fachwissens genannt
[Lotus 2001].
Der Versuch eine allgemein gültige Definition von Wissensmanagement zu finden erweist sich
meistens als sehr schwierig. Dies wurde schon zu Beginn dieses Kapitels am Beispiel des
Wissensbegriffs demonstriert. Das wichtigste ist zu verstehen, dass Wissensmanagement auf
jeden Fall einen interdisziplinären Charakter besitzt, der sowohl technische als auch
organisationale Aspekte umfaßt. Aus technologischer und betriebswirtschaftlicher Sicht
definiert [Wiig 1998] Wissensmanagement wie folgt:
„Wissensmanagement ist nicht nur eine Technologie, nicht nur eine Menge von
expliziten und strikt systematischen Aktivitäten, oder nicht nur eine
Patentmethode, um den ökonomischen Wert eines Unternehmens zu steigern.
Stattdessen ist Wissensmanagement ein übergreifendes Bemühen, um das
Unternehmen ’wissens-wachsam’ zu gestalten. Systematisches und explizites
Wissensmanagement ist konzipiert, um eine unternehmensweite, adaptive,
kontextuelle, umfassende und menschen-zentrierte Umgebung zu schaffen, die
andauernde persönliche Konzentration auf wissensbezogene Angelegenheiten
fördert [Wiig 1998] 8.“
In [O’Leary 1998] wird folgende technische und formale Definition angegeben:
„Wissensmanagement ist insofern formal, dass Wissen entsprechend
vordefinierter – aber entwickelnder – Ontologien klassifiziert sowie kategorisiert
ist in strukturelle und semistrukturelle Daten und Wissensbasen 9.“
8
“KM is not only a technology, not only a set of explicit and rigidly systematic activities, or not only a
patent method to increase the economic value of the enterprise. Instead, KM is a broad effort to make the
enterprise ‘knowledge-vigilant.’ Systematic and explicit KM is designed to create an enterprisewide,
adaptive, contextual, comprehensive, and people-centric environment that promotes continual personal
focus on knowledgerelated matters [Wiig 1998].”
9
“KM is formal in that knowledge is classified and categorized according to a prespecified—but
evolving—ontology into structured and semistructured data and knowledge bases [O’Leary 1998].”
Kapitel 2 - WISSENSMANAGEMENT
Seite 20
Es ist sicherlich auch sehr wichtig zu verstehen was Wissensmanagement ’nicht ist’, d.h. die
Unterschiede zu anderen verwandten Disziplinen zu erkennen. Wissensmanagement ist zum
Beispiel nicht nur reines Informationsmanagement.
Informationsmanagement behandelt Wissen vor allem als kontextunabhängiges Objekt und
beschäftigt sich hauptsächlich mit Prozessen des Informationstransfers innerhalb eines
Unternehmens. Wissensmanagement beschäftigt sich mit wissensorientierten Verstehens- und
Erklärungsprozessen, die vordefinierte Unternehmensziele verfolgen. Der Wissensmanager ist
somit derjenige, der das vermittelte Wissen einem Prozeß unterzieht, bei dem ein
unternehmensspezifischer Kontext bzw. Zusammenhang erzeugt wird [Capurro 2000b].
Die Prozesse der physikalischen Aufbewahrung von Daten - die Urform des Wissens - und
deren mechanische Pflege fallen wiederum in den Bereich des Datenmanagements. Natürlich
stehen diese Prozesse (und infolgedessen auch die Bereiche) in enger Beziehung zueinander und
deshalb ist es auch sinnvoll, dass diejenigen, die sich vor allem mit
Wissensvermittlungsprozessen beschäftigen sowohl von Wissensmanagement als auch von
Datenmanagement etwas verstehen und umgekehrt [Capurro 2000b].
Wissensmanagement ist auch nicht mit Wissensverarbeitung gleichzusetzen. Die
Wissensverarbeitung
beschäftigt
sich
mehr
mit
technischen
und
abstrakten
Wissensrepräsentationen und mit formalen Methoden aus dem Bereich der Künstlichen
Intelligenz. Wissensverarbeitung ist außerdem eine rein technische Disziplin. Methoden aus der
Wissensverarbeitung finden aber auch im Rahmen von Wissensmanagementinitiativen
Anwendung [Liebotz 1998], bilden aber sicherlich nicht den Schwerpunkt von
Wissensmanagement [Rollett 2000]. Wissensmanagement kann der Schlüssel sein für die
Bewältigung neuer Herausforderungen im globalen Markt. Hierfür sollte der Einsatz von
Wissensmanagementsystemen auf effektive und zielgerichtete Weise mehrere Komponenten aus
anderen verwandten Disziplinen (Informations- und Datenmanagement), neue Technologien
und Kollaborationswerkzeuge verbinden. Wissensmanagement in großen Konzernen ist eine
moderne interdisziplinäre Alternative, um sich mit allen Aspekten des Wissens innerhalb des
unternehmerischen Kontexts zu befassen. Dies beinhaltet, unter anderem, die Generierung,
Kodifizierung und (Ver)teilung des Wissens, aber auch die Verwaltung von Innovationen und
das Umsetzen einer lernenden Organisation.
Die Erfüllung dieser Aspekte kann mit Werkzeugen der Informationswissenschaft nicht
vollkommen abgedeckt werden. Deshalb umfaßt Wissensmanagement andere Aspekte, die
sozialer, kultureller und menschlicher Natur sind. Im nächsten Abschnitt werden die kritischen
Aspekte des Wissensmanagements, insbesondere für transnationale Konzerne, näher betrachtet.
Um schließlich einen raschen Überblick über das enorm breite Spektrum von modernen
Technologien und Bereichen - die mit Wissensmanagement direkt oder indirekt zu tun haben zu geben, sind folglich einige Beispiele genannt: Workflow, Document Management, Content
Management, Customer Relationship Management, Digital Libraries, Decision Support
Systems, Semantic Networks, Database Management, Data Ware House, Groupware,
Workgroup Computing, Collaborative Virtual Environments, Imaging and OCR, Information
Retrieval, Versioning Control, Annotationen, Rating and Recommender Systeme, Metadaten,
eLearning (Distance Learning), Visualisierung, Intelligent Agents, Knowledge Maps, Expertise
Profiling.
2.2 Kritische Aspekte
In transnationalen Konzernen spielt nicht nur die organisationale (d.h. hierarchisch angeordnete)
Struktur des Unternehmens eine große Rolle: unterschiedliche Geschäftsprozesse auf
Kapitel 2 - WISSENSMANAGEMENT
Seite 21
verschiedenen Ebenen dieser Hierarchie beeinflussen einander über Querverbindungen, die
somit orts- und zeitkritisch sind. Es entstehen wechselwirkende Abhängigkeiten, die viele
Bausteine des Wissensmanagements stören könnten, wenn sie nicht richtig oder frühzeitig
erkannt und behandelt werden. Eine sorgfältige Analyse all dieser Querverbindungen und deren
Verwaltung ist sicherlich eine der größten Herausforderungen beim Erstellen eines
Wissensmanagementkonzepts.
Als besonders wichtig bei der Konzeption eines umfangreichen Informationssystems für große
und geographisch verteilte Unternehmen können verschiedenartige Aspekte identifiziert
werden, deren Ursachen aus unterschiedlichen Bereichen (z.B. Technik, Management,
Gesellschaft, Kultur) herrühren und sich auf den nachhaltigen Erfolg des Wissensmanagement
auswirken.
Die wichtigsten - im Kontext der vorliegenden Arbeit erkannten und im nächsten Unterkapitel
behandelten - kritischen Aspekte lassen sich in folgenden Problembereichen unterteilen:
•
Unternehmensstruktur und Systemarchitektur
o Einflüsse von Architektur und Darstellungsvarianten des Informationssystems
gegenüber komplexer Unternehmensstrukturen.
•
Projektmanagement und Sichtweisen
o Kernfragen bei der Planung und
unternehmerischer und technischer Sicht.
Zielsetzung
des
Systems
aus
•
Technologien und Modularität
o Sorgfältige Auswahl der zugrundeliegenden Technologien bei der Lösung von
unterschiedlichen Teilproblemen (Kompatibilität und Standardisierung von
Subsystemen).
•
Wissensbausteine
o Wissensidentifikation (Wissensbeschaffung und -entwicklung)
o Wissenstransfer (Externalisierung und Internalisierung von Wissen)
o Wissensweitergabe (Wissen als Machtfaktor und Einflußfaktoren auf die
Mitarbeiter)
o Wissensaufbewahrung (Selektion von neuem Wissen und dessen effiziente und
effektive Aktualisierung und Wartung)
o Wissensnutzen (Meßbarkeit des produktiven Einsatzes vom intellektuellen
Kapital)
•
Soziale und kulturelle Barrieren
o Gesellschaftlich bedingte Barrieren in transnationalen Unternehmen.
o Erkennung der Besonderheiten von unterschiedlichen Kulturgruppen und deren
Einbindung an das System.
2.2.1 Unternehmensstruktur und Systemarchitektur
Die allgemeine Problematik der Wissensadministrierung und des Wissenszugangs für
transnationale Konzerne liegt in der Komplexität der Aspekte Struktur, Darstellung und
insbesondere Transparenz.
Ein weltweit verteiltes Unternehmen könnte sehr schnell Probleme mit der Überschaubarkeit
des gesamten Systems bekommen. Dies würde zu Fehlentscheidungen führen, die eine
effiziente und nachhaltige Umsetzung des Informationssystems verhindern, da elementare
Fehler in der Struktur oder Darstellung während der Systemkonzeption sich sofort fortpflanzen
Kapitel 2 - WISSENSMANAGEMENT
Seite 22
und die komplex angeordneten Komponenten des Wissenslebenszyklus stören. Zu diesen
Wissenskomponenten zählen, wie beispielsweise in [Rollett 2000] aufgezeigt: Organisation,
Administration, Zugang, Speicherung, Anwendung, Teilung, Zustellung, Suche, Visualisierung,
Kooperation und Kommunikation.
Interne Wissenstransparenz im stark vernetzten System eines transnationalen Konzerns kann
zum Beispiel mit der Hilfe von Wissenslandkarten, welche den systematischen Zugriff auf die
verteilte Wissensbasis unterstützen, erreicht werden. Für solche Karten existieren viele
Modellierungsansätze und bekannte Lösungsvorschläge, wie Wissenstopographien,
geographische Informationssysteme, Wissensbestandskarten, Wissensmatrix, und andere. Die
Verantwortung für eine passende interne Wissenstransparenz wird selten organisatorisch
geregelt. In [Probst et al. 1999] wird empfohlen, die Architektur von Intranets oder
Wissenslandkarten immer an den Bedürfnissen der potentiellen Wissensnutzer anzupassen und
nicht einer reinen Informatiklogik zu folgen.
2.2.2 Projektmanagement und Sichtweisen
Viele Probleme nach dem Einsatz von Wissensmanagementsystemen sind meist eine Folge von
nicht erkannten bzw. schlecht eingeschätzten Aspekten während der Entwurfs- oder
Konzeptionsphase.
Aus unternehmerischer und technischer Sicht lässt sich bei der Konzeption eines
Wissensmanagementsystems eine kritische Kernfrage zu jedem der folgenden - in [Bellinger et
al. 2001b] auch ’Dimensionen’ genannt - Aspekte stellen:
a) Auftrag
Was versucht man zu erreichen?
b) Wettbewerb
Wie kann man einen Wettbewerbsvorteil erreichen?
c) Leistung oder Performanz
d) Änderungen
Wie werden Resultate geliefert?
Wie werden Änderungen bewältigt?
Durch die gezielte Berücksichtigung dieser ’Dimensionen’ und deren zugehörigen Kernfragen
während des Projektmanagements kann der Einsatz von Wissensmanagement die Fähigkeiten
und Kapazitäten eines transnationalen Unternehmens verbessern. Wichtig hierbei ist die
Erkennung des Wertes vom Wissensmanagement für das Unternehmen. In [Bellinger et al.
2001b] wird der Wert des Wissensmanagements direkt proportional zur Effektivität, mit der das
Wissen Mitglieder eines Unternehmens bei täglichen Situationen und Entscheidungen
unterstützt, gesetzt. Somit ist das Wissen keine passive, sondern eine durchaus aktive
Komponente des Unternehmens, und genau als solches sollte man es betrachten.
Ein Beispiel für die Bereiche, welche durch effizienten und effektiven Einsatz von
Wissensmanagementsystemen verbessert werden können, gibt die im Jahr 2001 durchgeführte
statistische Studie des Fraunhofer-Instituts für Produktionsanlagen und Konstruktionstechnik
(IPK) in Berlin zum Thema Wissensmanagement.
Daraus gewann man statistische Aussagen über mögliche Verbesserungsbereiche in
Unternehmen nach dem zielorientierten Einsatz von Wissensmanagementsystemen [IPK 2001].
In [Tab. 2.1] werden die Ergebnisse dieser Studie gezeigt. Diese Tabelle gibt auch Auskunft
über die unterschiedlich positionierte Prioritäten in Bezug auf administrative und
technologiebasierte Zielsetzungen. So steht ein Produktivitätszuwachs an unangefochtener
erster Stelle vor einem dichtbesiedelten Mittelfeld, welches aus den tatsächlich praktischen
Kapitel 2 - WISSENSMANAGEMENT
Seite 23
Zielobjekten
(z.B.
Systemtransparenz,
Entscheidungshilfen) besteht.
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
Kundenstock,
Geschäftsprozesse,
Kosten-/Zeitersparnis, Produktivitätszuwachs
Prozeßverbesserung
Transparenz über Strukturen und Prozesse
Kundenorientierung und Zufriedenheit
Erleichterung von Entscheidungen und Prognosen
Verbesserter Informationsaustausch
Qualitätssteigerung
Erfolg, Marktführerschaft
Mitarbeiterqualifikation und –zufriedenheit
Verbesserungen sind noch nicht feststellbar
oder
50%
19%
18%
18%
17%
15%
13%
8%
7%
7%
Tabelle 2.1: Verbesserungen durch Wissensmanagement [IPK 2001]
Aus technischer Sicht hängen viele der kritischen Aspekte des Wissensmanagements in großen
Unternehmen mit den spezifizierten Systemanforderungen zusammen.
Aufgrund der organisationalen und geographischen Verteiltheit eines Konzernes, und
infolgedessen der hohen Priorität der Systemtransparenz, sind technische Mechanismen
notwendig, die eine optimale Nutzung des Wissens garantieren. Hierbei spielen Aspekte der
Verfügbarkeit, Datensicherung und der Ausfallsprävention eine besondere Rolle.
Weitere Stichworte in diesem Zusammenhang sind die Qualität und Nutzbarkeit
Benutzerschnittstelle (Interface Usability), die technische Effizienz bzw. Performanz
Systems (hier steht meistens die Geschwindigkeit im Mittelpunkt), die flexible Integration
skalierbare Architektur des Systems, sowie die technische Voraussetzungen, um
angeforderten Sicherheit zu genügen (Firewall, Vertraulichkeit der Wissensbestände, usw.).
der
des
und
der
Die Existenz unterschiedlicher Sichtweisen oder Perspektiven, aus denen Wissensmanagement
analysiert und verstanden wird, zu ignorieren, kann zu Mißerfolgen bzw. Fehlentscheidungen
bei der Konzeption eines Wissensmanagementsystems führen.
Hiermit
sind
die
unterschiedlichen
Interpretationsmöglichkeiten
des
Begriffs
’Wissensmanagement’, welche vor allem die Spezifikations- und die Entwurfsphase eines
Projekts durch verschiedenartige (subjektive) Meinungen auf Managementebene beeinflussen
können, gemeint.
Grundsätzlich werden drei Sichtweisen identifiziert [Rollett 2000]:
a) eine informationsorientierte,
b) eine technologieorientierte und
c) eine kulturorientierte Perspektive.
Unternehmensleiter, welche den Bereich des Wissensmanagements lediglich unter der
informationsorientierten Perspektive sehen, verbinden ihn oft mit einem einfachen
’Informationszugang’ bzw. ’Informationsfilterung’. Andere, die Wissensmanagement bloß unter
dem technologischen Aspekt sehen, verknüpfen Wissensmanagement mit der ’Infrastruktur der
Informationstechnologie’, d.h. sie sehen es als Integration von weltweit verteilten Systemen
(z.B. Intranets, Suchmaschinen oder Data Warehouse Systeme). Die Schwerpunkte der
Kapitel 2 - WISSENSMANAGEMENT
Seite 24
kulturorientierten Perspektive liegen hingegen in der ’Kollaboration’ und im andauernden
’Lernen des globalen Unternehmens’.
Wissensmanagement umfaßt aber alle drei Sichtweisen im gleichen Ausmaß. Diese Tatsache
liegt daran, dass der Bereich von der Interdisziplinarität lebt und deshalb auch so interpretiert
und angewendet werden sollte.
Insbesondere für transnationale Unternehmen spielt die Verwaltung der stark verteilten
Strukturen eine wichtige Rolle aus technologischer Perspektive. Die vorhandene modulare
Struktur eines Konzerns impliziert meistens die Existenz von unterschiedlichen technologischen
Systemarchitekturen.
2.2.3 Technologien und Modularität
Wissensmanagementsysteme in großen und geographisch verteilten Unternehmen zeichnen sich
dadurch aus, dass sie mehrere Technologiebereiche ausnützen können, um in der Praxis
umgesetzt zu werden. Die Erkennung und zielgerichtete Anwendung dieser ’Subsysteme’ bzw.
’technologischen Module’ stellen auch einen sensiblen Aspekt dar, weil die dahinter liegenden
Entscheidungskriterien sich direkt auf die Effektivität des Systems auswirken.
Einige Beispiele für solche Module lassen sich wie folgt auflisten [Maier et al. 2001]:
•
Wissensspeicher (im Sinne von erweiterten Document-Management-Systemen)
•
Wissenstransfer (z.B. Yellow Pages)
•
Meta-Suchsysteme (unterschiedliche Information Retrieval Mecahnismen)
•
Push-orientierte
Systeme
Informationsdiensten)
•
Visualisierungs- und Navigationssysteme (z.B. Knowledge Maps oder Hyperbolische
Browsers).
(z.B.
intelligente
Agenten
bei
abonnierten
Die richtige Auswahl bzw. Kombination dieser technologischen Möglichkeiten stellen enorm
wichtige Ansätze bei der Konzeption von Wissensmanagementsystemen für transnationale
Konzerne dar. Aus der Sicht des Wissensmodells von [Probst et al. 1999] können
unterschiedliche Wissensbausteine auch durch falsch eingeschätzte Technologien beeinflußt
werden. Der nächste Abschnitt befaßt sich mit einigen der betroffenen Wissensbausteinen.
2.2.4 Wissensbausteine
Als Hauptproblem bei der Wissensidentifikation in transnationalen Konzernen kann man die
nicht vorhandene Wissenstransparenz der Wissensquellen angegeben. Damit kommen typische
Fragen ins Spiel wie: Wer weiß was im Unternehmen? Wer hat wo und bei welchem Projekt
gearbeitet? Wer hat das benötigte Wissen innerhalb oder außerhalb des Unternehmens? Werden
diese Fragen nicht zufriedenstellend beantwortet, so deutet dies auf eine schlechte Nutzung der
Ressourcen.
Während des Prozesses der Wissensgenerierung sind vor allem kurzfristige Notwendigkeiten
(beeinflussen den externen Wissenserwerb) und interne Notwendigkeiten (beeinflussen die
interne Wissensentwicklung) ein Problem. Bei diesem Prozess sollte man nicht vergessen, dass
intellektuelles Kapital personenorientiert und kontextbezogen ist. Außerdem soll die Vielfalt der
Wissensressourcen nicht unberücksichtigt gelassen werden.
Kapitel 2 - WISSENSMANAGEMENT
Seite 25
Einen großen kritischen Bereich stellt auch die Wissenserfassung dar. Aus unternehmerischer
Perspektive spielt hierbei die Wissens(ver)teilung (bzw. der Wissenstransfer) die wichtigste
Rolle. Die mit dem Wissenstransfer verbundenen Prozesse sollen prinzipiell Wissen in
Information transformieren (externalisieren) und vice versa (internalisieren). Die generelle Idee
ist explizites Wissen in Information, und Information in Daten so zu konvertieren, dass es in
eine global funktionierende Wissensbasis gespeichert werden kann. Die Schwierigkeit liegt hier
in der Tatsache, dass Wissen nicht nur in Information beinhaltet ist, sondern auch in den
Zusammenhängen zwischen Informationselementen (z.B. über Hyperlinks), in deren
Klassifikation (wo Wissen überall gespeichert ist) und in deren Metadaten
(Zusatzinformationen, wie z.B. der Autor eines Dokumentes).
Relevante Aspekte in Bezug auf Wissenstransfer und dessen Bedeutung für das
Wissensmanagement in großen Unternehmen, werden in [Maurer 1999] wie folgt auf den Punkt
gebracht:
„Weiters ist zu bemerken, dass Wissen Macht ist. Deshalb sind Personen oft
nicht bereit ihr Wissen jedem weiterzugeben... komplett freier Wissensfluß
innerhalb einer großen Organisation (...) ist unrealistisch: es ist notwendig die
Privatsphäre zu respektieren, es ist auch notwendig einen gewissen Stolz auf
Wissen zu respektieren, weshalb die Einführung von Wissensmanagement in
Unternehmen ein schrittweise und sorgfältig geleiteter Prozeß werden soll.
[Maurer 1999] 10.“
Eines der Ziele von Wissensmanagement ist also jedem Unternehmensmitglied klar zu machen,
dass sein Wissen vom Rest der Organisation benötigt wird, und dass er selbst zu dem Wissen
anderer kommen kann, um seine Arbeitseffizienz zu steigern [Tolen 1999].
Im Zuge einer Einführung des Wissensmanagements in transnationalen Konzernen,
insbesondere bezüglich der Wissensnutzung (Wissensweitergabe und der Wissensteilung), kann
man folgende - in [Disterer 2001] allgemein geltende - individuelle und soziale Barrieren
identifizieren:
a) Machtverlust (engl.: ’loss of power’),
b) Preisgebung (engl.: ’revelation’),
c) Verunsicherung (engl.: ’uncertainty“), und
d) Motivation.
Experten mit selten vorkommendem Wissen besitzen die höchste Reputation innerhalb der
Firma. Ein Wissensmonopol führt eher zum Horten anstatt zum Transfer von Wissen [Disterer
2001]. Dieses Phänomen taucht bei mehreren Unternehmen auf, insbesondere in solchen
Situationen, in denen die Sicherheit des Arbeitsplatzes vor Entlassung niedrig ist. Die Macht des
Wissens spielt sodann eine vitale Rolle für eine Person, die ihr Wissen als eine Art
Versicherung bewahrt, um die Arbeitsstelle nicht zu verlieren.
Die Weitergabe von Wissen kann auch als persönliche Offenbarung interpretiert werden, denn
durch die Bekanntgabe persönlichen Wissens gewinnt dieses einen subjektiv hohen
10
“Note further that knowledge is power. Hence persons are often not willing to pass their knowledge to
everyone… completely free flow of knowledge within a large organization (…) is unrealistic: it is
necessary to respect privacy; it is also necessary to respect a certain pride in knowledge, hence
introducing KM in corporate environment has to be a stepwise and carefully orchestrated process
[Maurer 1999].”
Kapitel 2 - WISSENSMANAGEMENT
Seite 26
Seltenheitswert. Wenn eine Anerkennung seitens der anderen Wissensnutzer nicht stattfindet,
können Peinlichkeitsgefühle entstehen, die einen weiteren Transfer verhindern [Disterer 2001].
Auf der anderen Seite agiert die Verunsicherung bei manchen Personen, vor allem jungen
Mitarbeitern, die nicht einschätzen können oder wollen, ob ihre Arbeitsresultate wertvolles
Wissen für andere Personen darstellen. Schließlich taucht auch das Problem auf, dass viele
Systembenutzer einen persönlichen Vorteil oder eine Belohnung nach der Wissensweitergabe
(oder Speicherung) erwarten. Motivationsmechanismen sind hier notwendig, um ein
Verantwortungs- und Gemeinsamkeitsgefühl für die Pflege der Wissensbasis zu fördern.
Voraussetzung für eine gezielte Wissensbewahrung von Erfahrungen oder Informationen und
Dokumenten sind große Managementanstrengungen. In einem transnationalen Konzern werden
stündlich neue Erfahrungen gewonnen, die in Zukunft genützt und deswegen bewahrt werden
sollten: Briefe, Berichte jeglicher Art oder Besprechungsprotokolle entstehen an
unterschiedlichsten Orten. Die Herausforderung liegt hier in der Selektion zwischen den
speicherwürdigen und nicht speicherwürdigen Bestandteilen. Die Leitregel lautet: ’nur das was
in Zukunft für Dritte nutzbar sein könnte, verdient es auch bewahrt zu werden’.
Wissensbewahrung stellt einen kontinuierlichen Prozeß dar, welcher durch andauernde
Aktualisierungsanstrengungen gepflegt werden muß [Probst et al. 1999].
Ein weiterer kritischer Punkt in diesem Zusammenhang stellen die Entscheidungskriterien für
die unternehmensgerechte physikalische Speicherungsart von Daten. Der Einsatz von
Replikationsmechanismen kann für transnationale Unternehmen zu wesentlichen
Verbesserungen in der Performanz des gesamten Informationssystems führen. Dieser Aspekt
wird technisch vom Bereich des Datenmanagements gelöst, und wird deshalb in Kapitel 4
’Datenmanagement’ ausführlich behandelt.
Nicht selten wird von wissensbasierten Projekten gefordert, den Gesamtnutzen (d.h. der
produktive Einsatz organisationalen Wissens zum Nutzen des Unternehmens) des Systems
meßbar zu machen [Rollett 2000]. Dies ist aber in der Regel nur sehr schwer möglich oder nur
partiell, da die Messung und Bewertung organisationalen Wissens zu den größten
Schwierigkeiten gehört, die das Wissensmanagement heute zu bewältigen hat. Wichtig dabei ist
eine klare Unterscheidung zwischen Messung des Nutzens und Messung der Leistung bzw. der
Performanz. Die dafür nötigen Entscheidungskriterien sollen präzise und konkret auf
technischer und administrativer Ebene des Unternehmens diskutiert und definiert werden. Ein
entscheidender Durchbruch konnte in diesem Bereich bisher noch nicht erzielt werden [Probst et
al. 1999].
Wissensrelevanz, -verteilung und -orientierung (Orientierung im Sinne von Zeit-, Orts- und
Personenabhängigkeit) stellen in diesem Kontext wichtige Aspekte dar, weil die
Inanspruchnahme und die Nutzung des Wissens durch Nutzungsgewohnheiten und
Motivationsaspekte beeinflußt werden können [Röpnack et al. 1998]. Gewohnheiten und
Motivation sind menschenbezogene Aspekte, welche stark an sozialen und kulturellen Aspekten
gekoppelt sind. Dies gilt insbesondere für die starke geographische Verteilung eines
transnationalen Unternehmens.
2.2.5 Soziale und kulturelle Barrieren
Die in [Disterer 2001] identifizierten sozialen Barrieren des Wissensmanagements lassen sich
wie folgt unterteilen:
•
Sprache
Kapitel 2 - WISSENSMANAGEMENT
Seite 27
•
Konfliktvermeidung
•
Bürokratie und Hierarchie
•
inkoherente Paradigmen.
Der linguistische Aspekt ist vor allem in weltweit operierenden Unternehmen äußert relevant.
Hier spielt nicht nur der mehrsprachige Informationszugang, sondern auch die Festlegung einer
’gemeinsamen Sprache’ (im Bereich der Wissensorganisation auch ’kontrolliertes Vokabular’
genannt), um Wissen in einer global verständlichen Form zu organisieren, eine große Rolle. Mit
Konfliktvermeidung werden die Situationen in konservativen Gesellschaften gemeint, in denen
’gewagte Gedanken’ zu persönlichen Unannehmlichkeiten führen können. Als Beispiel der
bürokratischen und hierarchischen Barriere wird in [Disterer 2001] das komplette Fehlen des
Wissenstransfers in manchen zu strikten Hierarchien, welche abteilungsübergreifende
Kommunikation verbieten, angegeben. Unter ’inkoherente Paradigmen’ versteht man
vorhandene Inkoherenzen zwischen persönlichen Gedankenweisen und Unternehmensregeln.
Das rechtzeitige Erkennen und die korrekte Behandlung jeder dieser sozialen Barrieren ist bei
der Konzeption eines wissensbasierten Informationssystems für transnationale Konzerne
unumgänglich.
Am Ende dieses Abschnittes sollen nun die nicht minder kritischsten Aspekte im kulturellen
Bereich kurz erörtert werden. Diese hängen stark mit den individuellen und sozialen Aspekten
zusammen. Die Problematik beim Vorhandensein von kulturellen Barrieren wird anhand des in
[Nonaka et al. 1995] vorgelegten Beispiels klargemacht. Es wird untersucht, inwiefern das
japanische Wissensmanagement sich von westlichen Ansätzen unterscheidet. In [Nonaka et al.
1995] werden die Unterschiede durch drei Punkte verdeutlicht. Erstens findet die Interaktion
zwischen implizitem und explizitem Wissen im Westen überwiegend auf individueller Ebene, in
Japan vor allem auf Gruppenebene statt. Zweitens legt die westliche Unternehmenspraxis den
Mittelpunkt auf das explizite Wissen, japanische Unternehmen auf Bildsprache, Intuition, usw.
Schließlich charakterisieren sich japanische Unternehmen durch hohe Informationsredundanz,
vieldeutige Unternehmensziele, Autonomie auf Teamebene und Vielfalt durch
funktionsübergreifende Projektteams.
2.3 Schlußbemerkung
Als vor über zwanzig Jahren Peter Drucker in seinem Buch ’The Age of Discontinuity’ schrieb,
dass die größte Managementaufgabe des nächsten Jahrhunderts in dem Produktivmachen der
Wissensarbeit liegen würde, genauso wie im Jahrhundert zuvor in dem Produkivmachen der
Handarbeit, konnten nur wenige erahnen, wie zutreffend seine Prognose sein würde [Drucker
1978]. Mit dem Wandel von einer Industriegesellschaft zu einer Wissensgesellschaft ist nun
dem Wissen – aus unternehmerischer Sicht - eine höhere Bedeutung zugeordnet worden. Dies
heißt aber nicht, dass die eine Gesellschaftsform durch die andere ersetzt wird. Es heißt, dass
Information und Wissen zusammengehören. Auf der einen Seite, was der Mensch weiß ist stets
das Ergebnis eines Informations- oder Mitteilungsprozesses. Auf der anderen, durch den
Informationsprozeß wird Wissen allgemein verfügbar gemacht.
Die moderne Wirtschaft, charakterisiert durch Wissen und weltweit dezentralisierte Strukturen,
verlangt von großen Unternehmen global zu arbeiten, zu kooperieren und zu konkurrieren.
Wissen liegt in Organisationen vielmehr flüchtig, fragmentiert, verteilt und vor allem
eingebettet in Prozessen und Produkten vor, und gewinnt durch deren Nutzung an Wert.
Erfolgreiche Konzerne müssen in der Lage sein, ihre ’Corporate Identity’ und ihre
Hauptkompetenzen unabhängig von der geographischen Verteilung sowie sprachlichen und
kulturellen Barrieren hervorzuheben und anzubieten. Dies ist zu schaffen, wenn Konzerne
Kapitel 2 - WISSENSMANAGEMENT
Seite 28
problemspezifisch Wissen generieren und bewahren, oder vorhandenes Wissen produktiv
transferieren. Die organisationale Wissensbasis eines großen und geographisch verteilten
Unternehmens erfordert dafür sorgfältige und nutzbringende Pflege, Verteilung und
Erweiterung.
Mittlerweile akzeptieren viele Unternehmen, dass die Technologie nur teilweise eine Rolle bei
erfolgreichen Wissensmanagementinitiativen spielt. Ein großer Teil wird durch Organisation
und strukturelle Maßnahmen gedeckt. Wichtig dabei ist der Technologie nicht weniger
Bedeutung beizumessen, sondern zu verstehen, dass vor allem für große und verteilte
Organisationen, die Auseinandersetzung mit den Werkzeugen des Wissensmanagements eine
direkte und permanente Bindung mit verwandten Disziplinen verlangt. Web-basierte
Technologien erlauben heutzutage die geographischen Barrieren zu sprengen, indem sie
plattformunabhängige Mechanismen, spezialisierte Werkzeuge und allgemeingültige Standards
zur Verfügung stellen.
Um den Umfang und die Wichtigkeit anderer Managementdisziplinen für transnationale
Konzerne näher zu erläutern, werden im nächsten Kapitel die Grundlagen des
Informationsmanagements behandelt. Das Kapitel soll einen Überblick in die Thematik aus
technologischer Sicht verschaffen und dabei insbesondere die prinzipiellen Eigenschaften,
Anforderungen und Problembereiche von verteilten Systemen in großen und geographisch
verteilten Konzernen berücksichtigen.
Kapitel 3 - INFORMATIONSMANAGEMENT
Seite 29
Kapitel 3
Informationsmanagement
„You'll never have all the information you need to make a decision
– if you did, it would be a foregone conclusion, not a decision." 11
David Mahoney
Die Wichtigkeit und die Bedeutung von Informationsmanagement nimmt in der heutigen
globalisierten Welt, und vor allem in der nun so stark elektronisch vernetzten Wirtschaftswelt,
immer mehr zu. Dies betrifft sowohl multinationale Organisationen als auch regional und
international agierende Institutionen, die sich in zunehmendem Maße der modernen
Informations- und Kommunikationstechnik bedienen, um ihre grenzüberschreitenden
Tätigkeiten zu bewältigen.
Wie in Kapitel 2 ’Wissensmanagement’ bereits erwähnt, beschäftigt sich das
Informationsmanagement hauptsächlich mit Wissensvermittlungsprozessen innerhalb eines
Unternehmens. Dieses Kapitel behandelt die technologischen Schwerpunkte vom
Informationsmanagement, aus der Sicht großer und geographisch verteilter Unternehmen.
Allgemeine Eigenschaften verteilter Systeme, informationstechnisches Wissensmanagement
und die Grundlagen der Intranettechnologie bilden somit das Kernstück des ersten Abschnitts.
Anschließend werden die Problembereiche und kritischen Aspekte in großen verteilten
Systemen aufgezeigt.
3.1 Allgemeines
Aus technologischer Perspektive bilden Informationssysteme das Kernstück des
Informationsmanagements. In diesem Abschnitt werden die grundsätzlichen Definitionen und
Eigenschaften von verteilten Systemen dargestellt, und deren Zusammenhang mit
informationstechnischem Wissensmanagement erläutert.
Informationsmanagement umfaßt nicht nur Entscheidungskriterien auf der oberen
Managementebene eines Unternehmens, sondern auch die Behandlung diverser
Kommunikationstechnologien, die mit der Funktionalität eines Informationssystems
koexistieren sollen.
Der letzte Teil dieses Abschnitts präsentiert somit einen kurzen Überblick in das Thema
’Intranet’, die zugrundeliegende Technologie, die für die Systemkonzeption des im Kapitel 1
beschriebenen technischen Konzerns und somit für den Gestaltungsbereich dieser Diplomarbeit
erforderlich ist.
Je nachdem, aus welcher Perspektive die Begriffe Management und Information definiert und
interpretiert werden, lassen sich unterschiedliche Bedeutungen von Informationsmanagement
erkennen. Aus diesem Grund (wie auch für den im Kapitel 2 behandelten Begriff
Wissensmanagement zutreffend) ergibt sich eine terminologische Differenzierung von
Informationsmanagement in verschiedenen Disziplinen, welche das Finden einer allgemein
gültigen Definition erschwert.
11
„Man wird niemals all die gebrauchte Information haben, um eine Entscheidung zu treffen
– hätte man sie, wäre dies eine vorherbestimmte Schlußfolgerung und nicht eine Entscheidung."
Kapitel 3 - INFORMATIONSMANAGEMENT
Seite 30
3.1.1 Informationsmanagement
In [Davis et al. 1993] wird Informationsmanagement als holistische Disziplin, die aus
informationswissenschaftlicher Sicht mehrere Bereiche abdeckt, wie folgt definiert:
„... Informationsmanagement (…) ist im Wesentlichen eine neue
Geschäftsfunktion mit der Aufgabe, organisationale Informationsanforderungen
zu definieren, Informationsinfrastruktur und Informationssystemapplikationen zu
planen und aufzubauen, das System zu betreiben, und diese Aktivitäten zu
organisieren, belegen und verwalten [Davis et al. 1993] 12.“
In [Küng 1999] wird Informationsmanagement als ein schwer greifbarer Begriff im Zentrum
mehrerer Tätigkeitsbereiche beschrieben. Die Grafik in [Abb. 3.1] stellt diesen Sachverhalt dar.
Wissensmanagement
Organisation
Input
IT
E-Commerce
Kunde
IM
Output
Umwelt
Prozeßmanagement
Data Warehouse
Virtual
Communities
Online-Marketing
Abbildung 3.1: Informationsmanagement nach [Küng 1999]
In diesem Zusammenhang bietet [Küng 1999] eine eher
Begriffsinterpretation an, durch die Informationsmanagement als
technologisch
basierte
„effizientes digitales Handling sämtlicher relevanten Informationen im
Unternehmen und dessen Umfeld durch konsequente Nutzung der
Informationstechnologie [Küng 1999]“
definierbar wäre. Die Unvollständigkeit dieser Definition wird dort erkannt und damit
begründet, dass auch weitere wichtige Aspekte, wie zum Beispiel Kundenorientierung,
Prozeßmanagement, E-Commerce, usw., nicht berücksichtigt wurden [Küng 1999].
Informationsmanagement steht also, aus technischer Sicht, für eine Vielzahl von Werkzeugen
und Konzepten der Informationstechnologie, die alle daran beteiligt sind, eine effektive digitale
Be- und Verarbeitung sämtlicher im Unternehmen und seinem Umfeld anfallender
Informationen zu realisieren. Als Teilbereich der Unternehmensführung eines geographisch
verteilten Konzerns beinhaltet das Informationsmanagement einerseits allgemeine Gestaltungsund Führungsaufgaben im Bereich der Informationswirtschaft und andererseits die Konzeption
und Verwaltung des Informationssystems unter dem angemessenen Einsatz moderner
12
“... information management (...) is essentially a new business function with responsibility to define
organizational information requirements, plan and build an information infrastructure and information
system applications, operate the system, and organize, staff, and manage these activities [Davis et al.
1993].”
Kapitel 3 - INFORMATIONSMANAGEMENT
Seite 31
Informations- und Kommunikationstechnologien innerhalb des Konzerns. Die Umsetzung eines
Informationssystems wird somit durch die daran beteiligten Personen, die
Organisationsstrukturen des Unternehmens und die eingesetzte Technologie bestimmt. Dieses
Kapitel behandelt jedoch das Thema nur aus dem technologischen Blickwinkel eines großen
und geographisch verteilten Unternehmens.
3.1.2 Informationssysteme
Als praktischer Einstieg in die Thematik der Informationssysteme soll zunächst der Begriff
System definiert werden. Die sehr aussagekräftige, in [Bellinger et al. 2001c] zitierte Definition
des österreichischen Biologen Ludwig von Bertalanffy lautet:
„Ein System ist ein Wesen, das seine Existenz durch die wechselseitige
Interaktion seiner Teile aufrechterhält. [Bellinger et al. 2001c] 13.“
Den wesentlichen Teil in dieser Definition liefert die Betonung auf ’wechselseitige Interaktion’,
also die Tatsache, dass etwas zwischen den Teilen passiert. Für ein Informationssystem eines
verteilten Unternehmens erweitert sich dieser Sachverhalt, da die Interaktion zwischen
Systemkomponenten transparent über Zeit und Raum stattfinden sollte. Typisch für ein solches
Informationssystem und von besonderer Bedeutung für die in dieser Arbeit untersuchten
transnationalen Konzerne, ist die duale Präsenz des Wissens: einerseits in der Datenbank als
deklaratives Wissen und andererseits als prozedurales Wissen in den Applikationen. Solche
Systeme sind meist sehr mächtig und enthalten riesige Mengen an Information [NetAcademy
1999].
3.1.3 Verteilte Systeme
Das hervorstechende Charakteristikum eines Informationssystems für einen transnationalen
Konzern liegt in der ’Verteiltheit’. Ein Unternehmen dieser Art weist meist eine Verteilung auf
unterschiedlichen
(strukturellen
oder
funktionalen)
Ebenen:
Eigentümer,
Unternehmensbereiche, Tochtergesellschaften oder Zweigniederlassungen, Geschäftsprozesse,
Produktions- oder Fertigungsstandorte, und andere. Somit ergeben sich komplex strukturierte
Wissensgebiete, die (zwar nicht nur, aber meistens) über verteilte Systemarchitekturen lösbar
sind.
In [Mullender 1989] wird eine technische Definition über verteilte Systeme gegeben:
„Ein verteiltes System ist ein System mit vielen Verarbeitungselementen und
vielen Speicherungsvorrichtungen, die über ein Netzwerk miteinander verbunden
sind [Mullender 1989] 14.“
Eine aufschlußreiche Definition, die sich zwar auf Betriebssysteme konzentriert, aber
gleichzeitig auf das Hauptmerkmal jedes verteilten Systems hinweist und dies erörtert, gibt
[Tanenbaum et al. 1985] wie folgt an:
„Ein verteiltes Betriebssystem ist eines, das für seine Benutzer wie ein
gewöhnliches zentralisiertes Betriebssystem aussieht, aber auf mehrfache,
13
„A system is an entity which maintains its existence through the mutual interaction of its parts
[Bellinger et al. 2001c].“
14
„A distributed system is a system with many processing elements and many storage devices, connected
together by a network [Mullender 1989].“
Kapitel 3 - INFORMATIONSMANAGEMENT
Seite 32
unabhängige CPUs läuft. Der Schlüsselbegriff hier ist die Transparenz, mit
anderen Worten, der Gebrauch mehrfacher Prozessoren sollte unsichtbar
(transparent) für den Benutzer sein. Eine andere Weise, um dieselbe Idee
auszudrücken, ist zu sagen, dass der Benutzer das System als einen ‚virtuellen
Uniprozessor’, und nicht als eine Ansammlung unterschiedlicher Maschinen,
betrachtet [Tanenbaum et al. 1985] 15.“
Das gleiche Prinzip kann man aus der sehr oft zitierten, in [Mullender 1989] als Spruch von
Lamport wiedergegebene Definition gewinnen. Demzufolge hörte man Lamport einmal sagen,
dass ein verteiltes System jenes ist, in dem man durch den Ausfall einer Komponente von der
man bisher nichts wußte, in der Arbeit beeinträchtigt werde [Tanenbaum et al. 1985].
3.1.4 Internationale Informationssysteme
Von größerer Bedeutung für die vorliegende Arbeit ist aber eine Definition für ein verteiltes
Informationssystem aus der Perspektive transnationaler Konzerne. Eine interessante Definition
für ein Internationales Informationssystem, manchmal auch unter dem Namen corporate
information system bekannt, findet man in [Lehmann 1995]. Im Artikel wird auf die
Notwendigkeit hingewiesen, zwischen ’internationalen’ und ’verteilten’ Informationssystemen
prinzipiell und funktionell zu unterscheiden. Internationale Informationssysteme verfolgen den
strategischen Ansatz international tätiger Unternehmen und werden in [Lehmann 1995] wie
folgt definiert:
„'Internationale Informationssysteme' werden als verteilte Informationssysteme
definiert, welche gleichartige Geschäftsaktivitäten auf hoch unterschiedlichen
Umgebungen unterstützen, die häufig über Ländergrenzen hinweg gefunden
werden. Sie unterscheiden sich somit von Informationssystemen, welche
unterschiedliche Geschäftsaktivitäten oder –funktionen unterstützen, die per
Definition verschiedenartig sind, obgleich sie in einem oder mehreren
Standorten, national oder international sind [Lehmann 1995] 16.“
3.1.5 Systemarchitekturen für transnational tätige Konzerne
Aus der Analyse diverser Modelle für Internationale Informationssysteme identifiziert man drei
generische Systemarchitekturen, die sich in unterschiedlichem Maße auf lokale
Notwendigkeiten und globale Einflüsse konzentrieren [Lehmann 1995]:
a) Zentralisierte Architekturen ignorieren meist die lokale Vielfalt einzelner Standorte
und eignen sich deshalb für Unternehmen, deren Geschäftsstrategie durch eine
globale Organisationskontrolle und eine lokale Autonomie charakterisiert sind (z.B.
reine Exportunternehmen oder Franchise Firmen).
15
„A distributed operating system is one that looks to its users like an ordinary centralized operating
system, but runs on multiple, independent CPUs. The key concept here is transparency, in other words,
the use of multiple processors should be invisible (transparent) to the user. Another way of expressing the
same idea is to say that the user views the system as a ‘virtual uniprocessor’, not as a collection of
distinct machines [Tanenbaum et al. 1985].“
16
“'International Information Systems' are defined as distributed information systems which support
similar business activities in highly diverse environments commonly found across country boundaries.
They are thus distinguished from information systems which support different business activities or
functions, which are different by defintion, whether they are in single or multiple locations, national or
international [Lehmann 1995].”
Kapitel 3 - INFORMATIONSMANAGEMENT
Seite 33
b) Autonome Architekturen charakterisieren sich durch die getrennte Nutzung
heterogener Systeme in dezentralisierten Standorten, sind deshalb nicht auf global
geltende Einflüsse und Zusammenhänge spezialisiert und eignen sich für Firmen mit
sehr hoher lokaler Autonomie (z.B. multinationale Unternehmen).
c) Integrierte Architekturen ermöglichen eine sehr hohe globale und eine sehr hohe
lokale Kontrolle durch ausgeglichene Systeme, deren Kern zwar überall gleich ist
(oder leicht angepaßt) aber unterschiedliche lokale Elemente mit einbezieht.
Integrierte Systeme bilden also eine generell ausgeglichene Kontrolle ab, was der Organisation
einer transnationalen, stark vernetzten Firma entspricht. In [Lehmann 1995] werden solche
Organisationformen Heterarchien genannt. Heterarchien sind, wie in [Reihlen 1996] gezeigt,
pluralistische und flexible Organisationsmodelle, die gleichzeitig die Vorteile der
Organisationshierarchie mit der dezentralisierten und problemorientierten Wissensstruktur
verbindet. Indem die Organisationsstruktur schwächer formalisiert wird, erhöht sich die Freiheit
bzw. Autonomie der einzelnen Unternehmensmitglieder. Dies erleichtert den
Informationstransfer durch das gesamte Unternehmen, und somit kann sich die Effizienz
wissensbasierter Systeme erhöhen.
3.1.6 Informationstechnisches Wissensmanagement
Wie bereits im Kapitel 2 ’Wissensmanagement’ aufgezeigt, besteht das Ziel des
Wissensmanagements, unter anderem, aus der Bewahrung, Förderung, (Ver)teilung und
Erweiterung individuellen Wissens und dessen Transfer zwischen Menschen bzw. zwischen
Mensch und Maschine. Für transnationale Konzerne wurde auch die Berücksichtigung von
unterschiedlichen kritischen Aspekten im organisatorischen, technischen, sozialen und
kulturellen Bereich bei der Konzeption eines wissensbasierten Systems diskutiert.
In [Maurer et al. 2001] und [Tochtermann et al. 2000] werden die informations-technischen
Aspekte des Wissensmanagements präsentiert. Dabei wird unter anderem auf den Begriff
Unternehmensgedächtnis, d.h. die idealerweise vollständig computerisierte Abbildung von
Mitarbeiterwissen in einem Unternehmen, Bezug genommen. Das Ziel des Aufbaus und der
Wartung des Unternehmensgedächtnisses ist es, das Wissen informationstechnisch verarbeitbar,
auffindbar und transferierbar zu machen. Dabei wird das intellektuelle Kapital des
Unternehmens (oder zumindest Teilbereichen davon) regelmäßig und systematisch in einem
üblicherweise vernetzten Computersystem gespeichert.
Diese Sichtweise des Informationsmanagements kann also für transnationale Konzerne als eine
Menge vernetzter Zugangsportale interpretiert werden, durch die das gesamte Wissen des
Unternehmens handhabbar wird. Hierfür wird in [Tochtermann et al. 2000] auf zwei
unterschiedliche Sichtweisen des informationstechnischen Wissensmanagements hingewiesen:
a) Die prozessorientierte Sicht versucht das Wissen auf unternehmensrelevante Prozesse
anzuwenden, um diese zu optimieren bzw. zu verbessern.
b) Die produktorientierte Sicht betrachtet das menschliche Wissen als Objekt, und
beschäftigt sich mit seiner computergestützten Pflege, Bereitstellung, Auffindung und
Nutzung.
Eine andere, etwas strengere Unterteilung in der Anwendung von Wissensmanagement findet
man, laut [Remus et al. 2000], in Hinblick auf die strategische Intention des Systems. Man
Kapitel 3 - INFORMATIONSMANAGEMENT
Seite 34
unterscheidet dabei zwischen portal-, gemeinschaft- und prozeßorientierten Strategien17. Der
Mittelpunkt portalorientierter Strategien liegt in der Integration von Datenbanken und deren
verschmolzener Darstellung über ein standardisiertes User Interface, d.h. über ein Portal.
Gemeinschaftsorientierte Strategien konzentrieren sich auf die Verwaltung von
Gemeinschaften, die durch ein gemeinsames kollaboratives Ziel charakterisiert sind, d.h. sie
verfolgen in der Regel die gemeinsame Ansammlung, Kommentierung, Diskutierung und
Evaluierung von geschäftsrelevanten Informationen. Im Gegensatz zu den zwei ersten
Möglichkeiten, streben prozeßorientierte Strategien nach einer optimierten Versorgung von
aufgabenrelevantem Wissen innerhalb eines unternehmenspezifischen Geschäftsprozesses, d.h.
die Mitarbeiter werden nur mit den Wissenseinheiten versorgt, die sie für die Lösung ihrer
aktuellen Aufgaben gebrauchen können.
Für die optimale Nutzung von Wissen innerhalb eines Unternehmens werden in [Maurer et al.
2001] die vier Komponenten Unternehmensgedächtnis, Wissensretrieval, Wissenstransfer und
Wissensvisualisierung hervorgehoben. Um Informationen und Wissen zugänglich zu machen,
werden oft sogenannte Unternehmensportale (Enterprise Information Portals) eingesetzt, wobei
[Maurer et al. 2001] auf die Tatsache hinweisen, dass diese Zugangsmöglichkeiten in Zukunft
nicht als eine Stelle des Zugriffs18, sondern vielmehr als eine Stelle des Austausches19 Bedeutung
gewinnen werden. Damit ist der Einsatz von zusätzlichen Mechanismen gemeint, die sowohl
eine verbesserte Wissensauffindung ermöglichen als auch eine optimale - und
qualitätsgesicherte – Wissenseinbringung (Beschaffung bzw. Erzeugung) und fortgeschrittene
Kollaborations- und Kommunikationswerkzeuge unterstützen. Darüber hinaus spielen moderne
Technologien und Methoden der Navigationsdarstellung und Wissensvisualisierung eine
zunehmend bedeutende Rolle im technischen Bereich des Wissensmanagements [Maurer et al.
2001].
Die Bedeutung der Behandlung des Themas ’Informationstechnisches Wissensmanagement’
liegt für diese Arbeit in den technischen Bereichsüberlappungen von Wissensmanagement und
Informationsmanagement. Der gemeinsame Nenner beider Disziplinen wird durch das Ziel,
Wissen bzw. Information interaktiv unter Verwendung von Informationstechnologien zu
transferieren, dargestellt. Für transnationale Konzerne kommen aus informationstechnischer
Sicht nur Technologien in Frage, deren grundsätzliche Eigenschaften die charakteristischen
Anforderungen solcher Unternehmen erfüllen. Die technologische Lösung, die sich für das in
dieser Arbeit zu konzipierende Informationssystem am besten eignet, soll u.a.
plattformunabhängig und frei vernetzbar sein, direkten Zugang ins Internet erlauben und eine
für ’Unbefugte’ nicht sichtbare Wissensbank über ein standardisiertes User Interface zugänglich
machen. Die dafür gewählte Lösung ist das Intranet und wird im nachfolgenden Abschnitt
dargestellt.
3.1.7 Intranet
Um die Effizienz der Ausübung von Informationsmanagement in transnationalen Konzernen
gewährleisten zu können, ist die Nutzung moderner Kommunikations- und Informationstechnik
unumgänglich. Hierbei spielen zum Beispiel Intranets eine besonders wichtige Rolle. Intranets
unterstützen die Bereitstellung, den Abruf und den Austausch von Information innerhalb eines
Unternehmens, d.h. für nicht autorisierte Benutzer ist die dahinter liegende Wissensbank
unsichtbar und unerreichbar.
17
“… portal-oriented, community-oriented and process-oriented strategies… [Remus et al. 2000]”
“… single points of access… [Maurer et al. 2001]“
19
“… single points of exchange… [Maurer et al. 2001]“
18
Kapitel 3 - INFORMATIONSMANAGEMENT
Seite 35
Ein Intranet baut auf dieselben Technologien auf und nutzt dieselben Dienste wie das Internet.
Es stellt somit das Internet auf Unternehmensebene dar. In dieser Diplomarbeit wird der
verwendete Intranetbegriff etwas eingeschränkt, da er sich in Zusammenhang mit dem zu
untersuchenden Informationssystem für transnationale Konzerne nur auf einen Dienst des
Intranets bezieht. Dieser Dienst ist im Internet als World Wide Web (WWW) bekannt, und für
fast jedes Betriebssystem verfügbar.
Wichtige Gründe für die aktuelle Popularität des World Wide Web sind die einfache
Navigation, die Benutzerfreundlichkeit und die Konsistenz der Schnittstelle zu anderen
weitverbreiteten Diensten und Protokollen (z.B. FTP oder Telnet) über fast jeden Browser. Das
World Wide Web hat sich mittlerweile als die Standardlösung für Informations- und
Transaktionssysteme etablieren können, und kann als ein ’Hypermediasystem’ angesehen
werden, denn die dadurch ausgetauschten Informationen können nicht nur aus Text-, Grafik-,
Video- oder Audiodaten bestehen, sondern auch aus deren Kombinationen.
In [Nanfito 1996] werden die oben erwähnten technischen Eigenschaften eines Intranets in
einem Satz zusammengefaßt und hier, wie folgt, als Definition angegeben:
“Intranets sind Informationsnetzwerke eines Unternehmens, die
Technologien des World Wide Web und die Internetprotokolle
Computerkommunikation nutzen [Nanfito 1996] 20.”
die
der
Weiters betrachtet [Nanfito 1996] das Intranet nicht als isolierte Technologie, sondern bringt
das Wort Intranet auch mit Kommunikation, Informationsmanagement und Analyse von
Arbeitsabläufen in Verbindung. Optimal implementierte Intranets fördern den Prozeß des
Wissenstransfers und die Mitarbeiterkollaboration durch die Rationalisierung der
Kommunikation und des Informationszugriffs. Insbesondere im Bereich der automatisierten
Kommunikationsförderung finden Intranetlösungen weitverbreitete Anwendung. Beispiele für
hierfür implementierte Applikationsformen sind Email-, Chat- oder VideoconferencingSysteme.
Wie bereits oben erörtert, versuchen Intranetkonzepte einen intern abgesicherten Zugriff auf die
im Unternehmen vorhandenen Informationen über einheitliche Benutzerschnittstellen zu
ermöglichen. Somit ist aber das Problem einer effizienten Informationsverwaltung noch nicht
gelöst, da Intranetlösungen meist auf vorgegebenen Strukturen aufbauen. Infolgedessen wird an
dieser Stelle darauf hingewiesen, dass die kritischen Anforderungen der verteilten
Wissensorganisation (d.h. eine dem Unternehmen angemessene Informations- bzw.
Wissensstrukturierung) in transnationalen Konzernen allein durch eine Intranetplattform nicht
erfüllt werden können. Die wichtigsten Eigenschaften und kritischen Aspekte verteilter
Informationssysteme sowie unterschiedliche Sichtweisen, allgemeine Qualitätskriterien, und
Vor- und Nachteile gegenüber zentralen Lösungen werden im folgenden Abschnitt und in der
Schlußbemerkung dieses Kapitels präsentiert und analysiert.
3.2 Kritische Aspekte verteilter Informationssysteme
Die geographisch und funktionell verteilte Organisation eines transnationalen Konzerns
überlappt sich in Gestalt und Zielsetzung mit den allgemein geltenden Organisationsaspekten
für die Konzeption verteilter Informationssysteme. Die Charakteristika ’Verteiltheit’ und
’Vernetzung’ sind in unterschiedlichen Bereichen eines technischen Konzerns - wie
20
“Intranets are corporate information networks using the technologies of the World Wide Web and the
computer communication protocols of the Internet [Nanfito 1996].”
Kapitel 3 - INFORMATIONSMANAGEMENT
Seite 36
beispielsweise aus der Fallstudie [Hribernik et al. 1999] ersichtlich – u.a. durch folgende
Merkmale erkennbar:
-
geographisch verteilte aber zusammenhängende Unternehmensbereiche
-
verteilte Eigentümerstruktur
-
verteilte und vernetzte Innovationsprozesse
-
Standortverteilung von Produktions- oder Fertigungsstätten
-
geographisch verstreute Wissensgebiete
Nicht nur die ständigen Zusammenschlüsse von Organisationen zu großen Konzernen, sondern
auch das Outsourcing von Unternehmensaufgaben und die zunehmende politische und
wirtschaftliche Globalisierung beeinflussen kontinuierlich die Anforderungen, die an verteilte
Informationssysteme gestellt werden. Eine merkbare Tendenz bei der Konzeption von
Informationssystemen führt daher weg von zentralisierten Systemlösungen. Durch ein
integriertes bzw. verteiltes Informationssystem können Unternehmensmitarbeiter nicht lediglich
Zugriff auf Applikationen und Dienste des lokalen Teilsystems haben, sondern auch auf jenes
Wissen außerhalb der Tochterfirma bzw. des Teilbereichs - welches zum gesamten
intellektuellen Kapital des Konzerns zählt - effizient und transparent erreichen. Damit entsteht
die besondere Herausforderung an die Informationstechnologie, Information und Wissen auch
bei geographisch verteilten Humanressourcen und Wissenseinheiten über sehr große Distanzen
effizient und effektiv verwalten zu können.
Die kritischen Aspekte bzw. Bereiche, welche bei der Konzeption eines Informationssystems
für transnationale Konzerne eine besonders wichtige Rolle spielen, lassen sich, wie folgt,
unterteilen und stellen die Hauptthemen der nächsten Abschnitten dar:
•
Unternehmensweites Informationsmanagement: Dies beinhaltet die sorgfältige Analyse
der Anforderungen an die Informationsaufbereitung in stark vernetzten Systemen und
der Einflüsse der Dimensionen Ort, Anwendung, Zeit, Bedarf, Benutzer, Ziele,
Sicherheit und Kosten.
•
Verteilte Systeme: Hierbei spielen Entwurfsziele, Haupteigenschaften und
Qualitätskriterien eines verteilten Systems eine wichtige Rolle. Der Schwerpunkt liegt
hierbei im Begriff ’Transparenz’ und dessen unterschiedlichen Typen (Orts-,
Migrations-, Zugriffs-, Replikations-, Nebenläufigkeits-, Parallelitäts-, Skalierungs- und
Performanztransparenz).
•
Zuverlässigkeit und Stabilität: Gemeint sind damit Verfügbarkeit, Korrektheit und
Fehlertoleranz eines Systems.
•
Einflüsse aufgrund starker geographischer Verteilung: Die Einflüsse und deren
Ursachen sind auf lokaler und auf globaler Ebene identifizierbar. Hier spielen nicht nur
technische, sondern ebenfalls soziale und kulturelle Aspekte bei der Planung und
Durchführung des Systems eine wichtige Rolle.
3.2.1 Unternehmensweites Informationsmanagement
Hinsichtlich vernetzter Systeme lassen sich laut [Grosse 1996] unterschiedliche Anforderungen
an ein unternehmensweites Informationsmanagement identifizieren.
Informationsaufbewahrung sollte ortsgerecht bzw. anwendungsgerecht vonstatten gehen, d.h.
möglichst lokal zur Verfügung stehen. Anwendungsabhängiges Informationsmanagement stellt
Kapitel 3 - INFORMATIONSMANAGEMENT
Seite 37
somit sehr hohe Ansprüche an die gewählte Infrastruktur, da Informationen in Abhängigkeit
eines fluktuierenden Anwendungskontexts migriert oder repliziert werden können (z.B. große
Konstruktionszeichnungen, die während ihrer Erstellung zufolge eines beschleunigten
Fertigungsprozesses lokal verfügbar gemacht werden müssen) [Grosse 1996].
Das Informationssystem soll auch eine zeitgerechte Akquisition von Informationen
sicherstellen, um langandauernde Transfermechanismen zum Zeitpunkt des Informationsbedarfs
zu vermeiden. Darüber hinaus sollten Informationen lokal in einer für den Benutzer
angemessenen Form, d.h. bedarfsgerecht bzw. anwendergerecht, zur Verfügung stehen.
Bezüglich einer problemspezifischen Interpretation von abstrakt definierten Daten (implizitem
Wissen), sollte das Informationssystem dem Benutzer die Möglichkeit
bieten, den
Abstraktionsgrad der Informationen variabel zu gestalten (’Transformationsdienste’). Hierbei ist
das Problem gemeint, dass Informationen mit niedrigem Abstraktionsgrad zwar für die
Anwendung, jedoch oft nicht für den Anwender geeignet erscheinen. Dieses Problem macht
unterschiedliche anwendergerechte Bearbeitungsformen für die entsprechenden Informationen
notwendig. Für transnationale Konzerne besonders zutreffend könnten verschiedenartige
Unternehmensbereiche unterschiedliche Teilinformationen benötigen, die möglicherweise nur
im direkten Zusammenhang mit anderen Datenbeständen verfügbar sind. Ein Zugriff auf die
gewünschten Teilinformationen könnte über adaptive und dynamisch erzeugte Navigation durch
alle in Frage kommenden Objekte erfolgen. Deshalb ist es von großer Bedeutung, die
Informationen zielgerichtet entsprechend ihres Anwendungszwecks strukturieren zu können
[Grosse 1996].
Ein weiterer kritischer Aspekt bei der Informationsadministrierung stellt eine
sicherheitsgerechte Transferstrategie dar. Die konzipierte Systemlösung sollte Mechanismen
beinhalten, welche Sicherheitsanforderungen gegenüber Dritten berücksichtigen und
unterschiedliche Zugriffsrechte auf Informationen innerhalb des Intranets verwalten.
Desweiteren wird in [Grosse 1996] eine sehr wichtige Anforderung wirtschaftlichen Planens,
die Berücksichtigung der entstehenden Kosten (kostengerechte Produktentwicklung),
identifiziert.
3.2.2 Verteilte Systeme
Bei der Konzeption bzw. dem Entwurf eines verteilten Informationssystems werden die
gleichen Ziele und Anforderungen identifiziert wie bei den so oft in der Literatur unter
’Verteilte Systeme’ oder ’Verteilte Anwendungen’ bekannten Systemen (sei es auf der Ebene
von
Betriebssystemen,
Transaktionssystemen,
Datenbanksystemen
oder
auch
Wissensmanagementsystemen). Die in weiterer Folge aufgelisteten Entwurfsziele,
Haupteigenschaften und Qualitätskriterien eines verteilten Systems beziehen sich, falls nicht
anders angegeben, auf die in [Haub 1999] und [Lamport 2002] gewonnenen Erkenntnisse sowie
auf die Bücher [Mullender 1989] und [Mullender 1993].
Die hier erwähnten Konzepte stellen auch Haupteinflußfaktoren für verteilte
Informationssysteme eines transnationalen Konzerns dar. Das Schüsselkonzept im Bereich der
verteilten Systeme wird durch die Transparenz dargestellt. Diese läßt sich aus technischer Sicht,
wie folgt, unterteilen:
•
Ortstransparenz
•
Migrationstransparenz
•
Zugriffstransparenz
Kapitel 3 - INFORMATIONSMANAGEMENT
Seite 38
•
Replikationstransparenz
•
Nebenläufigkeitstransparenz
•
Parallelitätstransparenz
•
Skalierungstransparenz
•
Leistungstransparenz (Performanztransparenz).
Durch Ortstransparenz soll der Benutzer nicht merken, wo sich ein Objekt (Dateien, Benutzer,
Rechner, usw.) physikalisch im Netz befindet. Der Informationszugriff erfolgt in der Regel über
einen eindeutigen Namen, der keine Ortsinformation enthält. Somit wird Ortstransparenz durch
global geltende Regeln gewährleistet, wie zum Beispiel globale Verfügbarkeit (dieselben
Dienste sind sogar nach einem auftretenden Teilausfall arbeitsfähig), globale Sicherheit
(dieselben Benutzernamen und -rechte führen überall zum gleichen Resultat), globales
Management (dieselbe Person kann das System überall im gleichen Ausmaß beeinflussen) oder
eben globale Namen (einmalig vergebene Namen haben überall ein konstantes, technisch und
organisatorisch gleichbedeutendes Verhalten).
Die Verlagerung von Objekten wird durch Migrationstransparenz verbessert. Unter
transparenter Migration versteht man das Verlagern von Objekten quer über das verteilte
Rechnernetz, ohne eine Änderung des Objektnamens und ohne Beeinträchtigung der
Benutzerarbeit oder des Verhaltens verteilter Applikationen.
Mit optimaler Zugriffstransparenz kann man in einem verteilten System sicherstellen, dass auf
alle Systemkomponenten oder Objekte über einen einzigen Mechanismus zugegriffen wird zum Beispiel durch das Festlegen des Browsers als einzige Benutzerschnittstelle zum System.
Bei Replikationstransparenz greift der Benutzer auf replizierte (mehrfach kopierte) Objekte zu,
als wären diese nur einmal im System vorhanden, und zwar direkt in seiner Nähe. Das Ziel
hierbei ist es, oft verwendete oder große Dateien schneller zu erreichen und dabei die
Netzwerkbelastung lokal zu minimieren. Die Konsistenz der Replikate muß in der Regel über
komplexe Protokolle garantiert werden. Mehrfach reproduzierte Dokumente verlangen meistens
hohe Synchronisationsanstrengungen, weshalb Replikationstransparenz in direktem
Zusammenhang mit zwei anderen Transparenztypen steht: Nebenläufigkeitstransparenz21 und
Parallelitätstransparenz.
Mehrere Applikationen oder Benutzer sollten auf gemeinsame Objekte gleichzeitig zugreifen
können, ohne sich gegenseitig zu beeinflussen. Ein transparenter gemeinsamer Zugriff auf
Objekte wird Nebenläufigkeitstransparenz genannt und durch Mechanismen wie Objektsperren
oder Versionskontrolle ermöglicht.
Eines der komplexesten Forschungsgebiete im Bereich verteilter Systeme stellt die
Parallelitätstransparenz dar. Das wichtigste aus programmiertechnischer Sicht ist, dass man
Parallelität nicht explizit programmiert, sondern Algorithmen implementiert, die dem System
erlauben selbst herauszufinden, ob, welche, wann, wie und wo Applikationen parallel
ausgeführt werden sollen.
Das Ziel der Skalierungstransparenz besteht darin, eine Erweiterung vom System oder von
Systemteilen (Applikationen) zu ermöglichen, ohne die bestehende Systemstruktur oder die
Funktionalität von Systemkomponenten modifizieren zu müssen. Diese Eigenschaft sollte man
21
Gleichzeitigkeitstransparenz (transparency of concurrency)
Kapitel 3 - INFORMATIONSMANAGEMENT
Seite 39
von der Leistungstransparenz (oder Performanztransparenz) unterscheiden, die eine
dynamische Re-Konfiguration des Systems zur Verbesserung der Performanz erlaubt. Die
Leistungs- und die Skalierungstransparenz können somit als Maß für die Flexibilität und
Robustheit eines verteilten Systems verstanden werden.
3.2.3 Zuverlässigkeit und Systemstabilität
Ein zuverlässiges und stabiles System baut auf zwei Grundprinzipien auf: Verfügbarkeit und
Korrektheit. Ein System soll somit nicht nur ständig verfügbar sein, sondern auch das, auf
korrekter Weise tun, wofür es konzipiert wurde, auch wenn Fehler auftreten [Mullender 1993].
Verfügbarkeit bedeutet hier, dass die Arbeit einer ausgefallenen Maschine durch mindestens
eine weitere übernommen werden kann. Dies impliziert meistens die Existenz von redundant
gespeicherter Information, was in weiterer Folge zu Konsistenzproblemen führen könnte.
Das Bindeglied ist hier also die Festlegung und Analyse einer angemessenen Fehlertoleranz.
Bei der Berücksichtigung von Fehlern ist es wichtig zwischen Funktionsausfällen (faults,
failures) und Fehlzuständen (errors) zu unterscheiden. Eine weitere Grenzlinie soll auch
zwischen Fehlertoleranz und Fehlervermeidung gezogen werden, um eine optimale
Implementation und Funktionalität des Systems zu gewährleisten [Mullender 1993] .
3.2.4 Einflüsse aufgrund starker geographischer Verteilung
Einige der kritischen Aspekte, die sich bei der Konzeption eines Informationssystems für
transnationale Konzerne global auf das Unternehmen auswirken, lassen sich, wie folgt, auflisten
[Haub 1999] [Lamport 2002]:
a)
Die
Modularität
des
gesamten
Projektes
(wobei
vor
Schnittstellenprogrammierung eine sehr bedeutende Rolle spielt).
allem
die
b)
Die Erkennung der Masse und Komplexität der Funktionen und deren
Zusammenhänge, insbesondere die möglichen Auswirkungen von organisationalen
Umstrukturierungen oder von modifizierten Geschäftsprozessen.
c)
Die frühzeitige Einplanung und effiziente Implementierung einer multilingualen
Funktionalität (Mehrsprachigkeit), falls notwendig bzw. erwünscht.
d)
Die Festlegung einer einheitlichen und sicheren Benutzerverwaltung (An- und
Abmeldung am System, Registrierung neuer Benutzer, Autoritätshierarchien und
funktionale Befähigungen) sowie anwendungsgerechter Rollenkonzepte auf Benutzerund Dokumentenebene (Gruppenverwaltung, Workflow, usw.).
e)
Die sorgfältige Analyse einer nachhaltigen Wissensorganisation (zum Beispiel die
Wahl eines Klassifizierungsschemas oder die Darstellung geeigneter
Themenhierarchien).
Im Bezug auf die lokalen Gegebenheiten eines Unternehmens, oder präziser definiert, auf die
lokalen technischen Voraussetzungen eines Unterbereichs (z.B. eine Tochterfirma) innerhalb
eines transnationalen Konzerns, spielen diverse Faktoren, die sich auf die Effizienz und
Performanz des verteilten Informationssystems auswirken, eine nicht zu unterschätzende Rolle.
Lokal
verfügbare
Kommunikationstechnologien,
insbesondere
die
Art
einer
Datenübertragungsverbindung,
können
zum
Beispiel
die
Verteiltheitsoder
Replikationskriterien über Daten entscheidend beeinflussen. Diese Faktoren (vor allem die
Funktionalität und Entscheidungskriterien von Datenreplikation) fallen im Kontext der
Kapitel 3 - INFORMATIONSMANAGEMENT
Seite 40
vorliegenden Arbeit unter dem Bereich des Datenmanagements und werden im dazugehörigen
Kapitel 4 gründlich untersucht [Lamport 2002].
Weiters können kulturelle Aspekte innerhalb eines großen und geographisch verteilten
Konzerns den Informationstransfer beeinträchtigen. Insbesondere im Bestreben zu einer sehr
umfangreichen, einheitlichen und möglichst transparent verteilten Erfassung des intellektuellen
Kapitals auf globaler Ebene kann man auf lokale Hindernisse stoßen. Wie bereits im Kapitel 2
’Wissensmanagement’ Abschnitt 2.2.5 ’Soziale und kulturelle Barrieren’ anhand des Beispiels
aus [Nonaka et al. 1995] dargestellt, legt die westliche Unternehmenspraxis den Mittelpunkt auf
das explizite Wissen, japanische Unternehmen auf Bildsprache oder Intuition. Hierbei spielt das
in [World_Bank 1998] als einheimische oder eingeborene Wissen22 eine entscheidende Rolle.
Einheimisches Wissen beinhaltet traditionelles Know-How, eingeborene Geschicklichkeiten
und Problemlösungsmechanismen, die typisch für eine Gesellschaftsform sind. Wichtig dabei
ist, soviel explizites einheimisches Wissen in das verteilte System einzufangen, aber nicht als
Folge eines Verteilungsprozesses, sondern als Teil einer Systemintegration.
3.3 Schlußbemerkung
Wie groß die Überlappungen mehrerer Disziplinen bei der Konzeption eines
Informationssystems sind, und welche bedeutungsvolle Rolle deren Verständnis spielt, hat sich
aus den in Kapitel 2 ’Wissensmanagement’ und den in diesem Kapitel
’Informationsmanagement’ gewonnenen Erkenntnissen ableiten lassen. Wichtig dabei war das
Erkennen und die Analyse der gemeinsamen technischen Faktoren und der unterschiedlichen
Reichweiten beider Managementsdisziplinen, insbesondere in Bezug auf die Verteiltheit der
Informationen bzw. Wissenseinheiten für transnationale Konzerne.
Während der ’neue’ Begriff des Wissensmanagements eine neue Rolle definiert, findet man im
Informationsmanagement diverse Grundfähigkeiten, um Wissen verwalten zu können, vor allem
explizites Wissen. Diese Fähigkeiten kommen meist dann zur Geltung, wenn man - wie in
diesem Kapitel vollzogen – die technischen Komponenten des Informationsmanagements
analysiert [Miranda et al. 2000]. Aus den allgemeinen Zielen beider Disziplinen lassen sich
viele Parallelen, wie in [Tab. 3.1] dargestellt, ziehen.
Informationsmanagement
Sammlung von Information
Indizierung und Organisation von
Information
Evaluation von Informationen
Speicherung von Information in
Datenbanken
Informationszugriff und -verbreitung
Wissensmanagement
Sammlung von Wissen
Kodifizierung von Wissen
Messung von Werten bzgl.
Wiederverwendung
Erstellung von Wissensbanken
Wissenszugriff und -verbreitung
Tabelle 3.1: Informations- und Wissensmanagementrollen [Miranda et al. 2000]
Für große und geographisch verteilte Unternehmen sind aus kommunikationstechnologischer
Sicht viele Vorteile bei einer effektiven Nutzung eines Intranets identifizierbar, beispielsweise:
Transparenter Zugriff auf aktuelle und relevante Informationen
Beschleunigung und Qualitätsverbesserungen von Geschäftsprozessen
22
Indigenous Knowledge [World_Bank 1998]
Kapitel 3 - INFORMATIONSMANAGEMENT
Seite 41
Zeitersparnis bei der Informationssuche
Orts- und zeitunabhängige Verfügbarkeit der Benutzerschnittstelle (Browser als
einheitliches und überall verfügbares Zugangs- und Kommunikationswerkzeug)
Verbesserte Nutzung des verteilten intellektuellen Kapitals
Integration
kommunikationsfördernder
Videoconferecing, Email, u.v.m.)
Mechanismen
(z.B.
Chatsystem,
Die in diesem Kapitel besprochenen Qualitätskriterien (Erweiterbarkeit, Transparenz,
Robustheit, Performanz, Wartbarkeit oder Integrationsfähigkeit) von verteilten
Informationssystemen lassen die Erstellung einer groben Analyse über die Vor- und Nachteile
solcher Systeme gegenüber zentraler oder isolierter Lösungen, wie folgt, zu:
Vorteile einer Verteilung: Gegenüber zentral organisierten Systemen zeichnen sich
verteilte Systeme durch höhere Wirtschaftlichkeit (Preis/Leistungsverhältnis),
Zuverlässigkeit, kürzere Antwortzeiten, modulare Skalierbarkeit, kontinuierliche
Verfügbarkeit und transparente Behandlung von Teilausfällen aus. Gegenüber isolierten
Arbeitsplatzrechnern liegen die Vorteile eines verteilten Systems auf der Hand:
Kommunikation,
Kollaboration,
gemeinsame
Nutzung
von
Ressourcen,
Performanzausgleich durch wenige Hochleistungsrechner, Flexibilität, Integration,
Wartbarkeit und natürlich höhere Rentabilität.
Nachteile einer Verteilung: Einige Nachteile sollten - trotz aller Vorteile - jedoch nicht
ungenannt bleiben. Die Implementierung (Software) eines effizient verteilten Systems ist
sehr komplex und kritisch über die ganze Dauer der Projektabwicklung, d.h. von
Konzeption und Entwurf, über Implementierung und Testen, bis zu Abnahme und
Wartung. Es besteht ebenfalls eine große, konstante und direkte Abhängigkeit zur
Performanz des zugrundeliegenden Netzwerks. Weiters sind die Sicherheitsmaßnahmen
komplexer, da das verteilte System weitaus mehr Angriffspunkte anbietet als zentrale
Großsysteme.
Hauptthemen des nächsten Kapitels sind die effiziente und effektive physikalische
Aufbewahrung von Objekten und die Replikationsmechanismen in verteilten Systemen. Diese
Bereiche werden von der Disziplin des Datenmanagements abgedeckt, welches unter anderem
die technischen Aspekte von Datenbanksystemen beinhaltet. Um Zusammenhänge mit anderen
Disziplinen zu zeigen, werden auch ’verwandte’ Bereiche, die sich mit Wissensspeicherung in
großen Unternehmen beschäftigen (zum Beispiel Organisationsgedächtnis oder ’Organisational
Memory Systems’), dargestellt. Den wesentlichsten Teil stellt aber der Abschnitt über die
Entscheidungskriterien und Mechanismen für eine effiziente Datenreplikation in verteilten
Systemen für große und geographisch verteilte Unternehmen dar.
Kapitel 3 - INFORMATIONSMANAGEMENT
Seite 42
Kapitel 4 - DATENMANAGEMENT
Seite 43
Kapitel 4
Datenmanagement
„I think there is a world market for, may be, five computers.” 23
Ehemaliger CEO eines großen Hardwareunternehmens, 1943
„640 KB ought to be enough for everybody.” 24
CEO eines großen Softwareunternehmens, 1981
Wissensträger in einem Unternehmen sind in der Regel Objekte, Personen oder Systeme, die in
der Lage sind, Wissen zu speichern und zu repräsentieren. Dazu zählen zum Beispiel
Dokumentationen, Multimediadateien, Datenbanken, Expertensysteme bzw. Domänesysteme,
Personen mit Spezialwissen und Gruppen von Unternehmensmitarbeitern, die eine spezifische
Aufgabe gemeinsam lösen.
In diesem Kapitel werden Daten als konkret gespeichertes Symbol in einem physikalischen
Medium behandelt. Die Reichweite des Datenmanagements als unternehmensbezogene
Disziplin bzw. als Bereich der Informationswissenschaft wird oft unterschiedlich definiert und
interpretiert. Für die Definitionen lässt sich aber ein gemeinsamer Nenner finden: der
informationstechnische Teil des Datenmanagements befaßt sich hauptsächlich mit der ’nicht
semantischen’ Ebene der elektronischen Speicherung. Nicht semantisch deshalb, da diese Ebene
das Management im Zeichenbereich repräsentiert.
Das Ziel des Datenmanagements in großen und geographisch verteilten Unternehmen läßt sich
über alle Geschäftsbereiche und Organisationshierarchien gleichermaßen erkennen: wegen der
hohen Komplexität verteilter Systeme und der hohen Kosten der Wissenserfassung strebt man
nach einer nachhaltigen Aufbewahrung von Daten, nach ihrer möglichst fehlerfreien
Verwaltung und nach einer transparenten und gesicherten Verfügbarkeit für mehrere Benutzer
und Applikationen. Aus diesem Grund werden für die Datenverwaltung oft Datenbanksysteme
eingesetzt.
Im organisationalen und technologischen Bereich des Datenmanagements - aus der Sicht
transnationaler Konzerne - spielt die gesicherte Datenübertragung eine besonders wichtige
Rolle. Datensicherheit lässt sich durch rein technologische Maßnahmen (d.h.
Informationstechnologie) optimieren, zum Beispiel durch eine geeignete Intranetumgebung mit
effizienten Anmelde- und Zugriffsrechtkomponenten.
In Bezug auf Datenverwaltung in verteilten Organisationsstrukturen stellen meist die
synchronisierte Aktualisierung der Datenbestände sowie die Korrektheit und Transparenz der
Inhaltsauffindung ebenfalls kritische Bereiche dar. Wo und wie die Datenbestände physikalisch
gespeichert werden hängt meist ab von den lokalen technologischen Gegebenheiten der
Tochterfirma und von der beabsichtigten Fehlertoleranz des verteilten Informationssystems
bzw. der Performanz der zugrunde liegenden Datenbank.
Dieses Kapitel präsentiert einen Überblick über das Thema ’Verteilte Datenbanksysteme’ und
dessen Zusammenhang und Unterscheidung mit dem Begriff ’Organisationsgedächtnis’. Im
23
24
„Ich glaube es gibt einen Weltmarkt für, vielleicht, fünf Computer.“
„640 KB sollten genug für jedermann sein.“
Kapitel 4 - DATENMANAGEMENT
Seite 44
zweiten Teil des Kapitels werden die unterschiedlichen Methoden bzw. Entscheidungskriterien
für Datenreplikation diskutiert.
4.1 Verteilte Datenbanksysteme
Datenbanken, unabhängig vom Einsatzbereich, dienen der organisierten Speicherung von
Information. Datenbanksysteme bzw. Datenbankmanagementsysteme verwalten solche
Datenbanken, kontrollieren das Hinzufügen und Löschen von Datenbeständen, und unterstützen
bei Bedarf die Analyse und Reorganisation von bestehender Information nach bestimmten
Gesichtspunkten.
Damit stellen Datenbanken mehr als nur passive Kanäle, die Information über einen Zeitraum
speichern, dar. Sie können Aufgaben übernehmen und Information aktiv, reaktiv oder interaktiv
verarbeiten. Je mehr solcher Inferenzmechanismen die Datenbanken enthalten, desto näher
kommen sie dem Konzept von ’Intelligenten Agentsystemen’. Expertensysteme sind Beispiele
für solche Informationssysteme [NetAcademy 1999]. Diese Arbeit befaßt sich aber mit
Datenbanken für transnationale Konzerne, also Datenbanken mit meist stark vernetzten
Knotenpunkten innerhalb einer weltweit verteilten Umgebung. Eine Lösung für solch spezielle
Strukturen sind ’verteilte Datenbanken’.
Eines der in [Krcmar 2000] erkannten Ziele des Datenmanagements stellt die Erhöhung der
Produktivität bei der Entwicklung von Anwendungssystemen durch den Einsatz von
Datenbanksystemen dar. Dafür spielt die strategische Komponente des Managements eine
wichtige Rolle, d.h. welche Daten für welche Systeme und Aufgaben wie gespeichert und zur
Verfügung gestellt werden sollen.
4.1.1 Datenmanagement
Generell kann festgelegt werden, dass sich Datenmanagement mit
„...allen betrieblichen und technischen Aspekten der Datenmodellierung,
Datenadministration,
der
Datentechnik
und
des
datenbezogenen
Benutzerservices... [Krcmar 2000]“
befaßt.
Dieses Kapitel konzentriert sich auf die Herausforderungen der Datentechnik in Bezug auf
Datenverteilung und –lokalisierung, insbesondere für transnationale Konzerne. Die vom
Informationssystem eines transnationalen Konzerns angeforderte Intranettechnologie - mit ihrer
standardisierten und ortsunabhängigen Funktionalität – könnte zur Implementierung einer
verteilten Server- bzw. Datenbankarchitektur führen, welche sich für die Lösung vieler
Verteiltheitsprobleme sehr gut eignen kann (vor allem bei Problemen mit technologischem
Hintergrund).
4.1.2 Datenbanksysteme
Laut [Büchel 2000] besteht ein Datenbanksystem
„...aus dem Verbund einer nicht leeren Menge von Datenbanken mit einem
Datenbank-Management-System.“
Kapitel 4 - DATENMANAGEMENT
Seite 45
Ein Datenbankmanagementsystem wird somit durch die Datenbanksoftware repräsentiert.
Grundsätzlich, insbesondere im Hinblick auf Datenverteilung, unterscheidet man zwischen
folgenden verschiedenartig strukturierten Datenbanktypen [Krcmar 2000]:
a) zentralisierte Datenbanken
b) zentrale Datenbanken mit verteilten Partitionen (fragmentierte Datenbanken)
c) replizierte Datenbanken
d) verteilte Datenbanken mit zentralem Katalog (Data-Dictionary)
Wie in [Seidlitz 2001] dargestellt, können Datenbanksysteme in der Regel anhand der Anzahl
der im Netzwerk vorhandenen Knoten klassifiziert werden in:
a) zentralisierte Datenbanksysteme,
b) verteilte heterogene Datenbanksysteme
c) verteilte homogene Datenbanksysteme
Zentralisierte Datenbanksysteme bzw. zentrale Datenbanken zeichnen sich dadurch aus, dass
der gesamte Datenbestand eines Unternehmens auf einem einzigen Server gespeichert ist. Der
Datenabruf erfolgt in der Regel über mehrere Client-Applikationen.
Vorteile dieser einfachen Lösung sind die vereinfachte Bedienung und Konsistenz der Daten,
sowie die Vermeidung typischer Probleme von verteilten Strukturen, wie zum Beispiel
Nebenläufigkeitsprobleme oder Konflikte bei Datenreplikation.
Nachteilig für solche Strukturen ist der Mangel einer echten Skalierungsfreiheit und die
Tatsache, dass die alleinstehende Datenbank bzw. der alleinstehende Server einen single point
of failure darstellt [Seidlitz 2001]. Darüber hinaus wird dieser Server zum Flaschenhals
bezüglich Systemperformanz, allgemeine Speicherkapazität, Prozessorauslastung, Netzwerklast
bzw. Transaktionsverwaltung, Anzahl der simultan bedienbaren Benutzer und vielem mehr.
Eine der Möglichkeiten, um Lastprobleme zu vermeiden, ist der Einsatz von zentralen
Datenbanken mit verteilten Partitionen (fragmentierte Datenbanken). Diese Systeme bestehen
meist aus mehreren Festplattenspeichern (eventuell an unterschiedlichen Orten lokalisiert), die
entweder unterschiedliche Instanzen von Datenbanken oder diverse Fragmente einer großen
Datenbank enthalten. Somit kann man zwar das Problem der Speicherkapazität besser in den
Griff bekommen, die funktionale Serverperformanz verbessert sich dadurch aber prinzipiell
nicht.
Replizierte Datenbanken enthalten verteilte Replikate (mehrfach vorhandene Kopien) einzelner
Datenbestände oder kompletter Teildatenbanken. Eine Replikation auf dieser Basis wird meist
aus Performanzgründen hervorgerufen. Mögliche Ursache hierfür kann zum Beispiel der
häufige Zugriff auf große Dateien über langsame Internetverbindungen sein.
Verteilte Datenbanken mit zentralem Katalog werden über einen Schemakatalog (DataDictionary) verwaltet. Dieses Schema enthält eine konzeptionelle Beschreibung
(Datendefinitionen für sämtliche Daten) der Datenbanken eines Datenbanksystems. So eine
Methode gewährleistet die Anforderung der Datenunabhängigkeit an eine Datenbank [Krcmar
2000].
Vor allem für transnationale Konzerne nimmt die Anzahl der zu speichernden Daten oft
ungeahnte Ausmaße an. Sobald dieser Punkt erreicht wird könnte ein zentralisiertes System an
Kapitel 4 - DATENMANAGEMENT
Seite 46
seine Grenzen stoßen und eine sehr große Menge an Datenabfragen und Berechnungen nur sehr
schwer oder gar nicht effizient bewältigen. Es ist also erstrebenswert, die Gesamtlast (Speicher-,
Prozessor- und Netzwerklast) auf mehrere Systeme zu verteilen [Seidlitz 2001].
4.1.3 Verteilte Datenbanksysteme
Verteilte Datenbanksysteme erlauben den Zugriff auf lokale und entfernte Datenbanken. In so
einem System wird der gesamte Datenbestand auf mehrere Server bzw. Datenbanken verteilt.
Diese (geographisch) getrennten Komponenten werden oft Knoten oder Standorte (engl.:
’nodes’ oder ’sites’) genannt und über ein Netzwerk miteinander verbunden. Unerläßlich für ein
’echtes’ Verteilungskonzept ist hierbei die Sicherstellung von Ortstransparenz, d.h. die
Komponenten sollten für den Benutzer wie eine einzige Datenbank erscheinen [Oracle 2002a]
[Seidlitz 2001].
Man unterscheidet zwischen homogen verteilte Datenbanksysteme (alle Datenbanken sind vom
selben Typ bzw. ’Marke’) und heterogen verteilte Datenbanksysteme (mindestens eine
Datenbank ist nicht vom gleichen Typ wie alle anderen). In der Regel basieren verteilte
Datenbanken auf einer Client/Server Architektur, um Datenbankabfragen zu verarbeiten.
An dieser Stelle ist es angebracht zu betonen, dass ’Verteilte Datenbanken’ und ’Verteilte
Verarbeitung’ (engl.: distributed processing) bzw. ’Verteilte Anwendungen’ zwar sehr eng
zusammenhängende Begriffe darstellen, grundsätzlich aber unterschiedliche Bedeutungen
haben. Eine verteilte Datenbank besteht aus einer nicht leeren Menge von Datenbanken
innerhalb eines verteilten Systems, welche sich den Applikationen als eine einzige Datenquelle
präsentiert. Verteilte Verarbeitung entsteht, wenn eine Operation stattfindet, bei der eine
Applikation ihre Aufgaben auf verschiedenen Rechnern in einem Netzwerk verteilt. Aus diesem
Grund werden oft Verarbeitungssysteme für verteilte Datenbankapplikationen25 oft auch Client /
Server Datenbankapplikationssysteme26 genannt [Oracle 2002a].
Es gibt Definitionen für homogen verteilte Datenbanksysteme, die darunter nicht ein verteiltes
System verstehen, dessen Knoten mit demselben Softwarepaket ausgestattet sind und auf der
gleichen Plattform laufen. Stattdessen wird damit eine Knotenmenge, die unter dem gleichen
Datenbankmanagementsystem und Datenbankschema verwaltet wird, angenommen. Einigkeit
besteht darin, dass Ortstransparenz eines der wichtigsten Voraussetzungen darstellt und, dass
Unterschiede in der lokalen Autonomie der einzelnen Knoten bestehen können [Seidlitz 2001].
Heterogen verteilte Datenbanksysteme sind meist durch eine hohe lokale Autonomie
charakterisiert. Einige Knoten innerhalb solcher Systeme können verschiedenartige
Datenbankmanagementsysteme nutzen. Jeder Knoten hat einen eindeutigen Namen im
Netzwerk und verwaltet selbst seine lokalen Ressourcen. Die Verbindung zu anderen
Datenbanken erfolgt über standardisierte Schnittstellen [Seidlitz 2001].
Ein weiterer wichtiger Aspekt bei der Konzeption eines großen Datenbanksystems für
transnationale Konzerne stellt die ’Datenrettung oder Datenwiederherstellung’ (engl.: ’data
recovery’) dar. Dafür stehen in der Regel zwei Funktionen zur Verfügung: ’nochmals tun’
(engl.: ’redo’) und ’rückgängig machen’ (engl.: ’undo’). Die erste davon tritt dann auf, wenn ein
Knoten nach einem Fehler wieder anläuft und alle Modifikationen einmal abgeschlossener
Transaktionen - seien sie auf dem lokalen Knoten oder global über mehrere Knoten ausgeführt
worden - auf den am lokalen Knoten abgelegten Daten wiederhergestellt werden müssen. Ein
25
26
‘distributed database application processing systems’
‘client/server database application systems’
Kapitel 4 - DATENMANAGEMENT
Seite 47
’Undo’ ist dann notwendig, wenn die Modifikationen von noch nicht abgeschlossenen lokalen
und globalen Transaktionen auf den am abgestürzten Knoten vorliegenden Daten rückgängig
gemacht werden müssen [Oracle 2002a].
Wenn man moderne Entwicklungsmöglichkeiten im Bereich der Datenbanksysteme analysiert
und deren informationstechnische Bedeutung für das intellektuelle Kapital eines großen
Konzerns, insbesondere aus der Sicht des Wissensmanagements, betrachtet, erkennt man viele
Gemeinsamkeiten mit dem Begriff Organisationsgedächtnis (engl.: ’organisational memory’).
4.1.4 Organisationsgedächtnis
Die Speicherungsbasis des Informationssystems eines großen Unternehmens wird meist durch
eine Datenbank bzw. ein Datenbanksystem dargestellt. Im allgemeinen beschreibt das
Speichermedium ein System von Fähigkeiten, die es erlauben, aktuelle Erkenntnisse über eine
gewisse Zeit aufzubewahren, um zu einem späteren Zeitpunkt darauf zugreifen zu können. Ein
System kann also ohne Speicherungsmöglichkeiten nicht ’lernen’. Infolgedessen repräsentiert
ein Organisationsgedächtnis bzw. Unternehmensgedächtnis (engl.: ‚organisational memory’)
eine unerlässliche Voraussetzung für Organisationales Lernen [Lehner et al. 1998].
Das primäre Ziel des informationstechnischen Wissensmanagements ist Wissen zu
digitalisieren, d.h. informationstechnisch verarbeitbar, auffindbar und transferierbar zu machen.
Ein Unternehmensgedächtnis ist somit die idealisierte Digitalabbildung des Wissens von einer
Unternehmung und deren Mitarbeiter. Dieser Idealfall wird aber leider wegen der schwierigen
Externalisierung impliziten Wissens nicht erreicht [Tochtermann et al. 2000] [Maurer et al.
2001].
Das Schlüsselwort in diesem Kontext heißt also ’Organisationales Lernen’. Um diese Funktion
zu realisieren, wurden lange Zeit klassische Konzepte im Bereich der Datenbanksysteme
herangezogen. Aufgrund der informationstechnischen Entwicklungen in den letzten Jahren
(insbesondere bezüglich Datenmodellierung, multimedialer Informationssysteme und
Wissensrepräsentation) entstanden neue Möglichkeiten, um komplexere Aufbewahrungsorte zu
verwirklichen.
Mehrere Disziplinen oder Subdisziplinen unterschiedlicher Bereiche haben die Entwicklung
moderner Speicherungsmöglichkeiten beeinflußt: Organisationales Lernen, Lernende
Organisation,
Wissensmanagement,
Organisationsund
Personalentwicklung,
Innovationsmanagement, Organisationale Intelligenz, Wissensbasierte Systeme (Künstliche
Intelligenz, Kognitive Wissenschaften), und andere. In [Lehner et al. 1998] werden Systeme für
Organisationsgedächtnisse (engl.: ’Organisational Memory Systems’) als eine neue Dimension
bei der Realisierung von Informationssystemen im Sinne einer fortgeschrittenen Entwicklung
der Datenverarbeitung interpretiert.
Somit erfordert die Implementierung und die Nutzung dieser Systeme interdisziplinäre
Kenntnisse in Organisation und Management, Gruppen- und Verhaltenspsychologie sowie
Computerwissenschaften. Das ’Niveau’ solcher Systeme, wie in [Tab. 4.1] gezeigt, ist somit
höher einzustufen als jenes konventioneller Datenbanksysteme. Weiters betrachten [Lehner et
al. 1998] die Beherrschung der unteren Niveaus als eine unabdingbare Voraussetzung für den
erfolgreichen Einsatz von Organisational-Memory-Systems.
Kapitel 4 - DATENMANAGEMENT
Seite 48
Niveau / Name
4) Wissensmanagement
3) Information als Ressource
2) Datenmanagement
1) Datei- und Datenorganisation
Systemtyp / Fokussierung
Organisational Memory Systems
Fortgeschrittene Datenbanktechnologien
Daten(bank)architektur des Unternehmens
Datensysteme
Tabelle 4.1: Entwicklungsniveaus bezüglich der (elektronischen) Bearbeitung von Daten, Information
und Wissen in Unternehmen [Lehner et al. 1998]
In Bezug auf ’Organisationsgedächtnis’ - terminologisch gesehen - können in der Literatur
mehrere Synonyme bzw. sehr verwandte Disziplinen erkannt werden, wie zum Beispiel:
Unternehmensgedächtnis, Unternehmensweite Wissensbasis, Gruppengedächtnis, Kollektive
Intelligenz, Unternehmensintelligenz, Geteilte Wissensbasis, Know-How Datenbanken.
Die in [Maier et al. 2000a] beschriebene Studie über Wissensmanagementsysteme und Systeme
für Organisationales Gedächtnis identifiziert als Hauptziel beider Systemarten das Bewältigen
folgender Tendenzen:
• Die zunehmende Komplexität, Dynamik, Fragmentierung und Dezentralisierung des
Wissens.
• Die immer komplexer werdenden Organisationsstrukturen und die permanente
Notwendigkeit diese zu ändern.
• Die zunehmende Anzahl der zu verwaltenden ’nicht traditionellen’ Daten (wie
Hypertextdokumente, Links, Multimediadateien, usw.). Dies erfordert also eine genau
überlegte Datenbankarchitektur für die Speicherung und den Einsatz von modernen
Datenbanksystemen für die Verwaltung von Daten.
Wichtige Parallelen können somit zwischen ’Datenbanksystemen’ und ’Systemen für
Organisationales Gedächtnis’, wenn man die unterschiedlichen Definitionen miteinander
vergleicht bzw. wenn man die Ziele und Aufgaben beider Disziplinen betrachtet (siehe
Abschnitte 4.1.2 und 4.1.4 dieses Kapitels), gefunden werden.
In [Maier et al. 2000a] werden sechs unterschiedliche Perspektiven angegeben, die zu einer
Kategorisierung von Systemen für Organisationsgedächtnis führen. Eine dieser Perspektiven,
die sogenannte ’funktionelle Sichtweise’, bringt - insbesondere im Hinblick auf den Bereich der
Datenbanksysteme - eine interessante Definition hervor:
„Ein System für Organisationales Gedächtnis ist ein computerbasiertes System,
welches mit der Hilfe von Software, mindestens folgende Grundfunktionen
unterstützt: die Generierung und Akquisition, Speicherung, Suche und Nutzung
von Wissen, sowie seine Verteilung und Aktualisierung. 27“
In [Lehner et al. 1998], eine Studie über die Anwendung von modernen Datenbank- und
Netzwerktechnologien bei der Erstellung von Systemen für Organisationales Gedächtnis, bei
der die Autoren von [Maier et al. 2000a] auch als Mitverfasser erscheinen, wird eine aus
technischer Sicht etwas erweiterte Definition für diese Systeme wie folgt angegeben:
„Ein System für Organisationales Gedächtnis ist ein System, (a) welches Teile
der organisationalen Wissensbasis unter der Mithilfe von Informations- und
Kommunikationstechnologien umsetzt, und/oder (b) Aufgaben, Funktionen und
27
„An organizational memory system (OMS) is a computer-based system that, with the help of software,
supports at least the following basic functions: the generation and acquisition, storage, search for and
utilization of knowledge, as well as its distribution and updating.“ [Maier et al. 2000]
Kapitel 4 - DATENMANAGEMENT
Seite 49
Prozeduren, die mit der Nutzung der organisationalen Wissensbasis verbunden
sind, umsetzt und unterstützt. [Lehner et al. 1998]28.“
Die in [Krcmar 2000] identifizierten Herausforderungen im Bereich der Datentechnik (als Teil
des Datenmanagements) lassen auch Gemeinsamkeiten mit den Zielsetzungen für eine
technische Umsetzung von einem Datenbanksystem und von einem Unternehmensgedächtnis
erkennen: Sicherheit, zugrunde liegende Architektur, Fragmentierung, Verteilung und
Lokalisierung.
Unter alleiniger Berücksichtigung technischer Aspekte könnte man manchmal in den
Definitionen für ’Systeme für Unternehmensgedächtnis’ die Begriffe Wissensbasis und Wissen
mit Datenbank und Daten vertauschen, und bekäme eine in der Regel gültige Definition für
’Datenbanksysteme’. Dieser starke und direkte Zusammenhang sollte bei der Planung eines
Informationssystems für große Unternehmen nicht unbeachtet bleiben, da beide Bereiche
interessante Lösungen anbieten können.
Eines der kritischsten Aspekte im Bereich des Datenmanagements für transnationale Konzerne
bzw. während der Entwicklungs- und Implementierungsphase einer verteilten Systemlösung
stellt die Verwaltung von replizierten Daten dar. Nicht nur die dahinter stehenden technischen
Mechanismen (z.B. Synchronisation, Aktualisierung, usw.), sondern insbesondere die
Entscheidungskriterien für das Ergreifen von Replikationsmaßnahmen stellen eine große
Herausforderung bei der Konzeption des Informationssystems für geographisch verteilte
Unternehmen dar. Das folgende Kapitel befaßt sich mit den Grundlagen und dem Hintergrund
dieser Thematik.
4.2 Datenreplikation
Wissen wird nicht nur von der Zentrale eines Konzerns zu den Tochterfirmen und zu den
Geschäftspartnern transferiert. Wissen entsteht überall im Unternehmen, ist also
grenzüberschreitend, sowohl innerhalb der Konzernstruktur als auch für außenstehende
Benutzer. Die technologische Plattform für das Wissensmanagement muß also in der Lage sein,
das gesamte intellektuelle Kapital so durch das Unternehmen zu schleusen, dass alle Benutzer
einen möglichst schnellen Zugriff auf die aktuellste Version eines Geschäftsprozesses, einer
Projektphase, einer Diskussion oder eines Dokuments haben. Dies erfordert manchmal
Mechanismen, die neues und aktualisiertes Material gleichzeitig in verschiedene Richtungen
verteilen, und nicht nur von einer zentralen Quelle zu den Empfängern [Lotus 1999].
Der Zweck der Kommunikation, und infolgedessen auch des Datentransfers, ist die
Übermittlung und damit die Reproduktion von Wissenseinheiten. Die Reproduzierbarkeit bzw.
Replizierbarkeit von Objekten ermöglicht erst eine sinnvolle Kommunikation [NetAcademy
1999].
4.2.1 Allgemeines
Unter Replikation, im informationstechnischen Sinne, versteht man im allgemeinen die
Vervielfältigung eines Objektes auf mehrere Rechner. Diese in einem verteilten System
28
„An Organisational Memory System (OMS) is a system, (a) which realises parts of the organizational
knowledge base with the help of information and communications technologies and/or (b) realises and
supports tasks, functions and procedures that are connected to the use of the organizational knowledge
base [Lehner et al. 1998].”
Kapitel 4 - DATENMANAGEMENT
Seite 50
mehrfach vorhandenen Objekte sollten im Idealfall überall und immer identisch sein. Die Praxis
zeigt aber, dass die erfolgreiche Umsetzung dieser Maßnahme - welche üblicherweise aus
Performanzgründen ergriffen wird – sehr komplex und problematisch werden kann.
Im Bezug auf Datenmanagement bzw. Datenbanksysteme kann Replikation als Prozess der
Vervielfältigung von Objekten in den Datenbanken eines verteilten Datenbanksystems und der
synchronisierte Wartung solcher Kopien aufgefaßt werden [Seidlitz 2001].
Lokal unternommene Modifikationen werden aufgezeichnet und an jedem Replikat
nachgezogen. Die Replikationsobjekte haben somit im zeitlichen Mittel an allen Systemknoten
die gleiche Ausprägung [Seidlitz 2001].
4.2.2 Replizierende Datenbanken
Der Unterschied zwischen einer verteilten und einer replizierenden Datenbank besteht darin,
dass bei einer verteilten Datenbank die Information auf mehrere Systemknoten aufgeteilt ist und
bei replizierenden Datenbanken dieselbe Information an allen Knoten verfügbar ist [Seidlitz
2001].
Replikationsobjekte sind Datenbankobjekte, welche auf mehreren Servern eines verteilten
Informationssystems existieren und durch eine Replikationsumgebung aktualisiert werden.
Bei relationalen verteilten Datenbanksystemen - wie zum Beispiel Oracle - läßt sich praktisch
jede speicherbare Komponente (Tabellen, Indexes, Views, Prozeduren, Funktionen, Synonyme,
Sequenzen, usw.) replizieren [Oracle8i 1999].
Diese Replikationsobjekte können in logisch zusammenhängende Gruppen gesammelt werden,
wodurch sich größere Komponenten auf einmal replizieren lassen. Auch komplette Knoten
eines relationalen verteilten Datenbanksystems, in Oracle ’sites’ genannt, lassen sich
vervielfältigen [Oracle8i 1999].
Es gibt Informationssysteme, wie zum Beispiel der Hyperwave Information Server, welche die
darunter liegende Datenbankbestände entweder zur Gänze oder partiell (Container oder einzelne
Objekte jeder Art) über eine verteilte Architektur replizieren können [Hyperwave 2001a].
Der Hyperwave Information Server lässt zwei Richtungen der Replikation zu: einerseits können
Datenbankobjekte vom lokalen Server heraus auf mehreren Servern hin repliziert werden, und
andererseits kann man diverse Datenbankbestände
aus dem ’Serverpool’ (das
zusammenhängende verteilte Datenbanksystem) auf dem lokalen Server replizieren [Hyperwave
2001a].
Die Technik hinter einem Replikationsmechanismus in einem verteilten Informationssystem ist
komplex und vielfältig. Einige Methoden, Entscheidungskriterien, die wichtigsten Vorteile,
sowie mögliche Konflikte bei Replikationssystemen werden im nächsten Abschnitt beschrieben.
4.2.3 Allgemeine Kriterien für Datenreplikation
Verfügbarkeit, Performanz und Netzwerkverkehr zählen, wie in [Seidlitz 2001] erörtert, zu den
wichtigsten Gründen für das Ergreifen von Replikationsmaßnahmen.
Kapitel 4 - DATENMANAGEMENT
Seite 51
Replikationsmechanismen
erhöhen
die
Verfügbarkeit
von
Datenbeständen
für
Systemanwendungen, da sie ihnen mehrere identische Objektquellen zur Verfügung stellen.
Beim Einsatz von replizierenden Datenbanken kann eine Applikation nach dem Ausfall eines
Systemknotens sofort an einem anderen Replikat weiterarbeiten. Dieser Sachverhalt wird in
[Abb. 4.1] dargestellt.
Die an dem alternativen Knoten durchgeführte Modifikationen können zu einem später
Zeitpunkt auf den ausgefallenen (ursprünglichen) Knoten übertragen werden. Die Fehlertoleranz
gegenüber Kommunikationsfehlern bzw. Serverfehlern wird somit auch verbessert.
Replikat
Benutzer (client)
!
Knoten 1
Knoten 3
!
Knoten 4
X
Objekt
Knoten 2
Abbildung 4.1: Lokalisierung von Replikaten nach dem Ausfall eines Systemknotens
Die Performanz eines verteilten Systems kann durch Replikation erhöht werden, weil die
Berechnungslast auf mehrere Knoten verteilt wird. Somit muß nicht ein einzelner Großrechner
alle Abfragen bearbeiten. Die Folge davon ist eine Performanzsteigerung des gesamten
Systems, da die Replikate einen schnellen ’lokalen’ Datenzugriff erlauben. Weiters können
Benutzer an lokalen Knoten ’offline’ arbeiten. Die modifizierten Objekte lassen sich später, bei
wiederhergestellter Verbindung, durch das Replikationssystem synchronisieren [Seidlitz 2001].
Im verteilten Datenbanksystem eines transnationalen Konzerns können Applikationen mit Hilfe
des Replikationssystems die für den Benutzer ’günstigsten’ Replikate (i.d.R. die vom
nächstliegenden Server) auswählen, wodurch der Netzwerkverkehr und die Antwortzeiten
minimiert bzw. optimiert werden können.
Die parallele Abarbeitung mehrerer Client-Anforderungen kann dadurch auch optimiert werden.
Dieser Sachverhalt wird in [Abb. 4.2] graphisch dargestellt.
Knoten 1
Objekt
Replikat
Benutzer (client)
!
Knoten 2
X
Knoten 3
X
Abbildung 4.2: Der ’günstigste’ Weg durch Replikation
Eines der im Kapitel 3 ’Informationsmanagement’ besprochenen Schlüsselkonzept für verteilten
Systeme, die Ortstransparenz, kann durch Replikation effizient und effektiv gewährleistet
werden, da die Benutzer den Eindruck einer Interaktion mit einem naheliegenden Originalobjekt
bekommen. In [Abb. 4.3] wird dieser Sachverhalt graphisch dargestellt: der Benutzer am
Knoten 1 fordert das Objekt ’A’ vom System an und merkt nicht, dass er ein Replikat ’A3’
zurückgeliefert bekommt.
Kapitel 4 - DATENMANAGEMENT
Seite 52
System
Replikat ”A1”
Knoten 2
Benutzer (client)
Knoten 1
“A”
“A”
Replikat ”A2”
Knoten 3
Replikat “A3”
Knoten 4
.
.
.
Abbildung 4.3: Transparenz eines verteilten Systems durch Replikation
Replikationssysteme, die ein gleichzeitiges Modifizieren von unterschiedlichen Replikaten
erlauben, müssen sogenannte Replikationskonflikte oder Synchronisationskonflikte lösen.
Aktualisierungskonflikte entstehen, wenn am selben Objekt widersprüchliche Aktualisierungen
von verschiedenen Knoten durchgeführt werden. Eindeutigkeitskonflikte werden hervorgerufen,
wenn ein Replikationsvorgang eindeutige Nameskonventionen verletzt.
Schließlich können auch Löschungskonflikte entstehen, wenn zum Beispiel der Knoten 1 einen
Modifikationsvorgang auf ein Replikat des Knotens 2 starten will und noch nicht weiß, dass das
betroffene Replikat schon zuvor von einem anderen Knoten 3 gelöscht wurde [Seidlitz 2001].
Einen wichtigen Aspekt beim Verstehen des Replikationskonzepts stellen die unterschiedliche
Ansichten und Zielsetzungen dar, d.h. Replikationskriterien hängen auch davon ab, ob man die
Materie aus der Perspektive des technischen Datenmanagements (Datenbanken und
Datenbanksysteme) oder des Informationsmanagements (verteilte Informationssysteme)
analysiert.
4.2.4 Replikation in verteilten Datenbanken und verteilten Systemen
Replikation ist ein interessanter Forschungs- und Entwicklungsbereich sowohl für die
Gemeinschaft der Datenbankspezialisten als auch für die Kenner verteilter Systemen.
Um die unterschiedlichen Lösungsmethoden bzw. –mechanismen der Replikation zu verstehen,
entwickelten [Wiesmann et al. 2000] einen abstrakten und ’neutralen’ Arbeitsrahmen für die
Analyse verschiedener Techniken in Form einer sehr interessanten und detaillierten Studie aus
einer funktionalen Perspektive. Falls nicht besonders hervorgehoben, basieren alle in diesem
Abschnitt gezeigten Methoden bzw. gewonnenen Erkenntnisse auf dem Inhalt der zuvor
erwähnten Studie.
In der Regel wird Replikation in vielen Disziplinen eingesetzt wo Vervielfältigungsvorteile zu
erwarten sind. Im Bereich der verteilten Systeme werden Replikationsmaßnahmen zum Zwecke
einer optimierten Fehlertoleranz ergriffen. Bei Datenbanksystemen dienen sie hauptsächlich
einer verbesserten Systemperformanz. In beiden Disziplinen ist Replikation zwar begrifflich
Kapitel 4 - DATENMANAGEMENT
Seite 53
und konzeptionell identisch, mehrere grundsätzliche Unterschiede sind aber in der Praxis
aufgrund der involvierten Funktionsfeinheiten klar zu erkennen.
Das Modell
Für ein besseres Verständnis der unterschiedlichen Techniken wurde in [Wiesmann et al. 2000]
ein ’abstraktes’ funktionales Modell erarbeitet, welches in fünf generische Phasen unterteilt ist.
Diese Phasen stellen wichtige Stufen bzw. Schritte innerhalb eines Protokolls dar und dienen
gleichzeitig einer Charakterisierung für die verschiedenen Replikationstechniken.
Manche Techniken überspringen einzelne Phasen, ordnen sie anders um, iterieren über manche
davon, oder führen sie zu simpleren Phasen zusammen. Somit kann man die unterschiedlichen
Techniken aus der Sicht der funktionellen Implementiereung gut miteinander vergleichen.
Die in [Abb. 4.4] dargestellten Phasen dieses Protokollmodells lassen sich wie folgt erklären.
1) Request29: ein Client verschickt eine Operation an ein (oder mehrere) Replikat(e).
2) Serverkoordination (SC... engl. ’server coordination’): die Replikationsserver
koordinieren untereinander die Synchronisation einer Operation.
3) Ausführung (EX... engl. ’execution’): die Operation wird auf den Replikationsservern
ausgeführt.
4) Übereinstimmungskoordination (AC... engl. ’agreement coordination’): die
Replikationsserver einigen sich über das Resultat der Ausführung.
5) Ende oder Antwort (END... engl. ’end’ oder ’response’): das Ergebnis der Operation
wird an den Client zurück gesendet.
Phase 1 (RE)
Client
request
Phase 2 (SC)
Serverkoordination
Phase 3 (EX)
Ausführung
Phase 5 (END)
Antwort
Benutzer
Benutzer
Replikat 1
Phase 4 (AC)
Einigungskoordination
Aktualisiere
Replikat 2
Replikat 3
Aktualisiere
Abbildung 4.4: Funktionales Model eines abstrakten Protokolls [Wiesmann et al. 2000]
Replikation in verteilten Systemen
Ein verteiltes System wird als eine Menge von Diensten, welche von Serverprozessen
implementiert und von Clientprozessen aufgerufen werden, modelliert. Zum Zwecke einer
verbesserten Fehlertoleranz werden diese Dienste von mehreren (engl.: ’multiple’)
Serverprozessen oder Replikaten implementiert. In diesem Kontext unterscheidet man zwischen
aktiver, passiver, semi-aktiver und semi-passiver Replikation. Aktive Replikation – auch State
Machine Approach genannt - stellt eine nicht-zentralisierte Replikationstechnik dar. Das
Schlüsselkonzept bei dieser Methode besteht darin, dass alle Replikate die gleiche Reihenfolge
von Client-Requests empfangen und verarbeiten. Die Datenkonsistenz wird hier durch
deterministische Prozesse gesichert, denn es wird angenommen, dass alle Replikate dasselbe
Resultat liefern, wenn sie mit gleichen Eingaben versorgt werden.
29
Aufgrund des weitverbreiteten Bekanntheitsgrades vom Begriff ’Request’ wird in der vorliegenden
Arbeit auf die deutschsprachige Übersetzung verzichtet.
Kapitel 4 - DATENMANAGEMENT
Seite 54
Gemäß dem oben geschilderten funktionalen Modell, läßt sich ein Aktualisierungs-Request bei
Aktiver Replikation wie folgt erklären (die graphische Darstellung hierfür wird in [Abb. 4.5]
gezeigt):
1)
2)
3)
4)
5)
der Client sendet ein Request an alle Server mit Hilfe von Atomic Broadcast 30
die Serverkoordination wird durch die Totale Ordnung gesichert
alle Replikate führen die Operationen in der richtigen Reihenfolge aus
keine Koordination notwendig, da Totale Ordnung und Determinismus gegeben sind
alle Replikate senden dem Client ihre Resultate (dieser wartet in der Regel nur auf das
Erstankommende und ignoriert die anderen)
Phase 1 (RE)
Client
request
Benutzer
Phase 2 (SC)
Serverkoordination
Phase 3 (EX)
Ausführung
Phase 4 (AC)
Einigungskoordination
Phase 5 (END)
Antwort
Atomic
Broadcast
Benutzer
Replikat 1
Aktualisiere
Replikat 2
Aktualisiere
Replikat 3
Aktualisiere
Abbildung 4.5: Aktive Replikation [Wiesmann et al. 2000]
Bei Passiver Replikation oder Primary Backup wird die Client-Request an ein Primärobjekt
gesendet, welches die Operation ausführt und eine Aktualisierungsnachricht an alle anderen
Replikate sendet. Die fünf Phasen des Modells sind in [Abb. 4.6] dargestellt und lassen sich wie
folgt erklären:
1)
2)
3)
4)
das Request wird zum Primärobjekt übertragen
es findet keine Anfangskoordination statt
das Primärobjekt führt die Operation aus
das Primärobjekt koordiniert mit den Replikaten (bei dieser Technik oft ’Backups’
genannt) die Aktualisierungsergebnisse
5) das Primärobjekt sendet dem Client das Resultat
Phase 1 (RE)
Client
request
Phase 2 (SC)
Serverkoordination
Phase 3 (EX)
Ausführung
Phase 5 (END)
Antwort
VS
Broadcast
Benutzer
Replikat 1
Phase 4 (AC)
Einigungskoordination
Benutzer
Aktualisiere
Replikat 2
Anw.
Replikat 3
Anw.
Abbildung 4.6: Passive Replikation [Wiesmann et al. 2000]
Semi-aktive Replikation ist eine Zwischenlösung beider zuvor besprochenen Techniken, bei der
keine deterministische Ausführung der Operationen angefordert wird. Der Hauptunterschied
zwischen Aktiver und Semi-aktiver Replikation besteht darin, dass bei letzterer Technik, falls
30
Durch Atomic Broadcast werden Atomisierung (engl.: ’atomicity’) und Totale Ordnung (engl.: ’total
order’) unterstützt, d.h. alle Server erhalten dieselbe Nachrichten und alle Server liefern die gleichen
Ergebnisse, und zwar immer in der gleichen Reihenfolge. [Mullender 1989][Wiesmann et al. 2000]
Kapitel 4 - DATENMANAGEMENT
Seite 55
Replikate eine nicht-deterministische Entscheidung treffen sollten, ein Prozeß namens ’Führer’
(engl.: ’leader’) die gültige Auswahl bestimmt und sie an die ’Nachfolger’ (engl.: ’followers’)
verschickt. Die Phasen 3 (EX) und 4 (AC) werden somit für jede nicht-deterministische
Entscheidung wiederholt.
Die Phasen, wie in [Abb. 4.7] graphisch dargestellt, erklären sich wie folgt:
1)
2)
3)
4)
der Client sendet eine Atomic-Broadcast-Request
die Serverkoordination findet hinsichtlich Totaler Ordnung statt
alle Replikate führen die Operationen in der richtigen Reihenfolge aus
im Fall einer nicht-deterministischen Entscheidung informiert der Führer seine
Nachfolger via View Synchronous Broadcast (VS Broadcast) 31
5) das Resultat wird dem Client gesendet
Phase 1 (RE)
Client
request
Phase 2 (SC)
Serverkoordination
Phase 3 (EX)
Ausführung
Atomic
Broadcast
Benutzer
Phase 4 (AC)
Einigungskoordination
Phase 5 (END)
Antwort
VS
Broadcast
Replikat 1
‘Führer’
Aktualisiere
Replikat 2
Aktualisiere
Anw.
Replikat 3
Aktualisiere
Anw.
Benutzer
Abbildung 4.7: Semi-aktive Replikation [Wiesmann et al. 2000]
Bei der Semi-passiven Replikation, welche eine Variante der Passiven Replikation ohne
Ansichten (’views’) darstellt, werden die Phasen 2 (SC) und 4 (AC) zu einem einzigen
Koordinationsprotokoll zusammengefügt. Im Bereich der verteilten Systeme ist die somit
entstandene Phase unter dem Namen Consensus with Deferred Initial Values bekannt. Da im
Kontext der Datenbanken keine äquivalente Technik auffindbar ist, wird die Semi-aktive
Replikation hier nicht näher erläutert.
Unter Berücksichtigung der Parameter ’Ausfallstransparenz für Clients’ und
’Serverdeterminismus’ lassen sich die vier oben beschriebenen Replikationstechniken für
verteilte Systeme, wie in [Abb. 4.8] dargestellt, gruppieren.
Serverdeterminismus
gefordert
Serverausfall
nicht transparent
für Client
Serverausfall
transparent
für Client
Serverdeterminismus
nicht gefordert
Passiv
Aktiv
Semi-aktiv
Semi-passiv
Abbildung 4.8: Replikation in Verteilten Systemen [Wiesmann et al. 2000]
31
Das Verschicken einer Nachricht mit VS Broadcast von einem Gruppenmitglied zu seiner Gruppe,
welche sich unter der gleichen ’Ansicht’ (engl.: ’view’ = die Beschaffenheit einer Gruppe zu einem
gegebenen Zeitpunkt) befinden muß, garantiert folgendes: falls ein Prozeß als Erster eine Nachricht vor
dem Installieren einer neuen Ansicht liefert, dann installiert kein anderer Prozeß die neue Ansicht, bis
alle Gruppenmitglieder dieselbe Nachricht geliefert haben.
Kapitel 4 - DATENMANAGEMENT
Seite 56
Replikation in Datenbanksystemen
Replikation in Datenbanken kommt hauptsächlich zum Zweck der Performanzsteigerung zum
Einsatz. Das Ziel ist einen lokalen Datenzugriff zu ermöglichen, um die Antwortzeiten zu
minimieren und den Netzwerkverkehr zwischen den Systemknoten zu entlasten. Für die
Datenkonsistenz bei Lese- und Schreibvorgängen kann nur ein Replikationsprotokoll
garantieren. Das Problem der Fehlertoleranz kann mit Backupmechanismen gelöst werden. Die
Lösung bleibt damit transparent für den Benutzer und spielt deshalb keine Hauptrolle in diesem
Kontext.
In [Wiesmann et al. 2000] wird die von Gray et al.32 entwickelte Kategorisierung für
Replikationstechniken in Datenbanken übernommen. Mit Hilfe der Parameter
Aktualisierungsfortpflanzung und -standort (engl.: ’update propagation and location’) kann man
folgende Kategorien, wie in [Abb. 4.9] dargestellt, feststellen:
eifrige Replikation (engl.: ’eager replication’)
träge Replikation (engl.: ’lazy replication’)
Primärkopie-Replikation (engl.: ’primary-copy-replication’)
Aktualisiere-Überall-Replikation (engl.: ’update-everywhere replication’)
Update locatiion
(Aktualisierungsstandort)
a)
b)
c)
d)
Eager
Primary Copy
(Eifrig
Primärkopie)
Lazy
Primary Copy
(Träge
Primärkopie)
Eager
Update Everywhere
(Eifrig
Aktualisiere-Überall)
Lazy
Update Everywhere
(Träge
Aktualisiere-Überall)
Update propagation
(Aktualisierungsfortpflanzung)
Abbildung 4.9: Replikation in Datenbanken [Wiesmann et al. 2000]
In eifrigen Replikationssystemen pflanzt sich die Aktualisierung innerhalb der
Transaktionsgrenzen fort, d.h. der Benutzer empfängt keine Bestätigungsmeldung bis genügend
viele Replikate im System aktualisiert wurden.
Träge Systeme aktualisieren sofort die lokale Kopie, bestätigen die Operation und verbreiten
erst zu einem späteren Zeitpunkt die Aktualisierung weiter. Bezüglich des
Aktualisierungsstandorts erfordert die Primärkopie-Replikation die Ausführung aller
Aktualisierungen auf einem Primärreplikat (engl.: ’primary or master copy’) und dann erst auf
die restlichen Systemreplikaten. Die Aktualisiere-Überall-Replikation (engl.: ’updateeverywhere replication’) erlaubt eine quasi-synchrone Aktualisierung auf jedes Replikat des
Systems.
Bei der eager primary copy (’eifrige Primärkopie’) Replikation wird die Operation auf dem
Primärobjekt ausgeführt und dann die Aktualisierung auf weitere Replikate weiter verbreitet.
Sobald diese Primärkopie die Bestätigung aller Replikate empfängt, wird dem Benutzer das
Resultat gesendet. In [Abb. 4.10] wird dieses Verhalten dargelegt. Die Phase 2
(Serverkoordination) verschwindet hier, da die Ausführung an einem einzigen Ort stattfindet.
32
N. Gray, P. Helland, D. Shasha und P. O’Neil. “The dangers of replication and a solution” - in
Proceedings of the 1996 ACM SIGMOD International Conference on Management of Data, pages 173–
82, Montreal, Canada. 1996.
Kapitel 4 - DATENMANAGEMENT
Seite 57
Phase 2 (SC)
Serverkoordination
Phase 3 (EX)
Ausführung
Phase 4 (AC)
Einigungskoordination
Benutzer
Replikat 1
Aktualisiere
Replikat 2
Anw.
Replikat 3
Anw.
Zwei-Phasen
Bestätigung
Phase 1 (RE)
Client
request
Phase 5 (END)
Antwort
Benutzer
Abbildung 4.10: Eager primary copy Replikation [Wiesmann et al. 2000]
Die eager update everywhere (’eifrige aktualisiere-überall’) Replikation wird in zwei
unterschiedlichen Methoden unterteilt. Diese Unterteilung ergibt sich aus der Tatsache, dass
man entweder eine verteilte Sperre (engl.: ’distributed locking’) oder ein Atomic Broadcast für
die Verbreitung der Aktualisierung implementieren kann.
Bei eager update everywhere (’eifrige aktualisiere-überall’) Replikation mit verteilter Sperre
kann auf ein Replikat nur dann zugegriffen werden, nachdem es für alle Systemknoten gesperrt
wurde. Dieses an alle gesendetes Sperr-Request entspricht also der Serverkoordinationsphase
des Modells, wie aus [Abb. 4.11] ersichtlich.
Phase 1 (RE)
Client
request
Phase 2 (SC)
Serverkoordination
Phase 3 (EX)
Ausführung
Phase 4 (AC)
Einigungskoordination
Phase 5 (END)
Antwort
Benutzer
Replikat 1
Aktualisiere
Replikat 2
Aktualisiere
Replikat 3
Aktualisiere
Zwei-Phasen
Bestätigung
Benutzer
Abbildung 4.11: Eager update everywhere Replikation mit verteilter Sperre [Wiesmann et al. 2000]
Das Phasenverhalten einer eager update everywhere (’eifrige aktualisiere-überall’) Replikation
mit Atomic Broadcast lässt sich, wie in [Abb. 4.12] präsentiert, folgendermaßen erklären: (1)
der Client sendet ein Request zum lokalen Server, (2) der lokale Server leitet das Request
mittels Atomic Broadcast weiter, (3) alle Server führen die Operationen aus (falls Konflikte
entstehen, werden die Operationen gemäß Totaler Ordnung ausgeführt), (4) keine Koordination
in Phase AC notwendig, und (5) alle Server senden eine Antwort zum Client.
Phase 1 (RE)
Client
request
Benutzer
Phase 2 (SC)
Serverkoordination
Phase 3 (EX)
Ausführung
Atomic
Broadcast
Phase 4 (AC)
Einigungskoordination
Phase 5 (END)
Antwort
Benutzer
Replikat 1
Aktualisiere
Replikat 2
Aktualisiere
Replikat 3
Aktualisiere
Abbildung 4.12: Eager update everywhere Replikation mit Atomic Broadcast [Wiesmann et al. 2000]
Kapitel 4 - DATENMANAGEMENT
Seite 58
Das Hauptmerkmal der ’trägen Primärkopie-Replikation’ 33 liegt darin, dass alle Clients den
gleichen Server kontaktieren müssen, um alle Aktualisierungsvorgänge bekanntzugeben. Somit
wird das Zustandekommen eines Synchronisation-Overheads vermieden.
Wichtig ist aber, wie aus [Abb. 4.13] ersichtlich, die Berücksichtigung der Phase 5 (AC), in der
die Konsistenz der Datenbestände koordiniert werden sollte. Hier entfällt diese Überprüfung, da
alle Operationen schon auf dem Primärobjekt stattgefunden haben, und somit bloß das
Aktualisierungsresultat auf die Replikate angewendet wird.
Phase 1 (RE)
Client
request
Phase 2 (SC)
Serverkoordination
Phase 3 (EX)
Ausführung
Phase 4 (END)
Antwort
Benutzer
Phase 5 (AC)
Einigungskoordination
Benutzer
Aktualisiere
Replikat 1
Replikat 2
Anw.
Replikat 3
Anw.
Abbildung 4.13: Lazy primary copy Replikation [Wiesmann et al. 2000]
Die fünfte Replikationstechnik im Bereich der Datenbanksysteme, die ’träge AktualisiereÜberall Replikation’ 34, unterscheidet sich von der zuvor beschriebenen Technik darin, dass ein
Abstimmungsmechanismus35 in der fünften Phase (Übereinstimmungskoordination) notwendig
ist, um zu entscheiden, ob Transaktionen rückgängig gemacht werden müssen, falls Konflikte
zwischen den Systemknoten stattgefunden haben. Solche Abstimmungen scheitern meistens
daran, dass sie für die Ausführung einzelner Operationen auf einzelnen Objekten implementiert
werden, und deshalb nicht mehrere Transaktionen auf unterschiedliche Objekte konsistent
bewältigen können. In [Abb. 4.14] wird das Modell dieser Methode graphisch präsentiert.
Phase 2 (SC)
Serverkoordination
Phase 3 (EX)
Ausführung
Phase 4 (END)
Antwort
Benutzer
Replikat 1
Phase 5 (AC)
Einigungskoordination
Benutzer
Aktualisiere
Replikat 2
Anw.
Replikat 3
Anw.
Abstimmung
Phase 1 (RE)
Client
request
Abbildung 4.14: Lazy update everywhere Replikation [Wiesmann et al. 2000]
Analyse und Synthese der unterschiedlichen Mechanismen
Aus den in diesem Abschnitt beschriebenen Replikationstechniken, welche starke
Datenkonsistenz gewährleisten können, lassen sich die in [Abb. 4.15] dargestellten
Kombinationsmöglichkeiten der Modellphasen identifizieren. Jede Technik, die starke
Konsistenz sichern soll, enthält mindestens einen Synchronisationsschritt (SC- und/oder eine
AC-Phase) vor dem END-Schritt. Falls die Ausführungsphase (EX) deterministisch ist, entfällt
eine Synchronisation nach der EX-Phase.
33
‘lazy primary copy replication’
’lazy-update-everywhere-Replikation’
35
’reconciliation’
34
Kapitel 4 - DATENMANAGEMENT
Seite 59
RE
SC
RE
RE
SC
EX
AC
END
EX
AC
END
EX
END
Abbildung 4.15: Phasenkombinationen für starke Datenkonsistenz [Wiesmann et al. 2000]
Eine Zusammenfassung aller geschilderten Techniken wird in [Abb. 4.16] präsentiert. Mehrere
Schlußfolgerungen lassen sich aus dieser Graphik ziehen. Primary-copy-Replikation und
Passive Replikation besitzen keine Serverkoordinationsphase (SC). Da ein Primärobjekt die
Operation vollständig und unabhängig ausführt, braucht man keine Koordination zwischen den
Replikaten vor der Ausführungsphase. Der Unterschied zwischen Eager- und LazyReplikationssysteme liegt in der Reihenfolge der AC und END Phasen. Die AC-Phase kommt
in der Eager-Technik vor dem END-Schritt, in der Lazy-Technik umgekehrt. Viele
Ähnlichkeiten können in den Replikationsalgorithmen bei Datenbanken und verteilten Systemen
(trotz unterschiedlicher Modellierungen, Einschränkungen und Terminologien) identifiziert
werden. All diese funktionalen Ähnlichkeiten erbringen somit den Beweis für die
Notwendigkeit einer sinnvollen Kooperation zwischen beiden Disziplinen. So könnten
replizierende Datenbanken von den Abstraktionen der Techniken in verteilten Systemen einen
großen Nutzen ziehen. Dies erklärt also die Wichtigkeit der Behandlung des Themas für diese
Arbeit aus den unterschiedlicheren Sichtweisen: aus der Perspektive des Bereichs
’Datenbanksysteme’ und des Bereichs ’Informationssysteme’. Je nachdem wo die
Schwerpunkte bei der Konzeption des Systems liegen, lassen sich unterschiedliche
Lösungsansätze optimal erkennen und effizient anwenden.
Modell
RE
EX
END
Passiv
RE
Semi-aktiv
RE
Eager Primary-copy
RE
Eager Aktualisiere-Überall
mit verteilter Sperre
RE
Eager Aktualisiere-Überall
mit Atomic Broadcast
RE
Zertifizierungsbasiert
RE
EX
AC
END
Lazy Primary-copy
RE
EX
END
AC
Lazy Aktualisiere-Überall
RE
EX
END
AC
EX
AC
END
EX
AC
END
EX
AC
END
SC
EX
AC
END
SC
EX
SC
END
Schwache
Konsistenz
SC
Starke
Konsistenz
Aktiv
Abbildung 4.16: Synthetische Ansicht der Replikationstechniken für Datenbanken und Verteilte Systeme
[Wiesmann et al. 2000]
4.2.5 Andere Modelle und Lösungsansätze
Die Nomenklatur der Replikationstechniken ändert sich natürlich von einer Softwarefirma zur
anderen. Die von [Oracle8i 1999] unterstützten Replikationsarten lassen sich wie folgt erörtern.
Kapitel 4 - DATENMANAGEMENT
Seite 60
Die Multimaster Replikation (auch als Peer to Peer oder n-Way Replikation bekannt) erlaubt
mehreren gleichberechtigten Systemknoten Gruppen von Replikaten zu verwalten. Jeder Knoten
in einer solchen Umgebung ist ein Master-Knoten (analog zum Primär-KopieReplikationssystem). Diese Oracle-Replikationstechnik verwendet entweder synchrone oder
asynchrone Mechanismen für den Datenaustausch. Ein Snapshot innerhalb einer Oracle
Snapshop-Replikation beinhaltet eine komplette oder teilweise Kopie der Daten der
Mastertabelle zu einem gewissen Zeitpunkt (analog zur Theorie der Ansichten bei Semi-aktiver
Replikation). Eine gemischte oder kombinierte Form dieser Techniken kann in Oracle
Systemen auch zum Einsatz kommen. Das verteilte System mit einer solchen hybriden
Replikation besitzt dann eine beliebige Anzahl von Master- und mehrere Snapshot- Knoten für
jeden Master.
Bei der in [Crespo et al. 1998] beschriebenen Architektur für Digitale Bibliotheken, welche auf
einer geschichteten Systemstruktur basiert, wird die gesamte Funktionalität der
Replikationsmechanismen einer spezialisierten Zuverlässigkeitsschichte (engl.: ’reliability
layer’) überlassen. Diese Schichte befindet sich auf jedem Systemknoten, empfängt jede Art von
Modifikations- oder Aktualisierungs-Requests, und trägt die alleinige Verantwortung für die
Verwaltung von Replikaten. Diese zellenförmige Schichtstruktur stellt eine Art ’filterorientierte’
Replikationstechnik dar.
Viele verteilte Datenbanken wenden epidemische Replikationsmechanismen, um replizierte
Daten zu verwalten, an. Hierbei werden Benutzeroperationen auf ein einziges Replikat
ausgeführt. Asynchron findet dann eine separate Aktivität statt, die periodisch paarweise
Vergleiche der Kopien (welche Information über Versionen oder Timestamps enthalten)
unternimmt, um obsolete Replikate zu verwerfen oder zu aktualisieren. Das durch diese
Vergleiche entstandene Overhead wächst somit linear mit der Anzahl der Daten im System,
welches wiederum die Skalierbarkeit des Systems beeinträchtigt [Rabinovich et al. 1996].
Die Problematik der verteilten Datenspeicherung kann auch aus zwei unterschiedlichen
menschenbezogenen Perspektiven betrachtet werden. Replikationstechniken stellen laut [Theel
et al. 1999] eine Lösung aus der Sicht des ’Datenversorgers’ (eng.: ’data provider’) dar. Aus der
Sicht der Systembenutzer lassen sich andere Lösungen identifizieren, wie zum Beispiel
Datenmigration, Serverspiegelung oder die verteilte Pufferung (engl.: ’distibuted caching’).
Von diesen Möglichkeiten kann das Distributed Caching eine effiziente Transparenz und gute
Performanz, insbesondere bezüglich Bandbreite und Antwortzeiten, anbieten.
Eine durchdachte Lösung, mit Hilfe der in diesem Abschnitt beschriebenen Techniken, kann
eine effiziente, effektive und nachhaltige Wirkung auf die Architektur von
Informationssystemen (insbesondere für große und geographisch verteilte Unternehmen) haben,
und deren Funktionalität und Performanz steigern. Die erhöhte Komplexität der technischen
Implementierung soll dabei nicht unterschätzt werden, weshalb gute Kenntnisse in den
Bereichen Datenbanken und verteilte Systeme sehr nützlich sind.
4.3 Schlußbemerkung
In diesem Kapitel wurde eine Übersicht in die Problematik der verteilten Datenspeicherung
gegeben. Insbesondere für die verteilte Struktur eines transnationalen Konzerns wurden
Antworten auf die Schlüsselfrage Wann wird was und wie repliziert? im Bereich der
Datenreplikation gefunden.
Durch die Implementierung einer verteilten Lösung werden große Vorteile im Zusammenhang
mit Kosten, Verwaltung und Performanz erwirkt. Die optimale Konfiguration eines Rechners ist
Kapitel 4 - DATENMANAGEMENT
Seite 61
abhängig von der Art der Arbeit, die er zu verrichten hat. Die Vorteile einer verteilten
Datenbankarchitektur mit Replikationsmechanismen können, unter Anwendung gut
durchdachter Strategien, die Performanz und Transparenz des gesamten Systems optimieren.
Wenn ein verteiltes System Probleme mit der Performanz zeigt, können die dafür
verantwortlichen Komponenten identifiziert und optimiert werden. Ein Ausfall an einem der
Knoten eines verteilten Datenbanksystems wirkt sich weit weniger dramatisch aus, als der
Ausfall des Hauptrechners einer zentralisierten Datenbank. Datenbanken könnten zum Beispiel
durch eine Replikationsumgebung und durch Anwendungen auf Ersatzhardware abgesichert
werden. Dies erhöht die Fehlertoleranz des Systems.
Unter Transparenz versteht man im Zusammenhang mit Datenbanksystemen - in Analogie zur
Disziplin der verteilten Systeme – die Eigenschaft, dass sich weder Applikationen noch
Benutzer darum kümmern müssen, wo die Informationen genau gespeichert sind oder wie die
Verteilung auf die einzelnen Systemknoten aussieht. Durch das Verbergen solcher Details wird
die Bedienbarkeit des Systems vereinfacht.
Die Autonomie von Systemknoten wird durch eine Verteilung gesichert, da die einzelnen
Komponenten des verteilten Datenbanksystems voneinander völlig unabhängig sind, wodurch
sie unabhängig voneinander konfiguriert, gewartet und verwaltet werden können. Mit Hilfe
einer sicheren Intranettechnologie ist es auch möglich, Daten gemeinsam zu nutzen, ohne
Passwörter oder Accounts veröffentlichen zu müssen. Weiters kann durch das Einführen von
Zugriffsrechten auf Datenbankobjekten entschieden werden, unter welchen Voraussetzungen
unterschiedliche Datenbestände von einem Systemknoten zugänglich gemacht werden sollen.
Weiters wurden in diesem Kapitel die Begriffe Datenbanksystem und Organisationsgedächtnis
dargestellt. Aus technologischer Sicht repräsentieren beide einen Aufbewahrungsort für Daten,
Information bzw. Wissen. Um diese Wissensbasis eines Unternehmens zu erfassen, muß man
nach wiederauffindbarem Wissen fragen. Kritische Aspekte im Kontext des Zugriffs auf
Wissenseinheiten stellen die Lokalisierung und die Art der Speicherung dar, insbesondere in
komplexen und weltweit verteilten Strukturen (wie zum Beispiel in transnationalen Konzernen).
Einige
der
wichtigsten
technologischen
Entscheidungskriterien,
Einflußfaktoren,
Lösungstechniken und Auswirkungen in Bezug auf Datenaufbewahrung, -wartung und –zugriff
wurden in diesem Kapitel präsentiert und analysiert.
Durch den Einfluß von modernen Lösungsansätzen und –theorien im Bereich der
Informationstechnologie,
das
Zusammenkommen
mehrerer
Managementdisziplinen
(insbesondere im informationstechnischen Bereich), die stetig wachsende und mutierende
Komplexität von Unternehmensstrukturen und die immer wachsende Bedeutung der Ressource
Wissen sind abstrakte und an Semantik reichere Techniken für die Organisation von
Wissenseinheiten in großen Unternehmen notwendig, welche eine nachhaltige und dynamische
Informationsaufbereitung erlauben.
Für die Wissensverwaltung und die Wiederauffindung von Informationen in transnationalen
Konzernen ist auch eine geeignete Themenhierarchie, die Verwendung von geeigneten
Zusatzinformationen (Metadaten) sowie der Zugang zu den Informationen über unterschiedliche
Sichtweisen unumgänglich. Diese Aspekte werden vom Bereich Wissensorganisation behandelt
und sind das Thema des nächsten Kapitels.
Kapitel 4 - DATENMANAGEMENT
Seite 62
Kapitel 5 - WISSENSORGANISATION
Seite 63
Kapitel 5
Wissensorganisation
„…who controls the vocabulary, controls the knowledge.“ 36
George Orwell
5.1 Allgemeines
Die Problematik bei der Erstellung von Strukturen für die Aufbereitung und Verwaltung von
Information in großen und geographisch verteilten Unternehmen ist analog zum Phänomen der
semantischen Organisation von Ressourcen (Informationsquellen) im Internet: eine
unorganisierte und unkontrollierte Zunahme von Daten innerhalb eines Informationssystems
erschwert den zielgerechten und anwendungsgerechten Zugang zum Wissen, weil die meisten
Speicher- bzw. Zugangsmechanismen nicht imstande sind, die Komplexität der Strukturen (z.B.
bzgl. Größe und Verteilungsgrad des Systems, Relevanzgrad von Daten aufgrund von
Replikationen, Mangel an Deskriptoren, u.a.) und den Erstellungszweck von Dokumenten und
deren Inhalten semantisch richtig zu interpretieren.
Deshalb sind global geltende Strukturen und Mechanismen notwendig, welche die Darstellung
einer abstrakten und dynamischen Beschreibungsebene ermöglichen. Hierfür sind
Zusatzinformationen, Strukturen und Systeme gefragt, welche die Auffindung, Navigation und
Klassifikation von Informationseinheiten erleichtern.
Interessante Lösungsansätze, Methoden und Strukturformen, die diesen Anforderungen
genügen, sind in unterschiedlichen Disziplinen zu finden: Bibliothekswissenschaft,
Wissensorganisation,
Dokumentenmanagement,
Information
Retrieval,
Archivierungswissenschaft,
Terminologiewissenschaft,
Ontology
Engineering,
Informationswissenschaft und andere. Dieses Kapitel untersucht die wichtigsten Aspekte im
Zusammenhang mit einer semantischen Informationsaufbereitung und die unterschiedlichen
Möglichkeiten des Zugangs zu semantisch organisiertem Wissen.
Im ersten Teil des Kapitels wird eine allgemeine Übersicht in unterschiedlichen Disziplinen –
Wissensorganisation, Document & Content Management, Information Retrieval, Ressource
Discovery, Library & Archival Science - und deren Bedeutung für die Informationsaufbereitung
und Wissensorganisation in großen und geographisch verteilten Unternehmen gegeben.
Der zweite Teil untersucht die Begriffe ’Semantik’, ’Zusatzinformation’, ’Ontologien’ und
’Inhaltserschließung’, wodurch der Grundstein geschaffen wird, um komplexe Strukturen und
Systeme zu analysieren, die in den darauf folgenden Abschnitten präsentiert werden:
’Organisationssysteme’ und ’Sichtweisen’. Das Kapitel wird mit der Analyse
mehrdimensionaler
Lösungsansätze
(Wissensvisualisierung
und
komplexe
Repräsentationskarten) abgeschlossen.
Der Schwerpunkt der vorliegenden Arbeit liegt sowohl in der algorithmischen Beschreibung
von Strukturen (aus programmiertechnischer Sicht) als auch in den formalen Anforderungen
(aus unternehmerischer Sicht) und Mechanismen (aus informationstechnischer Sicht) für die
Beschaffung einer effizient organisierten, nachhaltigen und unternehmensgerechten
36
„...wer das Vokabular kontrolliert, kontrolliert das Wissen. [George Orwell]“
Kapitel 5 - WISSENSORGANISATION
Seite 64
(zielgerechten) ’Informationsinfrastruktur’. Die hier beschriebenen und untersuchten Strukturen
ermöglichen eine strategische Kodifizierung und Personalisierung von Wissen im Unternehmen
und sollen den semantischen Zugang und die anwendergerechte Präsentation von Information
verbessern.
5.1.1 Wissensorganisation
Wissensorganisation befaßt sich damit, wie Wissenseinheiten (meist Begriffe und Objekte als
explizite Einheiten) für spezifische Aufgaben und Anwendergruppen thematisch organisiert
werden können, damit Wissensarbeiter ihre Ziele besser erledigen können. Damit ist aus
technischer Sicht die Optimierung semantischer Zugangsmodelle für Wissen gemeint.
Zweck der Wissensorganisation ist es, Wissen durch Organisation ’intellektuell’ zugänglich zu
machen, d.h. Zugang und Auffindung des intellektuellen Kapitals eines Unternehmens optimal
zu organisieren. Von unternehmerischer (und sozialer) Bedeutung ist, dass Wissensorganisation
dazu beitragen kann, den Wissensbestand so aufzubereiten und zur Verfügung zu stellen, dass er
für Menschen wieder übersehbar wird. [Sigel 2001]
Ein wichtiges Gebiet der Wissensorganisation wird durch die Behandlung von
Themenübersichten und Zugangsstrukturierungen sowie dem zum Wiederfinden dienenden
Mechanismen dargestellt. Konkrete Wissensorganisationsprodukte sind traditionell universale
und spezialisierte Klassifikationssysteme und Thesauri, die sich insbesondere für stark vernetzte
Informationssysteme eignen.
Sobald die Relevanz der Datenbestände und ihre Beziehungen untereinander explizit genug
spezifiziert wurde, spricht man von einer Ontologie. Solche Begriffs-Beziehungsgeflechte
gemeinsamen Verständnisses lassen sich auch erfolgreich visualisieren, zum Beispiel mit der
Hilfe von Topic Maps, Concept Maps, Knowledge Maps oder Mind Maps.
Experten im Bereich der Wissensorganisation setzen sich mit dem Organisieren von Wissen als
dreidimensionales Gebilde, bestehend aus Wissenselementen, Wissenseinheiten und
Wissenskomplexen, auseinander. [Sigel 2001]
Wissenseinheiten sind Begriffe und werden meist durch Zeichen oder Zeichenfolgen dargestellt.
Wissenselemente sind Begriffseigenschaften, also Merkmale oder Charakteristika zu einem
Konzept (Begriff), und kommen durch Aussagen über Beziehungen zustande. Wissenskomplexe
bzw. Wissensmodule sind Begriffsverknüpfungen in Aussage-Zusammenhängen, zum Beispiel
Definitionen oder Texte. [Sigel 2001]
[Sigel 2001] präsentiert eine von Dr. Ingetraut Dahlberg stammende Definition für
Wissensorganisation (engl.: ’Knowledge Organisation’, kurz ’KO’ genannt), welche die
genannten Dimensionen (Momente) enthält:
„... in der KO geht es also darum, diese drei Momente entsprechend ihren
Bezugsgegenständen der realen Welt und der menschlichen Geistesaktivitäten in
den Griff zu bekommen... / ...sie also begrifflich zu erfassen und entsprechend so
zu 'organisieren', also planvoll zu gruppieren, anzuordnen und verbal
darzustellen, dass der Betrachter Einsicht gewinnt, Zusammenhänge erkennen
und für sich und seine Umgebung daraus nützliche Folgerungen ziehen kann.“
[Sigel 2001a]
Kapitel 5 - WISSENSORGANISATION
Seite 65
Besonders wichtig für große Unternehmungen ist der Aufbau von Begriffssystemen, die eine
semantische Beschreibung des intellektuellen Kapitals erleichtern, und somit das (Wieder)Auffinden und den Zugang von unternehmensrelevanten Konzeptualisierungen verbessern.
Eine Möglichkeit hierfür stellt die Modellierung solcher Konzeptualisierungen als
Wissensstrukturen in Ontologien, d.h. in expliziten Spezifikationen von Konzepthierarchien.
Für die Darstellung solcher Modelle bedient sich die Wissensorganisation moderner
Beschreibungsstandards (normalisierte Metadaten als kontrolliertes Vokabular), welche den
Informationsressourcen zugeteilt werden.
Zusammenfassend lassen sich folgende Grundfragen für eine erfolgreiche
informationstechnisch erfassbare Wissensorganisation erkennen [Sigel 2001]:
•
Wie kann man wesentliches Wissen bzw. relevante Wissensstrukturen erkennen?
•
Wie kann man Wissen ziel- und anwendergerecht darstellen?
•
Wie kann man Wissen zweckmäßig auffindbar und navigierbar machen?
•
Wie kann man Wissen interoperabel machen und halten?
und
Die Arbeitsgruppe ’Knowledge Organization and Internet’ der Internationalen Gesellschaft für
Wissensorganisation (ISKO) geht von der These aus, dass sich Wissensstrukturen (oft)
vorteilhaft als ’Begriffs- bzw. Themennetze’ organisieren lassen, welche auf expliziten
Begriffssystemen beruhen [Sigel et al. 2000].
Aus der Sicht der Wissensorganisation besteht also die Notwendigkeit, sich mit den aktuellen
technologischen Entwicklungen vertraut zu machen, aber auch die eigene Kompetenz aktiv
einzubringen, um Doppelentwicklungen in anderen Gebieten zu vermeiden. Der Autor von
[Sigel 2000] ist davon überzeugt, dass moderne Wissensorganisation (z.B. mit der Hilfe von
Topic Maps und Kategoriehierarchien) das Wissensmanagement sowie komplexes Information
Retrieval erheblich voranbringen kann.
Große und geographisch verteilte Unternehmen, die grenzüberschreitend ihre vernetzten
Strukturen und Geschäftsprozesse (beispielsweise über moderne Intranetlösungen) zu
organisieren und verwalten versuchen, sollten sich der Erkenntnisse und Fortschritte im Bereich
der Wissensorganisation bedienen, da diese interdisziplinäre Aktivität den intellektuellen und
kulturellen Wert der unternehmerischen Wissensbasis durch themenorientierte
Zusatzinformationen
und
maßgeschneiderte
strukturierte
Zugangspunkte
bzw.
benutzerorientierte konzeptualisierte Sichtweisen steigert.
Die dem Bereich Wissensmanagement eher zugeordneten Disziplinen ’Document Management’
und ’Content Management’ befassen sich ebenfalls mit dem Optimieren von
Informationsstrukturen und mit der semantischen Extraktion von Zweck und Sinn eines
Dokuments innerhalb eines Informationssystems. Der nächste Abschnitt gibt einen Einblick in
diese Thematik.
5.1.2 Document Management und Content Management
Im Bereich der webbasierten Informationstechnologie werden oft Document Management und
Content Management als ’stand-alone’ Applikationslösungen gesehen, die vom gesamten
Informationssystem unterschieden werden. Aus der Sicht des Marketings findet diese
Betrachtungsweise sicherlich Gültigkeit, da dort neue und unterschiedliche Begriffe benötigt
werden, um Marktsegmente zu begrenzen. Reale Geschäftsprozesse zeigen hingegen, dass diese
Kapitel 5 - WISSENSORGANISATION
Seite 66
zwei ’isolierte’ Disziplinen eigentlich zwei verschiedene Perspektiven des gleichen Bildes und
Zieles darstellen: das Erfassen und Steuern von wertvollen Informationseinheiten und deren
terminologische bzw. semantische Präsentation in Abhängigkeit von unternehmens- und
benutzerspezifischen Anforderungen [Hyperwave 2002a].
Document Management
In der vorliegenden Arbeit wird ein Dokument, in Übereinstimmung mit den in [Whatis 2002]
und [Encarta 2002] angegebenen Definitionen, als eine Form von Information interpretiert, d.h.
eine – elektronisch - erfasste Aufzeichnung mit dem Ziel gewisse Information nicht zu
verlieren. Ein Dokument ist also ein Bestandteil eines Informationssystems, der einen elektronisch erfaßten - informativen Inhalt besitzt.
Die in der vorliegenden Arbeit verwendete Definition von ’Document Management’ basiert also
auf der zuvor erwähnten Perspektive (d.h. es wird im Folgenden der Bereich ’Elektronisches
Document Management’ gemeint) und lautet wie folgt:
„...Document Management ist eine Reihe von Technologien und Disziplinen,
welche für die Verwaltung und Nutzung der in Dokumenten dargestellten
Informationsbeständen angewendet wird. Das Dokument kann die Prozesse und
Ziele der Organisation unterstützen oder als ein Speicherort des Intellektuellen
Kapitals agieren."37 [SP 2002]
Die wichtigsten Funktionen des Document Management sind somit: Erfassung, Speicherung,
Auffindung, Anzeige, Bearbeitung bzw. Manipulation, Verteilung, Verarbeitung und
Verwaltung von Dokumenten. Es sei an dieser Stelle darauf hingewiesen, dass man Information
nicht nur in Form von Text elektronisch erfassen kann, sondern ebenfalls in multimedialer Form
(z.B. Video, Ton oder Bild).
Bezüglich der Organisation und Aufbereitung von Information lassen sich zwischen Document
Management und dem Bereich Wissensorganisation Parallelen erkennen. Für die Beschaffung
von explizitem Wissen und die Bereicherung der Semantik von Datenbankobjekten ist die
Verwendung von Zusatzinformationen in Form von Metadaten unumgänglich. Flexible
Taxonomien (Strukturhierarchien), die in Form von Baumstrukturen unbegrenzter Tiefe und
Breite dargestellt und mit unterschiedlichen Sicherheits- und Zugriffsrechtsmechanismen
versehen werden können, steigern die Dynamik der Lösungskonzeption von komplexen
Informationssystemen. Kategorisierung (die geordnete Indexierung der Dokumente über MetaAttribute) und Lebensdauer (meistens ist hiermit die Sichtbarkeit von Datenbankbeständen
gemeint) sind auch wichtige funktionelle Bestandteile von modernen Systemen.
Ein wichtiger und kritischer Aspekt in webbasierten Document Management Systemen stellt die
Verknüpfungskonsistenz (’link consistency’) dar. Über spezielle Mechanismen, wie zum
Beispiel das Link Management des Hyperwave Informationssystems, können Dokumente
verschoben oder gelöscht werden, wobei alle zu diesem Dokument zeigenden Links (innerhalb
des Systems) automatisch aktualisiert werden [Hyperwave 2002a].
Interessant für die Organisation und Aufbereitung des Wissens innerhalb eines großen und
verteilten Systems ist die Analyse des Wesens eines Dokuments bezüglich des Lebenszyklus
37
"Electronic Document Management is a set of technologies and disciplines used to manage and exploit
the information assets represented by documents. The document may support organisational processes or
goals, or act as a container of the intellectual capital of the organisation.” [SP 2002]
Kapitel 5 - WISSENSORGANISATION
Seite 67
vom Intellektuellen Kapital einer Institution. Da Dokumente als explizites Wissen angesehen
werden können, sollte auch ein Lebenszyklus für Dokumente existieren.
Das in [Ginsburg 2000] vorgeschlagene Modell für den Lebenszyklus von Dokumenten
innerhalb eines zentralisierten Informationssystems für große und verteilte Institutionen
betrachtet Document Management als ein sozio-technisches Problem einer ’Wissensökologie’.
In so einem Lebensraum identifiziert man fünf unterschiedliche Phasen im Lebenszyklus eines
Dokuments:
•
Erstellung
•
Publizierung
•
Organisation
•
Zugriff
•
Vernichtung
Bedeutend für die vorliegende Arbeit ist das Erkennen der Lebensphasen eines Objektes in
einem System, vor allem bei der Konzeption eines wissensbasierten Intranetsystems für
transnationale Konzerne. Zusätzlich zu den oben angegebenen Phasen weist [Ginsburg 2000]
auf den direkten Einfluß der ’Aktoren’ (d.h. der Benutzer) auf den Lebenszyklus von
Dokumenten hin. In der Regel werden Dokumente von Menschen erzeugt und modifiziert. Eine
effiziente Benutzerverwaltung (bzw. Gruppenverwaltung) spielt somit eine entscheidende Rolle
bei der benutzerorientierten Präsentation der Wissenseinheiten, d.h. wann ist ein Benutzer zum
Beispiel ein Leser, ein Autor oder ein Verfasser, und wie werden die Dokumente vom System in
solchen Fällen behandelt? Wichtige Aspekte in diesem Zusammenhang erkennt man in
[Hyperwave 2002a] bei der Beschreibung von Dokumentenerstellung und -kontrolle (z.B. über
Mechanismen der Versionskontrolle) sowie bei der Informationsweitergabe (Zugriffsrechte auf
Gruppenebene).
Content Management
Der Begriff Content Management leidet wie zahlreiche der neuen Marketingslogans unter
mehreren Definitionsschwächen. Viele Anbieter werben momentan mit dem Begriff ’Content
Management System’, dahinter verbergen sich jedoch die unterschiedlichsten Systemlösungen.
Die vom Autor der vorliegenden Arbeit übernommene Auffassung des Begriffs lehnt sich an die
in [Rothfuss 2000] angegebene ’allgemeine’ Definition, welche wie folgt interpretiert wird:
„Content Management befasst sich mit der Erstellung, Erfassung, Speicherung
und Verbesserung von strukturierten Inhalts- und Multimediabeständen in einer
geregelten Kollaborationsumgebung. Es erleichtert den Zusammenbau, die
Analyse, die Verarbeitung und die Wiedernutzung von Inhalt." 38 [Rothfuss 2000]
Content Management kann somit als der auf Dokumenteninhalt spezialisierte „Verwandte“ vom
Document Management angesehen werden (Anmerkung des Autors der vorliegenden Arbeit).
Im Bezug auf Content Management identifiziert man ebenfalls einen Lebenszyklus, der
allerdings mehr mit der Funktion von Dokumenten zu tun hat [Hyperwave 2002b]:
Erstellung D Kontrolle D Organisation D Präsentation.
38
„… Content management deals with the creation, collection, storage and refinement of structured
content and media assets in a managed collaborative environment. It facilitates assembly, analysis,
processing and re-use of content.” [Rothfuss 2000]
Kapitel 5 - WISSENSORGANISATION
Seite 68
Die gröberen Unterschiede liegen in den Phasen der Organisation und der Präsentation, bei
denen nicht nur die Metainformation, sondern auch der Inhalt des Dokuments eine
entscheidende Rolle spielt. Hier kommen Aspekte wie Mehrsprachigkeit (Multilingual Clusters)
und Fulltext-Suche zur Geltung.
Bei der Aufbereitung von Informationseinheiten – vor allem in großen und verteilten
Unternehmensgedächtnissen - und deren nachhaltige und effiziente Verwaltung sind folgende
Aspekte des Content Managements von besonderer Bedeutung:
•
Wie oft wird sich der Inhalt von Dokumenten während des Lebenszyklus ändern?
•
Welche Auswirkungen hat eine Inhaltsänderung für die Aufbewahrung bzw. für die
Präsentation der Wissensbasis?
•
Was bedeuten verschiedene Inhaltstypen für das System (z.B. Bild, Video oder Ton)?
•
Soll das System mehrsprachige Dokumente unterstützen und wie?
•
Was passiert bei kollaborativer Dokumentenerstellung? Ist die Implementierung von
Mechanismen für Versionskontrolle wünschenswert?
•
Welchen Einfluß hat eine Änderung vom Dokumenteninhalt
Archivierungsmechanismen? Oder ab wann gibt es einen Einfluß?
•
Ist eine besondere Dynamik im Lebenszyklus eines Dokumenteninhalts wünschenswert
oder unerlässlich? Hierfür eignen sich spezialisierte Tools des Wissensmanagements,
wie zum Beispiel Workflow Applikationen, aber auch Lösungsansätze des Information
Retrievals, wie moderne Clustering-Verfahren.
auf
die
Moderne Lösungsansätze in Bezug auf Content Management können bei der Organisation des
Wissens bzw. Aufbereitung von Information in einem System sehr behilflich sein. Das Prinzip
der in [Krottmaier et al. 2001] erklärten ’Transklusionen’ können nicht nur Speicherplatz sparen
sondern sehr effektiv das Auftreten von Dead Links automatisch vermeiden und das
Aktualisieren von mehrfach vorhandenem Inhalt in einem Schritt garantieren.
Bei einer Transklusion werden ’Inhaltssegmente’ von fremden Quellen (zum Beispiel
referenzierte Dokumente oder duplizierte Inhalte) in die eigenen Dokumente so eingefügt, dass
ein eigenes Dokumentenobjekt entsteht. So kann ein neues Dokument aus zwei eigenen
Absätzen und – dazwischen - einer Referenz zu einem bestimmten Absatz in einem völlig
unterschiedlichen Dokument bestehen. Beim Öffnen des Dokumentes wird der ’fremde’ Inhalt
dynamisch ’kopiert’ und präsentiert als wäre es immer da gewesen. Der technische
Implementierungsaufwand von Transklusionen steigt mit der Unterstützung unterschiedlicher
Dokumentenformate aufgrund komplexer Übersetzungsalgorithmen [Krottmaier et al. 2001].
5.1.3 Information Retrieval und Resource Discovery
Die Suche nach geeigneten Mechanismen für das Auffinden ähnlicher Dokumente oder Inhalte
ist ein Teilgebiet vom Information Retrieval und vom Resource Discovery.
Information Retrieval
Information Retrieval, in der vorliegenden Arbeit auch Informationsauffindung genannt, basiert
auf der Analyse von Daten (oft durch Verfahren der Wissensrepräsentation unterstützt), die in
Wissensstrukturen gespeichert sind. Somit liefert ein Information Retrieval System
Informationen über ein System mittels Transformationen auf Wissensstrukturen.
Kapitel 5 - WISSENSORGANISATION
Seite 69
Es ergeben sich zwei grundlegende Möglichkeiten eine Interaktion zwischen Systembenutzer
und Datenbankobjekten zu ermöglichen: Navigieren (’Browsing’) und Auffinden (’Retrieval’).
Oft wird die Navigation über Systemstrukturen ’logische Sichtweise’, das Auffinden der
Information ’semantische Sichtweise’ genannt [Baeza-Yates et al. 1999].
Information Retrieval behandelt also Systeme für das Indizieren, Suchen und Wiederauffinden
von Daten und Inhaltselementen in elektronischen Dokumenten [García-Barrios 2001a], womit
sich die Frage nach einer geeigneten Repräsentationsform für Textinhalte stellt. Um die Qualität
von solchen Systemen zu messen, werden oft zwei meßbare Kriterien verwendet: ’Recall’
(wieviel Prozent aller relevanten Dokumente wurden nach einer Suchabfrage gefunden) und
’Precision’ (wieviel Prozent aller gefundenen Dokumente waren relevant) [Guetl 2000].
Die Messung der Qualität von Suchsystemen nach den oben erwähnten Parametern ist jedoch
relativ, da in allen Definitionen die ’Relevanz’ zu finden ist. Relevanz stellt eine abstrakte
Maßangabe und eine subjektive Meinung dar, um den Informationsbedarf des Benutzers zu
befriedigen. Ein weiterer Parameter, um Information Retrieval zu bewerten ist ’Relevance
Feedback’ (Relevanzrückmeldung), womit der Prozess des Filterns nach einer Suchabfrage
gemeint ist. Nach einer verfeinerten Abfrage des Benutzers wird das System versuchen, eine
qualitativ höhere Untermenge von Dokumenten zu liefern [García-Barrios 2001a].
Relevant für die in Kapitel 6 ’Lösungsvorschlag’ (Teil II ’Gestaltungsbereich’) vorgeschlagene
Organisationskonzeption eines Informationssystems für große und geographisch verteilte
Unternehmen sind die in Bezug auf die Informationsauffindung identifizierten semantischen
Lösungsansätze einer Wissensorganisation. Durch die Zuordnung von Deskriptoren
(semantische Zusatzelemente) zu Datenbankobjekten wird versucht, eine geeignete
Wissensrepräsentation zu konzipieren, die weitgehend unabhängig von den konkreten
Formulierungen in Dokumenten ist. Syntax und Semantik dieser Beschreibungselemente sind in
Form von Modellen festgelegt.
Die grundlegenden Modelle, laut [Baeza-Yates et al. 1999] in ’Boolean-’, ’Vektor-’ und
’Probabilistikmodelle’ unterteilt, ziehen in Erwägung, dass jedes Dokument sich durch eine
Menge von repräsentativen Schlüsselwörtern, auch ’index terms’ genannt, beschreiben läßt.
Index Terms stellen somit einfache (Dokumenten-)Wörter dar, deren Semantik dazu beiträgt,
sich an die Hauptthemen des Dokuments zu erinnern. Sie werden in der Regel mit Hauptwörtern
definiert, weil sie meistens eine besser begreifbare bzw. identifizierbare Bedeutung beinhalten.
Diese Modelle können somit einerseits einen einfachen und schnellen Zugriff auf verteilte
Datensammlungen und andererseits eine organisierte Gewichtung der Dokumente nach der
Wahrscheinlichkeit ihrer Relevanz ermöglichen. Die erfolgreiche Konzeption von semantischen
Modellen für stark vernetzte Informationssysteme, wie meist in transnationalen Unternehmen zu
finden, setzt die Definition und Erstellung eines allgemein gültigen Vokabulars voraus. Das
gewählte (selbst erstellte oder integrierte) Vokabular soll alle Mehrfachdeutungen und formale
Probleme der natürlichen Sprache vermeiden. Die von dem Bereich der Informationsauffindung
zur Verfügung gestellten Mechanismen, wie zum Beispiel ’Clustering’, ’Kontrollierte
Vokabulare’, ’Dokumentationssprachen’ und ’Map Collections’, werden in den nächsten
Abschnitten dieses Kapitels näher besprochen.
Resource Discovery
Ein weiterer Bereich, der sich mit der Problematik der Auffindung von Information bzw.
Informationseinheiten in verteilten Architekturen befaßt, stellt die ’Quellenentdeckung’ (engl.:
’Resource Discovery’) dar. Eines der Hauptziele dieser Disziplin ist das Ermöglichen eines
integrierten Zugriffs zu verteilten und vernetzten Informationsquellen. Resource Discovery,
Kapitel 5 - WISSENSORGANISATION
Seite 70
hauptsächlich im Bereich des Internets beschäftigt, vereint die Elemente Ressource (eng.:
’resource’), Entdeckung (engl.: ’discovery’), Benutzer und Dienstleister (eng.: ’service
provider’). [Ianella 1995]
Die Bedeutung dieses Bereichs für die Thematik der vorliegenden Arbeit liegt in der Tatsache,
dass die Aspekte Standort, Zugriff, Auffindung und Management von verteilten Ressourcen in
einem globalen Kontext von der Disziplin umfaßt werden. Organisation, Navigation und Suche
spielen bei der Ressourcenentdeckung eine entscheidende Rolle in direktem Zusammenhang mit
der Relevanz der vernetzt gespeicherten Information in einem verteilten System. In Bezug auf
die Taxonomie von Recource Discovery Systems werden in [Schwartz et al. 1992] die Aspekte
Körnung (eng.: ’granularity’), Verteilung, Verbindungstopologie (eng.: ’interconnection
topology’) und Datenintegritätsschema erkannt.
Die Körnung eines Systems, welches Resource Discovery unterstützt, kann als die
Feinabstimmung der Informationsauffindung bzw. die Exaktheit der Indizierungsparameter
einer Suche interpretiert werden (d.h. die Tiefe der Beziehung Daten zu Metadaten). Die
geographische Verteilung der Daten und die gewählte Verzeichnisstruktur (z.B. X.500, Gopher,
Prospero oder der vom Web umfaßter Informationsraum) sowie das Abbilden unterschiedlicher
Modelle
von
Datenspeicherung
(Schemata
für
Datenintegrität)
stellen
die
informationstechnische Dimension des Resource Discovery dar, wobei die Qualität bzw. der
Stand aktueller Technologien einen direkten Einfluß auf das System haben [Schwartz et al.
1992].
Die im Resource Discovery Workshop - RDW95 – erkannten Schwerpunkte bzw.
bedeutendsten Anforderungen an Resource Discovery Systems werden in [Ianella 1995] wie
folgt aufgelistet:
•
Metadaten
•
Information über Benutzerprofile
•
Skalierbarkeit und Zusammenschluß
•
Navigation (Browsing)
•
Sicherheit und Privatsphäre.
Die somit in [Ianella 1995] erkannten Problembereiche lassen sich auf die Anforderungen der
Informationsaufbereitung bzw. Wissensorganisation eines Informationssystems für
transnationale Unternehmen direkt proportional abbilden.
Die Metadaten als Zusatzinformation für Wissenseinheiten erhöhen die Qualität der
gespeicherten Strukturen. So kann zum Beispiel über das Zusammenwirken von
Qualitätsmetadaten und geregelten Mechanismen der Benutzerverwaltung eine bedarfsgerechte
und steuerbare Navigation und Präsentation der Inhalte ermöglicht werden. Sicherheit,
Skalierbarkeit, Integration und Privatsphäre können über Intranetlösungen garantiert
Knotenpunkt als Einstiegspunkt zu einer im Hintergrund vernetzt organisierte Struktur werden.
Der aus technischer Sicht direkte Zusammenhang von Resource-Discovery-Systemen und
Informationsaufbereitung für verteilte Informationssysteme liegt in der Benutzung von zentralen
Zugriffsknoten zu dahinterliegenden Informationsstrukturen. Dies kristallisiert sich aus der
Tatsache heraus, dass Resource Discovery häufig auch mit ’Subject Gateways’ in Verbindung
gebracht wird. Subject gateways stellen Online-Dienste und Websites dar, welche
durchsuchbare und navigierbare Kataloge von webbasierten Ressourcen darstellen. Solche
Kataloge sind themenorientiert organisiert und werden sehr oft von Themenexperten verwaltet
Kapitel 5 - WISSENSORGANISATION
Seite 71
und gewartet [García-Barrios 2001a]. Im Abschnitt 5.3 ’Themenhierarchien’ werden Subject
Gateways und die Bedeutung ihrer Methoden bei der Informationsaufbereitung in verteilten
Informationssystemen für transnationale Konzerne analysiert.
5.1.4 Library Science und Archival Science
Die Fachbereiche ’Library Science’ und ’Archival Science’ (im deutschsprachigen Raum auch
unter ’Bibliothekswesen’ und ’Archivierungswesen’ bekannt) sind sehr lange existierende
Spezialgebiete, die sich mit der Semantik und Strukturierung von Wissen bzw. Erschließung,
Auffindung und Wiedergewinnung von Information beschäftigen. Geschichtlich gesehen stellen
diese Disziplinen die routiniertesten und grundlegendsten Methoden und Strukturen zur
Wissensorganisation zur Verfügung, da sie schon seit der ’Erfindung’ der Bibliotheken (vom
Autor der vorliegenden Arbeit als geordnete Speichersysteme von explizitem Wissen
verstanden) existieren.
Die in diesem Abschnitt präsentierte Analyse basiert auf die in [Walker 2001] vorgestellte
Studie über professionelle Paradigmen des Bibliotheks- und des Archivierungswesens für das
Management von webbasierten Systemen.
Library Science
Das Bibiothekswesen (engl.: ’Library Science’) beschäftigt sich, wie in [Walker 2001] definiert,
"… mit der Auswahl, Anordnung und Beschreibung von publizierten Werken, wie
Büchern, Serien und multimedialem Material".39
Um einen Zugriff zu diesem Material zu ermöglichen, entwickelten Bibliothekare
hochspezialisierte Standards der Informationsauffindung (zum Beispiel ’Kontrollierte
Vokabulare’ wie die ’Library of Congress Subject Headings’) und Klassifikationssysteme
(beispielsweise ’Dewey Decimal’, ’Universal Decimal’ und ’Library of Congress’).
Die Vorteile von Klassifikationssystemen liegen vor allem in der Unterstützung von
themenorientierter Navigation durch systematisch organisierte Strukturen, welche einen
vordefinierten, verfeinerten Kontext für Suchanfragen zur Verfügung stellen. Die
Auffindungsmechanismen bedienen sich dieser kategorisierten Strukturen, um Mengen von
Suchresultaten zu segmentieren und manipulieren.
Weiters erlauben Klassifikationssysteme des Bibliothekswesens einen sprach-unabhängigen
Zugriff auf Information und (explizites) Wissen, da sie meist auf einer numerischen
Nomenklatur aufgebaut sind.
Die wirkliche Stärke von Paradigmen des Bibliothekswesens bei der Organisation von
elektronisch erstellten Dokumenten in großen und geographisch verteilten Unternehmen wird
gleichzeitig auch durch eine Schwäche dargestellt: das manuelle (effiziente und sorgfältige)
Indizieren vom publizierten Material ist aufwendig, langwierig und kostspielig. Traditionelle
Klassifikationssysteme bedienen sich deshalb anderer Mechanismen, um den Prozess des
Indizierens zu automatisieren. Dokumente können somit mit der Hilfe von vordefinierten
Metadaten und Zusatzattributen gleich beim Archivieren so versehen werden, dass sie ein
schnelleres themenorientiertes Wiederauffinden ermöglichen.
39
"Library science concerns itself with the selection, arrangement, and description of published works,
including books, serials, and multimedia materials. [Walker 2001]"
Kapitel 5 - WISSENSORGANISATION
Seite 72
Das Problem von universell geltenden Klassifikationssystemen liegt aber meist in der Tatsache,
dass sie sich nicht immer für Themenbereiche eignen, die dem ’akademischen’ Hintergrund
dieser standardisierten Strukturen genügen. Weiters kommen Klassifikationsexperten oft nicht
mit der Geschwindigkeit und Anzahl der neu auftauchenden Spezialgebiete zusammen, so dass
Unternehmen sich nicht ein Warten auf das Einbinden ihrer Spezialbereiche leisten können.
Diese verständliche ’Unflexibilität’ der universellen Klassifikationssysteme erklärt somit das
Heranwachsen kleinerer, selbsterstellter Themenhierarchien für spezialisierte Bereiche bzw.
Unternehmungen.
Archival Science
Das Archivierungswesen, analog zum Bibliothekswesen, bringt eine etablierte und solide
jahrhundertelange Erfahrungsgeschichte mit sich. Laut [Walker 2001], befasst sich Archival
Science hauptsächlich mit der Organisation von ’nicht publiziertem’ Material. Während
Bibliotheken diskrete Informationseinheiten enthalten, setzen sich Archivisten mit
umfangreichen Räumen von Records (Verzeichnissen oder Verzeichniselementen), welche
untereinander dynamische und oft komplexe Beziehungen enthalten, auseinander.
Archival Science folgt bei der Anordnung und Beschreibung von Strukturen zwei Prinzipien:
’Herkunft’ und ’ursprüngliche Anordnung’ (eng.: ’provenance’ and ’original order’ [Walker
2001]). Somit ist eine systematische Entwicklung und Beschreibung von Strukturen anhand des
Dokumentenautors und der chronologischen Erstellung möglich.
Die Vorteile der Paradigmen des Archival Science liegen in dem beziehungs-orientierten Ansatz
der Strukturen. Dokumente und Inhalte werden immer in einer bestimmten Form gewartet, so
dass deren enger Zusammenhang mit den ’Systemkomponenten’ (wie zum Beispiel Autoren,
Verfasser, Unternehmensbereiche, chronologische Archive) langfristig garantiert bleibt.
Das Problem der von Archival Science zur Verfügung gestellten Mechanismen wird durch ihr
’statisches’ Wesen dargestellt. Für die großen und dynamischen Strukturen von Konzernen des
21. Jahrhunderts, die ständig ihre Organisations- und Geschäftsbereiche erweitern und
modifizieren, scheinen diese traditionellen Paradigmen sogar mittelfristig zu versagen. Hierbei
können Methoden der Kommunikations- und Informationstechnologie eingesetzt werden, um
nicht mehr gültige Archivierungssysteme zu ’cachen’ (de.: ’zwischenspeichern’), womit
temporäre oder partielle Zugangsknoten zu alternativen Archiven garantiert werden.
Die somit beschriebenen Methoden dieser zwei Disziplinen (Library und Archival Science)
stellen ein Grundgerüst zur Verfügung, mit dem die Aufbereitung von Informationseinheiten in
großen Unternehmen unter einem allgemein gültigen, systematischen und technischen
Kriterium ermöglicht wird. Die praktische Anwendung dieser Methoden führt meist zu einer
themenspezifischen Kategorisierung aller Informationsbestände. Diese Kategorisierungen
werden auch ’terminologische Strukturen’ oder ’Begriffsstrukturierungen’ genannt.
Die Verwendung von systematischen Begriffsstrukturierungen ermöglicht das Erstellen von
semantischen Netzen, welche einerseits die unternehmensspezifische (im organisatorischen und
geschäftsprozessorientierten Sinne) Speicherung von Daten und andererseits einen
rollenspezifischen (im Zusammenhang zu den Notwendigkeiten der Benutzer des Systems)
Zugang zu Information effizient und zielgerecht garantieren.
Die in [Gödert 2001] erkannten Aufgaben von terminologischen Strukturen lassen sich wie folgt
zusammenfassen:
a) Abgeschlossenheit versus Entwicklung von Begriffen (fixe versus dynamische
Stellung von Begriffen innerhalb einer Hierarchie)
Kapitel 5 - WISSENSORGANISATION
Seite 73
b)
begriffliche Distanz (Abstand verwandter oder fremder Begriffe zu einander)
c) Gleichheit hierarchischer Niveaus (Bedeutung der Tiefen in Hierarchien und deren
Bedeutung)
d) Existenz von Beziehungen (Spezifikation oder Mangel von Verbindungen zwischen
den Begriffen)
e) Auswahl und Fixierung von Beziehungen unter Nutzungsaspekten (die Rolle und
Bedeutung von Begriffen für die Benutzer)
Informationssysteme, welche eine bestimmte Organisationsstruktur abbilden und eine vernetzte
Dokumentensammlung (Bibliothek oder Archiv) verwalten, werden vor allem im Bereich der
Wissensorganisation ’Vernetzte Organisationssysteme’ (engl.: ’Networked Organization
Systems’) genannt.
Wissensorganisationssysteme können Thesauri und andere Listen von Schlüsselwörtern,
Ontologien, Klassifikationssysteme, Clusteringansätze, Taxonomien, Gazetteers, Wörterbücher,
lexikalische Datenbanken, Concept Maps, Semantic Road Maps, usw. beinhalten.
Diese Schemata ermöglichen eine verbesserte Wissensstrukturierung, ein effizient organisiertes
Wissensmanagement, eine wissensbasierte Datenverarbeitung und einen systematischen Zugriff
auf Wissensstrukturen (z.B. in individuellen Datenvorräten, in unternehmensspezifischen
Intranetumgebungen oder in digitalen Bibliotheken). Ihre Anwendung als interaktive
Informationsdienste im Internet erhöhen ihr Unterstützungspotential zur Verbesserung der
Beschreibung, Entdeckung und Widerauffindung von heterogenen Informationsquellen [Sigel
2001].
Die unterschiedlichen Wissensorganisationssysteme lassen sich in folgende Hauptgruppen
unterteilen [Hodge 2000a]:
a) Begriffslisten (engl.: ’Term Lists’)
b) Klassifikationen und Kategorien
c) Zusammenhangslisten oder –gruppen (engl.: ’Relationship Lists’)
Eine nähere Betrachtung dieser Gruppen und ihrer – für die Konzeption eines verteilten
Informationssystems für transnationale Konzerne – Untergruppen (wie zum Beispiel
Ontologien, Taxonomien, Subject Headings, Klassifikationssysteme, Thesauri, Semantische
Netzwerke) wird im Unterkapitel 5.3 ’Organisationssysteme’ gegeben.
Der nächste Abschnitt gibt einen Überblick über die wichtigsten technischen Hilfsmittel für die
Konzeption von Wissensorganisationssystemen, wobei die Schwerpunkte durch die Bereiche
’Semantic Web’, ’Metadaten’, ’Ontologien und Taxonomien’ und ’Inhaltserschließung’
dargestellt werden.
5.2 Semantik
Dieses Unterkapitel präsentiert eine Einführung in die Thematik der ’Terminologie’ und
’Semantik’ aus der Sicht des Wissensmanagements bzw. -organisation und deren technische
Umsetzungsmöglichkeiten
durch
bekannte
Mechanismen,
wie
Metadaten,
Beschreibungssprachen, Ontologien und Taxonomien. Die Bedeutung dieser Bereiche für die
vorliegende Arbeit liegt in der Bereicherung bzw. Verbesserung der Informationsaufbereitung,
der Wissensorganisation, -auffindung, und –repräsentation.
Kapitel 5 - WISSENSORGANISATION
Seite 74
Die hier besprochenen Mechanismen und Hilfsmittel bilden die Grundlage für die in den
folgenden Abschnitten vorgestellten Systeme und Strukturierungsmöglichkeiten, welche aus
den bisher präsentierten Fachbereichen stammen und effiziente Sichtweisen für den Zugang auf
komplexe und verteilte Informationsstrukturen, wie diejenigen in transnationalen Konzernen zu
finden, erlauben.
Informationssysteme, die speziell in geographisch verteilten Unternehmensstrukturen zu finden
sind und das intellektuelle Kapital der Organisation verwalten, richten sich letztendlich auf die
benutzer- oder aufgabengerechte Aufnahme (multi)medial externalisierter Information. In
Dokumenten gespeichertes Wissen beschreibt meist einen bestimmten Sachverhalt, der vom
Dokumentenautor stammt und vom Informationssystem ’richtig’ zu interpretieren und zu
beschreiben ist. Die Bedeutung des Dokuments bzw. dessen Inhalt stellt somit ’das’ Merkmal
dar, um einen semantischen Wissenstransfer zu gewährleisten. Die Aufgabe der
(informationstechnischen)
Wissensmanager
bzw.
Wissenorganisatoren
oder
Informationssystementwickler besteht somit darin, semantische Modelle zu entwerfen, aus
denen die Bedeutung aller gespeicherten Wissenseinheiten – maschinell und menschlich - lesbar
wird.
„Die Bedeutung bzw. Festlegung der Bedeutung der einzelnen Sprachelemente
bezeichnet man als Semantik" [NetAcademy 1999].
Der Autor der vorliegenden Arbeit verfeinert diese Definition zum Zwecke der
Informationsaufbereitung in webbasierten Wissensstrukturen und verwendet den Begriff
Semantik für die ’ziel- und anwendungsgerechte Bedeutungsbeschreibung von
Wissenseinheiten in einem Informationssystem, um deren Wesen festzulegen und global
geltende Zusammenhänge in terminologischen Strukturierungen zu erstellen’.
Die Semantik, als Teilgebiet der Semiotik, wird auch als Bezug zwischen Objekten oder
Prozessen und Symbolen verstanden. Zur Unterscheidung der Semantik von den Begriffen
Syntax und Pragmatik, wird in [NetAcademy 1999] der Bezug der Symbole untereinander als
Syntax, und der Bezug zwischen Wissen und handelnder Einheit als Pragmatik definiert. Somit
werden Daten als Komposition von Zeichen und Syntax, Information als Komposition von
Daten und Semantik, und Wissen als Konstrukt aus internalisierter Information und den
Fähigkeiten, Information zu nutzen, verstanden.
Wichtigster Grundmechanismus für die Bedeutungsübertragung ist eine rückgekoppelte
Kommunikation zwischen Informationssender und –empfänger. Externalisierung und
Internalisierung von Bedeutung erfordern somit die Modellierung auf der Basis dieses
Grundmechanismus, womit die Semantik innerhalb von Bezugssystemen erst durch die
kognitive Informationsverarbeitung auf der Basis von Sinneseindrücken entsteht [Gödert 2001].
Für die Erschließung und Auffindung von Wissen mittels strukturierter Vokabulare werden oft
’Dokumentationssprachen’ (z.B. Thesauri oder Klassifikationsschemata) angewendet. Diese
werden in der Regel durch geordnete Klassen von Begriffen, welche eine systematische
Modellierung von Informationseinheiten ermöglichen, dargestellt.
Insbesondere für webbasierte Anwendungen ist die Verwendung von Zusatzattributen (zu einer
Informationseinheit gehörenden Deskriptoren), auch Metadaten genannt, weit verbreitet. Diese
aggregierten semantischen Beschreibungselemente sollen das Wesen des sonst chaotisch
organisierten World Wide Web zu einem ’semantisch organisierten Netz’ (engl.: ’Semantic
Web’) erheben.
Kapitel 5 - WISSENSORGANISATION
Seite 75
Dieses Unterkapitel beschäftigt sich mit den grundlegenden Elementen eines großen,
semantisch organisierten Informationssystems. Basiselemente eines solchen Systems sind
Semantische Portale, Metadaten und formale Begriffssysteme (Ontologien). Der folgende
Abschnitt präsentiert anhand des ’Semantic Web’ die verallgemeinerte Form eines semantischen
Portals.
5.2.1 Semantic Web
Webinhalte wurden bis heute meist dazu entworfen, um Dokumente lesbar für Menschen zur
Verfügung zu stellen, und nicht dazu, von Computerprogrammen semantisch manipuliert zu
werden.
Die Vision hinter dem ’Semantic Web’ ist, Organisationsstrukturen und Mechanismen zur
Verfügung zu stellen, welche nicht nur in der Lage sind, Dokumente semantisch zu erfassen und
die dazugehörigen Schlüsselwörter (engl.: ’keywords’) zu indizieren, sondern auch
Zusammenhänge zum vorteilhaften Nutzen des Benutzers zu verarbeiten. Der zu diesem Zweck
meist angewandte Lösungsansatz ist das Festlegen und Verwalten von ’Ontologien’. Somit
entwickelte ’Semantische Portale’ sind sehr komplex und bestehen zum Beispiel aus folgenden
Teilmodulen [Maedche et al. 2001] [Hotho et al. 2001]:
•
’Knowledge Warehouse’ stellt die physikalische Ebene der Repräsentation von Wissen
dar. Hier werden Ontologie, Datenbankobjekte und Metadaten aufbewahrt.
•
Suchsystem:
o Inferenzmotor – das deduktive Auffindungssystem.
o Extraktor – das Modul zur Begriffsextraktion aus Dokumenteninhalten.
o Crawler – ontologiebasierter Kontrollmechanismus des Suchmoduls.
•
’Ontologiebasiertes Clustering’ stellt das Anwendungsmodul zur Extraktion von
Wissen aus unstrukturierten Dokumenten dar.
•
Presentation (zum Beispiel Templates, Navigationsstrukturen, personalisierte Interfaces,
Query Language, usw.).
Ein futuristisches Szenario in Richtung ’Semantic Intranet’ - in Anlehnung an das in [BernersLee et al. 2001] angegebene Beispiel – könnte wie folgt aussehen:
das Ergebnis einer Suchabfrage nach einem bestimmten Unternehmensmitarbeiter soll
nicht nur den Hyperlink zur Homepage der Tochterunternehmung und die darin
gefundenen Keywords, sondern gleich die ’semantische’ Information über die
Sprechstunden, aktuelle Arbeitsbereiche, zusammenhängende Publikationsthemen,
usw., des betroffenen Mitarbeiters und eine Möglichkeit der Terminvereinbarung für
eventuelle Videokonferenzen, enthalten. Diese Semantische Information wurde zuvor
(theoretisch) vom Content Manager des Unternehmens über speziell programmierte
Interfaces - welche eine für den Konzern bekannte Terminologie verwenden eingegeben, wodurch der Suchmechanismus des webbasierten Intranets zielgerechte
Informationseinheiten
verarbeiten
kann
und
über
spezielle
Wissensorganisationsstrukturen dem Suchenden eine benutzergerechte Präsentation des
Ergebnisses liefert.
Die besprochenen Aspekte des Semantic Web sollen als grober Überblick und nicht als tiefe
Untersuchung aller existierenden Möglichkeiten dienen, da sie sonst den Rahmen der
vorliegenden Arbeit sprengen würden. Von besonderer Bedeutung ist somit das Nahebringen
der zukünftigen Perspektiven in diesem Bereich.
Kapitel 5 - WISSENSORGANISATION
Seite 76
Für transnationale Unternehmen ist die Nutzung des Web bzw. eines Intranets als
zugrundeliegende Technologie eine perfekte technische Möglichkeit sowohl, um die
geographische Verteilung der Organisation technologisch zu abstrahieren als auch, um die sonst
stark verteilten Strukturen auf transparenter Weise dem Benutzer ‘virtuell zentralisiert’ über
standardisierte Schnittstellen (Browser) zu liefern.
Deshalb sind Fortschritte im Bereich des Semantic Web von besonderer Bedeutung, da sie sich
für webbasierte Intranetlösungen auch umsetzen lassen.
Eines der wesentlichsten Hilfsmittel für das Hinzufügen von Semantik zu Informationseinheiten
in wissensbasierten Systemen stellen Zusatzinformationen dar. Diese Zusatzinformationen
werden Metadaten genannt und sind das Thema des nächsten Abschnitts.
5.2.2 Metadaten
Aus den bisher gewonnenen Erkenntnissen lässt sich folgern, dass die Erfassung und
Verwaltung vom intellektuellen Kapital eines großen Unternehmens durch das
Zusammenwirken mehrerer Komponenten aus verschiedenen Fachbereichen verbessert werden
kann.
Die Bedeutung bzw. Semantik eines Dokumentes, oder allgemeiner einer gespeicherten
Wissenseinheit, kann mit Hilfe von Zusatzinformation präziser oder konkreter beschrieben
werden.
Zusatzinformationen zu einem Dokument, auch ’Metadaten’ genannt, stellen nicht nur für
Suchprozesse einen wichtigen Hilfsaspekt dar, sie können dem Nutzer der Daten bei der
Datendarstellung und im Umgang mit den Inhalten einen besseren Überblick liefern.
In Übereinstimmung mit [Weitzer 2000] bedarf die Definition der Metadaten als ’Daten über
Daten’ noch einiger zusätzlicher Bemerkungen [Daniel et al. 1997]:
•
Eine Unterscheidung zwischen Daten und Metadaten kann nur in Bezug auf ganz
bestimmte ’Zusammenhangsbeziehungen’ (Relationen) getroffen werden. Oft werden
Metadaten eigens als Speicherelemente benutzt, wodurch sie selbst zu Daten werden.
•
Relationen sind semantisch nicht eindeutig: sie können zum Beispiel Information über
Qualität, Form, Funktion, Format oder Layout eines Dokuments verbergen.
•
In verteilten Architekturen können Daten in einem Speicher andere Daten in einem
anderen Speicher beschreiben.
•
Metadaten müssen physisch nicht ständig existieren. Sie können automatisch abgeleitet
werden.
HTML
Metadaten in HTML-Dokumenten können von Suchmechanismen verwendet werden, um die
Relevanz der Suchergebnisse zu erhöhen.
Die Notationssprache HTML schreibt keinen konkreten Metadatensatz vor, sie definiert nur den
grundsätzlichen Syntax von Meta-Tags [Harmelen et al. 1999], zum Beispiel:
<META NAME="Elementname" CONTENT="Elementwert">.
Kapitel 5 - WISSENSORGANISATION
Seite 77
Zusätzlich können folgende Attribute angegeben werden:
•
HTTP-EQUIV
Dieses Attribut wird anstelle des Name-Attributs verwendet. Http-Server verwenden
dieses Attribut, um Informationen für http zu kodieren und senden den Inhalt
(CONTENT) im Header der http Antwort.
•
LANG
Sprachkennzeichnung basierend auf RFC1766.
•
SCHEME
Dieses Attribut benennt das Schema, das zum interpretieren des Wertes verwendet wird.
Gültig erst ab HTML 4.0.
In Meta-Tags kann man beispielsweise nützliche Anweisungen für Server, Browser und
Suchdienste im Web beschreiben. Die meist verwendeten Meta-Tags sind ’Content-Type’,
’keywords’, ’description’, ’abstract’, ’Language’, ’author’, ’copyright’ und ’robots’ [Knögler
1999].
Standardisierte Metadatensätze (Dublin Core, LOM, PICS)
Zu den am bekanntesten und am häufigsten verwendeten Metadatenmodellen zur Strukturierung
von Metadaten gehören ’Dublin Core Metadata Element Set’ (DC), ’Learning Object Metadata’
(LOM) und ’Plattform for Internet Content Selection’ (PICS).
Das Dublin Core Metadata Element Set besteht aus 15 Elementen zur Ressourcenbeschreibung.
Es wird einfach gehalten, damit die Autoren von Dokumenten die entsprechenden Metadaten
gegebenenfalls selber definieren können. Hinter dem einfachen Dublin Core Lösungsansatz
stand die Idee, ein kostengünstiges, leicht wartbares Verfahren zu entwickeln, das auch vor der
rapiden Zunahme an Dokumentenanzahl in elektronischen Netzwerken nicht kapitulieren muß.
Weiterhin wurde darauf geachtet, dass die Anbindung an andere, zumeist komplexere Formate
möglich ist [Knögler 1999].
Beispiel für ein in HTML eingebundenes Dublin Core (DC) Element:
<META NAME="DC.ElementName" CONTENT="Elementwert">.
Der Inhalt des Elements NAME besteht aus der Kennung ’DC.’ als Metadaten und einem
Elementnamen, wie z.B. "DC.TITLE".
Der Learning Object Metadata Standard spezifiziert (aktuell in der Spezifikationsversion v3.8)
Syntax und Semantik der LOM-Metadaten und definiert Attribute, um ’learning objects’
vollständig zu beschreiben [LOM-IEEE 1999]. Learning Objects sind digitale oder nichtdigitale Objekte, die während technologieunterstützten Lernens benützt werden können.
Beispiele dafür sind eLearning Systeme oder interaktive Trainingsumgebungen. Learning
Objects können zum Beispiel Multimediainhalte, Anleitungen, Lernsoftware und Software
Tools sowie Personen, Organisationen oder auch die Fälle, die an technologieunterstützten
Lern- bzw. Lehrprozesse beteiligt sind, sein [Duval2001].
Der LOM Standard baut auf eine minimale Anzahl von Attributen, mit denen Learning Objekte
verwaltet, lokalisiert und ausgewertet werden können [Knögler 1999]. Relevante Attribute in
LOM umfassen Objekttyp, Autor, Besitzer, Konditionen für die Verteilung und Format des
Learning Objekts [LOM-IEEE 1999].
Kapitel 5 - WISSENSORGANISATION
Seite 78
Beim ’Platform for Internet Content Selection’ Metadatensatz, kurz PICS genannt, geht es um
ein standardisiertes Schema zum Kennzeichnen von Internet-Inhalten [García-Barrios 2001a].
Das Schema wurde eigentlich erfunden, um jugendfreie Inhalte auszuzeichnen bzw. bestimmte
unerwünschte Inhalte auf Benutzerseite (’client side’) auszufiltern. Diese speziellen
Auszeichnungen heißen ’PICS-Labels’. Anbieter von Web-Seiten können ihre Web-Seiten
entweder freiwillig und nach eigenem Ermessen mit einem PICS-Label versehen oder einen
unabhängigen PICS-Service in Anspruch nehmen, welcher PICS-Zertifikate für Inhalte ausstellt
[Knögler 1999].
Metadatenformate (XML, RDF)
Metadatenformate wie SOIF (Harvest ’Summary Object Interchange Format’) und MCF (’Meta
Content Framework’) werden in der vorliegenden Arbeit nicht behandelt, da sie entweder nicht
standardisiert sind oder deren Weiterentwicklung eingestellt wurde. Die aus der Sicht des
Autors der vorliegenden Arbeit wichtigeren XML und RDF Formate fanden bisher eine sehr
weite Verbreitung und werden im Folgenden kurz präsentiert werden.
Die Extensible Markup Language (XML) beschreibt eine Klasse von Datenobjekten, genannt
XML-Dokumente, und das Verhalten von Applikationen, welche diese Dokumente verarbeiten.
XML ist ein Anwendungsprofil (eng.: ’application profile’) oder eine eingeschränkte Form von
’Standard Generalized Markup Language’ (SGML). Durch deren Konstruktion sind XMLDokumente konforme SGML-Dokumente [Knögler 1999].
XML ist ebenso wie SGML eine Metasprache für das Definieren von Dokumenttypen. Das
heißt, XML ist der Oberbegriff für die Syntaxregeln, die angewendet werden, wenn ein neuer
Dokumenttyp definiert wird. Reine XML-Notation eignet sich deshalb zur Strukturierung bzw.
Strukturbeschreibung von Dokumenten [Knögler 1999]. Die ’eXtensible Markup Language’
(XML) wurde so spezifiziert, dass die nützlichsten Teile der ’Standard Generalized Markup
Language’ (SGML) erhalten bleiben, womit weniger gebräuchliche und komplizierte Teile
weggelassen wurden [Flynn 2001]. Ein wichtiger Bestandteil eines XML-Dokuments ist dessen
Dokumenttyp-Definition (DTD), welche mit einem Daten- oder Dateiformat vergleichbar ist.
Unter einem Datenformat bzw. Dateiformat versteht man die Gesamtheit der Richtlinien, die für
das Organisieren von Daten innerhalb einer Datei gelten. Die DTD legt somit die Gültigkeit der
Einträge innerhalb eines XML-Dokuments fest. Viele XML-Parser ignorieren diese Definition,
da sie von einem ’wohlgeformten’ Dokument ausgehen (z.B. die Validierung eines XMLDokuments durch die XML-Engine des Microsoft Internet Explorer).
Das Resource Description Framework (RDF) stellt eine einheitliche und interoperable
Alternative des Datenaustausches zwischen unterschiedlichen Webapplikationen dar. RDF
wurde mit dem Ziel entwickelt, für Menschen - relativ – leicht lesbar und für Computer leicht
verarbeitbar zu sein. RDF ist ein auf XML basierender Standard des W3C, mit dem festgelegt
wird, wie Metainformation beschrieben und ausgetauscht werden kann. Es bietet also
Entwicklern eine standardisierte Möglichkeit an, wie große Mengen von Elementen und deren
Beziehungen untereinander notiert werden können [Knögler 1999].
Lösungsansätze wie XML und RDF ermöglichen nicht nur eine wesentliche
Funktionalitätserleichterung für Suchdienste, sondern auch eine universell austauschbare
Konzeption von Modellierungsalternativen, welche zur semantischen Bereicherung von
Wissenseinheiten verwendet werden können. Dies ergibt sich aus ihrer Grundlage der
Deskription
durch Attributelemente
und ihrer
standardisierten
Notation
für
Strukturbeschreibungen. Durch die Verwendung von standardisierten Formaten können alle
Wissenseinheiten eines Informationssystems für große und geographisch verteilte Unternehmen
Kapitel 5 - WISSENSORGANISATION
Seite 79
wesentlich einfacher ausgetauscht, präsentiert und organisiert werden. Eine Anwendung dieses
Prinzips bilden ’Ontologien’, die im Folgenden das zu behandelnde Hauptthema darstellen.
5.2.3 Ontologien
Wie bereits im allgemeinen Abschnitt dieses Kapitels beschrieben, stellen
Begriffsstrukturierungen eine effiziente Möglichkeit dar, um den Informationszugang in stark
vernetzten Systemen zu verbessern. Wozu braucht aber eine transnationale Unternehmung
überhaupt eine spezielle Terminologie?
Eine Terminologie soll die Gesamtheit aller Begriffe und Benennungen in einem Fachgebiet
darstellen. Dies ist der Grundstein für eine ’fachsprachliche’ Kommunikation. Um eine
fachliche Kommunikation innerhalb von komplexen und verteilten Unternehmensstrukturen zu
gewährleisten, braucht man also eine exakt definierte, korrekte und geordnete Terminologie, die
außerdem möglichst sprachenunabhängig sein sollte. [Schmitz 2001]
Der Autor der vorliegenden Arbeit vertritt die Meinung, dass der Nutzen von terminologischen
Strukturen für die Organisation und Aufbereitung von Information in grenzüberschreitende
Unternehmen sich auf vielerlei Hinsichten äußert, zum Beispiel:
•
Unterstützung von lokalen und grenzübergreifenden Normungen
•
Umsetzung von Applikation (z.B. Navigation und Präsentation von Inhalten) in
benutzergerechter Sprache
•
Erstellung von kontrollierten und modifizierbaren Vokabularen
•
Verbesserte Lokalisierung und Internationalisierung
•
Festlegung unternehmensspezifischer Benennungen
•
Verbesserte Suchmechanismen
•
Echtes (internes und externes) global gültiges Corporate Identity
Ein Begriff ist die abstrakte Zusammenstellung von einer Benennung und einem Gegenstand.
Aus einer Zuordnung von Benennung und Begriff ergeben sich folgende Zusammenhänge:
Synonymie (ein Begriff - mehrere Benennungen), Homonymie (eine Benennung - mehrere
Begriffe) und Äquivalenz (gleiche Begriffe in mehreren Sprachen). Ein abstrakt definiertes
Begriffssystem wird oft Ontologie genannt und stellt eine hierarchisch geordnete
Fachgebietsklassifikation dar [Schmitz 2001].
Es sei an dieser Stelle darauf hingewiesen, dass eine Klassifikation nicht unbedingt eine
Hierarchie oder Ordnung impliziert, da sie eher die Zerlegung einer Objektmenge, welche
möglichst viele gleichartige Objekte in derselben Klassen und möglichst viele unterschiedliche
Objekte in unterschiedlichen Klassen beinhaltet, darstellt [Schmitz 2001].
Die nächsthöhere Stufe in Hinblick auf einer semantischen Grundlage wäre eine Taxonomie,
d.h. die Ordnung von Objekten in Klassen, nicht nur aufgrund von Charakteristika, sondern
auch aufgrund von Zusammenhängen (Beziehungen). Das Hauptziel von Ontologien ist es,
Konstrukte zur Verfügung zu stellen, die das Erstellen von semantisch höheren
Wissensstrukturen erlauben, um Konzepte oder Domänen zu spezifizieren und organisieren
[Pralle 1999].
Kapitel 5 - WISSENSORGANISATION
Seite 80
Die in [Studer et al. 2001] angegebene - von T. R. Gruber stammende - Definition einer
Ontologie lautet:
„Eine Ontologie ist eine formale, explizite Spezifikation einer gemeinsamen
Konzeptualisierung“.
Weiters wird die Definition wie folgt genauer analysiert [Studer et al. 2001] 40:
„Unter Konzeptualisierung versteht man ein abstraktes Modell bestimmter
Phänomene und Domänen mit deren identifizierten relevanten Begriffen. Explizit
bedeutet, dass Art und Bedingung eines jeden Begriffes explizit angegeben und
definiert werden. Formal müssen Ontologien sein, um maschinenverstehbar zu
sein, was eine natürlichsprachliche Darstellung ausschließt. Gemeinsam
signalisiert, dass es sich bei einer Ontologie nicht um eine einzelne, individuelle
Ansicht von Wissen handelt, sondern um eine Darstellung, auf die sich eine
bestimmte Benutzergruppe geeinigt hat und über die folglich ein Konsens
besteht.“
Das Hauptziel einer Ontologie ist somit Wissen einer Domäne explizit zu modellieren.
Ontologien vermitteln ein allgemein gültiges (sorgfältig generiertes und allgemein anerkanntes)
Verständnis dieser Domäne, welches von Anwendungen und Benutzergruppen gemeinsam
geteilt und wiederverwendet werden kann.
Eine Ontologie beinhaltet somit ’notwendigerweise’ – wie auch in [Studer et al. 2001]
identifiziert - alle relevanten Begriffe der Domäne und ordnet diese in einer Taxonomie an.
Durch die Einführung von ontologiebasierten Klassifikationsmechanismen in verteilten
Informationssystemen für transnationale Unternehmen entsteht ein unternehmensspezifisches
Modell, durch das sich die Kommunikation (Mensch-Maschine-Mensch-Kommunikation) und
die Organisation des intellektuellen Kapitals von einer syntaktischen Ebene hin zu einer
semantischen verschiebt, da für alle Beteiligten die Bedeutung von Wissenseinheiten eindeutig
durch das gemeinsame Modell festgelegt und klargestellt wird.
Die unterschiedlichen ’Sprachen’, welche sich aus der terminologischen Vielfalt ergeben und
von ’Ontologisten’ verwendet werden, lassen sich wie folgt gruppieren und erklären [Kyriakov
et al. 2001]:
a) Konzept – Eigenschaft - Beziehung
Konzepte: statische und kognitiv-autonome semantische Phänomene (d.h. die
Klassen der Domäne).
Eigenschaften: Charakteristika, Aspekte oder Attribute der Konzepte und deren
Beziehungen untereinander (d.h. Eigenschaften bestehen aus Attributen und
Beziehungen).
Beziehungen: meist dargestellt durch Verben.
b) Klassen – Objekte – Attribute:
Diese Unterteilung entspricht einem objektorientierten Lösungsansatz (im
programmiertechnischen Sinne).
c) Konzepte – Rollen – Individuen:
Diese Terminologie wird meist im Bezug auf Beschreibungslogik verwendet.
Die Rollen entsprechen hier den Eigenschaften von Konzepten.
Die Individuen entsprechen den konkreten Konzeptinstanzen.
40
Der fettgedruckte Stil einiger im Zitat vorkommenden Wörter wurde vom Autor der vorliegenden
Arbeit hinzugefügt.
Kapitel 5 - WISSENSORGANISATION
Seite 81
d) Collections - Individuals – Prädikate – Konstanten:
Dieses Paradigma findet in zyklischen Ansätzen Verwendung.
Die Collections entsprechen den Konzepten.
Die Individuals entsprechen den Instanzen.
Die Prädikate entsprechen den Eigenschaften.
Die Konstanten stellen Namen für Collections, Individuals oder Prädikate dar
Der nachfolgende Abschnitt gibt einen Überblick
Dokumenteninhalten in wissensbasierten Systemen.
über
die
Erschließung
von
5.2.4 Inhaltserschließung und Inhaltsanalyse
Bei der Inhaltserschließung geht es darum, den ’Inhalt’ eines Dokumentes zu erkennen, zu
erschließen, d.h. für Benutzergruppen geeignet aufzubereiten bzw. in einer speziellen
Repräsentationsform darzustellen [Sigel 2000]. Die Inhaltsanalyse befaßt sich mit der
’Essenzerkennung’ von Dokumenten. Beide Begriffe werden vom Bereich der
Wissensorganisation angewandt, wobei versucht wird, die Prinzipien der Inhaltserschließung
auf aktuelle Herausforderungen - bei denen es auf begriffliche Fundierung ankommt - zu
übertragen. Beispiele hierfür sind das Semantic Web und die Erstellung von Begriffsstrukturen
für Topic Maps (näheres über Topic Maps wird Abschnitt 5.4 ’Sichtweisen’ beschrieben).
In Bezug auf die Inhaltserschließung erkennt die Wissensorganisation die besondere Bedeutung
der gemeinsamen Funktion folgender Aspekte, [Sigel 2000]:
a) Abstrahieren: d.h. die Art der Abstraktion (informativ, indikativ, strukturiert,
zielgruppenspezifisch, usw.).
b) Indexieren: d.h. die Verwendung und Definition von Deskriptoren.
c) Klassifizieren: d.h. die Formulierung von ’Klassifikation zu Klassifikat’-Beziehungen.
Bei der Inhaltsanalyse geht es wiederum um den Interpretationsprozeß. Dieser Prozeß kann sehr
komplex sein, weshalb moderne technische Systeme (wie zum Beispiel eine automatische
Indexierungsapplikation) die intellektuelle Arbeit der Interpretation zwar einigermaßen
erleichtern kann, aber nicht ersetzen. Während eine Ontologie den ’formalen’ semantischen
Zugriff auf Informationseinheiten ermöglicht, findet bei der Inhaltsanalyse (bzw. -erschließung)
ein semantischer Zugriff unter ’inhaltlichen’ Gesichtspunkten statt [Sigel 2000].
In diesem Abschnitt wurden die verschieden Mechanismen vorgestellt, welche zu einer
semantischen Bereicherung von Informationseinheiten führen bzw. einen semantischen Zugang
ermöglichen. Die konkreten technischen Umsetzungen werden in den folgenden Abschnitten
’Organisationssysteme’ und ’Sichtweisen’ - in denen die unterschiedlichen Möglichkeiten der
Repräsentation, Modellierung, Klassifikation, Auffindung, Ordnung und Strukturierung von
Information präsentiert werden - beschrieben.
5.3 Organisationssysteme
Die in den vorigen Abschnitten dieses Kapitels beschriebenen Fachbereiche, welche zu einer
organisierten Informationsaufbereitung beitragen können, und die geschilderten Lösungsansätze
zur semantischen Anreicherung von Informationseinheiten (z.B. standardisierte
Metadatenformate, Ontologien und Taxonomien) bilden die Basis, um eine ’Repräsentation von
Bedeutung und Struktur auf Dokumentenebene’ zu ermöglichen.
Kapitel 5 - WISSENSORGANISATION
Seite 82
Mit einer strukturellen und semantischen Repräsentation auf Dokumentenebene ist eine
Darstellung gemeint, die folgende Aspekte umfasst:
•
die Nutzung von Mechanismen, welche auf ’physikalischer’ Ebene eine Speicherung
von Wissenseinheiten in kontextabhängigen Strukturen ermöglichen, und
•
die geeignete Integration von Systemen, die auf ’abstrakter’ Ebene einen semantischen
Informationszugang erlauben und eine kontextabhängige Präsentation von anwenderund zwecksorienterten Strukturen modellieren.
Die physikalische Ebene umfasst - wie im Kapitel 4 ’Datenmanagement’ bereits ausführlich
besprochen – alle betrieblichen und technischen Maßnahmen, um Daten auf Speicherebene
transparent und effizient zu verwalten. Der in diesem Kapitel hinzugekommene semantische
Aspekt erweitert die Aufgaben des Datenmanagements insofern, dass die Zusatzinformationen
(Metadaten oder Metastrukturen) auch transparent erreichbar sein sollten. Die abstrakte Ebene
umfasst Lösungsansätze, die auf spezifische Weise Begriffstrukturierungen modellieren und –
eventuell - dynamisieren. Eine Abstraktion kann somit – zweckgebunden - eine Teilung oder
einen Zusammenschluss von Logik und Präsentation erlauben.
Im Folgenden werden die unterschiedlichen Typen von Organisationssystemen, welche eine
domäneorientierte begriffliche Strukturierung ermöglichen, und deren wesentlichste
Eigenschaften, behandelt.
5.3.1 Typen von Organisationssystemen
Das primäre Ziel einer konzeptuellen Informationsaufbereitung ist es, Methoden anzubieten,
welche die effiziente Organisation des in einem Unternehmensgedächtnis erfassten
intellektuellen Kapitals ermöglichen. Hierfür sind – vor allem für große und geographisch
verteilte Unternehmen - Strategien der Wissensorganisation gesucht, um systematisch aus den
stark vernetzten und großen Datenbeständen genau jene relevante Information zu präsentieren,
die zum individuellen Bedarf im aktuellen Kontext passt.
Es ist empfehlenswert für transnationale Konzerne ein Klassensystem, welches zu jeder
Informationseinheit eine terminologische Kategorie aus einem Begriffssystem zuordnet, zu
implementieren. Hierbei stellt das Begriffssystem eine zum Unternehmenstyp entsprechende
und vereinheitlichte Wissensdomäne dar. In diesem Sinne stimmt die Auffassung des Autors der
vorliegenden Arbeit mit der in [Sigel 2001] dargelegten These überein. Sie besagt, dass das
Unternehmensgedächtnis in einem ’Lernenden Unternehmen’ eine flexible Begriffsstruktur
benötigt, und deswegen Kenntnisse im Bereich der Wissensorganisation genutzt werden sollten.
Das von [Probst et al. 1999] definierte ’Bausteinmodell des Wissens’, welches in [Abb. 2.5] des
Kapitels 2 ’Wissensmanagement’ präsentiert wurde, lässt besondere Bereiche mit hohem Anteil
an Semantik und Strukturierung erkennen [Gödert 2001]:
•
Wissensidentifikation
•
Wissenserwerb
•
Wissensentwicklung
•
Wissensbewahrung
Diese Bereiche sind für das Thema dieses Abschnittes von besonderer Wichtigkeit, da sie sich
dafür eignen, ’Semantik’ (=Bedeutung) zu erkennen, zu fixieren und zum Auffinden
Kapitel 5 - WISSENSORGANISATION
Seite 83
bereitzustellen [Gödert 2001]. Begriffe lassen sich auf unterschiedlicher Weise organisieren:
zum Beispiel chronologisch, alphabetisch, räumlich, nach physikalischen Attributen (Farbe,
Material, Größe, usw.) oder nach Themenbereichen.
Der, von den Disziplinen Wissensorganisation und Bibliothekswesen zur Verfügung gestellte
Lösungsansatz für das Festlegen einer Begriffsstruktur mit der Hilfe von einem ’kontrollierten
Vokabular’ erlaubt somit, den organisierten semantischen Zugang zum gesamten intellektuellen
Kapital eines großen Unternehmens. Mit ’kontrolliertes Vokabular’ ist ein standardisiertes
Begriffssystem gemeint, welches die Kodierung, Klassifikation oder – lediglich – Identifikation
von Daten und Information ermöglicht. Es sei an dieser Stelle darauf hingewiesen, dass im
Rahmen des Untersuchungsbereichs der vorliegenden Arbeit keine strenge Unterscheidung
zwischen den Begriffen ’kontrolliertes Vokabular’ und ’Organisationssystem’ in der Literatur
gefunden werden konnte. Das Ziel von kontrollierten Vokabularen und Organisationssystemen
ist es, Sammelstrukturen oder –mechanismen, welche gleichartige Objekte nach semantischen
Kriterien möglichst nahe gruppieren und verschiedenartige möglichst weit platzieren, zu
definieren.
Die für diesen Abschnitt gewählte Unterteilung von Organisationssystemtypen basiert auf der in
[Hodge 2000a] angegebenen allgemeinen Kategorisierung im Bereich der Digitalen
Bibliotheken, da diese eine besonders verständliche Beschreibung der unterschiedlichen
Möglichkeiten erlaubt. Demzufolge ergibt sich eine sinnvolle Unterteilung wie folgt:
•
•
•
Begriffslisten (engl.: ’Term Lists’)
o
Liste von Begriffen, die oft Definitionen beinhalten.
o
Beispiele hierfür sind ’Authority Files’, Glossare, Wörterbücher und
’Gazetteers’.
Beziehungslisten (engl.: ’Relationship Lists’)
o
In der vorliegenden Arbeit Beziehungsstrukturen genannt.
o
Liste von Beziehungen, die Verbindungen zwischen Begriffen und Konzepten
beinhalten.
o
Beispiele hierfür sind Thesauri, Semantische Netzwerke und Ontologien.
Klassifikationen und Kategorien
o
In der vorliegenden Arbeit Themenhierarchien genannt.
o
Systeme, welche die Erstellung von Themenmengen erlauben.
o
Beispiele hierfür sind ’Subject Headings’, Klassifikationssysteme, Taxonomien
und Kategorisierungssysteme.
In der vorliegenden Arbeit kommt das Thema ’Clustering’ hinzu, da es – als Teilbereich des
Information Retrieval und analog zum Ziel der Systeme im Bereich der Wissensorganisation –
Mechanismen und Algorithmen behandelt, die ’ähnliche’ Dokumente in Klassen gruppiert.
In diesem Zusammenhang, und in Übereinstimmung mit der in [Baeza-Yates et al. 1999]
angegebenen Beschreibung, stellt ’Clustering’ eine Operation auf Dokumentenmengen, und
nicht auf Textinhalte, dar.
Der Hauptteil dieses Abschnittes bilden die ’Klassifikationen und Kategorien’, da sie sich am
besten für kontextabhängige Themenhierarchien eignen, welche eine optimale taxonomische
Kapitel 5 - WISSENSORGANISATION
Seite 84
Ordnung, Strukturierung und Verwaltung von Ressourcen in verteilten Informationssystemen
für transnationale Konzerne erlauben.
5.3.2 Begriffslisten
Die hier dargestellte Beschreibung von Begriffslisten basiert auf den in [Hodge 2000a]
identifizierten Definitionen über ’Term Lists’ für Digitale Bibliotheken. Listen von Begriffen,
welche für die Kontrolle von wechselnden Namen innerhalb einer Terminologie oder von
Werten für Domänen in einem spezifischen Bereich bestimmt sind, werden Authority Files
genannt. Authority Files beinhalten in der Regel keine tiefe Organisation oder komplexe
Struktur, die Ordnung erfolgt meist alphabetisch oder über flache (d.h. einfache)
Klassifikationssysteme. Beispiele hierfür beinhalten Namen für Länder, Personen und
Organisationen.
Erreichen solche Listen eine bestimmte Länge, so kann eine beschränkte Tiefe, d.h.
hierarchische Ordnung, eingeführt werden, um die Navigation zu erleichtern. Beispiele für
Authority Files sind das ’Library of Congress Name Authority File (LC-NAF) 41’ und das
’Getty Geographic Authority File 42’.
Ein Glossar ist eine Liste von Begriffen, welche in der Regel Definitionen enthält. Die Einträge
in einem Glossar sind spezifisch zu einem Themenbereich, sind definiert innerhalb der Grenzen
eines bestimmten Systems und beinhalten deshalb selten wechselnde (dynamische)
Bedeutungen. Ein Beispiel hierfür ist die ’United States Environmental Protection Agency:
Terms of the Environment 43’.
Wörterbücher sind alphabetische Listen von Wörtern und deren Definitionen, und umfassen
größere (allgemeinere) Bereiche als Glossare. Wörterbücher können zusätzliche Information,
wie zum Beispiel Ursprung, Morphologie oder Aussprache des Wortes, enthalten. Obwohl
Wörterbücher auch Synonyme oder ähnliche Begriffe zu einzelnen Wörtern über die Definition
enthalten können, lassen sie keine explizite hierarchische Struktur oder Gruppierung nach
Konzepten erkennen.
Ein Gazetteer ist ein geographisches Lexikon oder Verzeichnis, welches Ortsnamen auflistet wie zum Beispiel das Verzeichnis im hinteren Teil eines Weltatlas - und entsprechende
Kennzeichnungen (Fluß, Berg, Koordinatenangaben, usw.) enthält.
Eine Anwendung von Begriffslisten für die Wissensorganisation und semantische
Informationsaufbereitung in transnationalen Konzernen ist nur eingeschränkt empfehlenswert,
da sich ihre einfache Funktionalität nicht besonders gut für komplexe Begriffsstrukturen eignet.
Falls aber eher flache und kurze Auflistungen von Konzepten in Frage kommen, können diese
Systeme durchaus gute und überschaubare Strukturen darstellen, welche einen semantischen
Zugang zu ’dahinterliegenden’ Informationseinheiten erlauben.
5.3.3 Beziehungsstrukturen
Ein anderer Typ von Organisationssystemen stellen die Beziehungsstrukturen, meist unter der
anglosprachigen Bezeichnung ’Relationschip Lists’ bekannt, dar. Diese Strukturen zeichnen
41
http://www.loc.gov/catdir/pcc/tgauthrpt.html
http://www.getty.edu
43
http://www.epa.gov/OCEPAterms/
42
Kapitel 5 - WISSENSORGANISATION
Seite 85
sich dadurch aus, dass sie Verbindungen zwischen Begriffen und Konzepten beinhalten. Die
wichtigsten Beispiele von Begriffsstrukturen, wie bereits im Abschnitt 5.3.1 erwähnt, sind
Thesauri, Semantische Netzwerke und Ontologien. Die Untersuchung dieser Untergruppen stellt
den Schwerpunkt dieses Abschnitts dar.
Ordnungssysteme, welche auf der Basis von Beziehungsstrukturen aufgebaut sind, lassen an den
Enden einer Beziehung (Relation) nur Begriffe eines bestimmten Typs zu. Sie beinhalten also
sogenannte Rolleneinschränkungen (engl.: ’role constraints’), wodurch sie als mächtige
Schablonen (engl.: ’Templates’) eingesetzt werden können [Sigel 2000a]. Ein Beispiel, um
diesen Sachverhalt zu verdeutlichen, wird in [Sigel 2000a] angegeben und wird in [Tab. 5.1]
dargestellt:
Rolle
Libretto
Librettist
>
Relation
ist geschrieben von
hat geschrieben
>
Rolle
Librettist
Libretto
Tabelle 5.1: Beispiel einer Relation in einer Beziehungsstruktur [Sigel 2000a]
Die Relation ’ist geschrieben von(Libretto, Librettist)’ könnte die Behandlung von Spezialfällen
erlauben, falls eine weiter Relation, wie in [Tab. 5.2] dargestellt, definiert wurde und eine
’Relationshierarchie’ (bestehend aus einer Relation zwischen einem Ober- und einem
Unterbegriff) zuläßt:
Rolle
Werk
Autor
>
Relation
wurde geschaffen von
schuf
>
Rolle
Autor
Werk
Tabelle 5.2: Beispiel einer Relation in einer Beziehungsstruktur [Sigel 2000a]
Wenn also Libretto ein Werk und Librettist ein Autor sind, dann sind die Relationen ’ist
geschrieben von’ und ’hat geschrieben’ Spezialfälle von ’wurde geschaffen von’ und ’schuf’.
Das Wort Thesaurus hat griechischen und lateinischen Ursprung, wird als eine Referenz zu
einem ’Wortschatz’ (engl.: ’treasury of words’) verwendet und besteht, in einer vereinfachter
Form, aus:
a) einer vordefinierten Liste von den für eine spezifische Wissensdomäne wichtigsten
Wörtern, und
b) einer zu jeden Listeneintrag dazugehörenden Menge von ’verwandten’ Wörtern (in der
Regel Synonyme). [Baeza-Yates et al. 1999]
In der allgemeinen Form bestehen Thesauri aus einem genormten Vokabular und einer
komplexeren Struktur als lediglich Listen. Die Relationseinträge in einem Thesaurus, auch
Deskriptoren genannt, können somit mehrfache Angaben, wie zum Beispiel ein Datum, eine
Begriffsnummer, eine Definition, ein Gültigkeitsbereich, eine Notation oder eine
Klassifikationsbeschreibung, beinhalten.
Die Bedeutung der Thesauri für die vorliegende Arbeit liegt in ihrer Implementierung in
webbasierten Systemen. In [Shiri et al. 2000] identifiziert man folgende Thesauritypen für das
Web:
•
Thesauri in einfachen statischen Textformaten,
•
Thesauri in HTML Format ohne effektive Nutzung von Hyperlinks (statisch),
Kapitel 5 - WISSENSORGANISATION
Seite 86
•
Thesauri in dynamischem HTML Format mit navigierbaren Hyperlinks,
•
Thesauri mit fortgeschrittenen visuellen und graphischen Interfaces und
•
Thesauri in XML Format.
Die wichtigsten allgemeinen Verwendungsgründe von Thesauri, wie in [Baeza-Yates et al.
1999] identifiziert, lauten wie folgt:
•
Das Bereitstellen eines Standardvokabulars (oder Referenzsystems) für das Indizieren
oder Suchen von Information.
•
Die Benutzerunterstützung bei der Formulierung von Suchabfragen durch das
Auffinden von ’ähnlichen’ Begriffen.
•
Das Verfügbarmachen von klassifizierten Begriffshierarchien, welche die aktuelle
Abfrage semantisch und bedarfsgerecht ausweiten oder einschränken können.
Das in [Shiri et al. 2000] gezeigte Beispiel für eine benutzerfreundliche Antwort des Thesaurus
ERIC 44, welches den Begriff ’high school’ als Deskriptor nicht kennt, aber trotzdem ähnliche
Einträge findet, die eine weitere Navigation bzw. eine erneute Sucheingabe ermöglicht, wird in
[Abb. 5.1] dargestellt.
Abbildung 5.1: Antwort des Thesaurus ERIC nach einer Suchabfrage [Shiri et al. 2000]
Der Autor der vorliegenden Arbeit vertritt die Meinung, dass der Grund für die Wichtigkeit der
Erstellung bzw. Anwendung von Thesauri zum Zweck der semantischen
Informationsaufbereitung, im vom Bereich des Wissensmanagements geprägten Ansatz der
Nutzung eines Organisationsgedächtnisses für die Verwaltung vom intellektuellen Kapital liegt.
Das heißt, wenn man ein Unternehmen als ein ’lernfähiges’ Wesen betrachtet, so ist die
Verwaltung seines Organisationsgedächtnisses analog zu – aber natürlich nicht identisch mit –
dem begrifflichen Lernmechanismus des menschlichen Gedächtnisses.
Die Abbildung von Terminologien unseres Gehirns in Benennungen der natürlichen Sprache ist
beim menschlichen Denken ein wichtiges Hilfsmittel zur Strukturierung von Wissen. Dieser
44
http://searcheric.org/
Kapitel 5 - WISSENSORGANISATION
Seite 87
Mechanismus dient hauptsächlich der Kommunikation, um beispielsweise Wissen
auszutauschen. Das oftmalige Vorkommen von Situationen, bei denen für bestimmte zu
übermittelnde Vorstellungen ’keine Worte gefunden werden können’, läßt erkennen, dass
Menschen nicht unbedingt in Sprache, sondern in Begriffen, denken. [Umstätter 2000]
Ein Problem bei der semantischen Erstellung von Thesauri ist, dass der Mensch für zu
komplexe Begriffe, die das Gehirn erfahrungsgemäß oder logisch erzeugt hat, Benennungen erst
neu erzeugen muß. Ein Gegenargument dazu wäre die bekannte These, dass auch die Begriffe
aus Zeichenketten, die im neuronalen Netz des Gehirns ausgetauscht werden, bestehen. Diese
haben aber noch nichts mit der natürlichen Sprache zu tun. [Umstätter 2000]
Der Anbruch der elektronischen Verarbeitung der natürlichen Sprache brachte signifikante
Entwicklungen bzw. Fortschritte im Bereich der Semantischen Netzwerke mit sich. Diese
Organisationssysteme erlauben eine komplexe Strukturierung von Konzepten und Begriffen als
Netze und nicht als Hierarchien. Die damit erzeugten Graphen besitzen Konzepte als Knoten
und Relationen als gerichtete Verbindungskanten. Eines der bekanntesten semantischen
Netzwerke ist jenes der lexikalischen Datenbank für die englische Sprache ’WordNet’ 45 von der
Princeton University (USA), welches von vielen Suchmaschinen verwendet wird. [Hodge
2000a]
Ein Beispiel für die Anwendung von semantischen Netzen wird in [Abb. 5.2] dargestellt.
Anhand des semantischen Netzes auf der rechten Seite der Abbildung wird die räumliche
Beziehung der links dargestellten geometrischen Figuren ausgedrückt.
Abbildung 5.2: Beispiel für die Anwendung von semantischen Netzen [Guetl 2000]
Die Knoten und Kanten eines semantischen Netzes können simultan zwei Rollen spielen:
einerseits können sie Wissen in ’realen Strukturen’ (z.B. Dokumente in einer Datenbank)
ausdrücken, und andererseits eine semantische und vernetzte Verbindung zu den Dokumenten
darstellen. In diesem Sinne kann man Regeln (d.h. ’Beziehungsregeln’ wie zum Beispiel AND,
OR, usw.) in den Kanten so definieren, dass sie die Semantik von zwei benachbarten
Knotenpunkten erweitern. Somit sind beispielsweise Implementierungen lösbar, die logische
Verknüpfungen (AND, OR, usw.) von in Knoten definierten Suchkriterien erlauben [Huber
1998].
Anhand semantischer Netze können auch Algorithmen erklärt werden, die im Bereich der
Wissensverarbeitung häufig angewandt werden. Dazu gehören zum Beispiel Algorithmen zur
Suche in Graphen und zur Behandlung von Spielbäumen. [Guetl 2000]
45
http://www.cogsci.princeton.edu/~wn/
Kapitel 5 - WISSENSORGANISATION
Seite 88
Der graphentheoretische Hintergrund von semantischen Netzen spielt bei der Konzeption von
Ontologien oder Modellierung von Wissenskarten eine entscheidende Rolle, worauf in
Abschnitt 5.4 ’Sichtweisen’ näher eingegangen wird. Ziele, Definition und Eigenschaften von
Ontologien wurden im vorangegangenen Abschnitt 5.2 ’Semantik’ schon ausführlich
besprochen. An dieser Stelle sei lediglich an die Bedeutung von Ontologien für
Begriffsstukturierungen in Informationssystemen für transnationale Konzerne hingewiesen.
Hierfür ist wieder der Vergleich einer funktionellen bzw. strukturellen Darstellung des
intellektuellen Kapitals von Unternehmungen als Organisationsgedächtnis mit der
terminologischen Funktionsweise des menschlichen Gehirns.
Menschen wenden ständig und überall Ontologie an. Und zwar, indem sie versuchen, die
Bedeutung von Worten und Zeichen aus ihren Zusammenhängen zu rekonstruieren. Mit der
Hilfe von Ontologie (hier als ’Seinslehre’ im Sinne der modernen Linguistik interpretiert)
versuchen Menschen durch Induktion von möglichst vielen Einzelfällen auf das Allgemeinere
zu schließen. Je einheitlicher die Erfahrungen sind, desto einfacher sind Definitionen
formulierbar. Je umfangreicher diese Definitionen sind, desto sicherer erscheint eine Aussage.
Andererseits werden Definitionen - aller Wahrscheinlichkeit nach - umso heterogener, je
umfangreicher die Erinnerungen (Erfahrungen) sind. Diesbezüglich wird in [Umstätter 2000]
ein Beispiel angegeben, das nicht nur diesen Sachverhalt erklärt, sondern auch die Wichtigkeit
des Bibliothekswesens für die Wissensorganisation ans Licht bringt:
ein ’Laie’ versucht normalerweise aufgrund der Frage ’Was versteht man unter einer
Bibliothek?’ eine möglichst ’typische’ (für den Laien bekannte) Bibliothek zu
beschreiben. Ein Bibliothekar (im allgemeineren Sinne ein Fachspezialist in einer
spezifischen Wissensdomäne) hat dagegen nicht nur eine größere Erfahrung hinsichtlich
der Vielfalt des Begriffs ’Bibliothek’, er kennt meist mehrere Typen aus eigener
Anschauung. Weiters hat er Fachliteratur gelesen und auch gelernt den Umfang seiner
Kenntnisse so zu kategorisieren, dass er zwischen den unterschiedlichen
Bibliothekssystemen, -aufgaben, -bautypen, usw. unterscheiden kann.
Wenn man diesen Sachverhalt auf das Informationssystem eines transnationalen Konzerns
zurückführt, geht es also darum, einen ’Wortschatz’ (d.h. ein kontrolliertes Vokabular)
festzulegen, den man unternehmensweit in möglichst gemeinsamer Eindeutigkeit benutzen
kann. Das umfangreiche intellektuelle Kapital (und infolgedessen das umfangreiche
Organisationsgedächtnis) von so einem Unternehmen und die Vielzahl an Interaktionen
zwischen Informationssystem und Benutzern können über transparente Begriffsstrukturierungen
einen guten Mechanismus darstellen, um eine global geltende Terminologie auf
bedarfsgerechter und kontextabhängiger Weise effizient zu verwalten.
5.3.4 Themenhierarchien
In diesem Abschnitt werden die unterschiedlichen Organisationssysteme, welche die Festlegung
von Themenmengen ermöglichen, präsentiert und analysiert. Diese Systeme werden hier wie
folgt unterteilt:
o
o
o
o
Subject Headings
Klassifikationssysteme
Taxonomien
Kategorisierungssysteme
Das Schema von Subject Headings stellt eine Menge von kontrollierten Begriffen, um die
Themen (Fachbereiche) einer Wissensdomäne darzustellen, zur Verfügung.
Kapitel 5 - WISSENSORGANISATION
Seite 89
Subject Headings sind meistens ’Listen’ mit einer sehr umfangreichen aber nicht tiefen
hierarchischen Struktur. Beispiele hierfür sind ’Medical Subject Headings 46 (MeSH)’ und
’Library of Congress Subject Headings 47 (LCSH)’. [Hodge 2000a]
Die LCSH unterscheidet vier grundsätzliche Typen von Subject Headings (SH) 48:
•
’Thematische’ (engl.: ’topical’) Subject Headings enthalten ein Wort oder eine Phrase,
welche einen Inhalt, einen Themenbereich oder ein Dokument beschreiben. Ein Beispiel
dafür wäre der Name eines Unternehmensbereichs.
•
’Form’-Subject-Headings werden verwendet, um die Gattung oder den Stil des zu
katalogisierenden Eintrags zu beschreiben. Ein Beispiel dafür wäre
’Projektmanagerdaten’. Damit ist hier eine Menge von Dokumenten, die für
Projektmanager – unabhängig vom thematischen Inhalt - publiziert wurden, gemeint.
•
’Geographische’ Subject Headings können auf zwei unterschiedliche Weisen
angewendet werden. Sie können einfach einen geographischen Namen, wie zum
Beispiel
’Guatemala’,
enthalten,
oder
in
Kombination
mit
anderen
Beschreibungswörtern erscheinen, um das Hauptaugenmerk des Themeneintrags
besonders zu kennzeichnen. Ein kombinierter Eintrag könnte somit ’GuatemalaForschung’ oder ’Forschung-Guatemala’ lauten. Die Reihenfolge der Einträge soll dem
System bekannt sein, um die einzelnen Wörter prioritätsabhangig zu behandeln.
•
’Perioden’-Subject-Headings (engl.: ’period subject headings’) beschreiben eine
spezifische Zeitspanne und können nicht nur numerische Zeitangaben beinhalten,
sondern auch Epochennamen (zum Beispiel ’Die Achtziger und Neunziger’ oder
’Nachkriegszeit’) oder bekannte Zeiteinheiten (zum Beispiel ’Dekade’ oder
’Jahrhundert’) enthalten. Diese können auch in kombinierter Form angegeben werden.
Klassifikationssysteme, Taxonomien und Kategorisierungssysteme
Die Begriffe ’Klassifikationssysteme’, ’Taxonomien’ und ’Kategorisierungssysteme’ werden
hier als gemeinsamer Punkt behandelt, da sie in der Literatur abwechselnd Verwendung finden.
Im Allgemeinen stellen diese Organisationssysteme Möglichkeiten zur Verfügung, um
Einheiten in Gruppen zu sammeln oder in relativ umfassenden Themenebenen zu trennen. Sie
stellen meist hierarchische Ordnungen in numerischer oder alphabetischer Notation dar, um
möglichst tiefe (fachspezifische) Themenstrukturen zu beschreiben. Diese Typen von
Organisationssystemen folgen in der Regel nicht den strengen Richtlinien für Hierarchien des
ANSI NISO Thesaurus Standards (Z39.19), wodurch es ihnen am expliziten
Beziehungsmechanismus von Thesauri mangelt [Hodge 2000a].
Da in der Literatur keine deutlich getrennte Behandlung von Bedeutung, Zielsetzung und
Eigenschaften dieser Systeme zu finden ist, wird nun der Versuch unternommen - zumindest
terminologisch – eine Unterscheidung zwischen Klassifikation, Taxonomie und Kategorisierung
anzubieten.
Unter Klassifikation versteht man, laut [Pralle 1999], die Zerlegung einer Menge von Objekten
in Klassen aufgrund gewählter Merkmale. Eine Hierarchie oder Ordnung der Klassen ist in einer
allgemeinen Klassifikation nicht unbedingt erforderlich. Das Hauptziel besteht darin,
hinreichend gleichartige Objekte in derselben Klasse und hinreichend unterschiedliche Objekte
in unterschiedlichen Klassen zu verteilen. Die resultierende Struktur ist meist ein Wald (eine
46
http://www.nlm.nih.gov/mesh/meshhome.html
http://www.lib.utah.edu/instruction/handouts/LCSH/lcsh.html
48
http://www.lili.org/isl/cepage/Courses/Course6/<13 bis 17>types.htm
47
Kapitel 5 - WISSENSORGANISATION
Seite 90
Menge von Bäumen, die nicht unbedingt miteinander verbunden sein müssen). Eine Taxonomie
ist hingegen die Ordnung von – meist biologischen – Objekten in Klassen aufgrund von
Beziehungen (Ähnlichkeit, Evolution, usw.) und nicht aufgrund äußerer Merkmale [Pralle
1999]. Taxonomien werden meist als hierarchisch geordnete Klassifikationen aufgefaßt. Das
Resultat bildet in diesem Fall ein Baum.
Eine Kategorie wird in [Easterbrook 1998] einfach als die Vereinigung von Klassen von
Objekten und Klassen von Morphismen definiert. Es entsteht also ein gerichteter Graph mit
Objektklassen als Knoten und Morphismen als gerichtete Kanten. Die in [Easterbrook 1998]
präzise formulierte Definition einer Kategorie lautet wie folgt (die graphische Darstellung
hierfür wird in [Abb. 5.3] präsentiert):
„Eine Kategorie besteht aus:
- einer Klasse von Objekten und
- einer Klasse von Morphismen (’Pfeilen’).
- Für jedes Morphismus f existiert ein Objekt als Domäne von f und ein
Objekt als Ko-Domäne von f.
- Für jedes Objekt A existiert ein Identitätsmorphismus, welches als
Domäne und Ko-Domäne das Objekt A besitzt (’IDA’)
- Für jedes Paar von Morphismen f: A→B und g: B→C
(zum Beispiel cod(f) = dom(g))
existiert ein Kompositionsmorphismus g o f: A→C
... mit den Regeln:
- Identitätskomposition: für jedes Morphismus f: A→B existieren die
Kompositionsmorphismen (f o IDA = f) und (IDB o f = f).
- Assoziativität: Für jede Menge von Morphismen f: A→B, g: B→C, h:
C→D gilt (h o g) o f = h o (g o f).“ 49
Abbildung 5.3: Graphische Darstellung der Eigenschaften von Kategorien. Von oben nach unten:
Morphismus; Identitätsmorphismus; Kompositionsmorphismus; Assoziativität. [Easterbrook 1998]
49
Definition einer Kategorie laut [Easterbrook 1998]
“A category consists of:
- a class of objects
- a class of morphisms (‘arrows’)
- for each morphism, f, one object as the domain of f and one object as the codomain of f.
- for each object, A, an identity morphism which has domain A and codomain A. (“IDA”)
- for each pair of morphisms f: A→B and g: B→C,
(i.e. cod(f)=dom(g)), a composite morphism, g o f: A→C
With these rules:
- Identity composition: For each morphism f: A→B, (f o IDA = f) and (IDB o f = f)
- Associativity: For each set of morphisms f:A→B, g:B→C, h:C→D, (h o g) o f = h o (g o f)”
Kapitel 5 - WISSENSORGANISATION
Seite 91
Beim Voranschreiten zu immer allgemeineren Begriffen gelangt man in einer
Klassifikationshierarchie schließlich an eine Themenbereichsgrenze, jenseits welcher kein
allgemeinerer (merkmalsärmerer) Oberbegriff mehr sinnvoll ist [Sigel 2001].
Der somit gefundene Oberbegriff bildet eine Kategorie. Die ihnen untergeordneten Begriffe
bezeichnet man als eine "Facette" von Begriffen. Insbesondere umfassen Kategorien alle
Begriffe, nach denen man in einem Informationssystem zuverlässig suchen will. Wichtig ist
diesbezüglich noch zu erwähnen, dass Kategorien durch die Nutzer des Informationssystems
festgelegt werden sollten [Sigel 2001].
Kategorien haben somit in einem Informationssystem folgende Funktionen [Sigel 2001]:
•
Sie dienen als Richtlinie bei der Zusammenstellung des Vokabulars für die
Indexsprache.
•
Sie helfen bei der Wahl ’ordnungsfreundlicher’ Unterteilungsgesichtspunkte.
•
Sie stellen Richtlinien zur Aufgabenteilung zwischen Wortschatz und Grammatik bei
der Begriffsanalyse dar.
•
Sie dienen als Richtlinie bei der Definition von Fachbegriffen.
•
Sie unterstützen die Grobgliederung eines spezialisierten Wortschatzes.
Themenkategorien werden häufig verwendet, um Thesauribegriffe in breite Themenmengen zu
gruppieren, welche sich dann außerhalb des hierarchischen Schemas des Thesaurus befinden.
Taxonomien finden heutzutage zunehmend im objektorientierten Entwurf und in
Wissensmanagementsystemen Anwendung, um Objekte aufgrund spezieller Eigenschaften zu
gruppieren. Desweiteren werden Taxonomien bei Schemata verwendet, welche ’Biota’ auf der
Basis irgendwelcher spezieller Charakteristika hierarchisch darstellen (d.h. um botanische
Klassen festzulegen). [Hodge 2000a]
Wie schon in den vorangegangenen Abschnitten beschrieben, bestehen Klassifikationssysteme
auch aus Deskriptoren (Beschreibungselementen). Syntax und Semantik solcher Deskriptoren
sind in Form sogenannter ’Dokumentationssprachen’ festgelegt. Um sich von der konkreten
sprachlichen Formulierung in dem zu klassifizierenden Dokument zu lösen, wird eine – vom
Dokument - unabhängige Repräsentation des Textinhaltes bzw. der Dokumentenbedeutung
durch Verwendung eines speziellen Vokabulars verwendet. Dieses Vokabular soll alle
mehrfachen Bedeutungen und die Probleme morphologischer und syntaktischer Art der
natürlichen Sprache vermeiden. Der Begriff ’Dokumentationssprachen’ stammt aus dem
Bereich ’Information Retrieval’ und beinhaltet die in der vorliegenden Arbeit besprochenen
’Klassifikationssysteme’ und ’Thesauri’. [Fuhr 1999]
Die am häufigsten anzutreffende Ordnung innerhalb eines großen und verteilten
Informationssystems erfolgt nach Fachgebieten. Dies verdeutlicht den hohen Stellenwert einer
thematischen Klassifikation in Verbindung mit Such- und Navigationsproblemen. [Heber 2000]
Die im Folgenden präsentierte Unterteilung von Klassifikationssystemen entspricht jener in
[Koch et al. 1997], wobei die wichtigste Gruppe von sogenannten ’Universalschemata’ (engl.:
’universal schemes’), welche eine umfassende Wissensordnung erlauben, dargestellt wird. Die
zweite Gruppe bilden die ’nationalen Allgemeinschemata’ (engl.: ’ national general schemes’),
die zwar bezüglich der Themen allgemein gehalten werden, jedoch für ein einzelnes Land oder
geographisches Gebiet entwickelt werden. In der dritten Gruppe sind ’fachspezifische
Schemata’ (engl.: ’subject specific schemes’) anzuordnen. Diese Schemata umfassen, wie der
Name schon verdeutlicht, ganz bestimmte Fachbereiche in sehr detaillierter Form. Die letzte
Kapitel 5 - WISSENSORGANISATION
Seite 92
Gruppe bilden die ’selbstentwickelten Themenschemata’ (engl.: ’home-grown schemes’),
welche zunehmend als ’Ontologien’ im Internet Verbreitung finden. [Koch et al. 1997] [Heber
2000]
Die Verwendung von Klassifikationssystemen, um Wissen – zum Beispiel in sehr großen und
geographisch verteilten Intranetumgebungen – effizient zu organisieren, bietet eine Reihe von
Vorteilen, unter denen man vor allem folgende findet:
•
Klassifikationssysteme können (aufgrund der hierarchischen Hierarchie) dabei helfen,
einen Suchbereich zu erweitern (um den ’Recall’ zu erhöhen) oder ihn einzuschränken
(um die ’Precision’ zu erhöhen oder Filterung zu ermöglichen). [Koch et al. 1997]
•
Die Navigation durch die in Klassen eingeteilten Wissenseinheiten kann intuitiver und
effizienter, aber vor allem überschaubarer gestaltet werden.
•
Die Organisation von Wissen in Klassenhierarchien ordnet den einzelnen Einheiten
einen Kontext zu, wodurch das Problem von Homonymen (d.h. Wörtern mit gleicher
Form und Aussprache aber mit unterschiedlichen Bedeutungen) zumindest teilweise
gelöst werden kann. [Koch et al. 1997]
•
Die weit verbreitete und stets zunehmende Anwendung von Klassifikationsschemata
kann statistische Kennwerte über Klassenverteilungen und -schwerpunkte in großen
Wissensdatenbanken liefern. Diese Werte können zur Verbesserung des jeweiligen
Klassifikationsschemas herangezogen werden, zur Weiterentwicklung neuer Hilfsmittel
zur Kategorisierung und Auffindung beitragen, oder die Funktionalität der voll- und
semiautomatischen Klassifikationsmechanismen verbessern. [Heber 2000]
Wie oben schon erwähnt, unterscheidet man meist zwischen den folgenden vier Typen von
Klassifikationsschemata:
a) Universalschemata
b) Nationale Allgemeinschemata
c) Fachspezifische Schemata
d) Selbstentwickelte Themenschemata
Welche dieser Schemata sich für ein Informationssystem am besten eignet hängt vom
Aufgabenbereich und der Zielgruppe der Anwendung ab. Für den Einsatz in großen und global
geltenden Informationssystemen empfiehlt sich ein Universalschema. Falls sich das System
einem spezifischen und abgeschlossenen Fachgebiet zuordnen lässt, oder in privaten bzw.
kommerziellen Anwendungen eingesetzt werden soll, dann kommt eher der Einsatz eines
selbstentwickelten oder eines fachspezifischen Schemas in Frage. Universalklassifikationen
hingegen bieten wesentliche Vorzüge in akademischen Systemen. Verschiedene Schemata
können gleichzeitig zur Anwendung kommen, wobei Konvertierungstools bei der
Zusammenführung der Themenhierarchien notwendig sind. Durch die sprachenunabhängige
(meist arabisch numerische) Notation eines Universalschemas ist das Problem der
Mehrsprachigkeit unter Kontrolle [Koch et al. 1997].
Der Zugang zu Information kann über verschiedensprachige Indizierungen erfolgen ohne
Änderungen in den Datenbankbeständen selbst durchführen zu müssen [Heber 2000]. Dieser
Ansatz verdient vor allem bei Informationssystemen in transnationalen Konzernen besonderes
Augenmerk. Desweiteren sind Universalkataloge heutzutage alle in computer-lesbarer Form
verfügbar.
Kapitel 5 - WISSENSORGANISATION
Seite 93
Zu den kritischen Aspekten bei der Verwendung von Universalschemata zählen folgende, in
[Heber 2000] und [Koch et al. 1997] identifizierte, Punkte:
•
Die Struktur der Themenhierarchie in Universalschemata folgt nicht immer formalwissenschaftlichen Regeln, sondern subjektiven Kriterien. Die somit entstandenen
inkonsistenten Abschnitte haben zum Teil ihre Ursache in den weit zurückliegenden
Anfängen der Katalogisierung. Eine Anpassung an die Notwendigkeiten, die
beispielsweise das Web an ein Klassifikationsschema stellt, wird bereits dahingehend
durchgeführt, dass man sich von dem aufzählenden Konzept weg in Richtung
aspektorientierter Klassifikation bewegt.
•
Universalschemata werden meist durch international kooperierende Organisationen
verwaltet. Änderungen der Themenhierarchie sind also erst nach genauen und
zeitintensiven Überprüfungen möglich. Dies kann sich bei sehr dynamischen
Organisationsgedächtnissen zufolge der eingeschränkten Aktualisierung bzw. der
umständlichen Einbindung neuer Themen kritisch auswirken.
•
Nationale Allgemeinschemata besitzen in der Regel die gleichen Eigenschaften,
Vorteile und Nachteile der Universalschemata. Der Unterschied besteht in der
geographischen Einschränkung (d.h. Kontext und Klassen gelten nur innerhalb der
Landesgrenzen), welche zugleich das wichtigste Gegenargument bei dem Einsatz in
großen und geographisch verteilten Unternehmen darstellt [Koch et al. 1997].
Fachspezifische Schemata werden meist für spezialisierte Themenbereiche entwickelt
und eignen sich deshalb für Organisationsgedächtnisse, deren terminologische
Anforderungen mit dem behandelten Fachbereich verknüpft werden können.
Infolgedessen werden sie bevorzugt in jenen Bereichen eingesetzt, die eine genauere
thematische Abstufung verlangen (zum Beispiel Medizin oder Mathematik) [Heber
2000].
Die Navigation durch fachspezifische Schemata kann aber für externe (unerfahrene) Benutzer
schwer fallen, da die Benutzerzielgruppe relativ klein ist, und das Verständnis der Struktur
Fachkenntnisse voraussetzt [Koch et al. 1997]. Selbstentwickelte Themenschemata erlauben
relativ hohe Flexibilität, Erweiterbarkeit und Modifizierbarkeit. Dies sind die wesentlichsten
Vorteile gegenüber Universalschemata. Eine selbstentwickelte Themenhierarchie wird aber oft
von subjektiven Überlegungen beeinflusst, weshalb Inkonsistenz und eine fehlende
Ordnungslogik die Folge sein kann [Heber 2000].
Bei sehr dynamischen Datenbeständen in großen Systemen sollte stets eine Überprüfung und
Bewertung der Zweckmäßigkeit von Themenstrukturen erfolgen. Dies erhöht aber den Aufwand
für Wartbarkeit, Pflege und Verwaltung des Katalogs. Somit ist die Zusammenarbeit mit
anderen Klassifikationsschemata bei selbstentwickelten Themenhierarchien nur über
aufwendige Konvertierungstools realisierbar. [Koch et al. 1997]
Bislang wurden Typen von Klassifikationssystemen betrachtet, welche ’fertige’ Systeme von
Klassen anbieten. Im Allgemeinen sollen diese fertigen Systeme ’potentiell’ alle denkbaren
Themen – universell oder domänespezifisch - abdecken können. Eine Alternative zu diesen
vorkombinierten Organisationstypen stellen sogenannte Facettenklassifikationen dar. Der
bekannteste Repräsentant dieser Art von Klassifikation ist die Colon Klassifikation, erfunden
um das Jahr 1930 vom indischen Mathematiker und Bibliothekar S. R. Ranganathan [Garfield
1984].
Die Methodik der Facettenklassifikation erfordert im ersten Schritt die Analyse einer Klasse, um
dazugehörige Aspekte (Facetten) festzulegen. Im zweiten Schritt findet die Synthese einer
Klassennummer (call number) aus den in veröffentlichten Verzeichnissen zu unterschiedlichen
Kapitel 5 - WISSENSORGANISATION
Seite 94
Facetten zugeordneten Nummern. Aus diesem Grund wird diese Methode auch analytischsynthetische Methode genannt [Garfield 1984].
Nachfolgendes Beispiel dient der Veranschaulichung von der analytisch-synthetischen
Klassifikationsmethode. Ein Teil eines Klassifikationssystems sei gegeben durch folgende
facettierte Ordnung (Analyse der Klassen):
A Fahrzeug
1 Auto
2 Motorrad
B Farbe
1 Grün
2 Rot
C Herstellungsland
1 Österreich
2 Japan
Durch die Synthese der einzelnen Klassen werden z.B. die Inhalte von Dokumenten anhand
obiger Klassifikation repräsentiert, zum Beispiel ’Rotes Auto aus Österreich’ A1B2C1, oder
’Motorrad aus Japan’ A2C2.
Einige praktische Beispiele aus den bisher besprochenen Organisationssystemtypen werden am
Ende dieses Abschnitts präsentiert. Zuvor wird aber ein kurze Einführung in das Thema
’Clustering’ gegeben, da dieser Prozess eine wesentliche Rolle in unterschiedlichen Disziplinen
(wie zum Beispiel Mustererkennung, Information Retrieval, Content Management, Künstliche
Intelligenz oder Knowledge Management) spielt und sich grundlegend mit der Bildung von
Ähnlichkeitsklassen beschäftigt.
5.3.5 Clustering
Das primäre Ziel all jener Techniken und Disziplinen, welche in diesem Kapitel bisher
beschrieben wurden, ist das Organisieren von Dateneinheiten in möglichst kontextueller Form.
Es geht also darum, semantische Darstellungen von Daten oder Dateneinheiten so zu
konzipieren, dass eine unternehmensgerechte themenspezifische Organisation und ein bedarfsund benutzergerechter Zugang ermöglicht werden.
Diese Darstellungen (Repräsentationen) von Wissenseinheiten innerhalb eines
Informationssystems werden auch ’Abstraktion’ genannt. Die für den Menschen ’freundlichste’
Repräsentation von Daten ist die natürliche Sprache, weshalb entweder linguistische oder
numerische Kategorisierungen bevorzugt werden. In diesem Abschnitt beschränkt sich der
Begriff der ’Abstraktion’ auf einen Prozess ’auf Datenebene’ und soll möglichst kompakt und
einfach funktionieren [Jain et al. 1999]. Eine der Methoden, welche sich für eine
Datenabstraktion besonders gut eignet, ist ’Clustering’. Darunter versteht man das Gruppieren
von ähnlichen oder in Beziehung stehenden Einheiten in Klassen. [Baeza-Yates et al. 1999]
Obwohl in der Literatur von ’Daten-Clustering’ oder ’Dokumenten-Clustering’ abwechselnd
geschrieben wird, verallgemeinert der Autor der vorliegenden Arbeit das Thema und untersucht
Clustering als ’Mechanismus zur Klassenerzeugung’. Es sei an dieser Stelle darauf hingewiesen,
dass Clustering eine Operation auf Dokumenteninhalte ist, um daraus Relationen oder
Ähnlichkeiten mit anderen Dokumenten zu extrahieren und demzufolge die Kategorisierung zu
vollziehen.
Kapitel 5 - WISSENSORGANISATION
Seite 95
Ein besonders wichtiger Aspekt im Bezug auf Clustering ist die Berücksichtigung des
’Wortstammes’ (engl.: ’word stem’). Die in [Baeza-Yates et al. 1999] dafür gegebene Definition
wird wie folgt vom Autor der vorliegenden Arbeit interpretiert:
Es sei V(s) eine nicht –leere Untermenge von Wörtern, welche sich lediglich
grammatikalisch voneinander unterscheiden.
Eine kanonische Form s von V(s) wird ’Stamm’ (engl.:’stem’) genannt. Zum
Beispiel wenn eine Menge V(s) = {’spielen’, ’Spieler’, ’spielend’, ’gespielt’}
existiert, dann ist der Stamm s von V(s) äquivalent zu s = ’spiel’. 50
Weiters wird in [Baeza-Yates et al. 1999] der Bereich Clustering in zwei Typen unterteilt :
a) In einer ’globalen Clustering’-Strategie werden Dokumente bezüglich ihres Standortes
im gesamten System gruppiert. Hierbei geht es meist um die klassenorientierte Antwort
zu einer zuvor vom Benutzer formulierten Suchabfrage. Die somit vom System
erzeugten Gruppierungen geben meist ein Abbild der realen Struktur der Datenbank
oder führen zu komplett neudefinierten Kategorien. Diese Strategie konzentriert sich
meistens auf die Transformation und Deutung von Dokumenteninhalten.
b) Beim ’lokalen Clustering’ erfolgt die Gruppierung von Dokumenten aufgrund des
Kontexts der Suchabfrage und dessen Zusammenhang mit der Menge der
aufgefundenen Dokumente.
Die lokale Strategie befasst sich somit ausschließlich mit der Transformation und Interpretation
der Benutzerabfrage und nicht mit der Transformation von Dokumenteninhalten. In diesem
Zusammenhang identifiziert [Baeza-Yates et al. 1999] folgende drei Typen von Clusters:
a) Assoziation-Clusters (engl.: ’association clusters’) basieren auf der Frequenz des
Auftretens von Stems (bzw. Begriffen) in Dokumenten. Die zugrundeliegende Idee
besteht darin, dass Stems, welche öfters innerhalb von Dokumenten auftreten, eine
Synonymie-Assoziation besitzen.
b) Metrische Clusters (engl.: ’metric clusters’) berücksichtigen nicht nur das Auftreten von
Begriffen in Dokumenten, sondern auch den Ort des Auftretens. Da zwei Begriffe,
welche innerhalb des gleichen Satzes auftreten, eine stärkere Beziehung zu haben
scheinen als jene die weit weg voneinander liegen, erscheint es sinnvoll, den Abstand
zwischen zwei Begriffen in der Berechnung des Korrelationsfaktors einzubeziehen. Auf
diesem Sachverhalt basieren metrische Clusters.
c) Skalare Clusters (engl.: ’scalar clusters’) leiten die Synonymie-Beziehung zwischen
zwei Stems (bzw. Begriffen) aus dem Vergleich der dazugehörigen ’NachbarUntermengen’. Die Nachbarmenge eines Begriffs ’s’ besteht aus anderen Begriffen, die
mit ’s’ eine relative – durch statistische Formeln errechnete – Ähnlichkeit besitzen.
Somit entsteht eine neue Assoziation, welche über den Vergleich von
’Nachbarschaften’ eine gewisse Art Synonymie ermöglicht.
Eine ähnliche Strategie wie jene der Skalaren Clusters verfolgt die in [Dietinger et al. 1999] als
’Konzeptuelles Clustering’ (engl.: ’conceptual clustering’) beschriebene Methode, bei der jedem
Dokument eine Reihe von Konzepten zugeordnet werden kann und somit eine Art
Nachbarschaft entwickelt (d.h. Objekte, deren konzeptuelle Metadaten stark ähneln, ’liegen
näher zueinander’ als Objekte mit völlig unterschiedlichen Metadatensätzen).
50
“Let V(s) be a non-empty suvset of words which are grammatical variants of each other. A canonical
form s of V(s) is called a stem. For instance, if V(s) = {polish, polishing, polished} then s = polish.”
[Baeza-Yates et al. 1999]
Kapitel 5 - WISSENSORGANISATION
Seite 96
Die Stärke des Conceptual Clustering liegt in der direkten Nutzung von Metadaten, wodurch
eine eigene Abstraktionsebene geschaffen wird, welche neue Möglichkeiten des
Informationszugangs erlaubt. So wird in [Dietinger et al. 1999] empfohlen, die Metadaten
getrennt zu speichern und zu verwalten, damit neue Conceptual Clusters auf der Basis von
schon existierenden Definitionen aufgebaut werden können. Ein somit erstelltes Klassensystem
kann auch als selbstentwickeltes Klassifikationsschema angewendet werden.
Die für Clustering meist verwendeten Lösungsansätze werden laut [Jain et al. 1999] wie folgt
unterteilt:
a) hierarchisch (das Resultat sind Baumstrukturen) und
b) partitionell (engl.: ’partitional’). Das Resultat von partitionellen Ansätzen sind Mengen
und Untermengen.
Die Untersuchung aller für Clustering existierenden Techniken würde den Rahmen der
vorliegenden Arbeit sprengen, weshalb an dieser Stelle auf die ausführlichen Beschreibungen in
[Jain et al. 1999] hingewiesen wird. Die für Clustering bekanntesten Techniken folgen
heutzutage nicht nur strengen statistischen Regeln, es werden auch Lösungsansätze aus anderen
Bereichen, wie zum Beispiel Fuzzy Logic aus der Künstlichen Intelligenz, angewendet.
Das Thema Clustering wurde an dieser Stelle eingeführt, da es bei der Modellierung und
Repräsentation von Datenstrukturen – vor allem in stark vernetzten, komplexen und
geographisch verteilten Informationssystemen - eine wichtige Rolle spielt und deshalb im
nächsten Abschnitt 5.4 ’Sichtweisen’ auch berücksichtigt wird. In diesem Zusammenhang ist
bei den Lösungsansätzen des Clustering die ’Dynamik bei der Behandlung von Synonymie’
sehr interessant.
Gut implementierte Clustering Techniken (in der Regel durch automatisierte Prozesse
angewandt) können als effiziente Erweiterung oder Ergänzung von Klassifikationsschemata
angewendet werden, da sie sich als ’dynamische’ Generatoren bzw. Modifikatoren von
Taxonomien besonders gut eignen und damit sehr gute Hilfswerkzeuge für die semantische
Informationsaufbereitung und den konzeptuellen Wissenszugang verkörpern.
Um ein praktisches Bild aller bisher besprochenen Organisationssysteme anzubieten, werden im
nächsten Abschnitt einige bekannte Beispiele präsentiert.
5.3.6 Beispiele aus der Praxis
Die in diesem Abschnitt dargestellten Systeme sind gemäß der in Abschnitt 5.3.1 ’Typen von
Organisationssystemen’ bekanntgegebenen Unterteilung gruppiert.
Authority Files
•
•
LC-NAF
Library of Congress Name Authority File
http://www.loc.gov/catdir/pcc/tgauthrpt.html
Getty Geographic Authority File
http://www.getty.edu
Glossare
•
United States Environmental Protection Agency:
Terms of the Environment
http://www.epa.gov/OCEPAterms
Kapitel 5 - WISSENSORGANISATION
Seite 97
Wörterbücher
•
ENCARTA
http://encarta.msn.com
Thesauri [Shiri et al. 2000]
•
•
•
•
•
•
ERIC
Assessment and Evaluation Clearinghouse
UNESCO Thesaurus
MeSH
National Library of Medicine
CERES Thesaurus
Californian Environmental Resources Evaluation System
KCL Theaurus
Knowledgecite Library
GenThes
General Thesaurus
Semantische Netzwerke
•
WordNet
University of Princeton
http://www.cogsci.princeton.edu/~wn
Ontologien
•
•
Cyc Knowledge Server [Gödert 2001]
SEAL [Maedche et al. 2001]
SEmantic portAL
Subject Headings
•
•
MeSH
Medical Subject Headings
http://www.nlm.nih.gov/mesh/meshhome.html
LCSH
Library of Congress Subject Headings
http://www.lib.utah.edu/instruction/handouts/LCSH/lcsh.html
Universalschemata
•
DDC
Dewey Decimal Classification
http://www.oclc.org/oclc/fp/index.htm
Jede Stufe dieser Hierarchie wird durch eine Ziffer zwischen 0 und 9 ausgedrückt. Eine
DDC Nummer besteht dabei aus mindestens 3 Ziffern und wird als Dezimalbruch
interpretiert, wobei der Dezimalpunkt nur fiktiv ist und zum besseren Verständnis der
Struktur verwendet wird. Ein Beispiel dafür zeigt [Abb. 5.4]. Kurze Nummern stellen
übergeordnete Klassen, längere Nummern speziellere, untergeordnete Klassen dar.
Nummern mit gleicher Länge charakterisieren dementsprechend gleichwertige Klassen.
[Heber 2000]
Kapitel 5 - WISSENSORGANISATION
Seite 98
Abbildung 5.4: Beispiel einer hierarchischen Notation von DDC [Heber 2000]
•
•
•
•
UDC
Universal Decimal Classification
http://www.udcc.org
Es stellt eine ausführliche Erweiterung des bereits beschriebenen DDC dar. Den Kern
der Klassifikation bildet das MRF (’Master Reference File’), eine mehrsprachige
Datenbank, welche jährlich aktualisiert wird, etwa 61000 Klassen enthält und auf
Lizenzbasis in eigenen Anwendungen eingesetzt werden kann. [Koch et al. 1997]
LCC
Library of Congress Classification
http://lcweb.loc.gov/cds/classif.html
BC
Bliss Bibliographic Classification
http://www.sid.cam.ac.uk/bca/bcahome.htm
Die Grundlage hierfür (Knoten des Strukturbaumes) bilden Aspekte. Die Notation weist
eine sehr breite Zeichenbasis auf und wird durch die Ziffern 1 bis 9 und die Buchstaben
A bis Z gebildet. [Koch et al. 1997]
CC
Colon Classification
Die Einteilung der einzelnen Aspekte in Klassen erfolgt aufgrund ihrer Verwendung
und ihrer Beziehungen, die durch einen Doppelpunkt (engl.: ’colon’) ausgedrückt
werden. Das Schema benötigt bei gleichem Genauigkeitsgrad weniger Platz als das
Schema einer vergleichbaren aufzählenden Klassifikation. Es erlaubt deshalb einen
hohen Grad an Spezialisierung. [Heber 2000]
Nationale Allgemeinschemata
•
•
DBC
Dutch Basic Classification
Land: Niederlande
http://www.kirjastot.fi/linkkikirjasto/selaus.asp
SAB
Sveriges Allmäma Biblioteksförening
Land: Schweden
http://www.sab.se
Fachspezifische Schemata
•
•
ACM
ACM Computing Classification System
http://www.acm.org/class
ACM: Association for Computing Machinery
Bereich: Computerliteratur und andere mit dem Computer im Zusammenhang
stehenden Ressourcen. [Heber 2000]
ICONCLASS
http://iconclass.let.ruu.nl
Kapitel 5 - WISSENSORGANISATION
Seite 99
•
•
Bereich: Kunst.
NLM
National Library of Medicine
http://www.nlm.nih.gov
Bereich: Medizin
Mammal Species of the World
http://www.nmnh.si.edu/msw
Bereich: Biologie
Selbstentwickelten Themenschemata
•
•
ODP
http://dmoz.org
YAHOO
http://yahoo.com
Einige Anbieter von Klassifikationslösungen [Wittkewitz 2001]:
•
•
•
•
SER
http://www.ser.de
Autonomy
http://www.autonomy.com
Verity
http://www.verity.com/international/gerweb
Lotus
http://www.lotus.com/home.nsf/welcome/discoveryserver
Kurze Analyse
Die in [Tab. 5.3] dargestellte Analyse gibt die in [Koch et al. 1997] zusammengefaßte Übersicht
einiger Klassifikationsschemata an.
BC
CCS
DDC
Icon.
LCC
MSC
NLM
SAB
UDC
Anzahl der
Internetdienste,
die das System
benutzen
1
1
17
0
5
0
1
4
5
Mehrsprachigkeit
Ja
Ja
Ja
Ja
Ja
Ja
Ja
Ja
Ja
Verfügbar in
unterschiedlichen
Sprachen
Nein
Nein
Ja
Nein
Nein
Nein
Ja
Nein
Ja
Integration mit
anderen Systemen
GTT
Nein
LCC
Nein
DDC
Nein
MeSH
Nein
Nein
Digital verfügbar
Ja
Ja
Ja
Ja
Ja
Ja
Nein
Nein
Ja
Copyright
Ja
Ja
Ja
Ja
Ja
Ja
Ja
Ja
Ja
Erweiterbarkeit
Ja
Ja
Ja
Ja
Ja
Ja
Ja
Ja
Ja
Tabelle 5.3: Übersicht einiger Klassifikationsschemata laut [Koch et al. 1997]
Kapitel 5 - WISSENSORGANISATION
Seite 100
Die Vielfalt der praktischen Techniken für eine semantische Dokumentenanalyse und –
modellierung ist das Thema des nächsten Abschnitts. Ziel dabei ist die Festlegung, Darstellung
und Verwaltung von unternehmensgerechten ’topologischen’ Strukturen, welche eine effiziente
Wissensdarstellung sowie den organisierten Zugang auf kategorisierten Wissensbeständen
erlauben. Dynamische benutzer- und bedarfsgerechte Wissensorganisation mit Hilfe neuer
Technologien und Standards (zum Beispiel XML, RDF, Topic Maps) stellt dabei den
Schwerpunkt dar.
5.4 Sichtweisen
Ein
typischer
Anwendungsfall
für
Wissensorganisation
bzw.
semantische
Informationsaufbereitung
in
großen
und
verteilten
Informationssystemen
sind
Wissensnetzwerke. Das primäre Ziel einer ’guten’ Wissensorganisation ist die Festlegung und
Verwaltung von Strukturen, welche sich zur späteren Inhaltsintegration durch Dritte eignen.
[Sigel 2001]
Dieses Ziel wird durch ’gutes’ ontologisches Design – auch ’Ontology Engineering’ genannt auf der Basis von Hauptkategorien und –relationen erreicht. Dafür geeignete Mechanismen
stellen beispielsweise die in den vorangegangenen Abschnitten beschriebenen Thesauri und die
Klassifikationsschemata dar.
Ontologien sind somit explizite Spezifikationen einer Konzeptualisierung relevanter Objekte
des spezifischen Interessengebiets (zum Beispiel ein unternehmensspezifischer
Fachwortschatz). Unter ’Konzeptualisierung’ versteht man eine spezifische ’Weltanschauung’
oder ’Weltsicht’, d.h. wie ein Fachbereich von seinen Vertretern sowie von
Wissensorganisatoren gesehen - ’konzeptualisiert’ - wird (im Kontext der vorliegenden Arbeit
zum Zwecke des Umgangs mit Wissensstrukturen). [Sigel 2001]
Dieser Abschnitt befaßt sich mit den Techniken, welche eine konzeptualisierte
Wissensdarstellung bzw. –modellierung ermöglichen. Hierbei geht es um die Darstellung von
Wissensstrukturen in ausreichend formaler Form, damit sie von Computern durch
Schlußfolgerungsmechanismen weiterverarbeitet werden können.
Es werden zunächst die allgemeinen Eigenschaften von Modellen bzw. Modellierungprozessen
beschrieben. Danach wird das Abbilden (’Mapping’) von Wissensstrukturen behandelt, d.h. das
kodifizierte ’Kartographieren’ von Wissen. Moderne und mittlerweile standardisierte
Technologien, wie zum Beispiel die auf XML basierenden ’Topic Maps’, werden anschließend
präsentiert und untersucht.
5.4.1 Modellierung
Wissensstrukturen werden von Menschen aufgebaut und zum Zwecke der Kommunikation und
Kollaboration geteilt. Von besonderem Interesse für die vorliegende Arbeit sind
Wissensstrukturen in sogenannten ’Diskursgemeinschaften’. Darunter versteht man
Menschengruppen, die eine Fachdiskussion führen und somit durch ein fachspezifisches
gemeinsames Verständnis, welches die Gemeinschaften voraussetzen, definiert werden [Sigel
2001]. Dies ist bei den untersuchten Informationssystemen für große und geographisch verteilte
Unternehmungen aufgrund ihrer hochspezialisierten Geschäftsbereiche auch der Fall. Die
Wissensorganisation trägt dazu bei, diese Wissensstrukturen effizient zu definieren und zu
verwalten. Die Produkte der wissensbasierten Informationsaufbereitung bzw. der
Wissensorganisation sind somit Klassifikationen, Thesauri und Metadaten.
Kapitel 5 - WISSENSORGANISATION
Seite 101
Auch wenn moderne Technologien wie das Internet (bzw. Intranet) ungeheure
Entwicklungspotentiale für Unternehmen bereitstellen, stellen sie ’lediglich’ das Mittel zum
Zweck, aber nicht ’den’ Unternehmenszweck selbst dar. Um den Mitarbeitern eines
Unternehmens nun tatsächlich das richtige Wissen zur richtigen Zeit am richtigen Ort zur
Verfügung zu stellen, ist es notwendig, sich sowohl abstrakt informierend als auch konkret
ausführend vom Wissensmanagementsystem unterstützen lassen zu können. [Filliesetal2001]
Die für eine zeit-, orts- und bedarfsgerechte Darstellung von Wissenstrukturen benötigte
Mechanismen sind ’Modelle’, welche einer Normalisierung dieser Strukturen dienen. Die – in
Anlehnung an [Sigel 2001] - identifizierte Funktionen der Normalisierung der Darstellung von
Wissensstrukturen sind:
•
Möglichst kontrollierte Vorhersehbarkeit (relativ steuerbar durch z.B. die Indizierung
der Metadaten für eine verbesserte Suche),
•
semantische Kollokation (Objekte mit ähnlichen Charakteristika sollten möglichst nahe
aneinander gruppiert werden) und
•
verbesserte semantische Interoperabilität (d.h. die garantierte Kompatibilität und
Vergleichbarkeit von Systemen zur Wissensorganisation und dazugehörigen
Metadaten).
Für die Weiterbehandlung des Themas Modellierung sei an dieser Stelle die in [Bellinger et al.
2001c] angegebene Definition des Begriffs ’Modell’ (und zwar im Kontext von Systemen)
festgelegt:
„… Eine Vereinfachung der Realität, mit der Absicht das Verständnis zu
fördern.“ 51
Bei der Entwicklung von Modellen (’Modellierung’) existiert laut [Bellinger et al. 2001c]
immer ein gewisser Kompromiß. Da der Mensch durch Modelle versucht, eine Realität zu
vereinfachen, impliziert dieser Prozess das Ausschließen einiger Details aus dem wirklichen
Phänomen.
Die Kernfrage bei der Modellierung von Wissenstrukturen ist: Was wird im Modell ein- und
was ausgeschlossen? Sollten relevante Komponenten ausgeschlossen werden, so besteht das
Problem einer zu einfachen Natur des Modells, womit die Entwicklung des Verständnisses nicht
wie erwünscht gefördert wird. Ein zu detailliertes Modell führt hingegen zu einer komplexen
Struktur, die ihrerseits die Entwicklung des Verständnisses (auf tiefer Ebene innerhalb der
Struktur) erschwert. [Bellinger et al. 2001c]
Eine der größten Herausforderungen bei der Konzeption von Wissensstrukturen in
transnationalen Konzernen ist die richtige Modellierung von stark verteilten
Geschäftsprozessen. Die neue Ausrichtung in der Unternehmensorganisation, wonach die
Aufbauorganisation (Strukturen) sich nach der Ablauforganisation (Prozesse) richten soll, sowie
die Forderung, zwischen Beschaffungs- und Absatzmarkt transnationale Prozeßketten zu
schaffen, haben die Optimierung respektive die Modellierung der Geschäftsprozesse ins
Zentrum der Maßnahmen, welche Unternehmen treffen müssen, um dem wachsenden
Wettbewerbsdruck standzuhalten, gebracht. [Bettoni et al. 2001]
Heutzutage wird diesbezüglich – laut [Filliesetal2001] und aus der Sicht des
Wissensmanagements - versucht, mit Hilfe der Prozeßorientierung eine weitere Möglichkeit zur
Klassifikation und Navigation anzubieten. Die in [Filliesetal2001] identifizierten Standardideen
51
“A simplification of reality intended to promote understanding.” [Bellinger et al. 2001c]
Kapitel 5 - WISSENSORGANISATION
Seite 102
zum Wissensmanagement, welche
Prozessmodellierung findet, sind:
man
bei
marktführenden
Werkzeugen
für
die
•
Wissenskategorien – jene, die zur Ausführung von Funktionen benötigt werden - als
Datenquellen mit in die Prozesse aufnehmen.
•
Wissenslandkarten als eigenen Diagrammtyp festlegen.
•
Bereitstellen von personalisierbaren Unternehmenswissensportalen (engl.: ’Enterprise
Knowledge Portals’) als Zugangspunkte zum System.
•
’Der Prozess ist das Wissen’. Referenzmodelle werden nun Wissensmodelle genannt.
•
Verteilte (aber transparente!) Modellierung der Wissensbestände.
•
(Chronologische) Geschichte ausgeführter Workflows (falls dafür Bedarf
[Filliesetal2001]
besteht).
Um ein Modell für das gesamte System zu konzipieren, können auch Teilmodelle verwendet
werden. Man könnte zum Beispiel52 ein Aufgabenmodell festlegen, das die Funktionalität der
Wissensstrukturen
in
unterschiedlichen
Aufgabengebieten
untergliedert.
Das
Kooperationsmodell könnte dann beschreiben, wie die Aufgaben, welche auf unterschiedliche
Strukturkomponenten aufgeteilt werden, miteinander zusammenarbeiten sollen. Schließlich
kann ein Klassifikationsmodell definiert werden, das die Begriffsstruktur enthält. Der
bedarfsgerechte Informationszugang kann dann über das Kooperationsmodell, welches das
Bindeglied zwischen Aufgaben- und Klassifikationsmodell bildet, automatisch gesteuert
werden.
Die oben beschriebenen Aspekte der Modellierung von Strukturen sollten zeigen, dass diese in
einer zielorientierten Abstraktionsebene zustande kommen und nicht immer ein konkretes
technisches Szenario darstellen. Sie stellen erst ein vereinfachtes Szenario, welches zurück auf
die Realität abgebildet werden muß, dar.
Der folgende Abschnitt wird diese abgebildeten Wissensstrukturen, d.h. kodifiziertes Wissen in
Form von Karten, behandeln. Moderne und mittlerweile standardisierte Technologien, wie zum
Beispiel die auf XML basierenden ’Topic Maps’, werden anschließend präsentiert und
untersucht.
5.4.2 Knowledge Mapping
Das Schlüsselwort im Kontext der technischen Implementierung von semantischen Strukturen
bildet der vom Bereich der Wissensorganisation bekannte Begriff Knowledge Mapping, welcher
in [Sigel 2001], wie folgt, definiert wird:
„Knowledge Mapping: Die Kartographierung von Wissen, ein visueller Ansatz
der Kodifizierung von Wissen. Kodifizierung dient der internen und externen
Identifikation von Wissen.“ [Sigel 2001]
Der Begriff des „Mapping“ ist nicht nur als „Kartographieren“ zu verstehen:
„Mapping impliziert, dass zur Darstellung von Sachverhalten formale Qualitäten
aus der einen Domäne (z.B. Temperatur) mit Hilfe einer anderen (z.B. Farbe)
dargestellt werden können.“ [Wrede 2000]
52
Anmerkung des Autors der vorliegenden Arbeit: das Beispiel stellt ein fiktives Szenario dar.
Kapitel 5 - WISSENSORGANISATION
Seite 103
Für die vorliegende Arbeit stellt aber der Kontext der Themenhierarchien (Funktion und
Implementierung) das Wesentliche an einer Wissensdarstellung dar. In [Probst et al. 1999] wird
eine Definition von Wissenskarten gezeigt, welche das Interesse der vorliegenden Arbeit auf
den Punkt bringt:
„Wissenskarten sind allgemein formuliert graphische Verzeichnisse von
Wissensträgern, Wissensbeständen, Wissensquellen, Wissensstrukturen oder
Wissensanwendungen. Neben der Transparenzerhöhung ermöglichen sie das
Auffinden von Wissensträgern oder - quellen, erleichtern sie das Einordnen von
neuem Wissen in bestehendes und verbinden Aufgaben mit Wissensbeständen
bzw. -trägern. Wissenskarten können je nach ihrer Struktur in unterschiedliche
Typen unterschieden werden. Bringt man diese Informationen auf den Computer,
strukturiert die Daten nach unterschiedlichen Kriterien und nutzt die
technologischen Visualisierungsmöglichkeiten, kann man den Zugriff auf
formalisierbare Wissensarten enorm vereinfachen und macht diese zeit- und
raumunabhängig für einen großen Personenkreis zugänglich." [Probst et al.
1999]
Der Schwerpunkt dieses Abschnitts ist somit Lösungsansätze zu präsentieren, welche die
Transparenz der Wissensbestände von großen Unternehmungen über strukturierte
Visualisierungmechanismen verbessern.
Die von Martin Eppler in [NetAcademy 1999] angegebenen Typen von Wissenskarten sind
Quellenkarten (engl.: ’carrier or source maps’), Bestandskarten (engl.: ’asset maps’),
Strukturkarten (engl.: ’structure maps’), Entwicklungskarten (engl.: ’development maps’) und
Fluß- und Kommunikationskarten (engl.: ’flow and communication maps’).
All diese Typen stellen laut [Eppler 2002] graphische Verzeichnisse von Wissensträgern,
Wissensbeständen, Wissensstrukturen oder Wissensanwendungen dar. Dabei werden sie in zwei
zweckgebundene Kategorien unterteilt: individuelle und kollektive Wissenskarten. Im
Folgenden werden die kollektiven Bestands- und Strukturkarten ’Concept Maps’ behandelt,
welche konkret der Organisation von kollektivem Wissen dienen und deshalb interessant für
den Kontext der vorliegenden Arbeit sind [Eppler 2002].
5.4.3 Concept Maps
Konzeptkarten (engl.: ’Concept Maps) stellen Werkzeuge dar, um Wissensbestände zu
organisieren und zu strukturieren [Novak 2002]. Diese Werkzeuge stellen ein spezielles
Paradigma und eine spezielle Technologie, mit der man Wissensnetzwerke verwalten kann, dar.
Insbesondere kann man damit Wissensstrukturen modellieren. Sie eignen sich besonders gut für
das ’Explizitmachen’ von Themenhierarchien für große und geographisch verteilte
Unternehmen, denn sie erlauben die praktische Implementierung von fachspezifischen
Klassifikationsschemata. Ein Beispiel für eine Konzeptkarte wird in [Abb 5.5] dargestellt.
Konzeptkarten stellen, analog zu den im Abschnitt 5.3.3 ’Beziehungsstrukturen’ beschriebenen
Semantischen Netzwerken, gerichtete Graphen dar.
Die Knoten und Kanten von Konzeptkarten können auch simultan zwei Rollen spielen:
einerseits können sie Wissen in ’realen Strukturen’ ausdrücken, und andererseits eine
semantische und vernetzte Verbindung zu den Dokumenten darstellen. Die Knoten der
Konzeptkarten beinhalten ’Konzepte’ (Fachbegriffe), die Kanten direkte ’Beziehungen’
zwischen zwei Konzepten. Die Knoten können aber auch ’Aussagen’ (engl.: ’propositions’)
enthalten, um Interrelationen zwischen Kartensegmenten darzustellen. Konzeptkarten sind
Kapitel 5 - WISSENSORGANISATION
Seite 104
spezialisierte Begriffsstrukturierungen, welche hierarchisch angeordnet werden (allgemeinere
Konzepte befinden sich somit in den oberen Knoten) [Novak 2002].
Die Funktionalität von einfachen Konzeptkarten beschränkt sich auf das Erstellen und
Überprüfen von Begriffsstrukturen. Aus diesem Grund werden sie bevorzugt in
Lernumgebungen verwendet, um zum Beispiel den Lernenden taxonomische Darstellungen von
Konzepten näherzubringen oder Testbeispiele zu erstellen.
Abbildung 5.5: Graphische Darstellung einer Concept Map [Novak 2002]
Das größte Problem von einfachen Konzeptkarten ist, dass sie keine direkte Beziehung zu den
gespeicherten Wissensbeständen erlauben. Hierfür sind erweiterte Eigenschaften notwendig, die
einen Zugang zu ’im Hintergrund’ gespeicherten Informationseinheiten erlauben. Im nächsten
Abschnitt werden ’Topic Maps’ präsentiert. Diese Art Wissenskarten beinhaltet
Beschreibungselemente, welche die Informationsauffindung derart verbessern, dass komplexe
Wissensstrukturen semantisch durchsuchbar und navigierbar werden.
5.4.4 Topic Maps
Der Begriff Topic Maps ist ein internationaler Standard mit der Kennzeichnung ISO 13250
[ISO-TM 1999]. Dieser internationale Standard stellt eine standardisierte Notation für die
Repräsentation von Informationen über die Struktur von Informationsquellen zur Verfügung.
Diese Repräsentation ist austauschbar und wird benutzt, um Themengebiete (engl.: ’topics’) und
die Beziehungen zwischen Topics zu definieren.
„ Eine Menge von einem oder mehreren in Wechselbeziehung stehenden
Dokumenten, welche durch diesen Internationalen Standard definiert ist, wird
Topic Map genannt.“ [ISO-TM 1999] 53
53
“A set of one or more interrelated documents that employs the notation defined by this International
Standard is called a topic map.” [ISO-TM 1999]
Kapitel 5 - WISSENSORGANISATION
Seite 105
Im Allgemeinen beinhaltet die strukturelle Information in den Topics: a) ’Vorkommnisse’
(engl.: ’Occurrences’), d.h. Gruppierungen von adressierbaren (engl.: ’addressable’)
Informationsobjekten rund um die Topics, und b) ’Assoziationen’ (engl.: ’Associations’)
zwischen den Topics. [ISO-TM 1999]
Die Basisnotationssprache für Topic Maps ist SGML. Da aber die ’Extensible Markup
Language’ eine Teilmenge von SGML ist, kann auch XML als Basisnotation verwendet werden
[ISO-TM 1999].
Topics beschreiben einen Themenbereich (Begriff) der realen Welt. Dieser Begriff kann: a)
durch den Computer adressierbar sein (z.B. eine Web Page mit einer URL), b) nicht
adressierbar sein (z.B. eine Person), oder c) ein abstraktes Objekt darstellen (z.B.: ’Musik’).
Ein Topic besitzt zwei Eigenschaften: Namen und Verweise auf Ressourcen im
Informationsbestand. Im Standard gliedert sich der Name in drei Teile: Base, Display und Sort
Name. Davon muß lediglich der erste vorhanden sein [Rath 1999].
Die Verweise werden Occurrences genannt und zeigen auf Informationseinheiten, welche
relevant für das Topic sind. Occurrences besitzen auch einen Typ namens Occurrence Role
Type. [Rath 1999].
Occurrences stellen die Verbindung zwischen einem Topic und einer Informationseinheit dar.
Dieses ’physikalische Vorkommnis’ kann benutzt werden, um das Objekt anzusprechen oder,
um die Art der Relation zwischen Topic und Informationseinheit zu beschreiben.
Associations beschreiben Beziehungen zwischen einer Menge von Topics. Die Beziehung hat
eine bestimmte Natur (’Type’) und eine bestimmte Rolle (’Role’). Associations können
verwendet werden, um zum Beispiel Hierarchien zu modellieren. Eine Association - formal
gesehen - stellt einen Verweis, welcher für eine Beziehung (Relation) steht, zwischen zwei oder
mehreren Topics dar. Diese Associations haben ebenfalls ein Type, wodurch eine Klassifikation
ermöglicht wird.
Ein Topic Map Template – was nichts anderes ist als eine Topic Map – kann in einer anderen
Topic Map kopiert oder von dieser referenziert werden. Das kopierte Template agiert als
Zugangspunkt für die neue Topic Map und beinhaltet alle Themen und Typen, welche für die
Entwicklung der neuen Topic Maps notwendig sind. Ein referenziertes Template benutzt die im
Internationalen Standard ISO 13250 festgesetzten Fähigkeiten des ’Merging of Topic Maps’
(Verschmelzung oder Fusion von Topic Maps). Dadurch können mehrere Topic Maps durch ein
einziges Template referenziert werden. [Rath 1999]
Topic Map Templates stellen also Schablonen, die (Rollen-)Einschränkungen oder den
konzeptuellen Überbau festlegen, dar [Sigel 2001].
In einer Topic Map können Verweise auf Ressourcen und Assoziationen stets nur für einen
bestimmten Anwendungsbereich gültig sein. Mehrfache Bedeutungen müssen explizit
ausgeschlossen werden. Jedem Element der Topic Map lässt sich ein eindeutiger
Gültigkeitsbereich (scope) zuordnen. Der Scope selbst bezieht sich auf ein Theme (d.h. ein
Thema, das den Scope eines anderen Themas oder dessen Eigenschaften einschränkt), und
Themes sind wiederum Topics. [Rath 1999] [ISO-TM 1999]
Die beliebig erlaubte Kombinierbarkeit der Konzepte für Topic Maps erschließt eine riesige
Vielfalt an Implementierungen (z.B. intelligente Inhaltserschließung des Web oder interessante
Wissensmodellierungen und -repräsentationen). Topic Maps erzeugen – vor allem im
Kapitel 5 - WISSENSORGANISATION
Seite 106
unternehmerischen Kontext – neue Geschäftsideen und fördern damit neue Geschäftsfelder, da
ihre Erstellung und ihr Austausch unabhängig vom physikalischen Informationsbestand
stattfinden. Somit erzielen Topic Maps auch ohne Occurrences einen relativ hohen Wert. [Rath
1999]
Die Bedeutung für die Wissensorganisation in transnationalen Konzernen
Da Topic Maps dafür geschaffen wurden, kann man mit ihnen alle denkbaren Arten
begrifflicher Auffindungsmechanismen (wie z.B. Datenbank-Indizierungen, Buchregister oder
Glossare) modellieren und in einer standardisierten, linearisierten Syntax austauschen. [Sigel
2001]
Ein ’relativ’ einfach zu implementierendes Beispiel wäre das Exportieren von Klassifikationen
in das Topic Map Format. Ein etwas komplexeres Beispiel wäre die Abbildung der Ergebnisse
von einer Domänenanalyse oder von neu entstandenen Wissensstrukturen in gemeinsamen
Verstehensprozessen. Die Tatsache, dass Topic Maps nicht nur aus Topics (Begriffen) und
Assoziationen (Relationen) bestehen, sondern auch aus Vorkommnissen (Occurrences), erklärt
ihre Eignung zur Darstellung von semantischen Netzen. [Sigel 2001]
Occurrences stellen ebenfalls Instanzen eines Konzepts dar, womit sich qualitative
Relevanzgründe darin definieren lassen. Desweiteren lässt sich mit Topics und Assoziationen
(z.B. unter Verwendung des Scope-Mechanismus für eine Einschränkung des
Gültigkeitsbereichs) eine Konzept-Indexsprache realisieren, mit der man Vorkommen von
Ressourcen beschreiben kann. [Sigel 2001]
Der wesentlichste Vorteil bei der Anwendung von Topic Maps liegt im hohen Potential der
starken Ausdruckskraft von Assoziationen (d.h. von den Beziehungen zwischen den einzelnen
Topics).
Das Prinzip bei Topic Maps ist die Strukturierung auf einer Meta-Ebene, d.h. die Abbildung von
übergeordneten Wissensstrukturen. Dadurch entsteht eine semantisch brauchbare
Unabhängigkeit vom Informationsbestand (bestehende Datenquellen müssen nicht
umstrukturiert werden), was wiederum das Erstellen von Wissensstrukturen ermöglicht, deren
Gültigkeit für alle darunterliegenden Systeme konstant ist.
Es gab – und gibt noch immer – kritische Beobachtungen aus dem Bereich des Semantic Web,
welche eine Synergie der Arbeiten des ISO und TopicMaps.org an Topic Maps und des W3C an
RDF identifizieren wollen. Die Argumentation für eine Zusammenführung beider Standards
liegt in der Tatsache, dass in beiden Modellen die Beschreibung von Beziehungen zwischen
Einheiten – welche eine Identität aufweisen können – das Hauptziel darstellt. Sollte die
Hypothese wahr sein, dann könnte man ein gemeinsames Modell haben, das über Topic Maps
oder über ein RDF Modell zugänglich wäre.
Die Analyse von Graham Moore in [Moore 2001] überprüft diesen Sachverhalt und kommt zum
nachweisbaren Ergebnis, dass sich sowohl RDF Modelle über Topic Maps Konstrukte
äquivalent modellieren lassen und ebenso andersherum. Weiters lassen sich die Topic Map
Modelle in RDF und umgekehrt RDF Modelle in Topic Map Notation ’mappen’ (’abbilden’).
Die Voraussetzung dafür sind vordefinierte ’semantische Topics’. Beide Standards konvergieren
also in ihrer Grundfunktionalität, womit der Austausch von semantischen Räumen möglich ist
[Moore 2001].
Kapitel 5 - WISSENSORGANISATION
Seite 107
Der nächste Abschnitt präsentiert einige Lösungsansätze, um Ontologien bzw. Taxonomien zu
erstellen. Alle beschriebenen Mechanismen haben das Ziel, semantische Strukturen für einen
effizienten und verbesserten Wissenstransfer und Wissenzugang zu schaffen.
5.4.5 Andere Modelle
Unterschiedliche Anstrengungen hinsichtlich der Modellierung von Themenhierarchien,
Taxonomien und Ontologien finden heutzutage in vielen Disziplinen statt.
Das besondere an jeder Methode ist die unterschiedliche Auslegung der Abstraktionsebenen.
Während einige auf Internationale Standards – wie zum Beispiel XML, RDF, SOAP oder Topic
Maps – aufbauen, versuchen andere alle Implementierungsebenen (von den
Zugriffsmechanismen auf die Informationseinheiten über die Klassifikationssysteme bis hin zu
Visualisierung der semantisch gefundenen Struktur) in einer einzigen Applikation zu definieren.
Mit den - aus dem Bereich des Wissensmanagements stammenden - ’Knowledge Asset Road
Maps’ kann man nicht nur die Organisation, sondern auch die Visualisierung von kritischen
Wissensbeständen (engl.: ’knowledge assets’) eines Unternehmens und deren Beziehungen
untereinander darstellen [Macintosh et al. 1998].
Das Besondere dabei ist die Einbeziehung der Zeitkomponente. Eine Knowledge Asset Road
Map stellt unterschiedliche Wissensbestände zeitkritisch gegenüber und beobachtet deren
Verhaltensvariationen über gewisse Zeitabschnitte. Knowledge Asset Road Map sind somit
‘strategische’ Modellierungen von Wissenbeständen.
Das Caiman System für ’Ontology Mapping’ basiert auf der Definition von beliebig
konfigurierbaren Ontologien und der zur Verfügung gestellten Caiman Services [Lacher et al.
2001].Caiman soll den transparenten Austausch von relevanten Dokumenten einer geographisch
verteilten Interessengemeinschaft unterstützen und bedient sich hierfür speziell entwickelter
Mapping Algorithmen. Aus der Sicht des Benutzers stellt Caiman zwei Hauptdienste zur
Verfügung [Lacher et al. 2001]:
a) Die ’Publikation von Dokumenten’ erfolgt aus der Zuordnung des Dokuments zu einer
Konzeptklasse (durchgeführt durch den Autor des Dokuments) und der Nachricht an die
gesamte Gemeinschaft, damit die Klassifikation überprüft und bestätigt wird.
b) Das ’Auffinden von in Beziehung stehenden Dokumenten’ erfolgt entweder auf
Klassen- oder auf Dokumentenebene. Die Auffindung auf Dokumentenebene entspricht
den traditionellen Mechanismen des Information Retrieval. Bei der Auffindung auf
Klassenebene kann der Benutzer ein Klassenkonzept aussuchen. Das System analysiert
somit alle mit der Klasse in Beziehung stehenden Dokumente und liefert die Menge all
jener, die noch nicht in der persönlichen Ontologie referenziert sind.
Der in [Helic et al. 2001] vorgestellte Mechanismus von ’Knowledge Domain Schemata’
erlaubt (unter anderen) die Suche von Wissenseinheiten und die Navigation durch
Wissensstrukturen auf Metadatenebene. Das System basiert hier wiederum auf der Trennung
von Inhalt und Struktur des System, wobei über Beziehungen ’Semantische Kategorien’
definiert werden.
Kapitel 5 - WISSENSORGANISATION
Seite 108
Eine weitere Möglichkeit der Modellierung von semantischen Strukturen stellen Mechanismen
auf der Basis von Ontologieprinzipien, wie zum Beispiel OIL54 (’Ontology Inference Layer’)
dar.
Bezüglich der verwendeten Technologien lassen sich auch unterschiedliche Lösungsansätze für
Klassifikation und Auffindung identifizieren.
So ist zum Beispiel die ’Q-Technologie’ (Quantor-Technologie) eine formale Sprache zur
Darstellung und Verarbeitung der Semantik quantitativer Informationen. Das dazugehörige
Konzept heißt ’Q-Kalkül’ und basiert auf der Synthese terminologischer Konzepte zur
Repräsentation und auf stochastischen Verfahren zu deren Auswertung [NetAcademy 1999].
Die ’Networked Knowledge Organization Systems/Services’-Arbeitsgruppe (NKOS Working
Group) ist für die Entwicklung von VocML (’Vocabulary Markup Language’) zuständig.
VocML ist ein XML DTD/Schema, welches die strukturierte Repräsentation von vielen KOSRessourcen (Quellen von ’Knowledge Organizational Systems’), wie zum Beispiel Authority
Files, hierarchischen Thesauri, Klassifikationssystemen, digitalen Gazetteers und Subject
Heading Lists, erlaubt. [Cover 2000]
Es sei an dieser Stelle darauf hingewiesen, dass viele Synonyme für Concept Maps identifiziert
wurden (z.B.: Structured Maps, Conceptual Maps, Knowledge Maps, Kmaps, Web Maps,
Cognitive Maps, Cognitive Structures, Self Organizing Maps, Associative Maps). Synonyme im
Kontext des Ziels, nämlich des funktionalen Ziels, d.h. begriffliche Auffindungsmechanismen
und Strukturen zu modellieren.
Besonders interessant für große und geographisch verteilte Unternehmen wäre die Möglichkeit
von mehrdimensionalen Sichtweisen zum Zweck einer semantisch verbesserten
Informationsauffindung (z.B. für Suche, Klassifizieren von Wissenseinheiten, Personalisierung
von Informationen, usw.). Nachfolgender Abschnitt beleuchtet die Grundlagen dieser
Aufgabenstellung.
5.4.6 Mehrdimensionale Ansätze
Das Thema dieses Abschnitts ist die Untersuchung von gegebenen technologischen
Möglichkeiten, um Wissenseinheiten über unterschiedlichen Mechanismen semantisch zu
organisieren, konzeptuell zugänglich zu machen und bedarfsgerecht strukturiert dem Benutzer
zu präsentieren.
Speziell für große und geographisch verteilte Unternehmen ergibt sich die Notwendigkeit der
Konzeption eines Mechanismus, welcher eine semantische Informationsaufbereitung und eine
dynamische Wissensorganisation ermöglicht, um in der Lage zu sein, die verteilte
Organisationsstruktur über kontrollierte Vokabulare ziel-, orts- und bedarfsgerecht zu erreichen.
Es geht hier darum, unterschiedliche Zugangsstrukturen bzw. –mechanismen so zu
implementieren, dass dem Benutzer lediglich den für ihn relevanten Teil des
Unternehmensgedächtnisses zur Verfügung gestellt wird, um eine themenspezifische Aufgabe
zu lösen.
Verschiedene, aber parallel implementierte Organisationssysteme (wie etwa mehrere
Klassifikationsschemata oder Thesauri) stellen unterschiedliche Sichtweisen bzw.
54
http://www.ontoknowledge.org/oil
Kapitel 5 - WISSENSORGANISATION
Seite 109
Zugangsmöglichkeiten auf das Wissensangebot des Informationssystems dar. Solche
unterschiedlichen Darstellungsmöglichkeiten durch verschiedene Organisationssysteme werden
hier Dimensionen genannt.
Das in [Abb. 5.6] präsentierte Szenario stellt den oben beschriebenen Sachverhalt dar.
Mehrdimensionale, konzeptuell angeordnete Sichtweisen können zum Beispiel durch die
Themenhierarchien der unterschiedlichen Klassifikationsschemata dargestellt werden. Das
Informationssystem eines transnationalen Konzerns wird einerseits durch das ’echte’ verteilte
Organisationsgedächtnis (VOG), welches im Idealfall das gesamte intellektuelle Kapital umfaßt
(in [Abb. 5.6] der Einfachheit halber als explizites Wissen mit Dokumentenicons
veranschaulicht), und andererseits durch die transparent verwaltete Struktur der Wissensbank
(in [Abb. 5.6] ’transparentes Organisationsgedächtnis’ benannt und durch gutes Informationsbzw. Datenmanagement lösbar) dargestellt.
Die unterschiedlichen Sichtweisen ergeben sich aus dem durch die unterschiedlich facettierten
Themenhierarchien (in [Abb. 5.6] als Klassifikationsysteme dargestellt) kodifizierten Wissen.
Damit erhält der Benutzer - auf eigenen Wunsch – die Visualisierung des für ihn relevanten
Informationsraums, und zwar gleich auf kontextuelle und themenspezifische Weise. Weiters
kann der Benutzer beispielsweise innerhalb dieses semantisch eingeschränkten Raumes
navigieren und suchen.
Abbildung 5.6: Mehrdimensionale Sichtweisen in einem Informationssystem für große und geographisch
verteilte Unternehmen über unterschiedlich facettierte Themenhierarchien
Grundsätzlich werden vom Autor der vorliegenden Arbeit mehrere Lösungsansätze identifiziert.
Empfehlenswert sind alle Technologien, welche auf international geltenden Standards basieren
und deshalb eine nachhaltige Effizienz und Konsistenz gewährleisten (siehe hierzu die
Abschnitte 5.4.1 bis 5.4.5).
Kapitel 5 - WISSENSORGANISATION
Seite 110
Bezüglich der Methoden zur technischen Implementierung des vorgestellten Szenarios lassen
sich keine konkreten Aussagen erstellen, weil das in [Abb. 5.6] dargestellte Szenario nicht
unbedingt mehrere Schichten enthalten muss. Damit kann man wahlweise eine mehrschichtige
(durch die parallele Anordnung von unterschiedlichen Organisationssystemen vor dem
dahinterliegenden Organisationsgedächtnis) oder eine planare Lösung (z.B. durch semi- oder
vollautomatische Clustering Mechanismen) implementieren. Eine hybride Methode, wie zum
Beispiel durch den Einsatz von effizienten Clustering Mechanismen - welche mehrere
semantische Kriterien kennt - in Verbindung mit einer entsprechend mächtigen Komponente für
die Visualisierung vom Clustering Ergebnis, kann durchaus in der Lage sein die in [Abb. 5.6]
präsentierte Aufgabenstellung technisch zu lösen.
Eine Alternative zum einschichtigen Modell wäre die Anwendung von regelbasierten
Organisationssystemen. Ein in Regeln verpackte Darstellung von unterschiedlichen
Themenhierarchien könnte über ein spezielles Algorithmus eine kontextuell eingeschränkte
Informationsauffindung ermöglichen. Mehrschichtige Techniken, wie zum Beispiel von OIL
oder dem Caiman System unterstützt, sind ebenfalls in der Lage durch Dynamisches
Ontologisches Mapping (siehe Abschnitt 5.4.5) diese Aufgabe lösen. Bezüglich einer
Wissensorganisation in unterschiedlichen terminologischen Strukturen können alle im Abschnitt
5.3.1 ’Typen von Organisationssystemen’ beschriebenen Möglichkeiten zu einer
mehrschichtigen Lösung der Aufgabenstellung herangezogen werden. Die Vor- und Nachteile
wurden im Abschnitt 5.3 ’Organisationssysteme’ präsentiert, wodurch es von einer sehr konkret
definierten Aufgabenstellung abhängen wird, welches Schema am besten die Anforderungen
des Systems erfüllt.
Eine weitere gute Möglichkeit, um eine eingenständige, mehrschichtige und semantische
Zwischenkomponente zu implementieren, wäre die Verwendung von Topic Maps. Wie in [Sigel
2000] auch identifiziert, erlauben Topic Maps die Implementierung von ’mehrfach-Sichten auf
Wissensbestände in speziellen Domänen’. Demzufolge kann man zum Beispiel den ’Scoping’Mechanismus von Topic Maps nutzen, welcher die bemerkenswerteste Eigenschaft bezüglich
Multidimensionalität repräsentiert, um eine facettierte Struktur zu entwerfen. Diese besondere
Fähigkeit von Topic Maps, mehrere unabhängige Sichten über Ressourcen legen zu können,
stellt sicherlich ein sehr vorteilhaftes Werkzeug im Bereich der dezentralen Inhaltserschließung
zur Verfügung. Solche Sichten können die Qualität der Erschließung erhöhen, wenn man die
Topic Maps - zum Beispiel - auf bekannte Bedarfsprofile einer Benutzergruppe adaptiert.
Fazit
Wie aus den oben geschilderten Lösungsmöglichkeiten entnommen werden kann, läßt sich
keine konkrete Aussage darüber machen, welche Methode die in [Abb. 5.6] dargestellte
Aufgabenstellung am besten lösen kann. Es müssten im Zuge intensiver Consultingtätigkeiten
und Diskussionsprozessen mit dem Kunden spezifische Anforderungen identifiziert und
formuliert werden, um eine korrekte Auswahl der zu implementierenden Technologie treffen zu
können. Im nächsten Abschnitt werden einige der aus diesem Kapitel - insbesondere für große
und geographisch verteilte Unternehmen - gewonnenen Erkenntnisse zusammengefaßt, womit
der Untersuchungsbereich der vorliegenden Arbeit abgeschlossen wird.
5.5 Schlußbemerkung
Dieses Kapitel befaßte sich mit den, von unterschiedlichen Bereichen zur Verfügung gestellten
Mechanismen, um ein effizientes semantisches Retrieval, d.h. das präzise Auffinden relevanten
Wissens aufgrund definierter semantischer Relationen [Sigel 2000], und ein kontextabhängiges
Kapitel 5 - WISSENSORGANISATION
Seite 111
Navigieren durch Themenhierarchien in verteilten Informationssystemen für transnationale
Konzerne zu ermöglichen.
Der in [Pepper 2000] angegeben Spruch ’ein Buch ohne Verzeichnis ist wie ein Land ohne
Landkarte’ 55 trifft die Problematik der Wissensorganisation für transantionale Unternehmen auf
den Punkt. Für die optimale Suche eines Begriffs (Konzepts) in einem großen und komplexen
Buch bzw. das Finden einer optimalen geographischen Strecke (z.B. in einem fremden Land)
sind ’kartographierte’ Strukturen unumgänglich. Demzufolge benötigt ein umfangreiches und
komplexes Informationssystem die effiziente, übersichtliche und semantisch organisierte
Repräsentation der Topologie von dem Unternehmensgedächtnis.
Dem Bericht von [Maier et al. 2000b] zufolge, welcher einen Überblick über die grundlegenden
Konzepte und Theorien im Bereich Wissensmanagementsysteme gibt, lassen sich bestehende
Klassifikationsansätze für Wissensmanagementsysteme identifizieren. Diese Aufzählung gibt
unterschiedliche Funktionsbereiche wieder und ordnet Wissensmanagementsysteme einem
bestimmten Bereich zu. Die für dieses Kapitel relevanten Punkte in Zusammenhang mit
Informationsaufbereitung und Wissensorganisation - vor allem im Kontext transnationaler
Konzerne - werden wie folgt aufgelistet 56:
•
Wissenssuche (’Pull’): Schlagwortsuche; Navigation von Kategorien in
Wissensgebieten; Einschränkung von Wissensquellen und Themen; Benutzerprofile,
Suchunterstützung/Suchassistent, Meta-Suchsystem für gleichzeitige Suche in internen
Wissensquellen gleichen Formats; Thesaurus und Synonyme; Anzeige neuer bzw.
ungelesener Dokumente (=Dokumente, die neu in das System kommen).
•
Wissenspräsentation und –visualisierung: Relevanzüberprüfung von gefundenen
Wissenseinheiten; Präsentation von ’nicht gesuchten’ Wissenseinheiten oder
Suchbegriffen (’Wer x sucht, sucht auch y!’); integrierte Darstellung der
Wissenseinheiten in Wissenskarten; Darstellung der ’semantischen Nähe’ zwischen
Wissenseinheiten (semantische Netzwerke).
•
Wissenspublizierung, -strukturierung und –vernetzung:
Publikation von
vorstrukturierten Inhalten; Publikation von nicht vorstrukturierten Inhalten (formatfrei);
Indizierung, Einordnung und Vernetzung von publizierten Inhalten; Erstellung und
Strukturierung von Wissensgebieten bzw. –clustern; automatische Einordnung und
Vernetzung von publizierten Inhalten; semantische Analyse von Wissenseinheiten;
Hyperlinks oder Vernetzung von publizierten Dokumenteninhalten; direkte Navigation
von einer Wissenseinheit zu beispielsweise einem Autor, einem Experten oder einer
Interessengemeinschaft.
•
Wissenseinbringung: Einbringung von Wissenseinheiten aus externen Wissensquellen;
automatische Übernahme von Wissenseinheiten aus externen Wissensquellen;
automatische Generierung von Wissenseinheiten aus unternehmensinternen
Datenquellen (z.B. Erstellung von Reports aus Produktionsdatenbanken). [Maier et al.
2000b]
Klassifikationsexperten und Spezialisten im Bereich des Information Retrievals, aber auch
Bibliothekare und Wissensorganisatoren identifizieren das hohe Potential von
Klassifikationsschemata, um den konzeptualisierten Informationszugang zu verbessern. Eine
gemeinsame (unternehmensweite) Klassifikationssprache erleichtert die terminologische
55
„… a book without an index is like a country without a map“. [Pepper 200]
Anmerkung des Autors der vorliegenden Arbeit: Die Liste beschränkt sich auf die Punkte, welche auch
als Problemaspekte aufgefaßt und durch die in diesem Kapitel behandelten Mechanismen gelöst werden
können
56
Kapitel 5 - WISSENSORGANISATION
Seite 112
Zusammenarbeit und den Datenaustausch. Solche Fachterminologien zeichnen sich zum
Beispiel durch die hohe Präzision, Sprachdifferenzierung und Korrektheit aus. Ob nun ein
universelles oder ein selbstdefiniertes Klassifikationsschema bzw. eine andere begriffliche
Struktur angewendet wird, hängt von den spezifischen Anforderungen der Unternehmung an
das zu implementierende wissensbasierte Informationssystem ab. Zusammenfassend läßt sich
feststellen, dass die Mechanismen der Wissensorganisation nicht alleine ausreichen, um alle
spezifischen Anforderungen erfüllen zu können.
Einige der im Untersuchungsbereich geschilderten Methoden und Technologien wurden direkt
zur technischen Umsetzung eines Informationssystems für einen im übernächsten Kapitel
anonymisiert dargestellten transnationalen Konzern implementiert. Im nächsten Kapitel wird
zunächst der Versuch unternommen, ein allgemeines Konzept zur Gestaltung eines
wissensbasierten Informationssystems so zu entwerfen, dass alle bisher besprochenen kritischen
Aspekte von einem einzigen Arbeitsmodell erfasst und analysiert werden können.
Teil II - GESTALTUNGSBEREICH
Seite 113
Teil II
GESTALTUNGSBEREICH
Teil II - GESTALTUNGSBEREICH
Seite 114
Kapitel 6 - LÖSUNGSVORSCHLAG
Seite 115
Kapitel 6
Lösungsvorschlag
Die gewonnenen Erkenntnisse aus dem Untersuchungsbereich (Kapitel 2 bis 5) der
vorliegenden Arbeit führten zur Identifikation von kritischen Aspekten bei der Konzeption eines
wissensbasierten Informationssystems für große und geographisch verteilte Unternehmen. Diese
Aspekte lassen sich in die Hauptpunkte ’verteilte Administration und transparenter Fluß der
Informationseinheiten’ sowie ’Internationalisierung und komplexe Organisationsstruktur der
Unternehmung’ zusammenfassen. Einerseits zeigen die im Untersuchungsbereich analysierten
Hauptdisziplinen57 unterschiedlich starke Einflüsse auf diese Hauptpunkte, und andererseits sind
sie zu verschiedenen Zeitpunkten der Systemgestaltung involviert. Sie bestimmen deshalb abwechselnd oder simultan - die Entscheidungskriterien auf der Suche nach Lösungen
spezifischer Aufgaben. Um die Auswirkungen aller Faktoren auf übersichtliche Weise zu
analysieren, wird in diesem Kapitel ein erster Lösungsvorschlag, der als allgemeines
Gestaltungsmodell zur Konzeption eines wissensbasierten Informationssystems für
transnationale Konzerne Anwendung finden kann, erarbeitet.
Im ersten Schritt (Unterkapitel 6.1 ’Grundanalyse zur Konzeption eines allgemeinen
Lösungsmodells’) werden besondere Merkmale der Hauptdisziplinen, sowie die eines
Informationssystems untersucht und gegenübergestellt. Das Ziel der Grundanalyse ist, die
Einflußfaktoren auf den Lösungsvorgang in einem einzigen Arbeitsmodell so zu erfassen, dass
eine ganzheitliche Betrachtungsmöglichkeit für die technische Konzeption ermöglicht wird.
Hierfür wird der Analysevorgang nach allgemein geltenden Wirkungsbereichen58 eingeteilt
(Abschnitt 6.1.1 ’Wirkungsbereiche der Analyse’). Die gemeinsame Betrachtung dieser
Wirkungsbereiche bildet somit die Basis eines allgemeinen Arbeitsmodells (Abschnitt 6.1.2
’Arbeitsmodell zur allgemeinen Sichtweise der Lösung’). Weiters wird durch die Einführung
und Untersuchung des Begriffs ’Informationsfluß’ der Hauptparameter zur Beschreibung der
Dynamik eines Informationssystems festgelegt (Abschnitt 6.1.3 ’Informationsfluß’). Zusätzlich
werden im Abschnitt 6.1.4 spezielle Sichtweisen des Informationssystems aus den Blickpunkten
Mensch, Standort und Inhalt untersucht .
Im zweiten Schritt sollen die aus der Grundanalyse resultierenden Modellvorstellungen
(Wirkungsbereich, Arbeitsmodell, Informationsfluß, Blickpunkt) dem Entwurf eines
technischen Grundkonzepts dienen (Unterkapitel 6.2 ’Technisches Gestaltungsmodell zur
Konzeption eines wissensbasierten Informationssystems’). Das Lösungsmodell selbst besteht
aus zwei Teilen: einem strategischen und einem technischen Schema. Es wird ein
grundlegendes Schema vorgestellt, um die Zusammenhänge zwischen Arbeitsmodell und
Sichtweisen auf einen gemeinsamen Nenner zu bringen (Abschnitt 6.2.1 ’Teil 1: Grundlegendes
Schema’). Der Informationsfluß fungiert im gesamten Gestaltungsmodell einerseits als
Brückenelement zwischen Strategie und Technik, und andererseits als unsichtbare
Kontrolleinheit des Informationssystems. Das aus diesen Überlegungen resultierende technische
Schema (Abschnitt 6.2.2 ’Teil 2: Funktionales Schema’) beschreibt die wichtigsten Struktur57
Anmerkung des Autors der vorliegenden Arbeit: Der Begriff ’Hauptdisziplinen’ umfaßt - im Kontext
der vorliegenden Arbeit - die in den vorangegangenen Kapiteln behandelten Fachgebiete
Wissensmanagement, Informationsmanagement, Datenmanagement und Wissensorganisation. Mit dem
allgemeineren Begriff ’Disziplinen’ werden alle anderen untersuchten Gebiete und Subgebiete – zum
Beispiel Information Retrieval, Distributed Systems, Library Science, u.a. - miteinbezogen.
58
Wirkungsbereich: engl. ’scope of impact’.
Kapitel 6 - LÖSUNGSVORSCHLAG
Seite 116
und Funktionskomponenten, wodurch ein Gerüst für das Gestaltungsmodell
wissensbasierten Informationssystems für transnationale Konzerne gegeben wird.
eines
Schließlich soll die Zweckmäßigkeit des technisches Gestaltungsmodells in die Praxis
umgesetzt werden. Die praktische Anwendung des Lösungsvorschlags wird anhand einer
umfassenden Liste von spezifischen Anforderungen gezeigt (Abschnitt 6.2.3 ’Anforderungen
eines transnationalen Konzerns an ein wissensbasiertes Informationssystem’). Hierbei werden
alle aus dem Untersuchungsbereich der vorliegenden Arbeit erkannten Problembereiche
(kritischen Aspekte) berücksichtigt und je einem bestimmten Wirkungsbereich zugeordnet
(unter Verwendung des Grundlegenden Schemas). Die Anforderungen werden - im Abschnitt
6.2.4 ’Anforderungsprofil für eine iterative Lösungsmethode’ - mit Hilfe des funktionalen
Schemas in eine Arbeitstabelle überführt, wodurch die Beziehungen zu den unterschiedlichen
Komponenten des Schemas aufgezeigt werden können. Das Ziel dieser Vorgehensweise ist die
Erkennung der Einflüsse von Disziplinen auf die unterschiedlichen Teilprobleme und deren
Zusammenhänge mit den Komponenten des funktionalen Schemas. Der größte Vorteil hierbei
besteht darin, dass erstens, durch die iterative Betrachtung des Gesamtproblems (laut
Anforderungsprofil) und zweitens, durch die eindeutige Zuordnung von Teilproblemen zu
spezialisierten Komponenten des funktionalen Schemas, auf technische und taktische Feinheiten
der Gesamtkonzeption geschlossen werden kann.
Alle im ’Gestaltungsbereich’ (Kapiteln 6 bis 8) der vorliegenden Arbeit dargestellten
Schlußfolgerungen, Vorschläge und Definitionen basieren auf den vom Autor der vorliegenden
Arbeit gewonnenen Erfahrungen, seinen aus dem Untersuchungsbereich gewonnenen
Erkenntnissen, sowie auf dem wertvollen Wissensaustausch und der praktischen
Zusammenarbeit mit den Mitgliedern der WAG59 am Institut für Informationsverarbeitung und
Computergestützte neue Medien (IICM) der Technischen Universität Graz.
6.1 Grundanalyse zur Konzeption eines allgemeinen Lösungsmodells
Um eine ganzheitliche Analyse aller Einflüsse der in den vorangegangenen Kapiteln
präsentierten Disziplinen auf ein wissensbasiertes Informationssystem zu ermöglichen, gilt es
zunächst Gemeinsamkeiten und Zusammenhänge zu finden. Das heißt, es muß in erster Linie
ein gemeinsamer Untersuchungsraum hergestellt werden, in dem alle Disziplinen Gültigkeit und
Anwendung haben. Hierfür muß ein Arbeitsmodell erarbeitet werden, um eine übersichtliche
Betrachtung der Auswirkungen von den Hauptdisziplinen auf die Konzeption des
Informationssystems zu erhalten.
6.1.1 Wirkungsbereiche der Analyse
Aus den Fakten der im Rahmen der vorliegenden Arbeit durchgeführten Recherche (Kapitel 2
bis 5) und den daraus gewonnenen Erkenntnissen, sowie aus den praktischen Erfahrungen nach
der technischen Konzeption eines wissensbasierten Informationssystems für einen
transnationalen Konzern – anonymisiert dargestellt im nächsten Kapitel - ergibt sich die
sinnvolle Einteilung eines Arbeitsraums in folgenden ’Wirkungsbereichen’:
•
59
Organisation: Einordnung aller planenden, kontrollierenden, steuernden, strategischen
und operativen Maßnahmen zur Festlegung der allgemeinen Lösungsstrategie.
’Web Applications Group’: Forschungs- und Entwicklungsgruppe am Institut für
Informationsverarbeitung und Computergestützte neue Medien (IICM) der Technische Universität Graz,
Österreich.
Kapitel 6 - LÖSUNGSVORSCHLAG
Seite 117
•
Inhalt und Semantik: Maßnahmen, um Qualität
Informationseinheiten und deren Inhalte zu steigern.
•
Technik: Gestaltung und Implementierung des technischen Szenarios.
und
Bedeutung
von
Die somit festgelegten Bereiche dienen während des nachfolgenden Analysevorgangs als
Parameter, um gemeinsam einen ganzheitlichen Arbeitsraum aufzuspannen. Weiters fassen
diese Wirkungsbereiche die wichtigsten Tätigkeits- und Zielbereiche der untersuchten
Hauptdisziplinen zusammen, und können deshalb zu einer geordneten Beschreibung der
Konzeption eines wissensbasierten Informationssystems für transnationale Konzerne beitragen.
Wirkungsbereich Organisation
Unter Organisation wird der Bereich, welcher
’unternehmerischer Ebene’ umfaßt, verstanden.
insbesondere
die
Tätigkeiten
auf
Die Organisation behandelt strategisch und operativ die globalen Ziele, Geschäftsprozesse und
Kompetenzen der Konzerneinheiten. Innerhalb dieses Bereichs werden zum Beispiel die global
und lokal geltenden unternehmensspezifischen Systemanforderungen, die allgemeinen
Aufgabenprioritäten, die technischen Bedürfnisse und Potentiale der Konzernunterbereiche, die
Rollen der Benutzer, die Intranetstrategie, usw. analysiert und festgelegt. Dieser
Wirkungsbereich liefert somit einen Arbeitsrahmen, der als Grundlage für die semantische
Inhaltserschließung und für die technologische Lösung verwendet werden kann.
Wirkungsbereich Inhalt & Semantik
Über den Wirkungsbereich Inhalt & Semantik wird das semantische Szenario erkannt und die
Kriterien zur Implementierung der technischen Komponenten festgelegt. Inhalt soll als die
Menge aller Informationseinheiten, welche das Intranetangebot ausmacht, verstanden werden.
Aus der Sicht des Wissensmanagements könnte man diesen Bereich für die Festlegung der
Struktur und Funktionalität des Organisationsgedächtnisses bzw. des Intellektuellen Kapitals
anwenden. Unter Semantik werden hier alle Mechanismen verstanden, die auf irgendeine Weise
den Wissenseinheiten eine spezifische Bedeutung hinzufügen und diese verwalten.
Weiters soll der Wirkungsbereich Inhalt & Semantik nicht nur die Problematik der
Bedeutungsdefinition erfassen, sondern auch spezifische Darstellungskriterien für Zugangs- und
Auffindungsmechanismen, welche erst das semantische Modell technisch realisierbar machen
(z.B. Navigation, Modellierung, Mapping, u.ä.), definieren. Dieser Wirkungsbereich ist also für
die unternehmenspezifische Zielsetzung, Zweckbestimmung und Qualitätserhaltung des
semantischen Inhalts der Intranetumgebung verantwortlich.
Wirkungsbereich Technik
Der Wirkungsbereich Technik umfaßt alle technischen Maßnahmen, um die reibungslose
Implementierung (Kodifizierung) des Informationssystems zu gewährleisten. Hier wird das
technische Szenario spezifiziert, analysiert, eventuell angepaßt, implementiert und getestet.
Typische Entscheidungen über den Wirkungsbereich ’Technik’ sind beispielsweise: Festlegung
der zu verwendenden Tools, Ausmaß der Verteilung des Systems (verteilte Architektur,
zentralisierte Architektur oder eine integrierte Variante), Kriterien zur Datenreplikation,
Spezifikation der Schnittstellen, technische Lösung für die Wissensvisualisierung, Lösung für
Datenbankanbindungen, Auswahl der Standards und Formate, und ähnliches.
Kapitel 6 - LÖSUNGSVORSCHLAG
Seite 118
Deutung der Wirkungsbereiche
Das Zusammenspiel der oben beschriebenen Bereiche wird in [Abb. 6.1] graphisch dargestellt.
Diese Abbildung soll lediglich eine geometrische Repräsentation des von den
Wirkungsbereichen Organisation, Inhalt & Semantik und Technik aufgespannten Raumes
verdeutlichen.
Organisation
Blickrichtung
Technik
Inhalt & Semantik
Abbildung 6.1: Wirkungsbereiche zur Analyse eines wissensbasierten Informationssystems
Um die Deutung des somit definierten Arbeitsraumes näher zu bringen, kann man sich die
Beziehung von je einem Punkt auf den Achsen der dreidimensionalen Darstellung in [Abb. 6.1]
als ein Kraftfeld vorstellen (Anm.: betrachtet unter dem dort angezeichneten Blickwinkel). Im
Kraftfeld - graphisch dargestellt im linken Teil von [Abb. 6.2] - werden die drei
Wirkungsbereiche als äquidistante Punkte positioniert. Im Idealfall, d.h. die Wirkungsbereiche
sind mit der gleichen Kraft60 versehen, spannen sie ein homogenes Feld auf. In der Praxis würde
dies einfach heißen, dass alle drei Wirkungsbereiche gleichwertig bzw. mit gleicher Priorität
berücksichtigt werden.
Homogener Zustand des Arbeitsraumes
2
1
2
1
4
3
3
1. Organisation
2. Inhalt & Semantik
3. Technik
4. Zu lösendes Problem
Abbildung 6.2: Deutung der Wirkungsbereiche ’Organisation’, ’Inhalt & Semantik’ und ’Technik’ als
Kraftfeld (links im Ruhezustand, rechts nach Hinzufügen eines Problems)
Nun wird ein beliebiger Aspekt (Teilproblem) des Informationssystems entlang der
Blickrichtung – wie im rechten Teil von [Abb. 6.2] dargestellt - gelegt. Der homogene Zustand
60
Anmerkung des Autors der vorliegenden Arbeit: Die Linien in [Abb. 6.2] sind mit den Feldlinien eines
elektromagnetischen Feldes vergleichbar. Die Dichte der Linien an einem beliebigen Punkt stellt somit
die Stärke des Wirkungsfeldes dar.
Kapitel 6 - LÖSUNGSVORSCHLAG
Seite 119
des Wirkungsfeldes führt dazu, dass die Aufgabenstellung unter ’idealen’ Bedingungen gelöst
werden kann. Werden aber zur Problemlösung die Schwerpunkte nicht gleichmäßig verteilt, so
entsteht nach obiger Deutung ein defektes bzw. gestörtes Wirkungsfeld. Als Beispiel hierfür sei
der Fall betrachtet, dass die Analyse und Konzeption des Informationssystems zwar unter einem
relativ großen ’organisatorischen, inhaltlichen und semantischen’ Aufwand stattfindet, die
technischen Gegebenheiten und Auswirkungen aber vernachlässigt werden. Der somit
resultierende ’gestörte’ Arbeitsraum wird im oberen Teil von [Abb. 6.3] dargestellt. Es sei an
dieser Stelle darauf hingewiesen, dass in der Praxis meist der umgekehrte Fall auftritt. Dies
bedeutet, dass meist vorgefertigte technische Lösungen eingesetzt werden, sodass die genauso
wichtigen organisatorischen (unternehmerischen), semantischen und inhaltlichen Schwerpunkte
in den Hintergrund treten.
Wie im unteren linken Teil der Abbildung dargestellt, wird wieder ein beliebiges Problem
untersucht (hinzugefügt). Technische Aspekte des Informationssystems wurden im betrachteten
Beispielsfall so sehr vernachlässigt, dass die technische Implementierung des Systems nicht die
erwarteten Anforderungen erfüllen kann. Falls aber das Fehlverhalten ’relativ früh’ erkannt
wird, müsste man im Nachhinein der Technik absoluter Priorität verleihen. Der somit
korrigierte Zustand – wie unten rechts in [Abb. 6.3] dargestellt – wird nur mit sehr hohem
Gesamtaufwand (Kosten, Zeit, Ressourcen, usw.) realisierbar sein.
Gestörtes System
Falsche Problembetrachtung
Korrigiertes System
Abbildung 6.3: Nicht ausgeglichener Zustand der Problembehandlung aufgrund fehlender
Berücksichtigung eines Wirkungsbereichs (gestörtes System)
Die oben beschriebene Deutung der Wirkungsbereiche als Kraftfeld wurde in Kontext dieser
Arbeit deshalb gewählt, weil nur so wirklich ersichtlich wird, welcher hohe Stellenwert die
gleichwertige Betrachtung von organisatorischen, inhaltlichen, semantischen und technischen
Einflüsse auf die Konzeption des Informationssystems hat. Es sei an dieser Stelle ebenfalls
klargestellt, dass obige Betrachtung eines Systems lediglich eine Abstraktion des
Analysevorgangs darstellt. Um mit den Wirkungsbereichen in der Praxis umgehen zu können,
ist nicht ihr Potential bzw. Intensität von Bedeutung, sondern ihre Reichweite bezüglich des zu
lösenden Gesamtproblems.
Die am Anfang dieses Abschnitts gegebenen Definitionen der Wirkungsbereiche stehen in
starker Verbindung mit den Hauptfunktionen und Zielsetzungen der Hauptdisziplinen, wodurch
sich viele Gemeinsamkeiten und Überlappungen ergeben. Diese Erkenntnis kann als Grundlage
Kapitel 6 - LÖSUNGSVORSCHLAG
Seite 120
zur Veranschaulichung der Reichweite aller Einflüsse herangezogen werden. Dies bedarf
allerdings der Festlegung eines konkreten Modells, um die Zusammenhänge zwischen
Hauptdisziplinen und Wirkungsbereichen zu verdeutlichen.
6.1.2 Arbeitsmodell zur allgemeinen Sichtweise der Lösung
Um die Einflüsse der Hauptdisziplinen bezüglich der bereits definierten Wirkungsbereiche zu
verdeutlichen, wird in diesem Abschnitt ein spezifisches Betrachtungsmodell festgelegt.
Zunächst soll aber an einige wesentliche Merkmale der Hauptdisziplinen erinnert werden. Aus
technischer Sicht besitzen sie jeweils unterschiedliche Schwerpunkte, welche auf folgende
Weise zusammengefasst werden können:
•
•
•
•
Wissensmanagement orientiert sich auf die Erfassung und allgemeine Verwaltung des
Intellektuellen Kapitals. Somit ist Wissensmanagement auf Erfahrungswerte gebunden
und analysiert ständig Vergangenheit und Gegenwart, um Prognosen zu erstellen bzw.
zukunftsorientierte Entscheidungen zu treffen.
Informationsmanagement nutzt meistens die technologische Infrastruktur, um eine
effiziente, effektive und insbesondere eine transparente Verwaltung der Informationsbzw. Wissenseinheiten zu garantieren.
Wissensorganisation baut begriffliche Beziehungsgeflechte zwischen den
Datenbeständen und modelliert Mechanismen, um den Benutzern stets bedarfgerechtes
relevantes Wissen zur Verfügung zu stellen.
Datenmanagement löst hauptsächlich die technischen Aspekte der Datentechnik und der
Kodifizierung der Informationseinheiten.
Um alle Anforderungen eines wissensbasierten Informationssystems für große und
geographisch verteilte Unternehmen auf systematische und effiziente Weise darstellen zu
können, wird mit Hilfe der Wirkungsbereiche ein ’Arbeitsmodell zur allgemeinen Sichtweise
der Lösung’ entworfen. Dieses Arbeitsmodell wird in [Abb. 6.4] graphisch dargestellt.
DM
IM
WO
Technik
Inhalt & Semantik
WM
Organisation
Anfangszustand
des Systems
Abbildung 6.4: Arbeitsmodell zur allgemeinen Sichtweise der Lösung. Flächeninhalte: anteilsmäßiger
Umfang der Wirkungsbereiche ’Organisation’, ’Inhalt & Semantik’ und ’Technik’. Links:
zugeordnete Reichweite der Hauptdisziplinen Wissensmanagement (WM),
Informationsmanagement (IM), Datenmanagement (DM), Wissensorganisation(WO).
Kapitel 6 - LÖSUNGSVORSCHLAG
Seite 121
Die graphische Darstellung in [Abb. 6.4] ist nicht der Versuch, eine strenge Unterscheidung
zwischen den Hauptdisziplinen herzustellen, sondern eher einen Überblick zu verschaffen, um
die Einflüsse, Zusammenhänge und Interaktionen zwischen Wirkungsbereichen und
Hauptdisziplinen erkennbar zu machen. Das Arbeitsmodell stellt also den Versuch dar, die
Eigenschaften der Hauptdisziplinen mit Hilfe eines gemeinsamen Raumes zu untersuchen.
Der große Vorteil dieses Arbeitsmodells besteht in der Tatsache, dass es eine neue,
aussagekräftige und sehr umfassende Sichtweise auf das Gesamtsystem ermöglicht. Weiters
erlaubt das Modell die Zuordnung von allen im Untersuchungsbereich der vorliegenden Arbeit
erkannten Aspekten zu bestimmten Wirkungsbereichen, und demzufolge zu bestimmten
Wissenschaftsbereichen (Disziplinen). Dieser Sachverhalt wird im nächsten Unterkapitel 6.2
systematisch vorgeführt.
Der unterste Teil des Arbeitsmodells in [Abb. 6.4], genannt ’Anfangszustand des Systems’,
stellt die vor einer Untersuchung vorhandene Infrastruktur des Unternehmens dar. Dieser ’IstZustand’ wird im Allgemeinen als ’Basis des Organisationsgedächtnisses’ interpretiert und
deshalb im Zuständigkeitsbereich des Wissensmanagements eingeordnet. Demzufolge wird es
hauptsächlich dem Wirkungsbereich Organisation zugeordnet. Aus rein technischer Sicht stellt
der Anfangszustand des Systems die schon vorhandene IT-Infrastruktur dar. Aus der Sicht des
Wissensmanagers kommt noch das implizite und explizite Wissen des Unternehmens hinzu.
In der Abbildung des Arbeitsmodells stellen die Flächeninhalte die ungefähre anteilsmäßige
Reichweite der Wirkungsbereiche dar. Aus dem Blickwinkel des Projektmanagements kann
man die Fläche des Dreiecks mit dem Gesamtaufwand zur Lösung des Informationssystems
gleichsetzen. Die linke Einteilung im Arbeitsmodell entspricht der Zuordnung der
Hauptdisziplinen zu den Wirkungsbereichen. Diese Zuordnung kann auch als Geltungsbereich
der Hauptdisziplinen aufgefaßt werden. Besonders interessant ist damit eine genauere
Untersuchung auf die Überlappungen dieser Geltungsbereiche der Hauptdisziplinen.
Die stärkste Überlappung zwischen den Reichweiten der Hauptdisziplinen ist zwischen
Informationsmanagement und Wissensorganisation zu erkennen. Beide Disziplinen decken
gleichzeitig und nahezu im gleichen Ausmaß den Großteil der Wirkungsbereiche ’Inhalt &
Semantik’ und ’Technik’, und besitzen deshalb (insbesondere im Kontext transnationaler
Konzerne) eine starke Beziehung zueinander. Ihre Hauptmerkmale, kritische Aspekte und
Einflüsse spielen vor allem bei der Erstellung der technischen Systemlösung eine wesentliche
Rolle. Wesentlich hierbei ist die Erkennung der unterschiedlichen Aufgabengebiete dieser
Hauptdisziplinen.
Während sich die Wissensorganisation und alle damit ’verwandten’ Disziplinen mit
semantischen Strukturen zur Wissensmodellierung und –ordnung befassen, kümmert sich das
Informationsmanagement hauptsächlich um die Spezifikation und Verwirklichung der
benötigten Transparenz des verteilten Systems. Während der Konzeptionsphase des
Informationssystems für einen transnationalen Konzern sollten die Einflüsse beider Disziplinen
nicht separat sondern parallel und interagierend betrachtet werden. Beispielsweise könnten
ungeeignete Mechanismen zum Lösen von Ortstransparenz nicht nur die einheitliche
Modellierung von Wissenseinheiten, sondern deren semantische Auffindungs- und
Zugangskriterien stark beeinträchtigen. Weiters könnte die unkoordinierte bzw. isolierte
Behandlung dieses Aspekts zur Auswahl von falschen Kriterien in Zusammenhang mit
Maßnahmen zur Performanzsteigerung des verteilten Systems (z.B. durch Replikation) führen,
wobei dies ebenfalls direkten (und sicherlich unerwünschten) Einfluß auf das Relevanz- und
Redundanzkriterium zur Informationsauffindung hätte. Die kritischen Einflüsse beider
Hauptdisziplinen können also mit Hilfe des Arbeitsmodells frühzeitig erkannt werden und eine
solche unerwünschte Kettenreaktion verhindern.
Kapitel 6 - LÖSUNGSVORSCHLAG
Seite 122
Ein weiterer sensibler Punkt bei der Lösungskonzeption eines wissensbasierten
Informationssystems für transnationale Konzerne ist die Berücksichtigung von Modularität und
Dynamik des Systems, um zum Beispiel die Erweiterbarkeit und Anpassungsfähigkeit zu
steigern. Dynamische Ziele und Strategien des Unternehmens werden in der Regel vom
Wirkungsbereich ’Organisation’ untersucht. Die Umsetzung der Lösung von Erweiterbarkeit
und Anpassungsfähigkeit des Systems findet größtenteils im Wirkungsbereich Technik statt.
Was aber verbirgt sich hinter dem Begriff ’Dynamik’ des Informationssystems? Ist sie
irgendwie erfaßbar? Und warum ist dies wichtig bei der Systemkonzeption? Zur Beantwortung
dieser Fragen wird im nächsten Abschnitt der Begriff ’Informationsfluß’ eingeführt und
untersucht.
6.1.3 Informationsfluß
Informationsfluß wird im Kontext der vorliegenden Arbeit als ein ganz spezielles
Charakteristikum eines Informationssystems aufgefaßt und als solches in drei ’Phasen’, wie in
[Abb. 6.5] graphisch dargestellt, unterteilt:
•
Bereitstellung
•
Erstellung
•
Administrierung
Benutzer
Informationssystem
ERSTELLUNG
Direkt
ADMINISTRIERUNG
Indirekt
Indirekt
Direkt
BEREITSTELLUNG
Abbildung 6.5: Phasen des Informationsflusses in einem Informationssystem
Der durch die Betrachtung des Informationsflusses gewonnene Einblick in das
Informationssystem wird auch in der Literatur zum Thema Wissensmanagement verwendet. Ein
ähnliches Modell wie jenes in [Abb. 6.5] wird zum Beispiel in [Maurer et al. 2001] definiert und
als Grundlage zur Untersuchung wichtiger Aspekte des informationstechnischen
Wissensmanagements genommen. Dort allerdings steht der Wissenstransfer im Mittelpunkt der
Untersuchung.
Im Kontext der vorliegenden Arbeit wird Informationsfluß als Hauptparameter zur
Beschreibung von Prozessen innerhalb des Informationssystems festgelegt. Es geht darum zu
zeigen, wo Information entsteht und wohin sie übertragen wird. Das Modell in [Abb. 6.5] ist
demzufolge auch als eine Art ’Sender-Speicher-Empfänger’-System aufzufassen.
Kapitel 6 - LÖSUNGSVORSCHLAG
Seite 123
Bereitstellung von Information
Die Phase der Bereitstellung von Information beschreibt die Ausgabe eines Systems (engl.:
’output’). Die Empfängerrolle bei dieser Phase übernimmt meist der Benutzer selbst und kann
aus dieser Sicht dem Lesevorgang des Benutzers gleichgestellt werden. Dieser Sachverhalt wird
auch direkte Bereitstellung genannt. Weiters kann diese Phase einer allgemeinen Zustellung von
Information gleichgesetzt werden. Dabei kann das System gleichzeitig die Rollen von Sender
und Empfänger einnehmen, und über eine indirekte Bereitstellung sich selbst mit neuen
Informationen beliefern (z.B. durch den Einsatz von intelligenten Agenten). Eng gekoppelt mit
einer bedarfsgerechten Bereitstellung von Informationseinheiten sind die Kriterien der
Präsentation und Navigation von Inhalten. Diese Aufgabe wird am Sender (Informationssystem)
zum Beispiel über Mechanismen aus dem Bereich Document Management oder
Wissensvisualisierung gelöst. Das Front End des Systems, um die Bereitstellung zu
ermöglichen, wird durch das User Interface realisiert.
Erstellung von Information
Die Informationserstellung, bzw. der Prozeß der Eingabe (eng.: ’input’) eines
Informationssystems kann als Schreibvorgang im System interpretiert werden, und ist
verantwortlich für die Generierung von Informationseinheiten. Es wird zwischen zwei Arten der
Informationserstellung unterschieden: direkte und indirekte Erstellung. Die direkte Erstellung
ist im Allgemeinen dem Benutzerinput gleichzusetzen (zum Beispiel ein Datei-Upload). Die
indirekte Erstellung findet innerhalb des Systems statt, und generiert neue Informationseinheiten
aufgrund der Beobachtung des Benutzerverhaltens. Ein Beispiel für die Anwendung indirekter
Informationserstellung wäre eine protokollierte und kategorisierte Beobachtung von
Suchvorgängen der Benutzer: wenn Benutzer A eine themenspezifische Suchanfrage startet, und
das System die Suchergebnisse zu einem ähnlichen Thema bei Benutzer B schon mal
beobachtet und gespeichert hat (das wäre die indirekt erstellte Informationseinheit), so kann es
dem Benutzer A diese hilfreiche Information zusätzlich zur Verfügung stellen. Weiters könnte
das System auch kontextuelle Zusammenhänge erkennen, d.h. beispielsweise die zu einem
Projekt gehörende Problematik erkennen, und dementsprechend einem Benutzer über das
Vorhandensein ähnlicher Dokumente informieren. Die Phase der Informationserstellung
berücksichtigt somit die Probleme der statischen und dynamischen Wissenserfassung, des
Uploads von Datenbeständen, der Metaisierung von Inhalten (Definition von
Zusatzinformationen) und ähnliche Vorgänge.
Administrierung von Information
Die Administrierung von Information ist ein interner Prozeß des Systems. In dieser Phase
werden alle Mechanismen der Informationsverwaltung implementiert. Der Vorgang der
Archivierung von Information (Datenspeicherung) findet auch innerhalb dieser Phase statt.
Typische Aufgaben der Informationsadministrierung sind beispielsweise die synchronisierte
Verwaltung von Replikaten, die Kontrolle des Informationszugangs über die Verwaltung von
Zugriffsrechten, die dezentrale oder zentrale Steuerung von Systemzugriffen (d.h. die
Transparenz einer verteilten Architektur zu gewährleisten), die automatische Wissensextraktion
für die Erstellung von begrifflichen Strukturierungen, usw.
Fazit
Die Begründung für die Einführung des Begriffs ’Informationsfluß’ kann somit in der Tatsache
gesehen werden, dass ein Parameter, welcher die Prozesse innerhalb des Systems beschreiben
kann, für weitere Untersuchungen zur Verfügung steht. Es liegt nahe zu behaupten, dass
dynamische Mechanismen bei allen Prozessen des Informationssystems (d.h. ’überall dort wo
Kapitel 6 - LÖSUNGSVORSCHLAG
Seite 124
Information fließt’) involviert sind. Dieser Sachverhalt wird im Kontext der vorliegenden Arbeit
als ’Dynamik des Systems’ bezeichnet. Mit Hilfe des Informationsflusses ergeben sich neue
Sichtweisen, um das Verhalten des Systems von verschiedenen Blickpunkten aus zu betrachten.
In Abhängigkeit davon, auf welches besondere Merkmal des Systems die Betrachtung
fokussiert wird (zum Beispiel unter ausschließlicher Untersuchung der Benutzerrolle
Systemadministrator), wirkt der Informationsfluß in spezifischer Art auf unterschiedliche
Systemeinheiten ein.
6.1.4 Spezielle Sichtweisen des Informationssystems
Die Dynamik eines Informationssystems für transnationale Konzerne ist im Kontext dieser
Arbeit durch den Informationsfluß (siehe Abschnitt 6.1.3) gekennzeichnet. Da die stark verteilte
Struktur des Systems ein sehr hohes Maß an Transparenz erfordert, spielt die Berücksichtigung
unterschiedlicher Sichtweisen während der Lösungskonzeption eine ganz besondere Rolle.
Bezüglich unterschiedlicher Betrachtungsweisen innerhalb des Systems und in Abhängigkeit
des Informationsflusses werden drei Komponenten - im Kontext der vorliegenden Arbeit
’Blickpunkte’ genannt - wie folgt identifiziert:
•
Mensch
•
Standort
•
Inhalt
Diese Blickpunkte ermöglichen gemeinsam eine ganzheitliche innere Perspektive des
Informationssystems, denn sie umfassen nicht nur alle digitalisierten Ressourcen, sondern auch
das global erfasste Intellektuelle Kapital (d.h. auch humane Ressourcen) und dessen räumliche
Verteilung im Konzern.
Der Blickpunkt Mensch
Der Blickpunkt Mensch läßt sich in unterschiedliche ’Rollen’ unterteilen, wobei die wichtigsten
wie folgt definiert werden:
•
Benutzer
•
Inhaltsanbieter
•
Referee
•
Administrator
•
Manager
In welcher Beziehung die Rollen zueinander stehen, soll [Abb. 6.6] zeigen. Auffällig in dieser
Abbildung ist die Tatsache, dass die Benutzergruppen (Rollen) wechselseitig aufeinander
wirken. Eine genau durchdachte Rollenspezifikation ist bei der Konzeption eines
Informationssystems für transnationale Unternehmen unumgänglich bzw. essenziell, da sie die
Grundlage für eine effiziente und effektive Gruppenverwaltung bildet. Im Rahmen dieser Arbeit
können nun den Hauptaufgaben Rollen zugeordnet werden.
Kapitel 6 - LÖSUNGSVORSCHLAG
Seite 125
Benutzer
Inhaltsanbieter
Manager
Rollenkonzept
Administrator
Referee
Abbildung 6.6: Rollenkonzept im wissensbasierten Informationssystem
Die in [Abb. 6.6] durch den zentralen Kreis dargestellte Interaktion der Rollen kommt zustande,
weil die Mitglieder einer Hauptgruppe ebenfalls einer anderen angehören dürfen. Wichtig
während der Gestaltung des Systems ist eine technische und formale Trennung zwischen den
Gruppen vorzunehmen, um spezielle Applikationsanforderungen dementsprechend
klassifizieren und priorisieren zu können.
Ein Benutzer spielt in der Regel die Rolle des Empfängers im Informationssystem. In diesem
Zusammenhang besteht die Aufgabe des wissensbasierten Informationssystems darin, den
Benutzern präzise und relevante Informationen auf effiziente Weise zur Verfügung zu stellen.
Somit geht es hierbei hauptsächlich um die Nutzbarkeit (engl.: ’usability’) des Systems. Das
Verhalten des Benutzers geht aber auch, wie im Abschnitt 6.1.3 anhand der Phasen des
Informationsflusses bereits geschildert, in Form von direkter bzw. indirekter
Informationsbereitstellung in das System ein.
Zu den Inhaltsanbietern gehören zum Beispiel Autoren oder Publizisten. Mitglieder dieser
Benutzergruppen sind für die ’Wissensveröffentlichung’, und somit für die Quantität und
Qualität der Hauptkomponente Inhalt innerhalb der Intranetumgebung verantwortlich.
Inhaltsanbieter spielen bezüglich des Informationsflusses die Hauptrolle bei der
Informationserstellung.
Eine besondere Stellung im Rollenkonzept eines Informationssystems für transnationale
Konzerne wird von Referees (deutsch: ’Begutachter’) eingenommen. Referees entscheiden über
Zweckmäßigkeit und Relevanz von Informationseinheiten und demzufolge über die
’Speicherbarkeit’ oder ’Archivierbarkeit’ von explizitem Wissen. Eine weitere Aufgabe der
Referees wäre z.B. als Fachexperten zur Festlegung von begrifflichen Strukturierungen. Allein
wegen der sprachlichen Unterschiede in einem transnationalen Konzern - aufgrund der weltweit
verstreuten Standorte - sollten verschiedensprachige Referees die Festlegung einer homogenen
allgemein gültigen Themenhierarchie begutachten.
Administratoren sind in der Regel für die Wartbarkeit, Fehlerbehebung und Erweiterung des
Informationssystems verantwortlich. Sie besitzen in der Regel Schreibrechte über alle
Strukturen des Systems. Bei transnationalen Konzernen sollte diesbezüglich die Tatsache nicht
unbeachtet bleiben, dass eine einzige Gruppe von Administratoren nicht immer erwünscht oder
effizient ist. Die starke Autonomie mancher Unterbereiche des Konzerns kann die Festlegung
standortabhängiger Untergruppen von Administratoren erfordern. Autonome Teilbereiche in
transnationalen Konzernen tauschen zwar Wissenseinheiten über die Grenzen der eigenen
Kapitel 6 - LÖSUNGSVORSCHLAG
Seite 126
lokalen Struktur aus, möchten aber oft ihre Inhalte vor ’externen’ Bereichsadministratoren
’schützen’. D.h. für autonome Unterbereiche können Subadministratorgruppen festgelegt
werden, welche sämtliche Zugangsrechte auf die Struktureinheiten vordefinierter Portale
besitzen, aber sonst nirgendwo.
Manager sind für die Organisation und Ordnung des Unternehmensgedächtnisses
verantwortlich, d.h. sie sind in irgendeiner Form für die Verwaltung von Informationseinheiten
zuständig. Eine typische Rollenbezeichnung in diesem Zusammenhang ist Content Manager.
Content Manager besitzen in der Regel fast uneingeschränkte Zugriffsrechte auf ganze
Strukturen, und dürfen, im Unterschied zu Inhaltsanbietern, auch Informationseinheiten löschen.
Die Mitglieder dieser Managementebene verfolgen strategische und operative Ziele, welche mit
den globalen und lokalen Geschäftsprozessen des Konzerns zu tun haben. Das Verhalten der
Manager legt somit die ’Intranetstrategie’ fest.
Der Blickpunkt Standort
Der Blickpunkt Standort gibt die Abbildung des realen Raumes auf das System wieder und
umfaßt alle Aspekte der Lokalisierung von Ressourcen. ’Standort’ stellt deshalb sowohl die
reale Topologie einer verteilten Systemarchitektur als auch die durch Mechanismen der
Transparenz gewonnene virtuelle Zentralisation von Ressourcen dar. Die Hauptkomponente
Standort spannt somit den ’realen’ sowie den ’virtuellen’ Raum des Informationssystems auf.
Der Blickpunkt Inhalt
Inhalt stellt den Blickpunkt dar, welcher die Betrachtung des Systems aus der Sicht der
erfaßbaren Wissenseinheiten (wie zum Beispiel Daten, Informationen oder Prozesse)
ermöglicht. Diese Komponente umfaßt somit fast alle Aspekte des Wirkungsbereiches ’Inhalt &
Semantik’, und schließt humane Ressourcen aus.
Fazit
Mit der Einführung der bislang beschriebenen Modelle, Parameter und Blickpunkte ist ein
allgemein gültiger Arbeitsrahmen, welcher die formale Konzeption eines technischen
Gestaltungsmodells erlaubt, gegeben. Das im nächsten Abschnitt beschriebene Modell kann
sicherlich nicht alle denkbaren speziellen Anforderungen von Informationssystemen für
transnationale Konzerne erfüllen, stellt aber einen ersten Lösungsvorschlag dar, um kritische
’Komponenten eines allgemeinen Arbeitsgerüsts’ zu definieren und diese mit den von
unterschiedlichen Disziplinen zur Verfügung gestellten Möglichkeiten effizient und effektiv zu
lösen.
6.2
Technisches
Gestaltungsmodell
zur
wissensbasierten Informationssystems
Konzeption
eines
Die verteilte Wissensverwaltung in transnationalen Konzernen ist in erster Linie ein
strukturelles und funktionales Problem. Aus informationstechnischer Sicht, wie bereits in den
Kapiteln 2 bis 5 der vorliegenden Arbeit beschrieben, sind unterschiedliche Lösungsansätze für
diese Problematik indentifizierbar, zum Beispiel benutzer-, prozeß-, struktur- und
themenorientierte Modelle. Ein Gesamtmodell für die Gestaltung des Systems sollte all diese
Ansätze berücksichtigen und die Lösungssuche nach spezifischen Problemen unterstützen. Aus
der Sicht des Wissensmanagements geht es darum, das Intellektuelle Kapital des Unternehmens
so abzubilden und zu präsentieren, dass eine effiziente und effektive Verwaltung der
Ressourcen gewährleistet ist.
Kapitel 6 - LÖSUNGSVORSCHLAG
Seite 127
Darüberhinaus vertritt der Autor der vorliegenden Arbeit die Meinung, dass die Konzeption des
Informationssystems einer Kartografierung des Unternehmenswissens analog ist, wobei die
Topologie aller Systemeinheiten sowohl statische als auch dynamische Elemente enthalten
sollte. Ein statisches Element entspricht der standortbezogenen Eigenschaft einer Komponente
bzw. einer Informationseinheit, d.h. ’wo’ sie tatsächlich liegt. Dynamische Elemente
ermöglichen ihrerseits unterschiedliche benutzerabhängige Sichtweisen der Datenbestände, d.h.
das Organisationsgedächtnis wird auf bedarfsgerechte Weise zugänglich gemacht (Auffindung
und Präsentation wird semantisch vom System verwaltet).
Die Kartografierung bzw. Modellierung des Wissensbestandes eines transnationalen
Unternehmens hängt somit von der Zielsetzung ab, d.h. ’Was’ wird ’wann’, ’wie’ und ’wo’ für
’wen’ präsentiert?, und ’Wozu’ wird etwas abgebildet? Hierbei stellen, der Meinung des Autors
der vorliegenden Arbeit nach, die Fragewörter ’was’ und ’wozu’ den Schwerpunkt bei der
Konzeption eines Modells dar. Bezüglich der ersten Frage lassen sich einige der modellierbaren
Bestände des intellektuellen Kapitals - oder Eigenschaften davon - wie folgt identifizieren:
•
Dokumente, Dateien, multimediale Einheiten (Video/Ton/Grafik), Teilsysteme in
verteilten Umgebungen, Beziehungen zwischen Systemkomponenten oder
Informationseinheiten, Speichermedien, Verzeichnisse, Wissenseinheiten (d.h.
explizites und implizites Wissen im Zusammenhang mit strategischen Zielen)
•
Standort, Gültigkeitsbereich, Zugehörigkeit, Domänen, Prioritäten, Aktualität
•
Organigramme, Chronologien, Zugriffsrechte, Strategien, Kompetenzen, Rollen,
Autoritäten, Muster, Ereignisse, Aktivitäten, usw.
Ein Grund für die Modellierung von Wissen im Informationssystem eines großen und
geographisch verteilten Unternehmens ist die Förderung der Wiederverwendbarkeit von Wissen
sowie die Vermeidung von erneuter Erfindung bzw. Definition von Prozessen, um Antwort- und
Auffindungszeiten bzw. Beschaffungskosten zu minimieren.
Ein weiteres Beispiel für die Notwendigkeit von Wissensmodellierung ist die Verbesserung der
Wissens(ver)teilung - und demzufolge der Kollaboration und der Kommunikation - durch eine
gefilterte Präsentation von Fachwissen (z.B. über Clustering oder selbstentwickelte
Themenhierarchien). Auch in diesem Zusammenhang kann die Hervorhebung von
Expertenwissen die Belastung der Experten senken, da kritische Information für jeden verfügbar
ist.
Das im Folgenden beschriebene Grundkonzept für die Lösungsmodellierung eines
wissensbasierten Informationssystems eines transnationalen Konzerns wird in zwei Schritten,
wie folgt, unterteilt:
a) Das grundlegende Schema des Lösungsmodells ergibt sich aus dem im ersten Teil
dieses Kapitels erörterten Arbeitsmodells und führt zur Identifikation der wichtigsten
logischen Komponenten des Systems unter Berücksichtigung der bisher definierten
Wirkungsbereiche und Sichtweisen.
b) Um das funktionale Schema zu erhalten, werden die Merkmale des grundlegenden
Schemas untersucht, und funktionale Zusammenhänge hergestellt. Das Resultat im
Kontext der vorliegenden Arbeit ist eine schematische Darstellung jener
Systemkomponenten, welche direkt am Informationsfluß beteiligt sind.
Das ’Arbeitsmodell zur allgemeinen Sichtweise der Lösung’ (siehe Abschnitt 6.1.2) kann als
Fundament für das Gestaltungsmodell herangezogen werden, weil es aus einem allgemeinen
Kapitel 6 - LÖSUNGSVORSCHLAG
Seite 128
Analysevorgang stammt. Somit wird ’deduktiv’ auf Aufbau und Eigenschaften eines
mehrteiligen und flexiblen Lösungsmodells geschlossen.
6.2.1 Teil 1 - Grundlegendes Schema
Aufbauend auf den Erkenntnissen des vorangegangenen Unterkapitels (Abschnitt 6.1
’Grundanalyse zur Konzeption eines allgemeinen Lösungsmodells’) sollen Zusammenhänge
zwischen den bereits beschriebenen Wirkungsbereichen (Punkt 6.1.1) und den unterschiedlichen
Blickpunkte (Punkt 6.1.4), welche die Analyse einer Intranetlösung für transnationale Konzerne
erlauben, identifiziert werden. Diese Zusammenhänge werden anhand des grundlegenden
Schemas in eine einheitliche Form zusammengefasst.
Das vom Autor der vorliegenden Arbeit erstellte grundlegende Schema zur Konzeption eines
wissensbasierten Informationssystems für transnationale Konzerne, graphisch in [Abb. 6.7]
dargestellt, ordnet jedem Wirkungsbereich eine spezifische Betrachtungsweise, eindeutige
Konzeptionskriterien sowie ein angenähertes Bedeutungsmaß der Blickpunkte zu.
ANALYSE
STANDPUNKT
KRITERIEN
FOKUSSIERUNG
Wirkungsbereiche
Untersuchung
aus der Sicht von:
Konzeptionskriterien
Ausmaß der Bezugnahme
von Blickpunkten
1
Organisation
Management
Strategie
und Bedürfnisse
2
Inhalt & Semantik
Benutzerrollen
und -interessen
Qualität
und Bedeutung
3
Technik
Administration und
Engineering
Technologische
Infrastruktur
Mensch
Inhalt
Standort
Abbildung 6.7: Grundlegendes Schema zur Konzeption eines wissensbasierten Informationssystems für
transnationale Konzerne
Aus [Abb. 6.7] ist ersichtlich, dass beispielsweise das Rollenkonzept (d.h. die Benutzer und ihre
spezifischen Interessen) die Hauptperspektive bei der Analyse von inhaltlichen und
semantischen Überlegungen darstellt (dies ergibt sich aus der externen Sichtweise des Systems).
Dadurch liegen Qualität und Bedeutung von Informationseinheiten als Hauptkriterien im
Vordergrund der Analyse. Demzufolge übt der Blickpunkt ’Inhalt’ (alle Wissenseinheiten) den
stärksten Einfluß in diesem Prozeß aus.
Mit Hilfe des ’grundlegenden Schemas’ kann man nun Anforderungen an das
Informationssystem (sofern sie definiert wurden) einem oder mehreren Wirkungsbereichen
zuordnen. D.h. die Einflüsse jeder Anforderung werden in allen Wirkungsbereichen strategisch
überprüft.
Das in [Tab. 6.1] dargestellte Beispiel zeigt eine Möglichkeit, wie für einen fiktiven
transnationalen Konzern einige Einflußfaktoren entsprechend den Wirkungsbereichen priorisiert
werden können. Die Nummern in den letzten drei Spalten der Tabelle entsprechen den in [Abb.
6.7] definierten Wirkungsbereichen.
Diese Tabelle soll exemplarisch die Tatsache unterstreichen, dass jede große und geographisch
verteilte Unternehmung zwar ein eigenes (spezifisches) Anforderungsprofil für ein
wissensbasiertes Informationssystem besitzt, dieses aber durch eine allgemein gültige
Kapitel 6 - LÖSUNGSVORSCHLAG
Seite 129
systematische Analyse – zum Beispiel durch die in diesem Kapitel selbstdefinierte Methodik erfaßbar ist.
Anforderungen
an das System
Wirkungsbereiche
1
2
3
Übernahme der
Organisationsform als
Systemarchitektur
Hoher Verteilungsgrad des
Informationssystems
Verfügbarkeit von großen
Objekten über Replikation
Qualitätssteigerung der
Informationseinheiten durch
Metadaten
Mehrsprachige Funktionalität
bei der
Dokumentenverwaltung
Bereichabhängiges
Rollenkonzept und
Rechtevergabe
Modularität des Systems
(Erweiterbarkeit und
Anpassungsfähigkeit)
Festlegung einer globalen
Themenhierarchie und
bereichabhängiger
Begriffsstrukturen
Tabelle 6.1: Fiktives Beispiel für die Analyse einiger Anforderungen an ein wissensbasiertes
Informationssystem für transnationale Konzerne bzgl. der Wirkungsbereiche gemäß dem grundlegenden
Schema (Anm.: 1 = Organisation, 2 = Inhalt & Semantik, 3 = Technik).
Das Ziel einer Analyse anhand des grundlegenden Schemas ist die Identifikation der
spezifischen strategischen und technischen Hauptkriterien, um die systematische Konzeption
des Systems zu ermöglichen. Das heißt, die Teilprobleme werden in diesem Schritt unabhängig
voneinander sortiert und den Wirkungsbereichen zugeordnet, um eine Aussage darüber zu
machen, welche Hauptdisziplin für die Lösung eines Teilproblems am besten in Frage kommt.
Die systematische Analyse mittels des grundlegenden Schemas kann also, zusammen mit der
Berücksichtigung von allgemeinen Anforderungen an das Informationssystem, dem Entwurf
eines allgemeinen Modells dienen. Aufgrund der indirekten Zuordnung zu den Hauptdisziplinen
kann eine taktische Lösung erarbeitet werden, d.h. die strategischen Ziele des
Informationssystems werden erkannt und spezifiziert. Die Konzeption der Systemmodule bleibt
aber aus technischer Sicht noch ungelöst. Es wird also mit Hilfe des grundlegenden Schemas
spezifiziert ’was’ technisch gelöst werden kann, aber nicht ’wie’. Dafür wäre eine schematische
Darstellung eines komponentenorientierten Lösungsmodells sehr hilfreich.
Das schematische Lösungsmodell, welches die technischen Hauptkomponenten eines
wissensbasierten Informationssystems für große und geographisch verteilte Unternehmen
Kapitel 6 - LÖSUNGSVORSCHLAG
Seite 130
beschreibt, wird vom Autor der vorliegenden Arbeit ’funktionales Schema’ genannt, resultiert teilweise - aus der Logik des ’grundlegenden’ Schemas und wird nachfolgend dargestellt..
6.2.2 Teil 2 - Funktionales Schema
Unabhängig von der Größe, dem Zweck oder der technischen Implementierung eines
Informationssystems (oder eines Teils davon), ’fließen’ stets Informationseinheiten von einem
Sender zum Speicher bzw. vom Speicher zu einem oder mehreren Empfängern. Viele Aufgaben
eines wissensbasierten Informationssystems können deshalb – der Meinung des Autors der
vorliegenden Arbeit nach - durch eine effektive und effiziente Verwaltung des
Informationsflusses gelöst werden.
Der Begriff ’Informationsfluß’ wird als Hauptparameter eines funktionalen Schemas gewählt,
da die meisten Prozesse in Informationssystemen erst dadurch beschreibbar werden. So ist zum
Beispiel der Informationsfluß das Hauptelement:
•
im Wissenstransferprozeß von lernenden Organisationen,
•
vieler Kommunikationstools in webbasierten Umgebungen,
•
in Workflowapplikationen, u.v.m.
Das in diesem Abschnitt erstellte funktionale Schema - wie in [Abb. 6.8] graphisch dargestellt bildet den zweiten Hauptteil des Lösungsvorschlags zur Konzeption eines wissensbasierten
Informationssystems für große und geographisch verteilte Unternehmen (bzw. transnationale
Konzerne). Das Schema resultiert sowohl aus den Erkenntnissen des Untersuchungsbereichs der
vorliegenden Arbeit (Kapitel 2 bis 5) als auch aus den Ergebnissen der Grundanalyse der
allgemeinen Problematik (Abschnitt 6.1), und wird so kompakt wie möglich gestaltet.
Das funktionale Schema basiert auf einer komponentenorientierten Sichtweise des Systems und
folgt der Logik des Informationsflusses. Es ergibt sich für die Struktur des Schemas folgende
sinnvolle Einteilung (unter Berücksichtigung des Informationsflusses) in
fünf
Hauptkomponenten:
•
Zugang
•
Erkennung
•
Semantik & Auffindung
•
Sicherheit
•
Basis
Weiters kann die Komponente ’Semantik & Auffindung’ wie folgt unterteilt werden:
Organisationssysteme
Metadaten
Navigation
Suche
Administrierung
Erstellung
Bereitstellung
Kapitel 6 - LÖSUNGSVORSCHLAG
Seite 131
Abbildung 6.8: Funktionales Schema zur Konzeption eines wissensbasierten Informationssystems für
transnationale Konzerne
Die Komponente Zugang des funktionalen Schemas umfaßt die strukturellen Eigenschaften des
gesuchten Systems. Aufgrund der stark verteilten Organisationsstruktur eines transnationalen
Unternehmens empfiehlt es sich, eine portalbasierende Zugangsstruktur für die Intranetlösung
zu verwenden. Meist entspricht die Anordnung dieser Zugangsknoten einer hierarchischen
Struktur (welche mit der Gliederungsart des Konzerns konform ist) und nicht der in [Abb. 6.8]
präsentierten einschichtigen Darstellung. Ob wirklich mehrere Zugänge zum
Informationssystem entworfen werden, oder bloß ein zentraler Knoten zur Verfügung gestellt
wird, hängt von den spezifischen Anforderungen des Unternehmens und vom erwünschten
Verteilungsgrad des Gesamtsystems ab. Auf Hardwareebene kann von dieser Komponente auch
die Entscheidung resultieren, ob ein Zentralserver, ein Serverpool oder eine Integrierte Variante
aus mehreren unabhängigen Servern entworfen werden soll.
Die Komponente Erkennung ist für das gesamte Rollenkonzept verantwortlich. Darin findet
somit die globale und lokale Benutzer- und Gruppenverwaltung statt. In diesem Modul werden
beispielsweise alle Fragen der Identifikation und Personalisierung beantwortet. Die
Kapitel 6 - LÖSUNGSVORSCHLAG
Seite 132
Erkennungskomponente sollte aber nicht mit den Mechanismen des objektbezogenen Zugriffs
verwechselt werden.
Die Komponente Semantik & Auffindung umfaßt alle Beschreibungprozesse,
Auffindungskriterien und Darstellungsmechanismen. Die Hauptteile dieser Komponente sind
Organisationssysteme, Metadaten, Navigation und Suche.
Hinter dem Begriff Organisationssysteme – wie schon im Untersuchungsbereich ausführlich
beschrieben – verbergen sich nicht nur die unterschiedlichen Klassifikationsmechanismen,
sondern auch jegliche Arten von begrifflichen Strukturen (Themenhierarchien, semantische
Netze, Thesauri, usw.), Technologien zur semantischen Archivierung bzw. Verwaltung von
Dokumenten (Topic Maps, Knowledge Mapping, usw.) oder, als weiteres Beispiel, eine semiautomatische Ontologieerzeugung.
Da die Beschreibung von Wissenseinheiten meist mit Hilfe von Zusatzinformation erfolgt, und
diese nicht unbedingt Teil der gespeicherten Einheit ist, wird hier die Subkomponente
Metadaten eingeführt und parallel zu den Organisationssystemen definiert.
Die Unterkomponente Navigation stellt im funktionalen Schema eine eigene Kategorie
innerhalb der Komponente ’Semantik & Auffindung’ dar, weil sie spezielle Mechanismen
implementieren könnte, die eine komplexe Dynamik enthalten (z.B. dynamische Listings,
personalisierte
Datenbereiche,
komplexe
Themenhierarchien,
Navigation
von
Workflowdarstellungen, usw.) und deshalb eine gesonderte Behandlung benötigen würde. Sie
ist im Allgemeinen für die ’Präsentation’ des Intranetangebots verantwortlich.
Die Mechanismen der Informationsauffindung werden von der Subkomponente Suche gedeckt
und umfassen alle damit verbundenen Algorithmen, wie beispielsweise eine automatische
semantische Datensammlung über eine spezialisierte Clustering Applikation. In der Suche sind
somit alle Aspekte des Information Retrieval und Resource Discovery enthalten. Besondere
Berücksichtigung gewinnen in dieser Subkomponente auch Aspekte aus dem Bereich
Datenmanagement, wie die Replikationskriterien oder der Typ des Datenbanksystems.
Die Komponente Sicherheit ist verantwortlich für alle Maßnahmen, um den Zugriff auf
Informationseinheiten applikations- bzw. benutzerspezifisch einzuschränken. Sie kann auch als
die funktionale Verbindung zwischen dem logischen und dem physikalischen Zugriff auf
Wissenseinheiten des Unternehmensgedächtnisses aufgefaßt werden. Der gefilterte Zugriff auf
Objekte des Organisationsgedächtnisses kann aber auch in Abhängigkeit von den Angaben in
Metadaten oder in Suchalgorithmen stattfinden.
Die physikalisch größte und technisch sensibelste Komponente des Systems stellt die Basis dar.
Dahinter ist nicht nur die Systemarchitektur zu verstehen, sondern auch alle Mechanismen, um
dessen Wesen (verteilt, zentralisiert, replizierend, relational, objektorientiert, usw.) transparent
zur Verfügung zu stellen. Mit Hilfe dieser Komponente sollen zum Beispiel die Anforderungen
der Archivierung, Anordnung, Beschreibung und Publizierung von Informationseinheiten erfüllt
werden. Portaleigenschaften, Benutzerinformation, Metadaten und andere Beschreibungs- und
Strukturelemente sollen auch hier definiert und verwaltet werden.
Die Besonderheit des oben dargestellten funktionalen Schemas liegt in dessen allgemeiner
Gültigkeit bezüglich Sichtweisen des Systems. Das heißt, nach der Wahl eines bestimmten
Blickpunktes kann der Pfad des Informationsflusses für eine bestimmte Teilaufgabe (z.B. die
Beobachtung einer Suchanfrage und die Zustellung der Ergebnisse für eine bestimmte
Benutzerrolle) über die betroffenen Komponenten auf übersichtliche Weise verfolgt werden.
Ein praktisches Beispiel, welches diesen Sachverhalt graphisch verdeutlicht, wird im Abschnitt
Kapitel 6 - LÖSUNGSVORSCHLAG
Seite 133
6.2.4 ’Anfoderungsprofil für eine iterative Lösungsmethode’ gegeben. Sind nun die konkreten
Anforderungen an das Informationssystem bekannt und ist eine entsprechende Zuordnung zu
den Wirkungsbereichen - nach einer Analyse mit Hilfe des grundlegenden Schemas - erfolgt, so
liefert das funktionale Schema einen unternehmensspezifischen Arbeitskorpus, welcher konkret
formulierte Aufgaben technisch lösbar und modellierbar macht.
Um die Zweckmäßigkeit des ’technischen Gestaltungsmodells’ in der Praxis zu demonstrieren,
werden im nächsten Abschnitt kritische Aspekte bei der Konzeption eines wissensbasierten
Informationssystems für transnationale Konzerne – wie bereits im Untersuchungsbereich der
vorliegenden Arbeit ausführlich beschrieben – mit den Wirkungsbereichen ’Organisation’,
’Inhalt & Semantik’ und ’Technik’ in Verbindung gebracht. Diese kritischen Aspekte stellen
somit konkrete Anforderungen an das System dar. Je eine Anforderung wird - der Einfachheit
halber - einem einzigen Wirkungsbereich zugeordnet. Somit wird die technische Erfassung von
einzelnen Aspekten innerhalb des funktionalen Schemas leichter modellierbar und
infolgedessen übersichtlicher. Die Untersuchung und Auswertung der Anforderungen mittels
des funktionalen Schemas wird durch eine iterative Methode im Abschnitt 6.2.4 beschrieben.
Das Hauptziel dieser Vorgehensweise ist somit die möglichst eindeutige Erfassung eines
Teilproblems (d.h. eines kritischen Aspekts bzw. einer Systemanforderung) durch eine oder
mehrere Komponenten des funktionalen Schemas. Damit werden die Einflüsse jedes Problems
auf gezielte Teile des Gesamtsystem isoliert, wodurch die technische Lösung anhand der im
Untersuchungsbereich beschriebenen Mechanismen diverser Disziplinen leichter erkennbar und
umsetzbar wird.
6.2.3
Anforderungen eines transnationalen Konzerns an ein wissensbasiertes
Informationssystem
Es sei an dieser Stelle darauf hingewiesen, dass der Entwurf und die Anwendung des
’technischen Gestaltungsmodells’ nicht eine maßgeschneiderte Lösung für das
Wissensmanagement in transnationalen Konzernen, sondern eine Arbeitsgrundlage für die
Aufbereitung, Organisation und Ordnung von Informationseinheiten eines wissensbasierten
Systems, in Abhängigkeit der technischen Systemkomponenten, darstellt. Der Schwerpunkt
liegt also in den Mechanismen zur semantischen Informationsaufbereitung und in der
technischen Implementierung von Lösungsaufgaben aufgrund folgender Hauptcharakteristika
transnationaler Konzerne:
•
Stark verteilte und vernetzte Administration von Informationseinheiten
•
Bedarfsgerechter und kontextabhängiger Informationsfluß
•
Komplexe und dynamische Organisationsstruktur des Unternehmens
•
Standortbezogene Einflüsse auf die Semantik der Informationseinheiten
Das Auftreten dieser Eigenschaften mag durch folgende Aspekte begründet sein:
Stets vorhandene Querverbindungen zwischen den Funktionen unterschiedlicher
Unterbereiche des Konzerns
Notwendigkeit des Verbergens der verteilten Systemarchitektur durch Steigerung der
Transparenz
Abbildung der Gliederungsart des Konzerns auf die Zugangsstrukturen des Systems
Kapitel 6 - LÖSUNGSVORSCHLAG
Seite 134
Internationalisierung des Konzerns (d.h. grenzüberschreitende Lösungen unter
Berücksichtigung spezifischer nationaler Gegebenheiten)
Der erste Schritt zur praktischen Anwendung des technischen Gestaltungsmodells wird in
diesem Abschnitt in Form einer geordneten Auflistung von Anforderungen stattfinden. Hierfür
werden die wichtigsten, im Untersuchungsbereich der vorliegenden Arbeit erkannten
Problembereiche (’kritischen Aspekte’) berücksichtigt und je zu einem bestimmten
Wirkungsbereich zugeordnet (unter Verwendung der Kriterien des grundlegenden Schemas). Es
resultiert somit die im Folgenden beschriebene Einteilung kritischer Aspekte zur Konzeption
eines Informationssystems für transnationale Konzerne.
Es wird in diesem Abschnitt nicht näher auf die Beschreibung einzelner Anforderungen
eingegangen, da sie direkt aus dem Kontext des Untersuchungsbereichs stammen und bereits
ausführlich erörtert wurden. Es werden aber exemplarische Anmerkungen gegeben, um aus
informationstechnischer Sicht das Problem zu beleuchten.
Wirkungsbereich Organisation
Dieser Bereich umfaßt planende, kontrollierende, steuernde, strategische und operative
Anforderungen an das System. Die wichtigsten Anforderungen in diesem Kontext werden wie
folgt eingeteilt:
•
Gliederungsart bzw. Organisationsform des Konzerns: Das Ziel dieser Anforderung ist
die Festlegung der zu implementierenden Zugangsknoten und Strukturelemente des
Informationssystems, zum Beispiel die strategische Anordnung von Portalen und deren
Zusammenhänge.
•
Ist-/Soll-Stand der technischen Infrastruktur: Unter diesem Aspekt sollen Fragen zur
allgemeinen Systemarchitektur beantwortet werden (z.B. zentralisiertes, verteiltes oder
integriertes System). Die Erkennung von standortabhängigen Gegebenheiten bzgl.
Technologien findet auch unter diesem Aspekt statt (Heterogene Systeme,
unterschiedliche Netzwerktopologien, Geschwindigkeiten der Internetverbindungen,
usw.).
•
Spezielle Applikationen: unter diesem Aspekt sollen frühzeitig spezifische
Applikationen isoliert und genau betrachtet werden. Beispiele hierfür wäre die
Implementierung eines Workflowmoduls für das gesamte Unternehmen. Es ist sehr
wichtig festzulegen, ob eine Applikation über den gesamten Konzern transparente
Anwendung findet, oder ob spezielle Anpassungen für bestimmte Unterbereiche
notwendig sind. Weitere Beispiele für spezielle Applikationen sind eLearning Systeme,
komplexe Nachrichtenverwaltung, Organisation und Darstellung begrifflicher
Strukturen, usw.
•
Rollenkonzept:
Festlegung der Gruppenarchitektur und Rechtevergabe der
Informationseinheiten. Hier werden Entscheidungen getroffen, wie zum Beispiel ob ein
anonymer Benutzer eine rein ’lesende’ Rolle, oder eine sehr beschränkte Schreibrolle
übernehmen wird. Die formalen Unterschiede zwischen Publizierer, Content Manager,
usw. werden hier auch definiert. Hier werden auch spezielle Rollen - wie zum Beispiel
für Workflow Applikationen, eLearning Umgebungen, usw. - besprochen. Die
Berücksichtigung dieser Aspekte ist von höchstem Stellenwert, da eine falsch
ausgelegte Benutzer- und Gruppenverwaltung beispielsweise zu inneren
Sicherheitslücken führen könnte.
•
Authentifizierung: z.B. Mechanismen zur Identifikation von Benutzern und deren
Rollen am System.
Kapitel 6 - LÖSUNGSVORSCHLAG
Seite 135
•
Autonomie mancher Unternehmensbereiche: Gesonderte Behandlung von speziellen
Rollenkonzepten, abgesicherten Portalen, Zugriff auf geheime Daten, spezialisierte
Replikationskriterien, usw. Hier wird nur die Entscheidung getroffen, ob solche
Mechanismen notwendig sind oder nicht.
•
Tools zur Steigerung der Kollaboration: z.B. Diskussionsforen, Teamwork Spaces,
usw. Obwohl diese Aspekte auch unter dem Bereich der speziellen Applikationen Platz
finden würden, stellen sie ganzheitliche Funktionen zu einem bestimmten Zweck dar.
•
Tools zur Steigerung der Kommunikation: z.B. Chatsysteme, Video Conferencing oder
Emailapplikationen.
•
Globale Kriterien bezüglich Informationszugang und -darstellung: Unter diesem
Aspekt werden ganz allgemeine Lösungskonzepte zu spezifischen Zugangs- und
Darstellungsmechanismen behandelt. Es geht hierbei darum, die Art des
Informationsflusses für spezifische Aufgaben (z.B. spezifische Applikationen oder
Teilproblemen) zu definieren. Eine weitere sinnvolle Unterteilung dieses Punktes ergibt
sich wie folgt:
o
o
o
o
o
o
o
o
Ortsgerechter Zugang (z.B. standortabhängiges Inhaltsangebot)
Anwendungsgerechter Zugang (z.B. beschränkter Zugang auf spezielle
Applikationen)
Zeitgerechter
Zugang
(z.B.
Scheduled
System-Jobs
wie
Synchronisationsmechanismen bei Datenreplikation)
Bedarfsgerechter Zugang (z.B. adaptive Navigation durch Strukturen bzw.
adaptive Präsentation von Informationseinheiten)
Anwendergerechter Zugang (z.B. automatische Rechtevergabe bei der
Erstellung von Informationseinheiten)
Zielgerechter Zugang (z.B. Festlegung der notwendigen Anpassungen zur
Änderung des Verhaltens von Standardfunktionen zu einem bestimmten Zweck.
Ein Beispiel hierfür wäre des Ersetzen der Datenlöschung durch eine versteckte
Archivierung zum Zwecke des unwiderruflichen bzw. unbeabsichtigten
Verlustes von Informationseinheiten)
Sicherheitsgerechter Zugang (zum Beispiel spezielle Sicherheitsmechanismen
bei autonomen Unternehmensbereichen mit streng geheimen Informationen)
Kostengerechter Zugang
(z.B. das Ergreifen von Maßnahmen zur
Datenreplikation in bestimmten Gebieten anstatt der Errichtung von einer
teuren und leistungsstarken IT - Infrastruktur)
•
Unternehmensspezifische Organisationssysteme: Hierbei soll lediglich auf die
Notwendigkeit dieser Mechanismen hingewiesen werden. Die konkrete Definition und
technische Implementierung werden von den anderen Wirkungsbereichen gedeckt.
•
Überwindung von sozialen und kulturellen Barrieren: Sprachen, Hierarchien,
Bürokratie, Gesetzgebung und inkoherente Paradigmen unter den unterschiedlichen
Kulturen mehrerer zusammenarbeitenden Standorte in verschiedenen Ländern.
•
Handhabung der Wissensbausteine: Unter diesem besonderen Aspekt des
Wissensmanagements werden die Wissensbausteine Identifikation, Erwerb,
Entwicklung, (Ver)teilung,
Bewahrung, Nutzung, Messung und Zielsetzung,
gemeinsam oder getrennt voneinander, behandelt.
•
Modellierung spezifischer Geschäftsprozesse: z.B. Ablauf spezifischer Innovations-,
Produktions- oder Fertigungsprozesse bei technischen Konzernen, aber auch
grenzüberschreitende finanzielle Abwicklungen, oder die Berücksichtigung
Kapitel 6 - LÖSUNGSVORSCHLAG
Seite 136
unterschiedlicher Rechtssysteme in unterschiedlichen Ländern und deren Einfluß auf
die Abwicklung von Projekten.
Wirkungsbereich Inhalt & Semantik
Dieser Wirkungsbereich umfaßt alle Maßnahmen, um die Qualität und die Bedeutung von
Informationseinheiten und deren Inhalte zu definieren bzw. zu steigern.
•
Qualität und Relevanz von Informationseinheiten: Diese Anforderung kann z.B. über
erweiterte Metadatensätze erfüllt werden. Eine weitere Möglichkeit wäre eine
Beurteilung der Informationseinheiten durch einen oder mehrere Referees,
Fachexperten oder Content Manager.
•
Einsatzmöglichkeiten von Klassifikationsschemata: Experten im Bereich der
Wissensorganisation könnten hier schnellere und effizientere Entscheidungskriterien für
die Wahl des richtigen Schemas finden. Mögliche Alternativen sind beispielsweise
numerische (Dewey) oder themenspezifische (ACM) Klassifikationen.
•
Einsatz spezifischer Metadatensätze: Parallel zur Qualitätssteigerung von Inhalten, kann
durch vordefinierte Metadatensätze eine zweckgebundene semiautomatische
Klassifikation von Informationseinheiten gewährleistet werden.
•
Begriffliche Strukturierungen: Einsatz und Anwendungsgebiete von Thesauri,
semantischen Netzen, Begriffslisten, usw. (=> Wissensorganisation).
•
Unterschiedliche bedarfsgerechte Sichtweisen: Wichtige Teile des Systems, wie zum
Beispiel Zugangs-, Erkennungs- und Navigationsmechanismen können zur
dynamischen Generierung von bedarfsgerechten Sichtweisen beitragen. Hierbei treten
zum Beispiel die Konzepte der Wissensmodellierung und –visualisierung stark in
Aktion.
•
Resource Discovery vrs. Information Retrieval: z.B. der Einsatz von Dat Mining,
Clustering, usw.
•
Anwendung von Ontologien: z.B. die Notwendigkeit und die Einsatzmöglichkeiten von
automatischen Taxonomieerstellungen spezifische Fachbereiche.
•
Semantische
Suche:
z.B.
indizierte
Suchmechanismen,
strukturbeschränkte Suche über Metadatendefinitionen, usw.
•
Lebenszyklus von Dokumenten: Unter diesem Aspekt werden beispielsweise
Sichtbarkeit und Relevanz von Informationseinheiten in Abhängigkeit von der Zeit oder
von der Dokumentenart festgelegt (Document Management).
•
Personalisierte Dienste: z.B. die Erstellung von Themenprofilen anhand des Such- und
Navigationsverhaltens von Benutzern und dementsprechend neue Auffindungskriterien
zur Verfügung stellen oder ein zusätzliches personalisiertes Informationsangebot
liefern.
•
Funktionalität der Themenhierarchie: Hiermit ist die Technologieauswahl gemeint, z.B.
XML Topic Maps (XTM), Standard XML, RDF, usw.
Volltextsuche,
Wirkungsbereich Technik
In diesem Wirkungsbereich fallen sehr wichtige Entscheidungen über die Gestaltung und
Implementierung des technischen Szenarios des Informationssystems. Die wichtigsten
Anforderungen an das Informationssystem werden wie folgt aufgelistet.
Kapitel 6 - LÖSUNGSVORSCHLAG
Seite 137
•
Inhaltserschließung und –analyse: z.B. Indizierung von Informationseinheiten für die
Steigerung der Suchfunktionalität.
•
Kriterien und Implementierung der Datenreplikation: Die Implementierung solcher
Mechanismen hängt von der zweckmäßigen Orientierung des Lösungsansatzes,
entweder zur Optimierung der Fehlertoleranz oder zur Steigerung der Performanz, ab.
•
Implementierung vom Verteilungsgrad des Systems: technische Kriterien zur Lösung
der verteilten Systemarchitektur (z.B. Serverpool, VPN, usw.).
•
Implementierung der Systemtransparenz: technische Kriterien zur Lösung der
transparenten Systemarchitektur (z.B. Festlegung eines Browser als Front End des
Systems, oder Replikationsmechanismen zum Zwecke des transparenten Zugangs zu
’lokalen’ Informationseinheiten). In Verbindung mit der Transparenz des Systems - ein
Phänomen, das im Abschnitt 3.2.2 ’Verteilte Systeme’ ausführlich beschrieben wurde –
ergibt sich eine weitere Unterteilung in folgende Punkte:
o
Ortstransparenz: z.B. der Informationszugriff
Namensgebung der Informationseinheiten
o
Migrationstransparenz:
z.B.
die
Verlagerung
(Informationseinheiten) ohne Änderung des Namens
o
Zugriffstransparenz: z.B. Festlegung des Browsers als Interface
o
Replikationstransparenz: z.B. Vortäuschung eines einzigen Objektes aus einer
Menge von Replikaten
o
Nebenläufigkeitstransparenz: z.B. Transparenz und Synchronisation beim
gemeinsamen Zugriff auf replizierte Objekte
o
Parallelitätstransparenz: z.B. Parallelprogrammierung
Prozessoren (Synchronisation bei verteilter Prozessorlast)
o
Skalierungstransparenz
Informationssystems
o
Leistungstransparenz (Performanztransparenz): z.B. Rekonfiguration des
Systems, um Performanz zu steigern.
:
z.B.
Erweiterbarkeit
über
und
eine
eindeutige
von
Objekten
auf
mehreren
Modularität
des
•
Archivierungskriterien und Datenverwaltung: z.B. Einsatz von Datenbanken,
Filesystemen, Objektorientierung der Lösung, Entwurf und Verwaltung von
Archivierungsstrukturen
•
Implementierung spezifischer Applikationen: Hier wird die technische Lösung von
spezifischen Applikationen festgelegt (Technologieauswahl, Programmiersprache,
Module, Signaturen, usw.).
•
Implementierung spezifischer Funktionseinheiten: Unter diesem Aspekt wird die
Funktionalität und technische Ausführung von speziellen Algorithmen festgelegt (z.B.
Clustering-Mechanismen, Ähnlichkeitskriterien bei semantischer Suche, Metaisierung
von Informationseinheiten zum Zwecke einer Klassifikation, usw.).
•
Metadatenverwaltung: z.B. explizite Unterscheidung und getrennte Speicherung von
Inhalt und Zusatzinformation.
•
Sicherheitskriterien: z.B. Verschlüsselungsalgorithmen, Netzwerktopologie, FirewallKonfiguration, usw.
•
Einsatz von Standards, Technologien und Formaten: z.B. XML, RDF, usw.
Kapitel 6 - LÖSUNGSVORSCHLAG
Seite 138
•
Überprüfung der Systemstabilität und –zuverlässigkeit: z.B. Testphasen zu bestimmten
Zeitpunkten auf bestimmte Ressourcen, oder Festlegung des Ablaufs eines
Penetrationstests zur Schwachstellenüberprüfung des Systems.
•
Dynamik der Bereitstellung von Informationseinheiten: z.B. die technische
Implementierung von benutzerabhängiger und bedarfsgerechter Navigation über
semantische Strukturen.
•
Implementierung einer Themenhierarchie: z.B. statische und dynamische Speicherung
von Hierarchieelementen und deren Zusammenhänge, um eine semantische Navigation
über die Hierarchieknoten zu ermöglichen.
•
Zweckgebundene Systemdienste: z.B. Benutzerdienste zum Zwecke der Kommunikation
(Chatsystem oder Video Conferencing), oder Netzwerkdienste zum Zwecke der
Synchronisation (Replikation), der Verzeichnisverwaltung oder der Sicherheit.
Die oben definierten Anforderungen lassen nun eine gewisse Zugehörigkeit zu den
Hauptdisziplinen erkennen, wenn man den jeweiligen zugeordneten Wirkungsbereich anhand
des ’Arbeitsmodells zur allgemeinen Sichtweise der Lösung’ (Abschnitt 6.1.2) und des
’grundlegenden Schemas’ (Abschnitt 6.2.1) untersucht.
Mit Hilfe des funktionalen Schemas (Abschnitt 6.2.2) sollen im nächsten Abschnitt die
Einflüsse der Anforderungen auf die Komponenten des Informationssystems in Abhängigkeit
vom Informationsfluß abgeleitet werden.
6.2.4 Anfoderungsprofil für eine iterative Lösungsmethode
Im zweiten und letzten Schritt zur Veranschaulichung der praxisorientierten Anwendung des
Lösungsvorschlags (’Technisches Gestaltungsmodell’) werden alle im vorangegangenen
Abschnitt aufgelisteten, spezifischen Systemanforderungen mit Hilfe des funktionalen Schemas
in eine Arbeitstabelle (’Anforderungsprofil für eine iterative Lösungsmethode’) eingetragen,
wodurch die Beziehungen zu den unterschiedlichen Komponenten des Schemas dargestellt
werden.
Die Lösungsmethode
Die Methode zur vollständigen Korrektheit des Gestaltungskonzepts erfolgt über mehrere
Analyse-Schritten durch die ganze Tabelle. Das heißt, die Auswertung der Anforderungen
findet ’iterativ’ statt. Es wird solange durch die gesamte Tabelle iteriert, bis eine korrekte
Zuordnung jeder Anforderung zu den Komponenten des funktionalen Schemas erkannt wird.
Die zwei wichtigsten Merkmale dieser Methode lassen sich somit wie folgt zusammenfassen:
•
Iterative Betrachtung des Gesamtproblems (laut Anforderungsprofil)
•
Eindeutige Zuordnung von Teilproblemen zu spezialisierten Komponenten des
funktionalen Schemas
Der Vorteil dieser iterativen Lösungsmethode anhand des Anforderungsprofils besteht darin,
dass durch die oben erwähnten Merkmale auf technische und taktische Feinheiten der
Gesamtkonzeption geschlossen werden kann.
Das Ergebnis der praktischen Anwendung des technischen Gestaltungsmodells auf die
Anforderungen an ein wissensbasiertes Informationssystem für transnationale Konzerne wird in
Kapitel 6 - LÖSUNGSVORSCHLAG
Seite 139
[Tab. 6.2a-c] dargestellt (entsprechend der im Abschnitt 6.2.3 erstellten Liste). Die einzelnen
Komponenten und Subkomponenten des funktionalen Schemas wurden in den Spalten der
Tabelle so angeordnet, dass jede Zeile (Anforderung) eine eindeutige und unabhängige
Zuordnung erhalten kann.
In [Tab. 6.2a-c] wurden die Komponenten aus Platzgründen mit Nummern, wie folgt, versehen:
1: Zugang
2: Erkennung
3: Semantik & Auffindung
3a: Organisationssysteme
3b: Metadaten
3c: Navigation
3d: Suche
4: Sicherheit
5: Basis
Anforderungen an das Informationssystem
(Wirkungsbereich Organisation)
Komponente
3
1 2
4 5
a b c d
Gliederungsart bzw. Organisationsform des Konzerns
Ist-/Soll-Stand der technischen Infrastruktur
Spezielle Applikationen
Rollenkonzept
Authentifizierung
Autonomie mancher Unternehmensbereiche
Tools zur Steigerung der Kollaboration
Tools zur Steigerung der Kommunikation
Globale Kriterien bzgl.
Informationszugang und -darstellung:
ortsgerecht
anwendungsgerecht
zeitgerecht
bedarfsgerecht
anwendergerecht
zielgerecht
sicherheitsgerecht
kostengerecht
Unternehmnesspezifische Organisationssysteme
Überwindung von sozialen und kulturellen Barrieren
Handhabung der Wissensbausteine
Modellierung spezifischer Geschäftsprozesse
Tabelle 6.2a: Anforderungsprofil bzgl. des Wirkungsbereichs ’Organisation’ zur iterativen
Lösungsmethode mit Hilfe des funktionalen Schemas.
Kapitel 6 - LÖSUNGSVORSCHLAG
Seite 140
Anforderungen an das Informationssystem
(Wirkungsbereich Inhalt & Semantik)
Komponente
3
1 2
4 5
a b c d
Qualitäts und Relevanz von Informationseinheiten
Einsatzmöglichkeiten von Klassifikationsschemata
Einsatz spezifischer Metadatensätze
Begriffliche Strukturierungen
Unterschiedliche bedarfsgerechte Sichtweisen
Ressource Discovery vrs. Information Retrieval
Anwendung von Ontologien
Semantische Suche
Lebenszyklus von Dokumenten
Personalisierte Dienste
Funktionalität der Themenhierarchie
Tabelle 6.2b: Anforderungsprofil bzgl. des Wirkungsbereichs ’Inhalt & Semantik’ zur iterativen
Lösungsmethode mit Hilfe des funktionalen Schemas.
Anforderungen an das Informationssystem
(Wirkungsbereich Technik)
Komponente
3
1 2
4 5
a b c d
Inhaltserschließung und – analyse
Kriterien und Implementierung der Datenreplikation
Implementierung vom Verteilungsgrad des Systems
Implementierung der Systemstransparenz
Ortstransparenz
Migrationstransparenz
Zugriffstransparenz
Replikationstransparenz
Nebenläufigkeitstransparenz
Parallelitätstransparenz
Skalierungstransparenz
Leistungstransparenz (Performanztransparenz)
Archivierungskriterien und Datenverwaltung
Implementierung spezifischer Applikationen
Implementierung spezifischer Funktionseinheiten
Metadatenverwaltung
Sicherheitskriterien
Einsatz von Standards, Technologien, Formaten
Überprüfung der Systemstabilität und -zuverlässigkeit
Dynamik der Bereitstellung von Informationseinheiten
Dynamik des Wissensretrievals
Implementierung der Themenhierarchie
Zweckgebundene Systemdienste
Benutzerdienste
Netzwerkdienste
Tabelle 6.2c: Anforderungsprofil bzgl. des Wirkungsbereichs ’Technik’ zur iterativen Lösungsmethode
mit Hilfe des funktionalen Schemas.
Kapitel 6 - LÖSUNGSVORSCHLAG
Seite 141
Bei der Analyse der Systemanforderungen mit Hilfe des funktionalen Schemas soll im
Allgemeinen versucht werden, jede Anforderung einer oder mehreren Komponenten
’funktional’ zuzuordnen. Der Hintergedanke hinter diesem Zuordnungsprozeß führt gleichzeitig
zu einer Auseinandersetzung mit dem logischen Entwurf der gesuchten technischen Lösung und
mit den möglichen Implementierungsmechanismen, welche von den betroffenen Disziplinen zur
Verfügung gestellt werden (entsprechend des im ersten Abschnitt dieses Kapitels dargestellten
Arbeitsmodells).
Am Beispiel der ersten Eintragung in [Tab. 6.2a]soll dieser Sachverhalt verdeutlicht werden.
Die Gliederungsart des Konzerns, welche vom Informationssystem abgebildet werden soll,
entspricht einer strategischen Überlegung. Deshalb wurde dieser Aspekt dem Wirkungsbereich
Organisation zugeordnet. Die Gliederungsarten eines Unternehmens werden in der Konzeption
der Lösung einbezogen, weil die Zugangsstruktur bzw. das strukturelle Zugangskonzept des
Systems und deren Navigationselemente damit vollständig beschrieben werden sollen. Dies
könnte beispielsweise zu der Entscheidung führen, dass mehrere Portale, welche eine bestimmte
Gliederungsart strukturell abbilden, ’hierarchisch angeordnet’ implementiert werden sollen. Die
taktische Isolierung dieses Aspekts nach der Untersuchung anhand des funktionalen Schemas
(Abschnitt 6.2.2) ergibt insgesamt einen Einfluß auf vier Komponenten, wie folgt:
•
Zugang (wegen der strukturellen Eigenschaft des Aspekts)
•
Organisationssysteme (wegen der semantischen Natur des Aspekt),
•
Navigation (wegen einer eventuellen Implementierung von dynamischer Erzeugung und
Modifizierung von Portalen) und
•
Basis (wegen der Erfassung und Verwaltung eines Portals als ’Informationsobjekt’
innerhalb der Datenbank bzw. des Organisationsgedächtnisses).
Schließlich kann aus dem ’Arbeitsmodell zur allgemeinen Sichtweise der Lösung’ (siehe
Abschnitt 6.1.2) entnommen werden, dass diese strategische Entscheidung von der
Hauptdisziplin Wissensmanagement getroffen wird. Falls diese Lösungsmethode den gesamten
Konzeptionsvorgang des Informationssystems begleitet, so wird die Erfüllung der Anforderung
(die Implementierung der Lösung) zunehmend von den Bereichen Informationsmanagement
bzw. Wissensorganisation übernommen. Ob nun die Lösung des Problems durch eine spezielle
begriffliche Struktur oder durch eine gewöhnliche statische Baumstruktur im System gelöst
wird, hängt mit anderen technischen Aspekten zusammen. Die Analyse dieser speziellen
Anforderung bezüglich des Wirkungsbereichs Organisation hat lediglich einen strategischen
Hintergrund.
Auf gleiche Weise wurden alle anderen kritischen Aspekte in [Tab. 6.2a-c]untersucht und
eingetragen. Die endgültige Zuordnung von spezifischen Teilproblemen zu den
unterschiedlichen Komponenten hängt vom konkreten Anforderungsprofil eines spezifischen
Unternehmens ab. Somit stellt die in [Tab. 6.2a-c]angegebene Auswertung lediglich die
Meinung des Autors der vorliegenden Arbeit zur allgemeinen Problematik dar, und kann
deshalb als Bezugskriterium zur genauen Beurteilung einer konkreten Aufgabenstellung dienen.
Beispiel für die Anwendung des funktionalen Schemas zur Lösung einer spezifischen
Aufgabenstellung
Die gewählte Darstellungsform der Komponenten des funktionalen Schemas laut [Abb. 6.8]
ergibt sich aus der Notwendigkeit, die dynamische und flexible Interaktion zwischen den
Modulen in der Komponente ’Semantik & Auffindung’ sichtbar zu machen. Um zum Beispiel
den Informationsfluß bei einer beliebig formulierten Suchanfrage über ein
Kapitel 6 - LÖSUNGSVORSCHLAG
Seite 142
Klassifikationsschema zu modellieren, könnte man den in [Abb. 6.9] beschriebenen
Lösungsansatz wählen.
Administrierung
Erstellung
Bereitstellung
Der Benutzer A verschafft sich Zugang zum System über das Portal 1 und startet eine
Suchanfrage. Das System nimmt die Rolle des Benutzers über die Komponente Erkennung
wahr, aktiviert den Suchmechanismus über die vorgewählte Sichtweise (zum Beispiel ein
selbstdefiniertes Klassifikationsschema) und holt sich aus dem Gesamtsystem (unter
Berücksichtigung des Zugriffskonzepts) alle für die Suchanfrage relevanten
Informationseinheiten. Der ’semantisch gültige Bereich’ bei der Suche im
Unternehmensgedächtnis ergibt sich aus der partiellen Sichtweise der Komponente
Organisationssysteme. Die Ergebnisse werden aus der Basis geholt und über die
Navigationskomponente dem Benutzer zur Verfügung gestellt. Eine Aufgabe der
Administrierung von Information könnte hierbei darin bestehen, dass das Informationssystem
unter Umständen den Zugriff auf ein bestimmtes Replikat ermöglichen sollte, um – zum
Beispiel - die Performanz des Netzwerkverkehrs zum Standort des Benutzers A zu steigern bzw.
zu optimieren.
Abbildung 6.9: Beispiel für den Pfad des Informationsflusses für eine (fiktive) Suchanfrage in einem
wissensbasierten Informationssystem für transnationale Konzerne
Bei diesem - fiktiven und vereinfachten - Beispiel ist somit ersichtlich geworden, dass manche
Komponenten des Schemas nicht immer ins Spiel kommen müssen. In diesem Fall wurde
einerseits die Komponente Metadaten bei der Anfrage übersprungen, andererseits kam nur die
Navigationskomponente bei der Antwort des Systems ins Spiel.
Kapitel 6 - LÖSUNGSVORSCHLAG
Seite 143
Vorteile des technischen Gestaltungsmodells
Einige wichtige Vorteile der Anwendung des in diesem Kapitels entworfenen technischen
Gestaltungsmodells lassen sich wie folgt auflisten:
•
Verwendung von einheitlichen Systemkomponenten
•
Abstimmung der Mangementstrategie mit der technischen Lösung
•
Klare Definitionen von Abläufen und Prozessen
•
Einführung in die Problematik in analytisch kleinen Schritten, danach relativ schnelle
iterative Konzeption der technischen Lösung
•
Hohes Integrationspotential von Systemteilen
•
Genaue Erfassung und Meßbarkeit der Ziele
•
Übersichtliche Spezifikationen der Kundenverantwortlichkeiten
Risiken des technischen Gestaltungsmodells
Die Risiken bei der Anwendung des Modells sollen an dieser Stelle nicht unerwähnt bleiben. Da
viele transnationale Konzerne keine andauernde statische Struktur aufweisen, ist die Suche nach
einer nachhaltigen Lösung aus einer Strategie heraus stark von den momentanen Gegebenheiten
der Infrastruktur abhängig.
Weiters ist es in der Praxis sehr schwer aus den gestreuten Verantwortlichkeiten des
Unternehmens allgemein gültige Anforderungen herauszuarbeiten. Aus diesen Gründen
empfiehlt es sich, eine Gruppe von Fachexperten aus den unterschiedlichen Fachgebieten und
Unternehmensbereichen intensiv zusammenarbeiten zu lassen, um gemeinsam für die
komplexen Anforderungen des großen und geographisch verteilten Unternehmens effiziente und
effektive Lösungen zu finden.
6.3 Zusammenfassung
Es wurde in diesem Kapitel der Versuch unternommen, anhand der Erkenntnisse des
Untersuchungsbereichs die Aktionsbereiche und Einflüsse der Hauptdisziplinen
(Wissensmanagement, Informationsmanagement, Datenmanagement und Wissensorganisation)
mit Hilfe eines gemeinsamen Arbeitsraumes möglichst präzise zu definieren. Das Ziel war die
technische Lösung zur Konzeption eines wissensbasierten Informationssystems für
transnationale Konzerne zu finden.
In diesem Kontext konnten sicherlich nicht alle kritischen Aspekte für die Konzeption
berücksichtigt werden, da es keine allgemeine Lösung für alle Arten von Konzernen gibt. Mit
der Anwendung des ’technischen Gestaltungsmodells’ können aber viele Teilprobleme auf
übersichtliche und effiziente Weise gelöst werden. Die Komponenten des funktionalen Schemas
stellen wichtige Teile jedes Informationssystems dar, und erlauben somit eine gute Annäherung
zu einer Gesamtmodellierung der komplexen semantischen Informationsaufbereitung in stark
verteilten und vernetzten Strukturen.
Das nächste Kapitel zeigt beispielhaft die Anwendung des hier vorgestellten
Gestaltungsmodells anhand eines konkreten Intranetprojekts für einen anonymisiert
dargestellten transnationalen Konzern.
Kapitel 7 – IMPLEMENTIERUNG DES SYSTEMS
Seite 144
Kapitel 7
Implementierung des Systems
Die in diesem Kapitel beschriebene Implementierung des Systems basiert auf der konkreten
Gestaltung eines Informationssystems für einen technischen transnationalen61 Konzern, welcher
anonymisiert (und daher nicht im Detail) vorgestellt wird. Der Autor der vorliegenden Arbeit,
als Mitglied der Web Applications Group des Instituts für Informationsverarbeitung und
Computergestützte neue Medien der Technischen Universität Graz (WAG-IICM Graz),
begleitete die Gesamtkonzeption des Informationssystems und arbeitete bei der
Implementierung aller Module und Applikationen mit.
Aufgrund des Kundenwunsches und des umfangreichen Erfahrungsspektrums der WAG-IICM
fiel die Entscheidung für die Implementierung der Intranetumgebung auf den Einsatz eines
Hyperwave Information Servers. Deshalb wird der Kern des in diesem Kapitel beschriebenen
Informationssystems durch die technologischen Möglichkeiten und die Architektur des
Hyperwave Information Servers62 (Version 5.5 SP2) gebildet. Aus diesem Grund wird im
Unterkapitel 7.1 ’Hyperwave Information Server’ eine Einführung in die Funktionalität dieses
Systems dargelegt, wobei lediglich die besonderen Eigenschaften im Kontext der vorliegenden
Arbeit hervorgehoben werden.
Im Unterkapitel 7.2 ’Allgemeine Problembeschreibung’ werden die wichtigsten Merkmale des
transnationalen Konzerns präsentiert. Es werden strukturelle und funktionale Eigenschaften
beschrieben, und daraus kritische Problembereiche anhand des im Abschnitt 6.2 vorgestellten
Technischen Gestaltungsmodells ermittelt. Das Unterkapitel 7.3 ’Technische Implementierung’
befaßt sich mit der technischen Lösung des Systems auf der Basis des Hyperwave Servers. Die
Beschreibung des grundlegenden Lösungsszenarios wird von einer Untersuchung der
Zusammenhänge mit dem Technischen Gestaltungsmodell begleitet, und aus einer allgemeinen
Sichtweise beleuchtet. Um die konkrete Umsetzung auf dem Hyperwave Information Server zu
demonstrieren, werden dann zwei Teilkomponenten (Module) aus der Gesamtlösung
ausgewählt. Die Auswahl dieser Module (’Metadatensätze’ und ’News Applikation’) erfolgte
aufgrund der direkten Einflüsse von den bisher untersuchten Disziplinen und der expliziten
Zusammenhänge mit den Komponenten des im Kapitel 6 erstellten Technischen
Gestaltungsmodells.
7.1 Hyperwave Information Server
Insbesondere transnationale Konzerne sind daran interessiert, eine Gesamtlösung für ihr
Informationssystem, wodurch ihre Geschäftsprozesse effizient und profitabel abgewickelt
werden, zu finden. Moderne wissensbasierte Informationssysteme sollen also in der Lage sein,
die richtige Information zum richtigen Zeitpunkt an der richtigen Stelle zur Verfügung zu
stellen.
Bei der webbasierten Hyperwave Infrastruktur handelt es sich um eine integrierte und
konfigurierbare Produktfamilie für Wissensmanagement und eLearning, die mehrere technische
Lösungsbereiche umfasst, zum Beispiel Document Management, Content Management,
61
Für die Anwendung des Begriffs ’transnational’ sei an dieser Stelle auf die im Abschnitt 1.2
’Transnationale Konzerne’ eingeführte Interpretation des Autors der vorliegenden Arbeit verwiesen.
62
http://www.hyperwave.com
Kapitel 7 – IMPLEMENTIERUNG DES SYSTEMS
Seite 145
Archivierung mit Konfigurationsmanagement, spezielle Suchfunktionalität, beliebig
erweiterbare Metadaten, Wissensportale, automatisches Link Management, Workflow,
Teamwork Spaces, eLearning, und andere. Die Funktionsweise des Hyperwave Information
Servers ist vielseitig und umfassend in ihrer Anwendbarkeit. Dieser Abschnitt soll keine
technische Übersicht aller Besonderheiten des Systems darstellen, sondern eine Auswahl von
interessanten Funktionen und Vorteilen im Kontext der vorliegenden Arbeit beschreiben. Für
eine detaillierte technische Beschreibung der Architektur, Funktionalität, Administration,
Bedienung und Programmierung des Hyperwave Information Servers sei deshalb an dieser
Stelle an die offizielle Dokumentation (Handbücher, Informationsbroschüren und White Papers)
der HYPERWAVE AG63 oder an wissenschaftliche Arbeiten des IICM-TU-Graz64 hingewiesen.
Der Inhalt dieses Abschnitts basiert auf folgenden im Literatur- und Quellenverzeichnis
angegebenen Unterlagen: [Hyperwave 2001a-c], [Hyperwave 2001a-c], [Kappe 2001],
[Schwarzmann 1999] und [Stadlmann 1999].
Dateninhalte, insbesondere Dokumente jeglichen Typs, werden auf dem Hyperwave
Information Server in Form von Objekten abgelegt. Diese werden also in einer
objektorientierten Art verwaltet und organisiert. Jedem Dokument werden dabei bestimmte
Metadaten (in Hyperwave Objektattribute genannt), welche Eigenschaften des entsprechenden
Dokuments beschreiben, zugewiesen. Neben der eigenen objektorientierten Datenbank von
Hyperwave, welche speziell auf die Anforderungen eines stark verteilten Informationssystems
abgestimmt ist, kann das System auch mit anderen Datenbanksystemen - Oracle 8i (ab Version
8.1.7) und Microsoft SQL Server 2000 - arbeiten.
Neben den Dokumentobjekten stellt der Hyperwave Information Server eine zweite Art von
Strukturelementen zur Verfügung, genannt Containerobjekte. Diese Art von Objekten stellt
Strukturierungsmöglichkeiten, welche eine hierarchische Modellierung (d.h. hierarchische
Baumstruktur) von Informationseinheiten ermöglichen, dar. Die in einem Container enthaltenen
Elemente werden von Hyperwave Children65 genannt, wodurch sich die bekannte Parent-ChildBeziehung ergibt. Man kann zwischen zwei Arten von elementaren Containertypen
unterscheiden: statische und dynamische Container. Diese Unterteilung basiert nicht auf die
Funktion von Containerobjekten aus Benutzersicht, sondern auf die Art der Speicherung von
Objekten in diesen Strukturelementen aus administrativer Sicht. Die wichtigsten statischen
Strukturierungselemente sind Collection, Cluster und Sequence. Collections können sowohl
Dokumente als auch andere Containertypen enthalten, und können deshalb mit gewöhnlichen
Verzeichnishierarchien in Dateisystemen verglichen werden.
Eine spezielle Art von Collections, die Sequence, legt für die darin enthaltenen Objekte eine
bestimmte Navigationsreihenfolge fest, und kann deshalb als geordnete Liste aufgefasst werden.
Ein Cluster hingegen fasst die darin enthaltenen Dokumente als eine einzige Einheit zusammen.
Es existieren folgende drei unterschiedliche Typen von Clustern: Multicluster, Alternative
Cluster und Language Cluster.
Die in Multiclustern enthaltenen Dokumentenobjekte werden simultan und untereinander so
dargestellt, als wären sie ein einziges großes Dokument. Dadurch könnten mehrere
geographisch verteilte Benutzer jeweils ’den’ Teil des großen Dokuments, für den sie zuständig
sind, bearbeiten, ohne ständig das ’große zusammenhängende’ Dokument herunterladen zu
müssen. Die Vorteile dieses Sachverhalts liegen auf der Hand: aus der Sicht des Benutzers wird
63
http://www.hyperwave.com
IICM: Institut für Informationsverarbeitung und Computergestützte neue Medien an der Technischen
Universität Graz, Österreich. URL: http://www.iicm.edu
65
Es werden in diesem Abschnitt deutschsprachige Übersetzungen mancher Begriffe aus praktischen
Gründen vermieden, da sie fixer Bestandteil der Hyperwave-Fachsprache sind.
64
Kapitel 7 – IMPLEMENTIERUNG DES SYSTEMS
Seite 146
die Übersicht verbessert, aus der Sicht des Unternehmens die Synchronisation der
Arbeitsteilung erleichtert, und aus technischer Sicht die Datenverkehrsbandbreite optimiert. Ein
Alternative Cluster wählt eines der darin enthaltenen Dokumente in Abhängigkeit von den
Benutzereinstellungen aus. Gleiche Bilder können somit in unterschiedlichen Auflösungen
gespeichert, und je nach verwendeter ’Bandbreite’ des Benutzers in entsprechender Qualität zur
Verfügung gestellt werden. Die Einstellung kann beispielsweise auch nach unterschiedlichen
Formaten des Dokuments optimiert werden. Letztlich werden in Language Clustern enthaltene
verschiedensprachige Versionen von Dokumenten in Abhängigkeit von der benutzerdefinierten
Sprache präsentiert (wodurch eine Form der bedarfs- und benutzergerechten Lieferung von
Wissen fixer Teil des Hyperwave Standards ist). Einige Anforderungen bezüglich der
Mehrsprachigkeit bei transnationalen Konzernen können über diesen Mechanismus der
Dokumentenverwaltung erfüllt werden.
Wie aus der Beschreibung der statischen Strukturelemente ersichtlich wurde, zeichnen sich
Containerobjekte im Hyperwave Information Server dadurch aus, dass sie auch ein bestimmtes
Verhalten aufweisen. Dies verleiht der Berücksichtigung von den dynamischen
Strukturelementen eine besondere Bedeutung im Kontext der vorliegenden Arbeit. Damit sind
die Objekte Search Query und Document Class gemeint.
Das Objekt Search Query leitet sich vom Containertyp Collection ab und kann deshalb auch
statische Elemente beinhalten. Das besondere am Search Query Objekt sind seine nach einer
vordefinierten Suche mitgespeicherten Metadaten, welche kontextuell bzw. semantisch
zusammengehörende dynamische Objekte als Children beschreiben. Das heißt, spricht man ein
Search Query Objekt an, werden seine statischen und die, aufgrund der Metadaten definierten
Suche, dynamischen Children automatisch präsentiert.
Das Konzept der Document Classes ermöglicht den Benutzern des Systems die Festlegung und
Anwendung neuer Datentypen mit selbstdefiniertem Verhalten, um spezielle Anforderungen
von zweckspezifischen Applikationen zu erfüllen. Document Classes stellen abstrakte
Datentypen innerhalb des Servers dar und werden, im vereinfachten Fall, als Erweiterungen der
Basistypen Document, Object oder Collection deklariert. Document Classes bilden den
programmiertechnischen Grundstein der in den nachfolgenden Abschnitten beschriebenen
Implementierungsmodule. Analog zur Festlegung einer Klasse in der objektorientierten
Programmierung können Dokumentenklassen abgeleitet, dazugehörige Methoden übernommen
oder überschrieben, Instanzen davon erzeugt und vernichtet werden, usw. Der herausragende
Unterschied zwischen dem Verhalten von Dokumentenklassen in Hyperwave und den Klassen
der allgemein bekannten objektorientierten Programmierung liegt in der Persistenz der
erzeugten Instanzen. Die während der Ausführung eines objektorientierten Programms
erzeugten Instanzen verschwinden automatisch nach der Beendigung desselben.
Dokumentenklassen hingegen sollen solange auf dem Hyperwave Server ’leben’, bis der
Benutzer sie explizit löschen will; besitzen also ein persistentes Verhalten. Die technische
Implementierung von Dokumentenklassen für die Lösung von spezifischen Applikationen wird
in den folgenden Unterkapiteln anhand ausgewählter Implementierungsmodule beschrieben.
Ein weiterer spezifischer Objekttyp im Hyperwave Information Server ist zugleich ein
Mechanismus zur Benutzer- und Gruppenverwaltung. Die Eigenschaften von Benutzern werden
als eine Informationseinheit erfaßt, und in einem Benutzerobjekt gespeichert. ’Registrierte
Benutzer’ können sich am System identifizieren, eine bestimmte Rolle einnehmen (z.B. einer
besonderen Gruppe angehören) und dadurch den vollen Funktionsumfang des Hyperwave
Information Servers nutzen. Im Gegensatz dazu können ’anonyme Benutzer’ bloß innerhalb des
Systems navigieren, erhalten also vom System - im Sinne des im vorangegangenen Kapitels
definierten Informationsflusses - nur Leserechte auf die Informationseinheiten. Identifizierte
Benutzer nützen zusätzlich den Schreib- bzw. Bearbeitungsmodus des System aus, und dürfen
Kapitel 7 – IMPLEMENTIERUNG DES SYSTEMS
Seite 147
deshalb beispielsweise Dokumente editieren, Metadaten modifizieren, spezielle Sichtweisen
vom System anfordern, usw. Durch die Vergabe eines Attributes zur Beschreibung der Rechte
auf Informationseinheiten kann festgelegt werden, welche Benutzer bzw. Benutzergruppen
Zugriff auf ein bestimmtes Objekt besitzen. Mit der Kombination dieser effizienten
Mechanismen (Benutzer-, Gruppenverwaltung und Rechtevergabe) ist der Punkt Sicherheit aus
der Sicht des Document Managements weitgehend gelöst.
Ein besonderes Charakteristikum des Hyperwave Servers wird durch das zur Verfügung
gestellte Link Management dargestellt. Links werden im Hyperwave Server getrennt vom
Dokumentenobjekt gespeichert und verwaltet. Sie sind bidirektional definiert, wodurch die
Möglichkeit besteht, für ein bestimmtes Dokument herauszufinden, welche Links von diesem
auf andere Objekte verweisen, aber auch welche anderen Dokumente auf dieses selbst
referenzieren.
Durch
dieses
konsistentgehaltene
Link
Management
werden
’Dokumentenleichen’ und demzufolge auch ’tote Links’ (engl.: ’dead links’ oder ’broken links’)
verhindert, d.h. wird ein Dokument gelöscht, so werden automatisch alle auf dieses Objekt
verweisenden Links auch gelöscht. Da Links selbst als Objekte realisiert werden, können sie mit
Metadaten versehen werden, wodurch sie zum Beispiel lediglich für bestimmte
Benutzergruppen sichtbar oder auffindbar sind. Eine interessante Anwendung von HyperwaveLinkobjekten ist die Möglichkeit, Benutzern das Recht zu geben, sonst nur lesbaren
Dokumenten auch Annotationen beizufügen, ohne den tatsächlichen Dokumenteninhalt
modifizieren zu dürfen.
Bezüglich der Architektur des Hyperwave Information Servers, ist das sogenannte ’proxy client
server’-Systemmodell von besonderer Bedeutung. Dabei wird jeder Client (Benutzer) lediglich
mit ’dem’ Server (auch ’local server’ oder ’proxy server’ genannt) verbunden, der die beste
Verbindung, hinsichtlich Bandbreite, zu ihm aufweist. Da die Benutzer stets nur mit einem
einzigen Server kommunizieren, muss die Verbindung nur einmal aufgebaut werden, und kann
so lange bestehen, bis der Benutzer sich entweder abmeldet oder ein Timeout (bestimmte
Zeitspanne) erfolgt.
Insbesondere bei der Lösung von Intranetsystemen für große und geographisch verteilte
Unternehmungen spielt die Möglichkeit der physikalischen Serververteilung auf mehreren
Standorten eine sehr wichtige Rolle. Hyperwave unterstützt diese Option durch das Konzept
namens Server Pool. Mehrere dadurch definierte Hyperwave Server fungieren somit als ein
einziger, großer, zentraler Server mit einem für den Benutzer transparenten und lokal
erscheinenden Datenbestand. Die Konsistenz und Integrität von Datenbeständen, zum Beispiel
beim Verschieben von Dokumenten von einem Server zu einem anderen, wird durch das zuvor
erwähnte Link Management gewährleistet. Ein weiterer Vorteil für die Verwendung eines
Hyperwave Server Pools ist die zur Verfügung gestellte Möglichkeit, ein einziges und global
geltendes Benutzerverzeichnis von allen beteiligten Servern zu nutzen und zu verwalten.
Aus programmiertechnischer Sicht kann das Verhalten des Hyperwave Servers verändert
werden, indem in die Wavemaster Templates eingegriffen wird. Die dadurch definierten und im
Dateisystem liegenden Dateien werden (je nach Bedarf) nach jedem Server Request
durchlaufen, und sind hauptsächlich für die optische Darstellung und Manipulation von
Objekten zuständig. Die Programmierung der Templates erfolgt entweder durch die
Hyperwave-spezifische Programmiersprache Place oder durch Server Side Javascript.
Hyperwave arbeitet aber auch mit offenen Internettechnologien, z.B. Java, XML oder CGI, und
ermöglicht deshalb effiziente Lösungen oder Anbindungen zu ’fremden’ Modulen. Ein
herauszuhebender Vorteil dieses Sachverhalts, insbesondere für das Informationssystem eines
transnationalen Konzerns, ist die flexible Festlegung von ’anpaßbaren Sichtweisen’ (engl.:
’customized views’). Customized views ergeben sich aus der gemeinsamen Nutzung von
maßgeschneiderten Templates, spezialisierten Dokumentenklassen und Linkobjekten mit
Kapitel 7 – IMPLEMENTIERUNG DES SYSTEMS
Seite 148
besonderer Rechtevergabe. Dadurch kann man zum Beispiel je einen spezifischen
Navigationspfad für unterschiedliche Benutzergruppen innerhalb eines besonderen
Strukturelementes erzwingen.
Die Suchfunktionalität innerhalb eines Informationssystems wird umso wichtiger und
komplexer, je größer der eingeschlossene Informationsraum ist. Der von Hyperwave
standardmäßig zur Verfügung gestellte Suchmechanismus erlaubt das gezielte Auffinden von
Dokumentenobjekten über indizierte Metadaten oder Boolean Kombinationen. Eine Textsuche
über den Inhalt von Dokumenten wird auch standardmäßig zur Verfügung gestellt
(Volltextsuche66). Demzufolge unterscheidet man zwischen ’einfacher Suche’ (d.h. Suche über
indizierte Metadaten plus Volltextsuche) und ’erweiterter Suche’ (frei konfigurierbare Suche
mit zusätzlichen Features). In Bezug auf den Informationsraum können Suchbereiche (engl.:
’search scopes’) ausgewählt werden, die dem Benutzer die Möglichkeit geben, eine
eingeschränkte Suche auf bestimmte Strukturbereiche durchzuführen. Weiters kann eine
Expertensuche auf Benutzerebene gestartet werden. Diese Funktionalität wird in Hyperwave
’Find Expert’ genannt und stellt eine klassische Anwendung im Bereich Wissensmanagement
dar, wodurch eine Möglichkeit gegeben ist, auf das implizite Wissen des Unternehmens (also
jenes in den Köpfen der Mitarbeitet) zugreifen zu können. Bei der Expertensuche wird vom
Benutzer ein spezifisches Thema (engl.: ’topic’) definiert; das System wendet auf die
Dokumente eine Kombination von Keyword- und Fulltextsuche an, analysiert die
Dokumentenautoren und liefert eine Ergebnisliste von den Experten in der gesuchten Domäne
(mit den entsprechenden Kontaktmöglichkeiten).
Dies waren lediglich einige der besonderen Merkmale des Hyperwave Information Servers,
welche für den Kontext der vorliegenden Arbeit und das Verständnis der nachfolgenden
Abschnitte von großer Bedeutung sind. Mit speziellen Tools bzw. Komponenten, die in Form
von Packages der Standardfunktionalität hinzugefügt werden, können ganz spezifische
Anforderungen, insbesondere aus dem Bereich des Wissensmanagements, leicht und sehr
effizient erfüllt werden. Beispiele aus dieser besonderen Produktpalette sind die ’eLearning
Suite’, die ’Workflow Option’ oder das ’eKnowledge Portal’. Die Funktionalität und die
Anwendungsmöglichkeiten des Hyperwave Information Servers werden anhand eines konkreten
Beispiels in den folgenden Abschnitten näher gebracht. Zunächst soll aber das konkrete
Szenario für eine große und geographisch verteilte Unternehmung gebildet und beschrieben
werden. Im nächsten Unterkapitel werden die speziellen Eigenschaften des anonymisiert
dargestellten technischen transnationalen Konzerns eine konkrete Arbeitsbasis für die
Implementierung des Informationssystems ermöglichen.
7.2 Allgemeine Problembeschreibung
Bevor die technische Lösung des wissensbasierten Informationssystems für den transnationalen
Konzern vorgestellt wird, sollen zunächst besondere Charakteristika der anonymisiert
dargestellten Unternehmung beschrieben werden. Einer globalen Beschreibung des Konzerns
wird in diesem Unterkapitel eine spezifische Auflistung kritischer Problembereiche des zu
implementierenden Informationssystems folgen.
7.2.1 Beschreibung des Konzerns
Der in diesem Abschnitt präsentierte transnationale Konzern ist ein weltweit agierendes
Technologie- und Serviceunternehmen, welches komplexe strukturelle und funktionale
66
Der Kunde kann hierfür zwischen den Suchmaschinen von Verity und Autonomy wählen.
Kapitel 7 – IMPLEMENTIERUNG DES SYSTEMS
Seite 149
Eigenschaften aufweist. Die graphische Darstellung dieser strukturellen und funktionalen
Eigenschaften des transnationalen Konzerns zeigt Abhängigkeiten jeglicher Art zwischen den
einzelnen Unternehmensbereichen, wodurch sich eine nicht sehr leicht verständliche Sichtweise
der Gesamtproblematik - wie in [Abb. 7.1] graphisch dargestellt – ergibt. Das heißt, die
Komplexität der Konzerneigenschaften wird durch diese Darstellung zwar eindeutig reflektiert,
jedoch das gleichzeitige Zusammenwirken von den drei Dimensionen Struktur, Funktion und
Standort verhindert einen klaren Einblick in die Problematik.
Gruppe
UB1
F1 F2
UB1a
F3
UB1b
f
UB2
b
UB3
c
F1 F4 F5
e
d
i
F6 F2
a
UB4
d
F7
F7 F6 F1
UB4a
m
Gruppe
UB
F
a .. z ..
a
r
UB4b
c
Gesamtgruppe bzw. Spitzeneinheit
Unternehmensbereich bzw. Teileinheit
Funktionaleinheit
Funktionale Abhängigkeit
Strukturelle Abhängigkeit
Standort
Abbildung 7.1: Organisationsform des transnationalen Konzerns
Aus diesem Grund wird eine Trennung der Organisations- und Funktionslogik bevorzugt. Die
Struktur der Unternehmensbereiche (Organisationslogik) des transnationalen Konzerns ist
transparent bezüglich Standorte definiert, und folgt dem in [Abb. 7.2] dargestellten
hierarchischen Schema. Die Struktur der Funktionalbereiche (Funktionenlogik) des
transnationalen Konzerns läßt sich (quasi)hierarchisch anordnen und wird anhand einer
Themenhierarchie - wie in [Abb. 7.3] graphisch dargestellt - definiert. Die Trennung von
Struktur und Funktionen erlaubt eine transparente und übersichtliche Sichtweise auf die
Architektur des Konzerns.
Gruppe
Bereiche
Unternehmen
Bereich 1
Bereich 2
Bereich 3
Bereich 4
Unternehmen 1
Unternehmen 2
Unternehmen 3
Unternehmen 4
Unternehmen 5
Unternehmen 6
Unternehmen 7
Unternehmen 8
Unternehmen 9
...
Abbildung 7.2: Unternehmensbereiche des transnationalen Konzerns
(Darstellung der obersten Schichte der Hierarchie)
Kapitel 7 – IMPLEMENTIERUNG DES SYSTEMS
Seite 150
Der
Konzern
Allg.
Informationen
Mitarbeiter
Fertigung
&
Entwicklung
Standorte
Produkte
&
Dienstleistungen
Abbildung 7.3: Funktionalbereiche des transnationalen Konzerns
(Darstellung der obersten Themenstruktur)
Der transnationale Konzern besteht aus über 100 Tochter- und Beteiligungsgesellschaften und
mindestens genau so vielen internationalen Vertriebsorganisationen. Der Hauptsitz des
Unternehmens befindet sich zwar im deutschsprachigen Raum, jedoch aufgrund der weltweiten
Präsenz stellt Englisch die Hauptsprache des Gesamtunternehmens dar.
Diese beachtliche Internationalität entsteht aus der Integration von über 20.000 Mitarbeitern.
Die weltweite Standortverteilung des Konzerns wird in [Abb. 7.4] graphisch dargestellt.
Abbildung 7.4: Standortverteilung eines transnationalen Konzerns
(fiktive Darstellung)
Auf die bisher beschriebene Weise ließ sich die Größenordnung des Konzerns und dessen
komplexe Organisation auf übersichtliche Weise darstellen. Demzufolge werden folgende
Punkte als Hauptkriterien für weitere Untersuchungen festgelegt:
•
Unternehmensbereiche
•
Standorte
•
Geschäftsfunktionen
•
Mehrsprachigkeit
Im Kontext der vorliegenden Arbeit wird unter dem Begriff ’Standort’ sowohl ein
geographischer Punkt als auch eine Region verstanden. Das besonders bedeutende
Charakteristikum der Mehrsprachigkeit wird hier repräsentativ für alle Aspekte infolge der
starken Internationalität hervorgehoben. Der Grund dafür liegt darin, dass für ein Unternehmen,
dessen Tätigkeitsbereich sich auf die Technik konzentriert (zumindest hauptsächlich) und aus
vielen quasi autonomen Unterbereichen besteht, sich die sozialen und kulturellen
Einflußfaktoren auf lokaler Ebene reduzieren und infolgedessen lösen lassen.
Kapitel 7 – IMPLEMENTIERUNG DES SYSTEMS
Seite 151
Genauer in das Innenleben des transnationalen Konzerns zu blicken ist an dieser Stelle auf
Kundenwunsch nicht möglich und für den Kontext der vorliegenden Arbeit irrelevant. Viel
wichtiger sind die Zusammenhänge zwischen diesen Hauptkriterien und der Tatsache, dass der
Konzern eine sehr stark vernetzte und geographisch verteilte Architektur aufweist. Nun gilt es
also, die wichtigsten Problembereiche bei der Gestaltung des Informationssystems zu
identifizieren.
7.2.2 Auflistung kritischer Aspekte
In diesem Abschnitt sollen für den anonymisiert dargestellten transnationalen Konzern einige
der wesentlichsten Aspekte, welche auf die Informationsaufbereitung direkten Einfluß ausüben,
identifiziert werden. Hierbei geht es darum, unternehmensspezifische Merkmale des
Unternehmens informationstechnisch erfassen und formulieren zu können. Spezifische
Anforderungen und Wünsche des Kunden sind in Form von Consultingtätigkeit und
Diskussionsprozessen in die hier vorgestellte Auflistung von kritischen Aspekten eingeflossen.
Die im Folgenden beschriebenen Aspekte stellen eine Auswahl der wichtigsten Anliegen des
transnationalen Konzerns bezüglich des zu implementierenden Informationssystems dar. Diese
’Anforderungen’ werden hier thematisch formuliert und kurz besprochen, da sie sich aus den im
Abschnitt 6.2.3 identifizierten Anforderungen vollständig ableiten lassen. Die technische
Untersuchung der kritischen Aspekte (d.h. die Analyse und die Lösung anhand des im Kapitel 6
beschriebenen Technischen Gestaltungsmodells) und deren Umsetzung mit den technologischen
Möglichkeiten des Hyperwave Servers werden im nächsten Unterkapitel unter Punkt 7.3.1
’Allgemeine Lösung’ besprochen. Die strategische Anwendung des Grundlegenden Schemas
(siehe Abschnitt 6.2.1) wird ab diesem Zeitpunkt streng vorausgesetzt und nicht mehr erwähnt,
d.h. die Wirkungsbereiche werden stets implizit berücksichtigt.
Die komplexen standortbezogenen, funktionalen und strukturellen Abhängigkeiten innerhalb
des Konzerns - wie bereits im vorigen Abschnitt geschildert - stellen die wichtigsten
Hauptkriterien bei der Untersuchung der Systemgestaltung. Ausgehend von Kundenwünschen,
in Abhängigkeit von den Charakteristiken des transnationalen Konzerns (Abschnitt 7.2.1), und
basierend auf den allgemeinen Anforderungen an ein wissensbasiertes Informationssystem
(Abschnitt 6.2.3), ergibt sich folgende Auflistung von kritischen Aspekten:
•
Technologiewahl und Architektur des Informationssystems
•
Verfügbarkeit und Lebenszyklus von Datenbeständen
•
Semantische Anreicherung der Datenbestände durch Metastrukturen
•
Mehrsprachige Funktionalität des Systems
•
Auffindung und Präsentation von Informationseinheiten
•
Unternehmensspezifisches Rollenkonzept
•
Dynamik und Modularität des Systems
•
Erstellung und Nutzung von begrifflichen Strukturen
•
Steigerung der Kollaboration und Kommunikation
•
Spezifische Archivierungskriterien und Datenverwaltung
Kapitel 7 – IMPLEMENTIERUNG DES SYSTEMS
Seite 152
Diese identifizierten Aspekte sollen nun in Zusammenhang mit den im vorigen Abschnitt
präsentierten Konzernmerkmalen kurz untersucht werden. Es soll damit verdeutlicht werden,
welche Bedeutung sie für weitere technische Untersuchungen besitzen.
Technologiewahl und Architektur des Informationssystems
Die zugrundeliegende Technologie für das in diesem Kapitel beschriebene Informationssystem
ist das Intranet. Besonders wichtig in diesem Zusammenhang ist das Verständnis der
Auswirkungen dieser Technologie auf die Systemkomponenten und die Informationseinheiten.
Empfehlenswert ist somit die Betrachtung des Intranets als Werkzeug zur
Informationsverwaltung und nicht lediglich als Sammler von Dokumenten. Das heißt, der
Schwerpunkt bzw. Hintergedanke bei der Nutzung der Intranettechnologie sollte hauptsächlich
durch Aufgaben motiviert und nicht durch Dokumente repräsentiert werden. Der Grund hierfür
liegt auf der Hand: Menschen benutzen Informationseinheiten, um bestimmte Aufgaben zu
bewältigen.
Die stark verteilte Organisationsstruktur des transnationalen Konzerns führt durch vereinfachte
eindimensionale Darstellungsformen (z.B. funktionale oder regionale Gliederungen) meist zu
sehr übersichtlichen hierarchischen Anordnungen in Form von einfachen Baumstrukturen (wie
in [Abb. 7.2] und [Abb. 7.3] dargestellt). Die stark vernetzte Struktur der Geschäftsprozesse
kann zu komplexeren Strukturierungen - meist in Form unübersichtlicher Graphen wie in [Abb.
7.1] dargestellt - führen.
Die unterschiedlichen Darstellungsformen können für die
Systemstruktur gleichzeitig Gültigkeit finden, lassen sich aber nur schwer innerhalb einer
einzigen Strukturdarstellung erfassen, d.h. die in [Abb. 7.1] dargestellte Organisationsform gibt
zwar die reale mehrdimensionale Komplexität der Konzernstruktur wieder, eignet sich aber für
die Festlegung der Architektur des Informationssystems lediglich unter eingeschränkten
Rahmenbedingungen bzw. für ganz spezifische Teilaufgaben. Die in diesem Kontext implizite
konkrete Anforderung an das Informationssystem ist die Berücksichtigung von den
standortbezogenen, funktionalen und strukturellen Abhängigkeiten bei der Festlegung der
Systemarchitektur.
Ein weiterer kritischer Punkt bezüglich Systemarchitektur stellt der Teilaspekt ’Verteilungsbzw. Zentralisierungsgrad des Systems’. Dieser Teilaspekt beschäftigt sich mit der Festlegung
der Kriterien und Mechanismen, um die Realisierung eines effizienten Zugangsnetzes zu
ermöglichen bzw. zu optimieren. Dieser Aspekt beinhaltet ebenfalls alle Maßnahmen, um den
vollkommen transparenten Zugriff auf eine stark verteilte und vernetzte Architektur zu
ermöglichen. Aus der unternehmerischen Sicht stellt dieser Aspekt auch eine nicht zu
unterschätzende Kostenfrage dar. Diesbezüglich empfiehlt es sich, eine möglichst genaue Ist/Soll-Überprüfung der IT-Infrastruktur durchzuführen.
Verfügbarkeit und Lebenszyklus von Datenbeständen
Wie bereits im Abschnitt 5.1.2 ’Document Management und Contnet Management’ spielt die
Untersuchung vom Lebenszyklus eines Dokuments innerhalb des Informationssystems
(Lebensraumes des Dokument) eine besondere Rolle. Aus der Sicht des Document
Managements sind hierbei Maßnahmen zu definieren, wodurch Erstellung, Publizierung,
Organisation, Zugriff und Archivierung bzw. Vernichtung eines Dokuments effizient und
effektiv implementiert werden. Im Bezug auf Content Management ist die Notwendigkeit von
Mechanismen zu identifizieren, wodurch Erstellung, Kontrolle, Organisation und Präsentation
der Inhalte von Dokumenten (’Lebenszyklus des Dokumenteninhalts’) auf dynamische Weise
steuerbar werden.
Kapitel 7 – IMPLEMENTIERUNG DES SYSTEMS
Seite 153
In Bezug auf die informationstechnische Datenverwaltung in transnationalen Konzernen zählen
meist Systemperformanz und Datenverkehr zu den wichtigsten Gründen für das Ergreifen von
Maßnahmen zur Datenreplikation. Weiters erhöhen Replikationsmechanismen die
Verfügbarkeit von Datenbeständen, da mehrere identische Objektquellen standortgerecht zur
Verfügung stehen. Beim Einsatz von replizierenden Datenbanken kann eine Applikation nach
dem Ausfall eines Systemknotens sofort an einem anderen Replikat weiterarbeiten. Damit kann
man die Fehlertoleranz des gesamten verteilten Systems optimieren.
Semantische Anreicherung der Datenbestände durch Metastrukturen
Die unternehmens- bzw. benutzerspezifische Bedeutung eines Dokumentes, oder allgemeiner
einer gespeicherten Informationseinheit, kann mit Hilfe von Zusatzinformation (Metadaten)
präzise formuliert und explizit festgehalten werden. Unter diesem Aspekt sind Entscheidungen
zu treffen, ob und wie Metadaten vom Informationssystem zu verwalten sind. Die semantische
Informationsaufbereitung durch die Definition von Metadaten zu den einzelnen Einheiten des
digital erfassten intellektuellen Kapitals erweist sich als sehr vorteilhaft, weil sie die Qualität bei
der Inhaltserschließung erhöht und die Extraktion der Bedeutung vom Dokumenteninhalt
vereinfacht.
Mehrsprachige Funktionalität des Systems
Von besonderer Bedeutung bei der Verwaltung von multilingual zur Verfügung stehenden
Datenbeständen, ist die Repräsentation dieser semantisch identischen Informationseinheiten zu
einzelnen Gruppenobjekten. Solche Informationseinheiten können einerseits ’physikalisch nahe’
(z.B. über deren gemeinsame Speicherung in speziellen Containerstrukturen), und andererseits
’virtuell nahe’ (z.B. über Clusteringmechanismen oder Topic Maps) verwaltet werden.
Auffindung und Präsentation von Informationseinheiten
Insbesondere die, von den Bereichen Resource Discovery und Information Retrieval zur
Verfügung
gestellten
Mechanismen zur
Modellierung
und
Auffindung
von
Informationseinheiten spielen unter diesem Aspekt (Auffindung und Präsentation) eine wichtige
Rolle. Hierbei geht es grundsätzlich um die logische und technische Trennung von Layout und
Inhalt des Datenbestands. Die Visualisierung und Präsentation von Inhalten des
Organisationsgedächtnisses stellt eines der wichtigsten Aspekte bei der Konzeption eines
Informationssystems für transnationale Konzerne dar, da sie den direkten ’visuellen’ Kontakt
zum Benutzer herstellen und deshalb bei der Nutzbarkeit (engl.: ’usability’) des gesamten
Systems eine wesentliche Rolle spielen.
Unternehmensspezifisches Rollenkonzept
Ein genau durchdachtes Rollenkonzept ist von essentieller Bedeutung für das
Informationssystem eines transnationalen Konzerns, da es die allgemeine Benutzer- und
Gruppenverwaltung darstellt, und demzufolge auf alle Operationen, welche von Zugriffsrechten
abhängig sind, direkten Einfluß ausübt. Auf diese Weise kann eine zielgruppenorientierte
Informationsverteilung und –aufbereitung die Informationsflut des Einzelnen vermindern.
Dynamik und Modularität des Systems
Unter ’dynamischen Strukturen’ sind alle Mechanismen oder Module zu verstehen, welche sich
sowohl an strategische als auch an operative Spezifikationsänderungen anpassen können, und
zwar unabhängig vom zeitlichen Auftreten der Änderung (d.h. kurz-, mittel- oder langfristig).
Unter der Berücksichtigung von den Aspekten Dynamik und Modularität sollen alle technischen
Kapitel 7 – IMPLEMENTIERUNG DES SYSTEMS
Seite 154
Möglichkeiten behandelt werden, um in Zukunft auftretende Systemmodifikationen bewältigen
zu können.
Erstellung und Nutzung von begrifflichen Strukturen
Wie bereits im Kapitel 5 ’Wissensorganisation’ ausführlich erörtert, stellen Aufbau und
Nutzung von global geltenden Begriffssystemen eine effiziente Möglichkeit dar, um die
semantische Beschreibung des intellektuellen Kapitals zu erleichtern. Die Vorteile der
Anwendung von begrifflichen Strukturen sind vielfältig. Mit einer global definierten
begrifflichen Struktur lassen sich, zum Beispiel, die Relevanz- und Präzisionskriterien des
Wissenszugangs auf einer systematisch konzeptualisierten Ebene lösen. Bei dem
Zusammenschluß von Unternehmungen - welche zum Beispiel in verschiedenartigen
Fachbereichen spezialisiert sind - zu großen Konzernen, können unterschiedliche
Begriffsstrukturen die Möglichkeit bieten, verschiedenartige Fachbereichsperspektiven über die
Wissenseinheiten der Systemstruktur zu erzeugen.
Steigerung der Kollaboration und Kommunikation
Der Grund für die informationstechnische Anforderung einer Steigerung der Kollaboration und
Kommunikation in einem großen Unternehmen ist meist die Verbesserung der
Wissens(ver)teilung. Dieser Aspekt, welcher einen besonders hohen Stellenwert in der
Hauptdisziplin Wissensmanagement besitzt, wird durch maßgeschneiderte Lösungen einem
Informationssystem hinzugefügt. Erfüllt wird diese Anforderung zur Steigerung der
Kollaboration und Kommunikation durch Tools, welche einen zentralen bzw. kontrollierten
Wissensaustausch ermöglichen. Lösungen dieser Art werden zum Beispiel durch folgende
Komponenten dargestellt: eLearning Plattformen, Diskussionsforen, Chat Systeme, Email
Applikationen, Video Conferencing, usw.
Spezifische Archivierungskriterien und Datenverwaltung
Unter diesem Aspekt sollen Entscheidungen getroffen werden, welche beispielsweise den
möglichen Einsatz von Datenbank- oder Filesystemen (oder einer Kombination aus beiden)
bestimmen. Es sollen diesbezüglich auch Kriterien berücksichtigt werden, welche den Entwurf
und
die
Verwaltung
von
Archivierungsstrukturen
beeinflussen
(Container-,
Verzeichnisstrukturen, Vergabe der entsprechenden Zugriffsrechte, Einsatz spezialisierter
Clusteringmechanismen, usw.).
Fazit
Die oben angegebene Auflistung von kritischen Aspekten wurde zwar auf allgemeine Weise
formuliert, sie umfaßt aber die Gesamtproblematik in weiten Bereichen, sodass spezielle
Anforderungen implizit von diesen Themenbereichen abgedeckt werden können.
Im nächsten Abschnitt wird - ausgehend von dieser Auflistung - die technische
Implementierung eines Informationssystems, welches diese kritischen Aspekte berücksichtigt
(und demzufolge die Anforderungen vom Abschnitt 6.2.3 erfüllt), beschrieben.
7.3 Technische Implementierung
In diesem Abschnitt wird das allgemeine technische Szenario des wissensbasierten
Informationssystems für den im Unterkapitel 7.2 präsentierten transnationalen Konzern
Kapitel 7 – IMPLEMENTIERUNG DES SYSTEMS
Seite 155
beschrieben. Als technologische Plattform für die Implementierung dient der Hyperwave
Information Server, welcher auch eine Vorgabe seitens des Kunden darstellt.
Im Abschnitt 7.3.1 ’Allgemeine Lösung’ wird eine allgemeine Beschreibung des
Gesamtsystems gegeben. Teillösungen aus diesem Gesamtkonzept wurden im Rahmen des
Gestaltungsbereichs der vorliegenden Arbeit als Module im Hyperwave Information Server
umgesetzt. Zwei davon werden in den Abschnitten 7.3.2 und 7.3.3 präsentiert.
7.3.1 Allgemeine Lösung
Es werden in diesem Abschnitt, die wichtigsten Grundzüge der technischen Gesamtlösung eines
Informationssystems für den im Unterkapitel 7.2 ’Allgemeine Problembeschreibung’
anonymisiert dargestellten transnationalen Konzern so hervorgehoben, dass folgende drei Ziele
erreicht werden:
Die Lösungsansätze sollen den Komponenten des Funktionalen Schemas aus
Abschnitt 6.2.2 zuordenbar sein.
Die technische Umsetzung des Informationssystems soll mit Hilfe der Technologie
vom Hyperwave Information Server stattfinden.
Die Lösung soll die im Abschnitt 7.2.2 vorgegebene Auflistung von kritischen
Aspekten berücksichtigen.
Um in diesem Abschnitt systematisch auf die Abschnitt 7.2.2 spezifizierten kritischen Aspekte
verweisen zu können, wird eine nummerierte Liste, wie folgt, angegeben:
( I ) Technologiewahl und Architektur des Informationssystems
( II ) Verfügbarkeit und Lebenszyklus von Datenbeständen
( III ) Semantische Anreicherung der Datenbestände durch Metastrukturen
( IV ) Mehrsprachige Funktionalität des Systems
( V ) Auffindung und Präsentation von Informationseinheiten
( VI ) Unternehmensspezifiches Rollenkonzept
( VII ) Dynamik und Modularität des Systems.
( VIII ) Erstellung und Nutzung von begrifflichen Strukturen
( IX ) Steigerung der Kollaboration und Kommunikation
( X ) Spezifische Archivierungskriterien und Datenverwaltung
Die Vorgehensweise bei der Beschreibung des Gesamtsystems wird aus praktischen Gründen in
folgende Punkte unterteilt:
-
Architektur des Informationssystems
-
Eigenschaften vom gewählten Framework (Verhalten des Interfaces)
-
Datenverwaltung und Zugriffskonzept
-
Benutzer- und Gruppenverwaltung
-
Qualität von Informationseinheiten (Metastrukturen)
Kapitel 7 – IMPLEMENTIERUNG DES SYSTEMS
Seite 156
-
Dynamik, Organisation und Navigation im System
-
Bedarfsgerechte Wissensauffindung (Suche in Hyperwave)
-
Verwaltung von Information höchster Priorität (Hotlines)
Einige der besonderen Vorzüge des Hyperwave Information Servers wurden bereits im
Abschnitt 7.1 geschildert. Zur Umsetzung des komplexen wissensbasierten Informationssystems
für einen transnationalen Konzern fällt deshalb die Wahl auf den Hyperwave Information Server
sehr leicht. Das Hyperwave System stellt ein Gesamtpaket, dessen Standardfunktionalität
sämtliche Anforderungen einer Intranetlösung ’quasi auf einmal’ erfüllen kann, dar. Es sei an
dieser Stelle auf den kritischen Aspekt (I) hingewiesen, wobei eine Anforderung bezüglich einer
geeigneten Technologiewahl erfüllt (siehe Abschnitt 6.2.3) ist.
Architektur des Informationssystems
Die technische Zentralisation der Konzernstruktur aufgrund der Organisationsformen stellt zwar
eine Möglichkeit zur Festlegung der Architektur des Informationssystems dar, muss aber nicht
unbedingt die beste Lösung liefern. In den Abschnitten 4.1.2 ’Datenbanksysteme’ und 4.1.3
’Verteilte Datenbanksysteme’ wurden die Vorteile und Nachteile von zentralisierten und
verteilten Datenbanksystemen untersucht. In diesem Zusammenhang wird zwischen
physikalischer und virtueller Struktur unterschieden, d.h. auch wenn Informationseinheiten
tatsächlich in einer stark verteilten Struktur gespeichert werden, bleibt die virtuelle Struktur des
Systems für den Benutzer völlig transparent.
Unter der Berücksichtigung der im Abschnitt 7.1 geschilderten speziellen Features des
Hyperwave Systems, wird eine verteilte Architektur nach dem ’proxy client server’Systemmodell gewählt. Für die nötige Transparenz des Systems sorgt die physikalische
Serververteilung nach dem Server Pool Konzept, wodurch dem Benutzer des Intranets ein lokal
erscheinender Datenbestand zur Verfügung gestellt wird.
Um dennoch einen Mechanismus, welcher die zentrale Verwaltung von spezifischen Strukturen,
Objekten oder Applikationen ermöglicht, zur Verfügung zu stellen, wird ein bestimmter Server
als ’Master Server’ definiert. Dadurch lassen sich zum Beispiel globale Konfigurationen
bewerkstelligen, zentral zu verwaltende Dokumente archivieren, alle Benutzer über ein einziges
und global geltendes Verzeichnis verwalten, usw. Aufgrund dieser Festlegung wurde der
kritische Aspekt (I) berücksichtigt, wobei die Komponente ’Basis’ des funktionalen Schemas
(siehe [Abb. 6.8]) eindeutig definiert ist.
Die Festlegung von einem strukturierten und zusammenhängenden Zugangsnetz im
Informationssystem, welche als verteilte Portale der Intranetumgebung fungieren, erlauben
einen strukturierten Zugang zu Mengen von Informationseinheiten. Die Verwaltung dieser
Knoten kann zwar über den Master Server erfolgen, deren Inhalte (Strukturelemente der
Portale) können aber über eine verteilte Architektur organisiert werden. Eine hierarchisch
angeordnete Nutzung von Portalen (zum Zwecke des semantisch organisierten Zugangs oder
Austausches) ermöglicht die direkte Darstellung von der in [Abb. 7.2] graphisch präsentierten
Organisationsform des transnationalen Konzerns nach seinen Unternehmensbereichen.
Durch das Konzept des Server Pools können stark autonome Unternehmensbereiche auf dem
lokalen Server kritische Datenbestände vor nicht-lokalen Zugriffen absichern (zum Beispiel
über die Definition einer besonderen Rechtevergabe). Über lokal definierte SubPortalstrukturen, welche mit der global gültigen Portalstruktur verlinkt werden, können
autonome Unternehmensbereiche zum konzernübergreifenden Wissensaustausch beitragen;
dieses Verhalten kann zum Beispiel mit Hilfe der konsistent gehaltenen und den transparenten
Kapitel 7 – IMPLEMENTIERUNG DES SYSTEMS
Seite 157
Möglichkeiten des Link Managements von Hyperwave auch serverübergreifend umgesetzt
werden. Die dem Benutzer transparent zur Verfügung gestellte Portalstruktur (logische
Portalstruktur) wird in [Abb. 7.5] graphisch dargestellt.
Abbildung 7.5: Logische Portalstruktur des Informationssystems
Die zu einem Portal gehörenden spezifischen Applikationen und Konfigurationselemente
werden lokal (als Children des Portalobjektes) über eindeutig bestimmte
Konfigurationscontainer verwaltet. In [Abb. 7.5] stellen die Collections mit dem Titel
’Applications’ und ’System’ diese Konfigurationscontainer für das Portal des Unterbereichs
’Company 1aa’ dar. Einen Einblick in die physikalische Portalstruktur wird durch die
graphische Darstellung in [Abb. 7.6] gewonnen.
Über die Festlegung und Verwaltung einer bestimmten Konfigurationsdatei (im Filesystem
jedes Servers) kann die Funktionalität jedes Servers und manche applikationsspezifische
Einstellung konfiguriert werden. Sowohl durch die Programmierung eines angepaßten Template
Sets und deren direkte Kopplung von speziellen Konfigurationsdateien, als auch durch die
vordefinierte Struktur von Konfigurationscontainer im Datenbanksystem sind Dynamik und
Modularität des Systems serverübergreifend und nachhaltig gesichert. Durch die bisher
besprochenen Konzepte wurden die kritischen Aspekte (I) und (VII) berücksichtigt. Das
Konzept der Portalstruktur stellt gleichzeitig die technische Implementierung der Komponente
’Zugang’ des funktionalen Schemas (siehe [Abb. 6.8]) dar.
Kapitel 7 – IMPLEMENTIERUNG DES SYSTEMS
Seite 158
Master Server
Applications
System
Portal - The Group
Portal - Company 1
Applications
System
Portal - Company 2
Applications
System
Portal - Company 4
Applications
System
Server
Company 3
Portal - Company 3
Applications
System
Abbildung 7.6: Physikalische Portalstruktur des Informationssystems
Eigenschaften vom gewählten Framework (Verhalten des Interfaces)
Um die transparente Darstellung des gesamten Intranetangebots für den Benutzer zu
gewährleisten, wird das Layout und das Verhalten des Interfaces (Darstellungen am Browser)
einem vordefinierten Schema folgen. Die Darstellung des Schemas wurde in Rahmen des CI
(Corporate Identity) festgelegt, wobei die Inhalte sich auf bedarfsgerechte Weise je
Portalstruktur anpassen lassen. Wie in [Abb. 7.7] dargestellt, werden sechs unterschiedliche
Frames definiert:
-
Header Frame
Navigation Frame
Search Frame
Quicklinks Frame
Code Frame
Content Frame
Navigation
Content
Search
Code
Quicklinks
Header
Abbildung 7.7: Framework für das Web Interface
Im Header Frame wird die allgemeine Information zum Portal und zum Konzern angezeigt. Hier
befindet sich auch die Möglichkeit der Authentifizierung und Registrierung am System. Die
Kapitel 7 – IMPLEMENTIERUNG DES SYSTEMS
Seite 159
technische Implementierung der Komponente ’Erkennung’ des in [Abb. 6.8] dargestellten
funktionalen Schemas erfolgt über die Funktionalität einer speziellen Document Class, da ein
registrierter Benutzer über bestimmte Metadaten (Information über Rollen im System,
Funktionen im Konzern, Kontaktmöglichkeiten, usw.) beschrieben wird. Die speziellen
Suchmechanismen von Hyperwave werden im Search Frame zur Verfügung gestellt. Der
Quicklinks Frame enthält portalspezifische Hyperlinks (sowohl interne als auch externe). Die
Angabe zu den Links sind in XML-Dateien enthalten und frei konfigurierbar.
Der Navigation Frame (siehe [Abb. 7.7]) zeigt eine dynamisch generierte und multifunktionale
Baumstruktur für die Navigation an. Der ’dynamische Baum’ ist als Document Class
implementiert, und besitzt sehr spezielle multifunktionale Mechanismen. Der Anfangszustand
eines Navigationsbaumes entspricht einer vordefinierten Struktur, welche über die Information
in einer XML-Datei (im Konfigurationscontainer des jeweiligen Portals) konfigurierbar ist. Die
Angaben in dieser XML-Datei beziehen sich auf statische und dynamische Strukturelemente des
Informationssystems. Statische Strukturelemente sind fixer Bestandteil der Konfigurationsdatei
und besitzen nur die dort explizit angegebene Beziehung zu andere Baumelementen.
Dynamische Strukturelemente sind alle Inhalte von statischen Containerobjekten (Children und
Subhierarchien davon), wobei lediglich das Containerobjekt im Konfigurationsfile definiert und
explizit als dynamisch angegeben ist. Mit der Angabe eines dynamischen Knotens erkennt die
Document Class ’dynamischer Baum’, dass sämtliche Children eines dynamischen Containers
bei jedem Aufbau des Baums neu festgestellt werden. Die Aktualität von dargestellten
Informationseinheiten ist damit über beliebig tiefe Strukturen gewährleistet. Alle notwendigen
Informationen, um den Baum auf der Client Seite zu bedienen, werden im Code Frame
geschrieben.
Die aktuell besuchte Informationseinheit wird im Content Frame präsentiert (ihre Metadaten, ihr
Inhalt, Parent-Child Beziehungen, usw.). Über ein im Content Frame definiertes Menü werden
sämtliche Funktionen für das Bearbeiten von Informationseinheiten zur Verfügung gestellt.
Weiters wird über dieses Menü die Sprachauswahl implementiert. Entsprechend dieser vom
Benutzer eingestellten Sprache wird nicht nur das gesamte Framework aufgebaut, sondern auch
z.B. Inhalte von Language Clustern, Information über Strukturelemente, oder Inhalte von
Dialogfenstern angezeigt.
Der HTML-spezifische Code für den Aufbau des Frameworks wird in sogenannten Language
Resource Templates einer Document Class definiert. Die Hauptfunktionalität für Zugang und
Navigation des Systems wird in der Document Class ’Homepage’ definiert. Eine der Methoden
dieser Document Class ist für das Erstellen des Frameworks verantwortlich.
Damit ist nun die Funktionalität der Portale (Document Class ’Homepage’), die dynamische
Visualisierung und Präsentation von Inhalten (Document Class ’Homepage’), die Navigation
(Document Class ’Dynamischer Baum’), ein Interface zur Authentifizierung und Registrierung
(Document Class ’Register’), eine Möglichkeit zur Suche (Standardsuche von Hyperwave), und
eine konfigurierbare unabhängige portalspezifische Navigation (Document Class ’Quicklinks’)
definiert worden, wobei auch die kritischen Aspekte (IV), (V), (VII), und (VIII) auch
berücksichtigt wurden..
Datenverwaltung und Zugriffskonzept
Die meisten Aufgaben bezüglich der Verwaltung von Informationseinheiten und deren
beuntzerabhängiger Zugriff werden vom Hyperwave Information Server, aufgrund der
mitgelieferten Tools gelöst. Die Verwaltung und Organisation von Dokumenten und Inhalten
sind in den Fachbereichen Document Management (Abschnitt 5.1.2), Content Management
(Abschnitt 5.1.2), Library Science (Abschnitt 5.1.4), Archival Science (Abschnitt 5.1.4) und
Kapitel 7 – IMPLEMENTIERUNG DES SYSTEMS
Seite 160
Organisationssysteme (Abschnitt 5.3) einzuordnen (siehe Aspekt (X)). Die gemeinsame
Berücksichtigung ihrer Aufgabengebiete und ihrer zur Verfügung stehenden Methoden liefern
sicherlich eine optimale Erfüllung von konkreten Anforderungen eines transnationalen
Konzerns an ein wissensbasiertes Informationssystem. Es sei an dieser Stelle darauf
hingewiesen, dass spezifische Anforderungen bezüglich Datenverwaltung aufgrund
technologischer Kriterien unter gemeinsamer Berücksichtigung dieser Fachbereiche zu erfüllen
sind. Beispiele für solche spezifische Anforderungen sind das Ergreifen von
Replikationsmechanismen zur Steigerung der allgemeinen Performanz des Netzwerkverkehrs
(siehe Aspekt (II)), oder die zur Bandbreite angepaßte Anzeige von Bildern in unterschiedlichen
Auflösungen (siehe Aspekt (X) bzw. Absatz zum Thema Alternative Cluster im Abschnitt 7.1).
Die effiziente und effektive Verwaltung von Daten und ein kontrolliertes Zugriffskonzept wird
von Hyperwave über die Kombination folgender Mechanismen gewährleistet: Vergabe von
Zugriffsrechten über spezifische Objektattribute, Upload-Mechanismus für jegliche Art von
multimedialen Objekten, konfigurierbare Versionskontrolle für Dokumentenobjekte, Editieren
von HTML Dateien direkt auf den Server (ohne erforderlichen Download), spezialisierte
Containerobjekte (Cluster, Sequence, Collection, Document Classes, Search Query Objekt),
u.v.m. Der oben beschriebene dynamische Navigationsbaum stellt zum Beispiel eine
vereinfachte Alternative zur Festlegung von Themenhierarchien und Organisationssystemen
dar. Mit all diesen Tools können daher die Komponenten ’Basis’, ’Organisationssystem’,
’Sicherheit’ und ’Navigation’ des funktionalen Schemas (siehe [Abb. 6.8]) hinsichtlich
allgemeiner Anforderungen (siehe Aspekte (II), (X)) implementiert werden.
Benutzer- und Gruppenverwaltung
Durch die Festlegung eines Rollenkonzepts für das Informationssystem des Konzerns, wie
beispielsweise in [Abb. 7.8] und [Abb. 7.9] dargestellt, wird die Komponente ’Erkennung’ des
funktionalen Schemas (siehe [Abb. 6.8]) vollständig beschrieben. Dieser Aspekt umfaßt alle
Eigenschaften von humanen Ressourcen innerhalb der Unternehmensstruktur und deren Rollen
innerhalb des Informationssystems. Auf der anderen Seite stellen funktionsabhängige
Benutzerrollenkonzepte eine Methode dar, um ein hierarchisches Zugriffsszenario zu definieren.
Abbildung 7.8: Rollenhierarchie des Informationssystems (bzgl. des Benutzers vgarcia)
Kapitel 7 – IMPLEMENTIERUNG DES SYSTEMS
Seite 161
Abbildung 7.9: Rollenhierarchie des Informationssystems (bzgl. der Gruppe wbt)
Das Informationssystem liefert den Benutzern globale oder partielle Sichtweisen des
Datenbestands in Abhängigkeit vom aktuellen Rollenstatus (meist Mitgliedschaft in einer
Gruppe), vom Aktivitätsmodus (lesend, schreibend, usw.) und von den - unter Hyperwave einstellbaren ’User Preferences’.
Durch die Einführung von kontrollierten Begriffsstrukturen - zum Beispiel über vordefinierte
dynamische Themenhierarchien, wie die oben erwähnte Funktionalität des dynamischen
Navigationsbaums - werden unterschiedliche Sichtweisen auf den Datenbestand ermöglicht
(siehe Aspekt (VI)). Die neuen Sichtweisen sind daher nicht nur von der Rolle des Benutzers
abhängig, sondern auch - zum Beispiel - von seinem Interessengebiet, einer konkreten
Aufgabenstellung oder vom Standort. Das hier beschriebene Informationssystem für
transnationale Konzerne ist in der Lage, die unterschiedlichen Fachgebiete des Konzerns
erfassen und darstellen zu können.
Weiters soll unter dem Rollenaspekt die Tatsache berücksichtigt werden, dass jede
Benutzergruppe bzw. jeder Unterbereich des Konzerns ein sehr spezifisches Aktivitätspotential
am Gesamtsystem, sowohl auf lokaler wie auch auf globaler Ebene, aufweist. Das heißt, jeder
Unterbereich des Konzerns hat je Benutzergruppe einen unterschiedlichen effektiven Bedarf am
gesamten Informationsangebot des Systems. Folgendes (fiktive) Beispielszenario soll diesen
Sachverhalt verdeutlichen:
Der Hauptsitz des Konzerns beschäftigt 1500 Mitarbeiter und soll den Hauptserver des
Gesamtsystems
verwalten.
Weiters
besteht
der
Konzern
aus
zehn
Tochterunternehmungen, wobei neun davon durchschnittlich 2000 effektive
Systembenutzer beschäftigen.
Wenn die 5000 Mitarbeiter vom letzten, weit entfernten Konzernunterbereich
hauptsächlich die Informationen des eigenen (Sub-)Servers nutzen und kaum oder gar
nicht auf externe Datenbestände aus dem Rest des verteilten Systems zugreifen, dann
soll diese Autonomie auch in der Konzeption der gesamten Systemarchitektur in
Erwägung gezogen werden.
Der Grund hierfür liegt in der Tatsache, dass diese starke Autonomie unterschiedliche
Aspekte der technischen Implementierung beeinflußt, wie etwa: lokale
Netzwerktopologie, Kriterien zur Datenreplikation, Verteilungsgrad der Applikationen,
technische Performanz des lokalen Servers (sowohl auf Hardware- als auch auf
Kapitel 7 – IMPLEMENTIERUNG DES SYSTEMS
Seite 162
Softwareebene), Definition von fachbereichsspezifischen Klassifikationsschemata, und
andere.
Als Basis für die Implementierung eines Rollenkonzepts können die im Abschnitt 6.1.4
’Spezielle Sichtweisen des Informationssystems’ vorgestellten Blickpunkte herangezogen
werden.
Ein weiterer Aspekt, welcher vom Rollenkonzept abhängig ist und gleichzeitig mit der
Auffindung von implizitem Wissen zu tun hat, ist die Implementierung von rollenspezifischen
Diensten zum Zwecke einer verbesserten Auffindung vom impliziten Wissen des
Organisationsgedächtnisses. Ein im Rahmen dieser Diplomarbeit implementiertes Modul,
welches alle Mitarbeiter des Konzerns innerhalb einer hierarchischen Struktur erfasst, sie auf
unternehmensspezifische Weise beschreibt (d.h. Metadaten bzgl. Tätigkeitsgebiete, Standort,
usw. zuordnet) und über eine spezielle Suche auffindbar macht, wird durch eine Applikation für
die Verwaltung von ’Business Cards’ dargestellt (siehe auch Aspekt (V)). Die unter Hyperwave
als Document Class implementierte Business-Card-Komponente, welche als zentrale
Zugangsstelle zu einem Großteil des impliziten Wissens im Konzern aufzufassen ist, steigert die
Kollaboration und verbessert die Kommunikation zwischen den weltweit verteilten Benutzern
des Systems (siehe auch Aspekt (IX)).
Qualität von Informationseinheiten: Metastrukturen
Anforderungen an die Qualitätssteigerung von Wissenseinheiten (entsprechend dem kritischen
Aspekt (III)) werden vom Hyperwave Information Server durch die zur Verfügung stehenden
Objektattribute großteils erfüllt. Dadurch ist die technische Implementierung der Komponente
’Metadaten’ des funktionalen Schema (siehe [Abb. 6.8]) implizit gegeben. Metadaten, wie
bereits im Abschnitt 5.2.2 beschrieben, stellen eine einfache Möglichkeit dar, um
Wissenseinheiten präzise zu beschreiben und infolgedessen deren Zugang bedarfsgerecht zu
steuern (z.B. über indizierte Suchmechanismen). Unter dem Begriff ’Metastrukturen’ versteht
der Autor der vorliegenden Arbeit Konstrukte, die Beschreibungen von Wissenseinheiten und
deren Beziehungen untereinander darstellen. Diese Konstrukte werden meist als semantische
Zugangsmodelle, wie beispielsweise die im Unterkapitel 5.4 beschriebenen Topic Maps,
dargestellt. Einfache Metastrukturen können auch unter Verwendung von Standardformaten,
wie XML oder RDF, realisiert werden. Der Hyperwave Information Server unterstützt die
Anwendung von einfachen Metastrukturen durch die auf Containerobjekten frei anwendbare
Attributvergabe und die Vorteile des Link Managements (siehe Abschnitt 7.1).
Während Metadaten in der Regel einzelne Informationseinheiten beschreiben, dienen
Metastrukturen der Beschreibung von Objektklassen bzw. der Erfassung von semantisch
verwandten Objekten zu Gruppen (z.B. zur Erstellung von Themenhierarchien). Durch die
Verwendung von standardisierten Beschreibungsformaten (XML, RDF, SOIF, MCF, usw.),
zum Beispiel, können Informationseinheiten wesentlich einfacher ausgetauscht, präsentiert und
organisiert werden. Die Konfigurationsdateien zur Erstellung des oben beschriebenen
dynamischen Navigationsbaumes stellen in diesem Sinne auch Metastrukturen dar.
Die Festlegung eines zusammenhängenden Metadatensatzes zur Beschreibung von
Dokumentenversionen
kann
zum
Beispiel
von
Workflowapplikationen,
Versionskontrollmechanismen und eLearning-Umgebungen gleichzeitig genutzt werden. Die
konkrete technische Beschreibung solcher Metakonstrukte und deren Vorteile werden im
nächsten Abschnitt näher beschrieben.
Die standortbezogenen, funktionalen und strukturellen Abhängigkeiten innerhalb des Konzerns
(siehe Abschnitt 7.2.2) stellen die wichtigsten Aspekte bezüglich eines effizienten Document
Kapitel 7 – IMPLEMENTIERUNG DES SYSTEMS
Seite 163
Managements dar. Das Hauptproblem liegt hierbei in der Tatsache, dass ein Dokument für
verschiedene Unternehmensbereiche unterschiedliche Bedeutung besitzt. Damit ist die
Notwendigkeit gegeben, mehrere Beschreibungskonstrukte zur Verfügung zu stellen. Die dafür
geeignete Lösung stellt ein Modul, welches unterschiedliche Arten von Metadatensätze für die
Beschreibung von Informationseinheiten verwaltet , dar. Die Implementierung eines solchen
Moduls wird im nächsten Abschnitt näher beschrieben.
Dynamik, Organisation und Navigation im System
Der Aspekt der Navigation im System wurde bereits oben unter dem Punkt ’Eigenschaften vom
gewählten Framework (Verhalten des Interfaces)’ u.a. anhand der Funktionalität des
Navigationsbaumes beschrieben (siehe auch Aspekt (V)). Der Aspekt der Organisation wird
ebenfalls durch die Document Class ’Dynamischer Baum’ berücksichtigt, da die Struktur des
Navigationsbaums von den XML-Angaben in einer Konfigurationsdatei abhängig ist. Eine
einfache beschreibende Ebene von Kontenpunkten innerhalb einer Taxonomie, wie
beispielsweise bei der Verwendung von Topic Maps üblich (siehe Abschnitt 5.4.4), ist mit den
Dynamischen Baum auch realisierbar, und dies sogar personalisiert und frei konfigurierbar. Die
Realisierung dieses Sachverhalts ist in vereinfachter Form über die Angabe einer Search Query
als dynamischer Knoten des Navigationsbaumes möglich. Im Abschnitt 7.1 wurde die
grundsätzliche Funktionalität des Search Query Objekts bereits beschrieben. Da die Metadaten
dieses Containerobjekts frei konfigurierbar sind, kann man ein bestimmtes Thema (z.B. ein
Oberbegriff) als Suchkriterium angeben (zusätzlich noch den Suchbereich einschränken) und
damit stets aktualisierte zusammenhängende Datenbestände in einem einzigen Strukturelement
’dynamisch’ und ’kontextuell’ sammeln. In diesem Knoten werden dann - als Children - andere
Search Query Objekten definiert. Jeder Sub-Knoten (Child) kann Verfeinerungskriterien für den
vordefinierten Oberbegriff, Ähnlichkeitskriterien zur Beschreibung von Synonymen, usw.
enthalten. Dadurch ist das Festlegen von einer dynamischen Taxonomie ermöglicht. Durch
diesen einfachen Mechanismus kann man deshalb die Komponente ’Organisationssysteme’ im
funktionalen Schema (siehe [Abb. 6.8]) implementieren, wobei gleichzeitig Aspekt (VIII)
berücksichtigt werden muss.
Bedarfsgerechte Wissensauffindung: Suche in Hyperwave
Dynamische Suchmechanismen zur bedarfsgerechten Wissensauffindung sollten nicht isoliert
betrachtet werden, weil sie von anderen Aspekten - wie zum Beispiel den oben beschriebenen
Aspekten der Verteilungstransparenz und Metadaten - abhängig sind und das Bindeglied
zwischen Präsentation und Struktur des Systems darstellen können. Durch die vom Hyperwave
Information Server standardmäßig zur Verfügung gestellte Suchfunktionalität wird die
Komponente ’Suche’ im funktionalen Schema (siehe [Abb. 6.8]) eindeutig definiert (unter
Berücksichtigung des Aspekts (V)). Das im Rahmen der Durchführung dieser Arbeit
implementierte System verfügt über die volle Suchfunktionalität vom Hyperwave Information
Server. Darüber hinaus steht dem Benutzer eine spezielle Suche in der Komponente Business
Card zur Verfügung.
Verwaltung von Information höchster Priorität: Hotlines
Eine spezielle Anforderung an das Informationssystem für transnationale Konzerne stellt die
effiziente Verwaltung (Weitergabe und Archivierung) von Information höchster Priorität dar. In
diesem konkreten Fall ist ein spezielles Nachrichtenmodul gemeint. Die technische Lösung
dafür wurde mit Hilfe von Document Classes implementiert und ’News Applikation’ genannt.
Das Ziel der News Applikation ist, ’Newsbeiträge’ von verschiedenen Unternehmensbereichen
des Konzerns in unterschiedlichen Unternehmenshierarchien zu verschiedenen Themen zu
publizieren und den Benutzern der entsprechenden Bereiche auf den jeweiligen Portalen
Kapitel 7 – IMPLEMENTIERUNG DES SYSTEMS
Seite 164
zugängig zu machen. Die Implementierung dieses Moduls stellt eine umfassende, komplexe und
demzufolge sehr interessante Applikation dar. Im Abschnitt 7.3.3 wird die Umsetzung dieses
Moduls mit Hilfe der Hyperwave Technologie näher beschrieben.
Eine andere Möglichkeit zur Implementierung eines Mechanismus, welcher den Benutzer über
neue und wichtige Informationseinheiten in periodischen Abständen informieren kann, stellt die
Anwendung des zeitlich einstellbaren Hyperwave Search Query Objekts (’Scheduled Query
Object’) dar. Dieses in Abschnitt 7.1 beschriebene ’dynamische’ Containerobjekt stellt die
Möglichkeit zur Verfügung, eine nach bestimmten Kriterien vordefinierte Suche in frei
konfigurierbaren Zeitabständen zu starten, wobei der Autor des Objekts per Email informiert
wird, falls neue ’dynamische’ Children gefunden wurden.
Fazit
Alle bislang beschriebenen Punkte stellen einen Überblick über die Struktur und Funktionalität
der Gesamtgestaltung eines wissensbasierten Informationssystems für einen transnationalen
Konzern (wie jener unter Punkt 7.2.1 beschrieben) dar. Die technische Umsetzung vieler
Anforderungen (die von den am Anfang dieses Abschnitts aufgelisteten kritischen Aspekten
weitgehend gedeckt werden) an ein solches System wurde anhand des Hyperwave Information
Servers präsentiert und in groben Zügen beschrieben. Beispielhaft werden in den folgenden
Abschnitten zwei ausgewählte Module der implementierten Gesamtlösung näher beschrieben.
Die mit Hyperwave umgesetzten, ausgewählten Module sind die Applikationen
’Metadatensätze’ (Thema des anschließenden Abschnitts) und ’News Applikation’ (präsentiert
im übernächsten Abschnitt 7.3.3).
7.3.2 Modul 1 - Metadatensätze
Dieser Abschnitt befaßt sich mit einer speziellen Form der Datenverwaltung durch die Nutzung
von Beschreibungskonstrukten für Informationseinheiten, welche aus der Sicht verschiedener
Unternehmensbereiche unterschiedliche Bedeutung besitzen. Eine einfache und gleichzeitig
effiziente Form der semantischen Anreicherung von Wissenseinheiten erfolgt über das
Hinzufügen von Metadaten.
Die Notwendigkeit dieses Moduls für das wissensbasierte Informationssystem eines
transnationalen Konzerns wurde bereits im vorigen Abschnitt 7.3.1 unter dem Aspekt ’Qualität
von Informationseinheiten: Metastrukturen’ kurz besprochen. Auf Wissen basierende und stark
verteilte Informationssysteme für transnationale Konzerne zeichnen sich - unter anderem dadurch aus, dass bestimmte Dokumente zwar einmal vorhanden (gespeichert) sind, deren
Inhalte aber für verschiedene Unternehmensbereiche unterschiedliche Bedeutung haben. Durch
die Zuordnung von unternehmens- oder applikationsspezifischen Gruppen von
Beschreibungselementen (Metadaten) wäre ein effizienter Mechanismus gegeben, mit dem die
bedarfsgerechte Informationsauffindung bzw. –verwaltung ganz stark gesteigert werden kann.
Damit kann man die standortbezogenen, funktionalen und strukturellen Abhängigkeiten von
Unternehmensbereichen bzgl. geteilter Informationsquellen strategisch abstrahieren, technisch
abbilden und semantisch auf effiziente Weise konfigurierbar machen.
Der Hyperwave Information Server unterstützt standardmäßig die Verwaltung von Metadaten
durch die Vergabe von Objektattributen (siehe Abschnitt 7.1). Wie bereits im Abschnitt 5.2.2
geschildert, kann durch die Anwendung von Metadaten beispielsweise die Qualität der
Inhaltserschließung erhöht bzw. die Extraktion der Bedeutung von Dokumenteninhalten
vereinfacht werden.
Kapitel 7 – IMPLEMENTIERUNG DES SYSTEMS
Seite 165
Im Kontext dieses Abschnitts können Metastrukturen als Mengen von zusammenhängenden
Metadaten verstanden werden (siehe Abschnitt 7.3.1). Eine Metastruktur, die aus einer
endlichen Menge von unterschiedlichen Metadaten besteht, wobei diese einen ganz bestimmten
vordefinierten Zweck erfüllen, wird hier Metadatensatz (engl.: ’Metadata Set’) genannt.
Zielsetzung und Motivation aus wissenschaftlicher Sicht
Das hier zu beschreibende Modul ’Metadatensätze’ wurde für die Verwendung innerhalb des
Informationssystems von dem im Abschnitt 7.2.1 präsentierten, technischen transnationalen
Konzern konzipiert. Das Ziel dieses Moduls ist eine optimierte, zweckgebundene semantische
Datenverwaltung vom Intranetsystem. Die Motivation für das Gestalten dieses Moduls war die
Suche nach einem Mechanismus, welcher folgende Bereiche funktional unterstützen sollte:
•
Resource Discovery
•
Information Retrieval
•
Inhaltserschließung und -analyse
Wie bereits im Abschnitt 5.1.3 beschrieben, ist eines der Hauptziele der Disziplin Resource
Disvcovery das Ermöglichen eines integrierten Zugriffs zu verteilten und vernetzten
Informationsquellen. Der kritische Aspekt einer konsistenten Verbindungstopologie (eng.:
’interconnection topology’) zwischen stark verteilten Informationseinheiten könnte durch die
Benutzung von zentralen Zugriffsknoten zu dahinterliegenden Informationsstrukturen gelöst
werden. Eine zentrale Verwaltung von spezifischen Metadatensätzen, welche einen Teil des
dahinter liegenden Intranetangebots semantisch und terminologisch verbindet, erfüllt diese
Anforderung. Die logische und die semantische Sichtweise auf das System (auch Navigation
und Auffindung genannt), wie ebenfalls in Abschnitt 5.1.3 beschrieben, stellen zwei
Möglichkeiten dar, um die Interaktion zwischen Benutzern und Wissenseinheiten zu
ermöglichen. Diese Interaktion kann über die, in der Disziplin Information Retrieval definierten
Parameter Recall und Precision gesteuert werden. Anders gesagt, die ’Relevanz’ von
Informationseinheiten (z.B. bezüglich einer Suchabfrage) muß optimiert werden. Eine zentrale
Verwaltung von spezifischen Metadatensätzen, welche ständig den semantisch gültigen Bereich
von Wissenseinheiten bestimmen, erfüllt diese Anforderung. Die Disziplinen
Inhaltserschließung und Inhaltsanalyse (siehe Abschnitt 5.2.5) befassen sich mit dem
semantischen Zugriff auf Wissenseinheiten unter ’inhaltlichen’ Gesichtspunkten. Die
Funktionalität eines spezialisierten Moduls für die Verwaltung von Metadatensätzen kann die
unterschiedlichen Aspekte dieser Disziplinen auf einfache und elegante Weise decken.
Dynamisch wachsende Mengen von Wissenseinheiten können durch Metadatensätze in
spezifischen Formen abstrahiert werden, d.h. man kann verschiedene Medatensätze mit
unterschiedlichen Zweckbestimmungen - zum Beispiel zielgruppenspezifisch, informativ,
indikativ, strukturiert, applikationsspezifisch, usw. - definieren. Da Metadatensätze auch
Deskriptoren (siehe Abschnitt 5.2.5) darstellen, kann der Prozess der Indexierung, und
infolgedessen auch der Suchmechanismus verbessert werden. Weiters kann durch die
Festlegung von Metadatensätzen das Problem des Klassifizierens, d.h. der Formulierung von
’Klassifikation zu Klassifikat’-Beziehungen, zumindest teilweise gelöst werden.
Beschreibung des Konzepts
Die Einführung dieser neuen Funktionalität (Definition, Wartung und Verwaltung von
Metadatensätzen) im Informationssystem des transnationalen Konzerns erfordert eine
Anpassung des Rollenkonzepts. Hierfür wird die Rolle ’Application Manager’ eingeführt. Die
Mitglieder der Gruppe Application Manager sind im Allgemeinen für das Gesamtkonzept, die
Kapitel 7 – IMPLEMENTIERUNG DES SYSTEMS
Seite 166
Struktur und das Design einer Intranetapplikation verantwortlich. Eine der Tätigkeiten eines
Application Managers ist die Definition und Verwaltung von appliklationsspezifischen
Metadatensätzen.
Um zwischen global und lokal geltenden Beschreibungen zu unterscheiden, forderte der
transnationale Konzern die Festlegung verschiedener Arten von Metadatensätzen. Demzufolge
wurden zwei Typen von Metadatensätzen festgelegt: Globale und Erweiterte Metadatensätze.
Der globale Metadatensatz stellt eine vom Konzern vordefinierte Menge von Attributen, welche
als ’Standard Metainformation’ aufzufassen ist, dar. Der globale Metadatensatz ist für jegliche
Art von Objekten gültig und muß zum Beispiel beim Publizieren jedes Dokuments vollständig
definiert werden. Um den Vorgang des Publizierens zu beschleunigen, werden je Attribut
Defaultwerte vordefiniert. Die Attributwerte einer Informationseinheit können im
Bearbeitungsmodus von allen Benutzern, welche auf das Objekt Schreibrechte besitzen,
modifiziert werden. Eine vollständige Definition für einen globalen Metadatensatz kann
beispielsweise entsprechend [Tab. 7.1] angegeben werden.
Titel
(Title)
Schlüsselwörter
(Keywords)
Beschreibung
(Short_Description)
Titel vom Dokument (entspricht dem HyperwaveStandardattribut Title)
Schlüsselwörter (laut freier Vergabe), welche den Inhalt des
Dokuments möglichst gut beschreiben.
Kurze Beschreibung des Dokumentes
Auswahl einer oder mehrerer Themen aus einer Liste von
hierarchischen Begriffsbestimmungen
Standort
Der Standort beschreibt die geographische Zuordnung der
Informationseinheit
(Location)
Zuordnung der Informationseinheit zu einer oder mehreren
Abteilungen bzw. anderen Gruppierungen, für welche die
Zielgruppe
vorliegende Information vorgesehen ist (z.B. Abteilungen,
(Target_Audience)
Führungskräfte, usw.)
Soll die Art des Dokumentes beschreiben (z.B.
Arbeitsanweisung, Pressetext, usw.). Kann aber auch die
Dokumenttyp (Document_Type)
Beschreibung des Dokumentenformats enthalten (z.B. Excel
Tabelle, PDF Datei, MP3 Audio, usw.).
Datum und Zeit der letzten Änderung vom Inhalt des
Dokuments (dieses Attribut wird von Hyperwave direkt
Letzte Änderung
gesetzt). Beim Publizieren entspricht der Wert des Attributs
(Last_Modification)
dem ’Erstellungsdatum’ (Datum vom Upload).
Gültigkeit
Geplante Gültigkeit eines Dokuments (Anzahlangabe in
Tagen, Wochen, Monaten, Jahren, oder ’immer’).
(Duration)
Status des Dokuments:
Dokumentenstatus
(Aktuell, Archiv, usw.) oder
(Document_Status)
(Neu, Überprüft, Genehmigt, usw.) je nach Kontext.
Information über versionierte Dokumente (z.B. für
Aktuelle Version
verschiedene Versionen von Gebrauchsanweisungen für eine
(Actual_Version)
Produktpalette)
Verfasser des Dokuments (nicht zu verwechseln mit dem
Autor
Publizierer, d.h. derjenigen Person, welche das Dokument im
(Author)
Server einfügt)
Verweise
Verweise zu anderen Dokumenten, welche mit dem aktuellen
Dokument in Zusammenhang stehen.
(References)
Themenbereiche (Topics)
Tabelle 7.1: Definition vom Globalen Metadatensatz für das wissensbasierte Informationssystem eines
transnationalen Konzerns
Kapitel 7 – IMPLEMENTIERUNG DES SYSTEMS
Seite 167
Die Definition vom Attribut ’Themenbereiche’ im globalen Metadatensatz, d.h. die Festlegung
von einem unternehmensspezifischen hierarchischen Begriffsschema (beispielsweise
implementiert wie unter dem Punkt ’Dynamik, Organisation und Navigation im System’ im
Abschnitt 7.3.1 bereits erwähnt), dient einer besseren Klassifikation und Organisation der
Inhalte, einer besseren Wiederauffindung und ist sehr praktisch beim Archivieren von
gleichartigen Informationseinheiten. Die Angabe der ’Gültigkeit’ einer Informationseinheit
kann den Autor, den Web Administrator oder beispielsweise den Bereichsadministrator auf
ablaufende Gültigkeit hinweisen. Weiters gibt sie den Benutzern Information über die Aktualität
des Dokuments. Der ’Dokumentenstatus’ könnte verwendet werden, um die Sichtbarkeit von
Dokumenten zu steuern. Wenn zum Beispiel die Rolle ’Referee’ definiert wurde, so sind die
Mitglieder dieser Gruppe für die Relevanz von Dokumenten verantwortlich. D.h. erst nach
erfolgter einstimmiger Überprüfung des Dokumenteninhalts durch alle Referees, erhält das
Dokument den Status ’genehmigt’ und wird sofort für alle sichtbar bzw. bearbeitbar. Das
Attribut ’Verweise’ sind Referenzen auf ’verwandte’ Dokumente, wie ein Literatur- oder
Quellenverezeichnis. Die Funktionalität des Attributs Verweise ist mit einer ’Siehe Auch’Funktion vergleichbar.
Ein erweiterter Metadatensatz ist meist spezifisch definiert (z.B. für dessen Anwendung in einer
bestimmten Applikation oder von einem bestimmten Unternehmensbereich), sodass seine
Definition von ganz spezifischen Anforderungen abhängig ist. Ein Unternehmensbereich des
Konzerns kann aufgrund von Erfahrungswerten spezifische Information (Attribute bzw.
Metadaten) über Dokumententypen für deren Charakterisierung über einen Metadatensatz
formulieren bzw. definieren.
Folgende Objektattribute (Metadaten) können, zum Beispiel, bei der Festlegung eines
erweiterten (applikations) Metadatensatzes sehr hilfreich werden:
•
Dokumentenhierarchie: Der Wert dieses Feldes beschreibt die Bereichsabhängigkeit
eines Dokuments, d.h. sein ’unternehmerischer Gültigkeitsbereich’.
•
Dokumentennummer: Viele Unternehmen geben bestimmten Dokumenten eine
alphanummerische Kennzeichnung, um sie zum Beispiel entsprechend einer
historischen Logik zu archivieren oder, um sie einer Phase eines Projektes zuzuordnen.
•
Dokumentenname: Dies ist der gewöhnliche Titel des Dokumentes, z.B. "Tesis de
Fulano de Tal en la Universidad Tecnológica de Guatemala" oder "Informe científico
sobre las distintas modalidades de escribir una tesis", usw. Aus der Sicht des Benutzers
sollte es irrelevant sein, welcher Wert dieses Atrribut besitzt, d.h. es müßte jederzeit
möglich sein, den Dokumentennamen zu modifizieren, ohne technische Probleme beim
Öffnen von Dokumenten hervorzurufen.
•
Editor: Dieses Attribut enthält die Information über jene Personen, welche
Ansprechpartner für Änderungswünsche im Dokument oder bei Unklarheiten über den
Inhalt darstellen. Ein Editor ist nicht derjenige, der das Dokument in das System
einfügt. Ein zusätzliches Feature bei der Anzeige dieses Attributs kann zum Beispiel
das Anbieten eines Links zur Email Adresse bzw. zur Business Card des Editors sein.
Funktionalität aus Benutzersicht
Aus der Sicht des Benutzers stellt das, für den transnationalen Konzern angepaßte Template Set
des Hyperwave Information Servers zwei verschiedene Zugangsmodi zu Informationseinheiten
zur Verfügung: ’Viewing Mode’ und ’Authoring Mode’ (Ansichts- und Bearbeitungsmodus).
Diese Arten des Zugangs sind mit einem Lese- und Schreibmodus vergleichbar, und werden
dem Benutzer über einen eigenen Bereich des Interfaces, den Content Frame, präsentiert.
Kapitel 7 – IMPLEMENTIERUNG DES SYSTEMS
Seite 168
Im Ansichtsmodus wird dem Benutzer der Inhalt einer Informationseinheit geliefert, d.h. der
Inhalt eines Dokuments, die Children eines Strukturelements, usw. Neben dem Inhalt der
Informationseinheit erscheint eine minimale Anzahl von Metadaten (Objektattributen) und eine
Liste ihrer zugeordneten Metadatensätze. Dieser Sachverhalt wird in [Abb. 7.10] graphisch
dargestellt. Über zwei Schaltflächen (Hyperlinks ’read more’ in [Abb. 7.10]) wird die komplette
Information über die Objektattribute bzw. Metadatensätze in einem eigenen Fenster geliefert
(siehe graphische Darstellung in [Abb. 7.11]).
Beim Publizieren eines Dokuments wird ein multi-tabbed Dialogfenster geöffnet, welches eine
Multi Selection Box im ersten Tab besitzt. Diese Multi Selection Box enthält die Namen aller
vorhandenen Metadatensätze (auslesbar aus der Metadaten Collection im Master Server, bzw.
aus den Replikaten davon). Erst nachdem das Publizieren in diesem Fenster abgeschlossen ist,
d.h. der Benutzer hat die OK Schaltfläche gedrückt, wird ein Dialogfenster mit der ’Edit
Selected Metadata Sets’ Funktionalität geladen. Dieses Dialogfenster wird in [Abb. 7.12]
dargestellt.
Abbildung 7.10: Darstellung einer Informationseinheit im Ansichtsmodus
Abbildung 7.11: Gesamte Metainformation (Dialogfenster ’Attributes’)
Kapitel 7 – IMPLEMENTIERUNG DES SYSTEMS
Seite 169
Abbildung 7.12: Bearbeiten der Metadatensätze beim Publizieren von Dokumenten
Funktionalität aus Administratorsicht
Die Namen der Schlüsselwörter (key name) von Attributen sind vordefiniert und dürfen
vorzugsweise nur von einer bestimmten Benutzergruppe (z.B. Application Manager) modifiziert
werden. Das Hinzufügen von neuen Attributen zu einem bereits vorhandenen Metadatensatz ist
durch einen Application Manager möglich. Falls diese zusätzlich über den Suchmechanismus
auffindbar sein sollen (indizierte Metadaten), müssen sie von einem Mitglied der
Administratorgruppe (system user group) eingetragen, und am Server ein
Reorganisationsprozeß angestoßen werden.
Da insgesamt mehrere Benutzer, im Allgemeinen alle Systemadministratoren und Application
Manager, die Definitionen (bzw. die Konfigurationsdateien) von Metadatensätzen bearbeiten
dürfen, werden sie zentral am Master Server gespeichert und verwaltet. Eine spezielle
Collection mit vordefiniertem Namen (z.B. myCompany/system/meta) wird zu diesem Zweck
definiert.
Der Inhalt der Konfigurationsdateien für die Definitionen der Metadatensätze entspricht einer
spezifischen XML-Notation. Falls eine stark verteilte Architektur des Systems vorhanden ist,
oder der Netzwerkverkehr zu groß ist, werden diese Dateien über einen im Hintergrund
laufenden Watchdog-Prozeß in konfigurierbaren Intervallen repliziert (beim Ergreifen von
Replikationsmaßnahmen wird die physikalisch verteilte Portalstruktur auch berücksichtigt).
Die Anzeige der Metadaten im Ansichtsmodus, wie in [Abb. 7.10] dargestellt, kann über ein
spezielles Attribut aktiviert bzw. deaktiviert werden (show_meta = true bzw. show_meta =
false).
Fazit
Mit Hilfe der bisher beschriebenen Logik für die Funktionalität von Metastrukturen, welche
unter Hyperwave durch die Nutzung von Attributobjekten und Document Classes realisiert
werden können, wurden auf effiziente und effektive Weise mehrere Anforderungen bezüglich
Informationsauffindung und –beschreibung erfüllt.
Kapitel 7 – IMPLEMENTIERUNG DES SYSTEMS
Seite 170
Die Funktionalität von Metadatensätzen verbessert den Informationsfluß aus semantischer Sicht
bezüglich Qualität und Relevanz der Informationseinheiten sowie aus technologischer Sicht
bezüglich Bandbreite bzw. Belastung des redundanten Netzwerkverkehrs.
Der nächste Abschnitt behandelt einen Mechanismus, welcher eine schnelle, bedarfsgerechte
und themenorientierte (Ver)Teilung von sehr wichtigen und akuellen Wissenseinheiten auf einer
stark verteilten Serverarchitektur unterstützt.
7.3.3 Modul 2 - News Applikation
Die Zielsetzung bei der Implementierung der in diesem Abschnitt behandelten ’News
Applikation’ ist die spezielle Anforderung des transnationalen Konzerns, Nachrichten (hier
Newsbeiträge genannt) von verschiedenen Unternehmensbereichen in unterschiedlichen
Unternehmenshierarchien zu verschiedenen Themen zu publizieren und den Benutzern der
entsprechenden Bereiche auf den jeweiligen Portalen zugängig zu machen.
Die Besonderheit bei dieser Aufgabenstellung ist die stark verteilte Architektur des Systems.
Wie bereits im Abschnitt 7.3.1 beschrieben, bzw. in [Abb. 7.5] und [Abb. 7.6] graphisch
dargestellt, steht der logischen Zugangsstruktur des Informationssystems eine stark verteilte und
vernetzte physikalische Portalstruktur gegenüber. Dieser Sachverhalt stellt die grösste
Herausforderung bei der Implementierung dieses Moduls dar.
Aus technischer Sicht sind hierbei folgende Aufgaben zu lösen:
•
Festlegung einer geeigneten Datenstruktur zur effizienten und nachhaltigen
Speicherung von Newsbeiträgen
•
Erstellung einer entsprechenden hierarchischen Struktur zur effizienten und zentralen
Verwaltung von Newsbeiträgen während ihrer konfigurierten Lebensdauer (gemeint ist
damit die Dauer ihrer Sichtbarkeit).
•
Festlegung der informationstechnischen Lösung anhand der gegebenen Technologie
(Hyperwave Information Server), um einen optimalen Betrieb der Applikation zu
gewährleisten (Publizieren, Löschen, Suchen, Darstellen von Newsbeiträgen sowie
allgemeine Verwaltung der Struktur).
Ein Newsbeitrag besitzt aufgrund der oben definierten Anforderungen einen ganz bestimmten
Lebenszyklus, welcher wie folgt definiert wird:
Vorpublizieren
Editieren
Freigeben
Archivieren
Zunächst werden die Newsbeiträge in einem ’Pre-Publish’-Bereich erstellt und in einem
weiteren Schritt freigegeben, d.h. einem ausgewählten News-Bereich hinzugefügt. Bei der
Freigabe werden sie dem vordefinierten Bereich zugeordnet und auf darunterliegende Einheiten
vererbt. Parallel zur Freigabe werden sie in einem Archiv chronologisch (zeitabhängig)
abgelegt.
Kapitel 7 – IMPLEMENTIERUNG DES SYSTEMS
Seite 171
Weiters besteht die Möglichkeit, mit einer speziellen Navigationsmöglichkeit, die Newsbeiträge
sowohl über die hierarchische Bereichsstruktur als auch über die chronologische Archivstruktur
abzurufen. Es wird zusätzlich eine spezielle Suche für die Newsbeiträge implementiert.
Um die portalabhängige Darstellung der Newsbeiträge zu ermöglichen, wird der Applikation
’Homepage’, welche für die Funktionalität der Portale verantwortlich ist und im Abschnitt 7.3.1
bereits untersucht wurde, eine Zusatzfunktionalität hinzugefügt. Da die Homepage-Komponente
(Portalfunktionalität) für die Darstellung und Verwaltung des Frameworks (siehe Punkt
’Eigenschaften vom gewählten Framework (Verhalten des Interfaces)’ in Abschnitt 7.3.1)
verantwortlich ist, soll sie auch in der Lage sein, portalabhängige Hotlines darzustellen.
Die Applikation Hotlines (eingegliedert in der Applikation Homepage) zeigt die wichtigsten
Eigenschaften (Headlines) von aktuellen Newsbeiträgen auf dem jeweiligen Bereichsportal an.
Die Anzahl der anzuzeigenden Hotlines ist frei konfigurierbar. Ein Beispiel für die Anzeige von
Hotlines im Content Frame eines Portals ist in [Abb. 7.13] dargestellt.
Abbildung 7.13: Anzeige von zwei Hotlines im Portal vmgb’s homepage
News Applikation aus Benutzersicht
Wie in [Abb. 7.13] bereits dargestellt, erhält der Benutzer beim Einstieg in ein Portal die
aktuellsten Newsbeiträge in zusammengefasster Form (Hotlines). Die visualisierten Teile der
aktuellen Newsbeiträge sind Datum, Thema, publizierender Bereich und Kurzbeschreibung des
Beitrages. All diese Informationsteile sind in den Metadaten der jeweiligen Newsbeiträge als
Textinformation gespeichert. Weiters soll über entsprechende Hotlinks (Hyperlink ’read more’
auf der rechten Seite jeder Hotline) der Zugang zur eigenständigen News Applikation
ermöglicht werden.
Die News Applikation bietet drei Zugangsmöglichkeiten, um publizierte Newsbeiträge
abzurufen, an:
-
Chronologisches Archiv der Newsbeiträge auf dem News Server
-
Nach Unternehmensbereichen strukturierte Newsbeiträge auf dem News Server
-
Applikationsspezifische Suche nach Newsbeiträgen (über indizierte Metadaten und
Volltextsuche)
Vom Framework her, stehen einem Benutzer insgesamt folgende Möglichkeiten zur Verfügung,
um zu dem kompletten Inhalt eines Newsbeitrags zu kommen:
-
Vom Portal aus können Newsbeiträge durch das Verfolgen der angebotenen Hyperlinks
(’read more’, "get more Hotlines", ’<Name des Unternehmensbereichs>’, "Archive"),
wie in [Abb. 7.13] graphisch dargestellt, erreicht werden. Diese Hyperlinks führen von
der Hotlines-Applikation (eingegliedert in der Homepage-Komponente) weg in die
eigenständige, zentral verwaltete News Applikation.
Kapitel 7 – IMPLEMENTIERUNG DES SYSTEMS
Seite 172
-
Navigation durch die Archivstruktur auf einer zentralen Stelle.
-
Suche über die zentral verwaltete Archivstruktur
-
Navigieren über die hierarchisch (nach Unternehmensbereichen) angeordnete Struktur
der publizierten Newsbeiträge.
Um einen besseren Einblick in das News-System zu gewinnen, wird seine allgemein definierte
Struktur in [Abb. 7.14] graphisch dargestellt. In der verteilten Struktur des Informationssystems
wird über Konfigurationsdateien festgelegt, welcher Hyperwave Server auch der News Server
ist, und demzufolge befindet sich auf ihm die zentrale Struktur (Archiv, usw.) der News
Applikation. Die Erstellung dieser Struktur erfolgt auf generische und deren Verwaltung auf
dynamische Weise. Alle Strukturelemente der News Applikation (News Hauptcollection,
Archiv, Zentrale für das Publizieren, Struktur nach Unternehmensbereichen, usw.) sind als
Document Classes implementiert, d.h. sie stellen Container mit vordefiniertem Verhalten dar.
Abbildung 7.14: Struktur der News Applikation auf dem Hyperwave News Server
Die Hauptsprache der Inhalte von Newsbeiträgen ist Englisch. Jedoch ist das Publizieren von
’mehrsprachigen’ Newsbeiträgen auch möglich. Die Darstellung der Inhalte von Newsbeiträgen
erfolgt in Abhängigkeit der Spracheinstellung des Benutzers; ist die Sprachversion aber nicht
definiert, so wird der Newsbeitrag auf Englisch angezeigt.
News Applikation aus Administrator- bzw. Autorsicht
Die Verwaltung der News Appliaktion erfolgt anhand eines speziell definierten Rollenkonzepts.
Ein News-Administrator (in der Regel ein Content Manager) kann in Abhäniggkeit von seinen
Zugriffsrechten die News Applikation verwalten, d.h. neue Newsbereiche (Container) anlegen
und bearbeiten, und Newsbeiträge in das News System einbringen.
Kapitel 7 – IMPLEMENTIERUNG DES SYSTEMS
Seite 173
Die gesamte Funktionalität der News Applikation wird über das Menü im Content Frame zur
Verfügung gestellt. Bezüglich des Rollenkonzeptes gibt es insgesamt drei unterschiedliche
administrative Rollen:
-
News Administratoren besitzen innerhalb der News Applikation überall Schreibrechte.
-
News Autoren dürfen Newsbeiträge entsprechend ihrer Rechte in der hierarchischen
Struktur erstellen.
-
News Publizierer dürfen Newsbeiträge freigeben (Publish Funktionalität) bzw. wieder
publizieren (Re-Publish Funktionalität).
Der in [Abb. 7.14] dargestellte Newscontainer ’Zentrale für das Publizieren’ stellt die zentrale
Verwaltungsselle der News Applikation dar, und wird Publish/Modify Bereich genannt. Dieser
Bereich ermöglicht das Erstellen und Modifizieren von untenehmensspezifischen
Newscontainern, und von Newsbeiträgen. Die allgemeine Darstellung in diesem Bereich wird in
[Abb. 7.15] graphisch dargestellt.
Aktuelles Objekt: <NewsContainer>
Last Page
Container 1
Parent 1
Container 2
<Suchwort>
Parent 2
Container 3
Container 4
Container 5
Container 6
<Filter>
SUCHE
Container 7
Hotlines vom Bereich <News Container>
<Datum> Thema:<Thema> Bereich:<Bereich>
<Titel vom Newsbeitrag>
Kurze Beschreibung des Newsbeitrags
read more
<Datum> Thema:<Thema> Bereich:<Bereich>
<Titel vom Newsbeitrag>
Kurze Beschreibung des Newsbeitrags
read more
<Datum> Thema:<Thema> Bereich:<Bereich>
<Titel vom Newsbeitrag>
Kurze Beschreibung des Newsbeitrags
read more
Abbildung 7.15: Allgemeine Darstellung der News Applikation
Aufbau der hierarchischen Struktur nach Unternehmensbereichen
Beim Erstellen eines Bereichscontainers (Division Newscontainer) werden Attribute wie Titel,
Beschreibung und Zugriffsrechte vergeben. Eine neue hierarchische Bereichszuordnung (d.h.
das Anlegen eines neuen Bereichscontainers) erfolgt über eine Auswahl von weiteren
Bereichscontainern, für die der Administrator Schreibrechte besitzt. Nach dem Anlegen des
neuen Newscontainers wird automatisch ein ’Aktuellcontainer’ (Actual Newscontainer) für
diesen (und in diesem) Bereich erzeugt. Dabei werden vom übergeordneten Bereichscontainer
(Parent) die aktuellsten Beiträge vererbt (’hineingelinkt’). Um diesen Sachverhalt zu
verdeutlichen, wird in [Abb. 7.16] die logische und funktionale Struktur der News Applikation
graphisch dargestellt.
Kapitel 7 – IMPLEMENTIERUNG DES SYSTEMS
Seite 174
Abbildung 7.16: Funktionale Logik der News Aplikation
Verwaltung von Newsbeiträgen
Die Erstellung und das Modifizieren von Newsbeiträgen erfolgt im Publish/Modify Bereich
über ein Dialogfenster entsprechend der Darstellung in [Abb. 7.17].
Abbildung 7.17: Dialog zum Bearbeiten eines Newsbetrags
Kapitel 7 – IMPLEMENTIERUNG DES SYSTEMS
Seite 175
Folgende Einträge sind bei einem Newsbeitrag konfigurierbar:
-
-
Tab Theme (Thema):
o
Division (Unternehmensbereich):
entsprechend der Benutzerrechte
Automatisch
generierte
Vorauswahl
o
Topic (Thema): Vorauswahl entsprechend einer konfigurierbaren Themenliste
(XML-Datei)
o
Time Open (Hyperwave Standard Attribut)
o
Time Close: Eingeführtes Attribut zur Steuerung der Dauer der Sichtbarkeit.
Die Sichtbarkeit stellt die Aktualität des Newsbeitrags dar, d.h. seine
Lebensdauer im entsprechenden Aktuellcontainer der Hierarchie.
o
Attachments: Ein Multipart-Fileupload Fenster wird zusätzlich geöffnet
(Optionale Funktionalität).
Tabs Major Language und Alternative Language (unternehmensspezifische Attribute):
o
Titel (Headline): Titel des Beitrags
o
Kurze Beschreibung (Hotline):
o
Dokumentenautor: Da der Autor des Inhalts eines Newsbeitrags nicht unbedingt
gleichzeitig der Publizierer (Freigeber) ist, wird mit Hilfe dieses Attributs ein
expliziter Unterschied hergestellt.
o
Inhalt (HTML): In diesem Feld wird der komplette Inhalt der zu übermittelten
Nachricht geschrieben.
Ein neu erstellter Newsbeitrag bleibt physikalisch im Publish/Modify Bereich, bis ein
Publizierer mit entsprechenden Zugriffsrechten den Beitrag zur Veröffentlichung freigibt. Bis
zur Freigabe wird der Beitrag weder im Archiv, noch in der hierarchischen Struktur abgelegt,
und ist über die Navigation nicht auffindbar. Damit ist gewährleistet, dass der Beitrag bis zur
expliziten Freigabe beliebig oft bearbeitet werden kann. Dieses Feature ist insbesondere für
transnationale Konzerne interessant, da mehrere, geographisch verteilte Autoren für einen
Beitrag verantwortlich sein können. Weiters ist damit die Möglichkeit gegeben, den
Newsbeitrag eines nicht mehrsprachigen Benutzers von einem geographisch weit entfernten,
mehrsprachigen Mitarbeiter übesetzen zu lassen, um damit eine multilinguale Darstellung zu
ermöglichen. Mit der Freigabe eines Newsbeitrags wird er physikalisch im Archiv entsprechend
seinem ’TimeOpen’-Attribut abgelegt. Zusätzlich wird er in den entsprechenden
Bereichscontainer und in alle untergeordneten Aktuellcontainer verlinkt. Nach dem ein Beitrag
veröffentlicht wurde, ist er nicht mehr editierbar und wird aus dem Publish/Modify Bereich
entfernt.
Beim Mechanismus des ’Wiederpublizierens’ (Re-Publish) wird eine physikalische Kopie des
Beitrages im Publish/Modify Bereich abgelegt. Diese neue Kopie eines Newsbeitrags (mit
einem neu generierten eindeutigen Namen) kann solange bearbeitet werden, bis er freigegeben
wird. Während des Prozesses der Wiederpublizierung kann der neue Autor bestimmen, ob das
Original des Newsbeitrags aus der hierarchischen Struktur entfernt werden soll, oder nicht. Das
Löschen eines Newsbeitrags aus dem Archiv ist hingegen nicht erlaubt.
Technische Verwaltung von Newsbeiträgen über die verteilte Serverarchitektur
Wie bereits weiter oben erwähnt, zeigt die Hotlines Applikation der Homepage Komponente die
Headlines von aktuellen Newsbeiträgen (die Anzahl von aktuellen Newsbeiträgen ist frei
konfigurierbar = n) auf dem jeweiligen Portal an. Es wird in der Portalstruktur je Homepage
Kapitel 7 – IMPLEMENTIERUNG DES SYSTEMS
Seite 176
(Portal) ein eigener Bereich definiert (z.B. homepage/hotlines). Darin werden die n aktuellsten
Newsbeiträge des Aktuellcontainers, welcher je Portal frei definierbar ist (d.h. ein spezifisches
Portalattribut), gespeichert.
Die Aktualisierung von portalabhängigen Hotlines erfolgt automatisch in konfigurierbaren
Zeitabständen (Cronjob Prozess namens Watchdog). Die benötigten Daten für die Darstellung
der Hotlines werden von dem entsprechenden Aktuellcontainer (welcher auf dem zentralen
News Server gespeichert ist) über eine Serververbindung auf andere geographisch entfernte
Server repliziert. Damit werden weder die physikalische noch die logische Portalstruktur (siehe
graphische Darstellung in [Abb. 7.5] und [Abb. 7.6]) des verteilten Systems verletzt. Die hierfür
verwendete Replikationsmethode ist ein periodisches Mehrfachkopieren von Daten über
verteilte Strukturen mit einfachem Synchronisationsprozess (siehe Abschnitt 4.2
’Datenreplikation’).
Es werden dabei folgende Daten repliziert: Datum, Thema, publizierender Bereich und
Kurzbeschreibung. Nicht repliziert werden der Inhalt und die eventuell vorhandenen Beilagen
(Attachments). Die angezeigten Hotlinks - siehe [Abb. 7.13] - bieten die Möglichkeit, die nicht
replizierten Dateninhalte der Newsbeiträge vom zentralen News Server abzurufen. Der, für die
Replikation implementierte Watchdog startet periodisch seine Initialisierungsroutinen. Zunächst
sucht er nach allen Portalen des verteilten Informationssystems. Für jedes gefundene Portal liest
er das Attribut ActualNews, baut eine Server-Verbindung zum angegebenen Newscontainer auf
und sucht alle noch sichtbaren Newsbeiträge im entsprechenden Container. Er löscht alle
Children der Hotlines Collection des Portals und legt die benötigten Replikationsdaten darin ab.
Das transparente Bereitstellen von mehrfach verfügbaren Datenbeständen hat sowohl technische
als auch strategische Gründe. Aus technischer Sicht kann durch Datenreplikation das Problem
vom nicht effizienten Datenzugriff auf weit entfernten Inhalten, aufgrund langsamer
Internettechnologien in manchen Standorten, gelöst werden. Aus strategischer Sicht können
beispielsweise globale Informationen hoher Priorität (wie etwa die hier besprochenen
Newsbeiträgen) durch Datenreplikation so über das System verteilt werden, dass die
Transferbelastung eines zentralen Newsrechners kompensiert wird.
Fazit
Das in diesem Abschnitt besprochene Modell einer News Applikation zeigt nicht nur die
Komplexität der Aufgabenstellung, sondern auch das Zusammenwirken unterschiedlicher
Technologien und Fachdisziplinen bei der Konzeption der beschriebenen Lösung.
Unter Berücksichtigung des im Kapitel 6 definierten Technischen Gestaltungsmodells konnten
Einflüsse der unterschiedlichen Hauptdisziplinen identifiziert werden. Sie stellten sämtliche
Werkzeuge, welche für diese effiziente und effektive Lösung notwendig waren, wie folgt, zur
Verfügung:
-
Wissensmanagement lieferte die strategischen Überlegungen zur Verwaltung der
Wissensbausteine, insbesondere der Wissens(ver)teilung und Wissensentwicklung.
-
Informationsmanagement gab einen Einblick in die verteilte Struktur des Systems und
lieferte gleichzeitig die Lösung für das Verschmelzen zweier stark verteilter
Applikationen (Homepage und News Applikation
Hotlines Applikation).
-
Datenmanagement lieferte die Kriterien zur Performanzsteigerung und demzufolge die
Lösung über einen Replikationsmechanismus.
-
Wissensorganisation ermöglichte das Festlegen von geordneten Strukturen auf
bedarfsgerechte Weise: chronologisch für das Archiv und hierarchisch für die
Kapitel 7 – IMPLEMENTIERUNG DES SYSTEMS
Seite 177
Abbildung der Unternehmensstruktur. Weiters wurde von dieser Hauptdisziplin die
themenorientierte Verwaltung von Newsbeiträgen über die Festlegung einer einfachen
Begriffsliste ermöglicht.
7.4 Zusammenfassung
Die technische Implementierung eines wissensbasierten Informationssystems für ein großes und
geographisch verteiltes Unternehmen erschwert sich in der Regel proportional zur Komplexität
der spezifischen Anforderungen. Aus technischer Sicht müssen deshalb intensive Gespräche mit
dem Kunden geführt werden, um einen möglichst präzisen Einblick in das Innenleben des
Unternehmens zu gewinnen, sodass die wesentlichsten Aspekte des Konzerns extrahiert werden
können.
In diesem Kapitel wurde die Vorgehensweise des in Kapitel 6 beschriebenen Lösungsvorschlags
gewählt, wobei hier das zugrundeliegende System von vornherein bekannt bzw. vom Kunden
vorbestimmt war. Da die Technologie des Hyperwave Information Servers auf einer modularen
und anpaßbaren Architektur basiert, erwies sich die Implementierung des Systems als sehr
praktisch. Zwar lösten die vorgefertigten Module von Hyperwave nicht direkt alle technischen
Aufgabenstellungen, viele Vorzüge des Servers stellten aber die notwendigen Werkzeuge für
eine effiziente und effektive Lösung zur Verfügung.
Die Modellierung der strukturellen Abhängigkeiten zwischen den unterschiedlichen
Unternehmensbereichen ließ sich durch eine multifunktionale und hierarchisch angeordnete
Portalstruktur realisieren. Die funktionalen Abhängigkeiten innerhalb des Konzerns, aufgrund
der starken Vernetzung von Geschäftsfunktionen, ließen sich semantisch durch die Einführung
von Themenhierarchien für die globale Navigation, sowie durch den Einsatz von
Metadatensätzen für eine verbesserte Informationsauffindung, vollständig im Wissensfluß des
Informationssystems abbilden. Für die benötigte Transparenz bezüglich der starken
Standortverteilung von Unternehmensbereichen sorgte das effiziente Server Pool Konzept vom
Hyperwave Information System. Das Hauptproblem bezüglich der Internationalität des
Konzerns – insbesondere seine Mehrsprachigkeit - wurde mit Hilfe spezialisierter
Strukturelementen (Language Cluster und Document Classes) sowie eines angepaßten Template
Sets weitgehend gelöst. Weiters wurde die Implementierung einer besonders komplexen
Applikation, welche erst durch das Zusammenwirken mehrerer Fachbereiche effizient gelöst
werden konnte, vorgestellt.
Die Zusammenfassung der Erkenntnisse des Untersuchungs- und Gestaltungsbereichs der
vorliegenden Arbeit, sowie einen Ausblick auf zukünftige Entwicklungen im Kontext der hier
behandelten Themen werden im nächsten Kapitel gegeben.
Kapitel 7 – IMPLEMENTIERUNG DES SYSTEMS
Seite 178
Kapitel 8 – ZUSAMMENFASSUNG UND AUSBLICK
Seite 179
Kapitel 8
Zusammenfassung und Ausblick
Die Ressource Wissen liegt in großen und geographisch verteilten Unternehmen explizit oder
implizit, aber insbesondere eingebettet in Prozessen vor. Die grundlegendste Zielsetzung
transnationaler Konzerne besteht in diesem Zusammenhang darin, Wissen problemspezifisch zu
generieren und zu bewahren bzw. den computergestützten Wissenstransfer produktiv und
effizient zu nutzen und damit zugänglich zu machen. Die moderne Weltwirtschaft zwingt
transnationale - und demzufolge global agierende - Konzerne ihre Corporate Identity
grenzüberschreitend und sprachunabhängig hervorzuheben und anzubieten. Das
Unternehmensgedächtnis des Konzerns erfordert deshalb eine organisierte und geordnete
Verwaltung.
Ein großes Anliegen des Autors der vorliegenden Diplomarbeit bestand darin, die
Hauptfunktionen diverser Wissenschaftsbereiche bezüglich der oben beschriebenen allgemeinen
Problematik zu untersuchen. Der Schwerpunkt wurde in den Bereichen, welche den größten
Aktionsradius besitzen, gelegt. Von diesem Grundgedanken ausgehend wurden
Wissensmanagement, Informationsmanagement, Datenmanagement und Wissensorganisation
gewählt und Hauptdisziplinen genannt. Nach einer allgemeinen Einführung in die wichtigsten
Merkmale eines großen und geographisch verteilten Unternehmens wurden starke strukturelle,
funktionale und standortbezogene Abhängigkeiten, welche aus der komplexen
Organisationsstruktur herrühren, identifiziert (siehe Abschnitt 1.2). Je Hauptdisziplin wurden im
Untersuchungsbereich dieser Arbeit kritische Aspekte bzw. spezifische Problembereiche in
Zusammenhang mit den identifizierten Abhängigkeiten gefunden und analysiert. Die stark
vernetzte und verteilte Infrastruktur eines transnationalen Konzerns lag bei den Untersuchungen
stets im Vordergrund.
Obwohl die Hauptdisziplinen unterschiedliche Hauptfunktionen besitzen, ließen sich folgende
gemeinsame kritische Problembereiche, die im Zusammenhang mit der technischen Gestaltung
des wissensbasierten Informationssystems stehen, identifizieren:
•
•
•
•
•
•
Stark verteilte Struktur des Unternehmens vrs. der Forderung nach einem zentralisiert
erscheinenden Gesamtsystem
Stark
vernetzte
funktionale
Querverbindungen
in
der
hierarchischen
Organisationsstruktur des Konzerns vs. der Forderung nach einer logischen Darstellung
und transparenten Verwaltung von Wissenseinheiten und Wissensprozessen
Mehrfach definierbare semantische Repräsentationen von Wissenseinheiten, um
standortbezogene und bedarfsgerechte Sichtweisen zu ermöglichen
Verwendung von plattformunabhängigen Mechanismen, spezialisierten Werkzeugen
und allgemeingültigen Standards, um die geographischen Barrieren zu sprengen
Gewährleisten von maximaler Transparenz, optimaler Fehlertoleranz und hoher
Performanz des verteilten Systems
Anwendung multilingualer Mechanismen, um das Problem der hohen
Internationalisierung des Konzerns effizient und effektiv zu lösen
Wissensmanagement, als erste untersuchte Hauptdisziplin, stellt strategische und steuernde
Lösungsansätze, welche die kritischen Aspekte aus einer sehr unternehmensnahen Sicht
behandeln, zur Verfügung. Die meisten Experten in diesem Bereich sehen im Umgang mit dem
Wissen einen stets veränderlichen Prozeß, auf dem ihre Lösungsvorschläge basieren. Diese
Kapitel 8 – ZUSAMMENFASSUNG UND AUSBLICK
Seite 180
Dynamik hinter der Ressource Wissen, in Verbindung mit den funktionalen, strukturellen und
standortabhängigen Charakteristiken eines transnationalen Konzerns, führen zur Identifikation
von sehr tief liegenden Problemen, welche einen sozialen, kulturellen oder
betriebswirtschaftlichen Charakter besitzen.
Es lässt sich also zusammenfassen, dass
Wissensmanagement, insbesondere in der Phase der Planung und Organisation eines
Lösungsmodells, kontrollierende Maßnahmen und Entscheidungskriterien liefert.
Wissensmanagement
liefert
aber
auch
Lösungsansätze
zur
untenstehenden
Inromationstechnologie. Das Besondere an der Hauptdisziplin Wissensmanagement ist ihr
starker interdisziplinärer Aktionsradius, und demzufolge ihr integrierendes Potential.
Wissensmanager messen während ihrer Analysetätigkeiten der Technologie nicht wenig
Bedeutung bei; sie setzen sich mit technischen Werkzeugen stark auseinander und können
deshalb mit Tools aus den Bereichen Document Management, Content Mangement, usw.
optimale Lösungen für jedes Anforderungsprofil bieten.
Informationsmanagement wurde fast ausschließlich von der technischen Seite beleuchtet, um
konkrete Lösungsansätze bezüglich der Realisierung von webbasierten verteilten Systemen zu
finden. Der Hauptvorteil der vorgegebenen und in Zusammenhang mit dem
Informationsmanagement untersuchten Intranetumgebung liegt in der orts- und
zeitunabhängigen Verfügbarkeit der Benutzerschnittstelle (d.h. in der Nutzung des Browsers als
einheitliches und überall verfügbares Zugangs- und Kommunikationswerkzeug). Die
identifizierten Qualitätskriterien für eine verteilte Lösung des Systems sind: Erweiterbarkeit,
Transparenz, Robustheit, Performanz, Wartbarkeit und Integrationsfähigkeit. Gegenüber zentral
organisierten Systemen zeichnen sich verteilte Systeme durch höhere Wirtschaftlichkeit,
Zuverlässigkeit, kürzere Antwortzeiten, modulare Skalierbarkeit, kontinuierliche Verfügbarkeit
und transparente Behandlung von Teilausfällen aus.
Die Hauptdisziplin Datenmanagement liefert konkrete technische Antworten in Zusammenhang
mit der physikalischen Verwaltung von Datenbeständen. Der Schwerpunkt wurde hierbei auf
Effizienz bei geographisch verteilter Datenaufbewahrung, -wartung und –zugriff gesetzt. Die
Mechanismen der Datenreplikation wurden ausführlich behandelt, und liefern unterschiedliche
Lösungsansätze in Abhängigkeit von zwei Hauptkriterien: Optimierung der Fehlertoleranz oder
Steigerung der Performanz des verteilten Systems.
Im Bereich der Wissensorganisation wurde nach Mechanismen gesucht, um eine effiziente
semantische Informationsauffindung zu ermöglichen. Experten in den Bereichen
Klassifikationssysteme, Information Retrieval, Bibliothekswesen und Wissensorganisation
identifizieren gemeinsam die sehr hohe Bedeutung von Metastrukturen und
Klassifikationsschemata, um einen konzeptualisierten (und infolgedessen sprachunabhängigen
und bedarfsgerechten) Informationszugang zu gewährleisten bzw. zu verbessern.
Im Gestaltungsbereich dieser Diplomarbeit wurde, um eine übersichtliche Analyse der
Auswirkungen aller oben beschriebenen kritischen Aspekte zu ermöglichen, ein
Lösungsvorschlag, welcher als Modell zur Gestaltung eines auf Wissen basierten
Informationssystems für transnationale Konzerne dient, erarbeitet. Hierfür wurde zunächst ein
Arbeitsmodell definiert, mit dem die Aktionsbereiche der Hauptdisziplinen untersucht werden
konnten. Weiters wurden drei Arbeitsbereiche (Wirkungsbereiche) definiert, um die
unterschiedlichen kritischen Aspekte in zweckgebundene Gruppen (Organisation, Inhalt &
Semantik und Technik) einzuordnen. Diese Vorgehensweise resultierte in zwei
unterschiedlichen Lösungsschemata: ein strategisches und ein technisches Schema. Das erste
Schema (Grundlegendes Schema) gilt der strategischen Zuordnung von spezifischen
Anforderungen an das Informationssystem zu den Wirkungsbereichen, wodurch ein
Anforderungsprofil erarbeitet werden kann. Das zweite Schema (Funktionales Schema) bildet
die wichtigsten Komponenten des Systems ab, wodurch die Festlegung eines technischen
Kapitel 8 – ZUSAMMENFASSUNG UND AUSBLICK
Seite 181
Lösungsvorschlags nahe liegt. Beide Schemata zusammen stellen ein allgemeines
Lösungsmodell dar, und wurden Technisches Gestaltungsmodell benannt. Anhand dieses
Technischen Gestaltungsmodells konnte aus allen im Untersuchungsbereich erkannten
kritischen Aspekten ein allgemeines Anforderungsprofil erstellt werden.
Im letzten Kapitel dieser Diplomarbeit wurden zunächst die wichtigsten Problembereiche eines
anonymisiert dargestellten technischen transnationalen Konzerns präsentiert. Basierend auf der
Technologie und Architektur des Hyperwave Information Servers, und anhand des Technischen
Gestaltungsmodells wurde das wissensbasierte Informationssystem für diesen Konzern
implementiert. Die technologischen Vorteile des Hyperwave Information Servers wurden für
die technische Umsetzung weitgehend ausgenutzt und lieferten in jedem Punkt eine optimale
Lösung für die Gesamtproblematik. Zwei als Module implementierte Teillösungen aus dem
Gesamtsystem wurden in den letzten Abschnitten der vorliegenden Arbeit näher beschrieben.
Das erste Modul beschrieb die Implementierung semantischer Metastrukturen (Metadatensätze),
welche angewendet auf eine einzige Informationseinheit unterschiedliche semantische Zugangsund Auffindungsmöglichkeiten erlauben. Das zweite Modul stellte eine komplexe News
Applikation dar. Hierbei lag der Schwerpunkt auf die stark verteilte Architektur des Systems,
und erforderte, unter anderem, die technische Umsetzung von Replikationsmechanismen. Die
große Herausforderung lag hierbei in der Anforderung, eine zentrale Verwaltung und
Archivierung von Newsbeiträgen zu implementieren und gleichzeitig auf alle Portale in der
verteilten Serverarchitektur stets die aktuellsten Newsbeiträge zur Verfügung zu stellen.
Erweiterungs- und Verbesserungsmöglichkeiten des, in dieser Arbeit dargelegten
Lösungsmodells sind im Rahmen zukünftiger Forschungsprojekte und Aufträge der Web
Applications Group des Instituts für Informationsverarbeitung und Computergestützte neue
Medien der Technischen Universität Graz (WAG-IICM Graz) zu erwarten. Die stärksten
Anstrengungen hinsichtlich der Verbesserung des Technischen Gestaltungsmodells werden mit
großer Wahrscheinlichkeit das Funktionale Schema betreffen. Der Grund hierfür liegt in der
Tatsache, dass die von den Hauptdisziplinen zur Verfügung gestellten Werkzeuge und
Mechanismen einem kontinuierlichem Optimierungsprozess unterworfen sind. Weiters ist das
Starten eines Projekts geplant, um aus dem Modellansatz ein ’computer-based framework’ zu
implementieren. Dieses Framework soll den Gestaltungsprozess des Modells unterstützen und
eventuell beschleunigen. Eine weitere Möglichkeit, um das hier vorgestellte Gestaltungsmodell
zu verbessern wäre, anhand mehrerer Interviews mit transnationalen Konzernen konkrete
Anforderungen an Intranetsysteme einzuholen. Die aus einer Auswertung dieser Anforderungen
gewonnenen Informationen sollen dabei helfen, die Funktionalität des Modells zu steigern bzw.
zu überprüfen.
Aus persönlicher Sicht hofft der Autor der vorliegenden Arbeit, dass die Vertreter aller hier
berücksichtigten Wissenschaftsbereiche in enger Kooperation miteinander zu neuen
gemeinsamen Lösungen hinsichtlich wissensbasierte Informationssysteme beitragen können.
Kapitel 8 – ZUSAMMENFASSUNG UND AUSBLICK
Seite 182
Teil III – ANHANG UND VERZEICHNISSE
Seite 183
Teil III
ANHANG UND VERZEICHNISSE
Teil III – ANHANG UND VERZEICHNISSE
Seite 184
ANHANG
Seite 185
Anhang
CD ROM
Als Beilage zu dieser Diplomarbeit finden Sie eine CD-ROM, die folgende Information enthält:
•
Diese Arbeit in elektronischer Form
(PDF-, HTML- und DOC-Format)
•
Die im Literaturverzeichnis angeführten Quellen
(soweit in elektronischer Form verfügbar)
Alle oben genannten Informationen sind über die Datei index.html erreichbar.
ANHANG
Seite 186
ABBILDUNGSVERZEICHNIS
Seite 187
Abbildungsverzeichnis
Abbildung 1.1: Beispiel für eine funktionale Organisationsform [Janko 2001] ........................... 4
Abbildung 1.2: Beispiel für eine produktionale Gliederung) [Janko 2001].................................. 4
Abbildung 1.3: Beispiel für eine regionale Organisationsform [Janko 2001]............................... 4
Abbildung 1.4: Beispiel für eine Matrixorganisation [Janko 2001].............................................. 5
Abbildung 1.5: Beispiel für eine Tensororganisation [Janko 2001].............................................. 5
Abbildung 2.1: Fünf Kategorien Modell nach Ackoff [Bellinger et al. 2001b].......................... 13
Abbildung 2.2: Interpretation des Komplexitätbegriffs nach Csikszentmihalyi [Bellinger et al.
2001b]................................................................................................................................. 13
Abbildung 2.3: Modellerweiterung. Korrelation des Wissensmodells von Ackoff mit dem
Komplexitätsmodel von Csikszentmihalyi [Bellinger et al. 2001b]................................... 14
Abbildung 2.4: Wissensspirale von Nonaka & Takeuchi ........................................................... 16
Abbildung 2.5: Bausteinmodell des Wissensmanagements [Probst et al. 1999] ........................ 17
Abbildung 3.1: Informationsmanagement nach [Küng 1999]..................................................... 30
Abbildung 4.1: Lokalisierung von Replikaten nach dem Ausfall eines Systemknotens............. 51
Abbildung 4.2: Der ’günstigste’ Weg durch Replikation............................................................ 51
Abbildung 4.3: Transparenz eines verteilten Systems durch Replikation................................... 52
Abbildung 4.4: Funktionales Model eines abstrakten Protokolls [Wiesmann et al. 2000] ......... 53
Abbildung 4.5: Aktive Replikation [Wiesmann et al. 2000]...................................................... 54
Abbildung 4.6: Passive Replikation [Wiesmann et al. 2000]...................................................... 54
Abbildung 4.7: Semi-aktive Replikation [Wiesmann et al. 2000] ............................................. 55
Abbildung 4.8: Replikation in Verteilten Systemen [Wiesmann et al. 2000] ............................. 55
Abbildung 4.9: Replikation in Datenbanken [Wiesmann et al. 2000] ........................................ 56
Abbildung 4.10: Eager primary copy Replikation [Wiesmann et al. 2000]................................ 57
Abbildung 4.11: Eager update everywhere Replikation mit verteilter Sperre [Wiesmann et al.
2000]................................................................................................................................... 57
Abbildung 4.12: Eager update everywhere Replikation mit Atomic Broadcast [Wiesmann et al.
2000]................................................................................................................................... 57
ABBILDUNGSVERZEICHNIS
Seite 188
Abbildung 4.13: Lazy primary copy Replikation [Wiesmann et al. 2000] ................................. 58
Abbildung 4.14: Lazy update everywhere Replikation [Wiesmann et al. 2000] ........................ 58
Abbildung 4.15: Phasenkombinationen für starke Datenkonsistenz [Wiesmann et al. 2000] .... 59
Abbildung 4.16: Synthetische Ansicht der Replikationstechniken für Datenbanken und Verteilte
Systeme [Wiesmann et al. 2000] ........................................................................................ 59
Abbildung 5.1: Antwort des Thesaurus ERIC nach einer Suchabfrage [Shiri et al. 2000] ......... 86
Abbildung 5.2: Beispiel für die Anwendung von semantischen Netzen [Guetl 2000] ............... 87
Abbildung 5.3: Graphische Darstellung der Eigenschaften von Kategorien [Easterbrook 1998]
............................................................................................................................................ 90
Abbildung 5.4: Beispiel einer hierarchischen Notation von DDC [Heber 2000]........................ 98
Abbildung 5.5: Graphische Darstellung einer Concept Map [Novak 2002] ............................. 104
Abbildung 5.6: Mehrdimensionale Sichtweisen in einem Informationssystem für große und
geographisch verteilte Unternehmen über unterschiedlich facettierte Themenhierarchien
.......................................................................................................................................... 109
Abbildung 6.1: Wirkungsbereiche zur Analyse eines wissensbasierten Informationssystems . 118
Abbildung 6.2: Deutung der Wirkungsbereiche ’Organisation’, ’Inhalt & Semantik’ und
’Technik’ als Kraftfeld .................................................................................................... 118
Abbildung 6.3: Nicht ausgeglichener Zustand der Problembehandlung aufgrund fehlender
Berücksichtigung eines Wirkungsbereichs (gestörtes System) ........................................ 119
Abbildung 6.4: Arbeitsmodell zur allgemeinen Sichtweise der Lösung .................................. 120
Abbildung 6.5: Phasen des Informationsflusses in einem Informationssystem ........................ 122
Abbildung 6.6: Rollenkonzept im wissensbasierten Informationssystem................................. 125
Abbildung 6.7: Grundlegendes Schema zur Konzeption eines wissensbasierten
Informationssystems für transnationale Konzerne ........................................................... 128
Abbildung 6.8: Funktionales Schema zur Konzeption eines wissensbasierten
Informationssystems für transnationale Konzerne ........................................................... 131
Abbildung 6.9: Beispiel für den Pfad des Informationsflusses für eine (fiktive) Suchanfrage in
einem wissensbasierten Informationssystem für transnationale Konzerne ...................... 142
Abbildung 7.1: Organisationsform des transnationalen Konzerns............................................ 149
Abbildung 7.2: Unternehmensbereiche des transnationalen Konzerns..................................... 149
Abbildung 7.3: Funktionalbereiche des transnationalen Konzerns........................................... 150
ABBILDUNGSVERZEICHNIS
Seite 189
Abbildung 7.4: Standortverteilung eines transnationalen Konzerns ......................................... 150
Abbildung 7.5: Logische Portalstruktur des Informationssystems............................................ 157
Abbildung 7.6: Physikalische Portalstruktur des Informationssystems .................................... 158
Abbildung 7.7: Framework für das Web Interface.................................................................... 158
Abbildung 7.8: Rollenhierarchie des Informationssystems (bzgl. des Benutzers vgarcia)....... 160
Abbildung 7.9: Rollenhierarchie des Informationssystems (bzgl. der Gruppe wbt) ................. 161
Abbildung 7.10: Darstellung einer Informationseinheit im Ansichtsmodus............................. 168
Abbildung 7.11: Gesamte Metainformation (Dialogfenster ’Attributes’)................................. 168
Abbildung 7.12: Bearbeiten der Metadatensätze beim Publizieren von Dokumenten.............. 169
Abbildung 7.13: Anzeige von zwei Hotlines im Portal vmgb’s homepage............................... 171
Abbildung 7.14: Struktur der News Applikation auf dem Hyperwave News Server................ 172
Abbildung 7.15: Allgemeine Darstellung der News Applikation ............................................. 173
Abbildung 7.16: Funktionale Logik der News Aplikation........................................................ 174
Abbildung 7.17: Dialog zum Bearbeiten eines Newsbetrags.................................................... 174
ABBILDUNGSVERZEICHNIS
Seite 190
TABELLENVERZEICHNIS
Seite 191
Tabellenverzeichnis
Tabelle 2.1: Verbesserungen durch Wissensmanagement [IPK 2001] ....................................... 23
Tabelle 3.1: Informations- und Wissensmanagementrollen [Miranda et al. 2000] ..................... 40
Tabelle 4.1: Entwicklungsniveaus bezüglich der (elektronischen) Bearbeitung von Daten,
Information und Wissen in Unternehmen [Lehner et al. 1998].......................................... 48
Tabelle 5.1: Beispiel einer Relation in einer Beziehungsstruktur [Sigel 2000a]......................... 85
Tabelle 5.2: Beispiel einer Relation in einer Beziehungsstruktur [Sigel 2000a]......................... 85
Tabelle 5.3: Übersicht einiger Klassifikationsschemata laut [Koch et al. 1997] ........................ 99
Tabelle 6.1: Fiktives Beispiel für die Analyse einiger Anforderungen an ein wissensbasiertes
Informationssystem für transnationale Konzerne bzgl. der Wirkungsbereiche gemäß dem
grundlegenden Schema..................................................................................................... 129
Tabelle 6.2a: Anforderungsprofil bzgl. des Wirkungsbereichs ’Organisation’ zur iterativen
Lösungsmethode mit Hilfe des funktionalen Schemas..................................................... 139
Tabelle 6.2b: Anforderungsprofil bzgl. des Wirkungsbereichs ’Inhalt & Semantik’ zur iterativen
Lösungsmethode mit Hilfe des funktionalen Schemas..................................................... 140
Tabelle 6.2c: Anforderungsprofil bzgl. des Wirkungsbereichs ’Technik’ zur iterativen
Lösungsmethode mit Hilfe des funktionalen Schemas..................................................... 140
Tabelle 7.1: Definition vom Globalen Metadatensatz für das wissensbasierte
Informationssystem eines transnationalen Konzerns........................................................ 166
TABELLENVERZEICHNIS
Seite 192
LITERATUR- UND QUELLENVERZEICHNIS
Seite 193
Literatur- und Quellenverzeichnis
[Baeza-Yates et al. 1999]
Baeza-Yates R., Ribeiro-Neto B.; Modern Information Retrieval; ACM Press New York.
Addison-Wesley. Harlow, England. 1999.
[Bellinger et al. 2001a]
Bellinger G., Castro D., Mills A.; Data, Information, Knowledge, and Wisdom; Last Update
2002-03-15, Last Visit 2002-03-15, URL http://outsights.com/systems/dikw/dikw.htm
[Bellinger et al. 2001b]
Bellinger G., OutSights; Knowledge Management – Emerging Perspectives; Last Update 200203-15, Last Visit 2002-03-15, URL http://outsights.com/systems/kmgmt/kmgmt.htm
[Bellinger et al. 2001c]
Bellinger G., OutSights; Systems/Understanding the Way; Last Update 2002-03-15, Last Visit
2002-03-15, URL http://www.outsights.com/systems/systems/systems.htm
[Bergermann 1999]
Bergermann U.; Geselligkeitsröhren und Fühlhörner: mein Kunststoff. Briefwechsel, Netzwerk,
Hypertext und ihre Geschlechter am Beispiel der Edition Rahel Levin Varnhagen; Tagung
’Archiv-Edition–Netzwerk’. Hamburg. Eva Lindemann, Barbara Hahn, Ulrike Landfester und
Marianne Schuller. 1999; Last Update 2002-03-15, Last Visit 2002-03-15, URL
http://www.uni-paderborn.de/~bergerma/texte/gesell.html
[Berners-Lee et al. 2001]
Berners-Lee T., Hendler J., Lassila O.; The Semantic Web: A new form of Web content that is
meaningful to computers will unleash a revolution of new possibilities; Scientific American.
Artikel: The Semantic Web. 2001; Last Update 2002-03-15, Last Visit 2002-03-15, URL
http://www.scientificamerican.com/2001/0501issue/0501berners-lee.html
[Bettoni et al. 2001]
Bettoni M., Baschung N., Endress G., Rütti M.; Eine prozeßorientierte Mikro-Logik für
praxisnahe Wissensmanagement-Projekte. Grundlagen und Vorgehensmodell; Workshop:
Geschäftsprozessorientiertes
Wissensmanagement.
WM2001
Professionelles
Wissensmanagement: Erfahrungen und Visionen; Baden-Baden; 2001; Last Update 2002-06-13,
Last Visit 2002-06-13, URL http://www.ikm-lab.ch/repraesentationen/bb2001/Beitrag.html
[Büchel 2000]
Büchel G.;
Datenbank – Systeme – Modellierung; Vortrag zur Fachtagung
Wissensmanagement - Informationsmanagement der Fachhochschule Köln; 2000; Last Update
2002-04-10, Last Visit 2002-04-10, URL http://leuchtturm.fh-koeln.de/buechel.pdf
[Capurro 2000a]
Capurro R.; Wissensmanagement und darüber hinaus; In ’Aufsätze und Vorträge zum Thema
Wissensmanagement’. Digitale Bibliothek; Last Update 2002-06-04, Last Visit
2002-06-04, URL http://v.hbi-stuttgart.de/WM/bausteine.htm
LITERATUR- UND QUELLENVERZEICHNIS
Seite 194
[Capurro 2000b]
Capurro R.; Grundfragen des Wissensmanagements; In ’Aufsätze und Vorträge zum Thema
Wissensmanagement’. Digitale Bibliothek; Last Update 2002-06-10, Last Visit 2002-06-10,
URL http://v.hbi-stuttgart.de/WM/bausteine.htm
[Choo 1998]
Choo C. W.; The Knowing Organization: How Organizations Use Information to Construct
Meaning, Create Knowledge, and Make Decisions.; Oxford University Press, New York. 1998.
[Cover 2000]
Cover R.; The XML Cover Pages: Vocabulary Markup Language (VocML); The XML Cover
Pages: Online Reference Work for XML and SGML. 2000; Last Update 2002-06-10, Last Visit
2002-06-10, URL http://xml.coverpages.org/vocML.html
[Crespo et al. 1998]
Crespo A., Garcia-Molina H.; Archival Storage for Digital Libraries; Third ACM Conference
on Digital Libraries, Pittsburgh, PA, USA. 1998; Last Update 2002-05-15, Last Visit
2002-05-15, URL http://dbpubs.stanford.edu:8090/pub/1998-49/de
[Daniel et al. 1997]
Daniel R., Lagoze C.; Extending the Warwick Framework: From Metadata Containers to Active
Digital Objects; D-Lib Magazine. 1997; Last Update 2002-07-02, Last Visit 2002-07-02, URL
http://www.dlib.org/dlib/november97/daniel/11daniel.html
[Davis et al. 1993]
Davis G. B., Hamilton S.; Managing Information; Business One Irwin, Homewood, pp 22, 1993
[Davenport et al. 1997a]
Davenport T. H., Prusak L.; Working Knowledge: How Organizations Manage What They
Know; Harvard Business School Press, USA, 1997
[Davenport et al. 1997b]
Davenport T. H., Long D. W. D., Beers M.C.; Building Successful Knowledge Management
Projects; Working Paper, Ernst & Young Center for Business Innovation, Jan. 1997
[Dietinger et al. 1999]
Dietinger T., Guetl C., Maurer H., Pivec M.; Targeted Information Retrieval; Vorgestellt bei
ICCE99 und Proc. ICCE99, Chiba, Japan. IOS Press, Amsterdam. Vol. II. P.p. 355-358.
1999;Last Update 2002-07-13, Last Visit 2002-07-13,
URL http://www2.iicm.edu/cguetl/papers/targetedinformationretrieval
[Disterer 2001]
Disterer G.; Individual and Social Barriers to Knowledge Transfer; In Proceedings of 34th
Hawaii International Conference on System Sciences – HICSS. 2001
[Drucker 1978]
Drucker P.; The Age of Discontinuity; New York, 1978
[Duval 2001]
Duval E.; Metadatas Standards: What, Who & Why; Journal of Universal Computer Science,
vol. 7, no. 7. P.p. 591-601. Springer Pub. Co. 2001; Last Update 2002-06-13, Last Visit
2002-06-13, URL http://www.jucs.org/jucs_7_7/metadata_standards_what_who
LITERATUR- UND QUELLENVERZEICHNIS
Seite 195
[Easterbrook 1998]
Easterbrook S.; Category Theory for Beginners; Einführung in ‘Category Theory for Software
Engineers’. Department of Computer Science, University of Toronto. 1998; Last Update
2002-08-02, Last Visit 2002-08-02, URL http://www.cs.toronto.edu
[Encarta 2002]
Encarta: World English Dictionary; Online-Wörterbuch. Encarta, North American Edition,
2002; Last Update 2002-08-02, Last Visit 2002-08-02, URL http://encarta.msn.com
[Eppler 2002]
Eppler M.; Knowledge Mapping: Eine Einführung in die Techniken der Wissensvisualisierung;
Präsentation in der Arbeitsgemeinschaft Wissensmanagement Kaiserslautern. Universität
Kaiserslautern, Deutschland, 2002; Last Update 2002-07-13, Last Visit 2002-07-13, URL
http://www.cck.uni-kl.de/wmk/papers/public/KnowledgeMapping
[Fillies et al. 2001]
Fillies C., Weichhardt F., Koch-Süwer G.; Prozessmodellierungswerkzeuge und das Semantic
Web; 1. Konferenz ’Professionelles Wissensmanagement Erfahrungen und Visionen’;
Baden-Baden, 2001; Last Update 2002-08-13, Last Visit 2002-08-13, URL
http://www.semtalk.com/pub/WM2001.htm
[Forst 1999]
Forst A.; Information und Wissen (Teil 1): Die neuen betrieblichen Ressourcen; Doculine
News, 1999
[Fuhr 1999]
Fuhr N.; Information Retrieval; Unterlagen zur Lehrveranstaltung Information Retrieval an der
Universität Dortmund, 1998; Last Update 2002-05-13, Last Visit 2002-05-13,
URL http://ls6-www.informatik.uni-dortmund.de/ir/teaching/courses/ir
[Flynn 2001]
Flynn P.; The XML FAQ; Frequently Asked Questions über XML (Extensible Markup
Language). In Zusammenarbeit mit der ’ WWW Consortium's XML Special Interest’ Gruppe.
v2.1. 2001; Last Update 2002-08-06, Last Visit 2002-08-06, URL http://www.ucc.ie/xml
[García-Barrios 2001]
Garcia-Barrios V.M.; Improved Knowledge Acquisition from the Internet. An approach to a
dynamic solution for web based learning systems; Seminar am Institut für
Informationsverarveitung und computergestützte neue Medien - IICM – Technische Universität
Graz, Österreich, 2001; Last Update 2002-06-13, Last Visit 2002-06-13, URL
http://www2.iicm.edu/cguetl/education/projects/vgarcia
[Garfield 1984]
Garfield E.; A Tribute to S.R. Ranganathan, the Father of Indian Library Science; Essays of an
Information Scientist. Vol 7. 1984. P.p.37-44; Last Update 2002-08-13, Last Visit 2002-08-13,
URL http://www.garfield.library.upenn.edu/essays/v7p037y1984.pdf
[Ginsburg 2000]
Ginsburg M.; Intranet Document Management Systems as Knowledge Ecologies; Proceedings
in 33. Hawaii International Conference on System Sciences. Hawaii, USA, 2000
LITERATUR- UND QUELLENVERZEICHNIS
Seite 196
[Godbout 1998]
Godbout A. J.; Filtering Knowledge: Changing Information into Knowledge Assets; Technical
Report 9867, Godbout Martin Godbout & ass. 1998
[Gödert 2001]
Gödert W.; Semantik und Strukturierung von Wissen (Gedanken über Gedanken über die die
Verbindung zum Verbindung zum Wissensmanagement); Fachhochschule Köln, Fachbereich
Bibliotheks- und Informationswesen, 2001
[Grosse 1996]
Grosse A. G.; Adaptives Informationsmanagement in vernetzten Systemen; Interner Bericht
36/96 der Klausurtagung „Forschungs- und Arbeitsgebiete des Instituts für Telematik“ in
Rothenburg,
Deutschland.
Fakultät
für
Informatik,
Universität
Karlsruhe,
Kapitel 9. 1996; Last Update 2002-08-04, Last Visit 2002-08-04, URL
http://www.telematik.informatik.uni-karlsruhe.de/forschung/klung96/klung96.html
[Guetl 2000]
Guetl Ch.; Knowledge Management; Course material for the lecture „Knowledge
Management”, Technological University of Graz, Austria; Last Update 2002-06-15, Last Visit
2002-06-15, URL http://wbt-2.iicm.edu/wbt/v1/core/app/hwt/mod/ip
[Harmelen et al. 1999]
van Harmelen F., Fensel D.; Practical Knowledge Representation for the Web; Paper aus dem
Workshop on Intelligent Information Integration IJCAI’99, 1999; Last Update 2002-03-13, Last
Visit 2002-03-13, URL http://www.cs.vu.nl/~frankh/postscript/IJCAI99-III.pdf
[Haub 1999]
Haub H.; Aspects of Access Management in Heterogeneous Distributed Object Systems;
Diplomarbeit aus Telematik an der Technischen Universität Graz - Institut für
Informationsverarbeitung und Computergestützte neue Medien (IICM), 1999; Last Update
2002-05-13, Last Visit 2002-05-13, URL http://www.iicm.edu/thesis/hhaub.pdf
[Heber 2000]
Heber J.; Knowledge Discovery: Broker-Entwicklungsarbeiten für das xFIND-Suchsystem;
Diplomarbeit an der Technischen Universität Graz, 2000; Last Update 2002-07-13, Last Visit
2002-07-13, URL http://www.iicm.edu
[Helic et al. 2001]
Helic D., Maurer H., Scerbakov N.; Knowledge Domains: A Global Structuring Mechanism for
Learning Resources in WBT Systems; Proceedings WebNet 2001. AACE - Charlottesville,
USA, P.p. 509-514, 2001; Last Update 2002-07-13, Last Visit 2002-07-13,
URL http://www.iicm.edu/hmaurer/publications/by_date/2001
[Hodge 2000a]
Hodge G.; Taxonomy of Knowledge Organization Sources/Systems; The Digital Library
Federation Council on Library and Information Resources. USA, 2000; Last Update
2002-08-10, Last Visit 2002-08-10, URL http://nkos.slis.kent.edu/KOS_taxonomy.htm
[Hotho et al. 2001]
Hotho A., Maedche A., Staab S., Studer R.; SEAL-II — The Soft Spot between Richly
Structured and Unstructured Knowledge,2001; Last Update 2002-08-01, Last Visit 2002-08-01,
URL http://citeseer.nj.nec.com/442994.html
LITERATUR- UND QUELLENVERZEICHNIS
Seite 197
[Hribernik et al. 1999]
Hribernik B., Sammer M.; Organisation und Wissensvernetzung im Bereich Forschung und
Entwicklung der Böhler Uddeholm AG; Vortragsbericht des Instituts für Wirtschafts- und
Betriebswissenschaften an der Monanuniversität Leoben für das WM Forum Graz,
1999;
Last
Update
2002-07-13,
Last
Visit
2002-07-13,
URL
www.cis.tu-graz.ac.at/wissensmanagement/events-beitraege/dokumente/1999-11-04-boehler.pdf
[Huang 1998]
Huang K.-T.; Capitalizing on intellectual assets; IBM Systems Journal. 37(4) p.p. 570–583.
1998
[Huber 1998]
Huber H.; Document research based on collaborative provided structural knowledge;
In ‘PAKM 98’ Practical Aspects of Knowledge Management; Proceedings
der
Second
International
Conference.
Zurich,
Sschweiz,
P.p.
11/1-10,
1998;
Last
Update
2002-07-13,
Last
Visit
2002-07-13,
URL
http://sunsite.informatik.rwth-aachen.de/Publications/CEUR-WS/Vol-13
[Hyperwave 2001a]
HIS Administrator Guide; Hyperwave Information Server, Version 5.5. Document Version HISV5.5-1.0; Hyperwave AG, München, Deutschland, 2001; Last Update 2002-08-06, Last Visit
2002-08-06, URL http://www.hyperwave.com
[Hyperwave 2001b]
HIS Programmer´s Guide; Hyperwave Information Server, Version 5.5. Document Version
HIS-V5.5-1.0; Hyperwave AG, München, Deutschland, 2001; Last Update 2002-06-13, Last
Visit 2002-06-13, URL http://www.hyperwave.com
[Hyperwave 2001c]
HIS User´s Guide; Hyperwave Information Server, Version 5.5. Document Version HIS-V5.51.0. Hyperwave AG; München, Deutschland, 2001; Last Update 2002-08-02, Last Visit 200208-02, URL http://www.hyperwave.com
[Hyperwave 2002a]
Hyperwave Document Management Solutions ; Broschüre zu Document Management mit dem
Hyperwave Information Server; Hyperwave AG, München, Deutschland, 2002; Last Update
2002-07-13, Last Visit 2002-07-13, URL http://www.hyperwave.com
[Hyperwave 2002b]
Hyperwave Content Management Solutions ; Broschüre zu Content Management mit dem
Hyperwave Information Server. Hyperwave AG; München, Deutschland, 2002; Last Update
2002-06-13, Last Visit 2002-06-13, URL http://www.hyperwave.com
[Hyperwave 2002c]
Hyperwave eKnowledge Portal; Broschüre: Die Portallösung für erfolgreiche Teamarbeit mit
dem Hyperwave Information Server; Hyperwave AG, München, Deutschland, 2002; Last
Update 2002-07-16, Last Visit 2002-07-16, URL http://www.hyperwave.com
[Ianella 1995]
Iannella R.; Internet Resource Discovery Issues; Research Data Network CRC. Universität in
Queensland, Australien, 1995; Last Update 2002-08-03, Last Visit 2002-08-03, URL
http://archive.dstc.edu.au/RDU/reports/QuestNet95.html
LITERATUR- UND QUELLENVERZEICHNIS
Seite 198
[IPK 2001]
Fraunhofer - Institut für Produktionsanlagen und Konstruktionstechnik; Berlin, 1999;
Last
Update
2002-08-23,
Last
Visit
2002-08-23,
URL
http://www.um.ipk.fhg.de/ccwm/benefit/benefit.htm
[ISO-TM 1999]
ISO/IEC 13250 Topic Maps; Information Technology - Document Description and Processing
Languages, 1999; Last Update 2002-08-13, Last Visit 2002-08-13, URL
http://www.y12.doe.gov/sgml/sc34/document/0129.pdf
[Jain et al. 1999]
Jain A., Murty M., Flynn P.; Data Clustering: A Review; ACM Computing Surveys. Vol. 31.
Nr.
3.
1999;
Last
Update
2002-06-23,
Last
Visit
2002-06-23,
URL
http://www.isi.uu.nl/TGV/jain.pdf
[Janko 2001]
Janko W.; Informationswirtschaft 2: Informationswirtschaft im Unternehmen; Unterlagen zu
Lehrveranstaltung ’Informationsmanagement in Organisationen I+II’. Wirtschaftsuniversität
Wien, Österreich, Kap. 1.9 – 1.10. 2001; Last Update 2002-07-13, Last Visit 2002-07-13, URL
http://wwwai.wu-wien.ac.at/unterlagen/informationswirtschaft2.pdf
[Kappe 2001]
Kappe F.; Hyperwave Information Server: Technical White Paper; Technisches White Paper.
Version 1.5. Januar 2001; Last Update 2002-08-13, Last Visit 2002-08-13, URL
http://www.hyperwave.com
[Kerssens et al. 1996]
Kerssens-Van Drongelen I. C., de Weerd-Nederhof P.C., Fisscher O.A.M.; Describing the
issues of knowledge management in R&D: Towards a communication and analysis tool; R & D
Management, 26(3) p.p. 213–230, 1996
[Knögler 1999]
Knögler B.; Wissensauffindung in verteilten Systemen: Lokale Suchmaschine und
Informationsaufbereitung für externe Suchdienste; Diplomarbeit am Institut für
Informationsverarbeitung
und Computergestützte neue Medien. Technische Universität
Graz, 1999; Last Update 2002-08-17, Last Visit 2002-08-17, URL http://www.iicm.edu
[Koch et al. 1997]
Koch T., Brümmer A., Hiom D., Peereboom M., Poulter A., Worsfold E.; The role of
classification schemes in Internet resource description and discovery; Spezifikation für
’resource description methods’ Part 3. v3.2. Projekt DESIRE - Development of a European
Service for Information on Research and Education, Sweden, 1997; Last Update 2002-08-13,
Last Visit 2002-08-13, URL http://www.ukoln.ac.uk/metadata/desire/classification/
[Krcmar 2000]
Krcmar H.; Management der Daten; Informationsmanagement an der Universität Hohenheim,
Lehrstuhl f. Wirtschaftsinformatik, 2000; Last Update 2002-07-13, Last Visit 2002-07-13, URL
http://domino.bwl.unihohenheim.de/winfobase/wb_material.nsf/aed0ef780a05b735c125692300
30a076/43b90f6b2a1b6e06c1256acb0034e3ba/$FILE/Le5.pdf
LITERATUR- UND QUELLENVERZEICHNIS
Seite 199
[Krottmaier et al. 2001]
Krottmaier H., Maurer H. ; Transclusions in the 21st Century; Journal of Universal Computer
Science, vol. 7, no. 12 (2001). P.p. 1125-1136; (Submitted: 15/10/01, accepted: 7/12/01,
appeared: 28/12/01 . Springer Pub. Co.). Österreich, 2001
[Küng 1999]
Küng M.; Was ist Informationsmanagement?; Last Update 2002-06-18, Last Visit 2002-06-18,
URL http://www.mgfk.ch/im/
[Kyriakov et al. 2001]
Kyriakov A., Dimitrov M., Simov K.; OntoMap – the Guide to the Upper-Level; International
Semantic Web Working Symposium (SWWS) - Infrastructure and Applications for the
Semantic Web. Stanford University, California, USA, 2001; Last Update 2002-06-13, Last Visit
2002-06-13, URL http://www.semanticweb.org/SWWS/program/full/paper35.pdf
[Lacher et al. 2001]
Lacher M., Groh G.; Facilitating the exchange of explicit knowledge through ontology
mappings; Proceedings of 14th International FLAIRS Conference. AAAI Press. P.p.305-309.
2001;
Last
Update
2002-07-29,
Last
Visit
2002-07-29,
URL
http://citeseer.nj.nec.com/lacher01facilitating.html
[Lamport 2002]
Lamport L. ; Leslie Lamport Homepage, 2002 ; Last Update
Visit 2002-08-11, URL http://research.microsoft.com/users/lamport/
2002-08-11,
Last
[Lehmann 1995]
Lehmann H.; Investigating A Generic Architecture For International Information Systems;
Paper aus den “Sessions of the Association for Information Systems” – Americas Conference on
Information Systems / Session MRIP-2: International Information Systems, 1995; Last Update
2002-08-08, Last Visit 2002-08-08, URL http://hsb.baylor.edu/ramsower/acis/sessions.htm
[Lehner et al. 1998]
Lehner F., Maier R., Klosa O.; Organisational Memory Systems - Application of Advanced
Database
&
Network
Technologies
in
Organisations;
Proceedings
of
the 2nd International Conference on Practical Aspects of Knowledge Management (PAKM98),
Schweiz,
1998;
Last
Update
2002-08-13,
Last
Visit
2002-08-13,
URL
http://sunsite.informatik.rwth-aachen.de/Publications/CEUR-WS/Vol-13
[Liebotz 1998]
Liebowitz J.; Expert systems: An integral part of knowledge management; Kybernetes, 27(2)
p.p.170–175. 1998
[LOM-IEEE 1999]
IEEE Learning Technology Standards Committee (LTSC): Learning Object Metadata; Working
Draft Document 3 (Approved 1999-11-27); Last Update 2002-07-17, Last Visit 2002-07-17,
URL http://ltsc.ieee.org/doc/wg12/LOM-WD3.htm
[Lotus 1999]
Lotus Development Corporation 3/99, Knowledge Management White Paper, 1999; Last
Update 2002-08-13, Last Visit 2002-08-13, URL http://www.lotus.com
LITERATUR- UND QUELLENVERZEICHNIS
Seite 200
[Lotus 2001]
Knowledge Management in Action. Three Scenarios; White Paper von Lotus Development
Corporation, IBM – Lotus, 2001
[Macintosh et al. 1998]
Macintosh A., Filby I., Tate A.; Knowledge Asset Road Maps; Proceedings of 2nd International
Conference on Practical Aspects of Knowledge Management - (PAKM98). Basel, Schweiz,
1998;
Last
Update
2002-08-02,
Last
Visit
2002-08-02,
URL
http://www.aiai.ed.ac.uk/~oplan/documents/1998/98-pakm98-roadmaps.pdf
[Maedche et al. 2001]
Maedche A., Staab S., Stojanovic N., Studer R., Sure Y.; Semantic portals – The SEAL
approach; Publikation der Universität Karlsruhe, 2001; Last Update 2002-08-13, Last Visit
2002-08-13, URL http://citeseer.nj.nec.com/maedche01semantic.html
[Maier et al. 2000a]
Maier R., Lehner F.; Perspectives on Knowledge Management Systems Theoretical Framework
and Design of an Empirical Study; Proceedings of 8th European Conference on Information
Systems, Vienna University of Economics and Business Administration, Österreich, 2000
[Maier et al. 2000b]
Maier R., Klosa O.; Wissensmanagementsysteme; Online-Marktübersicht zum
Forschungsbericht Nr. 36 – Stand Februar 2000. Universität Regensburg, Deutschland, 2000;
Last Update 2002-07-13, Last Visit 2002-07-13, URL http://www-wi.uni-regensburg.de
[Maier et al. 2001]
Maier R., Remus U.; Towards a Framework for Knowledge Management Strategies: Process
Orientation as Strategic Starting Point; Proceedings of the Hawai'i International Conference On
System Sciences, Maui, Hawaii, 2001
[Maurer 1999]
The Heart of the Problem: Knowledge Management and Knowledge Transfer; In Proceedings of
the conference Enable99: Enabling network-based learning. Helsinki, Finnland, 1999; Last
Update 2002-08-05, Last Visit 2002-08-05, URL http://www.enable.evitech.fi/enable99
[Maurer et al. 2001]
Maurer H., Tochtermann K.; Vier Komponenten des informationstechnischen
Wissensmanagements: Unternehmensgedächtnisse, Wissensretrieval, Wissenstransfer und
Wissensvisualisierung und Wissensmanagement und Kreativität; Bericht. Management von
nicht-explizitem Wissen: Noch mehr von der Natur lernen, Teil 3, FAW Ulm, P.p. 83-100.
2001;
Last
Update
2002-07-23,
Last
Visit
2002-07-23,
URL
http://www.iicm.edu/iicm_papers/vier_komponenten_wissensmanagement
[Miranda et al. 2000]
Miranda G. F., Ginestet J., Burr J., Timmermans J.; Information manager and Knowledge
manager: two jobs one role?; Poster session Nr. 38 in “Proceedings of 8th Conference ICML
2000”, International Conference on Medical Librarianship, London, 2000; Last Update
2002-08-13, Last Visit 2002-08-13, URL http://www.icml.org/posters/post38/poster38.htm
[Moore 2001]
Moore G.; RDF and TopicMaps: An Exercise in Convergence; In ‘XML Europe 2001’. Berlin,
Deutschland, 2001; Last Update 2002-08-13, Last Visit 2002-08-13,
URL
http://www.topicmaps.com/topicmapsrdf.pdf
LITERATUR- UND QUELLENVERZEICHNIS
Seite 201
[Mullender 1989]
Mullender S.; Distributed Systems; ACM Press, New York, Addison Wesley, Kapitel
1,2,13,14,15,20. 1989
[Mullender 1993]
Mullender S.; Distributed Systems, Second Edition; ACM Press, New York, Addison Wesley,
Kapitel 1-3,7,8. 1993
[Nanfito 1996]
Nanfito M.; Intranets are not for the Unwary...; White Paper in Bridge Information Systems,
1996;
Last
Update
2002-06-22,
Last
Visit
2002-06-22,
URL
http://www.bridgeinfo.com/intrnet2.htm
[NetAcademy 1999]
NetAcademy Glossar; Froschungsplattform für die “world-wide Scientific Community”,
veranstaltet am “Institute for Media and Communications Management”, Universität St. Gallen,
Schweiz, Dokumentversion 2.0. Entwurf, 1999; Last Update 2002-07-13, Last Visit
2002-07-13, URL http://www.netacademy.org.
[Neumann et al. 1998]
Neumann S., Flügge B., Finerty T.; The Art of Knowledge - Potential aus dem Wissen
schöpfen; IM Information Management, 13(1) p.p. 66–74. 1998
[Nonaka et al. 1995]
Nonaka I., Takeuchi H.; The Knowledge-Creating Company: How Japanese Companies Create
the Dynamics of Innovation; Oxford University Press, New York, Oxford, 1995
[Novak 2002]
Novak J.; The Theory Underlying Concept Maps and How To Construct Them; IHMC Concept Map Software; Last Update 2002-07-30, Last Visit 2002-07-30, URL
http://cmap.coginst.uwf.edu/info
[O’Leary 1998]
O’Leary D. E.; Enterprise knowledge management; Computer, 31(3) p.p. 54–61. März 1998
[Oracle 2002a]
Oracle9i Database Administrator's Guide; Part VI – Distributed Database Management;
Chapter 28 - Distributed Database Concepts; Release 1 (9.0.1), Part Number A90117-01. 2002;
Last
Update
2002-07-26,
Last
Visit
2002-07-26,
URL
http://download-west.oracle.com/otndoc/oracle9i/901_doc/server.901/a90117/ds_conce.htm
[Oracle8i 1999]
(Primary Authors: Leverenz L., Rehfield D., Baird C.); Oracle 8i – Concepts; Oracle
Documentation, Part No. A76965-01, Release 2 (8.1.6). 1999; Last Update 2002-08-13, Last
Visit 2002-08-13, URL http://technet.oracle.com
[Pepper 2000]
Pepper S.; The TAO of Topic Maps: Finding the Way in the Age of Infoglut; In Proccedings of
’XML Europe 2000’. Paris, Frakreich, 2000; Last Update 2002-08-29, Last Visit 2002-08-29,
URL http://www.gca.org/papers/xmleurope2000
LITERATUR- UND QUELLENVERZEICHNIS
Seite 202
[Pralle 1999]
Pralle H.; Architektur und Organisation verteilter Systeme; Universität Hannover, Deutschland,
1999;
Last
Update
2002-08-13,
Last
Visit
2002-08-13,
URL
http://www.rvs.uni-hannover.de/lehre/vs/Teil2_RVS_II_WS01_02.pdf
[Probst et al. 1999]
Probst G., Raub S., Romhardt K.; Wissen managen: Wie Unternehmen ihre wertvollste
Ressource optimal nutzen; FAZ Verlag, Gabler Th., Frankfurt am Main, Wiesbaden, 3. Auflage,
1999
[Rabinovich et al. 1996]
Rabinovich M., Gehani N. H., Kononov A.; Scalable Update Propagation in Epidemic
Replicated Databases; In Proceedings of the Fifth International Conference on Extending
Database Technology (EDBT), Avignon, 1996; Last Update 2002-07-13, Last Visit
2002-07-13, URL http://citeseer.nj.nec.com/rabinovich95scalable.html
[Rath 1999]
Rath H. ; Technical Issues on Topic Maps; MetaStructures 1999. GCA (Greaphic
Communications Associations). Motreal, Kanada, 1999; Last Update 2002-08-14, Last Visit
2002-08-14, URL http://www.topicmap.com/resources.html
[Reihlen 1996]
Reihlen M.; The Logic of Heterarchies: Making Organizations Competitive for Knowledgebased Competition; Arbeitsbericht Nr.91 für die „II CEMS Academic Conference“ in Universitá
Bocconi, Mailand, Italien, 1996; Last Update 2002-07-13, Last Visit 2002-07-13, URL
http://www.uni-koeln.de/wiso-fak/planung/download/arbb-91.pdf
[Reinmann 2001]
Reinmann-Rothmeier, G.; Wissen managen: das Münchener Modell; Hintergrundbeitrag zum
Thema „Eine integrative Sicht auf das Managen von Wissen“ in der Ausgabe 09/10-2001 der
Zeitschrift „wissensmanagement“; Last Update 2002-08-23, Last Visit 2002-08-23, URL
http://www.wissensmanagement.net/online/archiv/2001/09_1001/muenchener_modell.shtml
[Remus et al. 2000]
Remus U., Lehner F.; The Role of Process-oriented Enterprise Modeling in Designing Processoriented Knowledge Mangement Systems; Papers aus dem AAAI Spring Symposium
(http://www.aaai.org), Serie Technical Reports - Bringing Knowledge to Business Processes –
Topic: Methodologies, 2000; Last Update 2002-07-16, Last Visit 2002-07-16, URL
http://aifbhermes.aifb.unikarlsruhe.de/AAAI2000/CameraReady/URemus00.pdf
[Röpnack et al. 1998]
Röpnack A., Schindler M., Schwan T.; Concepts of the enterprise knowledge medium; In
PAKM 98. Practical Aspects of Knowledge Management, Proceedings of the Second
International Conference, Zurich, Switzerland, p.p. 21.1998
[Rollett 2000]
Rollett H.; Aspekte des Wissensmanagements; Diplomarbeit am Institut für
Informationsverarbeitung und Computergestützte neue Medien, Technische Universität Graz,
Austria, 2000
LITERATUR- UND QUELLENVERZEICHNIS
Seite 203
[Rothfuss 2000]
Rothfuss G.; Content Management with XML: Publishing with a Mouse-Click?; Präsentation
der Euro-Prisma International GmbH bei der XML-Site der ’Software AG – Agenda
2000’;
Last
Update
2002-08-19,
Last
Visit
2002-08-19,
URL:
http://www.softwareag.com/xml/presentations
[Scheer et al. 1999]
Scheer A.-W., Markus U.; Knowledge management: Life cycle and implementation techniques;
In W. Abramowicz and M. E. Orlowska, editors, BIS ’99: 3rd International Conference on
Business Information Systems, Pozan, Poland. P.p. 76–85. Springer, London, 1999
[Shiri et al. 2000]
Shiri A. A., Crawford R.; Thesauri on the Web: current developments and trends; Online
Information Review. MCB University Press . ISSN 1468-4527. Vol. 24 . Nr. 4 . pp. 273-279.
2000;
Last
Update
2002-07-13,
Last
Visit
2002-07-13,
URL:
http://personal.dis.strath.ac.uk/people/shiri/thesauri.pdf
[Schmitz 2001]
Schmitz, K.D.; Terminologie und Wissensmanagement: Ontologie; Wissens- und
Informationsmanagement 3. Interdisziplinäre Fachtagung. Institut für Informationsmanagement
(IIM) -Fachhochschule Köln, 2001; Last Update 2002-08-13, Last Visit 2002-08-13, URL
http://leuchtturm.fh-koeln.de/wimpro3.html
[Schwartz et al. 1992]
Schwartz M., Emtage A., Kahle B., Clifford Neuman B.; A Comparison of Internet Resource
Discovery Approaches; omputing Systems, 5(4). 1992; Last Update 2002-08-13, Last Visit
2002-08-13, URL: http://www.codeontheroad.com/papers/RD.Comparison.pdf
[Schwarzmann 1999]
Schwarzmann H.; Hierarchische Benutzerverwaltung unter Hyperwave: System zur
hierarchischen Benutzerverwaltung und Subadministration;Diplomarbeit am Institut für
Informationsverarbeitung und Computergestützte neue Medien, TU Graz – Österreich, 1999
[Seidlitz 2001]
Seidlitz R.; Abgleich von elektronischen Börsenständen zwischen ORACLE Datenbanken in
einem Wide Area Netzwerk; Diplomarbeit am Institut für Informationsverarbeitung und
Computergestützte neue Medien (IICM), Technische Universität Graz – Österreich, 2001
[Sigel 2000]
Sigel A.; Towards knowledge organization with Topic Maps; Veröffentlichung
zur XML – Europe 2000; Last Update 2002-08-13, Last Visit 2002-08-13, URL
http://index.bonn.iz-soz.de/~sigel/veroeff/XML-Europe2000/s22-02.pdf
[Sigel 2001]
Sigel A.; Wissensorganisation: Grundlagen für Wissens- und Bibliotheks- /
Informationsmanager; Skript zum Lehrblock an Donau-Universität Krems, Zentrum für
Informationsmanagement und Technische Dokumentation, 2001
[Sigel et al. 2000]
Sigel A. ; ISKO Arbeitsgruppe Knowledge Organization and Internet; FAQ Dokument von
Alexander Sigel und der Arbeitsgruppe "Knowledge Organization and Internet" der German
Section of the International Society of Knowledge Organization (ISKO), Informationszentrum
Sozialwissenschaften. Deutschland, 2000
LITERATUR- UND QUELLENVERZEICHNIS
Seite 204
[SP 2002]
Strategy Partners; Research and Consultants on IT. Berkshire, England, Since 1996; Last
Update 2002-07-13, Last Visit 2002-07-13, URL http://www.strategy-partners.com
[Stadlmann 1999]
Stadlmann Ch.; Implementierung und Analyse von Progress-Tracking innerhalb eines WebBased-Training-Systems; Diplomarbeit am Institut für Informationsverarbeitung und
Computergestützte neue Medien (IICM), Technische Universität Graz – Österreich, 1999
[Stevenson 1995]
Stevenson, D. A.; Intellectual Capital & EA (Enterprise Architecture); Extract from a paper
presented to the Department of Information Systems, University of Cape Town, 1995
[Studer et al. 2001]
Studer R., Erdmann M., Mädche A., Oppermann H., Schnurr H.-P., Staab S., Sure Y., Tempich
C.; Arbeitsgerechte Bereitstellung von Wissen – Ontologien für das Wissensmanagement
Research Publikation aus Ontoprise (Anbieter von semantischen Technologien und
Anwendungen). Karlsruhe, Deutschland; Last Update 2002-07-30, Last Visit 2002-07-30, URL
http://www.ontoprise.de/download/Ontologien_fuer_das_Wissensmanagement.pdf
[Tanenbaum et al. 1985]
Tanenbaum A.S., van Renesse R.; Distributed Operating Systems; ACM Computing Surveys 17
(4). P.p. 410 – 470, 1985
[Theel et al. 1999]
Theel O., Pizka. M.; Distributed Caching and Replication; Proceedings of the 32nd Hawaii
International Conference on System Sciences, Hawaii, USA, 1999
[Tochtermann et al. 2000]
Tochtermann K., Maurer H.; Umweltinformatik und Wissensmanagement – Ein Überblick;
Tagungsband des 14. Internationalen GI-Symposiums Informatik für den Umweltschutz, Bonn,
Metropolis Verlag. P.p. 462-475. 2000; Last Update 2002-08-13, Last Visit 2002-08-13, URL
http://www.iicm.edu/iicm_papers/umweltinformatik.doc
[Tolen 1999]
Tolen F. A. L.; Knowledge management: A practical approach; Information Services & Use.
19(1) p.p. 57–61. 1999
[Tuomi 1999]
Tuomi I.; Data is more than Knowledge: Implications of the reversed knowledge hierarchy for
knowledge management and organizational memory; Proceedings of the 32nd Annual Hawaii
International Conference on Systems Sciences, HICSS-32, Los Alamitos, Ca, USA, IEEE
Computer Society, 1999
[Umstätter 2000]
Umstätter W.; Wissensorganisation mit Hilfe des semiotischen Thesaurus - auf der Basis von
SGML bzw. XML; In ’Globalisierung und Wissensorganisation: Neue Aspekte für Wissen,
Wissenschaft Und Informationssysteme’. Hrsg.: Ohly, H. P.; Rahmstorf, G. und Sigel, A.. P.p.
237-249. Reihe: ’Fortschritte in der Wissensorganisation’ Bd. 6. Ergon Verlag,
Würzburg, 2000; Last Update 2002-07-13, Last Visit 2002-07-13, URL
http://www.ib.hu-berlin.de/~wumsta/pub113.pdf
LITERATUR- UND QUELLENVERZEICHNIS
Seite 205
[Walker 2001]
WalkerD.; Library Science and Archival Science: Professional Paradigms for Managing Webbased Environments; Final Paper für Projekt IS 200 an der ‘University of California (UCLA)’,
2001;
Last
Update
2002-07-19,
Last
Visit
2002-07-19,
URL
http://skipper.gseis.ucla.edu/students/dwalker/html/projects/projects.htm
[Weitzer 2000]
Weitzer J.; Verwendung von Qualitäts-Metadaten zur verbesserten Wissensauffindung und
Testimplementierung
im
xFIND
System;
Diplomarbeit
am
Institut
für
Informationsverarbeitungund Computergestützte neue Medien. Technische Universität Graz,
2000; Last Update 2002-08-23, Last Visit 2002-08-23, URL http://www.iicm.edu
[Whatis 2002]
whatis.techtarget.com; ’Whatis?com’ ist ein im Bereich der Informationstechnologie
spezialisiertes Wissens-Exploration-Tool und ein Teil von ’TechTarget Network of Enterprise;
IT Web Sites’. Editor: Lowell Thing, 2002; Last Update 2002-07-13, Last Visit 2002-07-13,
URL http://whatis.techtarget.com
[Wiesmann et al. 2000]
Wiesmann M., Pedone F., Schiper A., Kemme B., Alonso G.; Understanding Replication in
Databases and Distributed Systems; In Proccedings of 20th International Conference on
Distributed Computing Systems (ICDCS2000), Taipei, Taiwan, R.O.C. IEEE Computer
Society, P.p. 264-274. 2000; Last Update 2002-08-13, Last Visit 2002-08-13, URL
http://citeseer.nj.nec.com/286185.html
[Wiig 1998]
Wiig K. M.; Perspectives on introducing enterprise knowledge management; In PAKM 98.
Practical Aspects of Knowledge Management. Proceedings of the Second International
Conference, Zurich, Switzerland, 1998
[Wittkewitz 2001]
Wittkewitz J.; Ausgepresst: Automatische Klassifizierung von Dokumenten; iX – Magazin für
Professionelle Informationstechnik. Ausgabe 12 / 2001. P.p. 114 – 118. 2001; Last Update
2002-07-13, Last Visit 2002-07-13, URL http://www.heise.de/ix
[World_Bank 1998]
What is knowledge management?; Hintergrundsdokument zum „World Development Report“;
Eine Liste aller Autoren und Überprüfer wird im letzten Teil „Acknowledgements“ des Berichts
angeführt. World Bank, 1998; Last Update 2002-07-13, Last Visit 2002-07-13, URL
http://www.apqc.org/free/whitepapers/whatiskm.pdf
[Wrede 2000]
Wrede O.; Interface und Knowledge Management; Vortrag bei Fachtagung „Informations- und
Wissensmanagement“ - Fachhochschule Köln, 2000
Herunterladen