Informationsaufbereitung und Wissensorganisation in transnationalen Konzernen Konzeption eines Informationssystems für große und geographisch verteilte Unternehmen mit dem Hyperwave Information System Victor Manuel García Barrios Informationsaufbereitung und Wissensorganisation in transnationalen Konzernen Konzeption eines Informationssystems für große und geographisch verteilte Unternehmen mit dem Hyperwave Information System Diplomarbeit an der Technischen Universität Graz vorgelegt von Victor Manuel García Barrios Institut für Informationsverarbeitung und Computergestützte neue Medien (IICM) Technische Universität Graz A-8010 Graz, Österreich August 2002 © Copyright 2002, Victor Manuel García Barrios Diese Arbeit ist in deutscher Sprache verfaßt. Begutachter: Betreuer: o.Univ-Prof. Dr. Dr.h.c.mult. Hermann Maurer Dipl.-Ing. Christian Gütl Information Enhancing and Knowledge Organisation in Corporate Enterprises Conception of an information system for big and geographically distributed enterprises with the Hyperwave Information System Master’s Thesis at Graz University of Technology submitted by Victor Manuel García Barrios Institute for Information Processing and Computer Supported New Media (IICM) Graz University of Technology A-8010 Graz, Austria August 2002 © Copyright 2002 by Victor Manuel García Barrios This thesis is written in german language. Advisor: Supervisor: o.Univ-Prof. Dr. Dr.h.c.mult. Hermann Maurer Dipl.-Ing. Christian Gütl Kurzfassung Transnationale Konzerne haben einen dringenden Bedarf an einer umfassenden Lösung für ihre Intranetsysteme. Die spezifischen Anforderungen an ein wissensbasiertes Informationssystem sind vielfältig, die kritischsten davon sind aber allgemein gültig und ergeben sich aufgrund der stark vernetzten und geographisch verteilten Struktur des Konzerns. In unterschiedlichen Wissensdisziplinen, insbesondere Wissensmanagement, Informationsmanagement, Datenmanagement und Wissensorganisation, versucht man, oftmals in den einzelnen Disziplinen isoliert, die Erfüllung spezifischer Anforderungen zu implementieren. Nicht selten auf eine ineffektive Weise. Die nachfolgende Arbeit verfolgt deshalb einen ganzheitlichen Ansatz über die Wissensdisziplinen, um den umfangreichen Anforderungen gerecht werden zu können. Im Untersuchungsbereich der vorliegenden Arbeit wird die Problematik aus der Sicht der wichtigsten involvierten Wissensdisziplinen beleuchtet, um nach vorhandenen bzw. etablierten Lösungsansätzen zu suchen. Die spezifischen Einflussbereiche der Disziplinen auf Intranetlösungen werden überprüft und kritischen Aspekten von Anforderungen (beispielsweise ’starke örtliche Verteilung vs. Systemtransparenz’, ’Replikationsmaßnahmen vs. Systemperformanz’ oder ’semantische Wissensmodelle vs. bedarfsgerechten Wissenszugang) gegenübergestellt. Jede Disziplin bietet effiziente und effektive Lösungen für unterschiedliche Aspekte, es konnte jedoch kein umfassendes Gestaltungsmodell, welches die spezifischen Lösungsansätze der Disziplinen vereint, im Rahmen des Rechercheprozesses identifiziert werden. Aufgrund des oben beschriebenen Sachverhalts wird im Gestaltungsbereich dieser Arbeit ein zweiteiliges Technisches Gestaltungsmodell vorgestellt. Es besteht aus einem strategischen Analyseschema und einem funktionalen Komponentenschema, und berücksichtigt die Einflussbereiche oben erwähnter Wissensdisziplinen. Basierend auf der konkreten Anforderung einer Intranetlösung für einen transnationalen - und anonymisiert dargestellten - Konzern, wird das vorgestellte Modell angewandt, und auf Basis des Hyperwave Information Servers die technische Umsetzung eines wissensbasierten Informationssystems, von dem beispielhaft zwei Module näher beschrieben werden, gezeigt. Abstract Corporate Enterprises have an increased demand on extensive solutions for their intranet systems. There are various specific requirements for a knowledge-based information system. However, the most critical of them always arise from the heavily cross-linked and geographically distributed corporate structure. Diverse knowledge centred disciplines, in particular Knowledge Management, Information Management, Data Management and Knowledge Organisation, attempt, often separately, to implement the specific requirements. Often this does not happen in an optimally integrated way. The subsequent thesis follows a hollistic approach to the knowledge centred disciplines in order to meet the extensive requirements. In the theoretical section of this thesis, the above depicted problem will be addressed form the point of view of the distinct disciplines in order to search for given or established solution approaches. The specific scopes of impact of the disciplines will be verified and confronted with the critical aspects of requirements, e.g. ’strong locality distribution vs. system transparency’, ’replication measures vs. system performance’ or ’semantic knowledge models vs. needsdependent knowledge acquisition’. Each discipline offers efficient and effective solution methods for different aspects, but no comprehensive design model, unifying the specific solution approaches of each discipline, could be found within the scope of an investigation process carried out as part of this thesis work. By reason of the above depicted facts, a two-part Technical Design Model will be presented in the practical section of this thesis. The model consists of one strategic analysis schema and one functional components schema, and takes into account the scopes of impact of the above mentioned knowledge centred disciplines. The application of the Technical Design Model will take place according to the concrete requirement to implement an intranet solution for an (anonymous kept) corporate enterprise by means of the Hyperwave Information Server. In order to exemplify the implemented solution, two modules of the concept will be described closer. Ich versichere hiermit, diese Arbeit selbständig verfaßt, andere als die angegebenen Quellen und Hilfsmittel nicht benutzt und mich auch sonst keiner unerlaubten Hilfsmittel bedient zu haben. I hereby certify that the work presented in this thesis is my own and that work performed by others is appropriately cited. Meinen Eltern. A mis padres. Inhaltsverzeichnis 1 Einleitung ................................................................................................................................... 1 1.1 Ausgangssituation und Motivation ..................................................................................... 1 1.2 Transnationale Konzerne .................................................................................................... 2 1.3 Gliederung und Inhalt der Arbeit ........................................................................................ 6 Teil I – UNTERSUCHUNGSBEREICH 2 Wissensmanagement ................................................................................................................ 11 2.1 Allgemeines ...................................................................................................................... 11 2.1.1 Wissen ....................................................................................................................... 11 2.1.2 Intellektuelles Kapital ................................................................................................ 14 2.1.3 Modelle des Wissensmanagements ........................................................................... 15 2.1.4 Wissensmanagement ................................................................................................. 17 2.2 Kritische Aspekte .............................................................................................................. 20 2.2.1 Unternehmensstruktur und Systemarchitektur .......................................................... 21 2.2.2 Projektmanagement und Sichtweisen ........................................................................ 22 2.2.3 Technologien und Modularität .................................................................................. 24 2.2.4 Wissensbausteine ....................................................................................................... 24 2.2.5 Soziale und kulturelle Barrieren ................................................................................ 26 2.3 Schlußbemerkung ............................................................................................................. 27 3 Informationsmanagement ......................................................................................................... 29 3.1 Allgemeines ...................................................................................................................... 29 3.1.1 Informationsmanagement .......................................................................................... 30 3.1.2 Informationssysteme.................................................................................................. 31 3.1.3 Verteilte Systeme....................................................................................................... 31 3.1.4 Internationale Informationssysteme .......................................................................... 32 3.1.5 Systemarchitekturen für transnational tätige Konzerne ............................................. 32 3.1.6 Informationstechnisches Wissensmanagement ......................................................... 33 3.1.7 Intranet....................................................................................................................... 34 3.2 Kritische Aspekte verteilter Informationssysteme ............................................................ 35 3.2.1 Unternehmensweites Informationsmanagement ........................................................ 36 3.2.2 Verteilte Systeme....................................................................................................... 37 3.2.3 Zuverlässigkeit und Systemstabilität ......................................................................... 39 3.2.4 Einflüsse aufgrund starker geographischer Verteilung.............................................. 39 3.3 Schlußbemerkung ............................................................................................................. 40 4 Datenmanagement ................................................................................................................... 43 4.1 Verteilte Datenbanksysteme ............................................................................................. 44 4.1.1 Datenmanagement ..................................................................................................... 44 4.1.2 Datenbanksysteme ..................................................................................................... 44 4.1.3 Verteilte Datenbanksysteme ...................................................................................... 46 4.1.4 Organisationsgedächtnis ............................................................................................ 47 4.2 Datenreplikation................................................................................................................ 49 4.2.1 Allgemeines ............................................................................................................... 49 4.2.2 Replizierende Datenbanken ....................................................................................... 50 4.2.3 Allgemeine Kriterien für Datenreplikation................................................................ 50 4.2.4 Replikation in verteilten Datenbanken und verteilten Systemen ............................... 52 4.2.5 Andere Modelle und Lösungsansätze ........................................................................ 59 4.3 Schlußbemerkung ............................................................................................................. 60 5 Wissensorganisation ................................................................................................................. 63 5.1 Allgemeines ...................................................................................................................... 63 5.1.1 Wissensorganisation .................................................................................................. 64 5.1.2 Document Management und Content Management .................................................. 65 5.1.3 Information Retrieval und Resource Discovery ........................................................ 68 5.1.4 Library Science und Archival Science ...................................................................... 71 5.2 Semantik ........................................................................................................................... 73 5.2.1 Semantic Web ............................................................................................................ 75 5.2.2 Metadaten .................................................................................................................. 76 5.2.3 Ontologien ................................................................................................................. 79 5.2.4 Inhaltserschließung und Inhaltsanalyse ..................................................................... 81 5.3 Organisationssysteme ....................................................................................................... 81 5.3.1 Typen von Organisationssystemen ............................................................................ 82 5.3.2 Begriffslisten ............................................................................................................. 84 5.3.3 Beziehungsstrukturen ................................................................................................ 84 5.3.4 Themenhierarchien .................................................................................................... 88 5.3.5 Clustering .................................................................................................................. 94 5.3.6 Beispiele aus der Praxis ............................................................................................. 96 5.4 Sichtweisen ..................................................................................................................... 100 5.4.1 Modellierung ........................................................................................................... 100 5.4.2 Knowledge Mapping ............................................................................................... 102 5.4.3 Concept Maps .......................................................................................................... 103 5.4.4 Topic Maps .............................................................................................................. 104 5.4.5 Andere Modelle ....................................................................................................... 107 5.4.6 Mehrdimensionale Ansätze ..................................................................................... 108 5.5 Schlußbemerkung ........................................................................................................... 110 Teil II – GESTALTUNGSBEREICH 6 Lösungsvorschlag ................................................................................................................... 115 6.1 Grundanalyse zur Konzeption eines allgemeinen Lösungsmodells ................................ 116 6.1.1 Wirkungsbereiche der Analyse ................................................................................ 116 6.1.2 Arbeitsmodell zur allgemeinen Sichtweise der Lösung .......................................... 120 6.1.3 Informationsfluß ...................................................................................................... 122 6.1.4 Spezielle Sichtweisen des Informationssystems ...................................................... 124 6.2 Technisches Gestaltungsmodell zur Konzeption eines wissensbasierten Informationssystems ............................................................................................................. 126 6.2.1 Teil 1 - Grundlegendes Schema............................................................................... 128 6.2.2 Teil 2 - Funktionales Schema .................................................................................. 130 6.2.3 Anforderungen eines transnationalen Konzerns an ein wissensbasiertes Informationssystem .......................................................................................................... 133 6.2.4 Anfoderungsprofil für eine iterative Lösungsmethode ............................................ 138 6.3 Zusammenfassung .......................................................................................................... 143 7 Implementierung des Systems ................................................................................................ 144 7.1 Hyperwave Information Server....................................................................................... 144 7.2 Allgemeine Problembeschreibung .................................................................................. 148 7.2.1 Beschreibung des Konzerns..................................................................................... 148 7.2.2 Auflistung kritischer Aspekte .................................................................................. 151 7.3 Technische Implementierung .......................................................................................... 154 7.3.1 Allgemeine Lösung ................................................................................................. 155 7.3.2 Modul 1 - Metadatensätze ....................................................................................... 164 7.3.3 Modul 2 - News Applikation ................................................................................... 170 7.4 Zusammenfassung .......................................................................................................... 177 8 Zusammenfassung und Ausblick ........................................................................................... 179 Teil III - ANHANG UND VERZEICHNISSE Anhang ...................................................................................................................................... 185 Abbildungsverzeichnis .............................................................................................................. 187 Tabellenverzeichnis................................................................................................................... 191 Literatur- und Quellenverzeichnis ............................................................................................. 193 Kapitel 1 - EINLEITUNG Seite 1 Kapitel 1 Einleitung „Zweifel ist der Schlüssel zum Wissen..“ Spruch aus dem Iran. 1.1 Ausgangssituation und Motivation Die Web Applications Group (WAG), eine Forschungs- und Entwicklungsgruppe des Instituts für Informationsverarbeitung und Computergestützte neue Medien (IICM) an der Technischen Universität Graz, Österreich, beschäftigt sich, unter anderem, mit der Entwicklung von Knowledge Management Systemlösungen, insbesondere für das Hyperwave Information System [Hyperwave 2001a]. Die Durchführung der vorliegenden Diplomarbeit entstand aus der konkreten Anforderung einer Intranetlösung für einen weltweit operierenden technischen Konzern. Die Tatsache, dass Wissen die bedeutendste Quelle der Wertschöpfung in modernen Organisationen darstellt, wird heutzutage praktisch überall anerkannt. Das schnelle Wachstum und die steigende gemeinsame Nutzung von Wissen, sowie die Virtualisierung von Unternehmen und die neuen Möglichkeiten der Informationstechnologie zwingen Konzerne immer wieder dazu, eine systematische und aktive Verwaltung der Ressource Wissen festzulegen. Dies geschieht in der Regel durch Mechanismen, welche die Modellierung der funktionalen und strukturellen Merkmale des Konzerns sowie deren Abbildung auf das Informationssystem erlauben. Die Suche nach geeigneten Technologien, welche diese Mechanismen unterstützen, ist eine der zu lösenden Aufgaben der vorliegenden Arbeit. Eine weitere Herausforderung bei der Gestaltung eines wissensbasierten Informationssystems für transnationale Konzerne liegt in der starken Verteiltheit der Information auf geographisch unterschiedliche Standorte, sowie in der verteilten Administration. Verteilte Systeme setzen nicht nur rein technische Lösungen voraus, die mit der Funktionalität und Stabilität des gesamten Informationssystems abhängen, sie bedürfen ebenfalls einer genau zu planenden Strategie für die allgemeine Verwaltung von Wissenseinheiten d.h. für ihre effiziente Aufbereitung in Zusammenhang mit strukturellen, funktionalen, organisatorischen und zweckgebundenen Unternehmensaspekten. Weiters sollte das Informationssystem in der Lage sein, Wissenseinheiten semantisch zu verwalten. Aus diesem Grund stellen eine geeignete Themenhierarchie, die Verwendung von geeigneten Metastrukturen sowie der Zugang zu den Informationseinheiten über unterschiedliche Sichtweisen optimale Lösungswege für die Wissensverwaltung und für die semantische Wiederauffindung von Information dar. Die Themenhierarchie repräsentiert die semantische Abbildung der unterschiedlichen Unternehmensbereiche, Geschäftsprozesse und Wissenseinheiten in einem Konzern über fachspezifische und einheitlich gehaltene Vokabulare. Zusatzinformationen (Metadaten) können für die semantische Verarbeitung von Inhalten und Dokumenten verwendet werden. Unterschiedliche Sichtweisen des Systems können beispielsweise durch das Zusammenwirken von Wissenslandkarten, Benutzerrollenverwaltung und Klassifikationsschemata realisiert werden. In Bezug auf Metadaten und Themenhierarchien sind vorzugsweise etablierte Modellansätze zu verwenden, die eine ausbaufähige, standardisierte Lösung bieten. Die Benutzung bzw. Kapitel 1 - EINLEITUNG Seite 2 Einbindung von Standards in der Implementierung des Informationssystems stellen eine langfristige, integrationsfähige, wiederverwendbare, und somit kosteneffizientere Möglichkeit zur Verfügung, um das System zu erweitern oder zu verbessern. Die Untersuchung diverser Möglichkeiten, welche für transnationale Konzerne eine effiziente Lösung für die Verwaltung von Metadaten und Themenhierarchien anbieten, stellt ein weiteres Anliegen des Untersuchungsbereichs der vorliegenden Arbeit dar. Eine Intranetlösung für transnationale Konzerne sollte auch diverse Profile von Benutzern unterstützen, um ihnen dementsprechend eine personalisierte bzw. bedarfsgerechte Sichtweise auf das Informationssystem zu liefern. In dieser Beziehung ist die statisch oder dynamisch erzeugte, transparente Inhaltspräsentation gemeint. Eine unternehmensweite, konsistente Benutzerverwaltung über die stark verteilte Architektur des Systems sollte also mit einer effektiven Dokumentenverwaltung harmonieren. Weiters stellt die geographische Komponente (d.h. der kritische Aspekt aufgrund weltweit verteilter Standorte) in Hinblick auf Netzwerktechnologien und –topologien einen großen Einflußfaktor dar. Gemeinsam mit einem effizienten Informationszugang und einer optimalen Wissensverwaltung könnte man die Möglichkeit der Datenreplikation in Betracht ziehen (falls zum Beispiel die lokalen Gegebenheiten eines Unternehmensbereichs keinen ’schnellen’ Datentransfer für große oder zeitkritische Dokumente erlauben). Hierbei spielen nicht nur die technischen Lösungsaspekte von Replikationsmechanismen, sondern auch die strategischen Entscheidungskriterien eine wichtige Rolle. Ein Mechanismus zur effizienten Aktualisierung und Synchronisation von Replikaten soll derart erarbeitet werden, dass die Konsistenz, Fehlertoleranz und Performanz des Speichersystems optimiert werden. Es bleibt somit die Frage offen, welche Replikationsmechanismen für das Informationssystem eines transnationalen Konzerns am besten geeignet sind, und warum. Die oben erwähnten Problembereiche stellen einige der immens wichtigen Aspekte dar, die beim Erstellen eines Intranetkonzeptes für große und geographisch verteilte Unternehmen eine bedeutende und unentbehrliche Rolle spielen. Diese und weitere spezifischen Aspekte, sowie ihren Einfluss auf die technische Lösungssuche sollen in dieser Diplomarbeit untersucht werden. Der heutzutage auftretende Begriffsdschungel in den Bereichen Wissensmanagement, Informationsmanagement, Datenmanagement und Wissensorganisation, sowie das interdisziplinäre Wesen dieser Sparten, führt oft zu Mißverständnissen bei der Planung und Implementierung bzw. zu lückenhaften Betrachtungen von Lösungskonzepten. Ein besonders wichtiges Anliegen des Autors der vorliegenden Arbeit ist es, ein wenig ’Klarheit’ in diesem Zusammenhang zu verschaffen. Im nachfolgenden Abschnitt sollen die grundlegendsten Eigenschaften und Problembereiche von großen und geographisch verteilten Unternehmen dargestellt werden, um einen globalen Überblick der hier behandelten Unternehmensstrukturen zu geben. 1.2 Transnationale Konzerne Dieser Abschnitt soll einen Einblick in die funktionalen und strukturellen Eigenschaften eines transnationalen Konzerns ermöglichen. Die in diesem Unterkapitel beschriebenen, allgemein gültigen Charakteristika von großen und geographisch verteilten Unternehmen stellen kritische Problembereiche, welche besonderes Augenmerk bei der Konzeption eines Web-basierten Informationssystems erfordern, dar. Kapitel 1 - EINLEITUNG Seite 3 Der Autor dieser Arbeit verwendet abwechselnd unterschiedliche Bezeichnungen für große und räumlich ausgebreitete Organisationsstrukturen. Im allgemeinen Fall wird der Begriff große und geographisch verteilte Unternehmen verwendet, um Organisationen zu beschreiben, die eine große, stark vernetzte und räumlich ausgebreitete Struktur aufweisen. Diese Auffassung des Begriffs impliziert nicht nur eine Verteilung der geographischen Präsenz, sondern auch der Tätigkeitsfelder. Hiermit werden also Unternehmen gemeint, die zwar eine relativ starke funktionale und strukturelle Verteilung aufweisen, aber nicht unbedingt eine Ausbreitung über nationale Grenzen hinweg aufweisen. Um große und geographisch verteilte Unternehmen zu beschreiben, deren Struktur und Geschäftsfelder sich über Ländergrenzen hinweg ausbreiten und durch den Zusammenschluss mehrerer Organisationen zustande kommen, wird der Begriff transnationale Konzerne verwendet. Beide Unternehmenstypen - große und geographisch verteilte Unternehmen wie auch transnationale Konzerne - werden ausschließlich aus der Sicht der graphischen Repräsentation analysiert. Die nachfolgenden Beschreibungen und graphischen Darstellungen lehnen sich an die in [Janko 2001] definierten ’Organisationsformen’ und sollen einen einführenden Blick in die Komplexität solcher Unternehmensstrukturen ermöglichen. Die graphische Darstellung eines Unternehmens kann als eine Wiedergabe der dazugehörigen Organisation aufgefaßt werden. Das wesentlichste Merkmal einer Organisation stellt dessen ’dauerhafte’ Strukturierung dar. Befaßt sich der Begriff Organisation mit Strukturfragen, so spricht man vom ’Aufbau’ des Unternehmens. Sollten hingegen Prozesse behandelt werden, so spricht man von ’Ablauf’ der Organisation [Janko 2001]. Große und geographisch verteilte Unternehmen besitzen in der Regel eine hierarchische organisationale Verteilung in Sub-Unternehmen. Diese hierarchische Struktur repräsentiert das Organigramm des Unternehmens. Die einzelnen Knoten einer solchen ’Hierarchiestruktur’ werden beispielsweise durch Divisionen, Geschäftsbereiche, Sparten, Funktionen, Unternehmensbereiche, Kompetenzen oder Standorte dargestellt. Die Verbindungen zwischen den unterschiedlichen Hierarchieebenen stellen Wechselwirkungen, Interaktionen oder Abhängigkeiten dar. Einige Beispiele von Organisationsformen sind - laut [Janko 2001] und in der vorliegenden Arbeit lediglich partiell und verallgemeinert wiedergegeben - wie folgt definierbar: Funktionale Gliederung Produktionale Gliederug Regionale Gliederung Matrixorganisation Tensororganisation Die funktionale Gliederung wird auch ’Verrichtungszentralisation’ genannt und führt zur Darstellung der typischen Hauptabteilungen Fertigung (bzw. Produktion), Beschaffung, Vertrieb (bzw. Marketing und Verkauf) und Verwaltung. In [Abb. 1.1] wird ein Beispiel hierfür graphisch dargestellt. Kapitel 1 - EINLEITUNG Seite 4 Abbildung 1.1: Beispiel für eine funktionale Organisationsform [Janko 2001] Eine Produktionale Gliederung oder ’Objektzentralisation’ – wie beispielsweise in [Abb. 1.2] dargestellt - führt zur typischen zusammengefassten Darstellung von Hauptabteilungen nach Erzeugnisgruppen, Verfahrenstechniken oder Kundenkreisen. Die sich aus dieser Organisationsform ergebenden Elemente werden auch Divisionen, Geschäftsbereiche, Sparten, Unternehmensbereiche oder einfach Teilbereiche genannt. Abbildung 1.2: Beispiel für eine produktionale Gliederung) [Janko 2001] Die Regionale Gliederung erfolgt nach geographischen Gesichtspunkten und ist vor allem bei Unternehmen mit international gestreuten Tätigkeitsspektrum zu beobachten. Die Gliederung erfolgt hier häufig nach Kontinenten oder Ländergruppen bzw. beiden. So eine Darstellungsform besitzt typischerweise als oberste Schichte eine höhere Leitungsebene, wodurch sich eine geographische Kompetenzendarstellung ergeben kann (siehe [Abb. 1.3]). Abbildung 1.3: Beispiel für eine regionale Organisationsform [Janko 2001] Kapitel 1 - EINLEITUNG Seite 5 Bei Matrix- und Tensororganisation kommt es zur gleichzeitigen Berücksichtigung des Verrichtungs- und Objektaspekts. Die Matrixorganisationsform ist durch gleichzeitige funktionale und produktionale bzw. regionale Gliederung gekennzeichnet. Die Tensororganisationen ist eine dreidimensionale Darstellungsform. Hierbei wird nach einem bestimmten Merkmal - wie beispielsweise der regionalen Gliederung - die Matrixorganisation weiter untergliedert. Tensororganisationen kommen gewöhnlich nur bei großen und geographisch verteilten Unternehmen vor. Beispiele für diese Organisationsformen werden graphisch in [Abb. 1.4] und [Abb. 1.5] dargestellt. Abbildung 1.4: Beispiel für eine Matrixorganisation [Janko 2001] Abbildung 1.5: Beispiel für eine Tensororganisation [Janko 2001] Die obere Behandlung dieser Organisationsformen sollte nicht nur die Vielfalt der Möglichkeiten, sondern insbesondere die Komplexität der zusammengesetzten Varianten (Matrix- und Tensororganisation) verdeutlichen. Diese mehrdimensionalen Darstellungsformen Kapitel 1 - EINLEITUNG Seite 6 stellen ’genau’ jene Strukturierungen dar, welche vom verteilten wissensbasierten Informationssystem abstrahiert und verwaltet werden sollen. Auch bei der Betrachtung einer einzigen Darstellungsform sollte man die Querverbindungen (Abhängigkeiten bzw. Wechselwrikungen) zwischen den explizit zusammengehängten Elementen nicht übersehen. Folgende Szenarien (fiktive Beispiele) stellen also nicht zu unterschätzende Einflußfaktoren dar: a) eine Fertigungsabteilung des Unterbereichs ’B’ in Spanien kann organisatorisch und funktionell stark mit einer Lieferungsabteilung des Hauptbereichs ’B’ in Guatemala oder einem Entwicklungs-Unterbereich in Indien verbunden sein, oder b) eine technische Gebrauchsanweisung könnte während ihres Erstellungsprozesses nicht nur vertikal mehrere Hierarchieknoten, sondern auch horizontal mehrere Abteilungen in unterschiedlichen und regional verteilten Unterbereichen durchlaufen. Diese Betrachtung der verteilten und kollaborativen Geschäftsprozesse soll auch durch das Informationssystem richtig erkannt und verarbeitet werden. Zusammenschlüsse von Unternehmen zu großen Konzernen, aber auch das Outsourcing (das Weitergeben von Teilaufgaben) verändern zunehmend die Anforderungen, die an große Informationssysteme gestellt werden. Damit eng verbunden ist die Anforderung an die Informationstechnologie, Information und Wissen auch bei einer Verteilung der Wissenseinheiten (humane ebenso wie elektronisch erfassten Ressourcen) effizient und effektiv zur Verfügung stellen zu können. Die Aufgabe der vorliegenden Arbeit besteht infolgedessen darin, nach existierenden Mechanismen zu suchen, welche die Problematik der starken Verteilung von Informationseinheiten technisch abstrahiert und vereinfacht. Das heißt, diese Mechanismen sollen einen transparenten Zugang zu verteilten Informationseinheiten sowie eine bedarfsgerechte und effiziente Informationsauffindung ermöglichen. Hierfür ist eine semantische Vernetzung des kollektiven Wissens erforderlich, um zum Beispiel die Umsetzung von funktionalen Prozessen zu optimieren. Die einzelnen Kapitel der vorliegenden Arbeit stellen einen Rahmen aus übergeordneten Konzepten dar, die bei der Realisierung eines Informationssystems für große und geographisch verteilte Unternehmen – insbesondere transnationale Konzerne - beachtet werden sollten. Der Untersuchungsbereich soll es ermöglichen, die darin behandelte Thematik speziell für die evaluierte Unternehmensform – zumindest in allgemeiner Form – zu behandeln, d.h. einen ’ersten’ Lösungsvorschlag zu formulieren. Die Gliederung der damit zusammenhängenden Schwerpunkte, und somit der prinzipielle Aufbau der vorliegenden Arbeit, wird im nächsten Unterkapitel kurz dargestellt. 1.3 Gliederung und Inhalt der Arbeit Aufbauend auf den Untersuchungsbereich - welcher die Kapiteln 2 bis 5 umfasst und respektive die Themen Wissensmanagement, Informationsmanagement, Datenmanagement und Wissensorganisation behandelt - werden ein erster allgemeiner Lösungsvorschlag und beispielhaft zwei für das Hyperwave Information System umgesetzte Applikationen im Gestaltungsbereich (Kapitel 6 und 7) erarbeitet und dargestellt. Teilbereiche aus dem vorgestellten Gestaltungsmodell wurden konkret für einen - in dieser Arbeit anonymisiert dargestellten - transnationalen technischen Konzern als Module implementiert (auf der Basis des Hyperwave Information Servers) und sind im Gestaltungsbereich beschrieben. Im Kapitel 2 Wissensmanagement werden die theoretischen Grundlagen und die praktischen Hintergründe im Bereich Knowledge Management untersucht. Dabei wird die heutzutage oft Kapitel 1 - EINLEITUNG Seite 7 verwendete und stets unterschiedlich interpretierte Terminologie näher betrachtet. Unter dem Gesichtspunkt eines transnationalen Konzerns wird hier auf die informationstechnologische und betriebsspezifische Problematik der Wissensaufbereitung hingewiesen. Mit den aus Kapitel 2 gewonnenen Erkenntnissen wird im Kapitel 3 Informationsmanagement die technologische Seite von verteilten Informationssystemen behandelt. Die praxisrelevanten Einflussfaktoren und kritischen Aspekte, die für die Lösungssuche und somit die Konzeption einer verteilten Informationsarchitektur eine wichtige Rolle spielen, werden in diesem Kapitel dargelegt. Kapitel 4 Datenmanagement beschäftigt sich mit der physikalischen Verwaltung von Daten, insbesondere mit dem kritischen Aspekt der Datenreplikation in weltweit verteilten Systemarchitekturen. Zunächst werden die theoretischen Grundlagen im Bereich der verteilten Datenbanken und der Organisationsgedächtnisse eingeführt. Anschließend werden die unterschiedlichen Replikationsmechanismen analysiert. Es wird dabei vor allem versucht, die wichtigsten Entscheidungskriterien herauszufinden, um die Kernfragen „was, wann und wie wird repliziert?“ zu beantworten. Der Bereich Wissensorganisation und die damit verwandten Disziplinen - wie zum Beispiel Document Management, Content Management, Information Retrieval, Resource Discovery, Library Science und Archival Science - werden im Kapitel 5 Wissensorganisation eingehend untersucht und gegenübergestellt. Weiters befasst sich Kapitel 5 mit dem Thema Semantik, wobei Metadaten und Ontologien den Schwerpunkt bilden. Die Hauptthemen des Kapitels 5 bilden aber die Abschnitte 5.3 ’Organisationssysteme’ und 5.4 ’Sichtweisen’. Der Abschnitt ’Organisationssysteme’ befasst sich mit semantischen Begriffsstrukturen. Dabei werden die Themen Begriffslisten, Beziehungsstrukturen, Themenhierarchien (Klassifikationssysteme, Taxonomien und Kategoriesysteme) und Clustering ausführlich und aus der Sicht von transnationalen Konzernen untersucht. Der Abschnitt ’Sichtweisen’ präsentiert die Grundlagen von Wissenmodellierung und –mapping sowie unterschiedliche Technologien der semantischen Wissenskartographie. Aufbauend auf die im Untersuchungsbereich gewonnenen Erkenntnisse, wird in Kapitel 6 Lösungsvorschlag ein erster Gesstaltungsvorschlag, welcher die allgemeinen Anforderungen eines transnationalen Konzerns erfüllen soll, vorgestellt. Es ist dies ein neuartiger, entwickelter Modellansatz - ein Framework – zur Planung und Gestaltung von Intranetsystemen für transnationale Konzerne. Im Kapitel 7 Implementierung des Systems wird, anhand der konkreten Anforderungen eines anonymisiert dargestellten transnationalen Konzerns, ein komplettes Gestaltungsmodell für ein wissensbasiertes Informationssystem auf der Basis des Hyperwave Information Servers beschrieben. Zwei Teillösungen aus dem allgemeinen Modell werden anschließend als getrennte Module (Metadatensätze und News Applikation) ins Detail präsentiert. Im Kapitel 8 werden letztlich Rückschlüsse aus der gesamten Arbeit zusammengefasst. Erweiterungs- und Verbesserungsmöglichkeiten des in der vorliegenden Arbeit dargelegten Lösungsmodells werden im gleichen Kapitel aufgezählt Kapitel 1 - EINLEITUNG Seite 8 Teil I - UNTERSUCHUNGSBEREICH Seite 9 Teil I UNTERSUCHUNGSBEREICH Teil I - UNTERSUCHUNGSBEREICH Seite 10 Kapitel 2 - WISSENSMANAGEMENT Seite 11 Kapitel 2 Wissensmanagement „Die Zukunft lebt vom Austausch des Wissens.“ Albert Einstein Mit diesem Kapitel soll das erste und grundlegendste mit einem modernen Informationssystem verfolgte Ziel, das Wissensmanagement, erläutert werden. Dabei wird zunächst auf die wichtigsten Definitionen bezüglich dieser Disziplin eingegangen. Da eine nähere Betrachtung dieser Grundlagen ein Themenkomplex für sich darstellt, und diese Diplomarbeit die Thematik aus der Sicht eines transnationalen Unternehmens behandelt, erhalten hier die mit Wissensmanagement verfolgten strategischen Ansätze mehr Bedeutung. Im Unterkapitel 2.2 ’Kritische Aspekte’ werden die für transnationale Konzerne wichtigsten Entscheidungskriterien und Anforderungen eines Wissensmanagementsystems präsentiert und analysiert. 2.1 Allgemeines Um den Begriff Wissensmanagement zu verstehen, benötigt man einerseits den zugrundeliegenden Wissensbegriff als ’Bausubstanz’, und andererseits das Verständnis vom Managementbegriff als ’Steuerelement’. Management als Steuerelement, weil man damit unternehmerische und menschliche Aspekte einer Organisation (d.h. Unternehmens- und Personalführung) zielgerichtet zu steuern versucht. 2.1.1 Wissen Das bekannteste Definitionsmodell für Wissen beruht auf einer begrifflichen Trennung von Daten, Information und Wissen innerhalb einer hierarchischen Sichtweise, wobei Daten an unterster Stelle platziert sind, da sie als Voraussetzung für die weitere Analysen gelten. Die Hierarchie stellt sowohl eine wertabhängige Anordnung als auch eine chronologische Abfolge dar [Rollett 2000]. Daten sind unstrukturierte, isolierte und kontext-unabhängige Fakten. Sie existieren einfach, und besitzen keine Bedeutung jenseits ihrer Existenz. Daten stellen die Grundlage für Information und Wissen dar [Rollett 2000]. Information gewinnt man aus vom Menschen bewerteten Daten. Informationen sind Daten, die eine Bedeutung durch assoziative Beziehungen bekommen: „Information besteht aus Daten, die durch den Verstand von Personen gelaufen sind und aussagekräftig gefunden wurden.“ [Huang 1998] 1 Aus prozessorientierter Perspektive identifizieren Informationsmodelle unterschiedliche Mechanismen, durch die man Information aus Daten erstellen kann. Diese sind Kontextualisierung, Kategorisierung, Berechnung, Korrektur und Komprimierung [Davenport et al. 1997a]. 1 “Information consists of data passed through a person’s mind and found meaningful [Huang 1998].” Kapitel 2 - WISSENSMANAGEMENT Seite 12 Wissen besitzt heutzutage mindestens zwei Bedeutungen. Wissen als Objekt, wie zum Beispiel die Definitionen (Erkenntnisse) in einem Wörterbuch oder einer Enzyklopädie, und Wissen als Prozess, wie die Qualifikationserfahrungen, die sich im Handeln eines Experten zeigen. Wissen beinhaltet also viel mehr als Information [Rollett 2000]: „Wissen könnte als Information definiert werden, die mit Erfahrung, Kontext, Interpretation und Nachdenken kombiniert worden ist.“ [Davenport et al. 1997b] 2 [Röpnack et al. 1998] geben eine allgemeinere Definition von Wissen an, wobei der Mensch nicht explizit im Prozess involviert ist: „Wissen ist Information verknüpft mit einem spezifizierten Kontext, und wird durch eine intelligente Komponente verarbeitet.“ [Röpnack et al. 1998] 3 Eine entgegengesetzt gerichtete Sichtweise, bei der Wissen als gegeben vorausgesetzt wird, um daraus Information durch Strukturieren zu gewinnen, wird in [Tuomi 1999] präsentiert. In diesem Modell entstehen Daten erst am Ende des zeitlichen Prozesses, und zwar als Zusatzprodukt des kognitiven Prozesses, bei dem die aus der Information gewonnenen Strukturen interpretiert werden. Die zwei zuletzt besprochenen Sichtweisen (von H. Röpnack und I. Tuomi) basieren auf einer in Bezug auf Information gemeinsamen Tatsache: sie behandeln Information nicht als statisches Phänomen, sondern als Aktion bzw. Prozeß. Die sehr bekannte und oft zitierte Devise – siehe z.B. [Capurro 2000a] oder [Bergermann 1999] - des deutschen Informationswissenschaftlers Rainer Kuhlen4, bringt den Sachverhalt kurz und prägnant zum Punkt: „... Information ist Wissen in Aktion.“ 5 Dem Modell von Russell Ackoff zufolge, ein Systemtheoretiker und Professor für ’Organizational Change’, kann der menschliche Verstand in fünf Kategorien klassifiziert werden: Daten, Information, Wissen, Verständnis und Weisheit. Daten sind Symbole. Information gewinnt man aus Daten, die verarbeitet werden, um nutzbar zu sein. Information liefert Antworten auf ’Wer’-, ’Was’-, ’Wo’- und ’Wann’-Fragen. Wissen ist die Anwendung von Daten und Information, und liefert Antworten auf ’Wie’-Fragen. Verständnis ist die Einschätzung des ’Warum’. Weisheit wird als persönliche Beurteilung bzw. Erkennung des verstandenen Wissens definiert [Bellinger et al. 2001a]. Die ersten vier Kategorien beziehen sich auf die Vergangenheit, da sie mit existierenden Fakten oder vorhandenem Wissen zu tun haben. Bloß die fünfte Kategorie, die Weisheit, bezieht sich auf die Zukunft, weil sie Vision und Entwurf einschließt. Um aber Weisheit zu erlangen, muss “Knowledge could be defined as information that has been combined with experience, context, interpretation, and reflection [Davenport et al. 1997b].” 3 “Knowledge is information associated with a specified context and is processed by an intelligent component [Röpnack et al. 1998].” 4 Rainer Kuhlen: „Hypertext - ein nicht-lineares Medium zwischen Buch und Wissensbank“ - Addison Wesley, Berlin. Springer, Heidelberg - 1991 5 Zitat aus [Bergermann 1999]: „... mit dem Begriff ’Wissen’ des Informatikers Kuhlen...: ’Information hat keinen quasi objektiven Charakter, sie muß unter Berücksichtigung der Rahmenbedingungen erst aus Wissen bzw. der Darstellung von Wissen verarbeitet werden. Informationen können nicht wie Daten verarbeitet werden, sondern werden erst unter Berücksichtigung konkreter Bedürfnisse und Handlungssituationen erarbeitet. Information ist - wenn man es in eine Formel packen wollte - Wissen in Aktion’.“ 2 Kapitel 2 - WISSENSMANAGEMENT Seite 13 man sich sequentiell durch die ersten Kategorien bewegen [Bellinger et al. 2001b]. Wissen ist in diesem Modell als deterministischer Prozess zu betrachten, während Verständnis kognitiv und analytisch ist. Der Unterschied zwischen Wissen und Verständnis ist wie Merken (sich etwas einprägen) und Lernen. Erst wenn Menschen etwas verstanden haben, können sie neues Wissen aus vorhandenem Wissen generieren. Zum Beispiel, es hilft sehr wenig zu wissen, dass 5 x 9 = 45 und 12 x 12 = 144, wenn man das Multiplizieren nicht versteht und schwierigere Aufgaben bewältigen will, etwa 144 x 45. Schließlich wird in [Bellinger et al. 2001a] erläutert, dass Weisheit ein extrapolativer, nicht probabilistischer und nicht deterministischer Prozess ist. Sie ist die Grundlage der philosophischen Erforschung, der Prozeß durch den wir erkennen und beurteilen können ob etwas richtig oder falsch, gut oder schlecht ist. Die fünf Kategorien dieses Wissensmodells lassen sich, wie in [Abb 2.1] gezeigt, graphisch darstellen, wobei die Kategorie Verständnis kein eigener Ebenenpunkt, sondern eine Achse repräsentiert. Der Daten-zu-Weisheit-Übergangsvektor (DWÜV) symbolisiert in der Abbildung nicht einen morphologischen, sondern den semiotischen Übergang von Daten zu Weisheit über den Verständnisparameter, wobei die drei Verständnis-Teilübergänge (VerständnisBeziehungen, -Muster und -Prinzipien) vom Autor der vorliegenden Arbeit bidirektional (d.h. auch in Richtung Ursprung) dargestellt wurden, da der umgekehrte Weg durchaus möglich ist (in Übereinstimmung mit dem in [Tuomi 1999] präsentierten Modell). Kontextabhängigkeit Weisheit DWÜV Wissen Information Daten V-Prinzipien V-Muster V-Beziehungen Verständnis (V) Abbildung 2.1: Fünf Kategorien Modell nach Ackoff [Bellinger et al. 2001b] In [Bellinger et al. 2001b] wird zusätzlich auf Csikszentmihalyis Interpretation der Komplexität Bezug genommen. Wie komplex etwas ist oder nicht, läßt sich laut Csikszentmihalyi durch Differenzierung und Integration (analog zu Analyse und Synthese) definieren. Der Grad an Komplexität ergibt sich somit, wie in [Abb. 2.2] graphisch dargelegt, innerhalb der Grenzen eines entstehenden ’Komplexitätskorridors’ (graue Fläche). Differenziert Kompliziert Komplexität Banal Integriert Abbildung 2.2: Interpretation des Komplexitätbegriffs nach Csikszentmihalyi [Bellinger et al. 2001b] Kapitel 2 - WISSENSMANAGEMENT Seite 14 Wenn man beide Diagramme übereinander legt, entsteht plötzlich eine neue Sichtweise mit interessanten Überlappungen, zum Beispiel die Äquivalenz der Richtung des Daten-zuWeisheit-Übergangsvektors (DWÜV) mit dem Entfaltungsfluß der Komplexität (Ausrichtung des Komplexitätskorridors). Das resultierende Diagramm wird in [Abb. 2.3] dargestellt. Dieser Sachverhalt unterstützt also viele Thesen, die Daten als ’einfachere’ und Wissenseinheiten als ’komplexere’ Gebilde auffassen. Kontextabhängigkeit (differenziert) Weisheit DWÜV Wissen Information Daten om K itä ex l p or id r r ko ts Verständnis (integriert) Abbildung 2.3: Modellerweiterung. Korrelation des Wissensmodells von Ackoff mit dem Komplexitätsmodel von Csikszentmihalyi [Bellinger et al. 2001b] Abschließend zum Thema Wissen sei hier auf folgende, in [Reinmann 2001] erscheinende Anmerkungen hingewiesen. Da Wissensmanagement wissenschaftlich von der Interdisziplinarität lebt und sich in der Praxis mit unterschiedlicheren Gebieten innerhalb einer Organisation auseinandersetzt, könnte es sogar kontraproduktiv sein, das Wesen des Wissens verstehen zu wollen. Um mit Wissen umgehen zu können, wird das Phänomen mit dem Begriff Zeit verglichen. Jeder glaubt zu wissen und zu verstehen was Zeit ist, und kommt damit auch sehr gut zurecht. Sobald man aber versucht Zeit genauer zu definieren, entzieht sich einem das Wesen der Zeit. Simultan wird jedem klar, dass man Zeit gar nicht erkenntnistheoretisch verstehen muß, um damit umgehen zu können [Reinmann 2001]. 2.1.2 Intellektuelles Kapital Aus der Sicht eines großen Unternehmens kann man Wissen - beispielsweise - in Dokumenten finden. Dies können Texte, Grafiken, Statistiken, E-mails oder ausgefüllte Formulare sein, die ausgewertete Informationen über Kunden, Produkte, Geschäftsprozesse, usw. enthalten. Im Allgemeinen wird all das relevante Wissen eines Unternehmens (die Summe des in den Köpfen ihrer Mitarbeiter gespeicherten Wissens, jegliche Dokumente und Datenbankbestände, Geschäftsprozesse und –beziehungen, usw.) intellektuelles Kapital genannt. Aus der betriebswirtschaftlich orientierten Sicht des Wissens kann man leicht die Bedeutung vom Intellektuellen Kapital für ein Unternehmen extrahieren: “... Wissen ist, durch Forschung, Untersuchung oder Erfahrung internalisierte Information, die einen Wert für die Organisation hat [Kerssens et al. 1996] 6.” “... knowledge is information internalized by means of research, study or experience, that has value for the organization [Kerssens et al. 1996].” 6 Kapitel 2 - WISSENSMANAGEMENT Seite 15 Demzufolge kann man Intellektuelles Kapital als die in Kapitalwerten ausgedrückte unternehmerische Wissensbasis definieren. Es beinhaltet strukturelles Kapital, humanes Kapital und kundenspezifisches Kapital. Das Innenleben moderner Konzerne erfährt derzeit einen technischen Umschwung, Managementstrukturen werden abgeglichen, Mitarbeiter bekommen mehr Teilnahme an unternehmerischer Macht. Diese für das Ende des 20. Jahrhunderts typischen Einflußfaktoren verlagern somit den Mittelpunkt mehrerer Analysen auf die Wissensarbeiter (engl.: ’knowledge workers’). Die neuen Produktionswerkzeuge sind Spezialistenkompetenz und Wissen – also intellektuelles Kapital [Stevenson 1995]: “Die grundsätzlichen Werkzeuge der Produktion sind heutzutage nicht Anlagen und Ausrüstung, sondern die Ideen und Talente der Menschen. Das intellektuelle Kapital des Wissenschaftlers, des Anlagenbetreibers und des Programmierers stellt heutzutage die kritische Ressource dar, so dass die Inhaber dieser intellektuellen Produktionswerkzeuge – die Menschen – zur Ausübung effektiver Macht kommen werden [Stevenson 1995] 7.“ Es schaut so aus, als müssten viele Unternehmer Struktur, Philosophie und Funktionsziele ihrer Organisationen überdenken, um denjenigen mehr Stimmrecht zu geben, die dieses Kapital besitzen – den Arbeitern [Stevenson 1995]. 2.1.3 Modelle des Wissensmanagements Nur wenige Modelle des Wissensmanagements haben sich bisher durchsetzen können, d.h. sie haben große Verbreitung, Akzeptanz und Anerkennung gefunden. Diese drei Kriterien werden vor allem vom Spiralmodell der Japaner Ikujiro Nonaka & Hirotaka Takeuchi, vom Bausteinmodell der Gruppe um Gilbert Probst, aber auch vom prozessorientierten Modell von Chun Wei Choo erfüllt. Im Spiralmodell von [Nonaka et al. 1995] wird primär eine Klassifikation des Wissens durchgeführt: a) Explizites Wissen ist objektiv, kodifiziert, transferierbar und formaler Natur. b) Implizites oder verborgenes Wissen, im englischsprachigen Raum auch ’tacit knowledge’ genannt, ist subjektiv, persönlich, und somit auf individuelle Erfahrungen, Kultur, Emotionen und Werte basierend. Implizites Wissen besteht aus Können, Handlungsroutinen, Überzeugungen, Glaubenssätzen und geistigen Schemata [Forst1999]. Das dazugehörige Modell wird in [Abb. 2.4] graphisch gezeigt. Das Explizitmachen eines impliziten Kontexts ist eine wesentliche Voraussetzung für die Schaffung neuen Wissens. Dabei ist zu betonen, dass in diesem Modell verschiedene Formen der Wissensumwandlung stattfinden [Nonaka et al. 1995]: a) Sozialisation (vom impliziten zum impliziten Wissen) “The principle tools of production today are not machinery and equipment, but the ideas and talents of the people. Today, the intellectual capital of the scientist, the machinist, and the programmer is the critical resource, so the possessors of the intellectual tools of production - people - will come to exercise effective power [Stevenson 1995].” 7 Kapitel 2 - WISSENSMANAGEMENT Seite 16 b) Externalisierung (vom impliziten zum expliziten Wissen) c) Kombination (vom expliziten zum expliziten Wissen) d) Internalisierung (vom expliziten zum impliziten Wissen) Sozialisation, Kombination und Internalisierung sind in gängigen Organisationstheorien zu identifizieren. Die Kombination ist außerdem eine zu lernende Fähigkeit von Informationsmanagern. Das Neue bei diesem Ansatz ist nicht nur das Hervorheben der bislang unbeachteten Dimension des impliziten Wissens, man stellt sie in einen dynamischen Zusammenhang mit anderen Formen des Wissenstransfers, der als ein spiralförmiges Zusammenwirken aufzufassen ist [Nonaka et al. 1995]. Explizites Wissen Internalisierung Explizites Wissen Kombination Externalisierung Sozialisation Implizites Wissen Implizites Wissen Abbildung 2.4: Wissensspirale von Nonaka & Takeuchi Im Prozeßmodell von [Choo 1998] ist keine streng begriffliche Trennung zwischen Information und Wissen zu identifizieren. Er definiert drei strategische Prozeßklassen für das Einsetzen von Information: a) Bedeutungsbestimmung (engl.: ’sensemaking’) heißt Ereignisse und Aktivitäten des Unternehmens interpretieren und ihnen eine spezifische Bedeutung zuordnen. b) Wissensschaffung (engl.: ’knowledge creating’) ist die individuelle Gewinnung von Erkenntnissen und deren Weitergabe an die Organisation. c) Entscheidungsfindung (engl.: ’decision making’) bedeutet die zielorientierte Anwendung des Wissens beim Treffen von Entscheidungen. Das Bausteinmodell von [Probst et al. 1999], dessen graphische Darstellung in [Abb. 2.5] gezeigt wird, identifiziert wissensbezogene Aktivitäten, die als geschlossenes System (ohne externe Einflüsse) miteinander interagieren. Kapitel 2 - WISSENSMANAGEMENT Seite 17 Zielsetzung Wissensidentifikation Wissenserwerb Feedback Wissensentwicklung Wissens(ver)teilung Wissensbewahrung Messung Wissensnutzung Abbildung 2.5: Bausteinmodell des Wissensmanagements [Probst et al. 1999] Die Anordnung der Bausteine folgt zwei Prinzipien. Ein äußerer Kreislauf mit den Komponenten Wissensziele (Zielsetzung), Wissensumsetzung (rechter Teil in [Abb. 2.5]) und Wissensbewertung (Messung) bildet einen Managementprozeß ab. Dieser äußere Regelkreis verdeutlicht die Wichtigkeit strategischer Aspekte und die Bedeutung eindeutiger und konkreter Zielsetzungen. Im inneren Kreislauf befinden sich die Bausteine Wissenstransparenz, Wissenserwerb, Wissensentwicklung, Wissens(ver)teilung, Wissensbewahrung und Wissensnutzung. Das Auftauchen vieler Wissensprobleme in Unternehmen ist darauf zurückzuführen, dass die Organisation einem oder mehreren dieser Bausteine zu wenig Beachtung schenkt und somit den Regelkreis stört. Dies könnte geschehen wenn zum Beispiel keine Transparenz über intern erstellte Dokumentationen bzgl. Forschungsstudien besteht. Somit können diese Informationen nicht im Prozeß weiterer Produktentwicklungen genutzt werden. Falls einzelne Prozesse während einer Problemlösung nicht dokumentiert werden, können sie dem Organisationsgedächtnis entfallen und die Wiederholung einer erfolgreich durchgeführten Entwicklung unmöglich machen [Probst et al. 1999]. Das Festlegen dieser Bausteine hat mehrere Vorteile: es ermöglicht eine logische Strukturierung des Managementprozesses in logische Phasen, bietet Investitionsansätze und liefert ein erprobtes Raster für die Suche nach den Ursachen von Wissensproblemen [Rollett 2000]. 2.1.4 Wissensmanagement Um den Begriff Wissensmanagement zu verstehen, wurde schon das Wesen seiner Bausubstanz, des Wissens, auf theoretische Weise erklärt. Um nun das Wesen des Managements zu verstehen, wird hier zunächst der Vergleich eines Managers mit einem Steuermann gezogen. Das altgriechische Wort für Steuermann ist ’Kybernetes’. Demzufolge ist es nicht erstaunlich, dass die gängige Vorstellung von Management einem kybernetischen Regelkreismodell gleicht. Kapitel 2 - WISSENSMANAGEMENT Seite 18 Man versucht, einen bestimmten Sollzustand zu erreichen oder aufrecht zu erhalten und ablaufende Vorgänge zu berechnen. Die alleinige Anwendung von Berechnungsformeln (d.h. eines algorithmischen Modells) ist in Bezug auf Management nicht vollständig zufriedenstellend [Reinmann 2001]. Wenn es aber um die im weitesten Sinne technische Seite eines großen Unternehmens (z.B. verteilte Infrastrukturen oder komplex verbundene Geschäftsmodelle) geht, stellt sich ein algorithmisches Denken als durchaus funktional heraus. Management im Sinne von Unternehmensführung gehorcht großteils den Gesetzen berechenbarer technischer Systeme. Geht es um die menschliche Seite der Organisation, so stößt man mit diesem Denkmodell an Grenzen. Management in Bezug auf Mitarbeiterführung gehorcht den Gesetzen biologischer und ökologischer Systeme, deren Verhalten zwar determiniert, aber nicht vorhersehbar und mit Unsicherheitsfaktoren behaftet ist. In diesem Fall kommt man leichter mit einem heuristischen Modell (Denken in Faustregeln) weiter [Reinmann 2001]. Beim Wissensmanagement hat man es mit beiden Systemarten zu tun. Naheliegend ist daher eine Kombination des algorithmischen und des heuristischen Modells, also Management als Gestaltung evolutionsähnlicher Prozesse, d.h. als Gleichgewicht zwischen Moderieren und Kontrollieren, zwischen Metasteuerung und direkter Regelung [Reinmann 2001]. Somit ergibt sich für Wissensmanagement eine Ebene des Untenehmensmanagements als Steuerungmechanismus unter der Berücksichtigung des Wissensaspektes. Es geht im allgemeinen um eine möglichst nützliche organisationale und technologische Ausbeutung der unternehmerischen Wissensbasis und um ein integratives Erkennen und Ergreifen aller Maßnahmen (d.h. geschäftliche, organisatorische, technische und menschliche Aspekte inbegriffen), die hierfür notwendig sind. Für große Unternehmungen geht es, aus technischer Sicht, hauptsächlich um das transparente, problembezogene Verfügbarmachen des Wissens. Nach [Neumann et al. 1998] umfassen die durch Wissensmanagement ergriffenen Maßnahmen mehrere Dimensionen: a) strategische und operative, b) planende, steuernde und kontrollierende, c) organisatorische und technologische, und d) kulturelle und mitarbeiterbezogene. Will man aber die Zeitdimension als Hauptparameter eines Modells festlegen, so entstehen meist Lebenszyklen durch Teilprozesse. Der in [Scheer et al. 1999] beschriebene Lebenszyklus ist eines dieser Modelle und setzt sich aus den Teilkomponenten Wissensakquisition, Wissenspräsentation, Wissenstransfer, Wissensnutzen und Wissensentfernung [Rollett 2000]. Die meist genannten Komponenten des Wissensmanagements werden in [Rollet 2000] als Summe von Prozessen identifiziert, die den gesamten Umfang dieses interdisziplinären Begriffes abdecken. Diese dort erkannten Komponenten sind Identifikation, Bewertung, Erwerb, Entwicklung, Bewahrung, Aufbereitung, Klassifikation, Speicherung, Verteilung, Nutzung und Transfer von Wissen. Einige der in Zusammenhang mit diesen Komponenten liegenden kritischen Aspekte während der Konzeption eines Informationssystems für große Unternehmen werden im nächsten Abschnitt näher betrachtet. Aus unternehmerischer Sicht, vor allem für transnational tätige Konzerne, ist eines der Hauptziele des Wissensmanagements einen Wettbewerbsvorteil zu erlangen oder aufrecht zu Kapitel 2 - WISSENSMANAGEMENT Seite 19 erhalten. Dabei stellt Wissen bzw. intellektuelles Kapital die Basis von Innovationen bei Produkten und Prozessen dar. Die daraus resultierenden Innovationen sind der Motor für den Ausbau bzw. die Sicherstellung eines Wettbewerbsvorteils. Letztlich sichert der erlangte Wettbewerbsvorteil den nachhaltigen Bestand des Unternehmens. Ein strategisch ausgeklügeltes System für solche Unternehmen sollte somit das Aufbauen und effektive Nutzen von intellektuellem Kapital einbeziehen. Insbesondere sind damit Marktreichweite, Mitarbeiterkompetenz, geistiges Eigentum und Infrastrukturelemente (Organisation, Prozessen, Systemen und Methoden) gemeint [Godbout 1998]. Mit Wissensmanagement kann man, wie im ’White Paper’ von Lotus Development Corporation erwähnt [Lotus 2001], Operationskosten reduzieren, organisationale Effektivität steigern, Marktanteile verteidigen oder vergrössern, Kundenstock beibehalten oder vergrössern, Innovationsprozesse beschleunigen, Produktionszyklen minimieren, und neue Möglichkeiten schneller als die Konkurrenz identifizieren. Die drei hier interagierenden Hauptkomponenten sind Menschen, Orte (virtuelle Arbeitsräume), und Dinge (Inhalte: Daten, Informationen oder Prozesse jeglicher Art). Die Lotus Development Corporation glaubt außerdem an die Existenz von fünf Haupttechnologien, die Wissensmanagement untermauern. Diese werden Betriebsintelligenz, Kollaboration, Wissenstransfer, Wissensentdeckung, und Standort des Fachwissens genannt [Lotus 2001]. Der Versuch eine allgemein gültige Definition von Wissensmanagement zu finden erweist sich meistens als sehr schwierig. Dies wurde schon zu Beginn dieses Kapitels am Beispiel des Wissensbegriffs demonstriert. Das wichtigste ist zu verstehen, dass Wissensmanagement auf jeden Fall einen interdisziplinären Charakter besitzt, der sowohl technische als auch organisationale Aspekte umfaßt. Aus technologischer und betriebswirtschaftlicher Sicht definiert [Wiig 1998] Wissensmanagement wie folgt: „Wissensmanagement ist nicht nur eine Technologie, nicht nur eine Menge von expliziten und strikt systematischen Aktivitäten, oder nicht nur eine Patentmethode, um den ökonomischen Wert eines Unternehmens zu steigern. Stattdessen ist Wissensmanagement ein übergreifendes Bemühen, um das Unternehmen ’wissens-wachsam’ zu gestalten. Systematisches und explizites Wissensmanagement ist konzipiert, um eine unternehmensweite, adaptive, kontextuelle, umfassende und menschen-zentrierte Umgebung zu schaffen, die andauernde persönliche Konzentration auf wissensbezogene Angelegenheiten fördert [Wiig 1998] 8.“ In [O’Leary 1998] wird folgende technische und formale Definition angegeben: „Wissensmanagement ist insofern formal, dass Wissen entsprechend vordefinierter – aber entwickelnder – Ontologien klassifiziert sowie kategorisiert ist in strukturelle und semistrukturelle Daten und Wissensbasen 9.“ “KM is not only a technology, not only a set of explicit and rigidly systematic activities, or not only a patent method to increase the economic value of the enterprise. Instead, KM is a broad effort to make the enterprise ‘knowledge-vigilant.’ Systematic and explicit KM is designed to create an enterprisewide, adaptive, contextual, comprehensive, and people-centric environment that promotes continual personal focus on knowledgerelated matters [Wiig 1998].” 9 “KM is formal in that knowledge is classified and categorized according to a prespecified—but evolving—ontology into structured and semistructured data and knowledge bases [O’Leary 1998].” 8 Kapitel 2 - WISSENSMANAGEMENT Seite 20 Es ist sicherlich auch sehr wichtig zu verstehen was Wissensmanagement ’nicht ist’, d.h. die Unterschiede zu anderen verwandten Disziplinen zu erkennen. Wissensmanagement ist zum Beispiel nicht nur reines Informationsmanagement. Informationsmanagement behandelt Wissen vor allem als kontextunabhängiges Objekt und beschäftigt sich hauptsächlich mit Prozessen des Informationstransfers innerhalb eines Unternehmens. Wissensmanagement beschäftigt sich mit wissensorientierten Verstehens- und Erklärungsprozessen, die vordefinierte Unternehmensziele verfolgen. Der Wissensmanager ist somit derjenige, der das vermittelte Wissen einem Prozeß unterzieht, bei dem ein unternehmensspezifischer Kontext bzw. Zusammenhang erzeugt wird [Capurro 2000b]. Die Prozesse der physikalischen Aufbewahrung von Daten - die Urform des Wissens - und deren mechanische Pflege fallen wiederum in den Bereich des Datenmanagements. Natürlich stehen diese Prozesse (und infolgedessen auch die Bereiche) in enger Beziehung zueinander und deshalb ist es auch sinnvoll, dass diejenigen, die sich vor allem mit Wissensvermittlungsprozessen beschäftigen sowohl von Wissensmanagement als auch von Datenmanagement etwas verstehen und umgekehrt [Capurro 2000b]. Wissensmanagement ist auch nicht mit Wissensverarbeitung gleichzusetzen. Die Wissensverarbeitung beschäftigt sich mehr mit technischen und abstrakten Wissensrepräsentationen und mit formalen Methoden aus dem Bereich der Künstlichen Intelligenz. Wissensverarbeitung ist außerdem eine rein technische Disziplin. Methoden aus der Wissensverarbeitung finden aber auch im Rahmen von Wissensmanagementinitiativen Anwendung [Liebotz 1998], bilden aber sicherlich nicht den Schwerpunkt von Wissensmanagement [Rollett 2000]. Wissensmanagement kann der Schlüssel sein für die Bewältigung neuer Herausforderungen im globalen Markt. Hierfür sollte der Einsatz von Wissensmanagementsystemen auf effektive und zielgerichtete Weise mehrere Komponenten aus anderen verwandten Disziplinen (Informations- und Datenmanagement), neue Technologien und Kollaborationswerkzeuge verbinden. Wissensmanagement in großen Konzernen ist eine moderne interdisziplinäre Alternative, um sich mit allen Aspekten des Wissens innerhalb des unternehmerischen Kontexts zu befassen. Dies beinhaltet, unter anderem, die Generierung, Kodifizierung und (Ver)teilung des Wissens, aber auch die Verwaltung von Innovationen und das Umsetzen einer lernenden Organisation. Die Erfüllung dieser Aspekte kann mit Werkzeugen der Informationswissenschaft nicht vollkommen abgedeckt werden. Deshalb umfaßt Wissensmanagement andere Aspekte, die sozialer, kultureller und menschlicher Natur sind. Im nächsten Abschnitt werden die kritischen Aspekte des Wissensmanagements, insbesondere für transnationale Konzerne, näher betrachtet. Um schließlich einen raschen Überblick über das enorm breite Spektrum von modernen Technologien und Bereichen - die mit Wissensmanagement direkt oder indirekt zu tun haben zu geben, sind folglich einige Beispiele genannt: Workflow, Document Management, Content Management, Customer Relationship Management, Digital Libraries, Decision Support Systems, Semantic Networks, Database Management, Data Ware House, Groupware, Workgroup Computing, Collaborative Virtual Environments, Imaging and OCR, Information Retrieval, Versioning Control, Annotationen, Rating and Recommender Systeme, Metadaten, eLearning (Distance Learning), Visualisierung, Intelligent Agents, Knowledge Maps, Expertise Profiling. 2.2 Kritische Aspekte In transnationalen Konzernen spielt nicht nur die organisationale (d.h. hierarchisch angeordnete) Struktur des Unternehmens eine große Rolle: unterschiedliche Geschäftsprozesse auf Kapitel 2 - WISSENSMANAGEMENT Seite 21 verschiedenen Ebenen dieser Hierarchie beeinflussen einander über Querverbindungen, die somit orts- und zeitkritisch sind. Es entstehen wechselwirkende Abhängigkeiten, die viele Bausteine des Wissensmanagements stören könnten, wenn sie nicht richtig oder frühzeitig erkannt und behandelt werden. Eine sorgfältige Analyse all dieser Querverbindungen und deren Verwaltung ist sicherlich eine der größten Herausforderungen beim Erstellen eines Wissensmanagementkonzepts. Als besonders wichtig bei der Konzeption eines umfangreichen Informationssystems für große und geographisch verteilte Unternehmen können verschiedenartige Aspekte identifiziert werden, deren Ursachen aus unterschiedlichen Bereichen (z.B. Technik, Management, Gesellschaft, Kultur) herrühren und sich auf den nachhaltigen Erfolg des Wissensmanagement auswirken. Die wichtigsten - im Kontext der vorliegenden Arbeit erkannten und im nächsten Unterkapitel behandelten - kritischen Aspekte lassen sich in folgenden Problembereichen unterteilen: Unternehmensstruktur und Systemarchitektur o Einflüsse von Architektur und Darstellungsvarianten des Informationssystems gegenüber komplexer Unternehmensstrukturen. Projektmanagement und Sichtweisen o Kernfragen bei der Planung und unternehmerischer und technischer Sicht. Zielsetzung des Systems aus Technologien und Modularität o Sorgfältige Auswahl der zugrundeliegenden Technologien bei der Lösung von unterschiedlichen Teilproblemen (Kompatibilität und Standardisierung von Subsystemen). Wissensbausteine o Wissensidentifikation (Wissensbeschaffung und -entwicklung) o Wissenstransfer (Externalisierung und Internalisierung von Wissen) o Wissensweitergabe (Wissen als Machtfaktor und Einflußfaktoren auf die Mitarbeiter) o Wissensaufbewahrung (Selektion von neuem Wissen und dessen effiziente und effektive Aktualisierung und Wartung) o Wissensnutzen (Meßbarkeit des produktiven Einsatzes vom intellektuellen Kapital) Soziale und kulturelle Barrieren o Gesellschaftlich bedingte Barrieren in transnationalen Unternehmen. o Erkennung der Besonderheiten von unterschiedlichen Kulturgruppen und deren Einbindung an das System. 2.2.1 Unternehmensstruktur und Systemarchitektur Die allgemeine Problematik der Wissensadministrierung und des Wissenszugangs für transnationale Konzerne liegt in der Komplexität der Aspekte Struktur, Darstellung und insbesondere Transparenz. Ein weltweit verteiltes Unternehmen könnte sehr schnell Probleme mit der Überschaubarkeit des gesamten Systems bekommen. Dies würde zu Fehlentscheidungen führen, die eine effiziente und nachhaltige Umsetzung des Informationssystems verhindern, da elementare Fehler in der Struktur oder Darstellung während der Systemkonzeption sich sofort fortpflanzen Kapitel 2 - WISSENSMANAGEMENT Seite 22 und die komplex angeordneten Komponenten des Wissenslebenszyklus stören. Zu diesen Wissenskomponenten zählen, wie beispielsweise in [Rollett 2000] aufgezeigt: Organisation, Administration, Zugang, Speicherung, Anwendung, Teilung, Zustellung, Suche, Visualisierung, Kooperation und Kommunikation. Interne Wissenstransparenz im stark vernetzten System eines transnationalen Konzerns kann zum Beispiel mit der Hilfe von Wissenslandkarten, welche den systematischen Zugriff auf die verteilte Wissensbasis unterstützen, erreicht werden. Für solche Karten existieren viele Modellierungsansätze und bekannte Lösungsvorschläge, wie Wissenstopographien, geographische Informationssysteme, Wissensbestandskarten, Wissensmatrix, und andere. Die Verantwortung für eine passende interne Wissenstransparenz wird selten organisatorisch geregelt. In [Probst et al. 1999] wird empfohlen, die Architektur von Intranets oder Wissenslandkarten immer an den Bedürfnissen der potentiellen Wissensnutzer anzupassen und nicht einer reinen Informatiklogik zu folgen. 2.2.2 Projektmanagement und Sichtweisen Viele Probleme nach dem Einsatz von Wissensmanagementsystemen sind meist eine Folge von nicht erkannten bzw. schlecht eingeschätzten Aspekten während der Entwurfs- oder Konzeptionsphase. Aus unternehmerischer und technischer Sicht lässt sich bei der Konzeption eines Wissensmanagementsystems eine kritische Kernfrage zu jedem der folgenden - in [Bellinger et al. 2001b] auch ’Dimensionen’ genannt - Aspekte stellen: a) Auftrag Was versucht man zu erreichen? b) Wettbewerb Wie kann man einen Wettbewerbsvorteil erreichen? c) Leistung oder Performanz Wie werden Resultate geliefert? d) Änderungen Wie werden Änderungen bewältigt? Durch die gezielte Berücksichtigung dieser ’Dimensionen’ und deren zugehörigen Kernfragen während des Projektmanagements kann der Einsatz von Wissensmanagement die Fähigkeiten und Kapazitäten eines transnationalen Unternehmens verbessern. Wichtig hierbei ist die Erkennung des Wertes vom Wissensmanagement für das Unternehmen. In [Bellinger et al. 2001b] wird der Wert des Wissensmanagements direkt proportional zur Effektivität, mit der das Wissen Mitglieder eines Unternehmens bei täglichen Situationen und Entscheidungen unterstützt, gesetzt. Somit ist das Wissen keine passive, sondern eine durchaus aktive Komponente des Unternehmens, und genau als solches sollte man es betrachten. Ein Beispiel für die Bereiche, welche durch effizienten und effektiven Einsatz von Wissensmanagementsystemen verbessert werden können, gibt die im Jahr 2001 durchgeführte statistische Studie des Fraunhofer-Instituts für Produktionsanlagen und Konstruktionstechnik (IPK) in Berlin zum Thema Wissensmanagement. Daraus gewann man statistische Aussagen über mögliche Verbesserungsbereiche in Unternehmen nach dem zielorientierten Einsatz von Wissensmanagementsystemen [IPK 2001]. In [Tab. 2.1] werden die Ergebnisse dieser Studie gezeigt. Diese Tabelle gibt auch Auskunft über die unterschiedlich positionierte Prioritäten in Bezug auf administrative und technologiebasierte Zielsetzungen. So steht ein Produktivitätszuwachs an unangefochtener erster Stelle vor einem dichtbesiedelten Mittelfeld, welches aus den tatsächlich praktischen Kapitel 2 - WISSENSMANAGEMENT Seite 23 Zielobjekten (z.B. Systemtransparenz, Entscheidungshilfen) besteht. 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. Kundenstock, Geschäftsprozesse, Kosten-/Zeitersparnis, Produktivitätszuwachs Prozeßverbesserung Transparenz über Strukturen und Prozesse Kundenorientierung und Zufriedenheit Erleichterung von Entscheidungen und Prognosen Verbesserter Informationsaustausch Qualitätssteigerung Erfolg, Marktführerschaft Mitarbeiterqualifikation und –zufriedenheit Verbesserungen sind noch nicht feststellbar oder 50% 19% 18% 18% 17% 15% 13% 8% 7% 7% Tabelle 2.1: Verbesserungen durch Wissensmanagement [IPK 2001] Aus technischer Sicht hängen viele der kritischen Aspekte des Wissensmanagements in großen Unternehmen mit den spezifizierten Systemanforderungen zusammen. Aufgrund der organisationalen und geographischen Verteiltheit eines Konzernes, und infolgedessen der hohen Priorität der Systemtransparenz, sind technische Mechanismen notwendig, die eine optimale Nutzung des Wissens garantieren. Hierbei spielen Aspekte der Verfügbarkeit, Datensicherung und der Ausfallsprävention eine besondere Rolle. Weitere Stichworte in diesem Zusammenhang sind die Qualität und Nutzbarkeit Benutzerschnittstelle (Interface Usability), die technische Effizienz bzw. Performanz Systems (hier steht meistens die Geschwindigkeit im Mittelpunkt), die flexible Integration skalierbare Architektur des Systems, sowie die technische Voraussetzungen, um angeforderten Sicherheit zu genügen (Firewall, Vertraulichkeit der Wissensbestände, usw.). der des und der Die Existenz unterschiedlicher Sichtweisen oder Perspektiven, aus denen Wissensmanagement analysiert und verstanden wird, zu ignorieren, kann zu Mißerfolgen bzw. Fehlentscheidungen bei der Konzeption eines Wissensmanagementsystems führen. Hiermit sind die unterschiedlichen Interpretationsmöglichkeiten des Begriffs ’Wissensmanagement’, welche vor allem die Spezifikations- und die Entwurfsphase eines Projekts durch verschiedenartige (subjektive) Meinungen auf Managementebene beeinflussen können, gemeint. Grundsätzlich werden drei Sichtweisen identifiziert [Rollett 2000]: a) eine informationsorientierte, b) eine technologieorientierte und c) eine kulturorientierte Perspektive. Unternehmensleiter, welche den Bereich des Wissensmanagements lediglich unter der informationsorientierten Perspektive sehen, verbinden ihn oft mit einem einfachen ’Informationszugang’ bzw. ’Informationsfilterung’. Andere, die Wissensmanagement bloß unter dem technologischen Aspekt sehen, verknüpfen Wissensmanagement mit der ’Infrastruktur der Informationstechnologie’, d.h. sie sehen es als Integration von weltweit verteilten Systemen (z.B. Intranets, Suchmaschinen oder Data Warehouse Systeme). Die Schwerpunkte der Kapitel 2 - WISSENSMANAGEMENT Seite 24 kulturorientierten Perspektive liegen hingegen in der ’Kollaboration’ und im andauernden ’Lernen des globalen Unternehmens’. Wissensmanagement umfaßt aber alle drei Sichtweisen im gleichen Ausmaß. Diese Tatsache liegt daran, dass der Bereich von der Interdisziplinarität lebt und deshalb auch so interpretiert und angewendet werden sollte. Insbesondere für transnationale Unternehmen spielt die Verwaltung der stark verteilten Strukturen eine wichtige Rolle aus technologischer Perspektive. Die vorhandene modulare Struktur eines Konzerns impliziert meistens die Existenz von unterschiedlichen technologischen Systemarchitekturen. 2.2.3 Technologien und Modularität Wissensmanagementsysteme in großen und geographisch verteilten Unternehmen zeichnen sich dadurch aus, dass sie mehrere Technologiebereiche ausnützen können, um in der Praxis umgesetzt zu werden. Die Erkennung und zielgerichtete Anwendung dieser ’Subsysteme’ bzw. ’technologischen Module’ stellen auch einen sensiblen Aspekt dar, weil die dahinter liegenden Entscheidungskriterien sich direkt auf die Effektivität des Systems auswirken. Einige Beispiele für solche Module lassen sich wie folgt auflisten [Maier et al. 2001]: Wissensspeicher (im Sinne von erweiterten Document-Management-Systemen) Wissenstransfer (z.B. Yellow Pages) Meta-Suchsysteme (unterschiedliche Information Retrieval Mecahnismen) Push-orientierte Systeme Informationsdiensten) Visualisierungs- und Navigationssysteme (z.B. Knowledge Maps oder Hyperbolische Browsers). (z.B. intelligente Agenten bei abonnierten Die richtige Auswahl bzw. Kombination dieser technologischen Möglichkeiten stellen enorm wichtige Ansätze bei der Konzeption von Wissensmanagementsystemen für transnationale Konzerne dar. Aus der Sicht des Wissensmodells von [Probst et al. 1999] können unterschiedliche Wissensbausteine auch durch falsch eingeschätzte Technologien beeinflußt werden. Der nächste Abschnitt befaßt sich mit einigen der betroffenen Wissensbausteinen. 2.2.4 Wissensbausteine Als Hauptproblem bei der Wissensidentifikation in transnationalen Konzernen kann man die nicht vorhandene Wissenstransparenz der Wissensquellen angegeben. Damit kommen typische Fragen ins Spiel wie: Wer weiß was im Unternehmen? Wer hat wo und bei welchem Projekt gearbeitet? Wer hat das benötigte Wissen innerhalb oder außerhalb des Unternehmens? Werden diese Fragen nicht zufriedenstellend beantwortet, so deutet dies auf eine schlechte Nutzung der Ressourcen. Während des Prozesses der Wissensgenerierung sind vor allem kurzfristige Notwendigkeiten (beeinflussen den externen Wissenserwerb) und interne Notwendigkeiten (beeinflussen die interne Wissensentwicklung) ein Problem. Bei diesem Prozess sollte man nicht vergessen, dass intellektuelles Kapital personenorientiert und kontextbezogen ist. Außerdem soll die Vielfalt der Wissensressourcen nicht unberücksichtigt gelassen werden. Kapitel 2 - WISSENSMANAGEMENT Seite 25 Einen großen kritischen Bereich stellt auch die Wissenserfassung dar. Aus unternehmerischer Perspektive spielt hierbei die Wissens(ver)teilung (bzw. der Wissenstransfer) die wichtigste Rolle. Die mit dem Wissenstransfer verbundenen Prozesse sollen prinzipiell Wissen in Information transformieren (externalisieren) und vice versa (internalisieren). Die generelle Idee ist explizites Wissen in Information, und Information in Daten so zu konvertieren, dass es in eine global funktionierende Wissensbasis gespeichert werden kann. Die Schwierigkeit liegt hier in der Tatsache, dass Wissen nicht nur in Information beinhaltet ist, sondern auch in den Zusammenhängen zwischen Informationselementen (z.B. über Hyperlinks), in deren Klassifikation (wo Wissen überall gespeichert ist) und in deren Metadaten (Zusatzinformationen, wie z.B. der Autor eines Dokumentes). Relevante Aspekte in Bezug auf Wissenstransfer und dessen Bedeutung für das Wissensmanagement in großen Unternehmen, werden in [Maurer 1999] wie folgt auf den Punkt gebracht: „Weiters ist zu bemerken, dass Wissen Macht ist. Deshalb sind Personen oft nicht bereit ihr Wissen jedem weiterzugeben... komplett freier Wissensfluß innerhalb einer großen Organisation (...) ist unrealistisch: es ist notwendig die Privatsphäre zu respektieren, es ist auch notwendig einen gewissen Stolz auf Wissen zu respektieren, weshalb die Einführung von Wissensmanagement in Unternehmen ein schrittweise und sorgfältig geleiteter Prozeß werden soll. [Maurer 1999] 10.“ Eines der Ziele von Wissensmanagement ist also jedem Unternehmensmitglied klar zu machen, dass sein Wissen vom Rest der Organisation benötigt wird, und dass er selbst zu dem Wissen anderer kommen kann, um seine Arbeitseffizienz zu steigern [Tolen 1999]. Im Zuge einer Einführung des Wissensmanagements in transnationalen Konzernen, insbesondere bezüglich der Wissensnutzung (Wissensweitergabe und der Wissensteilung), kann man folgende - in [Disterer 2001] allgemein geltende - individuelle und soziale Barrieren identifizieren: a) Machtverlust (engl.: ’loss of power’), b) Preisgebung (engl.: ’revelation’), c) Verunsicherung (engl.: ’uncertainty“), und d) Motivation. Experten mit selten vorkommendem Wissen besitzen die höchste Reputation innerhalb der Firma. Ein Wissensmonopol führt eher zum Horten anstatt zum Transfer von Wissen [Disterer 2001]. Dieses Phänomen taucht bei mehreren Unternehmen auf, insbesondere in solchen Situationen, in denen die Sicherheit des Arbeitsplatzes vor Entlassung niedrig ist. Die Macht des Wissens spielt sodann eine vitale Rolle für eine Person, die ihr Wissen als eine Art Versicherung bewahrt, um die Arbeitsstelle nicht zu verlieren. Die Weitergabe von Wissen kann auch als persönliche Offenbarung interpretiert werden, denn durch die Bekanntgabe persönlichen Wissens gewinnt dieses einen subjektiv hohen “Note further that knowledge is power. Hence persons are often not willing to pass their knowledge to everyone… completely free flow of knowledge within a large organization (…) is unrealistic: it is necessary to respect privacy; it is also necessary to respect a certain pride in knowledge, hence introducing KM in corporate environment has to be a stepwise and carefully orchestrated process [Maurer 1999].” 10 Kapitel 2 - WISSENSMANAGEMENT Seite 26 Seltenheitswert. Wenn eine Anerkennung seitens der anderen Wissensnutzer nicht stattfindet, können Peinlichkeitsgefühle entstehen, die einen weiteren Transfer verhindern [Disterer 2001]. Auf der anderen Seite agiert die Verunsicherung bei manchen Personen, vor allem jungen Mitarbeitern, die nicht einschätzen können oder wollen, ob ihre Arbeitsresultate wertvolles Wissen für andere Personen darstellen. Schließlich taucht auch das Problem auf, dass viele Systembenutzer einen persönlichen Vorteil oder eine Belohnung nach der Wissensweitergabe (oder Speicherung) erwarten. Motivationsmechanismen sind hier notwendig, um ein Verantwortungs- und Gemeinsamkeitsgefühl für die Pflege der Wissensbasis zu fördern. Voraussetzung für eine gezielte Wissensbewahrung von Erfahrungen oder Informationen und Dokumenten sind große Managementanstrengungen. In einem transnationalen Konzern werden stündlich neue Erfahrungen gewonnen, die in Zukunft genützt und deswegen bewahrt werden sollten: Briefe, Berichte jeglicher Art oder Besprechungsprotokolle entstehen an unterschiedlichsten Orten. Die Herausforderung liegt hier in der Selektion zwischen den speicherwürdigen und nicht speicherwürdigen Bestandteilen. Die Leitregel lautet: ’nur das was in Zukunft für Dritte nutzbar sein könnte, verdient es auch bewahrt zu werden’. Wissensbewahrung stellt einen kontinuierlichen Prozeß dar, welcher durch andauernde Aktualisierungsanstrengungen gepflegt werden muß [Probst et al. 1999]. Ein weiterer kritischer Punkt in diesem Zusammenhang stellen die Entscheidungskriterien für die unternehmensgerechte physikalische Speicherungsart von Daten. Der Einsatz von Replikationsmechanismen kann für transnationale Unternehmen zu wesentlichen Verbesserungen in der Performanz des gesamten Informationssystems führen. Dieser Aspekt wird technisch vom Bereich des Datenmanagements gelöst, und wird deshalb in Kapitel 4 ’Datenmanagement’ ausführlich behandelt. Nicht selten wird von wissensbasierten Projekten gefordert, den Gesamtnutzen (d.h. der produktive Einsatz organisationalen Wissens zum Nutzen des Unternehmens) des Systems meßbar zu machen [Rollett 2000]. Dies ist aber in der Regel nur sehr schwer möglich oder nur partiell, da die Messung und Bewertung organisationalen Wissens zu den größten Schwierigkeiten gehört, die das Wissensmanagement heute zu bewältigen hat. Wichtig dabei ist eine klare Unterscheidung zwischen Messung des Nutzens und Messung der Leistung bzw. der Performanz. Die dafür nötigen Entscheidungskriterien sollen präzise und konkret auf technischer und administrativer Ebene des Unternehmens diskutiert und definiert werden. Ein entscheidender Durchbruch konnte in diesem Bereich bisher noch nicht erzielt werden [Probst et al. 1999]. Wissensrelevanz, -verteilung und -orientierung (Orientierung im Sinne von Zeit-, Orts- und Personenabhängigkeit) stellen in diesem Kontext wichtige Aspekte dar, weil die Inanspruchnahme und die Nutzung des Wissens durch Nutzungsgewohnheiten und Motivationsaspekte beeinflußt werden können [Röpnack et al. 1998]. Gewohnheiten und Motivation sind menschenbezogene Aspekte, welche stark an sozialen und kulturellen Aspekten gekoppelt sind. Dies gilt insbesondere für die starke geographische Verteilung eines transnationalen Unternehmens. 2.2.5 Soziale und kulturelle Barrieren Die in [Disterer 2001] identifizierten sozialen Barrieren des Wissensmanagements lassen sich wie folgt unterteilen: Sprache Kapitel 2 - WISSENSMANAGEMENT Seite 27 Konfliktvermeidung Bürokratie und Hierarchie inkoherente Paradigmen. Der linguistische Aspekt ist vor allem in weltweit operierenden Unternehmen äußert relevant. Hier spielt nicht nur der mehrsprachige Informationszugang, sondern auch die Festlegung einer ’gemeinsamen Sprache’ (im Bereich der Wissensorganisation auch ’kontrolliertes Vokabular’ genannt), um Wissen in einer global verständlichen Form zu organisieren, eine große Rolle. Mit Konfliktvermeidung werden die Situationen in konservativen Gesellschaften gemeint, in denen ’gewagte Gedanken’ zu persönlichen Unannehmlichkeiten führen können. Als Beispiel der bürokratischen und hierarchischen Barriere wird in [Disterer 2001] das komplette Fehlen des Wissenstransfers in manchen zu strikten Hierarchien, welche abteilungsübergreifende Kommunikation verbieten, angegeben. Unter ’inkoherente Paradigmen’ versteht man vorhandene Inkoherenzen zwischen persönlichen Gedankenweisen und Unternehmensregeln. Das rechtzeitige Erkennen und die korrekte Behandlung jeder dieser sozialen Barrieren ist bei der Konzeption eines wissensbasierten Informationssystems für transnationale Konzerne unumgänglich. Am Ende dieses Abschnittes sollen nun die nicht minder kritischsten Aspekte im kulturellen Bereich kurz erörtert werden. Diese hängen stark mit den individuellen und sozialen Aspekten zusammen. Die Problematik beim Vorhandensein von kulturellen Barrieren wird anhand des in [Nonaka et al. 1995] vorgelegten Beispiels klargemacht. Es wird untersucht, inwiefern das japanische Wissensmanagement sich von westlichen Ansätzen unterscheidet. In [Nonaka et al. 1995] werden die Unterschiede durch drei Punkte verdeutlicht. Erstens findet die Interaktion zwischen implizitem und explizitem Wissen im Westen überwiegend auf individueller Ebene, in Japan vor allem auf Gruppenebene statt. Zweitens legt die westliche Unternehmenspraxis den Mittelpunkt auf das explizite Wissen, japanische Unternehmen auf Bildsprache, Intuition, usw. Schließlich charakterisieren sich japanische Unternehmen durch hohe Informationsredundanz, vieldeutige Unternehmensziele, Autonomie auf Teamebene und Vielfalt durch funktionsübergreifende Projektteams. 2.3 Schlußbemerkung Als vor über zwanzig Jahren Peter Drucker in seinem Buch ’The Age of Discontinuity’ schrieb, dass die größte Managementaufgabe des nächsten Jahrhunderts in dem Produktivmachen der Wissensarbeit liegen würde, genauso wie im Jahrhundert zuvor in dem Produkivmachen der Handarbeit, konnten nur wenige erahnen, wie zutreffend seine Prognose sein würde [Drucker 1978]. Mit dem Wandel von einer Industriegesellschaft zu einer Wissensgesellschaft ist nun dem Wissen – aus unternehmerischer Sicht - eine höhere Bedeutung zugeordnet worden. Dies heißt aber nicht, dass die eine Gesellschaftsform durch die andere ersetzt wird. Es heißt, dass Information und Wissen zusammengehören. Auf der einen Seite, was der Mensch weiß ist stets das Ergebnis eines Informations- oder Mitteilungsprozesses. Auf der anderen, durch den Informationsprozeß wird Wissen allgemein verfügbar gemacht. Die moderne Wirtschaft, charakterisiert durch Wissen und weltweit dezentralisierte Strukturen, verlangt von großen Unternehmen global zu arbeiten, zu kooperieren und zu konkurrieren. Wissen liegt in Organisationen vielmehr flüchtig, fragmentiert, verteilt und vor allem eingebettet in Prozessen und Produkten vor, und gewinnt durch deren Nutzung an Wert. Erfolgreiche Konzerne müssen in der Lage sein, ihre ’Corporate Identity’ und ihre Hauptkompetenzen unabhängig von der geographischen Verteilung sowie sprachlichen und kulturellen Barrieren hervorzuheben und anzubieten. Dies ist zu schaffen, wenn Konzerne Kapitel 2 - WISSENSMANAGEMENT Seite 28 problemspezifisch Wissen generieren und bewahren, oder vorhandenes Wissen produktiv transferieren. Die organisationale Wissensbasis eines großen und geographisch verteilten Unternehmens erfordert dafür sorgfältige und nutzbringende Pflege, Verteilung und Erweiterung. Mittlerweile akzeptieren viele Unternehmen, dass die Technologie nur teilweise eine Rolle bei erfolgreichen Wissensmanagementinitiativen spielt. Ein großer Teil wird durch Organisation und strukturelle Maßnahmen gedeckt. Wichtig dabei ist der Technologie nicht weniger Bedeutung beizumessen, sondern zu verstehen, dass vor allem für große und verteilte Organisationen, die Auseinandersetzung mit den Werkzeugen des Wissensmanagements eine direkte und permanente Bindung mit verwandten Disziplinen verlangt. Web-basierte Technologien erlauben heutzutage die geographischen Barrieren zu sprengen, indem sie plattformunabhängige Mechanismen, spezialisierte Werkzeuge und allgemeingültige Standards zur Verfügung stellen. Um den Umfang und die Wichtigkeit anderer Managementdisziplinen für transnationale Konzerne näher zu erläutern, werden im nächsten Kapitel die Grundlagen des Informationsmanagements behandelt. Das Kapitel soll einen Überblick in die Thematik aus technologischer Sicht verschaffen und dabei insbesondere die prinzipiellen Eigenschaften, Anforderungen und Problembereiche von verteilten Systemen in großen und geographisch verteilten Konzernen berücksichtigen. Kapitel 3 - INFORMATIONSMANAGEMENT Seite 29 Kapitel 3 Informationsmanagement „You'll never have all the information you need to make a decision – if you did, it would be a foregone conclusion, not a decision." 11 David Mahoney Die Wichtigkeit und die Bedeutung von Informationsmanagement nimmt in der heutigen globalisierten Welt, und vor allem in der nun so stark elektronisch vernetzten Wirtschaftswelt, immer mehr zu. Dies betrifft sowohl multinationale Organisationen als auch regional und international agierende Institutionen, die sich in zunehmendem Maße der modernen Informations- und Kommunikationstechnik bedienen, um ihre grenzüberschreitenden Tätigkeiten zu bewältigen. Wie in Kapitel 2 ’Wissensmanagement’ bereits erwähnt, beschäftigt sich das Informationsmanagement hauptsächlich mit Wissensvermittlungsprozessen innerhalb eines Unternehmens. Dieses Kapitel behandelt die technologischen Schwerpunkte vom Informationsmanagement, aus der Sicht großer und geographisch verteilter Unternehmen. Allgemeine Eigenschaften verteilter Systeme, informationstechnisches Wissensmanagement und die Grundlagen der Intranettechnologie bilden somit das Kernstück des ersten Abschnitts. Anschließend werden die Problembereiche und kritischen Aspekte in großen verteilten Systemen aufgezeigt. 3.1 Allgemeines Aus technologischer Perspektive bilden Informationssysteme das Kernstück des Informationsmanagements. In diesem Abschnitt werden die grundsätzlichen Definitionen und Eigenschaften von verteilten Systemen dargestellt, und deren Zusammenhang mit informationstechnischem Wissensmanagement erläutert. Informationsmanagement umfaßt nicht nur Entscheidungskriterien auf der oberen Managementebene eines Unternehmens, sondern auch die Behandlung diverser Kommunikationstechnologien, die mit der Funktionalität eines Informationssystems koexistieren sollen. Der letzte Teil dieses Abschnitts präsentiert somit einen kurzen Überblick in das Thema ’Intranet’, die zugrundeliegende Technologie, die für die Systemkonzeption des im Kapitel 1 beschriebenen technischen Konzerns und somit für den Gestaltungsbereich dieser Diplomarbeit erforderlich ist. Je nachdem, aus welcher Perspektive die Begriffe Management und Information definiert und interpretiert werden, lassen sich unterschiedliche Bedeutungen von Informationsmanagement erkennen. Aus diesem Grund (wie auch für den im Kapitel 2 behandelten Begriff Wissensmanagement zutreffend) ergibt sich eine terminologische Differenzierung von Informationsmanagement in verschiedenen Disziplinen, welche das Finden einer allgemein gültigen Definition erschwert. „Man wird niemals all die gebrauchte Information haben, um eine Entscheidung zu treffen – hätte man sie, wäre dies eine vorherbestimmte Schlußfolgerung und nicht eine Entscheidung." 11 Kapitel 3 - INFORMATIONSMANAGEMENT Seite 30 3.1.1 Informationsmanagement In [Davis et al. 1993] wird Informationsmanagement als holistische Disziplin, die aus informationswissenschaftlicher Sicht mehrere Bereiche abdeckt, wie folgt definiert: „... Informationsmanagement (…) ist im Wesentlichen eine neue Geschäftsfunktion mit der Aufgabe, organisationale Informationsanforderungen zu definieren, Informationsinfrastruktur und Informationssystemapplikationen zu planen und aufzubauen, das System zu betreiben, und diese Aktivitäten zu organisieren, belegen und verwalten [Davis et al. 1993] 12.“ In [Küng 1999] wird Informationsmanagement als ein schwer greifbarer Begriff im Zentrum mehrerer Tätigkeitsbereiche beschrieben. Die Grafik in [Abb. 3.1] stellt diesen Sachverhalt dar. Wissensmanagement Organisation Input IT E-Commerce Kunde IM Output Umwelt Prozeßmanagement Data Warehouse Virtual Communities Online-Marketing Abbildung 3.1: Informationsmanagement nach [Küng 1999] In diesem Zusammenhang bietet [Küng 1999] eine eher Begriffsinterpretation an, durch die Informationsmanagement als technologisch basierte „effizientes digitales Handling sämtlicher relevanten Informationen im Unternehmen und dessen Umfeld durch konsequente Nutzung der Informationstechnologie [Küng 1999]“ definierbar wäre. Die Unvollständigkeit dieser Definition wird dort erkannt und damit begründet, dass auch weitere wichtige Aspekte, wie zum Beispiel Kundenorientierung, Prozeßmanagement, E-Commerce, usw., nicht berücksichtigt wurden [Küng 1999]. Informationsmanagement steht also, aus technischer Sicht, für eine Vielzahl von Werkzeugen und Konzepten der Informationstechnologie, die alle daran beteiligt sind, eine effektive digitale Be- und Verarbeitung sämtlicher im Unternehmen und seinem Umfeld anfallender Informationen zu realisieren. Als Teilbereich der Unternehmensführung eines geographisch verteilten Konzerns beinhaltet das Informationsmanagement einerseits allgemeine Gestaltungsund Führungsaufgaben im Bereich der Informationswirtschaft und andererseits die Konzeption und Verwaltung des Informationssystems unter dem angemessenen Einsatz moderner “... information management (...) is essentially a new business function with responsibility to define organizational information requirements, plan and build an information infrastructure and information system applications, operate the system, and organize, staff, and manage these activities [Davis et al. 1993].” 12 Kapitel 3 - INFORMATIONSMANAGEMENT Seite 31 Informations- und Kommunikationstechnologien innerhalb des Konzerns. Die Umsetzung eines Informationssystems wird somit durch die daran beteiligten Personen, die Organisationsstrukturen des Unternehmens und die eingesetzte Technologie bestimmt. Dieses Kapitel behandelt jedoch das Thema nur aus dem technologischen Blickwinkel eines großen und geographisch verteilten Unternehmens. 3.1.2 Informationssysteme Als praktischer Einstieg in die Thematik der Informationssysteme soll zunächst der Begriff System definiert werden. Die sehr aussagekräftige, in [Bellinger et al. 2001c] zitierte Definition des österreichischen Biologen Ludwig von Bertalanffy lautet: „Ein System ist ein Wesen, das seine Existenz durch die wechselseitige Interaktion seiner Teile aufrechterhält. [Bellinger et al. 2001c] 13.“ Den wesentlichen Teil in dieser Definition liefert die Betonung auf ’wechselseitige Interaktion’, also die Tatsache, dass etwas zwischen den Teilen passiert. Für ein Informationssystem eines verteilten Unternehmens erweitert sich dieser Sachverhalt, da die Interaktion zwischen Systemkomponenten transparent über Zeit und Raum stattfinden sollte. Typisch für ein solches Informationssystem und von besonderer Bedeutung für die in dieser Arbeit untersuchten transnationalen Konzerne, ist die duale Präsenz des Wissens: einerseits in der Datenbank als deklaratives Wissen und andererseits als prozedurales Wissen in den Applikationen. Solche Systeme sind meist sehr mächtig und enthalten riesige Mengen an Information [NetAcademy 1999]. 3.1.3 Verteilte Systeme Das hervorstechende Charakteristikum eines Informationssystems für einen transnationalen Konzern liegt in der ’Verteiltheit’. Ein Unternehmen dieser Art weist meist eine Verteilung auf unterschiedlichen (strukturellen oder funktionalen) Ebenen: Eigentümer, Unternehmensbereiche, Tochtergesellschaften oder Zweigniederlassungen, Geschäftsprozesse, Produktions- oder Fertigungsstandorte, und andere. Somit ergeben sich komplex strukturierte Wissensgebiete, die (zwar nicht nur, aber meistens) über verteilte Systemarchitekturen lösbar sind. In [Mullender 1989] wird eine technische Definition über verteilte Systeme gegeben: „Ein verteiltes System ist ein System mit vielen Verarbeitungselementen und vielen Speicherungsvorrichtungen, die über ein Netzwerk miteinander verbunden sind [Mullender 1989] 14.“ Eine aufschlußreiche Definition, die sich zwar auf Betriebssysteme konzentriert, aber gleichzeitig auf das Hauptmerkmal jedes verteilten Systems hinweist und dies erörtert, gibt [Tanenbaum et al. 1985] wie folgt an: „Ein verteiltes Betriebssystem ist eines, das für seine Benutzer wie ein gewöhnliches zentralisiertes Betriebssystem aussieht, aber auf mehrfache, „A system is an entity which maintains its existence through the mutual interaction of its parts [Bellinger et al. 2001c].“ 14 „A distributed system is a system with many processing elements and many storage devices, connected together by a network [Mullender 1989].“ 13 Kapitel 3 - INFORMATIONSMANAGEMENT Seite 32 unabhängige CPUs läuft. Der Schlüsselbegriff hier ist die Transparenz, mit anderen Worten, der Gebrauch mehrfacher Prozessoren sollte unsichtbar (transparent) für den Benutzer sein. Eine andere Weise, um dieselbe Idee auszudrücken, ist zu sagen, dass der Benutzer das System als einen ‚virtuellen Uniprozessor’, und nicht als eine Ansammlung unterschiedlicher Maschinen, betrachtet [Tanenbaum et al. 1985] 15.“ Das gleiche Prinzip kann man aus der sehr oft zitierten, in [Mullender 1989] als Spruch von Lamport wiedergegebene Definition gewinnen. Demzufolge hörte man Lamport einmal sagen, dass ein verteiltes System jenes ist, in dem man durch den Ausfall einer Komponente von der man bisher nichts wußte, in der Arbeit beeinträchtigt werde [Tanenbaum et al. 1985]. 3.1.4 Internationale Informationssysteme Von größerer Bedeutung für die vorliegende Arbeit ist aber eine Definition für ein verteiltes Informationssystem aus der Perspektive transnationaler Konzerne. Eine interessante Definition für ein Internationales Informationssystem, manchmal auch unter dem Namen corporate information system bekannt, findet man in [Lehmann 1995]. Im Artikel wird auf die Notwendigkeit hingewiesen, zwischen ’internationalen’ und ’verteilten’ Informationssystemen prinzipiell und funktionell zu unterscheiden. Internationale Informationssysteme verfolgen den strategischen Ansatz international tätiger Unternehmen und werden in [Lehmann 1995] wie folgt definiert: „'Internationale Informationssysteme' werden als verteilte Informationssysteme definiert, welche gleichartige Geschäftsaktivitäten auf hoch unterschiedlichen Umgebungen unterstützen, die häufig über Ländergrenzen hinweg gefunden werden. Sie unterscheiden sich somit von Informationssystemen, welche unterschiedliche Geschäftsaktivitäten oder –funktionen unterstützen, die per Definition verschiedenartig sind, obgleich sie in einem oder mehreren Standorten, national oder international sind [Lehmann 1995] 16.“ 3.1.5 Systemarchitekturen für transnational tätige Konzerne Aus der Analyse diverser Modelle für Internationale Informationssysteme identifiziert man drei generische Systemarchitekturen, die sich in unterschiedlichem Maße auf lokale Notwendigkeiten und globale Einflüsse konzentrieren [Lehmann 1995]: a) Zentralisierte Architekturen ignorieren meist die lokale Vielfalt einzelner Standorte und eignen sich deshalb für Unternehmen, deren Geschäftsstrategie durch eine globale Organisationskontrolle und eine lokale Autonomie charakterisiert sind (z.B. reine Exportunternehmen oder Franchise Firmen). „A distributed operating system is one that looks to its users like an ordinary centralized operating system, but runs on multiple, independent CPUs. The key concept here is transparency, in other words, the use of multiple processors should be invisible (transparent) to the user. Another way of expressing the same idea is to say that the user views the system as a ‘virtual uniprocessor’, not as a collection of distinct machines [Tanenbaum et al. 1985].“ 16 “'International Information Systems' are defined as distributed information systems which support similar business activities in highly diverse environments commonly found across country boundaries. They are thus distinguished from information systems which support different business activities or functions, which are different by defintion, whether they are in single or multiple locations, national or international [Lehmann 1995].” 15 Kapitel 3 - INFORMATIONSMANAGEMENT Seite 33 b) Autonome Architekturen charakterisieren sich durch die getrennte Nutzung heterogener Systeme in dezentralisierten Standorten, sind deshalb nicht auf global geltende Einflüsse und Zusammenhänge spezialisiert und eignen sich für Firmen mit sehr hoher lokaler Autonomie (z.B. multinationale Unternehmen). c) Integrierte Architekturen ermöglichen eine sehr hohe globale und eine sehr hohe lokale Kontrolle durch ausgeglichene Systeme, deren Kern zwar überall gleich ist (oder leicht angepaßt) aber unterschiedliche lokale Elemente mit einbezieht. Integrierte Systeme bilden also eine generell ausgeglichene Kontrolle ab, was der Organisation einer transnationalen, stark vernetzten Firma entspricht. In [Lehmann 1995] werden solche Organisationformen Heterarchien genannt. Heterarchien sind, wie in [Reihlen 1996] gezeigt, pluralistische und flexible Organisationsmodelle, die gleichzeitig die Vorteile der Organisationshierarchie mit der dezentralisierten und problemorientierten Wissensstruktur verbindet. Indem die Organisationsstruktur schwächer formalisiert wird, erhöht sich die Freiheit bzw. Autonomie der einzelnen Unternehmensmitglieder. Dies erleichtert den Informationstransfer durch das gesamte Unternehmen, und somit kann sich die Effizienz wissensbasierter Systeme erhöhen. 3.1.6 Informationstechnisches Wissensmanagement Wie bereits im Kapitel 2 ’Wissensmanagement’ aufgezeigt, besteht das Ziel des Wissensmanagements, unter anderem, aus der Bewahrung, Förderung, (Ver)teilung und Erweiterung individuellen Wissens und dessen Transfer zwischen Menschen bzw. zwischen Mensch und Maschine. Für transnationale Konzerne wurde auch die Berücksichtigung von unterschiedlichen kritischen Aspekten im organisatorischen, technischen, sozialen und kulturellen Bereich bei der Konzeption eines wissensbasierten Systems diskutiert. In [Maurer et al. 2001] und [Tochtermann et al. 2000] werden die informations-technischen Aspekte des Wissensmanagements präsentiert. Dabei wird unter anderem auf den Begriff Unternehmensgedächtnis, d.h. die idealerweise vollständig computerisierte Abbildung von Mitarbeiterwissen in einem Unternehmen, Bezug genommen. Das Ziel des Aufbaus und der Wartung des Unternehmensgedächtnisses ist es, das Wissen informationstechnisch verarbeitbar, auffindbar und transferierbar zu machen. Dabei wird das intellektuelle Kapital des Unternehmens (oder zumindest Teilbereichen davon) regelmäßig und systematisch in einem üblicherweise vernetzten Computersystem gespeichert. Diese Sichtweise des Informationsmanagements kann also für transnationale Konzerne als eine Menge vernetzter Zugangsportale interpretiert werden, durch die das gesamte Wissen des Unternehmens handhabbar wird. Hierfür wird in [Tochtermann et al. 2000] auf zwei unterschiedliche Sichtweisen des informationstechnischen Wissensmanagements hingewiesen: a) Die prozessorientierte Sicht versucht das Wissen auf unternehmensrelevante Prozesse anzuwenden, um diese zu optimieren bzw. zu verbessern. b) Die produktorientierte Sicht betrachtet das menschliche Wissen als Objekt, und beschäftigt sich mit seiner computergestützten Pflege, Bereitstellung, Auffindung und Nutzung. Eine andere, etwas strengere Unterteilung in der Anwendung von Wissensmanagement findet man, laut [Remus et al. 2000], in Hinblick auf die strategische Intention des Systems. Man Kapitel 3 - INFORMATIONSMANAGEMENT Seite 34 unterscheidet dabei zwischen portal-, gemeinschaft- und prozeßorientierten Strategien17. Der Mittelpunkt portalorientierter Strategien liegt in der Integration von Datenbanken und deren verschmolzener Darstellung über ein standardisiertes User Interface, d.h. über ein Portal. Gemeinschaftsorientierte Strategien konzentrieren sich auf die Verwaltung von Gemeinschaften, die durch ein gemeinsames kollaboratives Ziel charakterisiert sind, d.h. sie verfolgen in der Regel die gemeinsame Ansammlung, Kommentierung, Diskutierung und Evaluierung von geschäftsrelevanten Informationen. Im Gegensatz zu den zwei ersten Möglichkeiten, streben prozeßorientierte Strategien nach einer optimierten Versorgung von aufgabenrelevantem Wissen innerhalb eines unternehmenspezifischen Geschäftsprozesses, d.h. die Mitarbeiter werden nur mit den Wissenseinheiten versorgt, die sie für die Lösung ihrer aktuellen Aufgaben gebrauchen können. Für die optimale Nutzung von Wissen innerhalb eines Unternehmens werden in [Maurer et al. 2001] die vier Komponenten Unternehmensgedächtnis, Wissensretrieval, Wissenstransfer und Wissensvisualisierung hervorgehoben. Um Informationen und Wissen zugänglich zu machen, werden oft sogenannte Unternehmensportale (Enterprise Information Portals) eingesetzt, wobei [Maurer et al. 2001] auf die Tatsache hinweisen, dass diese Zugangsmöglichkeiten in Zukunft nicht als eine Stelle des Zugriffs18, sondern vielmehr als eine Stelle des Austausches19 Bedeutung gewinnen werden. Damit ist der Einsatz von zusätzlichen Mechanismen gemeint, die sowohl eine verbesserte Wissensauffindung ermöglichen als auch eine optimale - und qualitätsgesicherte – Wissenseinbringung (Beschaffung bzw. Erzeugung) und fortgeschrittene Kollaborations- und Kommunikationswerkzeuge unterstützen. Darüber hinaus spielen moderne Technologien und Methoden der Navigationsdarstellung und Wissensvisualisierung eine zunehmend bedeutende Rolle im technischen Bereich des Wissensmanagements [Maurer et al. 2001]. Die Bedeutung der Behandlung des Themas ’Informationstechnisches Wissensmanagement’ liegt für diese Arbeit in den technischen Bereichsüberlappungen von Wissensmanagement und Informationsmanagement. Der gemeinsame Nenner beider Disziplinen wird durch das Ziel, Wissen bzw. Information interaktiv unter Verwendung von Informationstechnologien zu transferieren, dargestellt. Für transnationale Konzerne kommen aus informationstechnischer Sicht nur Technologien in Frage, deren grundsätzliche Eigenschaften die charakteristischen Anforderungen solcher Unternehmen erfüllen. Die technologische Lösung, die sich für das in dieser Arbeit zu konzipierende Informationssystem am besten eignet, soll u.a. plattformunabhängig und frei vernetzbar sein, direkten Zugang ins Internet erlauben und eine für ’Unbefugte’ nicht sichtbare Wissensbank über ein standardisiertes User Interface zugänglich machen. Die dafür gewählte Lösung ist das Intranet und wird im nachfolgenden Abschnitt dargestellt. 3.1.7 Intranet Um die Effizienz der Ausübung von Informationsmanagement in transnationalen Konzernen gewährleisten zu können, ist die Nutzung moderner Kommunikations- und Informationstechnik unumgänglich. Hierbei spielen zum Beispiel Intranets eine besonders wichtige Rolle. Intranets unterstützen die Bereitstellung, den Abruf und den Austausch von Information innerhalb eines Unternehmens, d.h. für nicht autorisierte Benutzer ist die dahinter liegende Wissensbank unsichtbar und unerreichbar. “… portal-oriented, community-oriented and process-oriented strategies… [Remus et al. 2000]” “… single points of access… [Maurer et al. 2001]“ 19 “… single points of exchange… [Maurer et al. 2001]“ 17 18 Kapitel 3 - INFORMATIONSMANAGEMENT Seite 35 Ein Intranet baut auf dieselben Technologien auf und nutzt dieselben Dienste wie das Internet. Es stellt somit das Internet auf Unternehmensebene dar. In dieser Diplomarbeit wird der verwendete Intranetbegriff etwas eingeschränkt, da er sich in Zusammenhang mit dem zu untersuchenden Informationssystem für transnationale Konzerne nur auf einen Dienst des Intranets bezieht. Dieser Dienst ist im Internet als World Wide Web (WWW) bekannt, und für fast jedes Betriebssystem verfügbar. Wichtige Gründe für die aktuelle Popularität des World Wide Web sind die einfache Navigation, die Benutzerfreundlichkeit und die Konsistenz der Schnittstelle zu anderen weitverbreiteten Diensten und Protokollen (z.B. FTP oder Telnet) über fast jeden Browser. Das World Wide Web hat sich mittlerweile als die Standardlösung für Informations- und Transaktionssysteme etablieren können, und kann als ein ’Hypermediasystem’ angesehen werden, denn die dadurch ausgetauschten Informationen können nicht nur aus Text-, Grafik-, Video- oder Audiodaten bestehen, sondern auch aus deren Kombinationen. In [Nanfito 1996] werden die oben erwähnten technischen Eigenschaften eines Intranets in einem Satz zusammengefaßt und hier, wie folgt, als Definition angegeben: “Intranets sind Informationsnetzwerke eines Unternehmens, die Technologien des World Wide Web und die Internetprotokolle Computerkommunikation nutzen [Nanfito 1996] 20.” die der Weiters betrachtet [Nanfito 1996] das Intranet nicht als isolierte Technologie, sondern bringt das Wort Intranet auch mit Kommunikation, Informationsmanagement und Analyse von Arbeitsabläufen in Verbindung. Optimal implementierte Intranets fördern den Prozeß des Wissenstransfers und die Mitarbeiterkollaboration durch die Rationalisierung der Kommunikation und des Informationszugriffs. Insbesondere im Bereich der automatisierten Kommunikationsförderung finden Intranetlösungen weitverbreitete Anwendung. Beispiele für hierfür implementierte Applikationsformen sind Email-, Chat- oder VideoconferencingSysteme. Wie bereits oben erörtert, versuchen Intranetkonzepte einen intern abgesicherten Zugriff auf die im Unternehmen vorhandenen Informationen über einheitliche Benutzerschnittstellen zu ermöglichen. Somit ist aber das Problem einer effizienten Informationsverwaltung noch nicht gelöst, da Intranetlösungen meist auf vorgegebenen Strukturen aufbauen. Infolgedessen wird an dieser Stelle darauf hingewiesen, dass die kritischen Anforderungen der verteilten Wissensorganisation (d.h. eine dem Unternehmen angemessene Informations- bzw. Wissensstrukturierung) in transnationalen Konzernen allein durch eine Intranetplattform nicht erfüllt werden können. Die wichtigsten Eigenschaften und kritischen Aspekte verteilter Informationssysteme sowie unterschiedliche Sichtweisen, allgemeine Qualitätskriterien, und Vor- und Nachteile gegenüber zentralen Lösungen werden im folgenden Abschnitt und in der Schlußbemerkung dieses Kapitels präsentiert und analysiert. 3.2 Kritische Aspekte verteilter Informationssysteme Die geographisch und funktionell verteilte Organisation eines transnationalen Konzerns überlappt sich in Gestalt und Zielsetzung mit den allgemein geltenden Organisationsaspekten für die Konzeption verteilter Informationssysteme. Die Charakteristika ’Verteiltheit’ und ’Vernetzung’ sind in unterschiedlichen Bereichen eines technischen Konzerns - wie “Intranets are corporate information networks using the technologies of the World Wide Web and the computer communication protocols of the Internet [Nanfito 1996].” 20 Kapitel 3 - INFORMATIONSMANAGEMENT Seite 36 beispielsweise aus der Fallstudie [Hribernik et al. 1999] ersichtlich – u.a. durch folgende Merkmale erkennbar: - geographisch verteilte aber zusammenhängende Unternehmensbereiche - verteilte Eigentümerstruktur - verteilte und vernetzte Innovationsprozesse - Standortverteilung von Produktions- oder Fertigungsstätten - geographisch verstreute Wissensgebiete Nicht nur die ständigen Zusammenschlüsse von Organisationen zu großen Konzernen, sondern auch das Outsourcing von Unternehmensaufgaben und die zunehmende politische und wirtschaftliche Globalisierung beeinflussen kontinuierlich die Anforderungen, die an verteilte Informationssysteme gestellt werden. Eine merkbare Tendenz bei der Konzeption von Informationssystemen führt daher weg von zentralisierten Systemlösungen. Durch ein integriertes bzw. verteiltes Informationssystem können Unternehmensmitarbeiter nicht lediglich Zugriff auf Applikationen und Dienste des lokalen Teilsystems haben, sondern auch auf jenes Wissen außerhalb der Tochterfirma bzw. des Teilbereichs - welches zum gesamten intellektuellen Kapital des Konzerns zählt - effizient und transparent erreichen. Damit entsteht die besondere Herausforderung an die Informationstechnologie, Information und Wissen auch bei geographisch verteilten Humanressourcen und Wissenseinheiten über sehr große Distanzen effizient und effektiv verwalten zu können. Die kritischen Aspekte bzw. Bereiche, welche bei der Konzeption eines Informationssystems für transnationale Konzerne eine besonders wichtige Rolle spielen, lassen sich, wie folgt, unterteilen und stellen die Hauptthemen der nächsten Abschnitten dar: Unternehmensweites Informationsmanagement: Dies beinhaltet die sorgfältige Analyse der Anforderungen an die Informationsaufbereitung in stark vernetzten Systemen und der Einflüsse der Dimensionen Ort, Anwendung, Zeit, Bedarf, Benutzer, Ziele, Sicherheit und Kosten. Verteilte Systeme: Hierbei spielen Entwurfsziele, Haupteigenschaften und Qualitätskriterien eines verteilten Systems eine wichtige Rolle. Der Schwerpunkt liegt hierbei im Begriff ’Transparenz’ und dessen unterschiedlichen Typen (Orts-, Migrations-, Zugriffs-, Replikations-, Nebenläufigkeits-, Parallelitäts-, Skalierungs- und Performanztransparenz). Zuverlässigkeit und Stabilität: Gemeint sind damit Verfügbarkeit, Korrektheit und Fehlertoleranz eines Systems. Einflüsse aufgrund starker geographischer Verteilung: Die Einflüsse und deren Ursachen sind auf lokaler und auf globaler Ebene identifizierbar. Hier spielen nicht nur technische, sondern ebenfalls soziale und kulturelle Aspekte bei der Planung und Durchführung des Systems eine wichtige Rolle. 3.2.1 Unternehmensweites Informationsmanagement Hinsichtlich vernetzter Systeme lassen sich laut [Grosse 1996] unterschiedliche Anforderungen an ein unternehmensweites Informationsmanagement identifizieren. Informationsaufbewahrung sollte ortsgerecht bzw. anwendungsgerecht vonstatten gehen, d.h. möglichst lokal zur Verfügung stehen. Anwendungsabhängiges Informationsmanagement stellt Kapitel 3 - INFORMATIONSMANAGEMENT Seite 37 somit sehr hohe Ansprüche an die gewählte Infrastruktur, da Informationen in Abhängigkeit eines fluktuierenden Anwendungskontexts migriert oder repliziert werden können (z.B. große Konstruktionszeichnungen, die während ihrer Erstellung zufolge eines beschleunigten Fertigungsprozesses lokal verfügbar gemacht werden müssen) [Grosse 1996]. Das Informationssystem soll auch eine zeitgerechte Akquisition von Informationen sicherstellen, um langandauernde Transfermechanismen zum Zeitpunkt des Informationsbedarfs zu vermeiden. Darüber hinaus sollten Informationen lokal in einer für den Benutzer angemessenen Form, d.h. bedarfsgerecht bzw. anwendergerecht, zur Verfügung stehen. Bezüglich einer problemspezifischen Interpretation von abstrakt definierten Daten (implizitem Wissen), sollte das Informationssystem dem Benutzer die Möglichkeit bieten, den Abstraktionsgrad der Informationen variabel zu gestalten (’Transformationsdienste’). Hierbei ist das Problem gemeint, dass Informationen mit niedrigem Abstraktionsgrad zwar für die Anwendung, jedoch oft nicht für den Anwender geeignet erscheinen. Dieses Problem macht unterschiedliche anwendergerechte Bearbeitungsformen für die entsprechenden Informationen notwendig. Für transnationale Konzerne besonders zutreffend könnten verschiedenartige Unternehmensbereiche unterschiedliche Teilinformationen benötigen, die möglicherweise nur im direkten Zusammenhang mit anderen Datenbeständen verfügbar sind. Ein Zugriff auf die gewünschten Teilinformationen könnte über adaptive und dynamisch erzeugte Navigation durch alle in Frage kommenden Objekte erfolgen. Deshalb ist es von großer Bedeutung, die Informationen zielgerichtet entsprechend ihres Anwendungszwecks strukturieren zu können [Grosse 1996]. Ein weiterer kritischer Aspekt bei der Informationsadministrierung stellt eine sicherheitsgerechte Transferstrategie dar. Die konzipierte Systemlösung sollte Mechanismen beinhalten, welche Sicherheitsanforderungen gegenüber Dritten berücksichtigen und unterschiedliche Zugriffsrechte auf Informationen innerhalb des Intranets verwalten. Desweiteren wird in [Grosse 1996] eine sehr wichtige Anforderung wirtschaftlichen Planens, die Berücksichtigung der entstehenden Kosten (kostengerechte Produktentwicklung), identifiziert. 3.2.2 Verteilte Systeme Bei der Konzeption bzw. dem Entwurf eines verteilten Informationssystems werden die gleichen Ziele und Anforderungen identifiziert wie bei den so oft in der Literatur unter ’Verteilte Systeme’ oder ’Verteilte Anwendungen’ bekannten Systemen (sei es auf der Ebene von Betriebssystemen, Transaktionssystemen, Datenbanksystemen oder auch Wissensmanagementsystemen). Die in weiterer Folge aufgelisteten Entwurfsziele, Haupteigenschaften und Qualitätskriterien eines verteilten Systems beziehen sich, falls nicht anders angegeben, auf die in [Haub 1999] und [Lamport 2002] gewonnenen Erkenntnisse sowie auf die Bücher [Mullender 1989] und [Mullender 1993]. Die hier erwähnten Konzepte stellen auch Haupteinflußfaktoren für verteilte Informationssysteme eines transnationalen Konzerns dar. Das Schüsselkonzept im Bereich der verteilten Systeme wird durch die Transparenz dargestellt. Diese läßt sich aus technischer Sicht, wie folgt, unterteilen: Ortstransparenz Migrationstransparenz Zugriffstransparenz Kapitel 3 - INFORMATIONSMANAGEMENT Seite 38 Replikationstransparenz Nebenläufigkeitstransparenz Parallelitätstransparenz Skalierungstransparenz Leistungstransparenz (Performanztransparenz). Durch Ortstransparenz soll der Benutzer nicht merken, wo sich ein Objekt (Dateien, Benutzer, Rechner, usw.) physikalisch im Netz befindet. Der Informationszugriff erfolgt in der Regel über einen eindeutigen Namen, der keine Ortsinformation enthält. Somit wird Ortstransparenz durch global geltende Regeln gewährleistet, wie zum Beispiel globale Verfügbarkeit (dieselben Dienste sind sogar nach einem auftretenden Teilausfall arbeitsfähig), globale Sicherheit (dieselben Benutzernamen und -rechte führen überall zum gleichen Resultat), globales Management (dieselbe Person kann das System überall im gleichen Ausmaß beeinflussen) oder eben globale Namen (einmalig vergebene Namen haben überall ein konstantes, technisch und organisatorisch gleichbedeutendes Verhalten). Die Verlagerung von Objekten wird durch Migrationstransparenz verbessert. Unter transparenter Migration versteht man das Verlagern von Objekten quer über das verteilte Rechnernetz, ohne eine Änderung des Objektnamens und ohne Beeinträchtigung der Benutzerarbeit oder des Verhaltens verteilter Applikationen. Mit optimaler Zugriffstransparenz kann man in einem verteilten System sicherstellen, dass auf alle Systemkomponenten oder Objekte über einen einzigen Mechanismus zugegriffen wird zum Beispiel durch das Festlegen des Browsers als einzige Benutzerschnittstelle zum System. Bei Replikationstransparenz greift der Benutzer auf replizierte (mehrfach kopierte) Objekte zu, als wären diese nur einmal im System vorhanden, und zwar direkt in seiner Nähe. Das Ziel hierbei ist es, oft verwendete oder große Dateien schneller zu erreichen und dabei die Netzwerkbelastung lokal zu minimieren. Die Konsistenz der Replikate muß in der Regel über komplexe Protokolle garantiert werden. Mehrfach reproduzierte Dokumente verlangen meistens hohe Synchronisationsanstrengungen, weshalb Replikationstransparenz in direktem Zusammenhang mit zwei anderen Transparenztypen steht: Nebenläufigkeitstransparenz21 und Parallelitätstransparenz. Mehrere Applikationen oder Benutzer sollten auf gemeinsame Objekte gleichzeitig zugreifen können, ohne sich gegenseitig zu beeinflussen. Ein transparenter gemeinsamer Zugriff auf Objekte wird Nebenläufigkeitstransparenz genannt und durch Mechanismen wie Objektsperren oder Versionskontrolle ermöglicht. Eines der komplexesten Forschungsgebiete im Bereich verteilter Systeme stellt die Parallelitätstransparenz dar. Das wichtigste aus programmiertechnischer Sicht ist, dass man Parallelität nicht explizit programmiert, sondern Algorithmen implementiert, die dem System erlauben selbst herauszufinden, ob, welche, wann, wie und wo Applikationen parallel ausgeführt werden sollen. Das Ziel der Skalierungstransparenz besteht darin, eine Erweiterung vom System oder von Systemteilen (Applikationen) zu ermöglichen, ohne die bestehende Systemstruktur oder die Funktionalität von Systemkomponenten modifizieren zu müssen. Diese Eigenschaft sollte man 21 Gleichzeitigkeitstransparenz (transparency of concurrency) Kapitel 3 - INFORMATIONSMANAGEMENT Seite 39 von der Leistungstransparenz (oder Performanztransparenz) unterscheiden, die eine dynamische Re-Konfiguration des Systems zur Verbesserung der Performanz erlaubt. Die Leistungs- und die Skalierungstransparenz können somit als Maß für die Flexibilität und Robustheit eines verteilten Systems verstanden werden. 3.2.3 Zuverlässigkeit und Systemstabilität Ein zuverlässiges und stabiles System baut auf zwei Grundprinzipien auf: Verfügbarkeit und Korrektheit. Ein System soll somit nicht nur ständig verfügbar sein, sondern auch das, auf korrekter Weise tun, wofür es konzipiert wurde, auch wenn Fehler auftreten [Mullender 1993]. Verfügbarkeit bedeutet hier, dass die Arbeit einer ausgefallenen Maschine durch mindestens eine weitere übernommen werden kann. Dies impliziert meistens die Existenz von redundant gespeicherter Information, was in weiterer Folge zu Konsistenzproblemen führen könnte. Das Bindeglied ist hier also die Festlegung und Analyse einer angemessenen Fehlertoleranz. Bei der Berücksichtigung von Fehlern ist es wichtig zwischen Funktionsausfällen (faults, failures) und Fehlzuständen (errors) zu unterscheiden. Eine weitere Grenzlinie soll auch zwischen Fehlertoleranz und Fehlervermeidung gezogen werden, um eine optimale Implementation und Funktionalität des Systems zu gewährleisten [Mullender 1993] . 3.2.4 Einflüsse aufgrund starker geographischer Verteilung Einige der kritischen Aspekte, die sich bei der Konzeption eines Informationssystems für transnationale Konzerne global auf das Unternehmen auswirken, lassen sich, wie folgt, auflisten [Haub 1999] [Lamport 2002]: a) Die Modularität des gesamten Projektes (wobei vor Schnittstellenprogrammierung eine sehr bedeutende Rolle spielt). allem die b) Die Erkennung der Masse und Komplexität der Funktionen und deren Zusammenhänge, insbesondere die möglichen Auswirkungen von organisationalen Umstrukturierungen oder von modifizierten Geschäftsprozessen. c) Die frühzeitige Einplanung und effiziente Implementierung einer multilingualen Funktionalität (Mehrsprachigkeit), falls notwendig bzw. erwünscht. d) Die Festlegung einer einheitlichen und sicheren Benutzerverwaltung (An- und Abmeldung am System, Registrierung neuer Benutzer, Autoritätshierarchien und funktionale Befähigungen) sowie anwendungsgerechter Rollenkonzepte auf Benutzerund Dokumentenebene (Gruppenverwaltung, Workflow, usw.). e) Die sorgfältige Analyse einer nachhaltigen Wissensorganisation (zum Beispiel die Wahl eines Klassifizierungsschemas oder die Darstellung geeigneter Themenhierarchien). Im Bezug auf die lokalen Gegebenheiten eines Unternehmens, oder präziser definiert, auf die lokalen technischen Voraussetzungen eines Unterbereichs (z.B. eine Tochterfirma) innerhalb eines transnationalen Konzerns, spielen diverse Faktoren, die sich auf die Effizienz und Performanz des verteilten Informationssystems auswirken, eine nicht zu unterschätzende Rolle. Lokal verfügbare Kommunikationstechnologien, insbesondere die Art einer Datenübertragungsverbindung, können zum Beispiel die Verteiltheitsoder Replikationskriterien über Daten entscheidend beeinflussen. Diese Faktoren (vor allem die Funktionalität und Entscheidungskriterien von Datenreplikation) fallen im Kontext der Kapitel 3 - INFORMATIONSMANAGEMENT Seite 40 vorliegenden Arbeit unter dem Bereich des Datenmanagements und werden im dazugehörigen Kapitel 4 gründlich untersucht [Lamport 2002]. Weiters können kulturelle Aspekte innerhalb eines großen und geographisch verteilten Konzerns den Informationstransfer beeinträchtigen. Insbesondere im Bestreben zu einer sehr umfangreichen, einheitlichen und möglichst transparent verteilten Erfassung des intellektuellen Kapitals auf globaler Ebene kann man auf lokale Hindernisse stoßen. Wie bereits im Kapitel 2 ’Wissensmanagement’ Abschnitt 2.2.5 ’Soziale und kulturelle Barrieren’ anhand des Beispiels aus [Nonaka et al. 1995] dargestellt, legt die westliche Unternehmenspraxis den Mittelpunkt auf das explizite Wissen, japanische Unternehmen auf Bildsprache oder Intuition. Hierbei spielt das in [World_Bank 1998] als einheimische oder eingeborene Wissen22 eine entscheidende Rolle. Einheimisches Wissen beinhaltet traditionelles Know-How, eingeborene Geschicklichkeiten und Problemlösungsmechanismen, die typisch für eine Gesellschaftsform sind. Wichtig dabei ist, soviel explizites einheimisches Wissen in das verteilte System einzufangen, aber nicht als Folge eines Verteilungsprozesses, sondern als Teil einer Systemintegration. 3.3 Schlußbemerkung Wie groß die Überlappungen mehrerer Disziplinen bei der Konzeption eines Informationssystems sind, und welche bedeutungsvolle Rolle deren Verständnis spielt, hat sich aus den in Kapitel 2 ’Wissensmanagement’ und den in diesem Kapitel ’Informationsmanagement’ gewonnenen Erkenntnissen ableiten lassen. Wichtig dabei war das Erkennen und die Analyse der gemeinsamen technischen Faktoren und der unterschiedlichen Reichweiten beider Managementsdisziplinen, insbesondere in Bezug auf die Verteiltheit der Informationen bzw. Wissenseinheiten für transnationale Konzerne. Während der ’neue’ Begriff des Wissensmanagements eine neue Rolle definiert, findet man im Informationsmanagement diverse Grundfähigkeiten, um Wissen verwalten zu können, vor allem explizites Wissen. Diese Fähigkeiten kommen meist dann zur Geltung, wenn man - wie in diesem Kapitel vollzogen – die technischen Komponenten des Informationsmanagements analysiert [Miranda et al. 2000]. Aus den allgemeinen Zielen beider Disziplinen lassen sich viele Parallelen, wie in [Tab. 3.1] dargestellt, ziehen. Informationsmanagement Sammlung von Information Indizierung und Organisation von Information Wissensmanagement Sammlung von Wissen Evaluation von Informationen Speicherung von Information in Datenbanken Informationszugriff und -verbreitung Erstellung von Wissensbanken Kodifizierung von Wissen Messung von Werten bzgl. Wiederverwendung Wissenszugriff und -verbreitung Tabelle 3.1: Informations- und Wissensmanagementrollen [Miranda et al. 2000] Für große und geographisch verteilte Unternehmen sind aus kommunikationstechnologischer Sicht viele Vorteile bei einer effektiven Nutzung eines Intranets identifizierbar, beispielsweise: 22 Transparenter Zugriff auf aktuelle und relevante Informationen Beschleunigung und Qualitätsverbesserungen von Geschäftsprozessen Indigenous Knowledge [World_Bank 1998] Kapitel 3 - INFORMATIONSMANAGEMENT Seite 41 Zeitersparnis bei der Informationssuche Orts- und zeitunabhängige Verfügbarkeit der Benutzerschnittstelle (Browser als einheitliches und überall verfügbares Zugangs- und Kommunikationswerkzeug) Verbesserte Nutzung des verteilten intellektuellen Kapitals Integration kommunikationsfördernder Videoconferecing, Email, u.v.m.) Mechanismen (z.B. Chatsystem, Die in diesem Kapitel besprochenen Qualitätskriterien (Erweiterbarkeit, Transparenz, Robustheit, Performanz, Wartbarkeit oder Integrationsfähigkeit) von verteilten Informationssystemen lassen die Erstellung einer groben Analyse über die Vor- und Nachteile solcher Systeme gegenüber zentraler oder isolierter Lösungen, wie folgt, zu: Vorteile einer Verteilung: Gegenüber zentral organisierten Systemen zeichnen sich verteilte Systeme durch höhere Wirtschaftlichkeit (Preis/Leistungsverhältnis), Zuverlässigkeit, kürzere Antwortzeiten, modulare Skalierbarkeit, kontinuierliche Verfügbarkeit und transparente Behandlung von Teilausfällen aus. Gegenüber isolierten Arbeitsplatzrechnern liegen die Vorteile eines verteilten Systems auf der Hand: Kommunikation, Kollaboration, gemeinsame Nutzung von Ressourcen, Performanzausgleich durch wenige Hochleistungsrechner, Flexibilität, Integration, Wartbarkeit und natürlich höhere Rentabilität. Nachteile einer Verteilung: Einige Nachteile sollten - trotz aller Vorteile - jedoch nicht ungenannt bleiben. Die Implementierung (Software) eines effizient verteilten Systems ist sehr komplex und kritisch über die ganze Dauer der Projektabwicklung, d.h. von Konzeption und Entwurf, über Implementierung und Testen, bis zu Abnahme und Wartung. Es besteht ebenfalls eine große, konstante und direkte Abhängigkeit zur Performanz des zugrundeliegenden Netzwerks. Weiters sind die Sicherheitsmaßnahmen komplexer, da das verteilte System weitaus mehr Angriffspunkte anbietet als zentrale Großsysteme. Hauptthemen des nächsten Kapitels sind die effiziente und effektive physikalische Aufbewahrung von Objekten und die Replikationsmechanismen in verteilten Systemen. Diese Bereiche werden von der Disziplin des Datenmanagements abgedeckt, welches unter anderem die technischen Aspekte von Datenbanksystemen beinhaltet. Um Zusammenhänge mit anderen Disziplinen zu zeigen, werden auch ’verwandte’ Bereiche, die sich mit Wissensspeicherung in großen Unternehmen beschäftigen (zum Beispiel Organisationsgedächtnis oder ’Organisational Memory Systems’), dargestellt. Den wesentlichsten Teil stellt aber der Abschnitt über die Entscheidungskriterien und Mechanismen für eine effiziente Datenreplikation in verteilten Systemen für große und geographisch verteilte Unternehmen dar. Kapitel 3 - INFORMATIONSMANAGEMENT Seite 42 Kapitel 4 - DATENMANAGEMENT Seite 43 Kapitel 4 Datenmanagement „I think there is a world market for, may be, five computers.” 23 Ehemaliger CEO eines großen Hardwareunternehmens, 1943 „640 KB ought to be enough for everybody.” 24 CEO eines großen Softwareunternehmens, 1981 Wissensträger in einem Unternehmen sind in der Regel Objekte, Personen oder Systeme, die in der Lage sind, Wissen zu speichern und zu repräsentieren. Dazu zählen zum Beispiel Dokumentationen, Multimediadateien, Datenbanken, Expertensysteme bzw. Domänesysteme, Personen mit Spezialwissen und Gruppen von Unternehmensmitarbeitern, die eine spezifische Aufgabe gemeinsam lösen. In diesem Kapitel werden Daten als konkret gespeichertes Symbol in einem physikalischen Medium behandelt. Die Reichweite des Datenmanagements als unternehmensbezogene Disziplin bzw. als Bereich der Informationswissenschaft wird oft unterschiedlich definiert und interpretiert. Für die Definitionen lässt sich aber ein gemeinsamer Nenner finden: der informationstechnische Teil des Datenmanagements befaßt sich hauptsächlich mit der ’nicht semantischen’ Ebene der elektronischen Speicherung. Nicht semantisch deshalb, da diese Ebene das Management im Zeichenbereich repräsentiert. Das Ziel des Datenmanagements in großen und geographisch verteilten Unternehmen läßt sich über alle Geschäftsbereiche und Organisationshierarchien gleichermaßen erkennen: wegen der hohen Komplexität verteilter Systeme und der hohen Kosten der Wissenserfassung strebt man nach einer nachhaltigen Aufbewahrung von Daten, nach ihrer möglichst fehlerfreien Verwaltung und nach einer transparenten und gesicherten Verfügbarkeit für mehrere Benutzer und Applikationen. Aus diesem Grund werden für die Datenverwaltung oft Datenbanksysteme eingesetzt. Im organisationalen und technologischen Bereich des Datenmanagements - aus der Sicht transnationaler Konzerne - spielt die gesicherte Datenübertragung eine besonders wichtige Rolle. Datensicherheit lässt sich durch rein technologische Maßnahmen (d.h. Informationstechnologie) optimieren, zum Beispiel durch eine geeignete Intranetumgebung mit effizienten Anmelde- und Zugriffsrechtkomponenten. In Bezug auf Datenverwaltung in verteilten Organisationsstrukturen stellen meist die synchronisierte Aktualisierung der Datenbestände sowie die Korrektheit und Transparenz der Inhaltsauffindung ebenfalls kritische Bereiche dar. Wo und wie die Datenbestände physikalisch gespeichert werden hängt meist ab von den lokalen technologischen Gegebenheiten der Tochterfirma und von der beabsichtigten Fehlertoleranz des verteilten Informationssystems bzw. der Performanz der zugrunde liegenden Datenbank. Dieses Kapitel präsentiert einen Überblick über das Thema ’Verteilte Datenbanksysteme’ und dessen Zusammenhang und Unterscheidung mit dem Begriff ’Organisationsgedächtnis’. Im 23 24 „Ich glaube es gibt einen Weltmarkt für, vielleicht, fünf Computer.“ „640 KB sollten genug für jedermann sein.“ Kapitel 4 - DATENMANAGEMENT Seite 44 zweiten Teil des Kapitels werden die unterschiedlichen Methoden bzw. Entscheidungskriterien für Datenreplikation diskutiert. 4.1 Verteilte Datenbanksysteme Datenbanken, unabhängig vom Einsatzbereich, dienen der organisierten Speicherung von Information. Datenbanksysteme bzw. Datenbankmanagementsysteme verwalten solche Datenbanken, kontrollieren das Hinzufügen und Löschen von Datenbeständen, und unterstützen bei Bedarf die Analyse und Reorganisation von bestehender Information nach bestimmten Gesichtspunkten. Damit stellen Datenbanken mehr als nur passive Kanäle, die Information über einen Zeitraum speichern, dar. Sie können Aufgaben übernehmen und Information aktiv, reaktiv oder interaktiv verarbeiten. Je mehr solcher Inferenzmechanismen die Datenbanken enthalten, desto näher kommen sie dem Konzept von ’Intelligenten Agentsystemen’. Expertensysteme sind Beispiele für solche Informationssysteme [NetAcademy 1999]. Diese Arbeit befaßt sich aber mit Datenbanken für transnationale Konzerne, also Datenbanken mit meist stark vernetzten Knotenpunkten innerhalb einer weltweit verteilten Umgebung. Eine Lösung für solch spezielle Strukturen sind ’verteilte Datenbanken’. Eines der in [Krcmar 2000] erkannten Ziele des Datenmanagements stellt die Erhöhung der Produktivität bei der Entwicklung von Anwendungssystemen durch den Einsatz von Datenbanksystemen dar. Dafür spielt die strategische Komponente des Managements eine wichtige Rolle, d.h. welche Daten für welche Systeme und Aufgaben wie gespeichert und zur Verfügung gestellt werden sollen. 4.1.1 Datenmanagement Generell kann festgelegt werden, dass sich Datenmanagement mit „...allen betrieblichen und technischen Aspekten der Datenmodellierung, Datenadministration, der Datentechnik und des datenbezogenen Benutzerservices... [Krcmar 2000]“ befaßt. Dieses Kapitel konzentriert sich auf die Herausforderungen der Datentechnik in Bezug auf Datenverteilung und –lokalisierung, insbesondere für transnationale Konzerne. Die vom Informationssystem eines transnationalen Konzerns angeforderte Intranettechnologie - mit ihrer standardisierten und ortsunabhängigen Funktionalität – könnte zur Implementierung einer verteilten Server- bzw. Datenbankarchitektur führen, welche sich für die Lösung vieler Verteiltheitsprobleme sehr gut eignen kann (vor allem bei Problemen mit technologischem Hintergrund). 4.1.2 Datenbanksysteme Laut [Büchel 2000] besteht ein Datenbanksystem „...aus dem Verbund einer nicht leeren Menge von Datenbanken mit einem Datenbank-Management-System.“ Kapitel 4 - DATENMANAGEMENT Seite 45 Ein Datenbankmanagementsystem wird somit durch die Datenbanksoftware repräsentiert. Grundsätzlich, insbesondere im Hinblick auf Datenverteilung, unterscheidet man zwischen folgenden verschiedenartig strukturierten Datenbanktypen [Krcmar 2000]: a) zentralisierte Datenbanken b) zentrale Datenbanken mit verteilten Partitionen (fragmentierte Datenbanken) c) replizierte Datenbanken d) verteilte Datenbanken mit zentralem Katalog (Data-Dictionary) Wie in [Seidlitz 2001] dargestellt, können Datenbanksysteme in der Regel anhand der Anzahl der im Netzwerk vorhandenen Knoten klassifiziert werden in: a) zentralisierte Datenbanksysteme, b) verteilte heterogene Datenbanksysteme c) verteilte homogene Datenbanksysteme Zentralisierte Datenbanksysteme bzw. zentrale Datenbanken zeichnen sich dadurch aus, dass der gesamte Datenbestand eines Unternehmens auf einem einzigen Server gespeichert ist. Der Datenabruf erfolgt in der Regel über mehrere Client-Applikationen. Vorteile dieser einfachen Lösung sind die vereinfachte Bedienung und Konsistenz der Daten, sowie die Vermeidung typischer Probleme von verteilten Strukturen, wie zum Beispiel Nebenläufigkeitsprobleme oder Konflikte bei Datenreplikation. Nachteilig für solche Strukturen ist der Mangel einer echten Skalierungsfreiheit und die Tatsache, dass die alleinstehende Datenbank bzw. der alleinstehende Server einen single point of failure darstellt [Seidlitz 2001]. Darüber hinaus wird dieser Server zum Flaschenhals bezüglich Systemperformanz, allgemeine Speicherkapazität, Prozessorauslastung, Netzwerklast bzw. Transaktionsverwaltung, Anzahl der simultan bedienbaren Benutzer und vielem mehr. Eine der Möglichkeiten, um Lastprobleme zu vermeiden, ist der Einsatz von zentralen Datenbanken mit verteilten Partitionen (fragmentierte Datenbanken). Diese Systeme bestehen meist aus mehreren Festplattenspeichern (eventuell an unterschiedlichen Orten lokalisiert), die entweder unterschiedliche Instanzen von Datenbanken oder diverse Fragmente einer großen Datenbank enthalten. Somit kann man zwar das Problem der Speicherkapazität besser in den Griff bekommen, die funktionale Serverperformanz verbessert sich dadurch aber prinzipiell nicht. Replizierte Datenbanken enthalten verteilte Replikate (mehrfach vorhandene Kopien) einzelner Datenbestände oder kompletter Teildatenbanken. Eine Replikation auf dieser Basis wird meist aus Performanzgründen hervorgerufen. Mögliche Ursache hierfür kann zum Beispiel der häufige Zugriff auf große Dateien über langsame Internetverbindungen sein. Verteilte Datenbanken mit zentralem Katalog werden über einen Schemakatalog (DataDictionary) verwaltet. Dieses Schema enthält eine konzeptionelle Beschreibung (Datendefinitionen für sämtliche Daten) der Datenbanken eines Datenbanksystems. So eine Methode gewährleistet die Anforderung der Datenunabhängigkeit an eine Datenbank [Krcmar 2000]. Vor allem für transnationale Konzerne nimmt die Anzahl der zu speichernden Daten oft ungeahnte Ausmaße an. Sobald dieser Punkt erreicht wird könnte ein zentralisiertes System an Kapitel 4 - DATENMANAGEMENT Seite 46 seine Grenzen stoßen und eine sehr große Menge an Datenabfragen und Berechnungen nur sehr schwer oder gar nicht effizient bewältigen. Es ist also erstrebenswert, die Gesamtlast (Speicher-, Prozessor- und Netzwerklast) auf mehrere Systeme zu verteilen [Seidlitz 2001]. 4.1.3 Verteilte Datenbanksysteme Verteilte Datenbanksysteme erlauben den Zugriff auf lokale und entfernte Datenbanken. In so einem System wird der gesamte Datenbestand auf mehrere Server bzw. Datenbanken verteilt. Diese (geographisch) getrennten Komponenten werden oft Knoten oder Standorte (engl.: ’nodes’ oder ’sites’) genannt und über ein Netzwerk miteinander verbunden. Unerläßlich für ein ’echtes’ Verteilungskonzept ist hierbei die Sicherstellung von Ortstransparenz, d.h. die Komponenten sollten für den Benutzer wie eine einzige Datenbank erscheinen [Oracle 2002a] [Seidlitz 2001]. Man unterscheidet zwischen homogen verteilte Datenbanksysteme (alle Datenbanken sind vom selben Typ bzw. ’Marke’) und heterogen verteilte Datenbanksysteme (mindestens eine Datenbank ist nicht vom gleichen Typ wie alle anderen). In der Regel basieren verteilte Datenbanken auf einer Client/Server Architektur, um Datenbankabfragen zu verarbeiten. An dieser Stelle ist es angebracht zu betonen, dass ’Verteilte Datenbanken’ und ’Verteilte Verarbeitung’ (engl.: distributed processing) bzw. ’Verteilte Anwendungen’ zwar sehr eng zusammenhängende Begriffe darstellen, grundsätzlich aber unterschiedliche Bedeutungen haben. Eine verteilte Datenbank besteht aus einer nicht leeren Menge von Datenbanken innerhalb eines verteilten Systems, welche sich den Applikationen als eine einzige Datenquelle präsentiert. Verteilte Verarbeitung entsteht, wenn eine Operation stattfindet, bei der eine Applikation ihre Aufgaben auf verschiedenen Rechnern in einem Netzwerk verteilt. Aus diesem Grund werden oft Verarbeitungssysteme für verteilte Datenbankapplikationen25 oft auch Client / Server Datenbankapplikationssysteme26 genannt [Oracle 2002a]. Es gibt Definitionen für homogen verteilte Datenbanksysteme, die darunter nicht ein verteiltes System verstehen, dessen Knoten mit demselben Softwarepaket ausgestattet sind und auf der gleichen Plattform laufen. Stattdessen wird damit eine Knotenmenge, die unter dem gleichen Datenbankmanagementsystem und Datenbankschema verwaltet wird, angenommen. Einigkeit besteht darin, dass Ortstransparenz eines der wichtigsten Voraussetzungen darstellt und, dass Unterschiede in der lokalen Autonomie der einzelnen Knoten bestehen können [Seidlitz 2001]. Heterogen verteilte Datenbanksysteme sind meist durch eine hohe lokale Autonomie charakterisiert. Einige Knoten innerhalb solcher Systeme können verschiedenartige Datenbankmanagementsysteme nutzen. Jeder Knoten hat einen eindeutigen Namen im Netzwerk und verwaltet selbst seine lokalen Ressourcen. Die Verbindung zu anderen Datenbanken erfolgt über standardisierte Schnittstellen [Seidlitz 2001]. Ein weiterer wichtiger Aspekt bei der Konzeption eines großen Datenbanksystems für transnationale Konzerne stellt die ’Datenrettung oder Datenwiederherstellung’ (engl.: ’data recovery’) dar. Dafür stehen in der Regel zwei Funktionen zur Verfügung: ’nochmals tun’ (engl.: ’redo’) und ’rückgängig machen’ (engl.: ’undo’). Die erste davon tritt dann auf, wenn ein Knoten nach einem Fehler wieder anläuft und alle Modifikationen einmal abgeschlossener Transaktionen - seien sie auf dem lokalen Knoten oder global über mehrere Knoten ausgeführt worden - auf den am lokalen Knoten abgelegten Daten wiederhergestellt werden müssen. Ein 25 26 ‘distributed database application processing systems’ ‘client/server database application systems’ Kapitel 4 - DATENMANAGEMENT Seite 47 ’Undo’ ist dann notwendig, wenn die Modifikationen von noch nicht abgeschlossenen lokalen und globalen Transaktionen auf den am abgestürzten Knoten vorliegenden Daten rückgängig gemacht werden müssen [Oracle 2002a]. Wenn man moderne Entwicklungsmöglichkeiten im Bereich der Datenbanksysteme analysiert und deren informationstechnische Bedeutung für das intellektuelle Kapital eines großen Konzerns, insbesondere aus der Sicht des Wissensmanagements, betrachtet, erkennt man viele Gemeinsamkeiten mit dem Begriff Organisationsgedächtnis (engl.: ’organisational memory’). 4.1.4 Organisationsgedächtnis Die Speicherungsbasis des Informationssystems eines großen Unternehmens wird meist durch eine Datenbank bzw. ein Datenbanksystem dargestellt. Im allgemeinen beschreibt das Speichermedium ein System von Fähigkeiten, die es erlauben, aktuelle Erkenntnisse über eine gewisse Zeit aufzubewahren, um zu einem späteren Zeitpunkt darauf zugreifen zu können. Ein System kann also ohne Speicherungsmöglichkeiten nicht ’lernen’. Infolgedessen repräsentiert ein Organisationsgedächtnis bzw. Unternehmensgedächtnis (engl.: ‚organisational memory’) eine unerlässliche Voraussetzung für Organisationales Lernen [Lehner et al. 1998]. Das primäre Ziel des informationstechnischen Wissensmanagements ist Wissen zu digitalisieren, d.h. informationstechnisch verarbeitbar, auffindbar und transferierbar zu machen. Ein Unternehmensgedächtnis ist somit die idealisierte Digitalabbildung des Wissens von einer Unternehmung und deren Mitarbeiter. Dieser Idealfall wird aber leider wegen der schwierigen Externalisierung impliziten Wissens nicht erreicht [Tochtermann et al. 2000] [Maurer et al. 2001]. Das Schlüsselwort in diesem Kontext heißt also ’Organisationales Lernen’. Um diese Funktion zu realisieren, wurden lange Zeit klassische Konzepte im Bereich der Datenbanksysteme herangezogen. Aufgrund der informationstechnischen Entwicklungen in den letzten Jahren (insbesondere bezüglich Datenmodellierung, multimedialer Informationssysteme und Wissensrepräsentation) entstanden neue Möglichkeiten, um komplexere Aufbewahrungsorte zu verwirklichen. Mehrere Disziplinen oder Subdisziplinen unterschiedlicher Bereiche haben die Entwicklung moderner Speicherungsmöglichkeiten beeinflußt: Organisationales Lernen, Lernende Organisation, Wissensmanagement, Organisationsund Personalentwicklung, Innovationsmanagement, Organisationale Intelligenz, Wissensbasierte Systeme (Künstliche Intelligenz, Kognitive Wissenschaften), und andere. In [Lehner et al. 1998] werden Systeme für Organisationsgedächtnisse (engl.: ’Organisational Memory Systems’) als eine neue Dimension bei der Realisierung von Informationssystemen im Sinne einer fortgeschrittenen Entwicklung der Datenverarbeitung interpretiert. Somit erfordert die Implementierung und die Nutzung dieser Systeme interdisziplinäre Kenntnisse in Organisation und Management, Gruppen- und Verhaltenspsychologie sowie Computerwissenschaften. Das ’Niveau’ solcher Systeme, wie in [Tab. 4.1] gezeigt, ist somit höher einzustufen als jenes konventioneller Datenbanksysteme. Weiters betrachten [Lehner et al. 1998] die Beherrschung der unteren Niveaus als eine unabdingbare Voraussetzung für den erfolgreichen Einsatz von Organisational-Memory-Systems. Kapitel 4 - DATENMANAGEMENT Seite 48 Niveau / Name 4) Wissensmanagement 3) Information als Ressource 2) Datenmanagement 1) Datei- und Datenorganisation Systemtyp / Fokussierung Organisational Memory Systems Fortgeschrittene Datenbanktechnologien Daten(bank)architektur des Unternehmens Datensysteme Tabelle 4.1: Entwicklungsniveaus bezüglich der (elektronischen) Bearbeitung von Daten, Information und Wissen in Unternehmen [Lehner et al. 1998] In Bezug auf ’Organisationsgedächtnis’ - terminologisch gesehen - können in der Literatur mehrere Synonyme bzw. sehr verwandte Disziplinen erkannt werden, wie zum Beispiel: Unternehmensgedächtnis, Unternehmensweite Wissensbasis, Gruppengedächtnis, Kollektive Intelligenz, Unternehmensintelligenz, Geteilte Wissensbasis, Know-How Datenbanken. Die in [Maier et al. 2000a] beschriebene Studie über Wissensmanagementsysteme und Systeme für Organisationales Gedächtnis identifiziert als Hauptziel beider Systemarten das Bewältigen folgender Tendenzen: Die zunehmende Komplexität, Dynamik, Fragmentierung und Dezentralisierung des Wissens. Die immer komplexer werdenden Organisationsstrukturen und die permanente Notwendigkeit diese zu ändern. Die zunehmende Anzahl der zu verwaltenden ’nicht traditionellen’ Daten (wie Hypertextdokumente, Links, Multimediadateien, usw.). Dies erfordert also eine genau überlegte Datenbankarchitektur für die Speicherung und den Einsatz von modernen Datenbanksystemen für die Verwaltung von Daten. Wichtige Parallelen können somit zwischen ’Datenbanksystemen’ und ’Systemen für Organisationales Gedächtnis’, wenn man die unterschiedlichen Definitionen miteinander vergleicht bzw. wenn man die Ziele und Aufgaben beider Disziplinen betrachtet (siehe Abschnitte 4.1.2 und 4.1.4 dieses Kapitels), gefunden werden. In [Maier et al. 2000a] werden sechs unterschiedliche Perspektiven angegeben, die zu einer Kategorisierung von Systemen für Organisationsgedächtnis führen. Eine dieser Perspektiven, die sogenannte ’funktionelle Sichtweise’, bringt - insbesondere im Hinblick auf den Bereich der Datenbanksysteme - eine interessante Definition hervor: „Ein System für Organisationales Gedächtnis ist ein computerbasiertes System, welches mit der Hilfe von Software, mindestens folgende Grundfunktionen unterstützt: die Generierung und Akquisition, Speicherung, Suche und Nutzung von Wissen, sowie seine Verteilung und Aktualisierung. 27“ In [Lehner et al. 1998], eine Studie über die Anwendung von modernen Datenbank- und Netzwerktechnologien bei der Erstellung von Systemen für Organisationales Gedächtnis, bei der die Autoren von [Maier et al. 2000a] auch als Mitverfasser erscheinen, wird eine aus technischer Sicht etwas erweiterte Definition für diese Systeme wie folgt angegeben: „Ein System für Organisationales Gedächtnis ist ein System, (a) welches Teile der organisationalen Wissensbasis unter der Mithilfe von Informations- und Kommunikationstechnologien umsetzt, und/oder (b) Aufgaben, Funktionen und „An organizational memory system (OMS) is a computer-based system that, with the help of software, supports at least the following basic functions: the generation and acquisition, storage, search for and utilization of knowledge, as well as its distribution and updating.“ [Maier et al. 2000] 27 Kapitel 4 - DATENMANAGEMENT Seite 49 Prozeduren, die mit der Nutzung der organisationalen Wissensbasis verbunden sind, umsetzt und unterstützt. [Lehner et al. 1998]28.“ Die in [Krcmar 2000] identifizierten Herausforderungen im Bereich der Datentechnik (als Teil des Datenmanagements) lassen auch Gemeinsamkeiten mit den Zielsetzungen für eine technische Umsetzung von einem Datenbanksystem und von einem Unternehmensgedächtnis erkennen: Sicherheit, zugrunde liegende Architektur, Fragmentierung, Verteilung und Lokalisierung. Unter alleiniger Berücksichtigung technischer Aspekte könnte man manchmal in den Definitionen für ’Systeme für Unternehmensgedächtnis’ die Begriffe Wissensbasis und Wissen mit Datenbank und Daten vertauschen, und bekäme eine in der Regel gültige Definition für ’Datenbanksysteme’. Dieser starke und direkte Zusammenhang sollte bei der Planung eines Informationssystems für große Unternehmen nicht unbeachtet bleiben, da beide Bereiche interessante Lösungen anbieten können. Eines der kritischsten Aspekte im Bereich des Datenmanagements für transnationale Konzerne bzw. während der Entwicklungs- und Implementierungsphase einer verteilten Systemlösung stellt die Verwaltung von replizierten Daten dar. Nicht nur die dahinter stehenden technischen Mechanismen (z.B. Synchronisation, Aktualisierung, usw.), sondern insbesondere die Entscheidungskriterien für das Ergreifen von Replikationsmaßnahmen stellen eine große Herausforderung bei der Konzeption des Informationssystems für geographisch verteilte Unternehmen dar. Das folgende Kapitel befaßt sich mit den Grundlagen und dem Hintergrund dieser Thematik. 4.2 Datenreplikation Wissen wird nicht nur von der Zentrale eines Konzerns zu den Tochterfirmen und zu den Geschäftspartnern transferiert. Wissen entsteht überall im Unternehmen, ist also grenzüberschreitend, sowohl innerhalb der Konzernstruktur als auch für außenstehende Benutzer. Die technologische Plattform für das Wissensmanagement muß also in der Lage sein, das gesamte intellektuelle Kapital so durch das Unternehmen zu schleusen, dass alle Benutzer einen möglichst schnellen Zugriff auf die aktuellste Version eines Geschäftsprozesses, einer Projektphase, einer Diskussion oder eines Dokuments haben. Dies erfordert manchmal Mechanismen, die neues und aktualisiertes Material gleichzeitig in verschiedene Richtungen verteilen, und nicht nur von einer zentralen Quelle zu den Empfängern [Lotus 1999]. Der Zweck der Kommunikation, und infolgedessen auch des Datentransfers, ist die Übermittlung und damit die Reproduktion von Wissenseinheiten. Die Reproduzierbarkeit bzw. Replizierbarkeit von Objekten ermöglicht erst eine sinnvolle Kommunikation [NetAcademy 1999]. 4.2.1 Allgemeines Unter Replikation, im informationstechnischen Sinne, versteht man im allgemeinen die Vervielfältigung eines Objektes auf mehrere Rechner. Diese in einem verteilten System „An Organisational Memory System (OMS) is a system, (a) which realises parts of the organizational knowledge base with the help of information and communications technologies and/or (b) realises and supports tasks, functions and procedures that are connected to the use of the organizational knowledge base [Lehner et al. 1998].” 28 Kapitel 4 - DATENMANAGEMENT Seite 50 mehrfach vorhandenen Objekte sollten im Idealfall überall und immer identisch sein. Die Praxis zeigt aber, dass die erfolgreiche Umsetzung dieser Maßnahme - welche üblicherweise aus Performanzgründen ergriffen wird – sehr komplex und problematisch werden kann. Im Bezug auf Datenmanagement bzw. Datenbanksysteme kann Replikation als Prozess der Vervielfältigung von Objekten in den Datenbanken eines verteilten Datenbanksystems und der synchronisierte Wartung solcher Kopien aufgefaßt werden [Seidlitz 2001]. Lokal unternommene Modifikationen werden aufgezeichnet und an jedem Replikat nachgezogen. Die Replikationsobjekte haben somit im zeitlichen Mittel an allen Systemknoten die gleiche Ausprägung [Seidlitz 2001]. 4.2.2 Replizierende Datenbanken Der Unterschied zwischen einer verteilten und einer replizierenden Datenbank besteht darin, dass bei einer verteilten Datenbank die Information auf mehrere Systemknoten aufgeteilt ist und bei replizierenden Datenbanken dieselbe Information an allen Knoten verfügbar ist [Seidlitz 2001]. Replikationsobjekte sind Datenbankobjekte, welche auf mehreren Servern eines verteilten Informationssystems existieren und durch eine Replikationsumgebung aktualisiert werden. Bei relationalen verteilten Datenbanksystemen - wie zum Beispiel Oracle - läßt sich praktisch jede speicherbare Komponente (Tabellen, Indexes, Views, Prozeduren, Funktionen, Synonyme, Sequenzen, usw.) replizieren [Oracle8i 1999]. Diese Replikationsobjekte können in logisch zusammenhängende Gruppen gesammelt werden, wodurch sich größere Komponenten auf einmal replizieren lassen. Auch komplette Knoten eines relationalen verteilten Datenbanksystems, in Oracle ’sites’ genannt, lassen sich vervielfältigen [Oracle8i 1999]. Es gibt Informationssysteme, wie zum Beispiel der Hyperwave Information Server, welche die darunter liegende Datenbankbestände entweder zur Gänze oder partiell (Container oder einzelne Objekte jeder Art) über eine verteilte Architektur replizieren können [Hyperwave 2001a]. Der Hyperwave Information Server lässt zwei Richtungen der Replikation zu: einerseits können Datenbankobjekte vom lokalen Server heraus auf mehreren Servern hin repliziert werden, und andererseits kann man diverse Datenbankbestände aus dem ’Serverpool’ (das zusammenhängende verteilte Datenbanksystem) auf dem lokalen Server replizieren [Hyperwave 2001a]. Die Technik hinter einem Replikationsmechanismus in einem verteilten Informationssystem ist komplex und vielfältig. Einige Methoden, Entscheidungskriterien, die wichtigsten Vorteile, sowie mögliche Konflikte bei Replikationssystemen werden im nächsten Abschnitt beschrieben. 4.2.3 Allgemeine Kriterien für Datenreplikation Verfügbarkeit, Performanz und Netzwerkverkehr zählen, wie in [Seidlitz 2001] erörtert, zu den wichtigsten Gründen für das Ergreifen von Replikationsmaßnahmen. Kapitel 4 - DATENMANAGEMENT Seite 51 Replikationsmechanismen erhöhen die Verfügbarkeit von Datenbeständen für Systemanwendungen, da sie ihnen mehrere identische Objektquellen zur Verfügung stellen. Beim Einsatz von replizierenden Datenbanken kann eine Applikation nach dem Ausfall eines Systemknotens sofort an einem anderen Replikat weiterarbeiten. Dieser Sachverhalt wird in [Abb. 4.1] dargestellt. Die an dem alternativen Knoten durchgeführte Modifikationen können zu einem später Zeitpunkt auf den ausgefallenen (ursprünglichen) Knoten übertragen werden. Die Fehlertoleranz gegenüber Kommunikationsfehlern bzw. Serverfehlern wird somit auch verbessert. Replikat Benutzer (client) ! Knoten 1 Knoten 3 ! Knoten 4 X Objekt Knoten 2 Abbildung 4.1: Lokalisierung von Replikaten nach dem Ausfall eines Systemknotens Die Performanz eines verteilten Systems kann durch Replikation erhöht werden, weil die Berechnungslast auf mehrere Knoten verteilt wird. Somit muß nicht ein einzelner Großrechner alle Abfragen bearbeiten. Die Folge davon ist eine Performanzsteigerung des gesamten Systems, da die Replikate einen schnellen ’lokalen’ Datenzugriff erlauben. Weiters können Benutzer an lokalen Knoten ’offline’ arbeiten. Die modifizierten Objekte lassen sich später, bei wiederhergestellter Verbindung, durch das Replikationssystem synchronisieren [Seidlitz 2001]. Im verteilten Datenbanksystem eines transnationalen Konzerns können Applikationen mit Hilfe des Replikationssystems die für den Benutzer ’günstigsten’ Replikate (i.d.R. die vom nächstliegenden Server) auswählen, wodurch der Netzwerkverkehr und die Antwortzeiten minimiert bzw. optimiert werden können. Die parallele Abarbeitung mehrerer Client-Anforderungen kann dadurch auch optimiert werden. Dieser Sachverhalt wird in [Abb. 4.2] graphisch dargestellt. Knoten 1 Objekt Replikat Benutzer (client) ! Knoten 2 X Knoten 3 X Abbildung 4.2: Der ’günstigste’ Weg durch Replikation Eines der im Kapitel 3 ’Informationsmanagement’ besprochenen Schlüsselkonzept für verteilten Systeme, die Ortstransparenz, kann durch Replikation effizient und effektiv gewährleistet werden, da die Benutzer den Eindruck einer Interaktion mit einem naheliegenden Originalobjekt bekommen. In [Abb. 4.3] wird dieser Sachverhalt graphisch dargestellt: der Benutzer am Knoten 1 fordert das Objekt ’A’ vom System an und merkt nicht, dass er ein Replikat ’A3’ zurückgeliefert bekommt. Kapitel 4 - DATENMANAGEMENT Seite 52 System Replikat ”A1” Knoten 2 Benutzer (client) Knoten 1 “A” “A” Replikat ”A2” Knoten 3 Replikat “A3” Knoten 4 . . . Abbildung 4.3: Transparenz eines verteilten Systems durch Replikation Replikationssysteme, die ein gleichzeitiges Modifizieren von unterschiedlichen Replikaten erlauben, müssen sogenannte Replikationskonflikte oder Synchronisationskonflikte lösen. Aktualisierungskonflikte entstehen, wenn am selben Objekt widersprüchliche Aktualisierungen von verschiedenen Knoten durchgeführt werden. Eindeutigkeitskonflikte werden hervorgerufen, wenn ein Replikationsvorgang eindeutige Nameskonventionen verletzt. Schließlich können auch Löschungskonflikte entstehen, wenn zum Beispiel der Knoten 1 einen Modifikationsvorgang auf ein Replikat des Knotens 2 starten will und noch nicht weiß, dass das betroffene Replikat schon zuvor von einem anderen Knoten 3 gelöscht wurde [Seidlitz 2001]. Einen wichtigen Aspekt beim Verstehen des Replikationskonzepts stellen die unterschiedliche Ansichten und Zielsetzungen dar, d.h. Replikationskriterien hängen auch davon ab, ob man die Materie aus der Perspektive des technischen Datenmanagements (Datenbanken und Datenbanksysteme) oder des Informationsmanagements (verteilte Informationssysteme) analysiert. 4.2.4 Replikation in verteilten Datenbanken und verteilten Systemen Replikation ist ein interessanter Forschungs- und Entwicklungsbereich sowohl für die Gemeinschaft der Datenbankspezialisten als auch für die Kenner verteilter Systemen. Um die unterschiedlichen Lösungsmethoden bzw. –mechanismen der Replikation zu verstehen, entwickelten [Wiesmann et al. 2000] einen abstrakten und ’neutralen’ Arbeitsrahmen für die Analyse verschiedener Techniken in Form einer sehr interessanten und detaillierten Studie aus einer funktionalen Perspektive. Falls nicht besonders hervorgehoben, basieren alle in diesem Abschnitt gezeigten Methoden bzw. gewonnenen Erkenntnisse auf dem Inhalt der zuvor erwähnten Studie. In der Regel wird Replikation in vielen Disziplinen eingesetzt wo Vervielfältigungsvorteile zu erwarten sind. Im Bereich der verteilten Systeme werden Replikationsmaßnahmen zum Zwecke einer optimierten Fehlertoleranz ergriffen. Bei Datenbanksystemen dienen sie hauptsächlich einer verbesserten Systemperformanz. In beiden Disziplinen ist Replikation zwar begrifflich Kapitel 4 - DATENMANAGEMENT Seite 53 und konzeptionell identisch, mehrere grundsätzliche Unterschiede sind aber in der Praxis aufgrund der involvierten Funktionsfeinheiten klar zu erkennen. Das Modell Für ein besseres Verständnis der unterschiedlichen Techniken wurde in [Wiesmann et al. 2000] ein ’abstraktes’ funktionales Modell erarbeitet, welches in fünf generische Phasen unterteilt ist. Diese Phasen stellen wichtige Stufen bzw. Schritte innerhalb eines Protokolls dar und dienen gleichzeitig einer Charakterisierung für die verschiedenen Replikationstechniken. Manche Techniken überspringen einzelne Phasen, ordnen sie anders um, iterieren über manche davon, oder führen sie zu simpleren Phasen zusammen. Somit kann man die unterschiedlichen Techniken aus der Sicht der funktionellen Implementiereung gut miteinander vergleichen. Die in [Abb. 4.4] dargestellten Phasen dieses Protokollmodells lassen sich wie folgt erklären. 1) Request29: ein Client verschickt eine Operation an ein (oder mehrere) Replikat(e). 2) Serverkoordination (SC... engl. ’server coordination’): die Replikationsserver koordinieren untereinander die Synchronisation einer Operation. 3) Ausführung (EX... engl. ’execution’): die Operation wird auf den Replikationsservern ausgeführt. 4) Übereinstimmungskoordination (AC... engl. ’agreement coordination’): die Replikationsserver einigen sich über das Resultat der Ausführung. 5) Ende oder Antwort (END... engl. ’end’ oder ’response’): das Ergebnis der Operation wird an den Client zurück gesendet. Phase 1 (RE) Client request Phase 2 (SC) Serverkoordination Phase 3 (EX) Ausführung Phase 5 (END) Antwort Benutzer Benutzer Replikat 1 Phase 4 (AC) Einigungskoordination Aktualisiere Replikat 2 Replikat 3 Aktualisiere Abbildung 4.4: Funktionales Model eines abstrakten Protokolls [Wiesmann et al. 2000] Replikation in verteilten Systemen Ein verteiltes System wird als eine Menge von Diensten, welche von Serverprozessen implementiert und von Clientprozessen aufgerufen werden, modelliert. Zum Zwecke einer verbesserten Fehlertoleranz werden diese Dienste von mehreren (engl.: ’multiple’) Serverprozessen oder Replikaten implementiert. In diesem Kontext unterscheidet man zwischen aktiver, passiver, semi-aktiver und semi-passiver Replikation. Aktive Replikation – auch State Machine Approach genannt - stellt eine nicht-zentralisierte Replikationstechnik dar. Das Schlüsselkonzept bei dieser Methode besteht darin, dass alle Replikate die gleiche Reihenfolge von Client-Requests empfangen und verarbeiten. Die Datenkonsistenz wird hier durch deterministische Prozesse gesichert, denn es wird angenommen, dass alle Replikate dasselbe Resultat liefern, wenn sie mit gleichen Eingaben versorgt werden. Aufgrund des weitverbreiteten Bekanntheitsgrades vom Begriff ’Request’ wird in der vorliegenden Arbeit auf die deutschsprachige Übersetzung verzichtet. 29 Kapitel 4 - DATENMANAGEMENT Seite 54 Gemäß dem oben geschilderten funktionalen Modell, läßt sich ein Aktualisierungs-Request bei Aktiver Replikation wie folgt erklären (die graphische Darstellung hierfür wird in [Abb. 4.5] gezeigt): 1) 2) 3) 4) 5) der Client sendet ein Request an alle Server mit Hilfe von Atomic Broadcast 30 die Serverkoordination wird durch die Totale Ordnung gesichert alle Replikate führen die Operationen in der richtigen Reihenfolge aus keine Koordination notwendig, da Totale Ordnung und Determinismus gegeben sind alle Replikate senden dem Client ihre Resultate (dieser wartet in der Regel nur auf das Erstankommende und ignoriert die anderen) Phase 1 (RE) Client request Benutzer Phase 2 (SC) Serverkoordination Phase 3 (EX) Ausführung Phase 4 (AC) Einigungskoordination Phase 5 (END) Antwort Atomic Broadcast Benutzer Replikat 1 Aktualisiere Replikat 2 Aktualisiere Replikat 3 Aktualisiere Abbildung 4.5: Aktive Replikation [Wiesmann et al. 2000] Bei Passiver Replikation oder Primary Backup wird die Client-Request an ein Primärobjekt gesendet, welches die Operation ausführt und eine Aktualisierungsnachricht an alle anderen Replikate sendet. Die fünf Phasen des Modells sind in [Abb. 4.6] dargestellt und lassen sich wie folgt erklären: 1) 2) 3) 4) das Request wird zum Primärobjekt übertragen es findet keine Anfangskoordination statt das Primärobjekt führt die Operation aus das Primärobjekt koordiniert mit den Replikaten (bei dieser Technik oft ’Backups’ genannt) die Aktualisierungsergebnisse 5) das Primärobjekt sendet dem Client das Resultat Phase 1 (RE) Client request Phase 2 (SC) Serverkoordination Phase 3 (EX) Ausführung Phase 5 (END) Antwort VS Broadcast Benutzer Replikat 1 Phase 4 (AC) Einigungskoordination Benutzer Aktualisiere Replikat 2 Anw. Replikat 3 Anw. Abbildung 4.6: Passive Replikation [Wiesmann et al. 2000] Semi-aktive Replikation ist eine Zwischenlösung beider zuvor besprochenen Techniken, bei der keine deterministische Ausführung der Operationen angefordert wird. Der Hauptunterschied zwischen Aktiver und Semi-aktiver Replikation besteht darin, dass bei letzterer Technik, falls Durch Atomic Broadcast werden Atomisierung (engl.: ’atomicity’) und Totale Ordnung (engl.: ’total order’) unterstützt, d.h. alle Server erhalten dieselbe Nachrichten und alle Server liefern die gleichen Ergebnisse, und zwar immer in der gleichen Reihenfolge. [Mullender 1989][Wiesmann et al. 2000] 30 Kapitel 4 - DATENMANAGEMENT Seite 55 Replikate eine nicht-deterministische Entscheidung treffen sollten, ein Prozeß namens ’Führer’ (engl.: ’leader’) die gültige Auswahl bestimmt und sie an die ’Nachfolger’ (engl.: ’followers’) verschickt. Die Phasen 3 (EX) und 4 (AC) werden somit für jede nicht-deterministische Entscheidung wiederholt. Die Phasen, wie in [Abb. 4.7] graphisch dargestellt, erklären sich wie folgt: 1) 2) 3) 4) der Client sendet eine Atomic-Broadcast-Request die Serverkoordination findet hinsichtlich Totaler Ordnung statt alle Replikate führen die Operationen in der richtigen Reihenfolge aus im Fall einer nicht-deterministischen Entscheidung informiert der Führer seine Nachfolger via View Synchronous Broadcast (VS Broadcast) 31 5) das Resultat wird dem Client gesendet Phase 1 (RE) Client request Phase 2 (SC) Serverkoordination Phase 3 (EX) Ausführung Atomic Broadcast Benutzer Phase 4 (AC) Einigungskoordination Phase 5 (END) Antwort VS Broadcast Replikat 1 ‘Führer’ Aktualisiere Replikat 2 Aktualisiere Anw. Replikat 3 Aktualisiere Anw. Benutzer Abbildung 4.7: Semi-aktive Replikation [Wiesmann et al. 2000] Bei der Semi-passiven Replikation, welche eine Variante der Passiven Replikation ohne Ansichten (’views’) darstellt, werden die Phasen 2 (SC) und 4 (AC) zu einem einzigen Koordinationsprotokoll zusammengefügt. Im Bereich der verteilten Systeme ist die somit entstandene Phase unter dem Namen Consensus with Deferred Initial Values bekannt. Da im Kontext der Datenbanken keine äquivalente Technik auffindbar ist, wird die Semi-aktive Replikation hier nicht näher erläutert. Unter Berücksichtigung der Parameter ’Ausfallstransparenz für Clients’ und ’Serverdeterminismus’ lassen sich die vier oben beschriebenen Replikationstechniken für verteilte Systeme, wie in [Abb. 4.8] dargestellt, gruppieren. Serverdeterminismus gefordert Serverausfall nicht transparent für Client Serverausfall transparent für Client Serverdeterminismus nicht gefordert Passiv Aktiv Semi-aktiv Semi-passiv Abbildung 4.8: Replikation in Verteilten Systemen [Wiesmann et al. 2000] 31 Das Verschicken einer Nachricht mit VS Broadcast von einem Gruppenmitglied zu seiner Gruppe, welche sich unter der gleichen ’Ansicht’ (engl.: ’view’ = die Beschaffenheit einer Gruppe zu einem gegebenen Zeitpunkt) befinden muß, garantiert folgendes: falls ein Prozeß als Erster eine Nachricht vor dem Installieren einer neuen Ansicht liefert, dann installiert kein anderer Prozeß die neue Ansicht, bis alle Gruppenmitglieder dieselbe Nachricht geliefert haben. Kapitel 4 - DATENMANAGEMENT Seite 56 Replikation in Datenbanksystemen Replikation in Datenbanken kommt hauptsächlich zum Zweck der Performanzsteigerung zum Einsatz. Das Ziel ist einen lokalen Datenzugriff zu ermöglichen, um die Antwortzeiten zu minimieren und den Netzwerkverkehr zwischen den Systemknoten zu entlasten. Für die Datenkonsistenz bei Lese- und Schreibvorgängen kann nur ein Replikationsprotokoll garantieren. Das Problem der Fehlertoleranz kann mit Backupmechanismen gelöst werden. Die Lösung bleibt damit transparent für den Benutzer und spielt deshalb keine Hauptrolle in diesem Kontext. In [Wiesmann et al. 2000] wird die von Gray et al.32 entwickelte Kategorisierung für Replikationstechniken in Datenbanken übernommen. Mit Hilfe der Parameter Aktualisierungsfortpflanzung und -standort (engl.: ’update propagation and location’) kann man folgende Kategorien, wie in [Abb. 4.9] dargestellt, feststellen: eifrige Replikation (engl.: ’eager replication’) träge Replikation (engl.: ’lazy replication’) Primärkopie-Replikation (engl.: ’primary-copy-replication’) Aktualisiere-Überall-Replikation (engl.: ’update-everywhere replication’) Update locatiion (Aktualisierungsstandort) a) b) c) d) Eager Primary Copy (Eifrig Primärkopie) Lazy Primary Copy (Träge Primärkopie) Eager Update Everywhere (Eifrig Aktualisiere-Überall) Lazy Update Everywhere (Träge Aktualisiere-Überall) Update propagation (Aktualisierungsfortpflanzung) Abbildung 4.9: Replikation in Datenbanken [Wiesmann et al. 2000] In eifrigen Replikationssystemen pflanzt sich die Aktualisierung innerhalb der Transaktionsgrenzen fort, d.h. der Benutzer empfängt keine Bestätigungsmeldung bis genügend viele Replikate im System aktualisiert wurden. Träge Systeme aktualisieren sofort die lokale Kopie, bestätigen die Operation und verbreiten erst zu einem späteren Zeitpunkt die Aktualisierung weiter. Bezüglich des Aktualisierungsstandorts erfordert die Primärkopie-Replikation die Ausführung aller Aktualisierungen auf einem Primärreplikat (engl.: ’primary or master copy’) und dann erst auf die restlichen Systemreplikaten. Die Aktualisiere-Überall-Replikation (engl.: ’updateeverywhere replication’) erlaubt eine quasi-synchrone Aktualisierung auf jedes Replikat des Systems. Bei der eager primary copy (’eifrige Primärkopie’) Replikation wird die Operation auf dem Primärobjekt ausgeführt und dann die Aktualisierung auf weitere Replikate weiter verbreitet. Sobald diese Primärkopie die Bestätigung aller Replikate empfängt, wird dem Benutzer das Resultat gesendet. In [Abb. 4.10] wird dieses Verhalten dargelegt. Die Phase 2 (Serverkoordination) verschwindet hier, da die Ausführung an einem einzigen Ort stattfindet. N. Gray, P. Helland, D. Shasha und P. O’Neil. “The dangers of replication and a solution” - in Proceedings of the 1996 ACM SIGMOD International Conference on Management of Data, pages 173– 82, Montreal, Canada. 1996. 32 Kapitel 4 - DATENMANAGEMENT Seite 57 Phase 2 (SC) Serverkoordination Phase 3 (EX) Ausführung Phase 4 (AC) Einigungskoordination Benutzer Replikat 1 Aktualisiere Replikat 2 Anw. Replikat 3 Anw. Zwei-Phasen Bestätigung Phase 1 (RE) Client request Phase 5 (END) Antwort Benutzer Abbildung 4.10: Eager primary copy Replikation [Wiesmann et al. 2000] Die eager update everywhere (’eifrige aktualisiere-überall’) Replikation wird in zwei unterschiedlichen Methoden unterteilt. Diese Unterteilung ergibt sich aus der Tatsache, dass man entweder eine verteilte Sperre (engl.: ’distributed locking’) oder ein Atomic Broadcast für die Verbreitung der Aktualisierung implementieren kann. Bei eager update everywhere (’eifrige aktualisiere-überall’) Replikation mit verteilter Sperre kann auf ein Replikat nur dann zugegriffen werden, nachdem es für alle Systemknoten gesperrt wurde. Dieses an alle gesendetes Sperr-Request entspricht also der Serverkoordinationsphase des Modells, wie aus [Abb. 4.11] ersichtlich. Phase 1 (RE) Client request Phase 2 (SC) Serverkoordination Phase 3 (EX) Ausführung Phase 4 (AC) Einigungskoordination Phase 5 (END) Antwort Benutzer Replikat 1 Aktualisiere Replikat 2 Aktualisiere Replikat 3 Aktualisiere Zwei-Phasen Bestätigung Benutzer Abbildung 4.11: Eager update everywhere Replikation mit verteilter Sperre [Wiesmann et al. 2000] Das Phasenverhalten einer eager update everywhere (’eifrige aktualisiere-überall’) Replikation mit Atomic Broadcast lässt sich, wie in [Abb. 4.12] präsentiert, folgendermaßen erklären: (1) der Client sendet ein Request zum lokalen Server, (2) der lokale Server leitet das Request mittels Atomic Broadcast weiter, (3) alle Server führen die Operationen aus (falls Konflikte entstehen, werden die Operationen gemäß Totaler Ordnung ausgeführt), (4) keine Koordination in Phase AC notwendig, und (5) alle Server senden eine Antwort zum Client. Phase 1 (RE) Client request Benutzer Phase 2 (SC) Serverkoordination Phase 3 (EX) Ausführung Atomic Broadcast Phase 4 (AC) Einigungskoordination Phase 5 (END) Antwort Benutzer Replikat 1 Aktualisiere Replikat 2 Aktualisiere Replikat 3 Aktualisiere Abbildung 4.12: Eager update everywhere Replikation mit Atomic Broadcast [Wiesmann et al. 2000] Kapitel 4 - DATENMANAGEMENT Seite 58 Das Hauptmerkmal der ’trägen Primärkopie-Replikation’ 33 liegt darin, dass alle Clients den gleichen Server kontaktieren müssen, um alle Aktualisierungsvorgänge bekanntzugeben. Somit wird das Zustandekommen eines Synchronisation-Overheads vermieden. Wichtig ist aber, wie aus [Abb. 4.13] ersichtlich, die Berücksichtigung der Phase 5 (AC), in der die Konsistenz der Datenbestände koordiniert werden sollte. Hier entfällt diese Überprüfung, da alle Operationen schon auf dem Primärobjekt stattgefunden haben, und somit bloß das Aktualisierungsresultat auf die Replikate angewendet wird. Phase 1 (RE) Client request Phase 2 (SC) Serverkoordination Phase 3 (EX) Ausführung Phase 4 (END) Antwort Benutzer Phase 5 (AC) Einigungskoordination Benutzer Aktualisiere Replikat 1 Replikat 2 Anw. Replikat 3 Anw. Abbildung 4.13: Lazy primary copy Replikation [Wiesmann et al. 2000] Die fünfte Replikationstechnik im Bereich der Datenbanksysteme, die ’träge AktualisiereÜberall Replikation’ 34, unterscheidet sich von der zuvor beschriebenen Technik darin, dass ein Abstimmungsmechanismus35 in der fünften Phase (Übereinstimmungskoordination) notwendig ist, um zu entscheiden, ob Transaktionen rückgängig gemacht werden müssen, falls Konflikte zwischen den Systemknoten stattgefunden haben. Solche Abstimmungen scheitern meistens daran, dass sie für die Ausführung einzelner Operationen auf einzelnen Objekten implementiert werden, und deshalb nicht mehrere Transaktionen auf unterschiedliche Objekte konsistent bewältigen können. In [Abb. 4.14] wird das Modell dieser Methode graphisch präsentiert. Phase 2 (SC) Serverkoordination Phase 3 (EX) Ausführung Phase 4 (END) Antwort Benutzer Replikat 1 Phase 5 (AC) Einigungskoordination Benutzer Aktualisiere Replikat 2 Anw. Replikat 3 Anw. Abstimmung Phase 1 (RE) Client request Abbildung 4.14: Lazy update everywhere Replikation [Wiesmann et al. 2000] Analyse und Synthese der unterschiedlichen Mechanismen Aus den in diesem Abschnitt beschriebenen Replikationstechniken, welche starke Datenkonsistenz gewährleisten können, lassen sich die in [Abb. 4.15] dargestellten Kombinationsmöglichkeiten der Modellphasen identifizieren. Jede Technik, die starke Konsistenz sichern soll, enthält mindestens einen Synchronisationsschritt (SC- und/oder eine AC-Phase) vor dem END-Schritt. Falls die Ausführungsphase (EX) deterministisch ist, entfällt eine Synchronisation nach der EX-Phase. ‘lazy primary copy replication’ ’lazy-update-everywhere-Replikation’ 35 ’reconciliation’ 33 34 Kapitel 4 - DATENMANAGEMENT Seite 59 C R E S E X A C E N D R E E X N D A C E C R E S E X E N D Abbildung 4.15: Phasenkombinationen für starke Datenkonsistenz [Wiesmann et al. 2000] Eine Zusammenfassung aller geschilderten Techniken wird in [Abb. 4.16] präsentiert. Mehrere Schlußfolgerungen lassen sich aus dieser Graphik ziehen. Primary-copy-Replikation und Passive Replikation besitzen keine Serverkoordinationsphase (SC). Da ein Primärobjekt die Operation vollständig und unabhängig ausführt, braucht man keine Koordination zwischen den Replikaten vor der Ausführungsphase. Der Unterschied zwischen Eager- und LazyReplikationssysteme liegt in der Reihenfolge der AC und END Phasen. Die AC-Phase kommt in der Eager-Technik vor dem END-Schritt, in der Lazy-Technik umgekehrt. Viele Ähnlichkeiten können in den Replikationsalgorithmen bei Datenbanken und verteilten Systemen (trotz unterschiedlicher Modellierungen, Einschränkungen und Terminologien) identifiziert werden. All diese funktionalen Ähnlichkeiten erbringen somit den Beweis für die Notwendigkeit einer sinnvollen Kooperation zwischen beiden Disziplinen. So könnten replizierende Datenbanken von den Abstraktionen der Techniken in verteilten Systemen einen großen Nutzen ziehen. Dies erklärt also die Wichtigkeit der Behandlung des Themas für diese Arbeit aus den unterschiedlicheren Sichtweisen: aus der Perspektive des Bereichs ’Datenbanksysteme’ und des Bereichs ’Informationssysteme’. Je nachdem wo die Schwerpunkte bei der Konzeption des Systems liegen, lassen sich unterschiedliche Lösungsansätze optimal erkennen und effizient anwenden. Modell RE EX END Passiv RE Semi-aktiv RE Eager Primary-copy RE Eager Aktualisiere-Überall mit verteilter Sperre RE Eager Aktualisiere-Überall mit Atomic Broadcast RE Zertifizierungsbasiert RE EX AC END Lazy Primary-copy RE EX END AC Lazy Aktualisiere-Überall RE EX END AC EX AC END EX AC END EX AC END SC EX AC END SC EX SC END Schwache Konsistenz SC Starke Konsistenz Aktiv Abbildung 4.16: Synthetische Ansicht der Replikationstechniken für Datenbanken und Verteilte Systeme [Wiesmann et al. 2000] 4.2.5 Andere Modelle und Lösungsansätze Die Nomenklatur der Replikationstechniken ändert sich natürlich von einer Softwarefirma zur anderen. Die von [Oracle8i 1999] unterstützten Replikationsarten lassen sich wie folgt erörtern. Kapitel 4 - DATENMANAGEMENT Seite 60 Die Multimaster Replikation (auch als Peer to Peer oder n-Way Replikation bekannt) erlaubt mehreren gleichberechtigten Systemknoten Gruppen von Replikaten zu verwalten. Jeder Knoten in einer solchen Umgebung ist ein Master-Knoten (analog zum Primär-KopieReplikationssystem). Diese Oracle-Replikationstechnik verwendet entweder synchrone oder asynchrone Mechanismen für den Datenaustausch. Ein Snapshot innerhalb einer Oracle Snapshop-Replikation beinhaltet eine komplette oder teilweise Kopie der Daten der Mastertabelle zu einem gewissen Zeitpunkt (analog zur Theorie der Ansichten bei Semi-aktiver Replikation). Eine gemischte oder kombinierte Form dieser Techniken kann in Oracle Systemen auch zum Einsatz kommen. Das verteilte System mit einer solchen hybriden Replikation besitzt dann eine beliebige Anzahl von Master- und mehrere Snapshot- Knoten für jeden Master. Bei der in [Crespo et al. 1998] beschriebenen Architektur für Digitale Bibliotheken, welche auf einer geschichteten Systemstruktur basiert, wird die gesamte Funktionalität der Replikationsmechanismen einer spezialisierten Zuverlässigkeitsschichte (engl.: ’reliability layer’) überlassen. Diese Schichte befindet sich auf jedem Systemknoten, empfängt jede Art von Modifikations- oder Aktualisierungs-Requests, und trägt die alleinige Verantwortung für die Verwaltung von Replikaten. Diese zellenförmige Schichtstruktur stellt eine Art ’filterorientierte’ Replikationstechnik dar. Viele verteilte Datenbanken wenden epidemische Replikationsmechanismen, um replizierte Daten zu verwalten, an. Hierbei werden Benutzeroperationen auf ein einziges Replikat ausgeführt. Asynchron findet dann eine separate Aktivität statt, die periodisch paarweise Vergleiche der Kopien (welche Information über Versionen oder Timestamps enthalten) unternimmt, um obsolete Replikate zu verwerfen oder zu aktualisieren. Das durch diese Vergleiche entstandene Overhead wächst somit linear mit der Anzahl der Daten im System, welches wiederum die Skalierbarkeit des Systems beeinträchtigt [Rabinovich et al. 1996]. Die Problematik der verteilten Datenspeicherung kann auch aus zwei unterschiedlichen menschenbezogenen Perspektiven betrachtet werden. Replikationstechniken stellen laut [Theel et al. 1999] eine Lösung aus der Sicht des ’Datenversorgers’ (eng.: ’data provider’) dar. Aus der Sicht der Systembenutzer lassen sich andere Lösungen identifizieren, wie zum Beispiel Datenmigration, Serverspiegelung oder die verteilte Pufferung (engl.: ’distibuted caching’). Von diesen Möglichkeiten kann das Distributed Caching eine effiziente Transparenz und gute Performanz, insbesondere bezüglich Bandbreite und Antwortzeiten, anbieten. Eine durchdachte Lösung, mit Hilfe der in diesem Abschnitt beschriebenen Techniken, kann eine effiziente, effektive und nachhaltige Wirkung auf die Architektur von Informationssystemen (insbesondere für große und geographisch verteilte Unternehmen) haben, und deren Funktionalität und Performanz steigern. Die erhöhte Komplexität der technischen Implementierung soll dabei nicht unterschätzt werden, weshalb gute Kenntnisse in den Bereichen Datenbanken und verteilte Systeme sehr nützlich sind. 4.3 Schlußbemerkung In diesem Kapitel wurde eine Übersicht in die Problematik der verteilten Datenspeicherung gegeben. Insbesondere für die verteilte Struktur eines transnationalen Konzerns wurden Antworten auf die Schlüsselfrage Wann wird was und wie repliziert? im Bereich der Datenreplikation gefunden. Durch die Implementierung einer verteilten Lösung werden große Vorteile im Zusammenhang mit Kosten, Verwaltung und Performanz erwirkt. Die optimale Konfiguration eines Rechners ist Kapitel 4 - DATENMANAGEMENT Seite 61 abhängig von der Art der Arbeit, die er zu verrichten hat. Die Vorteile einer verteilten Datenbankarchitektur mit Replikationsmechanismen können, unter Anwendung gut durchdachter Strategien, die Performanz und Transparenz des gesamten Systems optimieren. Wenn ein verteiltes System Probleme mit der Performanz zeigt, können die dafür verantwortlichen Komponenten identifiziert und optimiert werden. Ein Ausfall an einem der Knoten eines verteilten Datenbanksystems wirkt sich weit weniger dramatisch aus, als der Ausfall des Hauptrechners einer zentralisierten Datenbank. Datenbanken könnten zum Beispiel durch eine Replikationsumgebung und durch Anwendungen auf Ersatzhardware abgesichert werden. Dies erhöht die Fehlertoleranz des Systems. Unter Transparenz versteht man im Zusammenhang mit Datenbanksystemen - in Analogie zur Disziplin der verteilten Systeme – die Eigenschaft, dass sich weder Applikationen noch Benutzer darum kümmern müssen, wo die Informationen genau gespeichert sind oder wie die Verteilung auf die einzelnen Systemknoten aussieht. Durch das Verbergen solcher Details wird die Bedienbarkeit des Systems vereinfacht. Die Autonomie von Systemknoten wird durch eine Verteilung gesichert, da die einzelnen Komponenten des verteilten Datenbanksystems voneinander völlig unabhängig sind, wodurch sie unabhängig voneinander konfiguriert, gewartet und verwaltet werden können. Mit Hilfe einer sicheren Intranettechnologie ist es auch möglich, Daten gemeinsam zu nutzen, ohne Passwörter oder Accounts veröffentlichen zu müssen. Weiters kann durch das Einführen von Zugriffsrechten auf Datenbankobjekten entschieden werden, unter welchen Voraussetzungen unterschiedliche Datenbestände von einem Systemknoten zugänglich gemacht werden sollen. Weiters wurden in diesem Kapitel die Begriffe Datenbanksystem und Organisationsgedächtnis dargestellt. Aus technologischer Sicht repräsentieren beide einen Aufbewahrungsort für Daten, Information bzw. Wissen. Um diese Wissensbasis eines Unternehmens zu erfassen, muß man nach wiederauffindbarem Wissen fragen. Kritische Aspekte im Kontext des Zugriffs auf Wissenseinheiten stellen die Lokalisierung und die Art der Speicherung dar, insbesondere in komplexen und weltweit verteilten Strukturen (wie zum Beispiel in transnationalen Konzernen). Einige der wichtigsten technologischen Entscheidungskriterien, Einflußfaktoren, Lösungstechniken und Auswirkungen in Bezug auf Datenaufbewahrung, -wartung und –zugriff wurden in diesem Kapitel präsentiert und analysiert. Durch den Einfluß von modernen Lösungsansätzen und –theorien im Bereich der Informationstechnologie, das Zusammenkommen mehrerer Managementdisziplinen (insbesondere im informationstechnischen Bereich), die stetig wachsende und mutierende Komplexität von Unternehmensstrukturen und die immer wachsende Bedeutung der Ressource Wissen sind abstrakte und an Semantik reichere Techniken für die Organisation von Wissenseinheiten in großen Unternehmen notwendig, welche eine nachhaltige und dynamische Informationsaufbereitung erlauben. Für die Wissensverwaltung und die Wiederauffindung von Informationen in transnationalen Konzernen ist auch eine geeignete Themenhierarchie, die Verwendung von geeigneten Zusatzinformationen (Metadaten) sowie der Zugang zu den Informationen über unterschiedliche Sichtweisen unumgänglich. Diese Aspekte werden vom Bereich Wissensorganisation behandelt und sind das Thema des nächsten Kapitels. Kapitel 4 - DATENMANAGEMENT Seite 62 Kapitel 5 - WISSENSORGANISATION Seite 63 Kapitel 5 Wissensorganisation „…who controls the vocabulary, controls the knowledge.“ 36 George Orwell 5.1 Allgemeines Die Problematik bei der Erstellung von Strukturen für die Aufbereitung und Verwaltung von Information in großen und geographisch verteilten Unternehmen ist analog zum Phänomen der semantischen Organisation von Ressourcen (Informationsquellen) im Internet: eine unorganisierte und unkontrollierte Zunahme von Daten innerhalb eines Informationssystems erschwert den zielgerechten und anwendungsgerechten Zugang zum Wissen, weil die meisten Speicher- bzw. Zugangsmechanismen nicht imstande sind, die Komplexität der Strukturen (z.B. bzgl. Größe und Verteilungsgrad des Systems, Relevanzgrad von Daten aufgrund von Replikationen, Mangel an Deskriptoren, u.a.) und den Erstellungszweck von Dokumenten und deren Inhalten semantisch richtig zu interpretieren. Deshalb sind global geltende Strukturen und Mechanismen notwendig, welche die Darstellung einer abstrakten und dynamischen Beschreibungsebene ermöglichen. Hierfür sind Zusatzinformationen, Strukturen und Systeme gefragt, welche die Auffindung, Navigation und Klassifikation von Informationseinheiten erleichtern. Interessante Lösungsansätze, Methoden und Strukturformen, die diesen Anforderungen genügen, sind in unterschiedlichen Disziplinen zu finden: Bibliothekswissenschaft, Wissensorganisation, Dokumentenmanagement, Information Retrieval, Archivierungswissenschaft, Terminologiewissenschaft, Ontology Engineering, Informationswissenschaft und andere. Dieses Kapitel untersucht die wichtigsten Aspekte im Zusammenhang mit einer semantischen Informationsaufbereitung und die unterschiedlichen Möglichkeiten des Zugangs zu semantisch organisiertem Wissen. Im ersten Teil des Kapitels wird eine allgemeine Übersicht in unterschiedlichen Disziplinen – Wissensorganisation, Document & Content Management, Information Retrieval, Ressource Discovery, Library & Archival Science - und deren Bedeutung für die Informationsaufbereitung und Wissensorganisation in großen und geographisch verteilten Unternehmen gegeben. Der zweite Teil untersucht die Begriffe ’Semantik’, ’Zusatzinformation’, ’Ontologien’ und ’Inhaltserschließung’, wodurch der Grundstein geschaffen wird, um komplexe Strukturen und Systeme zu analysieren, die in den darauf folgenden Abschnitten präsentiert werden: ’Organisationssysteme’ und ’Sichtweisen’. Das Kapitel wird mit der Analyse mehrdimensionaler Lösungsansätze (Wissensvisualisierung und komplexe Repräsentationskarten) abgeschlossen. Der Schwerpunkt der vorliegenden Arbeit liegt sowohl in der algorithmischen Beschreibung von Strukturen (aus programmiertechnischer Sicht) als auch in den formalen Anforderungen (aus unternehmerischer Sicht) und Mechanismen (aus informationstechnischer Sicht) für die Beschaffung einer effizient organisierten, nachhaltigen und unternehmensgerechten 36 „...wer das Vokabular kontrolliert, kontrolliert das Wissen. [George Orwell]“ Kapitel 5 - WISSENSORGANISATION Seite 64 (zielgerechten) ’Informationsinfrastruktur’. Die hier beschriebenen und untersuchten Strukturen ermöglichen eine strategische Kodifizierung und Personalisierung von Wissen im Unternehmen und sollen den semantischen Zugang und die anwendergerechte Präsentation von Information verbessern. 5.1.1 Wissensorganisation Wissensorganisation befaßt sich damit, wie Wissenseinheiten (meist Begriffe und Objekte als explizite Einheiten) für spezifische Aufgaben und Anwendergruppen thematisch organisiert werden können, damit Wissensarbeiter ihre Ziele besser erledigen können. Damit ist aus technischer Sicht die Optimierung semantischer Zugangsmodelle für Wissen gemeint. Zweck der Wissensorganisation ist es, Wissen durch Organisation ’intellektuell’ zugänglich zu machen, d.h. Zugang und Auffindung des intellektuellen Kapitals eines Unternehmens optimal zu organisieren. Von unternehmerischer (und sozialer) Bedeutung ist, dass Wissensorganisation dazu beitragen kann, den Wissensbestand so aufzubereiten und zur Verfügung zu stellen, dass er für Menschen wieder übersehbar wird. [Sigel 2001] Ein wichtiges Gebiet der Wissensorganisation wird durch die Behandlung von Themenübersichten und Zugangsstrukturierungen sowie dem zum Wiederfinden dienenden Mechanismen dargestellt. Konkrete Wissensorganisationsprodukte sind traditionell universale und spezialisierte Klassifikationssysteme und Thesauri, die sich insbesondere für stark vernetzte Informationssysteme eignen. Sobald die Relevanz der Datenbestände und ihre Beziehungen untereinander explizit genug spezifiziert wurde, spricht man von einer Ontologie. Solche Begriffs-Beziehungsgeflechte gemeinsamen Verständnisses lassen sich auch erfolgreich visualisieren, zum Beispiel mit der Hilfe von Topic Maps, Concept Maps, Knowledge Maps oder Mind Maps. Experten im Bereich der Wissensorganisation setzen sich mit dem Organisieren von Wissen als dreidimensionales Gebilde, bestehend aus Wissenselementen, Wissenseinheiten und Wissenskomplexen, auseinander. [Sigel 2001] Wissenseinheiten sind Begriffe und werden meist durch Zeichen oder Zeichenfolgen dargestellt. Wissenselemente sind Begriffseigenschaften, also Merkmale oder Charakteristika zu einem Konzept (Begriff), und kommen durch Aussagen über Beziehungen zustande. Wissenskomplexe bzw. Wissensmodule sind Begriffsverknüpfungen in Aussage-Zusammenhängen, zum Beispiel Definitionen oder Texte. [Sigel 2001] [Sigel 2001] präsentiert eine von Dr. Ingetraut Dahlberg stammende Definition für Wissensorganisation (engl.: ’Knowledge Organisation’, kurz ’KO’ genannt), welche die genannten Dimensionen (Momente) enthält: „... in der KO geht es also darum, diese drei Momente entsprechend ihren Bezugsgegenständen der realen Welt und der menschlichen Geistesaktivitäten in den Griff zu bekommen... / ...sie also begrifflich zu erfassen und entsprechend so zu 'organisieren', also planvoll zu gruppieren, anzuordnen und verbal darzustellen, dass der Betrachter Einsicht gewinnt, Zusammenhänge erkennen und für sich und seine Umgebung daraus nützliche Folgerungen ziehen kann.“ [Sigel 2001a] Kapitel 5 - WISSENSORGANISATION Seite 65 Besonders wichtig für große Unternehmungen ist der Aufbau von Begriffssystemen, die eine semantische Beschreibung des intellektuellen Kapitals erleichtern, und somit das (Wieder)Auffinden und den Zugang von unternehmensrelevanten Konzeptualisierungen verbessern. Eine Möglichkeit hierfür stellt die Modellierung solcher Konzeptualisierungen als Wissensstrukturen in Ontologien, d.h. in expliziten Spezifikationen von Konzepthierarchien. Für die Darstellung solcher Modelle bedient sich die Wissensorganisation moderner Beschreibungsstandards (normalisierte Metadaten als kontrolliertes Vokabular), welche den Informationsressourcen zugeteilt werden. Zusammenfassend lassen sich folgende Grundfragen für eine erfolgreiche informationstechnisch erfassbare Wissensorganisation erkennen [Sigel 2001]: Wie kann man wesentliches Wissen bzw. relevante Wissensstrukturen erkennen? Wie kann man Wissen ziel- und anwendergerecht darstellen? Wie kann man Wissen zweckmäßig auffindbar und navigierbar machen? Wie kann man Wissen interoperabel machen und halten? und Die Arbeitsgruppe ’Knowledge Organization and Internet’ der Internationalen Gesellschaft für Wissensorganisation (ISKO) geht von der These aus, dass sich Wissensstrukturen (oft) vorteilhaft als ’Begriffs- bzw. Themennetze’ organisieren lassen, welche auf expliziten Begriffssystemen beruhen [Sigel et al. 2000]. Aus der Sicht der Wissensorganisation besteht also die Notwendigkeit, sich mit den aktuellen technologischen Entwicklungen vertraut zu machen, aber auch die eigene Kompetenz aktiv einzubringen, um Doppelentwicklungen in anderen Gebieten zu vermeiden. Der Autor von [Sigel 2000] ist davon überzeugt, dass moderne Wissensorganisation (z.B. mit der Hilfe von Topic Maps und Kategoriehierarchien) das Wissensmanagement sowie komplexes Information Retrieval erheblich voranbringen kann. Große und geographisch verteilte Unternehmen, die grenzüberschreitend ihre vernetzten Strukturen und Geschäftsprozesse (beispielsweise über moderne Intranetlösungen) zu organisieren und verwalten versuchen, sollten sich der Erkenntnisse und Fortschritte im Bereich der Wissensorganisation bedienen, da diese interdisziplinäre Aktivität den intellektuellen und kulturellen Wert der unternehmerischen Wissensbasis durch themenorientierte Zusatzinformationen und maßgeschneiderte strukturierte Zugangspunkte bzw. benutzerorientierte konzeptualisierte Sichtweisen steigert. Die dem Bereich Wissensmanagement eher zugeordneten Disziplinen ’Document Management’ und ’Content Management’ befassen sich ebenfalls mit dem Optimieren von Informationsstrukturen und mit der semantischen Extraktion von Zweck und Sinn eines Dokuments innerhalb eines Informationssystems. Der nächste Abschnitt gibt einen Einblick in diese Thematik. 5.1.2 Document Management und Content Management Im Bereich der webbasierten Informationstechnologie werden oft Document Management und Content Management als ’stand-alone’ Applikationslösungen gesehen, die vom gesamten Informationssystem unterschieden werden. Aus der Sicht des Marketings findet diese Betrachtungsweise sicherlich Gültigkeit, da dort neue und unterschiedliche Begriffe benötigt werden, um Marktsegmente zu begrenzen. Reale Geschäftsprozesse zeigen hingegen, dass diese Kapitel 5 - WISSENSORGANISATION Seite 66 zwei ’isolierte’ Disziplinen eigentlich zwei verschiedene Perspektiven des gleichen Bildes und Zieles darstellen: das Erfassen und Steuern von wertvollen Informationseinheiten und deren terminologische bzw. semantische Präsentation in Abhängigkeit von unternehmens- und benutzerspezifischen Anforderungen [Hyperwave 2002a]. Document Management In der vorliegenden Arbeit wird ein Dokument, in Übereinstimmung mit den in [Whatis 2002] und [Encarta 2002] angegebenen Definitionen, als eine Form von Information interpretiert, d.h. eine – elektronisch - erfasste Aufzeichnung mit dem Ziel gewisse Information nicht zu verlieren. Ein Dokument ist also ein Bestandteil eines Informationssystems, der einen elektronisch erfaßten - informativen Inhalt besitzt. Die in der vorliegenden Arbeit verwendete Definition von ’Document Management’ basiert also auf der zuvor erwähnten Perspektive (d.h. es wird im Folgenden der Bereich ’Elektronisches Document Management’ gemeint) und lautet wie folgt: „...Document Management ist eine Reihe von Technologien und Disziplinen, welche für die Verwaltung und Nutzung der in Dokumenten dargestellten Informationsbeständen angewendet wird. Das Dokument kann die Prozesse und Ziele der Organisation unterstützen oder als ein Speicherort des Intellektuellen Kapitals agieren."37 [SP 2002] Die wichtigsten Funktionen des Document Management sind somit: Erfassung, Speicherung, Auffindung, Anzeige, Bearbeitung bzw. Manipulation, Verteilung, Verarbeitung und Verwaltung von Dokumenten. Es sei an dieser Stelle darauf hingewiesen, dass man Information nicht nur in Form von Text elektronisch erfassen kann, sondern ebenfalls in multimedialer Form (z.B. Video, Ton oder Bild). Bezüglich der Organisation und Aufbereitung von Information lassen sich zwischen Document Management und dem Bereich Wissensorganisation Parallelen erkennen. Für die Beschaffung von explizitem Wissen und die Bereicherung der Semantik von Datenbankobjekten ist die Verwendung von Zusatzinformationen in Form von Metadaten unumgänglich. Flexible Taxonomien (Strukturhierarchien), die in Form von Baumstrukturen unbegrenzter Tiefe und Breite dargestellt und mit unterschiedlichen Sicherheits- und Zugriffsrechtsmechanismen versehen werden können, steigern die Dynamik der Lösungskonzeption von komplexen Informationssystemen. Kategorisierung (die geordnete Indexierung der Dokumente über MetaAttribute) und Lebensdauer (meistens ist hiermit die Sichtbarkeit von Datenbankbeständen gemeint) sind auch wichtige funktionelle Bestandteile von modernen Systemen. Ein wichtiger und kritischer Aspekt in webbasierten Document Management Systemen stellt die Verknüpfungskonsistenz (’link consistency’) dar. Über spezielle Mechanismen, wie zum Beispiel das Link Management des Hyperwave Informationssystems, können Dokumente verschoben oder gelöscht werden, wobei alle zu diesem Dokument zeigenden Links (innerhalb des Systems) automatisch aktualisiert werden [Hyperwave 2002a]. Interessant für die Organisation und Aufbereitung des Wissens innerhalb eines großen und verteilten Systems ist die Analyse des Wesens eines Dokuments bezüglich des Lebenszyklus 37 "Electronic Document Management is a set of technologies and disciplines used to manage and exploit the information assets represented by documents. The document may support organisational processes or goals, or act as a container of the intellectual capital of the organisation.” [SP 2002] Kapitel 5 - WISSENSORGANISATION Seite 67 vom Intellektuellen Kapital einer Institution. Da Dokumente als explizites Wissen angesehen werden können, sollte auch ein Lebenszyklus für Dokumente existieren. Das in [Ginsburg 2000] vorgeschlagene Modell für den Lebenszyklus von Dokumenten innerhalb eines zentralisierten Informationssystems für große und verteilte Institutionen betrachtet Document Management als ein sozio-technisches Problem einer ’Wissensökologie’. In so einem Lebensraum identifiziert man fünf unterschiedliche Phasen im Lebenszyklus eines Dokuments: Erstellung Publizierung Organisation Zugriff Vernichtung Bedeutend für die vorliegende Arbeit ist das Erkennen der Lebensphasen eines Objektes in einem System, vor allem bei der Konzeption eines wissensbasierten Intranetsystems für transnationale Konzerne. Zusätzlich zu den oben angegebenen Phasen weist [Ginsburg 2000] auf den direkten Einfluß der ’Aktoren’ (d.h. der Benutzer) auf den Lebenszyklus von Dokumenten hin. In der Regel werden Dokumente von Menschen erzeugt und modifiziert. Eine effiziente Benutzerverwaltung (bzw. Gruppenverwaltung) spielt somit eine entscheidende Rolle bei der benutzerorientierten Präsentation der Wissenseinheiten, d.h. wann ist ein Benutzer zum Beispiel ein Leser, ein Autor oder ein Verfasser, und wie werden die Dokumente vom System in solchen Fällen behandelt? Wichtige Aspekte in diesem Zusammenhang erkennt man in [Hyperwave 2002a] bei der Beschreibung von Dokumentenerstellung und -kontrolle (z.B. über Mechanismen der Versionskontrolle) sowie bei der Informationsweitergabe (Zugriffsrechte auf Gruppenebene). Content Management Der Begriff Content Management leidet wie zahlreiche der neuen Marketingslogans unter mehreren Definitionsschwächen. Viele Anbieter werben momentan mit dem Begriff ’Content Management System’, dahinter verbergen sich jedoch die unterschiedlichsten Systemlösungen. Die vom Autor der vorliegenden Arbeit übernommene Auffassung des Begriffs lehnt sich an die in [Rothfuss 2000] angegebene ’allgemeine’ Definition, welche wie folgt interpretiert wird: „Content Management befasst sich mit der Erstellung, Erfassung, Speicherung und Verbesserung von strukturierten Inhalts- und Multimediabeständen in einer geregelten Kollaborationsumgebung. Es erleichtert den Zusammenbau, die Analyse, die Verarbeitung und die Wiedernutzung von Inhalt." 38 [Rothfuss 2000] Content Management kann somit als der auf Dokumenteninhalt spezialisierte „Verwandte“ vom Document Management angesehen werden (Anmerkung des Autors der vorliegenden Arbeit). Im Bezug auf Content Management identifiziert man ebenfalls einen Lebenszyklus, der allerdings mehr mit der Funktion von Dokumenten zu tun hat [Hyperwave 2002b]: Erstellung Kontrolle Organisation Präsentation. „… Content management deals with the creation, collection, storage and refinement of structured content and media assets in a managed collaborative environment. It facilitates assembly, analysis, processing and re-use of content.” [Rothfuss 2000] 38 Kapitel 5 - WISSENSORGANISATION Seite 68 Die gröberen Unterschiede liegen in den Phasen der Organisation und der Präsentation, bei denen nicht nur die Metainformation, sondern auch der Inhalt des Dokuments eine entscheidende Rolle spielt. Hier kommen Aspekte wie Mehrsprachigkeit (Multilingual Clusters) und Fulltext-Suche zur Geltung. Bei der Aufbereitung von Informationseinheiten – vor allem in großen und verteilten Unternehmensgedächtnissen - und deren nachhaltige und effiziente Verwaltung sind folgende Aspekte des Content Managements von besonderer Bedeutung: Wie oft wird sich der Inhalt von Dokumenten während des Lebenszyklus ändern? Welche Auswirkungen hat eine Inhaltsänderung für die Aufbewahrung bzw. für die Präsentation der Wissensbasis? Was bedeuten verschiedene Inhaltstypen für das System (z.B. Bild, Video oder Ton)? Soll das System mehrsprachige Dokumente unterstützen und wie? Was passiert bei kollaborativer Dokumentenerstellung? Ist die Implementierung von Mechanismen für Versionskontrolle wünschenswert? Welchen Einfluß hat eine Änderung vom Dokumenteninhalt Archivierungsmechanismen? Oder ab wann gibt es einen Einfluß? Ist eine besondere Dynamik im Lebenszyklus eines Dokumenteninhalts wünschenswert oder unerlässlich? Hierfür eignen sich spezialisierte Tools des Wissensmanagements, wie zum Beispiel Workflow Applikationen, aber auch Lösungsansätze des Information Retrievals, wie moderne Clustering-Verfahren. auf die Moderne Lösungsansätze in Bezug auf Content Management können bei der Organisation des Wissens bzw. Aufbereitung von Information in einem System sehr behilflich sein. Das Prinzip der in [Krottmaier et al. 2001] erklärten ’Transklusionen’ können nicht nur Speicherplatz sparen sondern sehr effektiv das Auftreten von Dead Links automatisch vermeiden und das Aktualisieren von mehrfach vorhandenem Inhalt in einem Schritt garantieren. Bei einer Transklusion werden ’Inhaltssegmente’ von fremden Quellen (zum Beispiel referenzierte Dokumente oder duplizierte Inhalte) in die eigenen Dokumente so eingefügt, dass ein eigenes Dokumentenobjekt entsteht. So kann ein neues Dokument aus zwei eigenen Absätzen und – dazwischen - einer Referenz zu einem bestimmten Absatz in einem völlig unterschiedlichen Dokument bestehen. Beim Öffnen des Dokumentes wird der ’fremde’ Inhalt dynamisch ’kopiert’ und präsentiert als wäre es immer da gewesen. Der technische Implementierungsaufwand von Transklusionen steigt mit der Unterstützung unterschiedlicher Dokumentenformate aufgrund komplexer Übersetzungsalgorithmen [Krottmaier et al. 2001]. 5.1.3 Information Retrieval und Resource Discovery Die Suche nach geeigneten Mechanismen für das Auffinden ähnlicher Dokumente oder Inhalte ist ein Teilgebiet vom Information Retrieval und vom Resource Discovery. Information Retrieval Information Retrieval, in der vorliegenden Arbeit auch Informationsauffindung genannt, basiert auf der Analyse von Daten (oft durch Verfahren der Wissensrepräsentation unterstützt), die in Wissensstrukturen gespeichert sind. Somit liefert ein Information Retrieval System Informationen über ein System mittels Transformationen auf Wissensstrukturen. Kapitel 5 - WISSENSORGANISATION Seite 69 Es ergeben sich zwei grundlegende Möglichkeiten eine Interaktion zwischen Systembenutzer und Datenbankobjekten zu ermöglichen: Navigieren (’Browsing’) und Auffinden (’Retrieval’). Oft wird die Navigation über Systemstrukturen ’logische Sichtweise’, das Auffinden der Information ’semantische Sichtweise’ genannt [Baeza-Yates et al. 1999]. Information Retrieval behandelt also Systeme für das Indizieren, Suchen und Wiederauffinden von Daten und Inhaltselementen in elektronischen Dokumenten [García-Barrios 2001a], womit sich die Frage nach einer geeigneten Repräsentationsform für Textinhalte stellt. Um die Qualität von solchen Systemen zu messen, werden oft zwei meßbare Kriterien verwendet: ’Recall’ (wieviel Prozent aller relevanten Dokumente wurden nach einer Suchabfrage gefunden) und ’Precision’ (wieviel Prozent aller gefundenen Dokumente waren relevant) [Guetl 2000]. Die Messung der Qualität von Suchsystemen nach den oben erwähnten Parametern ist jedoch relativ, da in allen Definitionen die ’Relevanz’ zu finden ist. Relevanz stellt eine abstrakte Maßangabe und eine subjektive Meinung dar, um den Informationsbedarf des Benutzers zu befriedigen. Ein weiterer Parameter, um Information Retrieval zu bewerten ist ’Relevance Feedback’ (Relevanzrückmeldung), womit der Prozess des Filterns nach einer Suchabfrage gemeint ist. Nach einer verfeinerten Abfrage des Benutzers wird das System versuchen, eine qualitativ höhere Untermenge von Dokumenten zu liefern [García-Barrios 2001a]. Relevant für die in Kapitel 6 ’Lösungsvorschlag’ (Teil II ’Gestaltungsbereich’) vorgeschlagene Organisationskonzeption eines Informationssystems für große und geographisch verteilte Unternehmen sind die in Bezug auf die Informationsauffindung identifizierten semantischen Lösungsansätze einer Wissensorganisation. Durch die Zuordnung von Deskriptoren (semantische Zusatzelemente) zu Datenbankobjekten wird versucht, eine geeignete Wissensrepräsentation zu konzipieren, die weitgehend unabhängig von den konkreten Formulierungen in Dokumenten ist. Syntax und Semantik dieser Beschreibungselemente sind in Form von Modellen festgelegt. Die grundlegenden Modelle, laut [Baeza-Yates et al. 1999] in ’Boolean-’, ’Vektor-’ und ’Probabilistikmodelle’ unterteilt, ziehen in Erwägung, dass jedes Dokument sich durch eine Menge von repräsentativen Schlüsselwörtern, auch ’index terms’ genannt, beschreiben läßt. Index Terms stellen somit einfache (Dokumenten-)Wörter dar, deren Semantik dazu beiträgt, sich an die Hauptthemen des Dokuments zu erinnern. Sie werden in der Regel mit Hauptwörtern definiert, weil sie meistens eine besser begreifbare bzw. identifizierbare Bedeutung beinhalten. Diese Modelle können somit einerseits einen einfachen und schnellen Zugriff auf verteilte Datensammlungen und andererseits eine organisierte Gewichtung der Dokumente nach der Wahrscheinlichkeit ihrer Relevanz ermöglichen. Die erfolgreiche Konzeption von semantischen Modellen für stark vernetzte Informationssysteme, wie meist in transnationalen Unternehmen zu finden, setzt die Definition und Erstellung eines allgemein gültigen Vokabulars voraus. Das gewählte (selbst erstellte oder integrierte) Vokabular soll alle Mehrfachdeutungen und formale Probleme der natürlichen Sprache vermeiden. Die von dem Bereich der Informationsauffindung zur Verfügung gestellten Mechanismen, wie zum Beispiel ’Clustering’, ’Kontrollierte Vokabulare’, ’Dokumentationssprachen’ und ’Map Collections’, werden in den nächsten Abschnitten dieses Kapitels näher besprochen. Resource Discovery Ein weiterer Bereich, der sich mit der Problematik der Auffindung von Information bzw. Informationseinheiten in verteilten Architekturen befaßt, stellt die ’Quellenentdeckung’ (engl.: ’Resource Discovery’) dar. Eines der Hauptziele dieser Disziplin ist das Ermöglichen eines integrierten Zugriffs zu verteilten und vernetzten Informationsquellen. Resource Discovery, Kapitel 5 - WISSENSORGANISATION Seite 70 hauptsächlich im Bereich des Internets beschäftigt, vereint die Elemente Ressource (eng.: ’resource’), Entdeckung (engl.: ’discovery’), Benutzer und Dienstleister (eng.: ’service provider’). [Ianella 1995] Die Bedeutung dieses Bereichs für die Thematik der vorliegenden Arbeit liegt in der Tatsache, dass die Aspekte Standort, Zugriff, Auffindung und Management von verteilten Ressourcen in einem globalen Kontext von der Disziplin umfaßt werden. Organisation, Navigation und Suche spielen bei der Ressourcenentdeckung eine entscheidende Rolle in direktem Zusammenhang mit der Relevanz der vernetzt gespeicherten Information in einem verteilten System. In Bezug auf die Taxonomie von Recource Discovery Systems werden in [Schwartz et al. 1992] die Aspekte Körnung (eng.: ’granularity’), Verteilung, Verbindungstopologie (eng.: ’interconnection topology’) und Datenintegritätsschema erkannt. Die Körnung eines Systems, welches Resource Discovery unterstützt, kann als die Feinabstimmung der Informationsauffindung bzw. die Exaktheit der Indizierungsparameter einer Suche interpretiert werden (d.h. die Tiefe der Beziehung Daten zu Metadaten). Die geographische Verteilung der Daten und die gewählte Verzeichnisstruktur (z.B. X.500, Gopher, Prospero oder der vom Web umfaßter Informationsraum) sowie das Abbilden unterschiedlicher Modelle von Datenspeicherung (Schemata für Datenintegrität) stellen die informationstechnische Dimension des Resource Discovery dar, wobei die Qualität bzw. der Stand aktueller Technologien einen direkten Einfluß auf das System haben [Schwartz et al. 1992]. Die im Resource Discovery Workshop - RDW95 – erkannten Schwerpunkte bzw. bedeutendsten Anforderungen an Resource Discovery Systems werden in [Ianella 1995] wie folgt aufgelistet: Metadaten Information über Benutzerprofile Skalierbarkeit und Zusammenschluß Navigation (Browsing) Sicherheit und Privatsphäre. Die somit in [Ianella 1995] erkannten Problembereiche lassen sich auf die Anforderungen der Informationsaufbereitung bzw. Wissensorganisation eines Informationssystems für transnationale Unternehmen direkt proportional abbilden. Die Metadaten als Zusatzinformation für Wissenseinheiten erhöhen die Qualität der gespeicherten Strukturen. So kann zum Beispiel über das Zusammenwirken von Qualitätsmetadaten und geregelten Mechanismen der Benutzerverwaltung eine bedarfsgerechte und steuerbare Navigation und Präsentation der Inhalte ermöglicht werden. Sicherheit, Skalierbarkeit, Integration und Privatsphäre können über Intranetlösungen garantiert Knotenpunkt als Einstiegspunkt zu einer im Hintergrund vernetzt organisierte Struktur werden. Der aus technischer Sicht direkte Zusammenhang von Resource-Discovery-Systemen und Informationsaufbereitung für verteilte Informationssysteme liegt in der Benutzung von zentralen Zugriffsknoten zu dahinterliegenden Informationsstrukturen. Dies kristallisiert sich aus der Tatsache heraus, dass Resource Discovery häufig auch mit ’Subject Gateways’ in Verbindung gebracht wird. Subject gateways stellen Online-Dienste und Websites dar, welche durchsuchbare und navigierbare Kataloge von webbasierten Ressourcen darstellen. Solche Kataloge sind themenorientiert organisiert und werden sehr oft von Themenexperten verwaltet Kapitel 5 - WISSENSORGANISATION Seite 71 und gewartet [García-Barrios 2001a]. Im Abschnitt 5.3 ’Themenhierarchien’ werden Subject Gateways und die Bedeutung ihrer Methoden bei der Informationsaufbereitung in verteilten Informationssystemen für transnationale Konzerne analysiert. 5.1.4 Library Science und Archival Science Die Fachbereiche ’Library Science’ und ’Archival Science’ (im deutschsprachigen Raum auch unter ’Bibliothekswesen’ und ’Archivierungswesen’ bekannt) sind sehr lange existierende Spezialgebiete, die sich mit der Semantik und Strukturierung von Wissen bzw. Erschließung, Auffindung und Wiedergewinnung von Information beschäftigen. Geschichtlich gesehen stellen diese Disziplinen die routiniertesten und grundlegendsten Methoden und Strukturen zur Wissensorganisation zur Verfügung, da sie schon seit der ’Erfindung’ der Bibliotheken (vom Autor der vorliegenden Arbeit als geordnete Speichersysteme von explizitem Wissen verstanden) existieren. Die in diesem Abschnitt präsentierte Analyse basiert auf die in [Walker 2001] vorgestellte Studie über professionelle Paradigmen des Bibliotheks- und des Archivierungswesens für das Management von webbasierten Systemen. Library Science Das Bibiothekswesen (engl.: ’Library Science’) beschäftigt sich, wie in [Walker 2001] definiert, "… mit der Auswahl, Anordnung und Beschreibung von publizierten Werken, wie Büchern, Serien und multimedialem Material".39 Um einen Zugriff zu diesem Material zu ermöglichen, entwickelten Bibliothekare hochspezialisierte Standards der Informationsauffindung (zum Beispiel ’Kontrollierte Vokabulare’ wie die ’Library of Congress Subject Headings’) und Klassifikationssysteme (beispielsweise ’Dewey Decimal’, ’Universal Decimal’ und ’Library of Congress’). Die Vorteile von Klassifikationssystemen liegen vor allem in der Unterstützung von themenorientierter Navigation durch systematisch organisierte Strukturen, welche einen vordefinierten, verfeinerten Kontext für Suchanfragen zur Verfügung stellen. Die Auffindungsmechanismen bedienen sich dieser kategorisierten Strukturen, um Mengen von Suchresultaten zu segmentieren und manipulieren. Weiters erlauben Klassifikationssysteme des Bibliothekswesens einen sprach-unabhängigen Zugriff auf Information und (explizites) Wissen, da sie meist auf einer numerischen Nomenklatur aufgebaut sind. Die wirkliche Stärke von Paradigmen des Bibliothekswesens bei der Organisation von elektronisch erstellten Dokumenten in großen und geographisch verteilten Unternehmen wird gleichzeitig auch durch eine Schwäche dargestellt: das manuelle (effiziente und sorgfältige) Indizieren vom publizierten Material ist aufwendig, langwierig und kostspielig. Traditionelle Klassifikationssysteme bedienen sich deshalb anderer Mechanismen, um den Prozess des Indizierens zu automatisieren. Dokumente können somit mit der Hilfe von vordefinierten Metadaten und Zusatzattributen gleich beim Archivieren so versehen werden, dass sie ein schnelleres themenorientiertes Wiederauffinden ermöglichen. 39 "Library science concerns itself with the selection, arrangement, and description of published works, including books, serials, and multimedia materials. [Walker 2001]" Kapitel 5 - WISSENSORGANISATION Seite 72 Das Problem von universell geltenden Klassifikationssystemen liegt aber meist in der Tatsache, dass sie sich nicht immer für Themenbereiche eignen, die dem ’akademischen’ Hintergrund dieser standardisierten Strukturen genügen. Weiters kommen Klassifikationsexperten oft nicht mit der Geschwindigkeit und Anzahl der neu auftauchenden Spezialgebiete zusammen, so dass Unternehmen sich nicht ein Warten auf das Einbinden ihrer Spezialbereiche leisten können. Diese verständliche ’Unflexibilität’ der universellen Klassifikationssysteme erklärt somit das Heranwachsen kleinerer, selbsterstellter Themenhierarchien für spezialisierte Bereiche bzw. Unternehmungen. Archival Science Das Archivierungswesen, analog zum Bibliothekswesen, bringt eine etablierte und solide jahrhundertelange Erfahrungsgeschichte mit sich. Laut [Walker 2001], befasst sich Archival Science hauptsächlich mit der Organisation von ’nicht publiziertem’ Material. Während Bibliotheken diskrete Informationseinheiten enthalten, setzen sich Archivisten mit umfangreichen Räumen von Records (Verzeichnissen oder Verzeichniselementen), welche untereinander dynamische und oft komplexe Beziehungen enthalten, auseinander. Archival Science folgt bei der Anordnung und Beschreibung von Strukturen zwei Prinzipien: ’Herkunft’ und ’ursprüngliche Anordnung’ (eng.: ’provenance’ and ’original order’ [Walker 2001]). Somit ist eine systematische Entwicklung und Beschreibung von Strukturen anhand des Dokumentenautors und der chronologischen Erstellung möglich. Die Vorteile der Paradigmen des Archival Science liegen in dem beziehungs-orientierten Ansatz der Strukturen. Dokumente und Inhalte werden immer in einer bestimmten Form gewartet, so dass deren enger Zusammenhang mit den ’Systemkomponenten’ (wie zum Beispiel Autoren, Verfasser, Unternehmensbereiche, chronologische Archive) langfristig garantiert bleibt. Das Problem der von Archival Science zur Verfügung gestellten Mechanismen wird durch ihr ’statisches’ Wesen dargestellt. Für die großen und dynamischen Strukturen von Konzernen des 21. Jahrhunderts, die ständig ihre Organisations- und Geschäftsbereiche erweitern und modifizieren, scheinen diese traditionellen Paradigmen sogar mittelfristig zu versagen. Hierbei können Methoden der Kommunikations- und Informationstechnologie eingesetzt werden, um nicht mehr gültige Archivierungssysteme zu ’cachen’ (de.: ’zwischenspeichern’), womit temporäre oder partielle Zugangsknoten zu alternativen Archiven garantiert werden. Die somit beschriebenen Methoden dieser zwei Disziplinen (Library und Archival Science) stellen ein Grundgerüst zur Verfügung, mit dem die Aufbereitung von Informationseinheiten in großen Unternehmen unter einem allgemein gültigen, systematischen und technischen Kriterium ermöglicht wird. Die praktische Anwendung dieser Methoden führt meist zu einer themenspezifischen Kategorisierung aller Informationsbestände. Diese Kategorisierungen werden auch ’terminologische Strukturen’ oder ’Begriffsstrukturierungen’ genannt. Die Verwendung von systematischen Begriffsstrukturierungen ermöglicht das Erstellen von semantischen Netzen, welche einerseits die unternehmensspezifische (im organisatorischen und geschäftsprozessorientierten Sinne) Speicherung von Daten und andererseits einen rollenspezifischen (im Zusammenhang zu den Notwendigkeiten der Benutzer des Systems) Zugang zu Information effizient und zielgerecht garantieren. Die in [Gödert 2001] erkannten Aufgaben von terminologischen Strukturen lassen sich wie folgt zusammenfassen: a) Abgeschlossenheit versus Entwicklung von Begriffen (fixe versus dynamische Stellung von Begriffen innerhalb einer Hierarchie) Kapitel 5 - WISSENSORGANISATION Seite 73 b) begriffliche Distanz (Abstand verwandter oder fremder Begriffe zu einander) c) Gleichheit hierarchischer Niveaus (Bedeutung der Tiefen in Hierarchien und deren Bedeutung) d) Existenz von Beziehungen (Spezifikation oder Mangel von Verbindungen zwischen den Begriffen) e) Auswahl und Fixierung von Beziehungen unter Nutzungsaspekten (die Rolle und Bedeutung von Begriffen für die Benutzer) Informationssysteme, welche eine bestimmte Organisationsstruktur abbilden und eine vernetzte Dokumentensammlung (Bibliothek oder Archiv) verwalten, werden vor allem im Bereich der Wissensorganisation ’Vernetzte Organisationssysteme’ (engl.: ’Networked Organization Systems’) genannt. Wissensorganisationssysteme können Thesauri und andere Listen von Schlüsselwörtern, Ontologien, Klassifikationssysteme, Clusteringansätze, Taxonomien, Gazetteers, Wörterbücher, lexikalische Datenbanken, Concept Maps, Semantic Road Maps, usw. beinhalten. Diese Schemata ermöglichen eine verbesserte Wissensstrukturierung, ein effizient organisiertes Wissensmanagement, eine wissensbasierte Datenverarbeitung und einen systematischen Zugriff auf Wissensstrukturen (z.B. in individuellen Datenvorräten, in unternehmensspezifischen Intranetumgebungen oder in digitalen Bibliotheken). Ihre Anwendung als interaktive Informationsdienste im Internet erhöhen ihr Unterstützungspotential zur Verbesserung der Beschreibung, Entdeckung und Widerauffindung von heterogenen Informationsquellen [Sigel 2001]. Die unterschiedlichen Wissensorganisationssysteme lassen sich in folgende Hauptgruppen unterteilen [Hodge 2000a]: a) Begriffslisten (engl.: ’Term Lists’) b) Klassifikationen und Kategorien c) Zusammenhangslisten oder –gruppen (engl.: ’Relationship Lists’) Eine nähere Betrachtung dieser Gruppen und ihrer – für die Konzeption eines verteilten Informationssystems für transnationale Konzerne – Untergruppen (wie zum Beispiel Ontologien, Taxonomien, Subject Headings, Klassifikationssysteme, Thesauri, Semantische Netzwerke) wird im Unterkapitel 5.3 ’Organisationssysteme’ gegeben. Der nächste Abschnitt gibt einen Überblick über die wichtigsten technischen Hilfsmittel für die Konzeption von Wissensorganisationssystemen, wobei die Schwerpunkte durch die Bereiche ’Semantic Web’, ’Metadaten’, ’Ontologien und Taxonomien’ und ’Inhaltserschließung’ dargestellt werden. 5.2 Semantik Dieses Unterkapitel präsentiert eine Einführung in die Thematik der ’Terminologie’ und ’Semantik’ aus der Sicht des Wissensmanagements bzw. -organisation und deren technische Umsetzungsmöglichkeiten durch bekannte Mechanismen, wie Metadaten, Beschreibungssprachen, Ontologien und Taxonomien. Die Bedeutung dieser Bereiche für die vorliegende Arbeit liegt in der Bereicherung bzw. Verbesserung der Informationsaufbereitung, der Wissensorganisation, -auffindung, und –repräsentation. Kapitel 5 - WISSENSORGANISATION Seite 74 Die hier besprochenen Mechanismen und Hilfsmittel bilden die Grundlage für die in den folgenden Abschnitten vorgestellten Systeme und Strukturierungsmöglichkeiten, welche aus den bisher präsentierten Fachbereichen stammen und effiziente Sichtweisen für den Zugang auf komplexe und verteilte Informationsstrukturen, wie diejenigen in transnationalen Konzernen zu finden, erlauben. Informationssysteme, die speziell in geographisch verteilten Unternehmensstrukturen zu finden sind und das intellektuelle Kapital der Organisation verwalten, richten sich letztendlich auf die benutzer- oder aufgabengerechte Aufnahme (multi)medial externalisierter Information. In Dokumenten gespeichertes Wissen beschreibt meist einen bestimmten Sachverhalt, der vom Dokumentenautor stammt und vom Informationssystem ’richtig’ zu interpretieren und zu beschreiben ist. Die Bedeutung des Dokuments bzw. dessen Inhalt stellt somit ’das’ Merkmal dar, um einen semantischen Wissenstransfer zu gewährleisten. Die Aufgabe der (informationstechnischen) Wissensmanager bzw. Wissenorganisatoren oder Informationssystementwickler besteht somit darin, semantische Modelle zu entwerfen, aus denen die Bedeutung aller gespeicherten Wissenseinheiten – maschinell und menschlich - lesbar wird. „Die Bedeutung bzw. Festlegung der Bedeutung der einzelnen Sprachelemente bezeichnet man als Semantik" [NetAcademy 1999]. Der Autor der vorliegenden Arbeit verfeinert diese Definition zum Zwecke der Informationsaufbereitung in webbasierten Wissensstrukturen und verwendet den Begriff Semantik für die ’ziel- und anwendungsgerechte Bedeutungsbeschreibung von Wissenseinheiten in einem Informationssystem, um deren Wesen festzulegen und global geltende Zusammenhänge in terminologischen Strukturierungen zu erstellen’. Die Semantik, als Teilgebiet der Semiotik, wird auch als Bezug zwischen Objekten oder Prozessen und Symbolen verstanden. Zur Unterscheidung der Semantik von den Begriffen Syntax und Pragmatik, wird in [NetAcademy 1999] der Bezug der Symbole untereinander als Syntax, und der Bezug zwischen Wissen und handelnder Einheit als Pragmatik definiert. Somit werden Daten als Komposition von Zeichen und Syntax, Information als Komposition von Daten und Semantik, und Wissen als Konstrukt aus internalisierter Information und den Fähigkeiten, Information zu nutzen, verstanden. Wichtigster Grundmechanismus für die Bedeutungsübertragung ist eine rückgekoppelte Kommunikation zwischen Informationssender und –empfänger. Externalisierung und Internalisierung von Bedeutung erfordern somit die Modellierung auf der Basis dieses Grundmechanismus, womit die Semantik innerhalb von Bezugssystemen erst durch die kognitive Informationsverarbeitung auf der Basis von Sinneseindrücken entsteht [Gödert 2001]. Für die Erschließung und Auffindung von Wissen mittels strukturierter Vokabulare werden oft ’Dokumentationssprachen’ (z.B. Thesauri oder Klassifikationsschemata) angewendet. Diese werden in der Regel durch geordnete Klassen von Begriffen, welche eine systematische Modellierung von Informationseinheiten ermöglichen, dargestellt. Insbesondere für webbasierte Anwendungen ist die Verwendung von Zusatzattributen (zu einer Informationseinheit gehörenden Deskriptoren), auch Metadaten genannt, weit verbreitet. Diese aggregierten semantischen Beschreibungselemente sollen das Wesen des sonst chaotisch organisierten World Wide Web zu einem ’semantisch organisierten Netz’ (engl.: ’Semantic Web’) erheben. Kapitel 5 - WISSENSORGANISATION Seite 75 Dieses Unterkapitel beschäftigt sich mit den grundlegenden Elementen eines großen, semantisch organisierten Informationssystems. Basiselemente eines solchen Systems sind Semantische Portale, Metadaten und formale Begriffssysteme (Ontologien). Der folgende Abschnitt präsentiert anhand des ’Semantic Web’ die verallgemeinerte Form eines semantischen Portals. 5.2.1 Semantic Web Webinhalte wurden bis heute meist dazu entworfen, um Dokumente lesbar für Menschen zur Verfügung zu stellen, und nicht dazu, von Computerprogrammen semantisch manipuliert zu werden. Die Vision hinter dem ’Semantic Web’ ist, Organisationsstrukturen und Mechanismen zur Verfügung zu stellen, welche nicht nur in der Lage sind, Dokumente semantisch zu erfassen und die dazugehörigen Schlüsselwörter (engl.: ’keywords’) zu indizieren, sondern auch Zusammenhänge zum vorteilhaften Nutzen des Benutzers zu verarbeiten. Der zu diesem Zweck meist angewandte Lösungsansatz ist das Festlegen und Verwalten von ’Ontologien’. Somit entwickelte ’Semantische Portale’ sind sehr komplex und bestehen zum Beispiel aus folgenden Teilmodulen [Maedche et al. 2001] [Hotho et al. 2001]: ’Knowledge Warehouse’ stellt die physikalische Ebene der Repräsentation von Wissen dar. Hier werden Ontologie, Datenbankobjekte und Metadaten aufbewahrt. Suchsystem: o Inferenzmotor – das deduktive Auffindungssystem. o Extraktor – das Modul zur Begriffsextraktion aus Dokumenteninhalten. o Crawler – ontologiebasierter Kontrollmechanismus des Suchmoduls. ’Ontologiebasiertes Clustering’ stellt das Anwendungsmodul zur Extraktion von Wissen aus unstrukturierten Dokumenten dar. Presentation (zum Beispiel Templates, Navigationsstrukturen, personalisierte Interfaces, Query Language, usw.). Ein futuristisches Szenario in Richtung ’Semantic Intranet’ - in Anlehnung an das in [BernersLee et al. 2001] angegebene Beispiel – könnte wie folgt aussehen: das Ergebnis einer Suchabfrage nach einem bestimmten Unternehmensmitarbeiter soll nicht nur den Hyperlink zur Homepage der Tochterunternehmung und die darin gefundenen Keywords, sondern gleich die ’semantische’ Information über die Sprechstunden, aktuelle Arbeitsbereiche, zusammenhängende Publikationsthemen, usw., des betroffenen Mitarbeiters und eine Möglichkeit der Terminvereinbarung für eventuelle Videokonferenzen, enthalten. Diese Semantische Information wurde zuvor (theoretisch) vom Content Manager des Unternehmens über speziell programmierte Interfaces - welche eine für den Konzern bekannte Terminologie verwenden eingegeben, wodurch der Suchmechanismus des webbasierten Intranets zielgerechte Informationseinheiten verarbeiten kann und über spezielle Wissensorganisationsstrukturen dem Suchenden eine benutzergerechte Präsentation des Ergebnisses liefert. Die besprochenen Aspekte des Semantic Web sollen als grober Überblick und nicht als tiefe Untersuchung aller existierenden Möglichkeiten dienen, da sie sonst den Rahmen der vorliegenden Arbeit sprengen würden. Von besonderer Bedeutung ist somit das Nahebringen der zukünftigen Perspektiven in diesem Bereich. Kapitel 5 - WISSENSORGANISATION Seite 76 Für transnationale Unternehmen ist die Nutzung des Web bzw. eines Intranets als zugrundeliegende Technologie eine perfekte technische Möglichkeit sowohl, um die geographische Verteilung der Organisation technologisch zu abstrahieren als auch, um die sonst stark verteilten Strukturen auf transparenter Weise dem Benutzer ‘virtuell zentralisiert’ über standardisierte Schnittstellen (Browser) zu liefern. Deshalb sind Fortschritte im Bereich des Semantic Web von besonderer Bedeutung, da sie sich für webbasierte Intranetlösungen auch umsetzen lassen. Eines der wesentlichsten Hilfsmittel für das Hinzufügen von Semantik zu Informationseinheiten in wissensbasierten Systemen stellen Zusatzinformationen dar. Diese Zusatzinformationen werden Metadaten genannt und sind das Thema des nächsten Abschnitts. 5.2.2 Metadaten Aus den bisher gewonnenen Erkenntnissen lässt sich folgern, dass die Erfassung und Verwaltung vom intellektuellen Kapital eines großen Unternehmens durch das Zusammenwirken mehrerer Komponenten aus verschiedenen Fachbereichen verbessert werden kann. Die Bedeutung bzw. Semantik eines Dokumentes, oder allgemeiner einer gespeicherten Wissenseinheit, kann mit Hilfe von Zusatzinformation präziser oder konkreter beschrieben werden. Zusatzinformationen zu einem Dokument, auch ’Metadaten’ genannt, stellen nicht nur für Suchprozesse einen wichtigen Hilfsaspekt dar, sie können dem Nutzer der Daten bei der Datendarstellung und im Umgang mit den Inhalten einen besseren Überblick liefern. In Übereinstimmung mit [Weitzer 2000] bedarf die Definition der Metadaten als ’Daten über Daten’ noch einiger zusätzlicher Bemerkungen [Daniel et al. 1997]: Eine Unterscheidung zwischen Daten und Metadaten kann nur in Bezug auf ganz bestimmte ’Zusammenhangsbeziehungen’ (Relationen) getroffen werden. Oft werden Metadaten eigens als Speicherelemente benutzt, wodurch sie selbst zu Daten werden. Relationen sind semantisch nicht eindeutig: sie können zum Beispiel Information über Qualität, Form, Funktion, Format oder Layout eines Dokuments verbergen. In verteilten Architekturen können Daten in einem Speicher andere Daten in einem anderen Speicher beschreiben. Metadaten müssen physisch nicht ständig existieren. Sie können automatisch abgeleitet werden. HTML Metadaten in HTML-Dokumenten können von Suchmechanismen verwendet werden, um die Relevanz der Suchergebnisse zu erhöhen. Die Notationssprache HTML schreibt keinen konkreten Metadatensatz vor, sie definiert nur den grundsätzlichen Syntax von Meta-Tags [Harmelen et al. 1999], zum Beispiel: <META NAME="Elementname" CONTENT="Elementwert">. Kapitel 5 - WISSENSORGANISATION Seite 77 Zusätzlich können folgende Attribute angegeben werden: HTTP-EQUIV Dieses Attribut wird anstelle des Name-Attributs verwendet. Http-Server verwenden dieses Attribut, um Informationen für http zu kodieren und senden den Inhalt (CONTENT) im Header der http Antwort. LANG Sprachkennzeichnung basierend auf RFC1766. SCHEME Dieses Attribut benennt das Schema, das zum interpretieren des Wertes verwendet wird. Gültig erst ab HTML 4.0. In Meta-Tags kann man beispielsweise nützliche Anweisungen für Server, Browser und Suchdienste im Web beschreiben. Die meist verwendeten Meta-Tags sind ’Content-Type’, ’keywords’, ’description’, ’abstract’, ’Language’, ’author’, ’copyright’ und ’robots’ [Knögler 1999]. Standardisierte Metadatensätze (Dublin Core, LOM, PICS) Zu den am bekanntesten und am häufigsten verwendeten Metadatenmodellen zur Strukturierung von Metadaten gehören ’Dublin Core Metadata Element Set’ (DC), ’Learning Object Metadata’ (LOM) und ’Plattform for Internet Content Selection’ (PICS). Das Dublin Core Metadata Element Set besteht aus 15 Elementen zur Ressourcenbeschreibung. Es wird einfach gehalten, damit die Autoren von Dokumenten die entsprechenden Metadaten gegebenenfalls selber definieren können. Hinter dem einfachen Dublin Core Lösungsansatz stand die Idee, ein kostengünstiges, leicht wartbares Verfahren zu entwickeln, das auch vor der rapiden Zunahme an Dokumentenanzahl in elektronischen Netzwerken nicht kapitulieren muß. Weiterhin wurde darauf geachtet, dass die Anbindung an andere, zumeist komplexere Formate möglich ist [Knögler 1999]. Beispiel für ein in HTML eingebundenes Dublin Core (DC) Element: <META NAME="DC.ElementName" CONTENT="Elementwert">. Der Inhalt des Elements NAME besteht aus der Kennung ’DC.’ als Metadaten und einem Elementnamen, wie z.B. "DC.TITLE". Der Learning Object Metadata Standard spezifiziert (aktuell in der Spezifikationsversion v3.8) Syntax und Semantik der LOM-Metadaten und definiert Attribute, um ’learning objects’ vollständig zu beschreiben [LOM-IEEE 1999]. Learning Objects sind digitale oder nichtdigitale Objekte, die während technologieunterstützten Lernens benützt werden können. Beispiele dafür sind eLearning Systeme oder interaktive Trainingsumgebungen. Learning Objects können zum Beispiel Multimediainhalte, Anleitungen, Lernsoftware und Software Tools sowie Personen, Organisationen oder auch die Fälle, die an technologieunterstützten Lern- bzw. Lehrprozesse beteiligt sind, sein [Duval2001]. Der LOM Standard baut auf eine minimale Anzahl von Attributen, mit denen Learning Objekte verwaltet, lokalisiert und ausgewertet werden können [Knögler 1999]. Relevante Attribute in LOM umfassen Objekttyp, Autor, Besitzer, Konditionen für die Verteilung und Format des Learning Objekts [LOM-IEEE 1999]. Kapitel 5 - WISSENSORGANISATION Seite 78 Beim ’Platform for Internet Content Selection’ Metadatensatz, kurz PICS genannt, geht es um ein standardisiertes Schema zum Kennzeichnen von Internet-Inhalten [García-Barrios 2001a]. Das Schema wurde eigentlich erfunden, um jugendfreie Inhalte auszuzeichnen bzw. bestimmte unerwünschte Inhalte auf Benutzerseite (’client side’) auszufiltern. Diese speziellen Auszeichnungen heißen ’PICS-Labels’. Anbieter von Web-Seiten können ihre Web-Seiten entweder freiwillig und nach eigenem Ermessen mit einem PICS-Label versehen oder einen unabhängigen PICS-Service in Anspruch nehmen, welcher PICS-Zertifikate für Inhalte ausstellt [Knögler 1999]. Metadatenformate (XML, RDF) Metadatenformate wie SOIF (Harvest ’Summary Object Interchange Format’) und MCF (’Meta Content Framework’) werden in der vorliegenden Arbeit nicht behandelt, da sie entweder nicht standardisiert sind oder deren Weiterentwicklung eingestellt wurde. Die aus der Sicht des Autors der vorliegenden Arbeit wichtigeren XML und RDF Formate fanden bisher eine sehr weite Verbreitung und werden im Folgenden kurz präsentiert werden. Die Extensible Markup Language (XML) beschreibt eine Klasse von Datenobjekten, genannt XML-Dokumente, und das Verhalten von Applikationen, welche diese Dokumente verarbeiten. XML ist ein Anwendungsprofil (eng.: ’application profile’) oder eine eingeschränkte Form von ’Standard Generalized Markup Language’ (SGML). Durch deren Konstruktion sind XMLDokumente konforme SGML-Dokumente [Knögler 1999]. XML ist ebenso wie SGML eine Metasprache für das Definieren von Dokumenttypen. Das heißt, XML ist der Oberbegriff für die Syntaxregeln, die angewendet werden, wenn ein neuer Dokumenttyp definiert wird. Reine XML-Notation eignet sich deshalb zur Strukturierung bzw. Strukturbeschreibung von Dokumenten [Knögler 1999]. Die ’eXtensible Markup Language’ (XML) wurde so spezifiziert, dass die nützlichsten Teile der ’Standard Generalized Markup Language’ (SGML) erhalten bleiben, womit weniger gebräuchliche und komplizierte Teile weggelassen wurden [Flynn 2001]. Ein wichtiger Bestandteil eines XML-Dokuments ist dessen Dokumenttyp-Definition (DTD), welche mit einem Daten- oder Dateiformat vergleichbar ist. Unter einem Datenformat bzw. Dateiformat versteht man die Gesamtheit der Richtlinien, die für das Organisieren von Daten innerhalb einer Datei gelten. Die DTD legt somit die Gültigkeit der Einträge innerhalb eines XML-Dokuments fest. Viele XML-Parser ignorieren diese Definition, da sie von einem ’wohlgeformten’ Dokument ausgehen (z.B. die Validierung eines XMLDokuments durch die XML-Engine des Microsoft Internet Explorer). Das Resource Description Framework (RDF) stellt eine einheitliche und interoperable Alternative des Datenaustausches zwischen unterschiedlichen Webapplikationen dar. RDF wurde mit dem Ziel entwickelt, für Menschen - relativ – leicht lesbar und für Computer leicht verarbeitbar zu sein. RDF ist ein auf XML basierender Standard des W3C, mit dem festgelegt wird, wie Metainformation beschrieben und ausgetauscht werden kann. Es bietet also Entwicklern eine standardisierte Möglichkeit an, wie große Mengen von Elementen und deren Beziehungen untereinander notiert werden können [Knögler 1999]. Lösungsansätze wie XML und RDF ermöglichen nicht nur eine wesentliche Funktionalitätserleichterung für Suchdienste, sondern auch eine universell austauschbare Konzeption von Modellierungsalternativen, welche zur semantischen Bereicherung von Wissenseinheiten verwendet werden können. Dies ergibt sich aus ihrer Grundlage der Deskription durch Attributelemente und ihrer standardisierten Notation für Strukturbeschreibungen. Durch die Verwendung von standardisierten Formaten können alle Wissenseinheiten eines Informationssystems für große und geographisch verteilte Unternehmen Kapitel 5 - WISSENSORGANISATION Seite 79 wesentlich einfacher ausgetauscht, präsentiert und organisiert werden. Eine Anwendung dieses Prinzips bilden ’Ontologien’, die im Folgenden das zu behandelnde Hauptthema darstellen. 5.2.3 Ontologien Wie bereits im allgemeinen Abschnitt dieses Kapitels beschrieben, stellen Begriffsstrukturierungen eine effiziente Möglichkeit dar, um den Informationszugang in stark vernetzten Systemen zu verbessern. Wozu braucht aber eine transnationale Unternehmung überhaupt eine spezielle Terminologie? Eine Terminologie soll die Gesamtheit aller Begriffe und Benennungen in einem Fachgebiet darstellen. Dies ist der Grundstein für eine ’fachsprachliche’ Kommunikation. Um eine fachliche Kommunikation innerhalb von komplexen und verteilten Unternehmensstrukturen zu gewährleisten, braucht man also eine exakt definierte, korrekte und geordnete Terminologie, die außerdem möglichst sprachenunabhängig sein sollte. [Schmitz 2001] Der Autor der vorliegenden Arbeit vertritt die Meinung, dass der Nutzen von terminologischen Strukturen für die Organisation und Aufbereitung von Information in grenzüberschreitende Unternehmen sich auf vielerlei Hinsichten äußert, zum Beispiel: Unterstützung von lokalen und grenzübergreifenden Normungen Umsetzung von Applikation (z.B. Navigation und Präsentation von Inhalten) in benutzergerechter Sprache Erstellung von kontrollierten und modifizierbaren Vokabularen Verbesserte Lokalisierung und Internationalisierung Festlegung unternehmensspezifischer Benennungen Verbesserte Suchmechanismen Echtes (internes und externes) global gültiges Corporate Identity Ein Begriff ist die abstrakte Zusammenstellung von einer Benennung und einem Gegenstand. Aus einer Zuordnung von Benennung und Begriff ergeben sich folgende Zusammenhänge: Synonymie (ein Begriff - mehrere Benennungen), Homonymie (eine Benennung - mehrere Begriffe) und Äquivalenz (gleiche Begriffe in mehreren Sprachen). Ein abstrakt definiertes Begriffssystem wird oft Ontologie genannt und stellt eine hierarchisch geordnete Fachgebietsklassifikation dar [Schmitz 2001]. Es sei an dieser Stelle darauf hingewiesen, dass eine Klassifikation nicht unbedingt eine Hierarchie oder Ordnung impliziert, da sie eher die Zerlegung einer Objektmenge, welche möglichst viele gleichartige Objekte in derselben Klassen und möglichst viele unterschiedliche Objekte in unterschiedlichen Klassen beinhaltet, darstellt [Schmitz 2001]. Die nächsthöhere Stufe in Hinblick auf einer semantischen Grundlage wäre eine Taxonomie, d.h. die Ordnung von Objekten in Klassen, nicht nur aufgrund von Charakteristika, sondern auch aufgrund von Zusammenhängen (Beziehungen). Das Hauptziel von Ontologien ist es, Konstrukte zur Verfügung zu stellen, die das Erstellen von semantisch höheren Wissensstrukturen erlauben, um Konzepte oder Domänen zu spezifizieren und organisieren [Pralle 1999]. Kapitel 5 - WISSENSORGANISATION Seite 80 Die in [Studer et al. 2001] angegebene - von T. R. Gruber stammende - Definition einer Ontologie lautet: „Eine Ontologie ist eine formale, explizite Spezifikation einer gemeinsamen Konzeptualisierung“. Weiters wird die Definition wie folgt genauer analysiert [Studer et al. 2001] 40: „Unter Konzeptualisierung versteht man ein abstraktes Modell bestimmter Phänomene und Domänen mit deren identifizierten relevanten Begriffen. Explizit bedeutet, dass Art und Bedingung eines jeden Begriffes explizit angegeben und definiert werden. Formal müssen Ontologien sein, um maschinenverstehbar zu sein, was eine natürlichsprachliche Darstellung ausschließt. Gemeinsam signalisiert, dass es sich bei einer Ontologie nicht um eine einzelne, individuelle Ansicht von Wissen handelt, sondern um eine Darstellung, auf die sich eine bestimmte Benutzergruppe geeinigt hat und über die folglich ein Konsens besteht.“ Das Hauptziel einer Ontologie ist somit Wissen einer Domäne explizit zu modellieren. Ontologien vermitteln ein allgemein gültiges (sorgfältig generiertes und allgemein anerkanntes) Verständnis dieser Domäne, welches von Anwendungen und Benutzergruppen gemeinsam geteilt und wiederverwendet werden kann. Eine Ontologie beinhaltet somit ’notwendigerweise’ – wie auch in [Studer et al. 2001] identifiziert - alle relevanten Begriffe der Domäne und ordnet diese in einer Taxonomie an. Durch die Einführung von ontologiebasierten Klassifikationsmechanismen in verteilten Informationssystemen für transnationale Unternehmen entsteht ein unternehmensspezifisches Modell, durch das sich die Kommunikation (Mensch-Maschine-Mensch-Kommunikation) und die Organisation des intellektuellen Kapitals von einer syntaktischen Ebene hin zu einer semantischen verschiebt, da für alle Beteiligten die Bedeutung von Wissenseinheiten eindeutig durch das gemeinsame Modell festgelegt und klargestellt wird. Die unterschiedlichen ’Sprachen’, welche sich aus der terminologischen Vielfalt ergeben und von ’Ontologisten’ verwendet werden, lassen sich wie folgt gruppieren und erklären [Kyriakov et al. 2001]: a) Konzept – Eigenschaft - Beziehung Konzepte: statische und kognitiv-autonome semantische Phänomene (d.h. die Klassen der Domäne). Eigenschaften: Charakteristika, Aspekte oder Attribute der Konzepte und deren Beziehungen untereinander (d.h. Eigenschaften bestehen aus Attributen und Beziehungen). Beziehungen: meist dargestellt durch Verben. b) Klassen – Objekte – Attribute: Diese Unterteilung entspricht einem objektorientierten Lösungsansatz (im programmiertechnischen Sinne). c) Konzepte – Rollen – Individuen: Diese Terminologie wird meist im Bezug auf Beschreibungslogik verwendet. Die Rollen entsprechen hier den Eigenschaften von Konzepten. Die Individuen entsprechen den konkreten Konzeptinstanzen. 40 Der fettgedruckte Stil einiger im Zitat vorkommenden Wörter wurde vom Autor der vorliegenden Arbeit hinzugefügt. Kapitel 5 - WISSENSORGANISATION Seite 81 d) Collections - Individuals – Prädikate – Konstanten: Dieses Paradigma findet in zyklischen Ansätzen Verwendung. Die Collections entsprechen den Konzepten. Die Individuals entsprechen den Instanzen. Die Prädikate entsprechen den Eigenschaften. Die Konstanten stellen Namen für Collections, Individuals oder Prädikate dar Der nachfolgende Abschnitt gibt einen Überblick Dokumenteninhalten in wissensbasierten Systemen. über die Erschließung von 5.2.4 Inhaltserschließung und Inhaltsanalyse Bei der Inhaltserschließung geht es darum, den ’Inhalt’ eines Dokumentes zu erkennen, zu erschließen, d.h. für Benutzergruppen geeignet aufzubereiten bzw. in einer speziellen Repräsentationsform darzustellen [Sigel 2000]. Die Inhaltsanalyse befaßt sich mit der ’Essenzerkennung’ von Dokumenten. Beide Begriffe werden vom Bereich der Wissensorganisation angewandt, wobei versucht wird, die Prinzipien der Inhaltserschließung auf aktuelle Herausforderungen - bei denen es auf begriffliche Fundierung ankommt - zu übertragen. Beispiele hierfür sind das Semantic Web und die Erstellung von Begriffsstrukturen für Topic Maps (näheres über Topic Maps wird Abschnitt 5.4 ’Sichtweisen’ beschrieben). In Bezug auf die Inhaltserschließung erkennt die Wissensorganisation die besondere Bedeutung der gemeinsamen Funktion folgender Aspekte, [Sigel 2000]: a) Abstrahieren: d.h. die Art der Abstraktion (informativ, indikativ, strukturiert, zielgruppenspezifisch, usw.). b) Indexieren: d.h. die Verwendung und Definition von Deskriptoren. c) Klassifizieren: d.h. die Formulierung von ’Klassifikation zu Klassifikat’-Beziehungen. Bei der Inhaltsanalyse geht es wiederum um den Interpretationsprozeß. Dieser Prozeß kann sehr komplex sein, weshalb moderne technische Systeme (wie zum Beispiel eine automatische Indexierungsapplikation) die intellektuelle Arbeit der Interpretation zwar einigermaßen erleichtern kann, aber nicht ersetzen. Während eine Ontologie den ’formalen’ semantischen Zugriff auf Informationseinheiten ermöglicht, findet bei der Inhaltsanalyse (bzw. -erschließung) ein semantischer Zugriff unter ’inhaltlichen’ Gesichtspunkten statt [Sigel 2000]. In diesem Abschnitt wurden die verschieden Mechanismen vorgestellt, welche zu einer semantischen Bereicherung von Informationseinheiten führen bzw. einen semantischen Zugang ermöglichen. Die konkreten technischen Umsetzungen werden in den folgenden Abschnitten ’Organisationssysteme’ und ’Sichtweisen’ - in denen die unterschiedlichen Möglichkeiten der Repräsentation, Modellierung, Klassifikation, Auffindung, Ordnung und Strukturierung von Information präsentiert werden - beschrieben. 5.3 Organisationssysteme Die in den vorigen Abschnitten dieses Kapitels beschriebenen Fachbereiche, welche zu einer organisierten Informationsaufbereitung beitragen können, und die geschilderten Lösungsansätze zur semantischen Anreicherung von Informationseinheiten (z.B. standardisierte Metadatenformate, Ontologien und Taxonomien) bilden die Basis, um eine ’Repräsentation von Bedeutung und Struktur auf Dokumentenebene’ zu ermöglichen. Kapitel 5 - WISSENSORGANISATION Seite 82 Mit einer strukturellen und semantischen Repräsentation auf Dokumentenebene ist eine Darstellung gemeint, die folgende Aspekte umfasst: die Nutzung von Mechanismen, welche auf ’physikalischer’ Ebene eine Speicherung von Wissenseinheiten in kontextabhängigen Strukturen ermöglichen, und die geeignete Integration von Systemen, die auf ’abstrakter’ Ebene einen semantischen Informationszugang erlauben und eine kontextabhängige Präsentation von anwenderund zwecksorienterten Strukturen modellieren. Die physikalische Ebene umfasst - wie im Kapitel 4 ’Datenmanagement’ bereits ausführlich besprochen – alle betrieblichen und technischen Maßnahmen, um Daten auf Speicherebene transparent und effizient zu verwalten. Der in diesem Kapitel hinzugekommene semantische Aspekt erweitert die Aufgaben des Datenmanagements insofern, dass die Zusatzinformationen (Metadaten oder Metastrukturen) auch transparent erreichbar sein sollten. Die abstrakte Ebene umfasst Lösungsansätze, die auf spezifische Weise Begriffstrukturierungen modellieren und – eventuell - dynamisieren. Eine Abstraktion kann somit – zweckgebunden - eine Teilung oder einen Zusammenschluss von Logik und Präsentation erlauben. Im Folgenden werden die unterschiedlichen Typen von Organisationssystemen, welche eine domäneorientierte begriffliche Strukturierung ermöglichen, und deren wesentlichste Eigenschaften, behandelt. 5.3.1 Typen von Organisationssystemen Das primäre Ziel einer konzeptuellen Informationsaufbereitung ist es, Methoden anzubieten, welche die effiziente Organisation des in einem Unternehmensgedächtnis erfassten intellektuellen Kapitals ermöglichen. Hierfür sind – vor allem für große und geographisch verteilte Unternehmen - Strategien der Wissensorganisation gesucht, um systematisch aus den stark vernetzten und großen Datenbeständen genau jene relevante Information zu präsentieren, die zum individuellen Bedarf im aktuellen Kontext passt. Es ist empfehlenswert für transnationale Konzerne ein Klassensystem, welches zu jeder Informationseinheit eine terminologische Kategorie aus einem Begriffssystem zuordnet, zu implementieren. Hierbei stellt das Begriffssystem eine zum Unternehmenstyp entsprechende und vereinheitlichte Wissensdomäne dar. In diesem Sinne stimmt die Auffassung des Autors der vorliegenden Arbeit mit der in [Sigel 2001] dargelegten These überein. Sie besagt, dass das Unternehmensgedächtnis in einem ’Lernenden Unternehmen’ eine flexible Begriffsstruktur benötigt, und deswegen Kenntnisse im Bereich der Wissensorganisation genutzt werden sollten. Das von [Probst et al. 1999] definierte ’Bausteinmodell des Wissens’, welches in [Abb. 2.5] des Kapitels 2 ’Wissensmanagement’ präsentiert wurde, lässt besondere Bereiche mit hohem Anteil an Semantik und Strukturierung erkennen [Gödert 2001]: Wissensidentifikation Wissenserwerb Wissensentwicklung Wissensbewahrung Diese Bereiche sind für das Thema dieses Abschnittes von besonderer Wichtigkeit, da sie sich dafür eignen, ’Semantik’ (=Bedeutung) zu erkennen, zu fixieren und zum Auffinden Kapitel 5 - WISSENSORGANISATION Seite 83 bereitzustellen [Gödert 2001]. Begriffe lassen sich auf unterschiedlicher Weise organisieren: zum Beispiel chronologisch, alphabetisch, räumlich, nach physikalischen Attributen (Farbe, Material, Größe, usw.) oder nach Themenbereichen. Der, von den Disziplinen Wissensorganisation und Bibliothekswesen zur Verfügung gestellte Lösungsansatz für das Festlegen einer Begriffsstruktur mit der Hilfe von einem ’kontrollierten Vokabular’ erlaubt somit, den organisierten semantischen Zugang zum gesamten intellektuellen Kapital eines großen Unternehmens. Mit ’kontrolliertes Vokabular’ ist ein standardisiertes Begriffssystem gemeint, welches die Kodierung, Klassifikation oder – lediglich – Identifikation von Daten und Information ermöglicht. Es sei an dieser Stelle darauf hingewiesen, dass im Rahmen des Untersuchungsbereichs der vorliegenden Arbeit keine strenge Unterscheidung zwischen den Begriffen ’kontrolliertes Vokabular’ und ’Organisationssystem’ in der Literatur gefunden werden konnte. Das Ziel von kontrollierten Vokabularen und Organisationssystemen ist es, Sammelstrukturen oder –mechanismen, welche gleichartige Objekte nach semantischen Kriterien möglichst nahe gruppieren und verschiedenartige möglichst weit platzieren, zu definieren. Die für diesen Abschnitt gewählte Unterteilung von Organisationssystemtypen basiert auf der in [Hodge 2000a] angegebenen allgemeinen Kategorisierung im Bereich der Digitalen Bibliotheken, da diese eine besonders verständliche Beschreibung der unterschiedlichen Möglichkeiten erlaubt. Demzufolge ergibt sich eine sinnvolle Unterteilung wie folgt: Begriffslisten (engl.: ’Term Lists’) o Liste von Begriffen, die oft Definitionen beinhalten. o Beispiele hierfür sind ’Authority Files’, Glossare, Wörterbücher und ’Gazetteers’. Beziehungslisten (engl.: ’Relationship Lists’) o In der vorliegenden Arbeit Beziehungsstrukturen genannt. o Liste von Beziehungen, die Verbindungen zwischen Begriffen und Konzepten beinhalten. o Beispiele hierfür sind Thesauri, Semantische Netzwerke und Ontologien. Klassifikationen und Kategorien o In der vorliegenden Arbeit Themenhierarchien genannt. o Systeme, welche die Erstellung von Themenmengen erlauben. o Beispiele hierfür sind ’Subject Headings’, Klassifikationssysteme, Taxonomien und Kategorisierungssysteme. In der vorliegenden Arbeit kommt das Thema ’Clustering’ hinzu, da es – als Teilbereich des Information Retrieval und analog zum Ziel der Systeme im Bereich der Wissensorganisation – Mechanismen und Algorithmen behandelt, die ’ähnliche’ Dokumente in Klassen gruppiert. In diesem Zusammenhang, und in Übereinstimmung mit der in [Baeza-Yates et al. 1999] angegebenen Beschreibung, stellt ’Clustering’ eine Operation auf Dokumentenmengen, und nicht auf Textinhalte, dar. Der Hauptteil dieses Abschnittes bilden die ’Klassifikationen und Kategorien’, da sie sich am besten für kontextabhängige Themenhierarchien eignen, welche eine optimale taxonomische Kapitel 5 - WISSENSORGANISATION Seite 84 Ordnung, Strukturierung und Verwaltung von Ressourcen in verteilten Informationssystemen für transnationale Konzerne erlauben. 5.3.2 Begriffslisten Die hier dargestellte Beschreibung von Begriffslisten basiert auf den in [Hodge 2000a] identifizierten Definitionen über ’Term Lists’ für Digitale Bibliotheken. Listen von Begriffen, welche für die Kontrolle von wechselnden Namen innerhalb einer Terminologie oder von Werten für Domänen in einem spezifischen Bereich bestimmt sind, werden Authority Files genannt. Authority Files beinhalten in der Regel keine tiefe Organisation oder komplexe Struktur, die Ordnung erfolgt meist alphabetisch oder über flache (d.h. einfache) Klassifikationssysteme. Beispiele hierfür beinhalten Namen für Länder, Personen und Organisationen. Erreichen solche Listen eine bestimmte Länge, so kann eine beschränkte Tiefe, d.h. hierarchische Ordnung, eingeführt werden, um die Navigation zu erleichtern. Beispiele für Authority Files sind das ’Library of Congress Name Authority File (LC-NAF) 41’ und das ’Getty Geographic Authority File 42’. Ein Glossar ist eine Liste von Begriffen, welche in der Regel Definitionen enthält. Die Einträge in einem Glossar sind spezifisch zu einem Themenbereich, sind definiert innerhalb der Grenzen eines bestimmten Systems und beinhalten deshalb selten wechselnde (dynamische) Bedeutungen. Ein Beispiel hierfür ist die ’United States Environmental Protection Agency: Terms of the Environment 43’. Wörterbücher sind alphabetische Listen von Wörtern und deren Definitionen, und umfassen größere (allgemeinere) Bereiche als Glossare. Wörterbücher können zusätzliche Information, wie zum Beispiel Ursprung, Morphologie oder Aussprache des Wortes, enthalten. Obwohl Wörterbücher auch Synonyme oder ähnliche Begriffe zu einzelnen Wörtern über die Definition enthalten können, lassen sie keine explizite hierarchische Struktur oder Gruppierung nach Konzepten erkennen. Ein Gazetteer ist ein geographisches Lexikon oder Verzeichnis, welches Ortsnamen auflistet wie zum Beispiel das Verzeichnis im hinteren Teil eines Weltatlas - und entsprechende Kennzeichnungen (Fluß, Berg, Koordinatenangaben, usw.) enthält. Eine Anwendung von Begriffslisten für die Wissensorganisation und semantische Informationsaufbereitung in transnationalen Konzernen ist nur eingeschränkt empfehlenswert, da sich ihre einfache Funktionalität nicht besonders gut für komplexe Begriffsstrukturen eignet. Falls aber eher flache und kurze Auflistungen von Konzepten in Frage kommen, können diese Systeme durchaus gute und überschaubare Strukturen darstellen, welche einen semantischen Zugang zu ’dahinterliegenden’ Informationseinheiten erlauben. 5.3.3 Beziehungsstrukturen Ein anderer Typ von Organisationssystemen stellen die Beziehungsstrukturen, meist unter der anglosprachigen Bezeichnung ’Relationschip Lists’ bekannt, dar. Diese Strukturen zeichnen 41 http://www.loc.gov/catdir/pcc/tgauthrpt.html http://www.getty.edu 43 http://www.epa.gov/OCEPAterms/ 42 Kapitel 5 - WISSENSORGANISATION Seite 85 sich dadurch aus, dass sie Verbindungen zwischen Begriffen und Konzepten beinhalten. Die wichtigsten Beispiele von Begriffsstrukturen, wie bereits im Abschnitt 5.3.1 erwähnt, sind Thesauri, Semantische Netzwerke und Ontologien. Die Untersuchung dieser Untergruppen stellt den Schwerpunkt dieses Abschnitts dar. Ordnungssysteme, welche auf der Basis von Beziehungsstrukturen aufgebaut sind, lassen an den Enden einer Beziehung (Relation) nur Begriffe eines bestimmten Typs zu. Sie beinhalten also sogenannte Rolleneinschränkungen (engl.: ’role constraints’), wodurch sie als mächtige Schablonen (engl.: ’Templates’) eingesetzt werden können [Sigel 2000a]. Ein Beispiel, um diesen Sachverhalt zu verdeutlichen, wird in [Sigel 2000a] angegeben und wird in [Tab. 5.1] dargestellt: Rolle Libretto Librettist > Relation ist geschrieben von hat geschrieben > Rolle Librettist Libretto Tabelle 5.1: Beispiel einer Relation in einer Beziehungsstruktur [Sigel 2000a] Die Relation ’ist geschrieben von(Libretto, Librettist)’ könnte die Behandlung von Spezialfällen erlauben, falls eine weiter Relation, wie in [Tab. 5.2] dargestellt, definiert wurde und eine ’Relationshierarchie’ (bestehend aus einer Relation zwischen einem Ober- und einem Unterbegriff) zuläßt: Rolle Werk Autor > Relation wurde geschaffen von schuf > Rolle Autor Werk Tabelle 5.2: Beispiel einer Relation in einer Beziehungsstruktur [Sigel 2000a] Wenn also Libretto ein Werk und Librettist ein Autor sind, dann sind die Relationen ’ist geschrieben von’ und ’hat geschrieben’ Spezialfälle von ’wurde geschaffen von’ und ’schuf’. Das Wort Thesaurus hat griechischen und lateinischen Ursprung, wird als eine Referenz zu einem ’Wortschatz’ (engl.: ’treasury of words’) verwendet und besteht, in einer vereinfachter Form, aus: a) einer vordefinierten Liste von den für eine spezifische Wissensdomäne wichtigsten Wörtern, und b) einer zu jeden Listeneintrag dazugehörenden Menge von ’verwandten’ Wörtern (in der Regel Synonyme). [Baeza-Yates et al. 1999] In der allgemeinen Form bestehen Thesauri aus einem genormten Vokabular und einer komplexeren Struktur als lediglich Listen. Die Relationseinträge in einem Thesaurus, auch Deskriptoren genannt, können somit mehrfache Angaben, wie zum Beispiel ein Datum, eine Begriffsnummer, eine Definition, ein Gültigkeitsbereich, eine Notation oder eine Klassifikationsbeschreibung, beinhalten. Die Bedeutung der Thesauri für die vorliegende Arbeit liegt in ihrer Implementierung in webbasierten Systemen. In [Shiri et al. 2000] identifiziert man folgende Thesauritypen für das Web: Thesauri in einfachen statischen Textformaten, Thesauri in HTML Format ohne effektive Nutzung von Hyperlinks (statisch), Kapitel 5 - WISSENSORGANISATION Seite 86 Thesauri in dynamischem HTML Format mit navigierbaren Hyperlinks, Thesauri mit fortgeschrittenen visuellen und graphischen Interfaces und Thesauri in XML Format. Die wichtigsten allgemeinen Verwendungsgründe von Thesauri, wie in [Baeza-Yates et al. 1999] identifiziert, lauten wie folgt: Das Bereitstellen eines Standardvokabulars (oder Referenzsystems) für das Indizieren oder Suchen von Information. Die Benutzerunterstützung bei der Formulierung von Suchabfragen durch das Auffinden von ’ähnlichen’ Begriffen. Das Verfügbarmachen von klassifizierten Begriffshierarchien, welche die aktuelle Abfrage semantisch und bedarfsgerecht ausweiten oder einschränken können. Das in [Shiri et al. 2000] gezeigte Beispiel für eine benutzerfreundliche Antwort des Thesaurus ERIC 44, welches den Begriff ’high school’ als Deskriptor nicht kennt, aber trotzdem ähnliche Einträge findet, die eine weitere Navigation bzw. eine erneute Sucheingabe ermöglicht, wird in [Abb. 5.1] dargestellt. Abbildung 5.1: Antwort des Thesaurus ERIC nach einer Suchabfrage [Shiri et al. 2000] Der Autor der vorliegenden Arbeit vertritt die Meinung, dass der Grund für die Wichtigkeit der Erstellung bzw. Anwendung von Thesauri zum Zweck der semantischen Informationsaufbereitung, im vom Bereich des Wissensmanagements geprägten Ansatz der Nutzung eines Organisationsgedächtnisses für die Verwaltung vom intellektuellen Kapital liegt. Das heißt, wenn man ein Unternehmen als ein ’lernfähiges’ Wesen betrachtet, so ist die Verwaltung seines Organisationsgedächtnisses analog zu – aber natürlich nicht identisch mit – dem begrifflichen Lernmechanismus des menschlichen Gedächtnisses. Die Abbildung von Terminologien unseres Gehirns in Benennungen der natürlichen Sprache ist beim menschlichen Denken ein wichtiges Hilfsmittel zur Strukturierung von Wissen. Dieser 44 http://searcheric.org/ Kapitel 5 - WISSENSORGANISATION Seite 87 Mechanismus dient hauptsächlich der Kommunikation, um beispielsweise Wissen auszutauschen. Das oftmalige Vorkommen von Situationen, bei denen für bestimmte zu übermittelnde Vorstellungen ’keine Worte gefunden werden können’, läßt erkennen, dass Menschen nicht unbedingt in Sprache, sondern in Begriffen, denken. [Umstätter 2000] Ein Problem bei der semantischen Erstellung von Thesauri ist, dass der Mensch für zu komplexe Begriffe, die das Gehirn erfahrungsgemäß oder logisch erzeugt hat, Benennungen erst neu erzeugen muß. Ein Gegenargument dazu wäre die bekannte These, dass auch die Begriffe aus Zeichenketten, die im neuronalen Netz des Gehirns ausgetauscht werden, bestehen. Diese haben aber noch nichts mit der natürlichen Sprache zu tun. [Umstätter 2000] Der Anbruch der elektronischen Verarbeitung der natürlichen Sprache brachte signifikante Entwicklungen bzw. Fortschritte im Bereich der Semantischen Netzwerke mit sich. Diese Organisationssysteme erlauben eine komplexe Strukturierung von Konzepten und Begriffen als Netze und nicht als Hierarchien. Die damit erzeugten Graphen besitzen Konzepte als Knoten und Relationen als gerichtete Verbindungskanten. Eines der bekanntesten semantischen Netzwerke ist jenes der lexikalischen Datenbank für die englische Sprache ’WordNet’ 45 von der Princeton University (USA), welches von vielen Suchmaschinen verwendet wird. [Hodge 2000a] Ein Beispiel für die Anwendung von semantischen Netzen wird in [Abb. 5.2] dargestellt. Anhand des semantischen Netzes auf der rechten Seite der Abbildung wird die räumliche Beziehung der links dargestellten geometrischen Figuren ausgedrückt. Abbildung 5.2: Beispiel für die Anwendung von semantischen Netzen [Guetl 2000] Die Knoten und Kanten eines semantischen Netzes können simultan zwei Rollen spielen: einerseits können sie Wissen in ’realen Strukturen’ (z.B. Dokumente in einer Datenbank) ausdrücken, und andererseits eine semantische und vernetzte Verbindung zu den Dokumenten darstellen. In diesem Sinne kann man Regeln (d.h. ’Beziehungsregeln’ wie zum Beispiel AND, OR, usw.) in den Kanten so definieren, dass sie die Semantik von zwei benachbarten Knotenpunkten erweitern. Somit sind beispielsweise Implementierungen lösbar, die logische Verknüpfungen (AND, OR, usw.) von in Knoten definierten Suchkriterien erlauben [Huber 1998]. Anhand semantischer Netze können auch Algorithmen erklärt werden, die im Bereich der Wissensverarbeitung häufig angewandt werden. Dazu gehören zum Beispiel Algorithmen zur Suche in Graphen und zur Behandlung von Spielbäumen. [Guetl 2000] 45 http://www.cogsci.princeton.edu/~wn/ Kapitel 5 - WISSENSORGANISATION Seite 88 Der graphentheoretische Hintergrund von semantischen Netzen spielt bei der Konzeption von Ontologien oder Modellierung von Wissenskarten eine entscheidende Rolle, worauf in Abschnitt 5.4 ’Sichtweisen’ näher eingegangen wird. Ziele, Definition und Eigenschaften von Ontologien wurden im vorangegangenen Abschnitt 5.2 ’Semantik’ schon ausführlich besprochen. An dieser Stelle sei lediglich an die Bedeutung von Ontologien für Begriffsstukturierungen in Informationssystemen für transnationale Konzerne hingewiesen. Hierfür ist wieder der Vergleich einer funktionellen bzw. strukturellen Darstellung des intellektuellen Kapitals von Unternehmungen als Organisationsgedächtnis mit der terminologischen Funktionsweise des menschlichen Gehirns. Menschen wenden ständig und überall Ontologie an. Und zwar, indem sie versuchen, die Bedeutung von Worten und Zeichen aus ihren Zusammenhängen zu rekonstruieren. Mit der Hilfe von Ontologie (hier als ’Seinslehre’ im Sinne der modernen Linguistik interpretiert) versuchen Menschen durch Induktion von möglichst vielen Einzelfällen auf das Allgemeinere zu schließen. Je einheitlicher die Erfahrungen sind, desto einfacher sind Definitionen formulierbar. Je umfangreicher diese Definitionen sind, desto sicherer erscheint eine Aussage. Andererseits werden Definitionen - aller Wahrscheinlichkeit nach - umso heterogener, je umfangreicher die Erinnerungen (Erfahrungen) sind. Diesbezüglich wird in [Umstätter 2000] ein Beispiel angegeben, das nicht nur diesen Sachverhalt erklärt, sondern auch die Wichtigkeit des Bibliothekswesens für die Wissensorganisation ans Licht bringt: ein ’Laie’ versucht normalerweise aufgrund der Frage ’Was versteht man unter einer Bibliothek?’ eine möglichst ’typische’ (für den Laien bekannte) Bibliothek zu beschreiben. Ein Bibliothekar (im allgemeineren Sinne ein Fachspezialist in einer spezifischen Wissensdomäne) hat dagegen nicht nur eine größere Erfahrung hinsichtlich der Vielfalt des Begriffs ’Bibliothek’, er kennt meist mehrere Typen aus eigener Anschauung. Weiters hat er Fachliteratur gelesen und auch gelernt den Umfang seiner Kenntnisse so zu kategorisieren, dass er zwischen den unterschiedlichen Bibliothekssystemen, -aufgaben, -bautypen, usw. unterscheiden kann. Wenn man diesen Sachverhalt auf das Informationssystem eines transnationalen Konzerns zurückführt, geht es also darum, einen ’Wortschatz’ (d.h. ein kontrolliertes Vokabular) festzulegen, den man unternehmensweit in möglichst gemeinsamer Eindeutigkeit benutzen kann. Das umfangreiche intellektuelle Kapital (und infolgedessen das umfangreiche Organisationsgedächtnis) von so einem Unternehmen und die Vielzahl an Interaktionen zwischen Informationssystem und Benutzern können über transparente Begriffsstrukturierungen einen guten Mechanismus darstellen, um eine global geltende Terminologie auf bedarfsgerechter und kontextabhängiger Weise effizient zu verwalten. 5.3.4 Themenhierarchien In diesem Abschnitt werden die unterschiedlichen Organisationssysteme, welche die Festlegung von Themenmengen ermöglichen, präsentiert und analysiert. Diese Systeme werden hier wie folgt unterteilt: o o o o Subject Headings Klassifikationssysteme Taxonomien Kategorisierungssysteme Das Schema von Subject Headings stellt eine Menge von kontrollierten Begriffen, um die Themen (Fachbereiche) einer Wissensdomäne darzustellen, zur Verfügung. Kapitel 5 - WISSENSORGANISATION Seite 89 Subject Headings sind meistens ’Listen’ mit einer sehr umfangreichen aber nicht tiefen hierarchischen Struktur. Beispiele hierfür sind ’Medical Subject Headings 46 (MeSH)’ und ’Library of Congress Subject Headings 47 (LCSH)’. [Hodge 2000a] Die LCSH unterscheidet vier grundsätzliche Typen von Subject Headings (SH) 48: ’Thematische’ (engl.: ’topical’) Subject Headings enthalten ein Wort oder eine Phrase, welche einen Inhalt, einen Themenbereich oder ein Dokument beschreiben. Ein Beispiel dafür wäre der Name eines Unternehmensbereichs. ’Form’-Subject-Headings werden verwendet, um die Gattung oder den Stil des zu katalogisierenden Eintrags zu beschreiben. Ein Beispiel dafür wäre ’Projektmanagerdaten’. Damit ist hier eine Menge von Dokumenten, die für Projektmanager – unabhängig vom thematischen Inhalt - publiziert wurden, gemeint. ’Geographische’ Subject Headings können auf zwei unterschiedliche Weisen angewendet werden. Sie können einfach einen geographischen Namen, wie zum Beispiel ’Guatemala’, enthalten, oder in Kombination mit anderen Beschreibungswörtern erscheinen, um das Hauptaugenmerk des Themeneintrags besonders zu kennzeichnen. Ein kombinierter Eintrag könnte somit ’GuatemalaForschung’ oder ’Forschung-Guatemala’ lauten. Die Reihenfolge der Einträge soll dem System bekannt sein, um die einzelnen Wörter prioritätsabhangig zu behandeln. ’Perioden’-Subject-Headings (engl.: ’period subject headings’) beschreiben eine spezifische Zeitspanne und können nicht nur numerische Zeitangaben beinhalten, sondern auch Epochennamen (zum Beispiel ’Die Achtziger und Neunziger’ oder ’Nachkriegszeit’) oder bekannte Zeiteinheiten (zum Beispiel ’Dekade’ oder ’Jahrhundert’) enthalten. Diese können auch in kombinierter Form angegeben werden. Klassifikationssysteme, Taxonomien und Kategorisierungssysteme Die Begriffe ’Klassifikationssysteme’, ’Taxonomien’ und ’Kategorisierungssysteme’ werden hier als gemeinsamer Punkt behandelt, da sie in der Literatur abwechselnd Verwendung finden. Im Allgemeinen stellen diese Organisationssysteme Möglichkeiten zur Verfügung, um Einheiten in Gruppen zu sammeln oder in relativ umfassenden Themenebenen zu trennen. Sie stellen meist hierarchische Ordnungen in numerischer oder alphabetischer Notation dar, um möglichst tiefe (fachspezifische) Themenstrukturen zu beschreiben. Diese Typen von Organisationssystemen folgen in der Regel nicht den strengen Richtlinien für Hierarchien des ANSI NISO Thesaurus Standards (Z39.19), wodurch es ihnen am expliziten Beziehungsmechanismus von Thesauri mangelt [Hodge 2000a]. Da in der Literatur keine deutlich getrennte Behandlung von Bedeutung, Zielsetzung und Eigenschaften dieser Systeme zu finden ist, wird nun der Versuch unternommen - zumindest terminologisch – eine Unterscheidung zwischen Klassifikation, Taxonomie und Kategorisierung anzubieten. Unter Klassifikation versteht man, laut [Pralle 1999], die Zerlegung einer Menge von Objekten in Klassen aufgrund gewählter Merkmale. Eine Hierarchie oder Ordnung der Klassen ist in einer allgemeinen Klassifikation nicht unbedingt erforderlich. Das Hauptziel besteht darin, hinreichend gleichartige Objekte in derselben Klasse und hinreichend unterschiedliche Objekte in unterschiedlichen Klassen zu verteilen. Die resultierende Struktur ist meist ein Wald (eine 46 http://www.nlm.nih.gov/mesh/meshhome.html http://www.lib.utah.edu/instruction/handouts/LCSH/lcsh.html 48 http://www.lili.org/isl/cepage/Courses/Course6/<13 bis 17>types.htm 47 Kapitel 5 - WISSENSORGANISATION Seite 90 Menge von Bäumen, die nicht unbedingt miteinander verbunden sein müssen). Eine Taxonomie ist hingegen die Ordnung von – meist biologischen – Objekten in Klassen aufgrund von Beziehungen (Ähnlichkeit, Evolution, usw.) und nicht aufgrund äußerer Merkmale [Pralle 1999]. Taxonomien werden meist als hierarchisch geordnete Klassifikationen aufgefaßt. Das Resultat bildet in diesem Fall ein Baum. Eine Kategorie wird in [Easterbrook 1998] einfach als die Vereinigung von Klassen von Objekten und Klassen von Morphismen definiert. Es entsteht also ein gerichteter Graph mit Objektklassen als Knoten und Morphismen als gerichtete Kanten. Die in [Easterbrook 1998] präzise formulierte Definition einer Kategorie lautet wie folgt (die graphische Darstellung hierfür wird in [Abb. 5.3] präsentiert): „Eine Kategorie besteht aus: - einer Klasse von Objekten und - einer Klasse von Morphismen (’Pfeilen’). - Für jedes Morphismus f existiert ein Objekt als Domäne von f und ein Objekt als Ko-Domäne von f. - Für jedes Objekt A existiert ein Identitätsmorphismus, welches als Domäne und Ko-Domäne das Objekt A besitzt (’IDA’) - Für jedes Paar von Morphismen f: A→B und g: B→C (zum Beispiel cod(f) = dom(g)) existiert ein Kompositionsmorphismus g o f: A→C ... mit den Regeln: - Identitätskomposition: für jedes Morphismus f: A→B existieren die Kompositionsmorphismen (f o IDA = f) und (IDB o f = f). - Assoziativität: Für jede Menge von Morphismen f: A→B, g: B→C, h: C→D gilt (h o g) o f = h o (g o f).“ 49 Abbildung 5.3: Graphische Darstellung der Eigenschaften von Kategorien. Von oben nach unten: Morphismus; Identitätsmorphismus; Kompositionsmorphismus; Assoziativität. [Easterbrook 1998] 49 Definition einer Kategorie laut [Easterbrook 1998] “A category consists of: - a class of objects - a class of morphisms (‘arrows’) - for each morphism, f, one object as the domain of f and one object as the codomain of f. - for each object, A, an identity morphism which has domain A and codomain A. (“ID A”) - for each pair of morphisms f: A→B and g: B→C, (i.e. cod(f)=dom(g)), a composite morphism, g o f: A→C With these rules: - Identity composition: For each morphism f: A→B, (f o IDA = f) and (IDB o f = f) - Associativity: For each set of morphisms f:A→B, g:B→C, h:C→D, (h o g) o f = h o (g o f)” Kapitel 5 - WISSENSORGANISATION Seite 91 Beim Voranschreiten zu immer allgemeineren Begriffen gelangt man in einer Klassifikationshierarchie schließlich an eine Themenbereichsgrenze, jenseits welcher kein allgemeinerer (merkmalsärmerer) Oberbegriff mehr sinnvoll ist [Sigel 2001]. Der somit gefundene Oberbegriff bildet eine Kategorie. Die ihnen untergeordneten Begriffe bezeichnet man als eine "Facette" von Begriffen. Insbesondere umfassen Kategorien alle Begriffe, nach denen man in einem Informationssystem zuverlässig suchen will. Wichtig ist diesbezüglich noch zu erwähnen, dass Kategorien durch die Nutzer des Informationssystems festgelegt werden sollten [Sigel 2001]. Kategorien haben somit in einem Informationssystem folgende Funktionen [Sigel 2001]: Sie dienen als Richtlinie bei der Zusammenstellung des Vokabulars für die Indexsprache. Sie helfen bei der Wahl ’ordnungsfreundlicher’ Unterteilungsgesichtspunkte. Sie stellen Richtlinien zur Aufgabenteilung zwischen Wortschatz und Grammatik bei der Begriffsanalyse dar. Sie dienen als Richtlinie bei der Definition von Fachbegriffen. Sie unterstützen die Grobgliederung eines spezialisierten Wortschatzes. Themenkategorien werden häufig verwendet, um Thesauribegriffe in breite Themenmengen zu gruppieren, welche sich dann außerhalb des hierarchischen Schemas des Thesaurus befinden. Taxonomien finden heutzutage zunehmend im objektorientierten Entwurf und in Wissensmanagementsystemen Anwendung, um Objekte aufgrund spezieller Eigenschaften zu gruppieren. Desweiteren werden Taxonomien bei Schemata verwendet, welche ’Biota’ auf der Basis irgendwelcher spezieller Charakteristika hierarchisch darstellen (d.h. um botanische Klassen festzulegen). [Hodge 2000a] Wie schon in den vorangegangenen Abschnitten beschrieben, bestehen Klassifikationssysteme auch aus Deskriptoren (Beschreibungselementen). Syntax und Semantik solcher Deskriptoren sind in Form sogenannter ’Dokumentationssprachen’ festgelegt. Um sich von der konkreten sprachlichen Formulierung in dem zu klassifizierenden Dokument zu lösen, wird eine – vom Dokument - unabhängige Repräsentation des Textinhaltes bzw. der Dokumentenbedeutung durch Verwendung eines speziellen Vokabulars verwendet. Dieses Vokabular soll alle mehrfachen Bedeutungen und die Probleme morphologischer und syntaktischer Art der natürlichen Sprache vermeiden. Der Begriff ’Dokumentationssprachen’ stammt aus dem Bereich ’Information Retrieval’ und beinhaltet die in der vorliegenden Arbeit besprochenen ’Klassifikationssysteme’ und ’Thesauri’. [Fuhr 1999] Die am häufigsten anzutreffende Ordnung innerhalb eines großen und verteilten Informationssystems erfolgt nach Fachgebieten. Dies verdeutlicht den hohen Stellenwert einer thematischen Klassifikation in Verbindung mit Such- und Navigationsproblemen. [Heber 2000] Die im Folgenden präsentierte Unterteilung von Klassifikationssystemen entspricht jener in [Koch et al. 1997], wobei die wichtigste Gruppe von sogenannten ’Universalschemata’ (engl.: ’universal schemes’), welche eine umfassende Wissensordnung erlauben, dargestellt wird. Die zweite Gruppe bilden die ’nationalen Allgemeinschemata’ (engl.: ’ national general schemes’), die zwar bezüglich der Themen allgemein gehalten werden, jedoch für ein einzelnes Land oder geographisches Gebiet entwickelt werden. In der dritten Gruppe sind ’fachspezifische Schemata’ (engl.: ’subject specific schemes’) anzuordnen. Diese Schemata umfassen, wie der Name schon verdeutlicht, ganz bestimmte Fachbereiche in sehr detaillierter Form. Die letzte Kapitel 5 - WISSENSORGANISATION Seite 92 Gruppe bilden die ’selbstentwickelten Themenschemata’ (engl.: ’home-grown schemes’), welche zunehmend als ’Ontologien’ im Internet Verbreitung finden. [Koch et al. 1997] [Heber 2000] Die Verwendung von Klassifikationssystemen, um Wissen – zum Beispiel in sehr großen und geographisch verteilten Intranetumgebungen – effizient zu organisieren, bietet eine Reihe von Vorteilen, unter denen man vor allem folgende findet: Klassifikationssysteme können (aufgrund der hierarchischen Hierarchie) dabei helfen, einen Suchbereich zu erweitern (um den ’Recall’ zu erhöhen) oder ihn einzuschränken (um die ’Precision’ zu erhöhen oder Filterung zu ermöglichen). [Koch et al. 1997] Die Navigation durch die in Klassen eingeteilten Wissenseinheiten kann intuitiver und effizienter, aber vor allem überschaubarer gestaltet werden. Die Organisation von Wissen in Klassenhierarchien ordnet den einzelnen Einheiten einen Kontext zu, wodurch das Problem von Homonymen (d.h. Wörtern mit gleicher Form und Aussprache aber mit unterschiedlichen Bedeutungen) zumindest teilweise gelöst werden kann. [Koch et al. 1997] Die weit verbreitete und stets zunehmende Anwendung von Klassifikationsschemata kann statistische Kennwerte über Klassenverteilungen und -schwerpunkte in großen Wissensdatenbanken liefern. Diese Werte können zur Verbesserung des jeweiligen Klassifikationsschemas herangezogen werden, zur Weiterentwicklung neuer Hilfsmittel zur Kategorisierung und Auffindung beitragen, oder die Funktionalität der voll- und semiautomatischen Klassifikationsmechanismen verbessern. [Heber 2000] Wie oben schon erwähnt, unterscheidet man meist zwischen den folgenden vier Typen von Klassifikationsschemata: a) Universalschemata b) Nationale Allgemeinschemata c) Fachspezifische Schemata d) Selbstentwickelte Themenschemata Welche dieser Schemata sich für ein Informationssystem am besten eignet hängt vom Aufgabenbereich und der Zielgruppe der Anwendung ab. Für den Einsatz in großen und global geltenden Informationssystemen empfiehlt sich ein Universalschema. Falls sich das System einem spezifischen und abgeschlossenen Fachgebiet zuordnen lässt, oder in privaten bzw. kommerziellen Anwendungen eingesetzt werden soll, dann kommt eher der Einsatz eines selbstentwickelten oder eines fachspezifischen Schemas in Frage. Universalklassifikationen hingegen bieten wesentliche Vorzüge in akademischen Systemen. Verschiedene Schemata können gleichzeitig zur Anwendung kommen, wobei Konvertierungstools bei der Zusammenführung der Themenhierarchien notwendig sind. Durch die sprachenunabhängige (meist arabisch numerische) Notation eines Universalschemas ist das Problem der Mehrsprachigkeit unter Kontrolle [Koch et al. 1997]. Der Zugang zu Information kann über verschiedensprachige Indizierungen erfolgen ohne Änderungen in den Datenbankbeständen selbst durchführen zu müssen [Heber 2000]. Dieser Ansatz verdient vor allem bei Informationssystemen in transnationalen Konzernen besonderes Augenmerk. Desweiteren sind Universalkataloge heutzutage alle in computer-lesbarer Form verfügbar. Kapitel 5 - WISSENSORGANISATION Seite 93 Zu den kritischen Aspekten bei der Verwendung von Universalschemata zählen folgende, in [Heber 2000] und [Koch et al. 1997] identifizierte, Punkte: Die Struktur der Themenhierarchie in Universalschemata folgt nicht immer formalwissenschaftlichen Regeln, sondern subjektiven Kriterien. Die somit entstandenen inkonsistenten Abschnitte haben zum Teil ihre Ursache in den weit zurückliegenden Anfängen der Katalogisierung. Eine Anpassung an die Notwendigkeiten, die beispielsweise das Web an ein Klassifikationsschema stellt, wird bereits dahingehend durchgeführt, dass man sich von dem aufzählenden Konzept weg in Richtung aspektorientierter Klassifikation bewegt. Universalschemata werden meist durch international kooperierende Organisationen verwaltet. Änderungen der Themenhierarchie sind also erst nach genauen und zeitintensiven Überprüfungen möglich. Dies kann sich bei sehr dynamischen Organisationsgedächtnissen zufolge der eingeschränkten Aktualisierung bzw. der umständlichen Einbindung neuer Themen kritisch auswirken. Nationale Allgemeinschemata besitzen in der Regel die gleichen Eigenschaften, Vorteile und Nachteile der Universalschemata. Der Unterschied besteht in der geographischen Einschränkung (d.h. Kontext und Klassen gelten nur innerhalb der Landesgrenzen), welche zugleich das wichtigste Gegenargument bei dem Einsatz in großen und geographisch verteilten Unternehmen darstellt [Koch et al. 1997]. Fachspezifische Schemata werden meist für spezialisierte Themenbereiche entwickelt und eignen sich deshalb für Organisationsgedächtnisse, deren terminologische Anforderungen mit dem behandelten Fachbereich verknüpft werden können. Infolgedessen werden sie bevorzugt in jenen Bereichen eingesetzt, die eine genauere thematische Abstufung verlangen (zum Beispiel Medizin oder Mathematik) [Heber 2000]. Die Navigation durch fachspezifische Schemata kann aber für externe (unerfahrene) Benutzer schwer fallen, da die Benutzerzielgruppe relativ klein ist, und das Verständnis der Struktur Fachkenntnisse voraussetzt [Koch et al. 1997]. Selbstentwickelte Themenschemata erlauben relativ hohe Flexibilität, Erweiterbarkeit und Modifizierbarkeit. Dies sind die wesentlichsten Vorteile gegenüber Universalschemata. Eine selbstentwickelte Themenhierarchie wird aber oft von subjektiven Überlegungen beeinflusst, weshalb Inkonsistenz und eine fehlende Ordnungslogik die Folge sein kann [Heber 2000]. Bei sehr dynamischen Datenbeständen in großen Systemen sollte stets eine Überprüfung und Bewertung der Zweckmäßigkeit von Themenstrukturen erfolgen. Dies erhöht aber den Aufwand für Wartbarkeit, Pflege und Verwaltung des Katalogs. Somit ist die Zusammenarbeit mit anderen Klassifikationsschemata bei selbstentwickelten Themenhierarchien nur über aufwendige Konvertierungstools realisierbar. [Koch et al. 1997] Bislang wurden Typen von Klassifikationssystemen betrachtet, welche ’fertige’ Systeme von Klassen anbieten. Im Allgemeinen sollen diese fertigen Systeme ’potentiell’ alle denkbaren Themen – universell oder domänespezifisch - abdecken können. Eine Alternative zu diesen vorkombinierten Organisationstypen stellen sogenannte Facettenklassifikationen dar. Der bekannteste Repräsentant dieser Art von Klassifikation ist die Colon Klassifikation, erfunden um das Jahr 1930 vom indischen Mathematiker und Bibliothekar S. R. Ranganathan [Garfield 1984]. Die Methodik der Facettenklassifikation erfordert im ersten Schritt die Analyse einer Klasse, um dazugehörige Aspekte (Facetten) festzulegen. Im zweiten Schritt findet die Synthese einer Klassennummer (call number) aus den in veröffentlichten Verzeichnissen zu unterschiedlichen Kapitel 5 - WISSENSORGANISATION Seite 94 Facetten zugeordneten Nummern. Aus diesem Grund wird diese Methode auch analytischsynthetische Methode genannt [Garfield 1984]. Nachfolgendes Beispiel dient der Veranschaulichung von der analytisch-synthetischen Klassifikationsmethode. Ein Teil eines Klassifikationssystems sei gegeben durch folgende facettierte Ordnung (Analyse der Klassen): A Fahrzeug 1 Auto 2 Motorrad B Farbe 1 Grün 2 Rot C Herstellungsland 1 Österreich 2 Japan Durch die Synthese der einzelnen Klassen werden z.B. die Inhalte von Dokumenten anhand obiger Klassifikation repräsentiert, zum Beispiel ’Rotes Auto aus Österreich’A1B2C1, oder ’Motorrad aus Japan’A2C2. Einige praktische Beispiele aus den bisher besprochenen Organisationssystemtypen werden am Ende dieses Abschnitts präsentiert. Zuvor wird aber ein kurze Einführung in das Thema ’Clustering’ gegeben, da dieser Prozess eine wesentliche Rolle in unterschiedlichen Disziplinen (wie zum Beispiel Mustererkennung, Information Retrieval, Content Management, Künstliche Intelligenz oder Knowledge Management) spielt und sich grundlegend mit der Bildung von Ähnlichkeitsklassen beschäftigt. 5.3.5 Clustering Das primäre Ziel all jener Techniken und Disziplinen, welche in diesem Kapitel bisher beschrieben wurden, ist das Organisieren von Dateneinheiten in möglichst kontextueller Form. Es geht also darum, semantische Darstellungen von Daten oder Dateneinheiten so zu konzipieren, dass eine unternehmensgerechte themenspezifische Organisation und ein bedarfsund benutzergerechter Zugang ermöglicht werden. Diese Darstellungen (Repräsentationen) von Wissenseinheiten innerhalb eines Informationssystems werden auch ’Abstraktion’ genannt. Die für den Menschen ’freundlichste’ Repräsentation von Daten ist die natürliche Sprache, weshalb entweder linguistische oder numerische Kategorisierungen bevorzugt werden. In diesem Abschnitt beschränkt sich der Begriff der ’Abstraktion’ auf einen Prozess ’auf Datenebene’ und soll möglichst kompakt und einfach funktionieren [Jain et al. 1999]. Eine der Methoden, welche sich für eine Datenabstraktion besonders gut eignet, ist ’Clustering’. Darunter versteht man das Gruppieren von ähnlichen oder in Beziehung stehenden Einheiten in Klassen. [Baeza-Yates et al. 1999] Obwohl in der Literatur von ’Daten-Clustering’ oder ’Dokumenten-Clustering’ abwechselnd geschrieben wird, verallgemeinert der Autor der vorliegenden Arbeit das Thema und untersucht Clustering als ’Mechanismus zur Klassenerzeugung’. Es sei an dieser Stelle darauf hingewiesen, dass Clustering eine Operation auf Dokumenteninhalte ist, um daraus Relationen oder Ähnlichkeiten mit anderen Dokumenten zu extrahieren und demzufolge die Kategorisierung zu vollziehen. Kapitel 5 - WISSENSORGANISATION Seite 95 Ein besonders wichtiger Aspekt im Bezug auf Clustering ist die Berücksichtigung des ’Wortstammes’ (engl.: ’word stem’). Die in [Baeza-Yates et al. 1999] dafür gegebene Definition wird wie folgt vom Autor der vorliegenden Arbeit interpretiert: Es sei V(s) eine nicht –leere Untermenge von Wörtern, welche sich lediglich grammatikalisch voneinander unterscheiden. Eine kanonische Form s von V(s) wird ’Stamm’ (engl.:’stem’) genannt. Zum Beispiel wenn eine Menge V(s) = {’spielen’, ’Spieler’, ’spielend’, ’gespielt’} existiert, dann ist der Stamm s von V(s) äquivalent zu s = ’spiel’. 50 Weiters wird in [Baeza-Yates et al. 1999] der Bereich Clustering in zwei Typen unterteilt : a) In einer ’globalen Clustering’-Strategie werden Dokumente bezüglich ihres Standortes im gesamten System gruppiert. Hierbei geht es meist um die klassenorientierte Antwort zu einer zuvor vom Benutzer formulierten Suchabfrage. Die somit vom System erzeugten Gruppierungen geben meist ein Abbild der realen Struktur der Datenbank oder führen zu komplett neudefinierten Kategorien. Diese Strategie konzentriert sich meistens auf die Transformation und Deutung von Dokumenteninhalten. b) Beim ’lokalen Clustering’ erfolgt die Gruppierung von Dokumenten aufgrund des Kontexts der Suchabfrage und dessen Zusammenhang mit der Menge der aufgefundenen Dokumente. Die lokale Strategie befasst sich somit ausschließlich mit der Transformation und Interpretation der Benutzerabfrage und nicht mit der Transformation von Dokumenteninhalten. In diesem Zusammenhang identifiziert [Baeza-Yates et al. 1999] folgende drei Typen von Clusters: a) Assoziation-Clusters (engl.: ’association clusters’) basieren auf der Frequenz des Auftretens von Stems (bzw. Begriffen) in Dokumenten. Die zugrundeliegende Idee besteht darin, dass Stems, welche öfters innerhalb von Dokumenten auftreten, eine Synonymie-Assoziation besitzen. b) Metrische Clusters (engl.: ’metric clusters’) berücksichtigen nicht nur das Auftreten von Begriffen in Dokumenten, sondern auch den Ort des Auftretens. Da zwei Begriffe, welche innerhalb des gleichen Satzes auftreten, eine stärkere Beziehung zu haben scheinen als jene die weit weg voneinander liegen, erscheint es sinnvoll, den Abstand zwischen zwei Begriffen in der Berechnung des Korrelationsfaktors einzubeziehen. Auf diesem Sachverhalt basieren metrische Clusters. c) Skalare Clusters (engl.: ’scalar clusters’) leiten die Synonymie-Beziehung zwischen zwei Stems (bzw. Begriffen) aus dem Vergleich der dazugehörigen ’NachbarUntermengen’. Die Nachbarmenge eines Begriffs ’s’ besteht aus anderen Begriffen, die mit ’s’ eine relative – durch statistische Formeln errechnete – Ähnlichkeit besitzen. Somit entsteht eine neue Assoziation, welche über den Vergleich von ’Nachbarschaften’ eine gewisse Art Synonymie ermöglicht. Eine ähnliche Strategie wie jene der Skalaren Clusters verfolgt die in [Dietinger et al. 1999] als ’Konzeptuelles Clustering’ (engl.: ’conceptual clustering’) beschriebene Methode, bei der jedem Dokument eine Reihe von Konzepten zugeordnet werden kann und somit eine Art Nachbarschaft entwickelt (d.h. Objekte, deren konzeptuelle Metadaten stark ähneln, ’liegen näher zueinander’ als Objekte mit völlig unterschiedlichen Metadatensätzen). “Let V(s) be a non-empty suvset of words which are grammatical variants of each other. A canonical form s of V(s) is called a stem. For instance, if V(s) = {polish, polishing, polished} then s = polish.” [Baeza-Yates et al. 1999] 50 Kapitel 5 - WISSENSORGANISATION Seite 96 Die Stärke des Conceptual Clustering liegt in der direkten Nutzung von Metadaten, wodurch eine eigene Abstraktionsebene geschaffen wird, welche neue Möglichkeiten des Informationszugangs erlaubt. So wird in [Dietinger et al. 1999] empfohlen, die Metadaten getrennt zu speichern und zu verwalten, damit neue Conceptual Clusters auf der Basis von schon existierenden Definitionen aufgebaut werden können. Ein somit erstelltes Klassensystem kann auch als selbstentwickeltes Klassifikationsschema angewendet werden. Die für Clustering meist verwendeten Lösungsansätze werden laut [Jain et al. 1999] wie folgt unterteilt: a) hierarchisch (das Resultat sind Baumstrukturen) und b) partitionell (engl.: ’partitional’). Das Resultat von partitionellen Ansätzen sind Mengen und Untermengen. Die Untersuchung aller für Clustering existierenden Techniken würde den Rahmen der vorliegenden Arbeit sprengen, weshalb an dieser Stelle auf die ausführlichen Beschreibungen in [Jain et al. 1999] hingewiesen wird. Die für Clustering bekanntesten Techniken folgen heutzutage nicht nur strengen statistischen Regeln, es werden auch Lösungsansätze aus anderen Bereichen, wie zum Beispiel Fuzzy Logic aus der Künstlichen Intelligenz, angewendet. Das Thema Clustering wurde an dieser Stelle eingeführt, da es bei der Modellierung und Repräsentation von Datenstrukturen – vor allem in stark vernetzten, komplexen und geographisch verteilten Informationssystemen - eine wichtige Rolle spielt und deshalb im nächsten Abschnitt 5.4 ’Sichtweisen’ auch berücksichtigt wird. In diesem Zusammenhang ist bei den Lösungsansätzen des Clustering die ’Dynamik bei der Behandlung von Synonymie’ sehr interessant. Gut implementierte Clustering Techniken (in der Regel durch automatisierte Prozesse angewandt) können als effiziente Erweiterung oder Ergänzung von Klassifikationsschemata angewendet werden, da sie sich als ’dynamische’ Generatoren bzw. Modifikatoren von Taxonomien besonders gut eignen und damit sehr gute Hilfswerkzeuge für die semantische Informationsaufbereitung und den konzeptuellen Wissenszugang verkörpern. Um ein praktisches Bild aller bisher besprochenen Organisationssysteme anzubieten, werden im nächsten Abschnitt einige bekannte Beispiele präsentiert. 5.3.6 Beispiele aus der Praxis Die in diesem Abschnitt dargestellten Systeme sind gemäß der in Abschnitt 5.3.1 ’Typen von Organisationssystemen’ bekanntgegebenen Unterteilung gruppiert. Authority Files LC-NAF Library of Congress Name Authority File http://www.loc.gov/catdir/pcc/tgauthrpt.html Getty Geographic Authority File http://www.getty.edu Glossare United States Environmental Protection Agency: Terms of the Environment http://www.epa.gov/OCEPAterms Kapitel 5 - WISSENSORGANISATION Seite 97 Wörterbücher ENCARTA http://encarta.msn.com Thesauri [Shiri et al. 2000] ERIC Assessment and Evaluation Clearinghouse UNESCO Thesaurus MeSH National Library of Medicine CERES Thesaurus Californian Environmental Resources Evaluation System KCL Theaurus Knowledgecite Library GenThes General Thesaurus Semantische Netzwerke WordNet University of Princeton http://www.cogsci.princeton.edu/~wn Ontologien Cyc Knowledge Server [Gödert 2001] SEAL [Maedche et al. 2001] SEmantic portAL Subject Headings MeSH Medical Subject Headings http://www.nlm.nih.gov/mesh/meshhome.html LCSH Library of Congress Subject Headings http://www.lib.utah.edu/instruction/handouts/LCSH/lcsh.html Universalschemata DDC Dewey Decimal Classification http://www.oclc.org/oclc/fp/index.htm Jede Stufe dieser Hierarchie wird durch eine Ziffer zwischen 0 und 9 ausgedrückt. Eine DDC Nummer besteht dabei aus mindestens 3 Ziffern und wird als Dezimalbruch interpretiert, wobei der Dezimalpunkt nur fiktiv ist und zum besseren Verständnis der Struktur verwendet wird. Ein Beispiel dafür zeigt [Abb. 5.4]. Kurze Nummern stellen übergeordnete Klassen, längere Nummern speziellere, untergeordnete Klassen dar. Nummern mit gleicher Länge charakterisieren dementsprechend gleichwertige Klassen. [Heber 2000] Kapitel 5 - WISSENSORGANISATION Seite 98 Abbildung 5.4: Beispiel einer hierarchischen Notation von DDC [Heber 2000] UDC Universal Decimal Classification http://www.udcc.org Es stellt eine ausführliche Erweiterung des bereits beschriebenen DDC dar. Den Kern der Klassifikation bildet das MRF (’Master Reference File’), eine mehrsprachige Datenbank, welche jährlich aktualisiert wird, etwa 61000 Klassen enthält und auf Lizenzbasis in eigenen Anwendungen eingesetzt werden kann. [Koch et al. 1997] LCC Library of Congress Classification http://lcweb.loc.gov/cds/classif.html BC Bliss Bibliographic Classification http://www.sid.cam.ac.uk/bca/bcahome.htm Die Grundlage hierfür (Knoten des Strukturbaumes) bilden Aspekte. Die Notation weist eine sehr breite Zeichenbasis auf und wird durch die Ziffern 1 bis 9 und die Buchstaben A bis Z gebildet. [Koch et al. 1997] CC Colon Classification Die Einteilung der einzelnen Aspekte in Klassen erfolgt aufgrund ihrer Verwendung und ihrer Beziehungen, die durch einen Doppelpunkt (engl.: ’colon’) ausgedrückt werden. Das Schema benötigt bei gleichem Genauigkeitsgrad weniger Platz als das Schema einer vergleichbaren aufzählenden Klassifikation. Es erlaubt deshalb einen hohen Grad an Spezialisierung. [Heber 2000] Nationale Allgemeinschemata DBC Dutch Basic Classification Land: Niederlande http://www.kirjastot.fi/linkkikirjasto/selaus.asp SAB Sveriges Allmäma Biblioteksförening Land: Schweden http://www.sab.se Fachspezifische Schemata ACM ACM Computing Classification System http://www.acm.org/class ACM: Association for Computing Machinery Bereich: Computerliteratur und andere mit dem Computer im Zusammenhang stehenden Ressourcen. [Heber 2000] ICONCLASS http://iconclass.let.ruu.nl Kapitel 5 - WISSENSORGANISATION Seite 99 Bereich: Kunst. NLM National Library of Medicine http://www.nlm.nih.gov Bereich: Medizin Mammal Species of the World http://www.nmnh.si.edu/msw Bereich: Biologie Selbstentwickelten Themenschemata ODP http://dmoz.org YAHOO http://yahoo.com Einige Anbieter von Klassifikationslösungen [Wittkewitz 2001]: SER http://www.ser.de Autonomy http://www.autonomy.com Verity http://www.verity.com/international/gerweb Lotus http://www.lotus.com/home.nsf/welcome/discoveryserver Kurze Analyse Die in [Tab. 5.3] dargestellte Analyse gibt die in [Koch et al. 1997] zusammengefaßte Übersicht einiger Klassifikationsschemata an. BC CCS DDC Icon. LCC MSC NLM SAB UDC Anzahl der Internetdienste, die das System benutzen 1 1 17 0 5 0 1 4 5 Mehrsprachigkeit Ja Ja Ja Ja Ja Ja Ja Ja Ja Verfügbar in unterschiedlichen Sprachen Nein Nein Ja Nein Nein Nein Ja Nein Ja Integration mit anderen Systemen GTT Nein LCC Nein DDC Nein MeSH Nein Nein Digital verfügbar Ja Ja Ja Ja Ja Ja Nein Nein Ja Copyright Ja Ja Ja Ja Ja Ja Ja Ja Ja Erweiterbarkeit Ja Ja Ja Ja Ja Ja Ja Ja Ja Tabelle 5.3: Übersicht einiger Klassifikationsschemata laut [Koch et al. 1997] Kapitel 5 - WISSENSORGANISATION Seite 100 Die Vielfalt der praktischen Techniken für eine semantische Dokumentenanalyse und – modellierung ist das Thema des nächsten Abschnitts. Ziel dabei ist die Festlegung, Darstellung und Verwaltung von unternehmensgerechten ’topologischen’ Strukturen, welche eine effiziente Wissensdarstellung sowie den organisierten Zugang auf kategorisierten Wissensbeständen erlauben. Dynamische benutzer- und bedarfsgerechte Wissensorganisation mit Hilfe neuer Technologien und Standards (zum Beispiel XML, RDF, Topic Maps) stellt dabei den Schwerpunkt dar. 5.4 Sichtweisen Ein typischer Anwendungsfall für Wissensorganisation bzw. semantische Informationsaufbereitung in großen und verteilten Informationssystemen sind Wissensnetzwerke. Das primäre Ziel einer ’guten’ Wissensorganisation ist die Festlegung und Verwaltung von Strukturen, welche sich zur späteren Inhaltsintegration durch Dritte eignen. [Sigel 2001] Dieses Ziel wird durch ’gutes’ ontologisches Design – auch ’Ontology Engineering’ genannt auf der Basis von Hauptkategorien und –relationen erreicht. Dafür geeignete Mechanismen stellen beispielsweise die in den vorangegangenen Abschnitten beschriebenen Thesauri und die Klassifikationsschemata dar. Ontologien sind somit explizite Spezifikationen einer Konzeptualisierung relevanter Objekte des spezifischen Interessengebiets (zum Beispiel ein unternehmensspezifischer Fachwortschatz). Unter ’Konzeptualisierung’ versteht man eine spezifische ’Weltanschauung’ oder ’Weltsicht’, d.h. wie ein Fachbereich von seinen Vertretern sowie von Wissensorganisatoren gesehen - ’konzeptualisiert’ - wird (im Kontext der vorliegenden Arbeit zum Zwecke des Umgangs mit Wissensstrukturen). [Sigel 2001] Dieser Abschnitt befaßt sich mit den Techniken, welche eine konzeptualisierte Wissensdarstellung bzw. –modellierung ermöglichen. Hierbei geht es um die Darstellung von Wissensstrukturen in ausreichend formaler Form, damit sie von Computern durch Schlußfolgerungsmechanismen weiterverarbeitet werden können. Es werden zunächst die allgemeinen Eigenschaften von Modellen bzw. Modellierungprozessen beschrieben. Danach wird das Abbilden (’Mapping’) von Wissensstrukturen behandelt, d.h. das kodifizierte ’Kartographieren’ von Wissen. Moderne und mittlerweile standardisierte Technologien, wie zum Beispiel die auf XML basierenden ’Topic Maps’, werden anschließend präsentiert und untersucht. 5.4.1 Modellierung Wissensstrukturen werden von Menschen aufgebaut und zum Zwecke der Kommunikation und Kollaboration geteilt. Von besonderem Interesse für die vorliegende Arbeit sind Wissensstrukturen in sogenannten ’Diskursgemeinschaften’. Darunter versteht man Menschengruppen, die eine Fachdiskussion führen und somit durch ein fachspezifisches gemeinsames Verständnis, welches die Gemeinschaften voraussetzen, definiert werden [Sigel 2001]. Dies ist bei den untersuchten Informationssystemen für große und geographisch verteilte Unternehmungen aufgrund ihrer hochspezialisierten Geschäftsbereiche auch der Fall. Die Wissensorganisation trägt dazu bei, diese Wissensstrukturen effizient zu definieren und zu verwalten. Die Produkte der wissensbasierten Informationsaufbereitung bzw. der Wissensorganisation sind somit Klassifikationen, Thesauri und Metadaten. Kapitel 5 - WISSENSORGANISATION Seite 101 Auch wenn moderne Technologien wie das Internet (bzw. Intranet) ungeheure Entwicklungspotentiale für Unternehmen bereitstellen, stellen sie ’lediglich’ das Mittel zum Zweck, aber nicht ’den’ Unternehmenszweck selbst dar. Um den Mitarbeitern eines Unternehmens nun tatsächlich das richtige Wissen zur richtigen Zeit am richtigen Ort zur Verfügung zu stellen, ist es notwendig, sich sowohl abstrakt informierend als auch konkret ausführend vom Wissensmanagementsystem unterstützen lassen zu können. [Filliesetal2001] Die für eine zeit-, orts- und bedarfsgerechte Darstellung von Wissenstrukturen benötigte Mechanismen sind ’Modelle’, welche einer Normalisierung dieser Strukturen dienen. Die – in Anlehnung an [Sigel 2001] - identifizierte Funktionen der Normalisierung der Darstellung von Wissensstrukturen sind: Möglichst kontrollierte Vorhersehbarkeit (relativ steuerbar durch z.B. die Indizierung der Metadaten für eine verbesserte Suche), semantische Kollokation (Objekte mit ähnlichen Charakteristika sollten möglichst nahe aneinander gruppiert werden) und verbesserte semantische Interoperabilität (d.h. die garantierte Kompatibilität und Vergleichbarkeit von Systemen zur Wissensorganisation und dazugehörigen Metadaten). Für die Weiterbehandlung des Themas Modellierung sei an dieser Stelle die in [Bellinger et al. 2001c] angegebene Definition des Begriffs ’Modell’ (und zwar im Kontext von Systemen) festgelegt: „… Eine Vereinfachung der Realität, mit der Absicht das Verständnis zu fördern.“ 51 Bei der Entwicklung von Modellen (’Modellierung’) existiert laut [Bellinger et al. 2001c] immer ein gewisser Kompromiß. Da der Mensch durch Modelle versucht, eine Realität zu vereinfachen, impliziert dieser Prozess das Ausschließen einiger Details aus dem wirklichen Phänomen. Die Kernfrage bei der Modellierung von Wissenstrukturen ist: Was wird im Modell ein- und was ausgeschlossen? Sollten relevante Komponenten ausgeschlossen werden, so besteht das Problem einer zu einfachen Natur des Modells, womit die Entwicklung des Verständnisses nicht wie erwünscht gefördert wird. Ein zu detailliertes Modell führt hingegen zu einer komplexen Struktur, die ihrerseits die Entwicklung des Verständnisses (auf tiefer Ebene innerhalb der Struktur) erschwert. [Bellinger et al. 2001c] Eine der größten Herausforderungen bei der Konzeption von Wissensstrukturen in transnationalen Konzernen ist die richtige Modellierung von stark verteilten Geschäftsprozessen. Die neue Ausrichtung in der Unternehmensorganisation, wonach die Aufbauorganisation (Strukturen) sich nach der Ablauforganisation (Prozesse) richten soll, sowie die Forderung, zwischen Beschaffungs- und Absatzmarkt transnationale Prozeßketten zu schaffen, haben die Optimierung respektive die Modellierung der Geschäftsprozesse ins Zentrum der Maßnahmen, welche Unternehmen treffen müssen, um dem wachsenden Wettbewerbsdruck standzuhalten, gebracht. [Bettoni et al. 2001] Heutzutage wird diesbezüglich – laut [Filliesetal2001] und aus der Sicht des Wissensmanagements - versucht, mit Hilfe der Prozeßorientierung eine weitere Möglichkeit zur Klassifikation und Navigation anzubieten. Die in [Filliesetal2001] identifizierten Standardideen 51 “A simplification of reality intended to promote understanding.” [Bellinger et al. 2001c] Kapitel 5 - WISSENSORGANISATION Seite 102 zum Wissensmanagement, welche Prozessmodellierung findet, sind: man bei marktführenden Werkzeugen für die Wissenskategorien – jene, die zur Ausführung von Funktionen benötigt werden - als Datenquellen mit in die Prozesse aufnehmen. Wissenslandkarten als eigenen Diagrammtyp festlegen. Bereitstellen von personalisierbaren Unternehmenswissensportalen (engl.: ’Enterprise Knowledge Portals’) als Zugangspunkte zum System. ’Der Prozess ist das Wissen’. Referenzmodelle werden nun Wissensmodelle genannt. Verteilte (aber transparente!) Modellierung der Wissensbestände. (Chronologische) Geschichte ausgeführter Workflows (falls dafür Bedarf [Filliesetal2001] besteht). Um ein Modell für das gesamte System zu konzipieren, können auch Teilmodelle verwendet werden. Man könnte zum Beispiel52 ein Aufgabenmodell festlegen, das die Funktionalität der Wissensstrukturen in unterschiedlichen Aufgabengebieten untergliedert. Das Kooperationsmodell könnte dann beschreiben, wie die Aufgaben, welche auf unterschiedliche Strukturkomponenten aufgeteilt werden, miteinander zusammenarbeiten sollen. Schließlich kann ein Klassifikationsmodell definiert werden, das die Begriffsstruktur enthält. Der bedarfsgerechte Informationszugang kann dann über das Kooperationsmodell, welches das Bindeglied zwischen Aufgaben- und Klassifikationsmodell bildet, automatisch gesteuert werden. Die oben beschriebenen Aspekte der Modellierung von Strukturen sollten zeigen, dass diese in einer zielorientierten Abstraktionsebene zustande kommen und nicht immer ein konkretes technisches Szenario darstellen. Sie stellen erst ein vereinfachtes Szenario, welches zurück auf die Realität abgebildet werden muß, dar. Der folgende Abschnitt wird diese abgebildeten Wissensstrukturen, d.h. kodifiziertes Wissen in Form von Karten, behandeln. Moderne und mittlerweile standardisierte Technologien, wie zum Beispiel die auf XML basierenden ’Topic Maps’, werden anschließend präsentiert und untersucht. 5.4.2 Knowledge Mapping Das Schlüsselwort im Kontext der technischen Implementierung von semantischen Strukturen bildet der vom Bereich der Wissensorganisation bekannte Begriff Knowledge Mapping, welcher in [Sigel 2001], wie folgt, definiert wird: „Knowledge Mapping: Die Kartographierung von Wissen, ein visueller Ansatz der Kodifizierung von Wissen. Kodifizierung dient der internen und externen Identifikation von Wissen.“ [Sigel 2001] Der Begriff des „Mapping“ ist nicht nur als „Kartographieren“ zu verstehen: „Mapping impliziert, dass zur Darstellung von Sachverhalten formale Qualitäten aus der einen Domäne (z.B. Temperatur) mit Hilfe einer anderen (z.B. Farbe) dargestellt werden können.“ [Wrede 2000] 52 Anmerkung des Autors der vorliegenden Arbeit: das Beispiel stellt ein fiktives Szenario dar. Kapitel 5 - WISSENSORGANISATION Seite 103 Für die vorliegende Arbeit stellt aber der Kontext der Themenhierarchien (Funktion und Implementierung) das Wesentliche an einer Wissensdarstellung dar. In [Probst et al. 1999] wird eine Definition von Wissenskarten gezeigt, welche das Interesse der vorliegenden Arbeit auf den Punkt bringt: „Wissenskarten sind allgemein formuliert graphische Verzeichnisse von Wissensträgern, Wissensbeständen, Wissensquellen, Wissensstrukturen oder Wissensanwendungen. Neben der Transparenzerhöhung ermöglichen sie das Auffinden von Wissensträgern oder - quellen, erleichtern sie das Einordnen von neuem Wissen in bestehendes und verbinden Aufgaben mit Wissensbeständen bzw. -trägern. Wissenskarten können je nach ihrer Struktur in unterschiedliche Typen unterschieden werden. Bringt man diese Informationen auf den Computer, strukturiert die Daten nach unterschiedlichen Kriterien und nutzt die technologischen Visualisierungsmöglichkeiten, kann man den Zugriff auf formalisierbare Wissensarten enorm vereinfachen und macht diese zeit- und raumunabhängig für einen großen Personenkreis zugänglich." [Probst et al. 1999] Der Schwerpunkt dieses Abschnitts ist somit Lösungsansätze zu präsentieren, welche die Transparenz der Wissensbestände von großen Unternehmungen über strukturierte Visualisierungmechanismen verbessern. Die von Martin Eppler in [NetAcademy 1999] angegebenen Typen von Wissenskarten sind Quellenkarten (engl.: ’carrier or source maps’), Bestandskarten (engl.: ’asset maps’), Strukturkarten (engl.: ’structure maps’), Entwicklungskarten (engl.: ’development maps’) und Fluß- und Kommunikationskarten (engl.: ’flow and communication maps’). All diese Typen stellen laut [Eppler 2002] graphische Verzeichnisse von Wissensträgern, Wissensbeständen, Wissensstrukturen oder Wissensanwendungen dar. Dabei werden sie in zwei zweckgebundene Kategorien unterteilt: individuelle und kollektive Wissenskarten. Im Folgenden werden die kollektiven Bestands- und Strukturkarten ’Concept Maps’ behandelt, welche konkret der Organisation von kollektivem Wissen dienen und deshalb interessant für den Kontext der vorliegenden Arbeit sind [Eppler 2002]. 5.4.3 Concept Maps Konzeptkarten (engl.: ’Concept Maps) stellen Werkzeuge dar, um Wissensbestände zu organisieren und zu strukturieren [Novak 2002]. Diese Werkzeuge stellen ein spezielles Paradigma und eine spezielle Technologie, mit der man Wissensnetzwerke verwalten kann, dar. Insbesondere kann man damit Wissensstrukturen modellieren. Sie eignen sich besonders gut für das ’Explizitmachen’ von Themenhierarchien für große und geographisch verteilte Unternehmen, denn sie erlauben die praktische Implementierung von fachspezifischen Klassifikationsschemata. Ein Beispiel für eine Konzeptkarte wird in [Abb 5.5] dargestellt. Konzeptkarten stellen, analog zu den im Abschnitt 5.3.3 ’Beziehungsstrukturen’ beschriebenen Semantischen Netzwerken, gerichtete Graphen dar. Die Knoten und Kanten von Konzeptkarten können auch simultan zwei Rollen spielen: einerseits können sie Wissen in ’realen Strukturen’ ausdrücken, und andererseits eine semantische und vernetzte Verbindung zu den Dokumenten darstellen. Die Knoten der Konzeptkarten beinhalten ’Konzepte’ (Fachbegriffe), die Kanten direkte ’Beziehungen’ zwischen zwei Konzepten. Die Knoten können aber auch ’Aussagen’ (engl.: ’propositions’) enthalten, um Interrelationen zwischen Kartensegmenten darzustellen. Konzeptkarten sind Kapitel 5 - WISSENSORGANISATION Seite 104 spezialisierte Begriffsstrukturierungen, welche hierarchisch angeordnet werden (allgemeinere Konzepte befinden sich somit in den oberen Knoten) [Novak 2002]. Die Funktionalität von einfachen Konzeptkarten beschränkt sich auf das Erstellen und Überprüfen von Begriffsstrukturen. Aus diesem Grund werden sie bevorzugt in Lernumgebungen verwendet, um zum Beispiel den Lernenden taxonomische Darstellungen von Konzepten näherzubringen oder Testbeispiele zu erstellen. Abbildung 5.5: Graphische Darstellung einer Concept Map [Novak 2002] Das größte Problem von einfachen Konzeptkarten ist, dass sie keine direkte Beziehung zu den gespeicherten Wissensbeständen erlauben. Hierfür sind erweiterte Eigenschaften notwendig, die einen Zugang zu ’im Hintergrund’ gespeicherten Informationseinheiten erlauben. Im nächsten Abschnitt werden ’Topic Maps’ präsentiert. Diese Art Wissenskarten beinhaltet Beschreibungselemente, welche die Informationsauffindung derart verbessern, dass komplexe Wissensstrukturen semantisch durchsuchbar und navigierbar werden. 5.4.4 Topic Maps Der Begriff Topic Maps ist ein internationaler Standard mit der Kennzeichnung ISO 13250 [ISO-TM 1999]. Dieser internationale Standard stellt eine standardisierte Notation für die Repräsentation von Informationen über die Struktur von Informationsquellen zur Verfügung. Diese Repräsentation ist austauschbar und wird benutzt, um Themengebiete (engl.: ’topics’) und die Beziehungen zwischen Topics zu definieren. „ Eine Menge von einem oder mehreren in Wechselbeziehung stehenden Dokumenten, welche durch diesen Internationalen Standard definiert ist, wird Topic Map genannt.“ [ISO-TM 1999] 53 “A set of one or more interrelated documents that employs the notation defined by this International Standard is called a topic map.” [ISO-TM 1999] 53 Kapitel 5 - WISSENSORGANISATION Seite 105 Im Allgemeinen beinhaltet die strukturelle Information in den Topics: a) ’Vorkommnisse’ (engl.: ’Occurrences’), d.h. Gruppierungen von adressierbaren (engl.: ’addressable’) Informationsobjekten rund um die Topics, und b) ’Assoziationen’ (engl.: ’Associations’) zwischen den Topics. [ISO-TM 1999] Die Basisnotationssprache für Topic Maps ist SGML. Da aber die ’Extensible Markup Language’ eine Teilmenge von SGML ist, kann auch XML als Basisnotation verwendet werden [ISO-TM 1999]. Topics beschreiben einen Themenbereich (Begriff) der realen Welt. Dieser Begriff kann: a) durch den Computer adressierbar sein (z.B. eine Web Page mit einer URL), b) nicht adressierbar sein (z.B. eine Person), oder c) ein abstraktes Objekt darstellen (z.B.: ’Musik’). Ein Topic besitzt zwei Eigenschaften: Namen und Verweise auf Ressourcen im Informationsbestand. Im Standard gliedert sich der Name in drei Teile: Base, Display und Sort Name. Davon muß lediglich der erste vorhanden sein [Rath 1999]. Die Verweise werden Occurrences genannt und zeigen auf Informationseinheiten, welche relevant für das Topic sind. Occurrences besitzen auch einen Typ namens Occurrence Role Type. [Rath 1999]. Occurrences stellen die Verbindung zwischen einem Topic und einer Informationseinheit dar. Dieses ’physikalische Vorkommnis’ kann benutzt werden, um das Objekt anzusprechen oder, um die Art der Relation zwischen Topic und Informationseinheit zu beschreiben. Associations beschreiben Beziehungen zwischen einer Menge von Topics. Die Beziehung hat eine bestimmte Natur (’Type’) und eine bestimmte Rolle (’Role’). Associations können verwendet werden, um zum Beispiel Hierarchien zu modellieren. Eine Association - formal gesehen - stellt einen Verweis, welcher für eine Beziehung (Relation) steht, zwischen zwei oder mehreren Topics dar. Diese Associations haben ebenfalls ein Type, wodurch eine Klassifikation ermöglicht wird. Ein Topic Map Template – was nichts anderes ist als eine Topic Map – kann in einer anderen Topic Map kopiert oder von dieser referenziert werden. Das kopierte Template agiert als Zugangspunkt für die neue Topic Map und beinhaltet alle Themen und Typen, welche für die Entwicklung der neuen Topic Maps notwendig sind. Ein referenziertes Template benutzt die im Internationalen Standard ISO 13250 festgesetzten Fähigkeiten des ’Merging of Topic Maps’ (Verschmelzung oder Fusion von Topic Maps). Dadurch können mehrere Topic Maps durch ein einziges Template referenziert werden. [Rath 1999] Topic Map Templates stellen also Schablonen, die (Rollen-)Einschränkungen oder den konzeptuellen Überbau festlegen, dar [Sigel 2001]. In einer Topic Map können Verweise auf Ressourcen und Assoziationen stets nur für einen bestimmten Anwendungsbereich gültig sein. Mehrfache Bedeutungen müssen explizit ausgeschlossen werden. Jedem Element der Topic Map lässt sich ein eindeutiger Gültigkeitsbereich (scope) zuordnen. Der Scope selbst bezieht sich auf ein Theme (d.h. ein Thema, das den Scope eines anderen Themas oder dessen Eigenschaften einschränkt), und Themes sind wiederum Topics. [Rath 1999] [ISO-TM 1999] Die beliebig erlaubte Kombinierbarkeit der Konzepte für Topic Maps erschließt eine riesige Vielfalt an Implementierungen (z.B. intelligente Inhaltserschließung des Web oder interessante Wissensmodellierungen und -repräsentationen). Topic Maps erzeugen – vor allem im Kapitel 5 - WISSENSORGANISATION Seite 106 unternehmerischen Kontext – neue Geschäftsideen und fördern damit neue Geschäftsfelder, da ihre Erstellung und ihr Austausch unabhängig vom physikalischen Informationsbestand stattfinden. Somit erzielen Topic Maps auch ohne Occurrences einen relativ hohen Wert. [Rath 1999] Die Bedeutung für die Wissensorganisation in transnationalen Konzernen Da Topic Maps dafür geschaffen wurden, kann man mit ihnen alle denkbaren Arten begrifflicher Auffindungsmechanismen (wie z.B. Datenbank-Indizierungen, Buchregister oder Glossare) modellieren und in einer standardisierten, linearisierten Syntax austauschen. [Sigel 2001] Ein ’relativ’ einfach zu implementierendes Beispiel wäre das Exportieren von Klassifikationen in das Topic Map Format. Ein etwas komplexeres Beispiel wäre die Abbildung der Ergebnisse von einer Domänenanalyse oder von neu entstandenen Wissensstrukturen in gemeinsamen Verstehensprozessen. Die Tatsache, dass Topic Maps nicht nur aus Topics (Begriffen) und Assoziationen (Relationen) bestehen, sondern auch aus Vorkommnissen (Occurrences), erklärt ihre Eignung zur Darstellung von semantischen Netzen. [Sigel 2001] Occurrences stellen ebenfalls Instanzen eines Konzepts dar, womit sich qualitative Relevanzgründe darin definieren lassen. Desweiteren lässt sich mit Topics und Assoziationen (z.B. unter Verwendung des Scope-Mechanismus für eine Einschränkung des Gültigkeitsbereichs) eine Konzept-Indexsprache realisieren, mit der man Vorkommen von Ressourcen beschreiben kann. [Sigel 2001] Der wesentlichste Vorteil bei der Anwendung von Topic Maps liegt im hohen Potential der starken Ausdruckskraft von Assoziationen (d.h. von den Beziehungen zwischen den einzelnen Topics). Das Prinzip bei Topic Maps ist die Strukturierung auf einer Meta-Ebene, d.h. die Abbildung von übergeordneten Wissensstrukturen. Dadurch entsteht eine semantisch brauchbare Unabhängigkeit vom Informationsbestand (bestehende Datenquellen müssen nicht umstrukturiert werden), was wiederum das Erstellen von Wissensstrukturen ermöglicht, deren Gültigkeit für alle darunterliegenden Systeme konstant ist. Es gab – und gibt noch immer – kritische Beobachtungen aus dem Bereich des Semantic Web, welche eine Synergie der Arbeiten des ISO und TopicMaps.org an Topic Maps und des W3C an RDF identifizieren wollen. Die Argumentation für eine Zusammenführung beider Standards liegt in der Tatsache, dass in beiden Modellen die Beschreibung von Beziehungen zwischen Einheiten – welche eine Identität aufweisen können – das Hauptziel darstellt. Sollte die Hypothese wahr sein, dann könnte man ein gemeinsames Modell haben, das über Topic Maps oder über ein RDF Modell zugänglich wäre. Die Analyse von Graham Moore in [Moore 2001] überprüft diesen Sachverhalt und kommt zum nachweisbaren Ergebnis, dass sich sowohl RDF Modelle über Topic Maps Konstrukte äquivalent modellieren lassen und ebenso andersherum. Weiters lassen sich die Topic Map Modelle in RDF und umgekehrt RDF Modelle in Topic Map Notation ’mappen’ (’abbilden’). Die Voraussetzung dafür sind vordefinierte ’semantische Topics’. Beide Standards konvergieren also in ihrer Grundfunktionalität, womit der Austausch von semantischen Räumen möglich ist [Moore 2001]. Kapitel 5 - WISSENSORGANISATION Seite 107 Der nächste Abschnitt präsentiert einige Lösungsansätze, um Ontologien bzw. Taxonomien zu erstellen. Alle beschriebenen Mechanismen haben das Ziel, semantische Strukturen für einen effizienten und verbesserten Wissenstransfer und Wissenzugang zu schaffen. 5.4.5 Andere Modelle Unterschiedliche Anstrengungen hinsichtlich der Modellierung von Themenhierarchien, Taxonomien und Ontologien finden heutzutage in vielen Disziplinen statt. Das besondere an jeder Methode ist die unterschiedliche Auslegung der Abstraktionsebenen. Während einige auf Internationale Standards – wie zum Beispiel XML, RDF, SOAP oder Topic Maps – aufbauen, versuchen andere alle Implementierungsebenen (von den Zugriffsmechanismen auf die Informationseinheiten über die Klassifikationssysteme bis hin zu Visualisierung der semantisch gefundenen Struktur) in einer einzigen Applikation zu definieren. Mit den - aus dem Bereich des Wissensmanagements stammenden - ’Knowledge Asset Road Maps’ kann man nicht nur die Organisation, sondern auch die Visualisierung von kritischen Wissensbeständen (engl.: ’knowledge assets’) eines Unternehmens und deren Beziehungen untereinander darstellen [Macintosh et al. 1998]. Das Besondere dabei ist die Einbeziehung der Zeitkomponente. Eine Knowledge Asset Road Map stellt unterschiedliche Wissensbestände zeitkritisch gegenüber und beobachtet deren Verhaltensvariationen über gewisse Zeitabschnitte. Knowledge Asset Road Map sind somit ‘strategische’ Modellierungen von Wissenbeständen. Das Caiman System für ’Ontology Mapping’ basiert auf der Definition von beliebig konfigurierbaren Ontologien und der zur Verfügung gestellten Caiman Services [Lacher et al. 2001].Caiman soll den transparenten Austausch von relevanten Dokumenten einer geographisch verteilten Interessengemeinschaft unterstützen und bedient sich hierfür speziell entwickelter Mapping Algorithmen. Aus der Sicht des Benutzers stellt Caiman zwei Hauptdienste zur Verfügung [Lacher et al. 2001]: a) Die ’Publikation von Dokumenten’ erfolgt aus der Zuordnung des Dokuments zu einer Konzeptklasse (durchgeführt durch den Autor des Dokuments) und der Nachricht an die gesamte Gemeinschaft, damit die Klassifikation überprüft und bestätigt wird. b) Das ’Auffinden von in Beziehung stehenden Dokumenten’ erfolgt entweder auf Klassen- oder auf Dokumentenebene. Die Auffindung auf Dokumentenebene entspricht den traditionellen Mechanismen des Information Retrieval. Bei der Auffindung auf Klassenebene kann der Benutzer ein Klassenkonzept aussuchen. Das System analysiert somit alle mit der Klasse in Beziehung stehenden Dokumente und liefert die Menge all jener, die noch nicht in der persönlichen Ontologie referenziert sind. Der in [Helic et al. 2001] vorgestellte Mechanismus von ’Knowledge Domain Schemata’ erlaubt (unter anderen) die Suche von Wissenseinheiten und die Navigation durch Wissensstrukturen auf Metadatenebene. Das System basiert hier wiederum auf der Trennung von Inhalt und Struktur des System, wobei über Beziehungen ’Semantische Kategorien’ definiert werden. Kapitel 5 - WISSENSORGANISATION Seite 108 Eine weitere Möglichkeit der Modellierung von semantischen Strukturen stellen Mechanismen auf der Basis von Ontologieprinzipien, wie zum Beispiel OIL54 (’Ontology Inference Layer’) dar. Bezüglich der verwendeten Technologien lassen sich auch unterschiedliche Lösungsansätze für Klassifikation und Auffindung identifizieren. So ist zum Beispiel die ’Q-Technologie’ (Quantor-Technologie) eine formale Sprache zur Darstellung und Verarbeitung der Semantik quantitativer Informationen. Das dazugehörige Konzept heißt ’Q-Kalkül’ und basiert auf der Synthese terminologischer Konzepte zur Repräsentation und auf stochastischen Verfahren zu deren Auswertung [NetAcademy 1999]. Die ’Networked Knowledge Organization Systems/Services’-Arbeitsgruppe (NKOS Working Group) ist für die Entwicklung von VocML (’Vocabulary Markup Language’) zuständig. VocML ist ein XML DTD/Schema, welches die strukturierte Repräsentation von vielen KOSRessourcen (Quellen von ’Knowledge Organizational Systems’), wie zum Beispiel Authority Files, hierarchischen Thesauri, Klassifikationssystemen, digitalen Gazetteers und Subject Heading Lists, erlaubt. [Cover 2000] Es sei an dieser Stelle darauf hingewiesen, dass viele Synonyme für Concept Maps identifiziert wurden (z.B.: Structured Maps, Conceptual Maps, Knowledge Maps, Kmaps, Web Maps, Cognitive Maps, Cognitive Structures, Self Organizing Maps, Associative Maps). Synonyme im Kontext des Ziels, nämlich des funktionalen Ziels, d.h. begriffliche Auffindungsmechanismen und Strukturen zu modellieren. Besonders interessant für große und geographisch verteilte Unternehmen wäre die Möglichkeit von mehrdimensionalen Sichtweisen zum Zweck einer semantisch verbesserten Informationsauffindung (z.B. für Suche, Klassifizieren von Wissenseinheiten, Personalisierung von Informationen, usw.). Nachfolgender Abschnitt beleuchtet die Grundlagen dieser Aufgabenstellung. 5.4.6 Mehrdimensionale Ansätze Das Thema dieses Abschnitts ist die Untersuchung von gegebenen technologischen Möglichkeiten, um Wissenseinheiten über unterschiedlichen Mechanismen semantisch zu organisieren, konzeptuell zugänglich zu machen und bedarfsgerecht strukturiert dem Benutzer zu präsentieren. Speziell für große und geographisch verteilte Unternehmen ergibt sich die Notwendigkeit der Konzeption eines Mechanismus, welcher eine semantische Informationsaufbereitung und eine dynamische Wissensorganisation ermöglicht, um in der Lage zu sein, die verteilte Organisationsstruktur über kontrollierte Vokabulare ziel-, orts- und bedarfsgerecht zu erreichen. Es geht hier darum, unterschiedliche Zugangsstrukturen bzw. –mechanismen so zu implementieren, dass dem Benutzer lediglich den für ihn relevanten Teil des Unternehmensgedächtnisses zur Verfügung gestellt wird, um eine themenspezifische Aufgabe zu lösen. Verschiedene, aber parallel implementierte Organisationssysteme (wie etwa mehrere Klassifikationsschemata oder Thesauri) stellen unterschiedliche Sichtweisen bzw. 54 http://www.ontoknowledge.org/oil Kapitel 5 - WISSENSORGANISATION Seite 109 Zugangsmöglichkeiten auf das Wissensangebot des Informationssystems dar. Solche unterschiedlichen Darstellungsmöglichkeiten durch verschiedene Organisationssysteme werden hier Dimensionen genannt. Das in [Abb. 5.6] präsentierte Szenario stellt den oben beschriebenen Sachverhalt dar. Mehrdimensionale, konzeptuell angeordnete Sichtweisen können zum Beispiel durch die Themenhierarchien der unterschiedlichen Klassifikationsschemata dargestellt werden. Das Informationssystem eines transnationalen Konzerns wird einerseits durch das ’echte’ verteilte Organisationsgedächtnis (VOG), welches im Idealfall das gesamte intellektuelle Kapital umfaßt (in [Abb. 5.6] der Einfachheit halber als explizites Wissen mit Dokumentenicons veranschaulicht), und andererseits durch die transparent verwaltete Struktur der Wissensbank (in [Abb. 5.6] ’transparentes Organisationsgedächtnis’ benannt und durch gutes Informationsbzw. Datenmanagement lösbar) dargestellt. Die unterschiedlichen Sichtweisen ergeben sich aus dem durch die unterschiedlich facettierten Themenhierarchien (in [Abb. 5.6] als Klassifikationsysteme dargestellt) kodifizierten Wissen. Damit erhält der Benutzer - auf eigenen Wunsch – die Visualisierung des für ihn relevanten Informationsraums, und zwar gleich auf kontextuelle und themenspezifische Weise. Weiters kann der Benutzer beispielsweise innerhalb dieses semantisch eingeschränkten Raumes navigieren und suchen. Abbildung 5.6: Mehrdimensionale Sichtweisen in einem Informationssystem für große und geographisch verteilte Unternehmen über unterschiedlich facettierte Themenhierarchien Grundsätzlich werden vom Autor der vorliegenden Arbeit mehrere Lösungsansätze identifiziert. Empfehlenswert sind alle Technologien, welche auf international geltenden Standards basieren und deshalb eine nachhaltige Effizienz und Konsistenz gewährleisten (siehe hierzu die Abschnitte 5.4.1 bis 5.4.5). Kapitel 5 - WISSENSORGANISATION Seite 110 Bezüglich der Methoden zur technischen Implementierung des vorgestellten Szenarios lassen sich keine konkreten Aussagen erstellen, weil das in [Abb. 5.6] dargestellte Szenario nicht unbedingt mehrere Schichten enthalten muss. Damit kann man wahlweise eine mehrschichtige (durch die parallele Anordnung von unterschiedlichen Organisationssystemen vor dem dahinterliegenden Organisationsgedächtnis) oder eine planare Lösung (z.B. durch semi- oder vollautomatische Clustering Mechanismen) implementieren. Eine hybride Methode, wie zum Beispiel durch den Einsatz von effizienten Clustering Mechanismen - welche mehrere semantische Kriterien kennt - in Verbindung mit einer entsprechend mächtigen Komponente für die Visualisierung vom Clustering Ergebnis, kann durchaus in der Lage sein die in [Abb. 5.6] präsentierte Aufgabenstellung technisch zu lösen. Eine Alternative zum einschichtigen Modell wäre die Anwendung von regelbasierten Organisationssystemen. Ein in Regeln verpackte Darstellung von unterschiedlichen Themenhierarchien könnte über ein spezielles Algorithmus eine kontextuell eingeschränkte Informationsauffindung ermöglichen. Mehrschichtige Techniken, wie zum Beispiel von OIL oder dem Caiman System unterstützt, sind ebenfalls in der Lage durch Dynamisches Ontologisches Mapping (siehe Abschnitt 5.4.5) diese Aufgabe lösen. Bezüglich einer Wissensorganisation in unterschiedlichen terminologischen Strukturen können alle im Abschnitt 5.3.1 ’Typen von Organisationssystemen’ beschriebenen Möglichkeiten zu einer mehrschichtigen Lösung der Aufgabenstellung herangezogen werden. Die Vor- und Nachteile wurden im Abschnitt 5.3 ’Organisationssysteme’ präsentiert, wodurch es von einer sehr konkret definierten Aufgabenstellung abhängen wird, welches Schema am besten die Anforderungen des Systems erfüllt. Eine weitere gute Möglichkeit, um eine eingenständige, mehrschichtige und semantische Zwischenkomponente zu implementieren, wäre die Verwendung von Topic Maps. Wie in [Sigel 2000] auch identifiziert, erlauben Topic Maps die Implementierung von ’mehrfach-Sichten auf Wissensbestände in speziellen Domänen’. Demzufolge kann man zum Beispiel den ’Scoping’Mechanismus von Topic Maps nutzen, welcher die bemerkenswerteste Eigenschaft bezüglich Multidimensionalität repräsentiert, um eine facettierte Struktur zu entwerfen. Diese besondere Fähigkeit von Topic Maps, mehrere unabhängige Sichten über Ressourcen legen zu können, stellt sicherlich ein sehr vorteilhaftes Werkzeug im Bereich der dezentralen Inhaltserschließung zur Verfügung. Solche Sichten können die Qualität der Erschließung erhöhen, wenn man die Topic Maps - zum Beispiel - auf bekannte Bedarfsprofile einer Benutzergruppe adaptiert. Fazit Wie aus den oben geschilderten Lösungsmöglichkeiten entnommen werden kann, läßt sich keine konkrete Aussage darüber machen, welche Methode die in [Abb. 5.6] dargestellte Aufgabenstellung am besten lösen kann. Es müssten im Zuge intensiver Consultingtätigkeiten und Diskussionsprozessen mit dem Kunden spezifische Anforderungen identifiziert und formuliert werden, um eine korrekte Auswahl der zu implementierenden Technologie treffen zu können. Im nächsten Abschnitt werden einige der aus diesem Kapitel - insbesondere für große und geographisch verteilte Unternehmen - gewonnenen Erkenntnisse zusammengefaßt, womit der Untersuchungsbereich der vorliegenden Arbeit abgeschlossen wird. 5.5 Schlußbemerkung Dieses Kapitel befaßte sich mit den, von unterschiedlichen Bereichen zur Verfügung gestellten Mechanismen, um ein effizientes semantisches Retrieval, d.h. das präzise Auffinden relevanten Wissens aufgrund definierter semantischer Relationen [Sigel 2000], und ein kontextabhängiges Kapitel 5 - WISSENSORGANISATION Seite 111 Navigieren durch Themenhierarchien in verteilten Informationssystemen für transnationale Konzerne zu ermöglichen. Der in [Pepper 2000] angegeben Spruch ’ein Buch ohne Verzeichnis ist wie ein Land ohne Landkarte’ 55 trifft die Problematik der Wissensorganisation für transantionale Unternehmen auf den Punkt. Für die optimale Suche eines Begriffs (Konzepts) in einem großen und komplexen Buch bzw. das Finden einer optimalen geographischen Strecke (z.B. in einem fremden Land) sind ’kartographierte’ Strukturen unumgänglich. Demzufolge benötigt ein umfangreiches und komplexes Informationssystem die effiziente, übersichtliche und semantisch organisierte Repräsentation der Topologie von dem Unternehmensgedächtnis. Dem Bericht von [Maier et al. 2000b] zufolge, welcher einen Überblick über die grundlegenden Konzepte und Theorien im Bereich Wissensmanagementsysteme gibt, lassen sich bestehende Klassifikationsansätze für Wissensmanagementsysteme identifizieren. Diese Aufzählung gibt unterschiedliche Funktionsbereiche wieder und ordnet Wissensmanagementsysteme einem bestimmten Bereich zu. Die für dieses Kapitel relevanten Punkte in Zusammenhang mit Informationsaufbereitung und Wissensorganisation - vor allem im Kontext transnationaler Konzerne - werden wie folgt aufgelistet 56: Wissenssuche (’Pull’): Schlagwortsuche; Navigation von Kategorien in Wissensgebieten; Einschränkung von Wissensquellen und Themen; Benutzerprofile, Suchunterstützung/Suchassistent, Meta-Suchsystem für gleichzeitige Suche in internen Wissensquellen gleichen Formats; Thesaurus und Synonyme; Anzeige neuer bzw. ungelesener Dokumente (=Dokumente, die neu in das System kommen). Wissenspräsentation und –visualisierung: Relevanzüberprüfung von gefundenen Wissenseinheiten; Präsentation von ’nicht gesuchten’ Wissenseinheiten oder Suchbegriffen (’Wer x sucht, sucht auch y!’); integrierte Darstellung der Wissenseinheiten in Wissenskarten; Darstellung der ’semantischen Nähe’ zwischen Wissenseinheiten (semantische Netzwerke). Wissenspublizierung, -strukturierung und –vernetzung: Publikation von vorstrukturierten Inhalten; Publikation von nicht vorstrukturierten Inhalten (formatfrei); Indizierung, Einordnung und Vernetzung von publizierten Inhalten; Erstellung und Strukturierung von Wissensgebieten bzw. –clustern; automatische Einordnung und Vernetzung von publizierten Inhalten; semantische Analyse von Wissenseinheiten; Hyperlinks oder Vernetzung von publizierten Dokumenteninhalten; direkte Navigation von einer Wissenseinheit zu beispielsweise einem Autor, einem Experten oder einer Interessengemeinschaft. Wissenseinbringung: Einbringung von Wissenseinheiten aus externen Wissensquellen; automatische Übernahme von Wissenseinheiten aus externen Wissensquellen; automatische Generierung von Wissenseinheiten aus unternehmensinternen Datenquellen (z.B. Erstellung von Reports aus Produktionsdatenbanken). [Maier et al. 2000b] Klassifikationsexperten und Spezialisten im Bereich des Information Retrievals, aber auch Bibliothekare und Wissensorganisatoren identifizieren das hohe Potential von Klassifikationsschemata, um den konzeptualisierten Informationszugang zu verbessern. Eine gemeinsame (unternehmensweite) Klassifikationssprache erleichtert die terminologische „… a book without an index is like a country without a map“. [Pepper 200] Anmerkung des Autors der vorliegenden Arbeit: Die Liste beschränkt sich auf die Punkte, welche auch als Problemaspekte aufgefaßt und durch die in diesem Kapitel behandelten Mechanismen gelöst werden können 55 56 Kapitel 5 - WISSENSORGANISATION Seite 112 Zusammenarbeit und den Datenaustausch. Solche Fachterminologien zeichnen sich zum Beispiel durch die hohe Präzision, Sprachdifferenzierung und Korrektheit aus. Ob nun ein universelles oder ein selbstdefiniertes Klassifikationsschema bzw. eine andere begriffliche Struktur angewendet wird, hängt von den spezifischen Anforderungen der Unternehmung an das zu implementierende wissensbasierte Informationssystem ab. Zusammenfassend läßt sich feststellen, dass die Mechanismen der Wissensorganisation nicht alleine ausreichen, um alle spezifischen Anforderungen erfüllen zu können. Einige der im Untersuchungsbereich geschilderten Methoden und Technologien wurden direkt zur technischen Umsetzung eines Informationssystems für einen im übernächsten Kapitel anonymisiert dargestellten transnationalen Konzern implementiert. Im nächsten Kapitel wird zunächst der Versuch unternommen, ein allgemeines Konzept zur Gestaltung eines wissensbasierten Informationssystems so zu entwerfen, dass alle bisher besprochenen kritischen Aspekte von einem einzigen Arbeitsmodell erfasst und analysiert werden können. Teil II - GESTALTUNGSBEREICH Seite 113 Teil II GESTALTUNGSBEREICH Teil II - GESTALTUNGSBEREICH Seite 114 Kapitel 6 - LÖSUNGSVORSCHLAG Seite 115 Kapitel 6 Lösungsvorschlag Die gewonnenen Erkenntnisse aus dem Untersuchungsbereich (Kapitel 2 bis 5) der vorliegenden Arbeit führten zur Identifikation von kritischen Aspekten bei der Konzeption eines wissensbasierten Informationssystems für große und geographisch verteilte Unternehmen. Diese Aspekte lassen sich in die Hauptpunkte ’verteilte Administration und transparenter Fluß der Informationseinheiten’ sowie ’Internationalisierung und komplexe Organisationsstruktur der Unternehmung’ zusammenfassen. Einerseits zeigen die im Untersuchungsbereich analysierten Hauptdisziplinen57 unterschiedlich starke Einflüsse auf diese Hauptpunkte, und andererseits sind sie zu verschiedenen Zeitpunkten der Systemgestaltung involviert. Sie bestimmen deshalb abwechselnd oder simultan - die Entscheidungskriterien auf der Suche nach Lösungen spezifischer Aufgaben. Um die Auswirkungen aller Faktoren auf übersichtliche Weise zu analysieren, wird in diesem Kapitel ein erster Lösungsvorschlag, der als allgemeines Gestaltungsmodell zur Konzeption eines wissensbasierten Informationssystems für transnationale Konzerne Anwendung finden kann, erarbeitet. Im ersten Schritt (Unterkapitel 6.1 ’Grundanalyse zur Konzeption eines allgemeinen Lösungsmodells’) werden besondere Merkmale der Hauptdisziplinen, sowie die eines Informationssystems untersucht und gegenübergestellt. Das Ziel der Grundanalyse ist, die Einflußfaktoren auf den Lösungsvorgang in einem einzigen Arbeitsmodell so zu erfassen, dass eine ganzheitliche Betrachtungsmöglichkeit für die technische Konzeption ermöglicht wird. Hierfür wird der Analysevorgang nach allgemein geltenden Wirkungsbereichen58 eingeteilt (Abschnitt 6.1.1 ’Wirkungsbereiche der Analyse’). Die gemeinsame Betrachtung dieser Wirkungsbereiche bildet somit die Basis eines allgemeinen Arbeitsmodells (Abschnitt 6.1.2 ’Arbeitsmodell zur allgemeinen Sichtweise der Lösung’). Weiters wird durch die Einführung und Untersuchung des Begriffs ’Informationsfluß’ der Hauptparameter zur Beschreibung der Dynamik eines Informationssystems festgelegt (Abschnitt 6.1.3 ’Informationsfluß’). Zusätzlich werden im Abschnitt 6.1.4 spezielle Sichtweisen des Informationssystems aus den Blickpunkten Mensch, Standort und Inhalt untersucht . Im zweiten Schritt sollen die aus der Grundanalyse resultierenden Modellvorstellungen (Wirkungsbereich, Arbeitsmodell, Informationsfluß, Blickpunkt) dem Entwurf eines technischen Grundkonzepts dienen (Unterkapitel 6.2 ’Technisches Gestaltungsmodell zur Konzeption eines wissensbasierten Informationssystems’). Das Lösungsmodell selbst besteht aus zwei Teilen: einem strategischen und einem technischen Schema. Es wird ein grundlegendes Schema vorgestellt, um die Zusammenhänge zwischen Arbeitsmodell und Sichtweisen auf einen gemeinsamen Nenner zu bringen (Abschnitt 6.2.1 ’Teil 1: Grundlegendes Schema’). Der Informationsfluß fungiert im gesamten Gestaltungsmodell einerseits als Brückenelement zwischen Strategie und Technik, und andererseits als unsichtbare Kontrolleinheit des Informationssystems. Das aus diesen Überlegungen resultierende technische Schema (Abschnitt 6.2.2 ’Teil 2: Funktionales Schema’) beschreibt die wichtigsten Struktur- Anmerkung des Autors der vorliegenden Arbeit: Der Begriff ’Hauptdisziplinen’ umfaßt - im Kontext der vorliegenden Arbeit - die in den vorangegangenen Kapiteln behandelten Fachgebiete Wissensmanagement, Informationsmanagement, Datenmanagement und Wissensorganisation. Mit dem allgemeineren Begriff ’Disziplinen’ werden alle anderen untersuchten Gebiete und Subgebiete – zum Beispiel Information Retrieval, Distributed Systems, Library Science, u.a. - miteinbezogen. 58 Wirkungsbereich: engl. ’scope of impact’. 57 Kapitel 6 - LÖSUNGSVORSCHLAG Seite 116 und Funktionskomponenten, wodurch ein Gerüst für das Gestaltungsmodell wissensbasierten Informationssystems für transnationale Konzerne gegeben wird. eines Schließlich soll die Zweckmäßigkeit des technisches Gestaltungsmodells in die Praxis umgesetzt werden. Die praktische Anwendung des Lösungsvorschlags wird anhand einer umfassenden Liste von spezifischen Anforderungen gezeigt (Abschnitt 6.2.3 ’Anforderungen eines transnationalen Konzerns an ein wissensbasiertes Informationssystem’). Hierbei werden alle aus dem Untersuchungsbereich der vorliegenden Arbeit erkannten Problembereiche (kritischen Aspekte) berücksichtigt und je einem bestimmten Wirkungsbereich zugeordnet (unter Verwendung des Grundlegenden Schemas). Die Anforderungen werden - im Abschnitt 6.2.4 ’Anforderungsprofil für eine iterative Lösungsmethode’ - mit Hilfe des funktionalen Schemas in eine Arbeitstabelle überführt, wodurch die Beziehungen zu den unterschiedlichen Komponenten des Schemas aufgezeigt werden können. Das Ziel dieser Vorgehensweise ist die Erkennung der Einflüsse von Disziplinen auf die unterschiedlichen Teilprobleme und deren Zusammenhänge mit den Komponenten des funktionalen Schemas. Der größte Vorteil hierbei besteht darin, dass erstens, durch die iterative Betrachtung des Gesamtproblems (laut Anforderungsprofil) und zweitens, durch die eindeutige Zuordnung von Teilproblemen zu spezialisierten Komponenten des funktionalen Schemas, auf technische und taktische Feinheiten der Gesamtkonzeption geschlossen werden kann. Alle im ’Gestaltungsbereich’ (Kapiteln 6 bis 8) der vorliegenden Arbeit dargestellten Schlußfolgerungen, Vorschläge und Definitionen basieren auf den vom Autor der vorliegenden Arbeit gewonnenen Erfahrungen, seinen aus dem Untersuchungsbereich gewonnenen Erkenntnissen, sowie auf dem wertvollen Wissensaustausch und der praktischen Zusammenarbeit mit den Mitgliedern der WAG59 am Institut für Informationsverarbeitung und Computergestützte neue Medien (IICM) der Technischen Universität Graz. 6.1 Grundanalyse zur Konzeption eines allgemeinen Lösungsmodells Um eine ganzheitliche Analyse aller Einflüsse der in den vorangegangenen Kapiteln präsentierten Disziplinen auf ein wissensbasiertes Informationssystem zu ermöglichen, gilt es zunächst Gemeinsamkeiten und Zusammenhänge zu finden. Das heißt, es muß in erster Linie ein gemeinsamer Untersuchungsraum hergestellt werden, in dem alle Disziplinen Gültigkeit und Anwendung haben. Hierfür muß ein Arbeitsmodell erarbeitet werden, um eine übersichtliche Betrachtung der Auswirkungen von den Hauptdisziplinen auf die Konzeption des Informationssystems zu erhalten. 6.1.1 Wirkungsbereiche der Analyse Aus den Fakten der im Rahmen der vorliegenden Arbeit durchgeführten Recherche (Kapitel 2 bis 5) und den daraus gewonnenen Erkenntnissen, sowie aus den praktischen Erfahrungen nach der technischen Konzeption eines wissensbasierten Informationssystems für einen transnationalen Konzern – anonymisiert dargestellt im nächsten Kapitel - ergibt sich die sinnvolle Einteilung eines Arbeitsraums in folgenden ’Wirkungsbereichen’: Organisation: Einordnung aller planenden, kontrollierenden, steuernden, strategischen und operativen Maßnahmen zur Festlegung der allgemeinen Lösungsstrategie. ’Web Applications Group’: Forschungs- und Entwicklungsgruppe am Institut für Informationsverarbeitung und Computergestützte neue Medien (IICM) der Technische Universität Graz, Österreich. 59 Kapitel 6 - LÖSUNGSVORSCHLAG Seite 117 Inhalt und Semantik: Maßnahmen, um Qualität Informationseinheiten und deren Inhalte zu steigern. Technik: Gestaltung und Implementierung des technischen Szenarios. und Bedeutung von Die somit festgelegten Bereiche dienen während des nachfolgenden Analysevorgangs als Parameter, um gemeinsam einen ganzheitlichen Arbeitsraum aufzuspannen. Weiters fassen diese Wirkungsbereiche die wichtigsten Tätigkeits- und Zielbereiche der untersuchten Hauptdisziplinen zusammen, und können deshalb zu einer geordneten Beschreibung der Konzeption eines wissensbasierten Informationssystems für transnationale Konzerne beitragen. Wirkungsbereich Organisation Unter Organisation wird der Bereich, welcher ’unternehmerischer Ebene’ umfaßt, verstanden. insbesondere die Tätigkeiten auf Die Organisation behandelt strategisch und operativ die globalen Ziele, Geschäftsprozesse und Kompetenzen der Konzerneinheiten. Innerhalb dieses Bereichs werden zum Beispiel die global und lokal geltenden unternehmensspezifischen Systemanforderungen, die allgemeinen Aufgabenprioritäten, die technischen Bedürfnisse und Potentiale der Konzernunterbereiche, die Rollen der Benutzer, die Intranetstrategie, usw. analysiert und festgelegt. Dieser Wirkungsbereich liefert somit einen Arbeitsrahmen, der als Grundlage für die semantische Inhaltserschließung und für die technologische Lösung verwendet werden kann. Wirkungsbereich Inhalt & Semantik Über den Wirkungsbereich Inhalt & Semantik wird das semantische Szenario erkannt und die Kriterien zur Implementierung der technischen Komponenten festgelegt. Inhalt soll als die Menge aller Informationseinheiten, welche das Intranetangebot ausmacht, verstanden werden. Aus der Sicht des Wissensmanagements könnte man diesen Bereich für die Festlegung der Struktur und Funktionalität des Organisationsgedächtnisses bzw. des Intellektuellen Kapitals anwenden. Unter Semantik werden hier alle Mechanismen verstanden, die auf irgendeine Weise den Wissenseinheiten eine spezifische Bedeutung hinzufügen und diese verwalten. Weiters soll der Wirkungsbereich Inhalt & Semantik nicht nur die Problematik der Bedeutungsdefinition erfassen, sondern auch spezifische Darstellungskriterien für Zugangs- und Auffindungsmechanismen, welche erst das semantische Modell technisch realisierbar machen (z.B. Navigation, Modellierung, Mapping, u.ä.), definieren. Dieser Wirkungsbereich ist also für die unternehmenspezifische Zielsetzung, Zweckbestimmung und Qualitätserhaltung des semantischen Inhalts der Intranetumgebung verantwortlich. Wirkungsbereich Technik Der Wirkungsbereich Technik umfaßt alle technischen Maßnahmen, um die reibungslose Implementierung (Kodifizierung) des Informationssystems zu gewährleisten. Hier wird das technische Szenario spezifiziert, analysiert, eventuell angepaßt, implementiert und getestet. Typische Entscheidungen über den Wirkungsbereich ’Technik’ sind beispielsweise: Festlegung der zu verwendenden Tools, Ausmaß der Verteilung des Systems (verteilte Architektur, zentralisierte Architektur oder eine integrierte Variante), Kriterien zur Datenreplikation, Spezifikation der Schnittstellen, technische Lösung für die Wissensvisualisierung, Lösung für Datenbankanbindungen, Auswahl der Standards und Formate, und ähnliches. Kapitel 6 - LÖSUNGSVORSCHLAG Seite 118 Deutung der Wirkungsbereiche Das Zusammenspiel der oben beschriebenen Bereiche wird in [Abb. 6.1] graphisch dargestellt. Diese Abbildung soll lediglich eine geometrische Repräsentation des von den Wirkungsbereichen Organisation, Inhalt & Semantik und Technik aufgespannten Raumes verdeutlichen. Organisation Blickrichtung Technik Inhalt & Semantik Abbildung 6.1: Wirkungsbereiche zur Analyse eines wissensbasierten Informationssystems Um die Deutung des somit definierten Arbeitsraumes näher zu bringen, kann man sich die Beziehung von je einem Punkt auf den Achsen der dreidimensionalen Darstellung in [Abb. 6.1] als ein Kraftfeld vorstellen (Anm.: betrachtet unter dem dort angezeichneten Blickwinkel). Im Kraftfeld - graphisch dargestellt im linken Teil von [Abb. 6.2] - werden die drei Wirkungsbereiche als äquidistante Punkte positioniert. Im Idealfall, d.h. die Wirkungsbereiche sind mit der gleichen Kraft60 versehen, spannen sie ein homogenes Feld auf. In der Praxis würde dies einfach heißen, dass alle drei Wirkungsbereiche gleichwertig bzw. mit gleicher Priorität berücksichtigt werden. Homogener Zustand des Arbeitsraumes 2 1 2 1 4 3 3 1. Organisation 2. Inhalt & Semantik 3. Technik 4. Zu lösendes Problem Abbildung 6.2: Deutung der Wirkungsbereiche ’Organisation’, ’Inhalt & Semantik’ und ’Technik’ als Kraftfeld (links im Ruhezustand, rechts nach Hinzufügen eines Problems) Nun wird ein beliebiger Aspekt (Teilproblem) des Informationssystems entlang der Blickrichtung – wie im rechten Teil von [Abb. 6.2] dargestellt - gelegt. Der homogene Zustand 60 Anmerkung des Autors der vorliegenden Arbeit: Die Linien in [Abb. 6.2] sind mit den Feldlinien eines elektromagnetischen Feldes vergleichbar. Die Dichte der Linien an einem beliebigen Punkt stellt somit die Stärke des Wirkungsfeldes dar. Kapitel 6 - LÖSUNGSVORSCHLAG Seite 119 des Wirkungsfeldes führt dazu, dass die Aufgabenstellung unter ’idealen’ Bedingungen gelöst werden kann. Werden aber zur Problemlösung die Schwerpunkte nicht gleichmäßig verteilt, so entsteht nach obiger Deutung ein defektes bzw. gestörtes Wirkungsfeld. Als Beispiel hierfür sei der Fall betrachtet, dass die Analyse und Konzeption des Informationssystems zwar unter einem relativ großen ’organisatorischen, inhaltlichen und semantischen’ Aufwand stattfindet, die technischen Gegebenheiten und Auswirkungen aber vernachlässigt werden. Der somit resultierende ’gestörte’ Arbeitsraum wird im oberen Teil von [Abb. 6.3] dargestellt. Es sei an dieser Stelle darauf hingewiesen, dass in der Praxis meist der umgekehrte Fall auftritt. Dies bedeutet, dass meist vorgefertigte technische Lösungen eingesetzt werden, sodass die genauso wichtigen organisatorischen (unternehmerischen), semantischen und inhaltlichen Schwerpunkte in den Hintergrund treten. Wie im unteren linken Teil der Abbildung dargestellt, wird wieder ein beliebiges Problem untersucht (hinzugefügt). Technische Aspekte des Informationssystems wurden im betrachteten Beispielsfall so sehr vernachlässigt, dass die technische Implementierung des Systems nicht die erwarteten Anforderungen erfüllen kann. Falls aber das Fehlverhalten ’relativ früh’ erkannt wird, müsste man im Nachhinein der Technik absoluter Priorität verleihen. Der somit korrigierte Zustand – wie unten rechts in [Abb. 6.3] dargestellt – wird nur mit sehr hohem Gesamtaufwand (Kosten, Zeit, Ressourcen, usw.) realisierbar sein. Gestörtes System Falsche Problembetrachtung Korrigiertes System Abbildung 6.3: Nicht ausgeglichener Zustand der Problembehandlung aufgrund fehlender Berücksichtigung eines Wirkungsbereichs (gestörtes System) Die oben beschriebene Deutung der Wirkungsbereiche als Kraftfeld wurde in Kontext dieser Arbeit deshalb gewählt, weil nur so wirklich ersichtlich wird, welcher hohe Stellenwert die gleichwertige Betrachtung von organisatorischen, inhaltlichen, semantischen und technischen Einflüsse auf die Konzeption des Informationssystems hat. Es sei an dieser Stelle ebenfalls klargestellt, dass obige Betrachtung eines Systems lediglich eine Abstraktion des Analysevorgangs darstellt. Um mit den Wirkungsbereichen in der Praxis umgehen zu können, ist nicht ihr Potential bzw. Intensität von Bedeutung, sondern ihre Reichweite bezüglich des zu lösenden Gesamtproblems. Die am Anfang dieses Abschnitts gegebenen Definitionen der Wirkungsbereiche stehen in starker Verbindung mit den Hauptfunktionen und Zielsetzungen der Hauptdisziplinen, wodurch sich viele Gemeinsamkeiten und Überlappungen ergeben. Diese Erkenntnis kann als Grundlage Kapitel 6 - LÖSUNGSVORSCHLAG Seite 120 zur Veranschaulichung der Reichweite aller Einflüsse herangezogen werden. Dies bedarf allerdings der Festlegung eines konkreten Modells, um die Zusammenhänge zwischen Hauptdisziplinen und Wirkungsbereichen zu verdeutlichen. 6.1.2 Arbeitsmodell zur allgemeinen Sichtweise der Lösung Um die Einflüsse der Hauptdisziplinen bezüglich der bereits definierten Wirkungsbereiche zu verdeutlichen, wird in diesem Abschnitt ein spezifisches Betrachtungsmodell festgelegt. Zunächst soll aber an einige wesentliche Merkmale der Hauptdisziplinen erinnert werden. Aus technischer Sicht besitzen sie jeweils unterschiedliche Schwerpunkte, welche auf folgende Weise zusammengefasst werden können: Wissensmanagement orientiert sich auf die Erfassung und allgemeine Verwaltung des Intellektuellen Kapitals. Somit ist Wissensmanagement auf Erfahrungswerte gebunden und analysiert ständig Vergangenheit und Gegenwart, um Prognosen zu erstellen bzw. zukunftsorientierte Entscheidungen zu treffen. Informationsmanagement nutzt meistens die technologische Infrastruktur, um eine effiziente, effektive und insbesondere eine transparente Verwaltung der Informationsbzw. Wissenseinheiten zu garantieren. Wissensorganisation baut begriffliche Beziehungsgeflechte zwischen den Datenbeständen und modelliert Mechanismen, um den Benutzern stets bedarfgerechtes relevantes Wissen zur Verfügung zu stellen. Datenmanagement löst hauptsächlich die technischen Aspekte der Datentechnik und der Kodifizierung der Informationseinheiten. Um alle Anforderungen eines wissensbasierten Informationssystems für große und geographisch verteilte Unternehmen auf systematische und effiziente Weise darstellen zu können, wird mit Hilfe der Wirkungsbereiche ein ’Arbeitsmodell zur allgemeinen Sichtweise der Lösung’ entworfen. Dieses Arbeitsmodell wird in [Abb. 6.4] graphisch dargestellt. DM IM WO Technik Inhalt & Semantik WM Organisation Anfangszustand des Systems Abbildung 6.4: Arbeitsmodell zur allgemeinen Sichtweise der Lösung. Flächeninhalte: anteilsmäßiger Umfang der Wirkungsbereiche ’Organisation’, ’Inhalt & Semantik’ und ’Technik’. Links: zugeordnete Reichweite der Hauptdisziplinen Wissensmanagement (WM), Informationsmanagement (IM), Datenmanagement (DM), Wissensorganisation(WO). Kapitel 6 - LÖSUNGSVORSCHLAG Seite 121 Die graphische Darstellung in [Abb. 6.4] ist nicht der Versuch, eine strenge Unterscheidung zwischen den Hauptdisziplinen herzustellen, sondern eher einen Überblick zu verschaffen, um die Einflüsse, Zusammenhänge und Interaktionen zwischen Wirkungsbereichen und Hauptdisziplinen erkennbar zu machen. Das Arbeitsmodell stellt also den Versuch dar, die Eigenschaften der Hauptdisziplinen mit Hilfe eines gemeinsamen Raumes zu untersuchen. Der große Vorteil dieses Arbeitsmodells besteht in der Tatsache, dass es eine neue, aussagekräftige und sehr umfassende Sichtweise auf das Gesamtsystem ermöglicht. Weiters erlaubt das Modell die Zuordnung von allen im Untersuchungsbereich der vorliegenden Arbeit erkannten Aspekten zu bestimmten Wirkungsbereichen, und demzufolge zu bestimmten Wissenschaftsbereichen (Disziplinen). Dieser Sachverhalt wird im nächsten Unterkapitel 6.2 systematisch vorgeführt. Der unterste Teil des Arbeitsmodells in [Abb. 6.4], genannt ’Anfangszustand des Systems’, stellt die vor einer Untersuchung vorhandene Infrastruktur des Unternehmens dar. Dieser ’IstZustand’ wird im Allgemeinen als ’Basis des Organisationsgedächtnisses’ interpretiert und deshalb im Zuständigkeitsbereich des Wissensmanagements eingeordnet. Demzufolge wird es hauptsächlich dem Wirkungsbereich Organisation zugeordnet. Aus rein technischer Sicht stellt der Anfangszustand des Systems die schon vorhandene IT-Infrastruktur dar. Aus der Sicht des Wissensmanagers kommt noch das implizite und explizite Wissen des Unternehmens hinzu. In der Abbildung des Arbeitsmodells stellen die Flächeninhalte die ungefähre anteilsmäßige Reichweite der Wirkungsbereiche dar. Aus dem Blickwinkel des Projektmanagements kann man die Fläche des Dreiecks mit dem Gesamtaufwand zur Lösung des Informationssystems gleichsetzen. Die linke Einteilung im Arbeitsmodell entspricht der Zuordnung der Hauptdisziplinen zu den Wirkungsbereichen. Diese Zuordnung kann auch als Geltungsbereich der Hauptdisziplinen aufgefaßt werden. Besonders interessant ist damit eine genauere Untersuchung auf die Überlappungen dieser Geltungsbereiche der Hauptdisziplinen. Die stärkste Überlappung zwischen den Reichweiten der Hauptdisziplinen ist zwischen Informationsmanagement und Wissensorganisation zu erkennen. Beide Disziplinen decken gleichzeitig und nahezu im gleichen Ausmaß den Großteil der Wirkungsbereiche ’Inhalt & Semantik’ und ’Technik’, und besitzen deshalb (insbesondere im Kontext transnationaler Konzerne) eine starke Beziehung zueinander. Ihre Hauptmerkmale, kritische Aspekte und Einflüsse spielen vor allem bei der Erstellung der technischen Systemlösung eine wesentliche Rolle. Wesentlich hierbei ist die Erkennung der unterschiedlichen Aufgabengebiete dieser Hauptdisziplinen. Während sich die Wissensorganisation und alle damit ’verwandten’ Disziplinen mit semantischen Strukturen zur Wissensmodellierung und –ordnung befassen, kümmert sich das Informationsmanagement hauptsächlich um die Spezifikation und Verwirklichung der benötigten Transparenz des verteilten Systems. Während der Konzeptionsphase des Informationssystems für einen transnationalen Konzern sollten die Einflüsse beider Disziplinen nicht separat sondern parallel und interagierend betrachtet werden. Beispielsweise könnten ungeeignete Mechanismen zum Lösen von Ortstransparenz nicht nur die einheitliche Modellierung von Wissenseinheiten, sondern deren semantische Auffindungs- und Zugangskriterien stark beeinträchtigen. Weiters könnte die unkoordinierte bzw. isolierte Behandlung dieses Aspekts zur Auswahl von falschen Kriterien in Zusammenhang mit Maßnahmen zur Performanzsteigerung des verteilten Systems (z.B. durch Replikation) führen, wobei dies ebenfalls direkten (und sicherlich unerwünschten) Einfluß auf das Relevanz- und Redundanzkriterium zur Informationsauffindung hätte. Die kritischen Einflüsse beider Hauptdisziplinen können also mit Hilfe des Arbeitsmodells frühzeitig erkannt werden und eine solche unerwünschte Kettenreaktion verhindern. Kapitel 6 - LÖSUNGSVORSCHLAG Seite 122 Ein weiterer sensibler Punkt bei der Lösungskonzeption eines wissensbasierten Informationssystems für transnationale Konzerne ist die Berücksichtigung von Modularität und Dynamik des Systems, um zum Beispiel die Erweiterbarkeit und Anpassungsfähigkeit zu steigern. Dynamische Ziele und Strategien des Unternehmens werden in der Regel vom Wirkungsbereich ’Organisation’ untersucht. Die Umsetzung der Lösung von Erweiterbarkeit und Anpassungsfähigkeit des Systems findet größtenteils im Wirkungsbereich Technik statt. Was aber verbirgt sich hinter dem Begriff ’Dynamik’ des Informationssystems? Ist sie irgendwie erfaßbar? Und warum ist dies wichtig bei der Systemkonzeption? Zur Beantwortung dieser Fragen wird im nächsten Abschnitt der Begriff ’Informationsfluß’ eingeführt und untersucht. 6.1.3 Informationsfluß Informationsfluß wird im Kontext der vorliegenden Arbeit als ein ganz spezielles Charakteristikum eines Informationssystems aufgefaßt und als solches in drei ’Phasen’, wie in [Abb. 6.5] graphisch dargestellt, unterteilt: Bereitstellung Erstellung Administrierung Benutzer Informationssystem ERSTELLUNG Direkt ADMINISTRIERUNG Indirekt Indirekt Direkt BEREITSTELLUNG Abbildung 6.5: Phasen des Informationsflusses in einem Informationssystem Der durch die Betrachtung des Informationsflusses gewonnene Einblick in das Informationssystem wird auch in der Literatur zum Thema Wissensmanagement verwendet. Ein ähnliches Modell wie jenes in [Abb. 6.5] wird zum Beispiel in [Maurer et al. 2001] definiert und als Grundlage zur Untersuchung wichtiger Aspekte des informationstechnischen Wissensmanagements genommen. Dort allerdings steht der Wissenstransfer im Mittelpunkt der Untersuchung. Im Kontext der vorliegenden Arbeit wird Informationsfluß als Hauptparameter zur Beschreibung von Prozessen innerhalb des Informationssystems festgelegt. Es geht darum zu zeigen, wo Information entsteht und wohin sie übertragen wird. Das Modell in [Abb. 6.5] ist demzufolge auch als eine Art ’Sender-Speicher-Empfänger’-System aufzufassen. Kapitel 6 - LÖSUNGSVORSCHLAG Seite 123 Bereitstellung von Information Die Phase der Bereitstellung von Information beschreibt die Ausgabe eines Systems (engl.: ’output’). Die Empfängerrolle bei dieser Phase übernimmt meist der Benutzer selbst und kann aus dieser Sicht dem Lesevorgang des Benutzers gleichgestellt werden. Dieser Sachverhalt wird auch direkte Bereitstellung genannt. Weiters kann diese Phase einer allgemeinen Zustellung von Information gleichgesetzt werden. Dabei kann das System gleichzeitig die Rollen von Sender und Empfänger einnehmen, und über eine indirekte Bereitstellung sich selbst mit neuen Informationen beliefern (z.B. durch den Einsatz von intelligenten Agenten). Eng gekoppelt mit einer bedarfsgerechten Bereitstellung von Informationseinheiten sind die Kriterien der Präsentation und Navigation von Inhalten. Diese Aufgabe wird am Sender (Informationssystem) zum Beispiel über Mechanismen aus dem Bereich Document Management oder Wissensvisualisierung gelöst. Das Front End des Systems, um die Bereitstellung zu ermöglichen, wird durch das User Interface realisiert. Erstellung von Information Die Informationserstellung, bzw. der Prozeß der Eingabe (eng.: ’input’) eines Informationssystems kann als Schreibvorgang im System interpretiert werden, und ist verantwortlich für die Generierung von Informationseinheiten. Es wird zwischen zwei Arten der Informationserstellung unterschieden: direkte und indirekte Erstellung. Die direkte Erstellung ist im Allgemeinen dem Benutzerinput gleichzusetzen (zum Beispiel ein Datei-Upload). Die indirekte Erstellung findet innerhalb des Systems statt, und generiert neue Informationseinheiten aufgrund der Beobachtung des Benutzerverhaltens. Ein Beispiel für die Anwendung indirekter Informationserstellung wäre eine protokollierte und kategorisierte Beobachtung von Suchvorgängen der Benutzer: wenn Benutzer A eine themenspezifische Suchanfrage startet, und das System die Suchergebnisse zu einem ähnlichen Thema bei Benutzer B schon mal beobachtet und gespeichert hat (das wäre die indirekt erstellte Informationseinheit), so kann es dem Benutzer A diese hilfreiche Information zusätzlich zur Verfügung stellen. Weiters könnte das System auch kontextuelle Zusammenhänge erkennen, d.h. beispielsweise die zu einem Projekt gehörende Problematik erkennen, und dementsprechend einem Benutzer über das Vorhandensein ähnlicher Dokumente informieren. Die Phase der Informationserstellung berücksichtigt somit die Probleme der statischen und dynamischen Wissenserfassung, des Uploads von Datenbeständen, der Metaisierung von Inhalten (Definition von Zusatzinformationen) und ähnliche Vorgänge. Administrierung von Information Die Administrierung von Information ist ein interner Prozeß des Systems. In dieser Phase werden alle Mechanismen der Informationsverwaltung implementiert. Der Vorgang der Archivierung von Information (Datenspeicherung) findet auch innerhalb dieser Phase statt. Typische Aufgaben der Informationsadministrierung sind beispielsweise die synchronisierte Verwaltung von Replikaten, die Kontrolle des Informationszugangs über die Verwaltung von Zugriffsrechten, die dezentrale oder zentrale Steuerung von Systemzugriffen (d.h. die Transparenz einer verteilten Architektur zu gewährleisten), die automatische Wissensextraktion für die Erstellung von begrifflichen Strukturierungen, usw. Fazit Die Begründung für die Einführung des Begriffs ’Informationsfluß’ kann somit in der Tatsache gesehen werden, dass ein Parameter, welcher die Prozesse innerhalb des Systems beschreiben kann, für weitere Untersuchungen zur Verfügung steht. Es liegt nahe zu behaupten, dass dynamische Mechanismen bei allen Prozessen des Informationssystems (d.h. ’überall dort wo Kapitel 6 - LÖSUNGSVORSCHLAG Seite 124 Information fließt’) involviert sind. Dieser Sachverhalt wird im Kontext der vorliegenden Arbeit als ’Dynamik des Systems’ bezeichnet. Mit Hilfe des Informationsflusses ergeben sich neue Sichtweisen, um das Verhalten des Systems von verschiedenen Blickpunkten aus zu betrachten. In Abhängigkeit davon, auf welches besondere Merkmal des Systems die Betrachtung fokussiert wird (zum Beispiel unter ausschließlicher Untersuchung der Benutzerrolle Systemadministrator), wirkt der Informationsfluß in spezifischer Art auf unterschiedliche Systemeinheiten ein. 6.1.4 Spezielle Sichtweisen des Informationssystems Die Dynamik eines Informationssystems für transnationale Konzerne ist im Kontext dieser Arbeit durch den Informationsfluß (siehe Abschnitt 6.1.3) gekennzeichnet. Da die stark verteilte Struktur des Systems ein sehr hohes Maß an Transparenz erfordert, spielt die Berücksichtigung unterschiedlicher Sichtweisen während der Lösungskonzeption eine ganz besondere Rolle. Bezüglich unterschiedlicher Betrachtungsweisen innerhalb des Systems und in Abhängigkeit des Informationsflusses werden drei Komponenten - im Kontext der vorliegenden Arbeit ’Blickpunkte’ genannt - wie folgt identifiziert: Mensch Standort Inhalt Diese Blickpunkte ermöglichen gemeinsam eine ganzheitliche innere Perspektive des Informationssystems, denn sie umfassen nicht nur alle digitalisierten Ressourcen, sondern auch das global erfasste Intellektuelle Kapital (d.h. auch humane Ressourcen) und dessen räumliche Verteilung im Konzern. Der Blickpunkt Mensch Der Blickpunkt Mensch läßt sich in unterschiedliche ’Rollen’ unterteilen, wobei die wichtigsten wie folgt definiert werden: Benutzer Inhaltsanbieter Referee Administrator Manager In welcher Beziehung die Rollen zueinander stehen, soll [Abb. 6.6] zeigen. Auffällig in dieser Abbildung ist die Tatsache, dass die Benutzergruppen (Rollen) wechselseitig aufeinander wirken. Eine genau durchdachte Rollenspezifikation ist bei der Konzeption eines Informationssystems für transnationale Unternehmen unumgänglich bzw. essenziell, da sie die Grundlage für eine effiziente und effektive Gruppenverwaltung bildet. Im Rahmen dieser Arbeit können nun den Hauptaufgaben Rollen zugeordnet werden. Kapitel 6 - LÖSUNGSVORSCHLAG Seite 125 Benutzer Inhaltsanbieter Manager Rollenkonzept Administrator Referee Abbildung 6.6: Rollenkonzept im wissensbasierten Informationssystem Die in [Abb. 6.6] durch den zentralen Kreis dargestellte Interaktion der Rollen kommt zustande, weil die Mitglieder einer Hauptgruppe ebenfalls einer anderen angehören dürfen. Wichtig während der Gestaltung des Systems ist eine technische und formale Trennung zwischen den Gruppen vorzunehmen, um spezielle Applikationsanforderungen dementsprechend klassifizieren und priorisieren zu können. Ein Benutzer spielt in der Regel die Rolle des Empfängers im Informationssystem. In diesem Zusammenhang besteht die Aufgabe des wissensbasierten Informationssystems darin, den Benutzern präzise und relevante Informationen auf effiziente Weise zur Verfügung zu stellen. Somit geht es hierbei hauptsächlich um die Nutzbarkeit (engl.: ’usability’) des Systems. Das Verhalten des Benutzers geht aber auch, wie im Abschnitt 6.1.3 anhand der Phasen des Informationsflusses bereits geschildert, in Form von direkter bzw. indirekter Informationsbereitstellung in das System ein. Zu den Inhaltsanbietern gehören zum Beispiel Autoren oder Publizisten. Mitglieder dieser Benutzergruppen sind für die ’Wissensveröffentlichung’, und somit für die Quantität und Qualität der Hauptkomponente Inhalt innerhalb der Intranetumgebung verantwortlich. Inhaltsanbieter spielen bezüglich des Informationsflusses die Hauptrolle bei der Informationserstellung. Eine besondere Stellung im Rollenkonzept eines Informationssystems für transnationale Konzerne wird von Referees (deutsch: ’Begutachter’) eingenommen. Referees entscheiden über Zweckmäßigkeit und Relevanz von Informationseinheiten und demzufolge über die ’Speicherbarkeit’ oder ’Archivierbarkeit’ von explizitem Wissen. Eine weitere Aufgabe der Referees wäre z.B. als Fachexperten zur Festlegung von begrifflichen Strukturierungen. Allein wegen der sprachlichen Unterschiede in einem transnationalen Konzern - aufgrund der weltweit verstreuten Standorte - sollten verschiedensprachige Referees die Festlegung einer homogenen allgemein gültigen Themenhierarchie begutachten. Administratoren sind in der Regel für die Wartbarkeit, Fehlerbehebung und Erweiterung des Informationssystems verantwortlich. Sie besitzen in der Regel Schreibrechte über alle Strukturen des Systems. Bei transnationalen Konzernen sollte diesbezüglich die Tatsache nicht unbeachtet bleiben, dass eine einzige Gruppe von Administratoren nicht immer erwünscht oder effizient ist. Die starke Autonomie mancher Unterbereiche des Konzerns kann die Festlegung standortabhängiger Untergruppen von Administratoren erfordern. Autonome Teilbereiche in transnationalen Konzernen tauschen zwar Wissenseinheiten über die Grenzen der eigenen Kapitel 6 - LÖSUNGSVORSCHLAG Seite 126 lokalen Struktur aus, möchten aber oft ihre Inhalte vor ’externen’ Bereichsadministratoren ’schützen’. D.h. für autonome Unterbereiche können Subadministratorgruppen festgelegt werden, welche sämtliche Zugangsrechte auf die Struktureinheiten vordefinierter Portale besitzen, aber sonst nirgendwo. Manager sind für die Organisation und Ordnung des Unternehmensgedächtnisses verantwortlich, d.h. sie sind in irgendeiner Form für die Verwaltung von Informationseinheiten zuständig. Eine typische Rollenbezeichnung in diesem Zusammenhang ist Content Manager. Content Manager besitzen in der Regel fast uneingeschränkte Zugriffsrechte auf ganze Strukturen, und dürfen, im Unterschied zu Inhaltsanbietern, auch Informationseinheiten löschen. Die Mitglieder dieser Managementebene verfolgen strategische und operative Ziele, welche mit den globalen und lokalen Geschäftsprozessen des Konzerns zu tun haben. Das Verhalten der Manager legt somit die ’Intranetstrategie’ fest. Der Blickpunkt Standort Der Blickpunkt Standort gibt die Abbildung des realen Raumes auf das System wieder und umfaßt alle Aspekte der Lokalisierung von Ressourcen. ’Standort’ stellt deshalb sowohl die reale Topologie einer verteilten Systemarchitektur als auch die durch Mechanismen der Transparenz gewonnene virtuelle Zentralisation von Ressourcen dar. Die Hauptkomponente Standort spannt somit den ’realen’ sowie den ’virtuellen’ Raum des Informationssystems auf. Der Blickpunkt Inhalt Inhalt stellt den Blickpunkt dar, welcher die Betrachtung des Systems aus der Sicht der erfaßbaren Wissenseinheiten (wie zum Beispiel Daten, Informationen oder Prozesse) ermöglicht. Diese Komponente umfaßt somit fast alle Aspekte des Wirkungsbereiches ’Inhalt & Semantik’, und schließt humane Ressourcen aus. Fazit Mit der Einführung der bislang beschriebenen Modelle, Parameter und Blickpunkte ist ein allgemein gültiger Arbeitsrahmen, welcher die formale Konzeption eines technischen Gestaltungsmodells erlaubt, gegeben. Das im nächsten Abschnitt beschriebene Modell kann sicherlich nicht alle denkbaren speziellen Anforderungen von Informationssystemen für transnationale Konzerne erfüllen, stellt aber einen ersten Lösungsvorschlag dar, um kritische ’Komponenten eines allgemeinen Arbeitsgerüsts’ zu definieren und diese mit den von unterschiedlichen Disziplinen zur Verfügung gestellten Möglichkeiten effizient und effektiv zu lösen. 6.2 Technisches Gestaltungsmodell zur wissensbasierten Informationssystems Konzeption eines Die verteilte Wissensverwaltung in transnationalen Konzernen ist in erster Linie ein strukturelles und funktionales Problem. Aus informationstechnischer Sicht, wie bereits in den Kapiteln 2 bis 5 der vorliegenden Arbeit beschrieben, sind unterschiedliche Lösungsansätze für diese Problematik indentifizierbar, zum Beispiel benutzer-, prozeß-, struktur- und themenorientierte Modelle. Ein Gesamtmodell für die Gestaltung des Systems sollte all diese Ansätze berücksichtigen und die Lösungssuche nach spezifischen Problemen unterstützen. Aus der Sicht des Wissensmanagements geht es darum, das Intellektuelle Kapital des Unternehmens so abzubilden und zu präsentieren, dass eine effiziente und effektive Verwaltung der Ressourcen gewährleistet ist. Kapitel 6 - LÖSUNGSVORSCHLAG Seite 127 Darüberhinaus vertritt der Autor der vorliegenden Arbeit die Meinung, dass die Konzeption des Informationssystems einer Kartografierung des Unternehmenswissens analog ist, wobei die Topologie aller Systemeinheiten sowohl statische als auch dynamische Elemente enthalten sollte. Ein statisches Element entspricht der standortbezogenen Eigenschaft einer Komponente bzw. einer Informationseinheit, d.h. ’wo’ sie tatsächlich liegt. Dynamische Elemente ermöglichen ihrerseits unterschiedliche benutzerabhängige Sichtweisen der Datenbestände, d.h. das Organisationsgedächtnis wird auf bedarfsgerechte Weise zugänglich gemacht (Auffindung und Präsentation wird semantisch vom System verwaltet). Die Kartografierung bzw. Modellierung des Wissensbestandes eines transnationalen Unternehmens hängt somit von der Zielsetzung ab, d.h. ’Was’ wird ’wann’, ’wie’ und ’wo’ für ’wen’ präsentiert?, und ’Wozu’ wird etwas abgebildet? Hierbei stellen, der Meinung des Autors der vorliegenden Arbeit nach, die Fragewörter ’was’ und ’wozu’ den Schwerpunkt bei der Konzeption eines Modells dar. Bezüglich der ersten Frage lassen sich einige der modellierbaren Bestände des intellektuellen Kapitals - oder Eigenschaften davon - wie folgt identifizieren: Dokumente, Dateien, multimediale Einheiten (Video/Ton/Grafik), Teilsysteme in verteilten Umgebungen, Beziehungen zwischen Systemkomponenten oder Informationseinheiten, Speichermedien, Verzeichnisse, Wissenseinheiten (d.h. explizites und implizites Wissen im Zusammenhang mit strategischen Zielen) Standort, Gültigkeitsbereich, Zugehörigkeit, Domänen, Prioritäten, Aktualität Organigramme, Chronologien, Zugriffsrechte, Strategien, Kompetenzen, Rollen, Autoritäten, Muster, Ereignisse, Aktivitäten, usw. Ein Grund für die Modellierung von Wissen im Informationssystem eines großen und geographisch verteilten Unternehmens ist die Förderung der Wiederverwendbarkeit von Wissen sowie die Vermeidung von erneuter Erfindung bzw. Definition von Prozessen, um Antwort- und Auffindungszeiten bzw. Beschaffungskosten zu minimieren. Ein weiteres Beispiel für die Notwendigkeit von Wissensmodellierung ist die Verbesserung der Wissens(ver)teilung - und demzufolge der Kollaboration und der Kommunikation - durch eine gefilterte Präsentation von Fachwissen (z.B. über Clustering oder selbstentwickelte Themenhierarchien). Auch in diesem Zusammenhang kann die Hervorhebung von Expertenwissen die Belastung der Experten senken, da kritische Information für jeden verfügbar ist. Das im Folgenden beschriebene Grundkonzept für die Lösungsmodellierung eines wissensbasierten Informationssystems eines transnationalen Konzerns wird in zwei Schritten, wie folgt, unterteilt: a) Das grundlegende Schema des Lösungsmodells ergibt sich aus dem im ersten Teil dieses Kapitels erörterten Arbeitsmodells und führt zur Identifikation der wichtigsten logischen Komponenten des Systems unter Berücksichtigung der bisher definierten Wirkungsbereiche und Sichtweisen. b) Um das funktionale Schema zu erhalten, werden die Merkmale des grundlegenden Schemas untersucht, und funktionale Zusammenhänge hergestellt. Das Resultat im Kontext der vorliegenden Arbeit ist eine schematische Darstellung jener Systemkomponenten, welche direkt am Informationsfluß beteiligt sind. Das ’Arbeitsmodell zur allgemeinen Sichtweise der Lösung’ (siehe Abschnitt 6.1.2) kann als Fundament für das Gestaltungsmodell herangezogen werden, weil es aus einem allgemeinen Kapitel 6 - LÖSUNGSVORSCHLAG Seite 128 Analysevorgang stammt. Somit wird ’deduktiv’ auf Aufbau und Eigenschaften eines mehrteiligen und flexiblen Lösungsmodells geschlossen. 6.2.1 Teil 1 - Grundlegendes Schema Aufbauend auf den Erkenntnissen des vorangegangenen Unterkapitels (Abschnitt 6.1 ’Grundanalyse zur Konzeption eines allgemeinen Lösungsmodells’) sollen Zusammenhänge zwischen den bereits beschriebenen Wirkungsbereichen (Punkt 6.1.1) und den unterschiedlichen Blickpunkte (Punkt 6.1.4), welche die Analyse einer Intranetlösung für transnationale Konzerne erlauben, identifiziert werden. Diese Zusammenhänge werden anhand des grundlegenden Schemas in eine einheitliche Form zusammengefasst. Das vom Autor der vorliegenden Arbeit erstellte grundlegende Schema zur Konzeption eines wissensbasierten Informationssystems für transnationale Konzerne, graphisch in [Abb. 6.7] dargestellt, ordnet jedem Wirkungsbereich eine spezifische Betrachtungsweise, eindeutige Konzeptionskriterien sowie ein angenähertes Bedeutungsmaß der Blickpunkte zu. ANALYSE STANDPUNKT KRITERIEN FOKUSSIERUNG Wirkungsbereiche Untersuchung aus der Sicht von: Konzeptionskriterien Ausmaß der Bezugnahme von Blickpunkten 1 Organisation Management Strategie und Bedürfnisse 2 Inhalt & Semantik Benutzerrollen und -interessen Qualität und Bedeutung 3 Technik Administration und Engineering Technologische Infrastruktur Mensch Inhalt Standort Abbildung 6.7: Grundlegendes Schema zur Konzeption eines wissensbasierten Informationssystems für transnationale Konzerne Aus [Abb. 6.7] ist ersichtlich, dass beispielsweise das Rollenkonzept (d.h. die Benutzer und ihre spezifischen Interessen) die Hauptperspektive bei der Analyse von inhaltlichen und semantischen Überlegungen darstellt (dies ergibt sich aus der externen Sichtweise des Systems). Dadurch liegen Qualität und Bedeutung von Informationseinheiten als Hauptkriterien im Vordergrund der Analyse. Demzufolge übt der Blickpunkt ’Inhalt’ (alle Wissenseinheiten) den stärksten Einfluß in diesem Prozeß aus. Mit Hilfe des ’grundlegenden Schemas’ kann man nun Anforderungen an das Informationssystem (sofern sie definiert wurden) einem oder mehreren Wirkungsbereichen zuordnen. D.h. die Einflüsse jeder Anforderung werden in allen Wirkungsbereichen strategisch überprüft. Das in [Tab. 6.1] dargestellte Beispiel zeigt eine Möglichkeit, wie für einen fiktiven transnationalen Konzern einige Einflußfaktoren entsprechend den Wirkungsbereichen priorisiert werden können. Die Nummern in den letzten drei Spalten der Tabelle entsprechen den in [Abb. 6.7] definierten Wirkungsbereichen. Diese Tabelle soll exemplarisch die Tatsache unterstreichen, dass jede große und geographisch verteilte Unternehmung zwar ein eigenes (spezifisches) Anforderungsprofil für ein wissensbasiertes Informationssystem besitzt, dieses aber durch eine allgemein gültige Kapitel 6 - LÖSUNGSVORSCHLAG Seite 129 systematische Analyse – zum Beispiel durch die in diesem Kapitel selbstdefinierte Methodik erfaßbar ist. Anforderungen an das System Übernahme der Organisationsform als Systemarchitektur Hoher Verteilungsgrad des Informationssystems Verfügbarkeit von großen Objekten über Replikation Qualitätssteigerung der Informationseinheiten durch Metadaten Mehrsprachige Funktionalität bei der Dokumentenverwaltung Bereichabhängiges Rollenkonzept und Rechtevergabe Modularität des Systems (Erweiterbarkeit und Anpassungsfähigkeit) Festlegung einer globalen Themenhierarchie und bereichabhängiger Begriffsstrukturen Wirkungsbereiche 1 2 3 Tabelle 6.1: Fiktives Beispiel für die Analyse einiger Anforderungen an ein wissensbasiertes Informationssystem für transnationale Konzerne bzgl. der Wirkungsbereiche gemäß dem grundlegenden Schema (Anm.: 1 = Organisation, 2 = Inhalt & Semantik, 3 = Technik). Das Ziel einer Analyse anhand des grundlegenden Schemas ist die Identifikation der spezifischen strategischen und technischen Hauptkriterien, um die systematische Konzeption des Systems zu ermöglichen. Das heißt, die Teilprobleme werden in diesem Schritt unabhängig voneinander sortiert und den Wirkungsbereichen zugeordnet, um eine Aussage darüber zu machen, welche Hauptdisziplin für die Lösung eines Teilproblems am besten in Frage kommt. Die systematische Analyse mittels des grundlegenden Schemas kann also, zusammen mit der Berücksichtigung von allgemeinen Anforderungen an das Informationssystem, dem Entwurf eines allgemeinen Modells dienen. Aufgrund der indirekten Zuordnung zu den Hauptdisziplinen kann eine taktische Lösung erarbeitet werden, d.h. die strategischen Ziele des Informationssystems werden erkannt und spezifiziert. Die Konzeption der Systemmodule bleibt aber aus technischer Sicht noch ungelöst. Es wird also mit Hilfe des grundlegenden Schemas spezifiziert ’was’ technisch gelöst werden kann, aber nicht ’wie’. Dafür wäre eine schematische Darstellung eines komponentenorientierten Lösungsmodells sehr hilfreich. Das schematische Lösungsmodell, welches die technischen Hauptkomponenten eines wissensbasierten Informationssystems für große und geographisch verteilte Unternehmen Kapitel 6 - LÖSUNGSVORSCHLAG Seite 130 beschreibt, wird vom Autor der vorliegenden Arbeit ’funktionales Schema’ genannt, resultiert teilweise - aus der Logik des ’grundlegenden’ Schemas und wird nachfolgend dargestellt.. 6.2.2 Teil 2 - Funktionales Schema Unabhängig von der Größe, dem Zweck oder der technischen Implementierung eines Informationssystems (oder eines Teils davon), ’fließen’ stets Informationseinheiten von einem Sender zum Speicher bzw. vom Speicher zu einem oder mehreren Empfängern. Viele Aufgaben eines wissensbasierten Informationssystems können deshalb – der Meinung des Autors der vorliegenden Arbeit nach - durch eine effektive und effiziente Verwaltung des Informationsflusses gelöst werden. Der Begriff ’Informationsfluß’ wird als Hauptparameter eines funktionalen Schemas gewählt, da die meisten Prozesse in Informationssystemen erst dadurch beschreibbar werden. So ist zum Beispiel der Informationsfluß das Hauptelement: im Wissenstransferprozeß von lernenden Organisationen, vieler Kommunikationstools in webbasierten Umgebungen, in Workflowapplikationen, u.v.m. Das in diesem Abschnitt erstellte funktionale Schema - wie in [Abb. 6.8] graphisch dargestellt bildet den zweiten Hauptteil des Lösungsvorschlags zur Konzeption eines wissensbasierten Informationssystems für große und geographisch verteilte Unternehmen (bzw. transnationale Konzerne). Das Schema resultiert sowohl aus den Erkenntnissen des Untersuchungsbereichs der vorliegenden Arbeit (Kapitel 2 bis 5) als auch aus den Ergebnissen der Grundanalyse der allgemeinen Problematik (Abschnitt 6.1), und wird so kompakt wie möglich gestaltet. Das funktionale Schema basiert auf einer komponentenorientierten Sichtweise des Systems und folgt der Logik des Informationsflusses. Es ergibt sich für die Struktur des Schemas folgende sinnvolle Einteilung (unter Berücksichtigung des Informationsflusses) in fünf Hauptkomponenten: Zugang Erkennung Semantik & Auffindung Sicherheit Basis Weiters kann die Komponente ’Semantik & Auffindung’ wie folgt unterteilt werden: Organisationssysteme Metadaten Navigation Suche Administrierung Erstellung Bereitstellung Kapitel 6 - LÖSUNGSVORSCHLAG Seite 131 Abbildung 6.8: Funktionales Schema zur Konzeption eines wissensbasierten Informationssystems für transnationale Konzerne Die Komponente Zugang des funktionalen Schemas umfaßt die strukturellen Eigenschaften des gesuchten Systems. Aufgrund der stark verteilten Organisationsstruktur eines transnationalen Unternehmens empfiehlt es sich, eine portalbasierende Zugangsstruktur für die Intranetlösung zu verwenden. Meist entspricht die Anordnung dieser Zugangsknoten einer hierarchischen Struktur (welche mit der Gliederungsart des Konzerns konform ist) und nicht der in [Abb. 6.8] präsentierten einschichtigen Darstellung. Ob wirklich mehrere Zugänge zum Informationssystem entworfen werden, oder bloß ein zentraler Knoten zur Verfügung gestellt wird, hängt von den spezifischen Anforderungen des Unternehmens und vom erwünschten Verteilungsgrad des Gesamtsystems ab. Auf Hardwareebene kann von dieser Komponente auch die Entscheidung resultieren, ob ein Zentralserver, ein Serverpool oder eine Integrierte Variante aus mehreren unabhängigen Servern entworfen werden soll. Die Komponente Erkennung ist für das gesamte Rollenkonzept verantwortlich. Darin findet somit die globale und lokale Benutzer- und Gruppenverwaltung statt. In diesem Modul werden beispielsweise alle Fragen der Identifikation und Personalisierung beantwortet. Die Kapitel 6 - LÖSUNGSVORSCHLAG Seite 132 Erkennungskomponente sollte aber nicht mit den Mechanismen des objektbezogenen Zugriffs verwechselt werden. Die Komponente Semantik & Auffindung umfaßt alle Beschreibungprozesse, Auffindungskriterien und Darstellungsmechanismen. Die Hauptteile dieser Komponente sind Organisationssysteme, Metadaten, Navigation und Suche. Hinter dem Begriff Organisationssysteme – wie schon im Untersuchungsbereich ausführlich beschrieben – verbergen sich nicht nur die unterschiedlichen Klassifikationsmechanismen, sondern auch jegliche Arten von begrifflichen Strukturen (Themenhierarchien, semantische Netze, Thesauri, usw.), Technologien zur semantischen Archivierung bzw. Verwaltung von Dokumenten (Topic Maps, Knowledge Mapping, usw.) oder, als weiteres Beispiel, eine semiautomatische Ontologieerzeugung. Da die Beschreibung von Wissenseinheiten meist mit Hilfe von Zusatzinformation erfolgt, und diese nicht unbedingt Teil der gespeicherten Einheit ist, wird hier die Subkomponente Metadaten eingeführt und parallel zu den Organisationssystemen definiert. Die Unterkomponente Navigation stellt im funktionalen Schema eine eigene Kategorie innerhalb der Komponente ’Semantik & Auffindung’ dar, weil sie spezielle Mechanismen implementieren könnte, die eine komplexe Dynamik enthalten (z.B. dynamische Listings, personalisierte Datenbereiche, komplexe Themenhierarchien, Navigation von Workflowdarstellungen, usw.) und deshalb eine gesonderte Behandlung benötigen würde. Sie ist im Allgemeinen für die ’Präsentation’ des Intranetangebots verantwortlich. Die Mechanismen der Informationsauffindung werden von der Subkomponente Suche gedeckt und umfassen alle damit verbundenen Algorithmen, wie beispielsweise eine automatische semantische Datensammlung über eine spezialisierte Clustering Applikation. In der Suche sind somit alle Aspekte des Information Retrieval und Resource Discovery enthalten. Besondere Berücksichtigung gewinnen in dieser Subkomponente auch Aspekte aus dem Bereich Datenmanagement, wie die Replikationskriterien oder der Typ des Datenbanksystems. Die Komponente Sicherheit ist verantwortlich für alle Maßnahmen, um den Zugriff auf Informationseinheiten applikations- bzw. benutzerspezifisch einzuschränken. Sie kann auch als die funktionale Verbindung zwischen dem logischen und dem physikalischen Zugriff auf Wissenseinheiten des Unternehmensgedächtnisses aufgefaßt werden. Der gefilterte Zugriff auf Objekte des Organisationsgedächtnisses kann aber auch in Abhängigkeit von den Angaben in Metadaten oder in Suchalgorithmen stattfinden. Die physikalisch größte und technisch sensibelste Komponente des Systems stellt die Basis dar. Dahinter ist nicht nur die Systemarchitektur zu verstehen, sondern auch alle Mechanismen, um dessen Wesen (verteilt, zentralisiert, replizierend, relational, objektorientiert, usw.) transparent zur Verfügung zu stellen. Mit Hilfe dieser Komponente sollen zum Beispiel die Anforderungen der Archivierung, Anordnung, Beschreibung und Publizierung von Informationseinheiten erfüllt werden. Portaleigenschaften, Benutzerinformation, Metadaten und andere Beschreibungs- und Strukturelemente sollen auch hier definiert und verwaltet werden. Die Besonderheit des oben dargestellten funktionalen Schemas liegt in dessen allgemeiner Gültigkeit bezüglich Sichtweisen des Systems. Das heißt, nach der Wahl eines bestimmten Blickpunktes kann der Pfad des Informationsflusses für eine bestimmte Teilaufgabe (z.B. die Beobachtung einer Suchanfrage und die Zustellung der Ergebnisse für eine bestimmte Benutzerrolle) über die betroffenen Komponenten auf übersichtliche Weise verfolgt werden. Ein praktisches Beispiel, welches diesen Sachverhalt graphisch verdeutlicht, wird im Abschnitt Kapitel 6 - LÖSUNGSVORSCHLAG Seite 133 6.2.4 ’Anfoderungsprofil für eine iterative Lösungsmethode’ gegeben. Sind nun die konkreten Anforderungen an das Informationssystem bekannt und ist eine entsprechende Zuordnung zu den Wirkungsbereichen - nach einer Analyse mit Hilfe des grundlegenden Schemas - erfolgt, so liefert das funktionale Schema einen unternehmensspezifischen Arbeitskorpus, welcher konkret formulierte Aufgaben technisch lösbar und modellierbar macht. Um die Zweckmäßigkeit des ’technischen Gestaltungsmodells’ in der Praxis zu demonstrieren, werden im nächsten Abschnitt kritische Aspekte bei der Konzeption eines wissensbasierten Informationssystems für transnationale Konzerne – wie bereits im Untersuchungsbereich der vorliegenden Arbeit ausführlich beschrieben – mit den Wirkungsbereichen ’Organisation’, ’Inhalt & Semantik’ und ’Technik’ in Verbindung gebracht. Diese kritischen Aspekte stellen somit konkrete Anforderungen an das System dar. Je eine Anforderung wird - der Einfachheit halber - einem einzigen Wirkungsbereich zugeordnet. Somit wird die technische Erfassung von einzelnen Aspekten innerhalb des funktionalen Schemas leichter modellierbar und infolgedessen übersichtlicher. Die Untersuchung und Auswertung der Anforderungen mittels des funktionalen Schemas wird durch eine iterative Methode im Abschnitt 6.2.4 beschrieben. Das Hauptziel dieser Vorgehensweise ist somit die möglichst eindeutige Erfassung eines Teilproblems (d.h. eines kritischen Aspekts bzw. einer Systemanforderung) durch eine oder mehrere Komponenten des funktionalen Schemas. Damit werden die Einflüsse jedes Problems auf gezielte Teile des Gesamtsystem isoliert, wodurch die technische Lösung anhand der im Untersuchungsbereich beschriebenen Mechanismen diverser Disziplinen leichter erkennbar und umsetzbar wird. 6.2.3 Anforderungen eines transnationalen Konzerns an ein wissensbasiertes Informationssystem Es sei an dieser Stelle darauf hingewiesen, dass der Entwurf und die Anwendung des ’technischen Gestaltungsmodells’ nicht eine maßgeschneiderte Lösung für das Wissensmanagement in transnationalen Konzernen, sondern eine Arbeitsgrundlage für die Aufbereitung, Organisation und Ordnung von Informationseinheiten eines wissensbasierten Systems, in Abhängigkeit der technischen Systemkomponenten, darstellt. Der Schwerpunkt liegt also in den Mechanismen zur semantischen Informationsaufbereitung und in der technischen Implementierung von Lösungsaufgaben aufgrund folgender Hauptcharakteristika transnationaler Konzerne: Stark verteilte und vernetzte Administration von Informationseinheiten Bedarfsgerechter und kontextabhängiger Informationsfluß Komplexe und dynamische Organisationsstruktur des Unternehmens Standortbezogene Einflüsse auf die Semantik der Informationseinheiten Das Auftreten dieser Eigenschaften mag durch folgende Aspekte begründet sein: Stets vorhandene Querverbindungen zwischen den Funktionen unterschiedlicher Unterbereiche des Konzerns Notwendigkeit des Verbergens der verteilten Systemarchitektur durch Steigerung der Transparenz Abbildung der Gliederungsart des Konzerns auf die Zugangsstrukturen des Systems Kapitel 6 - LÖSUNGSVORSCHLAG Seite 134 Internationalisierung des Konzerns (d.h. grenzüberschreitende Lösungen unter Berücksichtigung spezifischer nationaler Gegebenheiten) Der erste Schritt zur praktischen Anwendung des technischen Gestaltungsmodells wird in diesem Abschnitt in Form einer geordneten Auflistung von Anforderungen stattfinden. Hierfür werden die wichtigsten, im Untersuchungsbereich der vorliegenden Arbeit erkannten Problembereiche (’kritischen Aspekte’) berücksichtigt und je zu einem bestimmten Wirkungsbereich zugeordnet (unter Verwendung der Kriterien des grundlegenden Schemas). Es resultiert somit die im Folgenden beschriebene Einteilung kritischer Aspekte zur Konzeption eines Informationssystems für transnationale Konzerne. Es wird in diesem Abschnitt nicht näher auf die Beschreibung einzelner Anforderungen eingegangen, da sie direkt aus dem Kontext des Untersuchungsbereichs stammen und bereits ausführlich erörtert wurden. Es werden aber exemplarische Anmerkungen gegeben, um aus informationstechnischer Sicht das Problem zu beleuchten. Wirkungsbereich Organisation Dieser Bereich umfaßt planende, kontrollierende, steuernde, strategische und operative Anforderungen an das System. Die wichtigsten Anforderungen in diesem Kontext werden wie folgt eingeteilt: Gliederungsart bzw. Organisationsform des Konzerns: Das Ziel dieser Anforderung ist die Festlegung der zu implementierenden Zugangsknoten und Strukturelemente des Informationssystems, zum Beispiel die strategische Anordnung von Portalen und deren Zusammenhänge. Ist-/Soll-Stand der technischen Infrastruktur: Unter diesem Aspekt sollen Fragen zur allgemeinen Systemarchitektur beantwortet werden (z.B. zentralisiertes, verteiltes oder integriertes System). Die Erkennung von standortabhängigen Gegebenheiten bzgl. Technologien findet auch unter diesem Aspekt statt (Heterogene Systeme, unterschiedliche Netzwerktopologien, Geschwindigkeiten der Internetverbindungen, usw.). Spezielle Applikationen: unter diesem Aspekt sollen frühzeitig spezifische Applikationen isoliert und genau betrachtet werden. Beispiele hierfür wäre die Implementierung eines Workflowmoduls für das gesamte Unternehmen. Es ist sehr wichtig festzulegen, ob eine Applikation über den gesamten Konzern transparente Anwendung findet, oder ob spezielle Anpassungen für bestimmte Unterbereiche notwendig sind. Weitere Beispiele für spezielle Applikationen sind eLearning Systeme, komplexe Nachrichtenverwaltung, Organisation und Darstellung begrifflicher Strukturen, usw. Rollenkonzept: Festlegung der Gruppenarchitektur und Rechtevergabe der Informationseinheiten. Hier werden Entscheidungen getroffen, wie zum Beispiel ob ein anonymer Benutzer eine rein ’lesende’ Rolle, oder eine sehr beschränkte Schreibrolle übernehmen wird. Die formalen Unterschiede zwischen Publizierer, Content Manager, usw. werden hier auch definiert. Hier werden auch spezielle Rollen - wie zum Beispiel für Workflow Applikationen, eLearning Umgebungen, usw. - besprochen. Die Berücksichtigung dieser Aspekte ist von höchstem Stellenwert, da eine falsch ausgelegte Benutzer- und Gruppenverwaltung beispielsweise zu inneren Sicherheitslücken führen könnte. Authentifizierung: z.B. Mechanismen zur Identifikation von Benutzern und deren Rollen am System. Kapitel 6 - LÖSUNGSVORSCHLAG Seite 135 Autonomie mancher Unternehmensbereiche: Gesonderte Behandlung von speziellen Rollenkonzepten, abgesicherten Portalen, Zugriff auf geheime Daten, spezialisierte Replikationskriterien, usw. Hier wird nur die Entscheidung getroffen, ob solche Mechanismen notwendig sind oder nicht. Tools zur Steigerung der Kollaboration: z.B. Diskussionsforen, Teamwork Spaces, usw. Obwohl diese Aspekte auch unter dem Bereich der speziellen Applikationen Platz finden würden, stellen sie ganzheitliche Funktionen zu einem bestimmten Zweck dar. Tools zur Steigerung der Kommunikation: z.B. Chatsysteme, Video Conferencing oder Emailapplikationen. Globale Kriterien bezüglich Informationszugang und -darstellung: Unter diesem Aspekt werden ganz allgemeine Lösungskonzepte zu spezifischen Zugangs- und Darstellungsmechanismen behandelt. Es geht hierbei darum, die Art des Informationsflusses für spezifische Aufgaben (z.B. spezifische Applikationen oder Teilproblemen) zu definieren. Eine weitere sinnvolle Unterteilung dieses Punktes ergibt sich wie folgt: o o o o o o o o Ortsgerechter Zugang (z.B. standortabhängiges Inhaltsangebot) Anwendungsgerechter Zugang (z.B. beschränkter Zugang auf spezielle Applikationen) Zeitgerechter Zugang (z.B. Scheduled System-Jobs wie Synchronisationsmechanismen bei Datenreplikation) Bedarfsgerechter Zugang (z.B. adaptive Navigation durch Strukturen bzw. adaptive Präsentation von Informationseinheiten) Anwendergerechter Zugang (z.B. automatische Rechtevergabe bei der Erstellung von Informationseinheiten) Zielgerechter Zugang (z.B. Festlegung der notwendigen Anpassungen zur Änderung des Verhaltens von Standardfunktionen zu einem bestimmten Zweck. Ein Beispiel hierfür wäre des Ersetzen der Datenlöschung durch eine versteckte Archivierung zum Zwecke des unwiderruflichen bzw. unbeabsichtigten Verlustes von Informationseinheiten) Sicherheitsgerechter Zugang (zum Beispiel spezielle Sicherheitsmechanismen bei autonomen Unternehmensbereichen mit streng geheimen Informationen) Kostengerechter Zugang (z.B. das Ergreifen von Maßnahmen zur Datenreplikation in bestimmten Gebieten anstatt der Errichtung von einer teuren und leistungsstarken IT - Infrastruktur) Unternehmensspezifische Organisationssysteme: Hierbei soll lediglich auf die Notwendigkeit dieser Mechanismen hingewiesen werden. Die konkrete Definition und technische Implementierung werden von den anderen Wirkungsbereichen gedeckt. Überwindung von sozialen und kulturellen Barrieren: Sprachen, Hierarchien, Bürokratie, Gesetzgebung und inkoherente Paradigmen unter den unterschiedlichen Kulturen mehrerer zusammenarbeitenden Standorte in verschiedenen Ländern. Handhabung der Wissensbausteine: Unter diesem besonderen Aspekt des Wissensmanagements werden die Wissensbausteine Identifikation, Erwerb, Entwicklung, (Ver)teilung, Bewahrung, Nutzung, Messung und Zielsetzung, gemeinsam oder getrennt voneinander, behandelt. Modellierung spezifischer Geschäftsprozesse: z.B. Ablauf spezifischer Innovations-, Produktions- oder Fertigungsprozesse bei technischen Konzernen, aber auch grenzüberschreitende finanzielle Abwicklungen, oder die Berücksichtigung Kapitel 6 - LÖSUNGSVORSCHLAG Seite 136 unterschiedlicher Rechtssysteme in unterschiedlichen Ländern und deren Einfluß auf die Abwicklung von Projekten. Wirkungsbereich Inhalt & Semantik Dieser Wirkungsbereich umfaßt alle Maßnahmen, um die Qualität und die Bedeutung von Informationseinheiten und deren Inhalte zu definieren bzw. zu steigern. Qualität und Relevanz von Informationseinheiten: Diese Anforderung kann z.B. über erweiterte Metadatensätze erfüllt werden. Eine weitere Möglichkeit wäre eine Beurteilung der Informationseinheiten durch einen oder mehrere Referees, Fachexperten oder Content Manager. Einsatzmöglichkeiten von Klassifikationsschemata: Experten im Bereich der Wissensorganisation könnten hier schnellere und effizientere Entscheidungskriterien für die Wahl des richtigen Schemas finden. Mögliche Alternativen sind beispielsweise numerische (Dewey) oder themenspezifische (ACM) Klassifikationen. Einsatz spezifischer Metadatensätze: Parallel zur Qualitätssteigerung von Inhalten, kann durch vordefinierte Metadatensätze eine zweckgebundene semiautomatische Klassifikation von Informationseinheiten gewährleistet werden. Begriffliche Strukturierungen: Einsatz und Anwendungsgebiete von Thesauri, semantischen Netzen, Begriffslisten, usw. (=> Wissensorganisation). Unterschiedliche bedarfsgerechte Sichtweisen: Wichtige Teile des Systems, wie zum Beispiel Zugangs-, Erkennungs- und Navigationsmechanismen können zur dynamischen Generierung von bedarfsgerechten Sichtweisen beitragen. Hierbei treten zum Beispiel die Konzepte der Wissensmodellierung und –visualisierung stark in Aktion. Resource Discovery vrs. Information Retrieval: z.B. der Einsatz von Dat Mining, Clustering, usw. Anwendung von Ontologien: z.B. die Notwendigkeit und die Einsatzmöglichkeiten von automatischen Taxonomieerstellungen spezifische Fachbereiche. Semantische Suche: z.B. indizierte Suchmechanismen, strukturbeschränkte Suche über Metadatendefinitionen, usw. Lebenszyklus von Dokumenten: Unter diesem Aspekt werden beispielsweise Sichtbarkeit und Relevanz von Informationseinheiten in Abhängigkeit von der Zeit oder von der Dokumentenart festgelegt (Document Management). Personalisierte Dienste: z.B. die Erstellung von Themenprofilen anhand des Such- und Navigationsverhaltens von Benutzern und dementsprechend neue Auffindungskriterien zur Verfügung stellen oder ein zusätzliches personalisiertes Informationsangebot liefern. Funktionalität der Themenhierarchie: Hiermit ist die Technologieauswahl gemeint, z.B. XML Topic Maps (XTM), Standard XML, RDF, usw. Volltextsuche, Wirkungsbereich Technik In diesem Wirkungsbereich fallen sehr wichtige Entscheidungen über die Gestaltung und Implementierung des technischen Szenarios des Informationssystems. Die wichtigsten Anforderungen an das Informationssystem werden wie folgt aufgelistet. Kapitel 6 - LÖSUNGSVORSCHLAG Seite 137 Inhaltserschließung und –analyse: z.B. Indizierung von Informationseinheiten für die Steigerung der Suchfunktionalität. Kriterien und Implementierung der Datenreplikation: Die Implementierung solcher Mechanismen hängt von der zweckmäßigen Orientierung des Lösungsansatzes, entweder zur Optimierung der Fehlertoleranz oder zur Steigerung der Performanz, ab. Implementierung vom Verteilungsgrad des Systems: technische Kriterien zur Lösung der verteilten Systemarchitektur (z.B. Serverpool, VPN, usw.). Implementierung der Systemtransparenz: technische Kriterien zur Lösung der transparenten Systemarchitektur (z.B. Festlegung eines Browser als Front End des Systems, oder Replikationsmechanismen zum Zwecke des transparenten Zugangs zu ’lokalen’ Informationseinheiten). In Verbindung mit der Transparenz des Systems - ein Phänomen, das im Abschnitt 3.2.2 ’Verteilte Systeme’ ausführlich beschrieben wurde – ergibt sich eine weitere Unterteilung in folgende Punkte: o Ortstransparenz: z.B. der Informationszugriff Namensgebung der Informationseinheiten o Migrationstransparenz: z.B. die Verlagerung (Informationseinheiten) ohne Änderung des Namens o Zugriffstransparenz: z.B. Festlegung des Browsers als Interface o Replikationstransparenz: z.B. Vortäuschung eines einzigen Objektes aus einer Menge von Replikaten o Nebenläufigkeitstransparenz: z.B. Transparenz und Synchronisation beim gemeinsamen Zugriff auf replizierte Objekte o Parallelitätstransparenz: z.B. Parallelprogrammierung Prozessoren (Synchronisation bei verteilter Prozessorlast) o Skalierungstransparenz Informationssystems o Leistungstransparenz (Performanztransparenz): z.B. Rekonfiguration des Systems, um Performanz zu steigern. : z.B. Erweiterbarkeit über und eine eindeutige von Objekten auf mehreren Modularität des Archivierungskriterien und Datenverwaltung: z.B. Einsatz von Datenbanken, Filesystemen, Objektorientierung der Lösung, Entwurf und Verwaltung von Archivierungsstrukturen Implementierung spezifischer Applikationen: Hier wird die technische Lösung von spezifischen Applikationen festgelegt (Technologieauswahl, Programmiersprache, Module, Signaturen, usw.). Implementierung spezifischer Funktionseinheiten: Unter diesem Aspekt wird die Funktionalität und technische Ausführung von speziellen Algorithmen festgelegt (z.B. Clustering-Mechanismen, Ähnlichkeitskriterien bei semantischer Suche, Metaisierung von Informationseinheiten zum Zwecke einer Klassifikation, usw.). Metadatenverwaltung: z.B. explizite Unterscheidung und getrennte Speicherung von Inhalt und Zusatzinformation. Sicherheitskriterien: z.B. Verschlüsselungsalgorithmen, Netzwerktopologie, FirewallKonfiguration, usw. Einsatz von Standards, Technologien und Formaten: z.B. XML, RDF, usw. Kapitel 6 - LÖSUNGSVORSCHLAG Seite 138 Überprüfung der Systemstabilität und –zuverlässigkeit: z.B. Testphasen zu bestimmten Zeitpunkten auf bestimmte Ressourcen, oder Festlegung des Ablaufs eines Penetrationstests zur Schwachstellenüberprüfung des Systems. Dynamik der Bereitstellung von Informationseinheiten: z.B. die technische Implementierung von benutzerabhängiger und bedarfsgerechter Navigation über semantische Strukturen. Implementierung einer Themenhierarchie: z.B. statische und dynamische Speicherung von Hierarchieelementen und deren Zusammenhänge, um eine semantische Navigation über die Hierarchieknoten zu ermöglichen. Zweckgebundene Systemdienste: z.B. Benutzerdienste zum Zwecke der Kommunikation (Chatsystem oder Video Conferencing), oder Netzwerkdienste zum Zwecke der Synchronisation (Replikation), der Verzeichnisverwaltung oder der Sicherheit. Die oben definierten Anforderungen lassen nun eine gewisse Zugehörigkeit zu den Hauptdisziplinen erkennen, wenn man den jeweiligen zugeordneten Wirkungsbereich anhand des ’Arbeitsmodells zur allgemeinen Sichtweise der Lösung’ (Abschnitt 6.1.2) und des ’grundlegenden Schemas’ (Abschnitt 6.2.1) untersucht. Mit Hilfe des funktionalen Schemas (Abschnitt 6.2.2) sollen im nächsten Abschnitt die Einflüsse der Anforderungen auf die Komponenten des Informationssystems in Abhängigkeit vom Informationsfluß abgeleitet werden. 6.2.4 Anfoderungsprofil für eine iterative Lösungsmethode Im zweiten und letzten Schritt zur Veranschaulichung der praxisorientierten Anwendung des Lösungsvorschlags (’Technisches Gestaltungsmodell’) werden alle im vorangegangenen Abschnitt aufgelisteten, spezifischen Systemanforderungen mit Hilfe des funktionalen Schemas in eine Arbeitstabelle (’Anforderungsprofil für eine iterative Lösungsmethode’) eingetragen, wodurch die Beziehungen zu den unterschiedlichen Komponenten des Schemas dargestellt werden. Die Lösungsmethode Die Methode zur vollständigen Korrektheit des Gestaltungskonzepts erfolgt über mehrere Analyse-Schritten durch die ganze Tabelle. Das heißt, die Auswertung der Anforderungen findet ’iterativ’ statt. Es wird solange durch die gesamte Tabelle iteriert, bis eine korrekte Zuordnung jeder Anforderung zu den Komponenten des funktionalen Schemas erkannt wird. Die zwei wichtigsten Merkmale dieser Methode lassen sich somit wie folgt zusammenfassen: Iterative Betrachtung des Gesamtproblems (laut Anforderungsprofil) Eindeutige Zuordnung von Teilproblemen zu spezialisierten Komponenten des funktionalen Schemas Der Vorteil dieser iterativen Lösungsmethode anhand des Anforderungsprofils besteht darin, dass durch die oben erwähnten Merkmale auf technische und taktische Feinheiten der Gesamtkonzeption geschlossen werden kann. Das Ergebnis der praktischen Anwendung des technischen Gestaltungsmodells auf die Anforderungen an ein wissensbasiertes Informationssystem für transnationale Konzerne wird in Kapitel 6 - LÖSUNGSVORSCHLAG Seite 139 [Tab. 6.2a-c] dargestellt (entsprechend der im Abschnitt 6.2.3 erstellten Liste). Die einzelnen Komponenten und Subkomponenten des funktionalen Schemas wurden in den Spalten der Tabelle so angeordnet, dass jede Zeile (Anforderung) eine eindeutige und unabhängige Zuordnung erhalten kann. In [Tab. 6.2a-c] wurden die Komponenten aus Platzgründen mit Nummern, wie folgt, versehen: 1: Zugang 2: Erkennung 3: Semantik & Auffindung 3a: Organisationssysteme 3b: Metadaten 3c: Navigation 3d: Suche 4: Sicherheit 5: Basis Anforderungen an das Informationssystem (Wirkungsbereich Organisation) Gliederungsart bzw. Organisationsform des Konzerns Ist-/Soll-Stand der technischen Infrastruktur Spezielle Applikationen Rollenkonzept Authentifizierung Autonomie mancher Unternehmensbereiche Tools zur Steigerung der Kollaboration Tools zur Steigerung der Kommunikation Komponente 3 1 2 4 5 a b c d Globale Kriterien bzgl. Informationszugang und -darstellung: ortsgerecht anwendungsgerecht zeitgerecht bedarfsgerecht anwendergerecht zielgerecht sicherheitsgerecht kostengerecht Unternehmnesspezifische Organisationssysteme Überwindung von sozialen und kulturellen Barrieren Handhabung der Wissensbausteine Modellierung spezifischer Geschäftsprozesse Tabelle 6.2a: Anforderungsprofil bzgl. des Wirkungsbereichs ’Organisation’ zur iterativen Lösungsmethode mit Hilfe des funktionalen Schemas. Kapitel 6 - LÖSUNGSVORSCHLAG Seite 140 Anforderungen an das Informationssystem (Wirkungsbereich Inhalt & Semantik) Qualitäts und Relevanz von Informationseinheiten Einsatzmöglichkeiten von Klassifikationsschemata Einsatz spezifischer Metadatensätze Begriffliche Strukturierungen Unterschiedliche bedarfsgerechte Sichtweisen Ressource Discovery vrs. Information Retrieval Anwendung von Ontologien Semantische Suche Lebenszyklus von Dokumenten Personalisierte Dienste Funktionalität der Themenhierarchie 1 Komponente 3 2 4 a b c d 5 Tabelle 6.2b: Anforderungsprofil bzgl. des Wirkungsbereichs ’Inhalt & Semantik’ zur iterativen Lösungsmethode mit Hilfe des funktionalen Schemas. Anforderungen an das Informationssystem (Wirkungsbereich Technik) Inhaltserschließung und – analyse Kriterien und Implementierung der Datenreplikation Implementierung vom Verteilungsgrad des Systems Implementierung der Systemstransparenz Ortstransparenz Migrationstransparenz Zugriffstransparenz Replikationstransparenz Nebenläufigkeitstransparenz Parallelitätstransparenz Skalierungstransparenz Leistungstransparenz (Performanztransparenz) Archivierungskriterien und Datenverwaltung Implementierung spezifischer Applikationen Implementierung spezifischer Funktionseinheiten Metadatenverwaltung Sicherheitskriterien Einsatz von Standards, Technologien, Formaten Überprüfung der Systemstabilität und -zuverlässigkeit Dynamik der Bereitstellung von Informationseinheiten Dynamik des Wissensretrievals Implementierung der Themenhierarchie Zweckgebundene Systemdienste Benutzerdienste Netzwerkdienste Komponente 3 1 2 4 a b c d 5 Tabelle 6.2c: Anforderungsprofil bzgl. des Wirkungsbereichs ’Technik’ zur iterativen Lösungsmethode mit Hilfe des funktionalen Schemas. Kapitel 6 - LÖSUNGSVORSCHLAG Seite 141 Bei der Analyse der Systemanforderungen mit Hilfe des funktionalen Schemas soll im Allgemeinen versucht werden, jede Anforderung einer oder mehreren Komponenten ’funktional’ zuzuordnen. Der Hintergedanke hinter diesem Zuordnungsprozeß führt gleichzeitig zu einer Auseinandersetzung mit dem logischen Entwurf der gesuchten technischen Lösung und mit den möglichen Implementierungsmechanismen, welche von den betroffenen Disziplinen zur Verfügung gestellt werden (entsprechend des im ersten Abschnitt dieses Kapitels dargestellten Arbeitsmodells). Am Beispiel der ersten Eintragung in [Tab. 6.2a]soll dieser Sachverhalt verdeutlicht werden. Die Gliederungsart des Konzerns, welche vom Informationssystem abgebildet werden soll, entspricht einer strategischen Überlegung. Deshalb wurde dieser Aspekt dem Wirkungsbereich Organisation zugeordnet. Die Gliederungsarten eines Unternehmens werden in der Konzeption der Lösung einbezogen, weil die Zugangsstruktur bzw. das strukturelle Zugangskonzept des Systems und deren Navigationselemente damit vollständig beschrieben werden sollen. Dies könnte beispielsweise zu der Entscheidung führen, dass mehrere Portale, welche eine bestimmte Gliederungsart strukturell abbilden, ’hierarchisch angeordnet’ implementiert werden sollen. Die taktische Isolierung dieses Aspekts nach der Untersuchung anhand des funktionalen Schemas (Abschnitt 6.2.2) ergibt insgesamt einen Einfluß auf vier Komponenten, wie folgt: Zugang (wegen der strukturellen Eigenschaft des Aspekts) Organisationssysteme (wegen der semantischen Natur des Aspekt), Navigation (wegen einer eventuellen Implementierung von dynamischer Erzeugung und Modifizierung von Portalen) und Basis (wegen der Erfassung und Verwaltung eines Portals als ’Informationsobjekt’ innerhalb der Datenbank bzw. des Organisationsgedächtnisses). Schließlich kann aus dem ’Arbeitsmodell zur allgemeinen Sichtweise der Lösung’ (siehe Abschnitt 6.1.2) entnommen werden, dass diese strategische Entscheidung von der Hauptdisziplin Wissensmanagement getroffen wird. Falls diese Lösungsmethode den gesamten Konzeptionsvorgang des Informationssystems begleitet, so wird die Erfüllung der Anforderung (die Implementierung der Lösung) zunehmend von den Bereichen Informationsmanagement bzw. Wissensorganisation übernommen. Ob nun die Lösung des Problems durch eine spezielle begriffliche Struktur oder durch eine gewöhnliche statische Baumstruktur im System gelöst wird, hängt mit anderen technischen Aspekten zusammen. Die Analyse dieser speziellen Anforderung bezüglich des Wirkungsbereichs Organisation hat lediglich einen strategischen Hintergrund. Auf gleiche Weise wurden alle anderen kritischen Aspekte in [Tab. 6.2a-c]untersucht und eingetragen. Die endgültige Zuordnung von spezifischen Teilproblemen zu den unterschiedlichen Komponenten hängt vom konkreten Anforderungsprofil eines spezifischen Unternehmens ab. Somit stellt die in [Tab. 6.2a-c]angegebene Auswertung lediglich die Meinung des Autors der vorliegenden Arbeit zur allgemeinen Problematik dar, und kann deshalb als Bezugskriterium zur genauen Beurteilung einer konkreten Aufgabenstellung dienen. Beispiel für die Anwendung des funktionalen Schemas zur Lösung einer spezifischen Aufgabenstellung Die gewählte Darstellungsform der Komponenten des funktionalen Schemas laut [Abb. 6.8] ergibt sich aus der Notwendigkeit, die dynamische und flexible Interaktion zwischen den Modulen in der Komponente ’Semantik & Auffindung’ sichtbar zu machen. Um zum Beispiel den Informationsfluß bei einer beliebig formulierten Suchanfrage über ein Kapitel 6 - LÖSUNGSVORSCHLAG Seite 142 Klassifikationsschema zu modellieren, könnte man den in [Abb. 6.9] beschriebenen Lösungsansatz wählen. Administrierung Erstellung Bereitstellung Der Benutzer A verschafft sich Zugang zum System über das Portal 1 und startet eine Suchanfrage. Das System nimmt die Rolle des Benutzers über die Komponente Erkennung wahr, aktiviert den Suchmechanismus über die vorgewählte Sichtweise (zum Beispiel ein selbstdefiniertes Klassifikationsschema) und holt sich aus dem Gesamtsystem (unter Berücksichtigung des Zugriffskonzepts) alle für die Suchanfrage relevanten Informationseinheiten. Der ’semantisch gültige Bereich’ bei der Suche im Unternehmensgedächtnis ergibt sich aus der partiellen Sichtweise der Komponente Organisationssysteme. Die Ergebnisse werden aus der Basis geholt und über die Navigationskomponente dem Benutzer zur Verfügung gestellt. Eine Aufgabe der Administrierung von Information könnte hierbei darin bestehen, dass das Informationssystem unter Umständen den Zugriff auf ein bestimmtes Replikat ermöglichen sollte, um – zum Beispiel - die Performanz des Netzwerkverkehrs zum Standort des Benutzers A zu steigern bzw. zu optimieren. Abbildung 6.9: Beispiel für den Pfad des Informationsflusses für eine (fiktive) Suchanfrage in einem wissensbasierten Informationssystem für transnationale Konzerne Bei diesem - fiktiven und vereinfachten - Beispiel ist somit ersichtlich geworden, dass manche Komponenten des Schemas nicht immer ins Spiel kommen müssen. In diesem Fall wurde einerseits die Komponente Metadaten bei der Anfrage übersprungen, andererseits kam nur die Navigationskomponente bei der Antwort des Systems ins Spiel. Kapitel 6 - LÖSUNGSVORSCHLAG Seite 143 Vorteile des technischen Gestaltungsmodells Einige wichtige Vorteile der Anwendung des in diesem Kapitels entworfenen technischen Gestaltungsmodells lassen sich wie folgt auflisten: Verwendung von einheitlichen Systemkomponenten Abstimmung der Mangementstrategie mit der technischen Lösung Klare Definitionen von Abläufen und Prozessen Einführung in die Problematik in analytisch kleinen Schritten, danach relativ schnelle iterative Konzeption der technischen Lösung Hohes Integrationspotential von Systemteilen Genaue Erfassung und Meßbarkeit der Ziele Übersichtliche Spezifikationen der Kundenverantwortlichkeiten Risiken des technischen Gestaltungsmodells Die Risiken bei der Anwendung des Modells sollen an dieser Stelle nicht unerwähnt bleiben. Da viele transnationale Konzerne keine andauernde statische Struktur aufweisen, ist die Suche nach einer nachhaltigen Lösung aus einer Strategie heraus stark von den momentanen Gegebenheiten der Infrastruktur abhängig. Weiters ist es in der Praxis sehr schwer aus den gestreuten Verantwortlichkeiten des Unternehmens allgemein gültige Anforderungen herauszuarbeiten. Aus diesen Gründen empfiehlt es sich, eine Gruppe von Fachexperten aus den unterschiedlichen Fachgebieten und Unternehmensbereichen intensiv zusammenarbeiten zu lassen, um gemeinsam für die komplexen Anforderungen des großen und geographisch verteilten Unternehmens effiziente und effektive Lösungen zu finden. 6.3 Zusammenfassung Es wurde in diesem Kapitel der Versuch unternommen, anhand der Erkenntnisse des Untersuchungsbereichs die Aktionsbereiche und Einflüsse der Hauptdisziplinen (Wissensmanagement, Informationsmanagement, Datenmanagement und Wissensorganisation) mit Hilfe eines gemeinsamen Arbeitsraumes möglichst präzise zu definieren. Das Ziel war die technische Lösung zur Konzeption eines wissensbasierten Informationssystems für transnationale Konzerne zu finden. In diesem Kontext konnten sicherlich nicht alle kritischen Aspekte für die Konzeption berücksichtigt werden, da es keine allgemeine Lösung für alle Arten von Konzernen gibt. Mit der Anwendung des ’technischen Gestaltungsmodells’ können aber viele Teilprobleme auf übersichtliche und effiziente Weise gelöst werden. Die Komponenten des funktionalen Schemas stellen wichtige Teile jedes Informationssystems dar, und erlauben somit eine gute Annäherung zu einer Gesamtmodellierung der komplexen semantischen Informationsaufbereitung in stark verteilten und vernetzten Strukturen. Das nächste Kapitel zeigt beispielhaft die Anwendung des hier vorgestellten Gestaltungsmodells anhand eines konkreten Intranetprojekts für einen anonymisiert dargestellten transnationalen Konzern. Kapitel 7 – IMPLEMENTIERUNG DES SYSTEMS Seite 144 Kapitel 7 Implementierung des Systems Die in diesem Kapitel beschriebene Implementierung des Systems basiert auf der konkreten Gestaltung eines Informationssystems für einen technischen transnationalen61 Konzern, welcher anonymisiert (und daher nicht im Detail) vorgestellt wird. Der Autor der vorliegenden Arbeit, als Mitglied der Web Applications Group des Instituts für Informationsverarbeitung und Computergestützte neue Medien der Technischen Universität Graz (WAG-IICM Graz), begleitete die Gesamtkonzeption des Informationssystems und arbeitete bei der Implementierung aller Module und Applikationen mit. Aufgrund des Kundenwunsches und des umfangreichen Erfahrungsspektrums der WAG-IICM fiel die Entscheidung für die Implementierung der Intranetumgebung auf den Einsatz eines Hyperwave Information Servers. Deshalb wird der Kern des in diesem Kapitel beschriebenen Informationssystems durch die technologischen Möglichkeiten und die Architektur des Hyperwave Information Servers62 (Version 5.5 SP2) gebildet. Aus diesem Grund wird im Unterkapitel 7.1 ’Hyperwave Information Server’ eine Einführung in die Funktionalität dieses Systems dargelegt, wobei lediglich die besonderen Eigenschaften im Kontext der vorliegenden Arbeit hervorgehoben werden. Im Unterkapitel 7.2 ’Allgemeine Problembeschreibung’ werden die wichtigsten Merkmale des transnationalen Konzerns präsentiert. Es werden strukturelle und funktionale Eigenschaften beschrieben, und daraus kritische Problembereiche anhand des im Abschnitt 6.2 vorgestellten Technischen Gestaltungsmodells ermittelt. Das Unterkapitel 7.3 ’Technische Implementierung’ befaßt sich mit der technischen Lösung des Systems auf der Basis des Hyperwave Servers. Die Beschreibung des grundlegenden Lösungsszenarios wird von einer Untersuchung der Zusammenhänge mit dem Technischen Gestaltungsmodell begleitet, und aus einer allgemeinen Sichtweise beleuchtet. Um die konkrete Umsetzung auf dem Hyperwave Information Server zu demonstrieren, werden dann zwei Teilkomponenten (Module) aus der Gesamtlösung ausgewählt. Die Auswahl dieser Module (’Metadatensätze’ und ’News Applikation’) erfolgte aufgrund der direkten Einflüsse von den bisher untersuchten Disziplinen und der expliziten Zusammenhänge mit den Komponenten des im Kapitel 6 erstellten Technischen Gestaltungsmodells. 7.1 Hyperwave Information Server Insbesondere transnationale Konzerne sind daran interessiert, eine Gesamtlösung für ihr Informationssystem, wodurch ihre Geschäftsprozesse effizient und profitabel abgewickelt werden, zu finden. Moderne wissensbasierte Informationssysteme sollen also in der Lage sein, die richtige Information zum richtigen Zeitpunkt an der richtigen Stelle zur Verfügung zu stellen. Bei der webbasierten Hyperwave Infrastruktur handelt es sich um eine integrierte und konfigurierbare Produktfamilie für Wissensmanagement und eLearning, die mehrere technische Lösungsbereiche umfasst, zum Beispiel Document Management, Content Management, Für die Anwendung des Begriffs ’transnational’ sei an dieser Stelle auf die im Abschnitt 1.2 ’Transnationale Konzerne’ eingeführte Interpretation des Autors der vorliegenden Arbeit verwiesen. 62 http://www.hyperwave.com 61 Kapitel 7 – IMPLEMENTIERUNG DES SYSTEMS Seite 145 Archivierung mit Konfigurationsmanagement, spezielle Suchfunktionalität, beliebig erweiterbare Metadaten, Wissensportale, automatisches Link Management, Workflow, Teamwork Spaces, eLearning, und andere. Die Funktionsweise des Hyperwave Information Servers ist vielseitig und umfassend in ihrer Anwendbarkeit. Dieser Abschnitt soll keine technische Übersicht aller Besonderheiten des Systems darstellen, sondern eine Auswahl von interessanten Funktionen und Vorteilen im Kontext der vorliegenden Arbeit beschreiben. Für eine detaillierte technische Beschreibung der Architektur, Funktionalität, Administration, Bedienung und Programmierung des Hyperwave Information Servers sei deshalb an dieser Stelle an die offizielle Dokumentation (Handbücher, Informationsbroschüren und White Papers) der HYPERWAVE AG63 oder an wissenschaftliche Arbeiten des IICM-TU-Graz64 hingewiesen. Der Inhalt dieses Abschnitts basiert auf folgenden im Literatur- und Quellenverzeichnis angegebenen Unterlagen: [Hyperwave 2001a-c], [Hyperwave 2001a-c], [Kappe 2001], [Schwarzmann 1999] und [Stadlmann 1999]. Dateninhalte, insbesondere Dokumente jeglichen Typs, werden auf dem Hyperwave Information Server in Form von Objekten abgelegt. Diese werden also in einer objektorientierten Art verwaltet und organisiert. Jedem Dokument werden dabei bestimmte Metadaten (in Hyperwave Objektattribute genannt), welche Eigenschaften des entsprechenden Dokuments beschreiben, zugewiesen. Neben der eigenen objektorientierten Datenbank von Hyperwave, welche speziell auf die Anforderungen eines stark verteilten Informationssystems abgestimmt ist, kann das System auch mit anderen Datenbanksystemen - Oracle 8i (ab Version 8.1.7) und Microsoft SQL Server 2000 - arbeiten. Neben den Dokumentobjekten stellt der Hyperwave Information Server eine zweite Art von Strukturelementen zur Verfügung, genannt Containerobjekte. Diese Art von Objekten stellt Strukturierungsmöglichkeiten, welche eine hierarchische Modellierung (d.h. hierarchische Baumstruktur) von Informationseinheiten ermöglichen, dar. Die in einem Container enthaltenen Elemente werden von Hyperwave Children65 genannt, wodurch sich die bekannte Parent-ChildBeziehung ergibt. Man kann zwischen zwei Arten von elementaren Containertypen unterscheiden: statische und dynamische Container. Diese Unterteilung basiert nicht auf die Funktion von Containerobjekten aus Benutzersicht, sondern auf die Art der Speicherung von Objekten in diesen Strukturelementen aus administrativer Sicht. Die wichtigsten statischen Strukturierungselemente sind Collection, Cluster und Sequence. Collections können sowohl Dokumente als auch andere Containertypen enthalten, und können deshalb mit gewöhnlichen Verzeichnishierarchien in Dateisystemen verglichen werden. Eine spezielle Art von Collections, die Sequence, legt für die darin enthaltenen Objekte eine bestimmte Navigationsreihenfolge fest, und kann deshalb als geordnete Liste aufgefasst werden. Ein Cluster hingegen fasst die darin enthaltenen Dokumente als eine einzige Einheit zusammen. Es existieren folgende drei unterschiedliche Typen von Clustern: Multicluster, Alternative Cluster und Language Cluster. Die in Multiclustern enthaltenen Dokumentenobjekte werden simultan und untereinander so dargestellt, als wären sie ein einziges großes Dokument. Dadurch könnten mehrere geographisch verteilte Benutzer jeweils ’den’ Teil des großen Dokuments, für den sie zuständig sind, bearbeiten, ohne ständig das ’große zusammenhängende’ Dokument herunterladen zu müssen. Die Vorteile dieses Sachverhalts liegen auf der Hand: aus der Sicht des Benutzers wird 63 http://www.hyperwave.com IICM: Institut für Informationsverarbeitung und Computergestützte neue Medien an der Technischen Universität Graz, Österreich. URL: http://www.iicm.edu 65 Es werden in diesem Abschnitt deutschsprachige Übersetzungen mancher Begriffe aus praktischen Gründen vermieden, da sie fixer Bestandteil der Hyperwave-Fachsprache sind. 64 Kapitel 7 – IMPLEMENTIERUNG DES SYSTEMS Seite 146 die Übersicht verbessert, aus der Sicht des Unternehmens die Synchronisation der Arbeitsteilung erleichtert, und aus technischer Sicht die Datenverkehrsbandbreite optimiert. Ein Alternative Cluster wählt eines der darin enthaltenen Dokumente in Abhängigkeit von den Benutzereinstellungen aus. Gleiche Bilder können somit in unterschiedlichen Auflösungen gespeichert, und je nach verwendeter ’Bandbreite’ des Benutzers in entsprechender Qualität zur Verfügung gestellt werden. Die Einstellung kann beispielsweise auch nach unterschiedlichen Formaten des Dokuments optimiert werden. Letztlich werden in Language Clustern enthaltene verschiedensprachige Versionen von Dokumenten in Abhängigkeit von der benutzerdefinierten Sprache präsentiert (wodurch eine Form der bedarfs- und benutzergerechten Lieferung von Wissen fixer Teil des Hyperwave Standards ist). Einige Anforderungen bezüglich der Mehrsprachigkeit bei transnationalen Konzernen können über diesen Mechanismus der Dokumentenverwaltung erfüllt werden. Wie aus der Beschreibung der statischen Strukturelemente ersichtlich wurde, zeichnen sich Containerobjekte im Hyperwave Information Server dadurch aus, dass sie auch ein bestimmtes Verhalten aufweisen. Dies verleiht der Berücksichtigung von den dynamischen Strukturelementen eine besondere Bedeutung im Kontext der vorliegenden Arbeit. Damit sind die Objekte Search Query und Document Class gemeint. Das Objekt Search Query leitet sich vom Containertyp Collection ab und kann deshalb auch statische Elemente beinhalten. Das besondere am Search Query Objekt sind seine nach einer vordefinierten Suche mitgespeicherten Metadaten, welche kontextuell bzw. semantisch zusammengehörende dynamische Objekte als Children beschreiben. Das heißt, spricht man ein Search Query Objekt an, werden seine statischen und die, aufgrund der Metadaten definierten Suche, dynamischen Children automatisch präsentiert. Das Konzept der Document Classes ermöglicht den Benutzern des Systems die Festlegung und Anwendung neuer Datentypen mit selbstdefiniertem Verhalten, um spezielle Anforderungen von zweckspezifischen Applikationen zu erfüllen. Document Classes stellen abstrakte Datentypen innerhalb des Servers dar und werden, im vereinfachten Fall, als Erweiterungen der Basistypen Document, Object oder Collection deklariert. Document Classes bilden den programmiertechnischen Grundstein der in den nachfolgenden Abschnitten beschriebenen Implementierungsmodule. Analog zur Festlegung einer Klasse in der objektorientierten Programmierung können Dokumentenklassen abgeleitet, dazugehörige Methoden übernommen oder überschrieben, Instanzen davon erzeugt und vernichtet werden, usw. Der herausragende Unterschied zwischen dem Verhalten von Dokumentenklassen in Hyperwave und den Klassen der allgemein bekannten objektorientierten Programmierung liegt in der Persistenz der erzeugten Instanzen. Die während der Ausführung eines objektorientierten Programms erzeugten Instanzen verschwinden automatisch nach der Beendigung desselben. Dokumentenklassen hingegen sollen solange auf dem Hyperwave Server ’leben’, bis der Benutzer sie explizit löschen will; besitzen also ein persistentes Verhalten. Die technische Implementierung von Dokumentenklassen für die Lösung von spezifischen Applikationen wird in den folgenden Unterkapiteln anhand ausgewählter Implementierungsmodule beschrieben. Ein weiterer spezifischer Objekttyp im Hyperwave Information Server ist zugleich ein Mechanismus zur Benutzer- und Gruppenverwaltung. Die Eigenschaften von Benutzern werden als eine Informationseinheit erfaßt, und in einem Benutzerobjekt gespeichert. ’Registrierte Benutzer’ können sich am System identifizieren, eine bestimmte Rolle einnehmen (z.B. einer besonderen Gruppe angehören) und dadurch den vollen Funktionsumfang des Hyperwave Information Servers nutzen. Im Gegensatz dazu können ’anonyme Benutzer’ bloß innerhalb des Systems navigieren, erhalten also vom System - im Sinne des im vorangegangenen Kapitels definierten Informationsflusses - nur Leserechte auf die Informationseinheiten. Identifizierte Benutzer nützen zusätzlich den Schreib- bzw. Bearbeitungsmodus des System aus, und dürfen Kapitel 7 – IMPLEMENTIERUNG DES SYSTEMS Seite 147 deshalb beispielsweise Dokumente editieren, Metadaten modifizieren, spezielle Sichtweisen vom System anfordern, usw. Durch die Vergabe eines Attributes zur Beschreibung der Rechte auf Informationseinheiten kann festgelegt werden, welche Benutzer bzw. Benutzergruppen Zugriff auf ein bestimmtes Objekt besitzen. Mit der Kombination dieser effizienten Mechanismen (Benutzer-, Gruppenverwaltung und Rechtevergabe) ist der Punkt Sicherheit aus der Sicht des Document Managements weitgehend gelöst. Ein besonderes Charakteristikum des Hyperwave Servers wird durch das zur Verfügung gestellte Link Management dargestellt. Links werden im Hyperwave Server getrennt vom Dokumentenobjekt gespeichert und verwaltet. Sie sind bidirektional definiert, wodurch die Möglichkeit besteht, für ein bestimmtes Dokument herauszufinden, welche Links von diesem auf andere Objekte verweisen, aber auch welche anderen Dokumente auf dieses selbst referenzieren. Durch dieses konsistentgehaltene Link Management werden ’Dokumentenleichen’ und demzufolge auch ’tote Links’ (engl.: ’dead links’ oder ’broken links’) verhindert, d.h. wird ein Dokument gelöscht, so werden automatisch alle auf dieses Objekt verweisenden Links auch gelöscht. Da Links selbst als Objekte realisiert werden, können sie mit Metadaten versehen werden, wodurch sie zum Beispiel lediglich für bestimmte Benutzergruppen sichtbar oder auffindbar sind. Eine interessante Anwendung von HyperwaveLinkobjekten ist die Möglichkeit, Benutzern das Recht zu geben, sonst nur lesbaren Dokumenten auch Annotationen beizufügen, ohne den tatsächlichen Dokumenteninhalt modifizieren zu dürfen. Bezüglich der Architektur des Hyperwave Information Servers, ist das sogenannte ’proxy client server’-Systemmodell von besonderer Bedeutung. Dabei wird jeder Client (Benutzer) lediglich mit ’dem’ Server (auch ’local server’ oder ’proxy server’ genannt) verbunden, der die beste Verbindung, hinsichtlich Bandbreite, zu ihm aufweist. Da die Benutzer stets nur mit einem einzigen Server kommunizieren, muss die Verbindung nur einmal aufgebaut werden, und kann so lange bestehen, bis der Benutzer sich entweder abmeldet oder ein Timeout (bestimmte Zeitspanne) erfolgt. Insbesondere bei der Lösung von Intranetsystemen für große und geographisch verteilte Unternehmungen spielt die Möglichkeit der physikalischen Serververteilung auf mehreren Standorten eine sehr wichtige Rolle. Hyperwave unterstützt diese Option durch das Konzept namens Server Pool. Mehrere dadurch definierte Hyperwave Server fungieren somit als ein einziger, großer, zentraler Server mit einem für den Benutzer transparenten und lokal erscheinenden Datenbestand. Die Konsistenz und Integrität von Datenbeständen, zum Beispiel beim Verschieben von Dokumenten von einem Server zu einem anderen, wird durch das zuvor erwähnte Link Management gewährleistet. Ein weiterer Vorteil für die Verwendung eines Hyperwave Server Pools ist die zur Verfügung gestellte Möglichkeit, ein einziges und global geltendes Benutzerverzeichnis von allen beteiligten Servern zu nutzen und zu verwalten. Aus programmiertechnischer Sicht kann das Verhalten des Hyperwave Servers verändert werden, indem in die Wavemaster Templates eingegriffen wird. Die dadurch definierten und im Dateisystem liegenden Dateien werden (je nach Bedarf) nach jedem Server Request durchlaufen, und sind hauptsächlich für die optische Darstellung und Manipulation von Objekten zuständig. Die Programmierung der Templates erfolgt entweder durch die Hyperwave-spezifische Programmiersprache Place oder durch Server Side Javascript. Hyperwave arbeitet aber auch mit offenen Internettechnologien, z.B. Java, XML oder CGI, und ermöglicht deshalb effiziente Lösungen oder Anbindungen zu ’fremden’ Modulen. Ein herauszuhebender Vorteil dieses Sachverhalts, insbesondere für das Informationssystem eines transnationalen Konzerns, ist die flexible Festlegung von ’anpaßbaren Sichtweisen’ (engl.: ’customized views’). Customized views ergeben sich aus der gemeinsamen Nutzung von maßgeschneiderten Templates, spezialisierten Dokumentenklassen und Linkobjekten mit Kapitel 7 – IMPLEMENTIERUNG DES SYSTEMS Seite 148 besonderer Rechtevergabe. Dadurch kann man zum Beispiel je einen spezifischen Navigationspfad für unterschiedliche Benutzergruppen innerhalb eines besonderen Strukturelementes erzwingen. Die Suchfunktionalität innerhalb eines Informationssystems wird umso wichtiger und komplexer, je größer der eingeschlossene Informationsraum ist. Der von Hyperwave standardmäßig zur Verfügung gestellte Suchmechanismus erlaubt das gezielte Auffinden von Dokumentenobjekten über indizierte Metadaten oder Boolean Kombinationen. Eine Textsuche über den Inhalt von Dokumenten wird auch standardmäßig zur Verfügung gestellt (Volltextsuche66). Demzufolge unterscheidet man zwischen ’einfacher Suche’ (d.h. Suche über indizierte Metadaten plus Volltextsuche) und ’erweiterter Suche’ (frei konfigurierbare Suche mit zusätzlichen Features). In Bezug auf den Informationsraum können Suchbereiche (engl.: ’search scopes’) ausgewählt werden, die dem Benutzer die Möglichkeit geben, eine eingeschränkte Suche auf bestimmte Strukturbereiche durchzuführen. Weiters kann eine Expertensuche auf Benutzerebene gestartet werden. Diese Funktionalität wird in Hyperwave ’Find Expert’ genannt und stellt eine klassische Anwendung im Bereich Wissensmanagement dar, wodurch eine Möglichkeit gegeben ist, auf das implizite Wissen des Unternehmens (also jenes in den Köpfen der Mitarbeitet) zugreifen zu können. Bei der Expertensuche wird vom Benutzer ein spezifisches Thema (engl.: ’topic’) definiert; das System wendet auf die Dokumente eine Kombination von Keyword- und Fulltextsuche an, analysiert die Dokumentenautoren und liefert eine Ergebnisliste von den Experten in der gesuchten Domäne (mit den entsprechenden Kontaktmöglichkeiten). Dies waren lediglich einige der besonderen Merkmale des Hyperwave Information Servers, welche für den Kontext der vorliegenden Arbeit und das Verständnis der nachfolgenden Abschnitte von großer Bedeutung sind. Mit speziellen Tools bzw. Komponenten, die in Form von Packages der Standardfunktionalität hinzugefügt werden, können ganz spezifische Anforderungen, insbesondere aus dem Bereich des Wissensmanagements, leicht und sehr effizient erfüllt werden. Beispiele aus dieser besonderen Produktpalette sind die ’eLearning Suite’, die ’Workflow Option’ oder das ’eKnowledge Portal’. Die Funktionalität und die Anwendungsmöglichkeiten des Hyperwave Information Servers werden anhand eines konkreten Beispiels in den folgenden Abschnitten näher gebracht. Zunächst soll aber das konkrete Szenario für eine große und geographisch verteilte Unternehmung gebildet und beschrieben werden. Im nächsten Unterkapitel werden die speziellen Eigenschaften des anonymisiert dargestellten technischen transnationalen Konzerns eine konkrete Arbeitsbasis für die Implementierung des Informationssystems ermöglichen. 7.2 Allgemeine Problembeschreibung Bevor die technische Lösung des wissensbasierten Informationssystems für den transnationalen Konzern vorgestellt wird, sollen zunächst besondere Charakteristika der anonymisiert dargestellten Unternehmung beschrieben werden. Einer globalen Beschreibung des Konzerns wird in diesem Unterkapitel eine spezifische Auflistung kritischer Problembereiche des zu implementierenden Informationssystems folgen. 7.2.1 Beschreibung des Konzerns Der in diesem Abschnitt präsentierte transnationale Konzern ist ein weltweit agierendes Technologie- und Serviceunternehmen, welches komplexe strukturelle und funktionale 66 Der Kunde kann hierfür zwischen den Suchmaschinen von Verity und Autonomy wählen. Kapitel 7 – IMPLEMENTIERUNG DES SYSTEMS Seite 149 Eigenschaften aufweist. Die graphische Darstellung dieser strukturellen und funktionalen Eigenschaften des transnationalen Konzerns zeigt Abhängigkeiten jeglicher Art zwischen den einzelnen Unternehmensbereichen, wodurch sich eine nicht sehr leicht verständliche Sichtweise der Gesamtproblematik - wie in [Abb. 7.1] graphisch dargestellt – ergibt. Das heißt, die Komplexität der Konzerneigenschaften wird durch diese Darstellung zwar eindeutig reflektiert, jedoch das gleichzeitige Zusammenwirken von den drei Dimensionen Struktur, Funktion und Standort verhindert einen klaren Einblick in die Problematik. Gruppe UB1 UB2 b F1 F2 F3 UB1a UB1b f UB3 c F1 F4 F5 e d i a UB4 d F6 F2 F7 F7 F6 F1 UB4a m Gruppe UB F a .. z .. a r UB4b c Gesamtgruppe bzw. Spitzeneinheit Unternehmensbereich bzw. Teileinheit Funktionaleinheit Funktionale Abhängigkeit Strukturelle Abhängigkeit Standort Abbildung 7.1: Organisationsform des transnationalen Konzerns Aus diesem Grund wird eine Trennung der Organisations- und Funktionslogik bevorzugt. Die Struktur der Unternehmensbereiche (Organisationslogik) des transnationalen Konzerns ist transparent bezüglich Standorte definiert, und folgt dem in [Abb. 7.2] dargestellten hierarchischen Schema. Die Struktur der Funktionalbereiche (Funktionenlogik) des transnationalen Konzerns läßt sich (quasi)hierarchisch anordnen und wird anhand einer Themenhierarchie - wie in [Abb. 7.3] graphisch dargestellt - definiert. Die Trennung von Struktur und Funktionen erlaubt eine transparente und übersichtliche Sichtweise auf die Architektur des Konzerns. Gruppe Bereiche Unternehmen Bereich 1 Bereich 2 Bereich 3 Bereich 4 Unternehmen 1 Unternehmen 2 Unternehmen 3 Unternehmen 4 Unternehmen 5 Unternehmen 6 Unternehmen 7 Unternehmen 8 Unternehmen 9 ... Abbildung 7.2: Unternehmensbereiche des transnationalen Konzerns (Darstellung der obersten Schichte der Hierarchie) Kapitel 7 – IMPLEMENTIERUNG DES SYSTEMS Seite 150 Der Konzern Allg. Informationen Mitarbeiter Fertigung & Entwicklung Standorte Produkte & Dienstleistungen Abbildung 7.3: Funktionalbereiche des transnationalen Konzerns (Darstellung der obersten Themenstruktur) Der transnationale Konzern besteht aus über 100 Tochter- und Beteiligungsgesellschaften und mindestens genau so vielen internationalen Vertriebsorganisationen. Der Hauptsitz des Unternehmens befindet sich zwar im deutschsprachigen Raum, jedoch aufgrund der weltweiten Präsenz stellt Englisch die Hauptsprache des Gesamtunternehmens dar. Diese beachtliche Internationalität entsteht aus der Integration von über 20.000 Mitarbeitern. Die weltweite Standortverteilung des Konzerns wird in [Abb. 7.4] graphisch dargestellt. Abbildung 7.4: Standortverteilung eines transnationalen Konzerns (fiktive Darstellung) Auf die bisher beschriebene Weise ließ sich die Größenordnung des Konzerns und dessen komplexe Organisation auf übersichtliche Weise darstellen. Demzufolge werden folgende Punkte als Hauptkriterien für weitere Untersuchungen festgelegt: Unternehmensbereiche Standorte Geschäftsfunktionen Mehrsprachigkeit Im Kontext der vorliegenden Arbeit wird unter dem Begriff ’Standort’ sowohl ein geographischer Punkt als auch eine Region verstanden. Das besonders bedeutende Charakteristikum der Mehrsprachigkeit wird hier repräsentativ für alle Aspekte infolge der starken Internationalität hervorgehoben. Der Grund dafür liegt darin, dass für ein Unternehmen, dessen Tätigkeitsbereich sich auf die Technik konzentriert (zumindest hauptsächlich) und aus vielen quasi autonomen Unterbereichen besteht, sich die sozialen und kulturellen Einflußfaktoren auf lokaler Ebene reduzieren und infolgedessen lösen lassen. Kapitel 7 – IMPLEMENTIERUNG DES SYSTEMS Seite 151 Genauer in das Innenleben des transnationalen Konzerns zu blicken ist an dieser Stelle auf Kundenwunsch nicht möglich und für den Kontext der vorliegenden Arbeit irrelevant. Viel wichtiger sind die Zusammenhänge zwischen diesen Hauptkriterien und der Tatsache, dass der Konzern eine sehr stark vernetzte und geographisch verteilte Architektur aufweist. Nun gilt es also, die wichtigsten Problembereiche bei der Gestaltung des Informationssystems zu identifizieren. 7.2.2 Auflistung kritischer Aspekte In diesem Abschnitt sollen für den anonymisiert dargestellten transnationalen Konzern einige der wesentlichsten Aspekte, welche auf die Informationsaufbereitung direkten Einfluß ausüben, identifiziert werden. Hierbei geht es darum, unternehmensspezifische Merkmale des Unternehmens informationstechnisch erfassen und formulieren zu können. Spezifische Anforderungen und Wünsche des Kunden sind in Form von Consultingtätigkeit und Diskussionsprozessen in die hier vorgestellte Auflistung von kritischen Aspekten eingeflossen. Die im Folgenden beschriebenen Aspekte stellen eine Auswahl der wichtigsten Anliegen des transnationalen Konzerns bezüglich des zu implementierenden Informationssystems dar. Diese ’Anforderungen’ werden hier thematisch formuliert und kurz besprochen, da sie sich aus den im Abschnitt 6.2.3 identifizierten Anforderungen vollständig ableiten lassen. Die technische Untersuchung der kritischen Aspekte (d.h. die Analyse und die Lösung anhand des im Kapitel 6 beschriebenen Technischen Gestaltungsmodells) und deren Umsetzung mit den technologischen Möglichkeiten des Hyperwave Servers werden im nächsten Unterkapitel unter Punkt 7.3.1 ’Allgemeine Lösung’ besprochen. Die strategische Anwendung des Grundlegenden Schemas (siehe Abschnitt 6.2.1) wird ab diesem Zeitpunkt streng vorausgesetzt und nicht mehr erwähnt, d.h. die Wirkungsbereiche werden stets implizit berücksichtigt. Die komplexen standortbezogenen, funktionalen und strukturellen Abhängigkeiten innerhalb des Konzerns - wie bereits im vorigen Abschnitt geschildert - stellen die wichtigsten Hauptkriterien bei der Untersuchung der Systemgestaltung. Ausgehend von Kundenwünschen, in Abhängigkeit von den Charakteristiken des transnationalen Konzerns (Abschnitt 7.2.1), und basierend auf den allgemeinen Anforderungen an ein wissensbasiertes Informationssystem (Abschnitt 6.2.3), ergibt sich folgende Auflistung von kritischen Aspekten: Technologiewahl und Architektur des Informationssystems Verfügbarkeit und Lebenszyklus von Datenbeständen Semantische Anreicherung der Datenbestände durch Metastrukturen Mehrsprachige Funktionalität des Systems Auffindung und Präsentation von Informationseinheiten Unternehmensspezifisches Rollenkonzept Dynamik und Modularität des Systems Erstellung und Nutzung von begrifflichen Strukturen Steigerung der Kollaboration und Kommunikation Spezifische Archivierungskriterien und Datenverwaltung Kapitel 7 – IMPLEMENTIERUNG DES SYSTEMS Seite 152 Diese identifizierten Aspekte sollen nun in Zusammenhang mit den im vorigen Abschnitt präsentierten Konzernmerkmalen kurz untersucht werden. Es soll damit verdeutlicht werden, welche Bedeutung sie für weitere technische Untersuchungen besitzen. Technologiewahl und Architektur des Informationssystems Die zugrundeliegende Technologie für das in diesem Kapitel beschriebene Informationssystem ist das Intranet. Besonders wichtig in diesem Zusammenhang ist das Verständnis der Auswirkungen dieser Technologie auf die Systemkomponenten und die Informationseinheiten. Empfehlenswert ist somit die Betrachtung des Intranets als Werkzeug zur Informationsverwaltung und nicht lediglich als Sammler von Dokumenten. Das heißt, der Schwerpunkt bzw. Hintergedanke bei der Nutzung der Intranettechnologie sollte hauptsächlich durch Aufgaben motiviert und nicht durch Dokumente repräsentiert werden. Der Grund hierfür liegt auf der Hand: Menschen benutzen Informationseinheiten, um bestimmte Aufgaben zu bewältigen. Die stark verteilte Organisationsstruktur des transnationalen Konzerns führt durch vereinfachte eindimensionale Darstellungsformen (z.B. funktionale oder regionale Gliederungen) meist zu sehr übersichtlichen hierarchischen Anordnungen in Form von einfachen Baumstrukturen (wie in [Abb. 7.2] und [Abb. 7.3] dargestellt). Die stark vernetzte Struktur der Geschäftsprozesse kann zu komplexeren Strukturierungen - meist in Form unübersichtlicher Graphen wie in [Abb. 7.1] dargestellt - führen. Die unterschiedlichen Darstellungsformen können für die Systemstruktur gleichzeitig Gültigkeit finden, lassen sich aber nur schwer innerhalb einer einzigen Strukturdarstellung erfassen, d.h. die in [Abb. 7.1] dargestellte Organisationsform gibt zwar die reale mehrdimensionale Komplexität der Konzernstruktur wieder, eignet sich aber für die Festlegung der Architektur des Informationssystems lediglich unter eingeschränkten Rahmenbedingungen bzw. für ganz spezifische Teilaufgaben. Die in diesem Kontext implizite konkrete Anforderung an das Informationssystem ist die Berücksichtigung von den standortbezogenen, funktionalen und strukturellen Abhängigkeiten bei der Festlegung der Systemarchitektur. Ein weiterer kritischer Punkt bezüglich Systemarchitektur stellt der Teilaspekt ’Verteilungsbzw. Zentralisierungsgrad des Systems’. Dieser Teilaspekt beschäftigt sich mit der Festlegung der Kriterien und Mechanismen, um die Realisierung eines effizienten Zugangsnetzes zu ermöglichen bzw. zu optimieren. Dieser Aspekt beinhaltet ebenfalls alle Maßnahmen, um den vollkommen transparenten Zugriff auf eine stark verteilte und vernetzte Architektur zu ermöglichen. Aus der unternehmerischen Sicht stellt dieser Aspekt auch eine nicht zu unterschätzende Kostenfrage dar. Diesbezüglich empfiehlt es sich, eine möglichst genaue Ist/Soll-Überprüfung der IT-Infrastruktur durchzuführen. Verfügbarkeit und Lebenszyklus von Datenbeständen Wie bereits im Abschnitt 5.1.2 ’Document Management und Contnet Management’ spielt die Untersuchung vom Lebenszyklus eines Dokuments innerhalb des Informationssystems (Lebensraumes des Dokument) eine besondere Rolle. Aus der Sicht des Document Managements sind hierbei Maßnahmen zu definieren, wodurch Erstellung, Publizierung, Organisation, Zugriff und Archivierung bzw. Vernichtung eines Dokuments effizient und effektiv implementiert werden. Im Bezug auf Content Management ist die Notwendigkeit von Mechanismen zu identifizieren, wodurch Erstellung, Kontrolle, Organisation und Präsentation der Inhalte von Dokumenten (’Lebenszyklus des Dokumenteninhalts’) auf dynamische Weise steuerbar werden. Kapitel 7 – IMPLEMENTIERUNG DES SYSTEMS Seite 153 In Bezug auf die informationstechnische Datenverwaltung in transnationalen Konzernen zählen meist Systemperformanz und Datenverkehr zu den wichtigsten Gründen für das Ergreifen von Maßnahmen zur Datenreplikation. Weiters erhöhen Replikationsmechanismen die Verfügbarkeit von Datenbeständen, da mehrere identische Objektquellen standortgerecht zur Verfügung stehen. Beim Einsatz von replizierenden Datenbanken kann eine Applikation nach dem Ausfall eines Systemknotens sofort an einem anderen Replikat weiterarbeiten. Damit kann man die Fehlertoleranz des gesamten verteilten Systems optimieren. Semantische Anreicherung der Datenbestände durch Metastrukturen Die unternehmens- bzw. benutzerspezifische Bedeutung eines Dokumentes, oder allgemeiner einer gespeicherten Informationseinheit, kann mit Hilfe von Zusatzinformation (Metadaten) präzise formuliert und explizit festgehalten werden. Unter diesem Aspekt sind Entscheidungen zu treffen, ob und wie Metadaten vom Informationssystem zu verwalten sind. Die semantische Informationsaufbereitung durch die Definition von Metadaten zu den einzelnen Einheiten des digital erfassten intellektuellen Kapitals erweist sich als sehr vorteilhaft, weil sie die Qualität bei der Inhaltserschließung erhöht und die Extraktion der Bedeutung vom Dokumenteninhalt vereinfacht. Mehrsprachige Funktionalität des Systems Von besonderer Bedeutung bei der Verwaltung von multilingual zur Verfügung stehenden Datenbeständen, ist die Repräsentation dieser semantisch identischen Informationseinheiten zu einzelnen Gruppenobjekten. Solche Informationseinheiten können einerseits ’physikalisch nahe’ (z.B. über deren gemeinsame Speicherung in speziellen Containerstrukturen), und andererseits ’virtuell nahe’ (z.B. über Clusteringmechanismen oder Topic Maps) verwaltet werden. Auffindung und Präsentation von Informationseinheiten Insbesondere die, von den Bereichen Resource Discovery und Information Retrieval zur Verfügung gestellten Mechanismen zur Modellierung und Auffindung von Informationseinheiten spielen unter diesem Aspekt (Auffindung und Präsentation) eine wichtige Rolle. Hierbei geht es grundsätzlich um die logische und technische Trennung von Layout und Inhalt des Datenbestands. Die Visualisierung und Präsentation von Inhalten des Organisationsgedächtnisses stellt eines der wichtigsten Aspekte bei der Konzeption eines Informationssystems für transnationale Konzerne dar, da sie den direkten ’visuellen’ Kontakt zum Benutzer herstellen und deshalb bei der Nutzbarkeit (engl.: ’usability’) des gesamten Systems eine wesentliche Rolle spielen. Unternehmensspezifisches Rollenkonzept Ein genau durchdachtes Rollenkonzept ist von essentieller Bedeutung für das Informationssystem eines transnationalen Konzerns, da es die allgemeine Benutzer- und Gruppenverwaltung darstellt, und demzufolge auf alle Operationen, welche von Zugriffsrechten abhängig sind, direkten Einfluß ausübt. Auf diese Weise kann eine zielgruppenorientierte Informationsverteilung und –aufbereitung die Informationsflut des Einzelnen vermindern. Dynamik und Modularität des Systems Unter ’dynamischen Strukturen’ sind alle Mechanismen oder Module zu verstehen, welche sich sowohl an strategische als auch an operative Spezifikationsänderungen anpassen können, und zwar unabhängig vom zeitlichen Auftreten der Änderung (d.h. kurz-, mittel- oder langfristig). Unter der Berücksichtigung von den Aspekten Dynamik und Modularität sollen alle technischen Kapitel 7 – IMPLEMENTIERUNG DES SYSTEMS Seite 154 Möglichkeiten behandelt werden, um in Zukunft auftretende Systemmodifikationen bewältigen zu können. Erstellung und Nutzung von begrifflichen Strukturen Wie bereits im Kapitel 5 ’Wissensorganisation’ ausführlich erörtert, stellen Aufbau und Nutzung von global geltenden Begriffssystemen eine effiziente Möglichkeit dar, um die semantische Beschreibung des intellektuellen Kapitals zu erleichtern. Die Vorteile der Anwendung von begrifflichen Strukturen sind vielfältig. Mit einer global definierten begrifflichen Struktur lassen sich, zum Beispiel, die Relevanz- und Präzisionskriterien des Wissenszugangs auf einer systematisch konzeptualisierten Ebene lösen. Bei dem Zusammenschluß von Unternehmungen - welche zum Beispiel in verschiedenartigen Fachbereichen spezialisiert sind - zu großen Konzernen, können unterschiedliche Begriffsstrukturen die Möglichkeit bieten, verschiedenartige Fachbereichsperspektiven über die Wissenseinheiten der Systemstruktur zu erzeugen. Steigerung der Kollaboration und Kommunikation Der Grund für die informationstechnische Anforderung einer Steigerung der Kollaboration und Kommunikation in einem großen Unternehmen ist meist die Verbesserung der Wissens(ver)teilung. Dieser Aspekt, welcher einen besonders hohen Stellenwert in der Hauptdisziplin Wissensmanagement besitzt, wird durch maßgeschneiderte Lösungen einem Informationssystem hinzugefügt. Erfüllt wird diese Anforderung zur Steigerung der Kollaboration und Kommunikation durch Tools, welche einen zentralen bzw. kontrollierten Wissensaustausch ermöglichen. Lösungen dieser Art werden zum Beispiel durch folgende Komponenten dargestellt: eLearning Plattformen, Diskussionsforen, Chat Systeme, Email Applikationen, Video Conferencing, usw. Spezifische Archivierungskriterien und Datenverwaltung Unter diesem Aspekt sollen Entscheidungen getroffen werden, welche beispielsweise den möglichen Einsatz von Datenbank- oder Filesystemen (oder einer Kombination aus beiden) bestimmen. Es sollen diesbezüglich auch Kriterien berücksichtigt werden, welche den Entwurf und die Verwaltung von Archivierungsstrukturen beeinflussen (Container-, Verzeichnisstrukturen, Vergabe der entsprechenden Zugriffsrechte, Einsatz spezialisierter Clusteringmechanismen, usw.). Fazit Die oben angegebene Auflistung von kritischen Aspekten wurde zwar auf allgemeine Weise formuliert, sie umfaßt aber die Gesamtproblematik in weiten Bereichen, sodass spezielle Anforderungen implizit von diesen Themenbereichen abgedeckt werden können. Im nächsten Abschnitt wird - ausgehend von dieser Auflistung - die technische Implementierung eines Informationssystems, welches diese kritischen Aspekte berücksichtigt (und demzufolge die Anforderungen vom Abschnitt 6.2.3 erfüllt), beschrieben. 7.3 Technische Implementierung In diesem Abschnitt wird das allgemeine technische Szenario des wissensbasierten Informationssystems für den im Unterkapitel 7.2 präsentierten transnationalen Konzern Kapitel 7 – IMPLEMENTIERUNG DES SYSTEMS Seite 155 beschrieben. Als technologische Plattform für die Implementierung dient der Hyperwave Information Server, welcher auch eine Vorgabe seitens des Kunden darstellt. Im Abschnitt 7.3.1 ’Allgemeine Lösung’ wird eine allgemeine Beschreibung des Gesamtsystems gegeben. Teillösungen aus diesem Gesamtkonzept wurden im Rahmen des Gestaltungsbereichs der vorliegenden Arbeit als Module im Hyperwave Information Server umgesetzt. Zwei davon werden in den Abschnitten 7.3.2 und 7.3.3 präsentiert. 7.3.1 Allgemeine Lösung Es werden in diesem Abschnitt, die wichtigsten Grundzüge der technischen Gesamtlösung eines Informationssystems für den im Unterkapitel 7.2 ’Allgemeine Problembeschreibung’ anonymisiert dargestellten transnationalen Konzern so hervorgehoben, dass folgende drei Ziele erreicht werden: Die Lösungsansätze sollen den Komponenten des Funktionalen Schemas aus Abschnitt 6.2.2 zuordenbar sein. Die technische Umsetzung des Informationssystems soll mit Hilfe der Technologie vom Hyperwave Information Server stattfinden. Die Lösung soll die im Abschnitt 7.2.2 vorgegebene Auflistung von kritischen Aspekten berücksichtigen. Um in diesem Abschnitt systematisch auf die Abschnitt 7.2.2 spezifizierten kritischen Aspekte verweisen zu können, wird eine nummerierte Liste, wie folgt, angegeben: ( I ) Technologiewahl und Architektur des Informationssystems ( II ) Verfügbarkeit und Lebenszyklus von Datenbeständen ( III ) Semantische Anreicherung der Datenbestände durch Metastrukturen ( IV ) Mehrsprachige Funktionalität des Systems ( V ) Auffindung und Präsentation von Informationseinheiten ( VI ) Unternehmensspezifiches Rollenkonzept ( VII ) Dynamik und Modularität des Systems. ( VIII ) Erstellung und Nutzung von begrifflichen Strukturen ( IX ) Steigerung der Kollaboration und Kommunikation ( X ) Spezifische Archivierungskriterien und Datenverwaltung Die Vorgehensweise bei der Beschreibung des Gesamtsystems wird aus praktischen Gründen in folgende Punkte unterteilt: - Architektur des Informationssystems - Eigenschaften vom gewählten Framework (Verhalten des Interfaces) - Datenverwaltung und Zugriffskonzept - Benutzer- und Gruppenverwaltung - Qualität von Informationseinheiten (Metastrukturen) Kapitel 7 – IMPLEMENTIERUNG DES SYSTEMS Seite 156 - Dynamik, Organisation und Navigation im System - Bedarfsgerechte Wissensauffindung (Suche in Hyperwave) - Verwaltung von Information höchster Priorität (Hotlines) Einige der besonderen Vorzüge des Hyperwave Information Servers wurden bereits im Abschnitt 7.1 geschildert. Zur Umsetzung des komplexen wissensbasierten Informationssystems für einen transnationalen Konzern fällt deshalb die Wahl auf den Hyperwave Information Server sehr leicht. Das Hyperwave System stellt ein Gesamtpaket, dessen Standardfunktionalität sämtliche Anforderungen einer Intranetlösung ’quasi auf einmal’ erfüllen kann, dar. Es sei an dieser Stelle auf den kritischen Aspekt (I) hingewiesen, wobei eine Anforderung bezüglich einer geeigneten Technologiewahl erfüllt (siehe Abschnitt 6.2.3) ist. Architektur des Informationssystems Die technische Zentralisation der Konzernstruktur aufgrund der Organisationsformen stellt zwar eine Möglichkeit zur Festlegung der Architektur des Informationssystems dar, muss aber nicht unbedingt die beste Lösung liefern. In den Abschnitten 4.1.2 ’Datenbanksysteme’ und 4.1.3 ’Verteilte Datenbanksysteme’ wurden die Vorteile und Nachteile von zentralisierten und verteilten Datenbanksystemen untersucht. In diesem Zusammenhang wird zwischen physikalischer und virtueller Struktur unterschieden, d.h. auch wenn Informationseinheiten tatsächlich in einer stark verteilten Struktur gespeichert werden, bleibt die virtuelle Struktur des Systems für den Benutzer völlig transparent. Unter der Berücksichtigung der im Abschnitt 7.1 geschilderten speziellen Features des Hyperwave Systems, wird eine verteilte Architektur nach dem ’proxy client server’Systemmodell gewählt. Für die nötige Transparenz des Systems sorgt die physikalische Serververteilung nach dem Server Pool Konzept, wodurch dem Benutzer des Intranets ein lokal erscheinender Datenbestand zur Verfügung gestellt wird. Um dennoch einen Mechanismus, welcher die zentrale Verwaltung von spezifischen Strukturen, Objekten oder Applikationen ermöglicht, zur Verfügung zu stellen, wird ein bestimmter Server als ’Master Server’ definiert. Dadurch lassen sich zum Beispiel globale Konfigurationen bewerkstelligen, zentral zu verwaltende Dokumente archivieren, alle Benutzer über ein einziges und global geltendes Verzeichnis verwalten, usw. Aufgrund dieser Festlegung wurde der kritische Aspekt (I) berücksichtigt, wobei die Komponente ’Basis’ des funktionalen Schemas (siehe [Abb. 6.8]) eindeutig definiert ist. Die Festlegung von einem strukturierten und zusammenhängenden Zugangsnetz im Informationssystem, welche als verteilte Portale der Intranetumgebung fungieren, erlauben einen strukturierten Zugang zu Mengen von Informationseinheiten. Die Verwaltung dieser Knoten kann zwar über den Master Server erfolgen, deren Inhalte (Strukturelemente der Portale) können aber über eine verteilte Architektur organisiert werden. Eine hierarchisch angeordnete Nutzung von Portalen (zum Zwecke des semantisch organisierten Zugangs oder Austausches) ermöglicht die direkte Darstellung von der in [Abb. 7.2] graphisch präsentierten Organisationsform des transnationalen Konzerns nach seinen Unternehmensbereichen. Durch das Konzept des Server Pools können stark autonome Unternehmensbereiche auf dem lokalen Server kritische Datenbestände vor nicht-lokalen Zugriffen absichern (zum Beispiel über die Definition einer besonderen Rechtevergabe). Über lokal definierte SubPortalstrukturen, welche mit der global gültigen Portalstruktur verlinkt werden, können autonome Unternehmensbereiche zum konzernübergreifenden Wissensaustausch beitragen; dieses Verhalten kann zum Beispiel mit Hilfe der konsistent gehaltenen und den transparenten Kapitel 7 – IMPLEMENTIERUNG DES SYSTEMS Seite 157 Möglichkeiten des Link Managements von Hyperwave auch serverübergreifend umgesetzt werden. Die dem Benutzer transparent zur Verfügung gestellte Portalstruktur (logische Portalstruktur) wird in [Abb. 7.5] graphisch dargestellt. Abbildung 7.5: Logische Portalstruktur des Informationssystems Die zu einem Portal gehörenden spezifischen Applikationen und Konfigurationselemente werden lokal (als Children des Portalobjektes) über eindeutig bestimmte Konfigurationscontainer verwaltet. In [Abb. 7.5] stellen die Collections mit dem Titel ’Applications’ und ’System’ diese Konfigurationscontainer für das Portal des Unterbereichs ’Company 1aa’ dar. Einen Einblick in die physikalische Portalstruktur wird durch die graphische Darstellung in [Abb. 7.6] gewonnen. Über die Festlegung und Verwaltung einer bestimmten Konfigurationsdatei (im Filesystem jedes Servers) kann die Funktionalität jedes Servers und manche applikationsspezifische Einstellung konfiguriert werden. Sowohl durch die Programmierung eines angepaßten Template Sets und deren direkte Kopplung von speziellen Konfigurationsdateien, als auch durch die vordefinierte Struktur von Konfigurationscontainer im Datenbanksystem sind Dynamik und Modularität des Systems serverübergreifend und nachhaltig gesichert. Durch die bisher besprochenen Konzepte wurden die kritischen Aspekte (I) und (VII) berücksichtigt. Das Konzept der Portalstruktur stellt gleichzeitig die technische Implementierung der Komponente ’Zugang’ des funktionalen Schemas (siehe [Abb. 6.8]) dar. Kapitel 7 – IMPLEMENTIERUNG DES SYSTEMS Seite 158 Master Server Applications System Portal - The Group Portal - Company 1 Applications System Portal - Company 2 Applications System Portal - Company 4 Applications System Server Company 3 Portal - Company 3 Applications System Abbildung 7.6: Physikalische Portalstruktur des Informationssystems Eigenschaften vom gewählten Framework (Verhalten des Interfaces) Um die transparente Darstellung des gesamten Intranetangebots für den Benutzer zu gewährleisten, wird das Layout und das Verhalten des Interfaces (Darstellungen am Browser) einem vordefinierten Schema folgen. Die Darstellung des Schemas wurde in Rahmen des CI (Corporate Identity) festgelegt, wobei die Inhalte sich auf bedarfsgerechte Weise je Portalstruktur anpassen lassen. Wie in [Abb. 7.7] dargestellt, werden sechs unterschiedliche Frames definiert: - Header Frame Navigation Frame Search Frame Quicklinks Frame Code Frame Content Frame Navigation Content Search Code Quicklinks Header Abbildung 7.7: Framework für das Web Interface Im Header Frame wird die allgemeine Information zum Portal und zum Konzern angezeigt. Hier befindet sich auch die Möglichkeit der Authentifizierung und Registrierung am System. Die Kapitel 7 – IMPLEMENTIERUNG DES SYSTEMS Seite 159 technische Implementierung der Komponente ’Erkennung’ des in [Abb. 6.8] dargestellten funktionalen Schemas erfolgt über die Funktionalität einer speziellen Document Class, da ein registrierter Benutzer über bestimmte Metadaten (Information über Rollen im System, Funktionen im Konzern, Kontaktmöglichkeiten, usw.) beschrieben wird. Die speziellen Suchmechanismen von Hyperwave werden im Search Frame zur Verfügung gestellt. Der Quicklinks Frame enthält portalspezifische Hyperlinks (sowohl interne als auch externe). Die Angabe zu den Links sind in XML-Dateien enthalten und frei konfigurierbar. Der Navigation Frame (siehe [Abb. 7.7]) zeigt eine dynamisch generierte und multifunktionale Baumstruktur für die Navigation an. Der ’dynamische Baum’ ist als Document Class implementiert, und besitzt sehr spezielle multifunktionale Mechanismen. Der Anfangszustand eines Navigationsbaumes entspricht einer vordefinierten Struktur, welche über die Information in einer XML-Datei (im Konfigurationscontainer des jeweiligen Portals) konfigurierbar ist. Die Angaben in dieser XML-Datei beziehen sich auf statische und dynamische Strukturelemente des Informationssystems. Statische Strukturelemente sind fixer Bestandteil der Konfigurationsdatei und besitzen nur die dort explizit angegebene Beziehung zu andere Baumelementen. Dynamische Strukturelemente sind alle Inhalte von statischen Containerobjekten (Children und Subhierarchien davon), wobei lediglich das Containerobjekt im Konfigurationsfile definiert und explizit als dynamisch angegeben ist. Mit der Angabe eines dynamischen Knotens erkennt die Document Class ’dynamischer Baum’, dass sämtliche Children eines dynamischen Containers bei jedem Aufbau des Baums neu festgestellt werden. Die Aktualität von dargestellten Informationseinheiten ist damit über beliebig tiefe Strukturen gewährleistet. Alle notwendigen Informationen, um den Baum auf der Client Seite zu bedienen, werden im Code Frame geschrieben. Die aktuell besuchte Informationseinheit wird im Content Frame präsentiert (ihre Metadaten, ihr Inhalt, Parent-Child Beziehungen, usw.). Über ein im Content Frame definiertes Menü werden sämtliche Funktionen für das Bearbeiten von Informationseinheiten zur Verfügung gestellt. Weiters wird über dieses Menü die Sprachauswahl implementiert. Entsprechend dieser vom Benutzer eingestellten Sprache wird nicht nur das gesamte Framework aufgebaut, sondern auch z.B. Inhalte von Language Clustern, Information über Strukturelemente, oder Inhalte von Dialogfenstern angezeigt. Der HTML-spezifische Code für den Aufbau des Frameworks wird in sogenannten Language Resource Templates einer Document Class definiert. Die Hauptfunktionalität für Zugang und Navigation des Systems wird in der Document Class ’Homepage’ definiert. Eine der Methoden dieser Document Class ist für das Erstellen des Frameworks verantwortlich. Damit ist nun die Funktionalität der Portale (Document Class ’Homepage’), die dynamische Visualisierung und Präsentation von Inhalten (Document Class ’Homepage’), die Navigation (Document Class ’Dynamischer Baum’), ein Interface zur Authentifizierung und Registrierung (Document Class ’Register’), eine Möglichkeit zur Suche (Standardsuche von Hyperwave), und eine konfigurierbare unabhängige portalspezifische Navigation (Document Class ’Quicklinks’) definiert worden, wobei auch die kritischen Aspekte (IV), (V), (VII), und (VIII) auch berücksichtigt wurden.. Datenverwaltung und Zugriffskonzept Die meisten Aufgaben bezüglich der Verwaltung von Informationseinheiten und deren beuntzerabhängiger Zugriff werden vom Hyperwave Information Server, aufgrund der mitgelieferten Tools gelöst. Die Verwaltung und Organisation von Dokumenten und Inhalten sind in den Fachbereichen Document Management (Abschnitt 5.1.2), Content Management (Abschnitt 5.1.2), Library Science (Abschnitt 5.1.4), Archival Science (Abschnitt 5.1.4) und Kapitel 7 – IMPLEMENTIERUNG DES SYSTEMS Seite 160 Organisationssysteme (Abschnitt 5.3) einzuordnen (siehe Aspekt (X)). Die gemeinsame Berücksichtigung ihrer Aufgabengebiete und ihrer zur Verfügung stehenden Methoden liefern sicherlich eine optimale Erfüllung von konkreten Anforderungen eines transnationalen Konzerns an ein wissensbasiertes Informationssystem. Es sei an dieser Stelle darauf hingewiesen, dass spezifische Anforderungen bezüglich Datenverwaltung aufgrund technologischer Kriterien unter gemeinsamer Berücksichtigung dieser Fachbereiche zu erfüllen sind. Beispiele für solche spezifische Anforderungen sind das Ergreifen von Replikationsmechanismen zur Steigerung der allgemeinen Performanz des Netzwerkverkehrs (siehe Aspekt (II)), oder die zur Bandbreite angepaßte Anzeige von Bildern in unterschiedlichen Auflösungen (siehe Aspekt (X) bzw. Absatz zum Thema Alternative Cluster im Abschnitt 7.1). Die effiziente und effektive Verwaltung von Daten und ein kontrolliertes Zugriffskonzept wird von Hyperwave über die Kombination folgender Mechanismen gewährleistet: Vergabe von Zugriffsrechten über spezifische Objektattribute, Upload-Mechanismus für jegliche Art von multimedialen Objekten, konfigurierbare Versionskontrolle für Dokumentenobjekte, Editieren von HTML Dateien direkt auf den Server (ohne erforderlichen Download), spezialisierte Containerobjekte (Cluster, Sequence, Collection, Document Classes, Search Query Objekt), u.v.m. Der oben beschriebene dynamische Navigationsbaum stellt zum Beispiel eine vereinfachte Alternative zur Festlegung von Themenhierarchien und Organisationssystemen dar. Mit all diesen Tools können daher die Komponenten ’Basis’, ’Organisationssystem’, ’Sicherheit’ und ’Navigation’ des funktionalen Schemas (siehe [Abb. 6.8]) hinsichtlich allgemeiner Anforderungen (siehe Aspekte (II), (X)) implementiert werden. Benutzer- und Gruppenverwaltung Durch die Festlegung eines Rollenkonzepts für das Informationssystem des Konzerns, wie beispielsweise in [Abb. 7.8] und [Abb. 7.9] dargestellt, wird die Komponente ’Erkennung’ des funktionalen Schemas (siehe [Abb. 6.8]) vollständig beschrieben. Dieser Aspekt umfaßt alle Eigenschaften von humanen Ressourcen innerhalb der Unternehmensstruktur und deren Rollen innerhalb des Informationssystems. Auf der anderen Seite stellen funktionsabhängige Benutzerrollenkonzepte eine Methode dar, um ein hierarchisches Zugriffsszenario zu definieren. Abbildung 7.8: Rollenhierarchie des Informationssystems (bzgl. des Benutzers vgarcia) Kapitel 7 – IMPLEMENTIERUNG DES SYSTEMS Seite 161 Abbildung 7.9: Rollenhierarchie des Informationssystems (bzgl. der Gruppe wbt) Das Informationssystem liefert den Benutzern globale oder partielle Sichtweisen des Datenbestands in Abhängigkeit vom aktuellen Rollenstatus (meist Mitgliedschaft in einer Gruppe), vom Aktivitätsmodus (lesend, schreibend, usw.) und von den - unter Hyperwave einstellbaren ’User Preferences’. Durch die Einführung von kontrollierten Begriffsstrukturen - zum Beispiel über vordefinierte dynamische Themenhierarchien, wie die oben erwähnte Funktionalität des dynamischen Navigationsbaums - werden unterschiedliche Sichtweisen auf den Datenbestand ermöglicht (siehe Aspekt (VI)). Die neuen Sichtweisen sind daher nicht nur von der Rolle des Benutzers abhängig, sondern auch - zum Beispiel - von seinem Interessengebiet, einer konkreten Aufgabenstellung oder vom Standort. Das hier beschriebene Informationssystem für transnationale Konzerne ist in der Lage, die unterschiedlichen Fachgebiete des Konzerns erfassen und darstellen zu können. Weiters soll unter dem Rollenaspekt die Tatsache berücksichtigt werden, dass jede Benutzergruppe bzw. jeder Unterbereich des Konzerns ein sehr spezifisches Aktivitätspotential am Gesamtsystem, sowohl auf lokaler wie auch auf globaler Ebene, aufweist. Das heißt, jeder Unterbereich des Konzerns hat je Benutzergruppe einen unterschiedlichen effektiven Bedarf am gesamten Informationsangebot des Systems. Folgendes (fiktive) Beispielszenario soll diesen Sachverhalt verdeutlichen: Der Hauptsitz des Konzerns beschäftigt 1500 Mitarbeiter und soll den Hauptserver des Gesamtsystems verwalten. Weiters besteht der Konzern aus zehn Tochterunternehmungen, wobei neun davon durchschnittlich 2000 effektive Systembenutzer beschäftigen. Wenn die 5000 Mitarbeiter vom letzten, weit entfernten Konzernunterbereich hauptsächlich die Informationen des eigenen (Sub-)Servers nutzen und kaum oder gar nicht auf externe Datenbestände aus dem Rest des verteilten Systems zugreifen, dann soll diese Autonomie auch in der Konzeption der gesamten Systemarchitektur in Erwägung gezogen werden. Der Grund hierfür liegt in der Tatsache, dass diese starke Autonomie unterschiedliche Aspekte der technischen Implementierung beeinflußt, wie etwa: lokale Netzwerktopologie, Kriterien zur Datenreplikation, Verteilungsgrad der Applikationen, technische Performanz des lokalen Servers (sowohl auf Hardware- als auch auf Kapitel 7 – IMPLEMENTIERUNG DES SYSTEMS Seite 162 Softwareebene), Definition von fachbereichsspezifischen Klassifikationsschemata, und andere. Als Basis für die Implementierung eines Rollenkonzepts können die im Abschnitt 6.1.4 ’Spezielle Sichtweisen des Informationssystems’ vorgestellten Blickpunkte herangezogen werden. Ein weiterer Aspekt, welcher vom Rollenkonzept abhängig ist und gleichzeitig mit der Auffindung von implizitem Wissen zu tun hat, ist die Implementierung von rollenspezifischen Diensten zum Zwecke einer verbesserten Auffindung vom impliziten Wissen des Organisationsgedächtnisses. Ein im Rahmen dieser Diplomarbeit implementiertes Modul, welches alle Mitarbeiter des Konzerns innerhalb einer hierarchischen Struktur erfasst, sie auf unternehmensspezifische Weise beschreibt (d.h. Metadaten bzgl. Tätigkeitsgebiete, Standort, usw. zuordnet) und über eine spezielle Suche auffindbar macht, wird durch eine Applikation für die Verwaltung von ’Business Cards’ dargestellt (siehe auch Aspekt (V)). Die unter Hyperwave als Document Class implementierte Business-Card-Komponente, welche als zentrale Zugangsstelle zu einem Großteil des impliziten Wissens im Konzern aufzufassen ist, steigert die Kollaboration und verbessert die Kommunikation zwischen den weltweit verteilten Benutzern des Systems (siehe auch Aspekt (IX)). Qualität von Informationseinheiten: Metastrukturen Anforderungen an die Qualitätssteigerung von Wissenseinheiten (entsprechend dem kritischen Aspekt (III)) werden vom Hyperwave Information Server durch die zur Verfügung stehenden Objektattribute großteils erfüllt. Dadurch ist die technische Implementierung der Komponente ’Metadaten’ des funktionalen Schema (siehe [Abb. 6.8]) implizit gegeben. Metadaten, wie bereits im Abschnitt 5.2.2 beschrieben, stellen eine einfache Möglichkeit dar, um Wissenseinheiten präzise zu beschreiben und infolgedessen deren Zugang bedarfsgerecht zu steuern (z.B. über indizierte Suchmechanismen). Unter dem Begriff ’Metastrukturen’ versteht der Autor der vorliegenden Arbeit Konstrukte, die Beschreibungen von Wissenseinheiten und deren Beziehungen untereinander darstellen. Diese Konstrukte werden meist als semantische Zugangsmodelle, wie beispielsweise die im Unterkapitel 5.4 beschriebenen Topic Maps, dargestellt. Einfache Metastrukturen können auch unter Verwendung von Standardformaten, wie XML oder RDF, realisiert werden. Der Hyperwave Information Server unterstützt die Anwendung von einfachen Metastrukturen durch die auf Containerobjekten frei anwendbare Attributvergabe und die Vorteile des Link Managements (siehe Abschnitt 7.1). Während Metadaten in der Regel einzelne Informationseinheiten beschreiben, dienen Metastrukturen der Beschreibung von Objektklassen bzw. der Erfassung von semantisch verwandten Objekten zu Gruppen (z.B. zur Erstellung von Themenhierarchien). Durch die Verwendung von standardisierten Beschreibungsformaten (XML, RDF, SOIF, MCF, usw.), zum Beispiel, können Informationseinheiten wesentlich einfacher ausgetauscht, präsentiert und organisiert werden. Die Konfigurationsdateien zur Erstellung des oben beschriebenen dynamischen Navigationsbaumes stellen in diesem Sinne auch Metastrukturen dar. Die Festlegung eines zusammenhängenden Metadatensatzes zur Beschreibung von Dokumentenversionen kann zum Beispiel von Workflowapplikationen, Versionskontrollmechanismen und eLearning-Umgebungen gleichzeitig genutzt werden. Die konkrete technische Beschreibung solcher Metakonstrukte und deren Vorteile werden im nächsten Abschnitt näher beschrieben. Die standortbezogenen, funktionalen und strukturellen Abhängigkeiten innerhalb des Konzerns (siehe Abschnitt 7.2.2) stellen die wichtigsten Aspekte bezüglich eines effizienten Document Kapitel 7 – IMPLEMENTIERUNG DES SYSTEMS Seite 163 Managements dar. Das Hauptproblem liegt hierbei in der Tatsache, dass ein Dokument für verschiedene Unternehmensbereiche unterschiedliche Bedeutung besitzt. Damit ist die Notwendigkeit gegeben, mehrere Beschreibungskonstrukte zur Verfügung zu stellen. Die dafür geeignete Lösung stellt ein Modul, welches unterschiedliche Arten von Metadatensätze für die Beschreibung von Informationseinheiten verwaltet , dar. Die Implementierung eines solchen Moduls wird im nächsten Abschnitt näher beschrieben. Dynamik, Organisation und Navigation im System Der Aspekt der Navigation im System wurde bereits oben unter dem Punkt ’Eigenschaften vom gewählten Framework (Verhalten des Interfaces)’ u.a. anhand der Funktionalität des Navigationsbaumes beschrieben (siehe auch Aspekt (V)). Der Aspekt der Organisation wird ebenfalls durch die Document Class ’Dynamischer Baum’ berücksichtigt, da die Struktur des Navigationsbaums von den XML-Angaben in einer Konfigurationsdatei abhängig ist. Eine einfache beschreibende Ebene von Kontenpunkten innerhalb einer Taxonomie, wie beispielsweise bei der Verwendung von Topic Maps üblich (siehe Abschnitt 5.4.4), ist mit den Dynamischen Baum auch realisierbar, und dies sogar personalisiert und frei konfigurierbar. Die Realisierung dieses Sachverhalts ist in vereinfachter Form über die Angabe einer Search Query als dynamischer Knoten des Navigationsbaumes möglich. Im Abschnitt 7.1 wurde die grundsätzliche Funktionalität des Search Query Objekts bereits beschrieben. Da die Metadaten dieses Containerobjekts frei konfigurierbar sind, kann man ein bestimmtes Thema (z.B. ein Oberbegriff) als Suchkriterium angeben (zusätzlich noch den Suchbereich einschränken) und damit stets aktualisierte zusammenhängende Datenbestände in einem einzigen Strukturelement ’dynamisch’ und ’kontextuell’ sammeln. In diesem Knoten werden dann - als Children - andere Search Query Objekten definiert. Jeder Sub-Knoten (Child) kann Verfeinerungskriterien für den vordefinierten Oberbegriff, Ähnlichkeitskriterien zur Beschreibung von Synonymen, usw. enthalten. Dadurch ist das Festlegen von einer dynamischen Taxonomie ermöglicht. Durch diesen einfachen Mechanismus kann man deshalb die Komponente ’Organisationssysteme’ im funktionalen Schema (siehe [Abb. 6.8]) implementieren, wobei gleichzeitig Aspekt (VIII) berücksichtigt werden muss. Bedarfsgerechte Wissensauffindung: Suche in Hyperwave Dynamische Suchmechanismen zur bedarfsgerechten Wissensauffindung sollten nicht isoliert betrachtet werden, weil sie von anderen Aspekten - wie zum Beispiel den oben beschriebenen Aspekten der Verteilungstransparenz und Metadaten - abhängig sind und das Bindeglied zwischen Präsentation und Struktur des Systems darstellen können. Durch die vom Hyperwave Information Server standardmäßig zur Verfügung gestellte Suchfunktionalität wird die Komponente ’Suche’ im funktionalen Schema (siehe [Abb. 6.8]) eindeutig definiert (unter Berücksichtigung des Aspekts (V)). Das im Rahmen der Durchführung dieser Arbeit implementierte System verfügt über die volle Suchfunktionalität vom Hyperwave Information Server. Darüber hinaus steht dem Benutzer eine spezielle Suche in der Komponente Business Card zur Verfügung. Verwaltung von Information höchster Priorität: Hotlines Eine spezielle Anforderung an das Informationssystem für transnationale Konzerne stellt die effiziente Verwaltung (Weitergabe und Archivierung) von Information höchster Priorität dar. In diesem konkreten Fall ist ein spezielles Nachrichtenmodul gemeint. Die technische Lösung dafür wurde mit Hilfe von Document Classes implementiert und ’News Applikation’ genannt. Das Ziel der News Applikation ist, ’Newsbeiträge’ von verschiedenen Unternehmensbereichen des Konzerns in unterschiedlichen Unternehmenshierarchien zu verschiedenen Themen zu publizieren und den Benutzern der entsprechenden Bereiche auf den jeweiligen Portalen Kapitel 7 – IMPLEMENTIERUNG DES SYSTEMS Seite 164 zugängig zu machen. Die Implementierung dieses Moduls stellt eine umfassende, komplexe und demzufolge sehr interessante Applikation dar. Im Abschnitt 7.3.3 wird die Umsetzung dieses Moduls mit Hilfe der Hyperwave Technologie näher beschrieben. Eine andere Möglichkeit zur Implementierung eines Mechanismus, welcher den Benutzer über neue und wichtige Informationseinheiten in periodischen Abständen informieren kann, stellt die Anwendung des zeitlich einstellbaren Hyperwave Search Query Objekts (’Scheduled Query Object’) dar. Dieses in Abschnitt 7.1 beschriebene ’dynamische’ Containerobjekt stellt die Möglichkeit zur Verfügung, eine nach bestimmten Kriterien vordefinierte Suche in frei konfigurierbaren Zeitabständen zu starten, wobei der Autor des Objekts per Email informiert wird, falls neue ’dynamische’ Children gefunden wurden. Fazit Alle bislang beschriebenen Punkte stellen einen Überblick über die Struktur und Funktionalität der Gesamtgestaltung eines wissensbasierten Informationssystems für einen transnationalen Konzern (wie jener unter Punkt 7.2.1 beschrieben) dar. Die technische Umsetzung vieler Anforderungen (die von den am Anfang dieses Abschnitts aufgelisteten kritischen Aspekten weitgehend gedeckt werden) an ein solches System wurde anhand des Hyperwave Information Servers präsentiert und in groben Zügen beschrieben. Beispielhaft werden in den folgenden Abschnitten zwei ausgewählte Module der implementierten Gesamtlösung näher beschrieben. Die mit Hyperwave umgesetzten, ausgewählten Module sind die Applikationen ’Metadatensätze’ (Thema des anschließenden Abschnitts) und ’News Applikation’ (präsentiert im übernächsten Abschnitt 7.3.3). 7.3.2 Modul 1 - Metadatensätze Dieser Abschnitt befaßt sich mit einer speziellen Form der Datenverwaltung durch die Nutzung von Beschreibungskonstrukten für Informationseinheiten, welche aus der Sicht verschiedener Unternehmensbereiche unterschiedliche Bedeutung besitzen. Eine einfache und gleichzeitig effiziente Form der semantischen Anreicherung von Wissenseinheiten erfolgt über das Hinzufügen von Metadaten. Die Notwendigkeit dieses Moduls für das wissensbasierte Informationssystem eines transnationalen Konzerns wurde bereits im vorigen Abschnitt 7.3.1 unter dem Aspekt ’Qualität von Informationseinheiten: Metastrukturen’ kurz besprochen. Auf Wissen basierende und stark verteilte Informationssysteme für transnationale Konzerne zeichnen sich - unter anderem dadurch aus, dass bestimmte Dokumente zwar einmal vorhanden (gespeichert) sind, deren Inhalte aber für verschiedene Unternehmensbereiche unterschiedliche Bedeutung haben. Durch die Zuordnung von unternehmens- oder applikationsspezifischen Gruppen von Beschreibungselementen (Metadaten) wäre ein effizienter Mechanismus gegeben, mit dem die bedarfsgerechte Informationsauffindung bzw. –verwaltung ganz stark gesteigert werden kann. Damit kann man die standortbezogenen, funktionalen und strukturellen Abhängigkeiten von Unternehmensbereichen bzgl. geteilter Informationsquellen strategisch abstrahieren, technisch abbilden und semantisch auf effiziente Weise konfigurierbar machen. Der Hyperwave Information Server unterstützt standardmäßig die Verwaltung von Metadaten durch die Vergabe von Objektattributen (siehe Abschnitt 7.1). Wie bereits im Abschnitt 5.2.2 geschildert, kann durch die Anwendung von Metadaten beispielsweise die Qualität der Inhaltserschließung erhöht bzw. die Extraktion der Bedeutung von Dokumenteninhalten vereinfacht werden. Kapitel 7 – IMPLEMENTIERUNG DES SYSTEMS Seite 165 Im Kontext dieses Abschnitts können Metastrukturen als Mengen von zusammenhängenden Metadaten verstanden werden (siehe Abschnitt 7.3.1). Eine Metastruktur, die aus einer endlichen Menge von unterschiedlichen Metadaten besteht, wobei diese einen ganz bestimmten vordefinierten Zweck erfüllen, wird hier Metadatensatz (engl.: ’Metadata Set’) genannt. Zielsetzung und Motivation aus wissenschaftlicher Sicht Das hier zu beschreibende Modul ’Metadatensätze’ wurde für die Verwendung innerhalb des Informationssystems von dem im Abschnitt 7.2.1 präsentierten, technischen transnationalen Konzern konzipiert. Das Ziel dieses Moduls ist eine optimierte, zweckgebundene semantische Datenverwaltung vom Intranetsystem. Die Motivation für das Gestalten dieses Moduls war die Suche nach einem Mechanismus, welcher folgende Bereiche funktional unterstützen sollte: Resource Discovery Information Retrieval Inhaltserschließung und -analyse Wie bereits im Abschnitt 5.1.3 beschrieben, ist eines der Hauptziele der Disziplin Resource Disvcovery das Ermöglichen eines integrierten Zugriffs zu verteilten und vernetzten Informationsquellen. Der kritische Aspekt einer konsistenten Verbindungstopologie (eng.: ’interconnection topology’) zwischen stark verteilten Informationseinheiten könnte durch die Benutzung von zentralen Zugriffsknoten zu dahinterliegenden Informationsstrukturen gelöst werden. Eine zentrale Verwaltung von spezifischen Metadatensätzen, welche einen Teil des dahinter liegenden Intranetangebots semantisch und terminologisch verbindet, erfüllt diese Anforderung. Die logische und die semantische Sichtweise auf das System (auch Navigation und Auffindung genannt), wie ebenfalls in Abschnitt 5.1.3 beschrieben, stellen zwei Möglichkeiten dar, um die Interaktion zwischen Benutzern und Wissenseinheiten zu ermöglichen. Diese Interaktion kann über die, in der Disziplin Information Retrieval definierten Parameter Recall und Precision gesteuert werden. Anders gesagt, die ’Relevanz’ von Informationseinheiten (z.B. bezüglich einer Suchabfrage) muß optimiert werden. Eine zentrale Verwaltung von spezifischen Metadatensätzen, welche ständig den semantisch gültigen Bereich von Wissenseinheiten bestimmen, erfüllt diese Anforderung. Die Disziplinen Inhaltserschließung und Inhaltsanalyse (siehe Abschnitt 5.2.5) befassen sich mit dem semantischen Zugriff auf Wissenseinheiten unter ’inhaltlichen’ Gesichtspunkten. Die Funktionalität eines spezialisierten Moduls für die Verwaltung von Metadatensätzen kann die unterschiedlichen Aspekte dieser Disziplinen auf einfache und elegante Weise decken. Dynamisch wachsende Mengen von Wissenseinheiten können durch Metadatensätze in spezifischen Formen abstrahiert werden, d.h. man kann verschiedene Medatensätze mit unterschiedlichen Zweckbestimmungen - zum Beispiel zielgruppenspezifisch, informativ, indikativ, strukturiert, applikationsspezifisch, usw. - definieren. Da Metadatensätze auch Deskriptoren (siehe Abschnitt 5.2.5) darstellen, kann der Prozess der Indexierung, und infolgedessen auch der Suchmechanismus verbessert werden. Weiters kann durch die Festlegung von Metadatensätzen das Problem des Klassifizierens, d.h. der Formulierung von ’Klassifikation zu Klassifikat’-Beziehungen, zumindest teilweise gelöst werden. Beschreibung des Konzepts Die Einführung dieser neuen Funktionalität (Definition, Wartung und Verwaltung von Metadatensätzen) im Informationssystem des transnationalen Konzerns erfordert eine Anpassung des Rollenkonzepts. Hierfür wird die Rolle ’Application Manager’ eingeführt. Die Mitglieder der Gruppe Application Manager sind im Allgemeinen für das Gesamtkonzept, die Kapitel 7 – IMPLEMENTIERUNG DES SYSTEMS Seite 166 Struktur und das Design einer Intranetapplikation verantwortlich. Eine der Tätigkeiten eines Application Managers ist die Definition und Verwaltung von appliklationsspezifischen Metadatensätzen. Um zwischen global und lokal geltenden Beschreibungen zu unterscheiden, forderte der transnationale Konzern die Festlegung verschiedener Arten von Metadatensätzen. Demzufolge wurden zwei Typen von Metadatensätzen festgelegt: Globale und Erweiterte Metadatensätze. Der globale Metadatensatz stellt eine vom Konzern vordefinierte Menge von Attributen, welche als ’Standard Metainformation’ aufzufassen ist, dar. Der globale Metadatensatz ist für jegliche Art von Objekten gültig und muß zum Beispiel beim Publizieren jedes Dokuments vollständig definiert werden. Um den Vorgang des Publizierens zu beschleunigen, werden je Attribut Defaultwerte vordefiniert. Die Attributwerte einer Informationseinheit können im Bearbeitungsmodus von allen Benutzern, welche auf das Objekt Schreibrechte besitzen, modifiziert werden. Eine vollständige Definition für einen globalen Metadatensatz kann beispielsweise entsprechend [Tab. 7.1] angegeben werden. Titel (Title) Schlüsselwörter (Keywords) Beschreibung (Short_Description) Titel vom Dokument (entspricht dem HyperwaveStandardattribut Title) Schlüsselwörter (laut freier Vergabe), welche den Inhalt des Dokuments möglichst gut beschreiben. Kurze Beschreibung des Dokumentes Auswahl einer oder mehrerer Themen aus einer Liste von hierarchischen Begriffsbestimmungen Standort Der Standort beschreibt die geographische Zuordnung der (Location) Informationseinheit Zuordnung der Informationseinheit zu einer oder mehreren Zielgruppe Abteilungen bzw. anderen Gruppierungen, für welche die (Target_Audience) vorliegende Information vorgesehen ist (z.B. Abteilungen, Führungskräfte, usw.) Soll die Art des Dokumentes beschreiben (z.B. Arbeitsanweisung, Pressetext, usw.). Kann aber auch die Dokumenttyp (Document_Type) Beschreibung des Dokumentenformats enthalten (z.B. Excel Tabelle, PDF Datei, MP3 Audio, usw.). Datum und Zeit der letzten Änderung vom Inhalt des Letzte Änderung Dokuments (dieses Attribut wird von Hyperwave direkt (Last_Modification) gesetzt). Beim Publizieren entspricht der Wert des Attributs dem ’Erstellungsdatum’ (Datum vom Upload). Gültigkeit Geplante Gültigkeit eines Dokuments (Anzahlangabe in (Duration) Tagen, Wochen, Monaten, Jahren, oder ’immer’). Status des Dokuments: Dokumentenstatus (Aktuell, Archiv, usw.) oder (Document_Status) (Neu, Überprüft, Genehmigt, usw.) je nach Kontext. Information über versionierte Dokumente (z.B. für Aktuelle Version verschiedene Versionen von Gebrauchsanweisungen für eine (Actual_Version) Produktpalette) Verfasser des Dokuments (nicht zu verwechseln mit dem Autor Publizierer, d.h. derjenigen Person, welche das Dokument im (Author) Server einfügt) Verweise Verweise zu anderen Dokumenten, welche mit dem aktuellen (References) Dokument in Zusammenhang stehen. Themenbereiche (Topics) Tabelle 7.1: Definition vom Globalen Metadatensatz für das wissensbasierte Informationssystem eines transnationalen Konzerns Kapitel 7 – IMPLEMENTIERUNG DES SYSTEMS Seite 167 Die Definition vom Attribut ’Themenbereiche’ im globalen Metadatensatz, d.h. die Festlegung von einem unternehmensspezifischen hierarchischen Begriffsschema (beispielsweise implementiert wie unter dem Punkt ’Dynamik, Organisation und Navigation im System’ im Abschnitt 7.3.1 bereits erwähnt), dient einer besseren Klassifikation und Organisation der Inhalte, einer besseren Wiederauffindung und ist sehr praktisch beim Archivieren von gleichartigen Informationseinheiten. Die Angabe der ’Gültigkeit’ einer Informationseinheit kann den Autor, den Web Administrator oder beispielsweise den Bereichsadministrator auf ablaufende Gültigkeit hinweisen. Weiters gibt sie den Benutzern Information über die Aktualität des Dokuments. Der ’Dokumentenstatus’ könnte verwendet werden, um die Sichtbarkeit von Dokumenten zu steuern. Wenn zum Beispiel die Rolle ’Referee’ definiert wurde, so sind die Mitglieder dieser Gruppe für die Relevanz von Dokumenten verantwortlich. D.h. erst nach erfolgter einstimmiger Überprüfung des Dokumenteninhalts durch alle Referees, erhält das Dokument den Status ’genehmigt’ und wird sofort für alle sichtbar bzw. bearbeitbar. Das Attribut ’Verweise’ sind Referenzen auf ’verwandte’ Dokumente, wie ein Literatur- oder Quellenverezeichnis. Die Funktionalität des Attributs Verweise ist mit einer ’Siehe Auch’Funktion vergleichbar. Ein erweiterter Metadatensatz ist meist spezifisch definiert (z.B. für dessen Anwendung in einer bestimmten Applikation oder von einem bestimmten Unternehmensbereich), sodass seine Definition von ganz spezifischen Anforderungen abhängig ist. Ein Unternehmensbereich des Konzerns kann aufgrund von Erfahrungswerten spezifische Information (Attribute bzw. Metadaten) über Dokumententypen für deren Charakterisierung über einen Metadatensatz formulieren bzw. definieren. Folgende Objektattribute (Metadaten) können, zum Beispiel, bei der Festlegung eines erweiterten (applikations) Metadatensatzes sehr hilfreich werden: Dokumentenhierarchie: Der Wert dieses Feldes beschreibt die Bereichsabhängigkeit eines Dokuments, d.h. sein ’unternehmerischer Gültigkeitsbereich’. Dokumentennummer: Viele Unternehmen geben bestimmten Dokumenten eine alphanummerische Kennzeichnung, um sie zum Beispiel entsprechend einer historischen Logik zu archivieren oder, um sie einer Phase eines Projektes zuzuordnen. Dokumentenname: Dies ist der gewöhnliche Titel des Dokumentes, z.B. "Tesis de Fulano de Tal en la Universidad Tecnológica de Guatemala" oder "Informe científico sobre las distintas modalidades de escribir una tesis", usw. Aus der Sicht des Benutzers sollte es irrelevant sein, welcher Wert dieses Atrribut besitzt, d.h. es müßte jederzeit möglich sein, den Dokumentennamen zu modifizieren, ohne technische Probleme beim Öffnen von Dokumenten hervorzurufen. Editor: Dieses Attribut enthält die Information über jene Personen, welche Ansprechpartner für Änderungswünsche im Dokument oder bei Unklarheiten über den Inhalt darstellen. Ein Editor ist nicht derjenige, der das Dokument in das System einfügt. Ein zusätzliches Feature bei der Anzeige dieses Attributs kann zum Beispiel das Anbieten eines Links zur Email Adresse bzw. zur Business Card des Editors sein. Funktionalität aus Benutzersicht Aus der Sicht des Benutzers stellt das, für den transnationalen Konzern angepaßte Template Set des Hyperwave Information Servers zwei verschiedene Zugangsmodi zu Informationseinheiten zur Verfügung: ’Viewing Mode’ und ’Authoring Mode’ (Ansichts- und Bearbeitungsmodus). Diese Arten des Zugangs sind mit einem Lese- und Schreibmodus vergleichbar, und werden dem Benutzer über einen eigenen Bereich des Interfaces, den Content Frame, präsentiert. Kapitel 7 – IMPLEMENTIERUNG DES SYSTEMS Seite 168 Im Ansichtsmodus wird dem Benutzer der Inhalt einer Informationseinheit geliefert, d.h. der Inhalt eines Dokuments, die Children eines Strukturelements, usw. Neben dem Inhalt der Informationseinheit erscheint eine minimale Anzahl von Metadaten (Objektattributen) und eine Liste ihrer zugeordneten Metadatensätze. Dieser Sachverhalt wird in [Abb. 7.10] graphisch dargestellt. Über zwei Schaltflächen (Hyperlinks ’read more’ in [Abb. 7.10]) wird die komplette Information über die Objektattribute bzw. Metadatensätze in einem eigenen Fenster geliefert (siehe graphische Darstellung in [Abb. 7.11]). Beim Publizieren eines Dokuments wird ein multi-tabbed Dialogfenster geöffnet, welches eine Multi Selection Box im ersten Tab besitzt. Diese Multi Selection Box enthält die Namen aller vorhandenen Metadatensätze (auslesbar aus der Metadaten Collection im Master Server, bzw. aus den Replikaten davon). Erst nachdem das Publizieren in diesem Fenster abgeschlossen ist, d.h. der Benutzer hat die OK Schaltfläche gedrückt, wird ein Dialogfenster mit der ’Edit Selected Metadata Sets’ Funktionalität geladen. Dieses Dialogfenster wird in [Abb. 7.12] dargestellt. Abbildung 7.10: Darstellung einer Informationseinheit im Ansichtsmodus Abbildung 7.11: Gesamte Metainformation (Dialogfenster ’Attributes’) Kapitel 7 – IMPLEMENTIERUNG DES SYSTEMS Seite 169 Abbildung 7.12: Bearbeiten der Metadatensätze beim Publizieren von Dokumenten Funktionalität aus Administratorsicht Die Namen der Schlüsselwörter (key name) von Attributen sind vordefiniert und dürfen vorzugsweise nur von einer bestimmten Benutzergruppe (z.B. Application Manager) modifiziert werden. Das Hinzufügen von neuen Attributen zu einem bereits vorhandenen Metadatensatz ist durch einen Application Manager möglich. Falls diese zusätzlich über den Suchmechanismus auffindbar sein sollen (indizierte Metadaten), müssen sie von einem Mitglied der Administratorgruppe (system user group) eingetragen, und am Server ein Reorganisationsprozeß angestoßen werden. Da insgesamt mehrere Benutzer, im Allgemeinen alle Systemadministratoren und Application Manager, die Definitionen (bzw. die Konfigurationsdateien) von Metadatensätzen bearbeiten dürfen, werden sie zentral am Master Server gespeichert und verwaltet. Eine spezielle Collection mit vordefiniertem Namen (z.B. myCompany/system/meta) wird zu diesem Zweck definiert. Der Inhalt der Konfigurationsdateien für die Definitionen der Metadatensätze entspricht einer spezifischen XML-Notation. Falls eine stark verteilte Architektur des Systems vorhanden ist, oder der Netzwerkverkehr zu groß ist, werden diese Dateien über einen im Hintergrund laufenden Watchdog-Prozeß in konfigurierbaren Intervallen repliziert (beim Ergreifen von Replikationsmaßnahmen wird die physikalisch verteilte Portalstruktur auch berücksichtigt). Die Anzeige der Metadaten im Ansichtsmodus, wie in [Abb. 7.10] dargestellt, kann über ein spezielles Attribut aktiviert bzw. deaktiviert werden (show_meta = true bzw. show_meta = false). Fazit Mit Hilfe der bisher beschriebenen Logik für die Funktionalität von Metastrukturen, welche unter Hyperwave durch die Nutzung von Attributobjekten und Document Classes realisiert werden können, wurden auf effiziente und effektive Weise mehrere Anforderungen bezüglich Informationsauffindung und –beschreibung erfüllt. Kapitel 7 – IMPLEMENTIERUNG DES SYSTEMS Seite 170 Die Funktionalität von Metadatensätzen verbessert den Informationsfluß aus semantischer Sicht bezüglich Qualität und Relevanz der Informationseinheiten sowie aus technologischer Sicht bezüglich Bandbreite bzw. Belastung des redundanten Netzwerkverkehrs. Der nächste Abschnitt behandelt einen Mechanismus, welcher eine schnelle, bedarfsgerechte und themenorientierte (Ver)Teilung von sehr wichtigen und akuellen Wissenseinheiten auf einer stark verteilten Serverarchitektur unterstützt. 7.3.3 Modul 2 - News Applikation Die Zielsetzung bei der Implementierung der in diesem Abschnitt behandelten ’News Applikation’ ist die spezielle Anforderung des transnationalen Konzerns, Nachrichten (hier Newsbeiträge genannt) von verschiedenen Unternehmensbereichen in unterschiedlichen Unternehmenshierarchien zu verschiedenen Themen zu publizieren und den Benutzern der entsprechenden Bereiche auf den jeweiligen Portalen zugängig zu machen. Die Besonderheit bei dieser Aufgabenstellung ist die stark verteilte Architektur des Systems. Wie bereits im Abschnitt 7.3.1 beschrieben, bzw. in [Abb. 7.5] und [Abb. 7.6] graphisch dargestellt, steht der logischen Zugangsstruktur des Informationssystems eine stark verteilte und vernetzte physikalische Portalstruktur gegenüber. Dieser Sachverhalt stellt die grösste Herausforderung bei der Implementierung dieses Moduls dar. Aus technischer Sicht sind hierbei folgende Aufgaben zu lösen: Festlegung einer geeigneten Datenstruktur zur effizienten und nachhaltigen Speicherung von Newsbeiträgen Erstellung einer entsprechenden hierarchischen Struktur zur effizienten und zentralen Verwaltung von Newsbeiträgen während ihrer konfigurierten Lebensdauer (gemeint ist damit die Dauer ihrer Sichtbarkeit). Festlegung der informationstechnischen Lösung anhand der gegebenen Technologie (Hyperwave Information Server), um einen optimalen Betrieb der Applikation zu gewährleisten (Publizieren, Löschen, Suchen, Darstellen von Newsbeiträgen sowie allgemeine Verwaltung der Struktur). Ein Newsbeitrag besitzt aufgrund der oben definierten Anforderungen einen ganz bestimmten Lebenszyklus, welcher wie folgt definiert wird: Vorpublizieren Editieren Freigeben Archivieren Zunächst werden die Newsbeiträge in einem ’Pre-Publish’-Bereich erstellt und in einem weiteren Schritt freigegeben, d.h. einem ausgewählten News-Bereich hinzugefügt. Bei der Freigabe werden sie dem vordefinierten Bereich zugeordnet und auf darunterliegende Einheiten vererbt. Parallel zur Freigabe werden sie in einem Archiv chronologisch (zeitabhängig) abgelegt. Kapitel 7 – IMPLEMENTIERUNG DES SYSTEMS Seite 171 Weiters besteht die Möglichkeit, mit einer speziellen Navigationsmöglichkeit, die Newsbeiträge sowohl über die hierarchische Bereichsstruktur als auch über die chronologische Archivstruktur abzurufen. Es wird zusätzlich eine spezielle Suche für die Newsbeiträge implementiert. Um die portalabhängige Darstellung der Newsbeiträge zu ermöglichen, wird der Applikation ’Homepage’, welche für die Funktionalität der Portale verantwortlich ist und im Abschnitt 7.3.1 bereits untersucht wurde, eine Zusatzfunktionalität hinzugefügt. Da die Homepage-Komponente (Portalfunktionalität) für die Darstellung und Verwaltung des Frameworks (siehe Punkt ’Eigenschaften vom gewählten Framework (Verhalten des Interfaces)’ in Abschnitt 7.3.1) verantwortlich ist, soll sie auch in der Lage sein, portalabhängige Hotlines darzustellen. Die Applikation Hotlines (eingegliedert in der Applikation Homepage) zeigt die wichtigsten Eigenschaften (Headlines) von aktuellen Newsbeiträgen auf dem jeweiligen Bereichsportal an. Die Anzahl der anzuzeigenden Hotlines ist frei konfigurierbar. Ein Beispiel für die Anzeige von Hotlines im Content Frame eines Portals ist in [Abb. 7.13] dargestellt. Abbildung 7.13: Anzeige von zwei Hotlines im Portal vmgb’s homepage News Applikation aus Benutzersicht Wie in [Abb. 7.13] bereits dargestellt, erhält der Benutzer beim Einstieg in ein Portal die aktuellsten Newsbeiträge in zusammengefasster Form (Hotlines). Die visualisierten Teile der aktuellen Newsbeiträge sind Datum, Thema, publizierender Bereich und Kurzbeschreibung des Beitrages. All diese Informationsteile sind in den Metadaten der jeweiligen Newsbeiträge als Textinformation gespeichert. Weiters soll über entsprechende Hotlinks (Hyperlink ’read more’ auf der rechten Seite jeder Hotline) der Zugang zur eigenständigen News Applikation ermöglicht werden. Die News Applikation bietet drei Zugangsmöglichkeiten, um publizierte Newsbeiträge abzurufen, an: - Chronologisches Archiv der Newsbeiträge auf dem News Server - Nach Unternehmensbereichen strukturierte Newsbeiträge auf dem News Server - Applikationsspezifische Suche nach Newsbeiträgen (über indizierte Metadaten und Volltextsuche) Vom Framework her, stehen einem Benutzer insgesamt folgende Möglichkeiten zur Verfügung, um zu dem kompletten Inhalt eines Newsbeitrags zu kommen: - Vom Portal aus können Newsbeiträge durch das Verfolgen der angebotenen Hyperlinks (’read more’, "get more Hotlines", ’<Name des Unternehmensbereichs>’, "Archive"), wie in [Abb. 7.13] graphisch dargestellt, erreicht werden. Diese Hyperlinks führen von der Hotlines-Applikation (eingegliedert in der Homepage-Komponente) weg in die eigenständige, zentral verwaltete News Applikation. Kapitel 7 – IMPLEMENTIERUNG DES SYSTEMS Seite 172 - Navigation durch die Archivstruktur auf einer zentralen Stelle. - Suche über die zentral verwaltete Archivstruktur - Navigieren über die hierarchisch (nach Unternehmensbereichen) angeordnete Struktur der publizierten Newsbeiträge. Um einen besseren Einblick in das News-System zu gewinnen, wird seine allgemein definierte Struktur in [Abb. 7.14] graphisch dargestellt. In der verteilten Struktur des Informationssystems wird über Konfigurationsdateien festgelegt, welcher Hyperwave Server auch der News Server ist, und demzufolge befindet sich auf ihm die zentrale Struktur (Archiv, usw.) der News Applikation. Die Erstellung dieser Struktur erfolgt auf generische und deren Verwaltung auf dynamische Weise. Alle Strukturelemente der News Applikation (News Hauptcollection, Archiv, Zentrale für das Publizieren, Struktur nach Unternehmensbereichen, usw.) sind als Document Classes implementiert, d.h. sie stellen Container mit vordefiniertem Verhalten dar. Abbildung 7.14: Struktur der News Applikation auf dem Hyperwave News Server Die Hauptsprache der Inhalte von Newsbeiträgen ist Englisch. Jedoch ist das Publizieren von ’mehrsprachigen’ Newsbeiträgen auch möglich. Die Darstellung der Inhalte von Newsbeiträgen erfolgt in Abhängigkeit der Spracheinstellung des Benutzers; ist die Sprachversion aber nicht definiert, so wird der Newsbeitrag auf Englisch angezeigt. News Applikation aus Administrator- bzw. Autorsicht Die Verwaltung der News Appliaktion erfolgt anhand eines speziell definierten Rollenkonzepts. Ein News-Administrator (in der Regel ein Content Manager) kann in Abhäniggkeit von seinen Zugriffsrechten die News Applikation verwalten, d.h. neue Newsbereiche (Container) anlegen und bearbeiten, und Newsbeiträge in das News System einbringen. Kapitel 7 – IMPLEMENTIERUNG DES SYSTEMS Seite 173 Die gesamte Funktionalität der News Applikation wird über das Menü im Content Frame zur Verfügung gestellt. Bezüglich des Rollenkonzeptes gibt es insgesamt drei unterschiedliche administrative Rollen: - News Administratoren besitzen innerhalb der News Applikation überall Schreibrechte. - News Autoren dürfen Newsbeiträge entsprechend ihrer Rechte in der hierarchischen Struktur erstellen. - News Publizierer dürfen Newsbeiträge freigeben (Publish Funktionalität) bzw. wieder publizieren (Re-Publish Funktionalität). Der in [Abb. 7.14] dargestellte Newscontainer ’Zentrale für das Publizieren’ stellt die zentrale Verwaltungsselle der News Applikation dar, und wird Publish/Modify Bereich genannt. Dieser Bereich ermöglicht das Erstellen und Modifizieren von untenehmensspezifischen Newscontainern, und von Newsbeiträgen. Die allgemeine Darstellung in diesem Bereich wird in [Abb. 7.15] graphisch dargestellt. Aktuelles Objekt: <NewsContainer> Last Page Container 1 Parent 1 Container 2 <Suchwort> Parent 2 Container 3 Container 4 Container 5 Container 6 <Filter> SUCHE Container 7 Hotlines vom Bereich <News Container> <Datum> Thema:<Thema> Bereich:<Bereich> <Titel vom Newsbeitrag> Kurze Beschreibung des Newsbeitrags read more <Datum> Thema:<Thema> Bereich:<Bereich> <Titel vom Newsbeitrag> Kurze Beschreibung des Newsbeitrags read more <Datum> Thema:<Thema> Bereich:<Bereich> <Titel vom Newsbeitrag> Kurze Beschreibung des Newsbeitrags read more Abbildung 7.15: Allgemeine Darstellung der News Applikation Aufbau der hierarchischen Struktur nach Unternehmensbereichen Beim Erstellen eines Bereichscontainers (Division Newscontainer) werden Attribute wie Titel, Beschreibung und Zugriffsrechte vergeben. Eine neue hierarchische Bereichszuordnung (d.h. das Anlegen eines neuen Bereichscontainers) erfolgt über eine Auswahl von weiteren Bereichscontainern, für die der Administrator Schreibrechte besitzt. Nach dem Anlegen des neuen Newscontainers wird automatisch ein ’Aktuellcontainer’ (Actual Newscontainer) für diesen (und in diesem) Bereich erzeugt. Dabei werden vom übergeordneten Bereichscontainer (Parent) die aktuellsten Beiträge vererbt (’hineingelinkt’). Um diesen Sachverhalt zu verdeutlichen, wird in [Abb. 7.16] die logische und funktionale Struktur der News Applikation graphisch dargestellt. Kapitel 7 – IMPLEMENTIERUNG DES SYSTEMS Seite 174 Abbildung 7.16: Funktionale Logik der News Aplikation Verwaltung von Newsbeiträgen Die Erstellung und das Modifizieren von Newsbeiträgen erfolgt im Publish/Modify Bereich über ein Dialogfenster entsprechend der Darstellung in [Abb. 7.17]. Abbildung 7.17: Dialog zum Bearbeiten eines Newsbetrags Kapitel 7 – IMPLEMENTIERUNG DES SYSTEMS Seite 175 Folgende Einträge sind bei einem Newsbeitrag konfigurierbar: - - Tab Theme (Thema): o Division (Unternehmensbereich): entsprechend der Benutzerrechte o Topic (Thema): Vorauswahl entsprechend einer konfigurierbaren Themenliste (XML-Datei) o Time Open (Hyperwave Standard Attribut) o Time Close: Eingeführtes Attribut zur Steuerung der Dauer der Sichtbarkeit. Die Sichtbarkeit stellt die Aktualität des Newsbeitrags dar, d.h. seine Lebensdauer im entsprechenden Aktuellcontainer der Hierarchie. o Attachments: Ein Multipart-Fileupload Fenster wird zusätzlich geöffnet (Optionale Funktionalität). Automatisch generierte Vorauswahl Tabs Major Language und Alternative Language (unternehmensspezifische Attribute): o Titel (Headline): Titel des Beitrags o Kurze Beschreibung (Hotline): o Dokumentenautor: Da der Autor des Inhalts eines Newsbeitrags nicht unbedingt gleichzeitig der Publizierer (Freigeber) ist, wird mit Hilfe dieses Attributs ein expliziter Unterschied hergestellt. o Inhalt (HTML): In diesem Feld wird der komplette Inhalt der zu übermittelten Nachricht geschrieben. Ein neu erstellter Newsbeitrag bleibt physikalisch im Publish/Modify Bereich, bis ein Publizierer mit entsprechenden Zugriffsrechten den Beitrag zur Veröffentlichung freigibt. Bis zur Freigabe wird der Beitrag weder im Archiv, noch in der hierarchischen Struktur abgelegt, und ist über die Navigation nicht auffindbar. Damit ist gewährleistet, dass der Beitrag bis zur expliziten Freigabe beliebig oft bearbeitet werden kann. Dieses Feature ist insbesondere für transnationale Konzerne interessant, da mehrere, geographisch verteilte Autoren für einen Beitrag verantwortlich sein können. Weiters ist damit die Möglichkeit gegeben, den Newsbeitrag eines nicht mehrsprachigen Benutzers von einem geographisch weit entfernten, mehrsprachigen Mitarbeiter übesetzen zu lassen, um damit eine multilinguale Darstellung zu ermöglichen. Mit der Freigabe eines Newsbeitrags wird er physikalisch im Archiv entsprechend seinem ’TimeOpen’-Attribut abgelegt. Zusätzlich wird er in den entsprechenden Bereichscontainer und in alle untergeordneten Aktuellcontainer verlinkt. Nach dem ein Beitrag veröffentlicht wurde, ist er nicht mehr editierbar und wird aus dem Publish/Modify Bereich entfernt. Beim Mechanismus des ’Wiederpublizierens’ (Re-Publish) wird eine physikalische Kopie des Beitrages im Publish/Modify Bereich abgelegt. Diese neue Kopie eines Newsbeitrags (mit einem neu generierten eindeutigen Namen) kann solange bearbeitet werden, bis er freigegeben wird. Während des Prozesses der Wiederpublizierung kann der neue Autor bestimmen, ob das Original des Newsbeitrags aus der hierarchischen Struktur entfernt werden soll, oder nicht. Das Löschen eines Newsbeitrags aus dem Archiv ist hingegen nicht erlaubt. Technische Verwaltung von Newsbeiträgen über die verteilte Serverarchitektur Wie bereits weiter oben erwähnt, zeigt die Hotlines Applikation der Homepage Komponente die Headlines von aktuellen Newsbeiträgen (die Anzahl von aktuellen Newsbeiträgen ist frei konfigurierbar = n) auf dem jeweiligen Portal an. Es wird in der Portalstruktur je Homepage Kapitel 7 – IMPLEMENTIERUNG DES SYSTEMS Seite 176 (Portal) ein eigener Bereich definiert (z.B. homepage/hotlines). Darin werden die n aktuellsten Newsbeiträge des Aktuellcontainers, welcher je Portal frei definierbar ist (d.h. ein spezifisches Portalattribut), gespeichert. Die Aktualisierung von portalabhängigen Hotlines erfolgt automatisch in konfigurierbaren Zeitabständen (Cronjob Prozess namens Watchdog). Die benötigten Daten für die Darstellung der Hotlines werden von dem entsprechenden Aktuellcontainer (welcher auf dem zentralen News Server gespeichert ist) über eine Serververbindung auf andere geographisch entfernte Server repliziert. Damit werden weder die physikalische noch die logische Portalstruktur (siehe graphische Darstellung in [Abb. 7.5] und [Abb. 7.6]) des verteilten Systems verletzt. Die hierfür verwendete Replikationsmethode ist ein periodisches Mehrfachkopieren von Daten über verteilte Strukturen mit einfachem Synchronisationsprozess (siehe Abschnitt 4.2 ’Datenreplikation’). Es werden dabei folgende Daten repliziert: Datum, Thema, publizierender Bereich und Kurzbeschreibung. Nicht repliziert werden der Inhalt und die eventuell vorhandenen Beilagen (Attachments). Die angezeigten Hotlinks - siehe [Abb. 7.13] - bieten die Möglichkeit, die nicht replizierten Dateninhalte der Newsbeiträge vom zentralen News Server abzurufen. Der, für die Replikation implementierte Watchdog startet periodisch seine Initialisierungsroutinen. Zunächst sucht er nach allen Portalen des verteilten Informationssystems. Für jedes gefundene Portal liest er das Attribut ActualNews, baut eine Server-Verbindung zum angegebenen Newscontainer auf und sucht alle noch sichtbaren Newsbeiträge im entsprechenden Container. Er löscht alle Children der Hotlines Collection des Portals und legt die benötigten Replikationsdaten darin ab. Das transparente Bereitstellen von mehrfach verfügbaren Datenbeständen hat sowohl technische als auch strategische Gründe. Aus technischer Sicht kann durch Datenreplikation das Problem vom nicht effizienten Datenzugriff auf weit entfernten Inhalten, aufgrund langsamer Internettechnologien in manchen Standorten, gelöst werden. Aus strategischer Sicht können beispielsweise globale Informationen hoher Priorität (wie etwa die hier besprochenen Newsbeiträgen) durch Datenreplikation so über das System verteilt werden, dass die Transferbelastung eines zentralen Newsrechners kompensiert wird. Fazit Das in diesem Abschnitt besprochene Modell einer News Applikation zeigt nicht nur die Komplexität der Aufgabenstellung, sondern auch das Zusammenwirken unterschiedlicher Technologien und Fachdisziplinen bei der Konzeption der beschriebenen Lösung. Unter Berücksichtigung des im Kapitel 6 definierten Technischen Gestaltungsmodells konnten Einflüsse der unterschiedlichen Hauptdisziplinen identifiziert werden. Sie stellten sämtliche Werkzeuge, welche für diese effiziente und effektive Lösung notwendig waren, wie folgt, zur Verfügung: - Wissensmanagement lieferte die strategischen Überlegungen zur Verwaltung der Wissensbausteine, insbesondere der Wissens(ver)teilung und Wissensentwicklung. - Informationsmanagement gab einen Einblick in die verteilte Struktur des Systems und lieferte gleichzeitig die Lösung für das Verschmelzen zweier stark verteilter Applikationen (Homepage und News Applikation Hotlines Applikation). - Datenmanagement lieferte die Kriterien zur Performanzsteigerung und demzufolge die Lösung über einen Replikationsmechanismus. - Wissensorganisation ermöglichte das Festlegen von geordneten Strukturen auf bedarfsgerechte Weise: chronologisch für das Archiv und hierarchisch für die Kapitel 7 – IMPLEMENTIERUNG DES SYSTEMS Seite 177 Abbildung der Unternehmensstruktur. Weiters wurde von dieser Hauptdisziplin die themenorientierte Verwaltung von Newsbeiträgen über die Festlegung einer einfachen Begriffsliste ermöglicht. 7.4 Zusammenfassung Die technische Implementierung eines wissensbasierten Informationssystems für ein großes und geographisch verteiltes Unternehmen erschwert sich in der Regel proportional zur Komplexität der spezifischen Anforderungen. Aus technischer Sicht müssen deshalb intensive Gespräche mit dem Kunden geführt werden, um einen möglichst präzisen Einblick in das Innenleben des Unternehmens zu gewinnen, sodass die wesentlichsten Aspekte des Konzerns extrahiert werden können. In diesem Kapitel wurde die Vorgehensweise des in Kapitel 6 beschriebenen Lösungsvorschlags gewählt, wobei hier das zugrundeliegende System von vornherein bekannt bzw. vom Kunden vorbestimmt war. Da die Technologie des Hyperwave Information Servers auf einer modularen und anpaßbaren Architektur basiert, erwies sich die Implementierung des Systems als sehr praktisch. Zwar lösten die vorgefertigten Module von Hyperwave nicht direkt alle technischen Aufgabenstellungen, viele Vorzüge des Servers stellten aber die notwendigen Werkzeuge für eine effiziente und effektive Lösung zur Verfügung. Die Modellierung der strukturellen Abhängigkeiten zwischen den unterschiedlichen Unternehmensbereichen ließ sich durch eine multifunktionale und hierarchisch angeordnete Portalstruktur realisieren. Die funktionalen Abhängigkeiten innerhalb des Konzerns, aufgrund der starken Vernetzung von Geschäftsfunktionen, ließen sich semantisch durch die Einführung von Themenhierarchien für die globale Navigation, sowie durch den Einsatz von Metadatensätzen für eine verbesserte Informationsauffindung, vollständig im Wissensfluß des Informationssystems abbilden. Für die benötigte Transparenz bezüglich der starken Standortverteilung von Unternehmensbereichen sorgte das effiziente Server Pool Konzept vom Hyperwave Information System. Das Hauptproblem bezüglich der Internationalität des Konzerns – insbesondere seine Mehrsprachigkeit - wurde mit Hilfe spezialisierter Strukturelementen (Language Cluster und Document Classes) sowie eines angepaßten Template Sets weitgehend gelöst. Weiters wurde die Implementierung einer besonders komplexen Applikation, welche erst durch das Zusammenwirken mehrerer Fachbereiche effizient gelöst werden konnte, vorgestellt. Die Zusammenfassung der Erkenntnisse des Untersuchungs- und Gestaltungsbereichs der vorliegenden Arbeit, sowie einen Ausblick auf zukünftige Entwicklungen im Kontext der hier behandelten Themen werden im nächsten Kapitel gegeben. Kapitel 7 – IMPLEMENTIERUNG DES SYSTEMS Seite 178 Kapitel 8 – ZUSAMMENFASSUNG UND AUSBLICK Seite 179 Kapitel 8 Zusammenfassung und Ausblick Die Ressource Wissen liegt in großen und geographisch verteilten Unternehmen explizit oder implizit, aber insbesondere eingebettet in Prozessen vor. Die grundlegendste Zielsetzung transnationaler Konzerne besteht in diesem Zusammenhang darin, Wissen problemspezifisch zu generieren und zu bewahren bzw. den computergestützten Wissenstransfer produktiv und effizient zu nutzen und damit zugänglich zu machen. Die moderne Weltwirtschaft zwingt transnationale - und demzufolge global agierende - Konzerne ihre Corporate Identity grenzüberschreitend und sprachunabhängig hervorzuheben und anzubieten. Das Unternehmensgedächtnis des Konzerns erfordert deshalb eine organisierte und geordnete Verwaltung. Ein großes Anliegen des Autors der vorliegenden Diplomarbeit bestand darin, die Hauptfunktionen diverser Wissenschaftsbereiche bezüglich der oben beschriebenen allgemeinen Problematik zu untersuchen. Der Schwerpunkt wurde in den Bereichen, welche den größten Aktionsradius besitzen, gelegt. Von diesem Grundgedanken ausgehend wurden Wissensmanagement, Informationsmanagement, Datenmanagement und Wissensorganisation gewählt und Hauptdisziplinen genannt. Nach einer allgemeinen Einführung in die wichtigsten Merkmale eines großen und geographisch verteilten Unternehmens wurden starke strukturelle, funktionale und standortbezogene Abhängigkeiten, welche aus der komplexen Organisationsstruktur herrühren, identifiziert (siehe Abschnitt 1.2). Je Hauptdisziplin wurden im Untersuchungsbereich dieser Arbeit kritische Aspekte bzw. spezifische Problembereiche in Zusammenhang mit den identifizierten Abhängigkeiten gefunden und analysiert. Die stark vernetzte und verteilte Infrastruktur eines transnationalen Konzerns lag bei den Untersuchungen stets im Vordergrund. Obwohl die Hauptdisziplinen unterschiedliche Hauptfunktionen besitzen, ließen sich folgende gemeinsame kritische Problembereiche, die im Zusammenhang mit der technischen Gestaltung des wissensbasierten Informationssystems stehen, identifizieren: Stark verteilte Struktur des Unternehmens vrs. der Forderung nach einem zentralisiert erscheinenden Gesamtsystem Stark vernetzte funktionale Querverbindungen in der hierarchischen Organisationsstruktur des Konzerns vs. der Forderung nach einer logischen Darstellung und transparenten Verwaltung von Wissenseinheiten und Wissensprozessen Mehrfach definierbare semantische Repräsentationen von Wissenseinheiten, um standortbezogene und bedarfsgerechte Sichtweisen zu ermöglichen Verwendung von plattformunabhängigen Mechanismen, spezialisierten Werkzeugen und allgemeingültigen Standards, um die geographischen Barrieren zu sprengen Gewährleisten von maximaler Transparenz, optimaler Fehlertoleranz und hoher Performanz des verteilten Systems Anwendung multilingualer Mechanismen, um das Problem der hohen Internationalisierung des Konzerns effizient und effektiv zu lösen Wissensmanagement, als erste untersuchte Hauptdisziplin, stellt strategische und steuernde Lösungsansätze, welche die kritischen Aspekte aus einer sehr unternehmensnahen Sicht behandeln, zur Verfügung. Die meisten Experten in diesem Bereich sehen im Umgang mit dem Wissen einen stets veränderlichen Prozeß, auf dem ihre Lösungsvorschläge basieren. Diese Kapitel 8 – ZUSAMMENFASSUNG UND AUSBLICK Seite 180 Dynamik hinter der Ressource Wissen, in Verbindung mit den funktionalen, strukturellen und standortabhängigen Charakteristiken eines transnationalen Konzerns, führen zur Identifikation von sehr tief liegenden Problemen, welche einen sozialen, kulturellen oder betriebswirtschaftlichen Charakter besitzen. Es lässt sich also zusammenfassen, dass Wissensmanagement, insbesondere in der Phase der Planung und Organisation eines Lösungsmodells, kontrollierende Maßnahmen und Entscheidungskriterien liefert. Wissensmanagement liefert aber auch Lösungsansätze zur untenstehenden Inromationstechnologie. Das Besondere an der Hauptdisziplin Wissensmanagement ist ihr starker interdisziplinärer Aktionsradius, und demzufolge ihr integrierendes Potential. Wissensmanager messen während ihrer Analysetätigkeiten der Technologie nicht wenig Bedeutung bei; sie setzen sich mit technischen Werkzeugen stark auseinander und können deshalb mit Tools aus den Bereichen Document Management, Content Mangement, usw. optimale Lösungen für jedes Anforderungsprofil bieten. Informationsmanagement wurde fast ausschließlich von der technischen Seite beleuchtet, um konkrete Lösungsansätze bezüglich der Realisierung von webbasierten verteilten Systemen zu finden. Der Hauptvorteil der vorgegebenen und in Zusammenhang mit dem Informationsmanagement untersuchten Intranetumgebung liegt in der orts- und zeitunabhängigen Verfügbarkeit der Benutzerschnittstelle (d.h. in der Nutzung des Browsers als einheitliches und überall verfügbares Zugangs- und Kommunikationswerkzeug). Die identifizierten Qualitätskriterien für eine verteilte Lösung des Systems sind: Erweiterbarkeit, Transparenz, Robustheit, Performanz, Wartbarkeit und Integrationsfähigkeit. Gegenüber zentral organisierten Systemen zeichnen sich verteilte Systeme durch höhere Wirtschaftlichkeit, Zuverlässigkeit, kürzere Antwortzeiten, modulare Skalierbarkeit, kontinuierliche Verfügbarkeit und transparente Behandlung von Teilausfällen aus. Die Hauptdisziplin Datenmanagement liefert konkrete technische Antworten in Zusammenhang mit der physikalischen Verwaltung von Datenbeständen. Der Schwerpunkt wurde hierbei auf Effizienz bei geographisch verteilter Datenaufbewahrung, -wartung und –zugriff gesetzt. Die Mechanismen der Datenreplikation wurden ausführlich behandelt, und liefern unterschiedliche Lösungsansätze in Abhängigkeit von zwei Hauptkriterien: Optimierung der Fehlertoleranz oder Steigerung der Performanz des verteilten Systems. Im Bereich der Wissensorganisation wurde nach Mechanismen gesucht, um eine effiziente semantische Informationsauffindung zu ermöglichen. Experten in den Bereichen Klassifikationssysteme, Information Retrieval, Bibliothekswesen und Wissensorganisation identifizieren gemeinsam die sehr hohe Bedeutung von Metastrukturen und Klassifikationsschemata, um einen konzeptualisierten (und infolgedessen sprachunabhängigen und bedarfsgerechten) Informationszugang zu gewährleisten bzw. zu verbessern. Im Gestaltungsbereich dieser Diplomarbeit wurde, um eine übersichtliche Analyse der Auswirkungen aller oben beschriebenen kritischen Aspekte zu ermöglichen, ein Lösungsvorschlag, welcher als Modell zur Gestaltung eines auf Wissen basierten Informationssystems für transnationale Konzerne dient, erarbeitet. Hierfür wurde zunächst ein Arbeitsmodell definiert, mit dem die Aktionsbereiche der Hauptdisziplinen untersucht werden konnten. Weiters wurden drei Arbeitsbereiche (Wirkungsbereiche) definiert, um die unterschiedlichen kritischen Aspekte in zweckgebundene Gruppen (Organisation, Inhalt & Semantik und Technik) einzuordnen. Diese Vorgehensweise resultierte in zwei unterschiedlichen Lösungsschemata: ein strategisches und ein technisches Schema. Das erste Schema (Grundlegendes Schema) gilt der strategischen Zuordnung von spezifischen Anforderungen an das Informationssystem zu den Wirkungsbereichen, wodurch ein Anforderungsprofil erarbeitet werden kann. Das zweite Schema (Funktionales Schema) bildet die wichtigsten Komponenten des Systems ab, wodurch die Festlegung eines technischen Kapitel 8 – ZUSAMMENFASSUNG UND AUSBLICK Seite 181 Lösungsvorschlags nahe liegt. Beide Schemata zusammen stellen ein allgemeines Lösungsmodell dar, und wurden Technisches Gestaltungsmodell benannt. Anhand dieses Technischen Gestaltungsmodells konnte aus allen im Untersuchungsbereich erkannten kritischen Aspekten ein allgemeines Anforderungsprofil erstellt werden. Im letzten Kapitel dieser Diplomarbeit wurden zunächst die wichtigsten Problembereiche eines anonymisiert dargestellten technischen transnationalen Konzerns präsentiert. Basierend auf der Technologie und Architektur des Hyperwave Information Servers, und anhand des Technischen Gestaltungsmodells wurde das wissensbasierte Informationssystem für diesen Konzern implementiert. Die technologischen Vorteile des Hyperwave Information Servers wurden für die technische Umsetzung weitgehend ausgenutzt und lieferten in jedem Punkt eine optimale Lösung für die Gesamtproblematik. Zwei als Module implementierte Teillösungen aus dem Gesamtsystem wurden in den letzten Abschnitten der vorliegenden Arbeit näher beschrieben. Das erste Modul beschrieb die Implementierung semantischer Metastrukturen (Metadatensätze), welche angewendet auf eine einzige Informationseinheit unterschiedliche semantische Zugangsund Auffindungsmöglichkeiten erlauben. Das zweite Modul stellte eine komplexe News Applikation dar. Hierbei lag der Schwerpunkt auf die stark verteilte Architektur des Systems, und erforderte, unter anderem, die technische Umsetzung von Replikationsmechanismen. Die große Herausforderung lag hierbei in der Anforderung, eine zentrale Verwaltung und Archivierung von Newsbeiträgen zu implementieren und gleichzeitig auf alle Portale in der verteilten Serverarchitektur stets die aktuellsten Newsbeiträge zur Verfügung zu stellen. Erweiterungs- und Verbesserungsmöglichkeiten des, in dieser Arbeit dargelegten Lösungsmodells sind im Rahmen zukünftiger Forschungsprojekte und Aufträge der Web Applications Group des Instituts für Informationsverarbeitung und Computergestützte neue Medien der Technischen Universität Graz (WAG-IICM Graz) zu erwarten. Die stärksten Anstrengungen hinsichtlich der Verbesserung des Technischen Gestaltungsmodells werden mit großer Wahrscheinlichkeit das Funktionale Schema betreffen. Der Grund hierfür liegt in der Tatsache, dass die von den Hauptdisziplinen zur Verfügung gestellten Werkzeuge und Mechanismen einem kontinuierlichem Optimierungsprozess unterworfen sind. Weiters ist das Starten eines Projekts geplant, um aus dem Modellansatz ein ’computer-based framework’ zu implementieren. Dieses Framework soll den Gestaltungsprozess des Modells unterstützen und eventuell beschleunigen. Eine weitere Möglichkeit, um das hier vorgestellte Gestaltungsmodell zu verbessern wäre, anhand mehrerer Interviews mit transnationalen Konzernen konkrete Anforderungen an Intranetsysteme einzuholen. Die aus einer Auswertung dieser Anforderungen gewonnenen Informationen sollen dabei helfen, die Funktionalität des Modells zu steigern bzw. zu überprüfen. Aus persönlicher Sicht hofft der Autor der vorliegenden Arbeit, dass die Vertreter aller hier berücksichtigten Wissenschaftsbereiche in enger Kooperation miteinander zu neuen gemeinsamen Lösungen hinsichtlich wissensbasierte Informationssysteme beitragen können. Kapitel 8 – ZUSAMMENFASSUNG UND AUSBLICK Seite 182 Teil III – ANHANG UND VERZEICHNISSE Seite 183 Teil III ANHANG UND VERZEICHNISSE Teil III – ANHANG UND VERZEICHNISSE Seite 184 ANHANG Seite 185 Anhang CD ROM Als Beilage zu dieser Diplomarbeit finden Sie eine CD-ROM, die folgende Information enthält: Diese Arbeit in elektronischer Form (PDF-, HTML- und DOC-Format) Die im Literaturverzeichnis angeführten Quellen (soweit in elektronischer Form verfügbar) Alle oben genannten Informationen sind über die Datei index.html erreichbar. ANHANG Seite 186 ABBILDUNGSVERZEICHNIS Seite 187 Abbildungsverzeichnis Abbildung 1.1: Beispiel für eine funktionale Organisationsform [Janko 2001] ........................... 4 Abbildung 1.2: Beispiel für eine produktionale Gliederung) [Janko 2001] .................................. 4 Abbildung 1.3: Beispiel für eine regionale Organisationsform [Janko 2001] ............................... 4 Abbildung 1.4: Beispiel für eine Matrixorganisation [Janko 2001] .............................................. 5 Abbildung 1.5: Beispiel für eine Tensororganisation [Janko 2001].............................................. 5 Abbildung 2.1: Fünf Kategorien Modell nach Ackoff [Bellinger et al. 2001b] .......................... 13 Abbildung 2.2: Interpretation des Komplexitätbegriffs nach Csikszentmihalyi [Bellinger et al. 2001b] ................................................................................................................................. 13 Abbildung 2.3: Modellerweiterung. Korrelation des Wissensmodells von Ackoff mit dem Komplexitätsmodel von Csikszentmihalyi [Bellinger et al. 2001b] ................................... 14 Abbildung 2.4: Wissensspirale von Nonaka & Takeuchi ........................................................... 16 Abbildung 2.5: Bausteinmodell des Wissensmanagements [Probst et al. 1999] ........................ 17 Abbildung 3.1: Informationsmanagement nach [Küng 1999] ..................................................... 30 Abbildung 4.1: Lokalisierung von Replikaten nach dem Ausfall eines Systemknotens ............. 51 Abbildung 4.2: Der ’günstigste’ Weg durch Replikation............................................................ 51 Abbildung 4.3: Transparenz eines verteilten Systems durch Replikation ................................... 52 Abbildung 4.4: Funktionales Model eines abstrakten Protokolls [Wiesmann et al. 2000] ......... 53 Abbildung 4.5: Aktive Replikation [Wiesmann et al. 2000] ...................................................... 54 Abbildung 4.6: Passive Replikation [Wiesmann et al. 2000]...................................................... 54 Abbildung 4.7: Semi-aktive Replikation [Wiesmann et al. 2000] ............................................. 55 Abbildung 4.8: Replikation in Verteilten Systemen [Wiesmann et al. 2000] ............................. 55 Abbildung 4.9: Replikation in Datenbanken [Wiesmann et al. 2000] ........................................ 56 Abbildung 4.10: Eager primary copy Replikation [Wiesmann et al. 2000] ................................ 57 Abbildung 4.11: Eager update everywhere Replikation mit verteilter Sperre [Wiesmann et al. 2000] ................................................................................................................................... 57 Abbildung 4.12: Eager update everywhere Replikation mit Atomic Broadcast [Wiesmann et al. 2000] ................................................................................................................................... 57 ABBILDUNGSVERZEICHNIS Seite 188 Abbildung 4.13: Lazy primary copy Replikation [Wiesmann et al. 2000] ................................. 58 Abbildung 4.14: Lazy update everywhere Replikation [Wiesmann et al. 2000] ........................ 58 Abbildung 4.15: Phasenkombinationen für starke Datenkonsistenz [Wiesmann et al. 2000] .... 59 Abbildung 4.16: Synthetische Ansicht der Replikationstechniken für Datenbanken und Verteilte Systeme [Wiesmann et al. 2000] ........................................................................................ 59 Abbildung 5.1: Antwort des Thesaurus ERIC nach einer Suchabfrage [Shiri et al. 2000] ......... 86 Abbildung 5.2: Beispiel für die Anwendung von semantischen Netzen [Guetl 2000] ............... 87 Abbildung 5.3: Graphische Darstellung der Eigenschaften von Kategorien [Easterbrook 1998] ............................................................................................................................................ 90 Abbildung 5.4: Beispiel einer hierarchischen Notation von DDC [Heber 2000] ........................ 98 Abbildung 5.5: Graphische Darstellung einer Concept Map [Novak 2002] ............................. 104 Abbildung 5.6: Mehrdimensionale Sichtweisen in einem Informationssystem für große und geographisch verteilte Unternehmen über unterschiedlich facettierte Themenhierarchien .......................................................................................................................................... 109 Abbildung 6.1: Wirkungsbereiche zur Analyse eines wissensbasierten Informationssystems . 118 Abbildung 6.2: Deutung der Wirkungsbereiche ’Organisation’, ’Inhalt & Semantik’ und ’Technik’ als Kraftfeld .................................................................................................... 118 Abbildung 6.3: Nicht ausgeglichener Zustand der Problembehandlung aufgrund fehlender Berücksichtigung eines Wirkungsbereichs (gestörtes System) ........................................ 119 Abbildung 6.4: Arbeitsmodell zur allgemeinen Sichtweise der Lösung .................................. 120 Abbildung 6.5: Phasen des Informationsflusses in einem Informationssystem ........................ 122 Abbildung 6.6: Rollenkonzept im wissensbasierten Informationssystem ................................. 125 Abbildung 6.7: Grundlegendes Schema zur Konzeption eines wissensbasierten Informationssystems für transnationale Konzerne ........................................................... 128 Abbildung 6.8: Funktionales Schema zur Konzeption eines wissensbasierten Informationssystems für transnationale Konzerne ........................................................... 131 Abbildung 6.9: Beispiel für den Pfad des Informationsflusses für eine (fiktive) Suchanfrage in einem wissensbasierten Informationssystem für transnationale Konzerne ...................... 142 Abbildung 7.1: Organisationsform des transnationalen Konzerns ............................................ 149 Abbildung 7.2: Unternehmensbereiche des transnationalen Konzerns ..................................... 149 Abbildung 7.3: Funktionalbereiche des transnationalen Konzerns ........................................... 150 ABBILDUNGSVERZEICHNIS Seite 189 Abbildung 7.4: Standortverteilung eines transnationalen Konzerns ......................................... 150 Abbildung 7.5: Logische Portalstruktur des Informationssystems............................................ 157 Abbildung 7.6: Physikalische Portalstruktur des Informationssystems .................................... 158 Abbildung 7.7: Framework für das Web Interface.................................................................... 158 Abbildung 7.8: Rollenhierarchie des Informationssystems (bzgl. des Benutzers vgarcia)....... 160 Abbildung 7.9: Rollenhierarchie des Informationssystems (bzgl. der Gruppe wbt) ................. 161 Abbildung 7.10: Darstellung einer Informationseinheit im Ansichtsmodus ............................. 168 Abbildung 7.11: Gesamte Metainformation (Dialogfenster ’Attributes’) ................................. 168 Abbildung 7.12: Bearbeiten der Metadatensätze beim Publizieren von Dokumenten .............. 169 Abbildung 7.13: Anzeige von zwei Hotlines im Portal vmgb’s homepage ............................... 171 Abbildung 7.14: Struktur der News Applikation auf dem Hyperwave News Server................ 172 Abbildung 7.15: Allgemeine Darstellung der News Applikation ............................................. 173 Abbildung 7.16: Funktionale Logik der News Aplikation ........................................................ 174 Abbildung 7.17: Dialog zum Bearbeiten eines Newsbetrags .................................................... 174 ABBILDUNGSVERZEICHNIS Seite 190 TABELLENVERZEICHNIS Seite 191 Tabellenverzeichnis Tabelle 2.1: Verbesserungen durch Wissensmanagement [IPK 2001] ....................................... 23 Tabelle 3.1: Informations- und Wissensmanagementrollen [Miranda et al. 2000] ..................... 40 Tabelle 4.1: Entwicklungsniveaus bezüglich der (elektronischen) Bearbeitung von Daten, Information und Wissen in Unternehmen [Lehner et al. 1998] .......................................... 48 Tabelle 5.1: Beispiel einer Relation in einer Beziehungsstruktur [Sigel 2000a]......................... 85 Tabelle 5.2: Beispiel einer Relation in einer Beziehungsstruktur [Sigel 2000a]......................... 85 Tabelle 5.3: Übersicht einiger Klassifikationsschemata laut [Koch et al. 1997] ........................ 99 Tabelle 6.1: Fiktives Beispiel für die Analyse einiger Anforderungen an ein wissensbasiertes Informationssystem für transnationale Konzerne bzgl. der Wirkungsbereiche gemäß dem grundlegenden Schema ..................................................................................................... 129 Tabelle 6.2a: Anforderungsprofil bzgl. des Wirkungsbereichs ’Organisation’ zur iterativen Lösungsmethode mit Hilfe des funktionalen Schemas..................................................... 139 Tabelle 6.2b: Anforderungsprofil bzgl. des Wirkungsbereichs ’Inhalt & Semantik’ zur iterativen Lösungsmethode mit Hilfe des funktionalen Schemas. .................................................... 140 Tabelle 6.2c: Anforderungsprofil bzgl. des Wirkungsbereichs ’Technik’ zur iterativen Lösungsmethode mit Hilfe des funktionalen Schemas. .................................................... 140 Tabelle 7.1: Definition vom Globalen Metadatensatz für das wissensbasierte Informationssystem eines transnationalen Konzerns........................................................ 166 TABELLENVERZEICHNIS Seite 192 LITERATUR- UND QUELLENVERZEICHNIS Seite 193 Literatur- und Quellenverzeichnis [Baeza-Yates et al. 1999] Baeza-Yates R., Ribeiro-Neto B.; Modern Information Retrieval; ACM Press New York. Addison-Wesley. Harlow, England. 1999. [Bellinger et al. 2001a] Bellinger G., Castro D., Mills A.; Data, Information, Knowledge, and Wisdom; Last Update 2002-03-15, Last Visit 2002-03-15, URL http://outsights.com/systems/dikw/dikw.htm [Bellinger et al. 2001b] Bellinger G., OutSights; Knowledge Management – Emerging Perspectives; Last Update 200203-15, Last Visit 2002-03-15, URL http://outsights.com/systems/kmgmt/kmgmt.htm [Bellinger et al. 2001c] Bellinger G., OutSights; Systems/Understanding the Way; Last Update 2002-03-15, Last Visit 2002-03-15, URL http://www.outsights.com/systems/systems/systems.htm [Bergermann 1999] Bergermann U.; Geselligkeitsröhren und Fühlhörner: mein Kunststoff. Briefwechsel, Netzwerk, Hypertext und ihre Geschlechter am Beispiel der Edition Rahel Levin Varnhagen; Tagung ’Archiv-Edition–Netzwerk’. Hamburg. Eva Lindemann, Barbara Hahn, Ulrike Landfester und Marianne Schuller. 1999; Last Update 2002-03-15, Last Visit 2002-03-15, URL http://www.uni-paderborn.de/~bergerma/texte/gesell.html [Berners-Lee et al. 2001] Berners-Lee T., Hendler J., Lassila O.; The Semantic Web: A new form of Web content that is meaningful to computers will unleash a revolution of new possibilities; Scientific American. Artikel: The Semantic Web. 2001; Last Update 2002-03-15, Last Visit 2002-03-15, URL http://www.scientificamerican.com/2001/0501issue/0501berners-lee.html [Bettoni et al. 2001] Bettoni M., Baschung N., Endress G., Rütti M.; Eine prozeßorientierte Mikro-Logik für praxisnahe Wissensmanagement-Projekte. Grundlagen und Vorgehensmodell; Workshop: Geschäftsprozessorientiertes Wissensmanagement. WM2001 Professionelles Wissensmanagement: Erfahrungen und Visionen; Baden-Baden; 2001; Last Update 2002-06-13, Last Visit 2002-06-13, URL http://www.ikm-lab.ch/repraesentationen/bb2001/Beitrag.html [Büchel 2000] Büchel G.; Datenbank – Systeme – Modellierung; Vortrag zur Fachtagung Wissensmanagement - Informationsmanagement der Fachhochschule Köln; 2000; Last Update 2002-04-10, Last Visit 2002-04-10, URL http://leuchtturm.fh-koeln.de/buechel.pdf [Capurro 2000a] Capurro R.; Wissensmanagement und darüber hinaus; In ’Aufsätze und Vorträge zum Thema Wissensmanagement’. Digitale Bibliothek; Last Update 2002-06-04, Last Visit 2002-06-04, URL http://v.hbi-stuttgart.de/WM/bausteine.htm LITERATUR- UND QUELLENVERZEICHNIS Seite 194 [Capurro 2000b] Capurro R.; Grundfragen des Wissensmanagements; In ’Aufsätze und Vorträge zum Thema Wissensmanagement’. Digitale Bibliothek; Last Update 2002-06-10, Last Visit 2002-06-10, URL http://v.hbi-stuttgart.de/WM/bausteine.htm [Choo 1998] Choo C. W.; The Knowing Organization: How Organizations Use Information to Construct Meaning, Create Knowledge, and Make Decisions.; Oxford University Press, New York. 1998. [Cover 2000] Cover R.; The XML Cover Pages: Vocabulary Markup Language (VocML); The XML Cover Pages: Online Reference Work for XML and SGML. 2000; Last Update 2002-06-10, Last Visit 2002-06-10, URL http://xml.coverpages.org/vocML.html [Crespo et al. 1998] Crespo A., Garcia-Molina H.; Archival Storage for Digital Libraries; Third ACM Conference on Digital Libraries, Pittsburgh, PA, USA. 1998; Last Update 2002-05-15, Last Visit 2002-05-15, URL http://dbpubs.stanford.edu:8090/pub/1998-49/de [Daniel et al. 1997] Daniel R., Lagoze C.; Extending the Warwick Framework: From Metadata Containers to Active Digital Objects; D-Lib Magazine. 1997; Last Update 2002-07-02, Last Visit 2002-07-02, URL http://www.dlib.org/dlib/november97/daniel/11daniel.html [Davis et al. 1993] Davis G. B., Hamilton S.; Managing Information; Business One Irwin, Homewood, pp 22, 1993 [Davenport et al. 1997a] Davenport T. H., Prusak L.; Working Knowledge: How Organizations Manage What They Know; Harvard Business School Press, USA, 1997 [Davenport et al. 1997b] Davenport T. H., Long D. W. D., Beers M.C.; Building Successful Knowledge Management Projects; Working Paper, Ernst & Young Center for Business Innovation, Jan. 1997 [Dietinger et al. 1999] Dietinger T., Guetl C., Maurer H., Pivec M.; Targeted Information Retrieval; Vorgestellt bei ICCE99 und Proc. ICCE99, Chiba, Japan. IOS Press, Amsterdam. Vol. II. P.p. 355-358. 1999;Last Update 2002-07-13, Last Visit 2002-07-13, URL http://www2.iicm.edu/cguetl/papers/targetedinformationretrieval [Disterer 2001] Disterer G.; Individual and Social Barriers to Knowledge Transfer; In Proceedings of 34th Hawaii International Conference on System Sciences – HICSS. 2001 [Drucker 1978] Drucker P.; The Age of Discontinuity; New York, 1978 [Duval 2001] Duval E.; Metadatas Standards: What, Who & Why; Journal of Universal Computer Science, vol. 7, no. 7. P.p. 591-601. Springer Pub. Co. 2001; Last Update 2002-06-13, Last Visit 2002-06-13, URL http://www.jucs.org/jucs_7_7/metadata_standards_what_who LITERATUR- UND QUELLENVERZEICHNIS Seite 195 [Easterbrook 1998] Easterbrook S.; Category Theory for Beginners; Einführung in ‘Category Theory for Software Engineers’. Department of Computer Science, University of Toronto. 1998; Last Update 2002-08-02, Last Visit 2002-08-02, URL http://www.cs.toronto.edu [Encarta 2002] Encarta: World English Dictionary; Online-Wörterbuch. Encarta, North American Edition, 2002; Last Update 2002-08-02, Last Visit 2002-08-02, URL http://encarta.msn.com [Eppler 2002] Eppler M.; Knowledge Mapping: Eine Einführung in die Techniken der Wissensvisualisierung; Präsentation in der Arbeitsgemeinschaft Wissensmanagement Kaiserslautern. Universität Kaiserslautern, Deutschland, 2002; Last Update 2002-07-13, Last Visit 2002-07-13, URL http://www.cck.uni-kl.de/wmk/papers/public/KnowledgeMapping [Fillies et al. 2001] Fillies C., Weichhardt F., Koch-Süwer G.; Prozessmodellierungswerkzeuge und das Semantic Web; 1. Konferenz ’Professionelles Wissensmanagement Erfahrungen und Visionen’; Baden-Baden, 2001; Last Update 2002-08-13, Last Visit 2002-08-13, URL http://www.semtalk.com/pub/WM2001.htm [Forst 1999] Forst A.; Information und Wissen (Teil 1): Die neuen betrieblichen Ressourcen; Doculine News, 1999 [Fuhr 1999] Fuhr N.; Information Retrieval; Unterlagen zur Lehrveranstaltung Information Retrieval an der Universität Dortmund, 1998; Last Update 2002-05-13, Last Visit 2002-05-13, URL http://ls6-www.informatik.uni-dortmund.de/ir/teaching/courses/ir [Flynn 2001] Flynn P.; The XML FAQ; Frequently Asked Questions über XML (Extensible Markup Language). In Zusammenarbeit mit der ’ WWW Consortium's XML Special Interest’ Gruppe. v2.1. 2001; Last Update 2002-08-06, Last Visit 2002-08-06, URL http://www.ucc.ie/xml [García-Barrios 2001] Garcia-Barrios V.M.; Improved Knowledge Acquisition from the Internet. An approach to a dynamic solution for web based learning systems; Seminar am Institut für Informationsverarveitung und computergestützte neue Medien - IICM – Technische Universität Graz, Österreich, 2001; Last Update 2002-06-13, Last Visit 2002-06-13, URL http://www2.iicm.edu/cguetl/education/projects/vgarcia [Garfield 1984] Garfield E.; A Tribute to S.R. Ranganathan, the Father of Indian Library Science; Essays of an Information Scientist. Vol 7. 1984. P.p.37-44; Last Update 2002-08-13, Last Visit 2002-08-13, URL http://www.garfield.library.upenn.edu/essays/v7p037y1984.pdf [Ginsburg 2000] Ginsburg M.; Intranet Document Management Systems as Knowledge Ecologies; Proceedings in 33. Hawaii International Conference on System Sciences. Hawaii, USA, 2000 LITERATUR- UND QUELLENVERZEICHNIS Seite 196 [Godbout 1998] Godbout A. J.; Filtering Knowledge: Changing Information into Knowledge Assets; Technical Report 9867, Godbout Martin Godbout & ass. 1998 [Gödert 2001] Gödert W.; Semantik und Strukturierung von Wissen (Gedanken über Gedanken über die die Verbindung zum Verbindung zum Wissensmanagement); Fachhochschule Köln, Fachbereich Bibliotheks- und Informationswesen, 2001 [Grosse 1996] Grosse A. G.; Adaptives Informationsmanagement in vernetzten Systemen; Interner Bericht 36/96 der Klausurtagung „Forschungs- und Arbeitsgebiete des Instituts für Telematik“ in Rothenburg, Deutschland. Fakultät für Informatik, Universität Karlsruhe, Kapitel 9. 1996; Last Update 2002-08-04, Last Visit 2002-08-04, URL http://www.telematik.informatik.uni-karlsruhe.de/forschung/klung96/klung96.html [Guetl 2000] Guetl Ch.; Knowledge Management; Course material for the lecture „Knowledge Management”, Technological University of Graz, Austria; Last Update 2002-06-15, Last Visit 2002-06-15, URL http://wbt-2.iicm.edu/wbt/v1/core/app/hwt/mod/ip [Harmelen et al. 1999] van Harmelen F., Fensel D.; Practical Knowledge Representation for the Web; Paper aus dem Workshop on Intelligent Information Integration IJCAI’99, 1999; Last Update 2002-03-13, Last Visit 2002-03-13, URL http://www.cs.vu.nl/~frankh/postscript/IJCAI99-III.pdf [Haub 1999] Haub H.; Aspects of Access Management in Heterogeneous Distributed Object Systems; Diplomarbeit aus Telematik an der Technischen Universität Graz - Institut für Informationsverarbeitung und Computergestützte neue Medien (IICM), 1999; Last Update 2002-05-13, Last Visit 2002-05-13, URL http://www.iicm.edu/thesis/hhaub.pdf [Heber 2000] Heber J.; Knowledge Discovery: Broker-Entwicklungsarbeiten für das xFIND-Suchsystem; Diplomarbeit an der Technischen Universität Graz, 2000; Last Update 2002-07-13, Last Visit 2002-07-13, URL http://www.iicm.edu [Helic et al. 2001] Helic D., Maurer H., Scerbakov N.; Knowledge Domains: A Global Structuring Mechanism for Learning Resources in WBT Systems; Proceedings WebNet 2001. AACE - Charlottesville, USA, P.p. 509-514, 2001; Last Update 2002-07-13, Last Visit 2002-07-13, URL http://www.iicm.edu/hmaurer/publications/by_date/2001 [Hodge 2000a] Hodge G.; Taxonomy of Knowledge Organization Sources/Systems; The Digital Library Federation Council on Library and Information Resources. USA, 2000; Last Update 2002-08-10, Last Visit 2002-08-10, URL http://nkos.slis.kent.edu/KOS_taxonomy.htm [Hotho et al. 2001] Hotho A., Maedche A., Staab S., Studer R.; SEAL-II — The Soft Spot between Richly Structured and Unstructured Knowledge,2001; Last Update 2002-08-01, Last Visit 2002-08-01, URL http://citeseer.nj.nec.com/442994.html LITERATUR- UND QUELLENVERZEICHNIS Seite 197 [Hribernik et al. 1999] Hribernik B., Sammer M.; Organisation und Wissensvernetzung im Bereich Forschung und Entwicklung der Böhler Uddeholm AG; Vortragsbericht des Instituts für Wirtschafts- und Betriebswissenschaften an der Monanuniversität Leoben für das WM Forum Graz, 1999; Last Update 2002-07-13, Last Visit 2002-07-13, URL www.cis.tu-graz.ac.at/wissensmanagement/events-beitraege/dokumente/1999-11-04-boehler.pdf [Huang 1998] Huang K.-T.; Capitalizing on intellectual assets; IBM Systems Journal. 37(4) p.p. 570–583. 1998 [Huber 1998] Huber H.; Document research based on collaborative provided structural knowledge; In ‘PAKM 98’ Practical Aspects of Knowledge Management; Proceedings der Second International Conference. Zurich, Sschweiz, P.p. 11/1-10, 1998; Last Update 2002-07-13, Last Visit 2002-07-13, URL http://sunsite.informatik.rwth-aachen.de/Publications/CEUR-WS/Vol-13 [Hyperwave 2001a] HIS Administrator Guide; Hyperwave Information Server, Version 5.5. Document Version HISV5.5-1.0; Hyperwave AG, München, Deutschland, 2001; Last Update 2002-08-06, Last Visit 2002-08-06, URL http://www.hyperwave.com [Hyperwave 2001b] HIS Programmer´s Guide; Hyperwave Information Server, Version 5.5. Document Version HIS-V5.5-1.0; Hyperwave AG, München, Deutschland, 2001; Last Update 2002-06-13, Last Visit 2002-06-13, URL http://www.hyperwave.com [Hyperwave 2001c] HIS User´s Guide; Hyperwave Information Server, Version 5.5. Document Version HIS-V5.51.0. Hyperwave AG; München, Deutschland, 2001; Last Update 2002-08-02, Last Visit 200208-02, URL http://www.hyperwave.com [Hyperwave 2002a] Hyperwave Document Management Solutions ; Broschüre zu Document Management mit dem Hyperwave Information Server; Hyperwave AG, München, Deutschland, 2002; Last Update 2002-07-13, Last Visit 2002-07-13, URL http://www.hyperwave.com [Hyperwave 2002b] Hyperwave Content Management Solutions ; Broschüre zu Content Management mit dem Hyperwave Information Server. Hyperwave AG; München, Deutschland, 2002; Last Update 2002-06-13, Last Visit 2002-06-13, URL http://www.hyperwave.com [Hyperwave 2002c] Hyperwave eKnowledge Portal; Broschüre: Die Portallösung für erfolgreiche Teamarbeit mit dem Hyperwave Information Server; Hyperwave AG, München, Deutschland, 2002; Last Update 2002-07-16, Last Visit 2002-07-16, URL http://www.hyperwave.com [Ianella 1995] Iannella R.; Internet Resource Discovery Issues; Research Data Network CRC. Universität in Queensland, Australien, 1995; Last Update 2002-08-03, Last Visit 2002-08-03, URL http://archive.dstc.edu.au/RDU/reports/QuestNet95.html LITERATUR- UND QUELLENVERZEICHNIS Seite 198 [IPK 2001] Fraunhofer - Institut für Produktionsanlagen und Konstruktionstechnik; Berlin, 1999; Last Update 2002-08-23, Last Visit 2002-08-23, URL http://www.um.ipk.fhg.de/ccwm/benefit/benefit.htm [ISO-TM 1999] ISO/IEC 13250 Topic Maps; Information Technology - Document Description and Processing Languages, 1999; Last Update 2002-08-13, Last Visit 2002-08-13, URL http://www.y12.doe.gov/sgml/sc34/document/0129.pdf [Jain et al. 1999] Jain A., Murty M., Flynn P.; Data Clustering: A Review; ACM Computing Surveys. Vol. 31. Nr. 3. 1999; Last Update 2002-06-23, Last Visit 2002-06-23, URL http://www.isi.uu.nl/TGV/jain.pdf [Janko 2001] Janko W.; Informationswirtschaft 2: Informationswirtschaft im Unternehmen; Unterlagen zu Lehrveranstaltung ’Informationsmanagement in Organisationen I+II’. Wirtschaftsuniversität Wien, Österreich, Kap. 1.9 – 1.10. 2001; Last Update 2002-07-13, Last Visit 2002-07-13, URL http://wwwai.wu-wien.ac.at/unterlagen/informationswirtschaft2.pdf [Kappe 2001] Kappe F.; Hyperwave Information Server: Technical White Paper; Technisches White Paper. Version 1.5. Januar 2001; Last Update 2002-08-13, Last Visit 2002-08-13, URL http://www.hyperwave.com [Kerssens et al. 1996] Kerssens-Van Drongelen I. C., de Weerd-Nederhof P.C., Fisscher O.A.M.; Describing the issues of knowledge management in R&D: Towards a communication and analysis tool; R & D Management, 26(3) p.p. 213–230, 1996 [Knögler 1999] Knögler B.; Wissensauffindung in verteilten Systemen: Lokale Suchmaschine und Informationsaufbereitung für externe Suchdienste; Diplomarbeit am Institut für Informationsverarbeitung und Computergestützte neue Medien. Technische Universität Graz, 1999; Last Update 2002-08-17, Last Visit 2002-08-17, URL http://www.iicm.edu [Koch et al. 1997] Koch T., Brümmer A., Hiom D., Peereboom M., Poulter A., Worsfold E.; The role of classification schemes in Internet resource description and discovery; Spezifikation für ’resource description methods’ Part 3. v3.2. Projekt DESIRE - Development of a European Service for Information on Research and Education, Sweden, 1997; Last Update 2002-08-13, Last Visit 2002-08-13, URL http://www.ukoln.ac.uk/metadata/desire/classification/ [Krcmar 2000] Krcmar H.; Management der Daten; Informationsmanagement an der Universität Hohenheim, Lehrstuhl f. Wirtschaftsinformatik, 2000; Last Update 2002-07-13, Last Visit 2002-07-13, URL http://domino.bwl.unihohenheim.de/winfobase/wb_material.nsf/aed0ef780a05b735c125692300 30a076/43b90f6b2a1b6e06c1256acb0034e3ba/$FILE/Le5.pdf LITERATUR- UND QUELLENVERZEICHNIS Seite 199 [Krottmaier et al. 2001] Krottmaier H., Maurer H. ; Transclusions in the 21st Century; Journal of Universal Computer Science, vol. 7, no. 12 (2001). P.p. 1125-1136; (Submitted: 15/10/01, accepted: 7/12/01, appeared: 28/12/01 . Springer Pub. Co.). Österreich, 2001 [Küng 1999] Küng M.; Was ist Informationsmanagement?; Last Update 2002-06-18, Last Visit 2002-06-18, URL http://www.mgfk.ch/im/ [Kyriakov et al. 2001] Kyriakov A., Dimitrov M., Simov K.; OntoMap – the Guide to the Upper-Level; International Semantic Web Working Symposium (SWWS) - Infrastructure and Applications for the Semantic Web. Stanford University, California, USA, 2001; Last Update 2002-06-13, Last Visit 2002-06-13, URL http://www.semanticweb.org/SWWS/program/full/paper35.pdf [Lacher et al. 2001] Lacher M., Groh G.; Facilitating the exchange of explicit knowledge through ontology mappings; Proceedings of 14th International FLAIRS Conference. AAAI Press. P.p.305-309. 2001; Last Update 2002-07-29, Last Visit 2002-07-29, URL http://citeseer.nj.nec.com/lacher01facilitating.html [Lamport 2002] Lamport L. ; Leslie Lamport Homepage, 2002 ; Last Update Visit 2002-08-11, URL http://research.microsoft.com/users/lamport/ 2002-08-11, Last [Lehmann 1995] Lehmann H.; Investigating A Generic Architecture For International Information Systems; Paper aus den “Sessions of the Association for Information Systems” – Americas Conference on Information Systems / Session MRIP-2: International Information Systems, 1995; Last Update 2002-08-08, Last Visit 2002-08-08, URL http://hsb.baylor.edu/ramsower/acis/sessions.htm [Lehner et al. 1998] Lehner F., Maier R., Klosa O.; Organisational Memory Systems - Application of Advanced Database & Network Technologies in Organisations; Proceedings of the 2nd International Conference on Practical Aspects of Knowledge Management (PAKM98), Schweiz, 1998; Last Update 2002-08-13, Last Visit 2002-08-13, URL http://sunsite.informatik.rwth-aachen.de/Publications/CEUR-WS/Vol-13 [Liebotz 1998] Liebowitz J.; Expert systems: An integral part of knowledge management; Kybernetes, 27(2) p.p.170–175. 1998 [LOM-IEEE 1999] IEEE Learning Technology Standards Committee (LTSC): Learning Object Metadata; Working Draft Document 3 (Approved 1999-11-27); Last Update 2002-07-17, Last Visit 2002-07-17, URL http://ltsc.ieee.org/doc/wg12/LOM-WD3.htm [Lotus 1999] Lotus Development Corporation 3/99, Knowledge Management White Paper, 1999; Last Update 2002-08-13, Last Visit 2002-08-13, URL http://www.lotus.com LITERATUR- UND QUELLENVERZEICHNIS Seite 200 [Lotus 2001] Knowledge Management in Action. Three Scenarios; White Paper von Lotus Development Corporation, IBM – Lotus, 2001 [Macintosh et al. 1998] Macintosh A., Filby I., Tate A.; Knowledge Asset Road Maps; Proceedings of 2 nd International Conference on Practical Aspects of Knowledge Management - (PAKM98). Basel, Schweiz, 1998; Last Update 2002-08-02, Last Visit 2002-08-02, URL http://www.aiai.ed.ac.uk/~oplan/documents/1998/98-pakm98-roadmaps.pdf [Maedche et al. 2001] Maedche A., Staab S., Stojanovic N., Studer R., Sure Y.; Semantic portals – The SEAL approach; Publikation der Universität Karlsruhe, 2001; Last Update 2002-08-13, Last Visit 2002-08-13, URL http://citeseer.nj.nec.com/maedche01semantic.html [Maier et al. 2000a] Maier R., Lehner F.; Perspectives on Knowledge Management Systems Theoretical Framework and Design of an Empirical Study; Proceedings of 8th European Conference on Information Systems, Vienna University of Economics and Business Administration, Österreich, 2000 [Maier et al. 2000b] Maier R., Klosa O.; Wissensmanagementsysteme; Online-Marktübersicht zum Forschungsbericht Nr. 36 – Stand Februar 2000. Universität Regensburg, Deutschland, 2000; Last Update 2002-07-13, Last Visit 2002-07-13, URL http://www-wi.uni-regensburg.de [Maier et al. 2001] Maier R., Remus U.; Towards a Framework for Knowledge Management Strategies: Process Orientation as Strategic Starting Point; Proceedings of the Hawai'i International Conference On System Sciences, Maui, Hawaii, 2001 [Maurer 1999] The Heart of the Problem: Knowledge Management and Knowledge Transfer; In Proceedings of the conference Enable99: Enabling network-based learning. Helsinki, Finnland, 1999; Last Update 2002-08-05, Last Visit 2002-08-05, URL http://www.enable.evitech.fi/enable99 [Maurer et al. 2001] Maurer H., Tochtermann K.; Vier Komponenten des informationstechnischen Wissensmanagements: Unternehmensgedächtnisse, Wissensretrieval, Wissenstransfer und Wissensvisualisierung und Wissensmanagement und Kreativität; Bericht. Management von nicht-explizitem Wissen: Noch mehr von der Natur lernen, Teil 3, FAW Ulm, P.p. 83-100. 2001; Last Update 2002-07-23, Last Visit 2002-07-23, URL http://www.iicm.edu/iicm_papers/vier_komponenten_wissensmanagement [Miranda et al. 2000] Miranda G. F., Ginestet J., Burr J., Timmermans J.; Information manager and Knowledge manager: two jobs one role?; Poster session Nr. 38 in “Proceedings of 8th Conference ICML 2000”, International Conference on Medical Librarianship, London, 2000; Last Update 2002-08-13, Last Visit 2002-08-13, URL http://www.icml.org/posters/post38/poster38.htm [Moore 2001] Moore G.; RDF and TopicMaps: An Exercise in Convergence; In ‘XML Europe 2001’. Berlin, Deutschland, 2001; Last Update 2002-08-13, Last Visit 2002-08-13, URL http://www.topicmaps.com/topicmapsrdf.pdf LITERATUR- UND QUELLENVERZEICHNIS Seite 201 [Mullender 1989] Mullender S.; Distributed Systems; ACM Press, New York, Addison Wesley, Kapitel 1,2,13,14,15,20. 1989 [Mullender 1993] Mullender S.; Distributed Systems, Second Edition; ACM Press, New York, Addison Wesley, Kapitel 1-3,7,8. 1993 [Nanfito 1996] Nanfito M.; Intranets are not for the Unwary...; White Paper in Bridge Information Systems, 1996; Last Update 2002-06-22, Last Visit 2002-06-22, URL http://www.bridgeinfo.com/intrnet2.htm [NetAcademy 1999] NetAcademy Glossar; Froschungsplattform für die “world-wide Scientific Community”, veranstaltet am “Institute for Media and Communications Management”, Universität St. Gallen, Schweiz, Dokumentversion 2.0. Entwurf, 1999; Last Update 2002-07-13, Last Visit 2002-07-13, URL http://www.netacademy.org. [Neumann et al. 1998] Neumann S., Flügge B., Finerty T.; The Art of Knowledge - Potential aus dem Wissen schöpfen; IM Information Management, 13(1) p.p. 66–74. 1998 [Nonaka et al. 1995] Nonaka I., Takeuchi H.; The Knowledge-Creating Company: How Japanese Companies Create the Dynamics of Innovation; Oxford University Press, New York, Oxford, 1995 [Novak 2002] Novak J.; The Theory Underlying Concept Maps and How To Construct Them; IHMC Concept Map Software; Last Update 2002-07-30, Last Visit 2002-07-30, URL http://cmap.coginst.uwf.edu/info [O’Leary 1998] O’Leary D. E.; Enterprise knowledge management; Computer, 31(3) p.p. 54–61. März 1998 [Oracle 2002a] Oracle9i Database Administrator's Guide; Part VI – Distributed Database Management; Chapter 28 - Distributed Database Concepts; Release 1 (9.0.1), Part Number A90117-01. 2002; Last Update 2002-07-26, Last Visit 2002-07-26, URL http://download-west.oracle.com/otndoc/oracle9i/901_doc/server.901/a90117/ds_conce.htm [Oracle8i 1999] (Primary Authors: Leverenz L., Rehfield D., Baird C.); Oracle 8i – Concepts; Oracle Documentation, Part No. A76965-01, Release 2 (8.1.6). 1999; Last Update 2002-08-13, Last Visit 2002-08-13, URL http://technet.oracle.com [Pepper 2000] Pepper S.; The TAO of Topic Maps: Finding the Way in the Age of Infoglut; In Proccedings of ’XML Europe 2000’. Paris, Frakreich, 2000; Last Update 2002-08-29, Last Visit 2002-08-29, URL http://www.gca.org/papers/xmleurope2000 LITERATUR- UND QUELLENVERZEICHNIS Seite 202 [Pralle 1999] Pralle H.; Architektur und Organisation verteilter Systeme; Universität Hannover, Deutschland, 1999; Last Update 2002-08-13, Last Visit 2002-08-13, URL http://www.rvs.uni-hannover.de/lehre/vs/Teil2_RVS_II_WS01_02.pdf [Probst et al. 1999] Probst G., Raub S., Romhardt K.; Wissen managen: Wie Unternehmen ihre wertvollste Ressource optimal nutzen; FAZ Verlag, Gabler Th., Frankfurt am Main, Wiesbaden, 3. Auflage, 1999 [Rabinovich et al. 1996] Rabinovich M., Gehani N. H., Kononov A.; Scalable Update Propagation in Epidemic Replicated Databases; In Proceedings of the Fifth International Conference on Extending Database Technology (EDBT), Avignon, 1996; Last Update 2002-07-13, Last Visit 2002-07-13, URL http://citeseer.nj.nec.com/rabinovich95scalable.html [Rath 1999] Rath H. ; Technical Issues on Topic Maps; MetaStructures 1999. GCA (Greaphic Communications Associations). Motreal, Kanada, 1999; Last Update 2002-08-14, Last Visit 2002-08-14, URL http://www.topicmap.com/resources.html [Reihlen 1996] Reihlen M.; The Logic of Heterarchies: Making Organizations Competitive for Knowledgebased Competition; Arbeitsbericht Nr.91 für die „II CEMS Academic Conference“ in Universitá Bocconi, Mailand, Italien, 1996; Last Update 2002-07-13, Last Visit 2002-07-13, URL http://www.uni-koeln.de/wiso-fak/planung/download/arbb-91.pdf [Reinmann 2001] Reinmann-Rothmeier, G.; Wissen managen: das Münchener Modell; Hintergrundbeitrag zum Thema „Eine integrative Sicht auf das Managen von Wissen“ in der Ausgabe 09/10-2001 der Zeitschrift „wissensmanagement“; Last Update 2002-08-23, Last Visit 2002-08-23, URL http://www.wissensmanagement.net/online/archiv/2001/09_1001/muenchener_modell.shtml [Remus et al. 2000] Remus U., Lehner F.; The Role of Process-oriented Enterprise Modeling in Designing Processoriented Knowledge Mangement Systems; Papers aus dem AAAI Spring Symposium (http://www.aaai.org), Serie Technical Reports - Bringing Knowledge to Business Processes – Topic: Methodologies, 2000; Last Update 2002-07-16, Last Visit 2002-07-16, URL http://aifbhermes.aifb.unikarlsruhe.de/AAAI2000/CameraReady/URemus00.pdf [Röpnack et al. 1998] Röpnack A., Schindler M., Schwan T.; Concepts of the enterprise knowledge medium; In PAKM 98. Practical Aspects of Knowledge Management, Proceedings of the Second International Conference, Zurich, Switzerland, p.p. 21.1998 [Rollett 2000] Rollett H.; Aspekte des Wissensmanagements; Diplomarbeit am Institut für Informationsverarbeitung und Computergestützte neue Medien, Technische Universität Graz, Austria, 2000 LITERATUR- UND QUELLENVERZEICHNIS Seite 203 [Rothfuss 2000] Rothfuss G.; Content Management with XML: Publishing with a Mouse-Click?; Präsentation der Euro-Prisma International GmbH bei der XML-Site der ’Software AG – Agenda 2000’; Last Update 2002-08-19, Last Visit 2002-08-19, URL: http://www.softwareag.com/xml/presentations [Scheer et al. 1999] Scheer A.-W., Markus U.; Knowledge management: Life cycle and implementation techniques; In W. Abramowicz and M. E. Orlowska, editors, BIS ’99: 3rd International Conference on Business Information Systems, Pozan, Poland. P.p. 76–85. Springer, London, 1999 [Shiri et al. 2000] Shiri A. A., Crawford R.; Thesauri on the Web: current developments and trends; Online Information Review. MCB University Press . ISSN 1468-4527. Vol. 24 . Nr. 4 . pp. 273-279. 2000; Last Update 2002-07-13, Last Visit 2002-07-13, URL: http://personal.dis.strath.ac.uk/people/shiri/thesauri.pdf [Schmitz 2001] Schmitz, K.D.; Terminologie und Wissensmanagement: Ontologie; Wissens- und Informationsmanagement 3. Interdisziplinäre Fachtagung. Institut für Informationsmanagement (IIM) -Fachhochschule Köln, 2001; Last Update 2002-08-13, Last Visit 2002-08-13, URL http://leuchtturm.fh-koeln.de/wimpro3.html [Schwartz et al. 1992] Schwartz M., Emtage A., Kahle B., Clifford Neuman B.; A Comparison of Internet Resource Discovery Approaches; omputing Systems, 5(4). 1992; Last Update 2002-08-13, Last Visit 2002-08-13, URL: http://www.codeontheroad.com/papers/RD.Comparison.pdf [Schwarzmann 1999] Schwarzmann H.; Hierarchische Benutzerverwaltung unter Hyperwave: System zur hierarchischen Benutzerverwaltung und Subadministration;Diplomarbeit am Institut für Informationsverarbeitung und Computergestützte neue Medien, TU Graz – Österreich, 1999 [Seidlitz 2001] Seidlitz R.; Abgleich von elektronischen Börsenständen zwischen ORACLE Datenbanken in einem Wide Area Netzwerk; Diplomarbeit am Institut für Informationsverarbeitung und Computergestützte neue Medien (IICM), Technische Universität Graz – Österreich, 2001 [Sigel 2000] Sigel A.; Towards knowledge organization with Topic Maps; Veröffentlichung zur XML – Europe 2000; Last Update 2002-08-13, Last Visit 2002-08-13, URL http://index.bonn.iz-soz.de/~sigel/veroeff/XML-Europe2000/s22-02.pdf [Sigel 2001] Sigel A.; Wissensorganisation: Grundlagen für Wissens- und Bibliotheks- / Informationsmanager; Skript zum Lehrblock an Donau-Universität Krems, Zentrum für Informationsmanagement und Technische Dokumentation, 2001 [Sigel et al. 2000] Sigel A. ; ISKO Arbeitsgruppe Knowledge Organization and Internet; FAQ Dokument von Alexander Sigel und der Arbeitsgruppe "Knowledge Organization and Internet" der German Section of the International Society of Knowledge Organization (ISKO), Informationszentrum Sozialwissenschaften. Deutschland, 2000 LITERATUR- UND QUELLENVERZEICHNIS Seite 204 [SP 2002] Strategy Partners; Research and Consultants on IT. Berkshire, England, Since 1996; Last Update 2002-07-13, Last Visit 2002-07-13, URL http://www.strategy-partners.com [Stadlmann 1999] Stadlmann Ch.; Implementierung und Analyse von Progress-Tracking innerhalb eines WebBased-Training-Systems; Diplomarbeit am Institut für Informationsverarbeitung und Computergestützte neue Medien (IICM), Technische Universität Graz – Österreich, 1999 [Stevenson 1995] Stevenson, D. A.; Intellectual Capital & EA (Enterprise Architecture); Extract from a paper presented to the Department of Information Systems, University of Cape Town, 1995 [Studer et al. 2001] Studer R., Erdmann M., Mädche A., Oppermann H., Schnurr H.-P., Staab S., Sure Y., Tempich C.; Arbeitsgerechte Bereitstellung von Wissen – Ontologien für das Wissensmanagement Research Publikation aus Ontoprise (Anbieter von semantischen Technologien und Anwendungen). Karlsruhe, Deutschland; Last Update 2002-07-30, Last Visit 2002-07-30, URL http://www.ontoprise.de/download/Ontologien_fuer_das_Wissensmanagement.pdf [Tanenbaum et al. 1985] Tanenbaum A.S., van Renesse R.; Distributed Operating Systems; ACM Computing Surveys 17 (4). P.p. 410 – 470, 1985 [Theel et al. 1999] Theel O., Pizka. M.; Distributed Caching and Replication; Proceedings of the 32nd Hawaii International Conference on System Sciences, Hawaii, USA, 1999 [Tochtermann et al. 2000] Tochtermann K., Maurer H.; Umweltinformatik und Wissensmanagement – Ein Überblick; Tagungsband des 14. Internationalen GI-Symposiums Informatik für den Umweltschutz, Bonn, Metropolis Verlag. P.p. 462-475. 2000; Last Update 2002-08-13, Last Visit 2002-08-13, URL http://www.iicm.edu/iicm_papers/umweltinformatik.doc [Tolen 1999] Tolen F. A. L.; Knowledge management: A practical approach; Information Services & Use. 19(1) p.p. 57–61. 1999 [Tuomi 1999] Tuomi I.; Data is more than Knowledge: Implications of the reversed knowledge hierarchy for knowledge management and organizational memory; Proceedings of the 32nd Annual Hawaii International Conference on Systems Sciences, HICSS-32, Los Alamitos, Ca, USA, IEEE Computer Society, 1999 [Umstätter 2000] Umstätter W.; Wissensorganisation mit Hilfe des semiotischen Thesaurus - auf der Basis von SGML bzw. XML; In ’Globalisierung und Wissensorganisation: Neue Aspekte für Wissen, Wissenschaft Und Informationssysteme’. Hrsg.: Ohly, H. P.; Rahmstorf, G. und Sigel, A.. P.p. 237-249. Reihe: ’Fortschritte in der Wissensorganisation’ Bd. 6. Ergon Verlag, Würzburg, 2000; Last Update 2002-07-13, Last Visit 2002-07-13, URL http://www.ib.hu-berlin.de/~wumsta/pub113.pdf LITERATUR- UND QUELLENVERZEICHNIS Seite 205 [Walker 2001] WalkerD.; Library Science and Archival Science: Professional Paradigms for Managing Webbased Environments; Final Paper für Projekt IS 200 an der ‘University of California (UCLA)’, 2001; Last Update 2002-07-19, Last Visit 2002-07-19, URL http://skipper.gseis.ucla.edu/students/dwalker/html/projects/projects.htm [Weitzer 2000] Weitzer J.; Verwendung von Qualitäts-Metadaten zur verbesserten Wissensauffindung und Testimplementierung im xFIND System; Diplomarbeit am Institut für Informationsverarbeitungund Computergestützte neue Medien. Technische Universität Graz, 2000; Last Update 2002-08-23, Last Visit 2002-08-23, URL http://www.iicm.edu [Whatis 2002] whatis.techtarget.com; ’Whatis?com’ ist ein im Bereich der Informationstechnologie spezialisiertes Wissens-Exploration-Tool und ein Teil von ’TechTarget Network of Enterprise; IT Web Sites’. Editor: Lowell Thing, 2002; Last Update 2002-07-13, Last Visit 2002-07-13, URL http://whatis.techtarget.com [Wiesmann et al. 2000] Wiesmann M., Pedone F., Schiper A., Kemme B., Alonso G.; Understanding Replication in Databases and Distributed Systems; In Proccedings of 20th International Conference on Distributed Computing Systems (ICDCS2000), Taipei, Taiwan, R.O.C. IEEE Computer Society, P.p. 264-274. 2000; Last Update 2002-08-13, Last Visit 2002-08-13, URL http://citeseer.nj.nec.com/286185.html [Wiig 1998] Wiig K. M.; Perspectives on introducing enterprise knowledge management; In PAKM 98. Practical Aspects of Knowledge Management. Proceedings of the Second International Conference, Zurich, Switzerland, 1998 [Wittkewitz 2001] Wittkewitz J.; Ausgepresst: Automatische Klassifizierung von Dokumenten; iX – Magazin für Professionelle Informationstechnik. Ausgabe 12 / 2001. P.p. 114 – 118. 2001; Last Update 2002-07-13, Last Visit 2002-07-13, URL http://www.heise.de/ix [World_Bank 1998] What is knowledge management?; Hintergrundsdokument zum „World Development Report“; Eine Liste aller Autoren und Überprüfer wird im letzten Teil „Acknowledgements“ des Berichts angeführt. World Bank, 1998; Last Update 2002-07-13, Last Visit 2002-07-13, URL http://www.apqc.org/free/whitepapers/whatiskm.pdf [Wrede 2000] Wrede O.; Interface und Knowledge Management; Vortrag bei Fachtagung „Informations- und Wissensmanagement“ - Fachhochschule Köln, 2000