Infobionik – Entwurf einer menschzentrierten Benutzerschnittstelle

Werbung
Infobionik – Entwurf einer menschzentrierten
Benutzerschnittstelle
Tobias Limberger, Max Mühlhäuser
Fachbereich Informatik, Technische Universität Darmstadt
Zusammenfassung
In vielen Wissenschafts- und Technikzweigen ist der praktische Nutzen der Bionik
anerkannt. Die Lösung technischer Probleme mit Hilfe biologisch motivierter
Prinzipien wird erfolgreich praktiziert. Maschinenbau, Architektur, Materialwissenschaft und andere profitieren vom sprichwörtlichen Blick über den Tellerrand.
Die Vorteile einer Kooperation von Informatik und Bionik dagegen sind bislang
nicht Gegenstand eines gesteigerten Interesses gewesen. Tatsächlich existiert ein
großes Potential für Innovationen auf dem Gebiet der Datenverarbeitung. Im
Rahmen diese Beitrags soll exemplarisch die Gestaltung einer biologisch motivierten Benutzerschnittstelle diskutiert werden.
Abstract
In many fields of science and engineering, the practical value of bionics is well
accepted. The solution of technical problems by means of biologically motivated
principles is often used with great success. Engineering, architecture, materials
science and others benefit from thinking outside of the box. The benefits of a cooperation of informatics and bionics in contrast were not a focus of great interest
in the past. Actually there is a great potential for innovations in the area of data
processing. Within the scope of this article, the design of a biologically motivated
user interface will be discussed exemplary.
1 Einführung
Bionik – nahezu jeder Mensch verbindet mit diesem Wort bestimmte Vorstellungen: Schiffsrümpfe, deren Formen nach dem Vorbild von Pinguinoder Delphinkörpern gestaltet sind, Fußball spielende Roboter, architektonische Großprojekte mit einer an natürliche Vorbilder angelehnten Statik
oder neuartige Oberflächenbeschichtungen und Klebstoffe. Es ist den meisten Außenstehenden eingängig, dass in der Natur für eine Reihe von Aufgaben Vorbilder effektiver Lösungen zu finden sind. Oft sind die Proble-
2
Tobias Limberger, Max Mühlhäuser
me, vor denen die Technik steht, eng verwandt mit jenen, die Tiere und
Pflanzen bewältigen müssen, seien es nun das Fliegen, besonders energiesparende Fortbewegung, die Eindämmung von Wärmeverlusten oder eine
dauerhafte Verbindung von verschiedenen Materialien. Werkstoffkunde,
Architektur, Maschinenbau, Chemie: viele Wissenschaftszweige profitieren vom Blick über den „technischen Tellerrand“.
Fantastische Literatur und Filmindustrie zeichnen das Bild einer denkbar positiven Weiterentwicklung dieses Trends: Menschen und Maschinen
kommunizieren über perfekte Schnittstellen und verschmelzen zu Mischwesen, die vorteilhafte Eigenschaften beider Domänen in sich vereinigen.
Für nahezu alle Bereiche des Lebens existieren Vorstellungen biologischtechnischer Konstruktionen, die ihre Aufgaben besser und schneller erledigen als jeder rein technische oder biologische Vorgänger. Man kann von
einer gewissen Bionik-Euphorie sprechen.
Doch diese hat sich nicht so umfassend in den Köpfen festgesetzt, wie
es scheint. Die tatsächliche Universalität des Prinzips technische Aufgabe
– biologische Lösung wird meist nicht erkannt, Fragen vieler Wissensgebiete bei der Suche nach bionischen Antworten ausgeklammert. So wird
wohl niemand auf die Idee kommen, eine Verbindung zwischen der Bionik
und der Informatik zu sehen. Bionik, das ist Bio und Technik, das sind Lösungen für praktische, greifbare Probleme! Informatik? Das ist jene nur
vage definierbare Wissenschaft, die sich mit der Verwaltung und Nutzung
von Informationen beschäftigt, die „Computerwissenschaft“ eben. Es ist
nicht so leicht zu sehen, wo die Informatik mit Problemen konfrontiert ist,
deren Lösungen bei biologischen Vorbildern zu suchen sind. Schließlich
betreibt kein noch so komplexer Insektenstaat eine Datenbank, und Computer sind eine Erfindung des Menschen, die kein Äquivalent in der Natur
besitzt.
Weit gefehlt: tatsächlich ist die „Antwort der Natur“ auf die Frage nach
der Informationsverarbeitung schon seit langem von Informationswissenschaftlern als ein fernes, doch höchst erstrebenswertes Ziel identifiziert:
das Gehirn. Während jedoch die Erfolge der Bionik in anderen Fachgebieten weitere Anstrengungen sinnvoll erscheinen lassen, ist es in der Informationsverarbeitung relativ still geworden um die Orientierung am natürlichen Vorbild. Die Welle der Begeisterung für Künstliche Intelligenz,
Neuronale Netze und Co. ist einer Ernüchterung ob der schieren Komplexität der Aufgabe gewichen. Viele hochgesteckte Ziele sind nach mehreren
Jahrzehnten der Forschung noch immer nicht in Sicht, das Geheimnis der
Intelligenz ist nicht entschlüsselt, das Gehirn nicht im Elektronikbaukasten
konstruierbar.
Trotzdem gibt es in der jüngsten Zeit wieder verschiedene Projekte, die
spezielle Probleme der Informatik durch die Umsetzung natürlicher Vor-
Infobionik – Entwurf einer menschzentrierten Benutzerschnittstelle
3
bilder zu lösen versuchen. Dabei gehen sie eher von einem minimalistischen Ansatz aus und suchen das Verhalten natürlicher Entitäten nachzubilden, ohne die exakten Mechanismen der Originale zu kennen. Beispiele
hierfür sind z.B. Routing-Verfahren, die auf sog. Ameisenalgorithmen zurückgreifen, und Optimierungsstrategien, die sich genetischer Algorithmen
bedienen. Das neue Credo der Informatik bezüglich bionischer Lösungen
ist also eher die Nutzung vorteilhafter Strategien auf einer makroskopischen als die exakte Nachbildung von Mechanismen auf einer mikroskopischen Betrachtungsebene.
2 Motivation und Einordnung
Betrachtet man die möglichen Berührungspunkte im Grenzbereich zwischen Bionik und Informatik (den man mit dem Kunstwort „Infobionik“
bezeichnen könnte) etwas näher, so sind prinzipiell zwei erkennbar: zum
einen der Bereich physischer Entitäten, zum anderen der virtueller Entitäten. Im Bereich physischer Entitäten sind Beziehungen relativ leicht zu sehen: im wesentlichen erstreckt er sich auf die Probleme der Robotik, Sensorik und Steuerungstechnik. Gegenstand ist die Konstruktion von
Maschinen, die von biologischen Vorbildern abgeleitet sind. Beispiele sind
lauffähige humanoide Roboter oder Positionierungssysteme, die nach Art
unserer optischen Orientierung mittels Zweifachkameras arbeiten. Eng
verwandt ist allerdings die Programmierung von Agenten, die z.B. für Benutzer Informationen aus dem Internet sammeln und aus dem verhaltensbiologischem Wissen schöpfen, obwohl diese Agenten sich in einem virtuellen Umfeld bewegen. Zum Themenkreis Robotik existieren vielfältige
und umfangreiche Arbeiten (eine erste Orientierung bieten z.B. [7] und
[5]).
Im zweiten Bereich ist weiter zu unterscheiden. Eine Gruppe von Anwendungen kann unter dem Begriff der Algorithmik zusammengefasst
werden. Sie bedienen sich bionischer Ideen, um Programmabläufe robuster, flexibler oder überhaupt praktikabel zu gestalten. In diese Gruppe fallen die diversen heuristischen Ansätze zur Lösung komplexer Probleme
wie etwa Fuzzy-Logik, neuronale Netze, Ameisenalgorithmen oder genetische Algorithmen (häufig wird hier auch von „Soft Computing“ gesprochen, siehe z.B. [2] oder [1]). Hindernisse bei der Entwicklung anpassungsfähiger Software etwa können möglicherweise nach dem Vorbild
menschlichen oder tierischen Lernverhaltens umgangen werden. Hier ist
insbesondere eine engere Zusammenarbeit zwischen Informatik, Neurobiologie und Neuropsychologie notwendig. Die Anwendungsgebiete robuster
4
Tobias Limberger, Max Mühlhäuser
und lernfähiger Software sind fast unbegrenzt: so erfordert jede Bearbeitung vertraulicher Daten wie Finanz- oder Personendaten den Einsatz eines
fehlerresistenten Systems, das zudem nach Möglichkeit auf schnell anwachsende Datenbestände mit geringer Halbwertszeit angemessen reagieren kann. Beinhaltet eine Aufgabe gar potentiell lebenswichtige oder auf
andere Weise kritische Daten (wie etwa medizinische oder juristisch zu
verwertende), so muss häufig das korrekte Verhalten einer Software unter
jeglichen Bedingungen garantiert werden. Schließlich sind auch all jene
Optimierungsprobleme zu nennen, die sich nicht durch simples „Ausprobieren“ lösen lassen und oft mit Hilfe biologisch inspirierter Programme
wie genetischen Algorithmen oder Ameisenalgorithmen bearbeitet werden.
Mit dem Oberbegriff Systemorganisation ist eine weitere Gruppe abzugrenzen. Diese beinhaltet vor allem die Ansätze, die sich mit Architektur
bzw. Topologie von arbeitenden Systemen auseinandersetzen. Exemplarisch kann hier das Schlagwort „Peer-to-peer“ genannt werden. Die Entwicklung von der klassischen Client-Server-Architektur zum Verbund
„gleichberechtigter“ Datenknoten oder Peers wird aus vielen Gründe propagiert. So erwartet man eine höhere Resistenz eines Netzwerks von
Rechnereinheiten gegenüber Ausfällen einzelner Knoten, wenn benachbarte Knoten die unerledigten Aufgaben derselben übernehmen können. Darüber hinaus kann davon ausgegangen werden, dass sich durch die Vermeidung einer hierarchischen Kommunikationsstruktur die Bildung von
Engpässen vermeiden oder zumindest deutlich verringern lässt. Nicht zuletzt erhofft man sich eine Beschleunigung von Prozessen durch eine starke Parallelisierung. So aktuell allerdings diese Ansätze auch sind, lassen
sie sich doch alle auf ein schon lange existierendes und effizient arbeitendes Netzwerk natürlicher Kleinstrechner zurückführen: das Gehirn. Die
zunehmende Konvergenz der Organisation künstlicher und natürlicher
„Rechner“ wird etwa in [9] erwähnt.
Die dritte Gruppe von Anwendungen ist grob als die der Datenorganisation zu bezeichnen. Sie umfasst die Probleme der Mensch-MaschineInteraktion (siehe hierzu beispielsweise [3]) und zugehörige Thematiken
wie etwa Softwareergonomie (siehe [13] für eine Einführung) und Datenzugriff im Allgemeinen. Ein Feld, auf dem sich die Verfolgung bionischer
Ansätze insbesondere anbietet, ist die (Software-)Ergonomie. Die noch
immer zunehmende Verbreitung von Rechnern und ihr Einsatz in immer
mehr Bereichen des alltäglichen Lebens erfordert Konzepte zur Vereinfachung der Bedienung. Systeme sollen mit Benutzern interagieren und ihnen Hilfestellung bei der Lösung ihrer Probleme bieten. Dabei wird erwartet, dass sie Anfragen und Kommandos verstehen und auch die Ergebnisse
ihrer Arbeit in einer allgemein verständlichen Form präsentieren. Hierzu
Infobionik – Entwurf einer menschzentrierten Benutzerschnittstelle
5
ist es dringend erforderlich, ihnen eine Möglichkeit zur Ableitung impliziter Absichten aus expliziten Formulierungen eines Benutzers zu geben.
Die Verbalisierung allen impliziten Wissens, dessen sich ein Mensch
zum Verstehen von Aussagen bedient (sein „gesunder Menschenverstand“
oder das, was eben „jedes Kind weiß“), stellt jedoch eine bisher unlösbare
Aufgabe dar. Da auch Menschen derartiges Wissen nicht explizit beigebracht bekommen, sondern durch Erfahrung erwerben, ist es sinnvoll,
Rechnern die Möglichkeit zu einem ähnlichen Lernprozess zu geben, um
so eine natürlichere und menschennähere Kommunikation zu ermöglichen.
Vorlage für derart lernende Software können möglicherweise Theorien aus
der Lern- und Gedächtnispsychologie oder Erkenntnisse aus der Hirnforschung allgemein sein.
In die letzte Gruppe der Anwendungen fällt auch der hier beschriebene
Ansatz. Seine Einordnung in die Hierarchie der Ansätze ist in Abb. 1 verdeutlicht. In ihr entspricht jeder der Ringe einer möglichen Unterteilung aller Ansätze, wobei weiter außen stehende Ringe feinere Unterteilungen
darstellen. Eine weitere Unterteilung der Kategorien nach der dritten Ebene ist, wie in Abb. 1 angedeutet, nicht nötig, da alle weiteren Subkategorien lediglich konkurrierende Ansätze auf dem jeweils übergeordneten Gebiet bezeichnen würden. Wie leicht zu erkennen ist, zieht sich die Menge
der potentiellen Bionikanwendungen quer durch die Interessengebiete der
Informatik. Noch zu oft wird dem wenig Beachtung geschenkt, doch Tatsache ist, dass zwar die Technik der heutigen Computerhardware immer
komplexer und leistungsfähiger wird, jedoch die Möglichkeiten einer Leistungssteigerung der Software durch Nachahmung „natürlicher DVProzesse“ bei weitem nicht ausgeschöpft sind.
6
Tobias Limberger, Max Mühlhäuser
Abb. 1. Ansätze in der „Infobionik“
3 Vision
Ein Feld, auf dem bisher recht wenige bionische Ansätze existieren, ist die
Datenverwaltung. Sie fällt laut unserer Kategorisierung in den Bereich
„Datenorganisation“. Tatsächlich fällt es im Gegensatz zum Ergonomiebereich auf den ersten Blick schwer, einen potentiellen Nutzen zu erkennen.
Klassische Probleme der DB-Anwendungen sind Konsistenz des Datenbestands, Gewährleistung der Vollständigkeit aller Datensätze oder die Integration multimedialer Daten. Prinzipiell sollen alle gespeicherten Daten
jederzeit korrekt, vollständig und mit möglichst geringem Aufwand (z.B.
an Zeit) für den Benutzer abgerufen werden können. Das Gedächtnis als
biologisches Analogon scheint hier ein wenig geeignetes Vorbild für leistungsfähigere Datenbanken zu sein. Schließlich hat jeder schon oft die
Tücken des eigenen Gedächtnisses erlebt: wichtige Fakten sind – oft in
Stress-Situationen – eben nicht abrufbar, sind vergessen und tauchen, falls
überhaupt, erst viel zu spät wieder im Bewusstsein auf. Noch schlimmer,
manche Erinnerungen sind schlichtweg falsch, z.B. aufgrund einer Verwechslung, oder nur noch sehr ungenau, insbesondere wenn sie lange zurückliegende Ereignisse betreffen. Nicht umsonst gibt es die bekannte Redewendung vom Gedächtnis, das uns „Streiche spielt“. Auch die Kapazität
Infobionik – Entwurf einer menschzentrierten Benutzerschnittstelle
7
des Gedächtnisses scheint verglichen mit der moderner Datenträger eher
mager: wer kann sich auch nur einen Bruchteil der Daten behalten, die in
einer Datenbank abgelegt sind? Warum also sollte ein derart fehleranfälliges System konzeptionelle Vorteile vor den bewährten Speicherlösungen
bieten?
Hierzu muss beachtet werden, wo die nicht ganz so offensichtlichen
Schwächen der technologischen Datenspeicher liegen. Letztendlich ist ihr
Nutzen durch die Menge der Informationen begrenzt, die sie menschlichen
Benutzern vermitteln können. Das Problem setzt sich also aus den Teilproblemen Datenspeicherung, -präsentation und -organisation zusammen. Gerade das letzte Feld ist jedoch bisher nicht Gegenstand eines gesteigerten
Interesses gewesen. Alle bestehenden Lösungen orientieren sich an der
Zielsetzung, Daten jederzeit vollständig und konsistent zur Verfügung zu
stellen. Viele tragen auch der Erkenntnis Rechnung, dass eine Präsentation
in einer leicht verständlichen (z.B. graphischen) Form Vorteile bietet.
Die tatsächliche Strukturierung der gespeicherten Daten dagegen ist selten für den menschlichen Benutzer optimiert. Zwei Fragen müssen sich
DB-Entwickler neuerdings stellen: erstens orientiert sich die klassische
Einteilung von Daten in Verzeichnisbäume, Archive u.ä. Konstrukte an der
Arbeitsweise des Rechners und hat wenig mit der meist semantisch (auf
den Inhalt bezogen) ausgerichteten Strukturierung von Daten im menschlichen Gedächtnis zu tun. Zweitens muss ernsthaft gefragt werden, ob eine
vollständige Speicherung aller jemals eingespeisten Daten tatsächlich wünschenswert ist.
Die Ausrichtung der Datenstrukturierung und damit auch der Präsentation nach hauptsächlich syntaktischen (auf die Form bezogenen) Merkmalen
– ein Anordnen von Dateien nach dem Alphabet, nach dem Datum der Erstellung oder der Dateigröße – erlaubt einen schnellen Zugriff durch den
Rechner selbst, wenn der Benutzer derartige Merkmale angeben kann, die
seinen Informationsbedarf umschreiben. So ist es beispielsweise leicht
möglich, eine Datei zu finden, wenn deren Name bekannt ist. Häufig aber
kann ein Benutzer zwar inhaltlich sehr genau definieren, welche Daten benötigt werden, etwa „die Gehaltsabrechnungen des letzten Monats“, hat jedoch nicht das Wissen um den entsprechenden Suchschlüssel wie Dateioder Verzeichnisname. Damit werden gespeicherte Informationen zu nutzlosen Daten, weil semantisch orientierte Zugriffsmechanismen fehlen. Wie
Abb. 2 zeigt, können sowohl bei der „Übersetzung“ einer ursprünglich semantisch orientierten Anfrage in eine rechnerspezifische Form durch den
Benutzer als auch bei der Bearbeitung derselben und bei der Interpretation
der Antwort „Reibungsverluste“ entstehen, so dass die Kommunikation
Mensch-Rechner stark beeinträchtigt ist.
8
Tobias Limberger, Max Mühlhäuser
Abb. 2. „Reibungsverluste“ bei der Mensch-Maschine-Kommunikation
Eng mit dieser Frage zusammenhängend ist die nach dem Umfang von
Datenbanken. In Anbetracht der stetig wachsenden Datenproduktion durch
Wissenschaft, Wirtschaft, sonstige Institutionen und zunehmend auch Einzelpersonen ist die klassische Vorgehensweise des „alles speichern“ nicht
mehr sinnvoll. Auch wenn die Haltung derart großer Datenmengen technisch machbar ist, so wird mit wachsender Größe einer Wissensbasis die
Suche nach bestimmten Daten immer komplexer. Hinzu kommt, dass
Großteile der produzierten Daten nicht genutzt werden und also gar nicht
gespeichert werden müssten. In diesem Licht betrachtet erscheint die biologische Einrichtung des Vergessens durchaus ihre Berechtigung zu haben.
Menschliche Gehirne z.B. werden fast ununterbrochen mit einer Vielzahl
von Daten überschüttet, die ihnen diverse Sinnesorgane zuführen. Für sie
ist die Filterung der Datenströme, das Unterscheiden wichtiger und unwichtiger Informationen lebenswichtig, um überhaupt handlungsfähig zu
bleiben. Offensichtlich existiert hier also eine Lösung für ein Problem, das
in der Informatik erst jetzt zunehmend als solches erkannt wird.
Im Folgenden soll die Vision einer Benutzerschnittstelle entwickelt
werden, um den möglichen Nutzen einer biologischen Orientierung bei der
Softwareentwicklung zu verdeutlichen.
Ziel der Benutzerschnittstelle ist es, Laien eine Möglichkeit zur Suche
in einer Datenbank zu geben, ohne ihnen entsprechendes Vorwissen abzu-
Infobionik – Entwurf einer menschzentrierten Benutzerschnittstelle
9
verlangen. Üblicherweise ist zur erfolgreichen Datensuche eine grundlegende Kenntnis sowohl der betreffenden Domäne als auch der Struktur der
Datenbank notwendig. Ohne ein solches Wissen wird die exakte Formulierung einer Anfrage unmöglich, die wiederum Voraussetzung für die Identifizierung und Beschaffung der gesuchten Daten ist. Das benötigte Vorwissen wird mit wachsender Komplexität der Domäne größer. Daher verfolgt
die betrachtete Schnittstelle hauptsächlich zwei Ziele.
Zum einen soll es Benutzern ermöglicht werden, den Datenraum zu
durchsuchen, ohne eine Anfrage durch die Angabe syntaktisch orientierter
Kriterien zu formulieren, d.h. gewünscht ist eine „intuitive Bedienbarkeit“.
Zum anderen soll das System in der Lage sein, nicht benötigtes Wissen zu
identifizieren und analog dem biologischen Gedächtnis zu „vergessen“, um
so die verwaltete Datenmenge zu verringern, ohne auf relevante Daten zu
verzichten.
Die Basis des Systems bildet eine graphische Schnittstelle, die eine
schnell erfassbare Repräsentation des Datenraumes bietet und ein „Verfolgen“ thematischer Stränge durch die Datenmenge möglich macht. Der
Vergessensmechanismus wiederum kann auf einer statistischen Auswertung des Benutzerverhaltens aufbauen: Themenstränge, die häufig auf der
Suche nach relevanten Daten verfolgt wurden, bieten offenbar gute Anhaltspunkte für eine Suche und sollten dementsprechend beibehalten werden, während selten oder nie besuchte Stränge im Laufe der Zeit aus der
Datenbasis gelöscht werden können.
4 Grundlagen
Die oben genannte Benutzerschnittstelle verwendet zwei grundlegende
Konzepte für die Organisation des Datenraumes: Entitäten und Lifestreams
oder Lebensläufe.
• Eine Entität ist definiert als „etwas, womit man Dokumente und Dateien assoziieren kann“. Dies können reale Entitäten wie z.B. Personen,
Geräte oder Räume oder auch abstrakte Entitäten wie Ereignisse oder
Prozesse sein. So kann man beispielsweise einer Person sicherlich all
jene Textdokumente zuordnen, deren Autor sie ist. Genauso ist eine Assoziation der Person mit all jenen Bilddateien möglich, die Aufnahmen
derselben zeigen. Die entsprechenden Bilder können jedoch auch z.B.
mit dem Raum assoziiert werden, in dem sie aufgenommen wurden.
• Ein Lifestream oder Lebenslauf einer Entität setzt sich aus der Menge
aller Dokumente zusammen, die mit der entsprechenden Entität auf irgendeine Weise assoziiert sind. Die Beziehung zwischen Entitäten und
10
Tobias Limberger, Max Mühlhäuser
Lebensläufen ist eine 1:1-Beziehung, d.h. jeder Entität ist genau ein Lebenslauf zugeordnet und umgekehrt. Das Lebenslaufkonzept hat dem
Projekt zur Implementierung der beschriebenen Schnittstelle seinen
Namen, LifeStreams, gegeben.
Zur Realisierung der Schnittstelle ist neben der eigentlichen Visualisierung eine Akquisition geeigneter Daten notwendig. Diese umfasst die Erfassung nicht nur der zu verwaltenden Dokumente selbst, sondern auch
zugehöriger Metadaten. Metadaten sind Informationen über Daten. Das
heißt im Falle einer Datei sind das Erstellungsdatum, die Dateigröße, das
Format, der Autor usw. als Metadaten anzusehen. Da die Schnittstelle semantische Zusammenhänge zwischen Dokumenten darstellen soll, müssen
diese für den Rechner in irgendeiner Weise erkennbar sein. Semantische
Beziehungen zwischen Objekten (wie z.B. „Datei A ergänzt Datei B“) sind
jedoch sehr viel schwerer konkret zu beschreiben als syntaktische (wie
z.B. „Datei A hat denselben Namen wie Datei B.“). Um trotzdem mit semantischen Beziehungen arbeiten zu können, müssen diese aus Metadaten
abgeleitet werden.
Einer solchen Vorgehensweise liegt die Annahme zugrunde, dass semantisch zusammenhängende Entitäten bzw. die ihnen zugeordneten Dateien auch Übereinstimmungen bezüglich der Metadaten aufweisen. Der
Umkehrschluss dieser Annahme (Ähnlichkeit der Metadaten weist auf semantische Verwandtschaft hin) ist nicht in allen Fällen, aber sehr oft korrekt. So kann man z.B. mit hoher Wahrscheinlichkeit davon ausgehen,
dass zwei Personen (Entitäten) sich kennen (eine semantische Beziehung),
wenn Bilder dieser beiden (zugeordnete Dateien) häufig bei denselben Gelegenheiten aufgenommen wurden (Übereinstimmung der Metadaten Zeit
und Ort der Aufnahmen). Im Allgemeinen ist es sogar zulässig, einen höheren Grad an Übereinstimmung bei den Metadaten anzunehmen, wenn
eine engere Verwandtschaft der Entitäten besteht.
Diese Tatsache nutzt die Schnittstelle aus, um eine Menge von Dokumenten graphisch darzustellen. Die Abbildung der Dokumente erfolgt aus
der Dokumentmenge heraus in den dreidimensionalen Raum. Auf diese
Weise können ganze Datenbanken in einer Übersicht zusammengefasst
werden. Das Prinzip ist äußerst einfach: aus der Menge der zu den Dateien
verfügbaren Metadaten werden drei ausgewählt. Jedes Metadatum kann
nun auf eine der drei Raumachsen abgebildet werden. Der Vorgang kann
anhand eines Beispiels (Abb. 3) verdeutlicht werden.
Infobionik – Entwurf einer menschzentrierten Benutzerschnittstelle
11
Abb. 3. Schema der Abbildung von Dokumenten
Um eine Menge X von Dokumenten im Raum darzustellen, sind zunächst die erwähnten drei Metadatentypen auszuwählen. Im Beispiel sind
dies das Erstellungsdatum und das Format der Dateien als zwei allgemeingültige sowie ein Vertraulichkeitsmaß als anwendungsspezifisches Beispieldatum. Jedes Dokument wird im dreidimensionalen Raum als Punkt
oder Kugel dargestellt. Seine Position hängt von den Werten der zugehörigen Metadaten ab. Eine der drei Raumachsen bildet eine Skala für das Datum. Die Abbildung ist einfach, das älteste Dokument wird auf den Nullpunkt dieser Skala abgebildet, alle anderen Dokumente erhalten Positionen
entsprechend ihres Alters. Im Falle des Formats als zweiter Dimension
muss anders vorgegangen werden. Es existiert nur eine gewisse Anzahl
von verschiedenen Formaten, und zwei Formate lassen sich bezüglich ihrer
Ähnlichkeit nicht so leicht vergleichen wie zwei Zeitpunkte (bei denen die
Abweichung als die Differenz der Zeitwerte ausgedrückt werden kann).
Daher ist für ein Metadatum wie das Dateiformat eine Nominalskala zu
verwenden, die im Allgemeinen wegen der fehlenden Ordnung innerhalb
der Menge der Formate dem System vorgegeben werden muss. Abbildung 3 zeigt eine beispielhafte Formatskala.
12
Tobias Limberger, Max Mühlhäuser
Im Falle des Vertraulichkeitsmaßes sind zwei Möglichkeiten denkbar:
ist das Vertraulichkeitsmaß als ein reeller Wert definiert und berechenbar,
kann eine kontinuierliche Skala ähnlich der Zeitskala verwendet werden.
Sind mehrere nominale Vertraulichkeitswerte wie z.B. „unbedenklich“,
„kritisch“, „geheim” u.ä. definiert, ist analog der Formatdimension zu verfahren. Über alle drei Dimensionen gesehen werden Dokumente in der
Darstellung nahe beieinander liegen, wenn sie in allen drei Metadatentypen geringe Unterschiede aufweisen, also z.B. in ähnlichen Formaten, in
kurzen Zeitabständen und mit ähnlich hoher Vertraulichkeit gespeichert
wurden. Dokumente mit größeren Unterschieden in einer oder mehreren
der Metadatenkategorien dagegen finden sich in weit voneinander entfernten Regionen des dargestellten Dokumentenraumes. Der schon erwähnten
Annahme folgend kann nun geschlossen werden, dass in der graphischen
Darstellung nahe beisammen liegende Dokumente mit einer gewissen
Wahrscheinlichkeit „etwas miteinander zu tun haben“.
Durch die Auswahl der drei Metadatentypen ist ein Benutzer in der Lage, Einfluss auf die „Sortierungskriterien“ der Darstellung zu nehmen. Er
kann sich zeitliche, räumliche, formatbezogene, sicherheitsrelevante oder
grundsätzlich andere Zusammenhänge aus der jeweiligen Darstellung erschließen. Hat er dies getan, erlaubt ihm die Schnittstelle, von einem beliebigen Dokument ausgehend die Datenbank zu „durchstöbern“, ohne im
vorhinein sein Ziel genau zu formulieren oder auch nur kennen zu müssen.
Dabei kann er aufgrund der räumlichen Anordnung der Dokumente jeweils
das aktuelle mit benachbarten assoziieren, diese betrachten und sich auf
diese Weise schrittweise an gesuchte Dokumente herantasten. Es ist außerdem sinnvoll, die während des Suchvorgangs genutzten Pfade durch
den Dokumentenraum statistisch auszuwerten und für einen gedächtnispsychologisch inspirierten Speicherbereinigungsmechanismus zu verwenden. Dokumente, die häufig als nützliche Assoziation zu gesuchten Daten
verwendet werden, tragen viel zu der dem Dokumentenraum überlagerten
semantischen Strukturierung bei. Sie sind demnach relevante Daten und
sollten im Speicher verbleiben. Dokumente, die selten von einem Nutzer
bei einer Suche genutzt werden, also wenige nützliche Assoziationen anstoßen, können im Laufe der Zeit aus dem Speicher verschwinden, da ihr
Nutzen begrenzt ist. Dieser Mechanismus ähnelt dem beobachteten Verhalten natürlichen Gedächtnisses: Daten, die lange Zeit nicht abgerufen
oder durch Abrufen verwandter Daten „aktiviert“ werden, verblassen mit
der Zeit. Es bietet sich ein Alterungsverfahren an, bei dem grundsätzlich
alle Daten einer Alterung unterliegen und im Falle eines Abrufes durch einen Benutzer wieder „verjüngt“ bzw. konsolidiert werden. Ein mögliches
Verfahrensschema zeigt Abb. 4.
Infobionik – Entwurf einer menschzentrierten Benutzerschnittstelle
13
Abb. 4. Biologisch inspirierter Speicherbereinigungsmechanismus
5 Probleme
Ein System wie das beschriebene birgt trotz seiner Möglichkeiten auch
neue Probleme in mehreren Bereichen, so z.B. solche technischer Natur,
etwa bei der Frage nach der graphischen Präsentation des Dokumentenraums. Zwar ist das Prinzip der ähnlichkeitserhaltenden Abbildung – ähnliche Dokumente werden eng beisammen liegend dargestellt, unähnliche
weit voneinander getrennt – auch schon bei anderen Systemen recht erfolgreich eingesetzt worden (etwa im Falle von SOMLib [10], oder allgemein beim sog. Clustering, z.B. [8]), doch ergeben sich zahlreiche Schwierigkeiten bei den Details der Realisierung, insbesondere beim Problem der
Skalierung. Wie sind die Maßstäbe der einzelnen Raumachsen im Verhältnis zueinander zu wählen? Soll auf einer Achse für die Zeit eine Längeneinheit einer Minute entsprechen oder einem Tag? Stellt eine Längeneinheit der Raumachse einen Meter oder einen Kilometer dar, wenn die Achse
nicht gar nominal ist (also z.B. nur zwischen einzelnen Räumen unterscheidet)? Es ist in diesem Zusammenhang zu beachten, dass eine starke
Verzerrung des dargestellten Dokumentenraums die optisch erfassbare
14
Tobias Limberger, Max Mühlhäuser
„Nachbarschaftsbeziehung“ zwischen verwandten Dokumenten aufheben
kann.
Eine zweite offene technische Frage ist die Anzahl der darstellbaren Informationen. Wie schon erwähnt ist die gleichzeitige Darstellung von drei
Metadatentypen räumlich möglich. Doch kann es vorkommen, dass eine
vierte Information in derselben graphischen Repräsentation deren Aussagekraft erhöhen würde oder dass ein Metadatentyp auf zwei Dimensionen
abgebildet wird. Letzterer Fall ist insbesondere denkbar, wenn man auch
Stichworte als Metadaten ansieht, die den Inhalt eines Dokumentes beschreiben. Die üblichen Ansätze zur graphischen Darstellung einer nach
Stichworten geordneten Dokumentenmenge verwenden zwei Dimensionen, um etwa Dokumentenmengen korrekt abbilden zu können, deren Elemente paarweise miteinander verwandt sind, so dass sich ringförmige
Strukturen ergeben. Die Situation ist in Abb. 5 dargestellt.
Eine mögliche Lösung stellt die Einführung eines zusätzlichen graphischen Hilfsmittels wie z.B. Farbe, Sättigung o.ä. dar. Hierbei muss jedoch
die eingeschränkte Verwendbarkeit mancher Präsentationsmittel einkalkuliert werden, da die Schnittstelle nach Möglichkeit universell zur Darstellung von Ähnlichkeiten aller möglichen Metadatentypen nutzbar sein soll.
Abb. 5. Darstellung ringförmiger Strukturen
Infobionik – Entwurf einer menschzentrierten Benutzerschnittstelle
15
So ist etwa die Transparenz von dargestellten Dokumenten gut geeignet,
um das Alter von Dateien zu repräsentieren (ältere Dokumente erscheinen
z.B. durchsichtig), jedoch völlig unbrauchbar für die Darstellung des Formats einer Datei. Farbe als Hilfsmittel kann dagegen sehr schnell unübersichtliche Visualisierungen schaffen, die nur schwer interpretierbar sind,
und zieht nebenbei die Notwendigkeit für Sonderlösungen im Falle von
farbenblinden Benutzern nach sich. Ähnlich eingeschränkt ist die Eignung
von Form, Sättigung oder Größe der Dokumenticons.
Außerdem ist zu beachten, dass eine Notwendigkeit zur Betrachtung
komplexer Strukturen in zwei Dimensionen nicht in jedem Falle gegeben
ist. Bei bestimmten Anwendungen ist es vorstellbar, dass lediglich einfache Zyklen gegen die Verwendung nur einer Dimension zur Darstellung
eines Metadatentyps sprechen. Im Fall einer zyklischen Struktur kann jedoch auf eine zweite Dimension zur korrekten Darstellung verzichtet werden. Die virtuelle Verbindung der beiden Endpunkte einer Achse erzeugt
das Äquivalent eines Rings. Das Prinzip verdeutlicht Abb. 6.
Der Benutzer sieht jeweils einen Ausschnitt des Dokumentenraums.
Bewegt er sich auf der virtuell zum Ring geschlossenen Achse lange genug
in eine Richtung, so ist er wieder am Ausgangspunkt seiner Suche. Damit
ist eine ringförmige Struktur unter Verwendung einer einzigen Dimension
korrekt abgebildet.
Schließlich gibt es weitere Möglichkeiten, Dimensionen „einzusparen“:
so ist z.B. die gleichzeitige Darstellung desselben Dokumentenraums in
mehreren parallel zu betrachtenden Fenstern denkbar, wobei in jedem Fenster andere Metadatentypen die Ordnung der Dokumente bestimmen. Genauso könnte argumentiert werden, dass in bestimmten Situationen ein
schneller Überblick des Dokumentenraums weitaus wichtiger ist als die
Detailstufe der Darstellung, so dass eventuell sogar komplexe Strukturen
(unter Verlust von Information) in einer Dimension dargestellt werden
dürften.
Abb. 6. Verwendung einer virtuellen Zusatzdimension
16
Tobias Limberger, Max Mühlhäuser
Ein weiteres Problem stellt momentan die mangelnde Eignung der
Schnittstelle für Spezialisten dar. Sicherlich bietet sie in der beschriebenen
Form ein geeignetes Suchwerkzeug für Benutzer, die nicht in der Lage
sind, ihren Informationsbedarf in der herkömmlichen Art exakt zu formulieren. Doch muss man bei einer Analyse der Brauchbarkeit auch beachten,
dass in vielen Fällen Anfragen an Datenbanken von Spezialisten formuliert
werden, die durchaus Großteile ihres Spezialgebietes überblicken. Für diese bedeutet ein langsames, da stark dialogbasiertes Herantasten an Informationen eher eine Einschränkung, die den Suchvorgang verlangsamt. Um
eine Verwendbarkeit für alle Benutzergruppen zu erreichen, sind entsprechende Modifikationen notwendig. Denkbar sind z.B. optionale Suchoptionen für geschulte Benutzer, deren Bedienung komplexer ist, jedoch
mächtigere Werkzeuge bietet.
Die Automatisierung der Entscheidung zwischen Speichern und Löschen von Daten schließlich erfordert – insofern sie sich überhaupt vollständig realisieren lässt – sowohl umfangreiche Tests auf technischer Ebene als auch Überzeugungsarbeit in Bezug auf die Benutzer. Sicherlich wird
man auch einer sehr zuverlässig arbeitenden Software im Vorfeld mit großer Skepsis begegnen. Schließlich müssen zahlreiche rechtliche Fragen
geklärt werden: wer trägt die Verantwortung, wenn versehentlich wichtige
Daten „vergessen“ werden, etwa Kontostände, medizinische Untersuchungsergebnisse oder Konstruktionsunterlagen? Und wen trifft im Gegenzug die Schuld, wenn datenschutzrechtlich kritische Informationen
nicht gelöscht wurden? Es ist fraglich, ob eine vollkommen autarke Software (unabhängig von der Machbarkeitsfrage) überhaupt gewünscht ist.
Vielmehr könnte eine halbautomatische Lösung günstiger sein, bei der
dem Benutzer Vorschläge zur Löschung von Datensätzen gemacht werden,
denn es wird bei einem völlig unüberwachten System immer die bange
Frage bleiben, ob nicht vielleicht doch ein Fehler unbemerkt aufgetreten
ist. Auch für ein an das menschliche Gedächtnis angelehntes Werkzeug
muss letztendlich der alte Merksatz beachtet werden, dass Irren menschlich ist.
6 Verwandte Ansätze
Es muss erwähnt werden, dass die Idee einer „menschennahen“ Kommunikation zwischen einem Information suchenden Benutzer und einer Wissensbasis bereits Gegenstand vielfältiger Bemühungen gewesen ist, die
teilweise sehr brauchbare Ergebnisse produziert haben. Genannt seien bei-
Infobionik – Entwurf einer menschzentrierten Benutzerschnittstelle
17
spielhaft einige Ansätze auf dem Gebiet der explorativen Datenanalyse oder interaktiven Datenexploration:
LifeStreams sehr ähnlich ist das SOMLib-System [10]. Es verwendet
sog. selbst organisierende Karten (SOMs), ein neuronales Netzwerkmodell, um Dokumente einer Dokumentensammlung räumlich in einer Ebene
anzuordnen. Die Ordnung beruht dabei auf einer statistischen Analyse der
in den Dokumenten vorkommenden Stichwörter. Ziel ist die automatische
Erstellung einer Struktur, die der einer Bibliothek ähnelt. Hauptunterschied
zur LifeStreams-Idee ist die Beschränkung auf zwei Dimensionen bei der
Darstellung sowie auf Stichworte bezüglich der verwendeten Metadaten.
Eine Weiterentwicklung der SOMs stellt das Generative Topographic
Mapping [4] dar.
Eng mit dem beschriebenen Ansatz verwandt ist das Information Visualization Project [11], das Informationen ebenfalls dreidimensional darstellt und sich vor allem darauf konzentriert, wie viele Daten zu einem
Zeitpunkt sichtbar gemacht werden können.
Auf sog. Clustering-Algorithmen basiert das Projekt BiblioMapper [12],
während BEADS [6] dem Multidimensional-Scaling-Ansatz folgt. Obwohl
sie sich in der Methodik also von den oben genannten unterscheiden, haben beide auch die Strukturierung von Dokumentmengen zum Ziel. Viele
andere Ansätze hat die Entwicklung im HCI-Umfeld erbracht (HCI: Human-Computer-Interaction, d.h. Mensch-Computer-Interaktion).
Sie alle haben – wie auch der LifeStreams-Ansatz – die Erleichterung
der Kommunikation und die Vermeidung von Fehlerquellen auf den
Kommunikationskanälen zum Ziel und suchen dieses dadurch zu erreichen, dass sie einen Rechner in die Lage versetzen, Informationen in einer
möglichst intuitiv verständlichen Form zu präsentieren und Anfragen in
einer umgangssprachlich orientierten Form zu „verstehen“. Dazu verwenden sie zwangsläufig Organisationsmethoden für ihre Daten, die zu entschlüsseln einem Menschen leicht fällt, die also wahrscheinlich seiner „internen“ Datenstrukturierung nahe kommen. Damit folgen all diese
Systeme, ohne gedanklich von der bionischen Idee auszugehen, letztendlich bionischen Ansätzen.
7 Ausblick
Fasst man die Einsichten aus den eingangs gemachten Überlegungen zu
möglichen Einsatzgebieten „bionischer Informatik“ und diejenigen aus der
Betrachtung der zahlreichen als bionisch zu bezeichnenden Aktivitäten in
der Informatik selbst zusammen, so ergibt sich ein durchaus positives Bild.
18
Tobias Limberger, Max Mühlhäuser
Zwar ist (von beiden Seiten) häufig ein „Neuerfinden des Rades“ zu beobachten, das sich durch einen gelegentlichen Blick über den fachspezifischen Tellerrand vermeiden ließe. Doch die zunehmende Realisierung der
Tatsache, dass Verbindungen zwischen den Wissenschaften bestehen, lässt
darauf hoffen, dass sich Vertreter beider in Zukunft stärker aufeinander zu
orientieren werden. Aus einer engeren Zusammenarbeit zwischen Spezialisten beider Seiten könnte eine ähnlich erfolgreiche und fruchtbare neue
Sparte der Wissenschaft entstehen, wie dies auf anderen Gebieten bereits
der Fall war. Die Möglichkeiten einer solchen Infobionik sind zum momentanen Zeitpunkt noch nicht abzuschätzen.
8 Literatur
1. Aliev R, Walter K, Bonfig KW, Aliew F (2000) Soft Computing. Eine grundlegende Einführung. Verlag Technik
2. Azvine B, Azarmi N, Nauck DD (Hrsg) (2000) Intelligent Systems and Soft
Computing: Prospects, Tools and Applications. Springer-Verlag Berlin Heidelberg
3. Badre A, Schneiderman B (1984) Directions in Human Computer Interaction.
Ablex Publishing Corporation
4. Bishop C, Svensen M, Williams CKI (1998) GTM: The Generative Topographic Mapping. Neural Computation 10/1, pp 215–234
5. Brooks R (2002) Menschmaschinen: Wie uns die Zukunftstechnologien neu
erschaffen. Campus Verlag
6. Chalmers M, Chitson P (1992) Bead: Exploration in information visualization. In: Proc. of the 15th Annual Int’l. ACM SIGIR Conf., Copenhagen,
Denmark, pp 330–337
7. Craig JJ (2002) Introduction to Robotics. Addison Wesley, 3. Auflage 2001/2
8. Handl J, Meyer B (2002) Improved Ant-Based Clustering and Sorting in a
Document Retrieval Interface. In: Merelo Guervós JJ et al (Eds.): PPSN VII,
LNCS 2439, pp 913–923. Springer-Verlag Berlin Heidelberg
9. Kelly K (1994) Out of Control. Perseus Books, Reading, MA, USA
10. Rauber A, Merkl D (1999) SOMLib Digital Library System. In: ECDL 1999,
Proceedings of the Third European Conference on Research and Advanced
Technology for Digital Libraries, Paris, France, pp 323–342
11. Robertson G, Card S, Mackinlay J (1993) Information visualization using 3d
interactive animation. Communications of the ACM, 36:57
12. Song M (1998) BiblioMapper: A cluster-based information visualization
technique. In: IEEE Symposium on Information Visualization (INFOVIS
’98), North Carolina
13. Stary C (1996) Interaktive Systeme. Software-Entwicklung und SoftwareErgonomie. Vieweg Verlagsgesellschaft
Herunterladen