Infobionik – Entwurf einer menschzentrierten Benutzerschnittstelle Tobias Limberger, Max Mühlhäuser Fachbereich Informatik, Technische Universität Darmstadt Zusammenfassung In vielen Wissenschafts- und Technikzweigen ist der praktische Nutzen der Bionik anerkannt. Die Lösung technischer Probleme mit Hilfe biologisch motivierter Prinzipien wird erfolgreich praktiziert. Maschinenbau, Architektur, Materialwissenschaft und andere profitieren vom sprichwörtlichen Blick über den Tellerrand. Die Vorteile einer Kooperation von Informatik und Bionik dagegen sind bislang nicht Gegenstand eines gesteigerten Interesses gewesen. Tatsächlich existiert ein großes Potential für Innovationen auf dem Gebiet der Datenverarbeitung. Im Rahmen diese Beitrags soll exemplarisch die Gestaltung einer biologisch motivierten Benutzerschnittstelle diskutiert werden. Abstract In many fields of science and engineering, the practical value of bionics is well accepted. The solution of technical problems by means of biologically motivated principles is often used with great success. Engineering, architecture, materials science and others benefit from thinking outside of the box. The benefits of a cooperation of informatics and bionics in contrast were not a focus of great interest in the past. Actually there is a great potential for innovations in the area of data processing. Within the scope of this article, the design of a biologically motivated user interface will be discussed exemplary. 1 Einführung Bionik – nahezu jeder Mensch verbindet mit diesem Wort bestimmte Vorstellungen: Schiffsrümpfe, deren Formen nach dem Vorbild von Pinguinoder Delphinkörpern gestaltet sind, Fußball spielende Roboter, architektonische Großprojekte mit einer an natürliche Vorbilder angelehnten Statik oder neuartige Oberflächenbeschichtungen und Klebstoffe. Es ist den meisten Außenstehenden eingängig, dass in der Natur für eine Reihe von Aufgaben Vorbilder effektiver Lösungen zu finden sind. Oft sind die Proble- 2 Tobias Limberger, Max Mühlhäuser me, vor denen die Technik steht, eng verwandt mit jenen, die Tiere und Pflanzen bewältigen müssen, seien es nun das Fliegen, besonders energiesparende Fortbewegung, die Eindämmung von Wärmeverlusten oder eine dauerhafte Verbindung von verschiedenen Materialien. Werkstoffkunde, Architektur, Maschinenbau, Chemie: viele Wissenschaftszweige profitieren vom Blick über den „technischen Tellerrand“. Fantastische Literatur und Filmindustrie zeichnen das Bild einer denkbar positiven Weiterentwicklung dieses Trends: Menschen und Maschinen kommunizieren über perfekte Schnittstellen und verschmelzen zu Mischwesen, die vorteilhafte Eigenschaften beider Domänen in sich vereinigen. Für nahezu alle Bereiche des Lebens existieren Vorstellungen biologischtechnischer Konstruktionen, die ihre Aufgaben besser und schneller erledigen als jeder rein technische oder biologische Vorgänger. Man kann von einer gewissen Bionik-Euphorie sprechen. Doch diese hat sich nicht so umfassend in den Köpfen festgesetzt, wie es scheint. Die tatsächliche Universalität des Prinzips technische Aufgabe – biologische Lösung wird meist nicht erkannt, Fragen vieler Wissensgebiete bei der Suche nach bionischen Antworten ausgeklammert. So wird wohl niemand auf die Idee kommen, eine Verbindung zwischen der Bionik und der Informatik zu sehen. Bionik, das ist Bio und Technik, das sind Lösungen für praktische, greifbare Probleme! Informatik? Das ist jene nur vage definierbare Wissenschaft, die sich mit der Verwaltung und Nutzung von Informationen beschäftigt, die „Computerwissenschaft“ eben. Es ist nicht so leicht zu sehen, wo die Informatik mit Problemen konfrontiert ist, deren Lösungen bei biologischen Vorbildern zu suchen sind. Schließlich betreibt kein noch so komplexer Insektenstaat eine Datenbank, und Computer sind eine Erfindung des Menschen, die kein Äquivalent in der Natur besitzt. Weit gefehlt: tatsächlich ist die „Antwort der Natur“ auf die Frage nach der Informationsverarbeitung schon seit langem von Informationswissenschaftlern als ein fernes, doch höchst erstrebenswertes Ziel identifiziert: das Gehirn. Während jedoch die Erfolge der Bionik in anderen Fachgebieten weitere Anstrengungen sinnvoll erscheinen lassen, ist es in der Informationsverarbeitung relativ still geworden um die Orientierung am natürlichen Vorbild. Die Welle der Begeisterung für Künstliche Intelligenz, Neuronale Netze und Co. ist einer Ernüchterung ob der schieren Komplexität der Aufgabe gewichen. Viele hochgesteckte Ziele sind nach mehreren Jahrzehnten der Forschung noch immer nicht in Sicht, das Geheimnis der Intelligenz ist nicht entschlüsselt, das Gehirn nicht im Elektronikbaukasten konstruierbar. Trotzdem gibt es in der jüngsten Zeit wieder verschiedene Projekte, die spezielle Probleme der Informatik durch die Umsetzung natürlicher Vor- Infobionik – Entwurf einer menschzentrierten Benutzerschnittstelle 3 bilder zu lösen versuchen. Dabei gehen sie eher von einem minimalistischen Ansatz aus und suchen das Verhalten natürlicher Entitäten nachzubilden, ohne die exakten Mechanismen der Originale zu kennen. Beispiele hierfür sind z.B. Routing-Verfahren, die auf sog. Ameisenalgorithmen zurückgreifen, und Optimierungsstrategien, die sich genetischer Algorithmen bedienen. Das neue Credo der Informatik bezüglich bionischer Lösungen ist also eher die Nutzung vorteilhafter Strategien auf einer makroskopischen als die exakte Nachbildung von Mechanismen auf einer mikroskopischen Betrachtungsebene. 2 Motivation und Einordnung Betrachtet man die möglichen Berührungspunkte im Grenzbereich zwischen Bionik und Informatik (den man mit dem Kunstwort „Infobionik“ bezeichnen könnte) etwas näher, so sind prinzipiell zwei erkennbar: zum einen der Bereich physischer Entitäten, zum anderen der virtueller Entitäten. Im Bereich physischer Entitäten sind Beziehungen relativ leicht zu sehen: im wesentlichen erstreckt er sich auf die Probleme der Robotik, Sensorik und Steuerungstechnik. Gegenstand ist die Konstruktion von Maschinen, die von biologischen Vorbildern abgeleitet sind. Beispiele sind lauffähige humanoide Roboter oder Positionierungssysteme, die nach Art unserer optischen Orientierung mittels Zweifachkameras arbeiten. Eng verwandt ist allerdings die Programmierung von Agenten, die z.B. für Benutzer Informationen aus dem Internet sammeln und aus dem verhaltensbiologischem Wissen schöpfen, obwohl diese Agenten sich in einem virtuellen Umfeld bewegen. Zum Themenkreis Robotik existieren vielfältige und umfangreiche Arbeiten (eine erste Orientierung bieten z.B. [7] und [5]). Im zweiten Bereich ist weiter zu unterscheiden. Eine Gruppe von Anwendungen kann unter dem Begriff der Algorithmik zusammengefasst werden. Sie bedienen sich bionischer Ideen, um Programmabläufe robuster, flexibler oder überhaupt praktikabel zu gestalten. In diese Gruppe fallen die diversen heuristischen Ansätze zur Lösung komplexer Probleme wie etwa Fuzzy-Logik, neuronale Netze, Ameisenalgorithmen oder genetische Algorithmen (häufig wird hier auch von „Soft Computing“ gesprochen, siehe z.B. [2] oder [1]). Hindernisse bei der Entwicklung anpassungsfähiger Software etwa können möglicherweise nach dem Vorbild menschlichen oder tierischen Lernverhaltens umgangen werden. Hier ist insbesondere eine engere Zusammenarbeit zwischen Informatik, Neurobiologie und Neuropsychologie notwendig. Die Anwendungsgebiete robuster 4 Tobias Limberger, Max Mühlhäuser und lernfähiger Software sind fast unbegrenzt: so erfordert jede Bearbeitung vertraulicher Daten wie Finanz- oder Personendaten den Einsatz eines fehlerresistenten Systems, das zudem nach Möglichkeit auf schnell anwachsende Datenbestände mit geringer Halbwertszeit angemessen reagieren kann. Beinhaltet eine Aufgabe gar potentiell lebenswichtige oder auf andere Weise kritische Daten (wie etwa medizinische oder juristisch zu verwertende), so muss häufig das korrekte Verhalten einer Software unter jeglichen Bedingungen garantiert werden. Schließlich sind auch all jene Optimierungsprobleme zu nennen, die sich nicht durch simples „Ausprobieren“ lösen lassen und oft mit Hilfe biologisch inspirierter Programme wie genetischen Algorithmen oder Ameisenalgorithmen bearbeitet werden. Mit dem Oberbegriff Systemorganisation ist eine weitere Gruppe abzugrenzen. Diese beinhaltet vor allem die Ansätze, die sich mit Architektur bzw. Topologie von arbeitenden Systemen auseinandersetzen. Exemplarisch kann hier das Schlagwort „Peer-to-peer“ genannt werden. Die Entwicklung von der klassischen Client-Server-Architektur zum Verbund „gleichberechtigter“ Datenknoten oder Peers wird aus vielen Gründe propagiert. So erwartet man eine höhere Resistenz eines Netzwerks von Rechnereinheiten gegenüber Ausfällen einzelner Knoten, wenn benachbarte Knoten die unerledigten Aufgaben derselben übernehmen können. Darüber hinaus kann davon ausgegangen werden, dass sich durch die Vermeidung einer hierarchischen Kommunikationsstruktur die Bildung von Engpässen vermeiden oder zumindest deutlich verringern lässt. Nicht zuletzt erhofft man sich eine Beschleunigung von Prozessen durch eine starke Parallelisierung. So aktuell allerdings diese Ansätze auch sind, lassen sie sich doch alle auf ein schon lange existierendes und effizient arbeitendes Netzwerk natürlicher Kleinstrechner zurückführen: das Gehirn. Die zunehmende Konvergenz der Organisation künstlicher und natürlicher „Rechner“ wird etwa in [9] erwähnt. Die dritte Gruppe von Anwendungen ist grob als die der Datenorganisation zu bezeichnen. Sie umfasst die Probleme der Mensch-MaschineInteraktion (siehe hierzu beispielsweise [3]) und zugehörige Thematiken wie etwa Softwareergonomie (siehe [13] für eine Einführung) und Datenzugriff im Allgemeinen. Ein Feld, auf dem sich die Verfolgung bionischer Ansätze insbesondere anbietet, ist die (Software-)Ergonomie. Die noch immer zunehmende Verbreitung von Rechnern und ihr Einsatz in immer mehr Bereichen des alltäglichen Lebens erfordert Konzepte zur Vereinfachung der Bedienung. Systeme sollen mit Benutzern interagieren und ihnen Hilfestellung bei der Lösung ihrer Probleme bieten. Dabei wird erwartet, dass sie Anfragen und Kommandos verstehen und auch die Ergebnisse ihrer Arbeit in einer allgemein verständlichen Form präsentieren. Hierzu Infobionik – Entwurf einer menschzentrierten Benutzerschnittstelle 5 ist es dringend erforderlich, ihnen eine Möglichkeit zur Ableitung impliziter Absichten aus expliziten Formulierungen eines Benutzers zu geben. Die Verbalisierung allen impliziten Wissens, dessen sich ein Mensch zum Verstehen von Aussagen bedient (sein „gesunder Menschenverstand“ oder das, was eben „jedes Kind weiß“), stellt jedoch eine bisher unlösbare Aufgabe dar. Da auch Menschen derartiges Wissen nicht explizit beigebracht bekommen, sondern durch Erfahrung erwerben, ist es sinnvoll, Rechnern die Möglichkeit zu einem ähnlichen Lernprozess zu geben, um so eine natürlichere und menschennähere Kommunikation zu ermöglichen. Vorlage für derart lernende Software können möglicherweise Theorien aus der Lern- und Gedächtnispsychologie oder Erkenntnisse aus der Hirnforschung allgemein sein. In die letzte Gruppe der Anwendungen fällt auch der hier beschriebene Ansatz. Seine Einordnung in die Hierarchie der Ansätze ist in Abb. 1 verdeutlicht. In ihr entspricht jeder der Ringe einer möglichen Unterteilung aller Ansätze, wobei weiter außen stehende Ringe feinere Unterteilungen darstellen. Eine weitere Unterteilung der Kategorien nach der dritten Ebene ist, wie in Abb. 1 angedeutet, nicht nötig, da alle weiteren Subkategorien lediglich konkurrierende Ansätze auf dem jeweils übergeordneten Gebiet bezeichnen würden. Wie leicht zu erkennen ist, zieht sich die Menge der potentiellen Bionikanwendungen quer durch die Interessengebiete der Informatik. Noch zu oft wird dem wenig Beachtung geschenkt, doch Tatsache ist, dass zwar die Technik der heutigen Computerhardware immer komplexer und leistungsfähiger wird, jedoch die Möglichkeiten einer Leistungssteigerung der Software durch Nachahmung „natürlicher DVProzesse“ bei weitem nicht ausgeschöpft sind. 6 Tobias Limberger, Max Mühlhäuser Abb. 1. Ansätze in der „Infobionik“ 3 Vision Ein Feld, auf dem bisher recht wenige bionische Ansätze existieren, ist die Datenverwaltung. Sie fällt laut unserer Kategorisierung in den Bereich „Datenorganisation“. Tatsächlich fällt es im Gegensatz zum Ergonomiebereich auf den ersten Blick schwer, einen potentiellen Nutzen zu erkennen. Klassische Probleme der DB-Anwendungen sind Konsistenz des Datenbestands, Gewährleistung der Vollständigkeit aller Datensätze oder die Integration multimedialer Daten. Prinzipiell sollen alle gespeicherten Daten jederzeit korrekt, vollständig und mit möglichst geringem Aufwand (z.B. an Zeit) für den Benutzer abgerufen werden können. Das Gedächtnis als biologisches Analogon scheint hier ein wenig geeignetes Vorbild für leistungsfähigere Datenbanken zu sein. Schließlich hat jeder schon oft die Tücken des eigenen Gedächtnisses erlebt: wichtige Fakten sind – oft in Stress-Situationen – eben nicht abrufbar, sind vergessen und tauchen, falls überhaupt, erst viel zu spät wieder im Bewusstsein auf. Noch schlimmer, manche Erinnerungen sind schlichtweg falsch, z.B. aufgrund einer Verwechslung, oder nur noch sehr ungenau, insbesondere wenn sie lange zurückliegende Ereignisse betreffen. Nicht umsonst gibt es die bekannte Redewendung vom Gedächtnis, das uns „Streiche spielt“. Auch die Kapazität Infobionik – Entwurf einer menschzentrierten Benutzerschnittstelle 7 des Gedächtnisses scheint verglichen mit der moderner Datenträger eher mager: wer kann sich auch nur einen Bruchteil der Daten behalten, die in einer Datenbank abgelegt sind? Warum also sollte ein derart fehleranfälliges System konzeptionelle Vorteile vor den bewährten Speicherlösungen bieten? Hierzu muss beachtet werden, wo die nicht ganz so offensichtlichen Schwächen der technologischen Datenspeicher liegen. Letztendlich ist ihr Nutzen durch die Menge der Informationen begrenzt, die sie menschlichen Benutzern vermitteln können. Das Problem setzt sich also aus den Teilproblemen Datenspeicherung, -präsentation und -organisation zusammen. Gerade das letzte Feld ist jedoch bisher nicht Gegenstand eines gesteigerten Interesses gewesen. Alle bestehenden Lösungen orientieren sich an der Zielsetzung, Daten jederzeit vollständig und konsistent zur Verfügung zu stellen. Viele tragen auch der Erkenntnis Rechnung, dass eine Präsentation in einer leicht verständlichen (z.B. graphischen) Form Vorteile bietet. Die tatsächliche Strukturierung der gespeicherten Daten dagegen ist selten für den menschlichen Benutzer optimiert. Zwei Fragen müssen sich DB-Entwickler neuerdings stellen: erstens orientiert sich die klassische Einteilung von Daten in Verzeichnisbäume, Archive u.ä. Konstrukte an der Arbeitsweise des Rechners und hat wenig mit der meist semantisch (auf den Inhalt bezogen) ausgerichteten Strukturierung von Daten im menschlichen Gedächtnis zu tun. Zweitens muss ernsthaft gefragt werden, ob eine vollständige Speicherung aller jemals eingespeisten Daten tatsächlich wünschenswert ist. Die Ausrichtung der Datenstrukturierung und damit auch der Präsentation nach hauptsächlich syntaktischen (auf die Form bezogenen) Merkmalen – ein Anordnen von Dateien nach dem Alphabet, nach dem Datum der Erstellung oder der Dateigröße – erlaubt einen schnellen Zugriff durch den Rechner selbst, wenn der Benutzer derartige Merkmale angeben kann, die seinen Informationsbedarf umschreiben. So ist es beispielsweise leicht möglich, eine Datei zu finden, wenn deren Name bekannt ist. Häufig aber kann ein Benutzer zwar inhaltlich sehr genau definieren, welche Daten benötigt werden, etwa „die Gehaltsabrechnungen des letzten Monats“, hat jedoch nicht das Wissen um den entsprechenden Suchschlüssel wie Dateioder Verzeichnisname. Damit werden gespeicherte Informationen zu nutzlosen Daten, weil semantisch orientierte Zugriffsmechanismen fehlen. Wie Abb. 2 zeigt, können sowohl bei der „Übersetzung“ einer ursprünglich semantisch orientierten Anfrage in eine rechnerspezifische Form durch den Benutzer als auch bei der Bearbeitung derselben und bei der Interpretation der Antwort „Reibungsverluste“ entstehen, so dass die Kommunikation Mensch-Rechner stark beeinträchtigt ist. 8 Tobias Limberger, Max Mühlhäuser Abb. 2. „Reibungsverluste“ bei der Mensch-Maschine-Kommunikation Eng mit dieser Frage zusammenhängend ist die nach dem Umfang von Datenbanken. In Anbetracht der stetig wachsenden Datenproduktion durch Wissenschaft, Wirtschaft, sonstige Institutionen und zunehmend auch Einzelpersonen ist die klassische Vorgehensweise des „alles speichern“ nicht mehr sinnvoll. Auch wenn die Haltung derart großer Datenmengen technisch machbar ist, so wird mit wachsender Größe einer Wissensbasis die Suche nach bestimmten Daten immer komplexer. Hinzu kommt, dass Großteile der produzierten Daten nicht genutzt werden und also gar nicht gespeichert werden müssten. In diesem Licht betrachtet erscheint die biologische Einrichtung des Vergessens durchaus ihre Berechtigung zu haben. Menschliche Gehirne z.B. werden fast ununterbrochen mit einer Vielzahl von Daten überschüttet, die ihnen diverse Sinnesorgane zuführen. Für sie ist die Filterung der Datenströme, das Unterscheiden wichtiger und unwichtiger Informationen lebenswichtig, um überhaupt handlungsfähig zu bleiben. Offensichtlich existiert hier also eine Lösung für ein Problem, das in der Informatik erst jetzt zunehmend als solches erkannt wird. Im Folgenden soll die Vision einer Benutzerschnittstelle entwickelt werden, um den möglichen Nutzen einer biologischen Orientierung bei der Softwareentwicklung zu verdeutlichen. Ziel der Benutzerschnittstelle ist es, Laien eine Möglichkeit zur Suche in einer Datenbank zu geben, ohne ihnen entsprechendes Vorwissen abzu- Infobionik – Entwurf einer menschzentrierten Benutzerschnittstelle 9 verlangen. Üblicherweise ist zur erfolgreichen Datensuche eine grundlegende Kenntnis sowohl der betreffenden Domäne als auch der Struktur der Datenbank notwendig. Ohne ein solches Wissen wird die exakte Formulierung einer Anfrage unmöglich, die wiederum Voraussetzung für die Identifizierung und Beschaffung der gesuchten Daten ist. Das benötigte Vorwissen wird mit wachsender Komplexität der Domäne größer. Daher verfolgt die betrachtete Schnittstelle hauptsächlich zwei Ziele. Zum einen soll es Benutzern ermöglicht werden, den Datenraum zu durchsuchen, ohne eine Anfrage durch die Angabe syntaktisch orientierter Kriterien zu formulieren, d.h. gewünscht ist eine „intuitive Bedienbarkeit“. Zum anderen soll das System in der Lage sein, nicht benötigtes Wissen zu identifizieren und analog dem biologischen Gedächtnis zu „vergessen“, um so die verwaltete Datenmenge zu verringern, ohne auf relevante Daten zu verzichten. Die Basis des Systems bildet eine graphische Schnittstelle, die eine schnell erfassbare Repräsentation des Datenraumes bietet und ein „Verfolgen“ thematischer Stränge durch die Datenmenge möglich macht. Der Vergessensmechanismus wiederum kann auf einer statistischen Auswertung des Benutzerverhaltens aufbauen: Themenstränge, die häufig auf der Suche nach relevanten Daten verfolgt wurden, bieten offenbar gute Anhaltspunkte für eine Suche und sollten dementsprechend beibehalten werden, während selten oder nie besuchte Stränge im Laufe der Zeit aus der Datenbasis gelöscht werden können. 4 Grundlagen Die oben genannte Benutzerschnittstelle verwendet zwei grundlegende Konzepte für die Organisation des Datenraumes: Entitäten und Lifestreams oder Lebensläufe. • Eine Entität ist definiert als „etwas, womit man Dokumente und Dateien assoziieren kann“. Dies können reale Entitäten wie z.B. Personen, Geräte oder Räume oder auch abstrakte Entitäten wie Ereignisse oder Prozesse sein. So kann man beispielsweise einer Person sicherlich all jene Textdokumente zuordnen, deren Autor sie ist. Genauso ist eine Assoziation der Person mit all jenen Bilddateien möglich, die Aufnahmen derselben zeigen. Die entsprechenden Bilder können jedoch auch z.B. mit dem Raum assoziiert werden, in dem sie aufgenommen wurden. • Ein Lifestream oder Lebenslauf einer Entität setzt sich aus der Menge aller Dokumente zusammen, die mit der entsprechenden Entität auf irgendeine Weise assoziiert sind. Die Beziehung zwischen Entitäten und 10 Tobias Limberger, Max Mühlhäuser Lebensläufen ist eine 1:1-Beziehung, d.h. jeder Entität ist genau ein Lebenslauf zugeordnet und umgekehrt. Das Lebenslaufkonzept hat dem Projekt zur Implementierung der beschriebenen Schnittstelle seinen Namen, LifeStreams, gegeben. Zur Realisierung der Schnittstelle ist neben der eigentlichen Visualisierung eine Akquisition geeigneter Daten notwendig. Diese umfasst die Erfassung nicht nur der zu verwaltenden Dokumente selbst, sondern auch zugehöriger Metadaten. Metadaten sind Informationen über Daten. Das heißt im Falle einer Datei sind das Erstellungsdatum, die Dateigröße, das Format, der Autor usw. als Metadaten anzusehen. Da die Schnittstelle semantische Zusammenhänge zwischen Dokumenten darstellen soll, müssen diese für den Rechner in irgendeiner Weise erkennbar sein. Semantische Beziehungen zwischen Objekten (wie z.B. „Datei A ergänzt Datei B“) sind jedoch sehr viel schwerer konkret zu beschreiben als syntaktische (wie z.B. „Datei A hat denselben Namen wie Datei B.“). Um trotzdem mit semantischen Beziehungen arbeiten zu können, müssen diese aus Metadaten abgeleitet werden. Einer solchen Vorgehensweise liegt die Annahme zugrunde, dass semantisch zusammenhängende Entitäten bzw. die ihnen zugeordneten Dateien auch Übereinstimmungen bezüglich der Metadaten aufweisen. Der Umkehrschluss dieser Annahme (Ähnlichkeit der Metadaten weist auf semantische Verwandtschaft hin) ist nicht in allen Fällen, aber sehr oft korrekt. So kann man z.B. mit hoher Wahrscheinlichkeit davon ausgehen, dass zwei Personen (Entitäten) sich kennen (eine semantische Beziehung), wenn Bilder dieser beiden (zugeordnete Dateien) häufig bei denselben Gelegenheiten aufgenommen wurden (Übereinstimmung der Metadaten Zeit und Ort der Aufnahmen). Im Allgemeinen ist es sogar zulässig, einen höheren Grad an Übereinstimmung bei den Metadaten anzunehmen, wenn eine engere Verwandtschaft der Entitäten besteht. Diese Tatsache nutzt die Schnittstelle aus, um eine Menge von Dokumenten graphisch darzustellen. Die Abbildung der Dokumente erfolgt aus der Dokumentmenge heraus in den dreidimensionalen Raum. Auf diese Weise können ganze Datenbanken in einer Übersicht zusammengefasst werden. Das Prinzip ist äußerst einfach: aus der Menge der zu den Dateien verfügbaren Metadaten werden drei ausgewählt. Jedes Metadatum kann nun auf eine der drei Raumachsen abgebildet werden. Der Vorgang kann anhand eines Beispiels (Abb. 3) verdeutlicht werden. Infobionik – Entwurf einer menschzentrierten Benutzerschnittstelle 11 Abb. 3. Schema der Abbildung von Dokumenten Um eine Menge X von Dokumenten im Raum darzustellen, sind zunächst die erwähnten drei Metadatentypen auszuwählen. Im Beispiel sind dies das Erstellungsdatum und das Format der Dateien als zwei allgemeingültige sowie ein Vertraulichkeitsmaß als anwendungsspezifisches Beispieldatum. Jedes Dokument wird im dreidimensionalen Raum als Punkt oder Kugel dargestellt. Seine Position hängt von den Werten der zugehörigen Metadaten ab. Eine der drei Raumachsen bildet eine Skala für das Datum. Die Abbildung ist einfach, das älteste Dokument wird auf den Nullpunkt dieser Skala abgebildet, alle anderen Dokumente erhalten Positionen entsprechend ihres Alters. Im Falle des Formats als zweiter Dimension muss anders vorgegangen werden. Es existiert nur eine gewisse Anzahl von verschiedenen Formaten, und zwei Formate lassen sich bezüglich ihrer Ähnlichkeit nicht so leicht vergleichen wie zwei Zeitpunkte (bei denen die Abweichung als die Differenz der Zeitwerte ausgedrückt werden kann). Daher ist für ein Metadatum wie das Dateiformat eine Nominalskala zu verwenden, die im Allgemeinen wegen der fehlenden Ordnung innerhalb der Menge der Formate dem System vorgegeben werden muss. Abbildung 3 zeigt eine beispielhafte Formatskala. 12 Tobias Limberger, Max Mühlhäuser Im Falle des Vertraulichkeitsmaßes sind zwei Möglichkeiten denkbar: ist das Vertraulichkeitsmaß als ein reeller Wert definiert und berechenbar, kann eine kontinuierliche Skala ähnlich der Zeitskala verwendet werden. Sind mehrere nominale Vertraulichkeitswerte wie z.B. „unbedenklich“, „kritisch“, „geheim” u.ä. definiert, ist analog der Formatdimension zu verfahren. Über alle drei Dimensionen gesehen werden Dokumente in der Darstellung nahe beieinander liegen, wenn sie in allen drei Metadatentypen geringe Unterschiede aufweisen, also z.B. in ähnlichen Formaten, in kurzen Zeitabständen und mit ähnlich hoher Vertraulichkeit gespeichert wurden. Dokumente mit größeren Unterschieden in einer oder mehreren der Metadatenkategorien dagegen finden sich in weit voneinander entfernten Regionen des dargestellten Dokumentenraumes. Der schon erwähnten Annahme folgend kann nun geschlossen werden, dass in der graphischen Darstellung nahe beisammen liegende Dokumente mit einer gewissen Wahrscheinlichkeit „etwas miteinander zu tun haben“. Durch die Auswahl der drei Metadatentypen ist ein Benutzer in der Lage, Einfluss auf die „Sortierungskriterien“ der Darstellung zu nehmen. Er kann sich zeitliche, räumliche, formatbezogene, sicherheitsrelevante oder grundsätzlich andere Zusammenhänge aus der jeweiligen Darstellung erschließen. Hat er dies getan, erlaubt ihm die Schnittstelle, von einem beliebigen Dokument ausgehend die Datenbank zu „durchstöbern“, ohne im vorhinein sein Ziel genau zu formulieren oder auch nur kennen zu müssen. Dabei kann er aufgrund der räumlichen Anordnung der Dokumente jeweils das aktuelle mit benachbarten assoziieren, diese betrachten und sich auf diese Weise schrittweise an gesuchte Dokumente herantasten. Es ist außerdem sinnvoll, die während des Suchvorgangs genutzten Pfade durch den Dokumentenraum statistisch auszuwerten und für einen gedächtnispsychologisch inspirierten Speicherbereinigungsmechanismus zu verwenden. Dokumente, die häufig als nützliche Assoziation zu gesuchten Daten verwendet werden, tragen viel zu der dem Dokumentenraum überlagerten semantischen Strukturierung bei. Sie sind demnach relevante Daten und sollten im Speicher verbleiben. Dokumente, die selten von einem Nutzer bei einer Suche genutzt werden, also wenige nützliche Assoziationen anstoßen, können im Laufe der Zeit aus dem Speicher verschwinden, da ihr Nutzen begrenzt ist. Dieser Mechanismus ähnelt dem beobachteten Verhalten natürlichen Gedächtnisses: Daten, die lange Zeit nicht abgerufen oder durch Abrufen verwandter Daten „aktiviert“ werden, verblassen mit der Zeit. Es bietet sich ein Alterungsverfahren an, bei dem grundsätzlich alle Daten einer Alterung unterliegen und im Falle eines Abrufes durch einen Benutzer wieder „verjüngt“ bzw. konsolidiert werden. Ein mögliches Verfahrensschema zeigt Abb. 4. Infobionik – Entwurf einer menschzentrierten Benutzerschnittstelle 13 Abb. 4. Biologisch inspirierter Speicherbereinigungsmechanismus 5 Probleme Ein System wie das beschriebene birgt trotz seiner Möglichkeiten auch neue Probleme in mehreren Bereichen, so z.B. solche technischer Natur, etwa bei der Frage nach der graphischen Präsentation des Dokumentenraums. Zwar ist das Prinzip der ähnlichkeitserhaltenden Abbildung – ähnliche Dokumente werden eng beisammen liegend dargestellt, unähnliche weit voneinander getrennt – auch schon bei anderen Systemen recht erfolgreich eingesetzt worden (etwa im Falle von SOMLib [10], oder allgemein beim sog. Clustering, z.B. [8]), doch ergeben sich zahlreiche Schwierigkeiten bei den Details der Realisierung, insbesondere beim Problem der Skalierung. Wie sind die Maßstäbe der einzelnen Raumachsen im Verhältnis zueinander zu wählen? Soll auf einer Achse für die Zeit eine Längeneinheit einer Minute entsprechen oder einem Tag? Stellt eine Längeneinheit der Raumachse einen Meter oder einen Kilometer dar, wenn die Achse nicht gar nominal ist (also z.B. nur zwischen einzelnen Räumen unterscheidet)? Es ist in diesem Zusammenhang zu beachten, dass eine starke Verzerrung des dargestellten Dokumentenraums die optisch erfassbare 14 Tobias Limberger, Max Mühlhäuser „Nachbarschaftsbeziehung“ zwischen verwandten Dokumenten aufheben kann. Eine zweite offene technische Frage ist die Anzahl der darstellbaren Informationen. Wie schon erwähnt ist die gleichzeitige Darstellung von drei Metadatentypen räumlich möglich. Doch kann es vorkommen, dass eine vierte Information in derselben graphischen Repräsentation deren Aussagekraft erhöhen würde oder dass ein Metadatentyp auf zwei Dimensionen abgebildet wird. Letzterer Fall ist insbesondere denkbar, wenn man auch Stichworte als Metadaten ansieht, die den Inhalt eines Dokumentes beschreiben. Die üblichen Ansätze zur graphischen Darstellung einer nach Stichworten geordneten Dokumentenmenge verwenden zwei Dimensionen, um etwa Dokumentenmengen korrekt abbilden zu können, deren Elemente paarweise miteinander verwandt sind, so dass sich ringförmige Strukturen ergeben. Die Situation ist in Abb. 5 dargestellt. Eine mögliche Lösung stellt die Einführung eines zusätzlichen graphischen Hilfsmittels wie z.B. Farbe, Sättigung o.ä. dar. Hierbei muss jedoch die eingeschränkte Verwendbarkeit mancher Präsentationsmittel einkalkuliert werden, da die Schnittstelle nach Möglichkeit universell zur Darstellung von Ähnlichkeiten aller möglichen Metadatentypen nutzbar sein soll. Abb. 5. Darstellung ringförmiger Strukturen Infobionik – Entwurf einer menschzentrierten Benutzerschnittstelle 15 So ist etwa die Transparenz von dargestellten Dokumenten gut geeignet, um das Alter von Dateien zu repräsentieren (ältere Dokumente erscheinen z.B. durchsichtig), jedoch völlig unbrauchbar für die Darstellung des Formats einer Datei. Farbe als Hilfsmittel kann dagegen sehr schnell unübersichtliche Visualisierungen schaffen, die nur schwer interpretierbar sind, und zieht nebenbei die Notwendigkeit für Sonderlösungen im Falle von farbenblinden Benutzern nach sich. Ähnlich eingeschränkt ist die Eignung von Form, Sättigung oder Größe der Dokumenticons. Außerdem ist zu beachten, dass eine Notwendigkeit zur Betrachtung komplexer Strukturen in zwei Dimensionen nicht in jedem Falle gegeben ist. Bei bestimmten Anwendungen ist es vorstellbar, dass lediglich einfache Zyklen gegen die Verwendung nur einer Dimension zur Darstellung eines Metadatentyps sprechen. Im Fall einer zyklischen Struktur kann jedoch auf eine zweite Dimension zur korrekten Darstellung verzichtet werden. Die virtuelle Verbindung der beiden Endpunkte einer Achse erzeugt das Äquivalent eines Rings. Das Prinzip verdeutlicht Abb. 6. Der Benutzer sieht jeweils einen Ausschnitt des Dokumentenraums. Bewegt er sich auf der virtuell zum Ring geschlossenen Achse lange genug in eine Richtung, so ist er wieder am Ausgangspunkt seiner Suche. Damit ist eine ringförmige Struktur unter Verwendung einer einzigen Dimension korrekt abgebildet. Schließlich gibt es weitere Möglichkeiten, Dimensionen „einzusparen“: so ist z.B. die gleichzeitige Darstellung desselben Dokumentenraums in mehreren parallel zu betrachtenden Fenstern denkbar, wobei in jedem Fenster andere Metadatentypen die Ordnung der Dokumente bestimmen. Genauso könnte argumentiert werden, dass in bestimmten Situationen ein schneller Überblick des Dokumentenraums weitaus wichtiger ist als die Detailstufe der Darstellung, so dass eventuell sogar komplexe Strukturen (unter Verlust von Information) in einer Dimension dargestellt werden dürften. Abb. 6. Verwendung einer virtuellen Zusatzdimension 16 Tobias Limberger, Max Mühlhäuser Ein weiteres Problem stellt momentan die mangelnde Eignung der Schnittstelle für Spezialisten dar. Sicherlich bietet sie in der beschriebenen Form ein geeignetes Suchwerkzeug für Benutzer, die nicht in der Lage sind, ihren Informationsbedarf in der herkömmlichen Art exakt zu formulieren. Doch muss man bei einer Analyse der Brauchbarkeit auch beachten, dass in vielen Fällen Anfragen an Datenbanken von Spezialisten formuliert werden, die durchaus Großteile ihres Spezialgebietes überblicken. Für diese bedeutet ein langsames, da stark dialogbasiertes Herantasten an Informationen eher eine Einschränkung, die den Suchvorgang verlangsamt. Um eine Verwendbarkeit für alle Benutzergruppen zu erreichen, sind entsprechende Modifikationen notwendig. Denkbar sind z.B. optionale Suchoptionen für geschulte Benutzer, deren Bedienung komplexer ist, jedoch mächtigere Werkzeuge bietet. Die Automatisierung der Entscheidung zwischen Speichern und Löschen von Daten schließlich erfordert – insofern sie sich überhaupt vollständig realisieren lässt – sowohl umfangreiche Tests auf technischer Ebene als auch Überzeugungsarbeit in Bezug auf die Benutzer. Sicherlich wird man auch einer sehr zuverlässig arbeitenden Software im Vorfeld mit großer Skepsis begegnen. Schließlich müssen zahlreiche rechtliche Fragen geklärt werden: wer trägt die Verantwortung, wenn versehentlich wichtige Daten „vergessen“ werden, etwa Kontostände, medizinische Untersuchungsergebnisse oder Konstruktionsunterlagen? Und wen trifft im Gegenzug die Schuld, wenn datenschutzrechtlich kritische Informationen nicht gelöscht wurden? Es ist fraglich, ob eine vollkommen autarke Software (unabhängig von der Machbarkeitsfrage) überhaupt gewünscht ist. Vielmehr könnte eine halbautomatische Lösung günstiger sein, bei der dem Benutzer Vorschläge zur Löschung von Datensätzen gemacht werden, denn es wird bei einem völlig unüberwachten System immer die bange Frage bleiben, ob nicht vielleicht doch ein Fehler unbemerkt aufgetreten ist. Auch für ein an das menschliche Gedächtnis angelehntes Werkzeug muss letztendlich der alte Merksatz beachtet werden, dass Irren menschlich ist. 6 Verwandte Ansätze Es muss erwähnt werden, dass die Idee einer „menschennahen“ Kommunikation zwischen einem Information suchenden Benutzer und einer Wissensbasis bereits Gegenstand vielfältiger Bemühungen gewesen ist, die teilweise sehr brauchbare Ergebnisse produziert haben. Genannt seien bei- Infobionik – Entwurf einer menschzentrierten Benutzerschnittstelle 17 spielhaft einige Ansätze auf dem Gebiet der explorativen Datenanalyse oder interaktiven Datenexploration: LifeStreams sehr ähnlich ist das SOMLib-System [10]. Es verwendet sog. selbst organisierende Karten (SOMs), ein neuronales Netzwerkmodell, um Dokumente einer Dokumentensammlung räumlich in einer Ebene anzuordnen. Die Ordnung beruht dabei auf einer statistischen Analyse der in den Dokumenten vorkommenden Stichwörter. Ziel ist die automatische Erstellung einer Struktur, die der einer Bibliothek ähnelt. Hauptunterschied zur LifeStreams-Idee ist die Beschränkung auf zwei Dimensionen bei der Darstellung sowie auf Stichworte bezüglich der verwendeten Metadaten. Eine Weiterentwicklung der SOMs stellt das Generative Topographic Mapping [4] dar. Eng mit dem beschriebenen Ansatz verwandt ist das Information Visualization Project [11], das Informationen ebenfalls dreidimensional darstellt und sich vor allem darauf konzentriert, wie viele Daten zu einem Zeitpunkt sichtbar gemacht werden können. Auf sog. Clustering-Algorithmen basiert das Projekt BiblioMapper [12], während BEADS [6] dem Multidimensional-Scaling-Ansatz folgt. Obwohl sie sich in der Methodik also von den oben genannten unterscheiden, haben beide auch die Strukturierung von Dokumentmengen zum Ziel. Viele andere Ansätze hat die Entwicklung im HCI-Umfeld erbracht (HCI: Human-Computer-Interaction, d.h. Mensch-Computer-Interaktion). Sie alle haben – wie auch der LifeStreams-Ansatz – die Erleichterung der Kommunikation und die Vermeidung von Fehlerquellen auf den Kommunikationskanälen zum Ziel und suchen dieses dadurch zu erreichen, dass sie einen Rechner in die Lage versetzen, Informationen in einer möglichst intuitiv verständlichen Form zu präsentieren und Anfragen in einer umgangssprachlich orientierten Form zu „verstehen“. Dazu verwenden sie zwangsläufig Organisationsmethoden für ihre Daten, die zu entschlüsseln einem Menschen leicht fällt, die also wahrscheinlich seiner „internen“ Datenstrukturierung nahe kommen. Damit folgen all diese Systeme, ohne gedanklich von der bionischen Idee auszugehen, letztendlich bionischen Ansätzen. 7 Ausblick Fasst man die Einsichten aus den eingangs gemachten Überlegungen zu möglichen Einsatzgebieten „bionischer Informatik“ und diejenigen aus der Betrachtung der zahlreichen als bionisch zu bezeichnenden Aktivitäten in der Informatik selbst zusammen, so ergibt sich ein durchaus positives Bild. 18 Tobias Limberger, Max Mühlhäuser Zwar ist (von beiden Seiten) häufig ein „Neuerfinden des Rades“ zu beobachten, das sich durch einen gelegentlichen Blick über den fachspezifischen Tellerrand vermeiden ließe. Doch die zunehmende Realisierung der Tatsache, dass Verbindungen zwischen den Wissenschaften bestehen, lässt darauf hoffen, dass sich Vertreter beider in Zukunft stärker aufeinander zu orientieren werden. Aus einer engeren Zusammenarbeit zwischen Spezialisten beider Seiten könnte eine ähnlich erfolgreiche und fruchtbare neue Sparte der Wissenschaft entstehen, wie dies auf anderen Gebieten bereits der Fall war. Die Möglichkeiten einer solchen Infobionik sind zum momentanen Zeitpunkt noch nicht abzuschätzen. 8 Literatur 1. Aliev R, Walter K, Bonfig KW, Aliew F (2000) Soft Computing. Eine grundlegende Einführung. Verlag Technik 2. Azvine B, Azarmi N, Nauck DD (Hrsg) (2000) Intelligent Systems and Soft Computing: Prospects, Tools and Applications. Springer-Verlag Berlin Heidelberg 3. Badre A, Schneiderman B (1984) Directions in Human Computer Interaction. Ablex Publishing Corporation 4. Bishop C, Svensen M, Williams CKI (1998) GTM: The Generative Topographic Mapping. Neural Computation 10/1, pp 215–234 5. Brooks R (2002) Menschmaschinen: Wie uns die Zukunftstechnologien neu erschaffen. Campus Verlag 6. Chalmers M, Chitson P (1992) Bead: Exploration in information visualization. In: Proc. of the 15th Annual Int’l. ACM SIGIR Conf., Copenhagen, Denmark, pp 330–337 7. Craig JJ (2002) Introduction to Robotics. Addison Wesley, 3. Auflage 2001/2 8. Handl J, Meyer B (2002) Improved Ant-Based Clustering and Sorting in a Document Retrieval Interface. In: Merelo Guervós JJ et al (Eds.): PPSN VII, LNCS 2439, pp 913–923. Springer-Verlag Berlin Heidelberg 9. Kelly K (1994) Out of Control. Perseus Books, Reading, MA, USA 10. Rauber A, Merkl D (1999) SOMLib Digital Library System. In: ECDL 1999, Proceedings of the Third European Conference on Research and Advanced Technology for Digital Libraries, Paris, France, pp 323–342 11. Robertson G, Card S, Mackinlay J (1993) Information visualization using 3d interactive animation. Communications of the ACM, 36:57 12. Song M (1998) BiblioMapper: A cluster-based information visualization technique. In: IEEE Symposium on Information Visualization (INFOVIS ’98), North Carolina 13. Stary C (1996) Interaktive Systeme. Software-Entwicklung und SoftwareErgonomie. Vieweg Verlagsgesellschaft