COMPUTIONAL ARCHITECTURES FOR ATTENTION Autoren: Ernst Nieburg und Christof Koch Zusammenfassung: Alexander Falkenstern I.Notwendigkeit von Auswahlprozessen und Übersicht über Rechenmodellen Man hat viele verschiedene Sensoren, mit Hilfe deren die eingehenden Ereignisse verfolgt werden. Diese zahlreichen Daten können nicht vollständig verarbeitet werden, aber keine Informationsbearbeitungsanlage reicht, um die gewonnene Information zu bearbeiten. Als Folge muß man aus der Menge der Information nur das Wichtigste auswählen (selektive Aufmerksamkeit). II. ‚Versteckte’ und ‚offene’ Aufmerksamkeit. Visuelle Aufmerksamkeit ermöglicht ‚Zugang’ nur zum Teil der Information, die wir wahrnehmen. Man unterscheidet zwischen ‚versteckten’ und ‚offenen’ visuellen Aufmerksamkeit. Zum Beispiel, die Wahrnehmung von Wind (versteckte) und Augenbewegungen (offene). Bei visueller Aufmerksamkeit erfüllt die Lösung aus der Natur nicht alle Erfordernisse gleichzeitig, sondern verteilt die auf eine längere Zeitspanne. Die rechnerische Systeme bearbeiten dagegen eine Aufgabe nach der anderen III. Architektur von Auswahlprozesse Parallele und sequentielle Bearbeitung: Effiziente Informationsbearbeitung braucht Parallelität. Wichtige Aufgabe von Neuronen ist die Extraktion von einfachen Reizen. Aber nur eine begrenzte Menge von Information kann aus solchen einfachen Reizen extrahiert werden. Wegen der großen Anzahl von Reizkombinationen ist es unmöglich, Detektoren für jeden Reiztyp bereitzustellen. Das hat zur Folge, daß nicht jede Operation ist parallelisierbar und der bottom-up Ansatz ist sehr begrenzt. Rechnerische Argumente favorisieren ‚divide and conquer’ Ansatz, in dem Reize nach Merkmalen in die Untermengen gruppiert werden, die dann mit dem gleichen Ansatz bearbeitet werden. Die Gruppierung findet nach Objekten (‚Was’) und Position (‚Wo’) statt. Zeichenaufmerksamkeit: Es ist nützlich zwischen den Experimenten, in denen die Aufmerksamkeit von Merkmalen des Reizes selbst erregt wird und denen, wo ein Zeichen vor dem Reiz die Aufmerksamkeit erregt, zu unterscheiden. Die meisten Zeichen zeigt direkt, von wo der Reiz ausgeht. Es gibt aber indirekte Zeichen, die Information über die Position des Reizes tragen. Es ist nicht möglich, direkte Zeichen zu ignorieren, aber auch indirekte Zeichen sind wirksam. Unsere Aufmerksamkeit wird von indirekten Zeichen erregt. Feststellung von Merkmalen: Aufmerksamkeit wird auch vom Reiz selbst beeinflußt. Die hervorstehende visuelle Merkmale lenken Aufmerksamkeit zu den Reizen, die diese Merkmale besitzen, und die werden dann bevorzugt gewählt. Die Reize, die aus der Menge herausstechen, können leichter gefunden werden. Die einfachsten Merkmalen sind durch parallele Prozesse am effizientesten darstellbar. Da aber die Anzahl von Kombinationen schneller wächst, als die Anzahl der Merkmale, ist dieser Ansatz nur für elementare Feststellungen geeignet. Viele einzelne Merkmale (singleton) werden schneller festgestellt, wenn sie als Muster in der visuellen Suche verwendet werden. Singletons können also Aufmerksamkeit erregen. Zeitliche Dynamik: Sequentielle Abtastung der Szene braucht die Bewegung von dem Fokus von Aufmerksamkeit. Die Abtastung von direkten und indirekten Zeichen dauert unterschiedlich lang. Direkte Zeichen produzieren schnelle und starke Effekte, die schnell verschwinden. Indirekte Zeichen dagegen wirken schwächer und länger. Aufmerksamkeitsprozess muß nur in Verbindung mit der dynamischen Umgebung angesehen werden. Selektive Aufmerksamkeit: Der Aufmerksamkeitsprozess kommuniziert mit Sensoren und mit Erkennungsmechanismen, Gedächtnis und Verhaltenssteuerung. Die Rolle von Aufmerksamkeit als gatekeeper für Gedächtnis und Bewußtsein ist es, die Bearbeitung von nur ausgewählten Teilen der Szene zu erlauben. Gedächtnis wird auch als ‚Zwischenspeicher’ verwendet. Eine andere Aufgabe von Gedächtnis ist es, räumliche Beziehung zwischen ausgewählten Merkmalen herzustellen. IV. Rechenmodellen Merkmalbasierte Aufmerksamkeit: Dieses Modell kann den Vorgang bei der zeitlichen Dynamik reproduzieren. Es werden konkurrierende, sich gegenseitig hemmende Zellen verwendet, die die Eingabe von Sensoren bekommen. Für jedes Objekt wird die Stärke der Signaleproportional zu der Ähnlichkeit zwischen dem bekannten Objekt und der Form, die angezeigt wird, gesetzt. Die Gewichte von Verbindung in jeder Zellensammlung sind so gewählt, daß die Zellensammlungen genug Kraft haben, die ‚Konkurrenz’ zwischen den Objekten zu generieren. Gedächtnis speichert die Antwort, und es kommt die ‚finde-den-Muster’-Aufgabe. The saliency map: Erster Vortrag Shifter circuits: Als Modell dient ein mehrschichtiges Netzwerk, in dem jede Zelle als Schalter zwischen zwei Zellen in der Schicht, die eine Ebene höher liegt, dient. Dieser Schalter kann entweder geöffnet oder mit einer der ‚oberen’ Zellen verbunden sein. Durch Öffnen und Schließen solcher Schalter kann gezeigt werden, daß der Fokus von Aufmerksamkeit entweder kontinuierlich oder diskret verschoben werden kann und er kann seine Größe ändern. Es wurde auch gezeigt, daß der Fokus von Aufmerksamkeit auf allen Ebenen liegen kann. Zeitliche Markierung: Die Idee ist, daß der Aufmerksamkeitsauswahlprozess mit der Markierung von ausgewählten Reizen arbeitet. Nur markierte Reize können auf Kenntnisse und Gedächtnis zugreifen und zu motorischen Aktivitäten beitragen. Nichtmarkierte (ausgewählte) Reize haben keine Verhaltensfolgen. Es wurde gezeigt, wie man solche Markierung mit Hilfe von Spiking-Neuronen durchführen kann. Die Spike-Ketten von Neuronen, deren aufnahmebereite Bereiche sich mit dem Zentrum von Aufmerksamkeit nicht überschneiden, sind nach Poisson-Verteilung verteilt. Die Ketten, die sich mit dem Zentrum von Aufmerksamkeit überschneiden, können aus der saliency map moduliert werden. Die Ausgabe von der zeitlichen Markierung überschreitet die Grenzen von Filterung.