Zusammenfassung

COMPUTIONAL ARCHITECTURES FOR ATTENTION
Autoren: Ernst Nieburg und Christof Koch Zusammenfassung: Alexander Falkenstern
I.Notwendigkeit von Auswahlprozessen und Übersicht über Rechenmodellen
Man hat viele verschiedene Sensoren, mit Hilfe deren die eingehenden Ereignisse verfolgt werden. Diese zahlreichen
Daten können nicht vollständig verarbeitet werden, aber keine Informationsbearbeitungsanlage reicht, um die gewonnene
Information zu bearbeiten. Als Folge muß man aus der Menge der Information nur das Wichtigste auswählen (selektive
Aufmerksamkeit).
II. ‚Versteckte’ und ‚offene’ Aufmerksamkeit.
Visuelle Aufmerksamkeit ermöglicht ‚Zugang’ nur zum Teil der Information, die wir wahrnehmen. Man unterscheidet
zwischen ‚versteckten’ und ‚offenen’ visuellen Aufmerksamkeit. Zum Beispiel, die Wahrnehmung von Wind (versteckte)
und Augenbewegungen (offene). Bei visueller Aufmerksamkeit erfüllt die Lösung aus der Natur nicht alle Erfordernisse
gleichzeitig, sondern verteilt die auf eine längere Zeitspanne. Die rechnerische Systeme bearbeiten dagegen eine Aufgabe
nach der anderen
III. Architektur von Auswahlprozesse
Parallele und sequentielle Bearbeitung: Effiziente Informationsbearbeitung braucht Parallelität. Wichtige Aufgabe von
Neuronen ist die Extraktion von einfachen Reizen. Aber nur eine begrenzte Menge von Information kann aus solchen
einfachen Reizen extrahiert werden. Wegen der großen Anzahl von Reizkombinationen ist es unmöglich, Detektoren für
jeden Reiztyp bereitzustellen. Das hat zur Folge, daß nicht jede Operation ist parallelisierbar und der bottom-up Ansatz ist
sehr begrenzt. Rechnerische Argumente favorisieren ‚divide and conquer’ Ansatz, in dem Reize nach Merkmalen in die
Untermengen gruppiert werden, die dann mit dem gleichen Ansatz bearbeitet werden. Die Gruppierung findet nach
Objekten (‚Was’) und Position (‚Wo’) statt.
Zeichenaufmerksamkeit: Es ist nützlich zwischen den Experimenten, in denen die Aufmerksamkeit von Merkmalen des
Reizes selbst erregt wird und denen, wo ein Zeichen vor dem Reiz die Aufmerksamkeit erregt, zu unterscheiden. Die
meisten Zeichen zeigt direkt, von wo der Reiz ausgeht. Es gibt aber indirekte Zeichen, die Information über die Position
des Reizes tragen. Es ist nicht möglich, direkte Zeichen zu ignorieren, aber auch indirekte Zeichen sind wirksam. Unsere
Aufmerksamkeit wird von indirekten Zeichen erregt.
Feststellung von Merkmalen: Aufmerksamkeit wird auch vom Reiz selbst beeinflußt. Die hervorstehende visuelle
Merkmale lenken Aufmerksamkeit zu den Reizen, die diese Merkmale besitzen, und die werden dann bevorzugt gewählt.
Die Reize, die aus der Menge herausstechen, können leichter gefunden werden. Die einfachsten Merkmalen sind durch
parallele Prozesse am effizientesten darstellbar. Da aber die Anzahl von Kombinationen schneller wächst, als die Anzahl
der Merkmale, ist dieser Ansatz nur für elementare Feststellungen geeignet. Viele einzelne Merkmale (singleton) werden
schneller festgestellt, wenn sie als Muster in der visuellen Suche verwendet werden. Singletons können also
Aufmerksamkeit erregen.
Zeitliche Dynamik: Sequentielle Abtastung der Szene braucht die Bewegung von dem Fokus von Aufmerksamkeit. Die
Abtastung von direkten und indirekten Zeichen dauert unterschiedlich lang. Direkte Zeichen produzieren schnelle und
starke Effekte, die schnell verschwinden. Indirekte Zeichen dagegen wirken schwächer und länger.
Aufmerksamkeitsprozess muß nur in Verbindung mit der dynamischen Umgebung angesehen werden.
Selektive Aufmerksamkeit: Der Aufmerksamkeitsprozess kommuniziert mit Sensoren und mit Erkennungsmechanismen,
Gedächtnis und Verhaltenssteuerung. Die Rolle von Aufmerksamkeit als gatekeeper für Gedächtnis und Bewußtsein ist es,
die Bearbeitung von nur ausgewählten Teilen der Szene zu erlauben. Gedächtnis wird auch als ‚Zwischenspeicher’
verwendet. Eine andere Aufgabe von Gedächtnis ist es, räumliche Beziehung zwischen ausgewählten Merkmalen
herzustellen.
IV. Rechenmodellen
Merkmalbasierte Aufmerksamkeit: Dieses Modell kann den Vorgang bei der zeitlichen Dynamik reproduzieren. Es
werden konkurrierende, sich gegenseitig hemmende Zellen verwendet, die die Eingabe von Sensoren bekommen. Für jedes
Objekt wird die Stärke der Signaleproportional zu der Ähnlichkeit zwischen dem bekannten Objekt und der Form, die
angezeigt wird, gesetzt. Die Gewichte von Verbindung in jeder Zellensammlung sind so gewählt, daß die
Zellensammlungen genug Kraft haben, die ‚Konkurrenz’ zwischen den Objekten zu generieren. Gedächtnis speichert die
Antwort, und es kommt die ‚finde-den-Muster’-Aufgabe.
The saliency map: Erster Vortrag
Shifter circuits: Als Modell dient ein mehrschichtiges Netzwerk, in dem jede Zelle als Schalter zwischen zwei Zellen in
der Schicht, die eine Ebene höher liegt, dient. Dieser Schalter kann entweder geöffnet oder mit einer der ‚oberen’ Zellen
verbunden sein. Durch Öffnen und Schließen solcher Schalter kann gezeigt werden, daß der Fokus von Aufmerksamkeit
entweder kontinuierlich oder diskret verschoben werden kann und er kann seine Größe ändern. Es wurde auch gezeigt, daß
der Fokus von Aufmerksamkeit auf allen Ebenen liegen kann.
Zeitliche Markierung: Die Idee ist, daß der Aufmerksamkeitsauswahlprozess mit der Markierung von ausgewählten
Reizen arbeitet. Nur markierte Reize können auf Kenntnisse und Gedächtnis zugreifen und zu motorischen Aktivitäten
beitragen. Nichtmarkierte (ausgewählte) Reize haben keine Verhaltensfolgen. Es wurde gezeigt, wie man solche
Markierung mit Hilfe von Spiking-Neuronen durchführen kann. Die Spike-Ketten von Neuronen, deren aufnahmebereite
Bereiche sich mit dem Zentrum von Aufmerksamkeit nicht überschneiden, sind nach Poisson-Verteilung verteilt. Die
Ketten, die sich mit dem Zentrum von Aufmerksamkeit überschneiden, können aus der saliency map moduliert werden. Die
Ausgabe von der zeitlichen Markierung überschreitet die Grenzen von Filterung.