Wahrnehmungsgruppierungen Dennis Frederik Barteit [email protected] Hauptseminar: Biologienahe Simulation neuronaler Netze und Gehirnmodelle, SS 03 Inhaltsverzeichnis Inhaltsverzeichnis ..........................................................................................................................................- 1 Neurophysiologische Grundlagen der visuellen Informationverarbeitung ....................................- 3 Grundlagen der Wahrnehmungsgruppierung ........................................................................................- 4 Kern des Modells............................................................................................................................................- 6 1.) Vervollständigung der Grenzen und Gruppierung durch Bipolabhängigkeiten zwischen Pyramidenzellen der Schicht 2/3...............................................................................................................- 7 2.) Analoge Empfindlichkeit auf die LGN-Inputs durch die Schichten 6 und 4. ..............................- 7 - 3.) ‚Folded feedback’ - interlamellare Kortexbahnen und funktionale Kolumnen...........................- 8 - 4.) Kortikogenikulare Rückkopplung. ....................................................................................................- 8 - 5.) Ähnliche Organisation unterschiedlicher Einheiten der Areale V1 und V2. ..............................- 9 - Die Gleichungen des Modells .....................................................................................................................- 9 1.) Allgemeine Modellgleichungen ........................................................................................................- 9 - 3.) Corpus geniculatum laterale (bzw. lateral geniculate nucleus: LGN).......................................- 10 - 4.) Kortikales Areal V1 (Schicht 4) ......................................................................................................- 11 - 5.) Kortikales Areal V1 (Schicht 2/3) ...................................................................................................- 11 - 6.) Kortikales Areal V1 (Schicht 6) ......................................................................................................- 14 - 7.) Kortikales Areal V2 ..........................................................................................................................- 14 - 8.) Simulationsmethoden ......................................................................................................................- 14 - Resultate.........................................................................................................................................................- 15 Zusammenfassung ......................................................................................................................................- 17 Abbildungsverzeichnis ...............................................................................................................................- 18 Literatur ..........................................................................................................................................................- 18 - -2- Neurophysiologische Grundlagen der visuellen Informationverarbeitung Die visuellen Informationen, die von der Retina ausgehen, verlassen das Auge über den Sehnerv (nervus opticus). Die Sehnerven beider Augen vereinigen sich an der der Schädelbasis zum Chiasma nervi optici (siehe Abbildung 1). Von dort ziehen die Sehnervenbahnen aus den nasalen Bereichen der Retina mit denen, der temporalen Bereiche, des jeweils anderen Auges, im Tractus opticus zu den seitlichen Kniehöckern, die zum dorsalen Thalamus gehören. Vom seitlichen Kniehöcker (lateral geniculate nucleus (LGN) bzw. corpus geniculatum laterale (CGL)) ziehen etwa 1 Millionen Axone zu den Neuronen des Areal V1 (im Lobus occipitalis des Neocortex). Der seitliche Kniehöcker erhält dazu aber auch nicht-retinalen Input. Unter anderen treffen etwa ebenso viele Bahnen vom visuellen Kortex, wie von der Retina ein. Im Kortex erfolgt die Verarbeitung der Abb. 1. Schema der Sehbahn des Menschen. visuellen Information. Die erste Station der visuellen Informationsverarbeitung im Kortex ist das Areal V1. Dieses lässt sich auf Grund morphologischer Merkmale in sechs Schichten unterteilen (siehe dazu Abbildung 2). Neben dieser lamellaren Differenzierung (horizontal zur Hirnoberfläche), gibt es eine funktionale säulenartige Gliederung (also vertikal zur Hirnoberfläche). Die Nervenzellen einer Säule haben dabei rezeptive Felder im gleichen Bereich des Sehfeldes. Bezüglich der Funktion der Zellen, kann man die Säulen in „blob“-Gebiete, dort reagieren die Nervenzellen primär auf Farbe und in die größeren „interblob“-Gebiete, wo die Zellen sensitiv für die Orientierung, aber nicht für die Wellenlänge des Lichtes sind, unterteilen. Zu unterscheiden sind die Zellen, in den „interblob“Gebieten, mit einfachen (z.T. konzentrischen) bzw. Abb. 2. In Schicht IVc enden ein Großteil der thalamischen Afferenzen (A). Außerdem gibt es viele Sternzellen (S), hauptsächlich Schicht II-IVb innervieren. Pyramidenzellen (P) sind in den Schichten II-IVb sowie V-VI. Sie projizieren u.a. in anderen kortikale Bereiche (II-IVb) oder den Thalamus (VI) aber auch unter einander. komplexen rezeptiven Feldern. Die komplexen rezeptiven Felder werden durch bestimmte Reizmuster, abhängig von Form und Orientierung, optimal erregt. Des Weiteren sind die -3- Neurone des Areals V1 in okuläre Dominanzsäulen gegliedert. Zellen einer solchen Säule bekommen entweder vom linken oder vom rechten Auge Input. Allerdings gibt es auch schmale Bereiche der Überlappung. Grundlagen der Wahrnehmungsgruppierung Einen guten, bekannten Effekt, der die Wirkung von Wahrnehmungsgruppierungen widerspiegelt, liefert das Quadrat von Kanizsa (siehe Abbildung 3). Der Betrachter sieht ein Quadrat, das eigentlich nicht existiert, da die Kanten der Pacmanfiguren nicht aneinander anschließen. Dies ist ein Beispiel, in Abb. 3. Das Quadrat von Kanisza. Die Illusion kann verschieden stark wahrgenommen werden. Links: entsteht sie kollinear zu den Kanten der umgebenden Figuren. In der Mitte und rechts dagegen senkrecht zu den Linienenden. dem unverknüpfte lokale Kontraste in der gesamten wahrgenommenen Szene eine ununterbrochene Einheit bilden. Im Allgemeinen bieten Scheinkonturen gute Bespiele für Wahrnehmungsgruppierungen, allerdings werden sie meist nur unscharf wahrgenommen und funktionieren nur bei ausreichend guten Hell/Dunkel Kontrasten. Diese Arbeit stellt ein Modell (Ross, Grossberg und Mingolla 2000) vor, das sich mit den verantwortlichen Strukturen im Kortex befasst, also Netzwerke oder Gruppierungen von Neuronen, die an der visuellen Informationsverarbeitung beteiligt sind. Wie schon Abbildung 2 zeigt, gibt es vielfältige Verbindungen zwischen Zellen verschiedener Schichten, Module oder ganzer Kortexareale. Kortikale Strukturen interagieren also miteinander und können so Gruppen bilden, die auf bestimmte Reize reagieren. Das sind grundlegende Mechanismen, mit denen das Gehirn die lokalen Besonderheiten eines Bildes in zusammenhängende Gruppierungen organisieren kann. Die für die Gruppierung zwingend notwendigen kortikalen Bahnen übersetzen die retinogenikulare Informationen lokaler Bildkontraste, dem Kontext entsprechend, in eine Repräsentation von orientierten Grenzlinien. Das Modell zeigt, wie die Kontextsensibilität solcher Grenzgruppierungen mit der Empfindlichkeit, mit der die Neurone im Kortex aufeinander reagieren, erklärt werden kann. Der Mechanismus der Wahrnehmungsgruppierungen implementiert die Wahrnehmung von dünnen verlängerten Konturen zwischen einzelnen szenischen Elementen. Dieser Konturselektionsmechanismus muss über bestimmte berechenbare Eigenschaften verfügen, um perzeptuale Konturen realisieren und vervollständigen zu können: i) Die Bipoleigenschaft: Betrachten wir noch einmal das Beispiel aus Abbildung 3. Genauer, die horizontalen Kanten der unteren beiden Pacmanfiguren. Diese werden offensichtlich zur Mitte hin verlängert. D.h. das Zielneuron, das zwischen den beiden entsprechend orientierten rezeptiven Feldern liegt und eine ähnliche Orientierung besitzt, wird ebenfalls erregt. Eine Zelle mit nur einem relevanten Nachbarn wird dagegen nicht feuern. Das ist genau die Bipoleigenschaft. Ein Mechanismus, der diese Eigenschaft erfüllt, darf also nur dann aktiviert werden, wenn sein nicht-klassisches rezeptives Feld simultan an zwei Enden von Inputs, die von z.B. retinal registrierten Kontrasten stammen, erregt wird. Ein Reiz auf nur einer Seite darf nicht genügen. Abbildung 4 illustriert dies. Die 8-Form, in der der -4- Bipol in Abbildung 4 dargestellt ist, entspricht der Region, auf die der Bipol relativ stark reagiert. Abbildung 5 zeigt, dass die 8-Form auf drei fundamentalen Größen basiert: (a) Dem Abstand zwischen den Zentren beider Reizen, (b) dem Winkel, zwischen der Orientierungsachse der dunklen Ellipse und der Verbindungsgeraden der Zentren beider Ellipsen sowie (c) dem Winkel, um den beide Orientierungsachsen gedreht sind. Abb. 4. (a) Die Bipolzelle bekommt genug Input auf beiden Seiten und feuert. In (b) kann sie das nicht, da sie nur von einer Seite erregt wird. Abb. 5. Die 8-Form des Bipols lässt sich anhand der drei folgenden fundamentalen Größen berechnen: (a) Der Abstand zwischen den Zentren beider Ellipsen, (b) der Winkel, zwischen der Orientierungsachse der dunklen Ellipse und der Verbindungsgeraden der Zentren beider Ellipsen und (c) der Winkel, um den beide Orientierungsachsen gedreht sind. ii) Die Notwendigkeit bei der neuronalen Codierung ein Funktionskontinuum der Werte anzunehmen: Illusorische Konturen können in der Stärke, mit der sie wahrgenommen werden, variieren (siehe Beispiel Abbildung 3). Bei vielen Phänomenen der Wahrnehmung hat sich gezeigt, dass sie zu erklären sind, wenn man verschiedene Größen, wie z.B. die Helligkeit, mit einer sehr feinen Abstufung betrachtet. Dementsprechend variiert die Stärke der Antwort auf wahrgenommene Reize beim Menschen. Dies geschieht in Form von verschieden starkem Amplitudenausschlag, z.B. im Soma, oder im Axon durch eine Veränderung der Frequenz von gefeuerten Axonspotentialen. Im Modell werden neuronale Einheiten des Kortex als Funktion von Variablen dargestellt, deren Reaktionsstärke ähnlich variieren. Es wird angenommen, dass ein Zusammenhang zwischen den Ansprechgeschwindigkeiten der neuronalen Einheiten in den frühen kortikalen Bereichen und der perzeptualen Antwort besteht. Dieser Punkt wird unter dem Begriff der analogen Sensibilität zusammengefasst. Konkret bedeutet er, dass das Vervollständigungssignal im Verhältnis zu den Eingangssignalen stehen muss. iii) neuronale Rückkopplungsbahnen: Das sind Verarbeitungsschleifen zwischen neuronalen Einheiten. Sie kommen überall im Körper vor. So gibt es Rückkopplungen innerhalb nur einer Kolumne, sowie zwischen mehreren Kolumnen, aber auch über ganze Kortexbereiche hin. Außerhalb des Kortex gibt es zum Beispiel die kortikogenikulare Rückkopplung von der Schicht 6 der primären Sehrinde zurück in die seitlichen Kniehöcker. Hier wird die positive Rückkopplung verwendet, um die korrekte kontextsensitive perzeptuale Gruppierung auszusuchen. Später wird erläutert, weshalb im neuronalen Modell die positive Rückkopplung mit der analogen Empfindlichkeit kompatibel ist. -5- Kern des Modells In diesem Kapitel werden im Wesentlichen fünf Eigenschaften zur Berechnung des Modells vorgestellt. Die Beschreibung dieser Eigenschaften bezieht sich dabei auf das Schema in Abbildung 6. Es folgt jetzt zuerst eine kurze Beschreibung der neuronalen Bahnen, die im Schema gezeigt sind, damit der Ablauf des Signalflusses klar ist. Vom LGN Surround senden Zellen sowohl also auch OFF-Center-ONON-Center-OFF- Surround Zellen Impulse ins Areal V1, anders als in Abbildung 6 dargestellt. Empfänger sind Pyramidenzellen der Schicht 6 und 4. Die LGN-Zellen ihrerseits werden von den Schicht-6 Pyramidenzellen erregt und in einem breiteren Umkreis durch Interneurone gehemmt. Zellen der Schicht 4 senden exzitatorische Signale weiter an Pyramidenzellen der Schicht 2 und 3 ihrer eigenen Kolumne. Pyramidenzellen angrenzender Module werden jedoch wieder über Interneurone gehemmt. Diese Inhibition ist Teil eines horizontalen Feedbacks, das die Pyramidenzellen aus Schicht 2/3 mit anderen aus nahe gelegenen Kolumnen eingehen, welches aber nicht aus Abbildung 6 hervorgeht, da die entsprechenden Bahnen der Übersichtlichkeit halber weggelassen wurden. Bei dem Schicht-2/3 Neuron in der Mitte geht eine senkrechte Linie nach oben, sie stellt den apikalen Dendriten dar und wurde bei den beiden umge- Abb. 6. Das Schema des Modells. Die Kreise stellen Neurone dar. Die großen ungefüllten Kreise sind Pyramidenzellen, jene mit dicken Rand sind ON-Center-OFF-Surround Neurone des LGN und die kleinen schwarzen Kreise sind hemmende Interneurone. Schwarze Dreiecke stellen hemmende Synapsen dar, leere dagegen exzitatorische. benden Neuronen ebenfalls weggelassen. Diese sind im Schema nur auf ihre Funktion als „Input-Geber“ beschränkt. Von den Schicht-2/3 Pyramidenzellen gibt es eine positive Rückkopplung auf Schicht-6 Pyramidenzellen der eigenen Kolumne. Die weitreichenden horizontalen Verknüpfungen in Schicht 2/3 implementieren die Bipoleigenschaft: Der apikale Dendrit muss über die monosynaptische Innervation durch Schicht-2/3 Pyramidenzellen anderer, retinotop gegenüber liegender Regionen genügend Input bekommen, damit das eigene Neuron aktiviert wird. Von den innervierenden Pyramidenzellen geht aber auch eine disynaptische Inhibition aus: In Abbildung 6 gibt es nur ein zwischengeschaltetes Interneuron, in Wirklichkeit findet sich in Schicht 2/3 des Cortex ein komplexes Geflecht aus, auf die Pyramidenzelle inhibitorisch wirkende, Nervenzellen, die an den verschiedensten Stellen die Fortleitung hemmen. Zwei wichtige Punkte sind also bei der Hemmung zu beachten: zum einen wird die Erregung der Pyramidenzellen sofort wieder -6- unterbunden. Zum anderen ist natürlich die monosynaptische Exzitation etwas schneller als die disynaptische Inhibition, weshalb es zuerst doch zu einer kurzen Aktivierung der Nervenzelle kommt. Diese Erregung ergibt dann, wie erwähnt, die Rückkopplung auf Pyramidenzellen der Schicht 6 und sie wird ins Areal V2 weitergeleitet, wo sie, ähnlich wie die LGN-Zellen, Pyramidenzellen der Schicht 6 und 4 innerviert. Die Struktur der Nervenbahnen von V1 wiederholt sich im Prinzip in V2. Im Schema ist das V2-Netzwerk etwas größer gezeichnet, da die rezeptiven Felder des V2 größer sind, d.h. sie sind komplexer und fassen mehr Information zusammen. Es folgt nun die intuitive Beschreibung der, zu Beginn des Kapitels angekündigten, fünf Schlüsselfunktionen 1.) Vervollständigung der Grenzen und Gruppierung durch Bipolabhängigkeiten zwischen Pyramidenzellen der Schicht 2/3. Die Bipolvervollständigung folgt aus der Interaktion zwischen monosynaptischer Erregung und disynaptischer Hemmung, wenn Zellen der Schicht 2/3 horizontale Inputs von orientierten rezeptiven Feldern aus der Nachbarschaft bekommen, die entlang der Richtung der Orientierung des mittleren Neurons liegen. Die disynaptische Hemmung spielt eine entscheidende Rolle für die Bipoleigenschaft. Wie schon erklärt, kann eine einzelne Erregung kein Spiken der Pyramidenzelle auslösen, da die fast gleichzeitige Inhibition ausreicht, die Erregung zu annullieren. Jedoch kann die disynaptische Hemmung überwunden werden: durch die konvergente horizontale Aktivierung über die monosynaptischen Bahnen zwischen den Pyramidenzellen. Bedingung dafür ist, dass alle horizontalen Verbindungen, die in einer kortikalen Kolumne ankommen, auf eine einzelne Population von hemmenden Interneuronen zusammenlaufen. Die Aktivität dieser Population erreicht nach einiger Zeit eine Sättigung und ist dadurch beschränkt. Dagegen besitzen die Pyramidenzellen ein wesentlich höheres Sättigungspotential. Ab einer gewissen Anzahl von feuernden Pyramidenzellen, würde dann die Inhibition der Interneurone nicht mehr entsprechend Abb. 7. Der Teil (A) des Modells implementiert die Bipoleigenschaft. Die exzitatorische Verknüpfungen der anderen 2/3-Schicht Pyramidenzellen liegen am apikalen Dendriten der Zielzelle an. Die Hemmung dieser Zelle geschieht über ein Interneuron derselben Kolumne. (B) Die LGN ON bzw. OFF Zellen bekommen Feedforward Input von den retinalen ON/ OFF Zellen. Das LGN innerviert die Schichten 4 und 6. Das schmale ON-Center der Schicht 4 wird zusätzlich durch von Neuronen der Schicht 6 erregt. Die laterale Inhibtion durch Interneurone ist das OFF-Surround. (C) Die kooperierendekonkurrierende Feedback-Schleife von Schicht 2/3 über 6 zu 4 beschäftigt die Feedforward Bahn in (B). Sie kann Gewinnergruppierungen auswählen, ohne analoge Sensibilität zu verlieren. (D) Topdown kortikogenikulares Feedback: Schicht-6 Zellen erregen ein LGN ON-Center sowie ein weites OFF-Surround und synchronisieren dadurch LGN Zellen, die bzgl. ihres kortikalen Inputs konsistent bleiben. der Exzitation wachsen können und die Erregung schließlich überhand nehmen. 2.) Analoge Empfindlichkeit auf die LGN-Inputs durch die Schichten 6 und 4. -7- Die Kontrastempfindlichkeit auf die Signale des LGN wird vom V1 aufrechterhalten. OFF und ON Zellen des LGN regen die ‚simple cells’ der Schicht 4C direkt an (siehe Abb. 7B). Diese sind für verschiedene Kontrastpolaritäten empfindlich und hemmen sich gegenseitig, innervieren aber eine Pyramidenzelle der Schicht 2/3 und bilden dadurch ein ON-Center (zu Gunsten der Übersicht nicht in Abb. 7B dargestellt). Die Schicht-4 Zellen werden zusätzlich über Zellen der Schicht 6 erregt. Die Inhibition nahe gelegener Schicht-4 Zellen geschieht indirekt über Interneurone. Diese langweitreichende Hemmung stellt das OFF-Surround dar. Dieses feedforward Netzwerk, mit einem ON-Center und einem OFF-Surround, bewahrt die Sensibilität auf die Inputs. 3.) ‚Folded feedback’ - interlamellare Kortexbahnen und funktionale Kolumnen. Die interlamellare Rückkopplungsschleife durchläuft die Schichten 4, 2/3, 5, 6 und 4. Die beteiligten Zellen sind durch sie zu funktionalen Kolumnen zusammengefasst. Über die Schicht-6-bis-4 Bahnen können Gruppierungen unterstützt oder unterdrückt werden, ohne einen Verlust der graduellen Empfindlichkeit auf retinale Signale. Das wird dadurch gewährleistet, dass die Signale der Rückkopplungsschleife, die eine Vervollständigung von Konturen bzw. Gruppierungen darstellen, relativ zur Größe und Verteilung der bottom-up Inputs des LGN verändert werden. Schicht-4 Pyramidenzellen lösen die gegenseitige langweitreichende Erregung zwischen Schicht-2/3 Pyramidenzellen aus, indem sie die, der eigenen Kolumne aktvieren. Während Schicht-6 Neurone die kurzweitreichende Hemmung der Schicht-4 Pyramidenzellen auslösen. Mit der Innervation von Schicht-4 Neurone durch Nervenzellen der Schicht 2/3 können diese Zellaktivierungen verstärkt werden. Das ist ein besonders wichtiger Punkt, da die Schicht-2/3 Zellen Teil der Bipolgruppierung sind. Damit lassen sich die retinalen Signale in einem Kontext bearbeiten. Gruppierungen, die auf gewisse Orientierungen oder Längen reagieren, können hervorgehoben werden, weil zusammenhangslose Signale oder schwache Gruppierungen (z.B. beim Rauschen), durch die kurzweitreichende Hemmung unterdrückt werden. Das OFFSurround der interlamellaren Bahn wird so gesetzt, dass der Einfluss der bottom-up Inputs des LGN an jenen Positionen selektiv gehemmt wird, die nicht genug durch die Rückkopplung von der Schicht 2/3 unterstützt werden. 4.) Kortikogenikulare Rückkopplung. Die Schicht 6 sendet ausgedehnte Inhibition zurück zum LGN (Abb. 7D). Diese Rückkopplung selektiert und verstärkt LGN Zellaktivitäten, die mit kortikaler Zelltätigkeit konsistent sind. Sie stellt eine Art top-down Überprüfung der Daten dar, die das "Signal-zu-Störung" Verhältnis steigert, indem sie selektiv LGN-Zellen hemmt, die erfolglos versuchen, kortikale Zellen zu aktivieren. Die Schicht-6-zu-LGN Rückkopplung beendet den Input von LGN Zellen auf die Zellen der Schicht 4, die nicht Teil von "Gewinnergruppierungen" sind. Die Schicht-6-zu-4 Inhibition und die Schicht-6-zu-LGN Inhibition tragen zu längenempfindlichen Antworten (endstopping) bei, die Gruppierungen senkrecht zu den Enden -8- unterstützen. Kanten ab einer bestimmten Länge lösen dabei verstärkt an den Linienenden eine Aktivierung aus, während die Wahrnehmung des Mittelteils eher gehemmt bleibt. 5.) Ähnliche Organisation unterschiedlicher Einheiten der Areale V1 und V2. Das Modell geht von der Hypothese aus, dass die Nervenbahnen des V1 und die des V2 eine ähnliche Organisation besitzen und dass das Areal V1 die Einstellung von Position, Orientierung und Disparität organisiert, während das Areal V2 weitreichende Vervollständigung von Grenzen sowie Gruppierung gegenüber dem blinden Fleck, retinalen Venen und texturierten Szenen unterstützt. Die Gleichungen des Modells Es folgen die Gleichungen, Parameter und Simulationsmethoden des Modells. Abbildung 8 stellt die wichtigen exzitatorischen und inhibitorischen Verknüpfungsmuster des Modells dar. 1.) Allgemeine Modellgleichungen Im Folgenden werden Schichten von Nervenzellen (oder Neuronenpopulationen) durch ihre Position in einem Array beschrieben (i, j). Diese Zellen werden durch die exzitatorischen Eij und die inhibitorischen Iij Eingänge beeinflusst, entsprechend der Gleichung für die Aktivierung Wij: dWij dt = − AWij + ( B − Wij ) Eij − (C + Wij ) I ij (1) In Gleichung (1) fällt die Aktivierung der Zelle im Ruhezustand, also bei fehlenden Eingängen Eij und Iij, auf das Niveau Null zurück. Im Gleichgewichtszustand ist die Ausgabe einer Zelle: BEij − CI ij Vij = A + Eij + I ij + Abb. 8. Verknüpfungsmuster: die leeren (bzw. gefüllten) Kreise stellen exzitatorische (bzw. inhibitorische) Neurone dar. Die Größe der Kreise hängt von der Güte der Verbindungen ab. (A) Beispiel für eine retinale Center-Surround Verknüpfung. (B) Eine einfache ON-OFF Aktivierung einer vertikal orientierten Zelle. (C) Die Verknüpfungen des Schicht-6-zu-4 Surround. An jeder Position des Gatters kann es bis zu 12 Orientierungen geben, die den bevorzugten Orientierungen der Schicht-4C- Zellen entsprechen. Die Länge eines einzelnen Gitterteils entspricht der Stärke der inhibitorischen Verbindung mit einem ähnlich orientierten Zelle im Gitter. (D) Laterale exzitatorische Verknüpfung von orientierten komplexen Zellen der Schicht 2/3 des V1. (E) Entsprechend im V2. (2) Beide Gleichungen berechnen die Aktivierung. Gleichung (2) unterscheidet sich lediglich dadurch, dass alle neg. Ausgaben mit [w]+ = max(w,0) auf Null gesetzt werden. Des Weiteren werden zwei Ar- -9- ten von Gaußschen Kernen benutzt, um rezeptive Felder zu definieren (siehe Abbildung 8). Für die einfachen rezeptiven Felder der Retina und des LGN sind das unorientierte, symmetrische, normalisierte Kerne der Form: Gij = i² + j ² exp − 2σ σ 2π 1 (3) Wobei σ die Standardabweichung des Kerns bezeichnet. Orientierte Gaußsche Kerne haben die Form: Gijk kπ kπ − j sin i cos 12 12 = exp− 1 2 2 σ l 2 kπ kπ + ( j + offset ) sin (i + offset ) cos 12 12 + 2σ w 2 (4) Dabei sei k die Orientierung der Hauptachsen der Gaußschen Verteilung. σl und σw bezeichnen die Standardabweichung in der Länge (l) bzw. Breite (w) der Richtung der rezeptiven Felder. Die beiden länglichen Teilstrukturen des rezeptiven Feldes in Abbildung 8B liegen mit dem Abstand „offset“ von dessen Zentrum versetzt. 2.) Retina Die Aktivitäten retinaler Zellen bekommen den Index R. ON- bzw. OFF-Zellen sind durch den Index + bzw. – gekennzeichnet. Sij sind die eingegebenen Bildintensitäten. Die Erregung des kleineren ONCenters einer retinalen Zelle ist dann gerade die Eingabe: E ijR + = S ij (5) während die Inhibition durch das großflächige OFF-Surround definiert ist: R I ijR + = ∑ S i + m , j + n Gmn (6) mn beides zusammen in Gleichung (1) ergibt gerade WR+. Für WR- ist Iij die Eingabeintensität an der Position (i,j) und Eij die Summe über die umgebenen Intensitäten, skaliert durch die Normalverteilung. 3.) Corpus geniculatum laterale (bzw. lateral geniculate nucleus: LGN) Die Neurone des LGN haben den Index L. Ihre Inputs sind die Ausgaben retinaler Zellen (VR+) und Zellen der Schicht 6 (V6). Lc und Ls stehen für das Center bzw. das Surround der unorientierten rezeptiven Felder des LGN. Wieder sei nur die Gleichung für die ON-Zellen gegeben: Lc EijL + = VijR + 1 + ∑ Vi +6 m , j + n ,k Gmn mnk (7) Ls I ijL + = ∑ Vi +6 m , j + n ,k Gmn (8) und mnk - 10 - Gleichung (7) zeigt, wie Input, der von der bottom-up ON-Netzhautzelle kommt, den LGN aktiviert. Das Feedback aus Schicht 6 kann diese Aktivierung multiplizierend verstärken. Allerdings sorgt es auch, wie Gleichung (8) zeigt, für eine großflächige Hemmung durch das OFF-Surround. Die Kombination aus diesen bottom-up bzw. top-down Inputs führt zu einer Auswahl und Synchronisation von LGN-Zellen, was hemmende LGN-Zellen alleine nicht schaffen würden. 4.) Kortikales Areal V1 (Schicht 4) Die V1-Schicht-4 Zellen bekommen Eingaben von mehreren LGN ON- und OFF-Zellen, die alle retinotop etwas versetzt sind. Insbesondere wird eine einfache Schicht-4 Zelle von einem orientierten Muster von LGN ON-Zellen und einem dazu parallel liegenden Muster von LGN OFF-Zellen (wie in Abbildung 8B) erregt. In den Gleichungen (9) und (10) wird die LGN ON-Antwort mit 4 multipliziert, um eine asymmetrische Antwort von ON-Center- und OFF-Surround-Neuronen, die auf verschiedenen Seiten einer Kante liegen, zu kompensieren. In einem solchen Fall schwankt der Nenner aus Gleichung (2) stark. Spezifisch ist er auf der dunklen Seite viel kleiner als auf der hellen Seite, was sich sofort auf die Zellsignale auswirkt. Die Antwortraten der orientierten Zellen, die auf diese Kante reagieren sollen, würden auf der hellen Seite schneller abfallen. Die resultierenden Zellantworten wurden noch quadriert, um den Unterschied zwischen schwachen und starken Abgrenzungen überzubetonen. 2 E S1 ijk 4k + 4k − = 4∑ Vi +Lm+ , j + n ,k Gmnk + ∑ Vi +Lm− , j + n ,k Gmnk mn mn E S2 ijk 4k − 4k + = 4∑ Vi +Lm+ , j + n ,k Gmnk + ∑ Vi +Lm− , j + n ,k Gmnk mn mn (9) 2 (10) Mit Gleichung (11) erreicht man eine polaritäts-unempfindliche orientierte Zellaktivierung EC komplexer Zellen. In der Simulation wurde die Kombination von einfachen Zellen, mit ähnlicher Orientierung aber unterschiedlicher Polarität, direkt auf die Eingänge zu Schicht 4 und 6 Zellen gelegt. In vivo findet die Kombination einfacher Schicht-4 Zellen eigentlich erst bei der Projektion auf Schicht 2/3 statt. Diese Vereinfachung macht die Simulation rechnerisch übersichtlicher: [ E ijkC = E ijkS 1 − E ijkS 2 ] + [E + S2 ijk − E ijkS 1 ] + (11) Zur Berechnung der exzitatorischen und inhibitorischen Inputs auf Schicht-4 Neurone müssen noch die Signale aus Schicht 6 berücksichtigt werden (siehe Abbildung 7C): E ijk4 = E ijkC + Vijk6 L I ijk4 = ∑ Vi +6 m , j + n ,k + o Gmno (12) (13) mno 5.) Kortikales Areal V1 (Schicht 2/3) Die Aktivierung der Schicht 2/3 (W3) folgt: E ijk3 = Vijk4 + H ijk3 - 11 - (14) V4 ist der orientierte Input von Schicht 4 und H3 der totale monosynaptische exzitatorische horizontale Input. Dieser horizontale Input setzt sich aus einem kurzweitreichenden (s) und einem langweitreichenden (l) Bipolsignal zusammen: H ijk3 = hijks + hijkl (15) h ijks = g ∑ f (V i +3 m , j + n , k + o ) Z 20 m / C L , 20 n / C W , o , k (16) wobei mno Im Modell wird angenommen, dass der räumliche Umfang eines kurzweitreichenden Bipols in Gleichung (16) aus drei neuralen Einheiten besteht: einer zentralen Zelle und zwei relevanten Nachbarn. Relevante Nachbarn reagieren auf ähnlich orientierte benachbarte Reize. Wenn alle drei Zellen aktiviert werden, erhält der kurzweitreichende Bipol aus Gleichung (16) den maximalen Wert von 2,0. Dafür ist der Parameter g auf 2,0 gesetzt. f(w) ist eine Sättigungsfunktion (siehe Gleichung (20)). Das langweitreichende Bipolsignal hl ist gegeben durch: hijkl = ∑ [Vi +3 m , j + n ,k + o − T ] + Z 2 m / C L , 2 n / CW ,o ,k (17) mno wobei T die Bipolschwelle ist. Wenn sie von den Inputs der innervierenden Schicht-2/3 Neurone nicht überschritten werden konnte, ist die Gleichung (17) Null. Die Inhibition in Schicht 2/3 wird u.a. durch den disynaptisch verbundenen, weitreichenden Bipol beeinflusst: I ijk3 = ∑ Vi ,3j ,k + o Go3 s + Dijk (18) Dijk = gf (hijkl ) (19) o wobei mit f ( w) = w α +w (20) D.h. die disynaptische Hemmung Dijk nähert sich bei kleinem α in der Funktion f(w) schneller dem Parameter g an und ist abhängig von der weitreichenden Aktivierung hl. f(w) realisiert die Sättigungsfunktion, der z.B. die disynaptische Hemmung unterworfen ist. Der Parameter g in Gleichung (19) ist auf 2,0 gesetzt, damit das kurzweitreichende exzitatorische Bipolsignal hs in Gleichung (16) maximal aktiv sein muss, um den disynaptischen hemmenden Effekt von Dijk zu überwinden. Diese Abgleichung stellt sicher, dass jede aktive Pyramidenzelle der Schicht 2/3 entweder direkte bottom-up Aktivierung empfängt oder dass sie auf einen kollinearen Weg zwischen zwei oder mehr solcher Zellen fällt. Das Gewicht Z, aus den Gleichungen (16) und (17), folgt: Z mnok n 2 (k − o)π 2n = sgn{m} exp{− β (m² + n ²)} exp− µ × cos λ − sgn{m} arctan , m m² m K (21) Die Gleichung (21) erklärt die Arten von orientierten Kernen, die in Abb. 8D und E gezeigt werden. Der Wert µ definiert dabei die zugelassene Abweichung von der Kollinearität. - 12 - Zunächst werden jene Zellen betrachtet, in denen Grenzaktivierung ausschließlich durch seitliche Verknüpfung verursacht wurde und nicht durch direkte bottom-up Aktivierung. An solchen Positionen regt die langweitreichende Abhängigkeit hl V3 über Gleichung (15) an und danach den kurzweitreichenden Term hs über Gleichung (16). Gruppierungen, die sich, anstatt zwischen den auslösenden Reizen, darüber hinaus verbreiten, brechen bei zu geringer kurzweitreichender Aktivierung zusammen. In der Region zwischen einer größeren Anzahl von Reizen, kann die kurzweitreichende exzitatorische Aktivierung die disynaptische Hemmung überwinden und eine abgeschlossene Form hebt sich hervor. Die Abbildungen 9 und 10 veranschaulichen diese Idee. Abbildung 10 zeigt, wie die Dynamik der Grenzbeendigung in einem Quadrat von Kanizsa auftreten kann. Zuerst erzeugen die Pacmanfiguren über weitreichende horizontale Anschlüsse Erregung in beiden Richtungen. Die kurzweitreichende disynaptische Hemmung hemmt schnell Erregung außerhalb des Quadrats. Innerhalb des Quadrats jedoch ermöglicht die langweitreichende Erregung, die kurzweitreichende disynaptische Hemmung zu überwinden und die illusorische Form zu bilden. Die bottom-up Erregung von Schicht 2/3 ergibt eine Aktivierung der Grenzzellen. Das Aktivierungsmuster resultiert aus der Erregung in Gleichung (14) und wird durch Aktivität der Zellen der Schicht 4 (V4) geleitet. An diesem Punkt sind Grenzzellen in Schicht 2/3 ohne bottom-up 4 Abb. 9. (1) Zwei ähnlich orientierte Neurone werden gleichzeitig erregt. (2) Über die horizontalen, weitreichenden Verbindungen der Schicht 2/3 wird das dazwischen liegende, den Bipol repräsentierende Neuron erregt. (3) Auch diese Neuron stellt den Randbereich eines weiteren Bipols dar. (4) der Vorgang wiederholt sich Unterstützung von V inaktiv. Danach werden Zellen, deren Zentren der rezeptiven Felder kollinear zu den Grenzreizen sind, durch den Einfluss der langweitreichenden horizontalen Bipolzellen aktiviert. Das geschieht wieder durch die Erregungsgleichung (14), aber dieses mal wegen des horizontalen 3 Bestandteils (H ) und speziell wegen des langweitreichenden Terms hl. An diesem Punkt fangen die Schicht 2/3 Grenzaktivierungen an, die interpolierten und extrapolierten Grenzpositionen zu erstellen. Der Einfluss von disynaptischer Hemmung (D) und Bipolerregung Abb. 10. Das Schema der Grenzvervollständigung. Ausgehend von den Ecken der Figuren breiten sich die Signale zuerst (time 2) in beide Richtungen auf benachbarte Pyramidenzellen aus. Die Aktivitäten außerhalb des Bereiches der Figur werden jedoch schnell gehemmt (time 3), während die, die kolinear zu den Kanten liegen unterstützt werden. Was letztendlich zur vollständigen Erregung der Neurone führt, die retinotrop die verbindene Linie repräsentieren. - 13 - von s (h ) kurzweitreichender und die Balance zwischen diesen beiden Aktionen wird benutzt, um extrapolierte Grenzen zu unterdrücken. Zusammenfassend, sollte die disynaptische Hemmung, D, stark genug sein, einer teilweisen Aktivierung des kurzweitreichenden Bipols hs entgegenzuwirken, selbst wenn es eine zusätzliche Aktivierung durch den langweitreichenden Bipol hl gibt. Wenn dieses sichergestellt ist, interpoliert das System wie folgt: (1) bottom-up Inputs von den einfachen Zellen (V4) sorgen für eine Ausgangsaktivierung in Gleichung (14). (2) Seitliche Erregung verbreitet sich über V3 und beeinflusst hl in Gleichung (15). Daraus folgt wiederrum eine Erregung von V3 durch H3. (3) kurzweitreichende Erregung resultiert ebenfalls aus V3 und wirkt über hs in H3 (4) Die disynaptische Hemmung, ausgelöst durch hl in Gleichung (17), an hs in D in Gleichung (19) angepasst, kommt zur Inhibition I3 in Gleichung (18) dazu. (5) Falls V4 (Gleichung (14)) Null ist, ist es die Abgleichung zwischen Erregung H3 und Hemmung D, die festlegt, ob die ausgelöste Gruppierung erhalten und stabilisiert oder unterdrückt wird. Schritt vier wird dabei sooft wiederholt, bis die extrapolierten Gruppierungen zurück auf die Gruppierungen schrumpfen, die durch bottom-up Aktivierung gestützt werden. Das heißt, nach einem Ausgangsreiz der weitreichenden Bipolerregung (hl), müssen Zellen auf zwei Seiten durch aktive Grenzzellen hs umgeben sein, oder sie werden von D unterdrückt. 6.) Kortikales Areal V1 (Schicht 6) Schicht-6 Neurone erhalten exzitatorische Inputs von Schicht 2/3 und vom LGN. Die bottom-up Aktivierung durch den LGN wurde, wegen der besseren Berechenbarkeit, von EC approximiert: Eij6 = 1 EijkC + Vijk3 2 (22) 7.) Kortikales Areal V2 Im Modell sind die Gleichungen für die Schichten 4, 2/3, und 6 des Areals V1 für die Schichten des V2 einfach kopiert worden. Die Eingänge in die Schichten 4 und 6 kommen dann natürlich nicht mehr aus dem LGN, sondern sind die exzitatorischen Outputs der Pyramidenzelle aus Schicht 2/3 des V1. Im Areal V2 wurde die Skala der horizontalen Bipole in der Länge und in der Breite (Parameter CL und CW) verdoppelt, während alle weiteren Parameter dieselben blieben. 8.) Simulationsmethoden In den Simulationen des Modells, wurden Gleichgewichtslösungen auf jedem Prozessniveau berechnet und die vollständige Reihenentwicklung der Levels wurde wiederholt, bis das Konvergenzkriterium erfüllt wurde (typischerweise wurden 2 bis 5 Wiederholungen benötigt). Das Konvergenzkriterium spezifiziert, dass kein Aktivierungslevel um mehr als 10 % während eines Iterationsschrittes geändert werden kann. Die sequentielle Iteration von Gleichgewichtslösungen jeder Stufe reduziert die Simulationszeit. Die kortikale Schleife wird in dem folgenden wiederholenden Kreis simuliert: LGN-6-4-2/3-6. Das Beinhalten des Feedbacks von Schicht 6 in der Berechung von Schicht 2/3 stellt sicher, dass die Effekte interner kortikaler Prozesse das LGN, über das Feedback von Schicht 6, Einfluss auf alle anderen Bahnen haben. - 14 - Um künstliche Kanteneffekte an der Grenze eines Bildes zu vermeiden, wurde das Bild nach außen erweitert, um eine Distanz, entsprechend zweier Standardabweichungen des (größeren) inhibitorischen retinalen Kerns. Resultate 1.) Konturvervollständigung senkrecht zu Linienenden Abb.11. Das Verhältnis von tatsächlicher Reizstärke zur Stärke der wahrgenommenen Kontur. (A) Das Verhältnis steigt mit der Stärke der Reize, allerdings fällt die Steile des Anstiegs mit der Zeit ab. (B) Die Funktion hat die Form eines umgedrehten U's. D.h. nach einem Maximum, das das Verhältnis bei einer optimalen Anzahl von Reizen erreicht, fällt es wieder ab, je dichter die Reize danach liegen. nearen Linien als auch senkrecht zu Linienenden. Weitere Beispiele liefern die Abbildungen 11 A/B und 12 A/B. Abbildung 11 illustriert eine wichtige Eigenschaft Vorlage Im Modell entstehen Gruppierungen sowohl bei kolli- dieser Gruppierungen: Ihre graduelle Sensitivität auf den Kontext, in dem sie sich befindet. Sie lässt sich als Verhältnis von wahrgenommener Konturstärke zur bildung 11A verhalten sich noch wie erwartet. Je mehr Pyramidenzellen der Schicht 2/3 erregt werden, desto V1 tatsächlichen Konturlänge darstellen. Die Werte in Ab- stärker die Exzitation der einen Zielpyramiden. Dass die Funktion in Abbildung 11B die Form eines umgekehrten U's annimmt, das Verhältnis der Konturstärke nicht ganz einleuchtend. Diese Resultate lassen sich mit dem Hintergrund der Interaktion von kurzweitrei- V2 also wieder abfällt, ist dagegen auf den ersten Blick chender Inhibition und langweitreichender Exzitation erklären. Die Inhibition verhindert eine optimale Erregung durch einen Reiz und die Funktion stellt nur die Relation von Reizanzahl zur Erregung dar. Beim mittleren Quadrat von Kanizsa in Abbildung 11B ist dann die Ausbeute an Erregung pro Reiz erheblich höher, als beim rechten, wo, wegen der kurzweitreichenden Hemmung, viele Reize nur gedämpft erregen. - 15 - Abb. 12. Die Simulationsergebnisse zeigen illusorische Konturen senkrecht zu den horizontalen Linien, die in genügenden Abstand (A) liegen, um schon in V1 Gruppierungen auszulösen, bzw. (B) so weit auseinander liegen, dass dies erst in V2 geschehen kann. A Abb. 13. In Abbildung (A) kann keine eindeutige Gruppierung entstehen. Während aus (B), durch Hinzufügen von Reizen, eine klare horizontale Gruppierung resultiert. B Abb. 14. In Abbildung (A) kann wieder horizontal und vertikal gruppiert werden. In (B) dagegen verhindern die horizontalen Balken eine vertikale Gruppierung. Die Abbildungen 12A und 12B sind Beispiele für Gruppierungen, die senkrecht zu den Reizen entstehen. In Abbildung 12A sind die Linien nah genug beieinander, so dass in V1 schon Gruppierungen existieren, die in V2 noch verstärkt werden. Im Beispiel rechts davon, sind die Linen zu weit auseinander, so dass es im V1 nicht zu Gruppierungen kommt, wohl aber in V2. Diese Eigenschaft bestätigt die Hypothese, dass die Bereiche V1 und V2 eine ähnliche Organisation teilen, aber das V2 über größere Abstände gruppieren kann. 2.) Gestaltgruppierung Das Modell liefert z.B. für das Gestaltgesetz der Nähe eine plausible Erklärung. Das "Gesetz" besagt, dass nah beieinander liegende Objekte zusammengefasst werdenA(siehe Abbildung 13). Wenn mehr horizontale Reize in Abbildung 13B hinzugefügt werden, erhöht sich die Stärke der horizontalen Gruppierung in Schicht 2/3. Diese Gruppierung ist dann stärker als eine mögliche vertikale Gruppierung. Das bedeutet auch, dass von der horizontalen Gruppierung eine größere Hemmung auf die vertikale Gruppierung ausgeht, als umgekehrt. Ein weiteres Gestaltgesetz ist das der guten Weiterleitung. Aus der gleichmäßigen Verteilung von Reizen in Abbildung 14A können sowohl horizontale als auch vertikale perzeptuale Gruppierungen resultieren. Die horizontalen Linien zwischen den Quadraten in Abbildung 14B erzwingen eine horizontale Gruppierung. Dieser Effekt lässt sich, wie beim Beispiel von Abbildung 11B, auf die weitreichende Exzitation in Schicht 2/3 und die Kurzstreckeninhibition von Schicht 6 bis 4 zurückführen. - 16 - 3.) Steigerung des Verhältnisses von Signal zu Rauschen Im linken Teil von Abbildung 15 werden die Randsignale des schwarzen Quadrats in der Mitte durch Rauschen gestört. Das Quadrat im rechten Teil zeigt, wie die horizontalen Verknüpfungen der Schicht 2/3 die Grenzen aus der Unordnung ausgewählt haben. Abb. 15. Links ist ein stark durch Rauschen beeinflusstes Bild mit einem schwarzen Quadrat in der Mitte. Rechts ist das Resultat der Berechnung durch komplexe Zellen der Schicht 2/3. Zusammenfassung Das Modell lässt sich in verschiedene Stufen der Verarbeitung von retinalen Informationen gliedern. Durch die rezeptiven Felder in der Netzhaut und auch später im LGN gibt es eine Kontraststeigerung. Daraufhin aktivieren die halbwellig korrigierten Ausgaben dieser Felder die einfach orientierten Zellen. Ähnlich orientierte einfache Zellen bündeln ihre Aktivitäten auf komplexe Zellen. Die komplexen Zellen erweisen sich dabei als unempfindlich auf die Richtung des Kontrastes, da sie Input von einfachen Zellen mit unterschiedlicher Kontrastpolaritäten bekommen. Im Kortex, kommt es, u.a. wegen der kurzweitreichenden Inhibition, zur räumlichen und orientierten Konkurrenz zwischen den Komplexzellen, wobei schwächere Grenzaktivierungen unterdrückt, die Vervollständigung von stärkeren und die globaleren Grenzaktivierungen unterstützt werden. Funktional schärft Konkurrenz die Kantenbestimmung und die Ausrichtung von einzelnen Komplexzellen. Sie erlaubt, dass Komplexzellen stärker an den Enden einer Linie antworten, als in der Mitte. Das ‚folded feedback’ auf Zellen der Schicht 4, das auch durch langweitreichende Erregung beeinflusst wird, trägt mit zu dieser Konkurrenz bei. Dieses Feedback sorgt gleichzeitig für die Unterstützung von Formvervollständigung sowie für die Unterdrückung von Rauschen. Die langweitreichende Kooperation zwischen kortikalen Kolumnen ist ein wichtiger Punkt in der Verarbeitung. Sie verwirklicht die Gruppierung stetiger Grenzen und die Vervollständigung von durch Rauschen gestörter Grenzen. Diese Kooperation wird durch Bipolzellen erreicht, welche nur dann feuern, wenn beide Hälften ihres rezeptiven Feldes ausreichend von Inputs der entsprechend orientierten Komplexzellen aktiviert wurden. Des Weiteren sind Exzitation und Inhibition derart balanciert, dass die Sensibilität auf die Stärke einer Kontur bewahrt bleibt und Aktivierungen nicht von Sättigung beeinflusst werden. Diese robuste Bewahrung der Sensibilität zur analogen Inputstärke, die die weitreichende Vervollständigung von Signalen über Lücken von Kanten in den Bildern unterstützt ist eine wichtige Entwicklung. Die aktuelle Architektur kann entscheiden, ob und wo Grenzsegmente zusammenhängend zu verbinden sind, bezüglich der Wichtigkeit der Inputkontraste in vollständigen Konturen. Das vorgestellte Modell entwickelt die FACADE (Form And Color And DEpth) Theorie über visuelle Wahrnehmung weiter. Genauer gesagt, jene Bahnen der Theorie, die die Grenzen und Kanten in einer Szene erzeugen und welche unter der Bezeichnung Boundary Contour System zusammengefasst werden. - 17 - Abbildungsverzeichnis Abb. 1: Schmidt RF, Thews G (1997): S. 297. Abb. 2: Dudel J, Menzel R, Schmidt RF (2001): S. 413. Abb. 3: verändert aus: Grossberg S, Mingolla E, Ross WD (1997): S. 107. Abb. 4: Ross WD, Grossberg S, Mingolla E (2000): S. 572. Abb. 5: Neumann H, Mingolla E (2001): S. 355. Abb. 6: Grossberg S, Mingolla E, Ross WD (1997): S.109. Abb. 7: Ross WD, Grossberg S, Mingolla E (2000): S. 574. Abb. 8: Ross WD, Grossberg S, Mingolla E (2000): S. 577. Abb. 9: Neumann H, Mingolla E (2001): S. 368. Abb. 10: Ross WD, Grossberg S, Mingolla E (2000): S. 581. Abb. 11: Grossberg S, Mingolla E, Ross WD (1997): S.107. Abb. 12: verändert aus: Ross WD, Grossberg S, Mingolla E (2000): S. 585. Abb. 13: Ross WD, Grossberg S, Mingolla E (2000): S. 584. Abb. 14: Ross WD, Grossberg S, Mingolla E (2000): S. 584. Abb. 15: Ross WD, Grossberg S, Mingolla E (2000): S. 586. Literatur Ross WD, Grossberg S, Mingolla E (2000): Visual cortical mechanisms of perceptual grouping: interacting layers, networks, columns, and maps. In: Neural Networks 13: S. 571-588. Grossberg S, Mingolla E, Ross WD (1997): Visual brain and visual perception: how does the cortex do perceptual grouping? In: Trends in Neurosciences 20: S.106-111. Neumann H, Mingolla E (2001): Computational neural models of spatial integration in perceptual grouping. In: From Fragments to Objects: Grouping and Segmentation in Vision. T.F.Shipley & P.J. Kellman, Editors. Elsevier Amsterdam: S. 353-400. Schmidt RF, Thews G (1997): Physiologie des Menschen. Springer-Verlag Berlin Heidelberg. Dudel J, Menzel R, Schmidt RF (2001): Neurowissenschaft. Vom Molekül zur Kognition. SpringerVerlag Berlin Heidelberg. - 18 -