4. Schlußteil S. 19

Werbung
Inhalt
1.
Einleitung
S. 2
2.
Modelle der Raumwahrnehmung
S. 2
2.1
Das binokulare Sehen
S. 3
2.2 Entstehen der Raumwahrnehmung nach Metzger
S. 3
2.3 Das Feldmodell nach Erich König
S. 5
2.4 Entschlüsseln binokularer Disparitäten durch das Phasenmodell nach Ohzawa,
Freeman und DeAngelis
3.
S. 6
2.5 Diskussion der präsentierten Modelle und Entwicklung eines Arbeitsmodells
S. 9
Die Simulation des Phasenmodells nach Ohzawa et. al. durch den Computer
S. 11
3.1 Probleme der Anpassung an den Computer
S. 11
3.2 Das selbst entwickelte Stereosystem
S. 13
3.3 Die selbst entwickelte Software
S. 14
3.3.1
Die Softwarestruktur
S. 14
3.3.2
Die Simulation rezeptiver Felder
S. 15
3.3.3
Informationsverarbeitung durch Simple Cells
S. 16
3.3.4
Eliminierung von Störfaktoren auf der Basis von Complex Cells.
S. 16
3.4 Simulation des Phasenmodells
S. 17
3.4.1
1. Stufe der Simulation: Aufbau und Aufzeichnung der Bilder
3.4.2
2. Stufe der Simulation: Aufdeckung und Darstellung der räumlichen
Disparität
4.
5.
S. 17
S. 18
Schlußteil
S. 19
4.1 Diskussion der Ergebnisse
S. 19
4.2 Danksagungen
S. 20
Verzeichnis der verwendeten Literatur
S. 20
Anhang A: Materialen zur Dokumentation
Anhang B: Hilfe und Anleitung zur Software
Anhang C: Der Quellcode der Software
1
Einleitung
Vorgänge im Nervensystem höherer Säugetiere beschäftigen die Wissenschaft schon lange.
Aber erst in jüngster Zeit gelingt es dem Menschen, neuronale Aktivitäten tatsächlich
qualitativ und quantitativ exakt zu erfassen.
Die aktuelle Wissenschaft untersucht besonders solche Mechanismen, die Wahrnehmungen
der Sinnesorgane verarbeiten. Ein Schwerpunkt liegt hierbei in der Erforschung der
Verarbeitung von Hör- und Seheindrücken. Erkenntnisse hieraus werden in der Medizin bei
der Behandlung von Sehstörungen und Hörschwächen gebraucht und auch darüber hinaus bei
der Therapie verschiedenster Nervenerkrankungen. Außerdem fließt das neu gewonnene
Wissen in die Entwicklung modernster technischer Geräte ein, zur Verfeinerung
diagnostischer Instrumente, um Kranken und Behinderten mit Neuroprothesen den Alltag zu
erleichtern. Auch die Technik verwendet die gewonnenen Erkenntnisse, z. B. in der
Automobilindustrie (intelligente Steuerungssysteme, Verkehrsleitsysteme) in der
Computerindustrie (menschengerechte Benutzerschnittstellen „Human Interface“) und in der
Robotertechnik. So wird wohl auch das alltägliche Leben in der Zukunft von den
Erkenntnissen dieser Forschungen zunehmend beeinflußt werden.
Die vorliegende Arbeit befaßt sich zunächst mit der Entstehung der Raumwahrnehmung beim
Menschen. So werden verschiedene Modelle untersucht, die den Forschungsstand bis in die
jüngste Vergangenheit repräsentieren. Sie werden auf ihre Plausibilität, Brauchbarkeit und
wissenschaftliche Aktualität hin geprüft. Als Ergebnis entsteht ein Arbeitsmodell, das
weitgehend auf dem Phasenmodell vom Ohzawa beruht. Dazu habe ich in dieser Arbeit eine
Computersimulation entwickelt.
Die tatsächliche Raumwahrnehmung im Gehirn beruht zusätzlich auf komplexen
Lernprozessen, bei denen die Ergebnisse der Wahrnehmung in den Sehprozeß wieder
eingebracht werden. Sie werden zwar allgemein in den Theorien angenommen, sind für dieses
Modell aber nicht konkret beschrieben und auch noch nicht ausreichend erforscht, da die
Komplexität der von Individuum zu Individuum unterschiedlichen Nervenstrukturen ein
Untersuchen dieses Gebietes bislang erschwert. Mein Arbeitsmodell würde wie die Modelle
in der Literatur durch ungesicherte Annahmen belastet und wäre vom Aufwand her technisch
nicht realisierbar
2
2. Modelle der Raumwahrnehmung
2.1 Das binokulare Sehen
Mit seinen beiden Augen nimmt der Mensch zwei getrennte Bilder gleichzeitig auf. Diese
beiden Bilder sind nicht gleich. Je nach Tiefenabstand zum fixierten Gegenstand befinden
sich die „Sehdinge“ (Metzger1) an unterschiedlichen horizontalen Positionen. Diese Differenz
kann ausgewertet werden. Allgemein geht man davon aus, daß durch nervöse Mechanismen
Bildunterschiede benutzt werden, um Tiefenwerte einzelner Bildteile zu ermitteln.
Klix brachte das auf einen Punkt: „Durch die Verarbeitung zweier monokularer Reizmuster
zu einem Gesamtbild entsteht ein potentiell neuartiger Informationsträger über die
Abstandsbeziehungen der im Reizmuster abgebildeten Objekte.“2
Ein weiterer Faktor der Raumwahrnehmung, der aber in der Literatur kaum erwähnt wird, ist
die Tiefenbestimmung anhand der Krümmung der Linse. Um mit der Linse eine bestimmte
Tiefe zu fixieren, muß die Brechkraft einen zugeordneten Wert annehmen, nur dann werden
die gesehenen Gegenstände der Tiefenebene scharf abgebildet. So könnte also auch die
Kontraktion der Ciliarmuskulatur oder die Spannung der Ciliarbänder zur Bestimmung von
Tiefenwerten dienen. Hierüber gibt es aber keine genauen Untersuchungen in der Literatur,
die eine Auswertung im Sinne der Tiefenwahrnehmung ermöglichen würden.
Die im folgenden vorgestellten Modelle beruhen deshalb auf dem zuerst genannten Ansatz.
2.2 Entstehen der Raumwahrnehmung nach Metzger
Wolfgang Metzger befaßt sich in „Die Gesetze des Sehens“3 mit dem Zustandekommen des
Tiefeneindrucks und den zugrundeliegenden Mechanismen. Als Ausgangspunkt benutzt er
einen Ansatz Herings (Erwähnung im Text Metzgers). Dieser definiert die Tiefenbestimmtheit
der Sehdinge als „Folge der Tiefenbestimmtheit jedes einzelnen ihrer Punkte. Jede
Netzhautstelle hat danach außer ihrem Breiten- und Höhenwert auch einen Tiefenwert. Die
1
Metzger, Wolfgang: Gesetze des Sehens. Frankfurt am Main 1953
2
Klix, Friedhart: Information und Verhalten. Kybernetische Aspekte der organismischen
Informationsverarbeitung. Einführung in naturwissenschaftliche Grundlagen der Allgemeinen Psychologie.
3
Metzger, Wolfgang: a.a.O.
3
Tiefenwerte wachsen – im Gegensatz zu den Breitenwerten – in entgegengesetzter Richtung,
von der Schläfe zur Nase hin.“4.
An korrespondierenden Netzhautstellen heben sich die Tiefenwerte auf. Wird also ein Objekt
fixiert und so an diesen Stellen abgebildet, befindet es sich in einer Fixationsebene. Alle
anderen Bildpunkte werden nicht auf korrespondierende Netzhautstellen abgebildet. Als
Folge davon heben sich die Tiefenwerte nicht mehr exakt auf: Sie werden – je nach
Vorzeichen des resultierenden Tiefenwertes - als vor oder hinter der Fixationsebene liegend
wahrgenommen.
Um diese These zu überprüfen, stellt Metzger Folgerungen auf, die er konsequent mit
Experimenten überprüft.
Das Beobachtete läßt sich aber nicht mit Herings Annahmen in Einklang bringen. Metzger
bildet aus seinen Beobachtungsergebnissen ein eigenes Modell. Er folgert u. a. daß es
Unterschiede zwischen Netzhautabbild und Cortexbild gibt5. Er entwickelt die Vorstellung
von einem Verständnis des „zu vereinigenden Ganzen“.6 So handelt es sich in seinem Modell
nicht um eine Summe von Einzelpunkten, sondern um als funktionelle Einheiten empfundene
Ganze (z.B. Rechtecke, Linien etc.). Außerdem erkennt er die Bedeutung der Kontraste7,
indem er feststellt, daß sich auch Figuren unterschiedlicher Farben binokular vereinigen und
so einen räumlichen Eindruck vermitteln. Nach seiner Theorie werden ähnlich liegende
Kontrastlinien oder Stellen mit gleicher Bedeutung vereinigt.
Aus diesen Forschungen entwickelt er Gestaltgesetze des Zusammenschlusses. So entstehen
u. a. das Gesetz der Nähe („Diejenigen von ihrer Umgebung abgehobenen Gebilde, die in
allen ihren Teilen genau auf Deckstellen liegen oder verhältnismäßig am wenigsten von der
Deckstelle abweichen, vereinigen sich nach dem Gesetz der Nähe“8), das Gesetz der
Gleichartigkeit (Wenn sich auf Deckstellen Ungleiches befindet, in der Nähe aber passende
Partner, evtl. mit geringer Verzerrung, vorhanden sind, erfolgt die Vereinigung nicht nach
dem Gesetz der Nähe, d.h. der Partner mit der größeren Ähnlichkeit wird vorgezogen).
Außerdem dienen der Vereinigung nur prägnante Stellen (s.o.).
Um eine Theorie, bilden zu können, welche die physikalischen Umstände erklärt, befaßt sich
Metzger mit der Wahrnehmung des Vereinigungsprozesses. Er stellt fest, daß Objekte eines
4
Metzger, Wolfgang: a.a.O. S. 262
5
Metzger, Wolfgang: a.a.O. S. 276
6
Metzger, Wolfgang: a.a.O.
7
Metzger, Wolfgang: a.a.O. S. 281
8
Metzger, Wolfgang: a.a.O. S. 281
4
unbekannten Raumes zunächst „doppelt“ gesehen werden. Die Tendenz zur Vereingiung wird
von ihm als „Fusionsdruck“ oder „Vereinigungsdruck“ bezeichnet.
Abschließend entwickelt Metzger eine neue Theorie. Nach dieser laufen Nervenbahnen von
den beiden Retinen in das Grosshirn. Der Endbereich dieser Nervenbahnen wird als Raum
betrachtet, in dem sich die Nerven überkreuzen und korrespondierend zusammenlaufen. Die
Nervenbahnen sind nicht voneinander isoliert, Nervenerregungen laufen aber bevorzugt auf
der aktuellen Nervenbahn entlang.
Tiefeneindrücke entstehen so nach Metzger durch die Positionierung des Cortex-Abbildes
eines nicht fixierten Gegenstandes in Relation zu der Cortex-Abbildung eines fixierten
Gegenstandes9 (auf einer Art Fixationsebene im Endbereich). Die Abbildung erfolgt also
entweder vor oder hinter der Fixationsebene und wird auch dementsprechend empfunden.
2.3 Das Feldmodell nach Erich König
Erich König propagiert in seinem Werk „Experimentelle Beiträge zur Theorie des binokularen
Einfach- und Tiefensehens“10 eine weitere Theorie.
Ausgangspunkt sind Unstimmigkeiten (zur Zeit der Entstehung des Feldmodells) gängiger
Theorien, welche die Tiefenwahrnehmung weitgehend als Funktion der Netzhäute abtun, mit
praktischen Versuchen, die durch diese Ansätze nicht mehr zu erklären sind. Insbesondere
„das Lückenphänomen11“ sprach gegen die Ansätze Metzgers, die in dieser Arbeit bereits
genannt wurden.
9
Da es sich in Metzgers Modell im nicht isolierten Endbereich um einen Raum handelt, kann
das Cortex-Abbild vor oder hinter einem anderem gelagert sein.
10
König, Erich: Experimentelle Beiträge zur Theorie des binokularen Einfach- und Tiefensehens. Bd. 4: Bay,
Eberhard; Metzger, Wolfgang; Witte, Wilhelm: Psychologica Universalis. Meisenheim an Glan 1962.
11
König, Erich: a.a.O.
Eine in ausschließlich einem Halbbild vorhandene Lücke dominiert, d.h. Teile in der einfach gesehenen Figur
werden ausgelöscht. Begleitet wird das Lückenphänomen häufig durch ungewöhnliche Hervorhebung (z.B.
besonders „helle“ Wahrnehmung) der einfach gesehenen Lücke. Gelegentlich wird eine Lücke auch unstetig
wahrgenommen. In so einem Fall löst das dauerhafte Betrachten der Vorlagen ein unangenehmes Gefühl aus, das
manchen Betrachter sogar zum Abbruch eines Experiments gezwungen hat.
5
Um das Lückenphänomen genauer untersuchen zu können, entwickelt König eine
Versuchsapparatur. Diese ähnelt einem Stereoskop12, bei dem Parameter wie Raumhelligkeit,
Lückenöffnung etc. variabel sind. Hiermit führt er mehrere Versuchsreihen durch, bei denen
er einzelne Parameter variiert. Anschließend führte er weitere
Raumwahrnehmungsexperimente durch, wieder mit variierten Parametern.
Basierend auf den Ergebnissen seiner Versuchsreihen stellt König eine eigene Theorie auf.
Diese Theorie soll vor allem die bewußt wahrgenommenen Phänomene bei der Entstehung
der Tiefenwirkung, wie z.B. das „Wandern“ von Figuren oder das Lückenphänomen erklären.
Die auf Ansätze Köhlers gestützte „Feldtheorie“ Köhlers besagt folgendes: Beide Bilder eines
gesehenen Gegenstandes werden auf der Hirnrinde abgebildet, und zwar als elektronegativoder elektropositiv geladene Felder. Dabei sind die Abbildungen gegensätzlich geladen.
Zwischen diesen unterschiedlichen Ladungen ist eine isolierende Trennschicht, so daß die
Ladungen erhalten bleiben. Da sich unterschiedliche Ladungen anziehen, treiben auch diese
Felder aufeinander zu, bilden also eine Einheit und werden einfach wahrgenommen.
Mit dieser Theorie erklärt König auch Extremsituationen der binokularen
Raumwahrnehmung, wie z. B. das Lückenphänomen, das mit den gängigen Ansätzen nicht zu
erklären war.
2.4 Entschlüsselung binokularer Disparität durch das Phasenmodell nach
Ohzawa, Freeman und DeAngelis.
Ohzawa et al. beschreiben die Auswertung binokularer Disparität durch Neuronen in der
Cortex. Sie setzen dabei die gängigen Vorstellungen des Nervensystems voraus. Mit ein
Ausgangspunkt ihrer Untersuchungen waren Computersysteme, die Räumlichkeit erkennen.
Diese Systeme benutzen z.T. schon seit den 80er Jahren Gabor-Phasenfilter (siehe unten), um
zum Vergleich geeignete Gebiete ausfindig zu machen.
Ohzawa unterteilt Neuronen in der Cortex in „Simple Cells“ und „Complex Cells“. Simple
Cells haben auf der Retina sogenannte rezeptive Felder (RFs), d.h. sie bilden den
Sammelpunkt für Axone untergeordneter Neuronen. Jede Simple Cell hat je ein separates RF
12
Apparatur, die es ermöglicht, zwei Halbbilder binokulkar zu präsentieren, so daß bei passenden Vorlagen ein
räumlicher Eindruck entsteht
6
auf jeder Netzhaut. In den RFs gibt es Bereiche unterschiedlicher Sensitivitäten: „brightexcitatory“-Regionen („on“) und „dark-excitatory“-Regionen („off“)13.
Die Anordnungen und Ausprägungen dieser Sensivitätsbereiche kann man angenähert mit
Hilfe der Gabor-Funktion darstellen. Diese besteht aus einem Sinus-Teil, der mit der
Gausschen Normalverteilung multipliziert wird14. Man kann sich dieses so vorstellen, daß
sich die Sinusfunktion durch ein Gaussches Fenster bewegt15. Verändert man den Sinus-Teil
(Phasenveränderung), so verändert sich die räumliche Struktur des rezeptiven Feldes. Durch
diese Eigenschaft der RFs erst wird es möglich, die Gabor-Funktion an jedes beliebige RF
anzupassen. Mit dem in dieser Facharbeit erstellten Programm „Receptive Field Constructor“
können Gabor-Funktionen dargestellt und variiert werden.
Ohzawa geht davon aus, daß sich die RFs einer Simple Cell an korrospondierenden (d.h.
positionsgleichen) Bildpunkten der Retina befinden. Sie sind aber nicht durch gleiche Stimuli
in gleicher Weise zu erregen, da sie unterschiedlich – phasenverschoben (siehe oben) strukturiert sind. Hiervon leitet sich die Bezeichnung Phasenmodell ab. Die Informationen
über die räumliche Tiefenverteilung eines wahrgenommenen Raumes sind in den Anteilen der
Phasenverschiebung korrespondierender RFs enthalten.
Um dies zu beweisen entwickelte Ohzawa die Reverse Correlation Prozedur16, die es
ermöglicht, Struktur und „Funktionsweise“ von Simple-Cells und den angeschlossenen RFs
zu analysieren.
Da sich die Antwortstruktur eines RFs über die Zeit verändert, wurde zunächst keine
zweidimensionale Karte (X , Y – Karte), sondern ein Würfel, auch „Spike-train“ genannt,
erstellt. Idealerweise würde man für weitere Untersuchungen solche Raum (X) – Raum(Y) –
Zeit(T) - Würfel nehmen. Ein solches Vorgehen wäre aber unpraktisch und ließe nur schwer
13
Ohzawa, Izumi; De Angelis, Gregory; Freeman, Ralph: Encoding of binocular disparity by simple cells in the
cat’s visual cortex. In: Journal of Neurophysiology 75 o. O. 1996 S. 1779-1805. S. 3
14
Ohzawa, Izumi: a.a.O. S. 4
15
Ozawa, izumi: a.a.O. S. 19
16
Bei der Reverse Correlation Prozedur werden einem geeignetem Testobjekt, z.B. einer betäubten Katze,
verschiedene Stimuli auf korrespondierende Bildpunkte projiziert. Nun wird über Elektroden die Aktivität
zugeordneter Neuronen, z.B. von Simple Cells, durch einen Computer aufgezeichnet. Außerdem aufgezeichnet
werden Position und Ausrichtung der Stimuli (weißer/schwarzer Balken auf grauem Grund). Mit Hilfe dieser
Daten kann eine „Reizkarte“ erstellt werden, die genauen Aufschluß über die Erregbarkeit des RFs und die
Verteilung der „on“ und „off“ Regionen gibt. Da über die Zeit mehrere dieser Reizkarten erstellt werden, hat
man schließlich einen „Spike-Train“, darstellbar als dreidimensionaler Würfel mit den Sensitivitätskarten des
RFs zu verschiedenen Zeitpunkten.
7
mathematische Beschreibungen zu, und so verwendet man ein X-T-Profil17 18. Hierbei wird
auch deutlich, daß es ein Abdriften der Subregionen in einen RF gibt, die allerdings bei
beiden Augen gleich sind19.
Um exakte Aussagen über Bedeutungen und Zusammenhänge der Veränderung verschiedener
Parameter der RFs einer Simple Cell zu bekommen, erstellten Ohzawa et al. 1-D-Profile der
rezeptiven Felder im Abstand von fünf Millisekunden. Durch Anpassung der Gabor Funktion
erhielt man über die Parameter exakte Werte für Größen wie die „Optimale räumliche
Frequenz“ oder „Position des RF-Zentrums“20.
Diese Größen trug man in Graphen ein und konnte so die Entwicklung der Parameter, auch in
Bezug aufeinander, über die Zeit verfolgen. Dabei zeigte sich folgendes:
Die optimale räumliche Frequenz, d.h. die Zahl der „on-“ und „off-regions“ ist für die RFs
beider Augen annähernd gleich, ähnlich wie Größe und Position des Zentrums, sowie den Tilt
der Orientierung. Die Phase, entscheidend für Formgebung der unterschiedlichen
Subregionen, ist für beide auch relativ konstant. Bei bestimmten Zellen ist eine merkliche
Phasendifferenz zu verzeichnen, die konstant ist21. Und diese Zellen sind es, die dem
Phasenmodell entsprechen.
Auffallend ist, daß, je mehr die Orientierung vertikal ist (d.h. je mehr das RF sensibel für
Breiten-Disparitäten ist), desto mehr Zellen entsprechen dem Phasen-Modell22. Das PhasenModell decodiert also vorwiegend horizontale Disparitäten. Zellen mit horizontalen
Ausrichtungen haben nur geringe Phasendifferenzen. Die größte festgestellte Phasendifferenz
betrug 180°.
Simple Cells, die nicht der Beschreibung entsprechen, die bis hier vorgestellt wurden, gibt es
auch. Ihnen wird im Phasenmodell aber keine explizite Bedeutung zugewiesen.
Die nächste Stufe der Erkennung bilden die „Complex Cells“. Ihre RFs bilden die Simple
Cells. Sie kombinieren die Simple Cells nach dem Phasenmodell in der Weise, daß störende
17
Ohzawa, Izumi: a.a.O. S. 12
18
Alternativ könnte man auch ein X-Y-Profil verwenden. Man hätte dann eine Sensitivitätskarte zum Zeitpunkt
T. Dies wird aber von Ohzawa et al. als nicht adäquat abgelehnt.
Man erhält ein solches Raum (X) Zeit (T) Profil, indem man zunächst aus der X-Y-Karte eines Zeitpunktes
durch Integrieren, d.h Aufsummieren der Werte entlang der Y-Achse, ein 1-D-Profil. Fügt man mehrerer solcher
1-D-Profile verschiedener Meßzeitpunkte zusammen, so erhält man die zweidimensionale X-T-Karte.
19
Ohzawa, Izumi: a.a.O. S. 14
20
Ohzawa, Izumi: a.a.O. S. 46
21
Ohzawa,, Izumi: a.a.O. S. 16
22
Ohzawa, Izumi: a.a.O. S. 19
8
Faktoren (z.B. Kontrastpolarität) eliminiert werden. Gleichzeitig vereinigen sie Simple Cells
geeigneter Disparität2324.
Mit dem Modell nach Ohzawa existiert eine glaubwürdige und nachprüfbare Theorie, die
einen bestimmten Teil der räumlichen Tiefenwahrnehmung erklären kann. Eine Erkenntnis
ergibt sich auf jeden Fall: Simple Cells mit ihren rezeptiven Feldern fungieren als eine Art
Phasenfilter. Durch diese ihre Besonderheit sind sie in der Lage, auf bestimmte Disparitäten
zu reagieren. An dieser Stelle muß nochmals darauf hingewiesen werden, daß dies nur ein
Teilprozeß ist, der zur Entstehung der Raumwahrnehmung beiträgt. Er ist aber durchaus in der
Lage, Disparitäten zu entdecken, die sich in der Nähe der Fixationsebene befinden.
2.5 Diskussion der präsentierten Modelle und Entwicklung eines
Arbeitsmodells
Drei Modelle wurden bislang präsentiert, und es steht nun die Frage an, welchem
Gesamtmodell oder welchen Teilaspekten der Vorrang eingeräumt werden soll.
Überprüfen wir also zunächst einmal Metzgers Modell. Augenscheinlich fällt auf, daß das
Modell auf bestimmten Vorstellungen beruht, die heute nicht mehr zutreffen. So kannte
Metzger offensichtlich noch keine Neuronen. Wohl war er sich aber bewußt, daß
Informationen in unserem Nervensystem als „Reizströme“, als elektrische Impulse übertragen
werden25. In seiner Theorie schematisiert Metzger aber das, was heute in physiologisch
abweichender Form anerkannt ist: Der Vereinigungsraum, in dem alle Nerven
zusammenlaufen erinnert stark an Ohzawa et al. Der Ansatz entspricht modernen
Erkenntnissen, nach denen die Nervenerregungen korrespondierender Bildpunkte an ein
bestimmtes Neuron („Simple Cell“)26 laufen. Und selbst die im Phasenmodell beschriebene
Verbindung breitenabweichender Retinapunkte (über rezeptive Felder) ist von Metzger durch
die vielfältigen Überkreuzungen implementiert. Auch die Erkenntnis, daß sich nur die
Kontrastlinien vereinigen, ist heute gültig.
23
Ohzawa, Izumi: a.a.O. S.37
24
Ohzawa, Izumi; De Angelis, Gregory; Freeman, Ralph: The neural coding of stereoscopic depth. Berkeley
1997
25
Metzger, Wolfgang: a.a.O. S. 287, 289
26
Ohzawa, Izumi; De Angelis, Gregory; Freeman, Ralph: Encoding of binocular disparity by simple cells in
the cat’s visual cortex. In: Journal of Neurophysiology 75 o. O. 1996 S. 1779-1805
9
Metzger weist prinzipiell in die richtige Richtung bei der Erklärung zugrundeliegender
Mechanismen der Entschlüsselung binokularer Disparitäten. Allerdings entsprechen seine
physiologischen Vorstellungen nicht dem heutigen Wissensstand.
Das Feldmodell nach Erich König27 stellt einen weiteren Ansatz zur Erklärung der
Wahrnehmung räumlicher Tiefe dar.
Diese Theorie ist aber aus mehreren Gründen als nicht zutreffend einzustufen: Zunächst
stimmen auch hier die physiologischen Voraussetzungen nicht mit dem aktuellem
Erkenntnisstand überein. So läßt sich auch beispielsweise nicht erklären, wie die von König
entworfenen elektrischen Felder ihre Form behalten und sich die Ladung nicht, ähnlich wie in
den Platten eines Kondensators, gleichmäßig verteilt. Seine Versuchsergebnisse lassen sich
auch als Folge bestimmter Erfahrungswerte erklären, so daß er u. U. keine Erkenntnisse über
die Wirkung der Mechanismen zur Entschlüsselung binokularer Disparität gefunden hat.
Darüber hinaus widerspricht der heutige physiologische Wissensstand Königs Prinzip von den
zusammenhängenden Figuren, die sich „zueinander bewegen“. Die außergewöhnlich
erscheinenden Phänomene bei der Betrachtung einer Lücke, wie sie von König geschildert
werden (z.B. außerordentlich hell wahrgenommene Gebiete) lassen sich auch als Folge
neuronaler Prozesse, ähnlich wie der lateralen Inhibition28 erklären.
Ohzawa et al. haben das jüngste Modell entwickelt. Ihr Modell der durch Simple Cells
verbundenen Retinapunkte beider Augen läßt sich logisch und sogar praktisch durch gezielte
Messungen nachvollziehen. Psychische Einflüsse lassen sich bei ihren Experimenten
weitgehend ausschließen.
Damit wird Ohzawas Ansatz glaubhaft. Er erinnert aber durchaus an das prinzipielle Modell
nach Metzger. Als widerlegt gelten kann dagenen die Feldtheorie nach König.
Alle Fragen beantwortet das Phasenmodell nicht. So bleibt zunächst ungeklärt, wie genau
Complex Cells Simple Cells zusammenfassen und ob es hier bestimmte Muster gibt, wie wir
sie von den RFs auf der Retina (Gabor-Funktion) kennen.
Die Anwendung des Phasenmodells deckt nicht alle Phänomene ab. Die maximal erkennbare
Disparität an einer bestimmten Stelle ist hier durch die Größe der beiden entsprechenden RFs
27
König, Erich:a.a.O.
28
Bayrhuber, Horst et al.: Linder Biologie. Lehrbuch für die Oberstufe. 20. neubearbeitete Auflage. Hannover.
1989
Die laterale Inhibition ist ein Mechanismus, bei dem nebeneinander liegende Neuronen sich gegenseitig je nach
ihrer eigenen Erregung hemmen. Auch beim menschlichem Auge gibt es derartige Verknüpfungen. Durch die
gegenseitige Beeinflussung von Bildstellen kommt es so in bestimmten Situationen zum Sehen von
schattenartigen „Flecken“.
10
festgelegt29. Um andere Disparitäten zu erfassen, wird die Konvergenz der Augen verändert.
Auf die Notwendigkeit von Sakkaden (Blicksprüngen) und den damit verbundenen
Konvergenzänderungen gehen auch Burkhard Fischer et al. ein: Schon allein die Tatsache,
daß wir nur mit der Fovea (~Gelber Fleck) wirklich scharf sehen und somit erkennen
können30, zwingt uns zu ständigen Blicksprüngen, die von den Fixationsphasen des Auges
unterbrochen werden. Diese Kette von Vorgängen (Blicksprung-Fixation-Blicksprung) nennt
man einen „optomotorischen Zyklus“. Im allgemeinen werden solche Blicksprünge reflexartig
abgearbeitet. Auf einen bestimmten Netzhautreiz hin, ausgelöst durch eine optische
Veränderung, wird der Reflex initiiert. Das Auge bewegt sich nun auf das Gebiet mit dem
verändertem Stimulus zu.
Andererseits gibt es auch die willentliche Blicksteuerung, welche die Expreß- (=Reflex-)
Sakkaden unterdrückt. Da jedoch in meiner Simulation die Einbeziehung der willentlichen
Blicksteuerung nicht zu leisten ist und Expreß-Sakkaden zu chaotischen Blicksprüngen (=
Kamerabewegungen) führen würden, kann die Blickbewegung nicht in das Modell einfließen.
Da die genaue Vernetzungsart der Complex Cells in der wissenschaftlichen Literatur nicht
ausdrücklich vorgestellt wurde, nehme ich an, daß ihre rezeptiven Felder denen der Simple
Cells entsprechen. Durch eine derartige Anordnung werden Störfaktoren, wie zufällige,
punktuelle Entsprechungen ausgeschaltet.
3. Die Simulation des Phasenmodells nach Ohzawa et al. mit dem
Computer
3.1 Die Anpassung an den Computer
Nachdem das Modell gefunden wurde, das dem aktuellen Forschungsstand entspricht, geht es
an die Umsetzung des Phasenmodells in einer Computersimulation.
Zur binokularen Bilderfassung wird in einem Versuchsaufbau ein optisches Stereosystem,
bestehend aus zwei selbst modifizierten Videokameras, erstellt. Die parallel erfaßten Bilder
beider Kameras werden mit Hilfe von spezieller Software (Framegrabber) in den Computer
29
Die Bündelung der Simple Cells durch Complex Cells erweitert nicht die optimale Disparität, da laut Ohzawa
et al. nur Simple Cells gleicher oder ähnlicher Disparität von einer Complex Cell zusammengefaßt werden.
30
Fischer o.J. Seite 3
11
geladen und in einem elektronisch verarbeitbaren Bildformat auf Festplatte gespeichert. Eine
von mir eigens entwickelte Software wertet die gespeicherten Bildpaare aus und erstellt dabei
eine Simulation der neuronalen Vorgänge.
Die Übertragung des Phasenmodells auf den Computer gestaltet sich nicht ohne
Schwierigkeiten. Eine wesentliche Aufgabe für den Programmierer ergibt sich aus den
Unterschieden in der Organisation des menschlichen Nervensystems und dem Aufbau des
Computers. Während beim Menschen viele Neuronen parallel angeordnet sind und
unabhängig oder miteinander interagierend bestimmte Funktionen erfüllen, arbeitet der
Computer Programme im wesentlichen seriell ab, d.h. Befehle können nicht gleichzeitig,
sondern nur hintereinander, ausgeführt werden. Die Schwierigkeit liegt also darin, eine
Parallelität zu simulieren.
Bedingt durch die Tatsache, daß Aufgaben nacheinander abgearbeitet werden müssen, wird
die Verarbeitungsgeschwindigkeit zu einem entscheidendem Faktor. So müssen für einen RFScan eines Bildes mit 160*120 Pixeln (Bildpunkten) bei einer RF-Größe von 40*40 Pixeln
allein 6144000 Multiplikationen durchgeführt werden, deren Ergebnisse gespeichert werden
müssen. Die hieraus resultierenden langen Rechenzeiten zwingen dazu, den Bereich der
Simulation einzuengen. So kann die Veränderung der Phase eines RF über die Zeit des
Stimulus nicht berücksichtigt werden31.
Die Sakkaden haben sich als sehr notwendig erwiesen, da nach dem Phasenmodell besonders
Tiefendifferenzen in der Nähe der Fixationstiefe erkannt werden. Um weit entferntere Tiefen
zu erkennen, müssen also die Augen immer wieder neu ausgerichtet werden.
Jedoch können die Auslösekritierien für eine Sakkade von dem Phasenmodell nicht erfüllt
werden. deshalb kann dieser Bereich in der Simulation auch nicht berücksichtigt werden.
Zu beachten sind auch die Gegebenheiten des Kamerasystems, mit dem die Aufnahmen
gemacht werden. Es ist anzumerken, daß die Kamerabilder nicht genau dem Reizmuster einer
menschlichen Retina gleichen. Zunächst erfassen die Kameras – zur Vereinfachung der
Auswertung - nur Schwarzweißbilder. Außerdem haben die resultierenden Bilder nur eine
geringe Bildpunktzahl pro Flächeneinheit (=Auflösung), und ein Bildrauschen als Ergebnis
eines Rasterungsverfahrens ist zu beobachten.
Dennoch sind insgesamt die Voraussetzungen für die Schaffung einer modellgetreuen
Simulation gegeben.
31
Was die Ergebnisse wohl nicht verfälschen wird, da die Phasendifferenz der beiden RFs einer Simple Cell ja
über die Zeit konstant bleibt.
12
3.2 Das selbst entwickelte Stereosystem
Zur Aufnahme von Bildern für die Simulation im Computer ist ein binokulares
Kamerasystem, ein Stereosystem, nötig. Literatur speziell zu dieser Thematik gibt es nur
wenig. Trapp und Drüe haben in „Ein flexibles binokulares Sehsystem: Konstruktion und
Kalibrierung“32 ein Stereosystem vorgestellt. Es zeigt sich allerdings schnell, daß dieses
System (Abbildung 1 Anhang A Seite 1) für die schon in Kapitel 3.1 eingeschränkte
Simulationsprozedur überdimensioniert ist (z.B. hat das System zehn Freiheitsgrade), und mit
den Gesamtkosten von 25.000.- DM33 würde es auch den Kostenrahmen dieser Facharbeit
sprengen.
Für die Bilderfassung im Rahmen der anstehenden Simulation wird folgendes benötigt:

ein binokulares Kamerasystem muß über Möglichkeiten zur Scharfeinstellung verfügen.

Der Konvergenzwinkel der Kameras muß einstellbar sein.

Die Bilder müssen von der Kamera möglichst direkt in den Computer eingespeist werden
können.

Das System braucht also vier Freiheitsgrade: 2*Schärfe und 2*Konvergenz.
In der folgenden Tabelle 1 Anhang A (S. 2) sind die verwendeten Komponenten aufgelistet.
Natürlich wurde noch eine Reihe weiterer Bauteile verwendet, wie z.B. Winkel, AluminiumProfile, Schrauben etc., es ist aber weder möglich noch nötig, genauere Angaben über
Typenbezeichnung und Hersteller zu machen.
Die Schärfeneinstellungen beider Kameras sind sowohl elektrisch als auch mechanisch
vornehmbar. Für die elektrische Einstellung der Bildschärfe war es nötig, eine individuell auf
CCD-Chip und Optik abgestimmte Mechanik zu erstellen. Diese beruht im wesentlichen
darauf, daß der CCD-Chip auf einem Schlitten montiert ist, der von einem motorisch
angetriebenen Schneckengewinde an die Linse heran oder von ihr weg geschoben wird.
Die Regulierung des Konvergenzwinkels ist ebenfalls über ein Schneckengewinde realisiert.
Hierbei wird die Bewegung des Schlittens durch Hebel auf die drehbar gelagerten Kameras
übertragen, so daß der Konvergenzwinkel zu- oder abnimmt.
32
Trapp, R.; Drüe, S.: Ein flexibles binokulares Sehsystem: Konstruktion und Kalibrierung. Paderborn, o. J.
33
Trapp, R.: a.a.O. S. 3
13
3.3 Die selbstentwickelte Software
3.3.1 Die Softwarestruktur
In diesem Projekt wird die Auswertung der Bilddaten von selbst entwickelter Software
übernommen. Diese Software hat mehrere Aufgaben zu erledigen: Sie muß es dem Benutzer
ermöglichen, anhand der Gabor-Funktion RFs mit unterschiedlichen Phasen zu erstellen. Es
müssen weitere RF-, Simple Cell- und Complex Cell-Parameter, wie ein Reiz-Schwellwert
eingestellt werden können.
Selbstverständlich muß die Software die Bilddaten erfassen, Bildscans mit Hilfe der RFs
durchführen und die Ergebnisse dieser Scans von Simple Cells und Complex Cells auswerten
lassen.
Um diese vielfältigen Aufgaben sinnvoll zu gliedern, wurden einzelne Arbeitsschritte in
unterschiedliche Programmmodule gepackt (siehe Abbildung 2 Anhang A Seite 2).
Eye („Auge“):
Dieses Modul erfaßt Bilddaten indirekt (es verwendet als Dateien eingespielte Bilder und
greift nicht direkt auf Erfassungsgeräte zu). Außerdem überträgt es die Bilder „auf Anfrage“
an den
DisparityDetector (Bildverarbeitung)
Der DisparityDetector führt die Simulation der retinalen und cortikalen Vorgänge durch. Er
simuliert so RFs von Simple Cells, Simple Cells selber und Complex Cells.
Außerdem bietet dieses Modul vielfältige Konfigurationsmöglichkeiten für die
unterschiedlichen Teilprozesse. Der DisparityDetector erhält die Bilddaten via TCP/IP von
dem Eye/Modul.
RF-Constructor (RF-Gestaltung)
RF-Constructor dient der Erstellung von Reizsensitivitätskurven retinaler rezeptiver Felder
und RFs der Complex Cells.
Anhand der Gabor-Funktion können RF-Profile mit beliebiger Phase erstellt werden. Die
Software bietet vielfältige Konfigurations- und Überwachungsmöglichkeiten, wie 3D-Ansicht
und Histogramm. Im Anhang sind Handbücher für den aktuellen Einstieg in die Software
abgebildet.
Als Programmiersprache wurde Borland/Inprise Delphi 3.0 verwendet. Hierbei handelt es sich
um einen Pascal-Dialekt. Der Compiler erzeugt lauffähige Windows-Programme.
14
Neben den Standard-Komponenten von Delphi benutzte ich auch die Winsocket-Komponente
von François Piette, um einen computerübergreifenden Kommunikationskanal zwischen dem
„Eye“ und dem „Disparity Detector“ zu schaffen. Die Software setzt eine lauffähige Windows
95/98 Version voraus, die mit 24 Bit RGB-Farben betrieben werden sollte. Um eine schnelle
Verarbeitung der Bilder zu gewährleisten, sollte mindestens ein Pentium-Prozessor oder
vergleichbar ab 100 Mhz vorhanden sein.
3.3.2 Die Simulation rezeptiver Felder
Die Auswirkungen der RFs werden durch den DisparityDetector simuliert. Wesentlich hieran
beteiligt ist die Prozedur ScanArea.
Eine wesentliche Grundlage ist die Beschaffenheit der Bilder und der RFs. Für die rezeptiven
Felder gilt: Da nur Schwarzweißbilder verarbeitet werden, können die einzelnen RF-Punkte
Werte zwischen bright-excitatory (127) und dark-excitatory (-127) annehmen. Der Mittelwert
null repräsentiert einen neutralen Wert, d.h. Bildpunkte mit Werten um null werden nicht oder
nur minimal beachtet. Bei einer RF-Analyse wird mit einer RF-Sensitivitätskarte jede Stelle
des zu analysierenden Bildes gescannt. Zunächst werden die RF-Koordinaten relativ zum Bild
auf null gesetzt. Bildpunkt für Bildpunkt des RFs wird mit dem entsprechendem Bildpunkt
des Halbbildes multipliziert. Einige Beispielrechnungen: Der RF-Punkt hat den Wert 127
(bright-excitatory), der entsprechende Bildpunkt des Kamerabildes hat denselben Wert (hell).
Das Ergebnis beträgt 16129, ist also positiv. Es handelt sich hier um eine optimale Reizung.
Ähnlich ist es im zweiten Fall: eine dunkel-erregbare Stelle des RF (-127) obliegt einer
dunklen Kamerabildstelle (-127). Das Ergebnis ist genauso wie im ersten Fall; auch hier
handelt es sich um eine optimale Reizung. Anders ist es im dritten Fall: eine hell-erregbare
RF-Stelle (127) wird mit dem entsprechenden Bildpunkt, der dunkel ist (-127) multipliziert.
Das Ergebnis ist 127 * (-127) = -16129; es handelt sich nicht um eine optimale Reizung. Es
wird also deutlich: je größer das Produkt aus Bildpunkt des RF und Bildpunkt des
Kamerabildes, desto größer ist die Deckung, desto optimaler ist der Stimulus an der
Bildstelle. Die Teilergebnisse werden addiert und in der Variable „Average“ abgelegt. Nach
einem „RF-Scan“ wird diese Variable mit dem vorher festgelegten RF-Schwellwert
verglichen: ist „Average“ größer als der Schwellwert, so wird das Ansprechen des RFs an der
entsprechenden Bildstelle vermerkt.
Dieser Durchlauf wird wiederholt, wobei jedesmal eine weitere Bildstelle überprüft wird.
15
Ist die Prozedur ScanArea beendet, liegt eine RF-Reizkarte vor, die zeigt, an welchen Stellen
das gewählte RF-Neuron ein Aktionspotential abgeben würde.
Der hier beschriebene Prozeß ist auch im Flußdiagramm in Abbildung 3 Anhang A (Seite 3)
dargestellt.
Er wird zweimal (jeweils für das rechte und das linke Bild einmal) ausgeführt. Die Ergebnisse
werden in getrennten Karten dargestellt.
3.3.3 Informationsverarbeitung durch Simple Cells
Nachdem die Prozedur „ScanArea“ Karten für das rechte und das linke Kamerabild erstellt
hat, in denen die Aktionspotentiale der jeweiligen RFs vermerkt sind, kann die Wirkung der
„Simple-Cells“ nachvollzogen werden (Flußdiagramm hierzu: Abbildung 4, Anhang A Seite
4).
Eine Simple Cell nach dem Phasenmodell ist verbunden mit einem RF im rechten und einem
RF im linken Auge. Zu einer Erregung kommt es, wenn die bei der Simple Cell eingehenden
Reize einen bestimmten Schwellwert überschreiten. Da in meiner Umsetzung schon die
Antworten der einzelnen RFs aufgezeichnet wurden (durch „ScanArea“), braucht jetzt nur
noch die Reaktion der Simple Cells aufgezeichnet werden. Dies wird in der Prozedur
„CompareBitmaps“ getan. Hier werden die korrespondierenden Punkte der beiden RFAntwortkarten miteinander verglichen. Ist auf beiden Karten an der gleichen Stelle ein
Aktionspotential vermerkt, so zeichnet das Programm die entsprechende Simple Cell in einer
Anwortkarte als „erregt“ ein.
3.3.4 Eliminierung von Störfaktoren auf Basis der Complex Cells
Nachdem die Prozedur „ScanArea“ Karten für das rechte und das linke Kamerabild erstellt
hat, in denen die Aktionspotentiale der jeweiligen RFs vermerkt sind, kann die Wirkung der
„Simple-Cells“ nachvollzogen werden.
Eine Simple Cell nach dem Phasenmodell ist verbunden mit einem RF im rechten und einem
RF im linken Auge. Zu einer Erregung kommt es, wenn die bei der Simple Cell eingehenden
Reize einen bestimmten Schwellwert überschreiten. Da in meiner Umsetzung schon die
Antworten der einzelnen RFs aufgezeichnet wurden (durch „ScanArea“), braucht jetzt nur
noch die Reaktion der Simple Cells aufgezeichnet werden.
16
Hierzu werden die korrespondierenden Punkte der beiden RF-Antwortkarten miteinander
verglichen. Ist auf beiden Karten an der gleichen Stelle ein Aktionspotential vermerkt, so
zeichnet das Programm die entsprechende Simple Cell in einer Anwortkarte als „erregt“ ein..
3.4 Simulation des Phasenmodells
3.4.1 1. Stufe der Simulation, Aufbau der Geräte und Aufzeichnung der
Bilder
Nachdem der Simulator entwickelt ist, können jetzt Sehsituationen schnell und effizient mit
dem Phasenmodell überprüft werden. Um Störeinflüsse zu verringern, wurde die Umgebung
der Testobjekte idealisiert: Ein weißer Hintergrund wurde hinter den Testobjekten angebracht,
die Grundfläche blieb weitgehend leer.
Als Testobjekte dienten zwei vertikal stehende Schrauben. Eine dieser Schrauben wurde auf
dem Kamera-Fixationspunkt (auf der Mittelachse zwischen beiden Kameras, 70 cm vor den
Geräten) fest angebracht. Eine andere Schraube wurde 2,5 cm links seitlich von dieser
positioniert. Im Rahmen der folgende Aufnahmen wurde sie parallel zur Mittelachse vor- und
zurückbewegt (s. Abb 5, Anhang A, S. 4.).
Nun wurden in mehreren Sequenzen mit den Kameras rechts und links Bilder aufgenommen.
Vor jeder Sequenz wurde die linke, nicht fixierte Schraube, in einer anderen Tiefenebene
positioniert. Die bei diesem Verfahren gewonnen Bilder wurden von der Simulationssoftware
DisparityDetector analysiert. Hierbei wurden fünf RFs mit Phasenverschiebungen von 130°240° verwendet. Diese Werte wurden ausgewählt, da bei höheren oder niedrigeren
Phasenverschiebungen ungeeignete RF-Strukturen entstanden wären. (z.B. statt hell-dunkelsensitiven RFs hell-dunkel-hell sensitive RFs).
Eine Skizze des Aufbaus ist in Abbildung X. zu sehen. Änderungen an der Mechanik im
Sinne der Optimierung sind noch bis zum Kolloquium möglich.
3.4.2 2. Stufe der Simulation. Aufdeckung und Darstellung der räumlichen
Disparitäten
17
Die Filterfunktion der RFs wird deutlich, wenn man die Felder in einer Reihe untereinander
stellt (Abbildung sieben). Das oberste rezeptive Feld hat eine 130°, die unterste eine 240°
Phasenverschiebung. Die dominierenden Regionen, eine stark bright-excitatory und eine stark
dark-excitatory-Region, verschieben sich hierdurch in den RFs von rechts nach links.
Infolgedessen können wir annehmen, daß sich auch die optimale StimulusPosition in gleicher Weise verschiebt.
Nach der Auswertung von vier Simulationsläufen (Anhang A Abb. 6) zeigt sich
folgendes: Auf unterschiedliche retinale Disparitäten, d.h. unterschiedliche
räumliche Abbildungsdifferenzen, reagieren jeweils andere RF-Paare mit (und
somit andere Simple Cells) unterschiedlicher Phasenverschiebung.
Die Phasenverschiebung kehrt sich beim Überschreiten der Fixationsebene um.
1,5 cm vor der Fixationsebene beträgt die optimale Phasenverschiebung der
RFs links: 130°, rechts: 240°, 1,5 cm hinter der Fixationsebene beträgt sie links:
240°; rechts 130°. Besonders deutlich wird dies in Grafik 1, Anhang A (S. 6),
durch die Überkreuzung der beiden Optimale-RF-Phase-Kurven.
Eine weitere Feststellung ist, daß die rezeptiven Felder einer bestimmten Größe,
trotz Anwendung unterschiedlichster Phasenverschiebungen, nicht mehr an
Abb 7:
Optimale
Phasenverschiebunge
n
korrespondierenden Stellen ansprechen. Dies ist ab etwa 3 cm vor und hinter
der Fixationsebene der Fall. Hier ist der Abstand der rechten und der linken
Abbildung eines Gegenstandes zu weit entfernt, so daß die durch die
Phasenverschiebung entstandenen Verschiebungen der Subregions diesen
Abstand nicht mehr abdecken können. Abhilfe schaffen hier größere RFs. Diese haben jedoch
einen Nachteil: Indem sie ein größeres Gebiet abdecken, werden sie auch von mehr
Störsignalen wie z.B. Rauschen oder Kontrastlinien im Hintergrund gereizt.
Somit zeigt sich in den Simulationsexperimenten deutlich, daß Simple Cells in der Lage sind,
mit unterschiedlichen phasenverschobenen RFs ganz bestimmte räumliche Disparitäten
aufzudecken. Das Phasenmodell trägt auf diesem Weg zur Erklärung des binokularen Sehens
bei. Die im Rahmen dieser Arbeit selbst entwickelte und hier vorgestellte Software ist in der
Lage, die Vorgänge nach dem Phasenmodell zu simulieren und visuell darzustellen.
18
4. Schlußteil
4.1 Diskussion der Ergebnisse
Das Thema dieser Facharbeit lautet „Raumwahrnehmung beim Menschen: Modellbildung und
Simulation.“
Mehrere existierende Modelle wurden auf wissenschaftliche Aktualität und Stimmigkeit hin
untersucht. Ein Modell wurde gefunden, das als einziges auf physiologischen Messungen
beruht. Besonders in der Simulation hat sich gezeigt, daß dieses Modell beeindruckende
Eigenschaften. Das Phasenmodell ist für die Erkennung von Tiefen geeignet, deren Betrag
nahe der Fixationstiefe liegen. Hier kann es sehr genaue Informationen über die
Tiefenverteilungen liefern. Durch die enge Gebundenheit an die fixierte Tiefe ist es auch
möglich, Informationen über das seitliche Ausmaß der fixierten Objekte zu gewinnen (da bei
einer Reihe von Objekten – wenn fixiert - die Tiefenposition der verschiedenen sichtbaren
Kanten ähnlich sind, und so allesamt durch Simple Cells erkannt werden). Durch die
Verwendung rezeptiver Felder werden Störsignale im Bild weitgehend ignoriert, und auch so
unregelmäßige Bildmatrizen, wie die des Auges, können als Datenlieferant fungieren.
Das Phasenmodell hat sich also als sehr leistungsfähig gezeigt. Es wurde aber auch deutlich,
daß das Phasenmodell nicht der einzige Mechanismus sein kann, der die Tiefenwahrnehmung
entstehen läßt. Es wird wohl eine Reihe weiterer Prozesse geben, deren Ergebnisse andere
Prozesse anregen, und nur gemeinsam betrachtet erzeugen sie eine realitätsnahe Vorstellung
der räumlichen Tiefe. Das schmälert allerdings nicht den Wert des Phasenmodells, das
sicherlich an der Entstehung der Tiefenwahrnehmung bedeutend beteiligt ist.
Diese Arbeit zeigt, daß auf diesem Gebiet der Wissenschaft weite Bereiche noch nicht
abschließend erforscht sind: Andere Tiefenwahrnehmungsprozesse bleiben übrig, müssen z.T.
erst noch entdeckt werden. Die Verarbeitungsstufe der Complex Cells muß wohl noch weiter
erforscht werden. Es stellt sich auch die Frage, was mit den Informationen der Complex Cells
geschieht. Gibt es Simple-Cell-ähnliche Strukturen auch bei der Verarbeitung akustischer
Reize, z.B. um festzustellen, von welcher Seite ein akustsisches Signal kommt?
Im Rahmen dieser Arbeit wurde eine Simulationssoftware entwickelt. Sie ist in der Lage,
ausgehend von der Wirklichkeit entsprechenden Bildeindrücken, einen wichtigen Teil der
neuralen Vorgänge bei der Bildverarbeitung zu veranschaulichen, und so die Möglichkeiten
des Phasenmodells darzustellen. Nur mit dieser Software ist es möglich, die einzelnen Stufen
der Verarbeitung mit mathematischen Berechnungen nachzubilden und visuell anschaulich zu
19
machen. Sie bietet darüber hinaus Möglichkeiten zu weiteren Untersuchungen und
Experimenten auch auf der Basis von anderem Bildmaterial.
Abschließend kann ich also sagen, daß ich im Rahmen meiner Arbeit die sich aus dem Thema
stellenden Aufgaben erfolgreich erfüllen konnte.
4.2 Danksagungen
Ich danke Prof. Dr. Burckhardt Fischer von der Universität Freiburg für die Unterstützung bei
der Literaturrecherche. Weiterhin danke ich Prof. Dr. Izumi Ohzawa von der University of
California, Berkley, für die vielen Erklärungen, die er mir zusandte.
5. Verzeichnis der Verwendeten Literatur
1. Fischer, Burckhart; Weber, Heike; Biscaldi, Monica; Gezeck ,Stefan: Aktives Sehen Eine visuomotorische Koordinationsleistung des Gehirns. o.J. o.O.
2. Ohzawa, Izumi; DeAngelis, Gerald; Freeman, Ralph: Encoding of binocular disparity by
simple cells in the cat’s visual cortex. In: Journal of Neurophysiology 75 o.O. 1996 S.
1779-1805
3. Ohzawa, Izumi; DeAngelis, Gerald; Freeman, Ralph: The neural coding of stereoscopic
depth. Berkeley 1997
4. König, Erich: Experimentelle Beiträge zur Theorie des binokularen Einfach- und
Tiefensehens. Bd. 4: Bay, Eberhard; Metzger, Wolfgang; Witte, Wilhelm: Psychologica
Universalis. Meisenheim am Glan 1962.
5. Metzger, Wolfgang: Gesetze des Sehens. Frankfurt am Main 1953.
6. Maki, Atsuto; Uhlin, Thomas; Eklundh, Jan-Olof.: Disparity selection in binocular
persuit. Stockholm, o. J.
20
7. Klix, Friedhart: Information und Verhalten. Kybernetische Aspekte der organismischen
Informationsverarbeitung. Einführung in naturwissenschaftliche Grundlagen der
Allgemeinen Psychologie.
8. Trapp, R.; Drüe, S.: Ein flexibles binokulares Sehsystem: Konstruktion und Kalibrierung.
Paderborn, o. J.
9. Rausch, Rainer: Netzwerk-Experimente mit TCP/IP. In: Toolbox 2/98. München 1998,
S.100-102
10. Bayrhuber, Horst et al..: Linder Biologie. Lehrbuch für die Oberstufe. 20., neubearbeitete
Auflage. Hannover, 1989
21
Herunterladen