Inhalt 1. Einleitung S. 2 2. Modelle der Raumwahrnehmung S. 2 2.1 Das binokulare Sehen S. 3 2.2 Entstehen der Raumwahrnehmung nach Metzger S. 3 2.3 Das Feldmodell nach Erich König S. 5 2.4 Entschlüsseln binokularer Disparitäten durch das Phasenmodell nach Ohzawa, Freeman und DeAngelis 3. S. 6 2.5 Diskussion der präsentierten Modelle und Entwicklung eines Arbeitsmodells S. 9 Die Simulation des Phasenmodells nach Ohzawa et. al. durch den Computer S. 11 3.1 Probleme der Anpassung an den Computer S. 11 3.2 Das selbst entwickelte Stereosystem S. 13 3.3 Die selbst entwickelte Software S. 14 3.3.1 Die Softwarestruktur S. 14 3.3.2 Die Simulation rezeptiver Felder S. 15 3.3.3 Informationsverarbeitung durch Simple Cells S. 16 3.3.4 Eliminierung von Störfaktoren auf der Basis von Complex Cells. S. 16 3.4 Simulation des Phasenmodells S. 17 3.4.1 1. Stufe der Simulation: Aufbau und Aufzeichnung der Bilder 3.4.2 2. Stufe der Simulation: Aufdeckung und Darstellung der räumlichen Disparität 4. 5. S. 17 S. 18 Schlußteil S. 19 4.1 Diskussion der Ergebnisse S. 19 4.2 Danksagungen S. 20 Verzeichnis der verwendeten Literatur S. 20 Anhang A: Materialen zur Dokumentation Anhang B: Hilfe und Anleitung zur Software Anhang C: Der Quellcode der Software 1 Einleitung Vorgänge im Nervensystem höherer Säugetiere beschäftigen die Wissenschaft schon lange. Aber erst in jüngster Zeit gelingt es dem Menschen, neuronale Aktivitäten tatsächlich qualitativ und quantitativ exakt zu erfassen. Die aktuelle Wissenschaft untersucht besonders solche Mechanismen, die Wahrnehmungen der Sinnesorgane verarbeiten. Ein Schwerpunkt liegt hierbei in der Erforschung der Verarbeitung von Hör- und Seheindrücken. Erkenntnisse hieraus werden in der Medizin bei der Behandlung von Sehstörungen und Hörschwächen gebraucht und auch darüber hinaus bei der Therapie verschiedenster Nervenerkrankungen. Außerdem fließt das neu gewonnene Wissen in die Entwicklung modernster technischer Geräte ein, zur Verfeinerung diagnostischer Instrumente, um Kranken und Behinderten mit Neuroprothesen den Alltag zu erleichtern. Auch die Technik verwendet die gewonnenen Erkenntnisse, z. B. in der Automobilindustrie (intelligente Steuerungssysteme, Verkehrsleitsysteme) in der Computerindustrie (menschengerechte Benutzerschnittstellen „Human Interface“) und in der Robotertechnik. So wird wohl auch das alltägliche Leben in der Zukunft von den Erkenntnissen dieser Forschungen zunehmend beeinflußt werden. Die vorliegende Arbeit befaßt sich zunächst mit der Entstehung der Raumwahrnehmung beim Menschen. So werden verschiedene Modelle untersucht, die den Forschungsstand bis in die jüngste Vergangenheit repräsentieren. Sie werden auf ihre Plausibilität, Brauchbarkeit und wissenschaftliche Aktualität hin geprüft. Als Ergebnis entsteht ein Arbeitsmodell, das weitgehend auf dem Phasenmodell vom Ohzawa beruht. Dazu habe ich in dieser Arbeit eine Computersimulation entwickelt. Die tatsächliche Raumwahrnehmung im Gehirn beruht zusätzlich auf komplexen Lernprozessen, bei denen die Ergebnisse der Wahrnehmung in den Sehprozeß wieder eingebracht werden. Sie werden zwar allgemein in den Theorien angenommen, sind für dieses Modell aber nicht konkret beschrieben und auch noch nicht ausreichend erforscht, da die Komplexität der von Individuum zu Individuum unterschiedlichen Nervenstrukturen ein Untersuchen dieses Gebietes bislang erschwert. Mein Arbeitsmodell würde wie die Modelle in der Literatur durch ungesicherte Annahmen belastet und wäre vom Aufwand her technisch nicht realisierbar 2 2. Modelle der Raumwahrnehmung 2.1 Das binokulare Sehen Mit seinen beiden Augen nimmt der Mensch zwei getrennte Bilder gleichzeitig auf. Diese beiden Bilder sind nicht gleich. Je nach Tiefenabstand zum fixierten Gegenstand befinden sich die „Sehdinge“ (Metzger1) an unterschiedlichen horizontalen Positionen. Diese Differenz kann ausgewertet werden. Allgemein geht man davon aus, daß durch nervöse Mechanismen Bildunterschiede benutzt werden, um Tiefenwerte einzelner Bildteile zu ermitteln. Klix brachte das auf einen Punkt: „Durch die Verarbeitung zweier monokularer Reizmuster zu einem Gesamtbild entsteht ein potentiell neuartiger Informationsträger über die Abstandsbeziehungen der im Reizmuster abgebildeten Objekte.“2 Ein weiterer Faktor der Raumwahrnehmung, der aber in der Literatur kaum erwähnt wird, ist die Tiefenbestimmung anhand der Krümmung der Linse. Um mit der Linse eine bestimmte Tiefe zu fixieren, muß die Brechkraft einen zugeordneten Wert annehmen, nur dann werden die gesehenen Gegenstände der Tiefenebene scharf abgebildet. So könnte also auch die Kontraktion der Ciliarmuskulatur oder die Spannung der Ciliarbänder zur Bestimmung von Tiefenwerten dienen. Hierüber gibt es aber keine genauen Untersuchungen in der Literatur, die eine Auswertung im Sinne der Tiefenwahrnehmung ermöglichen würden. Die im folgenden vorgestellten Modelle beruhen deshalb auf dem zuerst genannten Ansatz. 2.2 Entstehen der Raumwahrnehmung nach Metzger Wolfgang Metzger befaßt sich in „Die Gesetze des Sehens“3 mit dem Zustandekommen des Tiefeneindrucks und den zugrundeliegenden Mechanismen. Als Ausgangspunkt benutzt er einen Ansatz Herings (Erwähnung im Text Metzgers). Dieser definiert die Tiefenbestimmtheit der Sehdinge als „Folge der Tiefenbestimmtheit jedes einzelnen ihrer Punkte. Jede Netzhautstelle hat danach außer ihrem Breiten- und Höhenwert auch einen Tiefenwert. Die 1 Metzger, Wolfgang: Gesetze des Sehens. Frankfurt am Main 1953 2 Klix, Friedhart: Information und Verhalten. Kybernetische Aspekte der organismischen Informationsverarbeitung. Einführung in naturwissenschaftliche Grundlagen der Allgemeinen Psychologie. 3 Metzger, Wolfgang: a.a.O. 3 Tiefenwerte wachsen – im Gegensatz zu den Breitenwerten – in entgegengesetzter Richtung, von der Schläfe zur Nase hin.“4. An korrespondierenden Netzhautstellen heben sich die Tiefenwerte auf. Wird also ein Objekt fixiert und so an diesen Stellen abgebildet, befindet es sich in einer Fixationsebene. Alle anderen Bildpunkte werden nicht auf korrespondierende Netzhautstellen abgebildet. Als Folge davon heben sich die Tiefenwerte nicht mehr exakt auf: Sie werden – je nach Vorzeichen des resultierenden Tiefenwertes - als vor oder hinter der Fixationsebene liegend wahrgenommen. Um diese These zu überprüfen, stellt Metzger Folgerungen auf, die er konsequent mit Experimenten überprüft. Das Beobachtete läßt sich aber nicht mit Herings Annahmen in Einklang bringen. Metzger bildet aus seinen Beobachtungsergebnissen ein eigenes Modell. Er folgert u. a. daß es Unterschiede zwischen Netzhautabbild und Cortexbild gibt5. Er entwickelt die Vorstellung von einem Verständnis des „zu vereinigenden Ganzen“.6 So handelt es sich in seinem Modell nicht um eine Summe von Einzelpunkten, sondern um als funktionelle Einheiten empfundene Ganze (z.B. Rechtecke, Linien etc.). Außerdem erkennt er die Bedeutung der Kontraste7, indem er feststellt, daß sich auch Figuren unterschiedlicher Farben binokular vereinigen und so einen räumlichen Eindruck vermitteln. Nach seiner Theorie werden ähnlich liegende Kontrastlinien oder Stellen mit gleicher Bedeutung vereinigt. Aus diesen Forschungen entwickelt er Gestaltgesetze des Zusammenschlusses. So entstehen u. a. das Gesetz der Nähe („Diejenigen von ihrer Umgebung abgehobenen Gebilde, die in allen ihren Teilen genau auf Deckstellen liegen oder verhältnismäßig am wenigsten von der Deckstelle abweichen, vereinigen sich nach dem Gesetz der Nähe“8), das Gesetz der Gleichartigkeit (Wenn sich auf Deckstellen Ungleiches befindet, in der Nähe aber passende Partner, evtl. mit geringer Verzerrung, vorhanden sind, erfolgt die Vereinigung nicht nach dem Gesetz der Nähe, d.h. der Partner mit der größeren Ähnlichkeit wird vorgezogen). Außerdem dienen der Vereinigung nur prägnante Stellen (s.o.). Um eine Theorie, bilden zu können, welche die physikalischen Umstände erklärt, befaßt sich Metzger mit der Wahrnehmung des Vereinigungsprozesses. Er stellt fest, daß Objekte eines 4 Metzger, Wolfgang: a.a.O. S. 262 5 Metzger, Wolfgang: a.a.O. S. 276 6 Metzger, Wolfgang: a.a.O. 7 Metzger, Wolfgang: a.a.O. S. 281 8 Metzger, Wolfgang: a.a.O. S. 281 4 unbekannten Raumes zunächst „doppelt“ gesehen werden. Die Tendenz zur Vereingiung wird von ihm als „Fusionsdruck“ oder „Vereinigungsdruck“ bezeichnet. Abschließend entwickelt Metzger eine neue Theorie. Nach dieser laufen Nervenbahnen von den beiden Retinen in das Grosshirn. Der Endbereich dieser Nervenbahnen wird als Raum betrachtet, in dem sich die Nerven überkreuzen und korrespondierend zusammenlaufen. Die Nervenbahnen sind nicht voneinander isoliert, Nervenerregungen laufen aber bevorzugt auf der aktuellen Nervenbahn entlang. Tiefeneindrücke entstehen so nach Metzger durch die Positionierung des Cortex-Abbildes eines nicht fixierten Gegenstandes in Relation zu der Cortex-Abbildung eines fixierten Gegenstandes9 (auf einer Art Fixationsebene im Endbereich). Die Abbildung erfolgt also entweder vor oder hinter der Fixationsebene und wird auch dementsprechend empfunden. 2.3 Das Feldmodell nach Erich König Erich König propagiert in seinem Werk „Experimentelle Beiträge zur Theorie des binokularen Einfach- und Tiefensehens“10 eine weitere Theorie. Ausgangspunkt sind Unstimmigkeiten (zur Zeit der Entstehung des Feldmodells) gängiger Theorien, welche die Tiefenwahrnehmung weitgehend als Funktion der Netzhäute abtun, mit praktischen Versuchen, die durch diese Ansätze nicht mehr zu erklären sind. Insbesondere „das Lückenphänomen11“ sprach gegen die Ansätze Metzgers, die in dieser Arbeit bereits genannt wurden. 9 Da es sich in Metzgers Modell im nicht isolierten Endbereich um einen Raum handelt, kann das Cortex-Abbild vor oder hinter einem anderem gelagert sein. 10 König, Erich: Experimentelle Beiträge zur Theorie des binokularen Einfach- und Tiefensehens. Bd. 4: Bay, Eberhard; Metzger, Wolfgang; Witte, Wilhelm: Psychologica Universalis. Meisenheim an Glan 1962. 11 König, Erich: a.a.O. Eine in ausschließlich einem Halbbild vorhandene Lücke dominiert, d.h. Teile in der einfach gesehenen Figur werden ausgelöscht. Begleitet wird das Lückenphänomen häufig durch ungewöhnliche Hervorhebung (z.B. besonders „helle“ Wahrnehmung) der einfach gesehenen Lücke. Gelegentlich wird eine Lücke auch unstetig wahrgenommen. In so einem Fall löst das dauerhafte Betrachten der Vorlagen ein unangenehmes Gefühl aus, das manchen Betrachter sogar zum Abbruch eines Experiments gezwungen hat. 5 Um das Lückenphänomen genauer untersuchen zu können, entwickelt König eine Versuchsapparatur. Diese ähnelt einem Stereoskop12, bei dem Parameter wie Raumhelligkeit, Lückenöffnung etc. variabel sind. Hiermit führt er mehrere Versuchsreihen durch, bei denen er einzelne Parameter variiert. Anschließend führte er weitere Raumwahrnehmungsexperimente durch, wieder mit variierten Parametern. Basierend auf den Ergebnissen seiner Versuchsreihen stellt König eine eigene Theorie auf. Diese Theorie soll vor allem die bewußt wahrgenommenen Phänomene bei der Entstehung der Tiefenwirkung, wie z.B. das „Wandern“ von Figuren oder das Lückenphänomen erklären. Die auf Ansätze Köhlers gestützte „Feldtheorie“ Köhlers besagt folgendes: Beide Bilder eines gesehenen Gegenstandes werden auf der Hirnrinde abgebildet, und zwar als elektronegativoder elektropositiv geladene Felder. Dabei sind die Abbildungen gegensätzlich geladen. Zwischen diesen unterschiedlichen Ladungen ist eine isolierende Trennschicht, so daß die Ladungen erhalten bleiben. Da sich unterschiedliche Ladungen anziehen, treiben auch diese Felder aufeinander zu, bilden also eine Einheit und werden einfach wahrgenommen. Mit dieser Theorie erklärt König auch Extremsituationen der binokularen Raumwahrnehmung, wie z. B. das Lückenphänomen, das mit den gängigen Ansätzen nicht zu erklären war. 2.4 Entschlüsselung binokularer Disparität durch das Phasenmodell nach Ohzawa, Freeman und DeAngelis. Ohzawa et al. beschreiben die Auswertung binokularer Disparität durch Neuronen in der Cortex. Sie setzen dabei die gängigen Vorstellungen des Nervensystems voraus. Mit ein Ausgangspunkt ihrer Untersuchungen waren Computersysteme, die Räumlichkeit erkennen. Diese Systeme benutzen z.T. schon seit den 80er Jahren Gabor-Phasenfilter (siehe unten), um zum Vergleich geeignete Gebiete ausfindig zu machen. Ohzawa unterteilt Neuronen in der Cortex in „Simple Cells“ und „Complex Cells“. Simple Cells haben auf der Retina sogenannte rezeptive Felder (RFs), d.h. sie bilden den Sammelpunkt für Axone untergeordneter Neuronen. Jede Simple Cell hat je ein separates RF 12 Apparatur, die es ermöglicht, zwei Halbbilder binokulkar zu präsentieren, so daß bei passenden Vorlagen ein räumlicher Eindruck entsteht 6 auf jeder Netzhaut. In den RFs gibt es Bereiche unterschiedlicher Sensitivitäten: „brightexcitatory“-Regionen („on“) und „dark-excitatory“-Regionen („off“)13. Die Anordnungen und Ausprägungen dieser Sensivitätsbereiche kann man angenähert mit Hilfe der Gabor-Funktion darstellen. Diese besteht aus einem Sinus-Teil, der mit der Gausschen Normalverteilung multipliziert wird14. Man kann sich dieses so vorstellen, daß sich die Sinusfunktion durch ein Gaussches Fenster bewegt15. Verändert man den Sinus-Teil (Phasenveränderung), so verändert sich die räumliche Struktur des rezeptiven Feldes. Durch diese Eigenschaft der RFs erst wird es möglich, die Gabor-Funktion an jedes beliebige RF anzupassen. Mit dem in dieser Facharbeit erstellten Programm „Receptive Field Constructor“ können Gabor-Funktionen dargestellt und variiert werden. Ohzawa geht davon aus, daß sich die RFs einer Simple Cell an korrospondierenden (d.h. positionsgleichen) Bildpunkten der Retina befinden. Sie sind aber nicht durch gleiche Stimuli in gleicher Weise zu erregen, da sie unterschiedlich – phasenverschoben (siehe oben) strukturiert sind. Hiervon leitet sich die Bezeichnung Phasenmodell ab. Die Informationen über die räumliche Tiefenverteilung eines wahrgenommenen Raumes sind in den Anteilen der Phasenverschiebung korrespondierender RFs enthalten. Um dies zu beweisen entwickelte Ohzawa die Reverse Correlation Prozedur16, die es ermöglicht, Struktur und „Funktionsweise“ von Simple-Cells und den angeschlossenen RFs zu analysieren. Da sich die Antwortstruktur eines RFs über die Zeit verändert, wurde zunächst keine zweidimensionale Karte (X , Y – Karte), sondern ein Würfel, auch „Spike-train“ genannt, erstellt. Idealerweise würde man für weitere Untersuchungen solche Raum (X) – Raum(Y) – Zeit(T) - Würfel nehmen. Ein solches Vorgehen wäre aber unpraktisch und ließe nur schwer 13 Ohzawa, Izumi; De Angelis, Gregory; Freeman, Ralph: Encoding of binocular disparity by simple cells in the cat’s visual cortex. In: Journal of Neurophysiology 75 o. O. 1996 S. 1779-1805. S. 3 14 Ohzawa, Izumi: a.a.O. S. 4 15 Ozawa, izumi: a.a.O. S. 19 16 Bei der Reverse Correlation Prozedur werden einem geeignetem Testobjekt, z.B. einer betäubten Katze, verschiedene Stimuli auf korrespondierende Bildpunkte projiziert. Nun wird über Elektroden die Aktivität zugeordneter Neuronen, z.B. von Simple Cells, durch einen Computer aufgezeichnet. Außerdem aufgezeichnet werden Position und Ausrichtung der Stimuli (weißer/schwarzer Balken auf grauem Grund). Mit Hilfe dieser Daten kann eine „Reizkarte“ erstellt werden, die genauen Aufschluß über die Erregbarkeit des RFs und die Verteilung der „on“ und „off“ Regionen gibt. Da über die Zeit mehrere dieser Reizkarten erstellt werden, hat man schließlich einen „Spike-Train“, darstellbar als dreidimensionaler Würfel mit den Sensitivitätskarten des RFs zu verschiedenen Zeitpunkten. 7 mathematische Beschreibungen zu, und so verwendet man ein X-T-Profil17 18. Hierbei wird auch deutlich, daß es ein Abdriften der Subregionen in einen RF gibt, die allerdings bei beiden Augen gleich sind19. Um exakte Aussagen über Bedeutungen und Zusammenhänge der Veränderung verschiedener Parameter der RFs einer Simple Cell zu bekommen, erstellten Ohzawa et al. 1-D-Profile der rezeptiven Felder im Abstand von fünf Millisekunden. Durch Anpassung der Gabor Funktion erhielt man über die Parameter exakte Werte für Größen wie die „Optimale räumliche Frequenz“ oder „Position des RF-Zentrums“20. Diese Größen trug man in Graphen ein und konnte so die Entwicklung der Parameter, auch in Bezug aufeinander, über die Zeit verfolgen. Dabei zeigte sich folgendes: Die optimale räumliche Frequenz, d.h. die Zahl der „on-“ und „off-regions“ ist für die RFs beider Augen annähernd gleich, ähnlich wie Größe und Position des Zentrums, sowie den Tilt der Orientierung. Die Phase, entscheidend für Formgebung der unterschiedlichen Subregionen, ist für beide auch relativ konstant. Bei bestimmten Zellen ist eine merkliche Phasendifferenz zu verzeichnen, die konstant ist21. Und diese Zellen sind es, die dem Phasenmodell entsprechen. Auffallend ist, daß, je mehr die Orientierung vertikal ist (d.h. je mehr das RF sensibel für Breiten-Disparitäten ist), desto mehr Zellen entsprechen dem Phasen-Modell22. Das PhasenModell decodiert also vorwiegend horizontale Disparitäten. Zellen mit horizontalen Ausrichtungen haben nur geringe Phasendifferenzen. Die größte festgestellte Phasendifferenz betrug 180°. Simple Cells, die nicht der Beschreibung entsprechen, die bis hier vorgestellt wurden, gibt es auch. Ihnen wird im Phasenmodell aber keine explizite Bedeutung zugewiesen. Die nächste Stufe der Erkennung bilden die „Complex Cells“. Ihre RFs bilden die Simple Cells. Sie kombinieren die Simple Cells nach dem Phasenmodell in der Weise, daß störende 17 Ohzawa, Izumi: a.a.O. S. 12 18 Alternativ könnte man auch ein X-Y-Profil verwenden. Man hätte dann eine Sensitivitätskarte zum Zeitpunkt T. Dies wird aber von Ohzawa et al. als nicht adäquat abgelehnt. Man erhält ein solches Raum (X) Zeit (T) Profil, indem man zunächst aus der X-Y-Karte eines Zeitpunktes durch Integrieren, d.h Aufsummieren der Werte entlang der Y-Achse, ein 1-D-Profil. Fügt man mehrerer solcher 1-D-Profile verschiedener Meßzeitpunkte zusammen, so erhält man die zweidimensionale X-T-Karte. 19 Ohzawa, Izumi: a.a.O. S. 14 20 Ohzawa, Izumi: a.a.O. S. 46 21 Ohzawa,, Izumi: a.a.O. S. 16 22 Ohzawa, Izumi: a.a.O. S. 19 8 Faktoren (z.B. Kontrastpolarität) eliminiert werden. Gleichzeitig vereinigen sie Simple Cells geeigneter Disparität2324. Mit dem Modell nach Ohzawa existiert eine glaubwürdige und nachprüfbare Theorie, die einen bestimmten Teil der räumlichen Tiefenwahrnehmung erklären kann. Eine Erkenntnis ergibt sich auf jeden Fall: Simple Cells mit ihren rezeptiven Feldern fungieren als eine Art Phasenfilter. Durch diese ihre Besonderheit sind sie in der Lage, auf bestimmte Disparitäten zu reagieren. An dieser Stelle muß nochmals darauf hingewiesen werden, daß dies nur ein Teilprozeß ist, der zur Entstehung der Raumwahrnehmung beiträgt. Er ist aber durchaus in der Lage, Disparitäten zu entdecken, die sich in der Nähe der Fixationsebene befinden. 2.5 Diskussion der präsentierten Modelle und Entwicklung eines Arbeitsmodells Drei Modelle wurden bislang präsentiert, und es steht nun die Frage an, welchem Gesamtmodell oder welchen Teilaspekten der Vorrang eingeräumt werden soll. Überprüfen wir also zunächst einmal Metzgers Modell. Augenscheinlich fällt auf, daß das Modell auf bestimmten Vorstellungen beruht, die heute nicht mehr zutreffen. So kannte Metzger offensichtlich noch keine Neuronen. Wohl war er sich aber bewußt, daß Informationen in unserem Nervensystem als „Reizströme“, als elektrische Impulse übertragen werden25. In seiner Theorie schematisiert Metzger aber das, was heute in physiologisch abweichender Form anerkannt ist: Der Vereinigungsraum, in dem alle Nerven zusammenlaufen erinnert stark an Ohzawa et al. Der Ansatz entspricht modernen Erkenntnissen, nach denen die Nervenerregungen korrespondierender Bildpunkte an ein bestimmtes Neuron („Simple Cell“)26 laufen. Und selbst die im Phasenmodell beschriebene Verbindung breitenabweichender Retinapunkte (über rezeptive Felder) ist von Metzger durch die vielfältigen Überkreuzungen implementiert. Auch die Erkenntnis, daß sich nur die Kontrastlinien vereinigen, ist heute gültig. 23 Ohzawa, Izumi: a.a.O. S.37 24 Ohzawa, Izumi; De Angelis, Gregory; Freeman, Ralph: The neural coding of stereoscopic depth. Berkeley 1997 25 Metzger, Wolfgang: a.a.O. S. 287, 289 26 Ohzawa, Izumi; De Angelis, Gregory; Freeman, Ralph: Encoding of binocular disparity by simple cells in the cat’s visual cortex. In: Journal of Neurophysiology 75 o. O. 1996 S. 1779-1805 9 Metzger weist prinzipiell in die richtige Richtung bei der Erklärung zugrundeliegender Mechanismen der Entschlüsselung binokularer Disparitäten. Allerdings entsprechen seine physiologischen Vorstellungen nicht dem heutigen Wissensstand. Das Feldmodell nach Erich König27 stellt einen weiteren Ansatz zur Erklärung der Wahrnehmung räumlicher Tiefe dar. Diese Theorie ist aber aus mehreren Gründen als nicht zutreffend einzustufen: Zunächst stimmen auch hier die physiologischen Voraussetzungen nicht mit dem aktuellem Erkenntnisstand überein. So läßt sich auch beispielsweise nicht erklären, wie die von König entworfenen elektrischen Felder ihre Form behalten und sich die Ladung nicht, ähnlich wie in den Platten eines Kondensators, gleichmäßig verteilt. Seine Versuchsergebnisse lassen sich auch als Folge bestimmter Erfahrungswerte erklären, so daß er u. U. keine Erkenntnisse über die Wirkung der Mechanismen zur Entschlüsselung binokularer Disparität gefunden hat. Darüber hinaus widerspricht der heutige physiologische Wissensstand Königs Prinzip von den zusammenhängenden Figuren, die sich „zueinander bewegen“. Die außergewöhnlich erscheinenden Phänomene bei der Betrachtung einer Lücke, wie sie von König geschildert werden (z.B. außerordentlich hell wahrgenommene Gebiete) lassen sich auch als Folge neuronaler Prozesse, ähnlich wie der lateralen Inhibition28 erklären. Ohzawa et al. haben das jüngste Modell entwickelt. Ihr Modell der durch Simple Cells verbundenen Retinapunkte beider Augen läßt sich logisch und sogar praktisch durch gezielte Messungen nachvollziehen. Psychische Einflüsse lassen sich bei ihren Experimenten weitgehend ausschließen. Damit wird Ohzawas Ansatz glaubhaft. Er erinnert aber durchaus an das prinzipielle Modell nach Metzger. Als widerlegt gelten kann dagenen die Feldtheorie nach König. Alle Fragen beantwortet das Phasenmodell nicht. So bleibt zunächst ungeklärt, wie genau Complex Cells Simple Cells zusammenfassen und ob es hier bestimmte Muster gibt, wie wir sie von den RFs auf der Retina (Gabor-Funktion) kennen. Die Anwendung des Phasenmodells deckt nicht alle Phänomene ab. Die maximal erkennbare Disparität an einer bestimmten Stelle ist hier durch die Größe der beiden entsprechenden RFs 27 König, Erich:a.a.O. 28 Bayrhuber, Horst et al.: Linder Biologie. Lehrbuch für die Oberstufe. 20. neubearbeitete Auflage. Hannover. 1989 Die laterale Inhibition ist ein Mechanismus, bei dem nebeneinander liegende Neuronen sich gegenseitig je nach ihrer eigenen Erregung hemmen. Auch beim menschlichem Auge gibt es derartige Verknüpfungen. Durch die gegenseitige Beeinflussung von Bildstellen kommt es so in bestimmten Situationen zum Sehen von schattenartigen „Flecken“. 10 festgelegt29. Um andere Disparitäten zu erfassen, wird die Konvergenz der Augen verändert. Auf die Notwendigkeit von Sakkaden (Blicksprüngen) und den damit verbundenen Konvergenzänderungen gehen auch Burkhard Fischer et al. ein: Schon allein die Tatsache, daß wir nur mit der Fovea (~Gelber Fleck) wirklich scharf sehen und somit erkennen können30, zwingt uns zu ständigen Blicksprüngen, die von den Fixationsphasen des Auges unterbrochen werden. Diese Kette von Vorgängen (Blicksprung-Fixation-Blicksprung) nennt man einen „optomotorischen Zyklus“. Im allgemeinen werden solche Blicksprünge reflexartig abgearbeitet. Auf einen bestimmten Netzhautreiz hin, ausgelöst durch eine optische Veränderung, wird der Reflex initiiert. Das Auge bewegt sich nun auf das Gebiet mit dem verändertem Stimulus zu. Andererseits gibt es auch die willentliche Blicksteuerung, welche die Expreß- (=Reflex-) Sakkaden unterdrückt. Da jedoch in meiner Simulation die Einbeziehung der willentlichen Blicksteuerung nicht zu leisten ist und Expreß-Sakkaden zu chaotischen Blicksprüngen (= Kamerabewegungen) führen würden, kann die Blickbewegung nicht in das Modell einfließen. Da die genaue Vernetzungsart der Complex Cells in der wissenschaftlichen Literatur nicht ausdrücklich vorgestellt wurde, nehme ich an, daß ihre rezeptiven Felder denen der Simple Cells entsprechen. Durch eine derartige Anordnung werden Störfaktoren, wie zufällige, punktuelle Entsprechungen ausgeschaltet. 3. Die Simulation des Phasenmodells nach Ohzawa et al. mit dem Computer 3.1 Die Anpassung an den Computer Nachdem das Modell gefunden wurde, das dem aktuellen Forschungsstand entspricht, geht es an die Umsetzung des Phasenmodells in einer Computersimulation. Zur binokularen Bilderfassung wird in einem Versuchsaufbau ein optisches Stereosystem, bestehend aus zwei selbst modifizierten Videokameras, erstellt. Die parallel erfaßten Bilder beider Kameras werden mit Hilfe von spezieller Software (Framegrabber) in den Computer 29 Die Bündelung der Simple Cells durch Complex Cells erweitert nicht die optimale Disparität, da laut Ohzawa et al. nur Simple Cells gleicher oder ähnlicher Disparität von einer Complex Cell zusammengefaßt werden. 30 Fischer o.J. Seite 3 11 geladen und in einem elektronisch verarbeitbaren Bildformat auf Festplatte gespeichert. Eine von mir eigens entwickelte Software wertet die gespeicherten Bildpaare aus und erstellt dabei eine Simulation der neuronalen Vorgänge. Die Übertragung des Phasenmodells auf den Computer gestaltet sich nicht ohne Schwierigkeiten. Eine wesentliche Aufgabe für den Programmierer ergibt sich aus den Unterschieden in der Organisation des menschlichen Nervensystems und dem Aufbau des Computers. Während beim Menschen viele Neuronen parallel angeordnet sind und unabhängig oder miteinander interagierend bestimmte Funktionen erfüllen, arbeitet der Computer Programme im wesentlichen seriell ab, d.h. Befehle können nicht gleichzeitig, sondern nur hintereinander, ausgeführt werden. Die Schwierigkeit liegt also darin, eine Parallelität zu simulieren. Bedingt durch die Tatsache, daß Aufgaben nacheinander abgearbeitet werden müssen, wird die Verarbeitungsgeschwindigkeit zu einem entscheidendem Faktor. So müssen für einen RFScan eines Bildes mit 160*120 Pixeln (Bildpunkten) bei einer RF-Größe von 40*40 Pixeln allein 6144000 Multiplikationen durchgeführt werden, deren Ergebnisse gespeichert werden müssen. Die hieraus resultierenden langen Rechenzeiten zwingen dazu, den Bereich der Simulation einzuengen. So kann die Veränderung der Phase eines RF über die Zeit des Stimulus nicht berücksichtigt werden31. Die Sakkaden haben sich als sehr notwendig erwiesen, da nach dem Phasenmodell besonders Tiefendifferenzen in der Nähe der Fixationstiefe erkannt werden. Um weit entferntere Tiefen zu erkennen, müssen also die Augen immer wieder neu ausgerichtet werden. Jedoch können die Auslösekritierien für eine Sakkade von dem Phasenmodell nicht erfüllt werden. deshalb kann dieser Bereich in der Simulation auch nicht berücksichtigt werden. Zu beachten sind auch die Gegebenheiten des Kamerasystems, mit dem die Aufnahmen gemacht werden. Es ist anzumerken, daß die Kamerabilder nicht genau dem Reizmuster einer menschlichen Retina gleichen. Zunächst erfassen die Kameras – zur Vereinfachung der Auswertung - nur Schwarzweißbilder. Außerdem haben die resultierenden Bilder nur eine geringe Bildpunktzahl pro Flächeneinheit (=Auflösung), und ein Bildrauschen als Ergebnis eines Rasterungsverfahrens ist zu beobachten. Dennoch sind insgesamt die Voraussetzungen für die Schaffung einer modellgetreuen Simulation gegeben. 31 Was die Ergebnisse wohl nicht verfälschen wird, da die Phasendifferenz der beiden RFs einer Simple Cell ja über die Zeit konstant bleibt. 12 3.2 Das selbst entwickelte Stereosystem Zur Aufnahme von Bildern für die Simulation im Computer ist ein binokulares Kamerasystem, ein Stereosystem, nötig. Literatur speziell zu dieser Thematik gibt es nur wenig. Trapp und Drüe haben in „Ein flexibles binokulares Sehsystem: Konstruktion und Kalibrierung“32 ein Stereosystem vorgestellt. Es zeigt sich allerdings schnell, daß dieses System (Abbildung 1 Anhang A Seite 1) für die schon in Kapitel 3.1 eingeschränkte Simulationsprozedur überdimensioniert ist (z.B. hat das System zehn Freiheitsgrade), und mit den Gesamtkosten von 25.000.- DM33 würde es auch den Kostenrahmen dieser Facharbeit sprengen. Für die Bilderfassung im Rahmen der anstehenden Simulation wird folgendes benötigt: ein binokulares Kamerasystem muß über Möglichkeiten zur Scharfeinstellung verfügen. Der Konvergenzwinkel der Kameras muß einstellbar sein. Die Bilder müssen von der Kamera möglichst direkt in den Computer eingespeist werden können. Das System braucht also vier Freiheitsgrade: 2*Schärfe und 2*Konvergenz. In der folgenden Tabelle 1 Anhang A (S. 2) sind die verwendeten Komponenten aufgelistet. Natürlich wurde noch eine Reihe weiterer Bauteile verwendet, wie z.B. Winkel, AluminiumProfile, Schrauben etc., es ist aber weder möglich noch nötig, genauere Angaben über Typenbezeichnung und Hersteller zu machen. Die Schärfeneinstellungen beider Kameras sind sowohl elektrisch als auch mechanisch vornehmbar. Für die elektrische Einstellung der Bildschärfe war es nötig, eine individuell auf CCD-Chip und Optik abgestimmte Mechanik zu erstellen. Diese beruht im wesentlichen darauf, daß der CCD-Chip auf einem Schlitten montiert ist, der von einem motorisch angetriebenen Schneckengewinde an die Linse heran oder von ihr weg geschoben wird. Die Regulierung des Konvergenzwinkels ist ebenfalls über ein Schneckengewinde realisiert. Hierbei wird die Bewegung des Schlittens durch Hebel auf die drehbar gelagerten Kameras übertragen, so daß der Konvergenzwinkel zu- oder abnimmt. 32 Trapp, R.; Drüe, S.: Ein flexibles binokulares Sehsystem: Konstruktion und Kalibrierung. Paderborn, o. J. 33 Trapp, R.: a.a.O. S. 3 13 3.3 Die selbstentwickelte Software 3.3.1 Die Softwarestruktur In diesem Projekt wird die Auswertung der Bilddaten von selbst entwickelter Software übernommen. Diese Software hat mehrere Aufgaben zu erledigen: Sie muß es dem Benutzer ermöglichen, anhand der Gabor-Funktion RFs mit unterschiedlichen Phasen zu erstellen. Es müssen weitere RF-, Simple Cell- und Complex Cell-Parameter, wie ein Reiz-Schwellwert eingestellt werden können. Selbstverständlich muß die Software die Bilddaten erfassen, Bildscans mit Hilfe der RFs durchführen und die Ergebnisse dieser Scans von Simple Cells und Complex Cells auswerten lassen. Um diese vielfältigen Aufgaben sinnvoll zu gliedern, wurden einzelne Arbeitsschritte in unterschiedliche Programmmodule gepackt (siehe Abbildung 2 Anhang A Seite 2). Eye („Auge“): Dieses Modul erfaßt Bilddaten indirekt (es verwendet als Dateien eingespielte Bilder und greift nicht direkt auf Erfassungsgeräte zu). Außerdem überträgt es die Bilder „auf Anfrage“ an den DisparityDetector (Bildverarbeitung) Der DisparityDetector führt die Simulation der retinalen und cortikalen Vorgänge durch. Er simuliert so RFs von Simple Cells, Simple Cells selber und Complex Cells. Außerdem bietet dieses Modul vielfältige Konfigurationsmöglichkeiten für die unterschiedlichen Teilprozesse. Der DisparityDetector erhält die Bilddaten via TCP/IP von dem Eye/Modul. RF-Constructor (RF-Gestaltung) RF-Constructor dient der Erstellung von Reizsensitivitätskurven retinaler rezeptiver Felder und RFs der Complex Cells. Anhand der Gabor-Funktion können RF-Profile mit beliebiger Phase erstellt werden. Die Software bietet vielfältige Konfigurations- und Überwachungsmöglichkeiten, wie 3D-Ansicht und Histogramm. Im Anhang sind Handbücher für den aktuellen Einstieg in die Software abgebildet. Als Programmiersprache wurde Borland/Inprise Delphi 3.0 verwendet. Hierbei handelt es sich um einen Pascal-Dialekt. Der Compiler erzeugt lauffähige Windows-Programme. 14 Neben den Standard-Komponenten von Delphi benutzte ich auch die Winsocket-Komponente von François Piette, um einen computerübergreifenden Kommunikationskanal zwischen dem „Eye“ und dem „Disparity Detector“ zu schaffen. Die Software setzt eine lauffähige Windows 95/98 Version voraus, die mit 24 Bit RGB-Farben betrieben werden sollte. Um eine schnelle Verarbeitung der Bilder zu gewährleisten, sollte mindestens ein Pentium-Prozessor oder vergleichbar ab 100 Mhz vorhanden sein. 3.3.2 Die Simulation rezeptiver Felder Die Auswirkungen der RFs werden durch den DisparityDetector simuliert. Wesentlich hieran beteiligt ist die Prozedur ScanArea. Eine wesentliche Grundlage ist die Beschaffenheit der Bilder und der RFs. Für die rezeptiven Felder gilt: Da nur Schwarzweißbilder verarbeitet werden, können die einzelnen RF-Punkte Werte zwischen bright-excitatory (127) und dark-excitatory (-127) annehmen. Der Mittelwert null repräsentiert einen neutralen Wert, d.h. Bildpunkte mit Werten um null werden nicht oder nur minimal beachtet. Bei einer RF-Analyse wird mit einer RF-Sensitivitätskarte jede Stelle des zu analysierenden Bildes gescannt. Zunächst werden die RF-Koordinaten relativ zum Bild auf null gesetzt. Bildpunkt für Bildpunkt des RFs wird mit dem entsprechendem Bildpunkt des Halbbildes multipliziert. Einige Beispielrechnungen: Der RF-Punkt hat den Wert 127 (bright-excitatory), der entsprechende Bildpunkt des Kamerabildes hat denselben Wert (hell). Das Ergebnis beträgt 16129, ist also positiv. Es handelt sich hier um eine optimale Reizung. Ähnlich ist es im zweiten Fall: eine dunkel-erregbare Stelle des RF (-127) obliegt einer dunklen Kamerabildstelle (-127). Das Ergebnis ist genauso wie im ersten Fall; auch hier handelt es sich um eine optimale Reizung. Anders ist es im dritten Fall: eine hell-erregbare RF-Stelle (127) wird mit dem entsprechenden Bildpunkt, der dunkel ist (-127) multipliziert. Das Ergebnis ist 127 * (-127) = -16129; es handelt sich nicht um eine optimale Reizung. Es wird also deutlich: je größer das Produkt aus Bildpunkt des RF und Bildpunkt des Kamerabildes, desto größer ist die Deckung, desto optimaler ist der Stimulus an der Bildstelle. Die Teilergebnisse werden addiert und in der Variable „Average“ abgelegt. Nach einem „RF-Scan“ wird diese Variable mit dem vorher festgelegten RF-Schwellwert verglichen: ist „Average“ größer als der Schwellwert, so wird das Ansprechen des RFs an der entsprechenden Bildstelle vermerkt. Dieser Durchlauf wird wiederholt, wobei jedesmal eine weitere Bildstelle überprüft wird. 15 Ist die Prozedur ScanArea beendet, liegt eine RF-Reizkarte vor, die zeigt, an welchen Stellen das gewählte RF-Neuron ein Aktionspotential abgeben würde. Der hier beschriebene Prozeß ist auch im Flußdiagramm in Abbildung 3 Anhang A (Seite 3) dargestellt. Er wird zweimal (jeweils für das rechte und das linke Bild einmal) ausgeführt. Die Ergebnisse werden in getrennten Karten dargestellt. 3.3.3 Informationsverarbeitung durch Simple Cells Nachdem die Prozedur „ScanArea“ Karten für das rechte und das linke Kamerabild erstellt hat, in denen die Aktionspotentiale der jeweiligen RFs vermerkt sind, kann die Wirkung der „Simple-Cells“ nachvollzogen werden (Flußdiagramm hierzu: Abbildung 4, Anhang A Seite 4). Eine Simple Cell nach dem Phasenmodell ist verbunden mit einem RF im rechten und einem RF im linken Auge. Zu einer Erregung kommt es, wenn die bei der Simple Cell eingehenden Reize einen bestimmten Schwellwert überschreiten. Da in meiner Umsetzung schon die Antworten der einzelnen RFs aufgezeichnet wurden (durch „ScanArea“), braucht jetzt nur noch die Reaktion der Simple Cells aufgezeichnet werden. Dies wird in der Prozedur „CompareBitmaps“ getan. Hier werden die korrespondierenden Punkte der beiden RFAntwortkarten miteinander verglichen. Ist auf beiden Karten an der gleichen Stelle ein Aktionspotential vermerkt, so zeichnet das Programm die entsprechende Simple Cell in einer Anwortkarte als „erregt“ ein. 3.3.4 Eliminierung von Störfaktoren auf Basis der Complex Cells Nachdem die Prozedur „ScanArea“ Karten für das rechte und das linke Kamerabild erstellt hat, in denen die Aktionspotentiale der jeweiligen RFs vermerkt sind, kann die Wirkung der „Simple-Cells“ nachvollzogen werden. Eine Simple Cell nach dem Phasenmodell ist verbunden mit einem RF im rechten und einem RF im linken Auge. Zu einer Erregung kommt es, wenn die bei der Simple Cell eingehenden Reize einen bestimmten Schwellwert überschreiten. Da in meiner Umsetzung schon die Antworten der einzelnen RFs aufgezeichnet wurden (durch „ScanArea“), braucht jetzt nur noch die Reaktion der Simple Cells aufgezeichnet werden. 16 Hierzu werden die korrespondierenden Punkte der beiden RF-Antwortkarten miteinander verglichen. Ist auf beiden Karten an der gleichen Stelle ein Aktionspotential vermerkt, so zeichnet das Programm die entsprechende Simple Cell in einer Anwortkarte als „erregt“ ein.. 3.4 Simulation des Phasenmodells 3.4.1 1. Stufe der Simulation, Aufbau der Geräte und Aufzeichnung der Bilder Nachdem der Simulator entwickelt ist, können jetzt Sehsituationen schnell und effizient mit dem Phasenmodell überprüft werden. Um Störeinflüsse zu verringern, wurde die Umgebung der Testobjekte idealisiert: Ein weißer Hintergrund wurde hinter den Testobjekten angebracht, die Grundfläche blieb weitgehend leer. Als Testobjekte dienten zwei vertikal stehende Schrauben. Eine dieser Schrauben wurde auf dem Kamera-Fixationspunkt (auf der Mittelachse zwischen beiden Kameras, 70 cm vor den Geräten) fest angebracht. Eine andere Schraube wurde 2,5 cm links seitlich von dieser positioniert. Im Rahmen der folgende Aufnahmen wurde sie parallel zur Mittelachse vor- und zurückbewegt (s. Abb 5, Anhang A, S. 4.). Nun wurden in mehreren Sequenzen mit den Kameras rechts und links Bilder aufgenommen. Vor jeder Sequenz wurde die linke, nicht fixierte Schraube, in einer anderen Tiefenebene positioniert. Die bei diesem Verfahren gewonnen Bilder wurden von der Simulationssoftware DisparityDetector analysiert. Hierbei wurden fünf RFs mit Phasenverschiebungen von 130°240° verwendet. Diese Werte wurden ausgewählt, da bei höheren oder niedrigeren Phasenverschiebungen ungeeignete RF-Strukturen entstanden wären. (z.B. statt hell-dunkelsensitiven RFs hell-dunkel-hell sensitive RFs). Eine Skizze des Aufbaus ist in Abbildung X. zu sehen. Änderungen an der Mechanik im Sinne der Optimierung sind noch bis zum Kolloquium möglich. 3.4.2 2. Stufe der Simulation. Aufdeckung und Darstellung der räumlichen Disparitäten 17 Die Filterfunktion der RFs wird deutlich, wenn man die Felder in einer Reihe untereinander stellt (Abbildung sieben). Das oberste rezeptive Feld hat eine 130°, die unterste eine 240° Phasenverschiebung. Die dominierenden Regionen, eine stark bright-excitatory und eine stark dark-excitatory-Region, verschieben sich hierdurch in den RFs von rechts nach links. Infolgedessen können wir annehmen, daß sich auch die optimale StimulusPosition in gleicher Weise verschiebt. Nach der Auswertung von vier Simulationsläufen (Anhang A Abb. 6) zeigt sich folgendes: Auf unterschiedliche retinale Disparitäten, d.h. unterschiedliche räumliche Abbildungsdifferenzen, reagieren jeweils andere RF-Paare mit (und somit andere Simple Cells) unterschiedlicher Phasenverschiebung. Die Phasenverschiebung kehrt sich beim Überschreiten der Fixationsebene um. 1,5 cm vor der Fixationsebene beträgt die optimale Phasenverschiebung der RFs links: 130°, rechts: 240°, 1,5 cm hinter der Fixationsebene beträgt sie links: 240°; rechts 130°. Besonders deutlich wird dies in Grafik 1, Anhang A (S. 6), durch die Überkreuzung der beiden Optimale-RF-Phase-Kurven. Eine weitere Feststellung ist, daß die rezeptiven Felder einer bestimmten Größe, trotz Anwendung unterschiedlichster Phasenverschiebungen, nicht mehr an Abb 7: Optimale Phasenverschiebunge n korrespondierenden Stellen ansprechen. Dies ist ab etwa 3 cm vor und hinter der Fixationsebene der Fall. Hier ist der Abstand der rechten und der linken Abbildung eines Gegenstandes zu weit entfernt, so daß die durch die Phasenverschiebung entstandenen Verschiebungen der Subregions diesen Abstand nicht mehr abdecken können. Abhilfe schaffen hier größere RFs. Diese haben jedoch einen Nachteil: Indem sie ein größeres Gebiet abdecken, werden sie auch von mehr Störsignalen wie z.B. Rauschen oder Kontrastlinien im Hintergrund gereizt. Somit zeigt sich in den Simulationsexperimenten deutlich, daß Simple Cells in der Lage sind, mit unterschiedlichen phasenverschobenen RFs ganz bestimmte räumliche Disparitäten aufzudecken. Das Phasenmodell trägt auf diesem Weg zur Erklärung des binokularen Sehens bei. Die im Rahmen dieser Arbeit selbst entwickelte und hier vorgestellte Software ist in der Lage, die Vorgänge nach dem Phasenmodell zu simulieren und visuell darzustellen. 18 4. Schlußteil 4.1 Diskussion der Ergebnisse Das Thema dieser Facharbeit lautet „Raumwahrnehmung beim Menschen: Modellbildung und Simulation.“ Mehrere existierende Modelle wurden auf wissenschaftliche Aktualität und Stimmigkeit hin untersucht. Ein Modell wurde gefunden, das als einziges auf physiologischen Messungen beruht. Besonders in der Simulation hat sich gezeigt, daß dieses Modell beeindruckende Eigenschaften. Das Phasenmodell ist für die Erkennung von Tiefen geeignet, deren Betrag nahe der Fixationstiefe liegen. Hier kann es sehr genaue Informationen über die Tiefenverteilungen liefern. Durch die enge Gebundenheit an die fixierte Tiefe ist es auch möglich, Informationen über das seitliche Ausmaß der fixierten Objekte zu gewinnen (da bei einer Reihe von Objekten – wenn fixiert - die Tiefenposition der verschiedenen sichtbaren Kanten ähnlich sind, und so allesamt durch Simple Cells erkannt werden). Durch die Verwendung rezeptiver Felder werden Störsignale im Bild weitgehend ignoriert, und auch so unregelmäßige Bildmatrizen, wie die des Auges, können als Datenlieferant fungieren. Das Phasenmodell hat sich also als sehr leistungsfähig gezeigt. Es wurde aber auch deutlich, daß das Phasenmodell nicht der einzige Mechanismus sein kann, der die Tiefenwahrnehmung entstehen läßt. Es wird wohl eine Reihe weiterer Prozesse geben, deren Ergebnisse andere Prozesse anregen, und nur gemeinsam betrachtet erzeugen sie eine realitätsnahe Vorstellung der räumlichen Tiefe. Das schmälert allerdings nicht den Wert des Phasenmodells, das sicherlich an der Entstehung der Tiefenwahrnehmung bedeutend beteiligt ist. Diese Arbeit zeigt, daß auf diesem Gebiet der Wissenschaft weite Bereiche noch nicht abschließend erforscht sind: Andere Tiefenwahrnehmungsprozesse bleiben übrig, müssen z.T. erst noch entdeckt werden. Die Verarbeitungsstufe der Complex Cells muß wohl noch weiter erforscht werden. Es stellt sich auch die Frage, was mit den Informationen der Complex Cells geschieht. Gibt es Simple-Cell-ähnliche Strukturen auch bei der Verarbeitung akustischer Reize, z.B. um festzustellen, von welcher Seite ein akustsisches Signal kommt? Im Rahmen dieser Arbeit wurde eine Simulationssoftware entwickelt. Sie ist in der Lage, ausgehend von der Wirklichkeit entsprechenden Bildeindrücken, einen wichtigen Teil der neuralen Vorgänge bei der Bildverarbeitung zu veranschaulichen, und so die Möglichkeiten des Phasenmodells darzustellen. Nur mit dieser Software ist es möglich, die einzelnen Stufen der Verarbeitung mit mathematischen Berechnungen nachzubilden und visuell anschaulich zu 19 machen. Sie bietet darüber hinaus Möglichkeiten zu weiteren Untersuchungen und Experimenten auch auf der Basis von anderem Bildmaterial. Abschließend kann ich also sagen, daß ich im Rahmen meiner Arbeit die sich aus dem Thema stellenden Aufgaben erfolgreich erfüllen konnte. 4.2 Danksagungen Ich danke Prof. Dr. Burckhardt Fischer von der Universität Freiburg für die Unterstützung bei der Literaturrecherche. Weiterhin danke ich Prof. Dr. Izumi Ohzawa von der University of California, Berkley, für die vielen Erklärungen, die er mir zusandte. 5. Verzeichnis der Verwendeten Literatur 1. Fischer, Burckhart; Weber, Heike; Biscaldi, Monica; Gezeck ,Stefan: Aktives Sehen Eine visuomotorische Koordinationsleistung des Gehirns. o.J. o.O. 2. Ohzawa, Izumi; DeAngelis, Gerald; Freeman, Ralph: Encoding of binocular disparity by simple cells in the cat’s visual cortex. In: Journal of Neurophysiology 75 o.O. 1996 S. 1779-1805 3. Ohzawa, Izumi; DeAngelis, Gerald; Freeman, Ralph: The neural coding of stereoscopic depth. Berkeley 1997 4. König, Erich: Experimentelle Beiträge zur Theorie des binokularen Einfach- und Tiefensehens. Bd. 4: Bay, Eberhard; Metzger, Wolfgang; Witte, Wilhelm: Psychologica Universalis. Meisenheim am Glan 1962. 5. Metzger, Wolfgang: Gesetze des Sehens. Frankfurt am Main 1953. 6. Maki, Atsuto; Uhlin, Thomas; Eklundh, Jan-Olof.: Disparity selection in binocular persuit. Stockholm, o. J. 20 7. Klix, Friedhart: Information und Verhalten. Kybernetische Aspekte der organismischen Informationsverarbeitung. Einführung in naturwissenschaftliche Grundlagen der Allgemeinen Psychologie. 8. Trapp, R.; Drüe, S.: Ein flexibles binokulares Sehsystem: Konstruktion und Kalibrierung. Paderborn, o. J. 9. Rausch, Rainer: Netzwerk-Experimente mit TCP/IP. In: Toolbox 2/98. München 1998, S.100-102 10. Bayrhuber, Horst et al..: Linder Biologie. Lehrbuch für die Oberstufe. 20., neubearbeitete Auflage. Hannover, 1989 21