INB - Universität zu Lübeck

Werbung
Prinzipien der
Informationsverarbeitung im
visuellen Cortex
Erhardt Barth
Institut für Neuro- und Bioinformatik
Universität zu Lübeck
INB
1
Übersicht
• Einleitung
• Aus heutiger (und meiner) Sicht
grundlegende Eigenschaften der
visuellen Informationsverarbeitung
• Übersicht OC-relevante Projekte
• Bewußtsein als Kontrollinstanz des Gehirns
(Anregung)
INB
2
Motivation
• Vom biologischen Sehen für das
Rechnersehen lernen
• Technische Systeme an den Menschen
anpassen
INB
3
Methoden der Hirnforschung
• Neurophysiologie, bildgebende Verfahren
– Ganglienzellen der Netzhaut
– Orientierungs-selektive Neurone des primären
visuellen Cortex
• Psychophysik
– hier einige Anregungen zur Selbstbeobachtung
• Mathematische Modelle und Simulationen
– Informationstheorie, Lineare Systemtheorie
– Beispiele nichtlinearer Ansätze (am Rande)
INB
4
Rahmen für interdisziplinäre
Hirnforschung
• Bisher
– Kybernetik
– Neuronale Netze
– Künstliche Intelligenz
– Computational Neuroscience
• Generelle Probleme
– zu viel versprochen
– zu sehr „solution in search of a problem“
INB
5
Computational Neuroscience
• Metaphors and the brain
• Hydraulic and mechanical metaphors (Hippocrates)
• Electronic and optical metaphors (telegraph brain)
• Computational metaphor (widespread today)
„Surprisingly, ..., there remains today no well established
evidence of symbolic manipulation or formal logic rules at
the neurobiological level in animal physiology. ...
INB
We should remember that the enthusiastically embraced
metaphors of each ‘new era’ can become, like their
predecessors, as much the prisonhouse of thought as
they at first appeared to represent its liberation.”
(J. Daugman)
6
Eigenschaften der visuellen
Informationsverarbeitung
•
Verhaltensrelevanz
•
Anpassung an die Umwelt
•
Modularität
•
Lernen, Plastizität und Umorganisation
•
Aktive, selektive Wahrnehmung
INB
7
INB
8
Behavior of a frog
•
A frog hunts on land by vision.
•
He escapes enemies mainly by seeing them.
•
His eyes do not move (but to compensate body motion).
•
He has a uniform retina and no fovea.
•
His choice of food is determined only by size and
movement - he will starve to death surrounded by
food if it is not moving!
•
His sex life is conducted by sound and touch.
•
To escape enemies, he jumps to where it is darker.
9
INB
10
The bug detector
Convexity detectors (type II ganglion cells in the
frogs retina) respond best when a dark object
enters the receptive field, stops and moves
about intermittently thereafter. The response is
not affected if the lightning changes or if the
background is moving. ‘Could one better
describe a system for detecting an accessible
bug?’
INB
11
Interpretations
‘One could say that the right way to view
the visual system was not as doing
information processing but as producing
behavior. Computers process
information, but brains make animals do
the right thing.’ (Anderson)
INB
12
Meeting Jerry Lettvin
(is a great experience ....)
The bug detector is even more complex:
yes
no
yes
less
INB
13
Topological features
INPUT
CON-COFF representation (not further specified)
1.00
INB
-3.00
-1.00
0.00
1.00
are the normalized integral values of CON-CON. When used to
inhibit the CON-COFF representation, they produce the selectivity
reported by Lettvin.
14
visueller Cortex
Optischer Nerv
Auge
INB
15
Bemerkung
Bei Säugetieren, speziell den Primaten,
sind die frühen Verarbeitungsstufen
generischer und werden meistens im
Sinne einer Repräsentation verstanden.
Was aber ist der Sinn von
Repräsentationen?
INB
16
Eigenschaften der visuellen
Informationsverarbeitung
•
Verhaltensrelevanz
•
Anpassung an die Umwelt
•
Modularität
•
Lernen, Plastizität und Umorganisation
•
Aktive, selektive Wahrnehmung
INB
17
Anpassung an die Umwelt
• Inzwischen eine beliebte Sichtweise: die
visuellen Mechanismen entstanden durch
Anpassung an die Statistik der natürlichen
Umgebung.
• Welche Statistik?
• „Klumpenbildung“
• Welche Mechanismen?
• laterale Hemmung, Orientierung, d.h. frühe M.
• Welches Kriterium?
INB
• minimale Entropie, „sparse coding“
18
INB
19
Cornsweet illusion
(Craik-O’Brien effect)
INB
20
Hubel & Wiesel, 1962
INB
21
Information und Entropie
• Information (I)
Nachrichten fk (z.B Helligkeit im Bild)
mit Wahrscheinlichkeiten pk, k=1,…,N
Information:
Ik = − log2 pk
[bit]
• Entropie (H)
N
H = − ∑ pk log 2 pk
[bits / Nachricht]
k =1
INB
(mittlere Information)
22
H gering
H maximal
•1
•0,8
•0,6
•0,4
•0,2
•0
•1
•2
•3
•4
•5
INB
23
Informationstheoretische Analyse
Input
Netzhaut
Cortex
INB
24
Optimal color coding
RGB principal
components
 0.44
0.55 0.71
 −0.77 −0.16 0.61


 0.44 −0.82 0.36
R+G+B
-R-G+B
R-G+B
INB
25
Visual color coding
R+G+B
achromatic channel
R-G+B
red-green channel
R+G-B
yellow-blue c.
The three channels carry different spatial frequencies
INB
26
Eigenschaften der visuellen
Informationsverarbeitung
•
Verhaltensrelevanz
•
Anpassung an die Umwelt
•
Modularität
•
Lernen, Plastizität und Umorganisation
•
Aktive, selektive Wahrnehmung
INB
27
Cortikale Spezialisierung
• Getrennte Verarbeitung von
– Form
– Bewegung
– Farbe
• V1: orientation
• V2: orientation, end-stopping
•.V3: orientation, motion, depth
• V4: mainly color
• MT: mainly motion
INB
28
Tanaka et al., 1991
IT cortex of wake monkeys
INB
29
Sparse coding
• Im Gehirn geht es sehr ruhig zu. d.h. es
sind meistens nur sehr wenige Neurone
aktiv.
• Desto besser es funktioniert, desto ruhiger.
• Neurone sind stark verbunden jedoch dienen die
meisten Interaktionen eher dem „Niederbügeln“
der Aktivität, d.h. dem „sparse coding“.
INB
30
An intermediate conclusion
• “Efficient coding of information is a
central problem of the sensory system. At
progressively higher levels in the sensory
pathway information about the physical
stimulus is more abstract and is
represented by progressively fewer
active neurons. “ (J. Feldman)
INB
31
Cortical organization: specialized visual areas
Diagram of visual pathway
and different visual areas
(Van Essen et.al.).
Note the massive
connections that are both
feed-forward and feedback (bottom-up and topdown pathways).
INB
32
Eigenschaften der visuellen
Informationsverarbeitung
•
Verhaltensrelevanz
•
Anpassung an die Umwelt
•
Modularität
•
Lernen, Plastizität und Umorganisation
•
Aktive, selektive Wahrnehmung
INB
33
Lernen, Plastizität und
Umorganisation
• Einige nicht behandelte Themen
– „Perceptual learning“
– Gedächtnis
– Zelluläre Mechanismen (LTP)
• Datengetriebene Umorganisation
– Seeing in the sound zone
INB
34
Seeing in the sound zone
Experimente von M. Sur u.a. (MIT):
• Nerven aus der Netzhaut von V1
(visueller Cortex) nach A1 (auditorischer
Cortex) umgeleitet (bei jungen Frettchen)
• A1 zeigt danach Eigenschaften von V1
• Frettchen „sehen“ mit A1
INB
(Lettvins „smellerfrog“)
35
Seeing in the sound zone
Zitate dazu (Merzenich, Nature Vol 404, 2000)
... compelling evidence ... for the exquisite sensitivity
of cortical development to external cues.
A1 territory is taken over by visual input.
... much of what typifies the functional organization of
V1 can be generated within A1 by delivering retinal
inputs to A1.
... the animals ‚see‘ with what was their auditory
cortex.
INB
36
Umorganisation neuronaler
Verbindungen beim Menschen
Ein Beispiel: Kinder mit nur einer Hirnhälfte
verhalten sich später, bei entsprechendem
Training, weitgehend normal.
Generelles Prinzip: vor und nach der Geburt
bilden sich sehr viele neuronale
Verbindungen, die dann im Laufe der Zeit
stark und selektiv abgebaut werden.
Im Alter passiert (leider und glücklicherweise)
davon nicht mehr viel.
INB
37
Eigenschaften der visuellen
Informationsverarbeitung
•
Verhaltensrelevanz
•
Anpassung an die Umwelt
•
Modularität
•
Lernen, Plastizität und Umorganisation
•
Aktive, selektive Wahrnehmung
INB
38
Aktive, selektive Wahrnehmung
• Aktiv im Sinne einer „top-down“
gesteuerten Sensorik
– Hypothesen-getriebene Sensorik
(Animate vision, active vision)
• Aktiv im Sinne einer aktiven
Hypothesenbildung
– Wahrnehmen was erwartet wird
INB
–Wie wird mit resultierenden Fehlern umgegangen?
39
Itap
Seeing as an illusion:
the door experiment
INB
D. Simons, Harvard
40
Basketball count
INB
D. Simons, Harvard
41
Seeing as an illusion:
change blindness
INB
42
Itap
Seeing as an illusion:
change blindness
INB
Demo Kevin O´Regan, Paris.
43
Kontextabhängige Wahrnehmung
INB
Die Tischkanten sind gleich lang, oder?
44
Philosophie der Wahrnehmung
Vorstellung
Anschauung
Empfindung
Erscheinung
cognitive model
active looking, scanpath
physiology
“stuff” (not “things”!)
bottom-up
(I. Kant)
(Larry Stark)
top-down
45
Bewußtsein als Kontrollinstanz
• Heute beliebt: Suche nach NCC (Crick & Koch)
– (neural correlates of consciousness), aber: „There is
no single correlate of conscious vision“.
• Varieties of vision and blindness (P. Stoerig)
– Verschiedene Funktionen des Sehens werden von
verschiedenen Modulen ausgeführt und diese
funktionieren teilweise auch ohne das Ganze.
• Studien mit Patienten (G. Baumgartner)
– Kein Ort im Gehirn, wo alles zusammenläuft!
INB
46
Kinds of blindness
• Absolute blindness
• Legal blindness
• Cortical blindness (no conscious sensation)
• Hemianopia (cortical blindness in one half field)
• Blindsight (what we see when cortically blind)
• Apperceptive agnosia (see only color etc. no objects)
• Associative agnosia (see car but not know what it is for)
INB
• Prosopagnosia (see face but not know who’s it is)
47
Baumgartner Hypothesen
1. Bewußtsein ist ein biologisches
Phänomen und muß daher evolutive
Charakteristika zeigen
2. Bewußtsein wird in der Großhirnrinde
generiert
3. Bewußtsein ist keine Entität
4. Bewußtseinsinhalte sind prinzipiell
neuronal korrelierbar
INB
48
Studien mit Patienten
• „Visual defects after cortical lesions are
strangely different from analog defects
after interruption of the afferent pathways.
While a sudden loss of afferent functions is
instantly realized, a cortical defect may
appear as a peculiar perceptive change,
which cannot be clearly described or may
not be perceived at all and denied.“
• (G. Baumgartner, 1988)
INB
49
Studien mit Patienten
„We conclude ... that the neuronal activity
in different visual areas is related to
different visual percepts and that, after
local destruction, the perception of the
related submodalities disappears as if
they never existed.“
(G. Baumgartner, 1988)
INB
50
OC-relevante Projekte
• LOCOMOTOR
• Modkog/Itap
• OoP
• WakeUp
INB
51
Nonlinear analysis of multidimensional signals:
LOCOMOTOR
INB
LOcal adaptive estimation of
COmplex MOTion and
ORientation patterns
LOCOMOTOR
Frankfurt
Im DFG Schwerpunkt 1114: “Mathematical
methods for time series analysis and digital
image processing”
http://www.math.uni-bremen.de/zetem/DFG-Schwerpunkt/
Heidelberg
Gefördert unter Ba-1176/7
INB
Lübeck
Cicero Mota
52
Intrinsic dimension in 3D
• i0D: constant in all directions:
f (x, y,t) = const.
• i1D: constant in 2 directions:
f (x, y,t) = g(ξ )
• i2D: constant in one direction: f (x, y,t) = g(ξ ,ζ )
• i3D: no constant direction:
f( x, y,t) = g(ξ,ζ ,τ )
INB
53
Natural scenes show occlusions, noisy
data, features at different scales, ...
INB
54
Generierung mehrerer Modelle->
Konfidenzmaße ->
Auswahl des Modells mit höchster Konfidenz
INB
55
Itap
Information technology for
active perception: Itap
Institute for Neuro- and Bioinformatics
University of Lübeck, Germany
Partners:
Allgemeine Psychologie, Giessen (Karl Gegenfurtner)
Sensomotoric Instruments GmbH (SMI), Teltow/Berlin
SIEMENS AG, München
Itap is part of ModKog, a project funded by
INB
56
Itap
Visual communication today:
same image but different messages
INB
Figure by M. Dorr, INB.
57
Itap
Visual communication today
The message that is conveyed by an
image depends very much on the
scan-path,
i.e, the sequence of eye movements that
are used to look at an image.
Visual communication systems, however,
are based on only the classical image
attributes luminance and color.
INB
58
Itap
Itap idea
The scan-path and the active component
of vision should become part of visual
communication systems.
Therefore the scan-path must be
sensed,
processed, and
“displayed“.
INB
59
Itap
Major challenges
Remote, user-friendly eye tracking
Understanding of eye movements
Eye-movement guidance
Development of gaze-contingent interactive
displays (GCIDs)
INB
60
Itap
Applications
• Vision-based communication systems
– will be defined not only by brightness and
color, but will be augmented with a
recommendation of what to see, of how to
view the images.
• Augmented-vision systems
– Attention is directed towards objects or
features that have been detected by a
computer-vision system.
INB
61
Itap
Automotive applications
INB
62
Applications (continued)
• Training systems
– Novices can learn to see with the eyes of experts, e.g.
in radiology or in flight simulators.
• Optimal scan path
– The scan path of an observer can be optimized by a
computer program according to some objective criteria.
• Reading systems
– Itap technology will be used to relax the unnatural scanpath of reading and therefore has the potential of
making GCIDs the reading system of the future.
INB
63
Itap
Summary on Itap
• Itap will improve visual communication by
helping people see what they are meant to
see.
• Itap aims at technology that is active in
the background and helps people
communicate and interact with other
people and with their environments.
INB
64
Car-passenger sensing
• Recognition of seat
occupancy and
head tracking for
airbag control
OoP system
SMI
• Fatigue
measurement
– WakeUp system
INB
65
Intelligent airbags
Problems:
• Deployment
with kids and
OoP (harm)
• Useless
deployment
(cost)
SMI
INB
Solution: video-based control
OoP: Out of Position
66
Intelligent airbags: OoP system
SMI
INB
67
Fatigue and attention measurement
SMI
BMW
INB
WakeUp
68
Herunterladen