Wahrnehmung

Werbung
WAHRNEHMUNG
Wie werden Objekte, Lebewesen etc. erkannt ?
Frage der Identität (wahrgenommene Welt-wirkliche Welt)
objektive Welt in uns repräsentiert  subjektive Repräsentation
subjektive Repräsentation = objektive Wirklichkeit ???
Dagegen, z.B.:
Wahrnehmungstäuschungen , z.B.
Müller-Lyer
Dreieckstäuschung
Wasserfalltäuschung
Bewegung im Film
Blinder Fleck
Wahrn TEIL 1.ppt
1
Müller-Lyer (1889)
2
3
Poggendorf (1860)
4
Blinder Fleck - z.B. from: Glynn: An anatomy of thought (1999)
5
Trotz der Wahrnehmungstäuschungen:
Übereinstimmung zwischen Realität und subjektiver Repräsentation
muss hoch sein, sonst wäre Überleben ernstlich gefährdet
_____________________________________________________
6
spezielle Literatur zur Wahrnehmung:
Bruce,V., Green, P.R & Georgeson, M.A. .: Visual Perception.
4th ed. Hove and London: Erlbaum, 2003
Schiffman,H.R.: Sensation and Perception: An integrated
approach. 5th ed. New York: Wiley, 2000
LINKS:
http://www.yorku.ca/eye/
http://Krantzj.hanover.edu/krantz/art/
http://psychlab1.hanover.edu/classes/Sensation/
7
VORSCHAU
(Aus Zeitgründen Beschränkung auf visuelle Wahrnehmung)
Entdeckung von Einfachen Signalen
1 (klassische) Psychophysik
2 Signalentdeckungstheorie
( Spada, 2006, Kap.2.3.1)
Tiefenwahrnehmung
1 Monokulare Hinweisreize
2 binokulare Hinweisreize
3 Hinweisreize aus der
Eigenbewegung
4 Kombination von Hinweisreizen
Eysenck & Keane
Kap 2 & 3
Erkennen von Objekten
8
Erkennen von Objekten
1 Gestaltpsychologie
2 Mustererkennen ( Pattern Recognition )
2.1 Schablonentheorien - Template theories
2.2 Merkmalsanalyse - Feature Theories
2.3 Strukturbeschreibung - Structural Description
3 Computationale Theorie der Visuellen Wahrnehmung
3.1 Grundsätzliche Überlegungen zum
Wahrnehmungsprozess
3.2 Basisprozesse
3.3 Objekterkennung
9
Ziel

Aneignung von Grundwissen zur Wahrnehmung

Die wichtigsten theoretischen Ansätze und ihren empirischen
Status kennen

Erkennen der Komplexität bereits der einfachen
Reizwahrnehmung
10
ENTDECKUNG VON EINFACHEN SIGNALEN
1 (KLASSISCHE) PSYCHOPHYSIK
Fechner (1860) Elemente der Psychophysik
physikalischer Reiz (Stimulus)

Sinnessystem

Transformierung der Stimulusenergie in
neurale Ereignisse

Entdeckung des Signales
subj. Intensität des wahrgenommenen Stimulus
11
Grundproblem :
Verhältnis:
physikalische Stimulusintensität - subjektive Empfindung
z.B.
wahrgenommenes Gewicht
wahrgenommene Länge von Strecken
wahrgenommene Süsse
wahrgenommene Lautstärke
subjektiver Geldwert
12
FECHNER:
• Wie stark muss ein Reiz sein (über obj. Nullpunkt) , damit er
überhaupt wahrgenommen wird?
Absolutschwelle – “eben merkliche Empfindung”
• Wie gross muss der Mindestunterschied zwischen zwei Reizen
sein, damit sie als verschieden wahrgenommen werden?
Unterschiedsschwelle - "eben merklicher Unterschied"
jnd - just noticeable difference
Bestimmung der Schwellenwerte: 3 Methoden



Herstellungsmethode (Reize gleich machen)
Grenzmethode (auf-absteigende Serien, ab wann)
Konstanzmethode (zufällige Abfolge, ja/nein)
13
Hypothese über Verhältnis:
physikalische Stimulusintensität - subjektive Empfindung
historisch:
Fechnersches-Gesetz (Weber-Fechnersches-Gesetz)
Aktuell:
POWER LAW Stevens (1961)
(Potenzgesetz)
S = k Ib
S ... subj Empfindungsstärke/ subj.Grösse
I ... physik. Stimulusintensität /obj. Grösse
k ... Konstante
b ... Exponent, konstant für: Sinnesdimension
Person
Exponent b:
>, <, oder = 1
14
Beispiel:
obj. Geldbetrag - subj.Wert
W = aGb
mit
a=1 und b=0.5: W = G.5
G (obj.Betrag)
( x0.5 = x )
W (subj.Wert)
0
0.00
1
1.00
5
2.24
10
3.16
100
10.00
259
...
16.09
...
15
subj.
Wert
0.5
8
W=G
7
6
5
4
3
2
1
0
10
20
30
40
obj.
Geldbetrag
Berechnung von b aus bekannten objektiven und subjektiven Werten
16
Exponent b > 1, b < 1, b = 1
100
b>1
90
80
b=1
70
60
50
40
b<1
30
20
10
0
0
10
20
30
40
50 60
70
80
90 100
(willkürliche Einheiten)
17
Table 2.5 aus: Schiffman (1982):
Representative exponents of the power functions relating
psychological magnitude to stimulus magnitude
Continuum
Measured
Exponent
Stimulus Condition
Loudness
Loudness
Brightness
Brightness
Smell
Smell
Taste
Taste
Temperature
Temperature
0.6
0.54
0.33
0.5
0.55
0.6
1.3
1.3
1.0
1.6
Binaural
Monaural
5º1 target, dark-adapted eye
Very brief flash
Coffee
Heptane
Sucrose, human subjects
Salt
Cold on arm
Warmth on arm
18
Fortsetzung
Continuum
Measured
Exponent
Stimulus Condition
Vibration
Vibration
Duration
Finger span
Pressure on palm
Heaviness
Force of handgrip
Electric shock
Tactual roughness
Tactual hardness
Visual length
Visual area
0.95
0.6
1.1
1.3
1.1
1.45
1.7
3.5
1.5
0.8
1.0
0.7
60 Hz on finger
250 Hz on finger
White noise stimuli
Thickness of blocks
Static force on ski
Lifted weights
Hand dynamometer
Current through fingers
Rubbing emery cloths
Squeezing rubber
Projected line
Projected square
19
Vorteil der Exponentialfunktion des Power-Laws:
Verhältnis zweier Signale,
z.B. Verhältnis gedruckter Buchstabe - Papier,
bleibt unverändert bei unterschiedlichen Beleuchtungsbedingungen!
Beweis siehe Ylmaz (1967)
20
2 SIGNALENTDECKUNGSTHEORIE
Swets & Tanner (1961)
Überblick: Spada
Schiffman
Entdeckung eines schwachen Signals (geringe Intensität)
Signal vermischt mit Störsignalen (Rauschen)
21
Reaktion des Beobachters nicht nur von Reizintensität
abhängig
d.h. es gibt keine konstante Schwelle i.S der Psychophysik
notwendige UNTERSCHEIDUNG:
Beobachter
als Sensor

Wahrnehmungsschwelle -
Beobachter
als Entscheider

Reaktionsschwelle
klassische Psychophysik untersucht nur Reaktionsschwelle
22
Reaktion des Beobachters abhängig von
1 objektive Signalstärke:
objektives Verhältnis
Signal-Rauschen
2 Beobachter:
(1) Sensitivität (Beobachter als Sensor)
(2) Erwartung des Beobachter
z.B.: heute viele Vögel auf Radarschirm, weil Flugzeit
weint mein Kind häufig?
ist der Brandalarm so eingestellt,
dass er sehr leicht anspricht
(3) Bewertung der Konsequenzen
Ist das Signal wichtig für mich
ist es schlimm, wenn ich es
übersehe
23
KONSEQUENZENMATRIX:
REAKTION DES BEOBACHTERS
STIMULUS
SIGNAL
(Signal +
Rauschen)
JA
("Signal
vorhanden")
NEIN
("Signal NICHT
vorhanden")
TREFFER
(HIT)
VERPASSER
(MISS)
KEIN SIGNAL FALSCHER
(nur
ALARM
Rauschen)
KORREKTE
VERNEINUNG
24
im Labor:
subj Wert der Konsequenzen und Erwartung
leicht variierbar
Beispiel: Variationen des subj Wertes der Konsequenzen
(z.B. durch Geld Belohnung oder Strafe)
Reaktion des Beob
Ja
Nein
Signal vorh.
Signal nicht vorh.
_____________________________________
Signal
+5
-5
_____________________________________
kein Signal
-5
+5
_____________________________________
25
Reaktion des Beob
Ja
Nein
Signal vorh. Signal nicht vorh.
____________________________________
Signal
+25
-8
____________________________________
kein Signal
-5
+7
____________________________________
Konsequenzen begünstigen JA-Reaktion
26
Reaktion des Beob
Ja
Nein
Signal vorh. Signal nicht vorh.
____________________________________
Signal
+5
-5
____________________________________
kein Signal
-50
+5
____________________________________
Konsequenzen begünstigen NEIN-Reaktion
27
Generell: Ergebnisse der Signalentdeckungstheorie gut
bestätigt:
Wahrsch für Signaldetektion (d.h. Reaktion "ja") steigt mit
Sensitivität
Erwartung: subj Wahrsch für Auftreten
Konsequenzen: in Abhängigkeit davon, welche
Konsequenz belohnt/bestraft wird
Anwendung signalentdeckunstheoretischer Ideen
z.B.:
Gedächtnispsychologie
Diagnostik
Rechtssprechung
28
Wichtige Konsequenz der Resultate der
Signalentdeckungstheorie
Bereits bei elementaren Signalentdeckungsaufgaben:
kognitive und motivationale Komponenten
Problem:
Elementare Signalentdeckungsaufgaben behandeln nur Detail
des Wahrnehmungsprozesses.
Ihre Untersuchung trägt kaum etwas bei zur Klärung der Frage:
Wie werden Objekte, Lebewesen etc. erkannt ?
29
TIEFENWAHRNEHMUNG
Relevant für Objekterkennung - von mehreren Faktoren determiniert
Netzhautbild allein kann über Form,
Lage, Grösse und Entfernung von
Gegenständen keine eindeutige
Antwort geben.
30
Daher: andere Grundlagen der Raumwahrnehmung notwendig.
3 Typen von Hinweisreizen (cues)
für die Wahrnehmung von Tiefe
Monokulare Hinweisreize
Binokulare Hinweisreize
Hinweisreize aus der Eigenbewegung
Kombination von Hinweisreizen
31
1 MONOKULARE HINWEISREIZE
z.B.
Überlappung/Verdeckung
Nahe Objekte verdecken oft
fernere Objekte.
Schattierung
Dreidimensionale Formen meist
nicht überall gleich beleuchtet.
32
Lineare Perspektive
Fluchtpunkt, systematisches
Kleinerwerden nach hinten
Textur
insbes. Gibson (1950)
viele Oberflächen haben
Feinstruktur (=Textur),
z.B.: Fell, Stoff, Rinde,
Baumkrone, Gras
 Elemente der Textur
rücken mit wachsender
Entfernung näher zusammen & werden
kleiner
33
34
relative Grösse
35
2 BINOKULARE HINWEISREIZE
optische Achsen der zwei Augen treffen sich im Fixationspunkt
Fovea centralis
(empfindlichster Bereich in Netzhaut, die meisten Sehzellen,
schärfstes Sehen)
Augen werden auf Fixationspunkt so eingestellt, dass Bild auf
fovea centralis projiziert wird
Bilder auf Netzhaut verschieden
36
Konvergenzwinkel
verändert sich mit
Entfernung zum
Fixationspunkt
je näher, desto grösser
("Schielen")
 jedoch:
Konvergenzwinkel erlaubt
nur sehr grobe
Bestimmung der
Entfernung (nah-fern)
37
Steropsis
Querdisparation
(binoculare Parallaxe)
Augenabstand ca. 5 - 7.6 cm
(beim Menschen)
daher: Augen liefern leicht
verschiedene Bilder
aus dieser Differenz auch
Info über Entfernung
38
3 HINWEISREIZE AUS DER EIGENBEWEGUNG
Verschiebung
Bilder aus verschiedenen Standpunkten liefern räumliche Info
(analog zur Querdisparation)
optisches Flussmuster / Fliessmuster (Gibson, 1950, 1982)
mit Bewegung des Betrachters entstehen Muster von
kontinuierlichen Veränderungen (Flussmuster)
daraus auch räumliche Info ableitbar
Fliessmuster abhängig von
1 Richtung und Geschwindigkeit der Eigenbewegung
2 Lage des Fixationspunktes
3 räumliche Verteilung der Oberflächen relativ zur
Blicklinie
39
Eigenbewegung
40
Eigenbewegung
41
Eigenbewegung
42
Eigenbewegung
43
Eigenbewegung
44
KOMBINATION von HINWEISREIZEN
Additive Verknüpfung oder Selektion?
Experimente von Bruno & Cutting (1988) legen nahe,
dass meist additiv verknüpft wird
( hilft, Fehler zu minimieren)
45
ERKENNEN VON OBJEKTEN
1 Gestaltpsychologie
2 Mustererkennen ( Pattern Recognition )
3 Computationale Theorie der Visuellen Wahrnehmung
GESTALTPSYCHOLOGIE
ca. 1890-1920
Max Wertheimer, Wolfang Köhler, Kurt Koffka
Zwei Phänomene der Wahrnehmung müssen erklärt werden:
Formkonstanz
Grössenkonstanz
Wahrn TEIL 2.ppt
46
Formkonstanz
Wahrgenommene Form eines Objektes ändert sich nicht, auch
wenn sich Netzhautbild ändert
(z.B. bei Änderung des Blickwinkels)
Grössenkonstanz
Wahrgenommene Grösse eines Objektes ändert sich nicht,
auch wenn sich die Grösse des Netzhautbildes ändert
(z.B. bei zunehmender Entfernung)
Annahme der Gestaltpsychologie:
Elementare Reize im Wahrnehmungsfeld werden durch
Organisationsgesetze (= Gestaltgesetze)
strukturiert.
47
Einige wichtige Regeln:
Figur und Grund
Im Wahrnehmungsfeld heben sich bestimmte Teile von anderen ab.
Teil, der sich mit scharfen Umgrenzungen und bestimmter Form
abhebt, ist Figur, der Rest ist Grund.
48
Binnengliederung
Übereinandergelegte Figuren werden in der Regel in möglichst
einfache Figuren zerlegt
49
Prägnanzprinzip
(Prinzip der guten Gestalt)
Wichtiges Gliederungsprinzip der Gestalttheorie
Wenn mehrere alternative Strukturierungen möglich: es setzt sich
diejenige durch, welche die einfachste, einheitlichste, "beste"
Gestalt ergibt.
50
Probleme der Gestaltpsychologie
• Keine Erklärung, wie natürliche Objekte erkannt werden
• Die explizite Annahme (zumind. frühe Gestaltpsych),
dass nur Reizkonfiguration für Wahrnehmungsinhalt
verantwortlich, nicht haltbar
• Für jedes Gestaltgesetz Gegenbeispiele, daher immer
neue Annahmen notwendig
z.B. Prinzip der Nähe:
Reize, die einander nahe sind, werden als zusammengehörig
betrachtet
.
.
.
.
..
..
..
..
51
.
.
.
.
.
.
. .
.. 
.
.
.
lt. Gesetz der Nähe gehören diese
beiden Punkte zusammen,
trotzdem werden sie als zu
den beiden verschiedenen Balken
des Y gehörend wahrgenommen
52
2 MUSTERERKENNEN
( Pattern Recognition )
Hauptsächlich mit zweidimensionalen Stimuli erforscht
(z.B.: Buchstaben)
Schablonentheorie
Merkmalsanalyse
Strukturbeschreibung
53
2.1 SCHABLONENTHEORIEN - Template theory
Schablone: mentale Kopie des wahrgenommenen Objektes
die im LZG gespeichert ist
ABC…
REAS
 Schablonen
 Stimuli
54
Schablonen:
ABC…
REAS
A
B
REAS
REAS
55
Probleme mit Drehung, kursiv, Grösse,...
durch Transformation lösbar
BKAIF
56
Probleme:
unsaubere Buchstaben
verkehrte, unvollständige Buchstaben
Kontext-Effekte
BANK
BERN
57
58
Hauptkritik an Schablonenvergleich-Theorie
1 Verzerrungen bei realistischem 3-dimensionalem Input
nicht durch einfache Transformation umkehrbar
2 Schablonenvergleich funktioniert nur bei klar isolierten
zweidimensionalen Wahrnehmungsobjekten
(z.B. Buchstaben auf Papier)
3 Schon bei einfachen zweidimensionalen Stimuli treten
Probleme auf, die zeigen, dass die Schablonentheorie nicht
stimmen kann
59
2.2 MERKMALSANALYSE - Feature Theories
- einzelne Merkmale (z.B.) von Buchstaben analysisert
- Mini-Schablonen für einfache geometrische Merkmale
z.B.:
z.B.:
A
H
60
Was spricht für die Merkmalsanalyse ?
1 Neurophysiologie
neurale Detektoren für Kanten, Striche, etc.
( Hubel & Wiesel, 1963 )
auf höherer Ebene unabhängig von der Lokation auf Retina
2
Fehleranalyse beim Erkennen von Buchstaben
Vorhersage von mehr Fehlern je mehr gemeinsame Merkmale
z.B. 250 Paare von Buchstaben präsentiert
E
T
E
T
F
I
W
O
39 Verwechslungen
22 Verwechslungen
3 Verwechslungen
0 Verwechslungen
61
Probleme der Merkmalsanalyse
1
Minischablonen für natürliche Formen?
z.B.: Pferd
[globale Merkmale (Kopf) unbrauchbar]
2
räumliche Beziehung zwischen Merkmalen
unberücksichtigt
( nur Art und Zahl )
A oder 
3
3-dimensionale Objekte
62
2.3 STRUKTURBESCHREIBUNG - Structural Description
Bruce & Green (1990)
Berücksichtigt Relationen zwischen Merkmalen
Strukturbeschreibungen aus elementaren Propositionen
(Aussagen)
Beschreibt Komponenten einer Konfiguration und deren
Anordnung
63
z. B.: Strukturbeschreibung eines T
Es gibt zwei Teile
Ein Teil ist eine horizontale Linie
Ein Teil ist eine vertikale Linie
Die vertikale Linie trägt die horizontale
Die vertikale Linie halbiert die horizontale
64
Probleme der Strukturbeschreibung
1
Strukturbeschreibung für natürliche Formen?
2
3-dimensionale Objekte
65
3 COMPUTATIONALE THEORIE DER
VISUELLEN WAHRNEHMUNG
Marr, D.: Vision. San Francisco: Freeman, 1982
Zwei fundamentale Probleme der traditionellen Ansätze
1 Keine klare Abgrenzung von Perzeption und Kognition
z.B.:
Erkennen des Quadrates ist unabhängig von der Art, wie
Begrenzung identifiziert wird
Begrenzung kann gesehen werden, ohne dass Figur erkannt
zu werden braucht
d.h. diese Prozesse (Identifikation von Begrenzungen,
Erkennen von Formen) sind unabhängig voneinander
66
erkennbar:
aaaaaaaaaa
a
a
a
a
a
a
a
a
a
a
aaaaaaaaaa
• Form unabhängig
von Begrenzung
• Begrenzung
unabhängig von
Form












67
Zwei fundamentale Probleme der traditionellen Ansätze
2
Keine klare Problemanalyse
d.h. es wird nicht spezifiziert, was man durch die Theorie
erreichen will
welcher Prozess soll erklärt werden
welcher Input, welches Ergebnis
68
3.1 GRUNDSÄTZLICHE ÜBERLEGUNGEN ZUM
WAHRNEHMUNGSPROZESS
Aufgabe des Wahrnehmungsprozesses:
Dreidimensionale Wirklichkeit muss aus
zweidimensionalem Netzhautbild rekonstruiert werden
 dabei Schwierigkeiten, z.B.
Teile des Gegenstandes können auf Netzhautbild
verdeckt sein
Gegenstände verschieden scharf
Schatten, Spiegelungen, Oberflächenstrukturen, ...
69
Unterscheidung von zwei globalen Verarbeitungsstufen:
 Basisprozesse (visuelle Perzeption)
eher von Sinnesdaten und allgemeinen
Verarbeitungsprinzipien bestimmt
Prozess der Extraktion von Informationen aus Daten,
ohne spezielle Annahmen über wahrgenommene Objekte
Eher datengetrieben (bottom-up)
 Objekterkennung (visuelle Kognition)
Prozess der Erkennung
Information aus den Basisprozessen mit der im Gedächtnis
gespeicherten Information verglichen
eher erwartungsgetrieben (top-down),
d.h.: spezielle Annahmen und spezielles Wissen über
wahrgenommene Objekte einbezogen
70
Annahme Marr’s:
Wahrnehmungsprozess beinhaltet eine Serie von Repräsentationen
unserer visuellen Umwelt, die zunehmend detailliertere
Informationen enthält.
bei Marr 3 Haupttypen der Repräsentation:
• Erstskizze (Primal sketch)
• 2 1/2-D Skizze
• Repräsentation in Form eines 3-D Modelles
71
Erstskizze (Primal sketch)
2-dimensionale Beschreibung von Änderungen der Licht-Intensität
im visuellen Input,
dazu Information über Kanten, Konturen und Flecken
beobachterzentriert
2 1/2-D Skizze
Beschreibung der sichtbaren Oberflächen,
ihre Tiefe (Entfernung) und Orientierung
(unter Ausnutzung der Hinweisreize zur Tiefenwahrnehmung)
beobachterzentriert
Repräsentation in Form eines 3-D Modelles
Beschreibt 3-dimensional Form und relative Position von Objekten
Unabhängig vom Beobachterstandpunkt!
72
3.3 BASISPROZESSE
ERSTSKIZZE (Primal sketch)
Roh-Erstskizze (Raw Primal sketch)
Information über Lichtintensität
Voll-Erstskizze (Full Primal sketch)
Linienrepräsentation von Umrissen, Kanten
Oft: Änderung der Lichtintensität an Kanten des Objektes
aber: z.B. Schatten, Spiegelungen, Textur
Daher nur Änderung der Lichtintensität nicht ausreichend
73
Zerlegung der Bildfläche in kleine Elemente: Pixels.
Problem: Lichtintensität auf jedem Pixel fluktuiert ständig, dadurch
könnte die Roh-Erstskizze verzerrt werden.
Lösung: Zusammenfassung (Durchschnitt) der Lichtintensität
benachbarter Pixels,
das führt aber zur Vergöberung (Verschwimmen - blurring) der
Bildauflösung.
Daher: Mehrere Analysen des Bildes mit unterschiedlichen Graden von
Vergröberung.
Information aus diesen mehrfachen Analysen wird zur
Roh-Erstskizze verarbeitet.
74
Ergebnis: einfache Elemente wie Kanten, Balken, Flecken, Enden
Voll-Erstskizze:
Gruppierung derartiger Elemente zu grösseren Einheiten
Gruppierungsprinzipien:
Nähe
Ausrichtung
iterativer Prozess
75
nach neueren Ergebnissen:
Vermutlich Gruppierung nicht nur im zweidimensionalen Raum
Endergebnis der Erstskizze:
Linienrepräsentation
enthält aber auch irrelevante Linien
beobachterzentriert
Abbildung (Bild 110 aus Frisby [1979])
76
77
2 1/2 D-SKIZZE
Beschreibung der sichtbaren Oberflächen, ihre Tiefe (Entfernung)
und Orientierung
Ausgangspunkt: Bild- "Zellen"
Jede Zelle entspricht einem Bildausschnitt aus der Sicht des
Betrachters
Information aus Zellen wird zusammengefasst.
Verwendete Information:
Tiefeninformation aus monokularen/binokularen Hinweisreizen etc.
2 1/2D-Skizze enthält Information über die sichtbaren Oberflächen
beobachterzentriert
78
Siehe Abbildung ( Marr, 1982)
79
2 1/2 D-Skizze ermöglicht nicht Vergleich mit Gedächtnisinhalt:
1 Nur sichtbare Oberflächen repräsentiert
2 Alles nur aus einem speziellen Blickwinkel
d.h. alle Distanzen und Orientierungen relativ zum momentanen
Blickpunkt
Ändert sich Standpunkt des Betrachters,
ändert sich auch die Repräsentation
3 Objekte und ihre Teile nicht explizit abgegrenzt
80
Neuropsychologische Hinweise, die als Bestätigung für Annahme
einer 2 1/2 D-Skizze interpretiert werden können:
Wenn nur Prozess der Konstruktion der 2 1/2 D-Skizze geschädigt:
•Patient kann Helligkeitsunterschiede, Bewegung kleiner Objekte
erkennen (Leistung der Erstskizze)
•Patient kann Objekte mithilfe anderer Sinnesmodalitäten erkennen
(z.B. Tasten, Hören)
•Patient kann Objekt nur mithilfe visueller Information nicht
erkennen
Benson & Greenberg (1969)
81
3.4 OBJEKTERKENNUNG
Marr (1982)
Biederman (1987)
Kosslyn et al. (1990)
( Konnektionistische Ansätze )
MARR (1982) , Marr & Nishihara (1978)
3-dim Modell aus Komponenten konstruiert
Basiselemente: Zylinder mit Hauptachse
Hierarchische Organisation:
Grobform+Orientierung  Details
(Hauptachse des globalen Objektes stimmt oft
nicht
überein mit Hauptachsen von Details)
3-D Modell wird mit Modellen im Gedächtnis verglichen
(dazu Identifikation der Hauptachse notwendig)
82
hierarchische Struktur des
menschl Körpers
Marr & Nishihara (1978)
83
Orientierung der Hand auf Retina unterschiedlich
relative Lage von Hand und Unterarm gleich
Orientierung der Hand unterschiedlich
bei Bewegung von Schulter und
Ellenbogen
84
BIEDERMAN (1987, etc.):
Recognition-by-components-theory
Objekte aus Basiskomponenten (geons) zusammengesetzt:
Block
Zylinder
Kugel
Bogen
Keil
etc.
insgesamt 36 geons
(Analogie zu Wörtern aus Lauten)
85
86
Verlauf der Objekt-Erkennung nach Biederman
Kanten-Extraktion
Identifikation von nichtzufälligen Eigenschaften
Zerlegung des Objektes
Determination der Geons
und ihrer Relationen
Vergleich mit Gedächtnisrepräsentationen
(Geon-Beschreibungen von Objekten)
87
Zerlegung des Objektes (Parsing of regions of concavity)
basiert auf geometrischer Regularität:
Wenn Objekt aus zwei Teilen gebildet, an der
Verbindgsstelle üblicherweise konkave
(nach innen ins Objekt gerichtete) Diskontinuität
Baum
88
Detektion von relevanten (nicht-zufälligen) Eigenschaften
(Detection of non-accidental properties)
Charakteristiken, die aus wechselnden Blickwinkeln unverändert bleiben
Werden durch Analyse der Kanten identifiziert:
 Kurvatur einer Kante
 Parallele Kanten
 Kanten mit gemeinsamen Endpunkt
 Symmetrische Kanten
 Gerade Kanten
Geons aus diesen Invarianten konstruiert
Annahme: nicht-zufällige Merkmale in der Repräsentation entsprechen
nicht-zufälligen Merkmalen in der Wirklichkeit
89
Warum können Objekte auch unter suboptimalen Bedingungen
erkannt werden (schlechte Beleuchtung, Teilverdeckung)?
1
Invariante Merkmale bleiben oft auch unter suboptimalen
Bedingungen erhalten
2
Fehlende Teile können ergänzt werden
(sofern Konkavität erhalten bleibt)
3
üblicherweise Redundanz
90
Empirischer Status
+ Biederman, Ju & Clapper (1985): Erkennen auch
unvollständiger komplexer Objekte ( 90%)
Biederman (1987): Erkennen unvollständiger Objekte
schwieriger, wenn Information über Konkavität fehlt.
Erkennen von Objekten wird durch Farbe nicht gefördert (nicht
einmal dort, wo Farbe wichtig ist - Banane)
- Komplexe Objekte werden oft zunächst global verarbeitet
(z.B. Kimchi, 1992) (wie bei Marr).
Zentrale theoretische Annahmen (derzeit) nicht direkt prüfbar
(36 geons).
91
Biederman
(1987)
intakte Figur
Info über
Struktur erhalten
Info über Struktur
nicht erhalten
92
Hauptproblem der Theorien von Marr und Biederman:
Behandeln relativ einfache/grobe Erkennungsaufgaben
(z.B.: Hund oder Kuh),
nicht differenzierte Unterscheidungen
(z.B.: bestimmter Schäferhund Rex)
Rolle anderer Hinweisreize (ausser den Kanten) noch zu wenig
untersucht (z.B. Farbe)
Vorteile
Bisher einzige Theorie des Objekterkennens
auch Kontexteffekte können wenigstens Teilweise erklärt werden
(Reihenfolge der Gedächtnissuche),
93
Herunterladen