WAHRNEHMUNG Wie werden Objekte, Lebewesen etc. erkannt ? Frage der Identität (wahrgenommene Welt-wirkliche Welt) objektive Welt in uns repräsentiert subjektive Repräsentation subjektive Repräsentation = objektive Wirklichkeit ??? Dagegen, z.B.: Wahrnehmungstäuschungen , z.B. Müller-Lyer Dreieckstäuschung Wasserfalltäuschung Bewegung im Film Blinder Fleck Wahrn TEIL 1.ppt 1 Müller-Lyer (1889) 2 3 Poggendorf (1860) 4 Blinder Fleck - z.B. from: Glynn: An anatomy of thought (1999) 5 Trotz der Wahrnehmungstäuschungen: Übereinstimmung zwischen Realität und subjektiver Repräsentation muss hoch sein, sonst wäre Überleben ernstlich gefährdet _____________________________________________________ 6 spezielle Literatur zur Wahrnehmung: Bruce,V., Green, P.R & Georgeson, M.A. .: Visual Perception. 4th ed. Hove and London: Erlbaum, 2003 Schiffman,H.R.: Sensation and Perception: An integrated approach. 5th ed. New York: Wiley, 2000 LINKS: http://www.yorku.ca/eye/ http://Krantzj.hanover.edu/krantz/art/ http://psychlab1.hanover.edu/classes/Sensation/ 7 VORSCHAU (Aus Zeitgründen Beschränkung auf visuelle Wahrnehmung) Entdeckung von Einfachen Signalen 1 (klassische) Psychophysik 2 Signalentdeckungstheorie ( Spada, 2006, Kap.2.3.1) Tiefenwahrnehmung 1 Monokulare Hinweisreize 2 binokulare Hinweisreize 3 Hinweisreize aus der Eigenbewegung 4 Kombination von Hinweisreizen Eysenck & Keane Kap 2 & 3 Erkennen von Objekten 8 Erkennen von Objekten 1 Gestaltpsychologie 2 Mustererkennen ( Pattern Recognition ) 2.1 Schablonentheorien - Template theories 2.2 Merkmalsanalyse - Feature Theories 2.3 Strukturbeschreibung - Structural Description 3 Computationale Theorie der Visuellen Wahrnehmung 3.1 Grundsätzliche Überlegungen zum Wahrnehmungsprozess 3.2 Basisprozesse 3.3 Objekterkennung 9 Ziel Aneignung von Grundwissen zur Wahrnehmung Die wichtigsten theoretischen Ansätze und ihren empirischen Status kennen Erkennen der Komplexität bereits der einfachen Reizwahrnehmung 10 ENTDECKUNG VON EINFACHEN SIGNALEN 1 (KLASSISCHE) PSYCHOPHYSIK Fechner (1860) Elemente der Psychophysik physikalischer Reiz (Stimulus) Sinnessystem Transformierung der Stimulusenergie in neurale Ereignisse Entdeckung des Signales subj. Intensität des wahrgenommenen Stimulus 11 Grundproblem : Verhältnis: physikalische Stimulusintensität - subjektive Empfindung z.B. wahrgenommenes Gewicht wahrgenommene Länge von Strecken wahrgenommene Süsse wahrgenommene Lautstärke subjektiver Geldwert 12 FECHNER: • Wie stark muss ein Reiz sein (über obj. Nullpunkt) , damit er überhaupt wahrgenommen wird? Absolutschwelle – “eben merkliche Empfindung” • Wie gross muss der Mindestunterschied zwischen zwei Reizen sein, damit sie als verschieden wahrgenommen werden? Unterschiedsschwelle - "eben merklicher Unterschied" jnd - just noticeable difference Bestimmung der Schwellenwerte: 3 Methoden Herstellungsmethode (Reize gleich machen) Grenzmethode (auf-absteigende Serien, ab wann) Konstanzmethode (zufällige Abfolge, ja/nein) 13 Hypothese über Verhältnis: physikalische Stimulusintensität - subjektive Empfindung historisch: Fechnersches-Gesetz (Weber-Fechnersches-Gesetz) Aktuell: POWER LAW Stevens (1961) (Potenzgesetz) S = k Ib S ... subj Empfindungsstärke/ subj.Grösse I ... physik. Stimulusintensität /obj. Grösse k ... Konstante b ... Exponent, konstant für: Sinnesdimension Person Exponent b: >, <, oder = 1 14 Beispiel: obj. Geldbetrag - subj.Wert W = aGb mit a=1 und b=0.5: W = G.5 G (obj.Betrag) ( x0.5 = x ) W (subj.Wert) 0 0.00 1 1.00 5 2.24 10 3.16 100 10.00 259 ... 16.09 ... 15 subj. Wert 0.5 8 W=G 7 6 5 4 3 2 1 0 10 20 30 40 obj. Geldbetrag Berechnung von b aus bekannten objektiven und subjektiven Werten 16 Exponent b > 1, b < 1, b = 1 100 b>1 90 80 b=1 70 60 50 40 b<1 30 20 10 0 0 10 20 30 40 50 60 70 80 90 100 (willkürliche Einheiten) 17 Table 2.5 aus: Schiffman (1982): Representative exponents of the power functions relating psychological magnitude to stimulus magnitude Continuum Measured Exponent Stimulus Condition Loudness Loudness Brightness Brightness Smell Smell Taste Taste Temperature Temperature 0.6 0.54 0.33 0.5 0.55 0.6 1.3 1.3 1.0 1.6 Binaural Monaural 5º1 target, dark-adapted eye Very brief flash Coffee Heptane Sucrose, human subjects Salt Cold on arm Warmth on arm 18 Fortsetzung Continuum Measured Exponent Stimulus Condition Vibration Vibration Duration Finger span Pressure on palm Heaviness Force of handgrip Electric shock Tactual roughness Tactual hardness Visual length Visual area 0.95 0.6 1.1 1.3 1.1 1.45 1.7 3.5 1.5 0.8 1.0 0.7 60 Hz on finger 250 Hz on finger White noise stimuli Thickness of blocks Static force on ski Lifted weights Hand dynamometer Current through fingers Rubbing emery cloths Squeezing rubber Projected line Projected square 19 Vorteil der Exponentialfunktion des Power-Laws: Verhältnis zweier Signale, z.B. Verhältnis gedruckter Buchstabe - Papier, bleibt unverändert bei unterschiedlichen Beleuchtungsbedingungen! Beweis siehe Ylmaz (1967) 20 2 SIGNALENTDECKUNGSTHEORIE Swets & Tanner (1961) Überblick: Spada Schiffman Entdeckung eines schwachen Signals (geringe Intensität) Signal vermischt mit Störsignalen (Rauschen) 21 Reaktion des Beobachters nicht nur von Reizintensität abhängig d.h. es gibt keine konstante Schwelle i.S der Psychophysik notwendige UNTERSCHEIDUNG: Beobachter als Sensor Wahrnehmungsschwelle - Beobachter als Entscheider Reaktionsschwelle klassische Psychophysik untersucht nur Reaktionsschwelle 22 Reaktion des Beobachters abhängig von 1 objektive Signalstärke: objektives Verhältnis Signal-Rauschen 2 Beobachter: (1) Sensitivität (Beobachter als Sensor) (2) Erwartung des Beobachter z.B.: heute viele Vögel auf Radarschirm, weil Flugzeit weint mein Kind häufig? ist der Brandalarm so eingestellt, dass er sehr leicht anspricht (3) Bewertung der Konsequenzen Ist das Signal wichtig für mich ist es schlimm, wenn ich es übersehe 23 KONSEQUENZENMATRIX: REAKTION DES BEOBACHTERS STIMULUS SIGNAL (Signal + Rauschen) JA ("Signal vorhanden") NEIN ("Signal NICHT vorhanden") TREFFER (HIT) VERPASSER (MISS) KEIN SIGNAL FALSCHER (nur ALARM Rauschen) KORREKTE VERNEINUNG 24 im Labor: subj Wert der Konsequenzen und Erwartung leicht variierbar Beispiel: Variationen des subj Wertes der Konsequenzen (z.B. durch Geld Belohnung oder Strafe) Reaktion des Beob Ja Nein Signal vorh. Signal nicht vorh. _____________________________________ Signal +5 -5 _____________________________________ kein Signal -5 +5 _____________________________________ 25 Reaktion des Beob Ja Nein Signal vorh. Signal nicht vorh. ____________________________________ Signal +25 -8 ____________________________________ kein Signal -5 +7 ____________________________________ Konsequenzen begünstigen JA-Reaktion 26 Reaktion des Beob Ja Nein Signal vorh. Signal nicht vorh. ____________________________________ Signal +5 -5 ____________________________________ kein Signal -50 +5 ____________________________________ Konsequenzen begünstigen NEIN-Reaktion 27 Generell: Ergebnisse der Signalentdeckungstheorie gut bestätigt: Wahrsch für Signaldetektion (d.h. Reaktion "ja") steigt mit Sensitivität Erwartung: subj Wahrsch für Auftreten Konsequenzen: in Abhängigkeit davon, welche Konsequenz belohnt/bestraft wird Anwendung signalentdeckunstheoretischer Ideen z.B.: Gedächtnispsychologie Diagnostik Rechtssprechung 28 Wichtige Konsequenz der Resultate der Signalentdeckungstheorie Bereits bei elementaren Signalentdeckungsaufgaben: kognitive und motivationale Komponenten Problem: Elementare Signalentdeckungsaufgaben behandeln nur Detail des Wahrnehmungsprozesses. Ihre Untersuchung trägt kaum etwas bei zur Klärung der Frage: Wie werden Objekte, Lebewesen etc. erkannt ? 29 TIEFENWAHRNEHMUNG Relevant für Objekterkennung - von mehreren Faktoren determiniert Netzhautbild allein kann über Form, Lage, Grösse und Entfernung von Gegenständen keine eindeutige Antwort geben. 30 Daher: andere Grundlagen der Raumwahrnehmung notwendig. 3 Typen von Hinweisreizen (cues) für die Wahrnehmung von Tiefe Monokulare Hinweisreize Binokulare Hinweisreize Hinweisreize aus der Eigenbewegung Kombination von Hinweisreizen 31 1 MONOKULARE HINWEISREIZE z.B. Überlappung/Verdeckung Nahe Objekte verdecken oft fernere Objekte. Schattierung Dreidimensionale Formen meist nicht überall gleich beleuchtet. 32 Lineare Perspektive Fluchtpunkt, systematisches Kleinerwerden nach hinten Textur insbes. Gibson (1950) viele Oberflächen haben Feinstruktur (=Textur), z.B.: Fell, Stoff, Rinde, Baumkrone, Gras Elemente der Textur rücken mit wachsender Entfernung näher zusammen & werden kleiner 33 34 relative Grösse 35 2 BINOKULARE HINWEISREIZE optische Achsen der zwei Augen treffen sich im Fixationspunkt Fovea centralis (empfindlichster Bereich in Netzhaut, die meisten Sehzellen, schärfstes Sehen) Augen werden auf Fixationspunkt so eingestellt, dass Bild auf fovea centralis projiziert wird Bilder auf Netzhaut verschieden 36 Konvergenzwinkel verändert sich mit Entfernung zum Fixationspunkt je näher, desto grösser ("Schielen") jedoch: Konvergenzwinkel erlaubt nur sehr grobe Bestimmung der Entfernung (nah-fern) 37 Steropsis Querdisparation (binoculare Parallaxe) Augenabstand ca. 5 - 7.6 cm (beim Menschen) daher: Augen liefern leicht verschiedene Bilder aus dieser Differenz auch Info über Entfernung 38 3 HINWEISREIZE AUS DER EIGENBEWEGUNG Verschiebung Bilder aus verschiedenen Standpunkten liefern räumliche Info (analog zur Querdisparation) optisches Flussmuster / Fliessmuster (Gibson, 1950, 1982) mit Bewegung des Betrachters entstehen Muster von kontinuierlichen Veränderungen (Flussmuster) daraus auch räumliche Info ableitbar Fliessmuster abhängig von 1 Richtung und Geschwindigkeit der Eigenbewegung 2 Lage des Fixationspunktes 3 räumliche Verteilung der Oberflächen relativ zur Blicklinie 39 Eigenbewegung 40 Eigenbewegung 41 Eigenbewegung 42 Eigenbewegung 43 Eigenbewegung 44 KOMBINATION von HINWEISREIZEN Additive Verknüpfung oder Selektion? Experimente von Bruno & Cutting (1988) legen nahe, dass meist additiv verknüpft wird ( hilft, Fehler zu minimieren) 45 ERKENNEN VON OBJEKTEN 1 Gestaltpsychologie 2 Mustererkennen ( Pattern Recognition ) 3 Computationale Theorie der Visuellen Wahrnehmung GESTALTPSYCHOLOGIE ca. 1890-1920 Max Wertheimer, Wolfang Köhler, Kurt Koffka Zwei Phänomene der Wahrnehmung müssen erklärt werden: Formkonstanz Grössenkonstanz Wahrn TEIL 2.ppt 46 Formkonstanz Wahrgenommene Form eines Objektes ändert sich nicht, auch wenn sich Netzhautbild ändert (z.B. bei Änderung des Blickwinkels) Grössenkonstanz Wahrgenommene Grösse eines Objektes ändert sich nicht, auch wenn sich die Grösse des Netzhautbildes ändert (z.B. bei zunehmender Entfernung) Annahme der Gestaltpsychologie: Elementare Reize im Wahrnehmungsfeld werden durch Organisationsgesetze (= Gestaltgesetze) strukturiert. 47 Einige wichtige Regeln: Figur und Grund Im Wahrnehmungsfeld heben sich bestimmte Teile von anderen ab. Teil, der sich mit scharfen Umgrenzungen und bestimmter Form abhebt, ist Figur, der Rest ist Grund. 48 Binnengliederung Übereinandergelegte Figuren werden in der Regel in möglichst einfache Figuren zerlegt 49 Prägnanzprinzip (Prinzip der guten Gestalt) Wichtiges Gliederungsprinzip der Gestalttheorie Wenn mehrere alternative Strukturierungen möglich: es setzt sich diejenige durch, welche die einfachste, einheitlichste, "beste" Gestalt ergibt. 50 Probleme der Gestaltpsychologie • Keine Erklärung, wie natürliche Objekte erkannt werden • Die explizite Annahme (zumind. frühe Gestaltpsych), dass nur Reizkonfiguration für Wahrnehmungsinhalt verantwortlich, nicht haltbar • Für jedes Gestaltgesetz Gegenbeispiele, daher immer neue Annahmen notwendig z.B. Prinzip der Nähe: Reize, die einander nahe sind, werden als zusammengehörig betrachtet . . . . .. .. .. .. 51 . . . . . . . . .. . . . lt. Gesetz der Nähe gehören diese beiden Punkte zusammen, trotzdem werden sie als zu den beiden verschiedenen Balken des Y gehörend wahrgenommen 52 2 MUSTERERKENNEN ( Pattern Recognition ) Hauptsächlich mit zweidimensionalen Stimuli erforscht (z.B.: Buchstaben) Schablonentheorie Merkmalsanalyse Strukturbeschreibung 53 2.1 SCHABLONENTHEORIEN - Template theory Schablone: mentale Kopie des wahrgenommenen Objektes die im LZG gespeichert ist ABC… REAS Schablonen Stimuli 54 Schablonen: ABC… REAS A B REAS REAS 55 Probleme mit Drehung, kursiv, Grösse,... durch Transformation lösbar BKAIF 56 Probleme: unsaubere Buchstaben verkehrte, unvollständige Buchstaben Kontext-Effekte BANK BERN 57 58 Hauptkritik an Schablonenvergleich-Theorie 1 Verzerrungen bei realistischem 3-dimensionalem Input nicht durch einfache Transformation umkehrbar 2 Schablonenvergleich funktioniert nur bei klar isolierten zweidimensionalen Wahrnehmungsobjekten (z.B. Buchstaben auf Papier) 3 Schon bei einfachen zweidimensionalen Stimuli treten Probleme auf, die zeigen, dass die Schablonentheorie nicht stimmen kann 59 2.2 MERKMALSANALYSE - Feature Theories - einzelne Merkmale (z.B.) von Buchstaben analysisert - Mini-Schablonen für einfache geometrische Merkmale z.B.: z.B.: A H 60 Was spricht für die Merkmalsanalyse ? 1 Neurophysiologie neurale Detektoren für Kanten, Striche, etc. ( Hubel & Wiesel, 1963 ) auf höherer Ebene unabhängig von der Lokation auf Retina 2 Fehleranalyse beim Erkennen von Buchstaben Vorhersage von mehr Fehlern je mehr gemeinsame Merkmale z.B. 250 Paare von Buchstaben präsentiert E T E T F I W O 39 Verwechslungen 22 Verwechslungen 3 Verwechslungen 0 Verwechslungen 61 Probleme der Merkmalsanalyse 1 Minischablonen für natürliche Formen? z.B.: Pferd [globale Merkmale (Kopf) unbrauchbar] 2 räumliche Beziehung zwischen Merkmalen unberücksichtigt ( nur Art und Zahl ) A oder 3 3-dimensionale Objekte 62 2.3 STRUKTURBESCHREIBUNG - Structural Description Bruce & Green (1990) Berücksichtigt Relationen zwischen Merkmalen Strukturbeschreibungen aus elementaren Propositionen (Aussagen) Beschreibt Komponenten einer Konfiguration und deren Anordnung 63 z. B.: Strukturbeschreibung eines T Es gibt zwei Teile Ein Teil ist eine horizontale Linie Ein Teil ist eine vertikale Linie Die vertikale Linie trägt die horizontale Die vertikale Linie halbiert die horizontale 64 Probleme der Strukturbeschreibung 1 Strukturbeschreibung für natürliche Formen? 2 3-dimensionale Objekte 65 3 COMPUTATIONALE THEORIE DER VISUELLEN WAHRNEHMUNG Marr, D.: Vision. San Francisco: Freeman, 1982 Zwei fundamentale Probleme der traditionellen Ansätze 1 Keine klare Abgrenzung von Perzeption und Kognition z.B.: Erkennen des Quadrates ist unabhängig von der Art, wie Begrenzung identifiziert wird Begrenzung kann gesehen werden, ohne dass Figur erkannt zu werden braucht d.h. diese Prozesse (Identifikation von Begrenzungen, Erkennen von Formen) sind unabhängig voneinander 66 erkennbar: aaaaaaaaaa a a a a a a a a a a aaaaaaaaaa • Form unabhängig von Begrenzung • Begrenzung unabhängig von Form 67 Zwei fundamentale Probleme der traditionellen Ansätze 2 Keine klare Problemanalyse d.h. es wird nicht spezifiziert, was man durch die Theorie erreichen will welcher Prozess soll erklärt werden welcher Input, welches Ergebnis 68 3.1 GRUNDSÄTZLICHE ÜBERLEGUNGEN ZUM WAHRNEHMUNGSPROZESS Aufgabe des Wahrnehmungsprozesses: Dreidimensionale Wirklichkeit muss aus zweidimensionalem Netzhautbild rekonstruiert werden dabei Schwierigkeiten, z.B. Teile des Gegenstandes können auf Netzhautbild verdeckt sein Gegenstände verschieden scharf Schatten, Spiegelungen, Oberflächenstrukturen, ... 69 Unterscheidung von zwei globalen Verarbeitungsstufen: Basisprozesse (visuelle Perzeption) eher von Sinnesdaten und allgemeinen Verarbeitungsprinzipien bestimmt Prozess der Extraktion von Informationen aus Daten, ohne spezielle Annahmen über wahrgenommene Objekte Eher datengetrieben (bottom-up) Objekterkennung (visuelle Kognition) Prozess der Erkennung Information aus den Basisprozessen mit der im Gedächtnis gespeicherten Information verglichen eher erwartungsgetrieben (top-down), d.h.: spezielle Annahmen und spezielles Wissen über wahrgenommene Objekte einbezogen 70 Annahme Marr’s: Wahrnehmungsprozess beinhaltet eine Serie von Repräsentationen unserer visuellen Umwelt, die zunehmend detailliertere Informationen enthält. bei Marr 3 Haupttypen der Repräsentation: • Erstskizze (Primal sketch) • 2 1/2-D Skizze • Repräsentation in Form eines 3-D Modelles 71 Erstskizze (Primal sketch) 2-dimensionale Beschreibung von Änderungen der Licht-Intensität im visuellen Input, dazu Information über Kanten, Konturen und Flecken beobachterzentriert 2 1/2-D Skizze Beschreibung der sichtbaren Oberflächen, ihre Tiefe (Entfernung) und Orientierung (unter Ausnutzung der Hinweisreize zur Tiefenwahrnehmung) beobachterzentriert Repräsentation in Form eines 3-D Modelles Beschreibt 3-dimensional Form und relative Position von Objekten Unabhängig vom Beobachterstandpunkt! 72 3.3 BASISPROZESSE ERSTSKIZZE (Primal sketch) Roh-Erstskizze (Raw Primal sketch) Information über Lichtintensität Voll-Erstskizze (Full Primal sketch) Linienrepräsentation von Umrissen, Kanten Oft: Änderung der Lichtintensität an Kanten des Objektes aber: z.B. Schatten, Spiegelungen, Textur Daher nur Änderung der Lichtintensität nicht ausreichend 73 Zerlegung der Bildfläche in kleine Elemente: Pixels. Problem: Lichtintensität auf jedem Pixel fluktuiert ständig, dadurch könnte die Roh-Erstskizze verzerrt werden. Lösung: Zusammenfassung (Durchschnitt) der Lichtintensität benachbarter Pixels, das führt aber zur Vergöberung (Verschwimmen - blurring) der Bildauflösung. Daher: Mehrere Analysen des Bildes mit unterschiedlichen Graden von Vergröberung. Information aus diesen mehrfachen Analysen wird zur Roh-Erstskizze verarbeitet. 74 Ergebnis: einfache Elemente wie Kanten, Balken, Flecken, Enden Voll-Erstskizze: Gruppierung derartiger Elemente zu grösseren Einheiten Gruppierungsprinzipien: Nähe Ausrichtung iterativer Prozess 75 nach neueren Ergebnissen: Vermutlich Gruppierung nicht nur im zweidimensionalen Raum Endergebnis der Erstskizze: Linienrepräsentation enthält aber auch irrelevante Linien beobachterzentriert Abbildung (Bild 110 aus Frisby [1979]) 76 77 2 1/2 D-SKIZZE Beschreibung der sichtbaren Oberflächen, ihre Tiefe (Entfernung) und Orientierung Ausgangspunkt: Bild- "Zellen" Jede Zelle entspricht einem Bildausschnitt aus der Sicht des Betrachters Information aus Zellen wird zusammengefasst. Verwendete Information: Tiefeninformation aus monokularen/binokularen Hinweisreizen etc. 2 1/2D-Skizze enthält Information über die sichtbaren Oberflächen beobachterzentriert 78 Siehe Abbildung ( Marr, 1982) 79 2 1/2 D-Skizze ermöglicht nicht Vergleich mit Gedächtnisinhalt: 1 Nur sichtbare Oberflächen repräsentiert 2 Alles nur aus einem speziellen Blickwinkel d.h. alle Distanzen und Orientierungen relativ zum momentanen Blickpunkt Ändert sich Standpunkt des Betrachters, ändert sich auch die Repräsentation 3 Objekte und ihre Teile nicht explizit abgegrenzt 80 Neuropsychologische Hinweise, die als Bestätigung für Annahme einer 2 1/2 D-Skizze interpretiert werden können: Wenn nur Prozess der Konstruktion der 2 1/2 D-Skizze geschädigt: •Patient kann Helligkeitsunterschiede, Bewegung kleiner Objekte erkennen (Leistung der Erstskizze) •Patient kann Objekte mithilfe anderer Sinnesmodalitäten erkennen (z.B. Tasten, Hören) •Patient kann Objekt nur mithilfe visueller Information nicht erkennen Benson & Greenberg (1969) 81 3.4 OBJEKTERKENNUNG Marr (1982) Biederman (1987) Kosslyn et al. (1990) ( Konnektionistische Ansätze ) MARR (1982) , Marr & Nishihara (1978) 3-dim Modell aus Komponenten konstruiert Basiselemente: Zylinder mit Hauptachse Hierarchische Organisation: Grobform+Orientierung Details (Hauptachse des globalen Objektes stimmt oft nicht überein mit Hauptachsen von Details) 3-D Modell wird mit Modellen im Gedächtnis verglichen (dazu Identifikation der Hauptachse notwendig) 82 hierarchische Struktur des menschl Körpers Marr & Nishihara (1978) 83 Orientierung der Hand auf Retina unterschiedlich relative Lage von Hand und Unterarm gleich Orientierung der Hand unterschiedlich bei Bewegung von Schulter und Ellenbogen 84 BIEDERMAN (1987, etc.): Recognition-by-components-theory Objekte aus Basiskomponenten (geons) zusammengesetzt: Block Zylinder Kugel Bogen Keil etc. insgesamt 36 geons (Analogie zu Wörtern aus Lauten) 85 86 Verlauf der Objekt-Erkennung nach Biederman Kanten-Extraktion Identifikation von nichtzufälligen Eigenschaften Zerlegung des Objektes Determination der Geons und ihrer Relationen Vergleich mit Gedächtnisrepräsentationen (Geon-Beschreibungen von Objekten) 87 Zerlegung des Objektes (Parsing of regions of concavity) basiert auf geometrischer Regularität: Wenn Objekt aus zwei Teilen gebildet, an der Verbindgsstelle üblicherweise konkave (nach innen ins Objekt gerichtete) Diskontinuität Baum 88 Detektion von relevanten (nicht-zufälligen) Eigenschaften (Detection of non-accidental properties) Charakteristiken, die aus wechselnden Blickwinkeln unverändert bleiben Werden durch Analyse der Kanten identifiziert: Kurvatur einer Kante Parallele Kanten Kanten mit gemeinsamen Endpunkt Symmetrische Kanten Gerade Kanten Geons aus diesen Invarianten konstruiert Annahme: nicht-zufällige Merkmale in der Repräsentation entsprechen nicht-zufälligen Merkmalen in der Wirklichkeit 89 Warum können Objekte auch unter suboptimalen Bedingungen erkannt werden (schlechte Beleuchtung, Teilverdeckung)? 1 Invariante Merkmale bleiben oft auch unter suboptimalen Bedingungen erhalten 2 Fehlende Teile können ergänzt werden (sofern Konkavität erhalten bleibt) 3 üblicherweise Redundanz 90 Empirischer Status + Biederman, Ju & Clapper (1985): Erkennen auch unvollständiger komplexer Objekte ( 90%) Biederman (1987): Erkennen unvollständiger Objekte schwieriger, wenn Information über Konkavität fehlt. Erkennen von Objekten wird durch Farbe nicht gefördert (nicht einmal dort, wo Farbe wichtig ist - Banane) - Komplexe Objekte werden oft zunächst global verarbeitet (z.B. Kimchi, 1992) (wie bei Marr). Zentrale theoretische Annahmen (derzeit) nicht direkt prüfbar (36 geons). 91 Biederman (1987) intakte Figur Info über Struktur erhalten Info über Struktur nicht erhalten 92 Hauptproblem der Theorien von Marr und Biederman: Behandeln relativ einfache/grobe Erkennungsaufgaben (z.B.: Hund oder Kuh), nicht differenzierte Unterscheidungen (z.B.: bestimmter Schäferhund Rex) Rolle anderer Hinweisreize (ausser den Kanten) noch zu wenig untersucht (z.B. Farbe) Vorteile Bisher einzige Theorie des Objekterkennens auch Kontexteffekte können wenigstens Teilweise erklärt werden (Reihenfolge der Gedächtnissuche), 93