Lernen - Allgemeine I

Lernen und Gedächtnis
Vorlesung
Christian Kaernbach
Teil 1: Lernen
„Automatisches“ Lernen
• Behaviorismus und die Folgen
– Der Mensch als Reiz-Reaktions-System
– Mentale Größen sind
• moderater Behaviorismus:
• radikaler Behaviorismus:
– Klassisches Konditionieren
– Instrumentelles Konditionieren
– Kritik am Behaviorismus
• Implizites Lernen
• Wahrnehmungslernen
• Handlungslernen
nicht erfaßbar
nicht existent
Klassisches Konditionieren
• unkonditionierter Stimulus (US)
– Pawlow: Fleisch
– z. B. Luftstrom gegen Hornhaut
• unkonditionierte Reaktion (UR)
– Pawlow: Speichelbildung
– hier: Lidschlag
• konditionierter Stimulus (CS)
– Pawlow: Klingel
– z. B. Ton
• konditionierte Reaktion (CR)
– Pawlow: Speichelbildung
– hier: Lidschlag
– CR  UR
Klassisches Konditionieren
• Die CR wird schnell gelernt.
– eine CS-US Koppelung kann ausreichen.
• Sie kann zwar „gelöscht“ werden,
– wiederholte Darbietung von CS ohne US.
• aber sie wird nie vergessen.
– bei weiterer CS-US Koppelung:
• Ersparnis
– ohne weitere CS-US Koppelung:
•
•
•
•
spontane Erholung
Kontext (Erneuerung)
US o.ä. (Wiederherstellung)
Relevanz: Stabilität der Phobie
• Gegenkonditionieren
• Clockwork Orange
Stanley Kubrick / Anthony Burgess
Zeitverhältnisse
• simultan
CS
US
• verzögert
CS
• rückwirkend
US
CS
US
Zeitverhältnisse
• simultan
250
CS
US
500
750
• verzögert
CS
US
125
• rückwirkend
CS
US
CR ist antizipatorische Reaktion auf den US
Paßfähigkeit von US und CS
•
Experiment mit Ratten:
–
•
•
US1:
Stromschlag
US2:
Brechreiz
– CS1:
Ton
CS2:
Süßstoff
 CS1+CS2+US1: CR nur bei CS1
 CS1+CS2+US2: CR nur bei CS2
Ein Geschmacksreiz ist ein besserer Prädiktor für Brechreiz
als ein Ton
Ein externer Reiz ist ein besserer Prädiktor für Stromschlag
als ein Geschmack
Neurophysiologie
des klassischen
Konditionierens
•
us1 Mantelrand berühren
us2 Siphon berühren
 ur schwacher Kiemenrückzug
•
US Stromschlag Schwanz
 UR starker Kiemenrückzug
•
CS1 Mantelrand berühren
oder CS2 Siphon berühren
paaren mit US Stromschlag Schwanz
 CR starker Kiemenrückzug
selektiv auf CS1 oder CS2
(CS+ bzw. CS–)
•
Hebb Lernregel (1949)
Klassische Konditionierung:
Was wird gelernt?
• konditionierter „Reflex“?
–
–
–
–
Reflex US  UR
neue Verbindung CS  UR = neuer Reflex?
CS  CR  UR!
gelernt wird nicht CS  CR, sondern CS  US
• UR verhindern: CR wird trotzdem gelernt
• US entwerten (US: Futter bei hungrigen/satten Ratten)
• CS2 mit CS1 paaren, dann CS1 mit US: CR auf CS2
Klassische Konditionierung:
Was wird gelernt?
• Informationswert des CS
– Hauptparameter: Kontiguität P(US|CS)
Wahrscheinlichkeit, daß US auftritt,
wenn CS gegeben wurde
– ebenfalls wichtig: Basisrate P(US|–CS)
Wahrscheinlichkeit, daß US auftritt,
wenn kein CS gegeben wurde
– Informationswert:
Kontingenz P = P(US|CS) – P(US|–CS)
P(US|–CS)
Klassische Konditionierung:
Was wird gelernt?
• Informationswert des CS
– Hauptparameter: Kontiguität P(US|CS)
Wahrscheinlichkeit, daß US auftritt,
wenn CS gegeben wurde
– ebenfalls wichtig: Basisrate P(US|–CS)
Wahrscheinlichkeit, daß US auftritt,
wenn kein CS gegeben wurde
– Informationswert:
Kontingenz P = P(US|CS) – P(US|–CS)
Menschen 
Instrumentelles Konditionieren
• klassisches Konditionieren:
respondentes Verhalten
(Reaktion auf einen Reiz)
• instrumentelles Konditionieren:
operantes Verhalten
zur Herbeiführung
einer Konsequenz
• benötigt: „Verstärker“
nach
Reaktion
geschieht
entfällt
Konsequenz
positiv
negativ
positive
Bestrafung
Verstärkung
Bestrafung
negative
Verstärkung
Instrumentelles Konditionieren
• benötigt: „Verstärker“
nach
Reaktion
geschieht
Konsequenz
positiv
negativ
positive nix positive
Verstärkung Bestrafung
entfällt negative
negative
Bestrafung Verstärkung
• Verstärker  (operationale Def.)
ein Reiz, der die
Auftretenswahrscheinlichkeit
einer Reaktion erhöht
(Skinner, 1938)
Fortfall der Konsequenz
(Verstärker/Strafe) = Löschung
Echogedächtnis bei Tieren
• Wüstenrennmäuse (Kooperation mit Holger Schulze, Magdeburg)
• Naive Tiere (N=21, 4 pro Gruppe):
– shuttle box, go/no-go task
– Periodenlänge 20...100 ms
– 60 EV pro Tag
Trainingsleistung
30
25
20 ms
20
15
40 ms
10
60 ms
80 ms
100 ms
5
0
0
5
10
15
Trainingsdauer [Tage]
• Hochtrainierte Tiere (N=2),
Periode wird bei guter Leistung verlängert:
– 160 Tage Training (9600 EV!)
– maximal 400 ms
20
Zeitverhältnisse, Paßfähigkeit
• CS-US Abstand am besten ca. 500 ms
• R-V Abstand am besten ca. 500 ms
• US und CS müssen paßfähig sein
• R und V müssen paßfähig sein
– instinctive drift (Breland & Breland)
Instrumentelles Lernen:
Was wird gelernt?
• Kontingenzlernen
– kein neues Verhalten
• Wasserman et al. (1993):
– VPn drücken Taste.
– Manchmal geht dann das Licht an:
P(O|R).
– Manchmal geht das Licht auch so an:
P(O|–R).
– Kausalurteil: VPn-Urteile
reflektieren die Größe von
P(O|R) – P(O|–R)
Instrumentelles Lernen:
Was wird gelernt?
• Kontingenzlernen
– kein neues Verhalten
• Wasserman et al. (1993):
– VPn drücken Taste.
– Manchmal geht dann das Licht an:
P(O|R).
– Manchmal geht das Licht auch so an:
P(O|–R).
– Kausalurteil: VPn-Urteile
reflektieren die Größe von
P(O|R) – P(O|–R)
 Ratten
shaping, chaining
• Verstärken erst von Bewegungsansatz,
dann peu à peu von weitergehender Bewegung.
• Separates Einlernen von Teilbewegungen,
dann Verkettung verstärken.
• Dressur
Aberglauben
• Skinner (1948):
– keine Kontingenz
zwischen Reaktion
und Verstärker:
alle 15 s Futter
– Tauben lernen
irrelevante Bewegungsmuster
• Staddon & Simmelhag (1971)
– Replikation von Skinner, aber
gleichförmigeres Verhalten, antizipatorisch
• Brown & Jenkins (1968): “autoshaping”
– in zufälligen Intervallen wird Tastatur beleuchtet, dann kommt Futter
– Tauben picken auf Taste, als ob dadurch das Futter käme
Der Behaviorismus
und die Pädagogik
• Give me a dozen healthy infants, well-formed, and my own specified world
to bring them up in and I'll guarantee to take any one at random and train
him to become any type of specialist I might select--doctor, lawyer, artist,
merchant-chief and, yes, even beggar-man and thief, regardless of his talents,
penchants, tendencies, abilities, vocations, and race of his ancestors.
I am going beyond my facts and I admit it, but so have the advocates of the
contrary and they have been doing it for many thousands of years.
(Watson, Behaviorism, 1924, S.104)
• Denn wir können die Kinder nach unserem Sinne nicht formen;
So wie Gott sie uns gab, so muß man sie haben und lieben,
Sie erziehen aufs beste und jeglichen lassen gewähren.
Denn der eine hat die, die anderen andere Gaben;
Jeder braucht sie, und jeder ist doch nur auf eigene Weise
Gut und glücklich.
(Goethe, Hermann und Dorothea)
Instrumentelles Lernen
aus Sicht der Betroffenen
Ich habe ihn gut dressiert.
Kaum drücke ich den Hebel herunter,
kommt er gerannt und gibt mir eine Nuß.
Implizites Lernen
• findet beiläufig statt
• ohne Aufmerksamkeitszuwendung
• bleibt unbewußt
experimentelle Paradigmen
•
•
•
•
Steuerung komplexer Systeme
Erlernen von versteckten Kovarianzen
Sequenzenlernen
Erlernen einer finite state Grammatik
finite state Grammatik
S
X
S
T
in
X
out
P
P
K
T
•
•
•
•
K
TXS
PKPS
TSSSXXTTTKPS
TXSS
Unbewußtes Lernen
• Ist Wissen, daß in Paradigmen des impliziten
Lernens demonstriert wird, wirklich unbewußt?
• Wie sensitiv ist der Test auf Bewußtheit verglichen
mit dem Test der Fertigkeit?
– Sensitivität kaum vergleichbar
– freier Bericht: z. B. Wissensfragmente
– multiple choice statt freier Bericht
• aber: Aha-Erlebnis bei Befragung vermeiden
– gute Abschätzung der Kausalstärke beim instr. Lernen
• Sind sich klassische konditionierte Ratten
(Kontiguität + Basisrate) ihres Wissens „bewußt“? (mental map)
Wahrnehmungslernen
• Kückensortierer können männliche von
weiblichen Kücken unterscheiden
• bessere Gesichtserkennung für die jeweils
eigene Ethnizität
• Eltern können eineiige Zwillinge
unterscheiden

oft gesehen → besser unterscheidbar
Wahrnehmungslernen
• einfache Unterscheidungsaufgaben
– Tonhöhe (Lautstärke, ...)
• 1 kHz trainiert → 4 kHz nur etwas besser
• mit Aufgabe besseres Lernen, aber auch
ohne Aufgabe Verbesserung
• mehr Kortex für diese Frequenz,
spezifischere rezeptive Felder
– Verniergenauigkeit (Nonius)
• am Ende besser als ein
rezeptives Feld auf der Retina
• generalisiert nicht auf
– andere Orientierung
– anderen Retina-Ort
Wahrnehmungslernen?
• McCollough-Effekt (McCollough, 1965)
– Adaptieren zu bestimmten
Farb-Orientierungs-Kombinationen
Wahrnehmungslernen
• McCollough-Effekt
– „Adaptierung“ von Zellen im visuellen Kortex,
die sowohl auf Farbe als auch auf Orientierung
reagieren
– Unterschied zu klassischen Nachbildern:
lange Persistenz (1 Tag, 1 Woche, 1 Jahr)
– kein klassisches Adaptieren im Sinne von
Ermüden, Habituieren, etc. (das wäre kürzer)
doch Lernen? Rekodierung?
Reprogrammierung?
Wahrnehmungslernen?
• Prismenadaptation
Woher wissen wir,
wo die Dinge sind,
die wir sehen?
?
Wahrnehmung und Handlung
Wahrnehmung als „Bild“
Objekt
Wahrnehmung
Zeichentheorie
Hermann von Helmholtz, 1879
Wahrnehmung ‫ؤ ت و ك‬
‫زظغن‬
Handlung ‫ه ى د ج‬
Korrelationstheorien
Die Wahrnehmung
dient dem Handeln
James J. Gibson, 1979
Experimente mit Prismenbrillen
Fresnelprismen
Wahrnehmung
Handlung
www.prism-adaptation.de
Experimente mit Prismenbrillen
Wahrnehmung
Handlung
Wahrnehmung ‫ؤ ت و ك‬
‫ ز ظ غ ن‬ Adaptation 
Handlung ‫ه ى د ج‬
Wahrnehmung
Handlung
zentrale
Repräsentation
räumlichen
Wissens
räumliches
Wissen
ist „verteilt“
Martin, T.A., et al. (1996). kein Transfer von Unterhandwürfen zu Oberhandwürfen
Kitazawa et al. (1997): kein Transfer von schnellem zu langsamen Zeigebewegungen
Verdacht: Die genaue Bewegungsausführung ist relevant.
Einfluß der Trajektorie
– Touch screen
– Horizontaler Balken als Kinnstütze
dadurch pro Hand zwei Trajektorien
– 72 Teilnehmer,
zufällig in vier Gruppen eingeteilt
– Zielposition zentral (Block 2&4)
oder horizontal randomisiert (Block 1&3)
– Prismenbrille (Block 3)
mit 16.7° horizontaler Verschiebung
(Basis links)
• Block 1 „Eingewöhnung“ mit visuellem Feedback (Licht ist an),
20 Versuche (5 Wiederholungen  4 Trajektorien)
• Block 2 „Vortest“ ohne Feedback (Licht ist aus),
20 Versuche (54)
• Block 3 „Adaptation“ mit Prismenbrille, mit visuellem Feedback,
80 Versuche (801) nur eine Trajektorie wird geübt, 4 Gruppen
• Block 4 „Nachtest“ ohne Feedback,
20 Versuche (54)
Ergebnisse
Block 4 minus Block 2
µ = 3 ± 1.8 mm
µ = 1 ± 1.7 mm
30
20
10
0
-80 -60 -40 -20 0
µ = -46 ± 2.2 mm
µ = -26 ± 2.3 mm
30
20
10
0
-80 -60 -40 -20 0
PHST
PHAT
20 40 60
AHST
AHAT
20 40 60
Horizontalfehler [mm]
Horizontalfehler [mm]
PH Passive Hand
AH Aktive Hand
Dynamik
1
Horizontalfehler [mm]
Horizontalfehler [mm]
Passive Hand:
Block 4 vs. Block 2
2
3
0
-10
-20
-30
-40
AHAT
AHST
Linear
(AHST)
Linear
(AHAT)
-50
-60
Durchgang
ST Selbe Trajektorie
AT Andere Trajektorie
4
5
Ergebnisse
vertraute / unvertraute Bewegungen
über/unter
Händigkeit
2
3
-10
-20
-30
-40
AHAT
AHST
Linear
(AHST)
Linear
(AHAT)
-50
-60
4
5
1
Horizontalfehler [mm]
Horizontalfehler [mm]
1
0
0
-10
2
3
-30
-40
-50
-60
PH Passive Hand
AH Aktive Hand
5
AHAT: B3 o, B4-2 u
AHAT: B3 u, B4-2 o
AHST: B3 o, B4-2 o
AHST: B3 u, B4-2 u
-20
Durchgang
4
Durchgang
1
Horizontalfehler [mm]
Dynamik
0
-10
2
3
4
5
AHAT: B234 dominant
non-pref
AHAT: B234 schwach
AHST: B234 dominant
non-pref
AHST: B234 schwach
-20
-30
-40
-50
-60
Durchgang
ST Selbe Trajektorie
AT Andere Trajektorie
ein erstes Fazit
•
kein Transfer zur passiven Hand
nur ca. 50% Transfer zur jeweils anderen Trajektorie der aktiven Hand
•
Zerfall der Adaptation auch ohne Feedback (aber nur bei Handlung)
ungewohnte Bewegungen werden leichter adaptiert
 Adaptation ist keine Rekalibrierung der visuellen Wahrnehmung
sonst hätte man 100% Transfer auf passive Hand erwarten müssen
und keine vollständige Rekalibrierung der Propriozeption
sonst hätte man 100% Transfer auf andere Trajektorie der aktiven Hand
erwarten müssen.
 Umlernen von Motor Skripts ?
 Einwand: gleiche Startposition, aber leicht verschiedene Endposition,
Endposition der anderen Trajektorie wurde nicht adaptiert.
Weitere Experimente
-90
-80
-60
-51
-30
0
gleich
verschieden
Startposition
Kreisbewegungen einschieben
Nacheffekt [mm]
Nacheffekt [mm]
Abhängigkeit von der Startposition
-90
-60
-59
-49
-30
0
gleich
verschieden
Trajektorie
Weitere Experimente
mit/ohne Gewichtsarmband
Vertikale Generalisierung
-90
-60
-55
-44
-30
0
gleich
verschieden
Gewicht
Nacheffekt [mm]
Nacheffekt [mm]
-90
getestet
-60
hoch
mitte
tief
-30
0
adaptiert hoch
hoch/tief
tief
Weitere Experimente
Dynamik der Adaptation in Block 3
abwechselnd mit/ohne Feedback
/
Terminales Feedback
blind (alt. mit Vollfeedback)
terminales feedback
Horizontaler Fehler [mm]
100
90
80
70
60
50
40
30
20
10
0
0
5
10
15
feedback Anzahl
20
ein zweites Fazit
• Adaptation überträgt sich nicht auf die passive Hand,
und nicht vollständig auf andere Trajektorien der aktiven Hand,
auch bei gleichen Start- und Endpositionen und bei gleichen Trajektorien.
• Adaptation von Zeigebewegungen geschieht vermutlich hauptsächlich
durch Umlernen von Motor Skripts. Handlungslernen
• Es gibt keine zentrale Repräsentation räumlichen Handlungswissens.
Räumliches Handlungswissen ist verteilt.
Knowing where is knowing how to.
• Aber was ist mit unserer phänomenalen Erfahrung?
Diese scheint nicht notwendig für stimulusgetriebene Handlungen (Zeigen,
Greifen)
– blindsight Patient fängt Ball
– Stratton (1897) fährt Fahrrad mit Umkehrbrille
obwohl er die Welt noch auf dem Kopf stehen sieht.
• Wozu ist phänomenale Erfahrung dann gut?
ein spätes Produkt der Evolution, das es uns ermöglicht,
alternative Handlungsschemas durchzuspielen.
Tolman, E.C. (1948). Cognitive maps in rats and men. Psychological Review, 55, 189-208.
Millionenquiz
• Bitte sortieren Sie die folgenden Städte
von West nach Ost (links nach rechts)
–
–
–
–
Mailand
Neapel
Rom
Venedig
Millionenquiz
• Bitte sortieren Sie die folgenden Städte
von West nach Ost (links nach rechts)
–
–
–
–
Mailand:
Venedig:
Rom:
Neapel:
9° 11'
12° 19'
12° 29'
14° 15'
ein zweites Fazit
Zwei Repräsentationen
räumlichen Wissens:
I
II
unbewußt
bewußt
verteilt
einheitlich, zentral
genau
verzerrt
stimulusgetriebene
Handlungen
Planung
Illusion:
Räumliches Wissen ist
bewußt, einheitlich,
zentral, genau, und
dient
Greifhandlungen,
genauso wie Planung
Dissoziation von
Handeln und Wahrnehmung
• Ebbinghaus-Illusion
– Wahrnehmung wird getäuscht
– Greifhandlung erfolgt präzise
– (Befunde nicht unstrittig)
Das sensomotorische Kontrollsystem
ZNS
Feedforward
Controller
motorischer
Plan
motorisches
System
Plankopie
+
–
Fehlersignal
Feedback
Controller
Sensorik
Interne Modelle
ZNS
„inverses Modell“
Feedforward
Controller
motorischer
Plan
motorisches
System
Efferenzkopie
Vorwärtsmodell
(erwartete Sensorik)
+
–
Fehlersignal
Feedback
Controller
Sensorik (Reafferenz)
Literatur zur Handlungssteuerung:
Müsseler/Prinz, Allgemeine Ps.
• Kapitel 6b-3: Neuronale Repräsentationen von Bewegung
– Kortex
• primärer motorischer Kortex, M1 (somatotopisch)
• Assoziationskortex
– Basalganglien
– Kleinhirn
• Kapitel 6c-3: Motorische Wahrnehmungstheorien
– u.a.: Biologische Bewegungen (biological motion)
• nicht lesen: Kapitel 6c-4, Gemeinsame Repräsentationen
für Wahrnehmung und Handlung
• Kapitel 6c-5: Dissoziationen zwischen Wahrnehmung und
Handlung
– hervorzuheben: Abschnitt 6c-5.4: Das Modell von Goodale und Millner
Literatur zur Handlungssteuerung:
Müsseler, Allgemeine Psychologie (2008)
• Kapitel VI 17-3: Neuronale Repräsentationen von Bewegung
• Kapitel VI 18-3: Motorische Wahrnehmungstheorien
• nicht lesen: Kapitel VI 18-4, Gemeinsame Repräsentationen
für Wahrnehmung und Handlung
• Kapitel VI 18-5: Dissoziationen zwischen Wahrnehmung und
Handlung
– hervorzuheben: Abschnitt 18-5.4: Das Modell von Goodale und Millner