zf-lernen-2

Kapitel 6 (6.5 – inkl. 6.7.2)
Evolutionspsychologische Sicht (in Bezug auf artspezifisches Lernen)

wichtig für Verallgemeinerbarkeit der Ergebnisse der Tierexperimente

Erhebliche Verhaltensunterschiede zwischen Tier und Mensch

Biologische Dispositionen bestimmen welche Verhaltensweisen gelernt werden können und
welche Reize dafür Auslöser sind

Seligman: Biologische Dispositionen steuern den Aufbau von Verhaltensweisen in Abhängigkeit
von der jeweiligen Reizsituation → wenn Verhaltensweise in der Evolution in bestimmten
Situationen nützlich, besteht in entsprechender Situation eine hohe biologische Lerndisposition

Allgemein: Verallgemeinerbarkeit von einfachen experimentellen Bedingungen auf komplexere
Situationen im Alltag schwierig, da experimentelle Bedingungen in alltäglichen Situationen oft
nicht mehr eindeutig identifizierbar sind
Klassische Konditionierung – Geschmacksaversion

Garcia und Koelling: Durstigen Ratten wurde aromatisiertes Wasser angeboten
- Trinkvorgang löste Lichtblitze und Lärm aus
- nach dem Trinkvorgang wurde Ratten toxische Substanz injiziert
- Ratten bekamen starke Übelkeit
→ Ratten hatten später starke Geschmacksaversion, aber kaum eine Aversion gegen Lichtblitze
und Lärm
→ Ratten verweigerten aromatisiertes Wasser, tranken aber reines Wasser, auch wenn der
Trinkvorgang von Lichtblitzen und Lärm begleitet war

Aroma des Wassers = neutraler und danach konditionierter Stimulus
toxische Substanz = unkonditionierter Reiz
Übelkeit = unkonditionierte Reaktion
Geschmacksaversion = konditionierte Reaktion
(Obwohl Lichtblitze und Lärm theoretisch genauso gut Auslöser der konditionierten
Reaktion hätten sein können, war das nicht der Fall)
→ nach Seligman: Ratten sind biologisch darauf vorbereitet Übelkeit mit dem Geschmack von
Futter und Trinken zu verbinden und nicht mit visuellen Reizen wie Lichtblitzen

ergänzend ersetzten Garcia et al die toxische Substanz mit einem Elektroschock
→ Wasseraufnahme durch Lichtblitze und Lärm reduziert und nicht durch den Geschmack
→ Verbindung Elektroschock mit visuellen Reizen biologisch unvorbereitet und somit lernbar

Geschmacksaversionen beim Menschen:
- Meiden von Nahrungsmitteln nach deren Genuss Übelkeit auftrat
- Geschmack und Geruch derartiger Nahrungsmittel kann über lange Zeit Ekelempfindungen
auslösen
- derartige Empfindungen kaum willentlich steuerbar
- Wissen um Ungefährlichkeit von entsprechenden Nahrungsmitteln in dem Fall wirkungslos

Geschmacksaversion = biologisch gut vorbereitet
→
- oft genügt eine einzige negative Erfahrung
- die visuellen und akustischen Reize, die zu dem Zeitpunkt vorliegen, zu dem das
Nahrungsmittel Übelkeit auslöst, werden nicht konditioniert
- auch wenn zwischen Übelkeit und Geschmack der Speise Stunden liegen noch Aufbau einer
stabilen konditionierten Reaktion
- Geschmacksaversionen = sehr löschungsresistent

Wilcoxon et al: Artspezifität der Lernvorgänge bei Geschmacksaversionen
- Ratten entwickeln nach Übelkeit Aversion gegenüber aromatisiertem Wasser, nicht aber
gegenüber gefärbtem Wasser (Ratten sind nachtaktiv)
- bei Wachteln ist das umgekehrt (Wachteln sehen sehr gut und sind tagaktiv)

Öhman und Mineka: Auch beim Menschen spielt Evolution eine Rolle
Bsp. Phobien vor Spinnen und Schlangen viel häufiger als vor Autos und Waffen
→ Phobien gemeinsames Resultat einer genetischen Disposition und aversiven Lernerfahrung
Operante Konditionierung

Shettleworth: Untersuchungen an Goldhamstern
- Verstärkung mit Futter
- Verhaltensweisen, deren Auftretenswahrscheinlichkeit durch Verstärkung mit Futter erhöht
werden konnten (z.B. Scharren an der Käfigwand, Graben) zugleich die Verhaltensweisen waren
welche auch ohne Verstärkung häufig bei hungrigen Tieren zu beobachten waren
- Andere Verhaltenweisen wie Gesicht putzen oder Kratzen des Körpers konnten durch Futter
nicht verstärkt werden
→ Erfolg einer Konditionierung hängt davon ab, wie gut die zu erlernende Reaktion mit
artspezifischen Verhaltensmustern in der entsprechenden Situation vereinbar ist

weiterer Beleg hierfür durch Petrinovich und Bolles:
- Ratten lernen leichter in einem T-Labyrinth immer den gleichen Gang zu wählen, wenn sie mit
Wasser statt mit Futter verstärkt werden
- denn eine Ratte wird an einem Ort an dem sie Wasser gefunden hat dort später immer wieder
Wasser finden
- die Nahrung wird aber nicht mehr an dem gleichen Ort sein, wenn sie sie zuvor aufgefressen
hat
Aktives Vermeidungslernen

Bolles: Jede Tierart reagiert mit bestimmten angeborenen Abwehrreaktionen auf bedrohliche
Situationen (artspezifische Abwehrreaktionen)
Bsp. Ratten reagieren auf Elektroschock mit Starrwerden und Zusammenkauern oder fliehen,
Tauben mit Flügelschlagen und hoch Fliegen
→ artspezifische Abwehrreaktionen lassen sich deutlich schneller konditionieren als andere
Reaktionen wie Drücken eines Hebels, um den aversiven Reiz zu vermeiden
Fazit

Lernphänomene = Ergebnis einer Anpassung an die jeweilige Umwelt
→ bestimmte Reizkombinationen für eine Tierart von besonderer Bedeutung
→ für diese Reizkombinationen werden die neuronalen Strukturen ausdifferenziert
→ gute spezifische Diskriminationsfähigkeit und rasches Lernen in diesem Bereich
Lernen aus kognitiver Sicht




Kognitionen wie z.B. Ursachenzuschreibungen, Erwartungen, Vorstellungen
Wichtiger als die Häufigkeit des gemeinsamen Auftretens von Reizen ist für das Lernen der
Informationsgehalt eines Reizes über einen anderen
Lernen ist der Erwerb von flexibel nutzbarem Wissen
dem Lernen liegen zu Grunde: Verstehen von Zusammenhängen, Ursachenzuschreibung etc.
Zielgerichtetes Verhalten nach Ortslernen

Tolman: Kognitive Theorie des Lernens
- Ortslernen = für Tolman das Herausbilden von Wissen über Wege und nicht Aufbau einer
Folge von Reiz-Reaktions-Verbindungen
- Beleg von Tolman hierfür: Ratten lernten im Experiment von A nach B zu schwimmen und
liefen auf dem selben Weg zum Ziel, wenn das Wasser entfernt wurde (→ mit behavioristischer
Auffassung nicht erklärbar)

Tolman und Honzik:
- 3 Wege führten in einem Labyrinth für die Ratte zum Ziel
- Ohne Sperren (Wege konnten versperrt werden) wurde natürlicherweise der kürzeste Weg
(Weg 1) bevorzugt
- Sperre A blockierte nur Weg 1 und Sperre B Weg 1und 2 (Skizze des Labyrinths siehe S. 391,
Abbildung 6.14)
- unabhängig davon an welchen der 3 Wege die Ratten in einem Vortraining gewöhnt wurden
wählten sie bei Sperre B sofort den längsten Weg 3 und probierten nicht noch Weg 2 aus
→ Nach Tolman verhielten die Ratten sich so, als ob sie eine kognitive Landkarte von dem
Labyrinth erworben hätten
→ Ratten hatten nicht Bewegungsfolgen (Reiz-Reaktions-Verknüpfungen) gelernt, sondern
Wege zum Ziel

Rieser et al: Beleg für das Herausbilden einer kognitiven Landkarte bei Menschen
- Vpn lernten den Ort verschiedener Objekte im Raum, indem sie es lernten mit verbundenen
Augen zu diesen Objekten zu laufen
- Vpn konnten von einem Objektstandpunkt den Ort eines anderen Objektes benennen, obwohl
sie immer nur von einem gleichbleibenden Standpunkt zu den Objekten gelaufen waren und nie
von einem Objektstandpunkt zum nächsten

Tolman erklärt die Zielbezogenheit von Verhalten mit der Erwartungstheorie
- Erwartungen = dreigliedrige Einheiten (S – R – S)
- S = Stimulus, R = Reaktion
→ eine Erwartung drückt aus, unter welcher Reizbedingung S welche Reaktion R zu welcher
neuen Reizbedingung S führt
→ es handelt sich also um Wissen, in welchen Situationen welches Verhalten zu welchem Ziel
führt
- Bsp. Rattenexperiment Tolmans:
-Wenn Weg 1 mit Sperre B blockiert (S) und Ratte läuft Weg 3 (R), dann kommt Ratte zum Ziel
mit Futter (S)
- Erwartungen werden durch Erfahrungen mit der Umwelt bestätigt/verstärkt oder widerlegt
- Erwartungen machen Verhalten flexibel und anpassungsfähig, da umfassendes Wissen über
mehrere Lösungswege situationsgerecht eingesetzt werden kann

Kompetenz und Performanz
- Lernen = Kompetenzerwerb, Auswirkung des gelernten im Verhalten = Performanz
- Lernen über Bilden von Erwartungen über Zusammenhänge und Bestätigung/Widerlegen von
Erwartungen
- Erwartungen führen immer dann zu einem Verhalten, wenn das Ziel (S) auch dazu motiviert
Neurobiologische Basis des Ortslernens: der Hippocampus

Hippocampus = größeres Rindengebiet, das sich von der Innenseite des Schläfenlappens bis in
den unteren Bereich der Seitenventrikel erstreckt

O´Keefe: einzelne Neuronen im Hippocampus sind dann aktiv, wenn sich ein Tier an einem
bestimmten Ort aufhält
→ im Hippocampus werden die Ergebnisse des Ortslernens repräsentiert

Morris et al: Defizite beim Ortslernen bei Läsionen des Hippocampus
- Unterschiede zwischen Ratten mit intaktem und mit geschädigtem Hippocampus

Hippocampus hat sehr große Funktion fürs Gedächtnis
- der Hippocampus verknüpft generell gespeicherte Informationen miteinander (so auch beim
Ortslernen → Hippocampus als kognitive Landkarte)

Hippocampus beteiligt an der Speicherung von Kurzzeitgedächtnisinhalten ins
Langzeitgedächtnis
Rolle des Informationsgehalts von Reizen im Lernprozess

Paradigma der konditionierten emotionalen Hemmung
= Möglichkeit, die Stärke einer klassischen Konditionierung anhand der Unterdrückung eines
operant konditionierten Verhaltens zu prüfen
→ weniger die Häufigkeit des gemeinsamen Auftretens eines zu konditionierenden Reizes mit
einem unkonditionierten Reiz ist von Bedeutung, sondern die Rolle des zu lernenden Reizes in
der Informationsverarbeitung
→ ein Reiz kann nur konditioniert werden, wenn er gegenüber anderen schon gelernten Reizen
zusätzliche Information enthält
- diese zusätzliche Information muss zudem verlässlich sein

Aufbau einer konditionierten emotionalen Hemmung:
- zuerst wird bestimmtes durch positive Verstärkung trainiert
- dann erfolgt unabhängig vom Verhalten aversiver Reiz
- dieser aversive Reiz wird durch Hinweisreiz signalisiert
- Erlernen dieses Hinweisreizes = klassische Konditionierung
- Ergebnis des Lernvorgangs = konditionierte emotionale Hemmung
→ der gelernte Reiz unterdrückt in der Folge auch ohne den aversiven Reiz das in der ersten
Phase operant aufgebaute Verhalten

Rescorla:
- hungrige Ratten in Skinner-Box auf Betätigen des Hebels mittels Verstärkung durch Futter
trainiert (= das operant konditionierte Verhalten)
- jeder Ratte wurde je 12mal ein Ton dargeboten (neutraler Stimulus)
- im Zusammenhang mit dem Ton in unterschiedlicher Häufigkeit ein Elektroschock
- aversiver Reiz = unkonditionierter Reiz
- klassisch konditionierter Reiz = Ton
- normalerweise ist der konditionierte Reiz immer mit dem unkonditionierten Reiz gepaart, bei
Rescorla trat der US jedoch auch in Abwesenheit vom CS auf (auch in den Intervallen ohne
Ton)
- trat im Training der elektrische Schlag mit gleicher Wahrscheinlichkeit während des Tons auf
wie außerhalb dieser Intervalle → keine Unterdrückung (Hebel wird von den Ratten gleich oft
während des Tons wie außerhalb des Tonintervalls gedrückt)
- wurde der elektrische Schlag aber häufiger zusammen mit dem Ton gedrückt als ohne →
Unterdrückung des Verhaltens (Hebel drücken) je seltener der Elektroschock ohne den Ton
gegeben worden war
→ Vorhersagbarkeit des US durch den CS und nicht die Häufigkeit der Reizkopplung ist
entscheidend
→ nur Reize, die verlässliche Informationen vermitteln, werden gelernt
- Kamin:
- Ratten in Skinner-Box mit Futter als Verstärkung auf Drücken eines Hebels trainiert
- unabhängig vom Betätigen des Hebels wurden Ratten neutrale Reize dargeboten, gefolgt von
elektrischem Schlag
- als CS wurde neben dem einzelnen Lärmreiz ein zusammengesetzter Reiz verwendet
(gleichzeitig Licht- und Lärmreiz)
- Gruppe A bekam 8x den zusammengesetzten Reiz und danach 16x den Lärmreiz alleine
- Gruppe B bekam 16x den Lärmreiz alleine und danach 8x den zusammengesetzten Reiz
- untersucht wurde, ob der Lichtreiz später alleine zu einer Verhaltensunterdrückung führt
- nur in Gruppe A war das teilweise der Fall, in Gruppe B nicht
→ enthält der neue Reiz keine Information, die über das hinausgeht, was schon aufgrund der
Beachtung anderer Reize bekannt ist, so wird der neue Reiz nicht gelernt (Blockierung)
→ wurde der zusammengesetzte Reiz nach dem einzelnen Lärmreiz gegeben ergab sich kein
Unterdrückungseffekt, weil der Lichtreiz keine weitere Information enthielt
→ nur Reize, die zusätzliche Information vermitteln, werden gelernt

Rescorla und Wagner: Mathematisch-numerisches Modell
- Lerngewinn für einen zu konditionierenden Reiz als Funktion von drei Größen
- a) die Stärke der Konditionierung hängt von Merkmalen des US ab, z.B. von dessen Stärke
- b) die bisher erreichte Konditionierungsstärke → der weitere Lerngewinn ist durch den
Lernzuwachs begrenzt, der noch möglich ist
- c) die Konditionierungsstärke anderer mit dem zu erlernenden Reiz konkurrierenden Reize
Lernen durch Einsicht

Köhler: Forschung an Schimpansen
- um Bananen zu erreichen war es notwendig Stöcke zusammen zu stecken oder Seile wie
Lassos zu werfen
- Köhler beobachtete nach Phasen des Probierens eine Phase der ruhigen Besinnung, bevor die
Problemlösung durch Verbindung einzelner vertrauter Verhaltensweisen erfolgte
- Nach erfolgreicher Problemlösung bereitete den Affen die Wiederholung des Verhaltens keine
Probleme → Einsicht in die Problemlösung → Lernen durch Einsicht
- allerdings ist davon auszugehen, dass die einzelnen Handlungselemente, die von den Affen zur
Problemlösung verknüpft wurden, zuvor durch operante Konditionierung erlernt wurden
→ Zusammenspiel von operanter Konditionierung und Lernen durch Einsicht
Lernen durch Beobachtung

Vorteil des Lernens durch Beobachtung:
- Lernvorgang wird verkürzt
- Handlungskonsequenzen wie Belohnung/Bestrafung können durch Beobachtung erlernt
werden, ohne das Verhalten selbst ausführen zu müssen

Fisher und Hinde: Beobachtungslernen bei Vögeln
- Anfang des 20. Jahrhunderts wurde in einem englischen Dorf erstmals beobachtet, wie Meisen
die Abdeckung von Milchflaschen aufpickten, um so an die Milch zu kommen
→ dieses Verhalten verbreitete sich daraufhin rasch in großen Teilen Großbritanniens
- ein vergleichbares Verhalten war zuvor nirgendwo beobachtet worden
→ Lernen am Modell

Slabbert und Rasa: Beobachtungslernen bei Schäferhunden
- Hundemütter und ihre Welpen
- ein Teil der ausgewachsenen Schäferhunde waren als Drogenspürhunde trainiert (Modelle)
- der andere Teil der ausgewachsenen Hunde war untrainiert
- die Welpen unterschieden sich in der Dauer des Verbleibs bei der Mutter
- je länger die Welpen ihre Mütter beim Drogenaufspüren beobachten konnten, desto bessere
Spürhunde wurden sie selbst

Allgemein: Das Lernen durch Beobachtung wird unterschieden von der Imitation (der reinen
Verhaltensnachahmung, die unmittelbar in der Beobachtungssituation ausgeführt wird)
Imitation als Instinkt

bereits sehr kleine Kinder ahmen Verhaltensmuster nach
→ haben Menschen einen angeborene Imitationsbereitschaft? → nicht belegt
Imitation als Lernen durch operante Konditionierung

Miller und Dollard: Imitation könne mit operanter Konditionierung erklärt werden
- bei der Imitation wirke das Verhalten anderer als Hinweisreiz für die Nachahmungsreaktion
- Imitation = matched-dependent behavior (gleiches voneinander abhängiges Verhalten)
- Bsp. für matched-dependent behavior: großer Bruder hört Schritte des von der Arbeit heim
kommenden Vaters (Schritte = Hinweisreiz) → läuft dem Vater entgegen, weil er weiß, dass der
immer Süßigkeiten (= Verstärkung) mitbringt → kleiner Bruder sieht die Reaktion des großen
Bruders und läuft diesem hinterher (Reaktion des großen Bruders = Hinweisreiz), die
Verstärkung ist für den kleinen Bruder auch die Süßigkeit, der Hinweisreiz jedoch nicht die
Schritte des Vaters, sondern die Reaktion des großen Bruders → Hinweisreiz für den jüngeren
Bruders hängt von der Reaktion des älteren ab → jüngerer Bruder imitiert den älteren Bruder
- Imitation = erworbenes, sekundäres Bedürfnis, um primäres Bedürfnis (z.B. Hunger) zu
befriedigen

Experiment von Miller und Dollard:
- 2 Kinder = Modelle
- andere Kinder beobachteten das Verhalten der Modelle
- 2 Experimentalgruppen: Imitationsbedingung und Gegensätzliche Verhaltensbedingung
- Imitationsbedingung: Kinder wurden für die Imitation des Modells belohnt
- Kinder wurden belohnt, wenn sie das entgegengesetzte Verhalten zeigten
- 2 Schachteln
- Modell nimmt immer ein Bonbon aus einer der beiden Schachteln heraus
- in der Imitationsbedingung werden Kinder verstärkt, wenn sie die gleiche Schachtel öffnen,
die das Modell zuvor geöffnet hatte (sie finden ein weiteres Bonbon in der Schachtel)
- in der Gegenbedingung werden Kinder verstärkt, wenn sie das Verhalten des Modells nicht
imitieren und die andere Schachtel öffnen (sie finden in der anderen Schachtel ein Bonbon)
→ Ergebnis:
- alle Kinder in der Imitationsbedingung wählten dieselbe Schachtel wie das Modell
- in der Gegenbedingung tat dies kein einziges Kind
→ Miller und Dollard: Kinder hätten nur durch entsprechende Verstärkung gelernt, das
Verhalten des Modells zu imitieren

Defizite der Erklärung des Erlernens von Imitation durch operante Konditionierung:
- Erlernen von Imitation durch operante Konditionierung nur dann erklärbar, wenn die Imitation
direkt verstärkt wird
- Imitationsreaktion wird nur dann aufgebaut, wenn die Reaktion vom Nachahmer selbst
ausgeführt wird
→ wahrscheinlich keine Imitation durch stellvertretende Verstärkung (wurde von Miller und
Dollard nicht erwähnt)
- Die Reaktion des Beobachters bleibt abhängig vom Modellverhalten (siehe kleiner Bruder, der
auf die Reaktion des älteren reagiert)
→ nicht erklärt werden kann daher die Übertragung des beobachteten Verhaltens in eine neue
Situation, in der das Modell nicht mehr anwesend ist