Kapitel 6 (6.5 – inkl. 6.7.2) Evolutionspsychologische Sicht (in Bezug auf artspezifisches Lernen) wichtig für Verallgemeinerbarkeit der Ergebnisse der Tierexperimente Erhebliche Verhaltensunterschiede zwischen Tier und Mensch Biologische Dispositionen bestimmen welche Verhaltensweisen gelernt werden können und welche Reize dafür Auslöser sind Seligman: Biologische Dispositionen steuern den Aufbau von Verhaltensweisen in Abhängigkeit von der jeweiligen Reizsituation → wenn Verhaltensweise in der Evolution in bestimmten Situationen nützlich, besteht in entsprechender Situation eine hohe biologische Lerndisposition Allgemein: Verallgemeinerbarkeit von einfachen experimentellen Bedingungen auf komplexere Situationen im Alltag schwierig, da experimentelle Bedingungen in alltäglichen Situationen oft nicht mehr eindeutig identifizierbar sind Klassische Konditionierung – Geschmacksaversion Garcia und Koelling: Durstigen Ratten wurde aromatisiertes Wasser angeboten - Trinkvorgang löste Lichtblitze und Lärm aus - nach dem Trinkvorgang wurde Ratten toxische Substanz injiziert - Ratten bekamen starke Übelkeit → Ratten hatten später starke Geschmacksaversion, aber kaum eine Aversion gegen Lichtblitze und Lärm → Ratten verweigerten aromatisiertes Wasser, tranken aber reines Wasser, auch wenn der Trinkvorgang von Lichtblitzen und Lärm begleitet war Aroma des Wassers = neutraler und danach konditionierter Stimulus toxische Substanz = unkonditionierter Reiz Übelkeit = unkonditionierte Reaktion Geschmacksaversion = konditionierte Reaktion (Obwohl Lichtblitze und Lärm theoretisch genauso gut Auslöser der konditionierten Reaktion hätten sein können, war das nicht der Fall) → nach Seligman: Ratten sind biologisch darauf vorbereitet Übelkeit mit dem Geschmack von Futter und Trinken zu verbinden und nicht mit visuellen Reizen wie Lichtblitzen ergänzend ersetzten Garcia et al die toxische Substanz mit einem Elektroschock → Wasseraufnahme durch Lichtblitze und Lärm reduziert und nicht durch den Geschmack → Verbindung Elektroschock mit visuellen Reizen biologisch unvorbereitet und somit lernbar Geschmacksaversionen beim Menschen: - Meiden von Nahrungsmitteln nach deren Genuss Übelkeit auftrat - Geschmack und Geruch derartiger Nahrungsmittel kann über lange Zeit Ekelempfindungen auslösen - derartige Empfindungen kaum willentlich steuerbar - Wissen um Ungefährlichkeit von entsprechenden Nahrungsmitteln in dem Fall wirkungslos Geschmacksaversion = biologisch gut vorbereitet → - oft genügt eine einzige negative Erfahrung - die visuellen und akustischen Reize, die zu dem Zeitpunkt vorliegen, zu dem das Nahrungsmittel Übelkeit auslöst, werden nicht konditioniert - auch wenn zwischen Übelkeit und Geschmack der Speise Stunden liegen noch Aufbau einer stabilen konditionierten Reaktion - Geschmacksaversionen = sehr löschungsresistent Wilcoxon et al: Artspezifität der Lernvorgänge bei Geschmacksaversionen - Ratten entwickeln nach Übelkeit Aversion gegenüber aromatisiertem Wasser, nicht aber gegenüber gefärbtem Wasser (Ratten sind nachtaktiv) - bei Wachteln ist das umgekehrt (Wachteln sehen sehr gut und sind tagaktiv) Öhman und Mineka: Auch beim Menschen spielt Evolution eine Rolle Bsp. Phobien vor Spinnen und Schlangen viel häufiger als vor Autos und Waffen → Phobien gemeinsames Resultat einer genetischen Disposition und aversiven Lernerfahrung Operante Konditionierung Shettleworth: Untersuchungen an Goldhamstern - Verstärkung mit Futter - Verhaltensweisen, deren Auftretenswahrscheinlichkeit durch Verstärkung mit Futter erhöht werden konnten (z.B. Scharren an der Käfigwand, Graben) zugleich die Verhaltensweisen waren welche auch ohne Verstärkung häufig bei hungrigen Tieren zu beobachten waren - Andere Verhaltenweisen wie Gesicht putzen oder Kratzen des Körpers konnten durch Futter nicht verstärkt werden → Erfolg einer Konditionierung hängt davon ab, wie gut die zu erlernende Reaktion mit artspezifischen Verhaltensmustern in der entsprechenden Situation vereinbar ist weiterer Beleg hierfür durch Petrinovich und Bolles: - Ratten lernen leichter in einem T-Labyrinth immer den gleichen Gang zu wählen, wenn sie mit Wasser statt mit Futter verstärkt werden - denn eine Ratte wird an einem Ort an dem sie Wasser gefunden hat dort später immer wieder Wasser finden - die Nahrung wird aber nicht mehr an dem gleichen Ort sein, wenn sie sie zuvor aufgefressen hat Aktives Vermeidungslernen Bolles: Jede Tierart reagiert mit bestimmten angeborenen Abwehrreaktionen auf bedrohliche Situationen (artspezifische Abwehrreaktionen) Bsp. Ratten reagieren auf Elektroschock mit Starrwerden und Zusammenkauern oder fliehen, Tauben mit Flügelschlagen und hoch Fliegen → artspezifische Abwehrreaktionen lassen sich deutlich schneller konditionieren als andere Reaktionen wie Drücken eines Hebels, um den aversiven Reiz zu vermeiden Fazit Lernphänomene = Ergebnis einer Anpassung an die jeweilige Umwelt → bestimmte Reizkombinationen für eine Tierart von besonderer Bedeutung → für diese Reizkombinationen werden die neuronalen Strukturen ausdifferenziert → gute spezifische Diskriminationsfähigkeit und rasches Lernen in diesem Bereich Lernen aus kognitiver Sicht Kognitionen wie z.B. Ursachenzuschreibungen, Erwartungen, Vorstellungen Wichtiger als die Häufigkeit des gemeinsamen Auftretens von Reizen ist für das Lernen der Informationsgehalt eines Reizes über einen anderen Lernen ist der Erwerb von flexibel nutzbarem Wissen dem Lernen liegen zu Grunde: Verstehen von Zusammenhängen, Ursachenzuschreibung etc. Zielgerichtetes Verhalten nach Ortslernen Tolman: Kognitive Theorie des Lernens - Ortslernen = für Tolman das Herausbilden von Wissen über Wege und nicht Aufbau einer Folge von Reiz-Reaktions-Verbindungen - Beleg von Tolman hierfür: Ratten lernten im Experiment von A nach B zu schwimmen und liefen auf dem selben Weg zum Ziel, wenn das Wasser entfernt wurde (→ mit behavioristischer Auffassung nicht erklärbar) Tolman und Honzik: - 3 Wege führten in einem Labyrinth für die Ratte zum Ziel - Ohne Sperren (Wege konnten versperrt werden) wurde natürlicherweise der kürzeste Weg (Weg 1) bevorzugt - Sperre A blockierte nur Weg 1 und Sperre B Weg 1und 2 (Skizze des Labyrinths siehe S. 391, Abbildung 6.14) - unabhängig davon an welchen der 3 Wege die Ratten in einem Vortraining gewöhnt wurden wählten sie bei Sperre B sofort den längsten Weg 3 und probierten nicht noch Weg 2 aus → Nach Tolman verhielten die Ratten sich so, als ob sie eine kognitive Landkarte von dem Labyrinth erworben hätten → Ratten hatten nicht Bewegungsfolgen (Reiz-Reaktions-Verknüpfungen) gelernt, sondern Wege zum Ziel Rieser et al: Beleg für das Herausbilden einer kognitiven Landkarte bei Menschen - Vpn lernten den Ort verschiedener Objekte im Raum, indem sie es lernten mit verbundenen Augen zu diesen Objekten zu laufen - Vpn konnten von einem Objektstandpunkt den Ort eines anderen Objektes benennen, obwohl sie immer nur von einem gleichbleibenden Standpunkt zu den Objekten gelaufen waren und nie von einem Objektstandpunkt zum nächsten Tolman erklärt die Zielbezogenheit von Verhalten mit der Erwartungstheorie - Erwartungen = dreigliedrige Einheiten (S – R – S) - S = Stimulus, R = Reaktion → eine Erwartung drückt aus, unter welcher Reizbedingung S welche Reaktion R zu welcher neuen Reizbedingung S führt → es handelt sich also um Wissen, in welchen Situationen welches Verhalten zu welchem Ziel führt - Bsp. Rattenexperiment Tolmans: -Wenn Weg 1 mit Sperre B blockiert (S) und Ratte läuft Weg 3 (R), dann kommt Ratte zum Ziel mit Futter (S) - Erwartungen werden durch Erfahrungen mit der Umwelt bestätigt/verstärkt oder widerlegt - Erwartungen machen Verhalten flexibel und anpassungsfähig, da umfassendes Wissen über mehrere Lösungswege situationsgerecht eingesetzt werden kann Kompetenz und Performanz - Lernen = Kompetenzerwerb, Auswirkung des gelernten im Verhalten = Performanz - Lernen über Bilden von Erwartungen über Zusammenhänge und Bestätigung/Widerlegen von Erwartungen - Erwartungen führen immer dann zu einem Verhalten, wenn das Ziel (S) auch dazu motiviert Neurobiologische Basis des Ortslernens: der Hippocampus Hippocampus = größeres Rindengebiet, das sich von der Innenseite des Schläfenlappens bis in den unteren Bereich der Seitenventrikel erstreckt O´Keefe: einzelne Neuronen im Hippocampus sind dann aktiv, wenn sich ein Tier an einem bestimmten Ort aufhält → im Hippocampus werden die Ergebnisse des Ortslernens repräsentiert Morris et al: Defizite beim Ortslernen bei Läsionen des Hippocampus - Unterschiede zwischen Ratten mit intaktem und mit geschädigtem Hippocampus Hippocampus hat sehr große Funktion fürs Gedächtnis - der Hippocampus verknüpft generell gespeicherte Informationen miteinander (so auch beim Ortslernen → Hippocampus als kognitive Landkarte) Hippocampus beteiligt an der Speicherung von Kurzzeitgedächtnisinhalten ins Langzeitgedächtnis Rolle des Informationsgehalts von Reizen im Lernprozess Paradigma der konditionierten emotionalen Hemmung = Möglichkeit, die Stärke einer klassischen Konditionierung anhand der Unterdrückung eines operant konditionierten Verhaltens zu prüfen → weniger die Häufigkeit des gemeinsamen Auftretens eines zu konditionierenden Reizes mit einem unkonditionierten Reiz ist von Bedeutung, sondern die Rolle des zu lernenden Reizes in der Informationsverarbeitung → ein Reiz kann nur konditioniert werden, wenn er gegenüber anderen schon gelernten Reizen zusätzliche Information enthält - diese zusätzliche Information muss zudem verlässlich sein Aufbau einer konditionierten emotionalen Hemmung: - zuerst wird bestimmtes durch positive Verstärkung trainiert - dann erfolgt unabhängig vom Verhalten aversiver Reiz - dieser aversive Reiz wird durch Hinweisreiz signalisiert - Erlernen dieses Hinweisreizes = klassische Konditionierung - Ergebnis des Lernvorgangs = konditionierte emotionale Hemmung → der gelernte Reiz unterdrückt in der Folge auch ohne den aversiven Reiz das in der ersten Phase operant aufgebaute Verhalten Rescorla: - hungrige Ratten in Skinner-Box auf Betätigen des Hebels mittels Verstärkung durch Futter trainiert (= das operant konditionierte Verhalten) - jeder Ratte wurde je 12mal ein Ton dargeboten (neutraler Stimulus) - im Zusammenhang mit dem Ton in unterschiedlicher Häufigkeit ein Elektroschock - aversiver Reiz = unkonditionierter Reiz - klassisch konditionierter Reiz = Ton - normalerweise ist der konditionierte Reiz immer mit dem unkonditionierten Reiz gepaart, bei Rescorla trat der US jedoch auch in Abwesenheit vom CS auf (auch in den Intervallen ohne Ton) - trat im Training der elektrische Schlag mit gleicher Wahrscheinlichkeit während des Tons auf wie außerhalb dieser Intervalle → keine Unterdrückung (Hebel wird von den Ratten gleich oft während des Tons wie außerhalb des Tonintervalls gedrückt) - wurde der elektrische Schlag aber häufiger zusammen mit dem Ton gedrückt als ohne → Unterdrückung des Verhaltens (Hebel drücken) je seltener der Elektroschock ohne den Ton gegeben worden war → Vorhersagbarkeit des US durch den CS und nicht die Häufigkeit der Reizkopplung ist entscheidend → nur Reize, die verlässliche Informationen vermitteln, werden gelernt - Kamin: - Ratten in Skinner-Box mit Futter als Verstärkung auf Drücken eines Hebels trainiert - unabhängig vom Betätigen des Hebels wurden Ratten neutrale Reize dargeboten, gefolgt von elektrischem Schlag - als CS wurde neben dem einzelnen Lärmreiz ein zusammengesetzter Reiz verwendet (gleichzeitig Licht- und Lärmreiz) - Gruppe A bekam 8x den zusammengesetzten Reiz und danach 16x den Lärmreiz alleine - Gruppe B bekam 16x den Lärmreiz alleine und danach 8x den zusammengesetzten Reiz - untersucht wurde, ob der Lichtreiz später alleine zu einer Verhaltensunterdrückung führt - nur in Gruppe A war das teilweise der Fall, in Gruppe B nicht → enthält der neue Reiz keine Information, die über das hinausgeht, was schon aufgrund der Beachtung anderer Reize bekannt ist, so wird der neue Reiz nicht gelernt (Blockierung) → wurde der zusammengesetzte Reiz nach dem einzelnen Lärmreiz gegeben ergab sich kein Unterdrückungseffekt, weil der Lichtreiz keine weitere Information enthielt → nur Reize, die zusätzliche Information vermitteln, werden gelernt Rescorla und Wagner: Mathematisch-numerisches Modell - Lerngewinn für einen zu konditionierenden Reiz als Funktion von drei Größen - a) die Stärke der Konditionierung hängt von Merkmalen des US ab, z.B. von dessen Stärke - b) die bisher erreichte Konditionierungsstärke → der weitere Lerngewinn ist durch den Lernzuwachs begrenzt, der noch möglich ist - c) die Konditionierungsstärke anderer mit dem zu erlernenden Reiz konkurrierenden Reize Lernen durch Einsicht Köhler: Forschung an Schimpansen - um Bananen zu erreichen war es notwendig Stöcke zusammen zu stecken oder Seile wie Lassos zu werfen - Köhler beobachtete nach Phasen des Probierens eine Phase der ruhigen Besinnung, bevor die Problemlösung durch Verbindung einzelner vertrauter Verhaltensweisen erfolgte - Nach erfolgreicher Problemlösung bereitete den Affen die Wiederholung des Verhaltens keine Probleme → Einsicht in die Problemlösung → Lernen durch Einsicht - allerdings ist davon auszugehen, dass die einzelnen Handlungselemente, die von den Affen zur Problemlösung verknüpft wurden, zuvor durch operante Konditionierung erlernt wurden → Zusammenspiel von operanter Konditionierung und Lernen durch Einsicht Lernen durch Beobachtung Vorteil des Lernens durch Beobachtung: - Lernvorgang wird verkürzt - Handlungskonsequenzen wie Belohnung/Bestrafung können durch Beobachtung erlernt werden, ohne das Verhalten selbst ausführen zu müssen Fisher und Hinde: Beobachtungslernen bei Vögeln - Anfang des 20. Jahrhunderts wurde in einem englischen Dorf erstmals beobachtet, wie Meisen die Abdeckung von Milchflaschen aufpickten, um so an die Milch zu kommen → dieses Verhalten verbreitete sich daraufhin rasch in großen Teilen Großbritanniens - ein vergleichbares Verhalten war zuvor nirgendwo beobachtet worden → Lernen am Modell Slabbert und Rasa: Beobachtungslernen bei Schäferhunden - Hundemütter und ihre Welpen - ein Teil der ausgewachsenen Schäferhunde waren als Drogenspürhunde trainiert (Modelle) - der andere Teil der ausgewachsenen Hunde war untrainiert - die Welpen unterschieden sich in der Dauer des Verbleibs bei der Mutter - je länger die Welpen ihre Mütter beim Drogenaufspüren beobachten konnten, desto bessere Spürhunde wurden sie selbst Allgemein: Das Lernen durch Beobachtung wird unterschieden von der Imitation (der reinen Verhaltensnachahmung, die unmittelbar in der Beobachtungssituation ausgeführt wird) Imitation als Instinkt bereits sehr kleine Kinder ahmen Verhaltensmuster nach → haben Menschen einen angeborene Imitationsbereitschaft? → nicht belegt Imitation als Lernen durch operante Konditionierung Miller und Dollard: Imitation könne mit operanter Konditionierung erklärt werden - bei der Imitation wirke das Verhalten anderer als Hinweisreiz für die Nachahmungsreaktion - Imitation = matched-dependent behavior (gleiches voneinander abhängiges Verhalten) - Bsp. für matched-dependent behavior: großer Bruder hört Schritte des von der Arbeit heim kommenden Vaters (Schritte = Hinweisreiz) → läuft dem Vater entgegen, weil er weiß, dass der immer Süßigkeiten (= Verstärkung) mitbringt → kleiner Bruder sieht die Reaktion des großen Bruders und läuft diesem hinterher (Reaktion des großen Bruders = Hinweisreiz), die Verstärkung ist für den kleinen Bruder auch die Süßigkeit, der Hinweisreiz jedoch nicht die Schritte des Vaters, sondern die Reaktion des großen Bruders → Hinweisreiz für den jüngeren Bruders hängt von der Reaktion des älteren ab → jüngerer Bruder imitiert den älteren Bruder - Imitation = erworbenes, sekundäres Bedürfnis, um primäres Bedürfnis (z.B. Hunger) zu befriedigen Experiment von Miller und Dollard: - 2 Kinder = Modelle - andere Kinder beobachteten das Verhalten der Modelle - 2 Experimentalgruppen: Imitationsbedingung und Gegensätzliche Verhaltensbedingung - Imitationsbedingung: Kinder wurden für die Imitation des Modells belohnt - Kinder wurden belohnt, wenn sie das entgegengesetzte Verhalten zeigten - 2 Schachteln - Modell nimmt immer ein Bonbon aus einer der beiden Schachteln heraus - in der Imitationsbedingung werden Kinder verstärkt, wenn sie die gleiche Schachtel öffnen, die das Modell zuvor geöffnet hatte (sie finden ein weiteres Bonbon in der Schachtel) - in der Gegenbedingung werden Kinder verstärkt, wenn sie das Verhalten des Modells nicht imitieren und die andere Schachtel öffnen (sie finden in der anderen Schachtel ein Bonbon) → Ergebnis: - alle Kinder in der Imitationsbedingung wählten dieselbe Schachtel wie das Modell - in der Gegenbedingung tat dies kein einziges Kind → Miller und Dollard: Kinder hätten nur durch entsprechende Verstärkung gelernt, das Verhalten des Modells zu imitieren Defizite der Erklärung des Erlernens von Imitation durch operante Konditionierung: - Erlernen von Imitation durch operante Konditionierung nur dann erklärbar, wenn die Imitation direkt verstärkt wird - Imitationsreaktion wird nur dann aufgebaut, wenn die Reaktion vom Nachahmer selbst ausgeführt wird → wahrscheinlich keine Imitation durch stellvertretende Verstärkung (wurde von Miller und Dollard nicht erwähnt) - Die Reaktion des Beobachters bleibt abhängig vom Modellverhalten (siehe kleiner Bruder, der auf die Reaktion des älteren reagiert) → nicht erklärt werden kann daher die Übertragung des beobachteten Verhaltens in eine neue Situation, in der das Modell nicht mehr anwesend ist