Psychologie des Lernens III: Klassische Konditionierung – Iwan P

Psychologie des Lernens III:
Klassische Konditionierung –
Iwan P. Pawlow
Klassischer Konditionierung
Instrumentelle Konditionierung
Operante Konditionierung
Kognitiver Behaviorismus
Lernen am Modell
Iwan P. Pawlow - Literatur
• Pavlov, Ivan P. (1927). Conditioned reflexes: An
investigation of the physiological activity of the
cerebral cortex (übers. v. G. V. Anrep). London:
Oxford University Press
• Yerkes, Robert M. & Morgulis, Sergius (1909).
The method of Pawlow in animal psychology.
Psychological Bulletin, 6, 257-273
Klassische Konditionierung
• Phase I: Kontrolle der Voraussetzungen
– unkonditionierter Stimulus (US, Fleischpulver)
löst unkonditionierte Reaktion (UR,
Speichelfluss) aus
– neutraler Stimulus (NS, Klingeln einer Glocke)
löst nur Orientierungsreaktion (OR, Aufmerken
des Hundes) aus
Klassische Konditionierung
• Phase II: Akquisition (Lernphase)
– NS wird mit US gekoppelt
– nach mehreren derartigen Koppelungen wird
NS zum konditionierten Stimulus (CS), der eine
konditionierte Reaktion (CS) auslöst
Klassische Konditionierung
• Phase IV: Spontanerholung
– nochmalige Darbietung von CS (ohne US) nach
einiger Zeit löst erneut CR aus.
Klassische Konditionierung
• Phase III: Extinktion (Löschungsphase)
– kein US mehr
– die ausschließliche Darbietung des CS löst CR
aus, die der UR ähnelt, aber von der Intensität
her schwächer ausfällt
– am Ende der Löschungsphase löst CS keine
spezifische Reaktion mehr aus
„Puzzle-Box“ – Thorndike
John B. Watson (1878-1958)
John B. Watson - Literatur
• Watson, John B. (1913). Psychology as the
Behaviorist Views It. Psychological Review, 20,
158-177 [das 'behavioristische Manifest']
• Watson, John B. (1919) Psychology from the
Standpoint of a Behaviorist. Philadelphia/London:
J. B. Lippincott
• Watson, John B. & Rayner, Rosalie (1920).
Conditioned emotional reactions. Journal of
Experimental Psychology, 3(1), 1-14 [die
berühmte 'Little-Albert-Studie]
John B. Watson
• Thorndike und Pavlov lieferten wichtige Beiträge
zur Verhaltenspsychologie
• Doch Watson verhalf dem Behaviorismus in der
Psychologie zum Durchbruch
• Das Jahr 1913 war hierfür das entscheidende Jahr,
da das neue Forschungsparadigma unter der
Bezeichnung „Behaviorismus“ sich durchsetzten.
„Little-Albert“-Experiment
Watson: Lernen als
Bildung von Gewohnheiten
Skinner-Box
Operante Konditionierung nach
Skinner
Wesentliche Unterschiede zur
klassischen Konditionierung
• Skinner-Box und Tiere (vor allem Ratten
und Tauben) als 'Werkzeuge' des
Verhaltensforschers
• Untersuchungsgegenstand war
ausschließlich das bloße Verhalten von
Lebewesen unter Aussparung jeglicher
theoretischer Vorannahmen
• Unterschied respondentes / operantes
Verhalten:
– respondentes Verhalten:
• ausgelöst durch Auslösereize
– operantes Verhalten:
• kein Auslösereiz
• durch Verstärkung modifizierbar
Wesentliche Unterschiede zur
klassischen Konditionierung
• Verstärkung und Bestrafung:
– Verstärkung: erhöht die
Auftrittswahrscheinlichkeit eines Verhaltens
(positiv: durch Gabe eines angenehmen Reizes;
negativ: durch Wegfall eines unangenehmen
Reizes)
– Bestrafung: vermindert die
Auftrittswahrscheinlichkeit eines Verhaltens
(positiv: durch Gabe eines unangenehmen Reizes;
negativ: durch Wegfall eines angenehmen Reizes)
Operante Konditionierung nach
Skinner
• Phase I: Bestimmung der Basisrate
– Versuchsleiter bestimmt die
Auftretenshäufigkeit eines Verhaltens ohne eine
Verstärkung
Wesentlicher Unterschied zur
instrumentellen Konditionierung
• Operante Konditionierung:
– das Versuchstier ist völlig frei, ein beliebiges
Verhalten zu zeigen.
• Instrumentelle Konditionierung nach Thorndike:
– das Versuchstier ist frei, ein bestimmtes Verhalten zu
zeigen oder nicht; wird nach Zeigen des
Zielverhaltens vom Versuchsleiters zum
Ausgangspunkt zurückgesetzt.
Operante Konditionierung nach
Skinner
• Phase II: Trainingsphase
– das zu konditionierende Verhalten wird durch
einen positiven Reiz (z. B. die Gabe von Futter)
verstärkt
– Häufigkeit des zu konditionierenden Verhalten
nimmt dadurch zu
Operante Konditionierung nach
Skinner
• Phase III: Extinktion (Löschungsphase)
– durch die Wegnahme der positiven Reize wird
das Verhalten nicht weiter verstärkt und sogar
abgeschwächt
Operante Konditionierung nach
Skinner
• Phase IV: Spontanerholung
– erhöhte Auftretenswahrscheinlichkeit des
konditionierten Verhaltens
– diese Auftretenswahrscheinlichkeit ist jedoch
keineswegs so hoch wie die nach der
Trainingsphase beobachtete Wahrscheinlichkeit
Operante Konditionierung nach
Skinner
• Phase IV: Spontanerholung
– erhöhte Auftretenswahrscheinlichkeit des
konditionierten Verhaltens.
– diese Auftretenswahrscheinlichkeit ist jedoch
keineswegs so hoch wie die nach der
Trainingsphase beobachtete
Wahrscheinlichkeit.
Kritik an den behavioristischen
Lerntheorien
• durch die kognitiven Psychologie
– die 'kongitive Wende' ('cognitive turn') in den
50er und 60er Jahren des 20. Jhdts.
– neues Paradigma in der Psychologie, das sich
aus dem Behaviorismus sowie in Absetzung
von diesem entwickelte
Kritik an den behavioristischen
Lerntheorien
• Kernpunkt der Kritik I:
Lernprozesse, die sich in komplexen
Situationen ereignen, sind nicht allein über
direkt beobachtbares Verhalten und direkt
beobachtbare Reize zu erklären.
Kritik an den behavioristischen
Lerntheorien
• der kognitive Informationswert, den Reize für
Versuchstiere haben, ist nicht in derselben Weise
beobachtbar, wie die Wirkung, die physikalisch zu
beschreibende Reize auf die
Aufftrittswahrscheinlichkeit von Verhaltensweisen
haben.
• in Pawlows Reflexologie, Watsons und Skinners
Behaviorismus ist kein Platz für kognitive Begriffe
wie 'Informationswert'.
Kritik an den behavioristischen
Lerntheorien
• Kernpunkte der Kritik II:
Lernvorgänge sind ohne Berücksichtigung des
Informationswertes, den Reizbedingungen
für den lernenden Organismus haben, nicht
zu erklären.
Die Notwendigkeit kognitiver
Begriffe
• kognitive Begriffe sind notwendig, um z.B.
das scheinbar einfache Verhalten einer
Ratte, die zur Erreichung eines
Zielgegenstands Hindernisse überwinden
muss, erklären zu können.
Edward Chase Tolman
(1886-1959)
Wissenschaftliche Kurzbiografie
• Edward Tolman studierte zuerst am berühmten
Massachussets Institute of Technology (MIT)
Elektrochemie
• an der Universität Havard inskribierte er dann Philosophie
und Psychologie
• den Doktorgrad erlangte er 1915 und war an der
Northwestern University drei Jahre als wissenschaftlicher
Assistent tätig
• wurde aufgrund seiner pazifistischen Haltung während des
ersten Weltkriegs aus dem Universitätsdienst entlassen
Wissenschaftliche Kurzbiografie
•
•
•
•
Ab 1918 an der Universität Berkeley
später ordentlichen Professur in Berkeley
forschte dort bis zu seinem Lebensende
Bemerkenswerte Persönlichkeit:
– ein 'demokratischer Geist', dem ein gut
argumentierter kritischer Einwand an seiner
eigenen Position Freude zu bereiten schien
– kritisch gegen jede Form des Dogmatismus in
der Wissenschaft
Tolmans wissenschaftliche
Kurzbiografie
• Aufenthalte in Deutschland und Österreich (19331934 in Wien) S gut vertraut mit den
europäischen Traditionen der Psychologie
• aktiver Widerstand gegen die politische
Instrumentalisierung von Wissenschaft und
Forschung in der McCarthy-Ära (40er und 50er
Jahren)
Tolmans Lerntheorie –
zielgerichtetes Verhalten
Kognitiver Behaviorismus
• Unterscheidung zwischen der molekularen und der
molaren Betrachtungsweise des Verhaltens:
–
–
Molekulare Betrachtungsweise: Verhalten wird als
die Abfolge und Summe einfacher
Muskelbewegungen aufgefasst (z. B. die Beugung
der Beinmuskulatur)
Molare Betrachtungsweise: Verhalten wird als
ganzheitliche sinnhafte Handlung eines
Lebewesens, das auf ein bestimmtes Ziel hin
ausgerichtet ist, verstanden (purposive behavoir)
Tolmans Lerntheorie –
zielgerichtetes Verhalten
Purposive behavior in animals
and men (1932)
Zielgerichtetes Verhalten in
Tieren und Menschen
• Zielgerichtetheit ist eine Beschreibung des Verhaltens
und keine Beschreibung des Bewusstseinszustandes eine
Lebewesens:
– das zielgerichtete Verhalten (purposive
behavior) ist kein mentalistischer (nicht direkt
beobachtbarer, innerlich-geistiger bzw.
kognitiver) Begriff,
– sondern ein Begriff, der aus der Beobachtung
des äußeren Verhaltens gebildet ist
Tolmans Lerntheorie –
Erfahrungen und Erwartungen
• jedoch kommt Tolman bei der Beschreibung des
Verhaltens doch nicht ganz ohne kognitive Begriffe aus:
–
bestimmte Reizbedingungen rufen in Abhängigkeit
von Erfahrungen, die ein Lebewesen zuvor
gemacht hat, Erwartungen (Hypothesen) hervor
• Erwartungen (Hypothesen) über:
–
–
–
Tolmans Lerntheorie –
Lernen als fortwährende
Hypothesenbildung
Lernen ist nach Tolman ein fortwährendes
Hypothesenbilden (Erwartungen ausbilden) und
-testen auf der Grundlage von vorangegangenen
Erfahrungen
die vorliegenden Reizbedingungen
die entsprechenden Verhaltensweisen
die aus den Verhaltensweisen resultierenden
Reizbedingungen
Tolmans Lerntheorie –
konkretes Verhalten & Verstärkung
• konkretes Verhalten:
– ist das Testen von bestimmten Hypothesen
(Erwartungen)
• Verstärkung:
– ist die Bestätigung dieser Hypothesen
(Erwartungen)
Experiment von Tolman Ortslernen im Labyrinth
• Ratten müssen in einem Labyrinth von einem
Startpunkt unter der Überwindung von
Hindernissen (Sperre A & B) in ein Ziel (Futter)
finden
Experiment von Tolman Ortslernen im Labyrinth
(a) Aufbau einer Verhaltenshierarchie (I, II, III) durch
Vortraining (erfolgte nur mit Sperre A):
–
–
–
ohne Sperre A: Versuchstiere (Vt) bevorzugten Weg
1 (I)
mit Sperre A: durch Verstärkung am Zielort wurde
erreicht, dass jedes Vt in 90 % seiner Durchläufe
Weg 2 (II), in 10 % seiner Durchläufe Weg 3
benutzte (III)
Ziel der Verhaltenshierarchie: Vt sollten den
jeweils kürzeren Weg bevorzugen
Experiment von Tolman Ortslernen im Labyrinth
Experiment von Tolman Ortslernen im Labyrinth: Ergebnisse
• Weg 1 durch die Sperre B blockiert:
(b) in der Testphase wurden abwechselnd Sperre A
und B gesetzt
S trotz der im Vortraining etablierten
Verhaltenshierarchie wählte die Mehrheit der
Vt, wenn sie erneut vom Start wegliefen, bereits
im aller ersten Durchgang Weg 3 (C) = den
einzigen zum Ziel führenden Weg
S die Vt 'ersparten' sich, den Weg 2 auszuprobieren
Experiment von Tolman Ortslernen im Labyrinth: Ergebnisse
• die kognitive Landkarte (cognitive map)
S die Ratten verhielten sich so, als ob sie sich im
Vortraining ein Bild (= kognitive Landkarte) des
Labyrinths erworben hätten, nach der sie ihr
zielorientiertes Verhalten organisiert hätten
kognitive Landkarte als Zeichensystem
• Tolman fasst diese kognitive Landkarte als ein
Zeichensystem auf, das reale Sachverhalte
abbildet:
S die Ratten haben keine Reiz-Reaktions-Verknüfpung
gelernt (vgl. klassiche und operante
Konditionierung)
S sondern Beziehungen zwischen Zeichen
S die Ratten lernten, Reizbedingungen als Zeichen zu
verwerten (Bedeutungen zu verstehen), die zu
bestimmten Zielgegenständen hinführen oder davon
abhalten
Zeichen-Gestalt (sign-gestalt)
• Zeichen und Bezeichnetes bilden einen
Bedeutungszusammenhang = Zeichen-Gestalt
(sign-gestalt)
S Situationen und Sachverhalte sind für Lebewesen
prinzipiell Mehrdeutigkeit
S erst aufgrund der Zeichen-Gestalt können
Hypothesen (Erwartungen) gebildet werden
Latentes Lernen
• Latentes Lernen:
–
–
Vt lernten diese kognitive Landkarte als
Zeichensystem ohne explizite Verstärkung
dieser Lernprozess ist zum Zeitpunkt seines
Ablaufs im Verhalten nicht manifest, sondern
latent
„Lernen“ als Erwerb von
Kompetenz (Tolman)
vs.
„Lernen“ als Änderung der
Auftrittswahrscheinlichkeit eines
Verhaltens (Skinner)
Kompetenz und Performanz
• Unterscheidung zwischen Kompetenz und
Performanz:
–
–
Kompetenz: das Erlernen von kognitiven
Landkarten bzw. das Strukturieren von realen
Sachverhalten in Form einer Zeichen-Gestalt
Performanz: Umsetzung der Kompetenz in
beobachtbares Verhalten