Psychologie des Lernens III: Klassische Konditionierung – Iwan P. Pawlow Klassischer Konditionierung Instrumentelle Konditionierung Operante Konditionierung Kognitiver Behaviorismus Lernen am Modell Iwan P. Pawlow - Literatur • Pavlov, Ivan P. (1927). Conditioned reflexes: An investigation of the physiological activity of the cerebral cortex (übers. v. G. V. Anrep). London: Oxford University Press • Yerkes, Robert M. & Morgulis, Sergius (1909). The method of Pawlow in animal psychology. Psychological Bulletin, 6, 257-273 Klassische Konditionierung • Phase I: Kontrolle der Voraussetzungen – unkonditionierter Stimulus (US, Fleischpulver) löst unkonditionierte Reaktion (UR, Speichelfluss) aus – neutraler Stimulus (NS, Klingeln einer Glocke) löst nur Orientierungsreaktion (OR, Aufmerken des Hundes) aus Klassische Konditionierung • Phase II: Akquisition (Lernphase) – NS wird mit US gekoppelt – nach mehreren derartigen Koppelungen wird NS zum konditionierten Stimulus (CS), der eine konditionierte Reaktion (CS) auslöst Klassische Konditionierung • Phase IV: Spontanerholung – nochmalige Darbietung von CS (ohne US) nach einiger Zeit löst erneut CR aus. Klassische Konditionierung • Phase III: Extinktion (Löschungsphase) – kein US mehr – die ausschließliche Darbietung des CS löst CR aus, die der UR ähnelt, aber von der Intensität her schwächer ausfällt – am Ende der Löschungsphase löst CS keine spezifische Reaktion mehr aus „Puzzle-Box“ – Thorndike John B. Watson (1878-1958) John B. Watson - Literatur • Watson, John B. (1913). Psychology as the Behaviorist Views It. Psychological Review, 20, 158-177 [das 'behavioristische Manifest'] • Watson, John B. (1919) Psychology from the Standpoint of a Behaviorist. Philadelphia/London: J. B. Lippincott • Watson, John B. & Rayner, Rosalie (1920). Conditioned emotional reactions. Journal of Experimental Psychology, 3(1), 1-14 [die berühmte 'Little-Albert-Studie] John B. Watson • Thorndike und Pavlov lieferten wichtige Beiträge zur Verhaltenspsychologie • Doch Watson verhalf dem Behaviorismus in der Psychologie zum Durchbruch • Das Jahr 1913 war hierfür das entscheidende Jahr, da das neue Forschungsparadigma unter der Bezeichnung „Behaviorismus“ sich durchsetzten. „Little-Albert“-Experiment Watson: Lernen als Bildung von Gewohnheiten Skinner-Box Operante Konditionierung nach Skinner Wesentliche Unterschiede zur klassischen Konditionierung • Skinner-Box und Tiere (vor allem Ratten und Tauben) als 'Werkzeuge' des Verhaltensforschers • Untersuchungsgegenstand war ausschließlich das bloße Verhalten von Lebewesen unter Aussparung jeglicher theoretischer Vorannahmen • Unterschied respondentes / operantes Verhalten: – respondentes Verhalten: • ausgelöst durch Auslösereize – operantes Verhalten: • kein Auslösereiz • durch Verstärkung modifizierbar Wesentliche Unterschiede zur klassischen Konditionierung • Verstärkung und Bestrafung: – Verstärkung: erhöht die Auftrittswahrscheinlichkeit eines Verhaltens (positiv: durch Gabe eines angenehmen Reizes; negativ: durch Wegfall eines unangenehmen Reizes) – Bestrafung: vermindert die Auftrittswahrscheinlichkeit eines Verhaltens (positiv: durch Gabe eines unangenehmen Reizes; negativ: durch Wegfall eines angenehmen Reizes) Operante Konditionierung nach Skinner • Phase I: Bestimmung der Basisrate – Versuchsleiter bestimmt die Auftretenshäufigkeit eines Verhaltens ohne eine Verstärkung Wesentlicher Unterschied zur instrumentellen Konditionierung • Operante Konditionierung: – das Versuchstier ist völlig frei, ein beliebiges Verhalten zu zeigen. • Instrumentelle Konditionierung nach Thorndike: – das Versuchstier ist frei, ein bestimmtes Verhalten zu zeigen oder nicht; wird nach Zeigen des Zielverhaltens vom Versuchsleiters zum Ausgangspunkt zurückgesetzt. Operante Konditionierung nach Skinner • Phase II: Trainingsphase – das zu konditionierende Verhalten wird durch einen positiven Reiz (z. B. die Gabe von Futter) verstärkt – Häufigkeit des zu konditionierenden Verhalten nimmt dadurch zu Operante Konditionierung nach Skinner • Phase III: Extinktion (Löschungsphase) – durch die Wegnahme der positiven Reize wird das Verhalten nicht weiter verstärkt und sogar abgeschwächt Operante Konditionierung nach Skinner • Phase IV: Spontanerholung – erhöhte Auftretenswahrscheinlichkeit des konditionierten Verhaltens – diese Auftretenswahrscheinlichkeit ist jedoch keineswegs so hoch wie die nach der Trainingsphase beobachtete Wahrscheinlichkeit Operante Konditionierung nach Skinner • Phase IV: Spontanerholung – erhöhte Auftretenswahrscheinlichkeit des konditionierten Verhaltens. – diese Auftretenswahrscheinlichkeit ist jedoch keineswegs so hoch wie die nach der Trainingsphase beobachtete Wahrscheinlichkeit. Kritik an den behavioristischen Lerntheorien • durch die kognitiven Psychologie – die 'kongitive Wende' ('cognitive turn') in den 50er und 60er Jahren des 20. Jhdts. – neues Paradigma in der Psychologie, das sich aus dem Behaviorismus sowie in Absetzung von diesem entwickelte Kritik an den behavioristischen Lerntheorien • Kernpunkt der Kritik I: Lernprozesse, die sich in komplexen Situationen ereignen, sind nicht allein über direkt beobachtbares Verhalten und direkt beobachtbare Reize zu erklären. Kritik an den behavioristischen Lerntheorien • der kognitive Informationswert, den Reize für Versuchstiere haben, ist nicht in derselben Weise beobachtbar, wie die Wirkung, die physikalisch zu beschreibende Reize auf die Aufftrittswahrscheinlichkeit von Verhaltensweisen haben. • in Pawlows Reflexologie, Watsons und Skinners Behaviorismus ist kein Platz für kognitive Begriffe wie 'Informationswert'. Kritik an den behavioristischen Lerntheorien • Kernpunkte der Kritik II: Lernvorgänge sind ohne Berücksichtigung des Informationswertes, den Reizbedingungen für den lernenden Organismus haben, nicht zu erklären. Die Notwendigkeit kognitiver Begriffe • kognitive Begriffe sind notwendig, um z.B. das scheinbar einfache Verhalten einer Ratte, die zur Erreichung eines Zielgegenstands Hindernisse überwinden muss, erklären zu können. Edward Chase Tolman (1886-1959) Wissenschaftliche Kurzbiografie • Edward Tolman studierte zuerst am berühmten Massachussets Institute of Technology (MIT) Elektrochemie • an der Universität Havard inskribierte er dann Philosophie und Psychologie • den Doktorgrad erlangte er 1915 und war an der Northwestern University drei Jahre als wissenschaftlicher Assistent tätig • wurde aufgrund seiner pazifistischen Haltung während des ersten Weltkriegs aus dem Universitätsdienst entlassen Wissenschaftliche Kurzbiografie • • • • Ab 1918 an der Universität Berkeley später ordentlichen Professur in Berkeley forschte dort bis zu seinem Lebensende Bemerkenswerte Persönlichkeit: – ein 'demokratischer Geist', dem ein gut argumentierter kritischer Einwand an seiner eigenen Position Freude zu bereiten schien – kritisch gegen jede Form des Dogmatismus in der Wissenschaft Tolmans wissenschaftliche Kurzbiografie • Aufenthalte in Deutschland und Österreich (19331934 in Wien) S gut vertraut mit den europäischen Traditionen der Psychologie • aktiver Widerstand gegen die politische Instrumentalisierung von Wissenschaft und Forschung in der McCarthy-Ära (40er und 50er Jahren) Tolmans Lerntheorie – zielgerichtetes Verhalten Kognitiver Behaviorismus • Unterscheidung zwischen der molekularen und der molaren Betrachtungsweise des Verhaltens: – – Molekulare Betrachtungsweise: Verhalten wird als die Abfolge und Summe einfacher Muskelbewegungen aufgefasst (z. B. die Beugung der Beinmuskulatur) Molare Betrachtungsweise: Verhalten wird als ganzheitliche sinnhafte Handlung eines Lebewesens, das auf ein bestimmtes Ziel hin ausgerichtet ist, verstanden (purposive behavoir) Tolmans Lerntheorie – zielgerichtetes Verhalten Purposive behavior in animals and men (1932) Zielgerichtetes Verhalten in Tieren und Menschen • Zielgerichtetheit ist eine Beschreibung des Verhaltens und keine Beschreibung des Bewusstseinszustandes eine Lebewesens: – das zielgerichtete Verhalten (purposive behavior) ist kein mentalistischer (nicht direkt beobachtbarer, innerlich-geistiger bzw. kognitiver) Begriff, – sondern ein Begriff, der aus der Beobachtung des äußeren Verhaltens gebildet ist Tolmans Lerntheorie – Erfahrungen und Erwartungen • jedoch kommt Tolman bei der Beschreibung des Verhaltens doch nicht ganz ohne kognitive Begriffe aus: – bestimmte Reizbedingungen rufen in Abhängigkeit von Erfahrungen, die ein Lebewesen zuvor gemacht hat, Erwartungen (Hypothesen) hervor • Erwartungen (Hypothesen) über: – – – Tolmans Lerntheorie – Lernen als fortwährende Hypothesenbildung Lernen ist nach Tolman ein fortwährendes Hypothesenbilden (Erwartungen ausbilden) und -testen auf der Grundlage von vorangegangenen Erfahrungen die vorliegenden Reizbedingungen die entsprechenden Verhaltensweisen die aus den Verhaltensweisen resultierenden Reizbedingungen Tolmans Lerntheorie – konkretes Verhalten & Verstärkung • konkretes Verhalten: – ist das Testen von bestimmten Hypothesen (Erwartungen) • Verstärkung: – ist die Bestätigung dieser Hypothesen (Erwartungen) Experiment von Tolman Ortslernen im Labyrinth • Ratten müssen in einem Labyrinth von einem Startpunkt unter der Überwindung von Hindernissen (Sperre A & B) in ein Ziel (Futter) finden Experiment von Tolman Ortslernen im Labyrinth (a) Aufbau einer Verhaltenshierarchie (I, II, III) durch Vortraining (erfolgte nur mit Sperre A): – – – ohne Sperre A: Versuchstiere (Vt) bevorzugten Weg 1 (I) mit Sperre A: durch Verstärkung am Zielort wurde erreicht, dass jedes Vt in 90 % seiner Durchläufe Weg 2 (II), in 10 % seiner Durchläufe Weg 3 benutzte (III) Ziel der Verhaltenshierarchie: Vt sollten den jeweils kürzeren Weg bevorzugen Experiment von Tolman Ortslernen im Labyrinth Experiment von Tolman Ortslernen im Labyrinth: Ergebnisse • Weg 1 durch die Sperre B blockiert: (b) in der Testphase wurden abwechselnd Sperre A und B gesetzt S trotz der im Vortraining etablierten Verhaltenshierarchie wählte die Mehrheit der Vt, wenn sie erneut vom Start wegliefen, bereits im aller ersten Durchgang Weg 3 (C) = den einzigen zum Ziel führenden Weg S die Vt 'ersparten' sich, den Weg 2 auszuprobieren Experiment von Tolman Ortslernen im Labyrinth: Ergebnisse • die kognitive Landkarte (cognitive map) S die Ratten verhielten sich so, als ob sie sich im Vortraining ein Bild (= kognitive Landkarte) des Labyrinths erworben hätten, nach der sie ihr zielorientiertes Verhalten organisiert hätten kognitive Landkarte als Zeichensystem • Tolman fasst diese kognitive Landkarte als ein Zeichensystem auf, das reale Sachverhalte abbildet: S die Ratten haben keine Reiz-Reaktions-Verknüfpung gelernt (vgl. klassiche und operante Konditionierung) S sondern Beziehungen zwischen Zeichen S die Ratten lernten, Reizbedingungen als Zeichen zu verwerten (Bedeutungen zu verstehen), die zu bestimmten Zielgegenständen hinführen oder davon abhalten Zeichen-Gestalt (sign-gestalt) • Zeichen und Bezeichnetes bilden einen Bedeutungszusammenhang = Zeichen-Gestalt (sign-gestalt) S Situationen und Sachverhalte sind für Lebewesen prinzipiell Mehrdeutigkeit S erst aufgrund der Zeichen-Gestalt können Hypothesen (Erwartungen) gebildet werden Latentes Lernen • Latentes Lernen: – – Vt lernten diese kognitive Landkarte als Zeichensystem ohne explizite Verstärkung dieser Lernprozess ist zum Zeitpunkt seines Ablaufs im Verhalten nicht manifest, sondern latent „Lernen“ als Erwerb von Kompetenz (Tolman) vs. „Lernen“ als Änderung der Auftrittswahrscheinlichkeit eines Verhaltens (Skinner) Kompetenz und Performanz • Unterscheidung zwischen Kompetenz und Performanz: – – Kompetenz: das Erlernen von kognitiven Landkarten bzw. das Strukturieren von realen Sachverhalten in Form einer Zeichen-Gestalt Performanz: Umsetzung der Kompetenz in beobachtbares Verhalten