operante konditionierung I

Werbung
Lernen: Themen der Vorlesung
I
II
III
IV
V
VI
VII
VIII
IX
X
XI
Geschichte und Gegenstand der Lernpsychologie
Habituation
Klassisches Konditionieren I – Grundlegende Phänomene,
Prinzipien, Anwendungsbeispiele
Klassisches Konditionieren II – Komplexitäten und
mathematische Erklärungsmodelle
Klassisches Konditionieren III – Evaluative Konditionierung
Operante Konditionierung I – Grundlegende Phänomene,
Prinzipien, Anwendungsbeispiele
Operante Konditionierung II – Verstärkerpläne
Operante Konditionierung III – Vermeidung, Bestrafung,
Löschung
Operante Konditionierung IV – Theorien
Relation von operanter und klassischer Konditionierung
Kausales Lernen
Übersicht
• Operantes vs. respondentes Verhalten
• Das Gesetz des Effekts
• Freie operante Verfahren
Operantes vs. respondentes Verhalten
• Respondentes Verhalten
– Stimulusbezogen
– Erfahrungsbedingte Veränderung in reizbezogenem
Verhalten: Klassische Konditionierung
• Operantes Verhalten
– Willkürlich/spontan
– an Konsequenzen/Folgen orientiert
– Erfahrungsbedingte Veränderung im operanten Verhalten:
operante Konditionierung
Das Gesetz des Effekts
• Law of effect
– Edward L. Thorndike (1874-1949)
Kontiguität beim Effektlernen
• Stop-Action-Prinzip
– Stärkung einer Verhaltensweise (Körperhaltung,
Muskelbewegung) im Moment des Eintretens der
positiven Konsequenz (Kontiguitätsprinzip)
• Abergläubisches Verhalten
– Auftreten regelmäßigen Verhaltens auch bei nichtkontingenter Verstärkung (Skinner, 1948)
• Mögliche Erklärung für alltägliche Verhaltensrituale
(Glücksspielverhalten, Sportler, Auf-Holz-Klopfen, etc.)
Abbildung 6.3: Das Verhalten einer Katze (Versuchstier B) im Problemkäfig von Guthrie und Horton. Die 24 Bilder
zeigen die Position der Katze bei den ersten 24 Durchgängen im Moment der Verstärkung. Im Problemkäfig führte jede
Bewegung des vertikalen Stabes zur Öffnung der Tür (nach Guthrie & Horton, 1946).
© James E. Mazur, Lernen und Gedächtnis, Pearson Studium Verlag 2004.
Abbildung 6.4: Das Verhalten einer anderen Katze (Versuchstier G) im Moment der Verstärkung bei den Durchgängen
52 bis 71 im Problemkäfig (nach Guthrie & Horton, 1946).
© James E. Mazur, Lernen und Gedächtnis, Pearson Studium Verlag 2004.
Effiziente Konditionierung I
• Problem: das gewünschte (= zu verstärkende)
Verhalten tritt spontan nicht auf
• Shaping
– Verstärkung von Rudimenten des gewünschten
Verhaltens
– Sukzessive Erhöhung des Kriteriums, das zur
Verstärkung notwendig ist
– Anwendungsbeispiele
• Anekdoten (Konditionierung des Dozenten, Tischtennisspielende Tauben, …)
• Verhaltenstherapie (Verhaltensaufbau bei retardierten
Kindern etwa im Bereich des Sprechens und des
Sozialverhaltens)
– Prompting und fading
Abbildung 6.5: Hypothetische Verteilung, die zeigt, wie hoch eine Ratte vor dem Shaping (durchgehende Linie) ihren
Kopf hält. Die gestrichelte Linie zeigt die Situation nach selektiver Verstärkung von Kopfpositionen über 4,5 Zentimeter.
Die Beobachtung erfolgte mit regelmäßigen Abständen. Rachlins Analyse des Shapingprozesses (1970) sieht ähnlich
aus.
5
Vor dem Shaping
Nach dem Shaping
4
3
Verstärkungskriterium
2
1
0
20
10
0
Anzahl der Beobachtungen
© James E. Mazur, Lernen und Gedächtnis, Pearson Studium Verlag 2004.
Effiziente Konditionierung II
• Aufbau komplexer Verhaltenssequenzen (V.ketten)
• Chaining
– Verkettung von Verhaltensweisen mithilfe
konditionierter Verstärkung
• Stimuli vermitteln zwischen den einzelnen
Verhaltenselementen
• Steuerungsfunktion als diskriminative Hinweisreize
• (konditionierte) Belohnung des vorangehenden
Verhaltens
Abbildung 6.7: Die abwechselnde Folge von Stimulus und Verhalten in der hypothetischen Verhaltenskette, die im Text
beschrieben wird. Jeder Stimulus in der Kette dient als konditionierter Verstärker für das vorangehende Verhalten und
als diskriminierender Stimulus für den folgenden Verhaltensschritt.
Stimuli
Leiter (SD)
Platform, Seil (SR, SD)
Tür öffnen (SR, SD)
Rutsche (SR, SD)
Anblick des Hebels
(SR, SD)
Hebel in Reichweite
(SR, SD)
Reaktionen
Hochklettern
am Seil ziehen
durch den Tunnel Rennen
Rutsche heruntergleiten
zum Hebel rennen
Hebel drücken
Futterpellet (SR)
© James E. Mazur, Lernen und Gedächtnis, Pearson Studium Verlag 2004.
Freie operante Konditionierung
• Problem: Experimente mit Einzelverhalten sind mühsam und
in ihrer Aussage begrenzt
• Analyse wiederholbarer Reaktionen erlaubt kontinuierliche
Analyse von Verhaltensintensitäten
– Verhaltensanalyse in der „Skinner-Box“
– Reaktionsrate als AV
• Verlauf
– Akquisition, Extinktion, Spontanerholung
• Kontingenzeffekte bei nicht-perfekter Verstärkung (Hammond,
1980)
– P(Verstärker I Reaktion) > P(Verstärker I ¬Reaktion)
– Analog zur klassischen Konditionierung
Abbildung 6.6: Eine Taube pickt auf eine leuchtende Taste in einer typischen Versuchskammer zum operanten
Konditionieren. Als Verstärker kommen Körner aus der viereckigen Öffnung unterhalb der Taste.
© James E. Mazur, Lernen und Gedächtnis, Pearson Studium Verlag 2004.
Typischer Verlauf der freien operanten Konditionierung
Häufigkeit der Verstärkung oder
Vorhersagekraft?
Hammond (1980)
Wahrscheinlichkeit, daß nach
einem 1-sek-Intervall, in dem
eine Ratte den Hebel gedrückt
hat, ein Verstärker folgt.
Häufigkeit der Verstärkung oder
Vorhersagekraft?
Hammond (1980)
Wahrscheinlichkeit, daß nach
einem 1-sek-Intervall, in dem
eine Ratte den Hebel nicht
gedrückt hat, ein Verstärker
folgt.
Häufigkeit der Verstärkung oder
Vorhersagekraft?
Hammond (1980)
Vorhersage
keine
Vorhersage
Vorhersage
keine
Vorhersage
Literatur
Mazur, J. E. (20066). Lernen und Verhalten (Kap. 6).
München: Pearson Studium.
Schwartz, B., Wasserman, E. A. & Robbins, S. J. (20025).
Psychology of learning and behavior (Kap. 7, 8).New York,
Norton & Co.
Herunterladen