„Operantes Konditionieren“ Prof. Dr. Hermann Körndle Professur für die Psychologie des Lehrens und Lernens Technische Universität Dresden © Psychologie des Lehrens und Lernens, TU Dresden Operantes Konditionieren Vertreter I - Thorndike Edward Lee Thorndike (1874-1949) Formulierung „Law of Effect“ Ö Verhaltensweisen, die einen befriedigenden Zustand zur Folge haben, werden mit höherer Wahrscheinlichkeit in gleichen oder ähnlichen Situationen wiederholt. 2 © Psychologie des Lehrens und Lernens, TU Dresden Operantes Konditionieren Vertreter II - Skinner Burrhus Frederic Skinner (1904-1990) Unterscheidung operanten und reaktiven Verhaltens Ö operantes Verhalten: Verhalten, dem kontingent Verhaltenskonsequenzen folgen und das nicht unmittelbar durch externe Reize ausgelöst wird Ö reaktives Verhalten: Verhalten, das unmittelbar durch einen Reiz ausgelöst wird. 3 © Psychologie des Lehrens und Lernens, TU Dresden Grundprinzip des Operanten Konditionierens Ö Prinzip des Operanten Konditionierens: Die Auftretenswahrscheinlichkeit eines Verhaltens wird durch die dem Verhalten folgenden Konsequenzen verändert. Folgt einem Verhalten eine angenehme Konsequenz, so erhöht sich die Wahrscheinlichkeit, dass dieses Verhalten in gleichen oder ähnlichen Situationen wieder gezeigt wird. Folgt einem Verhalten eine unangenehme Konsequenz, so verringert sich die Wahrscheinlichkeit, dass dieses Verhalten in gleichen oder ähnlichen Situationen wieder gezeigt wird. Ö Bedingungen: Kontiguität und Kontingenz zwischen dem Verhalten und dessen Konsequenz. 4 © Psychologie des Lehrens und Lernens, TU Dresden Experimentalparadigma Ö die Auftretenswahrscheinlichkeit eines Verhaltens wird durch die dem Verhalten folgenden Konsequenzen verändert. Ö Phasen eines Experiments zum Operanten Konditionieren 1) 2) 3) 4) 5 Kontrollphase Lernphase Löschungsphase Spontanerholungsphase © Psychologie des Lehrens und Lernens, TU Dresden Operantes Konditionieren Experimentalparadigma - Skinnerbox Food pellet reservoir Stimulus light Lever Foot container 6 © Psychologie des Lehrens und Lernens, TU Dresden Operantes Konditionieren Verhaltensrate Experimentalparadigma - Untersuchungsphasen keine Verhaltenskonsequenzen Kontrollphase 7 auf Verhalten folgen angenehme Konsequenzen keine Verhaltenskonsequenzen Zeit Lern-/Trainingsphase Löschungsphase Spontanerholung © Psychologie des Lehrens und Lernens, TU Dresden Operantes Konditionieren Prinzipien des Operanten Konditionierens Herstellung der Bezeichnung Verhaltenskonsequenz positive angenehmer Reiz Verstärkung wird hinzugefügt Verstärkung negative unangenehmer Reiz Verstärkung wird entfernt Bestrafung unangenehmer Reiz Typ I wird hinzugefügt Bestrafung Bestrafung angenehmer Reiz Typ II wird entfernt Löschung 8 Löschung auf Verhalten folgt keine Konsequenz Wirkung Erhöhung der Verhaltensrate Reduktion der Verhaltensrate Reduktion der Verhaltensrate © Psychologie des Lehrens und Lernens, TU Dresden Operantes Konditionieren Bedingungen für erfolgreiche Verhaltensbeeinflussung ÖKontiguität zeitliche (und räumliche) Nähe von Verhalten und Konsequenz. ÖKontingenz die Wahrscheinlichkeit des gemeinsamen Auftretens von Verhalten und Konsequenz ist höher als die Wahrscheinlichkeit, dass nur eines von beiden auftritt. Ein Verhalten wird in seiner Auftretenswahrscheinlichkeit nur dann von Verhaltenskonsequenzen beeinflusst, wenn Kontiguität und Kontingenz zwischen Verhalten und dessen Konsequenzen besteht. 9 © Psychologie des Lehrens und Lernens, TU Dresden Operantes Konditionieren Kontiguität und Kontingenz Verhalten Konsequenz 10 Zeit Zeit © Psychologie des Lehrens und Lernens, TU Dresden Unabhängige Variablen Das Kontiguitätsprinzip (Grice, 1948) 100% 0 sec 0,5 sec 1,2 sec 2 sec Prozent richtiges Verhalten 90% 80% 5 sec 70% 60% 50% 10 sec 40% 30% 0 100 200 300 400 500 600 700 Anzahl der Versuchsdurchgänge 11 © Psychologie des Lehrens und Lernens, TU Dresden Unabhängige Variablen 256 4 (feet/sec) Durchschnittsgeschwindigkeit Quantität der Verhaltenskonsequenz (Crespi, 1942) 64 3 16 2 1 0 0 5 10 15 Versuchsdurchgänge 12 © Psychologie des Lehrens und Lernens, TU Dresden Operantes Konditionieren - UV Verstärkungspläne I Verstärkungspläne sind Festlegungen des Experimentators, in denen angegeben wird, wie regelmäßig und wie häufig die Konsequenzen einem Verhalten folgen. ÖHäufigkeit: z kontinuierlich vs. intermittierend ÖRegelmäßigkeit: z z 13 fixiert vs. variabel Quote vs. Intervall © Psychologie des Lehrens und Lernens, TU Dresden Operantes Konditionieren - UV Wirkung von Verstärkungsplänen I Number of responses 1000 A B C 750 500 D 250 0 0 10 20 30 40 50 60 70 80 Time (minutes) 14 A Fixed ratio C Fixed interval B Variable ratio D Variable interval © Psychologie des Lehrens und Lernens, TU Dresden Operantes Konditionieren - UV Wirkung von Verstärkungsplänen II Ö Kontinuierliche Verstärkung z z hohe Lerngeschwindigkeit; geringer Löschungswiderstand Ö Intermittierende Verstärkung z z 15 niedrige Lerngeschwindigkeit; hoher Löschungswiderstand © Psychologie des Lehrens und Lernens, TU Dresden Operantes Konditionieren - UV Wirkung von Verstärkungsplänen III 16 Ö Fixierte Verstärkung - wechselnde Verhaltensrate; - geringerer Löschungswiderstand als variable Verstärkungspläne Ö Variable Verstärkung - gleichmäßige Verhaltensrate; - höherer Löschungswiderstand als fixierte Verstärkungspläne Ö Quotenpläne - höhere Verhaltensrate als Intervallpläne - höhere Lerngeschwindigkeit als Intervallpläne Ö Intervallpläne - niedrigere Verhaltensrate als Quotenpläne - geringere Lerngeschwindigkeit als Quotenpläne © Psychologie des Lehrens und Lernens, TU Dresden Unabhängige Variablen Wirkung von Verstärkungsplänen IV Saisonarbeitseffekt Cumulation of bills passed by the U.S. Congress Weisberg, P. & Waldrop, P.B. (1972). Fixed-interval work habits of congress. Journal of Applied Behavior Analysis. (n. Anderson, J.R. (1995). Learning and Memory. New York: Wiley, S. 23.) 17 © Psychologie des Lehrens und Lernens, TU Dresden Unabhängige Variablen Wirkung von Verstärkungsplänen V 500 450 400 350 300 250 200 150 100 50 0 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 Gesetze Rechtsverordnungen Seitenanzahl insg. im BGBI (geteilt durch 10) 18 © Psychologie des Lehrens und Lernens, TU Dresden Operantes Konditionieren - UV Diskriminative Hinweisreize (cues, Signalreize) Ö Definition: Diskriminative Hinweisreize sind Reize, die bestimmte Verhaltenskonsequenzen signalisieren. Ö Beispiele: Bei Lehrer Müller wird das Verhalten „im Unterricht reden“ nicht bestraft, bei Lehrer Meier wird es bestraft. Die Schüler reden bei Herrn Meier nicht im Unterricht. Eine Ratte erhält nur dann eine Belohnung (Futter), wenn vorher eine Lampe aufleuchtete. 19 © Psychologie des Lehrens und Lernens, TU Dresden Operantes Konditionieren Bestrafung (Estes, 1944) Verhaltenstendenz 100% 75% 50% 25% 0% 1 2 3 4 Zeit nicht bestraftes Verhalten 20 © Psychologie des Lehrens und Lernens, TU Dresden Operantes Konditionieren Bestrafung (Estes, 1944) Verhaltenstendenz 100% 75% 50% 25% 0% 1 2 nicht bestraftes Verhalten 21 3 4 Zeit in Phase 2 bestraft © Psychologie des Lehrens und Lernens, TU Dresden Operantes Konditionieren Differenzierungen - Kontrasteffekte Kontrasteffekte sprunghafte Veränderungen der Verhaltensrate in Abhängigkeit einer massiven Änderung der Quantität, d. h. der Menge der Verhaltenskonsequenz. Ö Positiver Kontrasteffekt Erhöht man eine zu Beginn geringe Verstärkungsmenge, so erhöht sich die Verhaltensrate sprunghaft über die zu erwartende Verhaltensrate. Ö Negativer Kontrasteffekt Reduziert man eine zu Beginn hohe Verstärkungsmenge, so verringert sich die Verhaltensrate sprunghaft unter die zu erwartende Verhaltensrate. 22 © Psychologie des Lehrens und Lernens, TU Dresden Operantes Konditionieren 4,5 4 256 auf 16 256 64 auf 16 3,5 64 3 16 Änderung der Verstärkungsmenge (Futerpillen) Durchschnittsgeschwindigkeit (feet/sec) Negativer Kontrasteffekt (Crespi, 1942) 2,5 16 2 1,5 1 0,5 16 16 0 0 15 16 17 18 19 20 1 2 3 4 5 6 7 8 Versuchsdurchgänge 23 © Psychologie des Lehrens und Lernens, TU Dresden Tokensysteme Ö Tokens sind sekundäre Verstärker, die gegen primäre Verstärker oder andere sekundäre Verstärker eingetauscht werden können. 24 © Psychologie des Lehrens und Lernens, TU Dresden Sekundäre Verstärkung Tokensysteme 25 © Psychologie des Lehrens und Lernens, TU Dresden Klassisches / Operantes Konditionieren Ö Klassisches Konditionieren z gelernt wird die Auslösung von schon im Verhaltensrepertoire des Organismus vorhandenen Reaktionen durch neue Reize Ö Operantes Konditionieren z 26 durch die Verfahren des operanten Konditionierens wird die Auftretenswahrscheinlichkeit von Verhaltensweisen verändert © Psychologie des Lehrens und Lernens, TU Dresden Experimentalparadigma - Vergleich Klassisches und Operantes Konditionieren Klassisches Konditionieren: unabhängige Variablen: die Bedingungen, unter denen der mit dem unkonditionierten Reiz gekoppelte, zu konditionierende Reiz dargeboten wird (z.B. Zeitdauer oder Zeitpunkt zwischen Aufleuchten einer Lampe und Futtergabe) abhängige Variablen: Ausmaß der durch den konditionierten Reiz ausgelösten Reaktion (z.B. Menge des Speichelflusses) Operantes Konditionieren: unabhängige Variablen: Art der Verhaltenskonsequenz; Quantität und Qualität der Verhaltenskonsequenz; zeitlicher Abstand zwischen Verhalten und dessen Konsequenzen; diskriminative Hinweisreize; Verstärkungspläne abhängige Variablen: Lerngeschwindigkeit; Verhaltensrate; Löschungswiderstand 27 © Psychologie des Lehrens und Lernens, TU Dresden Literaturhinweis Ö Steiner, G. (1996) Lernen: 20 Szenarien aus dem Alltag. 28 © Psychologie des Lehrens und Lernens, TU Dresden