Lernen (2) Operantes Konditionieren Prof. Dr. Ralph Viehhauser Thorndikes Puzzle-Box Operantes Konditionieren Operant: Operant: Das Verhalten eines Organismus, das sich anhand der beobachtbaren Effekte auf die Umwelt beschreiben lä lässt. Operantes Konditionieren: Eine Lernform, bei der sich die Wahrscheinlichkeit einer Reaktion aufgrund einer Verä Veränderung ihrer Konsequenzen ändert. 1 Skinner-Box Kontingenz Unter Kontingenz (bei der Verstä Verstärkung) versteht man eine zuverlä zuverlässige Beziehung zwischen einer Reaktion und den dadurch hervorgerufenen Änderungen in der Umwelt. 2 Verstärkung Verstä Verstärker: Jeder Reiz, der, wenn er kontingent auf eine Reaktion erfolgt, die Wahrscheinlichkeit der Reaktion erhö erhöht. Positive Verstä Verstärkung: Auf ein Verhalten (Reaktion) folgt ein angenehmer Reiz, der die Wahrscheinlichkeit der Reaktion erhö erhöht. Negative Verstä Verstärkung: Auf ein Verhalten (Reaktion) folgt die Entfernung eines aversiven Reizes. Dadurch erhö erhöht sich die Wahrscheinlichkeit der Reaktion. 3 Operante Löschung Wenn ein Verhalten nicht lä länger vorhervorhersagbare Konsequenzen zeigt, geht seine Auftretenshä Auftretenshäufigkeit auf das Niveau zurü zurück, dass es vor dem operanten Konditionieren besaß besaß. Bestrafung Bestrafungsreiz: Jeder Reiz, der unter KontingenzbedinKontingenzbedingungen mit einer Reaktion die Wahrscheinlichkeit dieser Reaktion senkt. Bestrafung 1. Art (positive Bestrafung): Auf ein Verhalten folgt ein aversiver Reiz, der die WahrWahrscheinlichkeit des Verhaltens senkt. Bestrafung 2. Art (negative Bestrafung): Auf ein Verhalten folgt der Wegfall eines angenehmen Reizes, wodurch die Wahrscheinlichkeit dieses Verhaltens sinkt. 4 Klassifikation von Verstä Verstärkern (1) Primä Primäre Verstä Verstärker: Biologisch begrü begründete Verstä Verstärker wie beispielsweise Nahrung oder Wasser. Konditionierte (sekundä (sekundäre) Verstä Verstärker: rker: Im Rahmen des klassischen Konditionierens werden aus zuvor neutralen Stimuli Verstä Verstärker. Generalisierte Verstä Verstärker: sind eine Sonderform sekundä sekundärer Verstä Verstärker. Ihre Besonderheit besteht darin, mit sehr vielen primä primären und/oder sekundä sekundären Verstä Verstärkern assoziierbar zu sein und in diese umgetauscht werden zu kö können (z.B. Geld, Tokens) Tokens) Klassifikation von Verstä Verstärkern (2) Materielle Verstä Verstärker: z.B. Nahrung, attraktive Gegenstä Gegenstände, Fleiß Fleißbildchen, Geld Soziale Verstä Verstärker: z.B. Lob, anerkennende Worte, zustimmendes Nicken, Lä Lächeln, Streicheln Aktivitä Aktivitätsverstä tsverstärker: jede als angenehm erlebte Tätigkeit kann verstä verstärkend wirken (z.B. nach der Erledigung der Hausaufgaben zum Spielen gehen) Verstärkerpläne Verstä Verstärkerplä rkerpläne: Muster der Gabe oder Zurü Zurückhaltung von Verstä Verstärkern beim operanten Konditionieren. Grundsä Grundsätzlich lassen sich unterscheiden: Intermittierende Verstä Verstärkung kann entweder nach einem Quotenplan oder nach einem Intervallplan erfolgen: Kontinuierliche Verstä Verstärkung: Verstä Verstärkung nach jeder Reaktion Intermittierende Verstä Verstärkung: Verstä Verstärkung hin und wieder Quotenplan: Verstä Verstärkung nach einer bestimmten Anzahl von Reaktionen. Intervallplan: Verstä Verstärkung nach einem bestimmten Zeitintervall. In beiden Fä Fällen kann das Muster der Verstä Verstärkung entweder: konstant und somit fixiert oder unregelmäß ig und somit variabel sein. unregelmäßig 5 Löschungsresistenz Reaktionen, die unter Plä Plänen intermittierender Verstä Verstärkung erworben wurden, sind lö löschungsresistenter als Reaktionen, die unter kontinuierlichen Verstä Verstärkerplä rkerplänen erworben wurden. Variable Quotenplä ten Quotenpläne produzieren den größ größten Löschungswiderstand (siehe z.B. Spielautomaten) Verhaltensgleichung (Bsp. zur positiven Verstä Verstärkung) Situation (S) Reaktion (R) Konsequenz (C) Johannes im Heim Weglaufen besondere Fürsorge (C+) Verhaltensgleichung (Bsp. zur negativen Verstä Verstärkung) Situation (S) Reaktion (R) Konsequenz (C) Nachbarin anwesend Mutter kauft Süßigkeit Tochter hört mit Quengeln auf (C-) 6 Verhaltensgleichung (Bsp. zur Bestrafung durch Verstä Verstärkerentzug) Situation (S) Reaktion (R) Konsequenz (C) Termin keine Übung durchgeführt Termin wird beendet (C+) Verhaltensgleichung (Bsp. zur Bestrafung durch aversiven Reiz) Situation (S) Reaktion (R) Konsequenz (C) Beratungsgespräch offene Mitteilung Berater macht Vorhaltungen (C-) Beispiel fü für eine operante Analyse Immer wenn Katrin zu Bett gebracht wird, fä fängt sie zu jammern und zu weinen an. Die Mutter kommt dann zu ihr ins Kinderzimmer, setzt sich neben sie ans Bett, streichelt sie und erzä erzählt eine Geschichte, woraufhin Katrin ruhig einschlä einschläft. Wie kö könnte eine operante Analyse aussehen? Was würden Sie der Mutter raten? 7 ZweiZwei-FaktorenFaktoren-Theorie (von Mowrer) Mowrer) zur Erklä Erklärung des Bsp. Hundephobie In der ersten Phase: bildet sich durch klassische KonditionieKonditionierung eine Angstreaktion, der zufolge ein Reiz aversive CSCS-Qualitä Qualität gewinnt und die CR "Angst" auslö auslöst. Wurde eine Person von einem Hund gebissen, lernt sie auf diese Weise, Hunde zu fürchten (UCS = Biss; UCR = Schmerz; CS = Hund; CR = Angst). In der zweiten Phase bildet sich auf der Grundlage operanten Lernens ein Verhalten, das zur Beseitigung des angstauslö angstauslösenden konditionierten Reizes fü führt. Fü Für die hundeä hundeängstliche Person wird die konditionierte Angstreaktion also zu einem diskriminativen Stimulus (SD), der die Auswahl eines Weges (R), auf dem man keinem Hund begegnet, anregt und auf diese Weise dazu fü führt, dass die Person keine Angst mehr zu haben braucht. Das Nachlassen der Angst wirkt dabei als negative Verstä Verstärkung. Intermittierende Verstä Verstärkung zur Erklä Erklärung aberglä abergläubischen Verhaltens Aberglä Abergläubisches Verhalten kommt oft vor, wenn Organismen (intermittierend) verstä verstärkenden EreigEreignissen ausgesetzt waren, die von ihrem Verhalten unabhä unabhängig sind. Die Organismen haben keine Kontrolle darü darüber, ob der Verstä Verstärker gegeben wird, aber sie verhalten sich so, als ob sie Kontrolle darü darüber hätten. Bsp.: Wü Würfelrituale um eine „sechs“ sechs“ zu Wü Würfeln. Positive Verstärkung am Bsp. Sucht 8 Negative Verstärkung am Bsp. Sucht 9 Chronischer Drogengebrauch – ein verhaltenstheoretisches Paradoxon Trotz der erheblichen negativen (aversiven (aversiven)) Konsequenzen (wie gesundheitlicher und psychosozialer Folgeschä Folgeschäden), trotz der Abnahme der subjektiv erfahrenen Verstä Verstärkerwirkung wird das DrogenDrogen-Verhalten aufrechterhalten. Das verhä verhängnisvolle Paradoxon ergibt sich v.a. v.a. aus der unterunterschiedlichen Wirkung von kurzkurz- vs. langfristigen Konsequenzen: Selbst minimale (positiv oder negativ) verstä verstärkende Wirkungen haben – wenn sie unmittelbar auf ein Verhalten folgen mehr Einfluss auf das Verhalten als massive aversive Folgen, wenn diese mit einer deutlichen zeitlichen Verzö Verzögerung auftreten. Operantes Lernen am Bsp. Sucht (1) Suchtmittel (SM) wirken i.S. i.S. einer positiven und/oder negativen Verstä Verstärkung. Durch negative Verstä Verstärkung erhö erhöht sich die AuftretenswahrAuftretenswahrscheinlichkeit von Vermeidungsverhalten. Vermeidung verhindert die Lö Löschung der problemat. problemat. SS-RVerknü Verknüpfung. Wegen der fehlenden Übung kommt es zu einem Defizit an alternativen Verstä Verstärkern und Bewä Bewältigungsmö ltigungsmöglichkeiten. Generalisierungseffekte und der Mangel an alternativen Verstä Verstärkern fü führen zu einer Inflation der KonsumKonsum-Anlä Anlässe. 10 Operantes Lernen am Bsp. Sucht (2) Im Verlauf der Problementwicklung hat das SM zunehmend mehr die Funktion der negativen Verstä Verstärkung. Der SMSM-Konsum ist zwingend notwendig, um Unangenehmes zu vermeiden. SMSM-Konsum als Problemlö Problemlöseversuch und Verstä Verstärkerquelle ist selbst zum Problem geworden mit einer Fü Fülle negativer Konsequenzen. Versuche den Konsum zu reduzieren sind sehr schwierig, weil der gelegentliche Konsum zum Faktum einer intermittierenden Verstä Verstärkung (= hohe Lö Löschungsresistenz) fü führt und kurzfristige Belohnungen eine sehr viel verhaltenssteuernde Wirkung haben als langfristig negative Konsequenzen. Kognition und operante Konditionierung Beim operanten Konditionieren spielen auch kognitive Prozesse eine Rolle! 11 Beispiel „Latentes Lernen“ Lernen“ Ratten tendieren dazu, ohne offensichtliche Belohnung ein Labyrinth zu erkunden. Sie scheinen eine kognitive Landkarte zu entwickeln. Wenn ein Versuchsleiter dann eine Belohnung in den Ausgang des Labyrinths legt, verhalten sich die Ratten ebenso ebenso wie die Ratten, die mit Futter fü für den Labyrinthgang belohnt wurden. Bei ihren Erkundungsgä Erkundungsgängen scheinen die Ratten latentes Lernen zu praktizieren: eine Form des Lernens, die nur dann sichtbar wird, wenn es einen Anreiz gibt, sie zu zeigen. Daraus folgt, dass Lernen auch ohne Verstä Verstärkung oder Bestrafung stattfinden kann. Korrumpierung des intrinsischen Interesses durch extrinsische Belohung Die kognitive Perspektive hat auch zu einer wichtigen EinEinschrä schränkung hinsichtlich des Einflusses von Belohnungen gefü geführt: Unnö Unnötige Belohnungen wirken sich manchmal auch negativ aus. In Versuchen zeigte sich, dass Kinder, denen Geld versprochen wurde, wenn sie mit einem interessanten Spielzeug spielten, spä später seltener mit diesem Spielzeug spielten als Kinder, die nicht fürs Spielen bezahlt wurden (Deci (Deci et al. 1999). Operantes Lernen – Zusammenfassung (1) Operantes Lernen: Lernen aufgrund der Konsequenzen eines Verhaltens. 4 grundlegende Konsequenzen: Positive Verstä Verstärkung: Hinzufü Hinzufügen eines angenehmen Reizes Negative Verstä Verstärkung: Entfernen eines aversiven Reizes Bestrafung 1. Art: Hinzufü Hinzufügen eines aversiven Reizes Bestrafung 2. Art: Entfernen eines Verstä Verstärkers Klassifikation von Verstä Verstärkern und Strafreizen: primä primäre, sekundä sekundäre (konditionierte), generalisierte; materielle, soziale und aktivitä aktivitätsbezogene Verstä Verstärkerplä rkerpläne: kontinuierliche vs. intermittierende (fixierte vs. variable QuotenQuoten- vs. IntervallIntervall-) Plä Pläne haben einen groß großen Einfluss auf den Erwerb und die Stabilitä Stabilität eines Verhaltens. 12 Operantes Lernen – Zusammenfassung (2) Das Wissen zum operanten Lernen kann praktisch genutzt werden: zur Erklä Erklärung menschlichen Verhaltens (z.B. operante Analyse zwischenmenzwischenmenschlicher Interaktionen; Entwicklung problematischer Gewohnheiten). für eine systematische Verä Veränderung von Verhalten: zum Aufbau (bzw. zur Festigung) erwü erwünschten Verhaltens und/oder zum Abbau problematischen Verhaltens. Einschrä Einschränkend muss bedacht werden, dass im Zuge des operanten Lernens auch Kognitionen eine Rolle spielen (latentes Lernen) und sich unnö unnötige Belohnungen manchmal auch negativ auswirken können (Korrumpierung des intrinsischen Interesses durch extrinschische Belohnung). 13