Lernen (2) Operantes Konditionieren Prof. Dr. Ralph Viehhauser Thorndikes Puzzle-Box Operantes Konditionieren Operant: Das Verhalten eines Organismus, das sich anhand der beobachtbaren Effekte auf die Umwelt beschreiben lässt. Operantes Konditionieren: Eine Lernform, bei der sich die Wahrscheinlichkeit einer Reaktion aufgrund einer Veränderung ihrer Konsequenzen ändert. Skinner-Box Kontingenz Unter Kontingenz (bei der Verstärkung) versteht man eine zuverlässige Beziehung zwischen einer Reaktion und den dadurch hervorgerufenen Änderungen in der Umwelt. Verstärkung Verstärker: Jeder Reiz, der, wenn er kontingent auf eine Reaktion erfolgt, die Wahrscheinlichkeit der Reaktion erhöht. Positive Verstärkung: Auf ein Verhalten (Reaktion) folgt ein angenehmer Reiz, der die Wahrscheinlichkeit der Reaktion erhöht. Negative Verstärkung: Auf ein Verhalten (Reaktion) folgt die Entfernung eines aversiven Reizes. Dadurch erhöht sich die Wahrscheinlichkeit der Reaktion. Operante Löschung Wenn ein Verhalten nicht länger vorhersagbare Konsequenzen zeigt, geht seine Auftretenshäufigkeit auf das Niveau zurück, dass es vor dem operanten Konditionieren besaß. Bestrafung Bestrafungsreiz: Jeder Reiz, der unter Kontingenzbedingungen mit einer Reaktion die Wahrscheinlichkeit dieser Reaktion senkt. Bestrafung 1. Art (positive Bestrafung): Auf ein Verhalten folgt ein aversiver Reiz, der die Wahrscheinlichkeit des Verhaltens senkt. Bestrafung 2. Art (negative Bestrafung): Auf ein Verhalten folgt der Wegfall eines angenehmen Reizes, wodurch die Wahrscheinlichkeit dieses Verhaltens sinkt. Klassifikation von Verstärkern (1) Primäre Verstärker: Biologisch begründete Verstärker wie beispielsweise Nahrung oder Wasser. Konditionierte (sekundäre) Verstärker: Im Rahmen des klassischen Konditionierens werden aus zuvor neutralen Stimuli Verstärker. Generalisierte Verstärker: sind eine Sonderform sekundärer Verstärker. Ihre Besonderheit besteht darin, mit sehr vielen primären und/oder sekundären Verstärkern assoziierbar zu sein und in diese umgetauscht werden zu können (z.B. Geld, Tokens) Klassifikation von Verstärkern (2) Materielle Verstärker: z.B. Nahrung, attraktive Gegenstände, Fleißbildchen, Geld Soziale Verstärker: z.B. Lob, anerkennende Worte, zustimmendes Nicken, Lächeln, Streicheln Aktivitätsverstärker: jede als angenehm erlebte Tätigkeit kann verstärkend wirken (z.B. nach der Erledigung der Hausaufgaben zum Spielen gehen) Verstärkerpläne Verstärkerpläne: Muster der Gabe oder Zurückhaltung von Verstärkern beim operanten Konditionieren. Grundsätzlich lassen sich unterscheiden: Intermittierende Verstärkung kann entweder nach einem Quotenplan oder nach einem Intervallplan erfolgen: Kontinuierliche Verstärkung: Verstärkung nach jeder Reaktion Intermittierende Verstärkung: Verstärkung hin und wieder Quotenplan: Verstärkung nach einer bestimmten Anzahl von Reaktionen. Intervallplan: Verstärkung nach einem bestimmten Zeitintervall. In beiden Fällen kann das Muster der Verstärkung entweder: konstant und somit fixiert oder unregelmäßig und somit variabel sein. Löschungsresistenz Reaktionen, die unter Plänen intermittierender Verstärkung erworben wurden, sind löschungsresistenter als Reaktionen, die unter kontinuierlichen Verstärkerplänen erworben wurden. Variable Quotenpläne produzieren den größten Löschungswiderstand (siehe z.B. Spielautomaten) Verhaltensgleichung (Bsp. zur positiven Verstärkung) Situation (S) Reaktion (R) Konsequenz (C) Johannes im Heim Weglaufen besondere Fürsorge (C+) Verhaltensgleichung (Bsp. zur negativen Verstärkung) Situation (S) Reaktion (R) Konsequenz (C) Nachbarin anwesend Mutter kauft Süßigkeit Tochter hört mit Quengeln auf (C-) Verhaltensgleichung (Bsp. zur Bestrafung durch Verstärkerentzug) Situation (S) Reaktion (R) Konsequenz (C) Termin keine Übung durchgeführt Termin wird beendet (C+) Verhaltensgleichung (Bsp. zur Bestrafung durch aversiven Reiz) Situation (S) Reaktion (R) Konsequenz (C) Beratungsgespräch offene Mitteilung Berater macht Vorhaltungen (C-) Beispiel für eine operante Analyse Immer wenn Katrin zu Bett gebracht wird, fängt sie zu jammern und zu weinen an. Die Mutter kommt dann zu ihr ins Kinderzimmer, setzt sich neben sie ans Bett, streichelt sie und erzählt eine Geschichte, woraufhin Katrin ruhig einschläft. Wie könnte eine operante Analyse aussehen? Was würden Sie der Mutter raten? Zwei-Faktoren-Theorie (von Mowrer) zur Erklärung des Bsp. Hundephobie In der ersten Phase: bildet sich durch klassische Konditionierung eine Angstreaktion, der zufolge ein Reiz aversive CS-Qualität gewinnt und die CR "Angst" auslöst. Wurde eine Person von einem Hund gebissen, lernt sie auf diese Weise, Hunde zu fürchten (UCS = Biss; UCR = Schmerz; CS = Hund; CR = Angst). In der zweiten Phase bildet sich auf der Grundlage operanten Lernens ein Verhalten, das zur Beseitigung des angstauslösenden konditionierten Reizes führt. Für die hundeängstliche Person wird die konditionierte Angstreaktion also zu einem diskriminativen Stimulus (SD), der die Auswahl eines Weges (R), auf dem man keinem Hund begegnet, anregt und auf diese Weise dazu führt, dass die Person keine Angst mehr zu haben braucht. Das Nachlassen der Angst wirkt dabei als negative Verstärkung. Intermittierende Verstärkung zur Erklärung abergläubischen Verhaltens Abergläubisches Verhalten kommt oft vor, wenn Organismen (intermittierend) verstärkenden Ereignissen ausgesetzt waren, die von ihrem Verhalten unabhängig sind. Die Organismen haben keine Kontrolle darüber, ob der Verstärker gegeben wird, aber sie verhalten sich so, als ob sie Kontrolle darüber hätten. Bsp.: Würfelrituale um eine „sechs“ zu Würfeln. Positive Verstärkung am Bsp. Sucht Negative Verstärkung am Bsp. Sucht Chronischer Drogengebrauch – ein verhaltenstheoretisches Paradoxon Trotz der erheblichen negativen (aversiven) Konsequenzen (wie gesundheitlicher und psychosozialer Folgeschäden), trotz der Abnahme der subjektiv erfahrenen Verstärkerwirkung wird das Drogen-Verhalten aufrechterhalten. Das verhängnisvolle Paradoxon ergibt sich v.a. aus der unterschiedlichen Wirkung von kurz- vs. langfristigen Konsequenzen: Selbst minimale (positiv oder negativ) verstärkende Wirkungen haben – wenn sie unmittelbar auf ein Verhalten folgen mehr Einfluss auf das Verhalten als massive aversive Folgen, wenn diese mit einer deutlichen zeitlichen Verzögerung auftreten. Operantes Lernen am Bsp. Sucht (1) Suchtmittel (SM) wirken i.S. einer positiven und/oder negativen Verstärkung. Durch negative Verstärkung erhöht sich die Auftretenswahrscheinlichkeit von Vermeidungsverhalten. Vermeidung verhindert die Löschung der problemat. S-RVerknüpfung. Wegen der fehlenden Übung kommt es zu einem Defizit an alternativen Verstärkern und Bewältigungsmöglichkeiten. Generalisierungseffekte und der Mangel an alternativen Verstärkern führen zu einer Inflation der Konsum-Anlässe. Operantes Lernen am Bsp. Sucht (2) Im Verlauf der Problementwicklung hat das SM zunehmend mehr die Funktion der negativen Verstärkung. Der SM-Konsum ist zwingend notwendig, um Unangenehmes zu vermeiden. SM-Konsum als Problemlöseversuch und Verstärkerquelle ist selbst zum Problem geworden mit einer Fülle negativer Konsequenzen. Versuche den Konsum zu reduzieren sind sehr schwierig, weil der gelegentliche Konsum zum Faktum einer intermittierenden Verstärkung (= hohe Löschungsresistenz) führt und kurzfristige Belohnungen eine sehr viel verhaltenssteuernde Wirkung haben als langfristig negative Konsequenzen. Kognition und operante Konditionierung Beim operanten Konditionieren spielen auch kognitive Prozesse eine Rolle! Beispiel „Latentes Lernen“ Ratten tendieren dazu, ohne offensichtliche Belohnung ein Labyrinth zu erkunden. Sie scheinen eine kognitive Landkarte zu entwickeln. Wenn ein Versuchsleiter dann eine Belohnung in den Ausgang des Labyrinths legt, verhalten sich die Ratten ebenso wie die Ratten, die mit Futter für den Labyrinthgang belohnt wurden. Bei ihren Erkundungsgängen scheinen die Ratten latentes Lernen zu praktizieren: eine Form des Lernens, die nur dann sichtbar wird, wenn es einen Anreiz gibt, sie zu zeigen. Daraus folgt, dass Lernen auch ohne Verstärkung oder Bestrafung stattfinden kann. Korrumpierung des intrinsischen Interesses durch extrinsische Belohung Die kognitive Perspektive hat auch zu einer wichtigen Einschränkung hinsichtlich des Einflusses von Belohnungen geführt: Unnötige Belohnungen wirken sich manchmal auch negativ aus. In Versuchen zeigte sich, dass Kinder, denen Geld versprochen wurde, wenn sie mit einem interessanten Spielzeug spielten, später seltener mit diesem Spielzeug spielten als Kinder, die nicht fürs Spielen bezahlt wurden (Deci et al. 1999). Operantes Lernen – Zusammenfassung (1) Operantes Lernen: Lernen aufgrund der Konsequenzen eines Verhaltens. 4 grundlegende Konsequenzen: Positive Verstärkung: Hinzufügen eines angenehmen Reizes Negative Verstärkung: Entfernen eines aversiven Reizes Bestrafung 1. Art: Hinzufügen eines aversiven Reizes Bestrafung 2. Art: Entfernen eines Verstärkers Klassifikation von Verstärkern und Strafreizen: primäre, sekundäre (konditionierte), generalisierte; materielle, soziale und aktivitätsbezogene Verstärkerpläne: kontinuierliche vs. intermittierende (fixierte vs. variable Quoten- vs. Intervall-) Pläne haben einen großen Einfluss auf den Erwerb und die Stabilität eines Verhaltens. Operantes Lernen – Zusammenfassung (2) Das Wissen zum operanten Lernen kann praktisch genutzt werden: zur Erklärung menschlichen Verhaltens (z.B. operante Analyse zwischenmenschlicher Interaktionen; Entwicklung problematischer Gewohnheiten). für eine systematische Veränderung von Verhalten: zum Aufbau (bzw. zur Festigung) erwünschten Verhaltens und/oder zum Abbau problematischen Verhaltens. Einschränkend muss bedacht werden, dass im Zuge des operanten Lernens auch Kognitionen eine Rolle spielen (latentes Lernen) und sich unnötige Belohnungen manchmal auch negativ auswirken können (Korrumpierung des intrinsischen Interesses durch extrinschische Belohnung).