Psych-Grund3,2-Lernen2

Werbung
Lernen (2)
Operantes Konditionieren
Prof. Dr. Ralph Viehhauser
Thorndikes
Puzzle-Box
Operantes Konditionieren

Operant: Das Verhalten eines Organismus, das
sich anhand der beobachtbaren Effekte auf die
Umwelt beschreiben lässt.

Operantes Konditionieren: Eine Lernform,
bei der sich die Wahrscheinlichkeit einer
Reaktion aufgrund einer Veränderung ihrer
Konsequenzen ändert.
Skinner-Box
Kontingenz
Unter Kontingenz (bei der Verstärkung)
versteht man eine zuverlässige Beziehung
zwischen einer Reaktion und den dadurch
hervorgerufenen Änderungen in der
Umwelt.
Verstärkung

Verstärker: Jeder Reiz, der, wenn er kontingent auf
eine Reaktion erfolgt, die Wahrscheinlichkeit der
Reaktion erhöht.

Positive Verstärkung: Auf ein Verhalten (Reaktion)
folgt ein angenehmer Reiz, der die Wahrscheinlichkeit
der Reaktion erhöht.

Negative Verstärkung: Auf ein Verhalten (Reaktion)
folgt die Entfernung eines aversiven Reizes. Dadurch
erhöht sich die Wahrscheinlichkeit der Reaktion.
Operante Löschung
Wenn ein Verhalten nicht länger vorhersagbare Konsequenzen zeigt, geht seine
Auftretenshäufigkeit auf das Niveau
zurück, dass es vor dem operanten
Konditionieren besaß.
Bestrafung

Bestrafungsreiz: Jeder Reiz, der unter Kontingenzbedingungen mit einer Reaktion die Wahrscheinlichkeit dieser
Reaktion senkt.

Bestrafung 1. Art (positive Bestrafung): Auf ein
Verhalten folgt ein aversiver Reiz, der die Wahrscheinlichkeit des Verhaltens senkt.

Bestrafung 2. Art (negative Bestrafung): Auf ein
Verhalten folgt der Wegfall eines angenehmen Reizes,
wodurch die Wahrscheinlichkeit dieses Verhaltens sinkt.
Klassifikation von Verstärkern (1)

Primäre Verstärker: Biologisch begründete Verstärker
wie beispielsweise Nahrung oder Wasser.

Konditionierte (sekundäre) Verstärker: Im Rahmen
des klassischen Konditionierens werden aus zuvor
neutralen Stimuli Verstärker.

Generalisierte Verstärker: sind eine Sonderform
sekundärer Verstärker. Ihre Besonderheit besteht darin,
mit sehr vielen primären und/oder sekundären
Verstärkern assoziierbar zu sein und in diese
umgetauscht werden zu können (z.B. Geld, Tokens)
Klassifikation von Verstärkern (2)

Materielle Verstärker: z.B. Nahrung, attraktive
Gegenstände, Fleißbildchen, Geld

Soziale Verstärker: z.B. Lob, anerkennende
Worte, zustimmendes Nicken, Lächeln,
Streicheln

Aktivitätsverstärker: jede als angenehm erlebte
Tätigkeit kann verstärkend wirken (z.B. nach der
Erledigung der Hausaufgaben zum Spielen
gehen)
Verstärkerpläne

Verstärkerpläne: Muster der Gabe oder Zurückhaltung von
Verstärkern beim operanten Konditionieren.

Grundsätzlich lassen sich unterscheiden:



Intermittierende Verstärkung kann entweder nach einem
Quotenplan oder nach einem Intervallplan erfolgen:



Kontinuierliche Verstärkung: Verstärkung nach jeder Reaktion
Intermittierende Verstärkung: Verstärkung hin und wieder
Quotenplan: Verstärkung nach einer bestimmten Anzahl von Reaktionen.
Intervallplan: Verstärkung nach einem bestimmten Zeitintervall.
In beiden Fällen kann das Muster der Verstärkung entweder:


konstant und somit fixiert oder
unregelmäßig und somit variabel sein.
Löschungsresistenz

Reaktionen, die unter Plänen intermittierender Verstärkung erworben wurden, sind löschungsresistenter als
Reaktionen, die unter kontinuierlichen Verstärkerplänen erworben wurden.

Variable Quotenpläne produzieren den größten
Löschungswiderstand (siehe z.B. Spielautomaten)
Verhaltensgleichung
(Bsp. zur positiven Verstärkung)
Situation (S)
Reaktion (R)
Konsequenz (C)
Johannes im
Heim
Weglaufen
besondere
Fürsorge (C+)
Verhaltensgleichung
(Bsp. zur negativen Verstärkung)
Situation (S)
Reaktion (R)
Konsequenz (C)
Nachbarin
anwesend
Mutter kauft
Süßigkeit
Tochter hört
mit Quengeln
auf (C-)
Verhaltensgleichung
(Bsp. zur Bestrafung durch
Verstärkerentzug)
Situation (S)
Reaktion (R)
Konsequenz (C)
Termin
keine Übung
durchgeführt
Termin wird
beendet (C+)
Verhaltensgleichung
(Bsp. zur Bestrafung durch aversiven Reiz)
Situation (S)
Reaktion (R)
Konsequenz (C)
Beratungsgespräch
offene
Mitteilung
Berater macht
Vorhaltungen (C-)
Beispiel für eine operante Analyse

Immer wenn Katrin zu Bett gebracht wird, fängt sie zu
jammern und zu weinen an. Die Mutter kommt dann
zu ihr ins Kinderzimmer, setzt sich neben sie ans Bett,
streichelt sie und erzählt eine Geschichte, woraufhin
Katrin ruhig einschläft.

Wie könnte eine operante Analyse aussehen? Was
würden Sie der Mutter raten?
Zwei-Faktoren-Theorie (von Mowrer) zur
Erklärung des Bsp. Hundephobie

In der ersten Phase: bildet sich durch klassische Konditionierung eine Angstreaktion, der zufolge ein Reiz aversive CS-Qualität
gewinnt und die CR "Angst" auslöst. Wurde eine Person von
einem Hund gebissen, lernt sie auf diese Weise, Hunde zu
fürchten (UCS = Biss; UCR = Schmerz; CS = Hund; CR =
Angst).

In der zweiten Phase bildet sich auf der Grundlage operanten
Lernens ein Verhalten, das zur Beseitigung des angstauslösenden
konditionierten Reizes führt. Für die hundeängstliche Person wird
die konditionierte Angstreaktion also zu einem diskriminativen
Stimulus (SD), der die Auswahl eines Weges (R), auf dem man
keinem Hund begegnet, anregt und auf diese Weise dazu führt,
dass die Person keine Angst mehr zu haben braucht. Das
Nachlassen der Angst wirkt dabei als negative Verstärkung.
Intermittierende Verstärkung zur
Erklärung abergläubischen Verhaltens

Abergläubisches Verhalten kommt oft vor, wenn
Organismen (intermittierend) verstärkenden Ereignissen ausgesetzt waren, die von ihrem Verhalten
unabhängig sind. Die Organismen haben keine
Kontrolle darüber, ob der Verstärker gegeben wird,
aber sie verhalten sich so, als ob sie Kontrolle darüber
hätten.

Bsp.: Würfelrituale um eine „sechs“ zu Würfeln.
Positive Verstärkung am Bsp. Sucht
Negative Verstärkung am Bsp. Sucht
Chronischer Drogengebrauch – ein
verhaltenstheoretisches Paradoxon

Trotz der erheblichen negativen (aversiven) Konsequenzen (wie
gesundheitlicher und psychosozialer Folgeschäden),

trotz der Abnahme der subjektiv erfahrenen Verstärkerwirkung
wird das Drogen-Verhalten aufrechterhalten.

Das verhängnisvolle Paradoxon ergibt sich v.a. aus der unterschiedlichen Wirkung von kurz- vs. langfristigen Konsequenzen:
Selbst minimale (positiv oder negativ) verstärkende Wirkungen
haben – wenn sie unmittelbar auf ein Verhalten folgen mehr
Einfluss auf das Verhalten als massive aversive Folgen, wenn
diese mit einer deutlichen zeitlichen Verzögerung auftreten.
Operantes Lernen am Bsp. Sucht (1)

Suchtmittel (SM) wirken i.S. einer positiven und/oder negativen
Verstärkung.

Durch negative Verstärkung erhöht sich die Auftretenswahrscheinlichkeit von Vermeidungsverhalten.

Vermeidung verhindert die Löschung der problemat. S-RVerknüpfung.

Wegen der fehlenden Übung kommt es zu einem Defizit an
alternativen Verstärkern und Bewältigungsmöglichkeiten.

Generalisierungseffekte und der Mangel an alternativen
Verstärkern führen zu einer Inflation der Konsum-Anlässe.
Operantes Lernen am Bsp. Sucht (2)

Im Verlauf der Problementwicklung hat das SM zunehmend
mehr die Funktion der negativen Verstärkung. Der SM-Konsum
ist zwingend notwendig, um Unangenehmes zu vermeiden.

SM-Konsum als Problemlöseversuch und Verstärkerquelle ist
selbst zum Problem geworden mit einer Fülle negativer
Konsequenzen.

Versuche den Konsum zu reduzieren sind sehr schwierig, weil
der gelegentliche Konsum zum Faktum einer intermittierenden
Verstärkung (= hohe Löschungsresistenz) führt und kurzfristige
Belohnungen eine sehr viel verhaltenssteuernde Wirkung haben
als langfristig negative Konsequenzen.
Kognition und operante
Konditionierung
Beim operanten Konditionieren spielen
auch kognitive Prozesse eine Rolle!
Beispiel „Latentes Lernen“

Ratten tendieren dazu, ohne offensichtliche Belohnung ein
Labyrinth zu erkunden. Sie scheinen eine kognitive Landkarte
zu entwickeln. Wenn ein Versuchsleiter dann eine Belohnung in
den Ausgang des Labyrinths legt, verhalten sich die Ratten ebenso
wie die Ratten, die mit Futter für den Labyrinthgang belohnt
wurden.

Bei ihren Erkundungsgängen scheinen die Ratten latentes
Lernen zu praktizieren: eine Form des Lernens, die nur dann
sichtbar wird, wenn es einen Anreiz gibt, sie zu zeigen.

Daraus folgt, dass Lernen auch ohne Verstärkung oder
Bestrafung stattfinden kann.
Korrumpierung des intrinsischen
Interesses durch extrinsische Belohung

Die kognitive Perspektive hat auch zu einer wichtigen Einschränkung hinsichtlich des Einflusses von Belohnungen
geführt: Unnötige Belohnungen wirken sich manchmal auch
negativ aus.

In Versuchen zeigte sich, dass Kinder, denen Geld versprochen
wurde, wenn sie mit einem interessanten Spielzeug spielten,
später seltener mit diesem Spielzeug spielten als Kinder, die nicht
fürs Spielen bezahlt wurden (Deci et al. 1999).
Operantes Lernen – Zusammenfassung (1)

Operantes Lernen: Lernen aufgrund der Konsequenzen eines
Verhaltens.

4 grundlegende Konsequenzen:

Positive Verstärkung: Hinzufügen eines angenehmen Reizes

Negative Verstärkung: Entfernen eines aversiven Reizes

Bestrafung 1. Art: Hinzufügen eines aversiven Reizes

Bestrafung 2. Art: Entfernen eines Verstärkers

Klassifikation von Verstärkern und Strafreizen: primäre,
sekundäre (konditionierte), generalisierte; materielle, soziale und
aktivitätsbezogene

Verstärkerpläne: kontinuierliche vs. intermittierende (fixierte vs.
variable Quoten- vs. Intervall-) Pläne haben einen großen
Einfluss auf den Erwerb und die Stabilität eines Verhaltens.
Operantes Lernen – Zusammenfassung (2)


Das Wissen zum operanten Lernen kann praktisch genutzt werden:

zur Erklärung menschlichen Verhaltens (z.B. operante Analyse zwischenmenschlicher Interaktionen; Entwicklung problematischer Gewohnheiten).

für eine systematische Veränderung von Verhalten: zum Aufbau (bzw. zur
Festigung) erwünschten Verhaltens und/oder zum Abbau problematischen
Verhaltens.
Einschränkend muss bedacht werden, dass im Zuge des operanten
Lernens auch Kognitionen eine Rolle spielen (latentes Lernen) und
sich unnötige Belohnungen manchmal auch negativ auswirken
können (Korrumpierung des intrinsischen Interesses durch
extrinschische Belohnung).
Herunterladen