Lernen (2)

Werbung
Lernen (2)
Operantes Konditionieren
Prof. Dr. Ralph Viehhauser
Thorndikes
Puzzle-Box
Operantes Konditionieren
Operant:
Operant: Das Verhalten eines Organismus, das
sich anhand der beobachtbaren Effekte auf die
Umwelt beschreiben lä
lässt.
Operantes Konditionieren: Eine Lernform,
bei der sich die Wahrscheinlichkeit einer
Reaktion aufgrund einer Verä
Veränderung ihrer
Konsequenzen ändert.
1
Skinner-Box
Kontingenz
Unter Kontingenz (bei der Verstä
Verstärkung)
versteht man eine zuverlä
zuverlässige Beziehung
zwischen einer Reaktion und den dadurch
hervorgerufenen Änderungen in der
Umwelt.
2
Verstärkung
Verstä
Verstärker: Jeder Reiz, der, wenn er kontingent auf
eine Reaktion erfolgt, die Wahrscheinlichkeit der
Reaktion erhö
erhöht.
Positive Verstä
Verstärkung: Auf ein Verhalten (Reaktion)
folgt ein angenehmer Reiz, der die Wahrscheinlichkeit
der Reaktion erhö
erhöht.
Negative Verstä
Verstärkung: Auf ein Verhalten (Reaktion)
folgt die Entfernung eines aversiven Reizes. Dadurch
erhö
erhöht sich die Wahrscheinlichkeit der Reaktion.
3
Operante Löschung
Wenn ein Verhalten nicht lä
länger vorhervorhersagbare Konsequenzen zeigt, geht seine
Auftretenshä
Auftretenshäufigkeit auf das Niveau
zurü
zurück, dass es vor dem operanten
Konditionieren besaß
besaß.
Bestrafung
Bestrafungsreiz: Jeder Reiz, der unter KontingenzbedinKontingenzbedingungen mit einer Reaktion die Wahrscheinlichkeit dieser
Reaktion senkt.
Bestrafung 1. Art (positive Bestrafung): Auf ein
Verhalten folgt ein aversiver Reiz, der die WahrWahrscheinlichkeit des Verhaltens senkt.
Bestrafung 2. Art (negative Bestrafung): Auf ein
Verhalten folgt der Wegfall eines angenehmen Reizes,
wodurch die Wahrscheinlichkeit dieses Verhaltens sinkt.
4
Klassifikation von Verstä
Verstärkern (1)
Primä
Primäre Verstä
Verstärker: Biologisch begrü
begründete Verstä
Verstärker
wie beispielsweise Nahrung oder Wasser.
Konditionierte (sekundä
(sekundäre) Verstä
Verstärker:
rker: Im Rahmen
des klassischen Konditionierens werden aus zuvor
neutralen Stimuli Verstä
Verstärker.
Generalisierte Verstä
Verstärker: sind eine Sonderform
sekundä
sekundärer Verstä
Verstärker. Ihre Besonderheit besteht darin,
mit sehr vielen primä
primären und/oder sekundä
sekundären
Verstä
Verstärkern assoziierbar zu sein und in diese
umgetauscht werden zu kö
können (z.B. Geld, Tokens)
Tokens)
Klassifikation von Verstä
Verstärkern (2)
Materielle Verstä
Verstärker: z.B. Nahrung, attraktive
Gegenstä
Gegenstände, Fleiß
Fleißbildchen, Geld
Soziale Verstä
Verstärker: z.B. Lob, anerkennende
Worte, zustimmendes Nicken, Lä
Lächeln,
Streicheln
Aktivitä
Aktivitätsverstä
tsverstärker: jede als angenehm erlebte
Tätigkeit kann verstä
verstärkend wirken (z.B. nach der
Erledigung der Hausaufgaben zum Spielen
gehen)
Verstärkerpläne
Verstä
Verstärkerplä
rkerpläne: Muster der Gabe oder Zurü
Zurückhaltung von
Verstä
Verstärkern beim operanten Konditionieren.
Grundsä
Grundsätzlich lassen sich unterscheiden:
Intermittierende Verstä
Verstärkung kann entweder nach einem
Quotenplan oder nach einem Intervallplan erfolgen:
Kontinuierliche Verstä
Verstärkung: Verstä
Verstärkung nach jeder Reaktion
Intermittierende Verstä
Verstärkung: Verstä
Verstärkung hin und wieder
Quotenplan: Verstä
Verstärkung nach einer bestimmten Anzahl von Reaktionen.
Intervallplan: Verstä
Verstärkung nach einem bestimmten Zeitintervall.
In beiden Fä
Fällen kann das Muster der Verstä
Verstärkung entweder:
konstant und somit fixiert oder
unregelmäß
ig und somit variabel sein.
unregelmäßig
5
Löschungsresistenz
Reaktionen, die unter Plä
Plänen intermittierender Verstä
Verstärkung erworben wurden, sind lö
löschungsresistenter als
Reaktionen, die unter kontinuierlichen Verstä
Verstärkerplä
rkerplänen erworben wurden.
Variable Quotenplä
ten
Quotenpläne produzieren den größ
größten
Löschungswiderstand (siehe z.B. Spielautomaten)
Verhaltensgleichung
(Bsp. zur positiven Verstä
Verstärkung)
Situation (S)
Reaktion (R)
Konsequenz (C)
Johannes im
Heim
Weglaufen
besondere
Fürsorge (C+)
Verhaltensgleichung
(Bsp. zur negativen Verstä
Verstärkung)
Situation (S)
Reaktion (R)
Konsequenz (C)
Nachbarin
anwesend
Mutter kauft
Süßigkeit
Tochter hört
mit Quengeln
auf (C-)
6
Verhaltensgleichung
(Bsp. zur Bestrafung durch
Verstä
Verstärkerentzug)
Situation (S)
Reaktion (R)
Konsequenz (C)
Termin
keine Übung
durchgeführt
Termin wird
beendet (C+)
Verhaltensgleichung
(Bsp. zur Bestrafung durch aversiven Reiz)
Situation (S)
Reaktion (R)
Konsequenz (C)
Beratungsgespräch
offene
Mitteilung
Berater macht
Vorhaltungen (C-)
Beispiel fü
für eine operante Analyse
Immer wenn Katrin zu Bett gebracht wird, fä
fängt sie zu
jammern und zu weinen an. Die Mutter kommt dann
zu ihr ins Kinderzimmer, setzt sich neben sie ans Bett,
streichelt sie und erzä
erzählt eine Geschichte, woraufhin
Katrin ruhig einschlä
einschläft.
Wie kö
könnte eine operante Analyse aussehen? Was
würden Sie der Mutter raten?
7
ZweiZwei-FaktorenFaktoren-Theorie (von Mowrer)
Mowrer) zur
Erklä
Erklärung des Bsp. Hundephobie
In der ersten Phase: bildet sich durch klassische KonditionieKonditionierung eine Angstreaktion, der zufolge ein Reiz aversive CSCS-Qualitä
Qualität
gewinnt und die CR "Angst" auslö
auslöst. Wurde eine Person von
einem Hund gebissen, lernt sie auf diese Weise, Hunde zu
fürchten (UCS = Biss; UCR = Schmerz; CS = Hund; CR =
Angst).
In der zweiten Phase bildet sich auf der Grundlage operanten
Lernens ein Verhalten, das zur Beseitigung des angstauslö
angstauslösenden
konditionierten Reizes fü
führt. Fü
Für die hundeä
hundeängstliche Person wird
die konditionierte Angstreaktion also zu einem diskriminativen
Stimulus (SD), der die Auswahl eines Weges (R), auf dem man
keinem Hund begegnet, anregt und auf diese Weise dazu fü
führt,
dass die Person keine Angst mehr zu haben braucht. Das
Nachlassen der Angst wirkt dabei als negative Verstä
Verstärkung.
Intermittierende Verstä
Verstärkung zur
Erklä
Erklärung aberglä
abergläubischen Verhaltens
Aberglä
Abergläubisches Verhalten kommt oft vor, wenn
Organismen (intermittierend) verstä
verstärkenden EreigEreignissen ausgesetzt waren, die von ihrem Verhalten
unabhä
unabhängig sind. Die Organismen haben keine
Kontrolle darü
darüber, ob der Verstä
Verstärker gegeben wird,
aber sie verhalten sich so, als ob sie Kontrolle darü
darüber
hätten.
Bsp.: Wü
Würfelrituale um eine „sechs“
sechs“ zu Wü
Würfeln.
Positive Verstärkung am Bsp. Sucht
8
Negative Verstärkung am Bsp. Sucht
9
Chronischer Drogengebrauch – ein
verhaltenstheoretisches Paradoxon
Trotz der erheblichen negativen (aversiven
(aversiven)) Konsequenzen (wie
gesundheitlicher und psychosozialer Folgeschä
Folgeschäden),
trotz der Abnahme der subjektiv erfahrenen Verstä
Verstärkerwirkung
wird das DrogenDrogen-Verhalten aufrechterhalten.
Das verhä
verhängnisvolle Paradoxon ergibt sich v.a.
v.a. aus der unterunterschiedlichen Wirkung von kurzkurz- vs. langfristigen Konsequenzen:
Selbst minimale (positiv oder negativ) verstä
verstärkende Wirkungen
haben – wenn sie unmittelbar auf ein Verhalten folgen mehr
Einfluss auf das Verhalten als massive aversive Folgen, wenn
diese mit einer deutlichen zeitlichen Verzö
Verzögerung auftreten.
Operantes Lernen am Bsp. Sucht (1)
Suchtmittel (SM) wirken i.S.
i.S. einer positiven und/oder negativen
Verstä
Verstärkung.
Durch negative Verstä
Verstärkung erhö
erhöht sich die AuftretenswahrAuftretenswahrscheinlichkeit von Vermeidungsverhalten.
Vermeidung verhindert die Lö
Löschung der problemat.
problemat. SS-RVerknü
Verknüpfung.
Wegen der fehlenden Übung kommt es zu einem Defizit an
alternativen Verstä
Verstärkern und Bewä
Bewältigungsmö
ltigungsmöglichkeiten.
Generalisierungseffekte und der Mangel an alternativen
Verstä
Verstärkern fü
führen zu einer Inflation der KonsumKonsum-Anlä
Anlässe.
10
Operantes Lernen am Bsp. Sucht (2)
Im Verlauf der Problementwicklung hat das SM zunehmend
mehr die Funktion der negativen Verstä
Verstärkung. Der SMSM-Konsum
ist zwingend notwendig, um Unangenehmes zu vermeiden.
SMSM-Konsum als Problemlö
Problemlöseversuch und Verstä
Verstärkerquelle ist
selbst zum Problem geworden mit einer Fü
Fülle negativer
Konsequenzen.
Versuche den Konsum zu reduzieren sind sehr schwierig, weil
der gelegentliche Konsum zum Faktum einer intermittierenden
Verstä
Verstärkung (= hohe Lö
Löschungsresistenz) fü
führt und kurzfristige
Belohnungen eine sehr viel verhaltenssteuernde Wirkung haben
als langfristig negative Konsequenzen.
Kognition und operante
Konditionierung
Beim operanten Konditionieren spielen
auch kognitive Prozesse eine Rolle!
11
Beispiel „Latentes Lernen“
Lernen“
Ratten tendieren dazu, ohne offensichtliche Belohnung ein
Labyrinth zu erkunden. Sie scheinen eine kognitive Landkarte
zu entwickeln. Wenn ein Versuchsleiter dann eine Belohnung in
den Ausgang des Labyrinths legt, verhalten sich die Ratten ebenso
ebenso
wie die Ratten, die mit Futter fü
für den Labyrinthgang belohnt
wurden.
Bei ihren Erkundungsgä
Erkundungsgängen scheinen die Ratten latentes
Lernen zu praktizieren: eine Form des Lernens, die nur dann
sichtbar wird, wenn es einen Anreiz gibt, sie zu zeigen.
Daraus folgt, dass Lernen auch ohne Verstä
Verstärkung oder
Bestrafung stattfinden kann.
Korrumpierung des intrinsischen
Interesses durch extrinsische Belohung
Die kognitive Perspektive hat auch zu einer wichtigen EinEinschrä
schränkung hinsichtlich des Einflusses von Belohnungen
gefü
geführt: Unnö
Unnötige Belohnungen wirken sich manchmal auch
negativ aus.
In Versuchen zeigte sich, dass Kinder, denen Geld versprochen
wurde, wenn sie mit einem interessanten Spielzeug spielten,
spä
später seltener mit diesem Spielzeug spielten als Kinder, die nicht
fürs Spielen bezahlt wurden (Deci
(Deci et al. 1999).
Operantes Lernen – Zusammenfassung (1)
Operantes Lernen: Lernen aufgrund der Konsequenzen eines
Verhaltens.
4 grundlegende Konsequenzen:
Positive Verstä
Verstärkung: Hinzufü
Hinzufügen eines angenehmen Reizes
Negative Verstä
Verstärkung: Entfernen eines aversiven Reizes
Bestrafung 1. Art: Hinzufü
Hinzufügen eines aversiven Reizes
Bestrafung 2. Art: Entfernen eines Verstä
Verstärkers
Klassifikation von Verstä
Verstärkern und Strafreizen: primä
primäre,
sekundä
sekundäre (konditionierte), generalisierte; materielle, soziale und
aktivitä
aktivitätsbezogene
Verstä
Verstärkerplä
rkerpläne: kontinuierliche vs. intermittierende (fixierte vs.
variable QuotenQuoten- vs. IntervallIntervall-) Plä
Pläne haben einen groß
großen
Einfluss auf den Erwerb und die Stabilitä
Stabilität eines Verhaltens.
12
Operantes Lernen – Zusammenfassung (2)
Das Wissen zum operanten Lernen kann praktisch genutzt werden:
zur Erklä
Erklärung menschlichen Verhaltens (z.B. operante Analyse zwischenmenzwischenmenschlicher Interaktionen; Entwicklung problematischer Gewohnheiten).
für eine systematische Verä
Veränderung von Verhalten: zum Aufbau (bzw. zur
Festigung) erwü
erwünschten Verhaltens und/oder zum Abbau problematischen
Verhaltens.
Einschrä
Einschränkend muss bedacht werden, dass im Zuge des operanten
Lernens auch Kognitionen eine Rolle spielen (latentes Lernen) und
sich unnö
unnötige Belohnungen manchmal auch negativ auswirken
können (Korrumpierung des intrinsischen Interesses durch
extrinschische Belohnung).
13
Herunterladen