Operante Konditionierung

LERNEN
1
Experimentelle Untersuchung
der klassischen
Konditionierung
Ivan P. Pavlov
(1849-1936)
Speichelsekretion
beim Hund
1927
2
klassische Konditionierung
Versuchsaufbau von
Pavlov
3
klassische Konditionierung
Versuchsaufbau von
Pavlov
1) Futter  Speichelabsonderung
2) Ton  neutrale Reaktion, Bsp. Ohrenaufstellen
3) Futter und Ton  Speichelabsonderung
4) Ton  Speichelabsonderung
4
klassische Konditionierung
Abkürzungen
US = unkonditionierter Reiz/Stimulus
Futter
UR = unkonditionierte Reaktion
Speichelabsonderung
CS = konditionierter Reiz
Ton
CR = konditionierte Reaktion
Speichelabsonderung
5
klassische Konditionierung
Versuchsablauf
US Futter
 UR Speichelabsonderung
Kontrollphase
NS Ton
 neutrale Reaktion (soll keine Speichelabsonderung
auslösen aber Orientierungsreaktion OR)
US Futter und NS Ton
UR Speichelabsonderung
 NS wird CS und UR wird CR
CS Ton
 CR Speichelabsonderung
Konditionierungsphase
Löschungsphase
Spontanerholung6
Phasen des
experimentellen
Vorgehens
Kontrollphase
klassische Konditionierung
1)
US zuverlässiger Auslöser der UR
NS keine UR aber OR
2) Konditionierungsphase
NS und US mehrmals gleichzeitig
dargeboten, zeitliche Beziehung!
7
klassische Konditionierung
2) Konditionierungsphase
Zeitliche Beziehung zwischen US und NS
1) Verzögerte Konditionierung
2) Simultane Konditionierung
3) Spurenkonditionierung
4) Rückwirkende Konditionierung
8
Zeitliche Beziehung
zwischen NS und US
Bezeichnung
Verzögerte Konditionierung
NS
Simultane
Konditionierung
NS
Spurenkonditionierung
NS
Rückwirkende Konditionierung
NS
Zeit
Zeitliche Beziehung zwischen NS und US bei vier Formen klassischer
Konditionierung. Der US ist schraffiert eingezeichnet.
9
Phasen des
experimentellen
Vorgehens
klassische Konditionierung
3) Löschungsphase
CS wird alleine dargeboten, Abnahme der
CR
CS alleine, führt noch einige Male zur CR,
• Spontanerholung
Löschung, dann Spontanerholung
10
klassische Konditionierung
Speichelfluss nach CS
3) Löschungsphase
4) Spontan
Konditionierung
Löschung
Spontanerholung
 konditionierte Reaktion kann nach einer
Löschung noch mal spontan auftreten
11
klassische Konditionierung
Merkmale des CS
Reizgeneralisierung
dem CS ähnlicher Reiz löst die CR auch aus
Reizdiskrimination
Komplementärer Vorgang, CR wird nur
durch CS ausgelöst
(Diskriminationstraining)
12
Konditionieren
emotionaler Reaktionen
Watson und Rayner 1920
„Der kleine Albert“
Bedingte Angst- und Furchtreaktion
Darbietung von weißer Ratte und
lautem Geräusch
Albert bekommt vor der weißen Ratte Angst
13
Operante Konditionierung
Lernen am Erfolg
14
Operante Konditionierung
Lernen am Erfolg
•
Vertreter: THORNDIKE und SKINNER 1938
•
Operante Konditionierung
... verändert die Auftretenswahrscheinlichkeit eines (auf die Umwelt
einwirkenden) spontanen Verhaltens aufgrund von Konsequenzen
(verstärkende/bestrafende Reize)
operant:= nicht reizgebunden, spontan auftretend
•
15
Operante Konditionierung
Experimentelles Vorgehen - SKINNER 1938
Lichtquelle
Hebel
Futtermagazin mit Trog
elektrifizierbares Bodengitter
SKINNER-BOX
• meist werden hungrige Ratten
in die Skinnerversuchsbox gesetzt
• elektromechanische Versuchsüberwachung
• automatische Registrierung des
interessierenden Verhaltens
• Verstärker: Futter
16
Operante Konditionierung
Phasen einer operanten Konditionierung
mit positivem Verstärker
1)
Bestimmung der Basisrate
2)
Verstärkung des Verhaltens in der Trainingsphase
3)
Löschung (Extinktion) des Verhaltens
[Verhalten wird nicht weiter verstärkt]
4)
Spontanerholung
[abgeschwächte Reaktionen treten nach einiger Zeit ohne
Verstärkung wieder gehäuft auf, wenn die experimentelle
Situation unterbrochen und wiederhergestellt wurde]
17
Operante Konditionierung
Begriffsklärung
• Meist: Operante Konditionierung =
instrumentelle Konditionierung, ABER:
• Instrumentelle Konditionierung kann
auch bedeuten, dass:
 Versuchstier nur auf eine Verhaltensweise
beschränkt
 Verhaltenswiederholung nur mit Eingriff des
Versuchsleiters möglich
 Unterschiede:
Versuchsanordnung & Verhaltensrestriktionen
18
Operante Konditionierung
Verstärkung
• ... erhöht die Auftretenswahrscheinlichkeit eines Verhaltens
• Positive Verstärkung (Futter)
• Negative Verstärkung:
Entfernung eines unangenehmen
(aversiven) Reizes aus der Situation,
nachdem best. Verhalten gezeigt wurde
(z.B.: Fluchttraining).
19
Operante Konditionierung
Bestrafung
• passives Vermeidungslernen =
Verhaltensunterlassung aufgrund negativer Konsequenzen
• Ziel: Verhaltensunterdrückung
• Typ 1:
unangenehmer Reiz wird der Situation
hinzugefügt (Elektroschock)
• Typ 2:
Entfernen eines angenehmen Reizes
20
Operante Konditionierung
Hinweisreize
• Dikriminatives Belohnungstraining:
Ratte bekommt nur Futter (angenehmer Reiz), wenn sie den Hebel
drückt und das Lämpchen leuchtet
 Verhalten wird nur gefördert, wenn der diskriminative Hinweisreiz
dabei ist.

Licht:= diskriminativer Hinweisreiz
• Aktives Vermeidungslernen:
- Fluchttrainingsversuch
- Licht an, vor aversivem Reiz
- nach Wh-en kann Ratte mit Hilfe des diskriminativen Hinweisreizes
dem Schmerzreiz entfliehen
21
Operante Konditionierung
Klassifikation
= aversiver Reiz
genauer erläutert
p./ n. Verstärkung mit d. H.
22
Operante Konditionierung
Positive Verstärkung
3 Verstärkerarten:
1) Primäre Verstärker
Reize, physiologischer Bedürfnisse
(Hunger, Durst)
2) Sekundäre Verstärker
neutraler Reiz, verbunden mit primärem Verstärker
(Geräusch/Licht vor Futtergabe)
3) Generalisierte Verstärker
Reize, die mit mehreren primären und sekundären
Verstärkern verknüpft sind
(hoher soz. Status, Macht, Geld)
23
Operante Konditionierung  positive Verstärkung
Verstärkungspläne
• Verstärkungsplan:= Art und Weise, wie
Verstärker im Experiment verabreicht werden
1) Kontingente Verstärkung:
Verstärkung, abhängig vom Verhalten
2) Nicht-kontingente Verstärkung:
Verstärkung nach Zeitintervall, unabhängig vom
Auftreten eines Verhaltens.
variabel
Zeitintervall:
fixiert
 seltsame Rituale/ abergläubisches Verhalten
24
Operante Konditionierung
 positive Verstärkung  Verstärkungspläne
1)
Kontinuierlich
Intermittierend
Kontingente Verstärkung
> jedes Auftreten des Verhaltens wird verstärkt
> führt rascher zum erwünschten Verhalten
fixiert
variabel
Intervallplan:
> gleichbleibende
> zufällig wechselnde Zeitabstände
Verstärkung nach
Zeitabstände
festgelegtem
Zeitintervall
Quotenplan:
> nicht jedes Auftreten
wird verstärkt
> löschungsresistenteres
Verhalten
> Verstärkung erst nach
best.
Anzahl von Reaktionen
> best. durchschnittl. Dauer,
die die Zeitabschnitte ergeben, ist
festgelegt
> genau jede n-te
Reaktion wird
verstärkt
> zufällige Anz. der Reaktionen ohne
Verstärkung
> festgelegte Verstärkungsdichte,
(im Durchschnitt, jede n-te
Reaktion)
> höhere
Reaktionshäufigkeit
Folge:
Stark wechselnde
Verhaltenshäufigkeiten
Folge:
Über längeren Zeitraum
Sehr gleichmäßiges, stabiles Verhalten
25
Operante Konditionierung
 positive Verstärkung  Verstärkungspläne
Optimaler Verstärkungsplan:
1) Kontinuierliche Verstärkung zum
Verhaltensaufbau
Dann Wechsel zu:
2) Über einen langen Zeitraum hinweg
abnehmende, intermittierende, variable
Verstärkung
26
Operante Konditionierung  positive Verstärkung
Verstärkungsmenge
• Crespi 1942:
- Geschwindigkeitsexperiment,
3 Versuchsgruppen mit untersch.
Futtermenge:
KG: 16, EG1: 64, EG2: 7256
ab 20. Tag: alle Gruppen: 16
 Stärke eines Verhaltens wächst in der
Trainingsphase eines Lernexperiments mit der
Verstärkungsmenge
27
Operante Konditionierung  Bestrafung, Löschung, Ablösung
Bestrafung
:= Unter festgelegten Bedingungen wird das Auftreten
des Verhaltens mit Hilfe aversiver Reize bestraft
• Verhalten wird nur unterdrückt, insgesamt nicht sehr
wirkungsvoll
• beeinträchtigt die Beziehung zw. Bestraften und
Bestrafenden
• Bestrafender wird Modell für den Bestraften
• Neg. Konsequenzen: naturgegeben (leichter ertragen,
informative Funktion) oder durch anderen Menschen
(informative Funktion und soziale Komponente,
Achtung!)
• Aufbau eines Alternativverhaltens ist besser
28
Operante Konditionierung  Bestrafung, Löschung, Ablösung
Löschung und Ablösung
• Löschung:
betreffende Verstärker ausmachen und aus der
Situation entfernen
• Ablösung von Verhalten:
gleichzeitig konkurrierendes Verhalten durch
positive Verstärkung aufbauen
Besonders wirkungsvolle Löschung
Zwar: Konkurrieren die beiden Verhalten,
aber: kein Entzug der pos. Verstärkung!
• Gemeinsam: Reduzierung der
Auftretenswahr-scheinlichkeit eines Verhaltens
29
Verschiedene komplexere
Phänomene und ihre
lerntheoretische Interpretation
30
Verschiedene komplexere Phänomene und ihre lerntheoretische Interpretation
Angst und Vermeidung
• Furcht-/Angst-Reaktion (=emotionale Reaktion) über den
Prozess einer klass. Konditionierung erworben
• Rolle der Furcht-/Angst-Reaktion im Prozess des
aktiven Vermeidungsverhaltens:
Antrieb, das neuartige Verhalten zu lernen
• MILLER, 1948a:
Zweifaktorentheorie:
Verbindung der gelernten Furcht-/Angst-Reaktion
(klass. Konditionierung auf weiße Käfighälfte) und des
aktiven Vermeidungslernens (op. Kond., Aufbau
Fluchtverhalten und Erwerb versch. Formen des
Vermeidungsverhaltens)
 Verhalten äußerst löschungsresistent
31
Verschiedene komplexere Phänomene und ihre lerntheoretische Interpretation
 Angst und Vermeidung
Abbau derartiger Vermeidungsverhalten und Reduktion
des erlebten Gefahrencharakters/Angstauslösung einer
Situation
• Konfrontation
• Reizüberflutung
den Reizen den furchtauslösenden
Charakter nehmen
• Systematische Desensibilisierung
 mit reziproker Inhibitionsmethode
(angstauslösende Stimuli mit Angstunkompatiblem Verhalten paaren)
 Entspannungstraining nach JACOBSON
1938
32
Verschiedene komplexere Phänomene und ihre lerntheoretische Interpretation
Gelernte Hilflosigkeit
• Resultiert, wenn unabhängig vom augenblicklichen
Verhalten unkontrollierbare und unvermeidbare
aversive Reize auftreten (1. Phase)
( Hilflosigkeitserwartung, die auf andere Situationen
übertragen wird)
• Überprüft in (2.Phase):
Flucht- und Vermeidungsverhalten-Training in neuer
experimenteller Situation
hier dann: EG reduzierte Lernleistung geg. KG =
Unfähigkeit Reizen zu entfliehen/ sie überhaupt zu
vermeiden, obwohl dies nun möglich wäre
Versuch von SELIGMANN und MAIER, 1967
33