Operantes Konditionieren - Psychologie des Lehrens und Lernens

„Operantes Konditionieren“
Prof. Dr. Hermann Körndle
Professur für die Psychologie des Lehrens und Lernens
Technische Universität Dresden
© Psychologie des Lehrens und Lernens, TU Dresden
Operantes Konditionieren
Vertreter I - Thorndike
Edward Lee Thorndike (1874-1949)
Formulierung „Law of Effect“
Ö Verhaltensweisen, die einen befriedigenden Zustand zur Folge
haben, werden mit höherer Wahrscheinlichkeit in gleichen oder
ähnlichen Situationen wiederholt.
2
© Psychologie des Lehrens und Lernens, TU Dresden
Operantes Konditionieren
Vertreter II - Skinner
Burrhus Frederic Skinner (1904-1990)
Unterscheidung operanten und reaktiven Verhaltens
Ö operantes Verhalten: Verhalten, dem kontingent Verhaltenskonsequenzen folgen und das nicht unmittelbar durch externe
Reize ausgelöst wird
Ö reaktives Verhalten: Verhalten, das unmittelbar durch einen Reiz
ausgelöst wird.
3
© Psychologie des Lehrens und Lernens, TU Dresden
Grundprinzip des Operanten Konditionierens
Ö Prinzip des Operanten Konditionierens:
Die Auftretenswahrscheinlichkeit eines Verhaltens wird durch
die dem Verhalten folgenden Konsequenzen verändert.
Folgt einem Verhalten eine angenehme Konsequenz, so erhöht
sich die Wahrscheinlichkeit, dass dieses Verhalten in gleichen
oder ähnlichen Situationen wieder gezeigt wird.
Folgt einem Verhalten eine unangenehme Konsequenz, so
verringert sich die Wahrscheinlichkeit, dass dieses Verhalten in
gleichen oder ähnlichen Situationen wieder gezeigt wird.
Ö Bedingungen:
Kontiguität und Kontingenz zwischen dem Verhalten und
dessen Konsequenz.
4
© Psychologie des Lehrens und Lernens, TU Dresden
Experimentalparadigma
Ö die Auftretenswahrscheinlichkeit eines Verhaltens wird
durch die dem Verhalten folgenden Konsequenzen
verändert.
Ö Phasen eines Experiments zum Operanten Konditionieren
1)
2)
3)
4)
5
Kontrollphase
Lernphase
Löschungsphase
Spontanerholungsphase
© Psychologie des Lehrens und Lernens, TU Dresden
Operantes Konditionieren
Experimentalparadigma - Skinnerbox
Food pellet reservoir
Stimulus light
Lever
Foot container
6
© Psychologie des Lehrens und Lernens, TU Dresden
Operantes Konditionieren
Verhaltensrate
Experimentalparadigma - Untersuchungsphasen
keine
Verhaltenskonsequenzen
Kontrollphase
7
auf Verhalten folgen
angenehme
Konsequenzen
keine
Verhaltenskonsequenzen
Zeit
Lern-/Trainingsphase Löschungsphase Spontanerholung
© Psychologie des Lehrens und Lernens, TU Dresden
Operantes Konditionieren
Prinzipien des Operanten Konditionierens
Herstellung der
Bezeichnung
Verhaltenskonsequenz
positive
angenehmer Reiz
Verstärkung wird hinzugefügt
Verstärkung
negative
unangenehmer Reiz
Verstärkung wird entfernt
Bestrafung unangenehmer Reiz
Typ I
wird hinzugefügt
Bestrafung
Bestrafung angenehmer Reiz
Typ II
wird entfernt
Löschung
8
Löschung
auf Verhalten folgt
keine Konsequenz
Wirkung
Erhöhung der
Verhaltensrate
Reduktion der
Verhaltensrate
Reduktion der
Verhaltensrate
© Psychologie des Lehrens und Lernens, TU Dresden
Operantes Konditionieren
Bedingungen für erfolgreiche Verhaltensbeeinflussung
ÖKontiguität
zeitliche (und räumliche) Nähe von Verhalten und
Konsequenz.
ÖKontingenz
die Wahrscheinlichkeit des gemeinsamen Auftretens von
Verhalten und Konsequenz ist höher als die
Wahrscheinlichkeit, dass nur eines von beiden auftritt.
Ein Verhalten wird in seiner Auftretenswahrscheinlichkeit nur dann
von Verhaltenskonsequenzen beeinflusst, wenn Kontiguität und
Kontingenz zwischen Verhalten und dessen Konsequenzen besteht.
9
© Psychologie des Lehrens und Lernens, TU Dresden
Operantes Konditionieren
Kontiguität und Kontingenz
Verhalten
Konsequenz
10
Zeit
Zeit
© Psychologie des Lehrens und Lernens, TU Dresden
Unabhängige Variablen
Das Kontiguitätsprinzip (Grice, 1948)
100%
0 sec
0,5 sec
1,2 sec
2 sec
Prozent richtiges Verhalten
90%
80%
5 sec
70%
60%
50%
10 sec
40%
30%
0
100
200
300
400
500
600
700
Anzahl der Versuchsdurchgänge
11
© Psychologie des Lehrens und Lernens, TU Dresden
Unabhängige Variablen
256
4
(feet/sec)
Durchschnittsgeschwindigkeit
Quantität der Verhaltenskonsequenz (Crespi, 1942)
64
3
16
2
1
0
0
5
10
15
Versuchsdurchgänge
12
© Psychologie des Lehrens und Lernens, TU Dresden
Operantes Konditionieren - UV
Verstärkungspläne I
Verstärkungspläne sind Festlegungen des Experimentators, in
denen angegeben wird, wie regelmäßig und wie häufig die
Konsequenzen einem Verhalten folgen.
ÖHäufigkeit:
z
kontinuierlich vs. intermittierend
ÖRegelmäßigkeit:
z
z
13
fixiert vs. variabel
Quote vs. Intervall
© Psychologie des Lehrens und Lernens, TU Dresden
Operantes Konditionieren - UV
Wirkung von Verstärkungsplänen I
Number of responses
1000
A
B
C
750
500
D
250
0
0
10
20
30
40
50
60
70
80
Time (minutes)
14
A Fixed ratio
C Fixed interval
B Variable ratio
D Variable interval
© Psychologie des Lehrens und Lernens, TU Dresden
Operantes Konditionieren - UV
Wirkung von Verstärkungsplänen II
Ö Kontinuierliche Verstärkung
z
z
hohe Lerngeschwindigkeit;
geringer Löschungswiderstand
Ö Intermittierende Verstärkung
z
z
15
niedrige Lerngeschwindigkeit;
hoher Löschungswiderstand
© Psychologie des Lehrens und Lernens, TU Dresden
Operantes Konditionieren - UV
Wirkung von Verstärkungsplänen III
16
Ö Fixierte Verstärkung
- wechselnde Verhaltensrate;
- geringerer Löschungswiderstand als
variable Verstärkungspläne
Ö Variable Verstärkung
- gleichmäßige Verhaltensrate;
- höherer Löschungswiderstand als
fixierte Verstärkungspläne
Ö Quotenpläne
- höhere Verhaltensrate als Intervallpläne
- höhere Lerngeschwindigkeit als
Intervallpläne
Ö Intervallpläne
- niedrigere Verhaltensrate als
Quotenpläne
- geringere Lerngeschwindigkeit als
Quotenpläne
© Psychologie des Lehrens und Lernens, TU Dresden
Unabhängige Variablen
Wirkung von Verstärkungsplänen IV
Saisonarbeitseffekt
Cumulation of bills passed
by the U.S. Congress
Weisberg, P. & Waldrop, P.B. (1972).
Fixed-interval work habits of congress.
Journal of Applied Behavior Analysis.
(n. Anderson, J.R. (1995). Learning and
Memory. New York: Wiley, S. 23.)
17
© Psychologie des Lehrens und Lernens, TU Dresden
Unabhängige Variablen
Wirkung von Verstärkungsplänen V
500
450
400
350
300
250
200
150
100
50
0
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
Gesetze
Rechtsverordnungen
Seitenanzahl insg. im BGBI (geteilt durch 10)
18
© Psychologie des Lehrens und Lernens, TU Dresden
Operantes Konditionieren - UV
Diskriminative Hinweisreize (cues, Signalreize)
Ö Definition:
Diskriminative Hinweisreize sind Reize, die bestimmte
Verhaltenskonsequenzen signalisieren.
Ö Beispiele:
Bei Lehrer Müller wird das Verhalten „im Unterricht reden“ nicht
bestraft, bei Lehrer Meier wird es bestraft. Die Schüler reden bei
Herrn Meier nicht im Unterricht.
Eine Ratte erhält nur dann eine Belohnung (Futter), wenn
vorher eine Lampe aufleuchtete.
19
© Psychologie des Lehrens und Lernens, TU Dresden
Operantes Konditionieren
Bestrafung (Estes, 1944)
Verhaltenstendenz
100%
75%
50%
25%
0%
1
2
3
4
Zeit
nicht bestraftes Verhalten
20
© Psychologie des Lehrens und Lernens, TU Dresden
Operantes Konditionieren
Bestrafung (Estes, 1944)
Verhaltenstendenz
100%
75%
50%
25%
0%
1
2
nicht bestraftes Verhalten
21
3
4
Zeit
in Phase 2 bestraft
© Psychologie des Lehrens und Lernens, TU Dresden
Operantes Konditionieren
Differenzierungen - Kontrasteffekte
Kontrasteffekte
sprunghafte Veränderungen der Verhaltensrate in Abhängigkeit
einer massiven Änderung der Quantität, d. h. der Menge der
Verhaltenskonsequenz.
Ö Positiver Kontrasteffekt
Erhöht man eine zu Beginn geringe Verstärkungsmenge, so
erhöht sich die Verhaltensrate sprunghaft über die zu
erwartende Verhaltensrate.
Ö Negativer Kontrasteffekt
Reduziert man eine zu Beginn hohe Verstärkungsmenge, so
verringert sich die Verhaltensrate sprunghaft unter die zu
erwartende Verhaltensrate.
22
© Psychologie des Lehrens und Lernens, TU Dresden
Operantes Konditionieren
4,5
4
256 auf 16
256
64 auf 16
3,5
64
3
16
Änderung der Verstärkungsmenge (Futerpillen)
Durchschnittsgeschwindigkeit (feet/sec)
Negativer Kontrasteffekt (Crespi, 1942)
2,5
16
2
1,5
1
0,5
16
16
0
0
15
16
17
18
19
20
1
2
3
4
5
6
7
8
Versuchsdurchgänge
23
© Psychologie des Lehrens und Lernens, TU Dresden
Tokensysteme
Ö Tokens sind sekundäre Verstärker, die gegen primäre
Verstärker oder andere sekundäre Verstärker eingetauscht
werden können.
24
© Psychologie des Lehrens und Lernens, TU Dresden
Sekundäre Verstärkung
Tokensysteme
25
© Psychologie des Lehrens und Lernens, TU Dresden
Klassisches / Operantes Konditionieren
Ö Klassisches Konditionieren
z
gelernt wird die Auslösung von schon im
Verhaltensrepertoire des Organismus vorhandenen
Reaktionen durch neue Reize
Ö Operantes Konditionieren
z
26
durch die Verfahren des operanten Konditionierens wird die
Auftretenswahrscheinlichkeit von Verhaltensweisen
verändert
© Psychologie des Lehrens und Lernens, TU Dresden
Experimentalparadigma - Vergleich
Klassisches und Operantes Konditionieren
Klassisches Konditionieren:
unabhängige Variablen: die Bedingungen, unter denen der mit dem
unkonditionierten Reiz gekoppelte, zu konditionierende
Reiz dargeboten wird (z.B. Zeitdauer oder Zeitpunkt
zwischen Aufleuchten einer Lampe und Futtergabe)
abhängige Variablen:
Ausmaß der durch den konditionierten Reiz ausgelösten
Reaktion (z.B. Menge des Speichelflusses)
Operantes Konditionieren:
unabhängige Variablen: Art der Verhaltenskonsequenz; Quantität und Qualität
der Verhaltenskonsequenz; zeitlicher Abstand zwischen
Verhalten und dessen Konsequenzen; diskriminative
Hinweisreize; Verstärkungspläne
abhängige Variablen:
Lerngeschwindigkeit; Verhaltensrate;
Löschungswiderstand
27
© Psychologie des Lehrens und Lernens, TU Dresden
Literaturhinweis
Ö Steiner, G. (1996) Lernen: 20 Szenarien aus dem Alltag.
28
© Psychologie des Lehrens und Lernens, TU Dresden