4. Operante Konditionierung

Werbung
4. Operante Konditionierung
Operante Konditionierung (OK)
• Die OK befasst sich mit Modellen, die Lernen
anhand von Zusammenhängen des Verhaltens mit
positiven oder negativen Konsequenzen zu erklären
versuchen
– Erfolgslernen, Misserfolgslernen
• OK vermag insbesondere, den Erwerb von
absichtsvollem, komplexem, zielgerichtetem
Verhalten zu erklären
4. Operante Konditionierung
OK
4. Operante Konditionierung
Edward Thorndike: The Law of Effect (1911)
• beschäftigte sich als Student mit
Intelligenz bei Tieren
• experimentierte, um Tiere beim
Problemlösen zu beobachten
• bastelte aus alten Obstkisten Käfig
mit Hebel zur Öffnung der Türe –
setzte die Katze rein und den Fisch
vor den Käfig
4. Operante Konditionierung 4.1 Frühe Experimente und Theorie
Edward Thorndike: The Law of Effect (1911)
4. Operante Konditionierung 4.1 Frühe Experimente und Theorie
Edward Thorndike: The Law of Effect (1911)
• Beobachtete 3 Lern-Phasen
– Katze versuchte «alles», tritt zufällig auf Hebel
– 2. Katze probierte Verhaltensabfolge aus, bis sie wieder
auf Hebel tritt.
– 3. nach vielen Versuchen tritt Katze direkt auf Hebel
4. Operante Konditionierung 4.1 Frühe Experimente und Theorie
Edward Thorndike: The Law of Effect (1911)
• The Law of Effect:
– Verhaltensweisen, auf die eine erfreuliche Konsequenz
folgt, werden wiederholt, während dem
Verhaltensweisen, auf die keine erfreuliche Konsequenz
folgt, nicht mehr gezeigt werden
4. Operante Konditionierung 4.1 Frühe Experimente
Edward Thorndike: The Law of Effect (1911)
• Thorndike zeigte also erstmals den Zusammenhang
zwischen Verhalten und seinen Konsequenzen (R-K).
• Versuch und Irrtum („trial and error“) sind entsprechend
seiner Sicht die Grundlagen des Lernens
• Er lieferte eine mechanistische Erklärung des Lernens:
Lernen erfolge auf der Grundlage des Erlebens von
Assoziationen.
4. Operante Konditionierung 4.1 Frühe Experimente und Theorie
Edward Thorndike: The Law of Effect (1911)
Revidiertes Law of Effect :
• Asymmetrie der Wirkung von Belohnung und
Bestrafung: Belohnung ist gegenüber Bestrafung
verhaltenswirksamer!
Edward Thorndike: The Law of Exercise
• Geübte Reaktionen treten mit grösserer Wahrscheinlichkeit
wieder auf, wenn eine entsprechende Situation wieder
auftritt.
• Das Gesetz der Übung beinhaltet zwei Aussagen:
– die Annahme, dass der Gebrauch einer Verknüpfung durch Übung
deren Stärke steigert.
– dass der Nicht-Gebrauch (Unterlassen der Übung) zu einer
Schwächung oder einem Vergessen dieser Verbindung führt
• Revision: …
– dass die Verstärkung nur stattfindet, wenn der Organismus
Informationen über die Richtigkeit der Reaktion erhält
4. Operante Konditionierung 4.1 Frühe Experimente und Theorie
Edward Thorndike: Relevanz
• Der Ansatz von Thorndike kann als Ursprung der
behavioristischen Lerntheorie gelten. Die Theorie
findet heute aufgrund ihrer mechanistischen
Ausprägung nur begrenzt Anerkennung.
• Nicht alle Erkenntnisse von Thorndike sind in den
Humanbereich übertragbar, da verdeckte kognitive
Prozesse vernachlässigt wurden.
4. Operante Konditionierung 4.1 Frühe Experimente und Theorie
Burrhus F. Skinner
• Skinner wollte Lernen systematisch untersuchen.
Dazu suchte er nach einem Weg, die ReaktionsKonsequenz- Zusammenhänge seiner Probanden
(Mäuse, Tauben) vollständig zu kontrollieren
1904 - 1990
• Als Graduate-Student baute er 1930 aus einer alten
Eiskiste eine Apparatur mit
–
–
–
–
einem Stimulus-Licht
Tasten
einem Futterspender
und einem Gitterrost-Boden (mittels dem Elektroschocks
verabreicht werden konnten).
• Dazu baute er einen Automaten, der automatisch
das Verhalten aufzeichnete
4. Operante Konditionierung 4.2 Skinner: Frühe Experimente und Theorie
die SKINNER-BOX!
4. Operante Konditionierung 4.2 Skinner: Frühe Experimente und Theorie
Kassin, 2004, p.181
Zusammenfassung
• Operante Konditionierung: Lernen am Erfolg/Misserfolg
• Wichtige Arbeiten von E. Thorndike: Law of Effect
• Wichtiges Prinzip: Zusammenhang zwischen Verhalten
und Konsequenz
• Law of Exercise:
– der Gebrauch einer Verknüpfung durch Übung steigert deren
Stärke
– der Nicht-Gebrauch (Unterlassen der Übung) führt zu einer
Schwächung oder einem Vergessen dieser Verbindung
• B. F. Skinner: Entwickelte Theorie der Operanten
Konditionierung
Skinner: Neue Begriffe
• Skinner führte neue Begriffe ein, um das aktive
Lernen vom passiven Lernen, wie es Pavlov
konzeptualisierte, zu unterscheiden
• Er nannte die aktive Form zu Lernen: Operante
Konditionierung, da das Verhalten auf die Umwelt
einwirkt und dadurch eine (erwünschte) Konsequenz
auslöst (“the behavior operates on the environment to
produce a desirable outcome”)
4. Operante Konditionierung 4.3 Skinner: Konzepte / Begriffe
Skinner: Neue Begriffe
• Skinner unterscheidet Stimuli zudem in
verschiedene Arten von “Verstärkern”
(Reinforcement)
– Als guter Behaviorist wollte Skinner Spekulationen über die
inneren Vorgänge vermeiden, und war deshalb bemüht,
Begriffe wie zufriedenstellend oder Belohnung zu vermeiden
• Ein Verstärker ist ein Stimulus, der kontingent auf
ein bestimmtes Verhalten erfolgt, und der die
Auftretenswahrscheinlichkeit dieses konkreten
Verhaltens entweder erhöht oder vermindert
4. Operante Konditionierung 4.3 Skinner: Konzepte / Begriffe
Skinner: Verstärker
• Positive Verstärker
– sind angenehme Stimuli, die die zukünftige
Verhaltenswahrscheinlichkeit erhöhen. Diese können
ungelernt (primäre V. ) oder gelernt (sekundäre V.) sein.
• Negative Verstärker
– sind aversive, also unangenehme Stimuli, die die
zukünftige Verhaltenswahrscheinlichkeit senken. Auch
diese können ungelernt (primäre V. ) oder gelernt
(sekundäre V.) sein.
4. Operante Konditionierung 4.3 Skinner: Konzepte / Begriffe
Skinner: Verstärkung
• Verstärkung bezeichnet den Prozess der Darbietung
oder Entfernen eines Reizes nach einem bestimmten
Verhalten
• Positive Verstärkung
– Verhaltenskontingente Darbietung eines positiven Stimulus.
Dies führt zu einer Erhöhung der Verhaltenswahrscheinlichkeit
• Negative Verstärkung
– Entfernung eines aversiven Stimulus. Führt ebenfalls zu einer
Erhöhung der Verhaltenswahrscheinlichkeit
4. Operante Konditionierung 4.3 Skinner: Konzepte / Begriffe
Verstärkungsmatrix (s. Holland & Skinner, 1971)
Darbietung
Entfernung
Positiver
Stimulus
Positive Verstärkung
V+
Negative (indirekte)
Bestrafung
V-
Aversiver
Stimulus
Positive (direkte)
Bestrafung
V-
Negative Verstärkung
V+
4. Operante Konditionierung 4.3 Skinner: Konzepte / Begriffe
Primäre Verstärker
• wirken ohne vorangegangene Lernprozesse
– ihre Wirkung wird meist mit Triebreduktion erklärt
• es kann unterschieden werden zwischen:
– positiven primären Verstärkern (Nahrung, Bewegung,
usw.)
– negativen primären Verstärkern (akustische Reize,
elektrische Schläge, usw.)
4. Operante Konditionierung 4.3 Skinner: Konzepte / Begriffe
Sekundäre und Generalisierte Verstärker
• Sekundärer V.: Ein ursprünglich neutraler Reiz der
zum Verstärker wird, wenn er mit dem primären
Verstärker gepaart wird (konditionierte Verstärker).
• Generalisierter V.: Ein Verstärker, der gegen mehrere
primäre Verstärker eingelöst werden kann (z.B. Geld,
Tokens)
4. Operante Konditionierung 4.3 Skinner: Konzepte / Begriffe
Arten der Verstärkung
• Intrinsische Verstärkung
– spirituelle, ideologische Verstärkung
• religiöse oder ideologische Werte und Ziele, theoretische oder
symbolische Verstärkung
– Handlungsverstärker
• Sport, Tanzen, Spazieren, Entspannung
• Extrinsische Verstärkung
– materielle Verstärkung
• Geld, materielle Belohnungen
– soziale Verstärkung
• Lächeln, Lob, Anerkennung, Zuwendung
4. Operante Konditionierung 4.3 Skinner: Konzepte / Begriffe
Arten der Verstärkung
Oft erfolgen Verstärkungsprozesse nicht durch externe
Verstärkung (Fremdverstärkung), sondern in Form der
Selbstverstärkung
• hierzu gibt es zwei Varianten
1. jemand belohnt sich selbst bewusst
2. die Verstärkung geht aus einer Handlung selbst hervor
4. Operante Konditionierung 4.3 Skinner: Konzepte / Begriffe
Herunterladen