Lernen: Operante Konditionierung, Teil II Lernen am Modell Bestrafung: Effektiv oder nicht? • Klassisches Exp. von ESTES (1944) • Versuchsaufbau • Skinner-Box mit Hebel, Futtermagazin und elektrifizierbarem Bodengitter. Mechanismus, der die Anzahl Hebeldrücke pro Zeiteinheit registrierte • Phase mit positiver Verstärkung;16 Ratten wurden auf möglichst häufiges Hebeldrücken operant konditioniert, zunächst kontinuierlich, später intermittierend. Ergebnis: stabil hohe Reaktionsfrequenz 2 Bestrafung: Effektiv oder nicht? • Klassisches Exp. von ESTES (1944), Forts. • 1. Löschungsphase: 8 Tiere (EG) während einstündiger Periode nicht nur nicht mehr verstärkt, sondern auch von der 5. bis 20. Minute bei Hebeldruck oft, aber nicht immer, leicht elektrisch geschockt. Die restlichen 8 Tiere (KG) wurden während der gleichen Zeit für Hebeldrücken weder verstärkt noch bestraft (Löschung). • In der 2. und 3. Löschungsphase wurde das Verhalten beider Gruppen nur gelöscht, d.h. weder verstärkt noch bestraft. 3 Bestrafung: Effektiv oder nicht? • Ergebnisse !Bestrafung unterdrückt lediglich das Verhalten, löscht es aber nicht! 4 Bestrafung • Verhalten wird seltener, wenn… 1 der Verstärker wegfällt (Löschung) 2 konkurrierendes Verhalten aufgebaut wird 3 Bestrafung erfolgt • Beispiele für 1: • Stören im Unterricht: Kind aus der Klasse schicken • Wutanfälle ignorieren; aber: Eskalationsfalle! • Sättigung 5 Bestrafung • Beispiel für 2: • Alkoholiker/innen: Hobby statt Kneipe • Zu 3: Bestrafung führt zu geringerer Verhaltenshäufigkeit • Kurzfristige Verhaltensunterdrückung bei wenig intensiver Bestrafung • Langfristige Verhaltensänderung bei intensiver 6 Bestrafung • Bestrafungsregeln (Azrin & Holz, 1966) 1. Von Anfang an mit voller Intensität 2. Unmittelbar 3. Anfangs immer bestrafen (sonst Verstärkung!) 4. Verhaltensmotivation senken 5. Alternative Verhaltensweisen stärken 7 Bestrafung • Nachteile von Bestrafung 1. Emotionale Konsequenzen • Lern- und Performanzschwächen 2. Allgemeine Verhaltensunterdrückung 3. Notwendigkeit der Überwachung 4. Regeln brechen/Situationsflucht 5. Aggression, soziale Konsequenzen 6. Spielen andere mit (Personal)? Aversion gegen Anwendung von Bestrafung 8 Bestrafung • Alternative: Negative Bestrafung/Omission/Bestrafung Typ II • Angenehmer Stimulus wird weggenommen/weggelassen: Verhalten wird seltener • Vorteil: Ohne Hinzufügen eines aversiven Reizes Verhaltenshäufigkeit senken • Anwendung von Bestrafung: Techniken, die unerwünschtes Verhalten reduzieren oder eliminieren (Beispiele aus Mazur, 2006) 9 Bestrafung • Bestrafung (Typ I) bei gefährlichem Verhalten • Selbstverletzung bei retardierten Kindern • • • Leichte Elektroschocks bei Schlägen Ethisch: 2 Dutzend Schocks statt Fixieren Alternativen zu Schocks? • Bestrafung von automatischem Verhalten • Bruxismus: bei ca. 5% aller Studierenden • Geräusch bei lautem Knirschen reduziert Häufigkeit und Stärke • Auch eingesetzt bei chron. Husten, unwillkürlichen Krämpfen, häufigem Erbrechen etc. ohne erkennbare med. Ursache 10 Bestrafung • Bestrafung und Belohnung alternativen Verhaltens • Bsp. Token Economy • Verhalten von Gruppen verbessern • Tokens: generalisierte sekundäre Verstärker • Erwünschte vs. unerwünschte Verhaltensweisen identifizieren • Bsp. Wohnheim, Kindergarten 11 Angst und Vermeidung • Vermeidungslernen (Solomon & Wynne, 1954) • Zweikammerkäfig mit Metallboden, durch Barriere getrennt • 10 Sek. Dunkelheit ⇒ Elektroschock • Erst Flucht-, dann Vermeidungsreaktion 12 Angst und Vermeidung • Viele Hunde wurden nie wieder geschockt! • Schnelle Routinereaktionen • Vermeidungsparadox: Nicht stattfindendes Ereignis als Verstärker? • Vermeidungsverhalten ist extrem löschungsresistent! (Phobien, Zwänge, …) 13 Angst und Vermeidung Zwei-Faktoren Theorie des Vermeidungslernens Phase 1 Klassische Konditionierung Stromschläge (US) lösen aus: Schmerz-/Angstreaktion (UR). Operante Konditionierung Verlassen der dunklen Käfighälfte (Fluchtverhalten) wird negativ verstärkt durch Beendigung der Stromschläge (aversiver Reiz) Dunkelheit (NS) gepaart mit Stromschlägen (US). Dunkelheit wird konditionierter Reiz (CS). Dunkle Käfighälfte wird diskriminativer Hinweisreiz. CS löst aus: Furcht-/Angstreaktion (CR) Phase 2 Verlassen der dunklen Käfighälfte (aktives Vermeidungsverhalten) wird negativ verstärkt durch Verringerung der Furcht bei Beendigung des diskr. Hinweisreizes 14 Angst und Vermeidung • Kognitive Theorie d. Vermeidungslernens (Seligman & Johnston, 1973) • Erwartung der Konsequenz der Reaktion • Erwartung der Konsequenz der Nichtreaktion • Solange keine Erwartung verletzt wird, ändert sich Verhalten nicht • Löschung durch Konfrontation: Vermeidungsreaktion blockieren; dadurch Erwartung falsifizieren 15 Erlernte Hilflosigkeit • EH (Seligman, 1975) • Konsequenzen von unkontrollierbaren, wiederholten, aversiven Ereignissen • Experiment: • Hunde unvermeidbaren Schocks aussetzen • Danach Solomon & Wynne-Prozedur • 2/3 lernen weder Flucht noch Vermeidung 16 Erlernte Hilflosigkeit • Drei Komponenten • Motivational; verminderte Motivation, Ereignisse zu kontrollieren; schnelles Aufgeben • Kognitiv; verminderte Fähigkeit, aus Erfahrungen zu lernen • Emotional; psychsomatische Reaktionen, Antriebslosigkeit 17 Erlernte Hilflosigkeit • Praktische Konsequenz: • In möglichst vielen Situationen sollten Menschen Kontrolle über wichtige Ereignisse in ihrem Leben haben • Bsp. Altenheim, Fabrikarbeit, … • EH ist mit viel Hilfe reversibel, wenn Erfahrung gesammelt wird, die Erwartung von Kontrolle unterstützt • Immunisierung als Schutz, dh. Erfahrung von Kontrolle kann gegen EH ‘immunisieren’ 18 Erlernte Hilflosigkeit • Um EH bei Menschen zu erklären, müssen Kausalattributionen negativer Ereignisse berücksichtigt werden: • global vs. situationsspezifisch • stabil vs. variabel • internal vs. external 19 Kognitive Sicht des Lernens • Damit resultiert eine kognitive Sicht des Lernens: • Kognitionen wie Ziele, Erwartungen, Ursachenzuschreibungen sind grundlegend • Nicht S-R-Verbindungen, sondern flexibel nutzbares Wissen wird erworben • Nicht gemeinsames Auftreten zweier Reize, sondern Informationsgehalt ist entscheidend 20 Ergänzt durch: Biologische Vorbedingungen • Seligman (1970): Konzept der „preparedness” • „preparedness” als artspezifische Bereitschaft zur Kombination spezifischer CS und US, aufgrund natürlicher Selektion (Schutz vor Vergiftung, Schutz vor äußeren Bedrohungen) • Anwendung auf Phobien: • Phobien gegenüber offenen Plätzen, Dunkelheit, Schlangen, Spinnen; nicht aber gegenüber Autos, elektrischen Geräten, Steckdosen, Pferden, Pilzen etc. • spricht für preparedness, d.h. Effekt genetischer Disposition und aversiver Lernerfahrung 21 Biologisch vorbereitetes Lernen • Geschmacksaversion • Paarung aus Geschmacksreiz und Übelkeit führt zu Vermeidung des Geschmacks • Übelkeit wird dagegen nicht mit anderen anwesenden Stimuli (Licht, Elektroschock) in Verbindung gebracht • Geschmacksaversion auch bei Menschen zu beobachten und kaum steuerbar • EINE Paarung von Nahrung und Übelkeit kann Aversion hervorrufen • Evolutionäre Basis: Schnelles Lernen hier überlebenswichtig! 22 Lernen am Modell • Zentrale Annahmen der sozial-kognitiven Lerntheorie • Gelernt werden symbolische Repräsentationen der beobachteten Verhaltensweise, dh. Modellverhalten wird kognitiv gespeichert • Gedanklich vorweggenommene Verstärkung hat eine aufmerksamkeitslenkende Wirkung bei der Beobachtung des Modellverhaltens • Modellverhalten muss angemessen kodiert werden, dh in einer individuell bedeutsamen Form • Resultat ist überdauernde kognitive Repräsentation des Beobachteten, die Ausgangspunkt für die Reproduktion ist 23 Rocky Experiment von Bandura • 66 Kinder im Alter von 4-6 Jahren sehen Film, in dem erwachsene Modellperson eine lebensgroße Plastikpuppe malträtiert, die ihr nicht aus dem Weg geht. • Drei Gruppen mit unterschiedlichem Ausgang der Szene 1: stellvertretende Belohnung: Modellperson wird belobigt und beschenkt 2: stellvertretende Bestrafung: Modellperson wird bestraft 3: Version ohne Folgen 24 Rocky Experiment von Bandura • Testphase 1: nach dem Film kommen Kinder in ein Spielzimmer, das Gegenstände des Films enthält (Puppe, Holzhammer, etc.); spontanes Spielverhalten • Testphase 2: Kinder werden angehalten, Verhalten aus dem Film zu zeigen und für jedes Verhalten verstärkt • registriert wird Zahl der nachgeahmten Verhaltensweisen 25 Rocky Experiment: Ergebnisse 26 Rocky Experiment: Ergebnisse • Bestrafung des Modells führt unter spontanen Bedingungen zur Unterdrückung des Verhaltens • jedoch: in allen Gruppen ist das aggressive Verhalten gelernt worden, denn nach Aufforderung zeigen fast alle Kinder unter allen Bedingungen das Verhalten 27 Lernen am Modell • Unterscheidung von Akquisition und Performanz • dh. Lernender muss Verhalten nicht ausführen (ZweiKomponenten-Theorie) • Bsp. Kind hat aggressive Verhaltenweisen gelernt, führt sie aber nicht aus 28 Lernen am Modell • Lernen ohne Verstärkung • weder direkte noch stellvertretende Verstärkung notwendige Bedingungen für Lernen • direkte und indirekte Verstärkung beeinflussen die Ausführung des Verhaltens, nicht das Erlernen • im Unterschied zu reiner Imitation auch ohne Anwesenheit des Modells und auch noch nach langer Zeit wirksam 29 Kernannahmen • (1) Stellvertretende Prozesse; neben unmittelbarer Erfahrung eine zweite Quelle von Erfahrungen • (2) Symbolische Prozesse; machen Vorstellung von Ereignissen möglich, erlauben Analysen und Planungen, ermöglichen Kommunikation mit anderen • (3) Selbstregulierende Prozesse; Menschen reagieren nicht direkt auf äußere Einflüsse. Stattdessen: Reiz-Auswahl, ReizOrganisation, Reiz-Umformung. Eigene Verhaltenskontrolle durch selbsterzeugte Anreize und Konsequenzen. • Klare Abgrenzung zu mechanistischem Menschenbild; Betonung kognitiver Prozesse 30 Subprozesse des Beobachtungslernens • (1) Aufmerksamkeitsprozesse: Vorbildverhalten muss wahrgenommen werden; Aufmerksamkeitssteuerung durch Merkmale des Verhaltens, des Modells, der Situation und des Beobachters • (2) symbolische Repräsentation (Behaltensprozesse): bildliche oder sprachliche Kodierung, aktive Organisationsprozesse • (3) motorische Reproduktion (Nachbildungsprozesse) • (4) Motivationsprozesse: Bekräftigungen wirken doppelt: auf Aufmerksamkeit und Ausführung • Prozesse (1) und (2) regeln Erwerb, (3) und (4) die Ausführung 31 Zusammenfassung • OK findet ungefähr überall Anwendung • Bestrafung muss nach ethischer Abwägung nach bestimmten Regeln eingesetzt werden und hat viele Nachteile • Bestrafung Typ II ist oft vorzuziehen • Vermeidungslernen ist extrem löschungsresistent • Wenn man erwartet, keinen Einfluss auf wichtige Ereignisse zu haben, resultiert erlernte Hilflosigkeit 32 Zusammenfassung • Studien zu biologisch vorbereitetem Lernen zeigen, dass nicht beliebige Reizkombinationen gelernt werden können, biologisch vorbereitete dagegen sehr schnell und nachhaltig • Kognitive Perspektive wichtige Ergänzung zur Erklärung von Vermeidungslernen und auch von Lernen am Modell 33 Literatur • Spada, H. (Ed.). (2006). Lehrbuch Allgemeine Psychologie. Bern: Huber (Kap. 6.3, 6.4) • Anwendungsbeispiele aus: • Mazur, J. E. (2006). Lernen und Verhalten. München: Pearson Studium. • Lefrancois, G. R. (2006). Psychologie des Lernens. Heidelberg: Springer. 34