-1LMU München Seminar Allgemeine Psychologie Referat am 18.12.2002-11-27 Klaus Z......., Tina Theobald, Paul Wimmer, Andrea Budimir-Bekan, Nadine Schmidt, Christine Durst, Daniela Reda, Elisabeth Tinhofer LERNEN 1. Geschichte der Forschung In der Lernpsychologie unterscheidet man 2 zentrale Lerntheorien: Klassische Konditionierung Operante Konditionierung Die Erforschung dieser zwei Theorien galt über lange Zeit als Schlüssel zum Verständnis erlernten Verhaltens. Besonders amerikanische Psychologen, die dem Behaviorismus nahe standen, befasten sich mit der Erforschung der Lerngesetze. Annahme: Mensch ist nur von seiner Umwelt abhängig Ziel: - Aufstellen von allgemeingültigen Gesetzen des Lernens auf der Basis streng objektiv beobachtbarer Verhaltensmerkmale - Entwicklung einer Verhaltenstechnologie um psychische Störungen beseitigen zu können Seid den 70ger Jahren jedoch spricht man von der „Kognitiven Wende“ Erforschung von Gedächtnis-, Denk- und Motivationsprozesse im Zusammenhang mit Lernphänomenen bedeutendster Vertreter: Bandura- „sozial- kognitive- Lerntheorie“ 2. Zentrale Lerntheorien 2.1 Klassisches Konditionieren . Definition : Bei der klassischen Konditionierung geht es darum, eine natürliche, angebo rene Reaktion des Organismus auf einen bestimmten und bekannten auslösenden Reiz mit einem anderen (ursprünglich neutralen) zu koppeln Die experimentelle Untersuchung der Klassischen Konditionierung geht auf den russischen Physiologen Iwan Petrowitsch Pawlow (1849-1936) zurück. Die Theorie von PAWLOW wird deswegen als klassisch bezeichnet, weil sie in der Lernpsychologie den ersten und auch für folgende Lernforscher grundlegenden Theorieansatz darstellt. Häufig wird auch der Begriff „Respondentes Lernen“ oder „Reiz-Reaktions-Lernen“ verwendet, da auf einen gegebenen Reiz eine Reaktion (Antwort = response) folgt. -2Ursprünglich beschäftigte sich Pawlow mit Verdauungsprozessen. Er gab den Hunden Futter und maß parallel die Menge des entstehenden Speichels. In diesem Zusammenhang bemerkte er, dass ein zuvor neutraler Reiz (z.B. Schritte des VL), der einige Male zeitgleich oder knapp vor der Futtergabe auftritt, den Speichelfluss bei alleiniger Präsentation auslöst. Aus dieser Beobachtung heraus entstand letztendlich die Gesamtkonzeption des Behaviorismus. Pawlow wandte sich von seiner ursprünglichen Arbeit ab und konzentrierte sich auf eine sorgfältige experimentelle Untersuchung dieser Lernprozesse. Versuchsaufbau: Der Versuchshund wird auf einem Labortisch festgeschnallt. Bekommt der Hund Fleischpulver ins Maul, sondert er Speichel ab. Fleischpulver = unkonditionierter Reiz/ Stimulus (US) Speichelabsonderung = unkonditionierte Reaktion (UR) Nun wird dem Hund zusätzlich zu diesem US einen neutralen Reiz/ Stimulus (NS), z.B. einen Glockenton dargeboten. Tritt dieser NS mehrmals in Verbindung mit dem US auf, so bewirkt bereits der Glockenton alleine eine Speichelabsonderung. Aus dem ursprünglich neutralem Reiz „Glockenton“ ist ein konditionierter Stimulus (CS) geworden, der eine konditionierte Reaktion (CR), den Speichelfluss, auslöst. Zusammenfassung des klassischen Konditionieren Unkonditionierter Stimulus US unkonditionierte Reaktion (UR) (Futter) (Speichelfluss) Neutraler Stimulus (NS) keine gesicherte Reaktion (Glockenton) US + NS nach mehreren Wiederholungen konditionierte Reaktion (CR) Lernen CS (Glockenton) CR (etwas schwächer, als UR) (Speichelabsonderung) Der ursprünglich neutrale Reiz „Glockenton“ hat eine Signalfunktion übernommen. Deshalb spricht man auch von Signallernen. Es handelt sich hierbei um klassisches Konditionieren anhand von Reflexen! Definition: Unter einem Reflex versteht man eine angeborene spezifische Organreaktion auf einen bestimmten Reiz. -3Phasen bei der klassischen Konditionierung: 1. Phase: KONTROLLPHASE: - Überprüfung, ob der US ein zuverlässiger Auslöser der UR ist - NS darf noch nicht die UR auslösen; er ruft allerdings die Orientierungsreaktion (OR) hervor (Hinwendung zur Reizquelle, Steigerung der Aufmerksamkeit Pupillenerweiterung, Herzklopfen) - Einzelne Komponenten der Ur müssen sich deutlich von OR unterscheiden, sonst könnte OR fälschlicherweise als CR interpretiert werden 2. Phase: KONDITIONIERUNGSPHASE: - US löst UR aus - Mehrmalige gemeinsame Darbietung von NS und US wichtig dabei ist die zeitliche Beziehung zwischen den beiden Reizen; man unterscheidet 4 verschiedene Varianten: S.329 Abb.2 - Der zeitliche Abstand zwischen dem Beginn des NS und dem Einsetzen des US wird als Interstimulationsintervall (ISI) bezeichnet. Untersuchungsergebnisse zur Wirksamkeit der verschiedenen Konditionierungsarten: ~ verzögerte Konditionierung führt am schnellsten zum Aufbau einer konditionierten Reaktion (CR) ~ rückwirkende Konditionierung führt nicht zu einem systematischen Lerneffekt 3. Phase: LÖSCHUNGSPHASE: - Darbietung des CS (Glockenton) ohne US (Fleischpulver) bei erfolgreicher Konditionierung tritt die CR anfangs noch deutlich auf, allerdings ist die Stärke kleiner, als bei der UR, daher auch die Umbenennung starker Abfall der physiologischen Reaktion Löschung der CR Die Löschung einer bestimmten Reaktion ist kein Vergessensprozeß Löschung = Lernen, dass der vorher relevante Reiz jetzt unwichtig ist. Reiz verliert seinen Signalcharakter 4. Phase: SPONTANERHOLUNG - Nach längerer Pause erneute Darbietung des CS -4 gelöschte Reaktion tritt wieder auf, die Intensität ist aber bedeutend geringer und verschwindet bei folgenden Durchgängen schnell Verschiedene Formen bei der Klassischen Konditionierung: Reizgeneralisierung Reizdiskriminierung > Definition: Von Reizgeneralisierung spricht man, wenn auch ein dem konditionierten Reiz ähnlicher Reiz die konditionierte Reaktion auslöst. > Beispiel: konditionierter Reiz ist konditionierte Reaktion erfolgt auch auf > Definition: Die konditioniere Reaktion wird nur durch den genau definierten Reiz ausgelöst > Diskriminationstraining: - Darbietung zweier ähnlicher Reize in unregelmäßiger Reihenfolge - zusammen mit dem einen Reiz (z.B. Kreis) wird ein unkonditionierter Reiz dargeboten, mit dem anderen Reiz (Ellipse) nicht nach einigen Durchgängen: Lernprozess, konditionierte Reaktion nur auf Darbietung des Kreises Vorsicht: durch Training verringert sich die Diskriminationsleistung experimentelle Neurosen Bedingte Furcht- / Angstreaktion: Der Erwerb von Furcht-Angstreaktionen gegenüber situativen Bedingungen in der individuellen Lebensgeschichte kann als klassische Konditionierung interpretiert werden. Koppelung emotional –motivationaler Reaktionen (keine Reflexe) an unterschiedliche, zuvor neutrale Reize - Beispiel: „ Der kleine Albert“ (Watson und Rayner (1920)) + Hypothese: Eine Vielzahl emotionaler Reaktionen auf bestimmte situative Bedingungen können über den Prozess einer Klassischen Konditionierung erworben werden + Durchführung/ Ergebnisse: kleiner Albert war zwischen 9 und 13 Monate alt unkonditionierten Reizes (US) = Hämmern an einen Stahlstab unkonditionierte Reaktion (UR) = Schreck-/ Angstreaktion neutraler Reiz(NS) = Ratte, haarige Tiere Interesse und Zutrauen Konditionierungstraining: NS + US UR (Schreck-/ Angstreaktion) CS CR (Furcht-/ Angstreaktion) Generalisierung: alles haarige (z.B. bärtiger Mann) führt zu einer Furcht-/Angstreaktion + Kritik: - Kind ist wehrlos und wird bewusst dazu gebracht, sich zu fürchten -5- es erfolgt keine Aufhebung der gelernten Furcht-/ Angst- Reaktion Interozeptive Konditionierung: Hierbei handelt es sich um eine besondere Form der klassischen Konditionierung. Ziel: Beeinflussung der Organfunktionen; Konditionierung der Aktivitätssteigerung Beispiel: - Vp wurde ein aufblasbarer Gummiballon zur Messung des Drucks in die Harnblase eingesetzt - während der Gummiballon mit Luft (US)gefüllt wurde, mussten die VP die Bewegung eines angeschlossenen Zeigers auf einer Skala (NS, später CS) verfolgen - Blasendruck Harndrang (UR) - NS + US Harndrang, nach mehreren Wiederholungen reichte schon die Zeigerstellung, um den Harndrang auszulösen 2.2 Operantes Konditionieren Diese Art von Lernen wird als „operant“ oder „instrumentell“ bezeichnet, weil hierbei die Reaktion eines Individuums „operativ“ oder „instrumentell“ für das Auftreten einer Verstärkung ist. Das heißt, das Verhalten wirkt derart auf die Umwelt ein, dass es zu einer Verstärkung dieser Verhaltensweise kommt. Es liegt kein reizgebundenes Verhalten vor; die Reaktionen werden spontan vom Individuum produziert. Es interessiert der Zusammenhang zwischen einem spontan gezeigtem Verhalten und der Konsequenz dieses Verhaltens in Form einer Verstärkung für das Individuum. Die Verstärkung als Konsequenz eines Verhaltens Ist die entscheidende Variable beim operanten Lernen: (Hinweis: In der Literatur wird gelegentlich zwischen operanter und instrumenteller Konditionierung unterschieden. Instrumentelle Situation: das Versuchstier ist auf ganz wenige oder nur eine Verhaltensweise beschränkt, wobei eine Verhaltenswiederholung nur mit Hilfe des VL möglich wäre, z.B. Ratte in einem Laufgang, deren Geschwindigkeit vom Start ins Ziel durch Lernen verändert werden soll. Sie muss nach dem Durchlaufen des Ganges erst wieder vom VL an den Start gesetzt werden. Operante Situation: Versuchstier ist frei, das Verhalten oder ein anderes zu zeigen, z.B. Skinner-Box) 2.2.1 Lernen durch Versuch und Irrtum Etwa zeitgleich mit Pawlow begann Edward L. Thorndike (1874-1949) seine Experimente mit Katzen. - Versuchsanordnung: Eine hungrige Katze wird in einen Käfig gesperrt. Schale mit Futter ist gut sichtbar außerhalb des Käfigs aufgestellt. Durch Zug an einer von der Käfigdecke herabhängenden Schlaufe könnte die Türe geöffnet werden. Katze läuft unruhig hin und her und tritt nach einiger Zeit zufällig auf die Schlaufe, Türe öffnet sich. Nach mehreren Wiederholungen des Versuchs ist eine Verringerung der Zeit, die die Katze zum Öffnen der Türe benötigt, zu beobachten. Der Lernfortschritt ist graduell Katze hat nach Versuch und Irrtum gelernt Lernen durch Versuch und Irrtum („trial-and-error“) ist ein Suchprozess, bei dem das zufällig richtige Verhalten durch den Erfolg verstärkt wird und in der Zukunft vermehrt -6auftritt. Lernen am Erfolg! Aus seinen Untersuchungen leitete Thorndike folgendes Gesetz ab: Gesetz des Effekts: „...unter verschiedenen Reaktionen wird diejenige stärker mit der Situation verknüpft, die von einem für das Tier befriedigenden Zustand begleitet oder innerhalb kurzer Zeit gefolgt werden...“ 2.2.2 Lernen durch Verstärkung: Besonders Burrhus F. Skinner beschäftigte sich mit der Frage, welche Wirkung positive oder negative Verstärkung auf ein Verhalten haben kann. Definition: Bei einem Verstärker handelt es sich um einen Reiz, der als Konsequenz eines Verhaltens auftritt und dessen Stärke (Auftretenswahrscheinlichkeit) erhöht. Sowohl negative wie auch positive Verstärkung führen zu einer Erhöhung der Auftretenswahrscheinlichkeit eines Verhaltens. Verstärkerarten: - Positive Verstärker: = Reize, die durch ihre Darbietung die Auftretenswahrscheinlichkeit erhöhen - Negative Verstärker: = Reize, die durch ihre Entfernung dazu führen, dass Verhaltensweisen vermehrt auftreten - kortikale Reizung: Elektrische Reizung wirkt verstärkend in bestimmten Gebieten des Zwischenhirns. (Experimente von Olds & Milner 1954) - Generell unterscheidet man 3 Klassen von Verstärkern: Primäre Verstärker Sekundäre Verstärker Generalisierte Verstärker - befriedigt physiologische Bedürfnisse (Hunger) - wirken ohne vorherigen Lernprozess - Abhängigkeit des primären Verstärkers von den Bedürfnissen des Organismus - durch häufige gemeisame Darbietung eines neutralen Reizes mit einem primären V. wird der neutrale Reiz zum sekundär Verstärker Wenn Verstärker ihre Wirksamkeit aus der in der Lerngeschichte des Individuums erfolgten Verknüpfung mit mehreren primären und sekundären Verstärkern beziehen, dann spricht man von generalisierten Verstärkern Experimentelle Varianten Für die operante Konditionierung typische experimentelle Vorgehensweise ist die Versuchsanordnung von Skinner. Er arbeitete meisten mit Ratten oder Tauben, die in eigens dafür entwickelten Boxen, sie sog. Skinner-Boxen trainiert wurden. Eine Skinner-Box besteht aus einem Käfig, der mit einem Druckhebel, einem Licht, einem Futtermagazin, einem Futterauslieferungsmechanismus und evtl. einem elektrifizierbaren Rost ausgestattet ist. -7a) Lernen durch positive Verstärkung Analog zur klassischen Konditionierung unterscheidet man wieder 4 Phasen: S.333 /Abb.5 - Bestimmung der Basisrate (Grundrate) Registrierung, wie oft das zu konditionierende Verhalten ohne Verstärkung auftritt (z.B. wie oft betätigt die Ratte spontan den Hebel pro Zeiteinheit) - Trainingsphase: Gezielte Verstärkung des Verhaltens (bei jedem Hebeldruck rollt eine Futterkugel herunter in den Futtertrog) Häufigkeit des Hebeldrückens nimmt zu - Extinktion = Löschung: Keine weitere Verstärkung, d.h. die Ratte bekommt kein Futter mehr, Löschung = Abschwächung des Verhaltens, nach ausgedehnter Löschungsphase kann kein Effekt der Konditionierung mehr beobachtet werden - Spontanerholung: Nach Unterbrechung und anschließender Herstellung der experimentellen Situation kommt es zu abgeschwächten Reaktionen Ratte für kurze Zeit aus der Skinner Box(Löschung), dorthin zurückgebracht betätigt sie wieder den Futterhebel, allerdings weniger häufig angenehmer Reiz = Futter = positive Verstärkung b) Lernen durch negative Verstärkung Skinner-Box besteht bei diesem Experiment aus zwei Abteilen, die durch eine verschließbare Öffnung miteinander verbunden sind. Nun wird das Gitter in der einen Hälfte unter Strom gesetzt Ratte lernt nach wenigen Durchgängen, von diesem Abteil isn andere zu flüchten unangenehmer Reiz = elektrischer Strom = negative Verstärkung Verstärkungspläne: Unter Verstärkungsplänen versteht man die Art und Weise, wie Verstärker im Experiment verabreicht werden. Jedes Auftreten des infrageKontinuierliche Verstärkung Jedes Auftreten des infragestehenden Verhaltens wird verstärkt. - Vorteil: führt rascher zum angestrebten Verhalten als intermittierende Verstärkung Intermittierende Verstärkung Nicht jedes Auftreten des infragestehenden Vehaltens wird verstärkt. - Vorteil: hat löschungsresistenteres Verhalten als Konsequenz - Die Unterbrechung kann nach zwei Kriterien eingerichtet sein: - Intervallplan: Verstärkung nach einem bestimmten Zeitintervall - Quotenplan: Verstärkung nach einer bestimmten Anzahl von Reaktionen führen zu einer höheren Reaktionshäufigkeit als Intervallpläne -8 beide Versuchspläne können sowohl fixiert wie auch variabel gestaltet werden, fixiert Intervallplan Gleichbleibende Zeitabstände Quotenplan Genau jede n-te Reaktion wird verstärkt Stark wechselnde Verhaltenshäufigkeiten variabel Zufällig wechselnde Zeitabstände stabiles, einheitliches Verhalten Anzahl der Reaktionen ohne Verstärkung zufällig, Durchschnitt immer gleich über die Zeit sehr gleichmäßiges Verhalten Es gibt viel Kombinationsmöglichkeiten der Verstärkungsvarianten; Generell gilt: Art des Verstärkungsplans = UV, Lerngeschwindigkeit und Löschungswiderstand = AV Wird nicht kontingent verstärkt, d.h. dass Verstärkung unabhängig vom Auftreten eines bestimmten Verhaltens nach einem bestimmten Zeitintervall gegeben wird, so kann es zu einem sog. abergläubischen Verhalten kommen (sehr löschungsresistent) Verstärkungsmenge: Experimentelle Erforschung von Crespi (1942): - Versuchsaufbau: Ratten liefen durch einen 7m langen Gang, am Ende wurde als Verstärkung Futter dargeboten, die Laufzeit vom Anfang bis zum Ende wurde von jeder Ratte gemessen - Ergebnisse: ~ monotoner Zusammenhang zwischen Verstärkermenge und Laufgeschwindigkeit; je größer die Verstärkung, desto schneller war die Geschwindigkeit ~ Änderung der Verstärkermenge: Reduktion langsameres Laufen (negativer Kontrasteffekt) Vermehrung schnelleres Laufen (positiver Kontrasteffekt) in der Trainingsphase wächst die Stärke des konditionierten Verhaltens mit der Verstärkungsmenge Keine Verstärkung: ein wesentlicher Teil des Gelernten wird erst in Performanz (Umset zung in beobachtbares Verhalten) umgesetzt, wenn entsprechende Verstärkung geboten wird. = latentes Lernen: Kompetenz, die sich erst zeigt, wenn Motivierung durch Verstärkung Zeitintervall zwischen Verhalten und Verstärkung: Je größer das Zeitintervall zwischen der Ausübung des Verhaltens und der Darbietung des Verstärkers ist, desto langsamer wird gelernt, und desto geringer ist die Stärke des konditionierten Verhaltens Behauptung von Spence (1947): Bei verzögerter Verstärkung sei ein Lernerfolg nur über sekundäre Verstärkung möglich. Z.B. Geräusch im Futtermagazin .... c) Lernen durch Hinweisreize: Eine Ratte in der Skinner-Box erhält nur Futter, wenn kurz vor dem Hebeldruck ein Lämpchen aufgeleuchtet hat. Die Ratte lernt mit der Zeit, den Hebel nur dann zu drücken, wenn das Lichtsignal gegeben wurde. Man spricht von einem diskriminativen Belohnungstraining -9 das Licht = diskriminativer Hinweisreiz Tiere sind zu erstaunlichen Diskriminationsleistungen fähig. Experiment von Reese(1966): „lesende“ Tauben: Tauben bekamen Wörter gezeigt: turn – Tauben drehten sich im Kreis peck – Tauben begannen zu picken Erklärung: Wörter hatten anfangs stark unterschiedliches Aussehen (Größe und Farbe) leicht zu unterscheiden Es folgte eine schrittweise Reduzierung der Unterschiede zwischen den beiden Hinweisreizen, bis sie schließlich gleich waren = fading (Ausblenden) Die Fähigkeit, die Lösung von Diskriminationsaufgaben zu lernen wurde als Indikator für Intelligenzunterschiede zwischen Tierarten angesehen. Warren (1965) nennt folgende Rangordnung: (1) Rhesusaffen, (2) Totenkopfäffchen, (3) Krallenaffen, (4) Katzen, (5) Ratten, (6) Eichhörnchen d) Verhaltensdifferenzierung/ Verhaltensketten: Definition: Von Verhaltensdifferenzierung spricht man, wenn einzelne Merkmale eines Verhaltens (Geschwindigkeit etc.) in einem Lernprozess verändert werden. Verstärkt wird hier nur, wenn das infragegestellte Merkmal im gewünschten Ausprägungsgrad erscheint Die Ratte in der Skinner-Box soll lernen, den Hebel besonders kräftig zu drücken. In der ersten Phase wird jedes Drücken verstärkt, dann nur noch Drücken mit höherer Intensität und schließlich nur noch bei kräftigem Drücken des Hebels. Durch eine stufenweise Annäherung an das gewünschte Verhalten kommt es zu einer Verhaltensformung (shaping) Mit dieser Methode kann auch ein komplizierteres, nicht im natürlichen Repertoire vorkommende Verhaltensweise erlernt werden (z.B. Tier lernt Fernsehbedienung) Spektakuläre Erfolge in der Tierdressur Tierverhalten in Fernsehfilmen Dabei spielt auch der Aufbau von Verhaltensketten eine wichtige Rolle. Definition: Eine Verhaltenskette stellt eine Abfolge von Reiz-Reaktions-Einheiten dar, wobei jedes einzelne Verhalten entweder als Konsequenz einen weiteres Verhalten auslösenden diskriminativen Hinweisreiz zur Folge hat oder aber selbst als solcher dient. Bezogen auf das vorangegangene Verhalten hat der diskriminative Hinweisreiz die Funktion eines Verstärkers 2.2.3 Bestrafung, Löschung und Ablösung von Verhalten: Um die Ausführungswahrscheinlichkeit eines Verhaltens zu reduzieren, gibt es drei unterschiedliche Möglichkeiten: Bestrafung Entzug der Verstärker, die das Verhalten aufrechtgehalten haben Löschung Aufbau eines konkurrierenden Verhaltens -10- Bestrafung: Verhaltungsunterlassung aufgrund negativer Konsequenzen wird auch als passives Vermeidungslernen bezeichnet. Man unterscheidet zwei Arten der Bestrafung: Bestrafung Typ 1 Hinzufügen eines unangenehmen Reizes Beispiel: Skinner-Box Stromstoß über das Bodengitter nach Betätigung des Hebels Unterdrückung des Verhaltens bei der Ratte Bestrafung Typ 2 Entfernung eines angenehmen Reizes Beispiel: durch Bewegung des Bodengitters geht der Ratte das Futterkügelchen verloren Wirksamkeit von Bestrafung: Die Wirksamkeit der Bestrafung wurde von Estes (1944) experimentell getestet. - Versuchsaufbau: Skinner-Box mit Hebel, Futtermagazin, elektrisches Bodengitter - Ablauf: 16 Ratten – 1. Phase: möglichst häufiges Hebeldrücken wurde operant Konditioniert mit positiver Verstärkung (erst kontinuierlich, dann intermittierend) 1.Löschungsphase: Experimentalgruppe wurde nicht mehr verstärkt und erhielt oft, aber nicht immer einen elektrischen Schock beim Hebeldruck Kontrollgruppe erhielt weder Bestrafung noch Verstärkung 2. und 3.Löschungsphase: Verhalten wurde in beiden Gruppen weder bestraft noch verstärkt - Ergebnisse: S.345 Abb.9 Es handelt sich hierbei um ein typische Bestrafungsexperiment im Rahmen der operanten Konditionierung, da in der ersten Phase ein Verhalten durch positive Verstärkung aufgebaut wurde und in der zweiten Phase(Löschung) sein Auftreten durch aversive Reize (Elektroschock) bestraft wird. Zusammenfassung der Ergebnisse einer Bestrafung: - Je intensiver der Strafreiz, umso stärker und dauerhafter ist die Unterdrückung des Verhaltens - Intermittierende Bestrafung ist wirksamer als kontinuierliche - Strafreiz muss direkt auf das fragliche Verhalten folgen - Wirksamkeit der Bestrafung verringert sich, wenn dem Verhalten gelegentlich eine positive Verstärkung folgt - besonders wirkungsvoll ist es, wenn gleichzeitig zur Unterdrückung eine Alter nativreaktion aufgebaut wird, die positiv verstärkt wird Bestrafung Löschung des Verhaltens!! -11- Bestrafung hat primär Einfluss auf die Performanz - bestrafte Verhalten tritt dann wieder auf, wenn das Individuum keine weiteren Bestrafungen erwartet Rolle der Bestrafung beim Menschen Naturgegebene negative Konsequenzen werden leichter ertragen als eine Bestrafung durch einen Menschen, wenn dem Bestraften klar ist, dass es in der Entscheidung des anderen liegt, ihn zu bestrafen oder nicht. Je deutlicher die informative Funktion einer Bestrafung ( z.B. Kind fasst auf heiße Herdplatte) ist und dazu beiträgt, Schaden von ihm abzuwenden, desto eher wird im allgemeinen eine Bestrafung zu rechtfertigen sein. Conditioned emotional response (konditionierte emotionale Reaktion) Als erste haben sich Skinner und Esters (1941) damit befasst. Es handelt sich hierbei nicht um eine Bestrafung im eigentlichen Sinn; es wird mit aversiven Reizen gearbeitet, die allerdings nicht nach einem bestimmten Verhalten gesetzt werden, sondern verhaltensunabhängig auftereten. Typischer Aufbau eines Experimentes zur konditionierten emotionalen Reaktion: 1. Aufbau eines bestimmten Verhaltens durch positive Verstärkung hohe und stabile Verhaltensrate 2. Klassische Konditionierung: unabhängig vom augenblicklichen Verhalten wird ein aversiver Reiz (US) dargeboten, der durch einen diskriminativen Hinweisreiz (NS, später CS) signalisiert wird Reduktion des operant konditionierten Verhaltens, auch wenn kein NS (CS) mehr auftritt Löschung: Werden die Verstärker herausgefiltert, die ein Verhalten aufrechterhalten und diese aus der Situation entfernt, so spricht man von Löschung des Verhaltens. Beispiel: Kind schreit wenn es ins Bett gelegt wurde Eltern kommen immer wieder herein und versuchen es zu besänftigen Zuwendung = Verstärker lassen die Eltern ihr Kind schreien und gehen nicht mehr zu ihm zurück, so lernt das Kind, dass sein Schreien nichts mehr nütz und die Schreidauer nimmt stetig ab! = Löschung! 3.Verbindung von klassischer und operanter Konditionierung 3.1 Angst und Vermeidung: Vor allem Miller (1948a) hat sich mit diesem Thema auseinandergesetzt. Als Versuchstiere dienten ihm 25 Ratten. -12- 5. Beobachtungslernen und die Wirkung von Vorbildern 5.1 Problembereiche und daraus abgeleitete Fragenstellungen der Vorbildforschung: Imitationskompetenz: Welches sind die basalen Fähigkeiten der Imitation? Ist die Befähigung zur Nachahmung genetisch angelegt oder ist sie erworben? Imitationsbereitschaft: Wie wird eine Bereitschaft zu imitieren erworben; was sind deren Lernbedingungen? Entwicklung der Imitation: Was sind die Prozesse und Bedingungen der Ontogenese der Imitation? Gibt es Entwicklungsfortschritte von Imitationsleistungen? Motivation zur Imitation: Welche situationalen und personalen Einflüsse veranlassen im konkreten Fall zur Nachahmung? Hier geht es nicht mehr um die Frage des Lernens und der Entwicklung, sondern um aktuelle Motivierungsbedingungen der Imitation. Lernen durch Beobachtung: Wie können Personen durch Beobachtung anderer Wissen erwerben; welche Lernprozesse liegen dem zugrunde? Es geht um die kognitiv- funktionalen Bedingungen von Vorbildwirkungen im allgemeinen. Imitation kann, muss aber nicht beteiligt sein. Motivation zur Ausführung: Welche situationalen und personalen Bedingungen lassen Personen durch Beobachtung Gelerntes in Handlung umsetzten; was sind die Veranlassungen zur Handlungausführung? Es geht um die motivationalen Bedingungen von Vorbildwirkungen. Indirekte Vorbildwirkungen. Welche Einflüsse haben Vorbilder auf Handlungen, die mit dem gezeigten Vorbildverhalten nur indirekt zu tun haben? Wie beeinflussen Vorbilder Urteilsbildungen und handlungsleitende Kognitionen von Beobachtern, die deren weitere Handlungen steuern? Diese Teilbereiche lassen sich zu Problemkomplexen gruppieren: Imitation Im engeren Sinne Bedingungen und Möglichkeiten der Nachahmung beobachteten Ontogenetische Sichtweise Verhaltens Allgemeine Effekte von Vorbildbeobachtung vs. Alllgemeinpsychologische Sichtweise Kompetenzfaktoren Permanenzfaktoren Betreffen Fähigkeiten und deren Erwerb, die zur Imitation und zum Beobachtungslernen nötig sind Motivationsfaktoren, die die Ausführung regulieren -13- 5.2 Theorien des Vorbildlernens: In den Theorien werden nur einzelne, manchmal mehrere, aber nie alle der oben genannten Problembereiche behandelt. Besondere Aufmerksamkeit wurde den motivationalen Bedingungen des Lernens von Imitation und des Lernens am Vorbild entgegengebracht. Die kognitiven Prozessen des Wahrnehmens, Speicherns und Umsetzen in Handlung wurden weniger berücksichtigt. Instinkttheorie Um die Jahrhundertwende war der Instinktbegriff ein gebräuchliches Konzept zr Erklärung menschlichen Verhaltens. Die Hauptbegründer einer Instinktpsychologie waren JAMES (1890) und McDOUGALL (1908) Definition: Unter Instinkt verstand man eine genetisch verankerte Verhaltensdisposition, die Lebewesen leitet, oder Einsicht und ohne vorheriger Erfahrungsmöglichkeit der Umwelt angepasste Verhaltensweisen zu zeigen. JAMES ordnete Imitation ausdrücklich den Instinkten zu; McDOUGALL hingegen nicht. o Imitation bei Neugeborenen? MELTZOFF und MOORE (1977) berichteten über Nachahmung ganz bestimmter Bewegungen, vor allem im Mundbereich, bei Neugeborenen. Bereits PREYER (1980) berichtete von solchen Beobachtungen. - Versuchsergebnisse: 18 12-21 Tage alte Babys zeigten eine erhöhte Auftretensrate bestimmter Reaktionsweisen, wenn diese von einem erwachsenen Vorbild vorgemacht wurden. Annahme: erfahrungsunabhängiger aktiver Nachahmungsprozess, der durch ein abstraktes Repräsentationsmedium vermittelt ist. Fähigkeit der Neugeborenen, die sensorische Information optischer und propriozeptiver Reize in der gleichen Modalität zu repräsentieren und zu vergleichen Generell kommt man zu dem Schluss, dass das Phänomen einer allgemeinen Nachahmung bei Neugeborenen nicht nachweisbar ist; für die Verhaltensweise des ZungeHerausstreckens in den ersten beiden Lebensjahren scheint es eine „Nachahmungs“Bereitschaft zu geben (genetisch fixiertes Verhaltensmuster) Lerntheoretische Konzeption: Deutliche Gegenposition zur Instinktheorie. - Imitation als eine erworbene Verhaltensbereitschaft. - Das Lernen von Imitation steht im Mittelpunkt, sprich um die Bedingungen, durch die eine Bereitschaft zu imitieren, erworben wird. - Imitationsfähigkeit und Ausführungskompetenz wird vorausgesetzt. - Erklärung des Nachahmungsverhalten durch allgemeine Lerngesetze (klassische/ operante Konditionierung oder Kombination) o Imitationslernen als Spezialfall des instrumentellen Konditionierens -14 Bekräftigungstheorie von MILLER und DOLLARD (1941) : Ohne Bekräftigung findet kein Lernen und somit kein Imitationslernen statt. Für jeden Lernakt sind, nach MILLER undDOLLARD, 4 Bestimmungsstücke notwendig: (1) Bedürfnis (drive) muss da sein (2) Hinweisreiz (cue) muss gegeben sein (3) Reaktion (response) (4) Bekräftigung (reward = Triebreduktion) MILLER und DOLLARD haben ihre theoretischen Überlegungen durch zehn Experimente mit Ratten und Kindern zu festigen versucht. - Ergebnisse: ~ Nachahmung ist erlerntes Verhalten ~ Unterscheidung von zwei Klassen von Imitationsverhalten: copying = Verhaltensangleichung matched-dependent behavior = reagieren auf das Verhalten des Vorbilds, Nachbildung - Kritikstellen: ~ Zirkularitätsfalle ~ Nachahmung kann ohne Bekräftigung nicht erklärt werden ~ Der Erwerb neuen Verhaltens kann nicht genau erklärt werden, da immer ReizReaktions-Verbindungen gelernt werden ~ Gültigkeit der Experimente: Situationen waren einfache Problemlöseaufgaben o Generalisierte Imitation: Fortführung des Ansatzes von MILLER und DOLLARD. Generalisierte Imitation umschreibt eine Klasse funktionaläquivalenter Verhaltensweisen, die in der individuellen Lebensgeschichte erworben wird. Drei der vier zentralen Bestimmungsstücke werden beibehalten: cue, response, reinforcement; auf das Triebkonzept wird verzichtet. - Erwerb: Bekräftigung erster zufällig auftretender oder durch Aufforderung hervorgerufe ner Imitationsreaktionen. Kontingente Bekräftigung Generalisierung einer Klasse von Verhaltensweisen, die funktionsäquivalent sind Zur Aufrechterhaltung der generalisierten Imitation ist nach den Prinzipien der operanten Konditionierung nur noch intermittierende Bekräftigung notwendig. o Kognitiv-affektive Vermittlung: Einführung von kognitiv-affektiven Vermittlungskonstrukten durch MOWRER und ARONFREED. Bruch mit der behavioristischen Sichtweise Zwei-Faktoren-Theorie von BANDURA: 1.Schritt: Erwerb eines Abbildes (image oder kognitive Schablone) des Vorbildverhaltens 2.Schritt: Verhaltensausführung Lernen findet vor der Verhaltensausführung statt Emotionale Prozesse spielen eine entscheidende Rolle. Affektänderungen, die der Beobachter während der Beobachtung erfährt, werden durch klassisches Konditionieren mit dem Abbild (cognitive template) assoziiert. - Kritik: ~ kognitionspsychologische Sicht: Konstrukt bleibt zu vage, keine präzisen Vor stellungen über seinen Aufbau, seine Speicherung und über Prozessse der Umsetztung in Verhalten -15~ motivationspsychologische Sicht: kritisieren der ausschließlichen Bindung an Emotionsprozesse Sozial-kognitive Theorie: Ein Kernstück der sozial-kognitiven Theorie von BANDURA (1977a) bildet die Annahme, dass der Mensch die Fähigkeit besitzt, durch Beobachtung zu lernen und Einsicht zu gewinnen. BANDURAS Anliegen war von Beginn an die Auseinandersetzung mit dem Lernbegriff der operanten Konditionierung. Drei Kernannahmen der Theorie: (1) stellvertretende, symbolische und selbstregulierende Prozesse spielen für die psychologischen Funktionen wichtige Rolle (2) entscheidende Bedeutung des Selbstregulationsprozesses: Menschen wählen Reize aus, organisieren sie und formen sie um (3) das Denken, Affekte und das Verhalten kann durch das Beobachten anderer beeinflusst werden Beobachtungsparadigmen Präzisierung der Zwei-Faktoren-Theorie: Erwerb durch klassische Konditionierung Kognitive Repräsentationen Ausführung Aufbau in der Erwerbsphase Regulieren Verhaltensausführung kognitive Repräsentationen Ausführung Durch Bekräftigung Es finden im Beobachtungslernen vier Subprozesse statt: (1) Aufmerksamkeitsprozesse in der Beobachtungsphase Bereits beim Aufnahmeprozess findet Selektion statt; Aufmerksamkeit kann durch verschiedene Variablen gefördert oder gestört werden (2) Behaltensprozesse der Speicherung und Verarbeitung Das Material wird entweder sprachlich oder bildlich kodiert, organisiert und gespeichert Sprachliche Kodierung ist der bildlichen überlegen (3) Motorische Reproduktionsprozesse Person steuert sich selbt, Diskrepanz zwischen dem kognitiven Abbild und dem eigenen Verhalten, die in einem Selbstbeobachtungsprozess registriert werden, führen zu korrektiven Anpassungsprozessen (4) Motivationsprozesse zur Verhaltensausführung Motivationsprozesse wirken als Ausführungsregularien, die nur durch Bekräftigung angeregt sind. Man unterscheidet (1) direkte Bekräftigung, (2) stellvertretende Bekräftigung und (3) Selbstbekräftigung o Vorbildeffekte: BANDURA unterschied drei verschiedene Vorbildeffekte: Lernen durch Beobachtung Erwerb neuer Verhaltensmuster oder Zusammensetzung bekannter Teilreaktionen Observational learning Vorhandene Verhaltensmuster werden effect unter neue Situationskontrolle gebracht Hemmung oder Enthemmung Inhibitory/ dishibitory effect Unterdrückung von potenziell verfügbaren, aber sozial sanktionierten Verhaltensweisen oder Befreiung dieser Verhaltensweisen von Hemmung (Phobien) Reaktionserleichterung Response facilitation effect Ein Verhalten, das weder neu noch sozial sanktioniert ist, wird durch gleiches Verhalten anderer ausgelöst -16 Diese Einteilung dient zur Systematisierung, hat aber kaum praktische Forschungsrelevanz Ansätze zu einer Motivationstheorie der Vorbildwirkung o Nachahmung als Selbstregulation Als Rahmenmodell für Motivation und Selbstregulation diente das einfache Modell des Regelkreises bzw. der TOTE-Einheit (Test-Operate-Test-Exit): ein bestehender Zustand wird mit einem Referenzkriterium verglichen (Test); bei Abweichungen (Ist-SollDiskrepanz) wird korrigiert (Operate) und erneut verglichen (test). Dieser Zyklus wird solange durchlaufen, bis eine genügende Ist-Soll- Anpassung erreicht ist (Exit). POWERS (1973) postuliert zwei Parameter, durch die das System in Gang gesetzt und in Gang gehalten wird: (1) Ziel (purpose): verhindert Abweichungen von einem Standard (2) Standard: Eine Hierarchie mehrerer ineinander verschachtelter Regelkreise und somit eine hierarchische Ordnung von Standards wird postuliert Der Standard für jeden Regelkreis wird durch den output des nächst Höhergeordneten Regelkreises gebildet Der Informationseinstrom wird auf verschiedenen Kontrollniveaus analysiert und mit dem auf dem jeweiligen Nivea gültigen Standard verglichen. Man unterscheidet 9 Kontrollniveaus: * EBENE 1 - Unterste Ebene: Kontrolle von Reizintensitäten bzw. deren Empfindungen * EBENE 2-6: Kontrolle motorischer Ausführungen, raum-zeitliche Koordination von zusammengehörigen Bewegungsmustern * EBENE 7 - Niveau der Programmkontrolle: Entscheidung über Handlungen und Strategien; Voraussetzung ist Kenntnis der Wenn-Dann-Beziehungen * EBENE 8 – Prinzipienkontrolle: Orientierung an logischen und moralischen Prinzipien * EBENE 9 – System-Kompetenzkontrolle: beinhaltet generalisierte Orientierungsleitlinie der Lebensgestaltung Es werden nicht bei jeder Handlung alle Kontrollebenen durchlaufen!! Alltagshandlungen bleiben auf der Programmebene stehen Mit diesem Modell lassen sich gut Nachahmungshandlungen und die Wirkung von Vorbildern beschreiben: Die Person reguliert ihr Verhalten gemäß einem Referenzstandard, der durch das, was vorher am Vorbild beobachtet wurde, mitbestimmt wird. Durch dieses Modell kann auch das Phänomen der Kontraimitation erklärt werden: Kontraimitation = aktive Distanzierung vom Vorbild; Widerstand gegen einen von außen nahegelegten Standard Interpretation als Reaktanzeffekt, der durch die Orientierung an einem übergeordneten Prinzip motiviert ist Erhaltung der persönlichen Freiheit, Erhaltung des Selbstwertes, Erhöhung der eigenen Fähigkeitseinschätzung - Schwachpunkt des kontrolltheoretischen Selbstregulationsansatzes: wenig Auskunft über motivationale Bedingungen -17- o Reaktionsunsicherheit: Reaktionsunsicherheit (response uncertainty) bezeichnet einen Zustand, in dem die Person nicht über schnell Abrufbare Handlungspläne verfügt und sich unsicher über situationsangemessenes Verhalten ist. Dieser Zustand betrifft sowohl Verhaltens-, Kognitions-, als auch Emotionsaspekte. Dieses Konzept wurde von THIELEN, DOLLINGER und KIRKLAND (1979) aufgestellt. Thesen: (1) Bereitschaft zur Nachahmung sinkt mit zunehmender Strukturiertheit der Situation und mit zunehmender Vorkenntnis bezüglich der Aufgabe (Situationstrukturiertheit und Vorkenntnisse versorgen Person mit konkreten Handlungsanleitungen und reduzieren Unsicherheiten) (2)Bereitschaft steigt mit vorheriger Misserfolgserfahrung o Vorbildwirkungen bei Leistungshandeln: Besonderes Interesse wurde in der Vorbildforschung dem Thema Vorbildwirkungen auf Standards, die Kinder an ihr eigenes Leistungshandeln anlegen, entgegengebracht. Dieses Thema wurde mit Hilfe zweier Untersuchungen nachgegangen. - Ablauf der Untersuchung: es wurde Kindern eine Leistungsaufgabe gegeben, die Vorerfahrung der Kinder mit der Aufgabe wurde variiert, das Leistungsmotiv der Kinder wurde erhoben Die Kinder beobachteten ein Vorbild, das die gleichen Leistungsergebnisse erzielt wie sie, sich selbst aber in einer Bedingung hohe, in der anderen niedrige Leistungsstandards setzt AV = auf Seiten der Kinder wurde Standardsetzungen, Selbstbewertungen, Schwierigkeits- und Tüchtigkeitseinschätzungen, Kausalattribuierungen erhoben - Ergebnisse: ~ ohne Aufgabenerfahrung hohe Reaktionsunsicherheit Orientierung des Standards am Vorbild (nicht exakt), Übernahme von Prinzipien nach längerer Beschäftigung mit der Aufgabe passen die Kinder ihren Standard dem eigenen Leistungsniveau an, werden unabhängiger ~ mit Aufgabenerfahrung Vergleich mit Vorbild, Vorbildeinfluss geringer klarer Motiveffekt: Misserfolgmotivierte: richten nach Vorbild Erfolgsmotivierte: unbeeinflussbar oder kontraimitativ, d.h sie setzen den eigenen Standard nach niedrigem Vorbildstandard etwas über dem eigenen Tüchtigkeitsniveau an bleiben längerer Zeit stabil!! -18Diese Motivatonsanalyse zeigt, auf welche Weise Vorbilder direkte und indirekte Wirkungen haben und wie unterschiedlich die Informationen, die ein Vorbild vorgibt, verarbeitet werden und das Handeln anderer beeinflusst. 5.3 Bedingungen der Vorbildwirkung: Merkmale des Vorbilds: Bestimmte Vorbilder werden eher nachgeahmt; Kriterien sind u.a. Geschlecht, Alter, Rasse, Kompetenz Beobachter nutzt diese Merkmale als Information über zu erwartende Handlungskonsequenzen kein durchschlagender Effekt eines einzelnen Kriteriums Interaktion Vorbildsituationen: ~ Situative Rahmenbedingungen haben größere Bedeutung als überdauernde Vorbildmerkmale ~ Bekräftigung des Vorbildverhaltens hat, nach THELEN und RENNIE, nur dann einen förderlichen Effekt auf die Nachahmung, wenn der Beobachter sie als relevant für das eigene Handeln erkennt. Man unterscheidet: Fremdbekräftigung und Selbstbekräftigung ~ es spielt eine Rolle, ob in der Vorbilddarbietung Widersprüchlichkeiten enthalten sind. Konflikt durch unklare Handlungsanweisungen es wird das Verhalten gewählt, das für die Personen weniger Bedürfnisverzicht bedeutet Beziehungen zwischen Vorbild und Beobachter: Einfluss von Wärme und Zuwendung, die das Vorbild gegenüber dem beobachtenden Kind zeigt. Es wird angenommen, dass der Einfluss von Wärme entwicklungsabhängig mit dem Alter sinkt. Motivationspsychologische Erklärungen: ~ bei Verhaltensweisen, die einen Bedürfnisverzicht verlangen, z.B. Selbstkritik und Selbstkontrolle, altruistisches Handeln oder aggressives Handeln, mindert warme Zuwendung die Nachahmung; durch die Zuwendung sinken die Sanktionsbefürchtungen ~ bei der Nachahmung neutraler Verhaltensweisen wirkt Wärme nachahmungsfördernt Merkmale des Beobachters: Defizite in der Aufmerksamkeits-, Speicherungs- und Ausführungsfähigkeit beeinträchtigen die Nachahmungsleistung Beobachtungssituationen: ~ Modus der Vorbilddarbietung: symbolisch, d.h. durch Film oder Video Zu berücksichtigen ist auch die direkte oder indirekte Lenkung der Aufmerksamkeit, die die Beobachtung und Speicherung beeinflussen Performanzsituationen: Wichtig sind alle Anreizbedingungen, die den Beobachter direkt oder indirekt auffordern, das gelernte Verhalten auszuführen, oder die ihm Anlass zur Vermutung geben, dass die Ausführung positive Handlungsfolgen herbeiführt oder negative verhindert. 5.4 Ausblick: Fragen des Imitations- und Beobachtungslernen finden immer weniger Interesse -19Eine integrative Vorbildtheorie wird nicht angestrebt; man schenkt eher einzelnen Teilgebieten mehr Aufmerksamkeit, z.B. evolutionstheoretische Perspektive, entwicklungspsychologischer Ansatz, Motivationstheorien, kognitionspsychologische sicht, Einfluss der modernen Medien Ansteckungseffekt