Grundformen des Lernens Teil 1: Lernen wird in der Psychologie definiert als eine dauerhafte (im Gegensatz zu einer vorübergehenden) Änderung des Verhaltens und von Verhaltenspotentialen, die durch Übung (im Gegensatz etwa Reifung, Prägung oder Krankheit) erfolgt. Die dauerhafte Veränderung wird in dieser Definition betont, weil Gelerntes unabhängig von temporalen Veränderungen, wie etwa der aktuellen Motivation, vorliegt. Darüber hinaus sind alle beobachtbaren Verhaltensweisen, die nicht durch Üben erworben wurden, vom Lernbegriff ausgeschlossen, also etwa auch die Prägung. Dieses „Lernen“ - besser wäre Verhaltensänderung - in einer genetisch festgelegten sensiblen Phase (zum Beispiel unmittelbar nach der Geburt), wurde vor allem durch Konrad Lorenz bekannt, der diesen besonderen Prozess unter anderem bei Graugänsen nachwies. Inzwischen ist er bei vielen Arten bekannt und kann später durch Umlernen kaum noch verändert werden (siehe Abgrenzung Lernen - Reifung Prägung). Aber auch die im menschlichen Reifungsprozessen automatisch ablaufenden Verhaltensänderungen sind explizit ausgeschlossen. Zu unterscheiden ist auch zwischen Lernen und Leistung: Leistung ist das Umsetzen von Gelerntem durch Hinzukommen der Motivation. Aussagen über Gelerntes kann man daher nicht aus der Leistung allein ableiten, da bei der Leistung die Motivation zur Erbringung eines Verhaltens mit berücksichtigt werden muss. Es gibt unterschiedlichste Einteilungen der Arten des Lernens. Eine sehr einfache ist die Unterscheidung von vier Arten des Lernens in Reihenfolge aufsteigender Komplexität: Habituation (Gewöhnung): Lernen, einen Reiz zu ignorieren, der keine im Augenblick nützliche Information enthält, zum Beispiel das Ticken einer Uhr oder das Rauschen des Meeres. Der Sinn ist die Vermeidung einer Reizüberflutung und Freimachen der Aufmerksamkeit. Sie läuft ständig und unbewusst ab und ist kaum zu vermeiden, wenn die entsprechenden Randbedingungen vorliegen. Klassische Konditionierung (Signallernen): Lernen, dass einem Reiz ein anderer folgen wird, zum Beispiel dem Warnton des Computers folgt eine Fehlermeldung. Zweck der Konditionierung ist es, Vorbereitungen für den zweiten Reiz treffen zu können. Dieses Lernen läuft ebenfalls automatisch ab; ihr Ergebnis kann aber bei Bedarf leichter als eine Habituation von bewussten Überlegungen „überstimmt'' werden. Operative Konditionierung: Lernen, dass einer Aktion eine Konsequenz folgt, zum Beispiel dem Aufdrehen des Wasserhahns folgt das Fliessen des Wassers oder dem Lernen folgt eine gute Note. Dieses Lernen ist die Basis gezielter nichtinstinktiver Handlungen. Dieses Lernen ist vor allem in Zusammenhang mit Motivationsfragen von Bedeutung. Ein Aktions-Konsequenz-Paar, dessen Konsequenz eine positive Motivationswirkung hat, kann man gezielt zum Antrainieren verwenden, entsprechend eines mit negativer Motivationswirkung zum Abgewöhnen einer Verhaltensweise. Komplexes Lernen: Lernen, das über das Bilden von Assoziationen hinausgeht, zum Beispiel die Anwendung einer Strategie zur Problemlösung oder die Ausbildung der geistigen Landkarte einer Umgebung. Dieses Lernen setzt die Herstellung mentaler Abbilder der Welt voraus und die Manipulation dieser Abbilder anstelle der Manipulation der Welt selbst. Es handelt sich also vor allem um einen Abstraktionsprozess. Der Lernende muss die richtigen Abstraktionen finden sowie die richtigen Operationen zu ihrer Manipulation. Als Konsequenz sollte man versuchen, sich bei allen komplexen Lernvorgängen die Konzepte hinter den zu lernenden Zusammenhängen zugänglich zu machen. Diese Konzepte geben die Gemeinsamkeiten hinter den zu lernenden Zusammenhängen (also deren Essenz) wieder sowie idealerweise auch die Motivation hinter deren Entwurf (also die Begründung), denn es handelt sich ja um bewusst und gezielt für einen Zweck entworfene Artefakte. Somit liegen diese Konzepte schon nah an den Abstraktionen, die zum Lernen ausgebildet werden müssen und ihre Kenntnis erleichtert deshalb das Lernen. Häufig ist es dabei nützlich, sich mittels Metaphern, Vergleichen etc. auf andere Konzepte zu stützen, die bereits geläufig sind. Ein wichtiger Schluss aus diesem Lernmechanismus lautet, sich beim Lernen nach Möglichkeit Zusammenhänge vollständig sichtbar zu machen. Es gibt grundsätzlich zwei Arten, wie eine Abstraktion beim komplexen Lernen erworben werden kann: induktiv oder deduktiv. Beim deduktiven Lernen (Lernen des Speziellen aus dem Allgemeinen) wird eine Beschreibung des zu lernenden Zusammenhangs vorgegeben, die in Begriffen abgefasst ist, die bereits zuvor gelernt wurden. Der Lernende analysiert diese Beschreibung und entwickelt daraus geistig die neue Abstraktion. Deduktives Lernen setzt Sprache oder sprachähnliche Systeme voraus. Beim induktiven Lernen hingegen (Lernen des Allgemeinen aus dem Speziellen) werden eine Reihe von Beispielen und Gegenbeispielen für die zu lernende Abstraktion vorgegeben. Überwiegend unbewusst wendet der Lernende eine große Zahl von früher gelernten Abstraktionen auf die Beispiele an, um deren relevante Gemeinsamkeiten und Unterschiede herauszufiltern. Die Gemeinsamkeiten werden vor dem Hintergrund der Unterschiede verallgemeinert (was ein unzuverlässiger Schritt ist!) und bilden den Inhalt der neu gelernten Abstraktion. Höheren Lebewesen, besonders Menschen, sind enorm leistungsfähig beim induktiven Lernen, zumindest, wenn alle notwendigen Basisabstraktionen bekannt sind. Aus diesem Grund ist es stets vorteilhaft, das Lehren möglichst stark auf induktives Lernen zu stützen. Allerdings erlaubt das induktive Lernen nicht, mit vertretbarem Aufwand eine genaue Grenzziehung einer Abstraktion zu lernen. Zweifelsfälle können also nach einem rein induktiven Lernprozess oft noch nicht korrekt beurteilt werden. Es sind in der Regel eine ganze Reihe von Beispielen nötig, um die meisten Zweifelsfälle auszuschließen, obwohl sonst sicherlich drei positive und drei negative Beispiele ausgereicht hätten. Deshalb sollte eine induktive Lernlektion möglichst mit einer entsprechenden deduktiven vervollständigt werden, die nach der Ausbildung eines Verständnisses für den überwiegenden Teil des Gehalts der zu lernenden Abstraktion dann auch recht schnell aufgenommen werden kann. Gelernte Gedächtnisinhalte sind an vielen verschiedenen Stellen des Gehirns gespeichert. So befinden sich sprachliche Informationen in einem anderen Bereich als visuelle oder haptische. Dies bedeutet, dass unser Wissen über einen Gegenstand, beispielsweise über eine Blume, nicht an demselben Ort abgespeichert ist, sondern über unser Gehirn verteilt abgelegt wurde. Bei Bedarf, also wenn wir uns an diese Blume erinnern, werden die vielen Einzelinformationen (Form, Bezeichnung, Geruch usw.) wieder zusammengefügt. WICHTIG !!! Die Information trifft in Form eines wahrnehmbaren Reizes auf eine Sinneszelle, die ihn als elektrischen Impuls an eine Nervenzelle (Neuron) weiterleitet. Wird ein bestimmter Energiewert überschritten, gibt diese Nervenzelle den Reiz über einen faserartigen Fortsatz, das Axon, an ein oder mehrere andere Neuronen weiter, die ihn ihrerseits ebenfalls weiterleiten können. Die Information hinterlässt so charakteristische Spuren. Durch häufiges „Nachziehen“ dieser Spuren (Üben, Wiederholen) verstärken sich die Verbindungen (Synapsen) zwischen den betreffenden Zellen. Es entsteht ein bleibendes Muster, ein Engramm. Die Information ist gespeichert, das heißt: sie ist gelernt! Das Abspeichern von Informationen im Gedächtnis kann durch eine Reihe von Faktoren beeinträchtigt werden, die nicht alle mit dem Lernvorgang im engeren Sinne zu tun haben. So ist Lernen nicht nur eine Sache des Gehirns, sondern des ganzen Körpers. Sind wir krank, erschöpft oder müde, ist unsere Aufnahmebereitschaft herabgesetzt. Ähnlich ist es unmittelbar nach einer Mahlzeit. Diese Beeinträchtigungen lassen sich leicht erklären: Denn das Gedächtnis beruht auf komplexen Vorgängen, an denen viele Gehirnbereiche beteiligt sind, auch jene Partien, die grundlegende Körperfunktionen steuern. Gefühle haben einen enormen Einfluss auf den Lernvorgang. Negative Gefühle wie Angst, Unlust oder Sorge beeinträchtigen das Einprägen des Lernstoffs. Auch Lernen unter Stress mindert den Erfolg. Gefühle entstehen in einem Teil des Gehirns, der limbisches System genannt wird. Er hat die Aufgabe, eintreffende Informationen zu bewerten, ihre Relevanz zu prüfen und somit eine adäquate Reaktion des Menschen auf den entsprechenden Reiz sicherzustellen. Mit dieser Bewertung ist eine emotionale Einfärbung der Informationen verbunden. Eine positive emotionale Besetzung des Lernstoffes ist für das Behalten wichtig. Daher wird ein Lernstoff besonders gut aufgenommen, wenn er mit positiven Gefühlen verbunden ist. Teil 2: Klassische Konditionierung Ivan Petrowitsch Pawlow gründete in Petersburg das „physiologische Labor für experimentelle Medizin“, in dem er den größten Teil seiner berühmten Forschungsarbeiten durchführte. Er hatte in Experimenten gezeigt, dass zum Beispiel Welpen über einen angeborenen Speichelreflex verfügen, der ausgelöst wird, sobald Futter in ihr Maul gerät. Eine Beobachtung, die jeder Hundebesitzer an seinem Tier feststellen kann. Pawlow nannte diese Speichelabsonderung eine psychische Sekretion, da er davon überzeugt war, es handle sich um einen vom Gehirn gesteuerten Prozess. Er entwickelte darauf hin eine Methode, psychische Vorgänge von außen zu beobachten, ohne sich dabei auf innere seelische Zustände zu beziehen. Am Beginn des 20. Jahrhunderts führte Pawlow seine klassisch gewordenen Experimente durch: Ein Hund wurde in einem besonderen Apparat gestellt, in dem die Intensität des Speichelflusses als Reaktion auf bestimmte Reize gemessen werden kann. Dem Hund wurde ein unbedingter Reiz (UCS: Futter) präsentiert, woraufhin er den angeborenen Reflex (UCR: Speichelfluss) zeigte. Auf das Läuten einer Glocke (CS) zeigte der Hund keinerlei Reaktion, außer einer gewissen Neugier. Pawlow kombinierte die beiden Reize (UCS und CS), worauf der Hund mit Speichelfluss reagierte (UCR). Nach mehrmaligem Wiederholen dieser Reizpräsentation, reagiert der Hund schon auf das Glockenläuten mit Speichelfluss. Diese Reaktion nennt Pawlow bedingte Reaktion (CR). CR und UCR ähneln sich, sind aber nicht identisch: so produziert der Hund, beim Anblick des Futters immer noch mehr Speichel, als bei dem Ertönen der Glocke. Der entscheidende Punkt in diesem Experiment ist, dass nach der Konditionierung ein vorher neutraler Reiz eine Reaktion hervorruft, die vorher nur durch einen unbedingten Reiz ausgelöst wurde. Wird dem Versuchstier jedoch längere Zeit der bedingte Reiz (CS) allein dargeboten, so verschwindet allmählich die bedingte Reaktion (CS); Pawlow nannte diesen Prozess Löschung. Wiederholt man nach einiger Zeit das Experiment, so zeigt der Hund nach wesentlich weniger Versuchsdurchführungen wieder die bedingte Reaktion auf den bedingten Reiz. Dies beweist, dass die Konditionierung nicht gänzlich gelöscht wurde, sondern lediglich gehemmt worden war. Als Anerkennung für seine Forschungsarbeiten erhielt er 1904 den Nobelpreis für Physiologie und Medizin verliehen. Merkmale des Pawlowschen Reflexbegriffes: Deterministische Natur, das heißt, dass jede Reaktion einer Ursache (zum Beispiel Reiz) bedarf. Prinzip der Analyse und Synthese, d.h., die Reflexlehre zerlegt die Vorgänge im Nervensystem in ihre kleinsten Bestandteile (Reflexe, die Verknüpfungen zwischen Reiz und Reaktion sind) und fügt diese dann wieder zusammen, um das Ganze zu beschreiben. Räumliches Konstruktionsprinzip: wo spielt sich der Reflexvorgang ab und wie hängt dieser Ort mit dem Vorgang zusammen. Ein Reflex ist nicht dasselbe wie eine Reaktion, er ist die Verknüpfung zwischen Reiz und Reaktion. Drei Arten von Reflexen: unbedingte: Sie sind angeboren und artspezifisch. Einem Reiz folgt automatisch, unbedingt eine ganz bestimmte Reaktion. bedingte: Sie sind erworben und individuell. Auch hier besteht eine gesetzmäßige Verbindung zwischen einem Reiz und einer Reaktion, die jedoch erlernt und vielfältig beeinflussbar ist. Orientierungsreflexe: Neue Reize werden mit einer Orientierungsreaktion (OR) verbunden, die sich in allgemeiner Erregung, Hinwendung zum Reiz und Desynchronisierung der EEG Alpha-Wellen äußert. Arten von Reizen und Reaktionen: Unbedingter Reiz (US): Ein solcher Reiz ist ohne experimentelles Zutun in der Lage, immer eine Reaktion hervorzurufen. Unbedingte Reaktion (UR): Sie wird durch den US hervorgerufen und hat in irgendeiner Form biologischen Nutzen (zum Beispiel Lidschlag schützt die Augen). Bedingter Reiz (CS): Ein Reiz, der ursprünglich neutral ist, beim Organismus also keine spezifische Reaktion hervorruft, sondern allenfalls eine allgemeine Orientierungsreaktion. Durch den Vorgang des Konditionierens (CS und US treten wiederholt in zeitlicher Nähe auf) wird dieser neutrale Reiz zum CS, wenn auf ihn irgendwann eine der UR ähnliche Reaktion folgt, die CR. Nach Pawlow kann jeder beliebige Reiz, der von einem Sinnesorgan aufgenommen wird, zum CS werden. Bedingte Reaktion (CR): Wird nach erfolgreichem Konditionieren vom CS ausgelöst. Sie ist der UR ähnlich, jedoch nicht gleich. Sie hat eine längere Latenzzeit und eine geringere Amplitude als die UR und ist kürzer als diese. Sie könnte entweder eine Komponente der UR sein, die durch den CS hervorgerufen wird, oder eine Reaktion sein, die den Organismus auf die UR vorbereitet. Reflexkette: Wenn die Reaktionen auf einen Reiz (egal ob UR oder CR) einen weiteren Reflex auslösen (und diese Reaktion dann wieder einen usw.), so entsteht eine Reflexkette. Auch solche Ketten können wieder untereinander verkoppelt werden und bilden so die Grundlage des Verhaltens. Arten der Konditionierung: Vorwärtsgerichtete: Der CS tritt vor dem US auf, entweder verzögert, das heißt: CSCS+US-US, oder zur Ausbildung eines Spurenreflexes, also CS-Pause-US. Gleichzeitige: CS und US treten gleichzeitig auf. Rückwirkende: Der US geht dem CS voraus. Temporalreflex: Die Konditionierung erfolgt auf einen „Zeittakt“, der US wird in immer gleichen Abständen wiederholt, die CR erfolgt dann ohne weiteren Reiz in derselben zeitlichen Abfolge. Reflexe höherer Ordnung: Man erzeugt mittels eines US und eines neutralen Reizes eine Verbindung CS-CR. Dann wird in einem weiteren Konditionierungsverfahren ein anderer neutraler Reiz an die Stelle des ursprünglichen CS gesetzt. Man erhält so eine Konditionierung zweiter Ordnung. Weitere wichtige Begriffe der Reflexologie: Pseudokonditionierung: Ein aversiver Reiz (US) wird wiederholt dargeboten. Wird nun direkt im Anschluss ein neutraler Reiz dargeboten, wird die UR (bzw. CR) auch gezeigt. US und CS werden offensichtlich durch die Situation miteinander verknüpft. Sensorisches Vorkonditionieren: Mehrere neutrale Reize werden als Compound dargeboten, danach erfolgt eine Konditionierung mit einem dieser Reize als CS. Dieser CS ist nun durch die anderen, vorher mit ihm dargebotenen Reize austauschbar. Reizgeneralisierung: Eine Reaktion auf einen speziellen Reiz (CS) wird gelernt. Auf andere, diesem Reiz ähnliche Reize erfolgt auch eine Reaktion, die umso stärker ist, je größer die Ähnlichkeit ist. Die Stärke der Reaktion in Abhängigkeit von der Ähnlichkeit wird in einem Diagramm, dem Reizgradienten abgebildet. Diskrimination: Bezeichnet die Fähigkeit, zwischen verschiedenen Reizen zu unterscheiden. Sie kann trainiert werden, indem man immer den einen Reiz mit, den anderen ohne US darbietet. Experimentelle Neurose: Wenn man einen Reiz (zum Beispiel Kreis) mit einem positiven US, und einen anderen, ähnlichen Reiz (zum Beispiel Ellipse) mit einem negativen US verbindet, und die Reize so sehr angleicht, dass das Versuchstier nicht mehr diskriminieren kann, reagiert es mit abwechselnd starker Erregung und starker Erschöpfung sowie Unsicherheit. Dies heißt experimentelle Neurose. Aversive Reize: Sie lösen neben der UR bzw. CR auch eine allgemeine Angstreaktion aus. Teil 3: Pawlows Theorie über zentralnervöse Vorgänge bei der Konditionierung Der US löst in einem bestimmten Zentrum des ZNS eine Erregung aus, die dann zur UR führt. Erfolgt nun gleichzeitig mit dieser Erregung eine unspezifische, indifferente Erregung irgendwo anders im ZNS (und das auch noch wiederholt), so wird diese Erregung zu der spezifischen „hingezogen“, es wird ein Weg (eine Verbindung) zwischen den ehemals unabhängigen Erregungen gebahnt. Dieser Vorgang ist reversibel, bzw. hemmbar (siehe Löschung und spontane Erholung). Irradiation: Die Ausdehnung der Erregung auf benachbarte „Herde“ im ZNS. Dem erregten „Herd“ benachbarte Regionen, werden je nach ihrem Abstand, unterschiedlich stark erregt (s. Generalisation). Konzentration: Sie ist das Gegenteil der Irradiation, die Erregungsausbreitung wird, zum Beispiel durch Diskriminationstraining, auf bestimmte Areale eingegrenzt. Hemmung, Löschung und spontane Erholung Hemmung ist sowohl ein gegenläufiger Prozess zur Erregung, als auch zur Bahnung. Ein anderer Prozess wird, wenn er gehemmt wird, behindert. externe: Eine CR wird durch die Aktivität eines anderen „Herdes“ gehemmt. Ein anderer Reiz bewirkt zum Beispiel eine OR, wodurch die CR abgeschwächt wird, oder sogar ganz ausbleibt. Externe Enthemmung beschreibt einen Vorgang, bei dem eine interne Hemmung durch einen (neuen) Reiz aufgehoben wird. interne: Ist vergleichbar mit dem Begriff der reaktiven Hemmung bei HULL oder auch EYSENCK, es werden hiermit physiologische Prozesse beschrieben, die das Auftreten der CR hemmen. Dazu zählen die Abschwächung (bei öfter CS ohne US) und auch die Generalisation, die ja mit zunehmender Unähnlichkeit der Reize (und damit nach Pawlow zunehmender Entfernung der erregten Zentren) geringer wird. Weiterhin kann interne Hemmung durch Verzögerung auftreten wenn der US dem CS erst nach längerer Zeit folgt. bedingte: Man verbindet eine CR zunächst mit zwei Reizen und bietet dann einen davon nur noch mit einem neutralen Reiz zusammen dar (gleich: Löschung des einen CS). Dieser neutrale Reiz hemmt nun auch wenn er mit dem anderen CS dargeboten wird, das Auftreten der CR. Auch hier ist eine Konditionierung zweiter Ordnung möglich. Eine Löschung erfolgt im Experiment in Form von interner Hemmung, der CS wird solange ohne US dargeboten, bis keine Reaktion mehr feststellbar ist, bis also die Bahnung (physiologisch) aufgehoben ist. Bei einer spontanen Erholung hemmt sich die interne Hemmung, die zur Löschung der CR geführt hat, offensichtlich selber. Eine gelöschte CR taucht nach einer Pause während des Experiments von selbst, also ohne zwischenzeitliche Verbindung mit dem US von alleine wieder auf. Einflüsse auf bedingte Reaktionen sind möglich durch Motivation: Je stärker die Motivation zu einer bestimmten UR, desto stärker auch zur entsprechenden CR (zum Beispiel Hunger des Hundes-Speicheln) Intensität des CS: Je höher, desto stärker CR. Intensität des US: Je höher, desto wahrscheinlicher Ausbildung einer CR. Verwendung von CS-Compounds: Dies ist meist wirksamer als nur ein Reiz. Verwendung mehrerer US: Dies ist meist wirksamer als nur ein Reiz. Inter-Stimulus-Intervall (ISI) zwischen US und CS: beim Skeletalsystem 0,2 0,5 s, beim autonomen NS zwischen 2 und 5 s optimal für Konditionierungserfolg. Erlernen emotionaler Reaktionen und Einstellungen Generell kann angenommen werden, dass viele unserer emotionalen Reaktionen und Einstellungen gegenüber Reizen durch klassische Konditionierung erworben wurden. Das klassische Konditionieren liefert zwar kaum angemessene Beschreibungen kognitiven bzw. schulischen Lernens. Es spielt jedoch indirekt eine Rolle, da vorhandene emotionale Reaktionen der Schüler durch klassisches Konditionieren entstanden sein können (zum Beispiel Schul- und Prüfungsangst, Aggression). Dieses Wissen kann für den Lehrer hilfreich sein. In der Schule bzw. im Unterricht können Konditionierungen emotionaler Reaktionen stattfinden, die langfristige Folgen haben (zum Beispiel Lernfreude vs. Schulangst). Lehrer, Klassenzimmer, Schule etc. können zum Beispiel zu angstauslösenden CS werden, wenn sie mit sehr negativen Erlebnissen gekoppelt wurden. Dies kann bis zu Bildungsfeindlichkeit oder Abneigung gegen Bücher führen. Ein anderes Beispiel wird von Anderson (2000) erwähnt, der eine Abneigung gegen Krabben entwickelt hat, weil ihm nach dem ersten Genuss von Krabben aufgrund einer Erkrankung sehr schlecht geworden ist. Selbst beim Schreiben des Kapitels über klassischem Konditionieren hat er Übelkeitsgefühle empfunden. Entstehung von Ängsten Eine besondere Rolle spielt die Untersuchung von Ängsten, die ein sehr häufiges Problem darstellen. Es lassen sich leicht viele Ängste nennen, die man selber hat oder die man von anderen kennt, die mittels klassischen Konditionierens gelernt wurden (zum Beispiel Höhenangst, Angst vor dem Wasser, vor dem Zahnarzt). Allerdings gibt es auch Ängste gegenüber Objekten, mit denen man noch gar keinen Kontakt hatte (Schlangen). Es ist daher zweifelhaft, in welchem Ausmaß KK als Ursache von Ängsten in Frage kommt. Allerdings gibt es genügend dokumentierte Beispiele für klassisch konditionierte Ängste. Gut dokumentiert sind zum Beispiel konditionierte Ängste aufgrund traumatischer Erfahrungen (zum Beispiel Krieg, KZ, Folter). Solche extrem intensiven US bzw. UR führen zu sehr löschungsresistenten Konditionierungen und eine einmalige Kopplung von CS und US kann bereits eine Konditionierung bedingen. Beispiele dafür sind Reaktionen auf gruselige Filmmusik, die häufig mit bestimmten „Effekten“ kombiniert wurde. Ein weiteres Beispiel sind Marinesoldaten, die noch 15 Jahre nach dem Krieg eine starke Reaktion auf eine Tonfolge zeigten, die im Krieg als Signal zum Einnehmen der Gefechtsposition diente. Damals fand eine Konditionierung statt, wobei Gewehrfeuer und Geräusche von Bomben die US darstellten. In der entsprechenden Studie wurden zwei Gruppen verglichen, nämlich Heeres- und Marine-Soldaten, denen 20 unterschiedliche Geräusche dargeboten wurden. Es erfolgte eine Messung der psychogalvanischen Hautreaktion (Hautwiderstandsmessung). Der größte Unterschied zwischen beiden Gruppen in ihrer emotionalen Reaktion zeigte sich bei einer Serie von 100 Gongschlägen/Min. Diese Tonfolge war während des Zweiten Weltkrieges bei der amerikanischen Marine das Signal für „Alle Mann auf Gefechtsstation“. Mehr als 15 Jahre nach Kriegsende rief dieses Signal bei den Navy-Veteranen immer noch starke emotionale Reaktionen hervor - bei den ArmyVeteranen, für die dieses Signal keine Bedeutung hatte, hingegen nicht. Auch in unseren Breiten löst heute noch jede Sirene bei vielen Menschen Angst aus, obwohl es sich um einen Probealarm handelt. Ein weiteres Beispiel dafür ist der Zahnarzt. Bereits beim Anblick des Bohrers bekommen es viele mit der Angst zu tun. Der Grund dafür ist eine gelernte Reizreaktionsverbindung. Hat ein Erwachsener z. B. im Englischunterricht in der Schule negative Erfahrungen mit einem Lehrer gemacht, kann dadurch für ihn eine folgenschwere Lernschwierigkeit entstehen, da seine Motivation für Sprachenlernen generell gestört sein. Als Therapieformen (vor allem für Phobien) wurden die systematische Desensibilisierung und die Implosion entwickelt (bei letzterer hat der Klient die Möglichkeit, in einer sicheren Umgebung zu erleben, das der phobische Reiz zu keiner Verletzung etc. führt und es kommt folglich zur Extinktion). Das Problem bei Ängsten ist oft, dass aufgrund von Vermeidungsverhalten keine Extinktion erfolgen kann. Dies wird durch Desensibilisierung gewährleistet. Bei dieser Methode wird erst eine Angsthierarchie entwickelt (zum Beispiel Bild einer Schlange bis hin zu Anfassen einer Schlange). Man beginnt damit, den Patienten in völlige Entspannung zu bringen, die unvereinbar mit Angst ist. Dann präsentiert man den schwächsten Angstreiz so lange bzw. so oft, bis dieser keinerlei negative Reaktion mehr auslöst; usw. Evaluative Konditionierung und Werbung Das klassische Konditionieren beruht normalerweise auf einer Wenn-DannBeziehung, wenn der CS auftritt, dann ist mit dem US zu rechnen, d.h., die mentale Repräsentation des CS aktiviert die Repräsentation des US und die CR kommt zustande. Diese Art der Konditionierung ist vom Bewusstsein abhängig. Daneben gibt es jedoch noch ein andere Art der Konditionierung, die automatisiert und unbewusst abläuft und auf einer evaluativen Reaktion (ER) beruht. Damit ist eine unmittelbare Reaktion im Sinne von gut/positiv/Mögen oder schlecht/negativ/Ablehnung gemeint. Essentielle ER sind angeboren, weitere können durch Erfahrung erworben werden. Diese Reaktion erfolgt noch vor dem Einsetzen kognitiver Reizverarbeitung. Man kann nun solche Reize (zum Beispiel Bilder) ermitteln, die bei einer Person eine positive ER hervorrufen. Wenn man nun neutrale Reize zusammen mit positiven Reizen öfter koppelt, lösen die neutralen Reize ebenfalls eine positive ER aus. Ein Bewusstsein der Kontingenz positiver und neutraler Reize ist nicht notwendig. Das Prinzip der ER wird vor allem in der Werbung genutzt. Einige sehr erfolgreiche Werbungen zeichnen sich dadurch aus, dass sie sehr persistent ein Produkt mit positiven Reizen kombinieren (Tiger-Esso Benzin; Natur/Cowboys-Marlboro; Schöner Mann-Parfum). Möglicherweise kann auch mit der ER erklärt werden, dass Leute, die viel über andere lästern, selbst mit negativen Eigenschaften assoziiert werden. Teil 4: Operante Konditionierung Das klassische Konditionieren kann eine Reihe von Lernphänomenen nicht erklären. Dazu gehören insbesondere das Entstehen neuer Verhaltensweisen, die bisher nicht im Verhaltensrepertoire eines Individuums waren (z.B. Fahrradfahren) Verhaltensenderungen, die unabhängig von vorausgehenden Stimulusbedingungen sind - das trifft wohl für das meiste Verhalten zu. Burrhus Frederic Skinner führte in den USA Tierversuche mit Tauben und Ratten durch. Auch dazu wurde eine künstliche Experimentalsituation entwickelt, die Skinner-Box. Skinner, der wichtigste Vertreter des operanten Konditionierens unterscheidet zwei Typen der Konditionierung: Konditionierung Typ S(timulus): Damit ist das KK gemeint, bei dem bereits vorhandene Reaktionen auf neue Reizbedingungen konditioniert werden, die diese Reaktionen dann fast automatisch auslösen (Lernen neuer Auslösebedingungen). Skinner spricht auch von respondentem Konditionieren. Konditionierung Typ R(eaktion): Beim Reaktionslernen geht es um das Entstehen und Verändern willkürlich und freiwillig ausgeübter Verhaltensweisen aufgrund von Reizen, die dem Verhalten folgen (Verstärkung). Ein Großteil menschlichen Verhaltens ist willkürlicher Natur und tritt auch auf, ohne dass bestimmte Reize es auslösen. Es ist jedoch wesentlich von den Konsequenzen abhängig, die ihm folgen. Es wird als operantes Verhalten bezeichnet, weil es in der Umwelt „operiert“ bzw. weil es selbst etwas bewirkt. Das operante Konditionieren besteht in der Beeinflussung der Auftretenswahrscheinlichkeit operanten Verhaltens durch bestimmte Verhaltenskonsequenzen. Operantes Lernen kann auch als Lernen neuer Verhaltens-Folge-Beziehungen verstanden werden. Unter Operantem Konditionieren versteht man auch das Lernen durch Versuch und Irrtum. Es lässt keine unmittelbaren Auslöser erkennen, bewirkt aber eine Reaktion in der Umwelt. Es wird durch seine Folgen gesteuert. Das Grundprinzip ist das Bekräftigungslernen. Durch die planmäßige Gestaltung der Folgen einer Handlung wird die Auftretenswahrscheinlichkeit des Verhaltens verändert. Je nach Art der Folgen erhöht oder erniedrigt sich diese. Verstärker sind kontingent auftretende Folgen. Es gibt drei wichtige Schritte: eine wählbare Reaktionsklasse eine verstärkende Verhaltenskonsequenz eine Kontingenz zwischen Verhalten und Konsequenz Auch beim operanten Konditionieren kann eine Stimuluskontrolle vorhanden sein. Zum Beispiel kann die Handlung ausgelöst werden im Beisein bestimmter Stimuli und bei anderen Stimuli wird sie nicht ausgeführt. Die Stimuli haben daher nur Hinweisfunktion. Thorndike formulierte das „Gesetz der Wirkung“, das den Begriff „Lernen am Erfolg“ beinhaltet. Zufällige Aktionen, die zu einer positiven Konsequenz für das Individuum führen, werden seiner Meinung nach selektiert und öfter eingesetzt. Für ihn war die Verknüpfung von Reiz und Reaktion, nicht einfach nur durch Wiederholung und Kontiguität vorhanden, sondern ebenfalls an eine Verstärkung gebunden. Diese Verstärkung bezieht sich auf die subjektive Wahrnehmung des Lernenden. Wenn die Verknüpfung von Reiz und Reaktion einen Zustand der Befriedigung (verstärkender Effekt) für das Individuum darstellt, wird die Verknüpfung gestärkt. Im Gegensatz dazu zieht der Effekt einer Nichtbefriedigung eine Schwächung der Verknüpfung nach sich. Das Versuchstier kann sich durch Drücken eines Hebels (Wirkreaktion) Futter beschaffen. Die Belohnungsgabe (Futter, Wasser) erfolgt nur unter bestimmten Bedingungen, die das Versuchstier zu erlernen hat. Ein äußerer Kasten schirmt den eigentlichen Versuchskasten gegen Störgeräusche von außen ab. Oft nimmt eine Fernsehkamera das Innere über einen Spiegel auf, um das Verhalten des Versuchstieres beobachten oder aufzeichnen zu können. Mit dieser Apparatur wurde die operante Konditionierung untersucht, also jene Lernform, die durch Verstärkung bzw. Belohnung gesteuert wird. Teil 5: Die vier Arten der Verstärkung und Bestrafung der operanten Konditionierung Unter einem Verstärker versteht man jeden dem Verhalten folgenden Stimulus, der die Verhaltenshäufigkeit steigert. Bei der Bestrafung verhält es sich umgekehrt: Unter einer Bestrafung versteht man jeden dem Verhalten folgenden Stimulus, der die Verhaltenshäufigkeit mindert. Auch Verhaltensweisen können als Verstärker bzw. Bestrafung fungieren. Primäre Verstärker/Bestrafung hängen mit biologischen Bedürfnissen zusammen (z. B. Futter, E-Schock). Sekundäre Verstärker entstehen durch Koppelung (z.B. durch klassische Konditionierung!) mit primären Verstärkern (z. B. zu Essen geben + Lächeln). Sekundäre bzw. soziale Verstärker (z. B. Geld, soziale Anerkennung) spielen eine größere Rolle als primäre Verstärker. In vielen Fällen führen sie zu primärer Verstärkung oder können gegen eine solche eingetauscht werden. Sekundäre Verstärker sind leichter und unmittelbarer einsetzbar. Wesentlich für die Verstärkung ist die Kontingenz, d.h. es muss eine Korrelation zwischen Verhalten und Verstärker bestehen. Es darf keine Verstärkung erfolgen, wenn das Verhalten nicht auftritt! Es gibt vier Arten von Verstärkung und Bestrafung: Positive Verstärkung: Durch einen Verstärker kommt es zu einer Erhöhung der Auftretenswahrscheinlichkeit des Verhaltens. Folgt dem Verhalten ein positives Ereignis (Verstärker), kommt es zu einer positiven Konsequenz. Als Beispiel dafür wäre ein Kind, das jedes Mal, wenn es sein Zimmer aufräumt, gelobt wird. Als Konsequenz wird dieses Kind jetzt öfter sein Zimmer aufräumen. Weitere Beispiele: Lernverhalten - Lob; Uni-Tassen im Automaten abgeben - Erhalt eines Bons. Negative Verstärkung: Hier folgt auf das Verhalten ein Ausbleiben eines unangenehmen Ereignisses (Verstärker). Ein Beispiel hierfür wäre die Drohung der Eltern ein Kinder-Fest abzusagen, sollten die Hausaufgaben nicht gemacht werden. Diese Drohung wird nicht verwirklicht, weil das Kind seine Hausaufgaben erledigt. Weitere Beispiele: Lernverhalten - kein Tadel des Lehrers oder keine ständigen Ermahnungen der Eltern mehr; Auftreten von Übelkeit vor einer Prüfung - Prüfung kann nicht absolviert werden, somit kommt es zu einer entlastenden Verstärkung (Auftreten von Übelkeit wird verstärkt durch Ausbleiben eines unangenehmen Ereignisses). Vor allem Vermeidungsverhalten wird durch negative Verstärkung aufrechterhalten: In Gefahrensituation (z. B. hohes Gebäude) tritt Vermeidungsverhalten auf (Vermeiden hoher Gebäude) und wird durch Ausbleiben von Angstzuständen verstärkt. Dadurch wird verhindert, daß die Angstreaktion gelöscht werden kann. Bestrafung durch aversive Reize: In dieser Form des Lernens folgt dem Verhalten ein unangenehmes Ereignis (Bestrafung). Ein Kind bekommt aufgrund seines schlechten Benehmens zu seinem Bruder das Verbot zu Fernsehen. Es kommt zum Entzug eines positiven Reizes. Bei zu aversiver Bestrafung kann es zu klassischer Konditionierung kommen, so dass z.B. der Lehrer oder ein Elternteil zu einem CS wird, die negativen Emotionen auslöst. Solche Nebenwirkungen sollten bei Bestrafung vermieden werden. Entscheidend für die Wirkung von Bestrafung ist u. a., daß ein Alternativverhalten zur Verfügung steht, das belohnt wird. Bestrafung durch Entziehung positiver Reize (Löschung): Auf ein Verhalten folgt weder ein unangenehmes noch ein angenehmes Ereignis. Ein Schüler benutzt im Unterricht oft das Wort „Scheiße“. Der Lehrer ignoriert diesen Begriff und es kommt somit zur Löschung. Der Schüler kann damit keine Aufmerksamkeit erregen. Weitere Beispiele: Fehlverhalten - „Liebesentzug“, Entzug bereits versprochener Belohnungen, etc. Auch beim klassischen Konditionieren kann man von Verstärkung sprechen. Der Verstärker beim operanten entspricht dem UCS beim klassischen. ===== Operante Konditionierung und Clicker: Wie alles anfing Von Gitta Vaughn Karen Pryors Verdienst war es, Clickertraining populär zu machen, vor allem für den privaten Hundehalter. Aber erfunden hat sie es nicht. Skinner hat die ersten Arbeiten mit Tauben gemacht, die Bomben ins Ziel leiten sollten, Ende der 30er Jahre mittels Operant Conditioning. Kam nicht zum Einsatz, die Idee. Zwei seiner Assistenten, Keller Breland und Marian Bailey (die dann geheiratet haben) waren die ersten die das ganze kommerziell angewandt haben. Werbespots im Fernsehen, Werbung auf landwirtschaftlichen Ausstellungen, Shows wie Disney mit Papageien etc. Die waren über Jahrzehnte erfolgreich damit, nur konnten sie Hundeausbilder damals nicht überzeugen. Die blieben bei ihren gewohnten Methoden. Später kam Bob Bailey dazu, der nach Kellers Tod Marian heiratete. In die Zeit fielen auch viele heute noch geheime Projekte für die Regierung. Vom Delphin zum Krähe wurden viele Tierarten für Spionagezwecke etc. ausgebildet. Karen Pryor kam erst viel später, nannte das ganze Clickertraining und hat auch nur einen Bruchteil der Erfahrung die die Baileys haben. Lange Zeit waren Clicker und Operant Cond. ein und das dasselbe, hat sich dann aber abgespalten, weil Clickertraining, wie es heute ausgelegt wird, nur mit positiver Bestärkung (Leckerli) oder negative Strafe (kein Leckerli) arbeiten und alles andere ablehnen. 6. Folge Diskriminative Stimuli Auch beim operanten Lernen können Reize eine Rolle spielen, die dem Verhalten vorausgehen. Diese Reize können anzeigen, ob einem bestimmten Verhalten eine bestimmte Verstärkung folgen wird (positiver diskriminativer Reiz) oder nicht (negativer diskriminativer Reiz). Wenn ein bestimmtes Verhalten von diskriminativen Reizen beeinflusst wird, dann ist das Verhalten unter „Stimuluskontrolle“. Experimentell kann man das so erzeugen, dass man ein Versuchstier z.B. nur dann für das Drücken eines Hebels belohnt, wenn vorher ein Licht aufleuchtet. Äußerlich kann dann beobachtet werden, dass das Licht das Hebeldrücken offenbar auslöst. In Wirklichkeit führt das Licht jedoch dazu, daß in dieser Situation für das Hebeldrücken eine Belohnung erwartet wird. Die diskriminativen Reize rufen das Verhalten also nicht hervor. Sie haben lediglich einen Informationswert bezüglich zu erwartender Verstärkungen. Es gibt im Alltag viele Beispiele für Verhalten, das unter Stimuluskontrolle ist (z.B. der Anblick einer Zigarettenschachtel scheint oft unmittelbar den Griff zur Zigarette auszulösen, tatsächlich führt der Anblick jedoch zu der Erwartung eines belohnenden Ereignisses wenn der Griff zur Zigarette bzw. das Rauchen der Zigarette erfolgt). Im Rahmen seiner Untersuchungen hat Skinner verschiedene „Verstärkungspläne “ erarbeitet: 1. Für die Erhaltung des gewünschten Verhaltens ist eine konsequente Reaktion auf das gezeigte Verhalten nötig (Lob, Strafe etc.) 2. Wird die Konsequenz nur sporadisch (bzw. partiell) ignoriert, verstärkt sie u.U. das unerwünschte Verhalten. 3. Wird das gezeigte Verhalten ignoriert, führt dies zur dessen Extinktion (Ko) 4. Wenn der Operand sein Verhalten stabilisiert hat, kann man zu einer partiellen Verstärkung übergehen (dann ist die Gefahr der Löschung gering) Weiterhin ist wie auch bei Pawlow eine Kontiguität zwischen dem gezeigten Verhalten und der Konsequenz notwendig. Das Kind muss z.B. erkennen können, daß die Strafe sich auf ein spezifisches unerwünschtes Verhalten bezieht. Wenn dem nicht so ist, wächst die Gefahr einer Generalisierung. Das Konzept der Verstärkung und der Bestrafung Typischer Verlauf einer Konditionierung: Das Modell scheint eher in der Lage zu sein, die Reaktion von Verhalten und Ereignissen der Umwelt zu beschreiben, als die klassische Konditionierung, denn mit Hilfe des operanten Konditionierens ist es möglich, nicht nur die Häufigkeit bereits verfügbarer Verhaltensweisen zu beeinflussen, sondern auch Verhalten zu erzeugen, dass für den Organismus bzw. das Individuum vollkommen neu ist. Dabei geht man prinzipiell so vor, dass stufenweise jene Verhaltensformen verstärkt werden, die eine Annäherung an das gewünschte Endziel (der Konditionierung) darstellen. Verstärkt werden im Verlauf der Konditionierung also die Verhaltenselemente, die dem gewünschten Endverhalten jeweils etwas näher kommen. Man bezeichnet diesen Prozeß als Shaping. Häufig genügt es jedoch nicht, ein bestimmtes Verhalten neu zu lernen, sondern es ist notwendig ganze Ketten einzelner Verhaltensweisen zu bilden. So besteht z.B. jede Sportart aus einer Kette einzelner Verhaltensweisen. Das Gleiche gilt für andere komplexe Handlungen (z.B. das Verfassen eines Referates). Wenn man solche komplexen Verhaltensketten erzeugen möchte, so wendet man das Prinzip des Chaining an. Dabei geht man (im Tierexperiment) so vor, dass zuerst das letzte Verhalten in der Kette primär verstärkt wird. Dieses Verhalten wird somit zum sekundären Verstärker für die davorliegende Reaktion. So wird der Verhaltenskette jeweils eine Verhaltensweise nach der anderen zugefügt. Jedes Glied der Kette wird zum diskriminativen Reiz für die nächste Reaktion und zum Verstärker für die vorhergehende Reaktion. Die Dressur von Tieren beruht normalerweise auf der Kombination von Shaping und Chaining. Beide Verfahren sind jedoch auch beim Menschen anwendbar. 7. und letzte Folge: Prägung In der Psychologie bezeichnet Prägung die Tatsache, dass sich bestimmt Einflüsse auf den Menschen, wie auch allgemein auf Organismen nachhaltig - gestaltend oder umgestaltend - auswirken (soziokulturelle Prägung: z. B. durch einen bestimmten Beruf, Lebensstandard oder durch eine bestimmte Erziehung). In der Verhaltensforschung (Ethologie) ist eine Prägung ein obligatorischer Lernvorgang, der in einigen Merkmalen von der Konditionierung abweicht. Charakteristisch für sie ist, dass sie sich auf eine einzige Bewegung oder auf eine bestimmte Gruppe von Verhaltensweisen bezieht, dass sie in der Ontogenese nur einmal, in einer sensiblen Phase, stattfinden kann und dass ein nachträgliches Umlernen unmöglich ist. Man unterscheidet zwischen einer Objektprägung, bei der die auslösenden Reize für eine bestimmte Reaktion festgelegt werden, und der motorischen Prägung, bei der ein Bewegungsmuster erworben wird. Das frischgeschlüpfte Entenküken läuft dem ersten, bewegten Gegenstand nach, der Töne von sich gibt. Nach sehr kurzer Zeit wird das Nachlaufen an weitere Merkmale des Objekts geknüpft, und das Küken ist nun nicht mehr dazu zu bewegen, einem Menschen zu folgen. Versuche an einem Stockentenküken haben gezeigt, dass die sensible Phase für die Nachfolgeprägung 13 bis 16 Stunden nach dem Schlüpfen ihr Maximum erreicht. Zu dieser Zeit wirkt das Präsentieren einer Mutterattrappe am nachhaltigsten. Innerhalb der folgenden 20 Stunden sinkt die Prägbarkeit auf fast Null ab. Ein auf Menschen geprägtes Küken kann mehreren Menschen nachlaufen. Die im Prägungsvorgang an die Reaktion geknüpften Merkmale sind also überindividuelle und meist Artmerkmale. Geprägt wird immer eine bestimmte Reaktion auf ein bestimmtes Objekt. Eine erstaunliche Erscheinung im Zusammenhang mit der Nachfolgeprägung ist, dass Schmerzreize, die in der sensiblen Phase mit dem Prägungsobjekt simultan geboten werden, den Lernvorgang sogar fördern, während bei der Konditionierung ein Fluchtverhalten bedingt würde. Neben der Nachfolgeprägung gibt es bei manchen Arten eine sexuelle Prägung. Die Prägung kann in einer Entwicklungsphase stattfinden, in der die zugehörigen Bewegungen noch nicht ausgereift sind. Dasselbe gilt auch für die motorische Prägung. Zahme und halbzahme Stockenten bevölkern heute in großer Zahl die Parkgewässer und Teichanlagen von Stadt und Land. Das bestuntersuchte Beispiel ist die Gesangsprägung bei manchen Vögeln. Zebrafinken-Männchen lernen den Gesang vom Vater, den sie zu einer Zeit hören, in der sie selber noch nicht singen. Isoliert man sie, kurz bevor sie singen, so entwickeln sie trotzdem die arttypischen Laute. Ob es sich bei der motorischen Prägung um einen grundsätzlich anderen Vorgang handelt als bei der Objektprägung, ist fraglich. Man kann sich vorstellen, dass ein Auslösemechanismus verändert oder gebildet wird, der zur Folge hat, dass später alle vom Vogel geäußerten Laute, die auf ihn passen, als Belohnung wirken. Da die Irreversibilität der Prägung möglicherweise lediglich eine Folge der kurzen sensiblen Phase ist und weil sonst manche Parallelen zu anderen Lernvorgängen vorliegen, versucht man teilweise, die Prägung als einen Spezialfall der Konditionierung zu deuten.