Grundformen des Lernens - Barbara-Julia-BJ

Grundformen des Lernens
Teil 1:
Lernen wird in der Psychologie definiert als eine dauerhafte (im Gegensatz zu einer
vorübergehenden) Änderung des Verhaltens und von Verhaltenspotentialen, die
durch Übung (im Gegensatz etwa Reifung, Prägung oder Krankheit) erfolgt.
Die dauerhafte Veränderung wird in dieser Definition betont, weil Gelerntes
unabhängig von temporalen Veränderungen, wie etwa der aktuellen Motivation,
vorliegt. Darüber hinaus sind alle beobachtbaren Verhaltensweisen, die nicht durch
Üben erworben wurden, vom Lernbegriff ausgeschlossen, also etwa auch die
Prägung.
Dieses „Lernen“ - besser wäre Verhaltensänderung - in einer genetisch festgelegten
sensiblen Phase (zum Beispiel unmittelbar nach der Geburt), wurde vor allem durch
Konrad Lorenz bekannt, der diesen besonderen Prozess unter anderem bei
Graugänsen nachwies. Inzwischen ist er bei vielen Arten bekannt und kann später
durch Umlernen kaum noch verändert werden (siehe Abgrenzung Lernen - Reifung Prägung). Aber auch die im menschlichen Reifungsprozessen automatisch
ablaufenden Verhaltensänderungen sind explizit ausgeschlossen.
Zu unterscheiden ist auch zwischen Lernen und Leistung: Leistung ist das Umsetzen
von Gelerntem durch Hinzukommen der Motivation. Aussagen über Gelerntes kann
man daher nicht aus der Leistung allein ableiten, da bei der Leistung die Motivation
zur Erbringung eines Verhaltens mit berücksichtigt werden muss.
Es gibt unterschiedlichste Einteilungen der Arten des Lernens. Eine sehr einfache ist
die Unterscheidung von vier Arten des Lernens in Reihenfolge aufsteigender
Komplexität:
Habituation (Gewöhnung): Lernen, einen Reiz zu ignorieren, der keine im
Augenblick nützliche Information enthält, zum Beispiel das Ticken einer Uhr oder das
Rauschen des Meeres. Der Sinn ist die Vermeidung einer Reizüberflutung und
Freimachen der Aufmerksamkeit. Sie läuft ständig und unbewusst ab und ist kaum
zu vermeiden, wenn die entsprechenden Randbedingungen vorliegen.
Klassische Konditionierung (Signallernen): Lernen, dass einem Reiz ein anderer
folgen wird, zum Beispiel dem Warnton des Computers folgt eine Fehlermeldung.
Zweck der Konditionierung ist es, Vorbereitungen für den zweiten Reiz treffen zu
können. Dieses Lernen läuft ebenfalls automatisch ab; ihr Ergebnis kann aber bei
Bedarf leichter als eine Habituation von bewussten Überlegungen „überstimmt''
werden.
Operative Konditionierung: Lernen, dass einer Aktion eine Konsequenz folgt, zum
Beispiel dem Aufdrehen des Wasserhahns folgt das Fliessen des Wassers oder dem
Lernen folgt eine gute Note. Dieses Lernen ist die Basis gezielter nichtinstinktiver
Handlungen. Dieses Lernen ist vor allem in Zusammenhang mit Motivationsfragen
von Bedeutung. Ein Aktions-Konsequenz-Paar, dessen Konsequenz eine positive
Motivationswirkung hat, kann man gezielt zum Antrainieren verwenden,
entsprechend eines mit negativer Motivationswirkung zum Abgewöhnen einer
Verhaltensweise.
Komplexes Lernen: Lernen, das über das Bilden von Assoziationen hinausgeht,
zum Beispiel die Anwendung einer Strategie zur Problemlösung oder die Ausbildung
der geistigen Landkarte einer Umgebung. Dieses Lernen setzt die Herstellung
mentaler Abbilder der Welt voraus und die Manipulation dieser Abbilder anstelle der
Manipulation der Welt selbst. Es handelt sich also vor allem um einen
Abstraktionsprozess. Der Lernende muss die richtigen Abstraktionen finden sowie
die richtigen Operationen zu ihrer Manipulation.
Als Konsequenz sollte man versuchen, sich bei allen komplexen Lernvorgängen die
Konzepte hinter den zu lernenden Zusammenhängen zugänglich zu machen. Diese
Konzepte geben die Gemeinsamkeiten hinter den zu lernenden Zusammenhängen
(also deren Essenz) wieder sowie idealerweise auch die Motivation hinter deren
Entwurf (also die Begründung), denn es handelt sich ja um bewusst und gezielt für
einen Zweck entworfene Artefakte.
Somit liegen diese Konzepte schon nah an den Abstraktionen, die zum Lernen
ausgebildet werden müssen und ihre Kenntnis erleichtert deshalb das Lernen. Häufig
ist es dabei nützlich, sich mittels Metaphern, Vergleichen etc. auf andere Konzepte
zu stützen, die bereits geläufig sind. Ein wichtiger Schluss aus diesem
Lernmechanismus lautet, sich beim Lernen nach Möglichkeit Zusammenhänge
vollständig sichtbar zu machen.
Es gibt grundsätzlich zwei Arten, wie eine Abstraktion beim komplexen Lernen
erworben werden kann: induktiv oder deduktiv.
Beim deduktiven Lernen (Lernen des Speziellen aus dem Allgemeinen) wird eine
Beschreibung des zu lernenden Zusammenhangs vorgegeben, die in Begriffen
abgefasst ist, die bereits zuvor gelernt wurden. Der Lernende analysiert diese
Beschreibung und entwickelt daraus geistig die neue Abstraktion. Deduktives Lernen
setzt Sprache oder sprachähnliche Systeme voraus.
Beim induktiven Lernen hingegen (Lernen des Allgemeinen aus dem Speziellen)
werden eine Reihe von Beispielen und Gegenbeispielen für die zu lernende
Abstraktion vorgegeben. Überwiegend unbewusst wendet der Lernende eine große
Zahl von früher gelernten Abstraktionen auf die Beispiele an, um deren relevante
Gemeinsamkeiten und Unterschiede herauszufiltern. Die Gemeinsamkeiten werden
vor dem Hintergrund der Unterschiede verallgemeinert (was ein unzuverlässiger
Schritt ist!) und bilden den Inhalt der neu gelernten Abstraktion.
Höheren Lebewesen, besonders Menschen, sind enorm leistungsfähig beim
induktiven Lernen, zumindest, wenn alle notwendigen Basisabstraktionen bekannt
sind. Aus diesem Grund ist es stets vorteilhaft, das Lehren möglichst stark auf
induktives Lernen zu stützen. Allerdings erlaubt das induktive Lernen nicht, mit
vertretbarem Aufwand eine genaue Grenzziehung einer Abstraktion zu lernen.
Zweifelsfälle können also nach einem rein induktiven Lernprozess oft noch nicht
korrekt beurteilt werden.
Es sind in der Regel eine ganze Reihe von Beispielen nötig, um die meisten
Zweifelsfälle auszuschließen, obwohl sonst sicherlich drei positive und drei negative
Beispiele ausgereicht hätten. Deshalb sollte eine induktive Lernlektion möglichst mit
einer entsprechenden deduktiven vervollständigt werden, die nach der Ausbildung
eines Verständnisses für den überwiegenden Teil des Gehalts der zu lernenden
Abstraktion dann auch recht schnell aufgenommen werden kann.
Gelernte Gedächtnisinhalte sind an vielen verschiedenen Stellen des Gehirns
gespeichert. So befinden sich sprachliche Informationen in einem anderen Bereich
als visuelle oder haptische. Dies bedeutet, dass unser Wissen über einen
Gegenstand, beispielsweise über eine Blume, nicht an demselben Ort abgespeichert
ist, sondern über unser Gehirn verteilt abgelegt wurde. Bei Bedarf, also wenn wir uns
an diese Blume erinnern, werden die vielen Einzelinformationen (Form,
Bezeichnung, Geruch usw.) wieder zusammengefügt.
WICHTIG !!!
Die Information trifft in Form eines wahrnehmbaren Reizes auf eine Sinneszelle, die
ihn als elektrischen Impuls an eine Nervenzelle (Neuron) weiterleitet. Wird ein
bestimmter Energiewert überschritten, gibt diese Nervenzelle den Reiz über einen
faserartigen Fortsatz, das Axon, an ein oder mehrere andere Neuronen weiter, die
ihn ihrerseits ebenfalls weiterleiten können. Die Information hinterlässt so
charakteristische Spuren. Durch häufiges „Nachziehen“ dieser Spuren (Üben,
Wiederholen) verstärken sich die Verbindungen (Synapsen) zwischen den
betreffenden Zellen.
Es entsteht ein bleibendes Muster, ein Engramm. Die Information ist gespeichert,
das heißt: sie ist gelernt!
Das Abspeichern von Informationen im Gedächtnis kann durch eine Reihe von
Faktoren beeinträchtigt werden, die nicht alle mit dem Lernvorgang im engeren Sinne
zu tun haben. So ist Lernen nicht nur eine Sache des Gehirns, sondern des ganzen
Körpers. Sind wir krank, erschöpft oder müde, ist unsere Aufnahmebereitschaft
herabgesetzt. Ähnlich ist es unmittelbar nach einer Mahlzeit.
Diese Beeinträchtigungen lassen sich leicht erklären: Denn das Gedächtnis beruht
auf komplexen Vorgängen, an denen viele Gehirnbereiche beteiligt sind, auch jene
Partien, die grundlegende Körperfunktionen steuern.
Gefühle haben einen enormen Einfluss auf den Lernvorgang. Negative Gefühle wie
Angst, Unlust oder Sorge beeinträchtigen das Einprägen des Lernstoffs. Auch
Lernen unter Stress mindert den Erfolg. Gefühle entstehen in einem Teil des
Gehirns, der limbisches System genannt wird. Er hat die Aufgabe, eintreffende
Informationen zu bewerten, ihre Relevanz zu prüfen und somit eine adäquate
Reaktion des Menschen auf den entsprechenden Reiz sicherzustellen. Mit dieser
Bewertung ist eine emotionale Einfärbung der Informationen verbunden. Eine
positive emotionale Besetzung des Lernstoffes ist für das Behalten wichtig.
Daher wird ein Lernstoff besonders gut aufgenommen, wenn er mit positiven
Gefühlen verbunden ist.
Teil 2: Klassische Konditionierung
Ivan Petrowitsch Pawlow gründete in Petersburg das „physiologische Labor für
experimentelle Medizin“, in dem er den größten Teil seiner berühmten
Forschungsarbeiten durchführte. Er hatte in Experimenten gezeigt, dass zum
Beispiel Welpen über einen angeborenen Speichelreflex verfügen, der ausgelöst
wird, sobald Futter in ihr Maul gerät. Eine Beobachtung, die jeder Hundebesitzer an
seinem Tier feststellen kann. Pawlow nannte diese Speichelabsonderung eine
psychische Sekretion, da er davon überzeugt war, es handle sich um einen vom
Gehirn gesteuerten Prozess. Er entwickelte darauf hin eine Methode, psychische
Vorgänge von außen zu beobachten, ohne sich dabei auf innere seelische Zustände
zu beziehen.
Am Beginn des 20. Jahrhunderts führte Pawlow seine klassisch gewordenen
Experimente durch: Ein Hund wurde in einem besonderen Apparat gestellt, in dem
die Intensität des Speichelflusses als Reaktion auf bestimmte Reize gemessen
werden kann. Dem Hund wurde ein unbedingter Reiz (UCS: Futter) präsentiert,
woraufhin er den angeborenen Reflex (UCR: Speichelfluss) zeigte. Auf das Läuten
einer Glocke (CS) zeigte der Hund keinerlei Reaktion, außer einer gewissen Neugier.
Pawlow kombinierte die beiden Reize (UCS und CS), worauf der Hund mit
Speichelfluss reagierte (UCR). Nach mehrmaligem Wiederholen dieser
Reizpräsentation, reagiert der Hund schon auf das Glockenläuten mit Speichelfluss.
Diese Reaktion nennt Pawlow bedingte Reaktion (CR). CR und UCR ähneln sich,
sind aber nicht identisch: so produziert der Hund, beim Anblick des Futters immer
noch mehr Speichel, als bei dem Ertönen der Glocke.
Der entscheidende Punkt in diesem Experiment ist, dass nach der Konditionierung
ein vorher neutraler Reiz eine Reaktion hervorruft, die vorher nur durch einen
unbedingten Reiz ausgelöst wurde. Wird dem Versuchstier jedoch längere Zeit der
bedingte Reiz (CS) allein dargeboten, so verschwindet allmählich die bedingte
Reaktion (CS); Pawlow nannte diesen Prozess Löschung.
Wiederholt man nach einiger Zeit das Experiment, so zeigt der Hund nach wesentlich
weniger Versuchsdurchführungen wieder die bedingte Reaktion auf den bedingten
Reiz.
Dies beweist, dass die Konditionierung nicht gänzlich gelöscht wurde, sondern
lediglich gehemmt worden war. Als Anerkennung für seine Forschungsarbeiten
erhielt er 1904 den Nobelpreis für Physiologie und Medizin verliehen.
Merkmale des Pawlowschen Reflexbegriffes:




Deterministische Natur, das heißt, dass jede Reaktion einer Ursache (zum
Beispiel Reiz) bedarf.
Prinzip der Analyse und Synthese, d.h., die Reflexlehre zerlegt die Vorgänge
im Nervensystem in ihre kleinsten Bestandteile (Reflexe, die Verknüpfungen
zwischen Reiz und Reaktion sind) und fügt diese dann wieder zusammen, um
das Ganze zu beschreiben.
Räumliches Konstruktionsprinzip: wo spielt sich der Reflexvorgang ab und wie
hängt dieser Ort mit dem Vorgang zusammen.
Ein Reflex ist nicht dasselbe wie eine Reaktion, er ist die Verknüpfung
zwischen Reiz und Reaktion.
Drei Arten von Reflexen:



unbedingte: Sie sind angeboren und artspezifisch. Einem Reiz folgt
automatisch, unbedingt eine ganz bestimmte Reaktion.
bedingte: Sie sind erworben und individuell. Auch hier besteht eine
gesetzmäßige Verbindung zwischen einem Reiz und einer Reaktion, die
jedoch erlernt und vielfältig beeinflussbar ist.
Orientierungsreflexe: Neue Reize werden mit einer Orientierungsreaktion (OR)
verbunden, die sich in allgemeiner Erregung, Hinwendung zum Reiz und
Desynchronisierung der EEG Alpha-Wellen äußert.
Arten von Reizen und Reaktionen:

Unbedingter Reiz (US): Ein solcher Reiz ist ohne experimentelles Zutun in der
Lage, immer eine Reaktion hervorzurufen.




Unbedingte Reaktion (UR): Sie wird durch den US hervorgerufen und hat in
irgendeiner Form biologischen Nutzen (zum Beispiel Lidschlag schützt die
Augen).
Bedingter Reiz (CS): Ein Reiz, der ursprünglich neutral ist, beim Organismus
also keine spezifische Reaktion hervorruft, sondern allenfalls eine allgemeine
Orientierungsreaktion. Durch den Vorgang des Konditionierens (CS und US
treten wiederholt in zeitlicher Nähe auf) wird dieser neutrale Reiz zum CS,
wenn auf ihn irgendwann eine der UR ähnliche Reaktion folgt, die CR. Nach
Pawlow kann jeder beliebige Reiz, der von einem Sinnesorgan aufgenommen
wird, zum CS werden.
Bedingte Reaktion (CR): Wird nach erfolgreichem Konditionieren vom CS
ausgelöst. Sie ist der UR ähnlich, jedoch nicht gleich. Sie hat eine längere
Latenzzeit und eine geringere Amplitude als die UR und ist kürzer als diese.
Sie könnte entweder eine Komponente der UR sein, die durch den CS
hervorgerufen wird, oder eine Reaktion sein, die den Organismus auf die UR
vorbereitet.
Reflexkette: Wenn die Reaktionen auf einen Reiz (egal ob UR oder CR) einen
weiteren Reflex auslösen (und diese Reaktion dann wieder einen usw.), so
entsteht eine Reflexkette. Auch solche Ketten können wieder untereinander
verkoppelt werden und bilden so die Grundlage des Verhaltens.
Arten der Konditionierung:
Vorwärtsgerichtete: Der CS tritt vor dem US auf, entweder verzögert, das heißt: CSCS+US-US, oder zur Ausbildung eines Spurenreflexes, also CS-Pause-US.
Gleichzeitige: CS und US treten gleichzeitig auf. Rückwirkende: Der US geht dem
CS voraus. Temporalreflex: Die Konditionierung erfolgt auf einen „Zeittakt“, der US
wird in immer gleichen Abständen wiederholt, die CR erfolgt dann ohne weiteren
Reiz in derselben zeitlichen Abfolge.
Reflexe höherer Ordnung:
Man erzeugt mittels eines US und eines neutralen Reizes eine Verbindung CS-CR.
Dann wird in einem weiteren Konditionierungsverfahren ein anderer neutraler Reiz
an die Stelle des ursprünglichen CS gesetzt. Man erhält so eine Konditionierung
zweiter Ordnung.
Weitere wichtige Begriffe der Reflexologie:



Pseudokonditionierung: Ein aversiver Reiz (US) wird wiederholt dargeboten.
Wird nun direkt im Anschluss ein neutraler Reiz dargeboten, wird die UR (bzw.
CR) auch gezeigt. US und CS werden offensichtlich durch die Situation
miteinander verknüpft.
Sensorisches Vorkonditionieren: Mehrere neutrale Reize werden als
Compound dargeboten, danach erfolgt eine Konditionierung mit einem dieser
Reize als CS. Dieser CS ist nun durch die anderen, vorher mit ihm
dargebotenen Reize austauschbar.
Reizgeneralisierung: Eine Reaktion auf einen speziellen Reiz (CS) wird
gelernt. Auf andere, diesem Reiz ähnliche Reize erfolgt auch eine Reaktion,
die umso stärker ist, je größer die Ähnlichkeit ist. Die Stärke der Reaktion in
Abhängigkeit von der Ähnlichkeit wird in einem Diagramm, dem
Reizgradienten abgebildet.



Diskrimination: Bezeichnet die Fähigkeit, zwischen verschiedenen Reizen zu
unterscheiden. Sie kann trainiert werden, indem man immer den einen Reiz
mit, den anderen ohne US darbietet.
Experimentelle Neurose: Wenn man einen Reiz (zum Beispiel Kreis) mit
einem positiven US, und einen anderen, ähnlichen Reiz (zum Beispiel Ellipse)
mit einem negativen US verbindet, und die Reize so sehr angleicht, dass das
Versuchstier nicht mehr diskriminieren kann, reagiert es mit abwechselnd
starker Erregung und starker Erschöpfung sowie Unsicherheit. Dies heißt
experimentelle Neurose.
Aversive Reize: Sie lösen neben der UR bzw. CR auch eine allgemeine
Angstreaktion aus.
Teil 3: Pawlows Theorie über zentralnervöse Vorgänge bei der Konditionierung
Der US löst in einem bestimmten Zentrum des ZNS eine Erregung aus, die dann zur
UR führt. Erfolgt nun gleichzeitig mit dieser Erregung eine unspezifische, indifferente
Erregung irgendwo anders im ZNS (und das auch noch wiederholt), so wird diese
Erregung zu der spezifischen „hingezogen“, es wird ein Weg (eine Verbindung)
zwischen den ehemals unabhängigen Erregungen gebahnt. Dieser Vorgang ist
reversibel, bzw. hemmbar (siehe Löschung und spontane Erholung).
Irradiation: Die Ausdehnung der Erregung auf benachbarte „Herde“ im ZNS. Dem
erregten „Herd“ benachbarte Regionen, werden je nach ihrem Abstand,
unterschiedlich stark erregt (s. Generalisation).
Konzentration: Sie ist das Gegenteil der Irradiation, die Erregungsausbreitung wird,
zum Beispiel durch Diskriminationstraining, auf bestimmte Areale eingegrenzt.
Hemmung, Löschung und spontane Erholung Hemmung ist sowohl ein
gegenläufiger Prozess zur Erregung, als auch zur Bahnung. Ein anderer Prozess
wird, wenn er gehemmt wird, behindert.
externe: Eine CR wird durch die Aktivität eines anderen „Herdes“ gehemmt. Ein
anderer Reiz bewirkt zum Beispiel eine OR, wodurch die CR abgeschwächt wird,
oder sogar ganz ausbleibt. Externe Enthemmung beschreibt einen Vorgang, bei dem
eine interne Hemmung durch einen (neuen) Reiz aufgehoben wird.
interne: Ist vergleichbar mit dem Begriff der reaktiven Hemmung bei HULL oder
auch EYSENCK, es werden hiermit physiologische Prozesse beschrieben, die das
Auftreten der CR hemmen. Dazu zählen die Abschwächung (bei öfter CS ohne US)
und auch die Generalisation, die ja mit zunehmender Unähnlichkeit der Reize (und
damit nach Pawlow zunehmender Entfernung der erregten Zentren) geringer wird.
Weiterhin kann interne Hemmung durch Verzögerung auftreten wenn der US dem
CS erst nach längerer Zeit folgt.
bedingte: Man verbindet eine CR zunächst mit zwei Reizen und bietet dann einen
davon nur noch mit einem neutralen Reiz zusammen dar (gleich: Löschung des
einen CS). Dieser neutrale Reiz hemmt nun auch wenn er mit dem anderen CS
dargeboten wird, das Auftreten der CR. Auch hier ist eine Konditionierung zweiter
Ordnung möglich.
Eine Löschung erfolgt im Experiment in Form von interner Hemmung, der CS wird
solange ohne US dargeboten, bis keine Reaktion mehr feststellbar ist, bis also die
Bahnung (physiologisch) aufgehoben ist. Bei einer spontanen Erholung hemmt sich
die interne Hemmung, die zur Löschung der CR geführt hat, offensichtlich selber.
Eine gelöschte CR taucht nach einer Pause während des Experiments von selbst,
also ohne zwischenzeitliche Verbindung mit dem US von alleine wieder auf.
Einflüsse auf bedingte Reaktionen sind möglich durch






Motivation: Je stärker die Motivation zu einer bestimmten UR, desto stärker
auch zur entsprechenden CR (zum Beispiel Hunger des Hundes-Speicheln)
Intensität des CS: Je höher, desto stärker CR.
Intensität des US: Je höher, desto wahrscheinlicher Ausbildung einer CR.
Verwendung von CS-Compounds: Dies ist meist wirksamer als nur ein Reiz.
Verwendung mehrerer US: Dies ist meist wirksamer als nur ein Reiz.
Inter-Stimulus-Intervall (ISI) zwischen US und CS: beim Skeletalsystem 0,2 0,5 s, beim autonomen NS zwischen 2 und 5 s optimal für
Konditionierungserfolg.
Erlernen emotionaler Reaktionen und Einstellungen
Generell kann angenommen werden, dass viele unserer emotionalen Reaktionen
und Einstellungen gegenüber Reizen durch klassische Konditionierung erworben
wurden.
Das klassische Konditionieren liefert zwar kaum angemessene Beschreibungen
kognitiven bzw. schulischen Lernens. Es spielt jedoch indirekt eine Rolle, da
vorhandene emotionale Reaktionen der Schüler durch klassisches Konditionieren
entstanden sein können (zum Beispiel Schul- und Prüfungsangst, Aggression).
Dieses Wissen kann für den Lehrer hilfreich sein.
In der Schule bzw. im Unterricht können Konditionierungen emotionaler Reaktionen
stattfinden, die langfristige Folgen haben (zum Beispiel Lernfreude vs. Schulangst).
Lehrer, Klassenzimmer, Schule etc. können zum Beispiel zu angstauslösenden CS
werden, wenn sie mit sehr negativen Erlebnissen gekoppelt wurden. Dies kann bis
zu Bildungsfeindlichkeit oder Abneigung gegen Bücher führen.
Ein anderes Beispiel wird von Anderson (2000) erwähnt, der eine Abneigung gegen
Krabben entwickelt hat, weil ihm nach dem ersten Genuss von Krabben aufgrund
einer Erkrankung sehr schlecht geworden ist. Selbst beim Schreiben des Kapitels
über klassischem Konditionieren hat er Übelkeitsgefühle empfunden.
Entstehung von Ängsten
Eine besondere Rolle spielt die Untersuchung von Ängsten, die ein sehr häufiges
Problem darstellen. Es lassen sich leicht viele Ängste nennen, die man selber hat
oder die man von anderen kennt, die mittels klassischen Konditionierens gelernt
wurden (zum Beispiel Höhenangst, Angst vor dem Wasser, vor dem Zahnarzt).
Allerdings gibt es auch Ängste gegenüber Objekten, mit denen man noch gar keinen
Kontakt hatte (Schlangen). Es ist daher zweifelhaft, in welchem Ausmaß KK als
Ursache von Ängsten in Frage kommt. Allerdings gibt es genügend dokumentierte
Beispiele für klassisch konditionierte Ängste. Gut dokumentiert sind zum Beispiel
konditionierte Ängste aufgrund traumatischer Erfahrungen (zum Beispiel Krieg, KZ,
Folter). Solche extrem intensiven US bzw. UR führen zu sehr löschungsresistenten
Konditionierungen und eine einmalige Kopplung von CS und US kann bereits eine
Konditionierung bedingen.
Beispiele dafür sind Reaktionen auf gruselige Filmmusik, die häufig mit bestimmten
„Effekten“ kombiniert wurde. Ein weiteres Beispiel sind Marinesoldaten, die noch 15
Jahre nach dem Krieg eine starke Reaktion auf eine Tonfolge zeigten, die im Krieg
als Signal zum Einnehmen der Gefechtsposition diente.
Damals fand eine Konditionierung statt, wobei Gewehrfeuer und Geräusche von
Bomben die US darstellten. In der entsprechenden Studie wurden zwei Gruppen
verglichen, nämlich Heeres- und Marine-Soldaten, denen 20 unterschiedliche
Geräusche dargeboten wurden. Es erfolgte eine Messung der psychogalvanischen
Hautreaktion (Hautwiderstandsmessung).
Der größte Unterschied zwischen beiden Gruppen in ihrer emotionalen Reaktion
zeigte sich bei einer Serie von 100 Gongschlägen/Min. Diese Tonfolge war während
des Zweiten Weltkrieges bei der amerikanischen Marine das Signal für „Alle Mann
auf Gefechtsstation“. Mehr als 15 Jahre nach Kriegsende rief dieses Signal bei den
Navy-Veteranen immer noch starke emotionale Reaktionen hervor - bei den ArmyVeteranen, für die dieses Signal keine Bedeutung hatte, hingegen nicht. Auch in
unseren Breiten löst heute noch jede Sirene bei vielen Menschen Angst aus, obwohl
es sich um einen Probealarm handelt.
Ein weiteres Beispiel dafür ist der Zahnarzt. Bereits beim Anblick des Bohrers
bekommen es viele mit der Angst zu tun. Der Grund dafür ist eine gelernte
Reizreaktionsverbindung. Hat ein Erwachsener z. B. im Englischunterricht in der
Schule negative Erfahrungen mit einem Lehrer gemacht, kann dadurch für ihn eine
folgenschwere Lernschwierigkeit entstehen, da seine Motivation für Sprachenlernen
generell gestört sein.
Als Therapieformen (vor allem für Phobien) wurden die systematische
Desensibilisierung und die Implosion entwickelt (bei letzterer hat der Klient die
Möglichkeit, in einer sicheren Umgebung zu erleben, das der phobische Reiz zu
keiner Verletzung etc. führt und es kommt folglich zur Extinktion). Das Problem bei
Ängsten ist oft, dass aufgrund von Vermeidungsverhalten keine Extinktion erfolgen
kann. Dies wird durch Desensibilisierung gewährleistet. Bei dieser Methode wird erst
eine Angsthierarchie entwickelt (zum Beispiel Bild einer Schlange bis hin zu
Anfassen einer Schlange).
Man beginnt damit, den Patienten in völlige Entspannung zu bringen, die unvereinbar
mit Angst ist. Dann präsentiert man den schwächsten Angstreiz so lange bzw. so oft,
bis dieser keinerlei negative Reaktion mehr auslöst; usw.
Evaluative Konditionierung und Werbung
Das klassische Konditionieren beruht normalerweise auf einer Wenn-DannBeziehung, wenn der CS auftritt, dann ist mit dem US zu rechnen, d.h., die mentale
Repräsentation des CS aktiviert die Repräsentation des US und die CR kommt
zustande. Diese Art der Konditionierung ist vom Bewusstsein abhängig. Daneben
gibt es jedoch noch ein andere Art der Konditionierung, die automatisiert und
unbewusst abläuft und auf einer evaluativen Reaktion (ER) beruht. Damit ist eine
unmittelbare Reaktion im Sinne von gut/positiv/Mögen oder
schlecht/negativ/Ablehnung gemeint.
Essentielle ER sind angeboren, weitere können durch Erfahrung erworben werden.
Diese Reaktion erfolgt noch vor dem Einsetzen kognitiver Reizverarbeitung. Man
kann nun solche Reize (zum Beispiel Bilder) ermitteln, die bei einer Person eine
positive ER hervorrufen. Wenn man nun neutrale Reize zusammen mit positiven
Reizen öfter koppelt, lösen die neutralen Reize ebenfalls eine positive ER aus. Ein
Bewusstsein der Kontingenz positiver und neutraler Reize ist nicht notwendig. Das
Prinzip der ER wird vor allem in der Werbung genutzt.
Einige sehr erfolgreiche Werbungen zeichnen sich dadurch aus, dass sie sehr
persistent ein Produkt mit positiven Reizen kombinieren (Tiger-Esso Benzin;
Natur/Cowboys-Marlboro; Schöner Mann-Parfum). Möglicherweise kann auch mit der
ER erklärt werden, dass Leute, die viel über andere lästern, selbst mit negativen
Eigenschaften assoziiert werden.
Teil 4: Operante Konditionierung
Das klassische Konditionieren kann eine Reihe von Lernphänomenen nicht erklären.
Dazu gehören insbesondere das Entstehen neuer Verhaltensweisen, die bisher nicht
im Verhaltensrepertoire eines Individuums waren (z.B. Fahrradfahren)
Verhaltensenderungen, die unabhängig von vorausgehenden Stimulusbedingungen
sind - das trifft wohl für das meiste Verhalten zu.
Burrhus Frederic Skinner führte in den USA Tierversuche mit Tauben und Ratten
durch. Auch dazu wurde eine künstliche Experimentalsituation entwickelt, die
Skinner-Box. Skinner, der wichtigste Vertreter des operanten Konditionierens
unterscheidet zwei Typen der Konditionierung:


Konditionierung Typ S(timulus): Damit ist das KK gemeint, bei dem bereits
vorhandene Reaktionen auf neue Reizbedingungen konditioniert werden, die
diese Reaktionen dann fast automatisch auslösen (Lernen neuer
Auslösebedingungen). Skinner spricht auch von respondentem
Konditionieren.
Konditionierung Typ R(eaktion): Beim Reaktionslernen geht es um das
Entstehen und Verändern willkürlich und freiwillig ausgeübter
Verhaltensweisen aufgrund von Reizen, die dem Verhalten folgen
(Verstärkung). Ein Großteil menschlichen Verhaltens ist willkürlicher Natur und
tritt auch auf, ohne dass bestimmte Reize es auslösen. Es ist jedoch
wesentlich von den Konsequenzen abhängig, die ihm folgen. Es wird als
operantes Verhalten bezeichnet, weil es in der Umwelt „operiert“ bzw. weil es
selbst etwas bewirkt.

Das operante Konditionieren besteht in der Beeinflussung der
Auftretenswahrscheinlichkeit operanten Verhaltens durch bestimmte
Verhaltenskonsequenzen. Operantes Lernen kann auch als Lernen neuer
Verhaltens-Folge-Beziehungen verstanden werden. Unter Operantem Konditionieren
versteht man auch das Lernen durch Versuch und Irrtum. Es lässt keine
unmittelbaren Auslöser erkennen, bewirkt aber eine Reaktion in der Umwelt. Es wird
durch seine Folgen gesteuert.
Das Grundprinzip ist das Bekräftigungslernen. Durch die planmäßige Gestaltung der
Folgen einer Handlung wird die Auftretenswahrscheinlichkeit des Verhaltens
verändert. Je nach Art der Folgen erhöht oder erniedrigt sich diese. Verstärker sind
kontingent auftretende Folgen.
Es gibt drei wichtige Schritte:




eine wählbare Reaktionsklasse
eine verstärkende Verhaltenskonsequenz
eine Kontingenz zwischen Verhalten und Konsequenz
Auch beim operanten Konditionieren kann eine Stimuluskontrolle vorhanden
sein. Zum Beispiel kann die Handlung ausgelöst werden im Beisein bestimmter
Stimuli und bei anderen Stimuli wird sie nicht ausgeführt. Die Stimuli haben daher
nur Hinweisfunktion.
Thorndike formulierte das „Gesetz der Wirkung“, das den Begriff „Lernen am Erfolg“
beinhaltet. Zufällige Aktionen, die zu einer positiven Konsequenz für das Individuum
führen, werden seiner Meinung nach selektiert und öfter eingesetzt. Für ihn war die
Verknüpfung von Reiz und Reaktion, nicht einfach nur durch Wiederholung und
Kontiguität vorhanden, sondern ebenfalls an eine Verstärkung gebunden. Diese
Verstärkung bezieht sich auf die subjektive Wahrnehmung des Lernenden. Wenn die
Verknüpfung von Reiz und Reaktion einen Zustand der Befriedigung (verstärkender
Effekt) für das Individuum darstellt, wird die Verknüpfung gestärkt. Im Gegensatz
dazu zieht der Effekt einer Nichtbefriedigung eine Schwächung der Verknüpfung
nach sich.
Das Versuchstier kann sich durch Drücken eines Hebels (Wirkreaktion) Futter
beschaffen. Die Belohnungsgabe (Futter, Wasser) erfolgt nur unter bestimmten
Bedingungen, die das Versuchstier zu erlernen hat. Ein äußerer Kasten schirmt den
eigentlichen Versuchskasten gegen Störgeräusche von außen ab. Oft nimmt eine
Fernsehkamera das Innere über einen Spiegel auf, um das Verhalten des
Versuchstieres beobachten oder aufzeichnen zu können. Mit dieser Apparatur wurde
die operante Konditionierung untersucht, also jene Lernform, die durch Verstärkung
bzw. Belohnung gesteuert wird.
Teil 5: Die vier Arten der Verstärkung und Bestrafung der operanten
Konditionierung
Unter einem Verstärker versteht man jeden dem Verhalten folgenden Stimulus, der
die Verhaltenshäufigkeit steigert. Bei der Bestrafung verhält es sich umgekehrt: Unter
einer Bestrafung versteht man jeden dem Verhalten folgenden Stimulus, der die
Verhaltenshäufigkeit mindert. Auch Verhaltensweisen können als Verstärker bzw.
Bestrafung fungieren.
Primäre Verstärker/Bestrafung hängen mit biologischen Bedürfnissen zusammen (z.
B. Futter, E-Schock). Sekundäre Verstärker entstehen durch Koppelung (z.B. durch
klassische Konditionierung!) mit primären Verstärkern (z. B. zu Essen geben +
Lächeln). Sekundäre bzw. soziale Verstärker (z. B. Geld, soziale Anerkennung)
spielen eine größere Rolle als primäre Verstärker. In vielen Fällen führen sie zu
primärer Verstärkung oder können gegen eine solche eingetauscht werden.
Sekundäre Verstärker sind leichter und unmittelbarer einsetzbar.
Wesentlich für die Verstärkung ist die Kontingenz, d.h. es muss eine Korrelation
zwischen Verhalten und Verstärker bestehen. Es darf keine Verstärkung erfolgen,
wenn das Verhalten nicht auftritt!
Es gibt vier Arten von Verstärkung und Bestrafung:
Positive Verstärkung: Durch einen Verstärker kommt es zu einer Erhöhung der
Auftretenswahrscheinlichkeit des Verhaltens. Folgt dem Verhalten ein positives
Ereignis (Verstärker), kommt es zu einer positiven Konsequenz. Als Beispiel dafür
wäre ein Kind, das jedes Mal, wenn es sein Zimmer aufräumt, gelobt wird. Als
Konsequenz wird dieses Kind jetzt öfter sein Zimmer aufräumen. Weitere Beispiele:
Lernverhalten - Lob; Uni-Tassen im Automaten abgeben - Erhalt eines Bons.
Negative Verstärkung: Hier folgt auf das Verhalten ein Ausbleiben eines
unangenehmen Ereignisses (Verstärker). Ein Beispiel hierfür wäre die Drohung der
Eltern ein Kinder-Fest abzusagen, sollten die Hausaufgaben nicht gemacht werden.
Diese Drohung wird nicht verwirklicht, weil das Kind seine Hausaufgaben erledigt.
Weitere Beispiele: Lernverhalten - kein Tadel des Lehrers oder keine ständigen
Ermahnungen der Eltern mehr; Auftreten von Übelkeit vor einer Prüfung - Prüfung
kann nicht absolviert werden, somit kommt es zu einer entlastenden Verstärkung
(Auftreten von Übelkeit wird verstärkt durch Ausbleiben eines unangenehmen
Ereignisses). Vor allem Vermeidungsverhalten wird durch negative Verstärkung
aufrechterhalten: In Gefahrensituation (z. B. hohes Gebäude) tritt
Vermeidungsverhalten auf (Vermeiden hoher Gebäude) und wird durch Ausbleiben
von Angstzuständen verstärkt. Dadurch wird verhindert, daß die Angstreaktion
gelöscht werden kann.
Bestrafung durch aversive Reize: In dieser Form des Lernens folgt dem Verhalten
ein unangenehmes Ereignis (Bestrafung). Ein Kind bekommt aufgrund seines
schlechten Benehmens zu seinem Bruder das Verbot zu Fernsehen. Es kommt zum
Entzug eines positiven Reizes. Bei zu aversiver Bestrafung kann es zu klassischer
Konditionierung kommen, so dass z.B. der Lehrer oder ein Elternteil zu einem CS
wird, die negativen Emotionen auslöst. Solche Nebenwirkungen sollten bei
Bestrafung vermieden werden. Entscheidend für die Wirkung von Bestrafung ist u. a.,
daß ein Alternativverhalten zur Verfügung steht, das belohnt wird.
Bestrafung durch Entziehung positiver Reize (Löschung): Auf ein Verhalten folgt
weder ein unangenehmes noch ein angenehmes Ereignis. Ein Schüler benutzt im
Unterricht oft das Wort „Scheiße“. Der Lehrer ignoriert diesen Begriff und es kommt
somit zur Löschung. Der Schüler kann damit keine Aufmerksamkeit erregen. Weitere
Beispiele: Fehlverhalten - „Liebesentzug“, Entzug bereits versprochener
Belohnungen, etc.
Auch beim klassischen Konditionieren kann man von Verstärkung sprechen.
Der Verstärker beim operanten entspricht dem UCS beim klassischen.
===== Operante Konditionierung und Clicker: Wie alles anfing
Von Gitta Vaughn
Karen Pryors Verdienst war es, Clickertraining populär zu machen, vor allem für den
privaten Hundehalter. Aber erfunden hat sie es nicht. Skinner hat die ersten Arbeiten
mit Tauben gemacht, die Bomben ins Ziel leiten sollten, Ende der 30er Jahre mittels
Operant Conditioning. Kam nicht zum Einsatz, die Idee.
Zwei seiner Assistenten, Keller Breland und Marian Bailey (die dann geheiratet
haben) waren die ersten die das ganze kommerziell angewandt haben. Werbespots
im Fernsehen, Werbung auf landwirtschaftlichen Ausstellungen, Shows wie Disney
mit Papageien etc.
Die waren über Jahrzehnte erfolgreich damit, nur konnten sie Hundeausbilder
damals nicht überzeugen. Die blieben bei ihren gewohnten Methoden. Später kam
Bob Bailey dazu, der nach Kellers Tod Marian heiratete. In die Zeit fielen auch viele
heute noch geheime Projekte für die Regierung.
Vom Delphin zum Krähe wurden viele Tierarten für Spionagezwecke etc.
ausgebildet. Karen Pryor kam erst viel später, nannte das ganze Clickertraining und
hat auch nur einen Bruchteil der Erfahrung die die Baileys haben. Lange Zeit waren
Clicker und Operant Cond. ein und das dasselbe, hat sich dann aber abgespalten,
weil Clickertraining, wie es heute ausgelegt wird, nur mit positiver Bestärkung
(Leckerli) oder negative Strafe (kein Leckerli) arbeiten und alles andere ablehnen.
6. Folge Diskriminative Stimuli
Auch beim operanten Lernen können Reize eine Rolle spielen, die dem Verhalten
vorausgehen. Diese Reize können anzeigen, ob einem bestimmten Verhalten eine
bestimmte Verstärkung folgen wird (positiver diskriminativer Reiz) oder nicht
(negativer diskriminativer Reiz). Wenn ein bestimmtes Verhalten von diskriminativen
Reizen beeinflusst wird, dann ist das Verhalten unter „Stimuluskontrolle“.
Experimentell kann man das so erzeugen, dass man ein Versuchstier z.B. nur dann
für das Drücken eines Hebels belohnt, wenn vorher ein Licht aufleuchtet. Äußerlich
kann dann beobachtet werden, dass das Licht das Hebeldrücken offenbar auslöst. In
Wirklichkeit führt das Licht jedoch dazu, daß in dieser Situation für das Hebeldrücken
eine Belohnung erwartet wird. Die diskriminativen Reize rufen das Verhalten also
nicht hervor. Sie haben lediglich einen Informationswert bezüglich zu erwartender
Verstärkungen.
Es gibt im Alltag viele Beispiele für Verhalten, das unter Stimuluskontrolle ist (z.B.
der Anblick einer Zigarettenschachtel scheint oft unmittelbar den Griff zur Zigarette
auszulösen, tatsächlich führt der Anblick jedoch zu der Erwartung eines belohnenden
Ereignisses wenn der Griff zur Zigarette bzw. das Rauchen der Zigarette erfolgt). Im
Rahmen seiner Untersuchungen hat Skinner verschiedene „Verstärkungspläne “
erarbeitet:
1. Für die Erhaltung des gewünschten Verhaltens ist eine konsequente Reaktion auf
das gezeigte Verhalten nötig (Lob, Strafe etc.) 2. Wird die Konsequenz nur
sporadisch (bzw. partiell) ignoriert, verstärkt sie u.U. das unerwünschte Verhalten. 3.
Wird das gezeigte Verhalten ignoriert, führt dies zur dessen Extinktion (Ko) 4. Wenn
der Operand sein Verhalten stabilisiert hat, kann man zu einer partiellen Verstärkung
übergehen (dann ist die Gefahr der Löschung gering) Weiterhin ist wie auch bei
Pawlow eine Kontiguität zwischen dem gezeigten Verhalten und der Konsequenz
notwendig. Das Kind muss z.B. erkennen können, daß die Strafe sich auf ein
spezifisches unerwünschtes Verhalten bezieht. Wenn dem nicht so ist, wächst die
Gefahr einer Generalisierung.
Das Konzept der Verstärkung und der Bestrafung
Typischer Verlauf einer Konditionierung: Das Modell scheint eher in der Lage zu
sein, die Reaktion von Verhalten und Ereignissen der Umwelt zu beschreiben, als die
klassische Konditionierung, denn mit Hilfe des operanten Konditionierens ist es
möglich, nicht nur die Häufigkeit bereits verfügbarer Verhaltensweisen zu
beeinflussen, sondern auch Verhalten zu erzeugen, dass für den Organismus bzw.
das Individuum vollkommen neu ist. Dabei geht man prinzipiell so vor, dass
stufenweise jene Verhaltensformen verstärkt werden, die eine Annäherung an das
gewünschte Endziel (der Konditionierung) darstellen. Verstärkt werden im Verlauf der
Konditionierung also die Verhaltenselemente, die dem gewünschten Endverhalten
jeweils etwas näher kommen. Man bezeichnet diesen Prozeß als Shaping.
Häufig genügt es jedoch nicht, ein bestimmtes Verhalten neu zu lernen, sondern es
ist notwendig ganze Ketten einzelner Verhaltensweisen zu bilden. So besteht z.B.
jede Sportart aus einer Kette einzelner Verhaltensweisen. Das Gleiche gilt für andere
komplexe Handlungen (z.B. das Verfassen eines Referates).
Wenn man solche komplexen Verhaltensketten erzeugen möchte, so wendet man
das Prinzip des Chaining an. Dabei geht man (im Tierexperiment) so vor, dass zuerst
das letzte Verhalten in der Kette primär verstärkt wird. Dieses Verhalten wird somit
zum sekundären Verstärker für die davorliegende Reaktion. So wird der
Verhaltenskette jeweils eine Verhaltensweise nach der anderen zugefügt. Jedes
Glied der Kette wird zum diskriminativen Reiz für die nächste Reaktion und zum
Verstärker für die vorhergehende Reaktion.
Die Dressur von Tieren beruht normalerweise auf der Kombination von Shaping und
Chaining. Beide Verfahren sind jedoch auch beim Menschen anwendbar.
7. und letzte Folge: Prägung
In der Psychologie bezeichnet Prägung die Tatsache, dass sich bestimmt Einflüsse
auf den Menschen, wie auch allgemein auf Organismen nachhaltig - gestaltend oder
umgestaltend - auswirken (soziokulturelle Prägung: z. B. durch einen bestimmten
Beruf, Lebensstandard oder durch eine bestimmte Erziehung).
In der Verhaltensforschung (Ethologie) ist eine Prägung ein obligatorischer
Lernvorgang, der in einigen Merkmalen von der Konditionierung abweicht.
Charakteristisch für sie ist,
dass sie sich auf eine einzige Bewegung oder auf eine bestimmte Gruppe von
Verhaltensweisen bezieht, dass sie in der Ontogenese nur einmal, in einer sensiblen
Phase, stattfinden kann und dass ein nachträgliches Umlernen unmöglich ist.
Man unterscheidet zwischen einer Objektprägung, bei der die auslösenden Reize
für eine bestimmte Reaktion festgelegt werden, und der motorischen Prägung, bei
der ein Bewegungsmuster erworben wird.
Das frischgeschlüpfte Entenküken läuft dem ersten, bewegten Gegenstand nach, der
Töne von sich gibt. Nach sehr kurzer Zeit wird das Nachlaufen an weitere Merkmale
des Objekts geknüpft, und das Küken ist nun nicht mehr dazu zu bewegen, einem
Menschen zu folgen.
Versuche an einem Stockentenküken haben gezeigt, dass die sensible Phase für die
Nachfolgeprägung 13 bis 16 Stunden nach dem Schlüpfen ihr Maximum erreicht. Zu
dieser Zeit wirkt das Präsentieren einer Mutterattrappe am nachhaltigsten. Innerhalb
der folgenden 20 Stunden sinkt die Prägbarkeit auf fast Null ab.
Ein auf Menschen geprägtes Küken kann mehreren Menschen nachlaufen. Die im
Prägungsvorgang an die Reaktion geknüpften Merkmale sind also überindividuelle
und meist Artmerkmale. Geprägt wird immer eine bestimmte Reaktion auf ein
bestimmtes Objekt.
Eine erstaunliche Erscheinung im Zusammenhang mit der Nachfolgeprägung ist,
dass Schmerzreize, die in der sensiblen Phase mit dem Prägungsobjekt simultan
geboten werden, den Lernvorgang sogar fördern, während bei der Konditionierung
ein Fluchtverhalten bedingt würde.
Neben der Nachfolgeprägung gibt es bei manchen Arten eine sexuelle Prägung. Die
Prägung kann in einer Entwicklungsphase stattfinden, in der die zugehörigen
Bewegungen noch nicht ausgereift sind. Dasselbe gilt auch für die motorische
Prägung.
Zahme und halbzahme Stockenten bevölkern heute in großer Zahl die Parkgewässer
und Teichanlagen von Stadt und Land.
Das bestuntersuchte Beispiel ist die Gesangsprägung bei manchen Vögeln.
Zebrafinken-Männchen lernen den Gesang vom Vater, den sie zu einer Zeit hören, in
der sie selber noch nicht singen. Isoliert man sie, kurz bevor sie singen, so
entwickeln sie trotzdem die arttypischen Laute.
Ob es sich bei der motorischen Prägung um einen grundsätzlich anderen Vorgang
handelt als bei der Objektprägung, ist fraglich. Man kann sich vorstellen, dass ein
Auslösemechanismus verändert oder gebildet wird, der zur Folge hat, dass später
alle vom Vogel geäußerten Laute, die auf ihn passen, als Belohnung wirken.
Da die Irreversibilität der Prägung möglicherweise lediglich eine Folge der kurzen
sensiblen Phase ist und weil sonst manche Parallelen zu anderen Lernvorgängen
vorliegen, versucht man teilweise, die Prägung als einen Spezialfall der
Konditionierung zu deuten.