Sechste Vorlesung Zur Psychologie des Lernens III: Konditionierung vegetativer Funktionen; Beschränkungen der behavioristischen Lerntheorien; kognitiver Behaviorismus In den beiden letzten Vorlesungen habe ich versucht, Sie mit den Grundlagen behavioristischer Lerntheorien vertraut zu machen. Ich habe Ihnen die Grundprinzipien der Klassischen Konditionierung dargestellt – hier sei noch ein historisches Foto nachgereicht, das Pawlow im Kreise seiner MitarbeiterInnen mit einem Versuchshund posierend zeigt –, dann das Lernparadigma Thorndikes – hier ist nochmals ein Foto von einem Problemkäfig (oder „Puzzle-Box“) –, schließlich die Grundlagen der operanten Konditionierung nach Skinner (hier ist noch ein hübsches Foto von einer Skinner-Box). Bevor ich mich heute der Kritik der klassischen Lerntheorien zuwenden will, möchte ich Ihnen noch an ein paar ausgewählten Beispielen die Relevanz der bislang besprochenen Modelle für klinische Zusammenhänge, vor allem aber für den Bereich der so genannten Psychosomatik demonstrieren. Dass bestimmte vegetative Funktionen durch die klassische Konditionierung beeinflusst, ja gesteuert werden können, wird Sie nach dem, was ich Ihnen das vorletzte Mal über die Pawlowschen Experimente gesagt habe, nicht weiter verwundern. Praktisch jede Veränderung einer vegetativen , die durch einen bestimmten unbedingten Reiz erzwungen wird, kann nach mehrmaliger Koppelung mit einem zunächst neutralen Reiz letztlich auch durch diesen alleine ausgelöst werden. Ein besonders eindruckvolles Beispiel dazu finden Sie in dem Skriptum zur Allgemeinen Psychologie II: die Konditionierung des Blutzuckerspiegels. Als UCS fungiert dabei Insulin (nach eine Injektion von Insulin sinkt der Blutzuckerspiegel), als neutraler Reiz z. B. ein starker Mentholgeruch (aber wie das Experiment zeigt, ist die Prozedur des Setzens einer Injektion schon allein ein wirksamer CS: Also: wird eine Versuchsgruppe in mehreren Durchgängen eine Insulin-Injektion verabreicht und im Anschluss daran die Injektion einer neutralen, d. h. an sich keine Absenkung des Blutzuckerspiegels bewirkende Substanz, so kommt es auch bei dieser an sich unwirksamen Injektion zu einem Abfall des Blutzuckerspiegels. Besonders interessant sind in diesem Kontext Untersuchungen, in denen gezeigt wurde, dass über einen an sich neutralen Reiz über die klassische Konditionierung auch die Produktion von Hormonen anzuregen ist, die für die Bildung von Lymphozyten im körpereigenen Immunsystem wichtig sind. Erstaunlich ist, dass vegetative Funktionen auch durch operante Konditionierung zu beeinflussen sind. In Tierexperimenten wurde das Ende der sechziger Jahre erstmals von Neal E. Miller und seinem Forschungsteam gezeigt. Miller und Di Cara (1967) haben z. B. 1 zufällig auftretende Beschleunigungen bzw. Verlangsamungen des Herzschlags bei Ratten systematisch verstärkt – mit dem Ergebnis, dass schließlich die Pulsfrequenz bei den beiden Versuchsgruppen um 200 Pulsschläge pro Minute differierte. Legendär ist in diesem Zusammenhang jenes Experiment, in dem Miller (1969) bei Ratten bei Zufallsschwankungen der Durchblutung der Ohren immer dann einen Verstärker setzte, wenn gerade das rechte etwas stärker durchblutet war als das linke. Das Ergebnis dieses Verfahrens war, dass das Versuchstier schließlich mit einem knall roten rechten und einem sehr blassen linken Ohr in seinem Käfig saß. Solche Experimente sind deshalb nicht bloß Tierquälerei, weil mit ihnen eine ganz bestimmte Hoffnung verbunden war: nämlich dass man über einfache operante Konditionierungsvorgänge psychosomatische Störungen in den Griff bekommen könnte. Allerdings hat sich der Einsatz von Biofeedback-Therapien im Humanbereich zur Kontrolle von vegetativen Körperfunktionen nicht sehr bewährt. Als sehr erfolgversprechend habe sich diese Techniken allerdings bei der Kontrolle des Muskelsystems durch Rückmeldung der elektrischen Muskelaktivität erwiesen: z. B. in der Behandlung von stressbedingten Muskelverspannungen, oder aber auch in der Rehabilitation von Lähmungen bei InsultPatientInnen. Ich möchte jetzt – nach diesem Erfolgsbericht – nochmals auf die Fotos zurückkommen, die ich Ihnen zu Beginn der heutigen Vorlesung gezeigt habe. Hier ist also nochmals das Foto von der Katze in der Skinner-Box. Es ist mir wichtig, dass Sie sich anhand dieses Fotos noch einmal vergegenwärtigen, wie die behavioristischen Lerntheorien begründet wurden. Alles das, was ich Ihnen das letzte Mal erzählt habe über die Prinzipien der operanten Konditionierung – über positive und negative Verstärkung, positive und negative Bestrafung, über Generalisierung und Reizdiskrimination, über die Wirkungen kontinuierlicher und intermittierender Verstärkerpläne – alles das kann mit dieser einfachen Versuchsanordnung demonstriert werden. Aber was soll das bedeuten, das mit dieser experimentellen Anordnung alles gezeigt werden kann? Für wen oder was sollen die damit demonstrierten Lernprinzipien relevant sein? Wenn wir uns in einer Vorlesung über Allgemeine Psychologie solange darüber aufhalten, so macht das nur dann einen Sinn, wenn wir stillschweigen voraussetzen, dass die an einer bestimmten Tierart – ganz gleich ob Ratte, Taube oder eben Katze – gezeigten Regelhaftigkeiten Allgemeingültigkeit beanspruchen können: Also, um bei unserem Beispiel hier zu bleiben: Die mit Hilfe der Katze in der Skinner-Box gezeigten Gesetzmäßigkeiten sollen nicht nur für Katzen, sondern auch für andere Tierarten, schließlich auch für Menschen gelten; und sie sollen nicht nur für die Herstellung eines Zusammenhangs von Leuchten einer gelben Glühbirne („diskriminativer Reiz“), dem Operanten „Hebeldruck von einer Katzenpfote“ und dem positiven Verstärker „Futterpille, die die Katze als Futter akzeptiert“, 2 also nicht nur für diese – im übrigen für ein normales Katzenleben höchst unnatürlichen, also biologisch unbedeutenden – experimentelle Situation gelten, sondern auf andere, jetzt natürliche Situationen, mit natürlichen diskriminativen Reizen, natürlichen Operanten und natürlichen Verstärkern generalisierbar sein. Wir haben es bei der Skinner-Box – und gleiches gilt natürlich auch für Klassische Konditionierung nach Pawlow und die Puzzle-Box nach Thorndike also im wissenschaftstheoretischen Sinn mit einer paradigmatischen experimentellen Inszenierung zu tun: gerade über die Beschäftigung mit nicht natürlichen Situationen und mit völlig willkürlichen Reiz-Reaktionsverbindungen soll die Ausschaltung individueller Vorerfahrungen gewährleistet und damit die Allgemeingültigkeit der erzielten Ergebnisse gewährleistet werden. Ist das – so müssen wir uns jetzt fragen – eine gute Strategie? Ist dieser Vorgehen haltbar? Können also die in den bislang geschilderten experimentellen Versuchsanordnungen erzielten Ergebnisse tatsächlich jene Allgemeingültigkeit beanspruchen, die sie – und auch wir bisher - stillschweigend voraussetzen? Obwohl in der Wissenschaft sich sehr oft und sehr viel sich etwas auf bloßem Glauben und nicht auf Wissen stützt – in diesem Fall handelt es sich eben nicht um eine Glaubenfrage, sondern um eine Frage, die es empirisch zu prüfen gilt. Wichtig ist, dass wir uns klar machen, dass die Demonstration von einzelnen Anwendungsbeispielen, wie ich sie Ihnen zu Beginn der heutigen Vorlesung einige aufgezählt habe, nicht ausreichen, um die Allgemeingültigkeit der ihnen zugrundeliegenden Prinzipien zu erweisen. Ich kann die Ergebnisse der einschlägigen empirischen Untersuchungen und der sich daran anschließenden theoretischen Diskussionen gleich vorwegnehmen: die Annahme einer generellen Gültigkeit der elementaren Gesetze der klassischen und operanten Konditionierung kann heute – trotzdem es eine Fülle positiver Anwendungsbeispiele gibt – als widerlegt gelten. Interessanterweise wurden einige der mehr oder weniger verborgenen Grundannahmen der behavioristischen Lerntheorie zunächst ausgerechnet durch Ergebnisse von Tierexperimenten in Frage gestellt. Machen wir uns zunächst eine jene Voraussetzungen klar, die Watson, Skinner und Konsorten in ihren experimentellen Inszenierungen und in der weitreichen Interpretation der Resultate dieser Inszenierungen stillschweigend voraussetzen: dass nämlich bei jeder Tierart prinzipiell jede beliebige Reaktion mit jedem beliebigen Reiz verknüpft werden kann. Nur unter dieser Voraussetzung kann beispielweise das Verhalten einer Katze in der Skinner-Box während eines Konditionierungsvorgangs als paradigmatisch für Lernvorgänge überhaupt angesehen werden. In einem programmatischen Artikel aus dem Jahr 1970 hat Milton P. E. Seligman gegen die Annahme der Allgemeingültigkeit der elementaren Lerngesetze der Behavioristen ins Treffen geführt, dass bestimmte biologische Dispositionen den Aufbau von Verknüpfungen zwischen Verhalten und 3 bestimmten Reizsituationen wesentlich mitbestimmen. Der Einwand ist an sich trivial – so trivial, dass man sich fragt, warum man darauf nicht schon früher gekommen ist. Für verschiedene Tierarten haben verschieden Verhaltensweisen und verschiedene Reizkonstellationen – gleichsam als Resultat ihrer evolutionären Anpassung an verschiedene „Umweltnischen“ – biologisch gesehen eine unterschiedliche Bedeutung. Kurz und gut: durch ihre genetische Ausstattung sind jeder Art bei der Herstellung von Reiz-Reiz- oder ReizReaktionsverknüpfungen – buchstäblich! – natürliche Grenzen gesetzt. Anders ausgedrückt: Aus den biologischen Unterschieden verschiedener Tierarten – und natürlich auch aus den biologischen Unterschieden zwischen Tieren und Menschen – ergeben sich auch Differenzen bezüglich dessen, was wie lernbar ist. Was genau damit gemeint ist, kann man sich am besten durch ein Beispiel verdeutlichen. Ein gut untersuchtes Phänomen ist etwa die sogenannte Geschmacksaversion, mit dem sich die Rolle biologischer Dispositionen im Kontext der klassischen Konditionierung zeigen lässt. Ich habe Ihnen ganz bewusst wieder ein eher grausiges Rattenexperiment ausgesucht – auch das ein Experiment, das in der Psychologie als klassisch gilt (es stammt von Garcia und Koelling (1966)). Durstigen Ratten wurde ein saccharinhaltiges Wasser vorgesetzt. Während des Trinkens wurden Lichtblitze gesetzt und Lärm ausgelöst. Zudem wurden die Tiere dabei einer starken Röntgenstrahlung ausgesetzt. Diese Prozedur führte bei den Versuchstieren nach etwa einer Stunde – beachten Sie das lange Zeitintervall, das zwischen den Ereignissen liegt! – zu einer starken Übelkeit. Als sich die Ratten etwas erholt haben, wurde getestet, gegenüber welchen Komponenten der Reizsituation (Saccharinwasser, Lichtblitz, Lärm) sie eine Aversion aufgebaut hatten. Es zeigte sich, dass sie eine starke Geschmacksaversion ausgebildet hatten, aber keine Aversion gegen die Lichtblitze und den Lärm. Übersetzen wir das einmal in die uns bereits vertrauten Termini der klassischen Konditionierung: Röntgenstrahlen – UCS, Übelkeit UCR; Aversion gegenüber das süße Wasser – CR. Lichtblitze und Lärm hätten theoretisch genauso gut zu konditionierten Reizen werden können. Warum war das nicht der Fall? Ändern wir jetzt die Versuchsanordnung! Wir verabreichen jetzt als UCR einen elektrischen Schlag während die Ratten Saccharinwasser trinken und gleichzeitig setzen wir wieder Lichtblitze und Lärm. Unter dieser Bedingung lösen nach einigen Versuchsdurchgängen jetzt sowohl Lichtblitze als auch Lärm ein Vermeidungshalten aus, nicht aber das Saccharinwasser. Was ist damit gezeigt? Offenbar besteht bei den Ratten eine biologische Disposition, Übelkeit mit dem Geschmack oder auch mit dem Geruch von Futter oder Flüssigkeiten zu verbinden. Hingegen scheint so etwas wie eine Gegendisposition dazu vorzuliegen, einen elektrischen Schock mit Geschmacks- oder Geruchsreizen zu verbinden. Das heißt, dass offenbar nicht 4 jeder beliebige neutrale Reiz mit jedem x-beliebigen unkonditionierten Reiz im Sinne der klassischen Konditionierung verbunden werden können. Vielleicht noch ein kleines Beispiel zum selben Problem, also zum Problem der Geschmacksaversion, um das Artspezifische von Lernvorgängen noch stärker zu betonen. Gibt man z. B. Ratten und Wachteln ein mit bestimmten Geschmackstoffen versetztes (z. B. Salz) und gefärbtes (z. B. blau) Wasser vor, das bei beiden Arten von Versuchstieren Übelkeit verursacht und lässt die Tiere später jeweils zwischen einem salzigen und einem gefärbten, aber eben nicht mehr Übelkeit verursachenden Wasser wählen, dann bilden die Ratten eine Aversion gegenüber dem salzigen Wasser, nicht aber gegenüber dem gefärbten Wasser, und die Wachteln umgekehrt eine Aversion gegenüber dem gefärbten, nicht aber gegenüber dem salzigen Wasser aus. Geschmacksaversionen sind ein sehr interessantes Thema – und im übrigen etwas, was jeder/jede von Ihnen eigentlich auch aus der eigenen Anschauung kennt. Jeder/jede von Ihnen hat schon irgendwann einmal irgendetwas gegessen, das nach dem Genuss Übelkeit, Erbrechen, Durchfall etc. verursacht hat. Üblicherweise werden solche Nahrungsmittel von uns dann über lange Zeit gemieden, allein der Geruch oder die Vorstellung, wie das schmeckt, kann massive Ekelempfindungen hervorrufen. Das Besondere an diesen Geschmacksaversionen ist eben, dass sich ihre Aneignung vom Vorgang einer normalen klassischen Konditionierung in wesentlichen Punkten unterscheidet: es reicht zumeist eine einzige negative Erfahrung, um sie auszubilden (also: es genügt ein einziger Lerndurchgang!), mit der Übelkeit auftretende visuelle oder akkustische Reize werden nicht konditioniert; das Zeitintervall zwischen der Erfahrung von Geruch und Geschmack der Speise und dem Auftreten der Übelkeit beträgt oft Stunden – und dennoch bildet sich eine Verknüpfung aus; schließlich – als letzt Besonderheit: Geschmacksaversionen sind äußerst löschungsresistent. Vergegenwärtigen wir uns noch einmal, worum es uns hier geht: Wir wollen zeigen, dass die meist stillschweigend getroffene Annahme einer allgemeine Gültigkeit der durch die Technik der klassischen und der operanten Konditionierung demonstrierten elementaren Lerngesetze nicht haltbar ist. Unser Argument lautet, dass aufgrund von biologischen Dispositionen nicht jeder beliebige neutrale Reiz mit jedem beliebigen Auslöserreiz (klassische Konditionierung) bzw. nicht jeder beliebige positive oder negative Reiz mit jeder beliebigen Verhaltensweise (operante Konditionierung) verknüpft werden kann. Ersteres haben wir an den Geschmacksaversionen gezeigt; letzteres müssen wir noch erweisen. Ich werde mich angesichts der fortgeschrittenen Zeit nicht allzu lange dabei aufhalten. Ein einfaches Beispiel mag genügen, um daraus allgemeine Schlüsse zu ziehen: In Experimenten zum aktiven Vermeidungslernen von Ratten konnte man zeigen, dass es bei einem Teil der 5 Versuchstiere trotz tausender Versuche nicht gelang, sie dazu zu bringen, einen aversiven Reiz (Stromschlag) durch Drücken einer Taste zu beenden. Hingegen ist es in derselben Situation äußerst einfach, den Ratten Verhaltensweisen wie Weglaufen oder Auf-einePlattform-Springen anzutrainieren. Es scheint bei den Ratten – wie überhaupt bei jeder Tierart – biologisch festgelegte Dispositionen zu ganz bestimmten Abwehrreaktionen auf schmerzhafte oder bedrohliche Situationen zu geben. Diese sind nach den von Skinner angegeben Prizipien leicht zu konditionieren. Der Erwerb nicht-artspezifischer Verhaltensweisen hingegen ist in solchen Situationen kaum oder gar nicht möglich. Das mag einmal genügen, um zu erkennen, dass von Seiten der Biologie aus sich einige gewichtige Einwände gegen eine allzu optimistische Sicht der Verallgemeinerbarkeit von unter lebensfernen Laborbedingungen gewonnenen „Lerngesetzen“ vorbringen lassen. Der Hauptangriff gegen die universellen Gültigkeitsansprüche der behavioristischen Lerntheorien wurde aber von einer anderen Seite aus geführt: von Seiten der kognitiven Psychologie aus, die gerade aus der Kritik des Behaviorismus Ende der fünfziger und Anfang der sechziger Jahre heraus als neues Paradigma der Psychologie Konturen anzunehmen begann. Ich werde auf die Geschichte der oft beschworenen „kognitiven Wende“ der Psychologie in einer der nächsten Vorlesungen noch ausführlicher zu sprechen kommen. Einige zentrale Aspekte der kognitiven Psychologie haben wir ohnehin schon im Zusammenhang unserer Erörterungen über das Gedächtnis kennen gelernt. Hier soll uns bloß die Entwicklung jenes Kernarguments interessieren, dass kognitive Psychologen gegen den Universalitätsanspruch der Gültigkeit der Prinzipien der klassischen und operanten Konditionierung vorzubringen haben: dass nämlich Lernprozesse von Organismen in natürlichen, d. h. also komplexen Situationen nicht allein über direkt beobachtbares Verhalten und direkt beobachtbare Reizkonstellationen zu erklären ist. Selbst wenn man den restriktiven Untersuchungsrahmen der klassischen und operanten Konditionierung als paradigmatisch für das Lernen von Organismen akzeptiert – ein Rahmen, dessen Relevanz eben mit der Fortentwicklung der so genannten kognitiven Psychologie mehr und mehr grundsätzlich in Frage gestellt wurde – kommt man – wie jetzt in der Folge zu zeigen sein wird – ohne Berücksichtigung des Informationswertes, den bestimmte Reizkonstellationen für Organismen in den von den Behavioristen als paradigmatisch für Lernen schlechthin behaupteten Lernsituationen haben, nicht aus. Der Informationswert, den Reizbedingungen z. B. für Ratten haben, ist natürlich nicht in derselben Art und Weise direkt zu beobachten, wie die Wirkung, die physikalisch zu beschreibende Reize auf die Auftrittswahrscheinlichkeit von Verhaltensweisen haben. In Watsons und Skinners Behaviorismus war kein Platz für solche – wie man das abschätzig nannte – mentalistische Begriffe. Die Notwendigkeit, auf solche „mentalistischen“ – besser: kognitive – Begriffe zu rekurrieren, um auch nur einen scheinbar so simplen Vorgang, wie das Verhalten einer Ratte, 6 die von einem Ausgangspunkt eines einfach konstruierten Labyrinths einen Zielgegenstand (Futter) zu erreichen lernt, erklären zu können – ist in aller nur wünschbaren Deutlichkeit zuallererst ausgerechnet von einem bekennenden Behavioristen demonstriert worden: von Edward Chase Tolman, der, wie ich glaube, zu den wenigen wirklich ganz großen Persönlichkeiten in der Geschichte unseres Faches zu zählen ist. Genauso wie Skinner, so war auch Tolman ein „Spätberufener“. Er hatte zunächst sein bachelor’s degree am berühmten Massachussets Institute of Technology in Elektrochemie gemacht, eh er in Havard Philosophie und Psychologie zu studieren begann. Seinen PHD machte er 1915; danach war er für drei Jahre als Instructor (das war die Vorform dessen, was seit dem Zweiten Weltkrieg an den amerikanischen Universitäten assistant professor heißt) an der Northwestern University tätig, ehe er aufgrund seiner pazifistischen Haltung – die USA waren in den Weltkrieg eingetreten – entlassen wurde. 1918 wurde er an die University of California in Berkeley geholt und später dort auch zum Full Professor ernannt. Hier – wo er bis zu seinem Lebensende wirkte – entwickelte er seine im höchsten Maße originelle Konzeption eines kognitiven Behaviorismus. Tolman war eine bemerkenswerte Persönlichkeit– ein durch und durch demokratischer Geist, dem ein gut argumentierter kritischer Einwand an seiner eigenen Position stets mehr Freude zu bereiten schien, als jede zustimmende Zitierung in irgendeinem modernen Lehrbuch; sein Leben lang offen für Neues, kritisch gegenüber jede Form von Dogmatismus in der Wissenschaft (insbesondere auch kritisch gegenüber allzu strikten methodischen Fesselungen der Psychologie); aufgrund mehrer Aufenthalte in Deutschland und vor allem auch hier in Wien (das ganze Studienjahr 1933/34 hatte Tolman hier am Wiener Institut zugebracht, wo er vor allem mit Egon Brunswik eng kooperierte) gut vertraut mit den europäischen Traditionen der Psychologie (insbesondere aber mit der Gestalttheorie der Berliner Schule), ein aktiver Förderer der Psychoanalyse; etc. Was uns heute – in Zeiten der versuchten Politisierung der Universitäten unter dem Deckmantel des Begriffs der Universitätsautonomie – besonders zu denken geben sollte, ist Tolmans Haltung während der Phase der von Senator McCarthy in den USA entfachten Kampagne zur Verfolgung potentieller Staatsfeinde. Als 1949 – die berühmt-berüchtigte McCarthy-Ära neigte sich ihrem Ende zu – die University of California ihrem Lehrkörper einen Loyalitätseid abverlangte, weigerte sich Tolman, ihn zu unterzeichnen. Gleichzeitig aber – und gerade das war für sein Verständnis von politischem Widerstand bezeichnend – riet er seinen Mitarbeitern, sich nicht zu widersetzen. Den Kampf sollten die etablierten Professoren führen – sie allein könnten sich das auch materiell leisten. Tatsächlich ist Tolman dann auch vom Universitätsdienst suspendiert worden. Das gegen ihn eingeleitet Ausschlussverfahren wurde aber schließlich wieder eingestellt. 7 Was hat Tolman nun in die Psychologie des Behaviorismus Neues eingebracht? Die Bezeichnung kognitiver Behaviorismus, die Tolman für sein Konzept akzeptiert hat, klingt natürlich nach einem Paradoxon. Wie hat er diese paradoxe Programmatik argumentiert? Für Tolmans ganze Lerntheorie zentral ist die Unterscheidung zwischen molekularen und molaren Aspekten des Verhaltens. „Molekular“ bezieht sich auf die Betrachtung von Verhalten als aktuell ablaufende Muskelbewegungen eines Organismus; „molar“ zielt darauf ab, dass Verhalten eben auch mehr ist als bloß die Summe von elementaren Muskelzuckungen (die Gestalttheorie lässt grüßen!). Ein ganzheitlicher Akt eines Lebewesens – der vor allem dadurch charakterisiert ist, dass er auf die Erreichung eines bestimmten Ziels hin organisiert ist. Purposive behavior in animals and men, so lautete der Titel, den Tolman seinem programmatischen Hauptwerk von 1932 gab, – das eben war der Gegenstand, auf den sich seine theoretischen Überlegungen bezogen. Dieses „purposive“ ist, darauf legte Tolman wert, kein mentalistischer, sondern ein reiner Beobachtungsbegriff. Eine Ratte, die von einem Ausgangspunkt in einem Labyrinth zu einem Zielgegenstand hinstrebt und nicht ruht, ehe sie diesen Zielgegenstand (z. B. Futter) erreicht hat – dieses zielstrebigen („goal-seeking“) Verhalten ist zu beobachten. Zielgerichtetheit ist also eine Beschreibung des Verhaltens, nicht eine Beschreibung des Bewusstseinszustand der Ratte. Allerdings kommt – wie wir gleich sehen werden – diese Beschreibung des Verhaltens letztlich nicht ohne Rekurs auf kognitive – d. h. also innere, zentrale, eben nicht direkt beobachtbare Begriffe aus. Tolman postulierte, dass bestimmte Reizkonstellationen in Abhängigkeit von den Erfahrungen, die ein Organismus zuvor gemacht hat, Erwartungen stiften – Erwartungen über den Zusammenhang zwischen den gerade vorliegende Reizbedingungen, entsprechenden Verhaltensweisen und daraus resultierenden neuen Reizbedingungen. Kurz und gut: bei Tolman ist Lernen ein fortwährendes Hypothesenbilden; konkretes Verhalten wird dann als Testen von bestimmten Hypothesen, „Verstärkung“ eben als Bestätigung von Hypothesen interpretierbar. Damit haben wir die zentralen Charakteristika des Ansatzes von Tolman beisammen. Wir können uns seinen zentralen Gedankengang nun an einem Experiment klar machen, das für Tolmans Konzept im selben Sinne paradigmatisch ist, wie die Skinner-Box für den radikalen Behaviorismus von Skinner. Tolman hat sich vor allem mit so genanntem Ortslernen befasst: Ratten müssen in einem Labyrinth unter mancherlei Schwierigkeiten, z. B. dem unvermutetem Auftreten von Sperren in zuvor offenen Wegen vom Start in ein Ziel (Futter) finden. Die folgende Abbildung zeigt einen typischen Aufbau von einem solchen Labyrinth: Es handelt sich dabei um etwa 4 cm breite Laufstege, die ca. 75 cm über dem Boden angebracht waren. 8 Vortraining: nur mit Sperre A: ohne Sperre A wurde von den Ratten der Weg 1 bevorzugt; mit Sperre A wurde durch selektive Verstärkung am Zielort gewährleistet, dass von jedem Versuchtier in 90 % seiner Durchläufe Weg 2, in 10 % seiner Durchläufe Weg 3 benutzt wurde. Es wurde also eine Verhaltenshierarchie aufgebaut, die man als Bevorzugung des jeweils kürzeren Weges bezeichnen kann. In der eigentlichen Testphase wurden dann abwechselnd Sperre A und B gesetzt. Die Ergebnisse waren erstaunlich: Fanden die Ratten Weg 1 durch Sperre B blockiert, so wählten die überwiegende Mehrheit (je nach Art des Vortrainings 73% und dann sogar 890 %), wenn sie jetzt erneut vom Start wegliefen, trotz der im Vortraining etablierten Verhaltenshierarchie schon im aller ersten Durchgang gleich Weg 3 – d. h. den einzigen unter diesen Bedingungen zum Ziel führenden Weg. Die Versuchstiere ersparten es sich sozusagen, in diesem Fall den Weg 2 überhaupt auszuprobieren. Die Ratten verhalten sich so, als ob sie sich im Vortraining ein Bild des Labyrinths erworben hätten – Jahre später hat die kognitive Psychologie eben dafür den zentralen Begriff der kognitiven Repräsentationen – eingeführt; Tolman selbst sprach von einer kognitiven Landkarte (cognitive map), die sich die Tiere von ihre Umgebung gebildet hätten, nach der sie sich in ihrem zielbezogenen Verhalten orientieren können. Tolman – der nicht nur ein kreativer Wissenschafter, sondern auch ein sehr humorvoller Mensch war – hatte großen Spaß daran, ständig neue Wortschöpfungen zur Beschreibung und Erklärung des Verhaltens seiner Ratten im Labyrinth zu kreieren. Wenn wir uns nur noch ein klein wenig mehr darauf einlassen, werden wir sehen, wie sehr der ganze Ansatz letztlich auf eine großartige Synthese der so voneinander differierenden Traditionen der USamerikanischen und europäischen Psychologie hinausläuft. Der Terminus cognitive map war mit Bedacht gewählt: Eine Landkarte ist nichts anderes als ein mehr oder minder komplexes Zeichensystem, das real bestehende Sachverhalte abbilden soll. So kann Tolman denn auch sagen, seine Ratten hätten im eigentlichen keine ReizReaktions-Verknüpfungen gelernt – Sie erinnern sich: das Lernen solcher Verknüpfungen stellt das Kernstück der Theorie des operanten Konditionierens dar – sondern Beziehungen zwischen Zeichen. Die Ratten lernen also im Labyrinth bestimmte Reizgegebenheiten als Zeichen zu verwerten, die sie zu bestimmten Zielgegenständen hinführen oder davon abhalten. Zeichen und Bezeichnetes bilden einen Bedeutungszusammenhang, den Tolman in Anknüpfung an die von der Gestalttheorie entwickelte Begrifflichkeit als „Zeichen-Gestalt“ (sign-gestalt) bezeichnete. Tolmans Einsicht, dass dieser Zusammenhang zwischen Zeichen und Bezeichneten in natürlichen Situationen für den Organismus prinzipiell mehrdeutig ist, liegt schließlich seiner Rede vom Bilden von Hypothesen zugrunde. Ich kann Ihnen das hier nicht im Detail 9 ausführen, aber es sei zumindest angedeutet, dass wir mit diesem Ansatz wieder bei jener Auffassung der Funktion unseres Wahrnehmungssystems angelangt sind, für die ich im letzten Semester unter dem Kapitel Psychologie des Sehens Werbung zu betreiben versucht habe. Sie erinnern sich: Wir haben damals von der prinzipiellen Mehrdeutigkeit des Netzhautbildes gesprochen und davon, dass unsere optischen Wahrnehmungen nichts anderes sein können als ein fortwährendes Bilden von Hypothesen darüber, welche Außenweltobjekte im Raum um uns gerade vorhanden sein könnten. Die eigentliche Pointe des Tolmanschen kognitiven Behaviorismus habe ich Ihnen bis jetzt aber noch vorenthalten. Sie betrifft die Frage, wie die Ratten – verwenden wir ruhig den modernen Begriff: – diese kognitive Repräsentation der Labyrinth-Umgebung erwerben. Es handelt sich dabei um so genanntes „latentes Lernen“, d. h. um ein Lernen, dass sich ohne explizite Verstärkung vollziehen kann. Es handelt sich also um einen Lernprozess, der sich zum Zeitpunkt seines Ablaufs nicht im Verhalten manifestiert. Tolman trägt dem Rechnung, indem er begrifflich sehr präzise zwischen dem Erwerb einer Kompetenz (dem eigentlichen Lernen) und seiner Umsetzung in beobachtbaren Verhalten (Performanz) unterschied. Damit ist aber gleichzeitig behauptet, dass die Skinnersche Auffassung von Lernen als Änderung der Auftrittswahrscheinlichkeit von bestimmten Verhaltensweisen zu kurz greift. Ich werde darauf in der nächsten Vorlesung nochmals ausführlich zu sprechen kommen. Für heute danke ich Ihnen für Ihre Aufmerksamkeit. 10