Volltext - Universität Heidelberg

1
2.1 Kritik: Reinterpretation des lerntheoretischen Grundansatzes behavioristischer SRPsychologie
Vorbemerkung: Tierexperimentelle Fundiertheit SR-psychologischer Lerntheorien?
Wenn wir nun also daran gehen wollen, mittels der dargelegten Kriterien zu nächst die SRpsychologischen Lernkonzepte begründungsanalytisch zu reinterpretieren, so sehen wir uns noch bevor wir damit begonnen haben - vor folgender Schwierigkeit: In den experimentellen
Standardanordnungen, mit welchen die SR-theoretischen Lerngesetze empirisch geprüft werden sollten, dienten bekanntlich Tiere (Ratten, Tauben etc.) als Versuchsorganismen; Konditionierungsexperimente mit Menschen hatten demgegenüber mehr sekundären, demonstrativen o.ä. Charakter. Dem lag die Auffassung zugrunde, die Gesetze des Lernens seien universell-organismischer Natur, also für Tiere und Menschen gleichermaßen gültig, könnten aber in
Tierexperimenten aufgrund der hier möglichen rigoroseren Bedingungskontrollen exakter
nachgewiesen werden. Sofern man diese Vorstellung für angemessen hält, muß man unseren
Versuch einer begründungsanalytischen Reinterpretation SR-psychologischer Lerntheorien
von vornherein als aussichtslos einschätzen: Da man Tieren ja noch keine Handlungsgründe
zuschreiben dürfe, die SR-Theorien des Lernens aber aufgrund von Tierexperimenten empirisch abgesichert seien, könne man doch aus den gleichen Theorien, wenn diese auf menschliches Lernen bezogen werden, nicht plötzlich »Begründungsmuster« explizieren wollen. Die
diesem möglichen Einwand zugrundeliegende Überzeugung von der tierexperimentellen Fundiertheit SR-psychologischer Theorien über menschliches Lernen ist nun aber innerhalb der
psychologischen Wissenschaftlergemeinschaft bis heute mindestens brüchig geworden. Einer
der Gründe da für liegt darin, daß mit der zunehmenden Rezeption ethologischer Ansätze und
Befunde in der Psychologie die SR-psychologische Auffassung von einem durch elementare
Lernmechanismen charakterisierbaren abstrakten »Organismus« immer stärker durch die Annahme artspezifischer Lernmechanismen problematisiert und zurückgedrängt wurde. So wurde es auch immer zweifelhafter, wieweit an bestimmten Tierarten gewonnene Resultate auf
andere Tierarten. also auch auf den Menschen, verallgemeinerbar seien.
Solche Zweifel entstanden und verstärkten sich zunächst aufgrund von »anomalen« Befunden
innerhalb der Konditionierungsexperimente mit Tieren. So stellte man bei einschlägigen Forschungen zum Klassischen Konditionieren ziemlich bald fest, daß sich nicht alle »Reflexe«
gleich gut konditionieren lassen, und daß manche Tierarten bestimmte Verknüpfungen einfach nicht lernen konnten (in einer Untersuchung von D‘Amato & Schiff 1964, ergab sich
etwa, daß vier von acht untersuchten Ratten auch nach 7330 Durchgängen noch nicht gelernt
hatten, einen Hebel loszulassen, um einen Schock zu vermeiden). Ähnliche Anomalien ergaben sich auch bei Experimenten zum Instrumenteller Konditionieren, so in Untersuchungen
von Garcia & Kölling bzw. Garcia, Ervin & Kölling (beide 1966) über »Geschmacksaversionen« von Ratten, weiterhin in Forschungen zum »spezifischen Hunger« (Sammelreferat bei
Rozin & Kalat 1972), über >unverstärktes< Pickverhalten von Tauben (Williams & Williams
1969), u.v.a: Hier erwies sich durchgehend, daß die Tiere im Experiment Verhaltensweisen
zeigten, die sie gemäß den unterstellten Konditionierungsgesetzen eigentlich nicht hätten zeigen dürfen, was auf »angeborene« Verhaltensdispositionen zurückgeführt wurde (neuere
Konzepte und Resultate dazu sind in LoLordo & Droungas, 1989, referiert).
Eine Sonderstellung unter derartigen Berichten über unerwartete, möglicherweise biologisch
bedingte »Verhaltensirregularitäten« nehmen die Beobachtungen des Ehepaare Breland ein.
Die Brelands, unmittelbare Schüler Skinners, hatten eine kommerzielle Firma, die »Animal
Behavior Enterprises« gegründet, in der für verschiedene Zwecke (Werbung, Fernsehspots,
Unterhaltungsindustrie) die Skinnerschen Techniken der Verhaltensmodifikation angewendet
wurden. In ihrer ersten Veröffentlichung darüber (Breland & Breland 1951) werden zunächst
noch die dabei erzielten großen Erfolge herausgehoben. Knapp zehn Jahre später (1960) berichten die Brelands jedoch über so ausgeprägte Verhaltensirregularitäten der von ihnen dres-
2
sierten Tiere, daß die Brauchbarkeit der Skinnerschen Theorie für derartige Dressurzwecke
generell angezweifelt wird. Es hatte sich nämlich - wie die Brelands in verschiedenen sorgfältig recherchierten »Fallgeschichten« sehr überzeugend schildern - herausgestellt, daß die zunächst mit Hilfe der Skinnerschen »Verstärkungspläne« (s.u.) erreichten gezielten Verhaltensmodifikationen bei verschiedenen Tierarten nach mehr oder weniger langer Zeit durch
artspezifische Verhaltensweisen überlagert und schließlich verdrängt wurden (so zeigen etwa
Waschbären, die auf das Einstecken von Münzen in ein Sparschwein dressiert worden waren,
nach einiger Zeit statt dessen ihr arttypisches «Waschverhalten«, neben die Münzen also, statt
sie in den Behälter zu stecken, permanent aneinander; Hühner, die eine Art von PingpongSpiel mit Kapseln gelernt hatten, kümmerten sich mit der Zeit immer weniger darum, sondern
fingen völlig »unverstärkt« an, den Kapseln nachzujagen, sie immer wieder »einzufangen«;
Schweine »vergruben« Münzen, statt sie, wie gelernt, in einen Behälter fallen zu lassen, etc.).
Die Brelands interpretieren den Umstand, daß derartige Verhaltensweisen der Tiere in den
üblichen psychologischen Tierexperimenten nicht auftreten, damit, daß dort die Beobachtungszeiten zu kurz sind und zu wenig unterschiedliche Tierarten untersucht werden. Die per
Konditionierung erlangten Verhaltensänderungen wären so gesehen keinesfalls als dauerhafte
Lernerfolge, sondern lediglich als vorübergehende, quasi experimentell erzwungene Abweichungen vom artspezifischen Verhaltensrepertoire anzusehen. Für einen solchen »Zwangscharakter« der Skinnerschen Tierdressuren sprechen auch Befunde über »adjunctive behavior«
als »spontane« Begleiterscheinungen der Anwendung von Skinners »Verstärkungsplänen«:
»Nichtverstärktes« exzessives Trinken, Fressen von nicht eßbarem Material wie Holzspänen
und Papier, tickartiges Umherrennen, ungezielte Aggressionen, etc. (vgl. Falk 1967, 1969,
1970, sowie Staddon & Simmelhag 1971). Zur Erklärung solcher konditionierungstheoretisch
unverständlichen tierischen Verhaltensweisen werden von den Autoren ethologische Gesichtspunkte eingeführt, so etwa (von Falk) der Versuch gemacht, einen Zusammenhang zwischen »adjunctive behavior« und den in der Ethologie beschriebenen »Übersprungbewegungen« herzustellen.
Diesen und vielen anderen experimentellen Befunden über »Ausnahmen« oder Einschränkungen hinsichtlich der Gültigkeit der SR-psychologischen Lerngesetze wurde auch auf allgemeinerer konzeptioneller Ebene Rechnung getragen. So unterschied etwa Seligman (1970),
u.a. in Interpretation der erwähnten Befunde von Garcia & Kölling (1966), zwischen »biologisch vorbereiteten«, »biologisch nicht vorbereiteten« und »biologisch entgegengesetzt vorbereiteten« Konditionierungen; in ähnliche Richtung gingen Überlegungen von Bolles (1970,
1972) speziell mit Bezug auf das Vermeiden-Lernen, In solchen Konzeptionen wurden jedoch
zunächst zwar »angeborene« biologische Faktoren als zusätzliche Bedingungen, die das Lernen fördern oder behindern können, eingeführt, die Universalität der Lerngesetze selbst (also
auch deren Anwendbarkeit auf Menschen) wurde aber noch nicht grundsätzlich in Zweifel
gezogen. Im Laufe der weiteren Entwicklung kamen dann aber auch daran Zweifel auf und
die SR-theoretische Grundvoraussetzung tierexperimenteller Fundierbarkeit menschlicher
Lernforschung wurde als solche problematisiert. Dies mag einmal darauf zurückzuführen
sein, daß man die Ethologie allmählich auf eine adäquatere Weise rezipierte, und so etwa zur
Kenntnis nahm, daß Lorenz (seit 1961) die ältere Vorstellung einer einfachen Trennbarkeit
zwischen »angeborenen« und »gelernten« Faktoren zurückwies, indem er die artspezifische
Ausprägung des Lernens selbst bei verschiedenen Tierarten demonstrieren konnte. Größere
Bedeutung hatte in diesem Zusammenhang indessen wohl der Umstand, daß die Kognitive
Psychologie (die mindestens seit den frühen sechziger Jahren zum beherrschenden psychologischen Grundansatz geworden war) mit ihrer Theorie der Informationsverarbeitung als dezidiert humanpsychologische Alternative zur SR-Psychologie auftrat, womit auch die Zuständigkeit der SR-Psychologie für menschliches Lernen zweifelhaft werden mußte. Die von da
aus nahegelegte Arbeitsteilung kam z.B. deutlich auf der berühmten Konferenz an der schwedischen Umea-Universität im Jahre 1984, »Perspectitives on Animal Learning and Human
3
Memory«, zum Ausdruck. In dieser Konferenz setzten prominente Vertreter der SRPsychologie (z.B. Rescorla, Olton und Estes) und der Kognitiven Psychologie (z.B. Tulving,
Crowder und Craik) ihre Auffassungen ins Verhältnis, wobei nicht nur (wie schon am Titel
ersichtlich) die Beiträge der SR-Psychologie unter »animal learning« rubriziert, sondern auch
die SR-Psychologen selbst wiederholt (ohne deren Protest) als »animal psychologists« bezeichnet wurden (vgl. Nilsson & Archer 1985). Daran könnte man ablesen, daß die SRPsychologie unter der Hegemonie der Kognitiven Psychologie (mindestens durch ihre in Umea anwesenden Vertreter) ihren Universalitätsanspruch mehr oder weniger stillschweigend
aufgegeben hat. Auch das, was neuerdings gelegentlich unter der Bezeichnung »ecological
psychology« firmiert (vgl. etwa Davey 1989), ist (soweit ich sehe) im wesentlichen Lernforschung an Tieren auf SR-theoretischer Grundlage, aber unter Einbeziehung artspezifischer
Umwelten.
Im Zusammenhang mit derartigen Problematisierungen ergab sich vom Standpunkt der Kognitiven Psychologie noch eine andere Art von Einwänden gegen die Auffassung der SRPsychologie von der humanpsychologischen Verallgemeinerbarkeit tierexperimenteller Konzepte und Befunde. Die Diskussion darüber kann mit dem Stichwort »awareness« oder »Wissentlichkeit« charakterisiert werden: Der in den SR-theoretischen Konzepten enthaltenen
Grundauffassung, die Lerneffekte unterlägen bestimmten universellen, für Tiere und Menschen gleichermaßen gültigen Konditionierungsgesetzen, stehen nämlich mannigfache Experimente mit dem Befund gegenüber, daß »Konditionierungseffekte« beim Menschen nur dann
auftreten, wenn das Versuchssubjekt sich der Tatsache und der Art der Verstärkung bewußt
ist, wenn es also dessen »gewahr« (»aware«) wird, welche seiner Reaktionen bzw. Verhaltensweisen in welcher Anordnung und Reihenfolge im Experiment »verstärkt« werden. Die
vielfältigen experimentellen Versuchsanordnungen, mit denen dieses WissentlichkeitsArgument bekräftigt oder widerlegt werden sollte, hat Brewer (1974), der sich vom kognivitistschen Standpunkt gegen den Mechanizismus der SR-Theorien wendet, in sorgfältiger und
um fassender Weise zusammengetragen und diskutiert. In dieser Arbeit, die den bezeichnenden Titel trägt »There is no convincing evidence for operant or classical conditioning in human adults«, kommt Brewer zunächst zu der Auffassung, das Gros der in Experimenten mit
Menschen erzielten (scheinbaren) Konditionierungseffekte müsse tatsächlich darauf zurückgeführt werden, daß die Versuchspersonen die jeweiligen Verknüpfungen bewußt hergestellt
haben, wobei es aber einige wenige Experimente gebe, bei denen die Beteiligung von »awareness« nicht nachweisbar sei. Darüber hinaus konnte Brewer zeigen, daß innerhalb der Geschichte der einschlägigen Forschungsbemühungen automatische Konditionierungseffekte
vorwiegend in früheren, methodisch noch wenig differenzierten Untersuchungen angenommen wurden, während mit der Verfeinerung der Versuchsmethodik Befunde über Konditionierungen ohne »awareness« immer seltener wurden. Von da aus sei es naheliegend, auch die
verbleibenden wenigen Fälle »bewußtlosen« Konditionierens auf noch nicht identifizierte
methodische Mängel zurückzuführen.
Dabei muß m.E. die prinzipielle Schwierigkeit, »awareness« innerhalb experimenteller Anordnungen generell auszuschließen, berücksichtigt werden: So wurde z.B. im Kontext der
»Signal detection theory« auf die Unmöglichkeit hingewiesen, »Bewußtseinsschwellen« von
den »Antwortprozessen« der Individuen zu unterscheiden (vgl. z.B. Swets, Tanner & Birdsall
1961); ebenso ergab sich in der Tradition der Forschungen zur »Wahrnehmungsabwehr«, daß
man die »Bewußtseinsschwelle« von der »Äußerungsschwelle« der Vpn abheben müsse, d.h.
daß aus dem Umstand, daß Vpn über bestimmte »Reizkonstellationen« nicht berichten, keineswegs der Schluß ableitbar sei, daß sie sie nicht wahrgenommen hätten (vgl. etwa Nothman
1962). In diesem Forschungszusammenhang wurde weiterhin die Auffassung problematisiert,
man könne bewußte und nichtbewußte Prozesse als einfache Alternativen gegenüberstellen:
tatsächlich handele es sich dabei um einen kontinuierlichen Übergang von undeutlicherer zu
deutlicherer »Reizerfassung«, wobei es wiederum von einer Vielzahl von Bedingungen ab-
4
hänge, wann eine Versuchsperson tatsächlich äußert, daß sie etwas gesehen oder bemerkt habe (vgl. etwa Brown 1961 und Haber 1966).
Nun ist die aus der früher dargelegten Einsicht in die artspezifische Besonderheit von Lernmechanismen und aus der »Awareness«-Problematik sich ergebende Konsequenz, bei der
Diskussion des SR-psychologischen Konditionierungslernens auf das Argument der tierexperimentellen Fundiertheit zu verzichten, zwar heute in der Psychologie keineswegs Allgemeingut: Man kann sich offensichtlich nur schwer dazu durchringen, ca. 30 Jahre intensiver tierexperimenteller Forschung für die Humanpsychologie einfach abzuschreiben (dies um so weniger, als das »naturwissenschaftliche« Selbstverständnis der Psychologen sich zu einem gewissen Teil auch auf die vorgebliche Fundiertheit der Lerntheorien in exakter experimenteller
Tierforschung gründen mag). Immerhin aber darf man angesichts der geschilderten Problemlage die Voraussetzung, daß bei tierischem und menschlichem »Konditionierungslernen« tatsächlich die gleichen Lerngesetze anzunehmen sind, wohl mindestens für sehr fragwürdig
halten: Es könnte doch auch sein, daß Entsprechungen tier- und humanexperimenteller Befunde bei der »Prüfung« derartiger Gesetzesannahmen keineswegs mit den gleichen »Lernmechanismen« erklärt werden dürfen, sondern daß es sich dabei nur um oberflächliche Ähnlichkeiten von Lernprozessen grundsätzlich verschiedener Art handelt. Demnach wäre die
scheinbare »Konditionierbarkeit« von Menschen keinesfalls durch die entsprechende Konditionierbarkeit von Tieren erklärt, sondern der Umstand, daß menschliches Lernen unter bestimmten experimentellen o.ä. Bedingungen als »Konditionierung« erscheint, wäre umgekehrt
selbst erklärungsbedürftig.
Da derartige Erklärungen sich in diesem Kontext nur auf menschliches Lernen beziehen, hätte
der SR-psychologische Ansatz hier seinen tierexperimentellen Bonus eingebüßt und könnte
von da aus andere Ansätze, die nicht auf tierisches Verhalten anwendbar sind, auch nicht als
prinzipiell illegitim zurückweisen. Sofern man gemäß dem »Awareness«-Argument bewußte
Lernaktivitäten als möglich in Rechnung stellt, würde sich mithin aus dem Umstand (scheinbarer) menschlicher Konditionierbarkeit die Frage ableiten lassen, unter welchen Bedingungen Individuen bewußt Verhaltensweisen zeigen, die dem Konditionierungsverhalten von
Tieren ähneln. So gesehen stünde auch dem Versuch einer begründungsanalytischen Reinterpretation nichts mehr im Wege, wobei die benannte Frage hier auf das Problem spezifizierbar ist, unter welchen Prämissen Individuen mit »guten Gründen«, also »vernünftigerweise«
in einer Weise lernen, die von außen, also vom Drittstandpunkt, als Konditionierung erscheint. Damit haben wir beim Versuch der Rechtfertigung unseres Vorhabens, aus SRTheorien Begründungsmuster explizieren zu wollen, gleichzeitig die Fragestellung unserer
anschließenden Reinterpretationsbemühungen ein Stück weit präzisiert.
Klassisches Konditionieren: Signallernen
Die SR-Theorie (oder SR-Psychologie) ist - um dies noch einmal zu pointieren - eine psychologische Grundkonzeption, in der »Stimuli« (»Reize«) und »Responses« (»Reaktionen«) von
Organismen bzw. Individuen als Elemente oder kleinste Einheiten des Verhaltens gesetzt
sind, wobei die einzelnen theoretischen Annahmen sich auf die Art der Verknüpfung zwischen Stimuli und Responses zu höheren Einheiten beziehen. Die SR-Psychologie gehört damit zu den assoziationistischen Grundansätzen i.w.S. Die Prozesse der Assoziationsbildung
werden als »Konditionieren« (»conditioning«) spezifiziert, wobei zwei Arten von Konditionieren unterschieden werden, heute als klassisches Konditionieren (dem wir uns zunächst
zuwenden) und instrumentelles Konditionieren (auf das wir später kommen) bezeichnet.
Das Konzept des klassischen Konditionierens geht bekanntlich auf Watsons Adaptation von
Pawlows Konzept des »bedingten Reflexes« zurück, wie er in der Standard-Anordnung des
berühmten Hundeexperiments demonstriert wurde: Unbedingter Stimulus (US): Futterpulver;
unbedingte Reaktion (UR): Speichelabsonderung des Hundes auf Futterpulver hin; bedingt
(»conditioned«) Stimulus (CS): Glockenton; bedingte Reaktion (CR): Speichelabsonderung
5
nur auf Glockenton hin. Der Lernprozeß, wie er in dieser Anordnung gefaßt wird, besteht in
der Ersetzung des Futterreizes durch den (ursprünglich »neutralen«) Glockenton aufgrund von
dessen mehrfacher Darbietung in zeitlicher »Kontiguität« (Nachbarschaft) mit dem Futterreiz,
nämlich jeweils kurz davor (Reizsubstitution). Das Konzept der »Verstärkung« bezieht sich in
diesem Kontext auf die bedingte Reaktion (CR): Diese wird verstärkt mit der Häufigkeit der
erwähnten Zusammendarbietung von US und CS (je häufiger der Glockenton kurz vor dem
Futterpulver dargeboten wird, um so stärker, dauernder, ist die Speichelsekretion nur auf den
Glockenton hin, also die CR). Als Gegenbegriff zur Verstärkung fungiert dabei das Konzept
der Löschung oder Extinktion: Wenn der Glockenton mehrere Male ohne den US (Futtergeruch) dargeboten worden ist, wird die CR (Speichelsekretion auf Glockenton) gelöscht (vgl.
Pawlow 1903, in 1953, S.122). In der Folge wurde die ursprüngliche Einschränkung dieses
Schemas auf angeborene Reflexe bzw. autonome Reaktionen der glatten Muskulatur immer
mehr relativiert, indem man auch Willküraktivitäten der quergestreiften Skelettmuskulatur als
UR einführte. Der konditionierte Stimulus wurde dabei häufig als Signal, mit welchem das
Auftreten des unkonditionierten Stimulus angekündigt wird, und das klassische Konditionieren entsprechend als Signallernen bezeichnet (weitere lerntheoretische Konzepte im Umkreis
des Klassischen Konditionierens werden von mir später bei Bedarf eingeführt).
Im folgenden soll nun also versucht werden, aus dem Theorieschema des Klassischen Konditionierens, wenn es auf Menschen angewendet wird, (mittels der früher, auf S.33ff, benannten
Kriterien) Begründungsmuster zu explizieren, um von da aus zu entsprechenden Reinterpretationen zu gelangen. Damit sind wir sogleich an einen SR-psychologischen Theorieansatz geraten, der aufgrund seiner besonders ausgeprägten »physiologischen« Charakteristik dem
Aufweis darin enthaltener Aussagen über Begründungszusammenhänge besonderen Widerstand entgegenzusetzen scheint.
Versuchen wir zunächst, das Klassische Konditionierungsschema in seiner dargestellten allgemeineren Fassung als empirische Wenn-Dann-Hypothese zu formulieren: Wenn kurz vor
einem bestimmten Reiz (US), auf den die Vp konstant in spezifischer Weise zu reagieren
pflegt (UR), ein anderer Reiz, der bei der Vp zunächst keine Reaktion hervorrief (CS), dargeboten wird, dann reagiert die Vp (nach einer gewissen Anzahl von Durchgängen) allein auf
den CS in gleicher (oder ähnlicher) Weise wie auf den US, zeigt also eine bedingte Reaktion
(CR). Solange man das Verhältnis zwischen CS und US in dieser Weise strikt als bloß zeitliche Nähe (Kontiguität) definiert, scheint die Einfügung von »vernünftigerweise« zwischen die
Wenn- und Dann-Komponente hier wenig Sinn zu machen. Nun wird aber (wie gesagt) im
Klassischen Konditionierungsschema - weil es offenbar in der rein »zeitlichen« Fassung kaum
psychologisch handhabbar und interpretierbar ist - häufig das Verhältnis zwischen CS und US
- selbst mit Bezug auf tierexperimentelle Anordnungen - als »Signallernen« gefaßt und damit
inhaltlich spezifiziert; entsprechend wird der CS als Signal, Hinweisreiz, Ankündigung o.ä.
des US bezeichnet. Mithin können wir, im Einklang mit dem einschlägigen Sprachgebrauch,
die Wenn-Dann-Hypothese des Klassischen Konditionierens so umformulieren:
Wenn mit einem bestimmten Reiz (CS) das Auftauchen eines anderen Reizes (US) angekündigt, signalisiert, etc. wird, dann reagiert die Vp (nach einer Reihe von Durchgängen) allein
schon auf diesen (ursprünglich neutralen) Hinweisreiz (CR) in vergleichbarer Weise wie auf
den signalisierten Reiz (UR). Angesichts dieser abgeänderten Fassung erscheint die Möglichkeit, (per Einfügung von »vernünftigerweise«) das Klassische Konditionierungsschema als
BGM zu explizieren, keineswegs mehr so sinnlos wie mit Bezug auf die ursprüngliche Fassung. »Signale«, »Hinweise«, »Ankündigungen« sind nämlich als solche immer Signale,
Hinweise, Ankündigungen für jemanden, und zwar offensichtlich (da nicht für den Experimentator) für den »Versuchsorganismus«. Darin liegt nun aber ein - wenn auch minimales, so
doch offenbar unvermeidliches - Zugeständnis an den Subjektstandpunkt des »konditionierten« Individuums: Somit wäre hier - jenseits des offiziellen Verständnisses - im Konzept der
Klassischen Konditionierung die Deutung der bedingten Reaktion der Vpn als auf irgendeine
6
Weise »begründet/verständlich« im Interesse psychologischer Sinngebung mitgemeint und
bedarfsweise explizierbar.
Wenn man nun allerdings die BGM-Fassung des Klassischen Konditionierens, dergemäß eine
Vp »gute Gründe« hat, bereits auf die Ankündigung eines Reizes in gleicher Weise zu reagieren wie auf einen ursprünglichen Reiz, für sich betrachtet, so stellt sich heraus, daß eine solche Formulierung zwar einerseits keineswegs - wie bei echten empirischen Wenn-DannAussagen - von vornherein »aus dem Diskurs fällt«. Andererseits kann man unter diesen Umständen aber auch nicht schon positiv behaupten, daß eine derartige BGM-Explikation berechtigt ist: Da man hier nichts über die inhaltliche Eigenart und die situationelle Einbettung der
Beziehung zwischen Signal und Signalisiertem als möglicher Begründungsprämisse erfährt,
lassen sich auch keine Aussagen darüber machen, wieweit darin die Reaktion auf das Signal
anstelle der Reaktion auf das Signalisierte als »begründet« impliziert sein mag, d.h. aufgrund
welcher Intentionen die Vp in Ansehung ihrer Lebensinteressen zu einem solchen Handlungsvorsatz kommen könnte. Bei Berücksichtigung unserer generellen Vorannahme, daß vermeintlich automatische Konditionierungseffekte beim Menschen tatsächlich durch begründete
Handlungen der Vpn zustandekommen können, würde daraus folgen: Die Bedingungen, unter
denen Klassisches Konditionieren (als Phänomen) bei Menschen auftritt, sind mit dessen allgemeiner Fassung allein in Termini des Verhältnisses zwischen Signalreizen und unbedingten
Reizen etc. unterbestimmt.
In Wirklichkeit muß die »Reizkonstellation« hier durch weitere, inhaltliche und situationelle
Bestimmungen (die theoretisch nicht abgebildet sind) spezifiziert sein, damit es zu »Konditionierungseffekten« kommt, die in diesem Kontext dann auch als »begründet« explizierbar
wären. Um zu verdeutlichen, was dies heißt, sei zunächst aus den »20 Szenarien aus dem Alltag«, mit welchen Steiner (1988) in seinem bekannten Lehrbuch die Struktur verschiedener
Lerntheorien veranschaulicht, das erste, unter dem Motto »Angst vor weißen Schürzen - Klassisches Konditionieren« stehende Szenario - eine Abwandlung des berühmten »KleinerAlbert-Experiments« von Watson & Rayner (1920) - referiert:
»Eine junge Mutter sitzt mit ihrem knapp anderthalbjährigen Kind im Wartezimmer des Augenarztes. Nachdem das letzte Mal die verstopften Tränenkanäle gespült werden mußten,
steht heute lediglich die Nachkontrolle an. Das Kind ist viel unruhiger als sonst, aber die Mutter lenkt es mit Geschichtenerzählen geschickt hab. Wie nun die Arztgehilfin eintritt, beginnt
das Kind wie am Messer zu schreien und zu strampeln. Das ist eine Reaktion auf die neue
Reizsituation, die mit dem Eintreten der Arztgehilfin, die das Kind zuvor nicht kannte, eingetreten ist. Die Reaktion ist völlig eindeutig; sie ist der Ausdruck für eine starke Emotion, für
Angst, für Furcht vor etwas, vielleicht auch für einen Widerwillen gegen etwas. Eine charakteristische Reizsituation löst eine ebenso charakteristische Reaktion aus.« (S.14)
In Verfolgung der »Lerngeschichte« dieser Reaktion verweist Steiner zunächst darauf, daß
allgemeine Erregungszustände wie die »Angst« des benannten Kleinkindes eine »elementare
natürliche Verhaltensweise» und deswegen für die Klassische Konditionierung von großer
Bedeutung seien. Sodann fragt er nach der Art der »Reizsituation«, die das Weinen und
Schreien des Kindes ausgelöst habe, wobei er als »Reizkonfiguration« etwa eine Figur im
weißen Kittel innerhalb des Kontextes der gesamten Arztpraxis heraushebt (S.16f). Weiterhin
charakterisiert er die »ursprüngliche Konditionierung des Kindes« in folgender Weise:
»Mit Sicherheit hat das Kind beim vorausgegangenen Spülen der Tränenkanäle einen bedeutenden Schmerz verspürt. Dieser war ein Reiz für das Kind, auf den es mit natürlichen Verhaltensweisen reagiert hat, vor allem mit denen, die ihm damals zu Gebote standen:
mit einer abwehrenden Körperbewegung (Zusammenzucken, Strampeln) und vor allem mit
Schreien. So zu reagieren, mußte das Kind nicht lernen; diese Reaktionen gehören wohl zu
den elementaren, in gewissem Sinne das Überleben sichernden Verhaltensweisen. Viele weitere Reaktionen, jedenfalls von außen beobachtbare, waren in dieser Situation nicht möglich,
weil der Arzt nämlich die Mutter gebeten hatte, das Kind auf dem Arm zu halten und seinen
7
Kopf zu fixieren. Die Tatsache, daß sich das Kind nicht bewegen konnte, stellte nun ihrerseits
eine Reizkonfiguration in Form von visuellen, taktilen, aber auch inneren Reizen dar. Das
Faktum ferner, daß es sich nicht wehren konnte, also keine Verhaltensalternativen hatte, führte zweifellos zu einer erhöhten Erregung des gesamten Organismus. Beim ersten Mal erfolgte
eine Angstreaktion unmittelbar auf den Schmerz, der das Spülen verursachte. Im Wiederholungsfalle, d.h. heute beim erneuten Arztbesuch, antizipiert das Kind - aufgrund der oben beschriebenen Reizsituation - den Schmerz und löst damit die Angstreaktion aus.« - »Sehen wir
uns noch einmal die ursprüngliche Situation an, so erkennen wir etwas Wichtiges: Das Kind
nimmt zwar zweifellos den Schmerz wahr (zu erst taktil, dann innerlich, organisch), erkennt
aber höchst wahrscheinlich die eigentliche Ursache, nämlich die Spülflüssigkeit bzw. die
Spülnadel als auslösenden Reiz nicht. Selbst wenn es die Nadel rein optisch wahrnehmen
würde, wüßte es nicht, was dies für ein Instrument ist und daß dieses eigentlich die schmerzhaften Konsequenzen nach sich zieht. Hingegen sieht und spürt es die umgebende Situation:
Es sieht und hört den behandelnden Arzt, dessen Gesicht und Teile seiner weißen Schürze.
Durch eben diese besondere, hoch geschlossene Schürze unterscheidet sich der Arzt von vielen anderen Menschen, denen das Kind schon begegnet ist und die es kennt. Der Schmerz als
Reiz wird nun mit dem für das Kind offensichtlichen Verursacher, d.h. mit dem Arzt und dessen auffallenden Merkmalen gepaart. Innerhalb der gesamten Reizsituation verbindet sich die
weiße Schürze als gleichzeitig und am gleichen Ort auftretender Teilstimulus mit dem
Schmerz und löst von jetzt an, auch ohne daß dieser Schmerz unmittelbar eintritt, die entsprechenden Reaktionen aus.«
»UCS → UCR → CS → CR«
»Halten wir folgendes fest: Am Anfang steht ein körperlicher Reiz, ein Schmerz. Dieser
Schmerz ist der unbedingte oder unkonditionierte Reiz ... UCS ... Dieser löst eine ebenso unbedingte oder unkonditionierte Reaktion aus ... UCR ...‚ eben die Angst des Kleinkindes
Später löst ein anderer, ursprünglich neutraler Reiz die Angstreaktion des Kindes aus. Dieser
Reiz, der dann als Auslöser fungiert (wir haben angenommen, es sei die weiße Schürze), wird
als bedingter oder konditionierter Reiz bezeichnet ... CS ... und die Angstreaktion des Kindes
als die bedingte oder konditionierte Reaktion ... CR ...« (S.16f).
Wieweit läßt sich nun aus der klassischen Konditionierungsanordnung, wie sie Steiner hier
inhaltlich und situationell konkretisiert hat, ein BGM explizieren, wieweit ist also das Schreien und Strampeln des Kindes beim Anblick der weißbekittelten Arzthelferin, von Steiner als
»konditionierte Reaktion« eingestuft, als Resultat eines begründeten Handlungsvorsatzes des
Kindes reinterpretierbar? Auf den ersten Blick scheint ein solcher Reinterpretationsversuch
schon dadurch ad absurdum geführt, daß das Kind ja unter Bedingungen strampelt und
schreit, wo ein erneuter schmerzhafter Stich durch den Tränenkanal gar nicht ansteht, weiterhin dadurch, daß Schreien und Strampeln wohl kaum als Realisierung eines begründeten
Handlungsvorsatzes angesehen werden können - wenn man nicht sogar der Auffassung ist, ein
eineinhalbjähriges Kind könne ohnehin noch keine begründeten Handlungsvorsätze fassen,
und sei so von vornherein besser als Reaktionsmechanismus nach Art des klassischen Konditionierungsschemas charakterisiert. Aber sehen wir etwas genauer zu:
Wenn man zunächst die von Steiner benannten »Reizkonstellationen« (d.h. in unserem Sinne
Bedeutungskonstellationen) betrachtet, so erweist sich die mögliche Vorstellung, das Kind
hätte - wenn es »vernünftig« gehandelt haben würde - erkennen müssen, daß diesmal »nichts
passiert«, als das, was man früher in der Psychophysik »Objektentgleisung« nannte: Als unangemessene Projektion der Sicht des Experimentators auf die Sicht der Vp - Steiner hebt, im
Interesse der Anwendbarkeit des Schemas des Klassischen Konditionierens auf sein Beispiel,
an verschiedenen Stellen heraus, was das Kind hier alles nicht wissen und tun kann bzw. darf,
damit der Konditionierungsmechanismus funktioniert. So wird von ihm angenommen, das
Kind we nicht, daß sein Schmerz von der Spülnadel bzw. Spülflüssigkeit verursacht wurde
etc., so daß für das Kind nur der auffallend weißbekittelte Arzt als »offensichtlicher Auslöser«
8
des Schmerzes übrigbleibt. Weiterhin weiß das Kind - wie wir ergänzen können - auch nicht,
daß »diesmal« nur eine »Nachkontrolle« ansteht: Man hat es ihm nicht gesagt (oder es konnte
es noch nicht verstehen). So gibt es vom Standpunkt des Kindes also hier keinen anderen Anhaltspunkt für die Annahme, es werde gleich wieder schmerzhaft werden, als den - diesmal
die Arzthelferin bekleidenden - auffallenden weißen Kittel. Wenn man die dergestalt radikal
reduzierte »Prämissenlage« in Rechnung stellt, so ergibt sich also, daß das Kind unter diesen
Bedingungen beim Anblick des Kittels der Arzthelferin sehr wohl »gute Gründe« für die Annahme haben könnte, es ginge »gleich wieder los«: Es bleibt ihm mangels weitergehender
Information sozusagen »gar nichts anderes übrig«. Somit können wir versuchsweise verallgemeinern, »Klassisches Konditionieren« beim Menschen sei begründetes Handeln bei extrem eingeschränktem Realitätszugang - insbesondere durch situationalen und/oder experimentellen Entzug der Einsicht in solche sachlichen und sozialen Bedeutungsunterschiede der
»unbedingten« und der »bedingten Reizkonstellationen«, aus denen unterschiedliche Handlungsvorsätze als »vernünftig« begründbar gewesen wären: Die Gleichheit der »Reaktion«
des Individuums auf den CS und den US, der für eine mechanische »Reizsubstitution« aufgrund bloßer Kontiguität zu sprechen scheint, ist so gesehen tatsächlich durch den Experimentator o.ä. selbst hergestellt, indem Realitätsaufschluß, der zu unterschiedlichen Prämissen und
Handlungskonsequenzen geführt hätte, der Vp vorenthalten (bzw. in Alltagssituationen »weggedacht«) wird.
Bleibt aber immer noch der mögliche Einwand, das »Strampeln und Schreien« des Kindes sei
doch eine (wie Steiner meint) natürliche, elementare Reaktion und nicht die Realisierung eines Handlungsvorsatzes - womit auch die benannte Interpretation der Reizkonstellation als
extrem eingeschränkte Prämissenlage quasi in der Luft hinge. Dem wäre zunächst entgegenzuhalten, daß schon die »unbedingte Reaktion« des Kindes, das Schreien und Strampeln beim
Durchstich des Tränenkanals, wenn man die von Steiner eingeführten speziellen Bedingungen
(»Fixierung« des Kopfes, damit Wehrlosigkeit des Kindes etc.) berücksichtigt, keineswegs als
sonderlich »natürlich« und »elementar«, sondern in dieser Situation eher als gut begründet,
d.h. verständlich erscheint: Das Kind wehrt sich hier sozusagen mit den ihm verbleibenden
Mitteln (Steiner sagt ja selbst, daß es keine »Verhaltensalternativen« hatte) gegen die Zumutung einer solchen aus seiner Sicht willkürlichen und undurchschaubaren Prozedur - wobei
der damit unterstellte »Handlungscharakter« eine starke emotionale Involviertheit des Kindes
keineswegs ausschließt. Bezüglich der »bedingten Reaktion« sagt Steiner (in Überschreitung
der SR psychologischen Begrifflichkeit) selbst, das Kind »antizipiert« die Wiederholung der
benannten Zwangsprozedur. Wir können hinzufügen, daß es (angesichts der benannten reduzierten »Prämissenlage«) gute Gründe für eine solche Antizipation hatte. Der Umstand, daß es
darauf (von außen gesehen) in gleicher Weise »reagiert« wie auf die Prozedur des Tränenkanal-Durchstichs selbst, ist in diesem Kontext wiederum keinesfalls ein zwingender Beleg für
den »automatischen« Charakter der Übertragung des (damit zum CR werdenden) UR auf die
zunächst neutrale »Reizsituation« (CS). Vielmehr kann das »Schreien und Strampeln«, als
Realisierung eines Handlungsvorsatzes betrachtet, in beiden Fällen durchaus unterschiedliche
Intentionen aus drücken: Im ersten Fall (US) etwa die Intention des Kindes, das Aufhören
einer quälenden Prozedur zu erreichen, im zweiten Falle (CS) die Intention des Kindes kundzutun, daß es mit einer Wiederholung dieser Prozedur nicht ein verstanden ist und nach Hause
möchte o.ä. Der Tatbestand, daß die Handlungsumsetzung hier ebenfalls in »Schreien und
Strampeln« besteht, verweist wiederum darauf, daß dem Kind (wie es Steiner geschildert hat)
die Mittel zu einer differenzierten intentionsgemäßen Handlungsrealisierung nicht zur Verfügung stehen. So kann es (da mit anderthalb Jahren nicht hinreichend sprachmächtig) etwa
nicht zu der Sprechstundenhilfe sagen: »Also, wenn Sie jetzt wieder zu pieken anfangen wollen, da mache ich nicht mit«; ebenso wenig zur Mutter: » Jetzt reicht‘s mir, wenn Du mit mir
keinen Arger kriegen willst, bring mich hier weg«. Außerdem hat das Steinersche Kind vielleicht (wie viele Kinder) die Erfahrung gemacht, daß man seine differenzierteren Absichtsbe-
9
kundungen normalerweise nicht beachtet, geschweige denn sich danach richtet. Also bleibt
dem Kind »vernünftigerweise« nichts anderes übrig, als eben zu schreien und zu strampeln.
Das Klassische Konditionieren wäre demnach als ein BGM zu explizieren, das nicht nur
durch Bedeutungskonstellationen mit spezifisch eingeschränkter, die Unterschiede zwischen
US und CS nivellierender Prämissenlage, sondern auch mit spezifisch eingeschränkten Alternativen der Handlungsumsetzung, durch welche die Gleichheit des CR und des UR quasi vor
getäuscht wird, charakterisiert ist. (In diesem Zusammenhang sei darauf hin gewiesen, daß
nach Lidell schon im Pawlowschen Hundeversuch nur da durch die Gleichheit der Speichelsekretion als UR und CR sichergestellt werden konnte, daß man den Hund an einem Gestell
festband und so daran hinderte, in »artspezifischer« Weise winselnd und schwanzwedelnd den
»CS« zu umschmeicheln; vgl. Lorenz, 1973, S.121 und Osterkamp, 1975, S.147ff.)
An dieser Stelle mag man, selbst wenn man der vorstehenden BGM-Reinterpretation soweit
gefolgt ist, einwenden wollen, damit sei aber keineswegs erwiesen, daß »alle« bei Menschen
beobachteten »klassischen« Konditionierungseffekte entsprechend reinterpretierbar seien. So
falle hier jede Möglichkeit der BGM-Interpretation doch mindestens dann weg, wenn es sich
beim UR und CR um Reaktionen des »autonomen Nervensystems« handelt. Nun hat sich ja
aber schon bei Diskussion des Steinerschen Beispiels gezeigt, daß das »Schreien/Strampeln«
des Kindes - von Steiner umstandslos als natürlich-elementare Reaktion im Sinne der ursprünglichen Theorie des »bedingten Reflexes« eingestuft - bei Berücksichtigung der dort
benannten situationellen Bedingungen und mangelnden Artikulationsmöglichkeiten des Kindes - als rigoros reduzierte »Handlung«, u.U. mit einer »autonomen» Reaktionskomponente,
reinterpretierbar ist. Von da aus wäre zu diskutieren, ob z.B. die »galvanische Hautreaktion«
(GSR) als beliebte UR/CR in human- psychologischen Experimenten zum Klassischen Konditionieren nicht ebenfalls nur die »autonome« Komponente einer impliziten Handlung der
Vpn darstellen könnte: Deren Äußerung und Erfassung wären demnach hier nicht (wie bei
Steiner) durch unterstellte mangelnde Artikulationsfähigkeiten der Vp, sondern einfach durch
die experimentelle Prozedur der Bestimmung der GSR unterbunden, bei der allein die als Index für emotionale Erregung angesehene Hautfeuchtigkeit gemessen und der Vp keine Gelegenheit zur Äußerung der möglichen Gründe für ihre Erregung gegeben wird. Eine genauere
Begründungsanalyse der experimentellen Situation vom Standpunkt der Vp könnte hier also
durchaus erbringen, daß deren »bedingte Reaktion« als unter den einschränkenden Bedingungen der Versuchsanordnung »begründete/verständliche Handlung betrachtet werden kann, die
im Experiment lediglich in ihrer autonomen Komponente, nämlich als GSR, in Erscheinung
tritt. Von da aus böte sich u.U. auch eine neue Erklärung dafür an, daß bestimmte autonome
Reaktionen, wie der Lidschlagreflex, beim Menschen kaum als »klassisch« zu konditionieren
nachweisbar sind: Vielleicht tritt diese Reaktion - anders als z.B. die GSR als allgemeine Erregungskomponente von Handlungen - nicht als autonomer Aspekt impliziter (oder expliziter)
Handlungen auf, sondern ist tatsächlich als unspezifisch physiologische »Reaktion« lediglich
durch isolierte »Reize« auszulösen und deswegen - da für die Vpn nicht in einem Begründungszusammenhang stehend - auch nicht »konditionierbar«.
Wenn man das Schema des Klassischen Konditionierens in all seinen Aspekten als BGM umformulieren wollte, wären allerdings noch viele komplizierte Fragen zu klären, so das Problem der einschlägigen Reinterpretierbarkeit von Konzepten wie »Stimulusgeneralisation«,
»Stimulusdifferenzierung«, »Irradiation« etc. in Humanexperimenten, weiterhin das Problem
der Relevanz oder Irrelevanz der (üblicherweise schlecht experimentell reproduzierbaren)
Aussagen über genauere quantitative Beziehungen, etwa des unterschiedlichen zeitlichen Abstands zwischen CS und US in ihrem Einfluß auf den Konditionierungseffekt, etc. Dabei ist
allerdings zu berücksichtigen, daß es uns hier lediglich darauf ankommen mußte, die Möglichkeit einer begründungsanalytischen Reinterpretation, selbst von scheinbar so »physiologienahen« Lernmechanismen wie dem Klassischen Konditionieren und damit die Aufhebbarkeit ihres psychologischen Gehalts in einer umfassenderen Begründungstheorie des Lernens
10
aufzuweisen - unabhängig davon, wieweit sich dabei bestimmte Spezialeffekte (zunächst)
unseren Reinterpretationsbemühungen entziehen mögen.
Instrumentelles bzw. Operantes Konditionieren: Lernen-am-Erfolg.
Die Theorie und Standardanordnung des Klassischen Konditionierens war zwar die erste theoretische Konkretisierung des behavioristischen Grundansatzes und läuft bis zur Gegenwart als
untergeordnetes Lernmodell der SR Psychologie mit: Sie wurde aber im Ganzen gesehen von
anderen theoretischen Konzeptionen/Standardanordnungen zurückgedrängt, die heute (seit
Hilgard & Marquis 1940) als »Instrumentelles Konditionieren« zusammengefaßt werden.
Dieses Konzept wurde zunächst von Thorndike (in Verbindung mit dem »Effektgesetz« des
Lernens) eingeführt (1911, revidiert ab 1933), bildete sodann die Grundlage für das umfassende System der Gesetzmäßigkeiten des Lernens durch »Triebreduktion« von Hull (etwa
1943 und 1952) und gewann schließlich herausragende Bedeutung. als Basis von Skinners
(bis heute einflußreicher) Theorie des »operanten Konditionierens« (etwa 1938 und 1953). Die Spezifik des Konzepts der Instrumentellen Konditionierung gegenüber dem Klassischen
Konditionieren läßt sich global so kennzeichnen:
Als »verstärkend« betrachtet man hier nicht die Häufigkeit des Miteinander-Vorkommens des
CS und des US in der von den Aktivitäten des Organismus unabhängigen Versuchsanordnung, sondern die Häufigkeit, mit der der Organismus durch sein eigenes Verhalten eine »Belohnung« (als »positive Verstärkung«) bzw. eine Beendigung von Schmerz, Stress etc. (als
»negative Verstärkung«) erreicht. Das Konzept »Kontiguität« bzw. »Kontingenz« bezieht sich
hier also nicht auf die zeitliche Konfiguration von CS und US, sondern auf das zeitliche Verhältnis zwischen der Aktivität des Organismus und der darauf folgenden Verstärkung als
»Verhaltenskonsequenz«. Die weiteren SR-theoretischen Konzepte (wie »Extinktion«, »Generalisierung«, »sekundäre Verstärkung«, »intermittierende Verstärkung« etc.) werden dabei
in ihrer Definition dem anderen Kontext angepaßt (s.u.). Eine frühe Versuchsanordnung zur
Realisierung dieses Konditionierungsschemas ist der Thorndike‘sche »Katzenkäfig«, aus welchem die Katzen durch »Versuch und Irrtum« per Hebeldruck nach draußen und zum Futter
gelangen können. Größere Bedeutung und Verbreitung gewann das »Labyrinth« (»maze«):
Hier durchlaufen Ratten ein Gangsystem mit verschiedenen Abzweigungen, von denen jeweils eine in die Sackgasse und die andere weiter führt, bis am Ende schließlich die Futterkammer erreicht ist. Die berühmteste Anordnung dieser Art ist die »Skinnerbox«, in welcher
die Tiere durch Drücken oder Picken auf einen Hebel an bestimmte Futter- oder Wasserquanten gelangen oder etwa auch einen elektrischen Schmerzreiz beenden können. Mit dem Terminus »instrumentelles« Konditionieren ist also auf den Umstand abgehoben, daß hier die
eigenen Aktivitäten der Organismen als Mittel der Gewinnung von Verstärkungen fungieren.
Noch deutlicher wird dieser Zusammenhang in dem (von Schlosberg, 1937, eingeführten)
Terminus »Lernen-am-Erfolg«, der heute oft zur Abhebung vom klassischen Signallernen
benutzt wird.
Während (wie sich zeigte) das Schema des Klassischen Konditionierens nur unter Einbeziehung weiterer je konkreter inhaltlicher und situationaler Bestimmungen als BGM reinterpretierbar ist, liegt der BGM-Charakter des (auf menschliches Lernen bezogenen) Instrumentellen Konditionierens - wie mir scheint - auf der Hand. So läßt sich dieses Schema für den Fall
»positiver Verstärkung« schlicht so als BGM formulieren: Wenn jemand für eine bestimmte
Handlung mehrfach eine Belohnung erhalten hat, dann führt er (bei Abwesenheit anderer Begründungsprämissen vernünftigerweise diese Handlung zum Zwecke der neuerlichen Herbeiführung des belohnenden Ereignisses wieder aus (die entsprechenden Formulierungen für den
Fall »negativer Verstärkung«, »Extinktion«, »sekundärer Verstärkung« etc. kann ich mir, da
auch dort der BGM-Charakter evident ist, sparen). Zur Bekräftigung dieser BGM Interpretation sei hier gleich auch das zweite meiner (früher dargelegten) einschlägigen Kriterien, die
»Gegenprobe« mittels Negation der vermeintlichen Wenn-Dann-Hypothese, in Anwendung
11
gebracht: Wenn jemand für eine Handlung belohnt wurde, dann wird er diese Handlung nicht
wieder aus führen. Es ist offensichtlich, daß die empirische Realisierung dieser Annahme keineswegs - wie bei einer echten empirischen Wenn-Dann-Hypothese - als Evidenz gegen die
Gültigkeit des genannten Verstärkungs-Gesetzes fungieren kann. Vielmehr wird man angesichts der augenscheinlichen »Unvernünftigkeit« des Unterlassens einer Handlung, für die
man belohnt worden ist, nach Gründen für das scheinbar abwegige Verhalten der Vp suchen.
Dabei mag man etwa in Erwägung ziehen, daß der als »positiver Verstärker« eingeführte Reiz
bei dieser besonderen Vp wirkungslos ist bzw. als »Strafreiz« wirkt, daß andere, nicht identifizierte Faktoren in der Reizkonstellation den Verstärkungseffekt überdeckt haben, daß die Vp
die Instruktion nicht begriffen hat, etc.: Man wird also - in der früher dargestellten typischen
Weise (vgl. S.37f) - die unpassenden empirischen Befunde durch Intentions- bzw. Prämissenspezifizierung weginterpretieren, weil man aufgrund des Implikationsverhältnisses der Wennund der Dann-Komponente der ursprünglichen Annahme diese aus logischen Gründen gar
nicht aufgeben kann.
Wenn nun also die allgemeinen »Gesetze« des instrumentellen bzw. operanten Konditionierens sich als BGMs explizieren lassen und ihr Verständnis als empirische Aussagen demnach
ein Selbstmißverständnis darstellt: Wie verhält es sich dann aber mit den vielfältigen experimentellen Einzelbefunden durch Variieren verschiedener Dimensionen der einschlägigen
Standardanordnung, insbesondere auf der Basis der berühmten Skinnerschen »Verstärkungspläne«? - Ich will auch hier nicht alle Einzelanordnungen und -resultate ausführlich durchdiskutieren. Vielmehr soll nur einer der spektakulärsten, auch bei praktischen Anwendungen
immer wieder herangezogenen Befunde von Ferster & Skinner (1957): erhöhte Löschungsresistenz bei intermittierender (d.h. nicht jedesmal, sondern nur in einer bestimmten Häufigkeit,
Rate, etc. als Verhaltenskonsequenz auftretender) Verstärkung, exemplarisch auf implizite
Begründungszusammenhänge hin untersucht werden. Dazu referiere ich wiederum zunächst
eine einschlägige Veranschaulichung aus der Literatur, diesmal Beispiele, die Lefrancois unter der Überschrift »Verstärkungspläne im täglichen Leben« in seinem verbreiteten Lehrbuch
»Psychologie des Lernens« (1986) angeboten hat:
Beispiel 1: »Ein Angler geht 22 Jahre lang zum selben Fluß angeln. Jedesmal, wenn er hingeht, fängt er mindestens 4 Fische (kontinuierliche Verstärkung). Nun, zu Beginn dieses
verschmutzungsbewußten Jahrzehnts, fängt er plötzlich keinen Fisch mehr (Entfernung der
Verstärkung). Nach vier erfolglosen Versuchen hängt er das Angeln an den Nagel (schnelle
Abschwächung nach kontinuierlicher Verstärkung)«. - »Beispiel 2«: «Ein anderer Mann hat
im selben Fluß auch 22 Jahre lang gefischt. Manchmal hat er dabei etwas gefangen, manchmal auch nicht. Es gab Jahre, da fing er in der ganzen Saison keinen einzigen Fisch. Aber es
kam auch vor, daß er an einem einzigen Tag bis zu 18 Forellen fing (intermittierende Verstärkung). Zu Beginn unseres verschmutzungsbewußten Jahrzehnts nun fing auch er keine Fische
mehr (Entfernung der Verstärkung). Am Ende dieses Jahrzehnts wird dieser Angler wahrscheinlich immer noch zum Fluß gehen (langsame Abschwächung, d.h. erhöhte Löschungsresistenz/K.H., nach intermittierender Verstärkung)« (S.40f).
Diese Beispiele sind, wie leicht zu sehen, - obwohl sie als Exempel für die empirische Wirkung kontinuierlicher bzw. intermittierender Verstärkung gemeint sind - tatsächlich Veranschaulichungen »vernünftigen« Verhaltens bei (vom Autor konstruierter) spezifisch residualer
Prämissenlage. Der erste Angler muß aufgrund seiner kontinuierlichen Fangerfolge davon
ausgehen, daß das Wasser bisher von (beißfreudigen) Fischen gleichmäßig bevölkert war. So
ist es von ihm nur »vernünftig«, beim Ausbleiben des Fangerfolges sehr bald nicht mehr zufällige Fehlschläge zu unterstellen, sondern anzunehmen, daß die Fische durch irgendeinen
systematischen Faktor verschwunden sind bzw. nicht mehr beißen, womit weitere Angelversuche sinnlos sind (die Möglichkeit, das Fischereiamt anzurufen, und nachzufragen, was mit
den Fischen im Fluß geschehen ist, wird ihm ja von Lefrancois nicht eingeräumt). Der zweite
Angler muß dagegen aufgrund seines andersartigen residualen Weltaufschlusses (als Hand-
12
lungsprämisse) annehmen, daß der Fluß mit Fischen, die sich in Rudeln bewegen, bzw. deren
Beißfreudigkeit auf unvorhersehbare Weise schwankt, bevölkert ist: Für diesen Fall erscheinen die Fangmißerfolge zunächst als nichts besonderes, sondern in der normalen Schwankung
der früheren Fangquoten und deren zeitlicher Verteilung liegend. So wäre es ziemlich »unvernünftig«, während er sonst bis zur nächsten Fangperiode weitergeangelt hat, gerade diesmal schon nach einigen erfolglosen Versuchen das weitere Angeln aufzustecken. Das Weiterangeln mag sich darüber hinaus aus dem In-Rechnung-Stellen eines Unsicherheitsbereichs
der bisherigen Schwankungen begründen (o.ä.). Typischerweise werden nun diese Beispiele
für alltägliche »Vernunftschlüsse« bei reduzierter Prämissenlage durch SR theoretische Termini wie »kontinuierliche« vs. »intermittierende Verstärkung« quasi als Anwendungsfälle
objektiver empirischer Lerngesetze mystifiziert, womit durch die Unterstellung einer mechanischen Wirkung der verschiedenen »Verstärkungspläne« auf das Verhalten dessen psychologisches Verständnis verhindert wird.
Gesamteinschätzung: Induktiv begründetes Lernen bei auf Gegebenheitszufälle reduziertem Realitätsaufschluß
Nachdem wir die Theorien des Klassischen und Instrumentellen Konditionierens als verborgene Begründungstheorien reinterpretiert haben, stellt sich für uns die Frage, mit welcher Art
von Begründungstheorien wir es dabei eigentlich zu tun haben. Welche speziellen theoretischen Verkürzungen ergeben sich daraus, daß von den lebenspraktischen Zusammenhängen
zwischen Daseinsumständen, Prämissen, Gründen und Handlungen, wie wir sie früher kategorialanalytisch gekennzeichnet haben, nur solche übrigbleiben, die sich aus den Konzepten des
klassischen bzw. instrumentellen Konditionierens explizieren lassen? Geht man dieser Frage
nach, so stellt sich heraus, daß von der bedeutungsvollen, in sich strukturierten Welt, aus der
die Prämissen für meine Handlungsbegründungen stammen und in die ich aufgrund meiner
begründeten Handlungsvorsätze verändernd hineinwirken kann, nur ganz begrenzte Aspekte
aus der SR-theoretischen Grundbegrifflichkeit reinterpretierbar sind: Bestimmte (vom Forscher eingeführte oder konstruierte) Wiederholungen der Konstellation von Einzelereignissen,
und zwar im Schema des Klassischen Konditionierens der CS als Antezedenz des US, und im
Schema des instrumentellen Konditionierens der Verstärkerreiz als Konsequenz einer bestimmten Handlung. Als Kriterium für derartige Verknüpfungen stehen dabei allein bestimmte Regelmäßigkeiten der zeitlichen Abfolge von CS und US bzw. Handlung und Handlungskonsequenz zur Verfügung. Die Bildung der Prämissen des Vorsatzes für eine künftige Handlung kann hier also nichts weiter sein als eine Extrapolation der bisher erfahrenen Ereignisabfolgen nach dem Motto »weil es bisher so war, wird es wieder so sein«. Als Indizien dafür
dienen entweder allmählich sich verdeutlichende Gleichförmigkeiten des bisherigen Miteinandervorkommens von CS und US bzw. Handlung und Handlungskonsequenz in der Zeitfolge oder (bei komplexeren »Verstärkungsplänen« o.ä.) einfache Reihenfortsetzungen bzw. der
Aufbau von »subjektiven Wahrscheinlichkeiten« über das Auftreten der zur Frage stehenden
Sequenz, etc. Man könnte die hier angesprochene Residualform des Lernens mithin - wenn
man unter »Induktion« die »Verallgemeinerung aus der Erfahrung« im Millschen Sinne versteht - als »induktives Lernen« bezeichnen.
Aus der Reduzierung der Zugangsmöglichkeiten zur Welt auf die Erfahrbarkeit zeitlicher
Verhältnisse voneinander isolierter Einzelereignisse ergibt sich, daß beim so gefaßten induktiven Lernen die auf solche Bedeutungsrudimente bezogene Prämissenbildung und die daraus
abgeleiteten Handlungsvorsätze inhaltlich weitgehend unfundiert sein müssen: Sicherlich
wird sich bei einem - nach der Kenntnisnahme hinreichend vieler Wiederholungen - allmählich der Eindruck verfestigen, der CS sei tatsächlich ein Signal für das Auftreten des US bzw.
man habe die jeweils folgende »Verstärkung« tatsächlich durch das eigene Handeln hervorgebracht. Dies ist aber nichts weiter als das Resultat subjektiver Kausalattributionen. Faktisch
hat man - was sich spätestens dann herausstellt, wenn die entsprechenden Sequenzen plötzlich
13
nicht mehr auftreten - keinerlei Einsicht in einen sachlichen Zusammenhang zwischen Signal
und Signalisiertem. Entsprechend hat man auch keinen Einblick in die Bedingungen, aufgrund
derer ggf. einer bestimmten Handlung eine »Verstärkung« bzw. »Belohnung« folgt: Die jeweilige Handlung und die daraufhin verabreichte Belohnung haben inhaltlich nichts miteinander zu tun, die Belohnung wie ihr Ausbleiben sind vom Standpunkt des Subjekts nichts als
ein bloßes blindes Faktum. Ebensowenig kann die Vp nach sachlichen Kriterien darauf
Einfluß nehmen: Der Umstand, daß ggf. bisher auf eine bestimmte Handlung die Belohnung
erfolgte, ist tatsächlich nicht das Resultat der Handlung, sondern für die Vp ebenfalls lediglich
ein undurchdringliches Zusammentreffen (das aus der Sicht des Experimentators etwa nach
entsprechenden, den Vpn verborgenen Verstärkungsplänen eingerichtet ist). Man kann mithin
das jeweilige Miteinandervorkommen von CS und US bzw. Handlung und Handlungskonsequenz als »Zufall« bezeichnen, nicht im Sinne des wahrscheinlichkeitstheoretischen Zufallsbegriffs, sondern im Sinne von »Gegebenheitszufällen«, die in ihrem Auftreten weder verständlich noch erklärlich sind, sondern einfach in ihrem Sosein hingenommen werden müssen. Induktives Lernen wäre so spezifiziert als Lernen von in diesem Sinne zufälligen Regelhaftigkeiten von Ereignisfolgen.
Die in der SR-Psychologie vollzogene Reduzierung in sich strukturierter sachlich- sozialer
Bedeutungszusammenhänge auf in Form von Gegebenheitszufällen angeordnete isolierte Einzelereignisse ergibt sich schon aus der kategorialen Eigenart der dabei benutz ten Grundbegriffe. So hat das Konzept des »Reizes« als psychologischer Basisbegriff (nicht nur) der SRTheorie zwar innerhalb der Physiologie, wo es um die Untersuchung physikalisch meßbarer
Einflußgrößen auf den Organismus geht, seinen guten Sinn. Was aber ist damit gewonnen, in
der Psychologie bestimmte, dem Individuum gegebene sachlich-soziale Bedeutungskonstellationen (etwa die in Steiners Beispiel benannte »Arztpraxis«) als »Reiz« bzw. »Reizkonstellation« zu bezeichnen? Man könnte versucht sein, darin lediglich eine der in der Psychologie
nicht seltenen wissenschaftsförmigen Terminologisierungen alltäglicher Tatbestände zu sehen. Bei genauerer Betrachtung zeigt sich jedoch, daß die psychologische Verwendung des
Reizbegriffs schon eine bestimmte Funktion hat, nämlich die, aus den jeweils als Reiz bezeichneten alltäglichen Bedeutungskomplexen nur bestimmte Aspekte »herauszuschneiden«,
andere aber auszuklammern und zu eliminieren: Wenn ich von einem Welttatbestand als von
einem »Reiz« rede, so berücksichtige ich ihn nur in seinen unmittelbaren Auswirkungen auf
den »Organismus«. »Reiz« ist ja eine Affektation der Körperoberfläche in ihren »sensiblen«
Zonen. Im Reizbegriff wird mithin die Außenwelt quasi in organismischen Termini ausgedrückt, die Welt wird nur als Inbegriff jeweils isolierter »Reizquellen« berücksichtigt, verschwindet mithin als in sich strukturierter Verweisungszusammenhang hinter den Einwirkungen, die von ihr auf den Organismus ausgehen (vgl. dazu die eindringende Kritik der Verwendung des Reizbegriffs in der Psychologie von Gundlach 1976).
Das gleiche gilt für die weiteren, als Spezifizierungen des Reizkonzeptes eingeführten SRpsychologischen Grundbegriffe. So sind etwa »Verstärkerreize« bestimmte Weltgegebenheiten nur unter dem Aspekt ihrer verhaltensändernden Wirkung auf den Organismus: Die unterschiedlichsten gesellschaftlichen Bedeutungszusammenhänge werden lediglich unter dem
nivellierenden Gesichtspunkt berücksichtigt, welche »Verstärkungskontingenzen« in ihnen
gegeben sind. Ihre weiteren sozialen und gegenständlichen Beschaffenheiten als Beziehungen
untereinander sind hingegen (obzwar für das Subjekt wichtig) für den auf individuelle Verhaltensänderungen fixierten Psychologen uninteressant. Auch die im Kontingenz-Begriff selbst
angesprochenen faktisch-zufälligen zeitlichen Anordnungen von Einzelereignissen sind direkte Implikate der Fassung der Umweltkontingenzen als »Reizkonstellation«, d.h. Inbegriff der
Wirkung isolierter unabhängiger Reizquellen auf den Organismus und deren Durchsetzung in
der experimentellen Realität.
Wenn man nun im begründungstheoretischen Kontext genauer danach fragt, in welchen alltäglichen Situationen jenseits der vom Forscher entsprechend eingerichteten experimentellen
14
Anordnungen das Subjekt tatsächlich induktive Lernprozesse im geschilderten Sinne vollziehen mag, so ergibt sich, daß die Konfrontation mit isolierten Gegebenheitszufällen, aus welchen man nur mittels induktiver Prämissengewinnung Handlungsvorsätze begründen kann,
eher zu den Sonder- oder Grenzsituationen des Alltags gehören. Normalerweise hat man es
von vornherein mit sachlich-sozialen Bedeutungskonstellationen zu tun, denen gegenüber
»Lernen« kaum als Verknüpfung zufälliger Elemente, sondern eher als irgendwie geartetes
Eindringen in die Strukturmerkmale solcher Konstellationen zu bestimmen wäre. Bestenfalls
mag man einräumen, daß gelegentlich beim Kontakt mit neuen Weltgegebenheiten zur Reduktion der ersten Unsicherheit induktive Orientierungsweisen begründet sein könnten: Dies
kann man aber »vernünftigerweise« lediglich als einen ersten vorläufigen Schritt betrachten,
der alsbald durch Lernaktivitäten, in denen die gegebenen realen Zusammenhänge erfaßt und
durchdrungen wer den können, zu überwinden ist.
Um die damit angesprochene Beschränkung zu veranschaulichen, sind die in der SRpsychologischen Literatur benannten Beispiele für Lernen im Alltag kaum geeignet, und zwar
deswegen, weil hier tendenziös solche Situationen ausgewählt wurden, die nach dem Muster
der benannten experimentellen Anordnungen konstruiert sind und demgemäß entsprechend
ausgedachte Grenz- und Sondersituationen verallgemeinern: So wird im angeführten AnglerBeispiel von Lefrancois dem Fischebeißen im Fluß, in den der Angler nicht hineinsehen kann,
einfach eine Verteilung der Fische gemäß dem Konzept der kontinuierlichen bzw. intermittierenden Verstärkung gesetzt, woraus dann die entsprechenden induktiven Alltagsschlüsse des
ersten bzw. zweiten Anglers verständlich werden. Im Steinerschen Beispiel wird die gleiche
Voraussetzung auf anderem Wege eingeführt, indem das Kind als »anderthalbjährig« dargestellt ist und so dessen Unverständnis sachlicher und sozialer Zusammenhänge innerhalb der
Lebenssituation »Arztpraxis« und Zurückgeworfensein auf die Orientierung an Koinzidenzen
zufälliger Merkmale und Ereignisse seinem geringen »Entwicklungsstand« angelastet werden
kann. Tatsächlich ist es kaum möglich, im Alltag, wie er (ohne entsprechende experimentelle
oder auch pädagogische Eingriffe, s.u.) vorgefunden ist, Beispiele zu finden, in denen die
Anwendungsvoraussetzungen für das Konzept des »induktiven Lernens« halbwegs erfüllt
sind, bei denen man also nicht zur Demonstration dieser Lernweise von wesentlichen Bestimmungen der jeweiligen Situation abstrahieren muß.
So habe ich (in einer Lehrveranstaltung) zur Veranschaulichung von Klassischem Konditionieren im Alltag das Lernen eines Autofahrers, auf das Bremslicht des vor ihm fahrenden Autos mit Bremsen zu reagieren, entsprechend zu schematisieren versucht:
US = schnelle Abstandsverringerung zum vorfahrenden Auto; UR = Bremsen auf Abstandsverringerung hin; CS = Bremslicht des vorfahrenden Autos; SR = Bremsen allein bei Wahrnehmung des Bremslichtes. Die Konditionierung käme demnach zustande durch das häufige
Auftauchen des Bremslichtes voranfahrender Wagen kurz vor der wahrnehmbaren Abstandsverringerung, also die Kontiguität zwischen US und CS. Dadurch wird der CS (Bremslicht)
zum »Signal« für den US. Betrachtet man jetzt noch die UR, das Bremsen auf die Abstandsverringerung (US) hin, als relativ festgelegte, »automatische« Notfallreaktion, die per Reizsubstitution nun auf den CS hin erfolgt und damit zur CR wird, so scheinen hier die Bestimmungen des Klassischen Konditionierens (i.w.S.) halbwegs erfüllt. Auch die BGM-Fassung
und Konzeptualisierung dieser Bestimmungen als Merkmale »induktiven Lernens« macht
weiter keine Schwierigkeiten: Die induktive Verallgemeinerung des Faktums der häufigen
Aufeinanderfolge der isolierten Ereignisse »Bremslicht« und »Abstandsverringerung« als
Prämisse für den Handlungsvorsatz, das nächste Mal schon auf das Licht hin zu bremsen,
scheint ohne weiteres als Fall von »vernünftigem« Handeln bei spezifisch reduziertem Umweltaufschluß einzuordnen.
Wenn man nun aber den Blick auf dieses Beispiel nicht durch die vorgefaßte Absicht, daran
das Klassische Konditionieren zu demonstrieren, fixiert, sondern die hier angeführte Situation
unvoreingenommen betrachtet, so wird schlagartig deutlich, daß bestenfalls ein total ahnungs-
15
loser Mitfahrer (am besten: von einem anderen Stern) die benannten »induktiven« Lernprozesse vollziehen mag, daß aber kein Autofahrer auf diesem Wege die Bedeutung des Bremslichtes lernt - schon deswegen nicht, weil er und sein Auto die Phase, in der sich die Verknüpfung zwischen Bremslicht und Abstandsverringerung in mehrfachen »Durchgängen« erst herstellt, wohl kaum unbeschadet überstehen würden. Tatsächlich lernt der Autofahrer (wenn er
es nicht schon vorher wußte) in der Fahrschule, daß das Leuchten des Bremslichtes kausal
durch den Bremsvorgang des vorfahrenden Autos hervorgerufen wird, weil das Auto vom
Hersteller im Einklang mit der Straßenverkehrsordnung (oder so) zum Zwecke der Verhütung
von Auffahrunfällen so gebaut worden ist. »Lernen« bedeutet hier also nicht Verknüpfung
zufälliger Einzelereignisse, sondern Erfassen eines bestimmten, in die Welt hineingebauten
und deswegen real vorfindlichen sachlichen Bedeutungszusammenhangs. Das Problem für
den Autofahrer ist hier demnach nicht der »induktive« Erwerb der Verknüpfung von Bremslicht und Abstandsverringerung, sondern höchstens - bei Einsicht in deren sachlichen Zusammenhang - die Umsetzung des darin begründeten Handlungsvorsatzes, also etwa die hinreichende Beachtung der Bremslichter und ggf. das rechtzeitige Treten der Bremse des eigenen Autos, etc. Darauf bezogene Lernprozesse sind aber mit dem Schema des Klassischen
Konditionierens (und des Konditionierungslernens überhaupt) nicht abzubilden.
Mit der Reduzierung der gegenständlich-bedeutungsvollen Welt auf isolierte Einzelereignisse
als Gegebenheitszufälle ist im Schema des Konditionierungslernens noch eine weitere gravierende Einschränkung des Weltbezugs der Individuen verbunden. - Gegenständliche Bedeutungen sind gemäß unseren Kategorialbestimmungen keine Handlungsdeterminanten, sondern
bloße objektive Handlungsmöglichkeiten, wobei das Individuum also prinzipiell immer die
Alternative des Nichthandelns oder Andershandelns hat (vgl. etwa GdP, S.233ff). In der SRPsychologie ist indessen - schon in der Bestimmung des elementaren kategorialen Begriffspaars »Reiz-Reaktion« - diese Möglichkeitsbeziehung auf eine einseitige Beziehung der Außendetermination des Lernens reduziert: Es wird davon ausgegangen, daß beim Individuum
angesichts bestimmter (vom Experimentator hergestellter) »Umweltkontigenzen« automatisch
bestimmte Verhaltensänderungen resultieren. Die Lesart, daß ein Individuum ja nicht notwendig auf eine bestimmte »Reizanordnung« mit dem »vorhergesagten« Verhalten antworten
muß, sondern dies nur tun wird, wenn es entsprechende Gründe dafür hat, ist hier also kategorial nicht in Rechnung gestellt, praktisch aber durch entsprechende Vorkehrungen ausgeschlossen.
Während man Tiere einfach in das Labyrinth oder die Skinnerbox hineinsetzen und damit den
Versuchsbedingungen unterwerfen kann, müssen bei menschlichen Vpn, damit diese sich der
Experimentalkonstellation aussetzen und darin verharren, besondere Vorkehrungen getroffen
werden: Dies ist normalerweise die - implizite, d.h. durch die Versuchsanordnung gesetzte
und/oder verbale, vom Experimentator gegebene — »Instruktion«, durch welche qua Konvention und/oder sozialem Druck theoretisch unreflektiert sichergestellt ist, daß das Subjekt im
Experiment auch bereit und willens ist etwa gemäß den »Anordnungen« (im doppelten Sinne)
des Experimentators zu »lernen«. Nur sofern die Vpn solchen Anordnungen folgen, sind die
Voraussetzungen z.B. der Anwendung des Konzeptes »Konditionierung« auf deren Verhalten
erfüllt.
Im Begründungsdiskurs bedeutet dies, daß die Grenz- und Sondersituationen, in welchen das
Subjekt mit »guten Gründen« so handelt, wie im Konditionierungsschema vorgesehen, nicht
nur durch den geschilderten extrem reduzierten Weltaufschluß, sondern darin auch durch eine
Konstellation gekennzeichnet ist, in welcher mir begründetermaßen nichts anderes übrigbleibt
als »nach Anordnung« zu »reagieren«, d.h. andere Handlungsalternativen als in Ansehung
meiner Interessen unbegründbar beiseitezulassen. So gesehen wäre das »induktive Lernen«,
sofern die dieses konstituierenden Versuchsbedingungen von der Vp zu Prämissen ihres begründeten Handelns gemacht werden, gleichzeitig ein Lernen unter (äußerem) Zwang.
16
Aufgrund der durch ein solches erzwungenes Lernen hergestellten scheinbaren Korrespondenz meines Verhaltens mit den Bestimmungen des SR-theoretischen Konditionierungsschemas sind - theoretisch wie durch die Versuchsanordnung - die intentionalen Zwischenglieder
zwischen Handlungsprämissen und Handlungsvorsätzen quasi stillgestellt; indem ich mich im
Experiment mithin so benehme, als ob ich nur aufgrund der eingeführt »Reizkonstellation«
tätig werde, täusche ich eine kurzschlüssig-direkte Verbindung zwischen meinen Prämissen
und Handlungen vor, die dann in der SR-Theorie als Verbindung zwischen »Reiz« und »Reaktion« abgebildet (d.h. für bare Münze genommen) wird. Mit der Verdrängung der intentionalen Zwischenglieder ist aber auch die Gegründetheit meiner Handlungsintentionen meinen
Lebens- und Verfügungsinteressen unsichtbar. Mithin kann, indem erzwungenes Lernen mit
Lernen überhaupt gleichgesetzt wird, die emotionale Wertung der jeweiligen Handlungsmöglichkeiten und ihrer Beschränkungen, also das Problem der subjektiven Voraussetzungen motivierten Lernens, hier gar nicht erst in den Blick geraten. Daraus ergibt sich, daß die SRTheorie - auch in ihrer begründungstheoretischen Reinterpretation - zur Klärung der emotional-motivationalen Aspekte des Lernens samt der mit der Lernintention oder Lernzumutung
etwa verbundenen Widersprüche und Konflikte vom Standpunkt des Subjekts nichts beizutragen hat.
SR-Theorien unter lerntechnologischem Aspekt: Manipulation von Begründungsprämissen zur Erzielung »gewünschten« Verhaltens
Der begründungstheoretische Gehalt SR-psychologischer Lerntheorien läßt sich unter einem
bestimmten Aspekt noch verdeutlichen, wenn man sich vergegenwärtigt, daß dabei nicht nur
auf das Faktum des Zusammenhangs zwischen Verstärkungskontingenzen und Verhaltensänderungen verwiesen ist, sondern Vorkehrungen benannt sind, mit denen man bestimmte »erwünschte« (»desired«, »appropriate«) Verhaltensweisen erzeugen bzw. unerwünschte bzw.
unangemessene Verhaltensweisen eliminieren können soll. So fungiert das Modell des Klassischen Konditionierens etwa als spezifisches Schema, mit dem Reaktionen auf unerwünschte
Reize eliminierbar oder in solche auf erwünschte oder mindestens neutrale Reize modifizierbar sein sollen. Auf diese Weise soll etwa bei Trinkern - nach dem Muster des erwähnten
»Kleiner-Albert-Experiments« (Watson & Rayner 1920) - die Schnapsflasche als CS bzw.
Signal für das Auftreten eines »aversiven« Reizes (etwa eines mittels Tablette hervorgerufenen schlechten Geschmacks) »gelernt« und so der Widerwillen gegenüber dem schlechten
Geschmack als UR zum Widerwillen gegen die Schnapsflasche als CR führen, etc. Das instrumentelle bzw. operante Konditionieren ist z.B. von Skinner als Mittel zur Erzeugung beliebiger tierischer oder menschlicher Verhaltensweisen durch entsprechende Einrichtung von
Verhaltenskonsequenzen konzipiert und (etwa mit der »Skinnerbox« bzw. mit Anordnungen
zur »programmierten Unterweisung« etc.) praktisch erprobt worden (daraus entstanden ja
mannigfache psychologische Anwendungsfelder, etwa als »Verhaltenstherapie« oder als
Schemata zur Verhaltensmodifikation in der Schulklasse). Dabei läßt sich der damit hervorgehobene lerntechnologische Aspekt der SR-Theorie keineswegs eindeutig von deren grundwissenschaftlicher Version trennen: Vielmehr ist die präskriptive Verwendung zur gezielten
Veränderung von Verhaltensweisen in gewisser Weise schon in der Struktur der SR-Theorien
und ihrer Standardanordnungen vorgeprägt und tritt in den benannten praktischen Anwendungen nur besonders deutlich hervor.
So gesehen ist die dargestellte kategoriale Reduktion sachlich-sozialer Bedeutungskonstellationen als individuelle Handlungsmöglichkeiten auf isolierte Gegebenheitszufälle ohne Handlungsalternativen nicht nur ein faktisches Implikat der SR-theoretischen Grundbegrifflichkeit,
sondern enthält gleichzeitig eine Handlungsanweisung an den psychologischen Forscher und/
oder Praktiker: Derartige Grenz- und Sondersituationen sollen als Zwangslagen hergestellt
werden, in denen besonders günstige Voraussetzungen für die Erzeugung von jeweils gewünschtem Verhalten bei den Individuen bestehen. So ist evident, daß Individuen, die sich in
17
eindeutigen sachlich-sozia len Lebenszusammenhängen finden und daraus die Prämissen für
in ihren Interessen gegründete Handlungsvorsätze / Handlungen gewinnen können, gegen
sachfremde Verstärkungspraktiken o.ä. weitgehend immun sein dürften. Demnach ist es nur
konsequent, wenn man zur »Verhaltensmodifikation« nach Möglichkeit solche Umgebungsbedingungen selegiert oder herstellt, in denen den Individuen möglichst geringer Realitätsaufschluß, insbesondere möglichst geringe Einsicht in übergreifende, handlungsrelevante
Weltzusammenhänge erlaubt ist, so daß die unter diesen Umständen gesetzten »Verstärkungen« als isolierte Einzelereignisse ihre Wirkung tun können, d.h. von den Individuen mangels
Alternativen zu Handlungsprämissen gemacht werden.
Manche der gesellschaftlich vorgefundenen »Umgebungen« erfüllen offensichtlich schon von
sich aus die Voraussetzungen für die Verunsicherung der Individuen. So meint Lefrancois
(1986): »Es ist tatsächlich nicht unzutreffend, eine Analogie zwischen einem Klassenzimmer
und einer Skinnerbox zu ziehen. In dieser Analogie ist der Lehrer der Versuchsleiter, d.h. er
kontrolliert die Verabreichung von Verstärkung und Bestrafung. Auf der anderen Seite sind
die Schüler die Ratten in der Skinnerbox» (S.46). Normalerweise aber müssen bestimmte therapeutische, pädagogische etc. »Environments« zu Zwecken der »Verhaltensmodifikation»
gezielt hergestellt werden; dies reicht vom Einbau bestimmter »Verstärkungskontingenzen» in
ansonsten vorgegebene »Umwelten» bis zur Schaffung spezieller, nach SR-theoretischen
Prinzipien aufgebauter Spezialschulen, -heime, -hospitäler etc. Als verunsichernde Bedingungen dienen dabei etwa »verarmte» Umgebungen, die den Individuen keine Gelegenheit zu
Handlungen außer den »erwünschten« geben, die Bereitstellung von Räumen, in denen die
Individuen zunächst von allen ihnen vertrauten und wertvollen Dingen, Befriedigungsmöglichkeiten o.ä. getrennt sind, wobei diese ihnen dann planmäßig als »Verstärkung« für gewünschtes Verhalten zurückgereicht werden, weiterhin gezielter kurzfristiger Entzug der
sonst angebotenen »Verstärkungen», das sog. »time-out», zur Erhöhung der Willfährigkeit
gegenüber den dann wieder gewährten Belohnungen etc.
Als konzeptuelle Grundlage für solche Praktiken der Schaffung verhaltensmodifikatorisch
günstiger Umgebungen wird etwa von Kanfer & Philips in ihrem klassischen Lehrbuch der
Verhaltenstherapie (1970) insbesondere das Skinnersche Schema das »operanten Konditionierens« empfohlen: »Its character as a content-free technology makes the operant model unusually well suited to the design of special environments for particular behavioral goals«. Dieses
operante Modell »formed the basis for construction of special therapeutic-educational or prosthetic (künstlichen/K.H.) environments in hospitals, schools, penal institutions, and other settings. In the same fashion, parents can be taught to revise reinforcement contingencies to
make the home a more constructive environment, that is, less likely to promote problematic
behaviors in family members« (S.318)
Damit verdeutlichen sich die den SR-Theorien inhärenten Begründungsmuster in ihrer spezifischen Struktur: Ich finde mich nicht nur in bestimmten Situationen drastisch reduzierten
Weltaufschlusses und demgemäß verengter Handlungsalternativen, sondern (mehr oder weniger bewußt) einem anderen Subjekt gegenüber, dessen Intentionen mit den meinen hinsichtlich kritischer Dimensionen in Widerspruch stehen und das durch die Manipulation meiner
Handlungsprämissen mir Gründe dafür liefern will, meine Intentionen den seinen anzugleichen. Man hat es hier also mit einem sozialen, genauer: interpersonalen, Arrangement zu tun,
in welchem der Experimentator bzw. Praktiker die Vp bzw. den Klienten quasi zu überlisten
versucht, wo bei die möglichen Ausflüchte und Tricks der anderen Seite in Rechnung gestellt
und neutralisiert werden müssen. Dies ist nicht nur meine Interpretation, sondern wird offensichtlich vom Standpunkt des Experimentators/ Praktikers auch so gesehen, indem hier die
Rede von »Strategien«, »Taktiken« o.ä., die gegenüber den Betroffenen zur Erzielung des
gewünschten Verhaltens in Anschlag zu bringen seien, weitgehend zur offiziellen Terminologie gehört.
18
In diesem technologischen Kontext ist etwa die Kategorie der »Verstärkung« (begründungstheoretisch betrachtet) vom Inbegriff realer Bedingungen/Prämissen für die Änderung von
Handlungsvorsätzen etc. zu einem Mittel in der Hand des Experimentators/Praktikers umakzentuiert, den Betroffenen Gründe für die Vernachlässigung ihrer eigenen Interessen zugunsten der Interessen des Psychologen und/oder Auftraggebers zu unterschieben. Das Verstärkungs-Konzept ist seinem theoretischen Gehalt nach für diese Funktion deswegen besonders
geeignet und universell einsetzbar, weil die Art der verabreichten »Verstärkungen« mit dem
Inhalt der jeweils zu modifizierenden Handlungen und den dabei zugrundeliegenden Interessen nichts zu tun hat. Als »Verstärkung« fungiert, unabhängig davon, was gerade »verstärkt«
werden soll, alles, von dem man annimmt, daß es von den Betroffenen begehrt, gemocht, geschätzt wird: Bei Kindern bevorzugt Süßigkeiten wie (besonders gut portionierbare) Gummibärchen oder Schokolinsen, ansonsten alles Beliebige, wenn es nur für das jeweilige Individuum begehrenswert ist - häufig vermittelt über die Ausgabe von »Tokens«, Spielmarken, als
»sekundären Verstärkern«, die gesammelt und in einer bestimmten Menge gegen »primäre
Verstärker« eingetauscht werden können. »Soziale Verstärker« stehen dabei funktional auf
der gleichen Ebene wie die bisher benannten »materiellen Verstärker«: »Freundlichkeit«,
»Zustimmung« oder auch das allfällige gezielte »Loben« von Kindern (»praising a child«
(Kanfer & Phillips 1970, S.364)) etc. Da ich hier dazu gebracht werden soll, meine eigenen
interessengegründeten Handlungsvorsätze/Handlungen um von außen gewährter Vergünstigungen willen zu modifizieren, und dabei mit gewissen bei mir hypostasierten Bedürftigkeiten, Schwächen etc. gerechnet wird, hat das taktische Verstärkungs-Arrangement - wie mir
scheint - etwas von einem Bestechungsversuch gegen über den Betroffenen an sich.
Entsprechend ist mit der Kategorie der »Extinktion« (als Gegenbegriff zu »Verstärkung«)
unter lerntechnologischem Aspekt nicht lediglich deskriptiv das Verschwinden einer Handlung mangels Verstärkung, sondern präskriptiv eine Technik, um unerwünschte Verhaltensweisen zum Verschwinden zu bringen, umschrieben. Kanfer & Phillips reden in diesem Sinne
von »Extinction as a Therapeutic Tactic« (1970, S.283). Eine besonders verbreitete Art der so
gefaßten »Extinktion« ist das Ignorieren von Bemühungen der Betroffenen, Beachtung, Zuwendung, sozialen Kontakt o.ä. zu erreichen (»ignoring inappropriate behaviors«/Kanfer &
Phillips, S.303): Unter der Annahme, daß diese unerwünschten Verhaltensweisen lediglich
das Resultat entsprechender sozialer »Verstärkung« sind, läßt man sie gezielt und vorsätzlich
unbeachtet, um sie so allmählich zu »löschen«. Der begründungstheoretische Hintergrund
dieser Taktik ist an einem von Steiner in dem schon erwähnten Lehrbuch angeführten weiteren Beispiel, diesmal unter der Überschrift »So bleibt Michael ein Störefried - Vom operanten
Konditionieren und den Tücken mit der Verstärkung« (1988, S.54ff) m.E. besonders eindrucksvoll zu veranschaulichen. Steiner stellt hier »Michael« als einen Schüler dar, der durch
allerlei unerwünschtes Verhalten die Beachtung der Lehrerin auf sich ziehen will und weist
darauf hin, daß diese, wenn sie auf Michaels Provokationen (und sei es mit Bestrafungen)
reagieren würde, dessen Störaktionen ungewollt begünstigen müßte: »Die Lehrerin verstärkt
ausgerechnet das unerwünschte Verhalten ihres Schülers, obwohl sie ganz sicher das Gegenteil beabsichtigt! Tücke der Verstärkung!!« (S.56). Sodann empfiehlt er als in diesem Kontext
angemessene Strategie der Lehrerin die Extinktion von Michaels Störaktivitäten durch deren
Ignorieren und erläutert dies auf folgende Weise:
»Was würde sich ereignen, wenn die Lehrerin nicht auf Michaels Störaktionen reagieren würde - mit keinem Ton, mit keinem Blick? Wenn sie sich so verhalten würde, als hätte Michael
nichts gesagt und nichts getan? Wenn das Verhalten von Michael nicht die geringste Reaktion
von seiten der Lehrerin zur Folge hätte? Das Ergebnis wäre für Michael negativ: weder soziale Zuwendung noch die Freude, die Lehrerin ‚im Griff‘ zu haben, noch Applaus von seiten
gewisser Kameraden. Wahrlich eine uninteressante Bilanz. Wozu eigentlich noch weitermachen? Hin und wieder ein Versuch vielleicht; aber auch dann: beharrlich keine Reaktion von
seiten der Lehrerin! Für Michael keine Chance auf Erfolg ... Michael würde höchstwahr-
19
scheinlich mit seinen Störmanövern aufhören, und wir hätten eine mustergültige Extinktion
vor uns« (Steiner 1988, S.57).
An diesen Formulierungen Steiners wird der im offiziellen Bedingtheitsdiskurs der SRPsychologie enthaltene implizite Begründungsdiskurs in spezifischer Weise deutlich: Man tut,
indem man das Konzept der »Extinktion« verwendet, zwar offiziell so, als ob das damit erreichte Verschwinden einer bestimmten Verhaltensweise der mechanische Effekt der einschlägigen Umweltkontingenzen wäre, wobei man aber, um das Zustandekommen dieses Effekts konkret verständlich zu machen, ungewollt (und notwendigerweise) in den Begründungsdiskurs fällt. Was Steiner hier tatsächlich empfiehlt, ist denn auch die Manipulation der
Handlungsprämissen des »Störefrieds« Michael in einer Weise, daß ihm keine Gründe für
sein »störendes« Verhalten mehr übrigbleiben - womit Michael dazu gebracht würde, seine
(sicherlich ungekonnt vorgetragenen) Intentionen, als Subjekt zur Kenntnis und ernstgenommen zu werden, gegenüber den Intentionen der Lehrerin nach störungsfreier Bewältigung
ihres Unterrichts »begründet« zurückzustellen.
Unser (damit abgeschlossener) Aufweis spezifischer Beschränkungen des SRpsychologischen Lernkonzeptes ist (wie erinnerlich) dadurch möglich geworden, daß wir die
SR-theoretischen Annahmen und Konzepte als implizite Begründungsmuster reinterpretierten
und dadurch mit unseren allgemeinen begründungstheoretischen Bestimmungen ins Verhältnis setzen konnten: Auf diesem Wege konnte dann gezeigt werden, daß die als allgemeine
Gesetze universalisierten SR-psychologischen Lernkonzepte tatsächlich nur auf Grenz- und
Sondersituationen menschlichen Lernens (Reduziertheit des Weltzugangs auf isolierte Gegebenheitszufälle mit eingeschränkten Handlungsalternativen) anwendbar sind, wobei die Herstellung derartig reduzierter und verarmter Situationen gleichzeitig »lerntechnologisch« zur
Prämissenmanipulation von Handlungsgründen ausgenutzt werden kann. Dabei hat sich allerdings auch der (prinzipiell ja selbstevidente) Umstand verdeutlicht, daß aus der begründungstheoretischen Reinterpretation zwar die benannten kritischen Konsequenzen, keineswegs damit aber auch schon über die aufgewiesenen Beschränkungen hinausgehende lerntheoretische
Konzepte zu gewinnen sind. Um in dieser Richtung voranzukommen, müssen vielmehr zu
nächst weitere, den SR-theoretischen Restriktionen wo möglich nicht in gleicher Weise unterworfene, traditionelle Lernkonzeptionen der begründungstheoretischen Kritik / Reinterpretation unterzogen werden - womit wir uns schrittweise einer Problemlage annähern, jenseits
derer die Weiterentwicklung subjektwissenschaftlicher Lernkonzepte nur noch durch eigene
theoretische Anstrengungen zu bewerkstelligen sein wird.