SOZIALE NORMEN UND REZIPROZITÄT – Die Bedeutung „sozialer“ Motive für die RationalChoice-Erklärung sozialer Normen In: Andreas Diekmann, Klaus Eichner, Peter Schmidt, Thomas Voss, Hrsg., 2008. Rational Choice. Theoretische Analysen und Empirische Resultate. Festschrift für Karl-Dieter Opp zum 70. Geburtstag. VS Verlag: Wiesbaden. Andreas Diekmann (ETH Zürich) Thomas Voss (Universität Leipzig) 2 Soziale Normen und Reziprozität Gliederung 1. Die Entstehung sozialer Normen 2. Die Sanktionierung abweichenden Verhaltens und das Problem der kollektiven Güter höherer Ordnung 3. Kooperation im Normspiel 4. Kooperation im Normspiel unter Bedingungen sozialer Präferenzen 5. Ausblick: Die Bedeutung von Reziprozität für den sozialen Zusammenhalt Literatur 3 Soziale Normen und Reziprozität 1. Die Entstehung sozialer Normen Informelle soziale Normen mit Sanktionen gehören zweifellos zu den wichtigen Bausteinen der sozialen Ordnung. Tatsächlich lautet eine der Grundannahmen des sogenannten „normativen Paradigmas“, für das insbesondere die Parsons-Tradition steht, dass gesellschaftliche Ordnung ohne eine verbindliche Anerkennung bestimmter Normen der Kooperation unmöglich entstehen bzw. stabil bleiben kann. Obwohl Normen so wichtig für die Generierung sozialer Ordnung sind, wurde das Problem der Entstehung sozialer Normen gegenüber dem der Untersuchung der Wirkungen bereits existierender Normen oder der Weitergabe bestehender Normen an nachfolgende Generationen (in der Sozialisation) in der Soziologie lange vernachlässigt. Viele Vertreter der „normativen Lösung“ des Ordnungsproblems setzen die Existenz ordnungsfördernder Normen stillschweigend voraus. Damit ergibt sich die Schwierigkeit, dass das Ordnungsproblem nicht wirklich gelöst, sondern nur auf eine andere Ebene verschoben wird: Geht man davon aus, dass Normen soziale Ordnung erzeugen, so muss – will man soziale Ordnung erklären -gezeigt werden, dass soziale Normen unter geeigneten Bedingungen tatsächlich entstehen. Dieses Desiderat ist allerdings in der Durkheim-Parsons-Tradition nicht erfüllt worden. Karl-Dieter Opp gehört zu den Autoren, die auf dieses Defizit frühzeitig aufmerksam machten und entscheidende Beiträge zur Erklärung sozialer Normen vorlegten (vgl. bereits Opp 1979, 1981; vgl. für neuere Beiträge Hechter und Opp 2001), die in einer Anwendung der individualistischen Theorie rationalen Handelns bestehen. Mittlerweile ist die Erklärung sozialer Normen, gerade auch aus Sicht der Theorie rationalen Handelns, zu einem multidisziplinären Forschungszweig geworden. Die Beiträge stammen von Philosophen (wie Ullmann-Margalit 1977; Bicchieri 1993), Soziologen und Politologen (wie Axelrod 1986; Coleman 1990; Baurmann 1997; Ostrom 2000; Bendor und Swistak 2001), von Juristen (Ellickson 1991, 2001; Posner 2000) und von Ökonomen (Young 1998; McMillan und Woodruff 2000). Ein gemeinsamer Grundgedanke der meisten dieser in Details differierenden Arbeiten ist, dass soziale Normen bestimmte effizienz- oder wohlfahrtssteigernde Wirkungen für die Menge der Nutznießer der Normen (Normbenefiziare) besitzen. Von diesen Akteuren (den Nutznießern) wird angenommen, dass sie rational und vorrangig eigeninteressiert handeln. Normen helfen, externe Effekte zu internalisieren; sie entproblematisieren soziale Dilemmata oder sie fungieren als Signale der Vertauenswürdigkeit eines Interaktionspartners und helfen damit indirekt, soziale Dilemmata zu überwinden. Beispielsweise zeigt Ellicksons ethnographische Studie über Shasta-County (1991), dass in einer ländlichen Gemeinschaft im Westen der USA soziale Normen der Kooperation unter Nachbarn entstanden sind. Die Normen entschärfen Konflikte zwischen Nachbarn, die durch materielle Schäden durch frei herumlaufendes Vieh ausgelöst werden oder geben Kostenteilungsregeln für die Errichtung von Zäunen zwischen benachbarten Ländereien an. Die Normen tragen zur Erhöhung der Wohlfahrt der Normnutznießer (d.h. sämtlicher in der Nachbarschaft ansässiger Landwirte) 4 Soziale Normen und Reziprozität bei, weil sie Situationen, die Ähnlichkeiten mit einem Gefangenendilemma haben, entschärfen, so dass tendenziell die kooperative Alternative gewählt wird. Coleman (1990: Kap. 10, 11) argumentiert, dass Erklärungen der Entstehung von Normen aus mindestens zwei Schritten bestehen. Erstens setzt Normentstehung eine Nachfrage der Nutznießer nach einer Norm voraus. Diese Nachfrage resultiert aus dem erwarteten Effizienzgewinn, also etwa einer Pareto-Verbesserung, die der allseitige Übergang von einer nichtkooperativen zu einer kooperativen Handlung hervorruft. Zweitens ist sozusagen ein Angebot erforderlich. Nicht jede Nachfrage nach einer Effizienzverbesserung trifft auf ein entsprechendes Angebot, weil die nachfrageerzeugende Situation ein soziales Dilemma enthält. Dieses liegt gerade darin, dass individuelle Rationalität zu kollektiver Suboptimalität führt. Die Überwindung dieses Dilemmas ist von bestimmten sozialen Bedingungen abhängig, die Coleman als Bedingungen der „effektiven Realisierung“ der kooperationsfördernden Norm bezeichnet (1990: Kap. 11). Die Frage nach den effektiven Bedingungen der Realisierung sozialer Normen führt auf die Überlegung, dass Sanktionen zu einer Überwindung des sozialen Dilemmas beitragen: Negative Sanktionen belegen unkooperatives oder normabweichendes Handeln mit Strafen, positive Sanktionen belohnen Normkonformität. Im Ergebnis ist die unkooperative Alternative weniger attraktiv. Bei hinreichend starken Sanktionen kann das Dilemma überwunden und Kooperation für den Normadressaten vorteilhafter als Nichtkooperation sein. Die Annahme rationalen und eigeninteressierten Handelns ergibt nun aber eine zusätzliche Schwierigkeit. Falls Sanktionen mit materiellen Kosten für den Sanktionsgeber verbunden sind, tritt ein Dilemma höherer Ordnung auf (Oliver 1980; Axelrod 1986; Yamagishi 1986; Heckathorn 1989; Coleman 1990: Kap. 11). Wenn Sanktionen wirksam angedroht werden, dann kann die Norm durchgesetzt werden. Was aber motiviert den Sanktionsgeber dazu, einen Beitrag (in Form von Kosten der Sanktionierung) zur Normdurchsetzung zu leisten? Die Sanktion hat aus der Sicht eines Sanktionsgebers möglicherweise Eigenschaften eines kollektiven Guts. Wenn die Sanktion produziert wird, dann ist die Norm durchgesetzt. Aber der Nutzen dieser Normdurchsetzung kommt allen Mitgliedern der Gruppe (der Nutznießer) zu Gute, nicht nur denjenigen, die sich an den Kosten der Sanktionierung beteiligt haben. Im Folgenden werden wir zunächst argumentieren, dass das Dilemma höherer Ordnung zwar grundsätzlich unter Bedingungen wiederholter Interaktionen überwunden werden kann (Abschnitt 2). Jedoch ist diese Erklärung informeller Normen aus empirischer Sicht nicht ganz befriedigend. Zunächst muss man sehen, dass die in gewöhnlichen wiederholten Dilemmata zur Verfügung stehenden indirekten Sanktionsmöglichkeiten nur zum Teil den Sanktionen entsprechen, die in empirischen Studien zur Normdurchsetzung beschrieben werden. Es müssen vielmehr (auch) direktere, aktive Bestrafungsmöglichkeiten untersucht werden. Diese können in einem durch die Bestrafungsoption erweiterten Dilemmaspiel, einem sogenannten „Normspiel“, das Gegenstand von Abschnitt 3 ist, dargestellt werden. Zum anderen gibt es nämlich Evidenzen, dass materiell kostenträchtige Sanktionen auch in einmaligen Dilemma-Situationen auftreten. Diese erstrecken sich auch auf das Normspiel. Deshalb wird in Abschnitt 4 am Beispiel des Normspiels diskutiert, ob Annahmen über „soziale Präferenzen“, die neben einer Orientierung an den materiellen eigenen Interessen auch die Auszahlungen anderer Akteure berücksichtigen, die Normdurchsetzung über Sanktionen in nicht-wiederholten Interaktionen erklären kann. 5 Soziale Normen und Reziprozität 2. Die Sanktionierung abweichenden Verhaltens und das Dilemma höherer Ordnung Informelle soziale Normen sind Regeln, zu deren Durchsetzung die Anwendung dezentral produzierter Sanktionen erforderlich ist. Ohne Beschränkung der Allgemeinheit und in Übereinstimmung mit dem üblichen Sprachgebrauch (vor allem der Weber-Geiger-PopitzTradition; vgl. Popitz 1980) beziehen wir uns auf negative Sanktionen, die bei Normabweichung eine Bestrafung (Auszahlungsminderung) auslösen. Den Regelbegriff verstehen wir im Sinne von Verhaltensregelmäßigkeiten, d.h. wir abstrahieren von kognitiven, emotiven oder imperativischen Aspekten, die in Explikationen des Normbegriffs viel diskutiert werden (z.B. Opp 2001; Jasso und Opp 1997), für die folgenden Überlegungen aber weitgehend unerheblich sind. Eine Nachfrage nach Normen tritt insbesondere auf, wenn die Menge der Nutznießer einer Norm sich in einer wiederkehrenden Interaktionssituation eines sozialen Dilemmas befindet. Eine ‚wiederkehrende’ Situation ist nicht gleichbedeutend mit einer ‚wiederholten’ Situation, weil im ersten Fall wechselnde Partner beteiligt sein können, so dass es sich – spieltheoretisch gesprochen – um einmalige Situationen handeln kann. Ein soziales Dilemma ist eine Interaktionssituation, die bei rationalem Handeln einen suboptimalen Ausgang ergibt. Beispiele für Normen, die eine Nachfrage nach Effizienzgewinnen bedienen, lassen sich leicht aufzählen: Normen der Aufwandsbeschränkung in betrieblichen Arbeitsgruppen (Homans 1950) oder vergleichbaren Gruppen (wie Schulklassen); Normen guter Nachbarschaft im Sinne Ellicksons (1991); Normen honorigen Verhaltens im Geschäftsleben (Macaulay 1963; McMillan und Woodruff 2000), usw. In diesen Beispielen geht es um soziale Dilemmata, etwa ein klassisches Zweipersonen Gefangenendilemma oder ein einseitiges Gefangenendilemma (Vertrauensspiel), ein Mehrpersonen Gefangenendilemma oder eine Situation der Kollektivgut-Produktion. Natürlich wäre es unsinnig zu behaupten, dass sämtliche soziale Normen als Lösungen von Dilemmata zu erklären sind. Zweifellos sind mit einigen Normen keine direkten Effizienzgewinne, sondern sogar Effizienzverluste verbunden, z. B. mit Normen der Etiquette (vgl. Elster 1989). In diesen Fällen sind andere, mit der Rational-Choice-Theorie kompatible Mechanismen zur Erklärung (z.B. über Signaling) nahe liegend (Posner 2000), die wir hier nicht näher diskutieren wollen. Wir wollen im Folgenden auch Konventionen, die Koordinationssituationen entproblematisieren, aus unserer Betrachtung ausschließen. Um die theoretische Analyse zu erleichtern, gehen wir davon aus, dass die wiederkehrende Situation als klassisches Gefangenendilemma dargestellt werden kann (vgl. Abb. 1). 6 Soziale Normen und Reziprozität Spieler 2 C D C R, R S, T D T, S P, P Spieler 1 T>R>P>S Abb. 1: Das klassische Gefangenendilemma Es ist bekannt, dass ein unbestimmt häufig wiederholtes Spiel bedingte Strategien erlaubt, die bei hinreichend großem Diskontfaktor bzw. „Schatten der Zukunft“ (Axelrod) zu wechselseitiger Kooperation führen. Eine besonders einfache Strategie im wiederholten Gefangenendilemma ist die Trigger-Strategie, die freundlich beginnt und ab der zweiten Runde solange kooperiert, wie in allen voran gegangenen Runden kooperiert wurde. Eine Defektion löst „ewige Verdammnis“, d.h. Defektion aus. In einem klassischen Gefangenendilemma existiert ein Nash-Gleichgewicht wechselseitiger Trigger-Strategien, falls der Diskontfaktor einen kritischen Wert übersteigt. Inhaltlich ist die Trigger-Strategie mit einer bestimmten indirekten Sanktion bzw. Sanktionsdrohung verbunden: Eine Defektion wird mit immerwährenden Defektionen bestraft. Elementaren Rationalitätskriterien zufolge ist es wichtig zu untersuchen, ob diese Sanktionsdrohungen glaubwürdig sind. Dazu muss die Teilspielperfektion des Gleichgewichts betrachtet werden. Ein Gleichgewicht ist teilspielperfekt, wenn es auch in sämtlichen (im Gleichgewicht: auch kontrafaktischen) Spielgeschichten, die durch eine Abweichung vom Gleichgewichtspfad (den die Kombination der Nash-Gleichgewichtsstrategie vorgibt) entstehen, keine positiven Anreize für den Spieler gibt, von der Strategie abzuweichen. Eine Abweichung vom Gleichgewichtspfad wäre im Fall der Trigger-Strategie gegeben, wenn ein Spieler defektiert. Diese Defektion löst ab der nächsten Runde fortwährende Defektionen aus. Offenkundig ist eine Defektion im stage-game (Basisspiel) des wiederholten Gefangenendilemmas deshalb Teil einer Gleichgewichtsstrategie, weil Defektion im stage-game dominant ist. Der betreffende Spieler könnte seine Situation durch die Abweichung zur Kooperation nur verschlechtern. Die Drohung mit der indirekten Sanktion der Defektion ist also glaubwürdig. 7 Soziale Normen und Reziprozität Damit ist der Nachweis skizziert, dass im wiederholten Gefangenendilemma bei hinreichend großem Diskontfaktor Normen der Kooperation aufrecht erhalten werden können, indem die Akteure Trigger-Strategien verwenden. Ein Kollektivgut-Problem höherer Ordnung tritt nicht auf, weil die indirekten Sanktionsdrohungen, die in der Trigger-Strategie enthalten sind, unter der Bedingung wiederholter Interaktionen glaubwürdig sind. Zwei Bemerkungen sind zur Abrundung des Resultats angezeigt: Erstens bedeutet dieses Ergebnis nicht, dass alle bekannten Strategien, die im wiederholten Spiel zu Kooperation führen, ebenfalls kein Problem höherer Ordnung beinhalten. Die Tit for Tat-Strategie (Axelrod 1987) beispielsweise ist nur unter speziellen Bedingungen teilspielperfekt, weil sie von den Spielern verlangt, außerhalb des Gleichgewichtspfads auch ein Muster von wechselseitigen Kooperationen und Defektionen zu unterstützen [Spieler 1:(C, D, C, D, ...); Spieler 2: (D, C, D, C, ...)]. Dies aber erfordert vom Tit for Tat-Spieler die Bereitschaft zu kooperieren während der Partner defektiert. Zweitens gibt es neben der Trigger-Strategie eine Vielzahl anderer, z.T. komplizierterer Regeln, die teilspielperfekte Gleichgewichte bilden, darunter auch solche, die im Ergebnis ungleiche (aber gegenüber wechselseitiger Defektion effizienzsteigernde) Verteilungen hervorbringen (so dass einer der Akteure eine gewisse Zahl Defektionen des Partners hinnimmt, während sie selbst kooperiert). Um diese Gleichgewichte durchzusetzen, bedarf es unter Umständen komplizierter Bestrafungsregimes, die intuitiv gesprochen eine ‚Metanorm’-Struktur (im Sinne von Axelrod 1986; Bendor & Swistak 2001) aufweisen: Jede Abweichung wird durch Bestrafung beantwortet; jemand, der die Anwendung der Bestrafung verweigert, wird seinerseits dafür bestraft; wer sich weigert, verweigerte Bestrafungen zu sanktionieren, wird wieder sanktioniert, usw. Anders als der erste Eindruck nahe legt, ist in diesen Strategien kein unendlicher Regress enthalten, der Kreis kann (formal) geschlossen werden. In einem Zwei-Personenspiel kann es dazu erforderlich sein, dass ein Spieler bereit sein muss, sich selbst zu bestrafen, wenn er es versäumt, den defektierenden Partner geeignet zu sanktionieren (vgl. Binmore 1998: 304; 310-313 für das Beispiel der modifizierten „Humpty-Dumpty-Strategie“, das diese Eigenschaften illustrieren kann). Dass es möglich ist, mit Hilfe solcher Bestrafungsstrategien beliebige Auszahlungskombinationen in einem wiederholten Spiel als Ergebnisse teilspielperfekter Nash-Gleichgewichte zu realisieren, ist Inhalt eines Folktheorems (Fudenberg und Maskin 1986; vgl. auch Binmore 1998: 293-313). Gegen diese – formal konsistent beschreibbaren Bestrafungsstrategien mit Metanorm-Struktur lässt sich einwenden, dass sie mit jeder realistischen Verhaltens- oder Kognitionstheorie unvereinbar ist (so sinngemäß Elster 1989:105; Bendor und Swistak 2001: 1514). Man muss jedoch einerseits bedenken, dass in Mehrpersonen-Interaktionen durchaus eine Hierarchie von Bestrafungsstrategien nach dem Muster totalitärer Überwachungsstaaten empirisch nicht unplausibel ist (Binmore 1998). Zum anderen ist klar, dass eine komplexe und prima facie kontra-intuitive Metanorm-Struktur vor allem in abstrakten Existenzbeweisen der Folktheoreme berücksichtigt werden muss; in Erklärungen empirischer Normstrukturen geht es aber weniger um solche Existenzbeweise, sondern um Folgerungen aus empirisch fundierten Annahmen über (kognitiv einfache) bedingte Strategien, die die Akteure in einem wiederholten Spiel tatsächlich verwenden. Der Komplexitätsgrad der untersuchten Strategien ist in der Regel geringer (wie z.B. in der Trigger-Strategie). Die Untersuchung wiederholter einstufiger Dilemmata ergibt wichtige Einsichten für eine Lösung des Kollektivgutproblems höherer Ordnung. Dennoch werden entscheidende Merkmale der empirischen Situationen, in denen Normen durchgesetzt werden, nicht abgebildet. Ethnographische und andere empirische Evidenzen zur Sanktionierung von Kooperationsnormen verdeutlichen, dass direktere, aktivere Sanktionen als der Entzug der eigenen Kooperationsbereitschaft angewandt werden: Entzug sozialer Anerkennung, 8 Soziale Normen und Reziprozität Ermahnungen, verschiedene Formen physischer Vergeltung, sozialer Ausschluss usw. (vgl. Boehm 1984; Coleman 1990: Kap. 10; Ellickson 1991; Sober und Wilson 1998). Diese müssen durch eine zweistufige Dilemma-Situation mit einer zusätzlichen direkten Bestrafungsoption modelliert werden. 3. Kooperation im Normspiel Wir untersuchen nunmehr die vermutlich einfachste mögliche Darstellung der oben beschriebenen Situation, das Normspiel (Voss 1998; 2001). Es handelt sich um ein Gefangenendilemma (wie oben in Abb. 1) mit einer zusätzlichen Bestrafungsoption. Die Bestrafungsoption beinhaltet die Möglichkeit, den Partner nach Abschluss der Gefangenendilemma-Interaktion direkt zu sanktionieren. Ein Spieler, der die Bestrafungsoption zur Anwendung bringt (s), wendet, so wird angenommen, Kosten der aktiven Sanktionierung in Höhe von k auf. Der Partner, auf den die Bestrafung sich richtet, erhält eine um das Ausmaß der Bestrafung p reduzierte Auszahlung. Die Auszahlungen beider Spieler ergeben sich nach Abschluss der Gefangenendilemma- und der Bestrafungsphase als Summe der Ergebnisse beider Phasen. Ein Spieler, der einseitig defektiert und von seinem Partner sanktioniert wird, erhält also eine Auszahlung T-p, sein kooperierender und sanktionierender Partner dagegen kommt auf S-k. Abbildung 2 zeigt eine Teilmenge des Spielbaums eines Normspiels für den Fall, dass ein Spieler einseitig kooperiert. Anmerkungen: - Abbildung basiert auf dem Normspiel von Voss (1998, 2001) - Auszahlungen vom Gefangenendilemma: T für einseitige Defektion, R für beidseitige Kooperation, P für beidseitige Defektion, S für einseitige Kooperation - Sanktionskosten: Sanktionierungskosten k, erhaltene Strafe p Abb. 2: Reduziertes Gefangenendilemma-Normspiel Das Normspiel unterscheidet sich von einem einfachen Gefangenendilemma in der Hinsicht, dass bereits in der one-shot-Variante grundsätzlich Kooperation möglich wird. Es existiert nämlich ein Nash-Gleichgewicht wechselseitiger Kooperation, falls gilt: p ≥ T-R. Wenn die Kosten der (passiven) Bestrafung mindestens so hoch sind wie der Vorteil aus der einseitigen Defektion (T-R), lohnt es sich nicht zu defektieren. 9 Soziale Normen und Reziprozität Ein weiteres offensichtliches Ergebnis einer spieltheoretischen Analyse des Normspiels ist allerdings (vgl. Voss 2001), dass ein Nash-Gleichgewicht wechselseitiger Kooperation nur dann teilspielperfekt sein kann, wenn k ≤ 0, d.h. wenn es keine Kosten der (aktiven) Sanktionierung gibt. Mit anderen Worten ist eine (stillschweigende) Drohung, den Partner für Nichtkooperation zu bestrafen, unglaubwürdig, sofern die Sanktionierung dem Sanktionsgeber Kosten abverlangt (k>0). Für das Kollektivgutproblem höherer Ordnung können wir folgendes Resultat festhalten: In einem one-shot Normspiel existiert kein teilspielperfektes Nash-Gleichgewicht wechselseitiger Kooperation, wenn die aktiven Sanktionierungskosten positiv sind (k>0). Am Rande sei bemerkt, dass auch für das wiederholte Normspiel auf Grund der Folktheoreme eine Lösung des Problems höherer Ordnung bei positiven Sanktionierungskosten möglich ist. 4. Kooperation im Normspiel unter Bedingungen sozialer Präferenzen Zweifellos ist die Bedingung wiederholter Interaktionen für die Durchsetzung informeller Normen sehr wichtig. Ellicksons (1991: Kap. 10) bekannte Hypothese über die Entstehung wohlfahrtsmaximierender Normen besagt, dass eine close-knit community dezentral effizienzsteigernde soziale Normen durchsetzen kann. Diese Hypothese beruht auf dem Gedanken, dass dichte, geschlossene Gruppen und Gemeinschaften annähernd solche sozialen Bedingungen verwirklichen, die in der Theorie wiederholter Spiele für die Existenz Paretooptimaler Nashgleichgewichte genannt sind (vgl. hierzu auch allgemein Raub und Voss 1986): Die Gruppengröße ist gering, jeder kann jeden beobachten und jeder erwartet, dass man mit den anderen Gruppenmitgliedern unbestimmt lange interagiert. Dennoch verweisen viele Autoren auf anekdotische Evidenzen, dass soziale Normen auch dann durch Sanktionen gestützt werden, wenn die Interaktion, in der das normativ geregelte Verhalten auftritt, einmalig ist, so dass sich Sanktionsgeber und Sanktionsempfänger nicht wieder treffen (z.B. Coleman 1990: 245). Wir erleben alle im Alltag solche Situationen, z.B. in Warteschlangen oder im Autoverkehr, wo die Norm fairen Verhaltens („Man soll sich nicht vordrängeln“) durch für den Sanktionsgeber gelegentlich kostenintensive Sanktionen durchgesetzt wird. Darüber hinaus belegen Laborexperimente die Wirksamkeit von Bestrafungsoptionen für die Erhöhung der Kooperationsbereitschaft: Fehr und Gächter (2000a) zeigen an einem Kollektivgutspiel mit zusätzlicher Option der Bestrafung, dass (1) die durchschnittliche Kooperationsrate (gemessen über den Anteil der Anfangsausstattung an Ressourcen, die in das kollektive Gut individuell investiert wird) im Vergleich zu einem Kollektivgutspiel ohne Bestrafungsoption erheblich höher ist; (2) dass kostspielige Strafen tatsächlich gewählt werden – überwiegend vis à vis Akteuren mit geringer Kooperationsbereitschaft. Diese Resultate beziehen sich auf one-shot-Spiele, in denen die Wahl einer Bestrafungsoption auch dem Sanktionsgeber materielle Kosten auferlegt. Es zeigt sich, dass auch in weiteren, strukturell ähnlichen Interaktionssituationen „altruistische“ Sanktionen gewählt werden, die zwar einen Beitrag zum kollektiven Gut (zweiter Ordnung) „Sanktionierung eines Normabweichlers“ leisten, dem Sanktionsgeber aber keine materiellen Vorteile, sondern sogar Nachteile verschaffen (Fehr und Fischbacher 2004). Es liegt nahe, dass auch im einfachen Zwei-Personen-Normspiel analoge experimentelle oder andere Ergebnisse erzielt werden können (Voss und Vieth 2006). 10 Soziale Normen und Reziprozität Es muss bedacht werden, dass die Existenz „altruistischer“ Bestrafungen, die materielle Kosten auch dem Sanktionsgeber abverlangen, zunächst vor allem unter der Annahme problematisch und erklärungsbedürftig ist, dass die Auszahlungen der Akteure ausschließlich durch materielle Anreize bestimmt sind. Diese Annahme einer Maximierung des materiellen Eigennutzes kennzeichnet das, was Karl-Dieter Opp (z.B. 1999) als „harte“ Version der Rational-Choice-Theorie beschrieben hat. Die erwähnten empirischen Evidenzen sind ein weiterer Hinweis dafür, dass diese „harte“ Variante, die unbestreitbaren Vorzug der größeren Sparsamkeit der Annahmen und der besseren Überprüfbarkeit besitzt, sehr fragwürdig ist. Wir fragen im folgenden, ob eine „weiche“ Variante der Rational-Choice-Theorie, die auch nicht-materielle Anreize als Argumente der Nutzenfunktion berücksichtigt, zu einer Erklärung von Kooperation im one-shot-Normspiel beitragen kann. Innerhalb der neueren experimentell orientierten Spieltheorie („Behavioral Game Theory“) werden derzeit verschiedene Modelle für Präferenzen diskutiert, die Nicht-Standardannahmen entsprechen. In den meisten dieser Überlegungen geht man von Ideen der klassischen Soziologie und Kulturanthropologie aus, die den sozialen Aspekt von Motiven betonen: Akteure bewerten ihre eigenen materiellen Ausgänge anhand eines Vergleichsmaßstabs, der aus den Ergebnissen von Akteuren einer Bezugsgruppe gebildet wird. Unter Anspielung auf Adam Smith’ Theory of Moral Sentiments argumentiert Frank (1992), dass Menschen über die Disposition verfügen, bestimmte emotionale Reaktionen zu aktivieren, wenn ihre Partner defektiert (und demnach höhere materielle Auszahlungen als sie selbst erreicht) haben. Diese Dispositionen können Drohungen, materiell unvorteilhafte Strafen anzuwenden, grundsätzlich glaubwürdig und entsprechend wechselseitige Kooperation (auch im one-shot-Spiel) zu rationalem Verhalten machen. Auch die Idee der Reziprozität ist ursprünglich in der älteren sozialtheoretischen Tradition vorgeschlagen worden. Sie spielt in neueren Beiträgen eine entscheidende Rolle bei der Erklärung von Kooperation (vgl. z.B. Fehr und Gächter 2000b): Positive Reziprozität liegt vor, wenn freundliches Verhalten erwidert wird. Ein Grenzfall wäre bedingte Kooperation, d.h. die Erwiderung kooperativen Verhaltens des Partners. Von Reziprozität würde man in solchen Fällen bedingter Kooperation sprechen, in denen weder das freundliche Verhalten noch die kooperative Antwort den materiellen Eigeninteressen im Sinne der spieltheoretischen Rationalitätskriterien entsprechen. Negative Reziprozität wäre gegeben, wenn ein Spieler unkooperatives Verhalten durch Vergeltung beantwortet. Der nichttriviale Aspekt vergeltender Reaktionen liegt vor, wenn eine Bestrafung materielle Kosten auslöst, die nicht durch zukünftige individuelle Gewinne kompensiert werden. Reziprozität ist zunächst nicht mehr als ein Begriff, der ein beobachtbares, aber erklärungsbedürftiges Verhaltensmuster beschreibt. Mittlerweile liegen zahlreiche, mit Rationalitätsannahmen vereinbare Modelle reziproken Verhaltens in strategischen Interaktionen vor (vgl. z.B. Camerer 2003), die es erlauben, reziprokes Verhalten aus Rationalitätsannahmen zu erklären. Hier greifen wir auf zwei bekanntere und analytisch einfach handhabbare Modelle zurück: Das FCC-Modell (FCC steht für Fairness, Cooperation und Competition) von Fehr und Schmidt (1999) und das ERC-Modell (ERC steht für Equity, Reciprocity und Competition) von Bolton und Ockenfels (2000). Beide Modelle gehen von dem Gedanken aus, dass die Nutzenfunktion eines Akteurs sich aus einer Komponente, die das individuelle materielle Eigeninteresse repräsentiert und einer zweiten Komponente, die soziale Vergleichsaspekte darstellt, zusammensetzt. Gegenstand der Nutzenfunktion (die als von Neumann-Morgenstern-Nutzenfunktion gedacht werden kann) sind materielle Ausgänge xi . Diese Ausgänge lassen sich als materielle Ergebnisse eines spieltheoretischen Experiments interpretieren, z.B. in Form von Geldeinheiten. Es ist wichtig zu beachten, dass 11 Soziale Normen und Reziprozität diese Ausgänge nicht mit den Auszahlungen (Payoffs) der Standard-Spieltheorie verwechselt werden. In der klassischen Spieltheorie beziehen die Payoffs sämtliche materielle und immaterielle Belohnungen (so wie der Akteur sie im Lichte seiner Präferenzen einstuft) mit ein (vgl. z.B. Harsanyi 1977). Wird der Ausgang in Geldeinheiten dargestellt, so gilt weiterhin (im Unterschied zu den Payoffs), dass eine Messbarkeit auf Ratioskalenniveau und ein sinnvoller interpersoneller Vergleich möglich werden. Wir beginnen mit einer Beschreibung und Anwendung des FCC-Modells, die wir auf den hier relevanten Zwei-Personen-Fall beschränken. Nach diesem Modell setzt sich der Nutzen ui (xi) zusammen aus einer materiellen Komponente xi. (der Höhe der monetären Auszahlung im Experiment, z.B.) und zweitens einer „Neid“- und einer „Scham“-Komponente. „Neid“ tritt auf, wenn Akteur i im Vergleich zu seinem Partner j eine materielle Schlechterstellung wahrnimmt, also wenn gilt: xj > xi. Das Ausmaß des empfundenen Neids hängt von einem Parameter αi ab, der individuenspezifisch ist. Umgekehrt kann eine Person „Scham“ empfinden, wenn sie besser gestellt wird als ihr Partner, sofern ein zweiter Parameter βi größer als Null ist. Das Modell spezifiziert die Nutzenfunktion des Akteurs i wie folgt: (1) (FCC) ui(xi) = xi – αi max {xj – xi; 0} – βi max {xi – xj; 0}. Dabei gilt: 0 ≤ βi < 1; βi ≤ αi . Inhaltlich kann dies als Darstellung einer Neigung der Ungleichheitsaversion interpretiert werden, deren Ausmaß von den beiden individuenspezifischen Parametern abhängt. Je stärker die Ungleichheit und die individuelle Gewichtung der sozialen Nutzenaspekte, desto größer die Minderung des Nutzens. Dabei gilt, dass die „Scham“-Komponente geringer ausgeprägt ist als die „Neid“-Komponente. Die Neid-Komponente ist nach oben nicht beschränkt. Das FCC-Modell kann auf das Normspiel angewendet werden, wenn Informationsannahmen eingeführt werden. Grundsätzlich kann die Situation unvollständiger Information betrachtet werden, so dass die Akteure zwar die eigenen Präferenzen kennen, hinsichtlich ihrer Partner jedoch nur die Wahrscheinlichkeitsverteilung der Parameter αj und βj in der Population (vgl. Fehr und Schmidt 1999). Wir beschränken uns zunächst auf die wesentlich einfachere Situation vollständiger Information über die Präferenzen. Es ist leicht zu sehen, dass unter der Annahme von FCC-Präferenzen unter geeigneten Bedingungen die Situation auftreten kann, dass Kooperation im Normspiel deshalb entsteht, weil bereits ohne Sanktionsmöglichkeit kooperiert wird. Spieler 2 C D C R, R S-α(T-S), T-β(T-S), D T-β(T-S), S-α(T-S) P, P Spieler 1 T>R>P>S 12 Soziale Normen und Reziprozität Abb. 3: Gefangenendilemma mit sozialen Präferenzen Gehen wir von einem Normspiel mit den Gefangenendilemma-Ausgängen T>R>P>S und vollständiger Information aus, wobei wir soziale Präferenzen nach dem FCC-Modell (1) berücksichtigen (Abb. 3). Kooperation ist dann für hinreichend starke soziale Präferenzen der Fairness möglich. Falls nämlich für i ∈{1,2} (2) βi ≥β* :=(T-R)/(T-S), so wird das Normspiel in der ersten Stufe zu einem Assurance-Spiel. Ein Assurance-Spiel besitzt in reinen Strategien zwei Nash-Gleichgewichte, wechselseitige Kooperation und wechselseitige Defektion. Daraus resultiert eine Art Koordinations- oder Gleichgewichtsauswahl-Problem und die Rolle „kultureller Überzeugungen“ (Greif 1994): Wenn ego erwartet, dass alter kooperiert, dann ist es egos beste Antwort ebenfalls zu kooperieren. Es entsteht also bedingte Kooperation oder positive Reziprozität. Die folgende Überlegung verdeutlicht die Vorteile von Sanktionsmöglichkeiten gegenüber dem einstufigen Assurance-Spiel. Diese bestehen darin, dass das Koordinationsgleichgewicht in Stufe 1 (beiderseitige Kooperation) durch Sanktionsdrohungen durchgesetzt wird. Das unterstützt Kooperationsnormen auch dann, wenn es keine Anreize zur Defektion gibt. Gegeben sei ein Normspiel mit den Gefangenendilemma-Ausgängen T>R>P>S und vollständiger Information, dann gibt es für βi≥β* (für i=1,2) und hinreichend großes αi ein teilspielperfektes Nash-Gleichgewicht, das für beide Spieler vorschreibt in Stufe 1 zu kooperieren und in Stufe 2 Defektionen zu sanktionieren. Ein Beweis lässt sich wie folgt skizzieren. Dass beide Spieler in Stufe 1 kooperieren, ergibt sich aus der Annahme βi≥β*. Es bleibt zu untersuchen, was (kontrafaktisch) geschieht, falls eine Defektion auftritt. Für festes p, k (p=p(k)) mit p>0, k>0 und p≠k gilt, dass Spieler i bereit ist, den Partner negativ zu sanktionieren, wenn (3) S− k − α [(T−p)−(S−k)] ≥ S − α (T− S) ⇒ αi≥ k/(p−k). Weiterhin lässt sich zeigen, dass im Normspiel teilspielperfekte Nash-Gleichgewichte existieren, so dass auch ein rationaler Egoist kooperiert, sofern ein an Fairness orientierter Spieler bereit ist, Defektion zu sanktionieren. Zum Beweis betrachten wir ein Paar von Strategien σ mit σ = (Spieler 1: Kooperiere in Stufe 1; sanktioniere nie in Stufe 2. Spieler 2: Kooperiere in Stufe 1; sanktioniere in Stufe 2, falls Spieler 1 defektiert hat, sonst sanktioniere nicht). Spieler 2 sei fairnessorientiert mit β2≥β*. Spieler 1 ist rationaler Egoist mit α1=β1=0. Falls p ≥ p*:= T−R (Spieler 1 wird hinreichend stark sanktioniert), besitzt Spieler 1 einen Anreiz zur Kooperation in der ersten Stufe. Es sei angenommen, dass p=p(k), so dass ein festes k* existiert mit p*=p(k*). 13 Soziale Normen und Reziprozität Es bleibt zu untersuchen, unter welcher Bedingung Spieler 2 bereit ist, glaubwürdig Sanktionen anzudrohen, die den anderen Spieler zur Kooperation veranlassen. Im Abweichungsfall (Spieler 1 defektiert), muss analog zu (3) gelten: (4) u2(σ) = S− k* − α2 [(T−p*)−(S−k*)] ≥ S − α2 (T− S) ⇒ α2 ≥ k*/(p*−k*). Es sei angemerkt, dass sich unsere Analyse des Gefangenendilemma-Normspiels auf einen Spezialfall des Public-Good-Spiels mit Sanktionsmöglichkeiten von Fehr und Schmidt (1999: 836ff.) bezieht. Die obigen Überlegungen beruhen auf der Voraussetzung vollständiger Information, d.h. insbesondere, dass auch die Fairness-Präferenzen common knowledge sind. Eine Annahme dieser Art ist allerdings empirisch grundsätzlich fragwürdig, auch wenn es unter günstigen Bedingungen valide Indikatoren für das Vorliegen bestimmter Präferenzen geben mag oder dem Spieler Möglichkeiten zur Überprüfung der Eigenschaften eines Partners zur Verfügung stehen (vgl. Frank 1992). Unter unvollständiger Information sind die Fairness-Präferenzen kein common knowledge, sondern es kann lediglich unterstellt werden, dass die Wahrscheinlichkeitsverteilung der Fairness-Präferenzen in der Population common knowledge ist. Wir betrachten den Fall, dass in einem Spiel mit unvollständiger Information eine AprioriWahrscheinlichkeit w gegeben ist, dass der Partner i über hinreichend starke FairnessPräferenzen verfügt (αi≥α*; βi≥β*). Unter dieser Bedingung gibt es im Normspiel mit unvollständiger Information und zwei Typen von Spielern, die entweder selbstinteressiert oder fairnessorientiert sind, ein perfektes Bayesianisches Nash-Gleichgewicht, so dass beide Spieler kooperieren und der fairnessorientierte Spieler eine Defektion des Partners sanktioniert, sofern w und p groß genug sind. In unserer Beweisskizze betrachten wir Spieler 1, der selbstinteressiert ist. Der erwartete Nutzen von Spieler 1 für Kooperation unter der Bedingung, dass Spieler 2 mit Wahrscheinlichkeit w eine Strategie der Kooperation in Stufe 1 und der Sanktionierung in Stufe 2 spielt, ist: EU1(C) = wR+(1-w)S. Für den Abweichungsfall erhält Spieler 1 EU1(D)=w(T-p)+(1-w)P. Wir wollen der Einfachheit halber zunächst unterstellen, dass p auf p=T-R fixiert ist. Dann wird EU1(D)=w(T-T+R)+(1-w)P. Es ergibt sich, dass EU1(C) ≥EU1(D) gdw. w≥1. Diese Strategie kann also nur ein Gleichgewicht bilden, wenn Spieler 1 sicher ist, dass der Partner Defektion bestraft, was im Widerspruch zur Annahme unvollständiger Information steht. Nehmen wir statt dessen an, dass p*=T-S. Dann gilt (5) w≥w*:=(P−S)/(R-S-T+P+p*)=(P−S)/(P+R-2S). Die rechte Seite der Gleichung ist kleiner 1, da gemäß Voraussetzung S<R gilt. In Abhängigkeit der Funktion der Sanktionskosten p=p(k) lässt sich das α* bestimmen, das nötig ist, um Spieler 2 zu veranlassen, das erforderliche Sanktionsniveau k* zu wählen: (6) α2≥α*:= k*/(p*−k*)= k*/(T-S- k*). 14 Soziale Normen und Reziprozität Diese Überlegungen führen zu den folgenden empirisch prüfbaren Hypothesen • Spieler mit Fairness-Präferenzen (βi≥β*) sind bereit, bedingt zu kooperieren, wenn sie erwarten, dass der Partner (ebenfalls) bedingt kooperiert („positive Reziprozität“). • Die Bereitschaft von Spielern mit Fairness-Präferenzen (βi≥β*) zur Kooperation ist höher, wenn sie zusätzlich über Sanktionsmöglichkeiten verfügen, die wegen der Annahmen über Fairness-Präferenzen glaubwürdig sind (αi≥α*). • Spieler mit ausgeprägten Fairness-Präferenzen (αi≥α*; βi≥β*) können auch Egoisten zur (rationalen) Kooperation zwingen, indem sie glaubwürdig Sanktionen androhen. • Daraus ergibt sich: Das Kooperationsniveau ist höher, falls Sanktionsmöglichkeiten bestehen. • Unter unvollständiger Information ist zu erwarten, dass faire Spieler kooperieren und Defektionen bestrafen („negative Reziprozität“). • In einem endlich oft wiederholten Spiel ist es möglich über Sanktionen eine Reputation der Fairness aufzubauen, die das Kooperationsniveau über die Zeit erhöht. Wir verweisen im folgenden auf einige analoge Resultate für das ERC-Modell von Bolton und Ockenfels (2000). Zur Vereinfachung der Rechnung illustrieren wir die Untersuchung durch eine spezielle Modell-Spezifikation, die auch Ockenfels (1999: Kap. VIII) verwendet. Das ERC-Modell unterstellt ähnlich dem FCC-Modell Nutzenfunktionen, die von den materiellen Auszahlungen yi und einem komparativen sozialen Aspekt abhängen: (7) (ERC) ui= aiyi – bi (0.5 – σi)2. Im ERC-Modell bezeichnet σi einen sozialen Bezugsstandard, nämlich den Anteil der Auszahlungen des Spielers im Verhältnis zur Summe der Auszahlungen beider Spieler. Der faire Anteil liegt bei 0.5. Wenn also σi= 0.5, so hängt der Nutzen ui nur von der materiellen Komponente ab. Die Parameter ai und bi (mit ai ≥ 0; bi > 0) stehen für das Gewicht des Selbstinteresses und der sozialen Vergleichsaspekte in der Nutzenfunktion. Für b→0 konvergiert die Nutzenfunktion gegen eine vollkommen selbstinteressierte Motivation. Der Exponent des Fairnessterms steht für die Annahme, dass höhere Abweichungen vom Gruppenstandard den Nutzen relativ stärker verringern als geringe Abweichungen. Im Unterschied zum FCC-Modell vergleichen sich Akteure nach dem ERC-Modell nicht individuell mit Referenzpersonen, sondern mit dem Gruppenstandard (der Durchschnittsauszahlung). Im vorliegenden 2-Personen-Fall ist dieser Aspekt allerdings weniger bedeutsam. Darüber hinaus ist das ERC-Modell symmetrisch in dem Sinne, dass Abweichungen vom Referenzpunkt nach „unten“ oder „oben“ als gleichermaßen aversiv gelten, während das FCC-Modell „Neid“ und „Scham“ unterschiedlich gewichtet. Wenden wir dieses Modell auf eine Analyse des Normspiels an, so erhalten wir zunächst das folgende Ergebnis: In einem Normspiel unter vollständiger Information mit ERC-Spielern existiert ein Nash-Gleichgewicht wechselseitiger Kooperation, wenn gilt, dass das FairnessMotiv hinreichend hoch bzw. der Quotient a/b hinreichend klein ist. (8) a/b ≤ (0,5 – (T/T+S))2/(T-R). Zur Interpretation der Behauptung sei angemerkt, dass a/b das relative Gewicht des Eigennutzes und des Fairness-Standards misst. Wenn a/b=0, so ist der Akteur vollkommen fairnessorientiert. Wenn a/b>1, so dominiert das Selbstinteresse. Auch hier gilt, dass steigende Kooperationskosten (T-R) die Kooperation erschweren, weil die rechte Seite der 15 Soziale Normen und Reziprozität Ungleichung kleiner wird und damit ein höheres Fairnessniveau (b hat höheres Gewicht als a) erforderlich ist. Auch mit dem ERC-Modell kann gezeigt werden, dass in einem Normspiel, in dem ein Spieler (Spieler 1) Egoist ist, während der andere ERC-Präferenzen besitzt, ein teilspielperfektes Nash-Gleichgewicht mit folgenden Strategien existiert: Spieler 1: Kooperiere in der ersten Stufe, sanktioniere nie. Spieler 2: Kooperiere in der ersten Stufe; sanktioniere Defektion in Stufe 2, sonst sanktioniere nicht. Zum Nachweis der Existenz betrachten wir nur den Spezialfall, dass (S-k)/(T-p+S-k)=0.5 oder (äquivalent) p-k = T-S. Diese Annahme besagt, dass der „Kuchen“ durch die Anwendung von Sanktionen in der zweiten Stufe gleich verteilt werden kann, so dass die effektiven materiellen Auszahlungen der beiden Spieler gleich hoch sind. Damit es in der zweiten Stufe für den Spieler 2 eine beste Antwort ist zu sanktionieren, muss gelten aS – b(0.5-(S/(T+S))2 ≥ a(S-k)-b((0.5-(S-k))/(T-p+S-k))2. Dies können wir wegen der Annahme über die Gleichheit der materiellen Auszahlungen T-p=S-k vereinfachen zu: aS – b (0.5-(S/S+T))2 ≥ a(S-k) und (9) a/b ≤ ((0,5 – (S/(T+S))2/k. Gemäß der Folgerung (9) aus dem ERC-Modell wird ein fairnessorientierter Spieler die Defektion seines egoistischen Partners um so eher sanktionieren, je geringer die Sanktionskosten k, die Fairness der Aufteilung (S/(T+S)) und das materielle Motiv im Verhältnis zum Fairnessmotiv (a/b) sind. Sowohl mit dem FCC-Modell als auch mit dem ERC-Modell lässt sich begründen, dass unter bestimmten Bedingungen Kooperation im Normspiel möglich ist. Über die qualitative Aussage hinaus sind aus den beiden Modellen aber auch unterschiedliche Prognosen ableitbar, so dass die beiden alternativen Theorien empirisch gegeneinander testbar sind (siehe dazu Engelmann and Strobel 2004). 5. Ausblick: Die Bedeutung von Reziprozität für den sozialen Zusammenhalt Das zweistufige Gefangenendilemma-Normspiel mit Sanktionen ist ein einfaches Modell, um ein grundlegendes Problem der Sozialtheorie zu klären: Wie ist Kooperation, d.h. die Befolgung sozialer Normen bei einer einmaligen Interaktion möglich, wenn die Sanktionierung abweichenden Verhaltens auch für die geschädigte Person mit Kosten verbunden ist? In der Sprache der Standard-Spieltheorie formuliert ist das NashGleichgewicht nicht teilspielperfekt; eine Drohung, unkooperatives Verhalten zu bestrafen, ist nicht glaubwürdig. Ein eigennütziger Akteur weiß zwar, dass die Normverletzung potentiell Sanktionen nach sich ziehen könnte. Er muss aber nicht mit dem aktuellen Vollzug rechnen, da dies dem Geschädigten weitere Kosten aufbürdete. Sanktionen stehen zwar zur Verfügung, sie sind aber ein „stumpfes Schwert“, weil sie keine abschreckende Wirkung haben. Wie sich zeigte, kann das Sanktionsdilemma gelöst werden, wenn die eigennützig-materiellen Interessen durch Fairnesspräferenzen ergänzt werden. Eine solche Annahme liegt dem ERC- 16 Soziale Normen und Reziprozität Modell von Bolton und Ockenfels und dem FCC-Modell von Fehr und Schmidt zugrunde. Im Unterschied zu nachträglichen und ‚Tautologie-verdächtigen’ Rekonstruktionen der Präferenzen im Gefangenendilemma wurden hier aber allgemeine Theorien herangezogen, aus denen die Präferenzen im zweistufigen Gefangenendilemma-Normspiel ableitbar sind. Die Rational-Choice-Erklärung ist „weich“ im Sinne, dass auch-nicht materielle Präferenzen berücksichtigt werden, aber „hart“ in dem Sinne, dass die Aussagen über eine spezifische Interaktionsstruktur aus einem theoretischen Modell höheren Allgemeinheitsgrades folgen. Damit werden auch empirisch prüfbare Bedingungen genannt, unter denen die Aussagen über kooperatives Verhalten gültig sind. Sind beide Akteure fairnessorientiert und überschreitet die Stärke der Fairnessorientierung einen Schwellenwert, der von den materiellen Auszahlungen abhängig ist, dann wird das Gefangenendilemma in ein Assurance-Game transformiert. Dieses Spiel hat neben einem ineffizienten auch ein Pareto-optimales Nash-Gleichgewicht. Rationale Spieler werden kooperieren, auch wenn keine Sanktionsdrohungen existieren. Allerdings verbleibt ein Koordinationsproblem. Durch die Verfügbarkeit von Sanktionen wird bei hinreichend hohem α-Parameter das Koordinationsproblem gelöst und das Gleichgewicht der kooperativen Strategien unterstützt. Aber auch wenn nur ein Spieler fairnessorientiert ist und der andere Spieler egoistisch, lassen sich Bedingungen für ein Gleichgewicht kooperativer Spieler angeben. Dabei muss der αParameter für den Nutzenverlust durch Übervorteilung groß genug sein, um Sanktionsdrohungen glaubwürdig zu machen. Selbst wenn der egoistische Akteur nicht sicher ist, ob der Mitspieler fairnessorientiert ist oder nicht, d.h. im Fall unvollständiger Information, erlaubt das Fairnessmodell Aussagen über die Existenz eines Gleichgewichts, bei dem beide Akteure die Norm befolgen und die Sanktionsdrohung glaubwürdig erscheint. Die Fairnessmodelle „bestrafen“ die Ausbeutung des Mitspielers (falls β>0) ebenso wie die Übervorteilung durch den Mitspieler (falls α>0). Die Bestrafung der Ausbeutung ist ein Anreiz für positive Reziprozität. Wer übervorteilt wird, leidet hingegen doppelt. Einerseits durch den materiellen Verlust, andererseits durch den Nutzenabzug für die unfaire Aufteilung. Dies ist ein starkes Motiv für negative Reziprozität. Positive Reziprozität kann per se zur Kooperation verhelfen. Altruistische negative Reziprozität ist der Schlüssel für die Wirksamkeit des Sanktionsmechanismus, weil hierdurch erst Sanktionsdrohungen glaubwürdig erscheinen. Wenn der eigennützige Akteur weiß, dass ein fairnessorientierter Mitspieler bereit ist, selbstschädigende Vergeltung auszuüben, wird er es als rationaler Akteur vorziehen zu kooperieren. Negative Reziprozität ist wichtig, weil bereits ein fairnessorientierter Spieler genügen kann, um Kooperation zu erreichen. Um nur mittels positiver Reziprozität Kooperation zu erzielen, müssen hingegen beide Akteure Fairnesspräferenzen aufweisen. Wie weiter oben erwähnt, demonstrieren Experimente, dass Personen das unfaire Verhalten anderer bestrafen, auch wenn sie dafür materielle Einbußen hinnehmen müssen. Auch für positive Reziprozität in nicht-wiederholten Situationen finden sich zahlreiche empirische Belege. Fehr, Fischbacher, Tougarova (2002) zeigen, dass sich Versuchspersonen in der Rolle von Arbeitnehmern für ein höheres Niveau der Anstrengung entscheiden, wenn sie einen höheren Lohn erhalten. Umgekehrt reagieren Versuchspersonen in der Rolle von Arbeitgebern mit höheren Löhnen auf ein gestiegenes Anstrengungsniveau. Auch bei, am Lebensstandard gemessen, relativ hohen Auszahlungen des in Moskau durchgeführten Experiments bleibt das hohe Ausmaß der Kooperation im Vergleich zu einer geringer entlohnten Versuchsgruppe erhalten. In einem psychologischen Experiment von Regan (1971) 17 Soziale Normen und Reziprozität wird einer Person durch eine vorgetäuschte andere Versuchsperson (in Wirklichkeit ein Beauftragter des Versuchsleiters) eine Freundlichkeit zuteil. Die vorgetäuschte Versuchsperson verlässt kurz den Raum und bringt in Bedingung (a) nur für sich und in Bedingung (b) auch für die andere Person eine Colaflasche mit. Anschließend versucht sie, der Versuchsperson für eine Tombola Lose zu verkaufen. Die Verkäufe sind in Situation (b) signifikant höher als in der Kontrollgruppe (a). In einem Experiment von Diekmann (2004) mit einem „sequentiellen Diktatorspiel“ teilen Versuchspersonen Beträge fairer auf, wenn sie zuvor von dem Empfänger ebenfalls fair behandelt wurden. Dieses Verhaltensmuster war sowohl bei geringen als auch bei relativ hohen Auszahlungen nachweisbar. Methodenexperimente bei schriftlichen Befragungen zeigen, dass die Rücklaufquote beim Versand von Geschenken mit dem Fragebogen im Vergleich zur Versuchsbedingung mit versprochenen Geschenken signifikant höher ausfällt (z.B. Diekmann und Jann 2001). Neurowissenschaftliche Studien legen sogar nahe, dass reziprokes Verhalten zur biologischen Grundausstattung des Menschen gehört (Cory 1999, Rilling et al. 2002). In der Ethnologie und Soziologie wird seit langer Zeit auf die Bedeutung von Reziprozitätsnormen hingewiesen (Malinowski 1926, Mauss 1950, Gouldner 1960). Die experimentelle Ökonomik hat diesen Faden erst seit kurzem aufgegriffen und mit spieltheoretischen Modellen verknüpft. Es ist nicht übertrieben zu behaupten, dass altruistische Reziprozität ein wesentliches Element der sozialen Integration darstellt (dazu auch Fehr und Gächter 2000b). Soziale Normen, die im Alltag selbstverständlich sind, würden nach kurzer Zeit verschwinden, wenn der Sanktionsmechanismus erodiert 1. Die Substituierung informeller Sanktionierung durch einklagbare Rechtsnormen wäre dagegen mit oftmals prohibitiv hohen Transaktionskosten verbunden. Altruistische Reziprozität fördert den sozialen Zusammenhalt, von dem auch rationale Egoisten profitieren. 1 Die Bedeutung des Rückgangs von Sanktionierung für den sozialen Wandel wurde von Heinrich Popitz (1961) hervorgehoben: „Der Sanktionen-Vollzug zeigt nicht nur Veränderungen an, er ist selbst der labilste, störungsempfindlichste Teil des normativen Handlungssystems.“ Popitz betont auch die Bedeutung dieses Zusammenhangs für die Festigung von Diktaturen. „Die Mehrheit der Bevölkerung wird zunächst nicht zum Bruch primärer Normen verleitet, sondern demoralisiert, indem man sie am Vollzug von Sanktionen gegen den Normbruch zu hindern versucht …“ Bezogen auf unsere Analyse werden die Sanktionskosten k durch Intervention Dritter erhöht, so dass der Sanktionsmechanismus zusammenbricht. Popitz hebt in seinen Arbeiten die Bedeutung der Sanktionierung hervor. Die mit der Sanktionierung verbundenen Anreizprobleme wurden von ihm aber nicht näher analysiert. 18 Soziale Normen und Reziprozität Literatur Axelrod, Robert. 1986. An Evolutionary Approach to Norms. American Political Science Review 80: 1095-1111. Axelrod, Robert. 1987. Die Evolution der Kooperation, München: Oldenbourg (orig.: 1984). Baurmann, Michael. 1996. Der Markt der Tugend. Tübingen: Mohr. Bendor, Jonathan und Piotr Swistak. 2001. The evolution of norms, American Journal of Sociology 106 (May):1493-1545. Bicchieri, Cristina. 1993. Rationality and Coordination. Cambridge: Cambridge University Press. Binmore, Ken. 1998. Game Theory and the Social Contract. Vol II: Just Playing. Cambridge, Mass.: MIT Press. Boehm, Christopher. 1984. Blood Revenge. Philadelphia: University of Pennsylvania Press. Bolton, Gary E., und Axel Ockenfels. 2000. ERC: A Theory of Equity, Reciprocity, and Competition. American Economic Review 90:166-93. Camerer, Colin F. 2003. Behavioral Game Theory. Experiments in Strategic Interaction. Princeton, New Jersey: Princeton University Press. Coleman, James S. 1990. Foundations of Social Theory. Cambridge, Mass.: Belknap Press of Harvard University Press. Cory, Gerald A. 1999. The Reciprocal Modular Brain in Economics and Politics. New York: Kluwer and Plenum Publishers. Diekmann, Andreas, 2004. The Power of Reciprocity. Fairness, Reciprocity, and Stakes in Variants of the Dictator Game. Journal of Conflict Resolution 48:487-505. Diekmann, Andreas und Ben Jann. 2001. Anreizformen und Ausschöpfungsquoten bei postalischen Befragungen. Eine Prüfung der Reziprozitätshypothese. ZUMA-Nachrichten 48: 18-26. Ellickson, Robert C. 1991. Order without Law. Cambridge, Mass.: Harvard University Press. Ellickson, Robert C. 2001. The evolution of social norms: A perspective from the legal academy, S. 35-75 in: Michael Hechter & Karl-Dieter Opp (eds.), Social Norms. New York: Russell Sage. 19 Soziale Normen und Reziprozität Elster, Jon. 1989. Social Norms and Economic Theory. Journal of Economic Perspectives 3: 99-117. Engelmann, Dirk und Strobel, Martin, 2004. Inequality Aversion, Efficiency, and Maximin Preferences in Simple Distribution Experiments. American Economic Review 94: 857-869. Fehr, Ernst und Urs Fischbacher. 2004. Social Norms and Human Cooperation. Trends in Cognitive Sciences 8: 185-190. Fehr, Ernst, Urs Fischbacher und Elena Tougarova. 2002. Do High Stakes and Competition Undermine Fairness? Evidence from Russia. Working paper No. 120, Institute for Empirical Research in Economics, University of Zurich. Fehr, Ernst und Simon Gächter. 2000a. Cooperation and Punishment in Public Goods Experiments. American Economic Review 90 (4): 980-994 (2000). Fehr, Ernst und Simon Gächter. 2000b. Fairness and Retaliation: The Economics of Reciprocity. Journal of Economic Perspectives 14(3): 159-181. Fehr, Ernst und Simon Gächter. 2002. Altruistic Punishment in Humans. Nature 415: 137140. Fehr, Ernst und Klaus M. Schmidt. 1999. A Theory of Fairness, Competition, and Cooperation. The Quarterly Journal of Economics: 817-868. Frank, Robert H. 1992. Strategie der Emotionen. München: Oldenbourg (Scientia Nova), (orig.: Passions within Reason. New York: Norton, 1988.). Fudenberg, Drew und Eric Maskin. 1986. The Folk Theorem in Repeated Games with Discounting or with Incomplete Information. Econometrica 54: 533-554. Gouldner, Alvin W. 1960. The Norm of Reciprocity: A Preliminary Statement. American Sociological Review 25: 161-178. Greif, Avner. 1994. Cultural Beliefs and the Organization of Society. Journal of Political Economy 102: 912-950. Harsanyi, John C. 1977. Rational Behavior and Bargaining Equilibrium in Games and Social Situations. Cambridge: Cambridge University Press. Hechter, Michael und Karl-Dieter Opp (eds.). 2001. Social Norms. New York: Russell Sage. Heckathorn, Douglas D. 1989. Collective Action and the Second Order Free-Rider Problem. Rationality and Society 1: 78-100. Homans, George C. 1951. The Human Group. London: RKP. Jasso, Guillermina und Karl-Dieter Opp. 1997. Probing the character of norms: A factorial survey analysis of the norms of political action. American Sociological Review 62: 947-964. 20 Soziale Normen und Reziprozität Macaulay, Stewart. 1963. Non-Contractual Relations in Business: A Preliminary Study. American Sociological Review 28: 55-67. Malinowski, Bronislaw. 1926. Crime and Custom in Savage Society. London: Routledge and Kegan. Mauss. Marcel. 1990 [1950]. The Gift. The Form and Reason for Exchange in Archaic Society. London: Routledge. McMillan, John und Christopher Woodruff. 2000. Private order under dysfunctional public order. Michigan Law Review 98: 2421-2458. Ockenfels. Axel. 1999. Fairness, Reziprozität und Eigennutz. Tübingen: Mohr Siebeck. Oliver, Pamela. 1980. Rewards and Punishments as Selective Incentives for Collective Action. American Journal of Sociology 85: 1356-1375. Opp, Karl-Dieter. 1979. The Emergence and Effects of Social Norms. Kyklos 32: 775-801. Opp, Karl-Dieter. 1983. Die Entstehung sozialer Normen. Tübingen: Mohr. Opp, Karl-Dieter. 1999. Contending Conceptions of the Theory of Rational Action. Journal of Theoretical Politics 11: 171-202. Opp, Karl-Dieter. 2001. Norms, S. 10714-10720 in: Paul B. Baltes und Neil J. Smelser (eds.), International Encyclopedia of Social and Behavioral Sciences. Amsterdam: Elsevier. Ostrom, Elinor. 2000. Collective Action and the Evolution of Norms. Journal of Economic Perspectives 14(3): 137-158. Popitz, Heinrich 1961. Soziale Normen, Europäisches Archiv für Soziologie 2: 185-198. Popitz, Heinrich. 1980. Die normative Konstruktion von Gesellschaft. Tübingen: Mohr. Posner, Eric A. 2000. Law and Social Norms. Cambridge, Mass.: Harvard University Press. Raub, Werner und Thomas Voss. 1986. Conditions for Cooperation in Problematic Social Situations, S. 85-103 in: Andreas Diekmann und Peter Mitter (eds.), Paradoxical Effects of Social Behavior. Heidelberg: Physica. Regan, Dennis T. 1971. Effects of Favor and Liking on Compliance. Journal of Experimental Social Psychology 7: 627-639. Rilling, James K., David A. Gutman, Torsten R. Zeh, Giuseppe Pagnoni, Gregory S. Berns, und Clinton D. Kilts. 2002. A Neural Basis for Social Cooperation. Neuron 35: 395-405. Sober, Elliott und David Sloan Wilson. 1998. Unto Others – The Evolution and Psychology of Unselfish Behavior, Cambridge, Mass.: Harvard University Press. Ullmann-Margalit, Edna. 1977. The Emergence of Norms. Oxford: Clarendon. 21 Soziale Normen und Reziprozität Voss, Thomas. 1998. Strategische Rationalität und die Realisierung sozialer Normen, S. 117135 in: Hans-Peter Müller und Michael Schmid (eds.), Norm, Herrschaft und Vertrauen. Opladen: Westdeutscher Verlag. Voss, Thomas. 2001. Game Theoretical Perspectives on the Emergence of Social Norms, S. 105-136 (Kap. 4) in: Michael Hechter und Karl-Dieter Opp (eds.), Social Norms. New York: Russell Sage. Voss, Thomas und Manuela Vieth. 2006. Kooperationsnormen und vergeltende Sanktionen – Experimentelle Untersuchungen. Universität Leipzig: Arbeitsbericht Nr. 50 des Instituts für Soziologie. Yamagishi, Toshio. 1986. The provision of a sanctioning system as a public good. Journal of Personality and Social Psychology 51: 110-116. Young, H. Peyton. 1998. Individual Strategy and Social Structure. Princeton, N.J.: Princeton University Press.