4 Dynamische Spiele 4.2 Wiederholte Spiele und kooperatives Verhalten 81 4.2.1 Zum Konzept des wiederholten Spiels • Die Auszahlungen der Spieler in einer Periode hängen nur von den in der jeweiligen Periode gewählten Handlungen ab. (Also nicht: heute investiertes Kapital verändert zukünftige Kosten). • Die Spieler haben die Möglichkeit, Aktionen in der aktuellen Periode t vom bisherigen Spielverlauf abhängig zu machen: Es kann für einen Spieler attraktiv sein, auf die Wahrnehmung kurzfristiger Gewinne zu verzichten, wenn ein derartiges Verhalten Vergeltungsmaßnahmen der Mitspieler herausfordert und damit in späteren Perioden Verluste brächte. • Die Wirksamkeit von Vergeltungsmaßnahmen hängt davon ab, wie stark die Spieler spätere Auszahlungen gewichten. • Ob andere Lösungen als die Wiederholungen der Nash-Gleichgewichte realisierbar sind, hängt entscheidend vom Zeithorizont ab (endlich vs. unendlich oft wiederholte Spiele). 4.2.2 Das Gefangenendilemma als wiederholtes Spiel Neuerungen: (1) Aktionen statt Strategien (2) Auszahlungen so normiert, dass Berechnungen erleichtert werden. Gegeben: Gefangenendilemma als Stufenspiel a21 a22 a11 (1,1) (-1,2) a12 (2, -1) (0,0) * 4 Dynamische Spiele Problem: 82 Der Grund für das Gefangenendilemma liegt letztlich nicht in der mangelnden Kommunikation, sondern in der Unmöglichkeit, bindende Verträge abzuschließen. (3) Das Gefangenendilemma wird nicht nur in einer, sondern über T (endliche) Perioden hinweg gespielt (endliche Wiederholung). Satz: Das einzige perfekte GG ist die nicht-kooperative Strategie (a12, a22) in T. In T ist das Spiel zu Ende. Es gibt keine Kooperationsdividende, also wird nicht kooperativ gespielt. Beweis: Würden beide Spieler in T-1 kooperativ spielen (a12, a22) wollen, so ist dies kein GG, denn weicht einer davon ab – (a12, a22) oder (a12, a21) –, so kann der andere in T keine Bestrafung mehr vornehmen. Also spielen sie auch in T-1 nicht-kooperativ. Dieser Prozess lässt sich bis in die Gegenwart fortsetzen. (4) Vorstellbar ist auch, dass der Zeithorizont unendlich ist; das bedeutet, dass es keine Endperiode mehr gibt, in der Strafen möglich sind. Satz: Im Falle des unendlichen Zeithorizonts kann Kooperation erreicht werden. Jeder Spieler spielt kooperativ und zwar solange, bis ein Mitspieler abweicht. Von da an legen alle Spieler nichtkooperatives Verhalten an den Tag. Instrument: Triggerstrategie (am Beispiel der obigen Auszahlungsmatrix): Grim Trigger Strategie ist eine von mehreren möglichen! Dynamische Spiele 4 ∞ ∑ δ t ⋅1 ≥ t =0 83 2+ ∞ ∑δt ⋅0 t =0 Summe der diskontierten Summe der diskontierten ≥ Einmaliger Gewinn + anschließenden Nutzeneinbußen aus Vertrauensbruch. Kooperationsvorteile wegen Glaubwürdigkeitsverlust ∞ Für ∑ δ t = t =0 ist 1 1− δ und zwar im Intervall 0 ≤ δ ≤ 1 1 0 ⋅δ ≥ 2+ 1− δ 1− δ 0 1 ≥2 1− δ 1 ≥ 2 − 2δ −2 −1 ≥ −2δ 1 ≤ 2δ 1 ≤δ 2 :2 oder Satz: δ≥ 1 2 Wenn die Zeitpräferenz sehr hoch ist und damit δ sehr klein, spielt die Zukunft keine Rolle. Im umgekehrten Fall spielt die Gegenwart (fast) keine und nur die Zeitpräferenz eine wichtige Rolle. Beispiel: (Nicht-) Kooperation in der Wirtschaftspolitik Gegeben: 2 Länder, die untereinander durch Handel und Kapitalverkehr verbunden sind. Betreiben beide Länder eine kooperative Strategie, so sind ihre Geldmengenexpansion und die Inflationsrate identisch: Keines der Länder versucht, durch Geldmengenausweitung, Inflationsratenerhöhung (von πC auf πREN bzw. π∗C auf π∗REN) und nachfolgende Erhöhung der (nominalen + realen) Wechselkurse (Abwertung), sich Wettbewerbsvorteile zu verschaffen. Dynamische Spiele 4 84 Annahme: Das Inland kann gegenüber dem Ausland (*) folgende Inflationsra- ten wählen: πΝC πC wenn C πt+i =π πt+i =π π∗t = π∗C wenn NC π∗t = π∗NC wenn REN πt=π π∗t-1 = π∗C Die „Versuchung“ des Inlands besteht in der Verlustdifferenz LC- LREN wobei LC=f(πC, π∗C) und LREN=f (πREN, π∗C). Nach einer einmaligen Täuschung des Auslands gilt für P Perioden LNC= f(πΝC, π∗ΝC). Damit sich Täuschen nicht lohnt, muss also gelten: ( ) ⎡⎣LNC − LC ⎤⎦ λ + λ 2 + ...λ P ≥ LC − LREN Für λ + λ + ...λ 2 ⎡⎣LNC − LC ⎤⎦ ⋅ P gilt die Formel: = λ (1 − λ P ) 1− λ λ (1 − λ P ) ≥ ⎡⎣LC − LREN ⎤⎦ 1− λ Fall A: Für P → ∞ wird aus der Formel: λ 1− λ und aus der Ungleichung λ ⎡⎣LNC − LC ⎤⎦ ⋅ ≥ ⎡LC − LREN ⎤⎦ 1− λ ⎣ oder ⎡ LC − LREN ⎤ ≥⎢ ⎥ 1 − λ ⎣ LNC − LC ⎦ λ 4 Dynamische Spiele Für λ → 1 ist lim λ 1− λ 85 ≅ ∞ für λ → 1 Für jedes λ in der Nähe von 1 kann also Kooperation durchgesetzt werden! Fall B: Für P = 1 wird aus der Ungleichung: λ (1 − λ ) ⎡ LC − LREN ⎤ = λ ≥ ⎢ NC C ⎥ 1− λ ⎣ L −L ⎦ :[ ] Da λ ≤ 1, verlangt diese Bedingung, dass ⎡⎣LNC − LC ⎤⎦ > ⎡⎣LC − LREN ⎤⎦ die einperiodigen Vorteile aus Kooperation größer sind als die einperiodigen Vorteile der Täuschung. Dynamische Spiele 4 86 Exkurs 1 ⎡⎣L − L ⎤⎦ ⋅ r f λ (1 − λ P ) 1− λ ≥ ⎡⎣Lf − LC ⎤⎦ Für λ (von oben) = γ: ⎡ 1 ⎤ λ (1 − λ ) P ⎡ 1 ⎤ 1 1 2 2 2 2 ⎢ 2 ⋅ ( Rbt ) − ( Rbt ) ⎥ ⋅ ≥ ⎢ ( Rbt ) − λ ( Rbt ) ⎥ 2 1− λ 2 ⎢⎣ 2γ ⎥ ⎢⎣ 2 Z ⎥⎦ ⎦ Z Z Z ⎡ 1 1 ⎤ λ (1 − λ ) ⎡1 1 ⎤ ≥ ⎢ − γ ⎥Z ⎢ 2γ 2 − 2 ⎥ Z ⋅ 1 − λ ⎣2 2 ⎦ ⎣ ⎦ P ⎤ λ (1 − λ ) 1⎡ 1 − 1⎥ ⋅ ≥ [1 − γ ] ⎢ 2 2 ⎣γ ⎦ 1− λ :Z P :Z ⎡1 ⎤ λ (1 − λ ) − 1 ≥ [1 − γ ] ⎢γ 2 ⎥ ⋅ 1− λ ⎣ ⎦ P Fall A: Für P → ∞ wird aus der Formel ⎡1 ⎤ λ ⎢ γ 2 − 1⎥ ⋅ 1 − λ ≥ [1 − γ ] ⎣ ⎦ λ 1− λ ≥ (1 − γ ) ⎛ 1 ⎞ ⎜ γ 2 − 1⎟ ⎝ ⎠ = oder (1 − γ ) ⎛ 1− γ 2 ⎞ ⎜ 2 ⎟ ⎝ γ ⎠ und aus der Ungleichung 4 Dynamische Spiele 87 Exkurs 2 ∞ Für λ → 1 ist lim Für jedes λ in der Nähe von eins kann also Fixing bzw. Preisniveaustabilität durchgesetzt werden! Fall B: Für P = 1 wird aus der Ungleichung: λ (1 − λ ) (1 − γ ) =λ≥ 1− λ ⎛ 1− γ 2 ⎞ ⎜ 2 ⎟ ⎝ γ ⎠ Das λ ≤ 1 verlangt diese Bedingung, dass ⎛ 1− γ 2 ⎞ 2 ⎜ 2 ⎟ > (1 − γ ) ⋅γ ⎝ γ ⎠ 1 − γ 2 > γ 2 − γ 3 oder 1 > 2γ 2 − γ 3 Exkurs 3 Beispiel: γ = γ = α α +θ2 ; α = 0,9 θ = 0,9 0,9 = 0,526 0,9 + 0,81 γ 2 = 0,277 ⇒ 2γ 2 = 0,554 γ 3 = 0,146 Bedingung: 1 > 0,554 – 0,146 = 0,408 leicht erfüllt! Dynamische Spiele 4 88 4.2.3 Auszahlungsmöglichkeiten Die Menge aller zulässigen Auszahlungsvektoren ist gegeben durch die Auszahlungen des Konfliktpunktes des Nash-Gleichgewichts und der Menge aller Auszahlungsvektoren, die besser sind als die Auszahlungen C des NashGleichgewichts (einschließlich des paretooptimalen Punktes P): U2 P 1 0 0 U1 1 Beispiel: Lohn-Verhandlungsmodelle Das Monopolgewerkschaftsmodell Die Gewerkschaften bestimmen den Lohn, die Arbeitgeber müssen diesen akzeptieren, entscheiden aber entsprechend über die Höhe der Beschäftigung im jeweiligen Sektor. In die Zielfunktion der Gewerkschaften gehen sowohl der Reallohn w (Preisniveau auf 1 normiert), als auch die Höhe der Beschäftigung der Gewerkschaftsmitglieder A im jeweiligen Sektor ein. Sie lautet: (1) U (w , A) = A ⋅w EK der Gewerkschaftsmitglieder bei Beschäftigung im Sektor mit: + (M − A ) ⋅ w A (utilitaristische NF), EK der Gewerkschaftsmitglieder bei Nichtbeschäftigung im Sektor M = Anzahl der Gewerkschaftsmitglieder, A = Anzahl der im Sektor beschäftigten Gewerkschaftsmitglieder, 4 Dynamische Spiele 89 w = Reallohn im Sektor, wa = Reallohn außerhalb des Sektors AN= Arbeitsnachfrage mit δAN/δw < 0 Es wird also das Gesamteinkommen der Gewerkschaftsmitglieder berücksichtigt. Totales Differenzieren der Zielfunktion ergibt: A ⋅ dw + w ⋅ dA − w A ⋅ dA = 0 (2) Ausklammern nach dA und Umstellen ergibt: A ⋅ dw = −dA ⋅ (w − w A ) (3) Durch Umformen erhält man: dw w − wA =− dA A (4) (Steigung der Indifferenzkurve) Es besteht also eine Trade-off-Beziehung, da die Gewerkschaften für einen höheren Lohn bereit sind, auf Beschäftigung zu verzichten. Der EinkommensZuwachs durch den höheren Lohn muss genau dem Einkommens-Verlust durch die geringere Beschäftigung entsprechen, damit das Nutzenniveau unverändert bleibt. Das Optimierungskalkül der Gewerkschaften lautet: max U (w , A ) = A ⋅ w + (M − A ) ⋅ w A (5) u.d.NB: AN = AN (w ,Y ) Einsetzen der Nebenbedingung ergibt: max U (w , A(w ,Y )) = A(w ,Y ) ⋅ w + (M − A(w ,Y )) ⋅ w A (6) Die Bedingung erster Ordnung lautet: ! ∂U ∂A ∂A = ⋅w + A − ⋅wA =0 ∂w ∂w ∂w (7) Ausklammern und Umformen ergibt: − Aw ⋅ (w − w A ) = A bzw. − (8) (9) − (w − w A ) = 1/ Aw A Aw (w − w A ) =1 A [Steigung der Indifferenzkurve = Steigung der (inversen) AN-Kurve] 4 Dynamische Spiele 90 • Im Optimum muss demnach die Steigung einer Indifferenzkurve gerade der Steigung der (inversen) Arbeitsnachfragefunktion entsprechen (Tangentialpunkt) • Die Indifferenzkurven weisen eine abnehmende Grenzrate der Substitution auf • Das Alternativeinkommen wA führt eine Untergrenze in das Indifferenzkurvenfeld ein, unter wA kann der Lohnsatz nicht fallen • Da bei Punkt M bereits Vollbeschäftigung unter den Gewerkschaftsmitgliedern herrscht, hat die Gewerkschaft jenseits von M an zusätzlicher Beschäftigung kein Interesse mehr, die Indifferenzkurve knicken deshalb bei M horizontal ab • Der Lohn wM liegt über dem gleichgewichtigen Lohn w*, die Beschäftigung AM entsprechend unterhalb der gleichgewichtigen Beschäftigung A* • Durch die Monopolgewerkschaft entsteht demnach (unfreiwillige) Arbeitslosigkeit Optimierungskalkül der Gewerkschaften im Monopolgewerkschaftsmodell w U0 U1 U2 AA wM w* wA AN AM A* M A In der Realität können die Gewerkschaften den Lohn nicht einfach festsetzen. Vielmehr verhandeln Gewerkschaften und Arbeitgeber über die Lohnhöhe, es liegt so etwas wie ein bilaterales Monopol vor. Dynamische Spiele 4 91 Der Right-to-Manage-Ansatz (RTM) Im Right-to-Manage-Ansatz (RTM) verhandeln die Tarifparteien über die Lohnhöhe. Im Anschluss an die Verhandlungen entscheiden die Unternehmen in Abhängigkeit des ausgehandelten Lohnes über die Beschäftigungshöhe. Die Verhandlungen können prinzipiell zu einer einvernehmlichen Lösung führen oder auch scheitern. Scheitern der Verhandlungen: • Alle Gewerkschaftsmitglieder sind arbeitslos und erhalten wA (U0 = M⋅wA) • Die Unternehmen machen einen Gewinn von 0 (π0=0) Erfolgreiche Verhandlungen: • Die Gewerkschaften erzielen einen Nutzen in Höhe von U (w , A ) = A ⋅ w + ( M − A ) ⋅ w A . Der Nutzenzuwachs aufgrund der erfolg- reichen Verhandlungen beläuft sich auf U − U 0 = A ⋅ (w − w A ) • Die Unternehmer erzielen einen Gewinn von π = y ( A) − w ⋅ A . Ihr Gewinnzuwachs aufgrund der erfolgreichen Verhandlungen beläuft sich auf π − π0 = π = y ( A ) − w ⋅ A Das Lösungsproblem (Nash Verhandlungslösung) Es gibt vier Anforderungen für mögliche Lösungen des Verhandlungsproblems: • Es kommen nur solche Lösungen in Frage, bei denen sich weder die Gewerkschaften noch die Unternehmen schlechter stellen als bei abgebrochenen Verhandlungen ( π ≥ π 0 ; U ≥ U 0 ) • Sogenannte „Invarianz“: Die Lösung soll unabhängig von den „Einheiten” sein, in denen der Nutzen gemessen wird • Die Lösung soll unabhängig von irrelevanten Alternativen sein • Pareto-Effizienz soll gewährleistet sein 4 D Dynamisch he Spiele 92 Da die e Lösung pareto-op ptimal sein n muss, kommen k n Lösun nur ngen auf der d Begrenzu ungslinie in Betrach ht. Die Begrenzung gslinie stelllt alle Pun nkte dar, bei denen eine Steige erung des Nutzens der Gewerkschafte en (des G Gewinns der d Unternehmen) nich ht möglich h ist, ohne e den Gew winn der Unternehm U men (den Nutzen der Ge ewerkschaften) zu schmäle ern (Analo og zur Tra ansformationskurve e einer Wirtschaft). Möglicche Lösungen: • Punkt A: Nur die Gewerksch G haft realis siert einen Verhandlungsgew winn • Punkt B:: Gewerksschaft und Unterne ehmen re ealisieren einen Ve erhandlungsgew winn • Punkt C: Nur die Unternehm U men realis sieren eine en Verhan ndlungsge ewinn • Welcher Punkt auff der Begrenzungslinie erreiccht wird, iist abhäng gig von der Verha andlungsm macht derr Tarifpartteien • Die Lage e des Dro ohpunktess wird bes stimmt du urch den Nutzen der d Gewerkscha aften bzw w. den Ge ewinn der Unterneh hmen, wenn die Lo ohnverhandlung gen scheittern (Α0, U0) Möglicche Ergebnisse der Lohnverh handlung Dynamische Spiele 4 93 Das Maximierungsproblem (1) NP = (U − U0 )β ⋅ ( π − π0 )1−β NB : A N = A N (w ) , mit β (1-β) als Maß für die Verhandlungsmacht der Gewerkschaften (der Unternehmen) (2) max NP = (U − U 0 )β ⋅ ( π − π0 )1−β w mit β=1: gesamte Verhandlungsmacht bei den Gewerkschaften: (3) NP = U − U 0 = A ⋅ [u (w ) − u (w A )] ; A=A(w) (4) ! ∂NP = Aw [u(w ) − u(w A )] + A ⋅ uw = 0 ∂w (5) −[u (w ) − u (w A )] 1 = Aiuw Aw mit u(w) = w, (6) ∂u(w ) = uw = 1 und u(wA) = wA: d (w ) (w − w A ) − = 1/ Aw A ⇒ Optimalbedingung im Monopolgewerkschaftsmodell mit β = 0: gesamte Verhandlungsmacht bei den Unternehmen: (7) NP = π − π 0 = Y ( A ) − w ⋅ A (8) ! ∂NP = YA − w = 0 ∂A (9) YA = w = w * ⇒ Optimalbedingung bei vollkommener Konkurrenz: • Je größer die Macht der Gewerkschaften ist, desto näher liegt das Ergebnis am Ergebnis des Monopolgewerkschaftsmodells und desto niedriger (höher) ist die Beschäftigung (der Lohn) • Sowohl der Lohn, als auch die Beschäftigung liegen im RTM-Modell zwischen dem Ergebnis des Monopolgewerkschaftsmodells und dem Ergebnis bei vollkommener Konkurrenz. 4 Dynamische Spiele 94 4.2.4 Das Rubinstein-Verhandlungsmodell Typ: Spiel mit unendlichem Zeithorizont Gegeben: Zwei Spieler machen abweichend Vorschläge über die Aufteilung eines Kuchens von der Größe 1. Jeder Spieler kann entweder den Vorschlag des anderen annehmen oder einen Gegenvorschlag machen, allerdings erst in der nächsten Periode. Wegen des „Eisbergprinzips“ ist die Torte aber in der nächsten Periode kleiner als in der vorangegangenen. t 0 0 a 1 x, 1 x ja 1 a 2 nein Aktion von Spieler 1 Aktion von Spieler 2 in Stufe null in Stufe eins ja nein Ergebnis: t 1 a 2 2 1 y, y z=(z1, z2) z= (x, 1-x) Bewertung der Ergebnisse: U i = δ ti zi mit 0 ≤ δ i ≤ 1; δ = 1 ; r = Diskontfaktor 1+ r Ein δ von Null steht für vollständige Gegenwartspräferenz. Die Höhe des Nutzens für die beteiligten Spieler hängt von dem Verteilungsschlüssel und der Dauer der Verhandlungen ab. 4 Dynamische Spiele 95 Teilspielperfektes Gleichgewicht Für jedes Teilspiel, das in Periode t ≥ 0 beginnt, muss ein Nash-GG existieren. Lösungshilfe: Wir nehmen an, dass in allen geraden (ungeraden) Perioden Spieler 1 (Spieler 2) einen Vorschlag macht. Bei unendlichem Zeithorizont (T=∞) bedeutet dies, dass das Spiel in allen geraden bzw. ungeraden Perioden identisch ist. Es sei denn, es wurde zuvor beendet. Arbitrage-Bedingungen: Das Angebot von Spieler 2 (Spieler 1) an Spieler 1 (Spieler 2) in Periode t ist so groß, wie das, was Spieler 1 (Spieler 2) in der Periode t+1 für sich selbst vorsieht: ! δ t 1 (1 − y ) = δ1t +1 ⋅ x (1 − y ) = δ1 ⋅ x Ry ( x ) : y = 1 − δ1x δ t 2 (1 − x ) = δ 2t +1 ⋅ y (1 − x ) = δ 2 ⋅ y Rx ( y ) : x = 1 − δ 2 y t δ1 bzw. :δ2 t Die dazugehörige Graphik sieht wie folgt aus: y 1 - δ1 - δ2 1 x Dynamische Spiele 4 96 Je höher δ, desto geduldiger der jeweilige Spieler (in der Zeichnung ist Spieler 2 geduldiger als Spieler 1). Das Nash-GG stellt sich im Schnittpunkt der Reaktionskurven ein: y 1 − x = δ 2 (1 − δ1x ) 1 − x = δ 2 − δ 2δ1x 1 − δ 2 = x (1 − δ 2δ1 ) x* = 1− δ2 1 − δ1δ 2 Dieses Ergebnis gilt in den Perioden 0,2. … Einsetzen in Ry ( x ) : y = 1 − δ1x ergibt: y = 1 − y* = δ1 (1 − δ 2 ) 1 − δ1δ 2 1 − δ1δ 2 − δ1 + δ1δ 2 ⎛ 1 − δ1 ⎞ =⎜ ⎟ 1 − δ1δ 2 ⎝ 1 − δ1δ 2 ⎠ Dieses Resultat gilt in den Perioden t=1,3. … Der Ergebnis- oder Lösungsvektor lautet demnach aus der Sicht von Spieler 1: z= ⎡ ⎤ ⎢ ⎥ ⎢ ⎡ 1 − δ 2 ⎤ ⎡ (1 − δ 1 ) δ 2 ⎤ ⎥ ⎢ ⎢1 − δ δ ⎥ , ⎢ 1 − δ δ ⎥ ⎥ 1 2⎦ ⎣ 1 2 ⎦ ⎢⎣ ⎥ ⎢⎣ x 1 − x = δ 2 y ⎥⎦ Auswirkungen von Reihenfolge und Diskontfaktor: z Ist δ 2 = 0 → (1 − x ) = 0 → (1,0 ) ⎧δ = 0 Ist ⎨ 1 ⇒ z = (1 − δ 2 , δ 2 ) ⎩δ 2 ≠ 0 δ ⎞ ⎛ 1 Ist δ1 = δ 2 = δ > 0 ⇒ z = ⎜ , ⎟ ⎝ 1+ δ 1+ δ ⎠ 4 Dynamische Spiele 97 ⎛ 1 1⎞ Für δ → 1 ⇒ z = ⎜ , ⎟ ergibt sich die Gleichverteilung. Insgesamt zeigt sich, ⎝2 2⎠ dass es vorteilhaft ist, geduldig zu sein (je höher das eigene δ, desto größer der eigene Anteil am Kuchen). 4.2.5 Probleme und Erweiterungen Beispiele für stochastische Spiele: Das Kartell In einem Oligopol-Modell mit Schwankungen der Nachfrage agieren zwei Anbieter, die sich zu einem Kartell zusammenschließen. Exkurs: Das Kartell als Kollektivmonopol Als Kartell bezeichnet man eine Vereinbarung zwischen Unternehmen der gleichen Produktionsstufe zum Zwecke der Wettbewerbsbeschränkung. Gegenstand der Vereinbarung sind somit wettbewerbliche Aktionsparameter wie Angebotsmengen, Konditionen, Qualität, Rabatte und Preise. Als Preiskartell bezeichnet man demgemäß eine entsprechende Vereinbarung über den Preis eines Gutes. Gruppengewinnmaximierung im Kollektivmonopol als Ausgangspunkt der Analyse Im Thema ist das Modell des „reinen Kollektivmonopols“ als Ausgangspunkt der Analyse vorgegeben. Es soll zunächst dargestellt werden. Voraussetzung des Modells: (1) Alle Anbieter eines Marktes schließen sich zu einem Kollektivmonopol zusammen; (2) Der Markt sei vollkommen (keine zeitlichen, räumlichen, sachlichen und personellen Präferenzen); 4 Dynamische Spiele 98 (3) Die Produktionsanlagen der Unternehmen seien fix und vorgegeben; es handele sich um Ein-Produktunternehmen; technischer Fortschritt finde somit nicht statt; (4) Auf dem Beschaffungsmarkt herrsche vollkommene Konkurrenz; die Faktorpreise werden durch den Zusammenschluss also nicht berührt; sie werden als „gegeben“ (konstant) angenommen; aus (3) und (4) folgt: „Gegebene“ (konstante) langfristige Kostenfunktionen; (5) Die Nachfragefunktion ändere sich nicht; (6) Verhaltensannahmen: Vor Zusammenschluss Gewinnmaximierung; nach Zusammenschluss Gruppengewinnmaximierung. Um das Ziel der individuellen Gewinnmaximierung unter Konkurrenz erreichen zu können, müssen sich die Anbieter entsprechend der Maxime „Grenzkosten = Grenzerlös = Preis“ verhalten. Sie sind dann Mengenanpasser. Daher ergibt sich die Gesamtangebotskurve am Markte durch horizontale Aggregation der individuellen Grenzkostenkurven vom Betriebsminimum an . . Der Marktpreis ist dann bestimmt durch den Schnittpunkt der Nachfrage mit der Angebotskurve (in der Abbildung ist der Marktpreis mit pm bezeichnet). Schließen sich nun die Unternehmen zu Kollektivmonopol zusammen, müssen sie, wollen sein den Gruppengewinn maximieren, als Gesamtheit entsprechend der Maxime „aggregierte Grenzkosten = Grenzerlös“ planen. Es ergäbe sich dann eine Angebotsmenge in Höhe von mk, die einen Preis in Höhe von pk ermöglichen würde (vgl. Abbildung). Verhielten sich nun die Mitglieder des Kollektivs weiter individuell gewinnmaximierend, so würden sie beim Preis pk wegen GK = pk, die Menge anbieten, welche wiederum nur zum Preis pk, abgesetzt werden könnte. Das Kollektivmonopol muss also über die Preisabsprache hinaus zur Lösung des Konflikts zwischen Gruppen- und Individualinteresse noch eine entsprechende Mengenabsprache treffen. Die Mengenrestriktion muss nun aber notwendigerweise dem Grenzkostenprinzip genügen (ansonsten sind die Gruppenkosten nicht minimiert und der Gruppengewinn somit nicht maximiert). 4 Dynamische Spiele 99 GK, K, P K PK ’ GK, K, P K’ f1 K1’ GK, K, P ’ 2 K f2 GK, K, P K’ fges. N f3 ’ 3 K DVK2 Pm PK’ PV K’ DVK3 E’ DVK1 m K’ges. m m mK N mK’ m Dynamische Spiele 4 100 Ende Exkurs Aufgrund von stochastischen Störeinflüssen schwankt der Marktpreis. Nun können Preissenkungen (-Erhöhungen) von den einzelnen Kartellmitgliedern als Signal aufgefasst werden, dass andere Kartellmitglieder von der ihnen „zustehenden“ Kartellmenge (Quote) abweichen. Als Spiel lässt sich diese Situation wie folgt modellieren: Beide Kartellmitglieder starten mit der ihnen zugeordneten Kollusionsmenge (= halbe Monopolmenge). Stellt einer der Spieler fest, dass der Preis unter den Monopolpreis fällt (bzw. vermutet er, dass das andere Unternehmen von der Menge X abgewichen ist), so wählt er die Cournot-Angebotsmenge in T-Perioden (Strafperiode der Länge T): Eine Rückkehr zur Kollusion zwischen den Anbietern im Oligopol ist dann nach Ablauf der Strafperiode möglich. Beispiel für den Anreiz, Drohstrategien nicht auszuführen: Das neu verhandlungspolitische Gleichgewicht Gegeben sei das folgende Gefangenendilemma: s21 s22 s11 (3,3) (1,4) s12 (4,1) (2,2)* Beide Spieler können sich am Anfang auf die kooperative Lösung (3,3) einigen, die durch eine Trigger-Strategie (s. o.) auch durchgesetzt werden kann. Weicht der eine Spieler davon ab, dann wechselt der andere sofort zur Strategie si2 und es stellt sich das altbekannte Nash-GG ein. Diese Vorgehensweise ist aber nicht, wie man sagt, „neuverhandlungsstabil“: Eine Rückkehr zu dem Ausgangspfad der Kooperation würde für alle Beteiligten eine Auszahlung von 3 ermöglichen, während der Vergeltungspfad nur die Dynamische Spiele 4 101 Auszahlung 2 liefert. Es besteht deshalb ein starker Anreiz, die „Vergangenheit zu vergessen“ und aufs Neue mit dem Ausgangspfad zu beginnen. Problem: Weil dann aber eine Abweichung ohne Folgen bleiben würde, käme eine Kooperation von Anfang an nie zustande! Lösung: Sobald Spieler i von dem Kooperationspfad abweicht, spielt j als Vergeltung seine 2. Strategie (s12 oder s22). Er tut dies aber nur solange, wie der Abweichende i keine Reue zeigt. Spieler i kann sein Vergehen bereuen, indem er selbst die kooperative Strategie (s11 oder s21) spielt, um damit dem Gegner j einen (einmaligen) Vorteil zuzugestehen und sich selbst an der eigenen Strafe zu beteiligen. Sobald Spieler i sein Abweichen bereut hat, kehrt auch der Strafende j zur Kooperation zurück. Es besteht dann kein Anreiz zu Neuverhandlungen! Beispiel für ein Stufenspiel mit mehreren Nash-Gleichgewichten: F&EKooperation zwischen 2 Unternehmen: Gegeben sei das folgende Gefangenendilemma: a21 a22 a23 a11 (1,1) (-1,2) (-2,2) a12 (2,-1) (0,0) (-2,-2) a13 (-2,-2) (-2,-2) (-2,-2) Die kooperative Lösung ist in der Nordwest-Ecke der Matrix, jedes Unternehmen hat allerdings den Anreiz, sich auf Kosten des anderen Unternehmens Vorteile zu verschaffen (durch die Aktionen a12 bzw. a21). Verhält sich eins der Unternehmen einmal nicht-kooperativ, so kann der Abbruch der Kooperation durch die Strategie ai3 gewählt werden. Diese Kombinationen sind aber (vgl. Matrix) für beide Unternehmen sehr ungünstig. 4 Dynamische Spiele 102 Lösung: Es existiert immer ein δ für das der völlige Abbruch der Kooperation in der Zukunft nicht lohnend erscheint. Periode ↓ Spieler a1i1 → 1 + δ ⋅ 0 = 1 a1i2 → 2 + δ ⋅ (-2) = 2 - 2 δ Daraus folgt: Für 1 > 2 – 2 δ => δ > ½. Für Werte von δ > ½ ist der Übergang zur Nash-Lösung (0,0) allemal attraktiver als der völlige Abbruch der Zusammenarbeit. Weitere Komplikationen oder Erleichterungen für kooperatives Verhalten können immer dann auftreten, wenn etwa „irrationale“ Spieler vorhanden sind: Diese würden bei Verlassen des Kooperationspfades keine Reue vom Gegenspieler erwarten und auch keine eigene aktive Bestrafung vornehmen. Damit wird aber der Anreiz zur Kooperation auf der Gegenseite deutlich vermindert. Sogenannte „beschränkte Rationalität“ (Englisch: bounded rationality) liegt etwa dann vor, wenn einer der Spieler nicht nach maximalem Gewinn strebt, sondern bereits mit einem „befriedigenden Ergebnis“ zufrieden ist. In solchen Fällen versagen die preistheoretischen Konzepte von Cournot, Stackelberg und gemeinsamer Gewinnmaximierung. 4 Dynamische Spiele 103 4.3 Unvollständige Informationen: Bayes-Nash und sequentielles Gleichgewicht 4.3.1 Einleitung Zufallszüge der Natur In vielen Spielen gibt es exogene Unsicherheit. Wir können das modellieren, indem wir einen zusätzlichen Spieler, die „Natur“, einführen, die aus der Menge der möglichen Zustände der Welt einen nach einer gegebenen Wahrscheinlichkeitsverteilung auswählt. Markteintrittspiel bei exogener Unsicherheit A Eintritt Natur 1 2 0 4 1 2 B (niedrige NE) (hohe NE) C Preiskrieg 0 0 Auf tei- Preislung krieg 3 3 -1 -1 Aufteilung 1 1 Nach der Eintrittsentscheidung realisiert sich der Zustand der Welt: • Mit Wahrscheinlichkeit ist die Nachfrage groß, beide können hohe Gewinne machen. • Mit Wahrscheinlichkeit ist die Nachfrage niedrig, beide machen bei Wettbewerb Verluste. Asymmetrische Information Bisher haben wir angenommen, dass alle Spieler vollständig über die Struktur des Spiels informiert sind. Insbesondere weiß jeder Spieler, was die Auszahlungsfunktion seines Gegenspielers ist. In diesem Kapitel werden wir diese Dynamische Spiele 4 104 Annahme abschwächen und zeigen, wie Spiele mit asymmetrischer Information modelliert und analysiert werden können. Als einführendes Beispiel betrachten wir das folgende (simultane) Marktzutrittsspiel: • Spieler 1 (der bisherige Monopolist) entscheidet, ob er eine neue Fabrik zur Kapazitätserweiterung baut oder nicht. • Spieler 2 entscheidet, ob er in den Markt eintritt. • Spieler 1 kennt die Kosten einer Kapazitätserweiterung, nicht aber Spieler 2. Dieser weiß nicht, ob die Auszahlungen nach Kosten 3 oder 0 sind. Er glaubt, dass die Wahrscheinlichkeit hoher Kosten p1 ist. • Die Profitabilität des Marktzutritts für Spieler 2 hängt von der Kapazitätserweiterung und damit indirekt von deren Kosten ab: Marktzutrittsspiel (Variante1) 2 2 1 Investition Keine I. Zutritt Kein Z. 0, -1 2,0 2,1 1 3,0 Hohe Inv.-Kosten für Spieler 1 ·1 1 1 Kein Z. 3, -1 5,0 2,1 3,0 Niedrige Inv.-Kosten für Spieler 1 Für Spieler 2 ist der Erwartungswert des Zutritts: 2 Zutritt 0 Dynamische Spiele 4 1 2 105 0 1 Analyse des Spiels • Spieler 1 hat eine dominante Strategie: − „Investiere nicht“, falls die Kosten hoch sind. − „Investiere“, falls sie niedrig sind. • Spieler 2 wird zutreten, wenn . • Spieler 2 ist indifferent, wenn . Dann ergibt jede Zutrittswahr- scheinlichkeit von Spieler 2 ein Gleichgewicht. Das Spiel wird etwas komplizierter, wenn die Auszahlungen für Spieler 1 bei niedrigen Investitionskosten statt 0 betragen: Marktzutrittsspiel (Variante 2) 2 1 Investition Keine I. Zutritt Kein Z. 0, -1 2,0 2,1 3,0 Hohe Inv.-Kosten für Spieler 1 (Typ Hoch) 1 2 Zutritt Kein Z. 3 -1 2, 7 2, 0 2,1 3,0 Niedrige Inv.-Kosten für Spieler 1 (Typ Niedrig) Dynamische Spiele 4 106 Analyse des Spiels Wenn Spieler 1 hohe Kosten hat, hat er wieder die dominante Strategie, nicht zu investieren. Wenn Spieler 1 niedrige Kosten hat, hat er keine dominante Strategie mehr. Seine optimale Strategie hängt jetzt von der Wahrscheinlichkeit ab, die er dem Ereignis zuordnet, dass Spieler 2 zutritt. Er wird investieren, falls y 1 7 2 7 2 2y 2y 0,5 y y 2y 2y 3 y 3 y 3 1 y . 3y oder 0,5 Analog zu den oben behandelten gemischten Strategien, wird Spieler 1 die reine Strategie „Investieren“ wählen für y Strategie „Nicht-Investieren“ wählen. Für y 0,5. Für y 0,5 wird er die reine 0,5 ist er indifferent, er wählt einen Zufallsmechanismus im Intervall zwischen 0,1 . Formal: Sei die Wahrscheinlichkeit mit der Spieler 1 investiert. Seine Beste- Antwort-Korrespondenz ist dann 1 0,1 0 1/2 1/2 1/2 Was wird Spieler 2 tun? Sei die Wahrscheinlichkeit, die Spieler 2 dem Ereignis zuordnet, dass Spieler 1 investiert, gegeben, dass Spieler 1 niedrige Kosten hat. (Wenn er hohe Kosten hat, wird er nie investieren) 5). Spieler 2 wird zutreten, falls 5 Da hier Nicht-Investieren für Spieler 1 die dominante Strategie ist! Dynamische Spiele 4 1· 1 107 1 0 · 1 2 1 2 1 1 1 2 0 0 1 2 1 1 2 1 Also ist die Beste-Antwort-Korrespondenz von Spieler 2: 1 1 2 1 1 0,1 2 1 1 0 2 1 Ein (Bayesianisches) Nash-Gleichgewicht in diesem Spiel ist ein Paar von wechselseitig besten Antworten, d. h. 1 Fallunterscheidung: , und bzw. : 1 . Dann wählt Spieler 2 stets y*=1 (sicherer Zutritt), da nur • erfüllt und zulässig. Das eindeutige Gleichgewicht ist 0,0 ,1 , d. h. „Keine Investition bei hohen und niedrigen Kosten, Marktzutritt“. • . Hier gibt es drei Gleichgewichte: 1) 0,0 ,1 : Keine Investition bei hohen und niedrigen Kosten, Marktzu- tritt. 2) 0,1 ,0 : Keine Investition bei hohen Kosten, Investition bei niedrigen Kosten, kein Marktzutritt. 3) 0, , : Keine Investition bei hohen Kosten, ansonsten ge- mischte Strategien. Dynamische Spiele 4 • 108 1 . Dieser Fall impliziert Gleichgewichte: 0,1 ,0 wie oben, und Beste-Antwort-Korrespondenzen (für y A 1 C x*(ye) B 0,75 A: (0,0), 1 B: (0,1), 0 C: (0, 0,75), 0,5 0,1 , y mit 0 ); Bsp.: y*(xe) 0,5 und ergibt unendlich viele 1 x führt zu . 0,75