Spieltheorie (Winter 2009/10) 5 5-1 Prof. Dr. Ana B. Ania Wiederholte Spiele Literaturhinweise zu Kapitel 5: Osborne (2004), Kapitel 14 Gibbons (1992), Kapitel 2 Fudenberg und Tirole (1991), Kapitel 5 5.1 Einleitung Sei G ein beliebiges endliches Spiel in Normalform oder in extensiver Form. Dann ist GT ein Spiel in extensiver Form, in dem das Stufenspiel G T -mal hintereinander gespielt wird, T ∈ IN ∪ {∞}, und in dem alle Spieler zu Beginn jeder Periode die gesamte bisherige Geschichte des Spiels kennen. Beispiele: Zwei Spieler spielen mehrfach hintereinander das Gefangenendilemma. N Oligopolisten stehen sich über viele Perioden in einem Cournot-Spiel gegenüber. Zentralbank setzt in jeder Periode die Geldmenge, etc. Klaus M. Schmidt 2007 Spieltheorie (Winter 2009/10) 5-2 Prof. Dr. Ana B. Ania Bemerkungen: 1) Wiederholte Spiele sind eigentlich nur ein Spezialfall von dynamischen Spielen. 2) Sie haben jedoch einige interessante Eigenschaften, die für allgemeine dynamische Spiele nicht gelten. 3) Wiederholte Spiele haben sowohl in der Theorie als auch in den Anwendungen sehr viel Aufmerksamkeit gefunden. 4) Vorsicht – die folgenden Spiele sind keine wiederholten Spiele: – Rubinsteins Verhandlungsspiel. – Wiederholte Spiele mit sich verändernden Zustandsvariablen, z.B. Oligopolspiel mit Nachfrageträgheit, Ressourcen-Extrahierungsspiel, Investitionsspiele, etc. Solche Spiele werden auch “stochastische Spiele” genannt. Spieltheorie (Winter 2009/10) 5-3 Prof. Dr. Ana B. Ania 5.2 Endlich oft wiederholte Spiele Angenommen, das Gefangenendilemma wird von 2 Spielern zweimal hintereinander gespielt. Spieler 2 r L 1, 1 5, 0 R 0, 5 4, 4 Spieler 1 Abb. 5.1: Das Gefangenendilemma Die Auszahlungen der Spieler sind einfach die Summe der Auszahlungen in den beiden Spielen. Analyse des Spiels Stufe 2: Egal was in der 1. Stufe passiert ist, das Gefangenendilemma der zweiten Stufe hat ein eindeutiges NashGleichgewicht: (L, ) Daraus folgt: In jedem teilspielperfekten Nash-Gleichgewicht muss in der zweiten Stufe (L, ) gespielt werden. Spieltheorie (Winter 2009/10) 5-4 Prof. Dr. Ana B. Ania Stufe 1: Was in dieser Stufe passiert, hat keinen Einfluss auf das Spiel in der zweiten Stufe. Wir können einfach die Auszahlung (1,1) aus der zweiten Stufe zu denen der ersten Stufe addieren. Spieler 2 r L 2, 2 6, 1 R 1, 6 5, 5 Spieler 1 Abb. 5.2: Reduzierte Normalform des wiederholten Gefangenendilemmas Fazit: Auf Stufe 1 sollten beide Spieler “links” spielen. Das einzige TPGG ist somit, dass beide Spieler in beiden Stufen “links” wählen: GG-Strategie von Spieler 1: (L1, L2L2L2L2) GG-Strategie von Spieler 2: (1, 2222) Spieltheorie (Winter 2009/10) 5-5 Prof. Dr. Ana B. Ania Satz 5.1 Wenn das Stufenspiel G ein eindeutiges Nash-Gleichgewicht hat, dann hat das endlich oft wiederholte Spiel GT , T < ∞, ein eindeutiges teilspielperfektes Gleichgewicht, nämlich die T -fache Wiederholung des Nash-Gleichgewichts unabhängig von der Geschichte des Spiels. Beweis: Folgt unmittelbar aus den Prinzipien der Teilspielperfektheit und der Rückwärtsinduktion, ganz analog zum Gefangenendilemma oben. Q.E.D. Übungsaufgabe: Zeigen Sie, dass im zweimal wiederholten Gefangenendilemma auch das einzige Nash-Gleichgewicht darin besteht, dass beide Parteien in beiden Perioden “links” spielen. Spieltheorie (Winter 2009/10) 5-6 Prof. Dr. Ana B. Ania Betrachte jetzt die zweifache Wiederholung des folgenden Spiels: 2 @ @ @ @ @ m r L 1, 1 5, 0 0, 0 M 0, 5 4, 4 0, 0 R 0, 0 0, 0 3, 3 1 Abb. 5.3: Multiple Nash-Gleichgewichte im Stufenspiel Frage: Wieviele reine Strategien hat jeder Spieler im zweifach wiederholten Spiel? Dieses Stufenspiel hat zwei Nash-Gleichgewichte in reinen Strategien: (L, ) und (R, r). Satz 5.2 Wenn in jeder Periode unabhängig von der Geschichte des wiederholten Spiels dasselbe NashGleichgewicht des Stufenspiels gespielt wird, liegt ein teilspielperfektes Gleichgewicht vor. Spieltheorie (Winter 2009/10) 5-7 Prof. Dr. Ana B. Ania Beweis: Teilspielperfektheit verlangt, dass die Strategien für jedes Teilspiel ein Nash-Gleichgewicht bilden. In der letzten Stufe ist das bei den betrachteten Strategien offenbar der Fall. Da das Ergebnis der vorletzten Stufe keine Auswirkung auf das Spiel in der letzten Stufe hat, liegt auch im Teilspiel ab der vorletzten Periode ein Nash-GG vor, usw. Q.E.D. Fazit: Die Wiederholungen der Nash-Gleichgewichte (L, ) bzw. (R, r) sind TPGG. Aber: Es gibt noch weitere TPGG. Beispiel: Periode 1: Beide Spieler spielen (M, m). Periode 2: - Wenn beide Spieler diese Aktionen in Periode 1 gewählt haben, wird in Periode 2 (R, r) gespielt. - Wenn wenigstens einer der beiden Spieler von diesen Aktionen abgewichen ist, wird in Periode 2 (L, ) gespielt. Bemerkungen: Dieses Gleichgewicht führt zur Auszahlung (7, 7), die höher ist als die Auszahlung (6, 6) bei der zweifachen Wiederholung von (R, r). Spieltheorie (Winter 2009/10) 5-8 Prof. Dr. Ana B. Ania In diesem Gleichgewicht wird Kooperation in der ersten Stufe durch die Drohung gestützt, nach einer Abweichung das “schlechte” Gleichgewicht (L, ) zu spielen. Die Drohung ist teilspielperfekt, aber ist sie wirklich glaubwürdig? Was würde passieren, wenn die Spieler zu Beginn jeder Runde kommunizieren könnten? Nachverhandlungen! Betrachte folgendes Spiel: 2 @ @ @ @ @ m r p q L 1, 1 5, 0 0, 0 0, 0 0, 0 M 0, 5 4, 4 0, 0 0, 0 0, 0 R 0, 0 0, 0 3, 3 0, 0 0, 0 P 0, 0 0, 0 0, 0 4, 1 2 0, 0 Q 0, 0 0, 0 0, 0 0, 0 1 1 2, 4 Abb. 5.4: Nachverhandlungssichere Bestrafungen Dieses Spiel hat vier Nash-Gleichgewichte: (L, ), (R, r), (P, p) und (Q, q). Spieltheorie (Winter 2009/10) 5-9 Prof. Dr. Ana B. Ania Betrachte das folgende TPGG: Periode 1: Beide Spieler spielen (M, m). Periode 2: - Wenn in Periode 1 (M, m) gespielt wurde, wird (R, r) gespielt. - Wenn Spieler 1 in Periode 1 abgewichen ist, wird (Q, q) gespielt. - Wenn Spieler 2 in Periode 1 abgewichen ist, wird (P, p) gespielt. - Wenn beide Spieler in Periode 1 abgewichen sind, wird (R, r) gespielt. Bemerkungen: 1) Dieses Gleichgewicht ist nachverhandlungssicher, weil die “Drohgleichgewichte” in Periode 2 Pareto-effizient sind. 2) Für eine ausführliche Diskussion “nachverhandlungssicherer Gleichgewichte” siehe z.B. Fudenberg und Tirole (1991, S. 174ff). 3) Was gespielt wird, wenn beide Spieler abgewichen sind, ist ganz egal. Allgemein gilt: Wenn wir sehen wollen, ob ein TPGG vorliegt, müssen wir nur prüfen, ob unilaterale Abweichungen profitabel sind. Spieltheorie (Winter 2009/10) 5-10 Prof. Dr. Ana B. Ania 5.3 Unendlich oft wiederholte Spiele In vielen endlich oft wiederholten Spielen spielt der “last period effect” eine wichtige Rolle. Wenn klar ist, was in der letzten Runde passiert, ist auch klar, was in der vorletzten Runde passiert, usw. Deshalb ist z.B. in jedem endlich oft wiederholten Gefangenendilemma das einzige Gleichgewicht, nie zu kooperieren, in jedem endlich oft wiederholten Bertrand-Spiel, Preis gleich Grenzkosten zu setzen, usw. Experimente haben gezeigt, dass “last period effects” in den letzten Perioden tatsächlich eine wichtige Rolle spielen, nicht aber in den ersten Perioden eines oft wiederholten Spiels. (Beispiel: Axelrod-Experimente) Am Anfang einer wiederholten Beziehung wird tatsächliches Verhalten besser durch ein unendlich oft wiederholtes Spiel beschrieben, auch wenn es im wörtlichen Sinne natürlich keine unendlich oft wiederholten Spiele gibt. Auszahlungen Es macht keinen Sinn, anzunehmen, dass jeder Spieler die Summe seiner Auszahlungen maximiert. Darum nehmen wir an, dass jeder Spieler den Gegenwartswert seiner abdiskontierten Auszahlungen maximiert. Außerdem werden wir die Auszahlungen durch Multiplikation mit (1 − δ) so normalisieren, dass wir die Auszahlungen des wiederholten Spiels Spieltheorie (Winter 2009/10) 5-11 Prof. Dr. Ana B. Ania direkt mit denen des Stufenspiels vergleichen können. Definition 5.1 Ein unendlich oft wiederholtes Stufenspiel G mit Diskontierungsfaktor δ wird G∞(δ) genannt. Die Auszahlung eines Spielers i in G∞(δ) ist gegeben durch vi = (1 − δ) ∞ t=1 δ t−1ui(ati, at−i). Beispiel: Wenn Spieler i in jeder Runde die Auszahlung 4 bekommt, ist seine Auszahlung im wiederholten Spiel ∞ 1 4 = 4. vi = (1 − δ) δ t−14 = (1 − δ) t=1 1−δ Satz 5.3 Wenn δ hinreichend groß ist, existiert im unendlich oft wiederholten Gefangenendilemma ein TPGG, in dem beide Spieler entlang des Gleichgewichtspfades in allen Perioden kooperieren. Beweis: Betrachte das folgende symmetrische Paar von Strategien für Spieler i und j: “Spiele ‘Kooperation’ in Periode 1 und in allen folgenden Perioden, solange beide Spieler in allen Vorperioden ‘kooperiert’ haben. Sobald wenigstens einer der beiden Spieler einmal ‘Verrat’ gespielt hat, spiele immer ‘Verrat’.” Spieltheorie (Winter 2009/10) 5-12 Prof. Dr. Ana B. Ania Wir nehmen zur Illustration die Auszahlungen aus Abb. 5.1: Wenn beide Spieler sich an diese Strategie halten, erhält jeder die Auszahlung (1 − δ) ∞ t=1 δ t−1 4 = (1 − δ) 1 4=4. 1−δ Wenn ein Spieler in einer Runde als erster abweicht, ist seine Restauszahlung (einschließlich dieser Runde) maximal ⎡ ⎤ ⎡ ⎤ ∞ δ t−1 ⎢ ⎥ ⎦ = 5 − 4δ . δ 1⎦ = (1 − δ) ⎣5 + (1 − δ) ⎣5 + t=2 1−δ Eine solche Abweichung lohnt sich also nur, falls 1 4 < 5 − 4δ ⇔ δ < . 4 Für δ ≥ 14 bilden die obigen Strategien daher ein Nash-GG. Wir müssen noch zeigen, dass dieses Gleichgewicht auch teilspielperfekt ist. Wir haben bereits gezeigt, dass eine Abweichung nach einer Geschichte, in der alle Spieler immer “kooperiert” haben, sich nicht lohnt, wenn δ ≥ 14 . Eine einmalige Abweichung kann sich aber auch nicht lohnen, wenn wenigstens einer der Spieler in der Vergangenheit Spieltheorie (Winter 2009/10) 5-13 Prof. Dr. Ana B. Ania schon einmal “verraten” hat, weil die obigen Strategien danach immer das statische Nash- Gleichgewicht vorschreiben. Also bilden diese Strategien ein TPGG. Q.E.D. Bemerkungen: 1) Diese Strategien heißen “Grim Strategien” oder “Trigger Strategien”. Sie haben den Nachteil, dass mögliche Fehler der Spieler eine Katastrophe auslösen (“doomsday machines”). 2) Kooperation kann aber auch mit anderen Bestrafungsstrategien als TPGG gestützt werden, z.B. mit “Perfect Tit-for-tat” (“Wie Du mir, so ich Dir”): “Spiele ‘Kooperation’ in Periode 1 und immer dann, wenn das Ergebnis in der etzten Periode (‘Kooperation’, ‘Kooperation’) oder (‘Verrat’, ‘Verrat’) war. Spiele ‘Verrat’, falls das Ergebnis in der letzten Periode (‘Verrat’, ‘Kooperation’) oder (‘Kooperation’, ‘Verrat’) war.” Übungsaufgabe: Zeigen Sie, dass “Perfect Tit-fortat” von beiden Spielern tatsächlich ein TPGG ist, falls δ groß genug ist. Benutzen Sie das Einmal-Abweichungsprinzip. (Sie müssen 4 Fälle überprüfen.) Spieltheorie (Winter 2009/10) 5-14 Prof. Dr. Ana B. Ania 5.4 Folk-Theoreme “Folk-Theoreme” sagen, dass “fast alle” Auszahlungsvektoren in einem wiederholten Spiel als Gleichgewichtsauszahlung gestützt werden können, wenn die Spieler hinreichend geduldig sind. Es gibt Folk-Theoreme für verschiedene Gleichgewichtskonzepte (Nash-Gleichgewichte, TPGG, Bayesianische Gleichgewichte, etc.) und für verschiedene Typen von Spielen (vollständige oder unvollständige Information, endlich oder unendlich oft wiederholt, etc.) Wir brauchen zunächst etwas Notation. Sei ai ∈ Ai eine reine Strategie (Aktion) von Spieler i im Stufenspiel, a−i ∈ A−i ein Strategienprofil seiner Gegenspieler und a = (a1, . . . , an) ∈ A = A1 × . . . × An. Entsprechend sei αi eine gemischte Strategie von Spieler i im Stufenspiel. Schließlich sei ui(ai, a−i) die Auszahlung von Spieler i im Stufenspiel, und u(a) das Auszahlungprofil. Definition 5.2 Ein Auszahlungsvektor x ist erreichbar (feasible), wenn es eine Wahrscheinlichkeitsverteilung p über die möglichen reinen Strategientupel des Stufenspiels gibt, die diesen Auszahlungsvektor Spieltheorie (Winter 2009/10) 5-15 generiert: x= a∈A Prof. Dr. Ana B. Ania p(a) u(a). Beispiel: g2 r L 2 1 0 0 R 0 0 1 2 2 6 @ @ @ @ @ 1 1 2 g1 Abb. 5.5: Erreichbare Payoffs im Kampf der Geschlechter Die Menge der “erreichbaren Payoffs” ist also einfach die konvexe Hülle der Auszahlungsvektoren aller reinen Strategienkombinationen des Stufenspiels. Es gibt zwei Möglichkeiten, wie ein erreichbarer Auszahlungsvektor tatsächlich erreicht werden kann. 1) Öffentliche Randomisierung: Die Spieler koordinieren ihr Verhalten mit einen öffentlichen Zufallsgenerator, der es ihnen erlaubt, jeden reinen Strategienvektor mit exakt der gewünschten Wahrscheinlichkeit zu spielen. 2) Die Spieler spielen die reinen Strategienvektoren abwechselnd entsprechend einer Frequenz, die die benötigte Spieltheorie (Winter 2009/10) 5-16 Prof. Dr. Ana B. Ania Wahrscheinlichkeitsverteilung so gut wie möglich approximiert. Wenn die Spieler hinreichend geduldig sind, können sie sich so jedem “erreichbaren’ Auszahlungsvektor beliebig nahe annähern. Damit wir uns mit diesen etwas umständlichen Methoden nicht weiter herumschlagen müssen, werden wir im folgenden zur Vereinfachung annehmen, dass für jeden beliebigen Auszahlungsvektor x ein Profil von (reinen) Aktionen a im Stufenspiel existiert, das genau diesen Auszahlungsvektor x generiert: u(a) = x. Satz 5.4 (Friedman, 1971) Sei G ein endliches Spiel mit vollständiger Information. Sei a∗ ein NashGleichgewicht von G mit Auszahlungsvektor u∗, und x̂ ein erreichbarer Auszahlungsvektor mit der Eigenschaft, dass x̂i > u∗i für alle i ∈ {1, . . . , n}. Falls δ nahe genug bei 1 liegt, existiert ein teilspielperfektes Gleichgewicht in G∞(δ) mit durchschnittlichem Auszahlungsvektor x̂. Beispiele: Wiederholtes Gefangenendilemma, wiederholtes Cournot-Spiel. Spieltheorie (Winter 2009/10) 5-17 Prof. Dr. Ana B. Ania Beweis: Wir argumentieren genau wie oben beim wiederholten Gefangenendilemma. Angenommen, es existiert ein Strategienvektor â, der den Auszahlungsvektor x̂ generiert. Betrachte die folgenden Strategien für Spieler i = 1, . . . , n: “Beginne mit âi in Periode 1. Spiele âi auch in allen folgenden Perioden, solange alle übrigen Spieler â−i gespielt haben. Wenn in der Vergangenheit irgendein Spieler j ∈ {1, . . . , n} zu irgendeinem Zeitpunkt nicht âj gespielt hat, spiele a∗i für immer.” Diese Strategien sind sicherlich teilspielperfekt, sobald ein Bestrafungspfad erreicht wurde. Sind sie auch optimal, solange noch kein Spieler abgewichen ist? Wenn Spieler i abweicht, macht er in der betreffenden Runde maximal einen Abweichungsgewinn in Höhe von {ui(ai, â−i)}−ui(âi, â−i) = max {ui(ai, â−i}−x̂i. di = max a a i i In allen Folgeperioden erhält er u∗i . Also wird Spieler i keinen Anreiz zum Abweichen habenn, falls x̂i ≥ (1 − δ)(di + xi) + δu∗i . Da x̂i > u∗i , existiert ein δ i < 1, so dass diese Ungleichung für δ ≥ δ i gilt. Damit liegt ein TPGG vor, wenn δ ≥ maxi δ i. Q.E.D. Spieltheorie (Winter 2009/10) 5-18 Prof. Dr. Ana B. Ania Interpretation des Folk-Theorems 1) Das Folk-Theorem zeigt, dass der empirische Gehalt der Theorie wiederholter Spiele sehr klein ist. Fast alles kann als Ergebnis eines TPGG erklärt werden. 2) Gleichgewichte eines wiederholten Spiels können als implizite (selbstdurchsetzende) Verträge interpretiert werden. Die Spieler können vor Beginn des Spiels darüber kommunizieren, welches Gleichgewicht sie spielen wollen. Folk-Theoreme zeigen, dass eine Fülle von Verhaltensweisen durch implizite Verträge gestützt werden können. Zusätzliche Annahmen sind erforderlich, um zu erklären, worauf sie sich einigen werden. 3) An den Folk-Theoremen sind vielmals die erreichbaren Auszahlungen selbst weniger interessant als das diese stützende Gerüst von “Strafen” und (bei teilspielperfekten Gleichgewichten im allgemeinen benötigten) “Belohnungen”. Wir wollen jetzt zeigen, dass das Folk-Theorem von Friedman noch weiter verallgemeinert werden kann. Dazu müssen wir zunächst die Minmax-Auszahlung von Spieler i definieren. Spieltheorie (Winter 2009/10) 5-19 Prof. Dr. Ana B. Ania Definition 5.3 Die Minmax-Auszahlung von Spieler i ist definiert durch ⎡ ⎤ max ui(ai, a−i)⎦ . ui = min a a ⎣ −i i In Worten: ui ist die niedrigste Auszahlung, die Spieler i erhalten kann, wenn er die gewählten Aktionen a−i seiner Gegenspieler beobachten und optimal auf sie reagieren kann und alle anderen Spieler gemeinsam versuchen, seine Auszahlung zu minimieren. Kurz gesagt: Dies ist die niedrigste Auszahlung, auf die Spieler i von den anderen Spielern {−i} “herabgedrückt” werden kann, wenn Spieler i eine beste Antwort spielt. Beispiele: Minmax-Auszahlungen im Gefangenendilemma, im Cournot-Spiel. Satz 5.5 In jedem Nash-Gleichgewicht des Stufenspiels wie auch des wiederholten Spiels muss Spieler i wenigstens seine Minmax-Auszahlung ui bekommen. Beweis: In einem Nash-GG des Stufenspiels “weiß” Spieler i, welches Strategientupel a−i seine Gegenspieler spielen werden (konsistente Erwartungen). Da er eine beste Antwort dagegen spielt, muss er wenigsten ui bekommen. Spieltheorie (Winter 2009/10) 5-20 Prof. Dr. Ana B. Ania Im wiederholten Spiel ist die Argumentation etwas komplizierter. Wieder “kennt” Spieler i in jeder Periode das Verhalten seiner Gegenüber. Eine mögliche (wenn auch nicht notwendigerweise optimale) Strategie ist, in jeder Periode eine “kurzfristig” beste Antwort gegen die Aktionen dieser Periode zu spielen. Das muss ihm wenigsten ui in jeder Periode garantieren. Also kann er nicht weniger bekommen, wenn er eine “langfristig” beste Antwort spielt. Q.E.D. Ein Auszahlungsvektor, der jedem Spieler echt mehr als seine Minmax-Auszahlung gibt, wird individuell rational (individually rational) genannt. Der folgende Satz ist das eigentliche “Folk-Theorem” aus den fünfziger Jahren, das keinem Autoren mehr eindeutig zugeordnet werden kann. Satz 5.6 (Folk-Theorem) Sei G ein endliches Spiel mit vollständiger Information. Sei x̂ ein erreichbarer und individuell rationaler Auszahlungsvektor. Wenn δ nahe genug bei 1 liegt, existiert ein Nash-Gleichgewicht in G∞(δ) mit Auszahlungsvektor x̂. Beispiel: Wiederholtes Cournot-Spiel. Spieltheorie (Winter 2009/10) 5-21 Prof. Dr. Ana B. Ania Beweis: Wir nehmen wieder an, dass ein Vektor von Aktionen a existiert, der den Auszahlungsvektor x̂ generiert. Betrachte die folgenden Strategien für Spieler i ∈ {1, . . . , n}: “Spiele ai in Periode 1. Spiele ai auch in allen folgenden Perioden, so lange kein Spieler von dem Strategienvektor a abgewichen ist. Sollte ein Spieler j von a abweichen, wird dieser Spieler von allen übrigen Spielern für alle Zeiten ‘geminmaxt’.” Spieler i hat keinen Anreiz abzuweichen, falls x̂i ≥ (1 − δ)(di + x̂i) + δui. Da x̂i > ui, existiert ein δ i < 1, so dass diese Bedingung für alle δ ≥ δ i erfüllt ist. Für δ ≥ maxi δ i liegt somit ein Nash-GG vor. Q.E.D. Beachten Sie, dass die minmax-Drohung im allgemeinen unglaubwürdig ist, das obige Nash-GG also kein TPGG bildet. Umso überaschender ist das folgende Folk-Theorem: Satz 5.7 (Fudenberg-Maskin, 1986) Sei G ein endliches Zwei-Personen-Spiel mit vollständiger Information. Sei x̂ ein erreichbarer und individuell rationaler Auszahlungsvektor. Falls δ nahe genug bei 1 liegt, existiert ein teilspielperfektes Gleichgewicht in G∞(δ) mit Auszahlungsvektor x̂. Beispiel: Wiederholtes Cournot-Spiel. Spieltheorie (Winter 2009/10) 5-22 Prof. Dr. Ana B. Ania Bemerkungen: 1) Mit einer schwachen technischen Einschränkung gilt dieser Satz auch für Spiele mit mehr als zwei Spielern. 2) Der Beweis ist schwierig und wird hier daher weggelassen (für eine zugängliche Version siehe FudenbergTirole, S. 150ff). 3) Beweisidee: Das Problem besteht darin, dass es nach einer Abweichung für die anderen Spieler nicht optimal ist, die Bestrafung auszuführen. Darum dauert die Bestrafung für Spieler i nicht für immer, sondern nur solange, dass sich für Spieler i eine Abweichung nicht lohnt. Gleichzeitig erhalten die anderen Spieler einen Anreiz, die Bestrafung auszuführen, indem sie nach Ende der Bestrafungsphase “belohnt” werden. Wenn sie dagegen von der Bestrafung abweichen, werden sie selbst für eine gewisse Zeit geminmaxt. Andere Folk-Theoreme Es gibt Folk-Theoreme für: Endlich oft wiederholte Spiele (Benoit-Krishna, 1985, 1987). Hier muss das Stufenspiel mehr als ein Gleichgewicht besitzen. Spieltheorie (Winter 2009/10) 5-23 Prof. Dr. Ana B. Ania Wiederholte Spiele mit “imperfect monitoring”: – Spiele mit imperfekter öffentlicher Information (GreenPorter, 1984, Fudenberg-Levine-Maskin, 1994). – Spiele mit imperfekter privater Information (KandoriMatsushima, 1994). Wiederholte Spiele mit wechselnden Gegenspielern: – Ein langlebiger gegen eine Folge von kurzlebigen Spielern (Fudenberg-Kreps-Maskin, 1990). Kurzlebige Spieler müssen in jeder Periode eine beste Antwort spielen. – Spiele mit überlappenden Generationen von Spielern (Kandori, 1989). – Spiele mit einander zufällig zugeteilten Spielern (Kandori, 1989, Ellison, 1991). Wiederholte Spiele mit asymmetrischer Information (Fudenberg-Maskin, 1986). Für Spiele mit asymmetrischer Information gibt es aber auch Anti-Folk-Theoreme, die zeigen, dass unter bestimmten Bedingungen sehr präzise Vorhersagen in wiederholten Spielen möglich sind (Fudenberg-Levine, 1989, Schmidt, 1993, Cripps-Schmidt-Thomas, 1996). Spieltheorie (Winter 2009/10) 5-24 Prof. Dr. Ana B. Ania 5.5 Kartelle: Wiederholtes Bertrand-Spiel Betrachten Sie ein wiederholtes Bertrand-Spiel: Zwei Duopolisten haben konstante und identische Grenzkosten c > 0. In jeder Periode wählen beide simultan ihre Preise pti. Es gibt T ∈ IN ∪ {∞} Perioden. Die Nachfrage für Unternehmen ben durch ⎧ ⎪ ⎪ D(pti) ⎪ ⎪ ⎪ ⎪ ⎨ Di(pti, ptj ) = ⎪⎪⎪ 21 D(pti) ⎪ ⎪ ⎪ ⎩0 i in Periode t ist gegefalls pti < ptj falls pti = ptj falls pti > ptj . Jedes Unternehmen maximiert Πi = (1 − δ) T t=1 δ t−1(pti − c)Di(pti, ptj ). Endliche Wiederholung (T ∈ IN ) Wenn T = 1, existiert ein eindeutiges Nash-GG, in dem beide Unternehmen pi = pj = c wählen. Wenn 1 < T < ∞, existiert nach Satz 5.1 ein eindeutiges TPGG, in dem beide Spieler in jeder Periode unabhängig von der Geschichte des Spiels Preis = Grenzkosten wählen. Spieltheorie (Winter 2009/10) 5-25 Prof. Dr. Ana B. Ania Ist dieses TPGG überzeugend? Unendliche Wiederholung (T = ∞) Sei Πm der Monopolgewinn und pm der Monopolpreis. Wenn δ ≥ 12 , dann existiert ein TPGG, in dem jeder Duopolist entlang des Gleichgewichtspfades in jeder Periode den Monopolpreis setzt und den halben Monopolgewinn erhält. Durch welche Drohungen außerhalb des Gleichgewichtspfades kann dieses Ergebnis gestützt werden? 5.6 Kartelle: Wiederholtes Cournot-Spiel Der Cournot-Fall ist ein wenig komplizierter: Zwei Duopolisten haben konstante und identische Grenzkosten c > 0. In jeder Periode wählen beide simultan ihre Mengen xti. Es gibt T ∈ IN ∪ {∞} Perioden. Marktpreis: P (x1 + x2) = a − (x1 + x2). Jedes Unternehmen maximiert Πi = (1 − δ) T t=1 δ t−1 P (xt1 + xt2) − c xti. Spieltheorie (Winter 2009/10) 5-26 Prof. Dr. Ana B. Ania Endliche Wiederholung (T ∈ IN ) Wenn T = 1, existiert ein eindeutiges Nash-GG, in dem ≡ xc wählen und den beide Unternehmen xi = a−c 3 2 Cournotgewinn Πc = a−c machen. 3 Wenn 1 < T < ∞, existiert nach Satz 5.1 ein eindeutiges TPGG, in dem beide Spieler in jeder Periode unabhängig von der Geschichte des Spiels xi = xc wählen. Unendliche Wiederholung (T = ∞) Sei xm = a−c die Monopolmenge und Πm = 2 Monopolgewinn. a−c 2 2 der Existiert ein TPGG, in dem jeder Duopolist entlang des Gleichgewichtspfades in jeder Periode die halbe Monopolmenge produziert und den halben Monopolgewinn macht? Trigger-Strategien mit Nash-Drohung: m m “Wähle x2 in der ersten Periode. Produziere x2 in Periode t > 1, wenn beide Firmen in allen vorm angegangenen Perioden ebenfalls x2 gewählt haben. Wenn ein Unternehmen jedoch in irgendeiner m vorangegangenen Periode von x2 abgewichen ist, wähle xc in allen Folgeperioden.” Spieltheorie (Winter 2009/10) 5-27 Prof. Dr. Ana B. Ania Bilden diese Strategien ein TPGG? – Außerhalb des Gleichgewichtspfades: Offensichtlich ja, weil hier immer das Nash-Gleichgewicht des Stufenspiels gespielt wird. – Entlang des Gleichgewichtspfades: Der Anreiz für Spieler i zur Abweichung ist am größten, wenn er in der Abweichungsperiode diejenige Menge wählt, die seine Auszahlung in dieser Periode maximiert, gegeben, dass Spieler j die halbe Monopolmenge wählt: a−c − c) · xi} x̃i = arg max{(a − xi − 4 3(a − c) ⇒ x̃i = 8 2 . Diese Abweichung gibt den Abweichungspayoff 9(a−c) 64 – Spieler i hat keinen Anreiz, vom Gleichgewichtspfad abzuweichen, falls ⎡ ⎛ ⎞ ⎤ ⎛ ⎞ 9(a − c)2 ∞ a − c ⎟2⎥⎥ 1 ⎜ a − c ⎟2 t−1 ⎜ ⎠ ⎦ ≤ ⎝ ⎠ . (1−δ) + δ ⎝ t=2 64 3 2 2 ⎢ ⎢ ⎣ – Diese Bedingung ist erfüllt, falls 9 δ≥ . 17 Spieltheorie (Winter 2009/10) 5-28 Prof. Dr. Ana B. Ania Bemerkungen: 1) Das Resultat zeigt, wie zwei Oligopolisten ein Kartell durch einen “impliziten Vertrag” stützen können. 2) Ein ähnliches Resultat gilt für N > 2 Oligopolisten. Allerdings steigt der minimale Diskontfaktor, der notwendig ist, damit die Monopolmenge gestützt werden kann, mit N . Warum? 3) Interpretation des Diskontierungsfaktors: δ reflektiert die Länge einer Periode, die verstreichen muss, bis die Parteien auf abweichendes Verhalten reagieren können. Wenn die Abweichung unmittelbar beobachtbar und die Ausdehnung der Produktion sehr schnell möglich ist, ist δ sehr nahe bei 1. Wenn Abweichungen nur mit erheblichen Verzögerungen beobachtet werden können und/oder Bestrafungsreaktionen viel Zeit erfordern, dann kann δ deutlich kleiner werden. 4) Es gibt viele andere TPGG: Wenn δ sehr nahe bei 1 ist, können nach Satz 5.7 alle Auszahlungsvektoren (Π1, Π2) gestützt werden, für die gilt: Πi > 0 und Π1 +Π2 ≤ Πm. 5) Die Parteien könnten vorab ein (Rubinstein-)Verhandlungsspiel spielen, indem sie sich über das zu spielende Gleichgewicht einigen. Spieltheorie (Winter 2009/10) 5-29 Prof. Dr. Ana B. Ania 5.8 Zeitkonsistente Geldpolitik Betrachte erneut das Spiel zwischen Zentralbank und privatem Sektor aus Kapitel 3.2.3, aber jetzt unendlich oft wiederholt: In jeder Periode t = 1, . . . , ∞ bilden die Privaten Inflationserwartungen für die laufende Periode πet , wählt die Zentralbank die tatsächliche Inflationsrate π t, bestimmt die Phillips-Kurve ut = un − α(π t − πet ) die Arbeitslosigkeit in dieser Periode. Auszahlungen: Privater Sektor: U = −(1 − δ) Zentralbank: L = −(1 − δ) ∞ t=1 ∞ t=1 δ t−1(π t − πet )2 δ t−1 ut + γ · (π t)2 Im einstufigen Spiel existiert ein eindeutiges TPGG, in dem α wählt und der private Sektor die Zentralbank π ∗ = 2γ ∗ πe = π erwartet. Spieltheorie (Winter 2009/10) 5-30 Prof. Dr. Ana B. Ania Betrachte nun die folgenden Strategien im unendlich oft wiederholten Spiel: Die Privaten erwarten in Periode 1 πe1 = 0. In Periode t, t ≥ 2, erwarten sie ebenfalls πet = 0, falls die Zentralbank in allen Vorperioden π = 0 gewählt hat. Ansonsten erwarten sie πet = π ∗. Wenn die Privaten in t = 1 πe1 = 0 erwarten, wählt die Zentralbank π 1 = 0. Sie bleibt bei dieser Politik in allen Folgeperioden, falls weder sie noch die Privaten vom Gleichgewichtspfad abgewichen sind. Ansonsten wählt sie immer π = π ∗. Sind diese Strategien ein TPGG? Die Privaten können sich durch Abweichen nie beser stellen. Warum? Wenn die Zentralbank abweicht, sollte sie in der Abweichungsperiode π = π ∗ wählen. Unter welcher Bedingung an δ lohnt eine Abweichung nicht? Bemerkungen: 1) In der Literatur ist dieses Gleichgewicht als “ReputationsGleichgewicht” interpretiert worden: Die Zentralbank baut eine Reputation dafür auf, nie zu inflationieren. Spieltheorie (Winter 2009/10) 5-31 Prof. Dr. Ana B. Ania 2) Aber: Es handelt sich hier eher um einen impliziten Vertrag. Eine “Reputation” kann man nur für eine Eigenschaft erwerben, über die unvollständige Information herrscht. Siehe nächstes Kapitel. 5.9 Überlappende Generationen Das folgende Spiel ist auch ein wiederholtes Spiel, obwohl die Menge der Spieler ständig wechselt: In jeder Periode t = 1, . . . , ∞ wird ein Spieler (indiziert mit t) geboren, der für zwei Perioden lebt. In der ersten Periode hat er eine Erstaustattung von 2 Einheiten eines nicht-haltbaren Gutes. In der zweiten Periode ist seine Ausstattung 0. Der Spieler möchte gerne in beiden Perioden konsumieren. Seine Präferenzen über Konsum heute und morgen sind monoton und konvex. Insbesondere gilt: (2, 1) (1, 1) (2, 0) (1, 0) Jeder Spieler hat in der ersten Periode seines Lebens die Möglichkeit, eine Einheit des Gutes an den alten Spieler abzugeben. Spieltheorie (Winter 2009/10) 5-32 Prof. Dr. Ana B. Ania Autarkie Jeder Spieler verhält sich gemäß der folgenden Strategie: “Konsumiere in der ersten Periode Deines Lebens 2 Einheiten und gib nichts ab. Hungere in der zweiten Periode.” Zeigen Sie, dass das ein TPGG ist. Ein Generationenvertrag Die Spieler wählen die folgenden Strategien: “Spieler 1 konsumiert beide Einheiten in Periode 1.” “Spieler 2 gibt eine Einheit an den alten Spieler 1 ab. “Spieler t, t ≥ 3, gibt eine Einheit an Spieler t − 1 ab, falls alle vorangegangenen Spieler (außer Spieler 1) ebenfalls eine Einheit abgegeben haben. Ansonsten konsumiert er beide Einheiten selbst.” Zeigen Sie, dass das ein TPGG ist. Bemerkungen: 1) Dieses Resultat zeigt, dass intergenerationelle Transfers durch einen selbstdurchsetzenden impliziten Vertrag (d.h. als TPGG) gestützt werden können. 2) Problem: Wenn eine Generation abweicht, müssen alle folgenden Generationen darunter leiden, auch wenn sie selbst nicht abgewichen sind. Spieltheorie (Winter 2009/10) 5-33 Prof. Dr. Ana B. Ania 3) Kann man dieses Ergebnis auch mit anderen Gleichgewichtsstrategien stützen, die nach einer gewissen Bestrafungsphase wieder zum alten Gleichgewichtspfad zurückkehren?