5 Wiederholte Spiele 5.1 Einleitung

Werbung
Spieltheorie (Winter 2009/10)
5
5-1
Prof. Dr. Ana B. Ania
Wiederholte Spiele
Literaturhinweise zu Kapitel 5:
Osborne (2004), Kapitel 14
Gibbons (1992), Kapitel 2
Fudenberg und Tirole (1991), Kapitel 5
5.1 Einleitung
Sei G ein beliebiges endliches Spiel in Normalform oder in
extensiver Form. Dann ist GT ein Spiel in extensiver Form,
in dem das Stufenspiel G T -mal hintereinander gespielt
wird, T ∈ IN ∪ {∞}, und in dem alle Spieler zu Beginn
jeder Periode die gesamte bisherige Geschichte des Spiels
kennen.
Beispiele:
Zwei Spieler spielen mehrfach hintereinander das Gefangenendilemma.
N Oligopolisten stehen sich über viele Perioden in einem
Cournot-Spiel gegenüber.
Zentralbank setzt in jeder Periode die Geldmenge, etc.
Klaus M. Schmidt 2007
Spieltheorie (Winter 2009/10)
5-2
Prof. Dr. Ana B. Ania
Bemerkungen:
1) Wiederholte Spiele sind eigentlich nur ein Spezialfall von
dynamischen Spielen.
2) Sie haben jedoch einige interessante Eigenschaften, die
für allgemeine dynamische Spiele nicht gelten.
3) Wiederholte Spiele haben sowohl in der Theorie als auch
in den Anwendungen sehr viel Aufmerksamkeit gefunden.
4) Vorsicht – die folgenden Spiele sind keine wiederholten
Spiele:
– Rubinsteins Verhandlungsspiel.
– Wiederholte Spiele mit sich verändernden Zustandsvariablen, z.B. Oligopolspiel mit Nachfrageträgheit,
Ressourcen-Extrahierungsspiel, Investitionsspiele, etc.
Solche Spiele werden auch “stochastische Spiele” genannt.
Spieltheorie (Winter 2009/10)
5-3
Prof. Dr. Ana B. Ania
5.2 Endlich oft wiederholte Spiele
Angenommen, das Gefangenendilemma wird von 2 Spielern
zweimal hintereinander gespielt.
Spieler 2
r
L
1, 1
5, 0
R
0, 5
4, 4
Spieler 1
Abb. 5.1: Das Gefangenendilemma
Die Auszahlungen der Spieler sind einfach die Summe der
Auszahlungen in den beiden Spielen.
Analyse des Spiels
Stufe 2: Egal was in der 1. Stufe passiert ist, das Gefangenendilemma der zweiten Stufe hat ein eindeutiges NashGleichgewicht: (L, )
Daraus folgt: In jedem teilspielperfekten Nash-Gleichgewicht
muss in der zweiten Stufe (L, ) gespielt werden.
Spieltheorie (Winter 2009/10)
5-4
Prof. Dr. Ana B. Ania
Stufe 1: Was in dieser Stufe passiert, hat keinen Einfluss
auf das Spiel in der zweiten Stufe. Wir können einfach die
Auszahlung (1,1) aus der zweiten Stufe zu denen der ersten
Stufe addieren.
Spieler 2
r
L
2, 2
6, 1
R
1, 6
5, 5
Spieler 1
Abb. 5.2: Reduzierte Normalform des wiederholten
Gefangenendilemmas
Fazit: Auf Stufe 1 sollten beide Spieler “links” spielen.
Das einzige TPGG ist somit, dass beide Spieler in beiden
Stufen “links” wählen:
GG-Strategie von Spieler 1: (L1, L2L2L2L2)
GG-Strategie von Spieler 2: (1, 2222)
Spieltheorie (Winter 2009/10)
5-5
Prof. Dr. Ana B. Ania
Satz 5.1 Wenn das Stufenspiel G ein eindeutiges
Nash-Gleichgewicht hat, dann hat das endlich oft
wiederholte Spiel GT , T < ∞, ein eindeutiges teilspielperfektes Gleichgewicht, nämlich die T -fache Wiederholung des Nash-Gleichgewichts unabhängig von
der Geschichte des Spiels.
Beweis: Folgt unmittelbar aus den Prinzipien der Teilspielperfektheit und der Rückwärtsinduktion, ganz analog zum
Gefangenendilemma oben.
Q.E.D.
Übungsaufgabe: Zeigen Sie, dass im zweimal wiederholten Gefangenendilemma auch das einzige Nash-Gleichgewicht darin besteht, dass beide Parteien in beiden Perioden
“links” spielen.
Spieltheorie (Winter 2009/10)
5-6
Prof. Dr. Ana B. Ania
Betrachte jetzt die zweifache Wiederholung des folgenden
Spiels:
2
@
@
@
@
@
m
r
L
1, 1
5, 0
0, 0
M
0, 5
4, 4
0, 0
R
0, 0
0, 0
3, 3
1
Abb. 5.3: Multiple Nash-Gleichgewichte im Stufenspiel
Frage: Wieviele reine Strategien hat jeder Spieler im zweifach wiederholten Spiel?
Dieses Stufenspiel hat zwei Nash-Gleichgewichte in reinen
Strategien: (L, ) und (R, r).
Satz 5.2 Wenn in jeder Periode unabhängig von der
Geschichte des wiederholten Spiels dasselbe NashGleichgewicht des Stufenspiels gespielt wird, liegt ein
teilspielperfektes Gleichgewicht vor.
Spieltheorie (Winter 2009/10)
5-7
Prof. Dr. Ana B. Ania
Beweis: Teilspielperfektheit verlangt, dass die Strategien für
jedes Teilspiel ein Nash-Gleichgewicht bilden. In der letzten
Stufe ist das bei den betrachteten Strategien offenbar der
Fall. Da das Ergebnis der vorletzten Stufe keine Auswirkung
auf das Spiel in der letzten Stufe hat, liegt auch im Teilspiel
ab der vorletzten Periode ein Nash-GG vor, usw. Q.E.D.
Fazit: Die Wiederholungen der Nash-Gleichgewichte (L, )
bzw. (R, r) sind TPGG.
Aber: Es gibt noch weitere TPGG. Beispiel:
Periode 1: Beide Spieler spielen (M, m).
Periode 2:
- Wenn beide Spieler diese Aktionen in Periode 1
gewählt haben, wird in Periode 2 (R, r) gespielt.
- Wenn wenigstens einer der beiden Spieler von diesen Aktionen abgewichen ist, wird in Periode 2
(L, ) gespielt.
Bemerkungen:
Dieses Gleichgewicht führt zur Auszahlung (7, 7), die
höher ist als die Auszahlung (6, 6) bei der zweifachen
Wiederholung von (R, r).
Spieltheorie (Winter 2009/10)
5-8
Prof. Dr. Ana B. Ania
In diesem Gleichgewicht wird Kooperation in der ersten
Stufe durch die Drohung gestützt, nach einer Abweichung das “schlechte” Gleichgewicht (L, ) zu spielen.
Die Drohung ist teilspielperfekt, aber ist sie wirklich
glaubwürdig? Was würde passieren, wenn die Spieler
zu Beginn jeder Runde kommunizieren könnten? Nachverhandlungen! Betrachte folgendes Spiel:
2
@
@
@
@
@
m
r
p
q
L
1, 1
5, 0
0, 0
0, 0
0, 0
M
0, 5
4, 4
0, 0
0, 0
0, 0
R
0, 0
0, 0
3, 3
0, 0
0, 0
P
0, 0
0, 0
0, 0
4,
1
2
0, 0
Q
0, 0
0, 0
0, 0
0, 0
1
1
2,
4
Abb. 5.4: Nachverhandlungssichere Bestrafungen
Dieses Spiel hat vier Nash-Gleichgewichte: (L, ), (R, r),
(P, p) und (Q, q).
Spieltheorie (Winter 2009/10)
5-9
Prof. Dr. Ana B. Ania
Betrachte das folgende TPGG:
Periode 1: Beide Spieler spielen (M, m).
Periode 2:
- Wenn in Periode 1 (M, m) gespielt wurde, wird
(R, r) gespielt.
- Wenn Spieler 1 in Periode 1 abgewichen ist, wird
(Q, q) gespielt.
- Wenn Spieler 2 in Periode 1 abgewichen ist, wird
(P, p) gespielt.
- Wenn beide Spieler in Periode 1 abgewichen sind,
wird (R, r) gespielt.
Bemerkungen:
1) Dieses Gleichgewicht ist nachverhandlungssicher, weil
die “Drohgleichgewichte” in Periode 2 Pareto-effizient
sind.
2) Für eine ausführliche Diskussion “nachverhandlungssicherer Gleichgewichte” siehe z.B. Fudenberg und Tirole
(1991, S. 174ff).
3) Was gespielt wird, wenn beide Spieler abgewichen sind,
ist ganz egal. Allgemein gilt: Wenn wir sehen wollen, ob
ein TPGG vorliegt, müssen wir nur prüfen, ob unilaterale Abweichungen profitabel sind.
Spieltheorie (Winter 2009/10)
5-10
Prof. Dr. Ana B. Ania
5.3 Unendlich oft wiederholte Spiele
In vielen endlich oft wiederholten Spielen spielt der “last
period effect” eine wichtige Rolle. Wenn klar ist, was in der
letzten Runde passiert, ist auch klar, was in der vorletzten Runde passiert, usw. Deshalb ist z.B. in jedem endlich
oft wiederholten Gefangenendilemma das einzige Gleichgewicht, nie zu kooperieren, in jedem endlich oft wiederholten
Bertrand-Spiel, Preis gleich Grenzkosten zu setzen, usw.
Experimente haben gezeigt, dass “last period effects” in
den letzten Perioden tatsächlich eine wichtige Rolle spielen,
nicht aber in den ersten Perioden eines oft wiederholten
Spiels. (Beispiel: Axelrod-Experimente)
Am Anfang einer wiederholten Beziehung wird tatsächliches
Verhalten besser durch ein unendlich oft wiederholtes
Spiel beschrieben, auch wenn es im wörtlichen Sinne natürlich keine unendlich oft wiederholten Spiele gibt.
Auszahlungen
Es macht keinen Sinn, anzunehmen, dass jeder Spieler die
Summe seiner Auszahlungen maximiert. Darum nehmen wir
an, dass jeder Spieler den Gegenwartswert seiner abdiskontierten Auszahlungen maximiert. Außerdem werden wir die
Auszahlungen durch Multiplikation mit (1 − δ) so normalisieren, dass wir die Auszahlungen des wiederholten Spiels
Spieltheorie (Winter 2009/10)
5-11
Prof. Dr. Ana B. Ania
direkt mit denen des Stufenspiels vergleichen können.
Definition 5.1 Ein unendlich oft wiederholtes Stufenspiel G mit Diskontierungsfaktor δ wird G∞(δ)
genannt. Die Auszahlung eines Spielers i in G∞(δ)
ist gegeben durch
vi = (1 − δ)
∞
t=1
δ t−1ui(ati, at−i).
Beispiel: Wenn Spieler i in jeder Runde die Auszahlung 4
bekommt, ist seine Auszahlung im wiederholten Spiel
∞
1
4 = 4.
vi = (1 − δ) δ t−14 = (1 − δ)
t=1
1−δ
Satz 5.3 Wenn δ hinreichend groß ist, existiert im
unendlich oft wiederholten Gefangenendilemma ein
TPGG, in dem beide Spieler entlang des Gleichgewichtspfades in allen Perioden kooperieren.
Beweis: Betrachte das folgende symmetrische Paar von Strategien für Spieler i und j:
“Spiele ‘Kooperation’ in Periode 1 und in allen folgenden Perioden, solange beide Spieler in allen Vorperioden ‘kooperiert’ haben. Sobald wenigstens einer
der beiden Spieler einmal ‘Verrat’ gespielt hat, spiele
immer ‘Verrat’.”
Spieltheorie (Winter 2009/10)
5-12
Prof. Dr. Ana B. Ania
Wir nehmen zur Illustration die Auszahlungen aus Abb. 5.1:
Wenn beide Spieler sich an diese Strategie halten, erhält
jeder die Auszahlung
(1 − δ)
∞
t=1
δ t−1 4 = (1 − δ)
1
4=4.
1−δ
Wenn ein Spieler in einer Runde als erster abweicht,
ist seine Restauszahlung (einschließlich dieser Runde)
maximal
⎡
⎤
⎡
⎤
∞
δ
t−1
⎢
⎥
⎦ = 5 − 4δ .
δ 1⎦ = (1 − δ) ⎣5 +
(1 − δ) ⎣5 +
t=2
1−δ
Eine solche Abweichung lohnt sich also nur, falls
1
4 < 5 − 4δ ⇔ δ < .
4
Für δ ≥ 14 bilden die obigen Strategien daher ein Nash-GG.
Wir müssen noch zeigen, dass dieses Gleichgewicht auch
teilspielperfekt ist.
Wir haben bereits gezeigt, dass eine Abweichung nach einer
Geschichte, in der alle Spieler immer “kooperiert” haben,
sich nicht lohnt, wenn δ ≥ 14 .
Eine einmalige Abweichung kann sich aber auch nicht lohnen, wenn wenigstens einer der Spieler in der Vergangenheit
Spieltheorie (Winter 2009/10)
5-13
Prof. Dr. Ana B. Ania
schon einmal “verraten” hat, weil die obigen Strategien danach immer das statische Nash- Gleichgewicht vorschreiben.
Also bilden diese Strategien ein TPGG.
Q.E.D.
Bemerkungen:
1) Diese Strategien heißen “Grim Strategien” oder “Trigger Strategien”. Sie haben den Nachteil, dass mögliche Fehler der Spieler eine Katastrophe auslösen (“doomsday machines”).
2) Kooperation kann aber auch mit anderen Bestrafungsstrategien als TPGG gestützt werden, z.B. mit “Perfect Tit-for-tat” (“Wie Du mir, so ich Dir”):
“Spiele ‘Kooperation’ in Periode 1 und immer
dann, wenn das Ergebnis in der etzten Periode
(‘Kooperation’, ‘Kooperation’) oder (‘Verrat’,
‘Verrat’) war. Spiele ‘Verrat’, falls das Ergebnis in
der letzten Periode (‘Verrat’, ‘Kooperation’) oder
(‘Kooperation’, ‘Verrat’) war.”
Übungsaufgabe: Zeigen Sie, dass “Perfect Tit-fortat” von beiden Spielern tatsächlich ein TPGG ist, falls δ
groß genug ist. Benutzen Sie das Einmal-Abweichungsprinzip. (Sie müssen 4 Fälle überprüfen.)
Spieltheorie (Winter 2009/10)
5-14
Prof. Dr. Ana B. Ania
5.4 Folk-Theoreme
“Folk-Theoreme” sagen, dass “fast alle” Auszahlungsvektoren in einem wiederholten Spiel als Gleichgewichtsauszahlung gestützt werden können, wenn die Spieler hinreichend
geduldig sind.
Es gibt Folk-Theoreme für verschiedene Gleichgewichtskonzepte (Nash-Gleichgewichte, TPGG, Bayesianische Gleichgewichte, etc.) und für verschiedene Typen von Spielen (vollständige oder unvollständige Information, endlich oder unendlich oft wiederholt, etc.)
Wir brauchen zunächst etwas Notation.
Sei ai ∈ Ai eine reine Strategie (Aktion) von Spieler i im
Stufenspiel, a−i ∈ A−i ein Strategienprofil seiner Gegenspieler und a = (a1, . . . , an) ∈ A = A1 × . . . × An. Entsprechend sei αi eine gemischte Strategie von Spieler i im
Stufenspiel. Schließlich sei ui(ai, a−i) die Auszahlung von
Spieler i im Stufenspiel, und u(a) das Auszahlungprofil.
Definition 5.2 Ein Auszahlungsvektor x ist erreichbar (feasible), wenn es eine Wahrscheinlichkeitsverteilung p über die möglichen reinen Strategientupel
des Stufenspiels gibt, die diesen Auszahlungsvektor
Spieltheorie (Winter 2009/10)
5-15
generiert:
x=
a∈A
Prof. Dr. Ana B. Ania
p(a) u(a).
Beispiel:
g2
r
L 2 1 0 0
R 0 0 1 2
2
6
@
@
@
@
@
1
1
2 g1
Abb. 5.5: Erreichbare Payoffs im Kampf der Geschlechter
Die Menge der “erreichbaren Payoffs” ist also einfach die
konvexe Hülle der Auszahlungsvektoren aller reinen Strategienkombinationen des Stufenspiels.
Es gibt zwei Möglichkeiten, wie ein erreichbarer Auszahlungsvektor tatsächlich erreicht werden kann.
1) Öffentliche Randomisierung: Die Spieler koordinieren ihr
Verhalten mit einen öffentlichen Zufallsgenerator, der es
ihnen erlaubt, jeden reinen Strategienvektor mit exakt
der gewünschten Wahrscheinlichkeit zu spielen.
2) Die Spieler spielen die reinen Strategienvektoren abwechselnd entsprechend einer Frequenz, die die benötigte
Spieltheorie (Winter 2009/10)
5-16
Prof. Dr. Ana B. Ania
Wahrscheinlichkeitsverteilung so gut wie möglich approximiert. Wenn die Spieler hinreichend geduldig sind,
können sie sich so jedem “erreichbaren’ Auszahlungsvektor beliebig nahe annähern.
Damit wir uns mit diesen etwas umständlichen Methoden
nicht weiter herumschlagen müssen, werden wir im folgenden zur Vereinfachung annehmen, dass für jeden beliebigen
Auszahlungsvektor x ein Profil von (reinen) Aktionen a im
Stufenspiel existiert, das genau diesen Auszahlungsvektor x
generiert: u(a) = x.
Satz 5.4 (Friedman, 1971) Sei G ein endliches
Spiel mit vollständiger Information. Sei a∗ ein NashGleichgewicht von G mit Auszahlungsvektor u∗, und
x̂ ein erreichbarer Auszahlungsvektor mit der Eigenschaft, dass x̂i > u∗i für alle i ∈ {1, . . . , n}. Falls
δ nahe genug bei 1 liegt, existiert ein teilspielperfektes Gleichgewicht in G∞(δ) mit durchschnittlichem Auszahlungsvektor x̂.
Beispiele: Wiederholtes Gefangenendilemma, wiederholtes
Cournot-Spiel.
Spieltheorie (Winter 2009/10)
5-17
Prof. Dr. Ana B. Ania
Beweis: Wir argumentieren genau wie oben beim wiederholten Gefangenendilemma. Angenommen, es existiert ein
Strategienvektor â, der den Auszahlungsvektor x̂ generiert.
Betrachte die folgenden Strategien für Spieler i = 1, . . . , n:
“Beginne mit âi in Periode 1. Spiele âi auch in allen
folgenden Perioden, solange alle übrigen Spieler â−i
gespielt haben. Wenn in der Vergangenheit irgendein
Spieler j ∈ {1, . . . , n} zu irgendeinem Zeitpunkt
nicht âj gespielt hat, spiele a∗i für immer.”
Diese Strategien sind sicherlich teilspielperfekt, sobald ein
Bestrafungspfad erreicht wurde. Sind sie auch optimal, solange noch kein Spieler abgewichen ist?
Wenn Spieler i abweicht, macht er in der betreffenden Runde maximal einen Abweichungsgewinn in Höhe von
{ui(ai, â−i)}−ui(âi, â−i) = max
{ui(ai, â−i}−x̂i.
di = max
a
a
i
i
In allen Folgeperioden erhält er u∗i . Also wird Spieler i keinen
Anreiz zum Abweichen habenn, falls
x̂i ≥ (1 − δ)(di + xi) + δu∗i .
Da x̂i > u∗i , existiert ein δ i < 1, so dass diese Ungleichung
für δ ≥ δ i gilt.
Damit liegt ein TPGG vor, wenn δ ≥ maxi δ i.
Q.E.D.
Spieltheorie (Winter 2009/10)
5-18
Prof. Dr. Ana B. Ania
Interpretation des Folk-Theorems
1) Das Folk-Theorem zeigt, dass der empirische Gehalt der
Theorie wiederholter Spiele sehr klein ist. Fast alles kann
als Ergebnis eines TPGG erklärt werden.
2) Gleichgewichte eines wiederholten Spiels können als implizite (selbstdurchsetzende) Verträge interpretiert werden. Die Spieler können vor Beginn des Spiels darüber
kommunizieren, welches Gleichgewicht sie spielen wollen. Folk-Theoreme zeigen, dass eine Fülle von Verhaltensweisen durch implizite Verträge gestützt werden können.
Zusätzliche Annahmen sind erforderlich, um zu erklären,
worauf sie sich einigen werden.
3) An den Folk-Theoremen sind vielmals die erreichbaren
Auszahlungen selbst weniger interessant als das diese
stützende Gerüst von “Strafen” und (bei teilspielperfekten Gleichgewichten im allgemeinen benötigten) “Belohnungen”.
Wir wollen jetzt zeigen, dass das Folk-Theorem von Friedman noch weiter verallgemeinert werden kann.
Dazu müssen wir zunächst die Minmax-Auszahlung von
Spieler i definieren.
Spieltheorie (Winter 2009/10)
5-19
Prof. Dr. Ana B. Ania
Definition 5.3 Die Minmax-Auszahlung von Spieler i ist definiert durch
⎡
⎤
max
ui(ai, a−i)⎦ .
ui = min
a
a
⎣
−i
i
In Worten: ui ist die niedrigste Auszahlung, die Spieler i erhalten kann, wenn er die gewählten Aktionen
a−i seiner Gegenspieler beobachten und optimal auf
sie reagieren kann und alle anderen Spieler gemeinsam versuchen, seine Auszahlung zu minimieren.
Kurz gesagt: Dies ist die niedrigste Auszahlung, auf die Spieler i von den anderen Spielern {−i} “herabgedrückt” werden kann, wenn Spieler i eine beste Antwort spielt.
Beispiele: Minmax-Auszahlungen im Gefangenendilemma,
im Cournot-Spiel.
Satz 5.5 In jedem Nash-Gleichgewicht des Stufenspiels wie auch des wiederholten Spiels muss Spieler
i wenigstens seine Minmax-Auszahlung ui bekommen.
Beweis: In einem Nash-GG des Stufenspiels “weiß” Spieler i,
welches Strategientupel a−i seine Gegenspieler spielen werden (konsistente Erwartungen). Da er eine beste Antwort
dagegen spielt, muss er wenigsten ui bekommen.
Spieltheorie (Winter 2009/10)
5-20
Prof. Dr. Ana B. Ania
Im wiederholten Spiel ist die Argumentation etwas komplizierter. Wieder “kennt” Spieler i in jeder Periode das Verhalten seiner Gegenüber. Eine mögliche (wenn auch nicht
notwendigerweise optimale) Strategie ist, in jeder Periode
eine “kurzfristig” beste Antwort gegen die Aktionen dieser
Periode zu spielen. Das muss ihm wenigsten ui in jeder Periode garantieren. Also kann er nicht weniger bekommen,
wenn er eine “langfristig” beste Antwort spielt. Q.E.D.
Ein Auszahlungsvektor, der jedem Spieler echt mehr als seine Minmax-Auszahlung gibt, wird individuell rational (individually rational) genannt.
Der folgende Satz ist das eigentliche “Folk-Theorem” aus
den fünfziger Jahren, das keinem Autoren mehr eindeutig
zugeordnet werden kann.
Satz 5.6 (Folk-Theorem) Sei G ein endliches Spiel
mit vollständiger Information. Sei x̂ ein erreichbarer
und individuell rationaler Auszahlungsvektor. Wenn
δ nahe genug bei 1 liegt, existiert ein Nash-Gleichgewicht in G∞(δ) mit Auszahlungsvektor x̂.
Beispiel: Wiederholtes Cournot-Spiel.
Spieltheorie (Winter 2009/10)
5-21
Prof. Dr. Ana B. Ania
Beweis: Wir nehmen wieder an, dass ein Vektor von Aktionen a existiert, der den Auszahlungsvektor x̂ generiert. Betrachte die folgenden Strategien für Spieler i ∈ {1, . . . , n}:
“Spiele ai in Periode 1. Spiele ai auch in allen folgenden Perioden, so lange kein Spieler von dem Strategienvektor a abgewichen ist. Sollte ein Spieler j von
a abweichen, wird dieser Spieler von allen übrigen
Spielern für alle Zeiten ‘geminmaxt’.”
Spieler i hat keinen Anreiz abzuweichen, falls
x̂i ≥ (1 − δ)(di + x̂i) + δui.
Da x̂i > ui, existiert ein δ i < 1, so dass diese Bedingung
für alle δ ≥ δ i erfüllt ist. Für δ ≥ maxi δ i liegt somit ein
Nash-GG vor.
Q.E.D.
Beachten Sie, dass die minmax-Drohung im allgemeinen unglaubwürdig ist, das obige Nash-GG also kein TPGG bildet.
Umso überaschender ist das folgende Folk-Theorem:
Satz 5.7 (Fudenberg-Maskin, 1986) Sei G ein
endliches Zwei-Personen-Spiel mit vollständiger Information. Sei x̂ ein erreichbarer und individuell rationaler Auszahlungsvektor. Falls δ nahe genug bei
1 liegt, existiert ein teilspielperfektes Gleichgewicht in G∞(δ) mit Auszahlungsvektor x̂.
Beispiel: Wiederholtes Cournot-Spiel.
Spieltheorie (Winter 2009/10)
5-22
Prof. Dr. Ana B. Ania
Bemerkungen:
1) Mit einer schwachen technischen Einschränkung gilt dieser Satz auch für Spiele mit mehr als zwei Spielern.
2) Der Beweis ist schwierig und wird hier daher weggelassen (für eine zugängliche Version siehe FudenbergTirole, S. 150ff).
3) Beweisidee: Das Problem besteht darin, dass es nach
einer Abweichung für die anderen Spieler nicht optimal
ist, die Bestrafung auszuführen. Darum dauert die Bestrafung für Spieler i nicht für immer, sondern nur solange, dass sich für Spieler i eine Abweichung nicht lohnt.
Gleichzeitig erhalten die anderen Spieler einen Anreiz,
die Bestrafung auszuführen, indem sie nach Ende der
Bestrafungsphase “belohnt” werden. Wenn sie dagegen
von der Bestrafung abweichen, werden sie selbst für eine
gewisse Zeit geminmaxt.
Andere Folk-Theoreme
Es gibt Folk-Theoreme für:
Endlich oft wiederholte Spiele (Benoit-Krishna, 1985,
1987). Hier muss das Stufenspiel mehr als ein Gleichgewicht besitzen.
Spieltheorie (Winter 2009/10)
5-23
Prof. Dr. Ana B. Ania
Wiederholte Spiele mit “imperfect monitoring”:
– Spiele mit imperfekter öffentlicher Information (GreenPorter, 1984, Fudenberg-Levine-Maskin, 1994).
– Spiele mit imperfekter privater Information (KandoriMatsushima, 1994).
Wiederholte Spiele mit wechselnden Gegenspielern:
– Ein langlebiger gegen eine Folge von kurzlebigen Spielern (Fudenberg-Kreps-Maskin, 1990). Kurzlebige Spieler müssen in jeder Periode eine beste Antwort spielen.
– Spiele mit überlappenden Generationen von Spielern
(Kandori, 1989).
– Spiele mit einander zufällig zugeteilten Spielern (Kandori, 1989, Ellison, 1991).
Wiederholte Spiele mit asymmetrischer Information
(Fudenberg-Maskin, 1986).
Für Spiele mit asymmetrischer Information gibt es aber auch
Anti-Folk-Theoreme, die zeigen, dass unter bestimmten Bedingungen sehr präzise Vorhersagen in wiederholten Spielen möglich sind (Fudenberg-Levine, 1989, Schmidt, 1993,
Cripps-Schmidt-Thomas, 1996).
Spieltheorie (Winter 2009/10)
5-24
Prof. Dr. Ana B. Ania
5.5 Kartelle: Wiederholtes Bertrand-Spiel
Betrachten Sie ein wiederholtes Bertrand-Spiel:
Zwei Duopolisten haben konstante und identische Grenzkosten c > 0.
In jeder Periode wählen beide simultan ihre Preise pti.
Es gibt T ∈ IN ∪ {∞} Perioden.
Die Nachfrage für Unternehmen
ben durch
⎧
⎪
⎪
D(pti)
⎪
⎪
⎪
⎪
⎨
Di(pti, ptj ) = ⎪⎪⎪ 21 D(pti)
⎪
⎪
⎪
⎩0
i in Periode t ist gegefalls pti < ptj
falls pti = ptj
falls pti > ptj .
Jedes Unternehmen maximiert
Πi = (1 − δ)
T
t=1
δ t−1(pti − c)Di(pti, ptj ).
Endliche Wiederholung (T ∈ IN )
Wenn T = 1, existiert ein eindeutiges Nash-GG, in dem
beide Unternehmen pi = pj = c wählen.
Wenn 1 < T < ∞, existiert nach Satz 5.1 ein eindeutiges TPGG, in dem beide Spieler in jeder Periode unabhängig von der Geschichte des Spiels Preis = Grenzkosten wählen.
Spieltheorie (Winter 2009/10)
5-25
Prof. Dr. Ana B. Ania
Ist dieses TPGG überzeugend?
Unendliche Wiederholung (T = ∞)
Sei Πm der Monopolgewinn und pm der Monopolpreis.
Wenn δ ≥ 12 , dann existiert ein TPGG, in dem jeder
Duopolist entlang des Gleichgewichtspfades in jeder Periode den Monopolpreis setzt und den halben Monopolgewinn erhält.
Durch welche Drohungen außerhalb des Gleichgewichtspfades kann dieses Ergebnis gestützt werden?
5.6 Kartelle: Wiederholtes Cournot-Spiel
Der Cournot-Fall ist ein wenig komplizierter:
Zwei Duopolisten haben konstante und identische Grenzkosten c > 0.
In jeder Periode wählen beide simultan ihre Mengen xti.
Es gibt T ∈ IN ∪ {∞} Perioden.
Marktpreis: P (x1 + x2) = a − (x1 + x2).
Jedes Unternehmen maximiert
Πi = (1 − δ)
T
t=1
δ t−1 P (xt1 + xt2) − c xti.
Spieltheorie (Winter 2009/10)
5-26
Prof. Dr. Ana B. Ania
Endliche Wiederholung (T ∈ IN )
Wenn T = 1, existiert ein eindeutiges Nash-GG, in dem
≡ xc wählen und den
beide Unternehmen xi = a−c
3
2
Cournotgewinn Πc = a−c
machen.
3
Wenn 1 < T < ∞, existiert nach Satz 5.1 ein eindeutiges TPGG, in dem beide Spieler in jeder Periode unabhängig von der Geschichte des Spiels xi = xc wählen.
Unendliche Wiederholung (T = ∞)
Sei xm = a−c
die Monopolmenge und Πm =
2
Monopolgewinn.
a−c 2
2
der
Existiert ein TPGG, in dem jeder Duopolist entlang des
Gleichgewichtspfades in jeder Periode die halbe Monopolmenge produziert und den halben Monopolgewinn
macht?
Trigger-Strategien mit Nash-Drohung:
m
m
“Wähle x2 in der ersten Periode. Produziere x2
in Periode t > 1, wenn beide Firmen in allen vorm
angegangenen Perioden ebenfalls x2 gewählt haben. Wenn ein Unternehmen jedoch in irgendeiner
m
vorangegangenen Periode von x2 abgewichen ist,
wähle xc in allen Folgeperioden.”
Spieltheorie (Winter 2009/10)
5-27
Prof. Dr. Ana B. Ania
Bilden diese Strategien ein TPGG?
– Außerhalb des Gleichgewichtspfades: Offensichtlich
ja, weil hier immer das Nash-Gleichgewicht des Stufenspiels gespielt wird.
– Entlang des Gleichgewichtspfades: Der Anreiz für Spieler i zur Abweichung ist am größten, wenn er in der
Abweichungsperiode diejenige Menge wählt, die seine Auszahlung in dieser Periode maximiert, gegeben,
dass Spieler j die halbe Monopolmenge wählt:
a−c
− c) · xi}
x̃i = arg max{(a − xi −
4
3(a − c)
⇒ x̃i =
8
2
.
Diese Abweichung gibt den Abweichungspayoff 9(a−c)
64
– Spieler i hat keinen Anreiz, vom Gleichgewichtspfad
abzuweichen, falls
⎡
⎛
⎞ ⎤
⎛
⎞
9(a − c)2 ∞
a − c ⎟2⎥⎥ 1 ⎜ a − c ⎟2
t−1 ⎜
⎠ ⎦ ≤
⎝
⎠ .
(1−δ)
+ δ ⎝
t=2
64
3
2
2
⎢
⎢
⎣
– Diese Bedingung ist erfüllt, falls
9
δ≥ .
17
Spieltheorie (Winter 2009/10)
5-28
Prof. Dr. Ana B. Ania
Bemerkungen:
1) Das Resultat zeigt, wie zwei Oligopolisten ein Kartell
durch einen “impliziten Vertrag” stützen können.
2) Ein ähnliches Resultat gilt für N > 2 Oligopolisten.
Allerdings steigt der minimale Diskontfaktor, der notwendig ist, damit die Monopolmenge gestützt werden
kann, mit N . Warum?
3) Interpretation des Diskontierungsfaktors: δ reflektiert die
Länge einer Periode, die verstreichen muss, bis die Parteien auf abweichendes Verhalten reagieren können. Wenn
die Abweichung unmittelbar beobachtbar und die Ausdehnung der Produktion sehr schnell möglich ist, ist δ
sehr nahe bei 1. Wenn Abweichungen nur mit erheblichen Verzögerungen beobachtet werden können und/oder
Bestrafungsreaktionen viel Zeit erfordern, dann kann δ
deutlich kleiner werden.
4) Es gibt viele andere TPGG: Wenn δ sehr nahe bei 1 ist,
können nach Satz 5.7 alle Auszahlungsvektoren (Π1, Π2)
gestützt werden, für die gilt: Πi > 0 und Π1 +Π2 ≤ Πm.
5) Die Parteien könnten vorab ein (Rubinstein-)Verhandlungsspiel spielen, indem sie sich über das zu spielende
Gleichgewicht einigen.
Spieltheorie (Winter 2009/10)
5-29
Prof. Dr. Ana B. Ania
5.8 Zeitkonsistente Geldpolitik
Betrachte erneut das Spiel zwischen Zentralbank und privatem Sektor aus Kapitel 3.2.3, aber jetzt unendlich oft
wiederholt:
In jeder Periode t = 1, . . . , ∞
bilden die Privaten Inflationserwartungen für die laufende Periode πet ,
wählt die Zentralbank die tatsächliche Inflationsrate π t,
bestimmt die Phillips-Kurve
ut = un − α(π t − πet )
die Arbeitslosigkeit in dieser Periode.
Auszahlungen:
Privater Sektor:
U = −(1 − δ)
Zentralbank:
L = −(1 − δ)
∞
t=1
∞
t=1
δ t−1(π t − πet )2
δ t−1 ut + γ · (π t)2
Im einstufigen Spiel existiert ein eindeutiges TPGG, in dem
α
wählt und der private Sektor
die Zentralbank π ∗ = 2γ
∗
πe = π erwartet.
Spieltheorie (Winter 2009/10)
5-30
Prof. Dr. Ana B. Ania
Betrachte nun die folgenden Strategien im unendlich oft
wiederholten Spiel:
Die Privaten erwarten in Periode 1 πe1 = 0. In Periode
t, t ≥ 2, erwarten sie ebenfalls πet = 0, falls die Zentralbank in allen Vorperioden π = 0 gewählt hat. Ansonsten
erwarten sie πet = π ∗.
Wenn die Privaten in t = 1 πe1 = 0 erwarten, wählt die
Zentralbank π 1 = 0. Sie bleibt bei dieser Politik in allen
Folgeperioden, falls weder sie noch die Privaten vom
Gleichgewichtspfad abgewichen sind. Ansonsten wählt
sie immer π = π ∗.
Sind diese Strategien ein TPGG?
Die Privaten können sich durch Abweichen nie beser
stellen. Warum?
Wenn die Zentralbank abweicht, sollte sie in der Abweichungsperiode π = π ∗ wählen. Unter welcher Bedingung an δ lohnt eine Abweichung nicht?
Bemerkungen:
1) In der Literatur ist dieses Gleichgewicht als “ReputationsGleichgewicht” interpretiert worden: Die Zentralbank baut
eine Reputation dafür auf, nie zu inflationieren.
Spieltheorie (Winter 2009/10)
5-31
Prof. Dr. Ana B. Ania
2) Aber: Es handelt sich hier eher um einen impliziten Vertrag. Eine “Reputation” kann man nur für eine Eigenschaft erwerben, über die unvollständige Information herrscht.
Siehe nächstes Kapitel.
5.9 Überlappende Generationen
Das folgende Spiel ist auch ein wiederholtes Spiel, obwohl
die Menge der Spieler ständig wechselt:
In jeder Periode t = 1, . . . , ∞ wird ein Spieler (indiziert
mit t) geboren, der für zwei Perioden lebt. In der ersten
Periode hat er eine Erstaustattung von 2 Einheiten eines
nicht-haltbaren Gutes. In der zweiten Periode ist seine
Ausstattung 0.
Der Spieler möchte gerne in beiden Perioden konsumieren. Seine Präferenzen über Konsum heute und morgen
sind monoton und konvex. Insbesondere gilt:
(2, 1) (1, 1) (2, 0) (1, 0)
Jeder Spieler hat in der ersten Periode seines Lebens die
Möglichkeit, eine Einheit des Gutes an den alten Spieler
abzugeben.
Spieltheorie (Winter 2009/10)
5-32
Prof. Dr. Ana B. Ania
Autarkie
Jeder Spieler verhält sich gemäß der folgenden Strategie:
“Konsumiere in der ersten Periode Deines Lebens 2
Einheiten und gib nichts ab. Hungere in der zweiten
Periode.”
Zeigen Sie, dass das ein TPGG ist.
Ein Generationenvertrag
Die Spieler wählen die folgenden Strategien:
“Spieler 1 konsumiert beide Einheiten in Periode 1.”
“Spieler 2 gibt eine Einheit an den alten Spieler 1 ab.
“Spieler t, t ≥ 3, gibt eine Einheit an Spieler t − 1
ab, falls alle vorangegangenen Spieler (außer Spieler 1)
ebenfalls eine Einheit abgegeben haben. Ansonsten konsumiert er beide Einheiten selbst.”
Zeigen Sie, dass das ein TPGG ist.
Bemerkungen:
1) Dieses Resultat zeigt, dass intergenerationelle Transfers durch einen selbstdurchsetzenden impliziten Vertrag
(d.h. als TPGG) gestützt werden können.
2) Problem: Wenn eine Generation abweicht, müssen alle
folgenden Generationen darunter leiden, auch wenn sie
selbst nicht abgewichen sind.
Spieltheorie (Winter 2009/10)
5-33
Prof. Dr. Ana B. Ania
3) Kann man dieses Ergebnis auch mit anderen Gleichgewichtsstrategien stützen, die nach einer gewissen Bestrafungsphase wieder zum alten Gleichgewichtspfad zurückkehren?
Herunterladen