Spieltheorie V

Werbung
Spieltheorie
Winter 2013/14
Professor Dezsö Szalay
3. Wiederholte Spiele
Dynamische Spiele werden sehr schnell zu komplex um
sie zu analysieren.
Eine Klasse von Spielen, die man jedoch relativ gut versteht sind wiederholte Spiele.
3.1. Wiederholte Spiele mit endlichem Horizont
Betrachten Sie folgendes Normalformspiel (das Gefangenendilemma):
Spieler 1
L1
R1
Spieler 2
L2
1,1
0,5
R2
5,0
4,4
Im Vergleich zum einfachen Gefangenendilemma, nehmen
wir an, die Spieler tre¤en sich zweimal. (Vielleicht werden notorische Straftäter sequentiell zu zwei verschiedenen Verbrechen verhört...)
Wir bezeichnen das obenstehende Normalformspiel als
das stage game. Das Spiel insgesamt besteht aus dem
zweimaligen Spielen des stage games. (Stufenspiel).
Welches Verhalten sollten wir erwarten in dieser zweimaligen Interaktion?
Es handelt sich um ein endlich of wiederholtes Spiel; daher können wir das Spiel rückwärts in der Zeit lösen.
In der zweiten Stufe:
Das stage game besitzt ein eindeutiges Nashgleichgewicht
in dominanten Strategien. Das Nashgleichgewicht ist
(L1; L2) :
Daher ist das Spiel aus Sicht der ersten Stufe das folgende:
Spieler 1
L1
R1
Spieler 2
L2
2,2
1,6
R2
6,1
5,5
Beachte: dies ist nicht mehr das stage game, sondern
das verbleibenden Teilspiel (welches mit dem gesamten
Spiel zusammenfällt), wenn wir für die zweite Stufe das
teilspielperfekte Ergebnis vorraussehen.
Dieses Spiel besitzt wiederum ein eindeutiges Nashgleichgewicht in dominanten Strategien.
Die Einsicht lässt sich verallgemeinern.
Sei G = fA1; : : : ; An; u1; : : : ; ung ein Stufenspiel mit
n Spielern. Sei G (T ) das Spiel das resultiert, wenn das
Stufenspiel T mal nacheinander gespielt wird. Formal,
de…nieren wir die Spielstruktur wie folgt:
De…nition: Gegeben ein Stufenspiel G; sei G (T ) ein
endlich wiederholtes Spiel in dem G T mal gespielt wird
und in dem die Ergebnisse der vorhergehenden Runden
beobachtet werden bevor die nächste Runde gespielt wird.
Die Auszahlungen im Spiel G (T ) sind gleich der Summe
der payo¤s aus dem Spiel G:
Satz: Wenn das Stufenspiel G ein eindeutiges Nashgleichgewicht besitzt, dann besitzt das Spiel G (T ) ein eindeutiges teilspielperfektes Ergebnis, für alle endlichen T :
die Spieler spielen die Nash-Strategien in jeder Stufe des
Spiels.
Betrachten Sie nun ein etwas komplizierteres Stufenspiel
Spieler 1
L1
M1
R1
L2
1,1
0,5
0,0
Spieler 2
M2
5,0
4,4
0,0
R2
0,0
0,0
3,3
Das Stufenspiel wird zweimal gespielt.
Das Stufenspiel besitzt zwei Nashgleichgewichte: (L1; L2)
und (R1; R2) :
In einem teilspielperfekten Gleichgewicht müssen die Spieler
somit in der zweiten Stufe entweder (L1; L2) oder (R1; R2)
spielen.
Wieviele Strategien haben die Spieler für das gesamte
Spiel?
Eine Strategie spezi…ziert einen vollständigen Handlungsplan für jede Eventualität. Somit:
eine Aktion in Periode 1 und eine Aktion in Periode 2 für
jede Eventualität, die in Periode 2 auftreten kann.
In der zweiten Stufe können die Spieler auf das Ergebnis
der ersten Stufe bedingen: beide beobachten das Ergebnis bevor sie in Stufe zwei interagieren.
Daher haben die Spieler insgesamt 3x39 = 310 Strategien.
Die beobachteten Ergebnisse der vergangenen Stufen werden als histories bezeichnet. Daher gibt es im vorliegenden Spiel 9 mögliche histories am Ende der Stufe 1 und
81 terminal histories am Ende der Stufe 2.
Durch Teilspielperfektheit reduzieren sich die Anzahl der
Strategien, die in der zweiten Stufe gespielt werden können (sinnvollerweise gespielt werden).
Wenn wir uns auf reine Strategien beschränken, dann
wird in Periode 2 entweder (L1; L2) oder (R1; R2) gespielt.
Es gibt immer teilspielperfekte Gleichgewichte mit Ergebnissen (outcomes) des Typs:
In Stufe 1 wird (L1; L2) gespielt, in Stufe 2 wird (L1; L2)
In Stufe 1 wird (L1; L2) gespielt, in Stufe 2 wird (R1; R2)
In Stufe 1 wird (R1; R2) gespielt, in Stufe 2 wird (R1; R2)
In Stufe 1 wird (R1; R2) gespielt, in Stufe 2 wird (L1; L2) :
Gibt es auch andere teilspielperfekte Gleichgewichte?
Folgender Kandidat:
Das outcome der Stufe 2 ist gleich (R1; R2) wenn das
outcome der Stufe 1 (M1; M2) : Sonst ist das outcome
der Stufe 2 gleich (L1; L2) :
Aus Sicht der Periode 1 präsentiert sich das Spiel dann
wie folgt:
Spieler 1
L1
M1
R1
L2
2,2
1,6
1,1
Spieler 2
M2
6,1
7,7
1,1
R2
1,1
1,1
4,4
Dieses Spiel hat nun 3 Nashgleichgewichte in reinen Strategien:
(L1; L2) ; (M1; M2) und (R1; R2) :
Daher können wir das folgende teilspielperfekte Gleichgewicht
stützen:
Spieler 1: In Periode 1, spiele M1: In Periode 2, spiele
R1 wenn das outcome der Periode 1 gleich (M1; M2) ist;
spiele L1 sonst.
Spieler 2: In Periode 1, spiele M2: In Periode 2, spiele
R2 wenn das outcome der Periode 1 gleich (M1; M2) ist;
spiele L2 sonst.
Schlussfolgerungen aus dem Beispiel:
Sei G ein statisches Normalformspiel mit mehreren Nashgleichgewichten. Dann ist es möglich, dass das Spiel
G (T ) (das resultiert wenn G T mal hintereinander gespielt
wird) ein teilspielperfektes Nashgleichgewicht besitzt, in
dem das Ergebnis des Spiels in jeder Periode t < T nicht
Nash ist.
Grundidee: wir können Kooperation stützen in wiederholten Spielen.
Kooperation am Anfang des Spiels (in Stufe 1) wird mit
einem für alle angenehmen Ergebnis in Stufe 2 belohnt.
Nichtkooperation in Stufe 1 wird durch ein unangenehmes
Ergebnis in Stufe 2 bestraft.
Kritik am Beispiel
Teilspielperfektheit schliesst unglaubwürdige Drohungen
aus.
Das beschriebene Gleichgewicht ist teilspielperfekt. Man
koordiniert sich jedoch auf ein pareto ine¢ zientes Ergebnis in Stufe 2 wenn in Stufe 1 nicht kooperiert wurde.
D.h. beide könnten sich besserstellen, wenn in Stufe 2
das Ergebnis (R1; R2) gespielt würde.
Überlebt die Idee, dass wir Kooperation stützen können
in wiederholten Spielen, wenn wir uns auf Gleichgewichte
beschränken, in denen nur pareto e¢ ziente Gleichgewichte
gespielt werden in Stufe 2?
Betrachten Sie das folgende Spiel:
Spieler 1
L1
M1
R1
P1
Q1
L2
1,1
0,5
0,0
0,0
0,0
M2
5,0
4,4
0,0
0,0
0,0
Spieler 2
R2
0,0
0,0
3,3
0,0
0,0
P2
0,0
0,0
0,0
4, 12
0,0
Q2
0,0
0,0
0,0
0,0
1; 4
2
Die statischen Nashgleichgewichte dieses Stufenspiels sind
(L1; L2) ; (R1; R2) ; (P1; P2) und (Q1; Q2) :
Während die Spieler gleichgerichtete Präferenzen haben
bezüglich der outcomes (L1; L2) versus (R1; R2) ; gilt dies
nicht für die outcomes (P1; P2) und (Q1; Q2) :
Spieler 1 bevorzugt outcome (P1; P2) gegenüber outcome (Q1; Q2) :
Spieler 2 bevorzugt outcome (Q1; Q2) gegenüber outcome (P1; P2) :
Die Einsicht:
Wir können wiederum ein Gleichgewicht stützen, in dem
in Stufe 1 kooperiert wird. Wir tun dies indem wir einem
nicht-kooperierenden Spieler mit Strafe drohen. Wenn 1
nicht kooperiert, dann wird das Ergebnis (Q1; Q2) gespielt
in Stufe 2. Wenn 2 nicht kooperiert, dann wird (P1; P2)
gespielt in Stufe 2.
Das teilspielperfekte Gleichgewicht, das wir so konstruieren können ist rückverhandlungssicher (renegotiation proof).
Konkret können wir ein Gleichgewicht in den folgenden
Strategien stützen:
Spieler 1: Spiele M1 in der ersten Stufe; in der zweiten
Stufe, spiele R1 wenn das Erststufen-outcome (M1;M2)
ist oder (x,y) wobei x6=M1 und y6=M2: Wenn das Erststufenoutcome (M1;z) ist, für alle z6=M2; dann spiele P1: Wenn
das Erststufen-outcome (w,M2) ist, für alle w6=M1; dann
spiele Q1:
Spieler 2: Spiele M2 in der ersten Stufe; in der zweiten
Stufe, spiele R2 wenn das Erststufen-outcome (M1;M2)
ist oder (x,y) wobei x6=M1 und y6=M2: Wenn das Erststufenoutcome (z,M2) ist, für alle z6=M1 (dann spiele Q2: Wenn
das Erststufen-outcome (M1;w) ist, für alle w6=M2; dann
spiele P2:
Zu beachten: für den Fall, dass der andere Spieler in
Stufe 1 abweicht, sieht die Strategie in Periode 2 eine
Belohnung vor für denjenigen, der den anderen Spieler
bestrafen soll.
Daher hat der Strafvollzieher kein Interesse, die Bestrafung neu zu verhandeln.
Herunterladen