Spieltheorie Winter 2013/14 Professor Dezsö Szalay 3. Wiederholte Spiele Dynamische Spiele werden sehr schnell zu komplex um sie zu analysieren. Eine Klasse von Spielen, die man jedoch relativ gut versteht sind wiederholte Spiele. 3.1. Wiederholte Spiele mit endlichem Horizont Betrachten Sie folgendes Normalformspiel (das Gefangenendilemma): Spieler 1 L1 R1 Spieler 2 L2 1,1 0,5 R2 5,0 4,4 Im Vergleich zum einfachen Gefangenendilemma, nehmen wir an, die Spieler tre¤en sich zweimal. (Vielleicht werden notorische Straftäter sequentiell zu zwei verschiedenen Verbrechen verhört...) Wir bezeichnen das obenstehende Normalformspiel als das stage game. Das Spiel insgesamt besteht aus dem zweimaligen Spielen des stage games. (Stufenspiel). Welches Verhalten sollten wir erwarten in dieser zweimaligen Interaktion? Es handelt sich um ein endlich of wiederholtes Spiel; daher können wir das Spiel rückwärts in der Zeit lösen. In der zweiten Stufe: Das stage game besitzt ein eindeutiges Nashgleichgewicht in dominanten Strategien. Das Nashgleichgewicht ist (L1; L2) : Daher ist das Spiel aus Sicht der ersten Stufe das folgende: Spieler 1 L1 R1 Spieler 2 L2 2,2 1,6 R2 6,1 5,5 Beachte: dies ist nicht mehr das stage game, sondern das verbleibenden Teilspiel (welches mit dem gesamten Spiel zusammenfällt), wenn wir für die zweite Stufe das teilspielperfekte Ergebnis vorraussehen. Dieses Spiel besitzt wiederum ein eindeutiges Nashgleichgewicht in dominanten Strategien. Die Einsicht lässt sich verallgemeinern. Sei G = fA1; : : : ; An; u1; : : : ; ung ein Stufenspiel mit n Spielern. Sei G (T ) das Spiel das resultiert, wenn das Stufenspiel T mal nacheinander gespielt wird. Formal, de…nieren wir die Spielstruktur wie folgt: De…nition: Gegeben ein Stufenspiel G; sei G (T ) ein endlich wiederholtes Spiel in dem G T mal gespielt wird und in dem die Ergebnisse der vorhergehenden Runden beobachtet werden bevor die nächste Runde gespielt wird. Die Auszahlungen im Spiel G (T ) sind gleich der Summe der payo¤s aus dem Spiel G: Satz: Wenn das Stufenspiel G ein eindeutiges Nashgleichgewicht besitzt, dann besitzt das Spiel G (T ) ein eindeutiges teilspielperfektes Ergebnis, für alle endlichen T : die Spieler spielen die Nash-Strategien in jeder Stufe des Spiels. Betrachten Sie nun ein etwas komplizierteres Stufenspiel Spieler 1 L1 M1 R1 L2 1,1 0,5 0,0 Spieler 2 M2 5,0 4,4 0,0 R2 0,0 0,0 3,3 Das Stufenspiel wird zweimal gespielt. Das Stufenspiel besitzt zwei Nashgleichgewichte: (L1; L2) und (R1; R2) : In einem teilspielperfekten Gleichgewicht müssen die Spieler somit in der zweiten Stufe entweder (L1; L2) oder (R1; R2) spielen. Wieviele Strategien haben die Spieler für das gesamte Spiel? Eine Strategie spezi…ziert einen vollständigen Handlungsplan für jede Eventualität. Somit: eine Aktion in Periode 1 und eine Aktion in Periode 2 für jede Eventualität, die in Periode 2 auftreten kann. In der zweiten Stufe können die Spieler auf das Ergebnis der ersten Stufe bedingen: beide beobachten das Ergebnis bevor sie in Stufe zwei interagieren. Daher haben die Spieler insgesamt 3x39 = 310 Strategien. Die beobachteten Ergebnisse der vergangenen Stufen werden als histories bezeichnet. Daher gibt es im vorliegenden Spiel 9 mögliche histories am Ende der Stufe 1 und 81 terminal histories am Ende der Stufe 2. Durch Teilspielperfektheit reduzieren sich die Anzahl der Strategien, die in der zweiten Stufe gespielt werden können (sinnvollerweise gespielt werden). Wenn wir uns auf reine Strategien beschränken, dann wird in Periode 2 entweder (L1; L2) oder (R1; R2) gespielt. Es gibt immer teilspielperfekte Gleichgewichte mit Ergebnissen (outcomes) des Typs: In Stufe 1 wird (L1; L2) gespielt, in Stufe 2 wird (L1; L2) In Stufe 1 wird (L1; L2) gespielt, in Stufe 2 wird (R1; R2) In Stufe 1 wird (R1; R2) gespielt, in Stufe 2 wird (R1; R2) In Stufe 1 wird (R1; R2) gespielt, in Stufe 2 wird (L1; L2) : Gibt es auch andere teilspielperfekte Gleichgewichte? Folgender Kandidat: Das outcome der Stufe 2 ist gleich (R1; R2) wenn das outcome der Stufe 1 (M1; M2) : Sonst ist das outcome der Stufe 2 gleich (L1; L2) : Aus Sicht der Periode 1 präsentiert sich das Spiel dann wie folgt: Spieler 1 L1 M1 R1 L2 2,2 1,6 1,1 Spieler 2 M2 6,1 7,7 1,1 R2 1,1 1,1 4,4 Dieses Spiel hat nun 3 Nashgleichgewichte in reinen Strategien: (L1; L2) ; (M1; M2) und (R1; R2) : Daher können wir das folgende teilspielperfekte Gleichgewicht stützen: Spieler 1: In Periode 1, spiele M1: In Periode 2, spiele R1 wenn das outcome der Periode 1 gleich (M1; M2) ist; spiele L1 sonst. Spieler 2: In Periode 1, spiele M2: In Periode 2, spiele R2 wenn das outcome der Periode 1 gleich (M1; M2) ist; spiele L2 sonst. Schlussfolgerungen aus dem Beispiel: Sei G ein statisches Normalformspiel mit mehreren Nashgleichgewichten. Dann ist es möglich, dass das Spiel G (T ) (das resultiert wenn G T mal hintereinander gespielt wird) ein teilspielperfektes Nashgleichgewicht besitzt, in dem das Ergebnis des Spiels in jeder Periode t < T nicht Nash ist. Grundidee: wir können Kooperation stützen in wiederholten Spielen. Kooperation am Anfang des Spiels (in Stufe 1) wird mit einem für alle angenehmen Ergebnis in Stufe 2 belohnt. Nichtkooperation in Stufe 1 wird durch ein unangenehmes Ergebnis in Stufe 2 bestraft. Kritik am Beispiel Teilspielperfektheit schliesst unglaubwürdige Drohungen aus. Das beschriebene Gleichgewicht ist teilspielperfekt. Man koordiniert sich jedoch auf ein pareto ine¢ zientes Ergebnis in Stufe 2 wenn in Stufe 1 nicht kooperiert wurde. D.h. beide könnten sich besserstellen, wenn in Stufe 2 das Ergebnis (R1; R2) gespielt würde. Überlebt die Idee, dass wir Kooperation stützen können in wiederholten Spielen, wenn wir uns auf Gleichgewichte beschränken, in denen nur pareto e¢ ziente Gleichgewichte gespielt werden in Stufe 2? Betrachten Sie das folgende Spiel: Spieler 1 L1 M1 R1 P1 Q1 L2 1,1 0,5 0,0 0,0 0,0 M2 5,0 4,4 0,0 0,0 0,0 Spieler 2 R2 0,0 0,0 3,3 0,0 0,0 P2 0,0 0,0 0,0 4, 12 0,0 Q2 0,0 0,0 0,0 0,0 1; 4 2 Die statischen Nashgleichgewichte dieses Stufenspiels sind (L1; L2) ; (R1; R2) ; (P1; P2) und (Q1; Q2) : Während die Spieler gleichgerichtete Präferenzen haben bezüglich der outcomes (L1; L2) versus (R1; R2) ; gilt dies nicht für die outcomes (P1; P2) und (Q1; Q2) : Spieler 1 bevorzugt outcome (P1; P2) gegenüber outcome (Q1; Q2) : Spieler 2 bevorzugt outcome (Q1; Q2) gegenüber outcome (P1; P2) : Die Einsicht: Wir können wiederum ein Gleichgewicht stützen, in dem in Stufe 1 kooperiert wird. Wir tun dies indem wir einem nicht-kooperierenden Spieler mit Strafe drohen. Wenn 1 nicht kooperiert, dann wird das Ergebnis (Q1; Q2) gespielt in Stufe 2. Wenn 2 nicht kooperiert, dann wird (P1; P2) gespielt in Stufe 2. Das teilspielperfekte Gleichgewicht, das wir so konstruieren können ist rückverhandlungssicher (renegotiation proof). Konkret können wir ein Gleichgewicht in den folgenden Strategien stützen: Spieler 1: Spiele M1 in der ersten Stufe; in der zweiten Stufe, spiele R1 wenn das Erststufen-outcome (M1;M2) ist oder (x,y) wobei x6=M1 und y6=M2: Wenn das Erststufenoutcome (M1;z) ist, für alle z6=M2; dann spiele P1: Wenn das Erststufen-outcome (w,M2) ist, für alle w6=M1; dann spiele Q1: Spieler 2: Spiele M2 in der ersten Stufe; in der zweiten Stufe, spiele R2 wenn das Erststufen-outcome (M1;M2) ist oder (x,y) wobei x6=M1 und y6=M2: Wenn das Erststufenoutcome (z,M2) ist, für alle z6=M1 (dann spiele Q2: Wenn das Erststufen-outcome (M1;w) ist, für alle w6=M2; dann spiele P2: Zu beachten: für den Fall, dass der andere Spieler in Stufe 1 abweicht, sieht die Strategie in Periode 2 eine Belohnung vor für denjenigen, der den anderen Spieler bestrafen soll. Daher hat der Strafvollzieher kein Interesse, die Bestrafung neu zu verhandeln.