08.03. Sequentielle Spiele, Glaubwürdigkeit von Drohungen und

Werbung
Sequentielle Spiele,
Glaubwürdigkeit von Drohungen und
Teilspielperfektheit
I. Chickenspiel in Normalform: Anwendung Kubakrise
II. Extensivform, Informationsbezirk, Strategien,
Teilspielperfektheit
III. Auffinden von Nash-Gleichgewichten durch Umwandlung
der Extensivform in die Normalform
V. Ultimatumspiel
VI. Auffinden des Nash-Gleichgewichts in der Extensivform
durch Rückwärtsinduktion
Chickenspiel
C
D
C
3,3
2,4
D
4,2
1,1
1. Dominante Strategie?
2. Maximin?
3. Nash-Gleichgewicht?
4. Pareto-optimal?
Chickenspiel
C
D
C
3,3
2,4
D
4,2
1,1
1. Dominante Strategie: Nein
2. Maximin? C
3. Nash-Gleichgewicht? Zwei Gleichgewichte in reinen
Strategien: (D,C) und (C,D)
4. Pareto-optimal? Beide Gleichgewichte sind Paretooptimal, aber mit ungleichen Auszahlungen. Auch
(C,C) ist Pareto-optimal, aber kein NashGleichgewicht.
Gefangenendilemma und Chicken
GD
Chicken
C
D
C
3,3
1,4
D
4,1
2,2
T>R>P>S
C
D
C
3,3
2,4
D
4,2
1,1
T>R>S>P
Nur eine Vertauschung einer Präferenz und aus GD wird
Chicken. Kleine Veränderung, grosse Wirkung!
„Rebel Without a Cause“
„Denn sie wissen nicht, was sie tun“
http://www.youtube.com/watch?v=u7hZ9jKrwvo
“Chicken“
→
Chicken
C2
→
C3
←
D1
D1
D4
C3
“Chicken“ und Kuba Krise 1962
→
Chicken
C2
→
C3
←
D1
D1
D4
C3
Wikipedia
Die Kuba-Krise: Im Oktober 1962 sind die USA
und die UDSSR auf Konfrontationskurs.
Die Welt steht am Rand eines Atomkriegs
(16. bis 28.10.1962)
Nikita Chruschtschow
John F. Kennedy
“Wie wäre es,
Wenn wir Uncle Sam
Einen Igel in die
Unterhose
pflanzten?”
(Chruschtschow
nach Mayr 2007)
Wien 1961, Foto
Wikipedia Commons
Kennedys Rede an die Nation
22. Oktober 1962
https://www.youtube.com/watch?v=W50RNAbmy3M
Nach dem Buch von Robert Kennedy, “Thirteen Days”
Chruschtschow selbst hat
internationale Konflikte durchaus
im Sinne eines Chickenspiels
interpretiert. In einem Brief an
Kennedy schreibt er mit Blick auf
Berlin am 10. März 1962:
«Zwei Ziegenböcke treffen sich
Kopf an Kopf auf einer engen
Brücke über einem Abgrund.
Keiner gibt dem anderen den Weg
frei, und so fallen sie beide hinab.
Sie waren dumme und dickköpfige
Tiere» (Chruschtschow 1962).
Barbara W. Tuchman, The Guns of August, 1962 war ein Buch über
den I. Weltkrieg, das womöglich Kennedys Entscheidungen während
Der Kuba-Krise mit beeinflusst hat.
Die Situation ist komplexer
• Die amerikanischen Militärs wollen die Invasion
Kubas
• Die Kennedy-Regierung veranlasst als defensive
Massnahme die Quarantäne (Blockade Kubas).
• Robert Kennedy verhandelt in letzter Minute im
Auftrag des Präsidenten mit Botschafter Dobrynin
den Kompromiss: Keine Invasion Kubas und Abzug
nuklearer US-Raketen aus der Türkei.
• Wassili A. Archipow verhindert den Abschuss einer
Nuklearrakete („The Man Who Saved the World“)
Vortrag von Robert J. Aumann an der ETH
Krieg mit Spielen erklären
„Der Mathematiker Robert J. Aumann
erklärt mit der Spieltheorie
Mechanismen von Krieg und Frieden.
Dafür erhielt er 2005 den Nobelpreis in
Ökonomie. Seine leicht geänderte
Nobelpreis-Rede am Montag an der ETH
stiess auf grosses Interesse.“
ETH, Tagesberichte, 22.11.2006
Aus Robert J. Aumanns Nobelpreisrede
2005
“So now, let’s get back to war, and how homo economicus –
rational man – fits into the picture. An example, in the spirit of
the previous item, is this. You want to prevent war. To do
that, obviously you should disarm, lower the level of
armaments. Right? No, wrong. You might want to do the
exact opposite. In the long years of the cold war between the
US and the Soviet Union, what prevented “hot” war was that
bombers carrying nuclear weapons were in the air 24 hours a
day, 365 days a year. Disarming would have led to war.”
Und wenn Irrtümer auftreten, Missverständnisse, Fehlwahrnehmungen?
Verschärft durch mangelnde Kommunikationsmöglichkeiten und extrem
kurze Entscheidungszeiten? Aumann spielt mit dem (nuklearen) Feuer!
„The Man who saved the world“
Einer der spektakulärsten von zahlreichen
Beinahe-Katastrophen
Vasili Arkhipov, legte als
einziger von drei Befehlshabern
auf einem U-Boot im Oktober
1962 ein Veto gegen den
Abschuss einer Nuklearrakete
ein. (Das U-Boot war von der
Kommunikation mit Moskau
abgeschnitten.) Dieses Ereignis
wurde erst Anfang der 90er
Jahre bekannt.
http://www.youtube.com/watch?v=453PEldRoIE
Foto: Wikipedia
Die Kuba-Krise als Chicken-“Spiel“
13 Tage im Oktober 1962
UDSSR
Rückzug der Raketen
aus Kuba
Kompromiss
(USA: Abzug Raketen aus
Verhandeln, der Türkei, Verzicht auf
kein Angriff
Invasion Kubas)
auf Kuba
3, 3
Aufstellung der NuklearRaketen
Sieg der UDSSR,
Niederlage der USA
2, 4
USA
Luftangriff
Kubas
und nachfolgende
Invasion
Sieg der USA,
Niederlage der UDSSR
Atomkrieg
4, 2
1,1 (-∞, -∞)
16. Oktober 2014
Pflichtlektüre zum Management von Krisen: Robert Kennedy, 13 Tage.
Und zum Missmanagement: Dietrich Dörner, Die Logik des Misslingens
und Barbara Tuchman, Die Torheit der Regierenden.
“Chicken a la Kahn”
(Rapoport 1965)
Dagegen Herman Kahn, RAND-Corporation, strategischer
Berater, “On Thermonuclear War”, Empfehlung, im Chickenspiel
Härte zu zeigen.
Herman Kahn’s
recommendation. Stay
firm in a chicken game.
Throw your steering
wheel out of the window.
Ghamari-Tabrizi, 2005
The Worlds of Herman Kahn
“Chicken a la Kahn”
(Rapoport 1965)
Dagegen Herman Kahn, RAND-Corporation, strategischer
Berater, “On Thermonuclear War”, Empfehlung, im Chickenspiel
Härte zu zeigen.
Ghamari-Tabrizi, 2005
The Worlds of Herman Kahn
Herman Kahn’s
recommendation. Stay
firm in a chicken game.
Throw your steering
wheel out of the window.
Yet, if the opponent were
to use the same strategy?
Then you have a
problem! (RAND, coldwar strategic thinking.
Critical comment by A.
Rapoport)
Ameisen sind klüger!
Humane Lösung des Chickenspiels
im Strassenverkehr
Foto Wikipedia
Eine Institution, die das Chicken-Spiel löst, d.h. ein Pareto-optimales
Nash-Gleichgewicht ermöglicht!
• Grobe Vereinfachung
• Statisch: Züge erfolgen nicht immer simultan,
sondern oft nacheinander
►Extensivform von Spielen (Dynamische Spiele)
Spiel in Extensivform
1. n Spieler
2. Spielbaum (Knoten: Spieler; Kanten:
Entscheidungen; hierarchischer Aufbau)
3. Auszahlungen an den Endknoten
Simultanes
Chickenspiel
C
D
C
D
3, 3
2, 4
4, 2
1, 1
Normalform
Extensivform
► Dynamik
des Spielablaufs
InformationsBezirk:
-----------------► Spiel mit vollständiger (aber
nicht perfekter)
Information
Spielbaum
Common Knowledge
• „Information is common knowledge if it is
known to all the players, if each player knows
that all the players know it, and so forth ad
infinitum“ (Rasmusen 2007, Games and
Information)
• „Private information“: Information, über die
nur der jeweilige Spieler verfügt.
• Common knowledge of rationality (CKR): Es
ist common knowledge, dass alle Spieler
rational handeln.
Simultanes
Chickenspiel
C
D
C
D
3, 3
2, 4
4, 2
1, 1
Normalform
Extensivform
► Dynamik
des Spielablaufs
InformationsBezirk:
-----------------► Spiel mit vollständiger (aber
nicht perfekter)
Information
Sequenzielles Chickenspiel
Extensivform
► Dynamik
des SpielabLaufs
►Vollständige
und perfekte
Information
„Perfect information“: Jeder Knoten ist ein eigener Informationsbezirk.
Strategie
Definition: Ein vollständiger Plan, der angibt, welche
Entscheidung in jeder möglichen Spielsituation getroffen
wird.
Simultanes Chickenspiel (2x2-Spiel): Spieler 1 und Spieler 2
haben je 2 Strategien
Sequentielles Chickenspiel: Spieler 1 hat 2 (C oder D), Spieler
2 hat 4 Strategien: CC, CD, DC, DD
Schach: Weiss hat zu Beginn 20 Strategien. Wieviele
Strategien hat Schwarz für den zweiten Halbzug?
Beispiel Schach (Rapoport 1998)
Weiss, erster Zug: 20 Strategien (Bauern 16, Springer 4)
Antwort von Schwarz: Nicht 400, sondern 2020 Strategien
Weiss
·
·
·
Schwarz
1
→
4
5
2
→
1
1
3
→
3
3
·
·
·
20 → 16
·
·
·
16
etc.
Teilspielperfektheit
„Subgame perfect equilibrium (spe)“
Teilspielperfektheit
• Verfeinerung („refinement“) des Nash-Gleichgewichts
• Spiele und Teilspiele
Informelle Definition eines Teilspiels
• Ein Teilspiel H eines Spiels in Extensivform G ist ein Teil des Spiels,
der selbst wieder als eigenständiges Spiel gelten kann (nach Gintis
2000: 92).
Teilspielperfektes Nash Gleichgewicht (spe):
• „Ein Nash Gleichgewicht ist teilspielperfekt, wenn diese Strategie
eine Nash-Gleichgewichtsstrategie in allen Teilspielen ist, (…) die
mit Wahrscheinlichkeit grösser als null erreicht werden“ (Gintis
2000).
Glaubwürdigkeit von Drohungen
Spieler 2 droht: Wenn Spieler
1 D spielt, werde ich mit D
antworten. Dann erhält Spieler
1 nur einen Punkt. Auf C werde
ich mit D antworten, so dass
Spieler 1 dann 2 Punkte erzielt. Wird ein rationaler
Spieler der Drohung Folge
Leisten?
Extensivform und Normalform des
sequentiellen Spiels
Notation der Strategien: z. B.
CC: „Auf C mit C und auf D mit
C antworten“ („Immer C“)
C
D
CC
CD
DC
DD
3,3
3,3
2,4
2,4
4,2
1,1
4,2
1,1
Extensivform und Normalform des
sequentiellen Spiels
Notation der Strategien: z. B.
CC: „Auf C mit C und auf D mit
C antworten“ („Immer C“)
Sequentielles Chickenspiel:
Spieler 1 kann „sein“ Gleichgewicht erzwingen („First Mover
Advantage“)
Extensivform und Normalform des
sequentiellen Spiels
Notation der Strategien: z. B.
CC: „Auf C mit C und auf D mit
C antworten“ („Immer C“)
unglaubwürdige
Drohung
Sequentielles Chickenspiel:
Spieler 1 kann „sein“ Gleichgewicht erzwingen („First Mover
Advantage“)
EU – Griechenland
Badische Zeitung
Wikipedia
Aufgabe für Übung!
EU – Griechenland
GR
Hart bleiben (D)
Einlenken (C)
EU
Kredit geben = K
Kein Kredit = k
K
?
EU
k
K
?
?
k
?
1. Präferenzen (Rangfolge) für GR, EU festlegen.
2. Normalform (2 x 4) – Matrix aufstellen.
3. Spiel analysieren: Nash-Gleichgewicht(e), teilspielperfekte(s)
Gleichgewicht(e) bestimmen.
Ultimatumspiel
• Diktator: Einer teilt den „Kuchen“ auf, der
andere muss akzeptieren.
• Ultimatum: Einer teilt den Kuchen auf, der
andere hat ein Veto-Recht. Stimmt er zu, gilt
die Aufteilung. Lehnt er ab, erhalten beide
nichts.
Beispiel: Aufteilung von 100 Franken. Welches
sind Nash-Gleichgewichtsstrategien, welche
sind teilspielperfekt?
Ultimatumspiel
• Jede Aufteilung ist „Nash“: Z.B. Spieler 1: „Ich
biete meinem Mitspieler 20 Fr. an“ und Spieler
2: „Ich akzeptiere Aufteilungen von 20 Fr. und
mehr. Bei weniger als 20 Fr. akzeptiere ich
nicht“.
• Teilspielperfekt ist: Spieler 1 bietet die
kleinstmögliche Einheit, Spieler 2 akzeptiert.
Ultimatumspiel
• Jede Aufteilung ist „Nash“: Z.B. Spieler 1: „Ich
biete meinem Mitspieler 20 Fr. an“ und Spieler
2: „Ich akzeptiere Aufteilungen von 20 Fr. und
mehr. Bei weniger als 20 Fr. akzeptiere ich
nicht“.
• Jedes dieser Nash-Gleichgewichte ist Paretooptimal
• Teilspielperfekt ist: Spieler 1 bietet die
kleinstmögliche Einheit, Spieler 2 akzeptiert.
• Teilspielperfekt ist auch: Spieler 1 bietet null,
Spieler 2 akzeptiert!
Three pioneers of game
theory:
John C. Harsanyi, John F.
Nash, and Reinhard Selten
Nobleprice for economics
1994
(© The Nobel Foundation
www.nobel.se)
Harsanyi
Games with
incomplete
information
Nash
Selten
Nash equilibrium, Subgame
proof of
perfectness
Robert L. Stevenson, The Bottle Imp
Der dienstbare
Geist in der Flasche
erfüllt jeden Wunsch.
Die Flasche muss aber
vor dem Ableben des
Besitzers zu einem
Preis verkauft werden,
der geringer ist als der
Preis, zu dem die Flasche
erstanden wurde.
arts.gla.ac.uk
Robert L. Stevenson, The Bottle Imp
Geschieht dies nicht,
fährt der Besitzer zur
Hölle. Worin besteht
das Problem nach
klassischer
Spieltheorie?
arts.gla.ac.uk
„Centipede“-Spiel
(Rosenthal 1981, nach Fudenberg & Tirole 1991: 98)
I A1
II
D1
D2
(1,0)
(0,1)
A2
I
A3 II
D3
D4
(3,0)
(2,4)
A4
I
D5
A5
(5,5)
(6,3)
Spieler I und Spieler II haben in jeder Runde die Option
zwischen A („weiter“) und D („unten“).
„Centipede“-Spiel
(Rosenthal 1981, nach Fudenberg & Tirole 1991: 98)
I A1
II
D1
D2
(1,0)
(0,1)
A2
I
A3 II
D3
D4
(3,0)
(2,4)
A4
I
A5
D5
(6,3)
Spieler I und Spieler II haben in jeder Runde die Option
zwischen A („weiter“) und D („unten“).
„Centipede“-Spiel
(Rosenthal 1981, nach Fudenberg & Tirole 1991: 98)
I A1
II
D1
D2
(1,0)
(0,1)
A2
I
A3 II
D3
D4
(3,0)
A4
I
A5
D5
(2,4)
Spieler I und Spieler II haben in jeder Runde die Option
zwischen A („weiter“) und D („unten“).
„Centipede“-Spiel
(Rosenthal 1981, nach Fudenberg & Tirole 1991: 98)
I A1
II
D1
D2
(1,0)
(0,1)
A2
I
A3 II
D3
D4
A4
I
A5
D5
(3,0)
Spieler I und Spieler II haben in jeder Runde die Option
zwischen A („weiter“) und D („unten“).
„Centipede“-Spiel
(Rosenthal 1981, nach Fudenberg & Tirole 1991: 98)
I A1
II
D1
D2
(1,0)
(0,1)
A2
I
A3 II
D3
D4
A4
I
A5
D5
Spieler I und Spieler II haben in jeder Runde die Option
zwischen A („weiter“) und D („unten“).
„Centipede“-Spiel
(Rosenthal 1981, nach Fudenberg & Tirole 1991: 98)
I A1
D1
II
D2
A2
I
A3 II
D3
D4
A4
I
A5
D5
(1,0)
Spieler I und Spieler II haben in jeder Runde die Option
zwischen A („weiter“) und D („unten“).
Centipede-Spiel
(frei nach Ken Binmore, Fun and Games, 1992:164p.)
• Exzentrischer Philantrop bittet den ETHPräsidenten und den ZH-Uni-Rektor in eine
Suite im Dolder.
• Er bietet an, maximal 900 Mio. Fr. für beide
Universitäten zu spenden – allerdings hängt
der Ausgang von einem Spiel ab.
I
II
I
II
I
II
I
II
I
II
(9 x 108, 9 x 108)
1,0 0,10 100,0 0,103 104,0 0,105 106,0 0,107 108,0 0,109
Beide
handeln
strikt
rational!
I. Michael Hengartner, Uni ZH
II. Lino Guzella
I
II
I
II
I
II
I
II
I
II
1,0 0,10 100,0 0,103 104,0 0,105 106,0 0,107 108,0 0,109
I
II
I
II
I
II
I
II
I
1,0 0,10 100,0 0,103 104,0 0,105 106,0 0,107 108,0
II
I
II
I
II
I
II
I
II
I
II
(9 x 108, 9 x 108)
1,0
Bekommt
1 Fr.
Geht leer aus!
Chickenspiel und Kubakrise
Sequenzielle Spiele, dynamische Spiele
Extensivform eines Spiels
Informationsbezirk
Common Knowledge
Definition Strategien
Teilspiele
Verfeinerung des Nash-Gleichgewichts:
Teilspielperfektheit
• Tausendfüssler-Spiel (Centipede Game) und
Rückwärtsinduktion
•
•
•
•
•
•
•
•
Aufgabe für Übung: Piratenspiel
•
•
•
•
•
•
Foto von dc-freibeuter.de
•
Aufteilung von Piratenschatz mit 100 Goldmünzen
Ränge der fünf Piraten nach Alter: Anton Bonnet,
Bootstrap Bill, Cutler Beckett, Davy Jones, Edward
Teach (A, B, C, D, E)
Ranghöchster macht Vorschlag zur Aufteilung, dann
stimmen Piraten ab.
Vorschlagender ist stimmberechtigt und hat
ausschlaggebende Stimme, wenn keine Mehrheit.
Wird der Vorschlag angenommen, erfolgt diese
Aufteilung und das Spiel ist zu Ende.
Wird die Aufteilung nicht angenommen, dann wird
der Vorschlagende über Bord geworfen und der
nächste im Rang schlägt eine Aufteilung vor.
Jeder Pirat möchte viele Goldmünzen erhalten.
Kirchler 2011
Die NZZ am Sonntag versteht mehr
von Spieltheorie:
“Leider stellt die vom Drehbuch
vorgeschlagene Lösung kein
Gleichgewicht im Sinne des echten Nash dar …” (NZZ am
Sonntag, 24.3.2002).
Frage:
1) Warum nicht?
2) Wie könnte man die Situation formal in einem Spiel in
Normalform darstellen?
3) Welche Lösung(en) (Nash-Gleichgewichte) gibt es dann?
„Beautiful-Mind-Spiel“
Anzahl anderer Freunde, die die Top-Favoritin (A) wählen
Wahl
von
A
B
0
1
2
3
T
T/2
T/3
T/4
R
R
R
R
T>R
„Winner takes it all“. Wenn es mehrere Bewerber für die Top-Favoritin gibt,
wird der Gewinner ausgelost.
Die „Lösung im Film s = (B, B, B, B) ist kein Nash-Gleichgewicht!
Fall 1: A ist eine dominante Strategie (T/4 ≥ R). Es
gibt ein Nash-Gleichgewicht mit gleicher Auszahlung für alle: s* = (A, A, A, A)
mit u(s*) = (T/4, T/4, T/4, T/4)
Fall2: Es gibt keine dominante Strategie. Dann gibt es mehrere
Gleichgewichte mit asymmetrischen Auszahlungen (und weitere
Gleichgewichte in gemischten Strategien). Z.B. T/2 < R → s* = (A, B, B, B)
„Beautiful-Mind-Spiel“
Anzahl anderer Freunde, die die Top-Favoritin (A) wählen
A
Wahl
von B
0
1
2
3
T
T/2
T/3
T/4
R
R
R
R
Z.B.: T > R und T/2 < R. Es gibt vier Nash-Gleichgewichte
in reinen Strategien, die aber alle „asymmetrisch“ sind.
Strategienprofile:
s* = (A, B, B, B)
s* = (B, A, B, B)
s* = (B, B, A, B)
s* = (B, B, B, A)
Winner takes it all“, Wettbewerb,
Markteintrittsspiel
Es gibt weitere Gleichgewichte in
„gemischten“ Strategien: Alle wählen pA
so, dass niemand einen Anreiz hat,
einseitig die Entscheidung zu ändern.
Chicken Game im Film
„Footloose“ mit Kevin Bacon
http://www.youtube.com/watch?v=mA4W1Ayd1jE
Herunterladen