3 Dynamische Spiele mit vollständiger Information 3.1

Spieltheorie (Winter 2009/10)
3-1
Prof. Dr. Ana B. Ania
3
Dynamische Spiele mit vollständiger
Information
Literaturhinweise zu Kapitel 3:
Osborne (2004), Kapitel 5-7
Gibbons (1992), Kapitel 2
MasColell, Whinston, Green (1995), Kapitel 7 und 9A+B
Fudenberg und Tirole (1991), Kapitel 3 und 4
3.1 Rückwärtsinduktion
Bisher hatten wir Situationen betrachtet, in denen beide
Parteien simultan über ihre Strategie entscheiden müssen.
Jetzt betrachten wir etwas kompliziertere zeitliche Strukturen. Dabei beschränken wir uns zunächst auf Spiele mit
vollständiger und perfekter Information, d.h., alle Spieler
spielen sequentiell, und jeder Spieler beobachtet alle vorangegangenen Züge.
Klaus M. Schmidt 2007
Spieltheorie (Winter 2009/10)
3-2
Prof. Dr. Ana B. Ania
Die Zeitstruktur eines Spiels
Spieler 1
qqqqqqq
qqqqqx
qqqqqqq
qqqqqqq
qqqqqqq
qqqqqqq
q
q
qqqqqqq
q
q
q
q
q
q
q
qqqqqqq
q
q
q
q
q
q
qqqqqqq
q
q
q
q
q
q
q
qqqqqqq
q
q
q
q
q
q
qqqqqqq
q
q
q
q
q
q
qqqqqqq
q
q
q
q
q
q
q
qqqqqqq
q
q
q
q
q
q
q
qqqqqx
qq
q
q
x
q
q
q
qq qqq
q qqqq
q
q
q
qqqq
qqqq qqqqqqqq
q
q
q
q
qqqq
qqqq
qqqq
q
q
q
q
q
q
q
q
qqqq
q
qqqq
qqqq
qqqq
qqqq
qqqq
qqqq
qqqq
qqqq
q
qqqq
q
q
q
q
q
q
qqqq
qqqq
q
q
q
q
q
q
q
qqqq
q
q
q
qqqq
q
q
q
q
q
q
qqqq
q
qqqq
q
q
q
q
q
q
qqqq
q
q
qqq
qqq
qqq
Aktion 1
Spieler 2
Aktion 3
a
b
Aktion 2
Aktion 4 Aktion 3
c
d
e
f
Spieler 2
Aktion 4
g
h
Abb. 3.1: Ein Spielbaum
Beispiel 1: IBM vs. Intel
In den frühen 70er Jahren ist Intel der einzige Lieferant
von IBM für bestimmte Computerchips. IBM steht vor der
Wahl, entweder Intel als einzigen Lieferanten zu behalten
oder einen zweiten Lieferanten (AMD) aufzubauen.
Ohne einen zweiten Lieferanten kann Intel seine Monopolmacht ausnutzen. Dann würde IBM einen Gewinn von 10
und Intel einen Gewinn von 90 erhalten. Intel kündigt jedoch
an, auf das Ausnutzen der Monopolstellung zu verzichten
und die Gewinne gleichmäßig aufzuteilen (jeder bekommt
einen Gewinn von 50). Wenn sich IBM entscheidet, AMD
als zweiten Lieferanten aufzubauen, erhält IBM einen Gewinn von 40 und Intel einen Gewinn von 30.
Spieltheorie (Winter 2009/10)
3-3
Prof. Dr. Ana B. Ania
Sollte IBM eine zweite Lieferantenbeziehung aufbauen oder
darauf verzichten?
Zeichnen Sie den Spielbaum für dieses Spiel.
Bestimmen Sie die Normalform für dieses Spiel.
Spieltheorie (Winter 2009/10)
3-4
Prof. Dr. Ana B. Ania
Beispiel 2: Marktzutrittsspiel
Zutreter
qqqqqqq
qqqqqx
qqqqqqq
qqqqqqq
qqqqqqq
qqqqqqq
q
q
qqqqqqq
q
q
q
q
q
q
q
qqqqqqq
q
q
q
q
q
q
qqqqqqq
q
q
q
q
q
q
q
qqqqqqq
q
q
q
q
q
q
qqqqqqq
q
q
q
q
q
q
qqqqqqq
q
q
q
q
q
q
q
qqqqqqq
q
q
q
q
q
q
q
qqqqqx
qqqqq
qq qqq
qqqq qqqqqqqq
qqqq
qqqq
q
q
q
q
qqqq
0
qqqq
qqqq
qqqq
qqqq
q
q
q
qqqq
q
q
q
2
q
qqqq
q
q
q
qqqq
q
q
q
q
qqqq
q
qqq
N
E
k
Monopolist
n
−1
−1
2
1
Abb. 3.2: Marktzutrittsspiel
Der Marktzutreter entscheidet, ob er eintritt (E) oder
nicht (N ).
Der Monopolist entscheidet, ob er kämpft (k) oder nicht
kämpft und sich den Markt teilt (n).
Ein sequentielles Spiel mit endlich vielen Stufen und perfekter Information wird von hinten (durch Rückwärtsinduktion)
gelöst.
Monopolist: Gegeben, dass der Zutreter eingetreten ist,
ist es für mich optimal, den Markt zu teilen.
Zutreter: Wenn ich zutrete, wird der Monopolist den
Markt teilen. Also sollte ich zutreten.
Das Ergebnis der Rückwärtsinduktion ist also (E, n).
Spieltheorie (Winter 2009/10)
3-5
Prof. Dr. Ana B. Ania
Rückwärtsinduktion und Nash-Gleichgewicht
Das Ergebnis der Rückwärtsinduktion ist ein Nash-GG:
Gegeben, dass der Zutreter E spielt, ist für den Monopolisten n optimal.
Gegeben, dass der Monopolist n spielt, ist für den Zutreter E optimal.
M
@
@
@
@
@
k
n
N
0, 2
0, 2
E
-1, -1
2, 1
Z
Abb. 3.3: Normalform des Marktzutrittsspiels
Analyse der Normalform zeigt, dass es noch ein zweites
Nash-GG gibt: (N, k).
Diese Strategie des Monopolisten ist nicht optimal, wenn
der Zutreter E spielen sollte. Aber: Im Nash-GG (N, k) tritt
der Zutreter eben nicht ein, also ist dieser Fall irrelevant.
Trotzdem ist das Nash-GG (N, k) nicht überzeugend. Der
Monopolist “droht”, zu kämpfen, falls der Zutreter zutritt.
Spieltheorie (Winter 2009/10)
3-6
Prof. Dr. Ana B. Ania
Das ist eine unglaubwürdige Drohung, weil es nicht
im Interesse des Monopolisten liegt, sie im Fall des Falles
tasächlich wahr zu machen.
Die Unglaubwürdigkeit einer Drohung lässt sich aus der Normalform des Spiels nicht erkennen. Darum werden wir bei
dynamischen Spielen oft die extensive Form des Spiels
betrachten, die die Zeit- und Informationsstruktur explizit
macht.
Ziel: Verfeinerung des Nash-Gleichgewichts. D.h.,
Ausschluss von Gleichgewichten, die unglaubwürdige Drohungen enthalten.
Bevor wir das tun, werden wir aber ein paar weitere Anwendungsbeispiele für Rückwärtsinduktion betrachten
Spieltheorie (Winter 2009/10)
3-7
Prof. Dr. Ana B. Ania
3.2 Anwendungsbeispiele für Rückwärtsinduktion
3.2.1 Stackelberg-Duopol
Heinrich von Stackelberg (1934)
1) Unternehmen 1, der Stackelberg-Führer, wählt seine Menge x1.
2) Unternehmen 2, der Stackelberg-Anpasser, beobachtet
x1 und wählt seine Menge x2.
3) Auf dem Markt ergibt sich der Preis als Funktion der
gesamten Menge: p = p(x1 + x2).
Dieses Modell wird oft verwendet, wenn es auf einem Markt
einen dominanten Anbieter gibt, an den alle übrigen Anbieter ihr Verhalten anpassen.
Beispiele:
Saudi-Arabien als größter Ölproduzent legt seine Menge
als erster fest. Andere Ölproduzenten passen sich an.
Südafrika: Dominierender Diamantenproduzent De Beers.
Andere Marktführer: Microsoft, IBM, Telekom, etc., aber
hier geht es meist um Preis- und/oder Qualitätswettbewerb bei heterogenen Gütern.
Spieltheorie (Winter 2009/10)
3-8
Prof. Dr. Ana B. Ania
Das Entscheidungsproblem des Anpassers
Der Anpasser maximiert seinen Gewinn
π2 = p(x1 + x2)x2 − c2(x2)
durch geeignete Wahl von x2. Dabei liegt die Menge x1
bereits fest und ist bekannt.
Bedingung erster Ordnung (BEO) für Gewinnmaximum:
dp(x1 + x∗2 )
dc2(x∗2 )
∗
p(x1 + x2 ) +
x2 =
dx2
dx2
Diese Bedingung legt die optimale Menge x∗2 als Funktion
von x1 fest, d.h.:
x∗2 = R2(x1)
Die Funktion R2(x1) wird Reaktionsfunktion von Unternehmen 2 genannt.
Beispiel:
Lineare Nachfrage: p(x1 + x2) = a − b · (x1 + x2)
Konstante Grenzkosten: c1(x) = c2(x) = c · x
Gewinnfunktion des Anpassers:
π2 = [a − b(x1 + x2)] · x2 − c · x2
BEO für Gewinnmaximum:
a − b(x1 + x2) − bx2 = c
Spieltheorie (Winter 2009/10)
3-9
Prof. Dr. Ana B. Ania
Gewinnfunktion ist streng konkav:
dπ22
= −2b < 0
d 2 x2
Reaktionsfunktion des Anpassers:
x2 =
a−c 1
a − bx1 − c
=
− x1
2b
2b
2
Das Problem des Marktführers
Der Marktführer kennt das Entscheidungsproblem des Anpassers und weiß, dass er die Menge x∗2 = R2(x1) wählen
wird. Also ist sein Gewinnmaximierungsproblem:
max
p(x1 + R2(x1)) · x1 − c1(x1)
x
1
BEO für Gewinnmaximum:
⎛
p(x∗1
+
R(x∗1 ))
⎞
dR2 ⎟ dp ∗
dc1
⎠
x1 =
+ 1+
dx1 dx
dx1
⎜
⎝
Der Stackelberg-Führer berücksichtigt nicht nur, wie eine
zusätzliche Einheit den Martkpreis direkt senkt, sondern
auch, wie sie die Menge seines Konkurrenten und damit
indirekt den Marktpreis beeinﬂusst.
Spieltheorie (Winter 2009/10)
3-10
Prof. Dr. Ana B. Ania
Im Beispiel:
Gewinnfunktion des Marktführers:
π1 = [a − b(x1 + R2(x1))] · x1 − c · x1
a−c
b
· x1 − · x21
=
2
2
BEO für Gewinnmaximum:
a−c
− bx∗1 = 0
2
a−c
x∗1 =
2b
Nachdem wir die optimale Menge des Stackelberg-Führers
kennen, können wir sie in die Reaktionsfunktion des Anpassers einsetzen, um dessen Menge, die gesamte Menge, und
den Marktpreis zu bestimmen.
Einsetzen von x∗1 in R2(x1) ergibt:
a−c
x∗2 =
4b
Die gesamte Menge ist also:
3(a − c)
x1 + x2 =
4b
Der Marktpreis ergibt sich als:
a + 3c
p∗ =
4
Spieltheorie (Winter 2009/10)
3-11
Prof. Dr. Ana B. Ania
Vergleich zum Cournot-Duopol
Der Gewinn des Stackelberg-Führers ist immer höher als
der Gewinn eines Cournot-Duopolisten. Warum?
Im Stackelberg-Spiel ist der Anpasser besser informiert
als ein Duopolist im Cournot-Spiel. Er kann beobachten,
welche Menge der Stackelberg-Führer auf den Markt
wirft. Trotzdem geht es dem Anpasser schlechter als
dem Cournot-Duopolisten. Warum?
In Ein-Personen-Entscheidungssituationen ist es unmöglich, dass sich der Entscheidungsträger schlechter stellt,
wenn er zusätzliche Informationen oder zusätzliche Handlungsmöglichkeiten bekommt.
In interpersonellen Entscheidungssituationen ist es dagegen oft besser, weniger Informationen oder weniger
Handlungsmöglichkeiten zu haben. Beispiele:
– Cournot- versus Stackelberg-Spiel.
– Chicken-Spiel: Angenommen, einer der Fahrer kann
sein Lenkrad aus dem Fenster werfen und sich damit
die Möglichkeit zum Ausweichen nehmen.
⇒ Gegenspieler wird ausweichen.
– Viele andere Beispiele für Selbstbindung (Commitment).
Spieltheorie (Winter 2009/10)
3-12
Prof. Dr. Ana B. Ania
3.2.2 Löhne und Beschäftigung
Leontief (1946), später in zahlreichen Variationen.
Zweistuﬁges Spiel:
1. Gewerkschaft bestimmt den Lohnsatz, w.
2. Unternehmen bestimmt die Beschäftigungsmenge, L.
Auszahlungsfunktionen:
Gewerkschaft:
U (w, L),
streng monoton steigend in w und L,
quasikonkav (konvexe Indiﬀerenzkurven)
Unternehmen:
π(w, L) = R(L) − wL,
R(L) steigend und streng konkav,
limL→0 R(L) = ∞,
limL→∞ R(L) = 0.
Spieltheorie (Winter 2009/10)
3-13
Prof. Dr. Ana B. Ania
Rückwärtsinduktion
Unternehmen:
max R(L) − wL
L≥0
BEO (hier notwendig und hinreichend):
R(L) − w = 0
Die optimale Beschäftigungsmenge L∗(w) ist eine fallende Funktion von w. (Warum?)
Isogewinnlinien:
R(L) − c
R(L) − wL = c ⇒ w =
L
rrrrrrrr
rrrrrrrr
R r rrrrr
w r rrrrr
rr
rr
rrrr
rr
rrrrr
rr
rrrrr
r
rr
r
r
r
r
rr
rrrrr
rr
rrrrr
rr
rrrrr
rr
r
r
r
r
r
rr
rrrrr
rr
rrrrr
rr
rrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrr
r
rr
r
r
r
rr rrr
rr
rrrrrrrrrr
rr
rrrrrr
rr
rrrr
r
rr
r
r
r
r
rr
rrrrrr
rr
rrrrrrrrr
rr
rrrrrrrrrrrr
r
rr
r
r
r
rr rrrrrr rrr
rr rrrrrr rr
rrrrrr rrr
rr
rr
rr rrr
rr rr
rrr rrr
rr rrr
rr rr
rrr rrr
rrrr
rrr
rrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrr
rr
rr
rr
rr
rr
rr
rr
rr
rr
rr
rr
rr
rr
rr
rr
rr
rr
rr
rr
rr
rr
rr
rr
rr
rr
rr
rr
rr
rr
rr
rr
rr
rr
rr
rr
r
rrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrr
L
L
Abb. 3.4: Gewinnmaximum und Isogewinnlinien der
Unternehmung
Spieltheorie (Winter 2009/10)
3-14
Prof. Dr. Ana B. Ania
Gewerkschaft antizipiert L∗(w):
max U (w, L∗(w))
w≥0
BEO:
w
∂U ∂U dL∗(w)
+
= 0
∂w ∂L dw
rr
rrrrrrrr
rr
rr
rr
rr
rr
rr
rr
rr
rr
rr
rr
rr
rr
rr
rr
rr
rr
rr
rr
rr
rr
rr
rr
rr
rr
rr
rr
rr
rr
rr
rr
rr
rr
rr
rr
rr
rr
rrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrr
rr
rrrrrrrr
rr
rr
rr
rr
rr
rr
rr
rr
rr
rr
rr
rr
rr
rr
rr
rr
rr
rr
rr
rr
rr
rr
rr
rr
rr
rr
rr
rr
rr
rr
rr
rr
rr
rr
rr
rr
rr
rrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrr
L
L
w
Abb. 3.5: Nutzenmaximum der Gewerkschaft, Ineﬃzienz
Bemerkungen:
1) Gewerkschaft sucht sich den besten Punkt auf der Reaktionsfunktion des Unternehmens.
2) Aber das Ergebnis ist ineﬃzient: Gewerkschaften und
Unternehmen könnten sich besser stellen, wenn sie den
Spieltheorie (Winter 2009/10)
3-15
Prof. Dr. Ana B. Ania
Lohn etwas verringerten und die Beschäftigung etwas
erhöhten.
3) Die Ineﬃzienz besteht, weil Gewerkschaft und Unternehmen nicht über Beschäftigung und Lohnhöhe gleichzeitig verhandeln. Warum wird das nicht gemacht?
3.2.3 Zeitkonsistenz der Geldpolitik
Barro und Gordon (1983)
Zweistuﬁges Spiel zwischen Zentralbank und privatem Sektor:
1. Die Privaten bilden Inﬂationserwartungen π e, die sich
insbesondere in Tarifabschlüssen niederschlagen.
2. Die Zentralbank beobachtet π e und entscheidet über die
Geldpolitik, die die tatsächliche Inﬂationsrate π determiniert.
Stark stilisiertes Modell in reduzierter Form. Tarifabschlüsse,
Transmissionsmechanismus von Geldpolitik auf realen und
monetären Sektor etc. werden nicht explizit modelliert.
Stattdessen: Zentralbank möchte die gesamtwirtschaftliche
Wohlfahrt maximieren, indem sie die Verlustfunktion
L(u, π) = u + γπ 2
minimiert. Dabei ist u > 0 die Arbeitslosenquote, γ > 0.
Spieltheorie (Winter 2009/10)
3-16
Prof. Dr. Ana B. Ania
Die Volkswirtschaft wird durch eine modiﬁzierte Phillipskurve beschrieben:
u = un − α(π − π e)
Die natürliche Arbeitslosenquote un > 0 wird durch Tarifabschlüsse bestimmt. Die Zentralbank kann die tatsächliche
Inﬂationsrate perfekt und ohne Zeitverzögerung steuern.
Die privaten Wirtschaftssubjekte möchten die tatsächliche
Inﬂation so gut wie möglich voraussagen:
U (π, π e) = −(π − π e)2
Rückwärtsinduktion
Zentralbank: Inﬂationserwartungen liegen bereits fest.
min
un − α(π − π e) + γπ 2
π
BEO:
dL
= −α + 2γπ = 0
dπ
Daraus folgt:
α
2γ
Beachten Sie: Die “optimale Inﬂationsrate” für die Zentralbank ist in diesem Modell unabhängig von den Inﬂationserwartungen der Privaten.
π∗ =
Spieltheorie (Winter 2009/10)
3-17
Prof. Dr. Ana B. Ania
Private Wirtschaftssubjekte antizipieren π ∗:
max
−(π ∗ − π e)2
e
π
Daraus folgt:
α
2γ
Für die Arbeitslosenquote ergibt sich:
πe = π∗ =
u = un − α(π ∗ − π e) = un
Bemerkungen:
Ergebnis ist ineﬃzient: u = un und π = 0 wäre besser.
Problem der Zentralbank: Sie kann sich nicht binden,
eine Inﬂationsrate von 0 zu wählen. Die Privaten antizipieren, dass die Bank ex post einen Anreiz hat, zu
inﬂationieren.
Der Anreiz zu inﬂationieren besteht, obwohl die Privaten
die Inﬂation perfekt voraussehen und sie darum keine für
die Zentralbank positiven Eﬀekte hat.
Regelgebundene Geldpolitik: Wenn die Zentralbank eine
“Reputation” dafür aufbauen könnte, nie zu inﬂationieren, würde sie sich besserstellen. Siehe dazu das Kapitel
über wiederholte Spiele.
Spieltheorie (Winter 2009/10)
3-18
Prof. Dr. Ana B. Ania
3.3 Die extensive Form eines Spiels
Definition 3.1 (Extensive Form) Die extensive
Form eines Spiels spezifiziert:
(1) die Menge der Spieler {1, . . . , n};
(2a) zu welchem Zeitpunkt welcher Spieler am
Zug ist;
(2b) welche Aktionen einem Spieler zur Verfügung
stehen, wenn er am Zug ist;
(2c) was ein Spieler weiß, wenn er am Zug ist;
(3) die Auszahlung eines jeden Spielers für jede
mögliche Kombination von Zügen.
Die Deﬁnition der extensiven Form ist ganz analog zu der
der Normalform. Einziger Unterschied: Die Beschreibung
der Strategienräume kann sehr viel komplexer sein.
Spiele in extensiver Form können mit Hilfe eines Spielbaums
beschrieben werden.
Spieltheorie (Winter 2009/10)
3-19
Prof. Dr. Ana B. Ania
Ein Spielbaum besteht einer Menge von geordneten und
miteinander verbundenen Knoten:
Entscheidungsknoten: Hier kann genau ein Spieler
aus einer Menge von Aktionen auswählen. Jede Aktion
führt zu einem neuen Entscheidungs- oder Endknoten.
Endknoten: Hier endet das Spiel, und Auszahlungen
werden zugeordnet.
Der Spielbaum beginnt mit genau einem Anfangs-Entscheidungsknoten.
Wir werden immer annehmen, dass ein Spielbaum sich echt
verzweigt:
Er wächst nicht in sich selbst zurück (keine Zyklen);
Zweige wachsen nicht wieder zusammen (keine gemeinsamen Vorgänger).
Gegenbeispiele?
Spieltheorie (Winter 2009/10)
3-20
Prof. Dr. Ana B. Ania
Zufallszüge der Natur
In vielen Spielen gibt es exogene Unsicherheit. Wir können
das modellieren, indem wir einen zusätzlichen Spieler, die
“Natur”, einführen, die aus der Menge der möglichen Zustände
der Welt einen nach einer gegebenen Wahrscheinlichkeitsverteilung auswählt.
Z
qx
qqqqqqq qqqqqqqqqqqqqq
qqqqqqq
qqqqqqq
qqqqqqq
qqqqqqq
q
q
q
q
q
q
qqqqqqq
q
qqqqqqq
qqqqqqq
q
q
q
q
q
q
qqqqqqq
q
q
q
q
q
q
qqqqqqq
q
q
q
q
q
q
qqqqqqq
q
q
q
q
q
q
q
qqqqqqq
q
q
q
q
q
q
qqqqqqx
q
q
q
qq
qqq qqqq
qqqq qqqqqqqq
q
q
q
q
qqqq
q
q
1
1
q
q
qqqq
0
qqqq
qqqq
qqqq 2
qqqq
q
2
q
q
qqqq
qq
2
qqqq
qqqq
qqqq
qqqq
qqqx
qqqqq
qq qx
qqq
qq qqq
qq qqq
qq q qqqq
qq qqq
qq
qqq
qq
qqq
q
qqq
qqq
qq
qq
qqq
qqq
qq
q
qq q
qqq
qqq
qq
q
qqq
qqq
qq q
qq q
qq
qq
qq
qq
N
E
Natur
M
M
n
k
0
0
3
3
k
−1
−1
n
1
1
Abb. 3.6: Marktzutrittsspiel mit exogener Unsicherheit
Nach der Zutrittsentscheidung realisiert sich der Zustand
der Welt:
Mit Wahrscheinlichkeit 12 ist die Nachfrage groß, beide
können hohe Gewinne machen.
Mit Wahrscheinlichkeit 12 ist die Nachfrage niedrig, beide
machen bei Wettbewerb Verluste.
Spieltheorie (Winter 2009/10)
3-21
Prof. Dr. Ana B. Ania
Informationsmengen
Definition 3.2 (Informationsmenge) Eine Informationsmenge ist eine Menge von Entscheidungsknoten mit den Eigenschaften:
Bei allen Entscheidungsknoten einer Informationsmenge ist derselbe Spieler am Zug.
Ein Spieler kann die verschiedenen Knoten einer Informationsmenge nicht unterscheiden. Insbesondere hat er an jedem Knoten einer Informationsmenge dieselbe Menge von Aktionen.
Jeder Entscheidungsknoten gehört zu genau einer
Informationsmenge.
Beispiele:
1
qqqq
qqqqx
qqqqqqq qqqqqqqqqqqqq
qqqqqqq
qqqqqqq
q
q
q
q
q
q
qqqqqqq
q
qqqqqqq
qqqqqqq
qqqqqqq
qqqqqqq
q
q
q
q
q
qqqqqqq
q
q
q
q
q
q
qqqqqqq
q
q
qq
q
q
q
qqqqqqq
q
q
q
q
q
q
qqqqqqq
q
q
q
q
qq q
q
q
x
q
q
qq
q
qqqqx
q qqqq
q
q
q
qqqq qqqqqqqq
q
qqqq
q
q
q
qqqq
qqqq
qqqq
q
q
q
q
q
q
q
q
qqqq
qqqq
q
qqqq
qqqq
qqqq
qqqq
qqqq
qqqq
qqqq
qqqq
q
q
q
q
q
q
q
qqqq
q
q
qqqq
q
q
q
q
q
q
qqqq
qqqq
q
q
q
q
q
q
qqqq
q
q
qqqq
q
q
q
q
q
q
qqqq
q
q
qqqq
q
qqq
qqq
G
L
2
g
−3
−3
2
0
−5
g
−5
0
−1
−1
Abb. 3.7: Das Gefangenen-Dilemma
Spieltheorie (Winter 2009/10)
3-22
Prof. Dr. Ana B. Ania
1
qqqqqqq
qqqqqqqx
qqqqqqq
qqqqqqq
qqqqqqq
qqqqqqq
qqqqqqq
q
q
q
q
q
q
qqqqqqq
qq
q
q
q
q
q
q
qqqqqqq
q
q
q
q
q
q
q
qqqqqqq
q
q
q
q
q
q
qqqqqqq
q
q
q
q
q
q
qqqqqqq
q
q
q
q
q
q
q
qqqqqqq
q
q
q
q
q
q
qqqqqx
q
q
q
qqqqq
x
q
q
q
qqq qqqqq
q qqqq
q
q
q
qqqq qqqqqqq
qqqq
q
q
q
q
q
q
q
q
qqqq
qqqq
q
q
q
q
q
q
q
qqqq
qqqq
q
q
qqqq
qqqq
qqqq
qqqq
qqqq
qqqq
qqqq
qqqq
q
q
q
q
q
q
qqqq
q
qqqq
q
q
q
q
q
q
qqqq
q
q
qqqq
q
q
q
q
q
q
qqqq
q
q
qqqq
q
q
qqqqx
qq qq
q
q
qqx
q
qqq
qqq
qx
q qq
qq qqx
q
qq qqq
qq qq
qq qqq
qq q qqq
qq qq
qq q qqqqq
qq qqq
qq qqq
qq qqq
q
qq
q
q
qqq
qqq
qqq
qqq
q
q
q
q
qqq
qqq
qqq
qqq
qq
qq
qq
qq
qqq
qqq
qqq
qq
qq
qq
qqq
qq
qq
qqq
qqq
qq
qq
qqq
qqq
q
q
qq q
q
qqq
qqq
qqq
qqq
qq q
qq q
qq
qq q
qq
qq
qq
qq
qq
qq
qq
q
2
1
2
1
1
1
Abb. 3.8: Mögliche und unmögliche Informationsmengen
Wenn ein Spiel nur einelementige Informationsmengen enthält,
sprechen wir von einem Spiel mit perfekter Information
(nicht zu verwechseln mit vollständiger Information).
Gibt es mehrelementige Informationsmengen sprechen wir
von einem Spiel mit imperfekter Information (nicht zu
verwechseln mit unvollständiger Information).
Strategien
Definition 3.3 (Strategie) Eine Strategie ist ein
vollständig konditionierter Aktionsplan: Für jede Informationsmenge, in der der Spieler am Zug ist, spezifiziert sie eine mögliche Aktion, d.h., sie konditioniert die Aktion auf die von Spieler i beobachtete
bisherige Geschichte des Spiels.
Spieltheorie (Winter 2009/10)
3-23
Prof. Dr. Ana B. Ania
Beispiele:
1
qqq
qqx
qqqqqqq qqqqqqqqqqqqq
qqqqqqq
qqqqqqq
q
q
q
q
q
q
qqqqqqq
q
qqqqqqq
qqqqqqq
qqqqqqq
qqqqqqq
q
q
q
q
q
qqqqqqq
q
q
q
q
q
q
qqqqqqq
q
q
qq
q
q
q
qqqqqqq
q
q
q
q
q
q
qqqqqqq
q
q
q
q
qq
q
qqqqqx
q
q
q
x
q
q
q qqqqq
q
q
q
qqqq qqqqqqqq
q qqqq
q
q
q
qqqq
qqqq
qqqq
q
q
q
q
q
q
q
qqqq
qqqq
q
q
q
q
q
q
q
q
qqqq
qqqq
q
q
qqqq
qqqq
qqqq
qqqq
q
q
q
q
q
qqqq
q
q
q
q
qqqq
q
q
q
q
q
qqqq
q
qqqq
q
q
q
q
q
q
qqqq
q
q
qqqq
q
q
q
q
q
q
qqqq
q
q
qqqq
qq
q
qqqq
qqqq
L
R
2
2
r
3
1
r
1
2
2
1
0
0
Abb. 3.9: Strategien in einem Spiel mit perfekter
Information
Spieler 1 hat 2 Strategien: L, R
Spieler 2 hat 4 Strategien: , r, r, rr
2
@
@
@
@
@
r
r
rr
L
3, 1
3, 1
1, 2
1, 2
R
2, 1
0, 0
2, 1
0, 0
1
Abb. 3.10: Normalform dieses Spiels
Spieltheorie (Winter 2009/10)
3-24
Prof. Dr. Ana B. Ania
1
qqqqqqq
qqqqqqqx
qqqqqqq
qqqqqqq
qqqqqqq
qqqqqqq
qqqqqqq
q
q
q
q
q
q
qqqqqqq
qq
q
q
q
q
q
q
qqqqqqq
q
q
q
q
q
q
q
qqqqqqq
q
q
q
q
q
q
qqqqqqq
q
q
q
q
q
q
qqqqqqq
q
q
q
q
q
q
q
qqqqqqq
q
q
q
q
q
q
qqqqqx
q
q
q
qqqqq
x
q
q
q
qqq qqqqq
q qqqq
q
q
q
qqqq qqqqqqq
qqqq
q
q
q
q
q
q
q
q
qqqq
qqqq
q
q
q
q
q
q
q
qqqq
qqqq
q
q
qqqq
qqqq
qqqq
qqqq
qqqq
qqqq
qqqq
qqqq
q
q
q
q
q
q
qqqq
q
qqqq
q
q
q
q
q
q
qqqq
q
q
qqqq
q
q
q
q
q
q
qqqq
q
q
qqqq
q
q
qqqqx
qq qq
q
q
qqx
q
qqq
qqq
q
qx
qq qqx
q
qq qqq
qq qq
qq qqq
qq q qqq
qq qq
qqq qqqq qqq qqqq qqq qqqq qqqqq qqqqqq qqq
qqq
qqq
qqq
qq
qq
qq
qq
qqq
qqq
qqq
qqq
qq
qq
qq
qq
qqq
qqq
qqq
qqq
qq
qq
qq
qq
qqq
qqq
qq q
qqq
qqq
qq q
qq q
qq q
qqq
q
q
qq
q
qqq
qqq
qqq
q
q
q
q
q
qq
q
q
q
q
q
q
q
q
L
R
2
2
r
1
L
R
L
1
R
r
1
L
R
L
1
R
Abb. 3.11: Strategien in einem Spiel mit imperfekter
Information
Strategien von Spieler 1:
Strategien von Spieler 2:
Jedes Spiel in extensiver Form kann in ein Spiel in Normalform überführt werden.
Aber: Zu einem Spiel in Normalform können mehrere verschiedene Spiele in extensiver Form existieren.
Spieltheorie (Winter 2009/10)
3-25
Prof. Dr. Ana B. Ania
3.4 Teilspielperfekte Gleichgewichte
Definition 3.4 (Teilspiel) Ein Teilspiel eines Spiels
in extensiver Form
a) beginnt in einem Entscheidungsknoten K einer
einelementigen Informationsmenge,
b) beinhaltet alle Entscheidungs- und Endknoten,
die K nachfolgen, aber keine Knoten, die K nicht
nachfolgen,
c) durchtrennt keine nachfolgenden Informationsmengen.
1
qqqqqqq
qqqqqx
qqqqqqq
qqqqqqq
qqqqqqq
qqqqqqq
q
q
qqqqqqq
q
q
q
q
qq
q
qqqqqqq
q
q
q
q
q
q
q
qqqqqqq
q
q
q
q
q
q
qqqqqqq
q
q
q
q
q
q
q
qqqqqqq
q
q
q
q
q
q
qqqqqqq
q
q
q
q
q
q
q
qqqqqqq
q
q
q
q
q
q
qqqqqx
q
qqqq
q
x
q
q
q
qq qqq
q qqqq
q
q
q
qqqq qqqqqqqq
q
qqqq
q
q
q
q
q
q
qqqq
q
qqqq
q
q
q
q
q
q
q
qqqq
q
qqqq
q
qqqq
qqqq
qqqq
qqqq
qqqq
qqqq
qqqq
qqqq
q
q
q
q
q
qqqq
q
q
q
q
qqqq
q
q
q
q
q
qqqq
q
qqqq
q
q
q
q
q
q
qqqq
q
q
qqqq
q
q
q
q
q
q
qqqqx
q
q
qqqx
qqqqq
qq qqq
qq qx
qq qx
qqqqq
qqqqq
qq qqq
qq qq
qq qq
q
q
q
q
q
q
q
qq qqq
qq qqqq qq qqq qq q qqqqqq qqq
qqq
qqq
qqq
qq
qq
qq
qq
qqq
qqq
qqq
qq
qq
qq
qq
qqq
qqq
qq
qqq
qqq
qq
qq
qq
qqq
q
q
q
q
q
qq q
q
qqq
qqq
qqq
qqq
q
q
q
q
q
qq
q
qqq
qqq
qqq
qqq
q
q
q
q
q
qq
q
q
q
q
q
q
q
q
L
R
2
2
r
1
L
R
L
1
R
r
1
L
R
Abb. 3.12: Teilspiele
L
1
R
Spieltheorie (Winter 2009/10)
3-26
Prof. Dr. Ana B. Ania
Intuitiv ist ein Teilspiel einfach ein Teil des gesamten Spiels,
der in einem Knoten beginnt und alle nachfolgenden Knoten enthält. An diesem Knoten muss die gesamte bisherige
Geschichte des Spiels dem Spieler, der hier am Zug ist, bekannt sein.
Ein Teilspiel kann isoliert betrachtet und analysiert werden.
Die folgende Deﬁnition stammt von Reinhard Selten (1965).
Definition 3.5 (Teilspielperfekte GG) Ein NashGleichgewicht ist teilspielperfekt, wenn die Strategien der Spieler in jedem Teilspiel ein Nash-Gleichgewicht
bilden.
Beispiel:
1
qqqqqqq
qqqqqqx
qqqqqqq
qqqqqqq
qqqqqqq
qqqqqqq
q
qqqqqqq
q
q
q
q
q
q
q
qqqqqqq
q
q
q
q
q
q
q
qqqqqqq
q
q
q
q
q
q
qqqqqqq
q
q
q
q
q
q
q
qqqqqqq
q
q
q
q
q
q
qqqqqqq
q
q
q
q
q
q
q
qqqqqqq
q
q
q
q
q
q
qqqqqx
q
qqqq
q
x
q
q
q
qq qqqq
q qqqq
q
q
q
qqqq qqqqqqq
qqqq
q
q
q
q
q
q
q
q
qqqq
qqqq
q
q
q
q
q
q
q
qqqq
qqqq
q
q
qqqq
qqqq
qqqq
qqqq
qqqq
qqqq
qqqq
qqqq
q
q
q
q
q
q
qqqq
q
q
q
qqqq
q
q
q
q
q
q
qqqq
qqqq
q
q
q
q
q
q
qqqq
q
q
qqqq
q
q
q
q
qqqq
q
q
q
q
q
qq
qq
qq
L
R
2
3
1
2
r
1
2
2
1
r
0
0
Abb. 3.13: Teilspielperfektes Nash-Gleichgewicht
Spieltheorie (Winter 2009/10)
3-27
Prof. Dr. Ana B. Ania
Analyse der Teilspiele:
Gegeben, dass Spieler 1 L gewählt hat, sollte 2 r spielen.
Gegeben, dass Spieler 1 R gewählt hat, sollte 2 spielen.
Gegeben das Verhalten von 2 sollte 1 R spielen.
Das teilspielperfekte Nash-Gleichgewicht ist (R, rl).
Beachten Sie:
Der Gleichgewichtspfad ist (R, l)
Aber: Das Gleichgewicht muss auch angeben, was außerhalb des Gleichgewichtspfades passieren würde. Darum
ist das Gleichgewicht (R, rl).
Es existiert ein zweites Nash-Gleichgewicht: (L, rr).
Aber, dieses Nash-GG ist nicht teilspielperfekt. Es enthält
die unglaubwürdige Drohung, dass Spieler 2 r spielt,
sollte Spieler 1 R spielen.
Teilspielperfektheit ist nicht nur für Spiele mit perfekter Information, sondern auch für beliebige Spiele mit
imperfekter Information wohldeﬁniert.
Spieltheorie (Winter 2009/10)
3-28
Prof. Dr. Ana B. Ania
Satz 3.1 Jedes endliche Spiel in extensiver Form
hat wenigstens ein teilspielperfektes Nash-Gleichgewicht.
Beweisskizze: Der Beweis ist konstruktiv und zeigt, wie man
ein teilspielperfektes Gleichgewicht ﬁnden kann. Das Verfahren ist eine Verallgemeinerung der Rückwärtsinduktion.
1) Beginne am Ende des Spielbaums und bestimme für
alle letzten Teilspiele die Nash-Gleichgewichte. Da es
sich bei diesen letzten Spielen um endliche Spiele handelt, muss in jedem von ihnen wenigstens ein NashGleichgewicht (eventuell in gemischten Strategien) existieren.
2) Wähle für jedes dieser Teilspiele ein Nash-Gleichgewicht
aus und ersetze das Teilspiel durch den Vektor der Gleichgewichtsauszahlungen.
3) Wiederhole diese Schritte für das reduzierte Spiel solange, bis alle Züge im gesamten Spiel bestimmt sind.
Damit ist ein teilspielperfektes Nash-Gleichgewicht gefunden.
Spieltheorie (Winter 2009/10)
3-29
Prof. Dr. Ana B. Ania
Satz 3.2 Jedes endliche Spiel in extensiver Form
mit perfekter Information hat generisch ein eindeutiges teilspielperfektes Nash-Gleichgewicht.
Beweis: Bei perfekter Information gibt es auf jeder Stufe der Rückwärtsinduktion nur einfache Ein-Personen-Entscheidungsprobleme. Da diese Probleme endlich sind, haben
sie eine Lösung. Generisch führen unterschiedliche Aktionen
nie zu denselben Auszahlungen. Also gibt es auf jeder Stufe eine eindeutige optimale Aktion, und folglich auch ein
eindeutiges Nash-Gleichgewicht.
Bemerkungen:
1. Dieser Satz wurde schon von Zermelo (1913) bewiesen.
2. Bei Spielen mit imperfekter Information kann es natürlich
mehrdeutige Gleichgewichte in einem Teilspiel geben.
Die Menge aller TPGG im gesamten Spiel erhält man,
indem man die Rückwärtsinduktion mit jeder möglichen
Kombination aller möglichen Gleichgewichte durchführt.
Spieltheorie (Winter 2009/10)
3-30
Prof. Dr. Ana B. Ania
Beispiel: Ein Spiel mit imperfekter Information
Betrachten Sie das folgende Spiel mit zwei Perioden, bei
dem die Spieler in der ersten Periode ein Gefangenen-Dilemma
und in der zweiten Periode ein Koordinationsspiel spielen:
B
@
@
cooperate defect
@
A @@
cooperate
2, 2
-1, 3
defect
3, -1
0, 0
r
L
x, x
0, 0
R
0, 0
y, y
B
@
@
@
@
@
A
Fig. 4.12: SPE of a Game of Imperfect Information
Was sind die teilspielperfekten Gleichgewichte dieses Spiels?
Unter welcher Annahme an x und y kann ein teilspielperfektes Gleichgewicht gestützt werden, bei dem die beiden
Spieler in der ersten Periode kooperieren?
Spieltheorie (Winter 2009/10)
3-31
Prof. Dr. Ana B. Ania
3.5 Teilspielperfektheit und Rationalität
Teilspielperfektheit erfordert, dass es “Common Knowledge” ist, dass alle Spieler rational sind. Betrachten Sie das
folgende Spiel:
1
qqqq
qqqqx
qqqq qqqqqqqq
qqqq
qqqq
q
q
q
qqqq
q
qqqq
qqqq
qqqq
qqqq
q
q
q
qqqq
q
q
q
qqqq
q
q
q
q
qqqq
q
qqqq
qqq qqq
qqq
qqqx
qqqq qqqqqqqq
q
q
q
q
qqqq
q
q
q
q
qqqq
2
qqqq
qqqq
qqqq
qqqq
q
q
q
qqqq
q
q
q
0
q
qqqq
q
q
q
q
qqqq
qq q
qqq qqq
qq
qqqqx
qqqq qqqqqqqq
q
q
q
q
qqqq
q
q
q
qqqq
q
1
qqqq
qqqq
q
q
q
qqqq
qqqq
qqqq
1
qqqq
qqqq
qqqq
qqqq
qqqq
qqq qqq
L
R
2
r
1
L
3
0
R
0
2
Abb. 3.14: Rationalität und Rückwärtsinduktion
Rückwärtsinduktion ergibt, dass Spieler 1 L spielen und das
Spiel damit beenden sollte. Begründung: Wenn Spieler 1 R
spielt, sollte Spieler 2 spielen, denn würde er r spielen,
würde Spieler 1 in der letzten Runde L spielen.
Angenommen, Spieler 1 spielt dennoch R.
Zeigt er damit nicht, dass er irrational ist?
Wenn Spieler 1 aber irrational ist, sollte Spieler 2 dann
Spieltheorie (Winter 2009/10)
3-32
Prof. Dr. Ana B. Ania
nicht vielleicht doch lieber r spielen, in der Hoﬀnung,
dass Spieler 1 sich in der letzten Runde ebenfalls irrational verhält und R spielt?
Wenn Spieler 2 durch diese Argumentation verleitet wird,
r zu spielen, sollte dann nicht auch ein rationaler Spieler
1 R in Runde 1 spielen?
Rückwärtsinduktion ist nur solange überzeugend, solange
Abweichungen vom Rückwärtsinduktionspfad rational erklärt werden können. Das hat Selten (1975) motiviert, das
Konzept des “perfekten Gleichgewichts” einzuführen:
1) Es ist common knowledge, beide Spieler sind rational.
2) Aber: Beide Spieler machen mit sehr kleinen Wahrscheinlichkeiten Fehler: ihre Hände zittern bei der Auswahl
der Strategien. Mit Wahrscheinlichkeit 1 − spielt jeder
Spieler die intendierte Strategie, aber mit Wahrscheinlichkeit macht er einen Fehler und wählt eine andere
(zufällig ausgewählte) Strategie. Die Wahl von R kann
dann als nicht intendierter Fehler von 1 interpretiert werden und bedeutet nicht, dass 1 irrational ist.
3) Ein perfektes Gleichgewicht ist der Limes einer Folge
von Gleichgewichten, in denen jeder Spieler mit Wahrscheinlichkeit einen Fehler macht, wenn gegen 0 konvergiert.
Spieltheorie (Winter 2009/10)
3-33
Prof. Dr. Ana B. Ania
Das folgende Spiel soll noch einmal darauf hinweisen, dass
Teilspielperfektheit nicht immer völlig plausibel sein muss.
Spieler 1 und 2 sind abwechselnd am Zug und können jedesmal entscheiden, ob das Spiel enden oder weitergehen
soll.
1
2
1
2
qqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqx
qqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqx
qqqqqqqqqqqqqqqq
qx
qqq
qqq
q
qqq
qq
q
qq
qq
qqq
qq
qq
qq
qq
qq
qq
qq
qq
qq
qq
qq
qq
qq
qq
qq
qq
qq
qq
qq
qq
qq
qq
qq
qq
q
q
q
w
w
s
1
1
w
s
0
3
2
2
2
w
s
1
qqqqqqqx
qqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqx
qqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqx
qqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqq
qq
qq
q
qqq
qq
qq
qq
qq
qq
qq
qq
qq
qq
qq
qq
qq
qq
qq
qq
qq
qq
qq
qq
qq
qq
qq
qq
qq
qq
qq
qq
qq
qq
q
q
q
w
s
97
100
w
s
99
99
100
100
s
98
101
Abb. 3.15: Rosenthals Hundertfüßler
Das eindeutige TPGG ist, dass jeder Spieler das Spiel beendet, wenn er zum Zug kommt.
Was passiert, wenn Spieler 1 das Spiel in Periode 1 nicht
beendet? Sollte Spieler 2 sich dennoch an das Gleichgewicht
halten?
Ob dieses TPGG überzeugend ist oder nicht, hängt entscheidend davon ab, wie die Spieler Abweichungen vom Gleichgewichtspfad interpretieren.
Spieltheorie (Winter 2009/10)
3-34
Prof. Dr. Ana B. Ania
3.6 Ein Zermürbungskrieg
Das klassische Beispiel für einen Zermürbungskrieg stammt
aus der Biologie (Maynard Smith, 1974): Kampf zweier Tiere um ein Territorium.
Wir betrachten dieses Spiel nur in diskreter Zeit mit unendlichem Horizont:
Folge von Zeitpunkten: t = 0, 1, 2, . . .
In jeder Periode entscheiden beide Spieler simultan, ob sie
“kämpfen” oder “aufgeben” sollen.
Wenn beide kämpfen, verlieren beide eine Nutzeneinheit
pro Periode, und das Spiel geht weiter.
Wenn einer aufgibt, der andere aber nicht, erhält der
Gewinner einer Preis im Wert v, der Verlierer nichts,
und das Spiel ist zu Ende.
Wenn beide gleichzeitig aufgeben, sind beide Verlierer
und erhalten beide nichts.
Auszahlungen: Sei t̂ die Periode, in der der Verlierer aufgegeben hat.
Verlierer:
uv (t̂) = −(1 + δ + · · · + δ
t̂−1
1 − δ t̂
)·1=−
1−δ
Spieltheorie (Winter 2009/10)
3-35
Prof. Dr. Ana B. Ania
Gewinner:
ug (t̂) = −(1 + δ + · · · + δ
t̂−1
1 − δ t̂
+ δ t̂v
)·1+δ v = −
1−δ
t̂
Existiert ein symmetrisches, stationäres TPGG?
Ja, aber nur in gemischten Strategien.
Angenommen beide Spieler geben in jeder Periode mit Wahrscheinlichkeit p auf und kämpfen mit Wahrscheinlichkeit
1 − p.
Diese Strategien sind nur dann ein Gleichgewicht, wenn jeder Spieler in jeder Periode indiﬀerent ist, ob er aufgeben
oder weiterkämpfen soll. Also muss in jeder Periode t gelten:
0 = p v + (1 − p) · [−1 + δ · 0]
Interpretation:
Die bisher verlorenen Nutzeneinheiten sind “sunk costs”.
Wir brauchen also nur Auszahlungen zu betrachten, die
von der jetzigen Periode an erhalten werden.
0 ist die Auszahlung, wenn ich heute aufgebe.
Wenn ich nicht aufgebe, gibt es zwei Möglichkeiten:
– Mit Wahrscheinlichkeit p gibt mein Gegner auf, und
ich bekomme v.
Spieltheorie (Winter 2009/10)
3-36
Prof. Dr. Ana B. Ania
– Mit Wahrscheinlichkeit 1 − p gibt er nicht auf, was
mich diese Runde eine Nutzeneinheit kostet. In der
nächsten Runde bin ich dann wieder indiﬀerent zwischen Aufgeben und Kämpfen. Also ist der FolgePayoﬀ ab der nächsten Runde genau 0.
Auﬂösen ergibt:
p∗ =
1
1+v
Bemerkungen:
1) Je höher der Preis v, um so kleiner ist die Wahrscheinlichkeit des Aufgebens.
2) Das Ergebnis ist ineﬃzient, weil mit positiver Wahrscheinlichkeit gekämpft wird. Mit positiver Wahrscheinlichkeit sind die Kosten des Kämpfens sogar höher als
der zu gewinnende Preis.
3) Es gibt noch andere TPGG. Beispiel: Spieler 1 wird immer kämpfen, Spieler 2 wird immer aufgeben. Insbesondere sind alle stationären Nash-Gleichgewichte auch
teilspielperfekt.
4) Aber: Das Gleichgewicht, dass wir oben charakterisiert
haben, ist das einzige symmetrische Gleichgewicht.
Spieltheorie (Winter 2009/10)
3-37
Prof. Dr. Ana B. Ania
3.7 Das “Einmal-Abweichungsprinzip”
In den bisherigen Beispielen war es relativ einfach, zu prüfen,
ob ein Strategientupel (s∗1 , . . . , s∗n) ein TPGG ist. In komplizierteren Spielen kann das jedoch sehr aufwendig sein. Der
folgende Satz macht uns das Leben erheblich leichter:
Satz 3.3 (Einmal-Abweichungsprinzip) Ein Strategientupel s∗ ist teilspielperfekt genau dann, wenn
es für keinen Spieler i eine Strategie s̃i gibt, die sich
von s∗i nur in einer Periode t und nach einer Geschichte ht unterscheidet, und die echt besser ist als
s∗i , wenn das Teilspiel nach ht erreicht wird.
Bemerkungen:
1) Es ist oﬀensichtlich, dass die Bedingung notwendig für
Teilspielperfektheit ist. Gäbe es eine solche proﬁtable
Abweichungsstrategie s̃i, dann kann sicher kein TPGG
vorliegen. (Achtung: Es könnte immer noch ein NashGleichgewicht vorliegen, falls die Geschichte ht auf dem
Gleichgewichtspfad nicht erreicht wird.)
2) Es ist nicht oﬀensichtlich, dass die Bedingung auch hinreichend für Teilspielperfektheit ist. Angenommen, es
gäbe keine proﬁtable Strategie s̃i, die nur in einer Informationsmenge von s∗i abweicht. Dann könnte es immer
Spieltheorie (Winter 2009/10)
3-38
Prof. Dr. Ana B. Ania
noch eine Strategie ŝi geben, die an mehreren Informationsmengen gleichzeitig von s∗i abweicht und echt besser
als s∗i ist.
3) Wenn wir den Satz bewiesen haben, können wir uns das
Leben in Zukunft sehr viel leichter machen: Wir müssen
nur noch prüfen, ob es Abweichungsstrategien gibt, die
proﬁtabel an nur einer Informationsmenge abweichen.
Das ist besondern nützlich bei wiederholten Spielen.
4) Wir führen den Beweis für Spiele mit endlichem Horizont. Der Beweis für Spiele mit unendlichem Horizont
wird nur skizziert. Siehe Fudenberg-Tirole, S. 107-110.
Beweis (durch Widerspruch): Angenommen, wir haben ein
Strategientupel s∗, das der Bedingung des Einmal-Abweichungsprinzips genügt, das aber nicht teilspielperfekt ist.
Dann existiert ein Zeitpunkt t und eine Geschichte ht, so
dass es für einen Spieler i eine Strategie ŝi gibt, die nach
ht echt besser gegen s∗−i ist als s∗i und an wenigstens zwei
Informationsmengen von s∗i abweicht.
Wir suchen jetzt die “letzte” Informationsmenge, an der eine Abweichung von s∗i echt proﬁtabel ist: Betrachte den
letzten Zeitpunkt, an dem es eine Informationsmenge gibt,
in der ŝi von s∗i abweicht. Wenn ŝi zu keiner strikten Verbesserung führt, falls diese Informationsmenge erreicht wird,
Spieltheorie (Winter 2009/10)
3-39
Prof. Dr. Ana B. Ania
dann ersetze diesen Teil von ŝi durch den entsprechenden
Teil von s∗i und gehe zur nun “letzten” Informationsmenge
mit einer Abweichung. Tue das solange, bis die “letzte” Informationsmenge gefunden ist, in der ŝi echt besser ist als
s∗i . Die Geschichte, die zu dieser Informationsmenge führt,
nennen wir h̃t̃.
Betrachte jetzt eine Strategie s̃i, die mit s∗i in allen Informationsmengen übereinstimmt, bis auf diejenige im Anschluss
an h̃t̃, die wir im letzten Abschnitt gefunden haben. An dieser Informationsmenge stimmt die Strategie mit ŝi überein.
In allen folgenden Informationsmengen ist sie aber wieder
identisch mit s∗i . Aufgrund unserer Konstruktion muss gelten:
s̃i ist gegen s∗−i echt besser als s∗i , wenn h̃t̃ erreicht wird.
s̃i weicht von s∗i in nur einer einzigen Informationsmenge
ab.
Also ist eine proﬁtable Abweichung mit einfacher Abweichung gefunden. Das ist ein Widerspruch zu der Annahme, dass s∗i die Bedingung des Einmal-Abweichungsprinzips
erfüllt.
Q.E.D.
Spieltheorie (Winter 2009/10)
3-40
Prof. Dr. Ana B. Ania
Beweisskizze für Spiele mit unendlichem Horizont:
Bei unendlichem Horizont muss es keine “letzte” Informationsmenge mit einer proﬁtablen Abweichung geben. Was
dann?
Wenn die Strategie ŝi gegen s∗−i echt besser ist als s∗i , dann
existiert ein > 0, so dass
ui(ŝi, s∗−i | ht) > ui(s∗i , s∗−i | ht) + .
Wenn die Spieler zukünftige Auszahlungen diskontieren, dann
existiert ein t < ∞, so dass der Gegenwartswert aller Auszahlungen nach t kleiner als sind.
Also muss die Strategie ŝi zu einer proﬁtablen Abweichung
vor der Periode t führen.
Damit haben wir wieder ein endliches Problem, das wir von
hinten aufrollen können genau wie im obigen Beweis.

Zugehörige Unterlagen

Einführung in Datenanalyse und Data Mining mit

Ventura - IMIPR.CHP

3 Dynamische Spiele mit vollständiger Information 3.1

Zugehörige Unterlagen

Produkte

Unterstützung

3 Dynamische Spiele mit vollständiger Information 3.1

Zugehörige Unterlagen

Dieses Dokument Sammlung (en)

Dieses Dokument gespeichert

Schlagen Sie uns vor, wie wir StudyLib verbessern können