2. Statische Spiele mit vollständiger Information

Werbung
2. Statische Spiele mit vollständiger Information
Klaus M. Schmidt
LMU München
Spieltheorie, Wintersemester 2014/15
Klaus M. Schmidt (LMU München)
2. Statische Spiele mit vollständiger Information
Spieltheorie, Wintersemester 2014/15
1 / 82
Literaturhinweise zu Kapitel 2:
Osborne (2004), Kapitel 2-4
Gibbons (1992), Kapitel 1
MasColell, Whinston, Green (1995), Kapitel 7 und 8
Fudenberg und Tirole (1991), Kapitel 1 und 2
c 2014 Klaus M. Schmidt
Klaus M. Schmidt (LMU München)
2. Statische Spiele mit vollständiger Information
Spieltheorie, Wintersemester 2014/15
2 / 82
2.1 Beschreibung eines Spieles
Die “Normalform” eines Spiels besteht aus:
1) Menge der Spieler
I = {1, 2, . . . , n}
2) Menge aller möglichen Strategien für jeden Spieler
Si
für alle {i ∈ I wobei
si ∈ Si
ein Element (also eine Strategie) aus der Menge Si bezeichnet. Ein Profil
von Strategien für alle Spieler ist ein Vektor
s = (s1 , s2 , . . . , sn ) ∈ ×ni=1 Si .
Manchmal ist es nützlich, diesen Vektor zu schreiben als:
s = (si , s−i ) ∈ (Si , S−i ) ,
wobei s−i der Vektor der Strategien aller übrigen Spieler (außer Spieler i)
ist.
Klaus M. Schmidt (LMU München)
2. Statische Spiele mit vollständiger Information
Spieltheorie, Wintersemester 2014/15
3 / 82
3) Auszahlungsfunktionen für jeden Spieler
ui : S1 × S2 × · · · × Sn → R
für alle i ∈ {1, . . . , n}, die jedem möglichen Strategienprofil eine
Auszahlung für jeden Spieler zuordnet.
Definition 2.1 (Normalform)
Die Normalform eines Spiels G = {I; S1 , . . . , Sn ; u1 , . . . , un } spezifiziert
1) die Menge der Spieler, I = {1, . . . , n},
2) die Strategienräume der Spieler, S1 , . . . , Sn ,
3) die Nutzenfunktionen der Spieler, u1 , . . . , un .
Klaus M. Schmidt (LMU München)
2. Statische Spiele mit vollständiger Information
Spieltheorie, Wintersemester 2014/15
4 / 82
2.2 Ein Bei-Spiel
Zwei Unternehmen stehen auf einem Duopolmarkt im Preiswettbewerb.
Jedes Unternehmen muss entscheiden, ob es einen hohen oder einen
niedrigen Preis verlangt. Die Entscheidungen werden gleichzeitig getroffen.
Wenn beide Firmen den hohen Preis wählen, machen beide einen
Gewinn von jeweils 2 Mio. Euro.
Wenn eine Firma einen hohen Preis und die andere einen niedrigen
Preis wählt, macht die Firma mit dem niedrigen Preis einen Gewinn von 3
Mio. Euro und die mit dem hohen Preis einen Gewinn von 0 Euro.
Wenn beide Firmen den niedrigen Preis wählen, machen beide einen
Gewinn von 1 Mio. Euro.
Klaus M. Schmidt (LMU München)
2. Statische Spiele mit vollständiger Information
Spieltheorie, Wintersemester 2014/15
5 / 82
Ein Normalformspiel mit nur zwei Spielern und endlich vielen Strategien kann
in einer Bimatrix dargestellt und analysiert werden:
2
@
1 @
@
H
N
H
2, 2
0, 3
N
3, 0
1, 1
Abb. 2.1: Duopolmarkt
Klaus M. Schmidt (LMU München)
2. Statische Spiele mit vollständiger Information
Spieltheorie, Wintersemester 2014/15
6 / 82
Menge der Spieler: I =
Strategienmengen der Spieler:
S1 =
S2 =
S=
Auszahlungsfunktionen:
u1 (N, N) =
u1 (N, H) =
u1 (H, N) =
u1 (H, H) =
u2 (N, N) =
u2 (N, H) =
u2 (H, N) =
u2 (H, H) =
Welche Strategie sollte Unternehmen 1 in diesem Beispiel wählen?
Klaus M. Schmidt (LMU München)
2. Statische Spiele mit vollständiger Information
Spieltheorie, Wintersemester 2014/15
7 / 82
Bemerkungen:
1) Bei einem statischen Spiel ist nicht entscheidend, dass die Spieler
simultan handeln. Entscheidend ist, dass kein Spieler weiß, welche
Strategien die anderen Spieler gewählt haben, wenn er selbst am Zug ist.
2) Wir werden im Folgenden grundsätzlich annehmen, dass die
Auszahlungen der Spieler durch von Neumann-Morgensternsche
Nutzenfunktionen beschrieben werden. Eine solche Nutzenfunktion
ordnet jedem möglichen Ergebnis der Interaktion und damit jedem
möglichen Strategientupel (s1 , . . . , sn ) einen Nutzenwert zu, der nicht nur
die ordinalen Präferenzen über die Ergebnisse, sondern auch die
Risikopräferenzen eines Spielers reflektiert. Sie ist eindeutig bis auf eine
positive lineare Transformation. Bei Unsicherheit über das Ergebnis ist
die Auszahlung gleich dem Erwartungswert der Nutzenfunktion.
3) In einem Spiel mit vollständiger Information sind sowohl die Struktur des
Spiels als auch die Auszahlungen “common knowledge”
(gemeinsames Wissen).
4) Die Normalform eines Spiels wird oft auch die “strategische Form”
genannt, im Gegensatz zur “extensiven Form” eines Spiels, die wir bei
dynamischen Spielen kennenlernen werden.
Klaus M. Schmidt (LMU München)
2. Statische Spiele mit vollständiger Information
Spieltheorie, Wintersemester 2014/15
8 / 82
2.3 Dominanz
Definition 2.2 (Streng dominierte Strategie)
Eine Strategie ŝi von Spieler i wird streng dominiert, wenn es eine andere
Strategie s̃i ∈ Si gibt, so dass s̃i zu einer streng größeren Auszahlung führt als
ŝi , ganz gleich welches Strategientupel von den Gegenspielern gewählt wird:
ui (ŝi , s−i ) < ui (s̃i , s−i ) ∀s−i ∈ S−i .
Im Duopolmarktbeispiel ist die Strategie “H” streng dominiert.
Warum wird ein rationaler Spieler wird niemals eine streng dominierte
Strategie spielen?
Klaus M. Schmidt (LMU München)
2. Statische Spiele mit vollständiger Information
Spieltheorie, Wintersemester 2014/15
9 / 82
Definition 2.3 (Dominante Strategie)
Die Strategie si∗ von Spieler i ist eine (streng) dominante Strategie, falls sie
alle anderen Strategien von Spieler i streng dominiert. D.h., eine dominante
Strategie ist eine streng beste Antwort gegen alle Strategientupel s−i :
ui (si∗ , s−i ) > ui (si , s−i ) ∀si ∈ Si \ {si∗ }, s−i ∈ S−i .
Wenn von einer “dominanten Strategie” die Rede ist, ist immer eine streng
dominante Strategie gemeint. Wenn eine Strategie nur schwach dominant ist,
muss das ausdrücklich gesagt werden.
Gibt es eine dominante Strategie im Duopolmarkt-Beispiel?
Wenn eine dominante Strategie si∗ existiert, wird sie ein rationaler Spieler
immer wählen, ganz gleich, was er über das Verhalten seiner Gegenspieler
annimmt. Warum?
Klaus M. Schmidt (LMU München)
2. Statische Spiele mit vollständiger Information
Spieltheorie, Wintersemester 2014/15
10 / 82
Satz 2.1
Wenn in G = {I, S1 , . . . , Sn ; u1 , . . . , un } jeder Spieler i eine dominante
Strategie hat und alle Spieler rational sind, dann gibt es ein Gleichgewicht in
dominanten Strategien.
Beweis von Satz 2.1:
Klaus M. Schmidt (LMU München)
2. Statische Spiele mit vollständiger Information
Spieltheorie, Wintersemester 2014/15
11 / 82
Bemerkungen:
1) Dieser Satz verlangt nur, dass jeder Spieler rational ist. Er verlangt nicht,
dass jeder Spieler weiß, dass seine Gegenspieler rational sind.
2) Im Duopolspiel ist es für beide Spieler eine dominante Strategie, den
niedrigen Preis zu wählen. Also gibt es ein eindeutiges Gleichgewicht in
dominanten Strategien: Beide Firmen wählen den niedrigen Preis,
obwohl sich beide Firmen besser stellen würden, wenn sie beide den
hohen Preis wählen würden. Warum ist dieses Verhalten trotzdem
“rational”?
3) Das Duopolspiel hat dieselbe strategische Struktur wie das
“Gefangenendilemma”. In beiden Fällen hat jeder Spieler die streng
dominante Strategie, etwas sozial Ineffizientes zu tun.
In der folgenden Bimatrix bezeichnen die Auszahlungen die “Jahre im
Gefängnis”, die den beiden Gefangenen bevorstehen, wenn sie die
jeweiligen Strategien wählen.
Klaus M. Schmidt (LMU München)
2. Statische Spiele mit vollständiger Information
Spieltheorie, Wintersemester 2014/15
12 / 82
B Leugnen
Gestehen
@
A @ (“cooperate”) (“defect”)
@
Leugnen
(“cooperate”)
-1, -1
-4, 0
Gestehen
(“defect”)
0, -4
-3, -3
Abb. 2.2: Gefangenendilemma
Das Gefangenendilemma ist eine sog. “soziale Dilemmasituation”, die
immer dann auftritt, wenn optimales individuelles Verhalten zu einem
sozial ineffizienten Ergebnis führt. Andere wichtige Beispiele für soziale
Dilemmasituationen sind Spiele, in denen die Spieler zu einem
öffentlichen Gut beitragen müssen (public good games) und
Wettbewerbsspiele (z.B. das Cournot- oder das Bertrandspiel).
Klaus M. Schmidt (LMU München)
2. Statische Spiele mit vollständiger Information
Spieltheorie, Wintersemester 2014/15
13 / 82
4) Obwohl die Vorhersage “Ein Spieler wird seine dominante Strategie
spielen, wenn eine solche existiert” fast trivial ist, scheint sie von
tatsächlichen Spielern oft verletzt zu werden. In Experimenten zum
Gefangenendilemma entscheiden sich viele Versuchspersonen zu
kooperieren. Viele bleiben bei dieser Entscheidung, obwohl man ihnen
erklärt, dass “Gestehen” eine dominante Strategie ist.
5) Eine mögliche Erklärung ist, dass die Auszahlungen oder die
Spielstruktur nicht richtig spezifiziert wurden:
I
I
Vielleicht geht es den Versuchspersonen nicht nur um ihr eigenes
Einkommen, sondern auch um Fairness und Reziprozität.
Vielleicht betrachten die Versuchspersonen das Spiel als Teil eines
wiederholten Spiels.
Im Labor kann man diese Hypothesen überprüfen.
6) Die meisten Spiele haben kein Gleichgewicht in dominanten Strategien.
Was soll ein Spieler dann tun?
Klaus M. Schmidt (LMU München)
2. Statische Spiele mit vollständiger Information
Spieltheorie, Wintersemester 2014/15
14 / 82
2.4 Iterierte Elimination von streng dominierten Strategien,
Rationalisierbarkeit
Betrachten Sie das folgende Spiel:
2
@
1 @
@
Links
Mitte
Rechts
Oben
1, 0
1, 2
0, 1
Unten
0, 3
0, 1
2, 0
Abb. 2.3: Iterierte Elimination von streng dominierten Strategien
Welche Strategien werden hier streng dominiert?
Klaus M. Schmidt (LMU München)
2. Statische Spiele mit vollständiger Information
Spieltheorie, Wintersemester 2014/15
15 / 82
“Rechts” wird streng dominiert durch “Mitte”
⇒ Ein rationaler Spieler 2 wird “Rechts” nicht wählen.
⇒ Wenn Spieler 1 weiß, dass Spieler 2 rational ist, kann er
“Rechts” eliminieren. Dann ist für ihn “Unten” streng dominiert.
⇒ Wenn Spieler 2, weiß, dass Spieler 1 rational ist und dass
Spieler 1 weiß, dass 2 rational ist, kann er “Unten” eliminieren.
Dann ist für ihn “Links” streng dominiert.
⇒ (“Oben”, “Mitte”) wird gespielt.
Bemerkungen:
1) Iterierte Elimination von streng dominierten Strategien (IESDS) verlangt
nicht nur, (i) dass alle Spieler rational sind, sondern auch, (ii) dass alle
Spieler wissen, dass alle Spieler rational sind, (iii) dass alle Spieler
wissen, dass alle Spieler wissen, dass alle Spieler rational sind, usw. ad
infinitum. Das heißt, Rationalität muss “common knowledge” sein.
2) Die Reihenfolge der Eliminierung spielt bei streng dominierten Strategien
für das Ergebnis keine Rolle.
3) Schwach dominierte Strategien dürfen nicht eliminiert werden!
Klaus M. Schmidt (LMU München)
2. Statische Spiele mit vollständiger Information
Spieltheorie, Wintersemester 2014/15
16 / 82
2.5 Nash-Gleichgewicht
Wenn ein Spieler erwartet, dass seine Gegenspieler die
Strategienkombination s−i spielen, sollte er eine Strategie wählen, die eine
“beste Antwort” gegen s−i ist.
Definition 2.4 (Beste Antwort)
Die Strategie si von Spieler i ist eine (schwach) beste Antwort gegen die
Strategien s−i seiner Gegenspieler, wenn
ui (si , s−i ) ≥ ui (si0 , s−i ) ∀si0 ∈ Si .
Klaus M. Schmidt (LMU München)
2. Statische Spiele mit vollständiger Information
Spieltheorie, Wintersemester 2014/15
17 / 82
Das folgende Konzept des Nash-Gleichgewichts ist von fundamentaler
Bedeutung für die Spieltheorie:
Definition 2.5 (Nash-Gleichgewicht)
Die Strategien (s1∗ , s2∗ , . . . , sn∗ ) bilden ein Nash-Gleichgewicht, falls jede
∗
ist, d.h.
Strategie si∗ eine beste Antwort gegen s−i
∗
∗
ui (s1∗ , .., si∗ , .., sn∗ ) ≥ ui (s1∗ , .., si−1
, si , si+1
, .., sn∗ )
für alle i ∈ {1, . . . , n} und alle si ∈ Si .
Ein Nash-Gleichgewicht ist also eine Strategienkombination aus
wechselseitig besten Antworten:
Für jeden Spieler gilt, dass er eine beste Antwort gegen die Strategien
aller übrigen Spieler spielt.
Diese Situation ist ein Gleichgewicht (eine stabile Situation), weil kein
Spieler einen Anreiz hat, seine Strategie zu ändern.
Klaus M. Schmidt (LMU München)
2. Statische Spiele mit vollständiger Information
Spieltheorie, Wintersemester 2014/15
18 / 82
Beachten Sie:
1) In der Definition des Nash-Gleichgewichts wird nur die schwache
Ungleichheit verlangt. Warum?
2) Beachten Sie, dass das Nash-Gleichgewicht verlangt, dass alle Spieler
korrekte Erwartungen bilden.
Kein Spieler weiß, welche Strategien seine Gegenspieler gewählt haben.
Seine optimale Strategie hängt also von den Erwartungen über die
gewählten Strategien der anderen Spieler ab.
Betrachten Sie zur Illustration ein Spiel mit zwei Spielern:
I
I
Im Nash-Gleichgewicht ist die Strategie von Spieler 1 optimal, gegeben
seine korrekte Erwartung über die Strategie von Spieler 2 und
für Spieler 2 ist es tatsächlich optimal, sich entsprechend der Erwartung von
Spieler 1 zu verhalten, wenn er selbst korrekt erwartet, welche Strategie
Spieler 1 wählen wird.
Ein Nash-Gleichgewicht ist also nicht nur eine Kombination von
wechselseitig besten Antworten, sondern auch eine Kombination von
miteinander konsistenten Erwartungen.
Klaus M. Schmidt (LMU München)
2. Statische Spiele mit vollständiger Information
Spieltheorie, Wintersemester 2014/15
19 / 82
3) Angenommen, die Spieler können sich vor dem Spiel darüber
unterhalten, welche Strategien sie spielen werden. Diese Abstimmung ist
jedoch nicht bindend (nicht-kooperative Spieltheorie!).
Frage: Gibt es eine Absprache auf eine Strategienkombination, die
selbst-durchsetzend ist, d.h., von der niemand einen Anreiz hat
abzuweichen?
Eine Strategienkombination ist selbst-durchsetzend dann und nur dann,
wenn sie ein Nash-Gleichgewicht ist:
I
I
In einem Nash-Gleichgewicht hat kein Spieler einen Anreiz von seiner
Gleichgewichtsstrategie abzuweichen.
Wenn eine Strategienkombination kein Nash-Gleichgewicht ist, dann
existiert wenigstens ein Spieler i und eine Strategie s̃i , so dass
ui (ŝ1 , .., ŝi , .., ŝn ) < ui (ŝ1 , .., ŝi−1 , s̃i , ŝi+1 , .., ŝn ) .
Also hat i einen Anreiz, von der Übereinkunft abzuweichen.
Klaus M. Schmidt (LMU München)
2. Statische Spiele mit vollständiger Information
Spieltheorie, Wintersemester 2014/15
20 / 82
Wie findet man ein Nash-Gleichgewicht in einem 2-Personen-Spiel mit
endlich vielen Strategien?
Betrachte jede Strategie von Spieler 1 und überlege, welche Strategie
von Spieler 2 dagegen eine beste Antwort ist. Unterstreiche die höchste
Auszahlung von Spieler 2 für jede gegebene Strategie von Spieler 1.
Betrachte jede Strategie von Spieler 2 und überlege, welche Strategie
von Spieler 1 dagegen eine beste Antwort ist. Unterstreiche die höchste
Auszahlung von Spieler 1 für jede gegebene Strategie von Spieler 2.
Gibt es eine Zelle in der Auszahlungsbimatrix, in der beide Auszahlungen
unterstrichen sind? Wenn ja, dann sind die Strategien der Spieler hier
wechselseitig beste Antworten, also ein Nash-Gleichgewicht.
Klaus M. Schmidt (LMU München)
2. Statische Spiele mit vollständiger Information
Spieltheorie, Wintersemester 2014/15
21 / 82
Beispiel:
2
@
1 @
@
`
m
r
O
0, 4
4, 0
5, 3
M
4, 0
0, 4
5, 3
U
3, 5
3, 5
6, 6
Abb. 2.4: Finden eines Nash-Gleichgewichts
Klaus M. Schmidt (LMU München)
2. Statische Spiele mit vollständiger Information
Spieltheorie, Wintersemester 2014/15
22 / 82
2.6 Multiple Nash-Gleichgewichte
Leider gibt es oft mehrere Gleichgewichte. Beispiele:
Sie
@
Er @
@
Boxen
Ballett
Boxen
2, 1
0, 0
Ballett
0, 0
1, 2
Abb. 2.5: Kampf der Geschlechter
Klaus M. Schmidt (LMU München)
2. Statische Spiele mit vollständiger Information
Spieltheorie, Wintersemester 2014/15
23 / 82
2
@
1 @
@
Falke
Taube
Falke
-10, -10
5, 0
Taube
0, 5
1, 1
Abb. 2.6: Feigling (“Chicken”), Falke-Taube (“Hawk-Dove”)
Ohne zusätzliche Information ist unklar, ob die Spieler überhaupt ein
Nash-Gleichgewicht spielen werden und, wenn ja, welches.
In manchen Spielen ragt ein Nash-Gleichgewicht aus der Menge aller
Nash-Gleichgewichte heraus, weil es “offensichtlich" von allen Spielern
gespielt werden sollte.
Wann ist ein Nash-Gleichgewicht “offensichtlich”?
Klaus M. Schmidt (LMU München)
2. Statische Spiele mit vollständiger Information
Spieltheorie, Wintersemester 2014/15
24 / 82
2.6.1 Fokus-Punkte (Focal Points)
Schelling (1960): Bei vielen Koordinationsproblemen gibt es gesellschaftliche
Normen oder Konventionen, die festlegen, welches Gleichgewicht gespielt
wird. Beispiele:
1. Normen
Sie fahren mit dem Auto aus der Garage auf die Straße. Welche
Straßenseite wählen Sie?
Was würden Sie in England tun?
Wie ist das bei Radfahrern, Fußgängern?
2. Das Aufteilungsspiel
Sie müssen 10 EUR zwischen sich selbst und einem Gegenspieler
aufteilen.
Schreiben Sie auf einen Zettel, wie viel Sie für sich selbst beanspruchen.
Zwei Zettel werden zufällig ausgewählt. Wenn die Summe der
Forderungen kleiner oder gleich 10 EUR ist, bekommt jeder seine
Forderung. Ansonsten bekommen beide nichts.
Welche Zahl würden Sie auf Ihren Zettel schreiben?
Klaus M. Schmidt (LMU München)
2. Statische Spiele mit vollständiger Information
Spieltheorie, Wintersemester 2014/15
25 / 82
3. Das Städte-Spiel
Teilen Sie die folgende Liste von Städten in zwei beliebige Gruppen auf:
Berlin, Havanna, London, Moskau, Paris, Ottawa, Washington.
Schreiben Sie Ihre Aufteilung und Ihren Namen auf einen Zettel.
Zwei Zettel werden zufällig ausgewählt. Wenn die beiden Zettel dieselbe
Aufteilung der Städte aufweisen, bekommt jeder 5 Euro. Ansonsten
bekommen beide nichts.
Welche Aufteilung der Städte würden Sie vornehmen?
Klaus M. Schmidt (LMU München)
2. Statische Spiele mit vollständiger Information
Spieltheorie, Wintersemester 2014/15
26 / 82
2.6.2 Kommunikation vor dem Spiel
Wenn die Spieler vor dem Spiel miteinander kommunizieren können, können
sie sich auf ein Gleichgewicht einigen, das damit zu einem Fokus-Punkt wird.
Beispiel 1: Kampf der Geschlechter
Wenn die beiden Spieler sich absprechen, zum Boxkampf zu gehen, was
wird dann jeder Spieler tun?
Beispiel 2: Das Duopolspiel
Wenn die beiden Spieler sich absprechen, hohe Preise zu wählen, was
wird dann jeder Spieler tun?
Fazit: Eine unverbindliche Absprache wird von den Parteien dann und nur
dann eingehalten, wenn es sich um ein Nash-Gleichgewicht handelt!
Klaus M. Schmidt (LMU München)
2. Statische Spiele mit vollständiger Information
Spieltheorie, Wintersemester 2014/15
27 / 82
2.6.3 Pareto-Optimalität
Im folgenden Spiel gibt es zwei Gleichgewichte, aber es scheint offensichtlich,
welches gespielt werden sollte, auch wenn die Parteien sich nicht absprechen
können.
2
@
1 @
@
`
r
O
100, 100
0, 0
U
0, 0
1, 1
Abb. 2.7: Pareto-optimales Nash-Gleichgewicht
Klaus M. Schmidt (LMU München)
2. Statische Spiele mit vollständiger Information
Spieltheorie, Wintersemester 2014/15
28 / 82
Ist es immer “offensichtlich”, ein Pareto-effizientes Gleichgewicht zu spielen,
falls dieses eindeutig ist?
Gegenbeispiel von Harsanyi und Selten (1988):
2
@
1 @
@
`
r
O
9, 9
0, 8
U
8, 0
7, 7
Abb. 2.8: Pareto-Effizienz und Risiko-Dominanz
Klaus M. Schmidt (LMU München)
2. Statische Spiele mit vollständiger Information
Spieltheorie, Wintersemester 2014/15
29 / 82
Spieler 1 könnte sich denken:
O ist sehr riskant, wenn nicht völlig sicher ist, dass Spieler 2 ` wählt.
U führt zu einer nur unwesentlich kleineren Auszahlung, ist aber sehr viel
sicherer.
Harsanyi und Selten argumentieren, dass das Nash-GG (U, r ) das Nash-GG
(O, l) risikodominiert und deshalb gespielt werden sollte.1
Werden die Spieler das Pareto-effiziente Gleichgewicht spielen, wenn sie sich
vor dem Spiel absprechen können?
Aumann (1990): Nein!
Spieler 1 wird sich sagen: “Ganz gleich, welche Strategie ich spielen werde,
ich sollte immer versuchen, Spieler 2 davon zu überzeugen, dass ich O
spiele, damit er ` spielt.”
Also enthält die Mitteilung von Spieler 1, dass er O spielen wird, keine neue
Information.
1 In einem symmetrischen 2x2 Spiel (zwei Spieler mit jeweils zwei Strategien) “risikodominiert”
das Gleichgewicht (a, a) das Gleichgewicht (b, b), wenn beide Spieler a wählen würden, falls sie
glauben, dass der jeweils andere Spieler die Strategien a und b jeweils mit gleicher
Wahrscheinlichkeit wählt.
Klaus M. Schmidt (LMU München)
2. Statische Spiele mit vollständiger Information
Spieltheorie, Wintersemester 2014/15
30 / 82
2.7 Anwendungsbeispiele
2.7.1 Öffentliche Güter
Betrachten Sie das folgende lineare Public Good Spiel:
Vier Spieler, i ∈ {1, 2, 3, 4}. Jeder Spieler hat ein Vermögen von 10.
Jeder Spieler entscheidet, welchen Betrag xi ∈ [0, 10] er zu einem
öffentlichen Gut beiträgt.
Wenn Spieler i den Betrag xi zum öffentlichen Gut beiträgt, erhöht sich
die Auszahlung von jedem Spieler um a · xi mit 41 < a < 1.
Die Monetäre Auszahlungsfunktion von Spieler i, i ∈ {1, 2 , 3 , 4} ist also:
Ui = a ·
4
X
xj + (10 − xi )
j=1
Welche Strategie wäre sozial effizient?
Welche Strategie ist für jeden Spieler dominant?
Vergleichen Sie das Public Good Spiel mit dem Gefangenendilemma.
Klaus M. Schmidt (LMU München)
2. Statische Spiele mit vollständiger Information
Spieltheorie, Wintersemester 2014/15
31 / 82
2.7.2 Cournot-Duopol (Auguste Cournot, 1838):
Zwei Unternehmen produzieren ein homogenes Gut
keine Fixkosten;
identische, konstante Grenzkosten c1 = c2 = c
simultane Wahl der Mengen, x1 ∈ R+ , x2 ∈ R+
Preis ergibt sich bei Gesamtproduktion x = x1 + x2 aus der inversen
Nachfragefunktion:
P(x) = a − b · (x1 + x2 )
Gewinnfunktion von Unternehmen i, i ∈ {1, 2}:
πi = [a − b · (xi + xj )] · xi − c · xi
Klaus M. Schmidt (LMU München)
2. Statische Spiele mit vollständiger Information
Spieltheorie, Wintersemester 2014/15
32 / 82
Bestimmung der Reaktionsfunktion (Beste-Antwort-Funktion) von
Unternehmen 1:
max[a − b · (x1 + x2 )] · x1 − c · x1
x1
Bedingung erster Ordnung für Maximum:
∂π1
= a − b · (x1 + x2 ) − bx1 − c = 0
∂x1
Reaktionsfunktion:
x1∗ (x2 ) = R1 (x2 ) =
1
(a − c − bx2 )
2b
Analog für Unternehmen 2:
x2∗ (x1 ) = R2 (x1 ) =
Klaus M. Schmidt (LMU München)
1
(a − c − bx1 )
2b
2. Statische Spiele mit vollständiger Information
Spieltheorie, Wintersemester 2014/15
33 / 82
Nash-Gleichgewicht muss wechselseitig beste Antwort sein, d.h.
x1 =
1
(a − c − bx2 )
2b
x2 =
1
(a − c − bx1 )
2b
müssen gleichzeitig erfüllt sein. Auflösen ergibt:
x1∗ =
a−c
= x2∗
3b
Dieses Gleichgewicht wird auch Cournot-Gleichgewicht oder
Cournot-Nash-Gleichgewicht genannt.
Klaus M. Schmidt (LMU München)
2. Statische Spiele mit vollständiger Information
Spieltheorie, Wintersemester 2014/15
34 / 82
x2
......
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
..................................................................................................................
x1
Abb. 2.9: Reaktionsfunktionen und Cournot-Gleichgewicht
Der Schnittpunkt der beiden Reaktionsfunktionen ist das
Cournot-Gleichgewicht.
Klaus M. Schmidt (LMU München)
2. Statische Spiele mit vollständiger Information
Spieltheorie, Wintersemester 2014/15
35 / 82
Bemerkungen:
1. Ineffizienz des Cournot-Gleichgewicht
Im Cournotgleichgewicht macht jedes Unternehmen positive Gewinne:
2b(a − c)
a−c
(a − c)2
πi = [a − 2bx ∗ ]x ∗ − cx ∗ = a −
−c
=
> 0
3b
3b
9b
Die beiden Unternehmen könnten aber noch höhere Gewinne machen, wenn
Sie ein Kartell bilden würden.
Monopolproblem:
max[a − bx]x − cx =⇒ a − c − 2bx = 0 =⇒ x M =
x
a−c
2b
Monopolgewinn:
π M = [a − b
a−c
a−c
(a − c)2
− c]
=
2b
2b
4b
Wenn jedes Unternehmen xi =
Unternehmen den Gewinn
xM
2
(a−c)2
8b
produzieren würde, würde jedes
>
(a−c)2
9b
machen.
Warum ist das Kartell nicht stabil?
Klaus M. Schmidt (LMU München)
2. Statische Spiele mit vollständiger Information
Spieltheorie, Wintersemester 2014/15
36 / 82
2. Dynamische Interpretation des Cournot-Gleichgewichts
Das Cournot-Gleichgewicht ist von Cournot selbst als Ergebnis eines
dynamischen Anpassungsprozesses interpretiert worden:
Jedes Unternehmen erwartet, dass der Konkurrent in der nächsten
Periode dieselbe Mengenentscheidung wie in dieser Periode treffen wird.
⇒ x1t+1 = R1 (x2t )
⇒ x2t+1 = R2 (x1t )
Diese Gleichungen beschreiben ein dynamisches System. In unserem
linearen Beispiel konvergiert dieses System zum Cournot-Gleichgewicht.
Diese Interpretation ist jedoch nicht überzeugend: Jedes Unternehmen
bildet in jeder Periode systematisch falsche Erwartungen, ohne im
Zeitablauf zu lernen. Da bessere Erwartungsbildung zu höherem Gewinn
führt, hat jedes Unternehmen einen starken Anreiz seine Erwartungen zu
verbessern.
Nur konsistente Erwartungen können nicht weiter verbessert werden.
Klaus M. Schmidt (LMU München)
2. Statische Spiele mit vollständiger Information
Spieltheorie, Wintersemester 2014/15
37 / 82
3. Cournot-Gleichgewicht und IESDS
Das Cournot-Gleichgewicht ist die einzige Strategienkombination, die iterierte
Eliminierung von streng dominierten Strategien überlebt. Siehe
Übungsaufgabe.
4. Cournot-Gleichgewicht mit mehr als zwei Unternehmen
Man kann auch leicht das Cournot-Gleichgewicht in einem Spiel mit mehr als
zwei Unternehmen bestimmen.
Wenn die Zahl der Spieler im Cournot-Oligopol gegen ∞ geht, dann
konvergiert der Gleichgewichtspreis gegen die Grenzkosten. Siehe
Übungsaufgabe.
Klaus M. Schmidt (LMU München)
2. Statische Spiele mit vollständiger Information
Spieltheorie, Wintersemester 2014/15
38 / 82
2.7.3 Bertrand-Duopol (Joseph Bertrand, 1883):
Modell wie bei Cournot, aber:
Unternehmen wählen Preise, p1 ∈ R+ , p2 ∈ R+ .
Alle Konsumenten kaufen beim Anbieter mit dem niedrigsten Preis
p = min{p1 , p2 }, der die gesamte Nachfrage X (p) zu diesem Preis
bedienen muss.
Bei gleichen Preisen teilen sich die Konsumenten 50:50 zwischen den
beiden Anbietern auf.
Auszahlungsfunktion von Unternehmen i


(pi − c)X (pi )
Πi = 12 (pi − c)X (pi )


0
Klaus M. Schmidt (LMU München)
∈ {1, 2}:
wenn pi < pj
wenn pi = pj
wenn pi > pj
2. Statische Spiele mit vollständiger Information
Spieltheorie, Wintersemester 2014/15
39 / 82
Satz 2.2
Es existiert ein eindeutiges Nash-Gleichgewicht, in dem die Unternehmen
p1 = p2 = c wählen. Jedes Unternehmen bedient den halben Markt und
macht Nullgewinne.
Beweis von Satz 2.2:
Klaus M. Schmidt (LMU München)
2. Statische Spiele mit vollständiger Information
Spieltheorie, Wintersemester 2014/15
40 / 82
Bemerkungen:
1) Hier ist das eindeutige Nash-GG ein Gleichgewicht in schwach
dominierten Strategien.
2) Das Marktergebnis ist dasselbe wie bei vollkommener Konkurrenz: Preis
gleich Grenzkosten, Nullgewinne.
3) Manche Autoren sprechen von Bertrand- und Cournot-Gleichgewichten.
Besser: Nash-Gleichgewichte im Cournot- bzw. Bertrand-Spiel.
4) Das Resultat wird Bertrand-Paradox genannt, weil es unplausibel
scheint, dass bei nur zwei Anbietern keine Marktmacht herrscht.
5) Das extreme Resultat beruht auf der extremen Preiselastizität der
Nachfrage bei einem homogenem Gut.
6) Es gibt Marktsituationen, die durch das Bertrand-Modell sehr gut
beschrieben werden. Beispiel: Bieterwettbewerb bei Auktion (z.B. für
öffentlichen Auftrag).
7) Vergleichen Sie das Bertrand-Spiel mit dem Gefangenendilemma und
dem Cournot-Spiel.
8) Hausaufgabe: Welche Gleichgewichte gibt es, wenn es eine kleinste
Geldeinheit für den Preis gibt (z.B. 1 Cent)? Nehmen Sie an, dass c = 0.
Klaus M. Schmidt (LMU München)
2. Statische Spiele mit vollständiger Information
Spieltheorie, Wintersemester 2014/15
41 / 82
2.7.4 Bertrand-Duopol mit differenzierten Gütern
Betrachten wir jetzt ein Duopol, in dem beide Unternehmen Preise setzen, in
dem die Güter aber differenziert sind. Die Nachfragefunktionen der beiden
Unternehmen sind:
x1 (p1 , p2 ) = a − p1 + bp2
x2 (p1 , p2 ) = a − p2 + bp1
Beide Unternehmen haben dieselbe Kostenfunktion
c(xi ) = cxi
Wir nehmen an, dass 0 < b < 1 und a > (1 − b)c (warum?).
Unternehmen i ∈ {1, 2} maximiert:
max πi (pi , pj ) = pi xi (pi , pj ) − cxi (pi , pj ) = (pi − c)[a − pi + bpj ]
pi ≥0
Klaus M. Schmidt (LMU München)
2. Statische Spiele mit vollständiger Information
Spieltheorie, Wintersemester 2014/15
42 / 82
Die BEO für ein Gewinnmaximum verlangt:
∂πi
= a − 2pi + bpj + c = 0
∂pi
Daraus ergeben sich die Reaktionsfunktionen:
pi =
1
(a + bpj + c)
2
pj =
1
(a + bpi + c)
2
Die Lösung dieses Gleichungssystems ergibt die Gleichgewichtspreise
pi∗ = pj∗ =
Klaus M. Schmidt (LMU München)
a+c
2−b
2. Statische Spiele mit vollständiger Information
Spieltheorie, Wintersemester 2014/15
43 / 82
p2
.......
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
..................................................................................................................
p1
Abb. 2.10: Reaktionsfunktionen bei differenzierten Gütern
Klaus M. Schmidt (LMU München)
2. Statische Spiele mit vollständiger Information
Spieltheorie, Wintersemester 2014/15
44 / 82
Bemerkungen:
1. Der Preis ist höher als die Grenzkosten (zeigen!), d.h., die Unternehmen
machen positive Gewinne.
2. Im Gegensatz zum Standard-Bertrand-Modell ist die Preiselastizität der
Nachfrage für jedes Unternehmen kleiner als unendlich.
3. Die Strategievariablen der beiden Firmen sind strategische
Komplemente: Je höher der Preis meines Konkurrenten, um so höher ist
mein eigener optimaler Preis.
4. Im Cournot-Modell sind die Strategievariablen der beiden Firmen
strategische Substitute: Je höher die Menge meines Konkurrenten, um
so geringer ist meine eigene optimale Menge.
5. Wenn b = 0, setzen beide Unternehmen den Monopolpreis (warum?).
Klaus M. Schmidt (LMU München)
2. Statische Spiele mit vollständiger Information
Spieltheorie, Wintersemester 2014/15
45 / 82
2.7.5 Ein Bankenzusammenbruch
Eine Bank finanziert ein langfristiges Projekt, das K Geldeinheiten kostet und
R > K Geldeinheiten zum Zeitpunkt 2 auszahlt.
Die Bank kann sich aber nur kurzfristig finanzieren. Sie hat Einlagen von zwei
Investoren in Höhe von je K /2.
Jeder Investor kann entweder K /2 bereits zum Zeitpunkt 1 zurückverlangen
oder R/2 zum Zeitpunkt 2. Wenn ein Investor sein Geld in Periode 1
zurückverlangt, muss die Bank das Projekt vorzeitig liquidieren und kann nur r
einnehmen, r < K < R.
Klaus M. Schmidt (LMU München)
2. Statische Spiele mit vollständiger Information
Spieltheorie, Wintersemester 2014/15
46 / 82
2
@
1 @
@
run
wait
run
r
r
2, 2
r−
K
K
2, 2
wait
K
2,
r−
K
2
R R
2, 2
Abb. 2.11: Möglicher Bankenzusammenbruch
Hier gibt es zwei Nash-Gleichgewichte in reinen Strategien: (run,run) und
(wait,wait).
Der Bankenzusammenbruch wird durch die Erwartung der Sparer ausgelöst,
dass die anderen Sparer ihr Geld abziehen werden. Gegegeben, dass die
anderen ihr Geld abziehen, sollte ich auch mein Geld abziehen, selbst wenn
dann die Bank zusammenbricht.
Klaus M. Schmidt (LMU München)
2. Statische Spiele mit vollständiger Information
Spieltheorie, Wintersemester 2014/15
47 / 82
2.7.6 Politischer Wettbewerb
Das folgende Modell von Macht-orientierten Parteien geht auf Hotelling
(1929) und Downs (1957) zurück.
Es gibt zwei Parteien, A und B. Jede Partei interessiert sich
ausschließlich dafür, die nächste Wahl zu gewinnen.
Das politische Spektrum wird durch das Intervall [0, 1] beschrieben.
Dabei ist die Position “0” ganz links und die Position “1” ganz rechts.
Jeder Wähler hat im politischen Spektrum [0, 1] eine Position, die ihm am
liebsten ist. Die Wähler sind über dem Intervall [0, 1] gleich verteilt.
Die beiden Parteien müssen sich vor der Wahl auf eine Position im
Links-Rechts Spektrum festlegen und diese Position nach der Wahl auch
umsetzen. Wenn die Partei i ∈ {A, B}, die die Wahl gewinnt, die Position
si ∈ [0, 1] vertritt, erleidet ein Wähler mit der präferierten Position
x ∈ [0, 1] einen Nutzenverlust in Höhe von | x − si |. Darum wird jeder
Wähler die Partei wählen, die seiner Position am nächsten steht.
Klaus M. Schmidt (LMU München)
2. Statische Spiele mit vollständiger Information
Spieltheorie, Wintersemester 2014/15
48 / 82
Diejenige Partei, die die meisten Stimmen auf sich vereinigt, wird gewählt
und bekommt die Auszahlung R. Der Wahlverlierer bekommt eine
Auszahlung von 0. Bei Stimmengleichheit gewinnt jede Partei mit
Wahrscheinlichkeit 0,5.
Die beiden Parteien müssen zeitgleich und unabhängig voneinander
entscheiden, welche Positionen sA und sB sie vertreten wollen.
Auszahlungsfunktion von Partei i ∈ {A, B}:

1

wenn si < sj
si + 2 (sj − si )
1
Ui = 2
wenn si = sj


1
1 − si + 2 (si − sj ) wenn si > sj
0
si
si +
si +sj
2
sj
1
Abb. 2.12: Politischer Wettbewerb
Klaus M. Schmidt (LMU München)
2. Statische Spiele mit vollständiger Information
Spieltheorie, Wintersemester 2014/15
49 / 82
Was ist das eindeutige Nash-Gleichgewicht in diesem Spiel?
Angenommen:
sB < 12 . Dann möchte Partei A die Position sB + einnehmen.
sB > 12 . Dann möchte Partei A die Position sB − einnehmen.
sB = 12 . Dann möchte Partei A die Position 0, 5 einnehmen.
⇒ Das einzige Nash-Gleichgewicht in diesem Spiel ist, dass beide
Parteien sA = sB = 12 wählen.
Was ändert sich an diesem Resultat, wenn die Verteilung der Wähler
keine Gleichverteilung ist?
Warum wird dieses Ergebnis auch Medianwählertheorem genannt?
Wie gut sagt dieses Theorem die Wirklichkeit voraus?
Klaus M. Schmidt (LMU München)
2. Statische Spiele mit vollständiger Information
Spieltheorie, Wintersemester 2014/15
50 / 82
Ideologie-orientierte Parteien
Bisher hatten wir angenommen, dass sich die Parteien nur für die Macht
interessieren. Jetzt machen die umgekehrte (ebenfalls extreme) Annahme,
dass sich die Parteien nur für ihre jeweilige Ideologie interessieren.
Partei A möchte am liebsten die Position xA <
xB > 12 vertreten.
1
2
und Partei B die Position
Wenn von der gewählten Regierung (egal ob diese von Partei A oder B
gestellt wird) die Politik s ∈ [0, 1] durchgeführt wird, sind die politischen
Auszahlungen der beiden Parteien
UA
= −|s − xA |
B
= −|s − xB |
U
Die Parteien müssen sich auf eine Politik sA und sB festlegen. Diese
Positionen können von ihren eigentlichen Position abweichen, müssen
nach der Wahl aber “eins-zu-eins” umgesetzt werden.
Die Wähler entscheiden wie oben.
Die Partei mit der höchsten Stimmenzahl gewinnt und setzt ihre Politik si
um. Bei Stimmengleichheit wird die Politik s = 12 [sA + sB ] realisiert.
Klaus M. Schmidt (LMU München)
2. Statische Spiele mit vollständiger Information
Spieltheorie, Wintersemester 2014/15
51 / 82
Bestimmen Sie die Menge der Nash-Gleichgewichte für dieses Spiel.
Klaus M. Schmidt (LMU München)
2. Statische Spiele mit vollständiger Information
Spieltheorie, Wintersemester 2014/15
52 / 82
2.8 Gemischte Strategien
Das Elfmeter-Spiel:
Der Torwart muss entscheiden, ob er nach links oder rechts springt.
Der Schütze muss entscheiden, ob er nach links oder rechts schießt.
Wenn der Torwart in dieselbe Ecke springt, in die der Schütze schießt,
hält er den Ball.
Wenn der Torwart in die andere Ecke springt, erzielt der Schütze ein Tor.
Beide Entscheidungen fallen gleichzeitig.
Klaus M. Schmidt (LMU München)
2. Statische Spiele mit vollständiger Information
Spieltheorie, Wintersemester 2014/15
53 / 82
Schütze
@
Links
Torwart @
@
Rechts
Links
1, -1
-1, 1
Rechts
-1, 1
1, -1
Abb. 2.13: Das Elfmeter-Spiel
Gibt es ein Nash-Gleichgewicht in diesem Spiel?
Klaus M. Schmidt (LMU München)
2. Statische Spiele mit vollständiger Information
Spieltheorie, Wintersemester 2014/15
54 / 82
Definition 2.6 (Gemischte Strategie)
Betrachte ein Spiel in Normalform G mit endlichen Strategienräumen Si . Sei
Si = {si1 , . . . , siKi }. Eine gemischte Strategie für Spieler i ist eine
Wahrscheinlichkeitsverteilung σi = (σi1 , . . . , σiKi ) über Si , wobei 0 ≤ σik ≤ 1
für k = 1, . . . , Ki und σi1 + . . . + σiKi = 1.
Bemerkungen:
1) Eine reine Strategie ist nur der Extremfall einer gemischten Strategie: die
Wahrscheinlichkeit einer Strategie ist 1, die aller anderen ist 0.
2) Der Träger einer gemischten Strategie ist die Menge all der Aktionen, die
mit positiver Wahrscheinlichkeit gespielt werden.
3) Beachten Sie, dass die Spieler bei gemischten Strategien nur
unabhängig voneinander randomisieren können.
4) Eine gemischte Strategie kann eine reine Strategie streng dominieren:
Klaus M. Schmidt (LMU München)
2. Statische Spiele mit vollständiger Information
Spieltheorie, Wintersemester 2014/15
55 / 82
2
@
1 @
@
`
r
O
3, -
0, -
M
0, -
3, -
U
1, -
1, -
Abb. 2.14: Dominanz einer gemischten Strategie
U wird weder von O noch M dominiert, aber die gemischte Strategie, die
O mit Wahrscheinlichkeit 12 und M mit 21 spielt, dominiert U streng!
Klaus M. Schmidt (LMU München)
2. Statische Spiele mit vollständiger Information
Spieltheorie, Wintersemester 2014/15
56 / 82
5) Eine reine Strategie von Spieler 1, die gegen keine reine Strategie von
Spieler 2 eine beste Antwort ist, kann doch gegen eine gemischte
Strategie von Spieler 2 eine beste Antwort sein:
2
@
r
`
1 @
@
O
3, -
0, -
M
0, -
3, -
U
2, -
2, -
Abb. 2.15: Beste Antwort gegen gemischte Strategie
Wenn Spieler 2 ` mit Wahrscheinlichkeit
beste Antwort von Spieler 1.
Klaus M. Schmidt (LMU München)
1
2
und r mit
2. Statische Spiele mit vollständiger Information
1
2
spielt, ist U eine
Spieltheorie, Wintersemester 2014/15
57 / 82
Satz 2.3
Im “Elfmeter-Spiel” ist das einzige Nash-Gleichgewicht ein Gleichgewicht in
gemischten Strategien, in dem beide Spieler mit Wahrscheinlichkeit 12 Links
bzw. Rechts wählen.
Beachten Sie:
Eine gemischte Strategie ist eine beste Antwort gegen ein (gemischtes)
Strategienprofil der Mitspieler genau dann, wenn jedes Element des
Trägers eine (reine) beste Antwort ist. (Warum?)
Klaus M. Schmidt (LMU München)
2. Statische Spiele mit vollständiger Information
Spieltheorie, Wintersemester 2014/15
58 / 82
Beweis von Satz 2.3:
Klaus M. Schmidt (LMU München)
2. Statische Spiele mit vollständiger Information
Spieltheorie, Wintersemester 2014/15
59 / 82
Graphische Darstellung:
q
.......
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
..................................................................................................................
p
Abb. 2.16: Beste-Antwort-Korrespondenz
beim Elfmeter-Spiel
Einziger Schnittpunkt ist p = q = 21 .
Klaus M. Schmidt (LMU München)
2. Statische Spiele mit vollständiger Information
Spieltheorie, Wintersemester 2014/15
60 / 82
Systematische Bestimmung aller Nash-Gleichgewichte
Betrachte erneut den “Kampf der Geschlechter”, aber diesmal mit
allgemeinen Auszahlungen:
p.
2
1@
@
Bo
Ba
Bo
X1 , X2
0, 0
Ba
0, 0
Y1 , Y2
.......
...
...
...
...
...
...
...
...
...
...
...
...
...
...
....................................................................................................
...
q
Abb. 2.17: Alle Nash-GGe im Kampf der Geschlechter
Klaus M. Schmidt (LMU München)
2. Statische Spiele mit vollständiger Information
Spieltheorie, Wintersemester 2014/15
61 / 82
Sei p die Wahrscheinlichkeit, mit der Spieler 1 zum Boxen geht, und q die W.,
mit der Spieler 2 zum Boxen geht.
u1 (Bo) = q · X1 + (1 − q) · 0 = qX1
u1 (Ba) = q · 0 + (1 − q) · Y1 = (1 − q)Y1
u1 (Bo) ≥ u1 (Ba)
⇔
qX1 ≥ (1 − q)Y1
⇔
q≥
Y1
X1 + Y1
u2 (Bo) ≥ u2 (Ba)
⇔
pX2 ≥ (1 − p)Y2
⇔
p≥
Y2
X2 + Y2
Analog:
Klaus M. Schmidt (LMU München)
2. Statische Spiele mit vollständiger Information
Spieltheorie, Wintersemester 2014/15
62 / 82
Bemerkungen:
1) Hier gibt es zwei Nash-GGe in reinen Strategien und eines in gemischten
Strategien.
2) Im gemischten Nash-GG wählt Spieler 1 “Boxen” mit Wahrscheinlichkeit
2
und Spieler 2 die Strategie “Boxen” mit Wahrscheinlichkeit
p∗ = X2Y+Y
2
Y1
∗
q = X1 +Y1 . Beachten Sie, dass im Gleichgewicht p∗ unabhängig von den
Auszahlungen X1 , Y1 von Spieler 1 ist: Wenn X1 steigt, wird Spieler 1
deshalb nicht mit größerer Wahrscheinlichkeit zum Boxen gehen. p∗
hängt nur von den Auszahlungen X2 , Y2 des Gegenspielers ab. Jeder
Spieler wählt seine Randomisierungswahrscheinlichkeit so, dass der
andere Spieler indifferent gehalten wird!
3) Man kann zeigen, dass für (fast) alle Spiele gilt: Wenn ein Spiel eine
endliche Zahl von Gleichgewichten hat, dann ist die Anzahl der
Nash-Gleichgewichte ungerade. Nützlicher Test, ob man alle Nash-GGe
gefunden hat.
Klaus M. Schmidt (LMU München)
2. Statische Spiele mit vollständiger Information
Spieltheorie, Wintersemester 2014/15
63 / 82
Interpretation von gemischten Strategien
Gemischte Strategien sind oft als “unnatürlich” kritisiert worden. Beachten
Sie, dass ein Spieler im Gleichgewicht indifferent zwischen der gemischten
Strategie und den reinen Strategien im Träger der gemischten Strategie ist.
Mögliche Rechtfertigungen für gemischte Strategien:
1) In vielen Spielen wird von “guten Spielern” tatsächlich randomisiert (z.B.
beim Elfmeter im Fußball).
Prüfen Sie sich selbst: Wie spielen Sie “Stein, Schere, Papier”?
2) Man kann sich vorstellen, dass jeder Spieler eine reine Strategie spielt,
dass sein Gegenspieler aber unsichere Erwartungen über diese
Strategie hat.
Dieses Argument steht jedoch im Widerspruch zur Philosophie des
Nash-Gleichgewichts, weil hier die Erwartungen miteinander konsistent
und korrekt sein sollen.
Klaus M. Schmidt (LMU München)
2. Statische Spiele mit vollständiger Information
Spieltheorie, Wintersemester 2014/15
64 / 82
3) Es gibt unvollständige Information über die Auszahlungsfunktion der
Gegenspieler. Jeder Spieler wählt eine reine Strategie, die von seinem
“Typ” abhängt, aber sein Typ ist dem Gegenspieler nicht bekannt.
Man kann zeigen: Ein gemischtes Gleichgewicht ist der Grenzwert einer
Folge von Gleichgewichten in reinen Strategien eines Spiels mit
unvollständiger Information, wenn die Informationsunvollständigkeit
gegen 0 geht. Harsanyi (1973): Purification Theorem.
Klaus M. Schmidt (LMU München)
2. Statische Spiele mit vollständiger Information
Spieltheorie, Wintersemester 2014/15
65 / 82
2.9 Wer ruft die Polizei?
Stellen Sie sich die folgende Situation vor:
Sie werden nachts durch lautes Schreien auf der Straße geweckt. Sie
machen das Licht an, gehen zum Fenster und beobachten eine
gefährliche Schlägerei zwischen zwei Personen.
Sie beobachten auch, dass in N − 1 anderen Wohnungen das Licht
angegangen ist und Nachbarn zum Fenster gekommen sind.
Jeder der N Nachbarn muss entscheiden, ob er die Polizei anruft. Wenn
er das tut, muss er auch als Zeuge aussagen.
Jeder der Nachbarn wäre bereit die Kosten des Anrufs und der
Zeugenaussage auf sich zu nehmen, damit die Polizei die Schlägerei
beendet, aber jeder Nachbar hätte es noch lieber, wenn ein anderer
Nachbar das erledigt.
Klaus M. Schmidt (LMU München)
2. Statische Spiele mit vollständiger Information
Spieltheorie, Wintersemester 2014/15
66 / 82
Dieses Spiel hat die folgende Struktur:
Spieler: N Nachbarn
Strategien: “Anrufen”, “Schweigen”
Auszahlungen von Spieler i ∈ {1, . . . , N}:
I
I
I
Wenn niemand die Polizei anruft: Ui = 0
Wenn i nicht die Polizei anruft, aber wenigstens ein anderer anruft:
Ui = v > 0
Wenn i die Polizei anruft: Ui = v − c > 0
Klaus M. Schmidt (LMU München)
2. Statische Spiele mit vollständiger Information
Spieltheorie, Wintersemester 2014/15
67 / 82
Gibt es ein Gleichgewicht in reinen Strategien?
Gibt es ein symmetrisches Gleichgewicht in reinen Strategien?
Gibt es ein symmetrisches Gleichgewicht in gemischten Strategien?
Klaus M. Schmidt (LMU München)
2. Statische Spiele mit vollständiger Information
Spieltheorie, Wintersemester 2014/15
68 / 82
Bestimmung des GG in gemischten Strategien:
In einem symmetrischen, gemischten GG ruft jeder Spieler die Polizei mit
derselben Wahrscheinlichkeit p∗ ∈ (0, 1). Also muss jeder Spieler indifferent
sein, ob er anruft oder nicht. Darum muss gelten:
v −c
= 0 · W (niemand sonst ruft an)
+v · W (wenigstens ein anderer ruft an)
bzw.:
v −c
= 0 · W (niemand sonst ruft an)
+v · (1 − W (niemand sonst ruft an))
bzw.:
c = v · W (niemand sonst ruft an)
Klaus M. Schmidt (LMU München)
2. Statische Spiele mit vollständiger Information
Spieltheorie, Wintersemester 2014/15
69 / 82
Die Wahrscheinlichkeit, dass keiner der anderen anruft ist (1 − p∗ )N−1 . Also
muss im GG gelten:
c
= (1 − p∗ )N−1
v
bzw.:
p∗ = 1 −
1
c N−1
v
Beachten Sie: Die Wahrscheinlichkeit, dass Spieler i die Polizei ruft
steigt mit v
fällt mit c
fällt mit N
Klaus M. Schmidt (LMU München)
2. Statische Spiele mit vollständiger Information
Spieltheorie, Wintersemester 2014/15
70 / 82
Wie verändert sich die W., dass die Polizei von irgendjemandem gerufen wird,
wenn N steigt?
W (jemand ruft an) = 1 − W (keiner ruft an)
Die W., dass niemand anruft, ist gleich der W., dass i nicht anruft und dass
kein anderer j 6= i anruft.
W (keiner ruft an)
= W (i ruft nicht an)
·W (niemand sonst ruft an)
Aus der Gleichgewichtsbedingung wissen wir, dass
W (niemand sonst ruft an) = (1 − p∗ )N−1 =
c
v
Dieser Ausdruck ist also unabhängig von N.
Klaus M. Schmidt (LMU München)
2. Statische Spiele mit vollständiger Information
Spieltheorie, Wintersemester 2014/15
71 / 82
Wir wissen auch, dass
W (i ruft nicht an) = 1 − p∗ =
1
c N−1
v
mit N steigt.
Also fällt die Wahrscheinlichkeit, dass die Polizei gerufen, wird mit der Zahl
der Zeugen!
Bemerkungen:
Dieses Resultat ist bemerkenswert. Es erklärt, warum die
Wahrscheinlichkeit, dass wenigstens ein Außenstehender hilft, fällt, wenn
die Anzahl der Außenstehenden steigt.
Wenn ein Außenstehender dazu kommt, gibt es zwei Effekte:
I
I
I
Es gibt eine zusätzliche Person, die mit positiver Wahrscheinlichkeit hilft.
Dadurch steigt die Wahrscheinlichkeit, dass wenigstens eine Person hilft.
Alle bisherigen Personen haben jetzt einen geringeren Anreiz zu helfen, weil
sich jeder noch mehr auf die anderen verlässt. Dieser Effekt geht in die
entgegengesetzte Richtung.
Der zweite Effekt überkompensiert den ersten!
Klaus M. Schmidt (LMU München)
2. Statische Spiele mit vollständiger Information
Spieltheorie, Wintersemester 2014/15
72 / 82
2.10 Existenz von Nash-Gleichgewichten
Unter welchen Umständen können wir sicher sein, dass in einem Spiel ein
Nash-Gleichgewicht existiert?
a) Solange wir nicht wissen, ob Nash-Gleichgewichte existieren, ist es
wenig sinnvoll, über die allgemeinen Eigenschaften solcher
Gleichgewichte nachzudenken.
b) Wenn Nash-Gleichgewichte in natürlichen Spielen nicht existieren
würden, dann wäre etwas faul mit unserer interpersonellen
Entscheidungstheorie. Wie sollten sich rationale Individuen dann
verhalten?
Klaus M. Schmidt (LMU München)
2. Statische Spiele mit vollständiger Information
Spieltheorie, Wintersemester 2014/15
73 / 82
John Nash hat gezeigt, dass unter relativ schwachen hinreichenden
Bedingungen wenigstens ein Nash-Gleichgewicht existiert:
Satz 2.4 (Existenz)
Jedes Normalform-Spiel mit einer endlichen Anzahl von Spielern und
endlichen Strategienräumen hat wenigstens ein Nash-Gleichgewicht in reinen
oder gemischten Strategien.
Bemerkungen:
1) Dieser Existenzsatz zeigt, dass in einer großen Klasse von Spielen
Nash-Gleichgewichte existieren.
2) Dieser Satz ist später erheblich verallgemeinert worden (für unendliche
Strategienräume, stetige Nutzenfunktionen etc.).
3) Die Beweise dieser Sätze beruhen auf Fixpunktargumenten, die wir an
dieser Stelle nicht zeigen werden.
Klaus M. Schmidt (LMU München)
2. Statische Spiele mit vollständiger Information
Spieltheorie, Wintersemester 2014/15
74 / 82
2.11 Warum sollten die Spieler ein Nash-Gleichgewicht
spielen?
2.11.1 Rationalität und Nash-Gleichgewicht
Impliziert Rationalität plus Common Knowledge von Rationalität, dass ein
Nash-Gleichgewicht gespielt werden sollte?
Nein! Rationale Spieler können falsche Erwartungen hegen.
Aber:
Nur ein Nash-Gleichgewicht hat die Eigenschaft, dass die Erwartungen der
Spieler miteinander konsistent sind. Bei jeder Strategienkombination, die
kein Nash-Gleichgewicht ist, muss wenigstens ein Spieler einen Fehler
machen:
entweder wählt er keine beste Antwort, gegeben seine Erwartungen,
oder er wählt eine beste Antwort, aber seine Erwartungen sind falsch.
Klaus M. Schmidt (LMU München)
2. Statische Spiele mit vollständiger Information
Spieltheorie, Wintersemester 2014/15
75 / 82
Wenn ein eindeutiges Nash-Gleichgewicht existiert, kann man argumentieren,
dass es von rationalen Spielern, die konsistent sein wollen, gespielt werden
sollte, denn:
1) Nash-GG ist die einzige rationalisierbare Strategienkombination mit
konsistenten Erwartungen.
2) Nash-GG ist die einzige Strategienkombination, die selbst-durchsetzend
wäre, wenn sich die Spieler vorab über ihre Strategien unterhalten
könnten.
Klaus M. Schmidt (LMU München)
2. Statische Spiele mit vollständiger Information
Spieltheorie, Wintersemester 2014/15
76 / 82
Bemerkungen:
Wenn es mehrere Nash-Gleichgewichte gibt, reicht diese Argumentation
nicht mehr aus. Jetzt müssen wir zusätzliche Anforderungen an das
Gleichgewichtskonzept stellen, bis nur noch ein Gleichgewicht übrig
bleibt, das alle Anforderungen erfüllt.
Beispiele für solche Verfeinerungen des Gleichgewichtskonzepts
(equilibrium refinements): “Das Gleichgewicht eines symmetrischen
Spiels sollte symmetrisch sein” oder “Das Gleichgewichtsergebnis sollte
von keinem anderen Gleichgewichtsergebnis Pareto-dominiert werden”.
Harsanyi und Selten (1988) haben eine axiomatische Theorie entwickelt,
das für jedes Spiel ein eindeutiges Gleichgewicht als dasjenige
auszeichnet, das von (hyper-)rationalen Spielern gespielt werden sollte.
Selten interpretiert diese Theorie aber als normative Theorie. Wenn wir
das Verhalten von tatsächlichen Spielern voraussagen wollen, müssen
wir verstehen, wie beschränkt rationale Spieler lernen.
Klaus M. Schmidt (LMU München)
2. Statische Spiele mit vollständiger Information
Spieltheorie, Wintersemester 2014/15
77 / 82
2.11.2 Lernenprozesse und Nash-Gleichgewicht
Lernmodelle gehen davon aus, dass tatsächliche Spieler nur beschränkt
rational sind, dass sie aber versuchen, ihr Verhalten im im Zeitablauf zu
verbessern.
Einige einfache Lernprozesse:
Spiele eine beste Antwort gegen das, was die Gegenspieler in der letzten
Periode getan haben.
Imitiere die Stratgegie eines Gegenspielers, der in der letzten Periode am
erfolgreichsten von allen Spielern war.
Experimentieren: Wähle in jeder Periode mit einer kleinen
Wahrscheinlichkeit eine (zufällig ausgewählte) neue Strategie. Wenn die
neue Strategie zu einer höheren Auszahlung führt als die alte Strategie,
dann wechsele zu der neuen Strategie, sonst bleibe bei der alten
Strategie.
Klaus M. Schmidt (LMU München)
2. Statische Spiele mit vollständiger Information
Spieltheorie, Wintersemester 2014/15
78 / 82
Es kann gezeigt werden, dass diese sehr einfachen Lernprozesse in vielen
Situationen langfristig dazu führen, dass die Spieler ein Nash-Gleichgewicht
spielen.
Wenn es mehrere Nash-Gleichgewichte gibt, kann es sein, dass bestimmte
Lernprozesse immer zu demselben dieser Gleichgewichte führen. Hier erfolgt
die Gleichgewichtsauswahl durch den Lernprozess.
Klaus M. Schmidt (LMU München)
2. Statische Spiele mit vollständiger Information
Spieltheorie, Wintersemester 2014/15
79 / 82
Beispiel für einen tatsächlichen Lernprozess
Schätze zwei Drittel des Durchschnitts:
Jeder muss eine ganze Zahl zwischen 1 und 100 wählen.
Derjenige, dessen Zahl am nächsten an 2/3 des Durchschnitts aller
gewählten Zahlen liegt, hat gewonnen.
Alle Spieler erfahren den Durchschnitt der gewählten Zahlen und welche
Zahl gewonnen hat. Dann spielen Sie das Spiel noch einmal, usw.
Wie haben Sie in diesem Spiel Ihr Verhalten im Zeitablauf angepasst? Wohin
konvergiert das Verhalten?
Keynes hat ein ähnliches Spiel beschrieben: Ein “Beauty Contest", bei dem
es darauf ankommt, diejenige Schönheit auszuwählen, die von den meisten
anderen als größte Schönheit betrachtet wird. Hier gibt es offensichtlich viele
Gleichgewichte.
Keynes hat dieses Spiel mit Finanzmärkten verglichen, auf denen jeder
Anleger diejenige Aktie kaufen will, deren Kurs am stärksten steigen wird (weil
viele andere Anleger sie auch kaufen). Das kann erklären, warum
Finanzmärkte oft volatil und instabil sind.
Klaus M. Schmidt (LMU München)
2. Statische Spiele mit vollständiger Information
Spieltheorie, Wintersemester 2014/15
80 / 82
Fazit:
Wenn erfahrene Spieler in einer stabilen Umgebung interagieren, ist das
Nash-Gleichgewicht ein gutes Konzept, um tatsächliches Verhalten
vorauszusagen.
Wenn die Spieler jedoch unerfahren sind und sich zum ersten Mal in
einer komplexen strategischen Situation befinden, ist es
unwahrscheinlich, dass ein Nash-Gleichgewicht gespielt wird.
Wenn Sie nicht glauben, dass Ihre Gegenspieler das Nash
Gleichgewicht, kann es für Sie optimal sein, ebenfalls vom Nash
Gleichgewicht abzuweichen.
Klaus M. Schmidt (LMU München)
2. Statische Spiele mit vollständiger Information
Spieltheorie, Wintersemester 2014/15
81 / 82
2.11.3 Evolution und Nash-Gleichgewicht
In der theoretischen Biologie spielt die evolutionäre Spieltheorie eine
wichtige Rolle, um das Verhalten von Tieren und die Evolution von
Eigenschaften einer Species zu erklären.
Die evolutionäre Spieltheorie geht davon aus, dass Strategien genetisch
programmiert sind und vererbt werden. Sie zeigt, dass nur solche Strategien
evolutionär stabil sind, die ein Gleichgewicht bilden.
Die evolutionäre Spieltheorie kann erklären, warum die Evolution zu
offensichtlich ineffizienten Entwicklungen führen kann:
Warum kämpfen Tiere um Territorien oder Paarungspartner, auch wenn
sie sich dabei mit positiver Wahrscheinlichkeit stark verletzen können?
Warum entwickeln manche Tier- und Pflanzenarten Eigenschaften, die
eine Behinderung darstellen (z.B. der Pfauenschwanz)?
Wir können die evolutionäre Spieltheorie in dieser Vorlesung leider nicht
vertiefen.
Klaus M. Schmidt (LMU München)
2. Statische Spiele mit vollständiger Information
Spieltheorie, Wintersemester 2014/15
82 / 82
Herunterladen