Kapitel 12 Spieltheorie

Kapitel 12
Spieltheorie
Vor- und Nachbereitung:
● Varian, Chapter 28 und 29
● Frank, Chapter 13
● Übungsblatt 12
© Klaus M. Schmidt, 2008
12.1 Einleitung
Bisher haben wir Ein-Personen-Entscheidungsprobleme betrachtet.
Beispiele:
● In der Haushaltstheorie maximiert jedes Individuum seinen Nutzen
bei gegebenem Einkommen und gegebenen Güterpreisen.
● In der Unternehmenstheorie minimiert jedes Unternehmen seine
Kosten bei gegebenen Inputpreisen.
In diesen Beispielen gibt es keinerlei Interaktion zwischen den
Entscheidungsträgern.
Auf Märkten mit vollkommener Konkurrenz interagieren die
Wirtschaftssubjekte. Doch jeder Konsument/Produzent nimmt bei der
Nutzen-/Gewinnmaximierung den Preis als gegeben an. Keiner
versucht, den Preis oder das Verhalten der anderen Marktteilnehmer
zu beeinflussen. Also ist die Interaktion nicht strategisch.
Prof. Martin Kocher
Mikro 1-12 (SS 2009)
2
Ein Monopolist handelt dagegen strategisch:
● Er weiß, dass sein Preis das Verhalten der Nachfrager
beeinflussen wird, und bezieht das in sein Kalkül mit ein.
● Aber die Konsumenten handeln nicht strategisch (nehmen den
Preis als gegeben an). Darum ist die strategische Interaktion hier
sehr einfach.
Im Oligopol liegt dagegen ein echtes interpersonelles
Entscheidungsproblem vor:
● Jedes Unternehmen hat einen Einfluss auf den Preis, kann den
Preis aber nicht allein bestimmen.
● Die optimale Entscheidung eines Unternehmens hängt ab von den
Entscheidungen der anderen Unternehmen.
● Hier liegt strategische Interaktion vor.
Prof. Martin Kocher
Mikro 1-12 (SS 2009)
3
Situationen mit strategischer Interaktion treten immer dann auf, wenn
das Verhalten mehrerer Personen sich wechselseitig beeinflusst.
Man findet sie überall.
Beispiele:
1. Oligopolmärkte: Entscheidungen über Mengen, Preise,
Produktdifferenzierung, Innovationen, Marktzutritt, etc.
2. Verhandlungssituationen: Tarifverhandlungen, WTO, Klimaschutz,
Abrüstung, etc.
3. Bietverhalten bei Auktionen
4. Interaktion zwischen Regierung und Zentralbank oder zwischen den
Zentralbanken verschiedener Länder
5. Wettbewerb zwischen verschiedenen Ländern oder Regionen um
die Ansiedlung bestimmter Industrien
6. Strategisches Verhalten in der Kriegsführung
7. Gesellschaftsspiele (z.B. Schach, Poker)
8. Sportwettkämpfe
Prof. Martin Kocher
Mikro 1-12 (SS 2009)
4
Geschichte der Spieltheorie
● Um 1900: Mathematische Analyse von Gesellschaftsspielen;
●
●
●
●
●
Konzentration auf Nullsummenspiele.
John von Neumann und Oskar Morgenstern (1944), “Theory of
Games and Economic Behavior”.
Kooperative und nicht-kooperative Spieltheorie.
Siegeszug der nicht-kooperativen Spieltheorie in den 80er Jahren:
Erklärung zahlreicher Phänomene in der Industrieökonomik,
Außenhandelstheorie, Makroökonomik, politischen Ökonomie, etc.
Seit Anfang der 90er Jahre werden die Vorhersagen der
Spieltheorie verstärkt durch Experimente überprüft.
Zahlreiche Nobelpreise seit 1994, darunter
– John Nash („A Beautiful Mind“)
– Reinhard Selten (Bonn)
Prof. Martin Kocher
Mikro 1-12 (SS 2009)
5
12.2 Definition eines Spiels
Ein “Spiel” besteht aus:
● einer Menge von Spielern
● einer Menge von möglichen Strategien für jeden Spieler,
● einer Auszahlungsfunktion, die angibt, welche Auszahlung ein
Spieler erhält in Abhängigkeit davon, welche Strategien von allen
Spielern gewählt worden sind.
Beachten Sie:
In vielen Beispielen werden wir annehmen, dass der Nutzen eines
Spielers einfach seine monetäre Auszahlung ist. Das kann
problematisch sein, weil wir implizit annehmen, dass der Spieler
● risikoneutral und
● rein eigennützig
ist. Streng genommen sollten wir hier von Neumann-Morgensternsche
Nutzenwerte verwenden.
Prof. Martin Kocher
Mikro 1-12 (SS 2009)
6
12.3 Simultane Spiele
Wir betrachten zunächst Spiele, in denen alle Spieler simultan
entscheiden müssen, welche Strategie sie wählen sollen.
(Entscheidend ist, dass kein Spieler weiß, wie sich sein Gegenüber
entschieden hat, wenn er selbst am Zug ist.)
Außerdem nehmen wir an, dass alle Spieler die Spielstruktur und die
Auszahlungsfunktionen aller übrigen Spieler genau kennen.
(“Simultane Spiele mit vollständiger Information”)
Wenn es nur zwei Spieler gibt, die nur endlich viele Strategien zur
Verfügung haben, lassen sich diese Spiele durch eine
Auszahlungsmatrix darstellen.
Hier ist ein Beispiel für ein Spiel mit zwei Spielern und zwei Strategien
per Spieler:
Prof. Martin Kocher
Mikro 1-12 (SS 2009)
7
Spieler 2
Links
Rechts
Oben
1, 3
0, 1
Unten
2, 1
1, 0
Spieler 1
Abb. 12.1: Auszahlungsmatrix eines Spiels
Interpretation: Wenn Spieler 1 “Unten” spielt und Spieler 2 “Rechts”
spielt, dann erhält Spieler 1 eine Auszahlung von 1 und Spieler 2 eine
Auszahlung von 0.
Prof. Martin Kocher
Mikro 1-12 (SS 2009)
8
12.4 Dominante Strategien
Betrachten Sie das Spiel in Abb. 12.1. Was ist hier die optimale
Strategie für Spieler 1?
● Wenn Spieler 2 “Links” spielt, ist “Unten” besser als “Oben”.
● Wenn Spieler 2 “Rechts” spielt, ist “Unten” besser als “Oben”.
=> Es ist eine dominante Strategie für Spieler 1, “Unten” zu spielen.
Was ist die optimale Strategie für Spieler 2?
● Wenn Spieler 1 “Oben” spielt, ist “Links” besser als “Rechts”.
● Wenn Spieler 1 “Unten” spielt, ist “Links” besser als “Rechts”.
● Es ist eine dominante Strategie für Spieler 2, “Links” zu spielen.
Definition: Eine dominante Strategie ist eine Strategie, die für
den betreffenden Spieler immer optimal ist, d.h., unabhängig
davon, welche Strategie sein Gegenspieler gewählt hat.
Prof. Martin Kocher
Mikro 1-12 (SS 2009)
9
In diesem Spiel werden rationale Spieler also immer die Kombination
(“Unten”, “Links”) spielen. Diese Kombination ist ein Gleichgewicht in
dominanten Strategien.
Beachten Sie:
● Wenn ein Spieler eine dominante Strategie hat, muss er keine
Erwartungen darüber bilden, was seine Gegenspieler tun werden.
● Es ist immer optimal, die dominante Strategie zu spielen. Darum
sind Spiele mit dominanten Strategien besonders leicht zu
analysieren.
Fazit: Wenn jeder Spieler in einem Spiel eine dominante Strategie hat
und wenn alle Spieler rational sind, dann muss das Gleichgewicht in
dominanten Strategien gespielt werden.
Prof. Martin Kocher
Mikro 1-12 (SS 2009)
10
12.5 Das Gefangenendilemma
Zwei Einbrecher, die gemeinsam einen “Bruch” auf dem Gewissen
haben, sind verhaftet worden und sitzen in getrennten Zellen. Außer
illegalem Waffenbesitz kann man ihnen aber nichts nachweisen. Jeder
überlegt, ob er den “Bruch” gestehen oder leugnen soll:
● Wenn beide leugnen, bekommen beide ein halbes Jahr wegen
illegalen Waffenbesitzes.
● Wenn beide gestehen, bekommen beide 2 Jahre wegen Einbruchs
mit mildernden Umständen (weil sie gestanden haben).
● Wenn einer gesteht und der andere leugnet, wird der geständige
freigesprochen (Kronzeugenregelung), während der andere 3
Jahre absitzen muss.
Nehmen wir an, dass für beide Gefangenen gilt:
U(0 J) > U(0.5 J) > U(2 J) > U(3 J)
Prof. Martin Kocher
Mikro 1-12 (SS 2009)
11
In diesen Nutzenwerten sind nicht nur die Entbehrungen während x
Jahren Gefängnis enthalten, sondern auch alle Gefühle der Spieler in
Bezug auf ihr eigenes Verhalten (z.B. schlechtes Gewissen oder Stolz).
Wir können jetzt den verschiedenen Ergebnissen Nutzenwerte
zuordnen, z.B. wie folgt: U(0 J)=5, U(0,5J)=4, U(2 J)=1, U(3 J)=0.
Spieler 2
Gestehen
Leugnen
Gestehen
1, 1
5, 0
Leugnen
0, 5
4, 4
Spieler 1
Abb. 12.2.: Das Gefangenendilemma
Prof. Martin Kocher
Mikro 1-12 (SS 2009)
12
Gleichgewicht in dominanten Strategien:
“Gestehen, Gestehen”.
Bemerkungen:
1. Aus Sicht der Gefangenen wird das Gleichgewichtsergebnis Pareto-
dominiert von “Leugnen, Leugnen”.
2. Trotzdem gelingt es den Spielern nicht, ihr Verhalten zu koordinieren.
3. Das Gefangenendilemma ist eine Parabel, die das Scheitern von
Kooperation und Koordination sehr gut erklärt. Dieselbe Spielstruktur
findet sich in vielen ökonomischen und politischen Problemen wieder,
z.B.:
– Kartellverhalten: Jedes Kartellmitglied hat einen Anreiz, seinen
Preis zu senken, obwohl alle besser gestellt sind, wenn sie den
Preis hoch halten.
– Abrüstung: Jede Supermacht hat Anreiz zur Aufrüstung, obwohl
sich alle besser stellen, wenn nicht aufgerüstet wird.
Prof. Martin Kocher
Mikro 1-12 (SS 2009)
13
– Öffentliche Güter: Niemand möchte zur Bereitstellung etwas
beitragen, obwohl es allen besser geht, wenn jeder sich beteiligt.
4. Das Gefangenendilemma kann überwunden werden, wenn
– die Parteien Verträge schreiben können, die ihr Verhalten
festlegen,
– die Parteien sehr oft miteinander interagieren (wiederholtes Spiel).
Prof. Martin Kocher
Mikro 1-12 (SS 2009)
14
12.6 Strikt dominierte Strategien
In vielen Spielen gibt es keine dominanten Strategien. Betrachten Sie
etwa das folgende Spiel:
2
Links
Mitte
Rechts
Oben
1, 0
1, 2
0, 1
Unten
0, 3
0, 1
2, 0
1
Abb. 12.3 .: Ein Spiel ohne dominante Strategien
Hier hat keiner der Spieler eine dominante Strategie.
Aber: Für Spieler 2 kann es nicht optimal sein, “Rechts” zu spielen.
Ganz gleich, was Spieler 1 tut, “Mitte” ist immer besser als “Rechts”.
Prof. Martin Kocher
Mikro 1-12 (SS 2009)
15
Definition: Eine Strategie B wird von einer anderen Strategie A
strikt dominiert,wenn die Strategie A bei allen möglichen
Entscheidungen der Gegenspieler zu einer strikt höheren
Auszahlung führt.
Fazit: Ein rationaler Spieler wird nie eine strikt dominierte Strategie wählen.
Analyse des Spiels aus Abb. 12.3:
“Rechts” wird streng dominiert durch “Mitte”
● Ein rationaler Spieler 2 wird “Rechts” nicht wählen.
● Wenn Spieler 1 weiß, dass Spieler 2 rational ist, kann er “Rechts”
eliminieren. Dann ist für ihn “Unten” streng dominiert.
● Wenn Spieler 2, weiß, dass Spieler 1 rational ist und dass Spieler 1 weiß,
dass 2 rational ist, kann er “Unten” eliminieren. Dann ist für ihn “Links”
streng dominiert.
● (“Oben”, “Mitte”) wird gespielt.
Man nennt dieses Verfahren iterierte Eliminierung von strikt dominierten
Strategien (IESDS).
Prof. Martin Kocher
Mikro 1-12 (SS 2009)
16
Bemerkungen:
1. IESDS verlangt nicht nur, dass alle Spieler rational sind, sondern
auch, dass alle Spieler wissen, dass alle Spieler rational sind, dass
alle Spieler wissen, dass alle Spieler wissen, dass alle Spieler
rational sind, usw.
2. Die Reihenfolge der Eliminierung spielt bei strikt dominierten
Strategien für das Ergebnis keine Rolle.
Prof. Martin Kocher
Mikro 1-12 (SS 2009)
17
12.7 Nash-Gleichgewicht
In den meisten Spielen hilft uns die Elimination von strikt dominierten
Strategien nicht weiter, weil keine Strategien dominiert werden.
Betrachten Sie z.B. das folgende Spiel:
2
l
m
r
O
3, 3
2, 4
3, 2
M
4, 2
6, 6
0, 8
U
2, 3
8, 0
4, 4
1
Abb. 12.4 .: Nash-Gleichgewicht
In diesem Spiel gibt es weder dominante noch dominierte Strategien.
Prof. Martin Kocher
Mikro 1-12 (SS 2009)
18
Darum suchen wir zunächst die besten Antworten eines jeden Spielers:
1. Markieren Sie für jede Strategie von Spieler 2, was die beste
Antwort von Spieler 1 auf diese Strategie ist. Am besten
unterstreichen Sie die höchste Auszahlung von Spieler 1 in jeder
Spalte der Matrix.
2. Markieren Sie für jede Strategie von Spieler 1, was die beste
Antwort von Spieler 2 auf diese Strategie ist. Am besten
unterstreichen Sie die höchste Auszahlung von Spieler 2 in jeder
Zeile der Matrix.
3. Sollte es mehrere maximale Auszahlungen in einer Spalte (Zeile)
geben, müssen Sie alle diese Auszahlungen unterstreichen.
Wir suchen jetzt nach einem “Gleichgewicht” in diesem Spiel, d.h., nach
einer stabilen Situation, in der kein Spieler mehr einen Anreiz hat,
sein Verhalten zu ändern.
Prof. Martin Kocher
Mikro 1-12 (SS 2009)
19
Definition: Ein Nash-Gleichgewicht ist ein paar von Strategien
(s1*,s2*) für das gilt:
1. Gegeben die Strategie s1* von Spieler 1 ist die Strategie
s2* von Spieler 2 optimal (eine „beste Antwort“).
2. Gegeben die Strategie s2* von Spieler 2 ist die Strategie
s1* von Spieler 1 optimal (eine „beste Antwort“).
In einem Nash- Gleichgewicht hat kein Spieler einen Anreiz, sein
Verhalten zu ändern.
Wir haben ein Nash-Gleichgewicht gefunden, wenn es eine Zelle in der
Auszahlungsmatrix gibt, in der beide Auszahlungen unterstrichen
sind.
Prof. Martin Kocher
Mikro 1-12 (SS 2009)
20
Bemerkungen:
1. Ein Nash-Gleichgewicht ist ein Paar von wechselseitig besten
Antworten:
● Wenn Spieler 1 weiß, dass Spieler 2 s2* spielt, sollte er mit s1*
antworten.
● Wenn Spieler 2 weiß, dass Spieler 1 s1* spielt, sollte sie mit s2*
antworten.
2. Aber: Zum Zeitpunkt, wo ein Spieler sich für eine Strategie entscheidet,
weiß er nicht, welche Strategie sein Gegenüber wählt. Er kann nur eine
beste Antwort gegen das erwartete Verhalten seines Gegenspielers
spielen. Im Gleichgewicht müssen diese Erwartungen korrekt sein.
3. Wenn eine Strategienkombination kein Nash-Gleichgewicht ist, muss
einer der Spieler bei dieser Kombination einen Fehler machen:
– Entweder spielt er keine beste Antwort gegen das erwartete
Verhalten der anderen Spieler,
– oder seine Strategie ist optimal gegeben seine Erwartungen,
aber diese Erwartungen sind falsch.
Prof. Martin Kocher
Mikro 1-12 (SS 2009)
21
4. Ein Nash-Gleichgewicht kann also als eine Kombination konsistenter
Erwartungen interpretiert werden: Wenn sich jeder Spieler
entsprechend der Erwartung seines Gegenspielers verhält, hat kein
Spieler einen Anreiz, sein Verhalten zu ändern.
Frage: Warum sollten wir erwarten, dass die Spieler ein NashGleichgewicht spielen?
Darauf sind verschiedene Antworten gegeben worden:
1. Rationale Analyse des Spiels:
Jeder Spiele könnte sich fragen, was als Ergebnis des Spiels in Frage
käme. Ein Ergebnis, dass kein Nash-Gleichgewichtsergebnis ist, kann
kein rationales Ergebnis sein, weil sich hier wenigstens ein Spieler
suboptimal verhält. Nur ein Nash-Gleichgewicht ist eine
Strategienkombination, bei der sich kein Spieler mehr besser stellen
kann.
Prof. Martin Kocher
Mikro 1-12 (SS 2009)
22
2. Vorschlag von außen: Ein Außenstehender empfiehlt den Spielern,
das Nash Gleichgewicht zu spielen. Wenn jeder glaubt, dass alle
anderen diesem Vorschlag folgen, ist es für jeden einzelnen optimal,
dies auch zu tun. Dieser Vorschlag, wie das Spiel zu spielen ist, könnte
z.B. eine soziale Norm sein (Rechts- oder Linksverkehr, “Ladies first”).
3. Kommunikation vor dem Spiel: Stellen Sie sich vor, dass die Spieler
miteinander reden können, bevor sie sich für ihre Strategien
entscheiden. Angenommen, sie haben sich darauf geeinigt, die
Strategienkombination (U,r) zu wählen. Dann hat keiner der Spieler
einen Anreiz, von dieser Absprache abzuweichen. Wenn sie sich
jedoch auf eine Strategienkombination einigen, die kein NashGleichgewicht ist (z.B. (M,m)), dann hat wenigstens ein Spieler einen
Anreiz, sich nicht an die Absprache zu halten.
4. Lernen durch Versuch und Irrtum: Nehmen wir an, die Spieler
spielen dasselbe Spiel immer wieder gegen wechselnde Gegenspieler.
Auch wenn die Spieler nur beschränkt rational sind, aber aus Fehlern
der Vergangenheit lernen, kann ihr Verhalten im Zeitablauf zu einer
Gleichgewichtsstrategie konvergieren.
Prof. Martin Kocher
Mikro 1-12 (SS 2009)
23
Beachten Sie:
Es ist nur dann eine gute Idee, die Nash-Gleichgewichtsstrategie zu
wählen, wenn Sie davon überzeugt sind, dass die anderen Spieler dies
ebenfalls tun. Wenn das nicht der Fall ist und Sie in der Lage sind, das
abweichende Verhalten Ihrer Gegenspieler richtig vorherzusagen, können
Sie unter Umständen sehr viel besser abschneiden, wenn auch Sie nicht
die Gleichgewichtsstrategie spielen.
Prof. Martin Kocher
Mikro 1-12 (SS 2009)
24
12.8 Multiple Nash-Gleichgewichte
In einigen Spielen gibt es nicht nur ein, sondern gleich mehrere NashGleichgewichte. Betrachten Sie etwa das folgende Spiel:
Er
Ballett
Boxen
Ballett
2, 1
0, 0
Boxen
0, 0
1, 2
Sie
Abb. 12.5 .: „Kampf der Geschlechter“
Prof. Martin Kocher
Mikro 1-12 (SS 2009)
25
Interpretation:
Eine Frau und ein Mann können an einem Abend ins Ballett oder zum
Boxen gehen.
● Sie geht lieber zum Ballett.
● Er geht lieber zum Boxen.
● Sie geht lieber mit ihm zum Boxen als allein ins Ballett.
● Er geht lieber mit ihr ins Ballett als allein zum Boxen.
Ein Gleichgewicht dieses Spiels ist “Ballett, Ballett”:
● Gegeben, dass sie ins Ballett geht, ist es für ihn ebenfalls optimal, ins
Ballett zu gehen.
● Gegeben, dass er ins Ballett geht, ist es für sie natürlich auch optimal,
ins Ballett zu gehen.
Es existiert aber noch ein zweites Nash-Gleichgewicht: “Boxen, Boxen”.
Denn gegeben, dass er zum Boxen geht, ist es auch für sie optimal, zum
Boxen zu gehen, und umgekehrt.
Prof. Martin Kocher
Mikro 1-12 (SS 2009)
26
Beachten Sie:
Wenn es mehrere Nash-Gleichgewichte gibt, ist nicht klar, ob überhaupt ein
ein Nash Gleichgewicht gespielt wird, und wenn ja, welches.
Es gibt jedoch verschiedene Theorien, die vorherzusagen versuchen,
welches von mehreren Nash Gleichgewichten gespielt wird:
● Selbststützende Absprachen
● Focal Points (Schelling)
● Verfeinerungen des Gleichgewichtsbegriffes (Harsanyi, Selten)
Prof. Martin Kocher
Mikro 1-12 (SS 2009)
27
12.9 Gemischte Gleichgewichte
In einigen Spielen scheint es kein Nash-Gleichgewicht zu geben.
Betrachten Sie etwa das folgende Spiel:
2
Stein
Schere
Papier
Stein
0, 0
1, -1
-1, 1
Schere
-1, 1
0, 0
1, -1
Papier
1, -1
-1, 1
0, 0
1
Abb. 12.6 .: „Stein, Schere, Papier“
Prof. Martin Kocher
Mikro 1-12 (SS 2009)
28
In diesem Spiel gibt es kein Gleichgewicht in reinen Strategien.
Es existiert aber ein Gleichgewicht in gemischten Strategien:
Jeder Spieler randomisiert und wählt jede seiner drei Aktionen mit der
Wahrscheinlichkeit ein Drittel:
● Gegeben, dass jede Aktion meines Gegenspieler gleichwahrscheinlich
ist, bin ich indifferent, welche Aktion ich wählen sollte.
● Wenn ich indifferent bin, ist es für mich optimal zu randomisieren.
● Das selbe gilt für meinen Gegenspieler
● Also sind diese gemischten Strategien wechselseitig beste Antworten.
Wir können das Thema gemischte Strategien hier leider nicht vertiefen,
aber es wirft einige interessante Fragen auf:
● Können Spieler randomisieren?
● Warum sollten sie das tun, wenn sie indifferent sind?
● Wie werden die Auszahlungen bei Unsicherheit bewertet?
Mehr dazu in der Vorlesung „Spieltheorie“.
Prof. Martin Kocher
Mikro 1-12 (SS 2009)
29
12.9 Sequentielle Spiele
Bisher hatten wir Situationen betrachtet, in denen beide Parteien
simultan über ihre Strategie entscheiden müssen. Jetzt betrachten wir
Spiele, in denen eine Partei zuerst zieht. Der zweite Spieler beobachtet
diesen Zug und entscheidet erst dann über seinen eigenen Zug.
Um die zeitliche Struktur zum Ausdruck zu bringen, werden wir
sequentielle Spiele mit einem Spielbaum beschreiben:
Spieler A
Spieler B
l
⎛1⎞
⎜ ⎟
⎝9⎠
R
L
r
⎛ 3⎞
⎜ ⎟
⎝8⎠
l
⎛0⎞
⎜ ⎟
⎝0⎠
Spieler B
r
⎛ 2⎞
⎜ ⎟
⎝1⎠
Abb. 12.7: Ein Spielbaum
Prof. Martin Kocher
Mikro 1-12 (SS 2009)
30
Wieviele Strategien habe Spieler A und B in diesem Spiel?
● Spieler A hat nur zwei Strategien, L und R.
● Spieler B hat dagegen vier Strategien:
– ll: Spiele l, wenn Spieler A L gespielt hat, und l, wenn A R gespielt
hat.
– lr: Spiele l, wenn Spieler A L gespielt hat, und r, wenn A R gespielt
hat.
– rl: Spiele r, wenn Spieler A L gespielt hat, und l, wenn A R gespielt
hat.
– rr: Spiele r, wenn Spieler A L gespielt hat, und r, wenn A R gespielt
hat.
● In einem sequentiellen Spiel ist eine Strategie ein vollständig
bedingter Aktionsplan, der angibt, wie sich ein Spieler in jedem
Entscheidungsknoten, an dem er am Zug ist, verhalten wird.
Prof. Martin Kocher
Mikro 1-12 (SS 2009)
31
Wie kann man ein sequentielles Spiel lösen?
Eine Möglichkeit wäre es, den Spielbaum in die “Normalform” des
Spiels zu überführen. Die Normalform gibt einfach für jede mögliche
Strategienkombination das zugehörige Auszahlungsprofil an. Für den
obigen Spielbaum sieht diese Normalform wie folgt aus:
B
ll
lr
rl
rr
L
1, 9
1, 9
3, 8
3, 8
R
0, 0
2, 1
0, 0
2, 1
A
Abb. 12.8: Die Normalform des Spielbaums
Was sind die Nash-Gleichgewichte in diesem Spiel?
Prof. Martin Kocher
Mikro 1-12 (SS 2009)
32
● (R,lr): Spieler A geht nach rechts. Wenn er nach rechts gegangen ist,
geht Spieler B auch nach rechts. Wenn A nach links gegangen wäre,
hätte Spieler B links gespielt.
● (L,ll): Spieler A geht nach links. Wenn er nach links gegangen ist, geht
Spieler B auch nach links. Wenn A nach rechts gegangen wäre, hätte
Spieler B links gespielt.
Sind diese Nash-Gleichgewichte beide überzeugend?
Das Nash-Gleichgewicht (L,ll) ist nicht überzeugend:
● In diesem Nash-Gleichgewicht “droht” Spieler B damit, nach links zu
gehen, wenn Spieler A nach rechts gehen würde. Wenn Spieler A
glaubt, dass Spieler B das tut, ist es für A tatsächlich optimal, nach
links zu gehen.
● Aber: Die Drohung von Spieler B ist nicht glaubwürdig. Wenn Spieler A
doch nach rechts gehen würde, dann wäre es für Spieler B besser,
wenn er nicht nach links, sondern nach rechts ginge.
● Wenn Spieler A das voraussieht, ist es für ihn besser, nach rechts statt
nach links zu gehen.
Prof. Martin Kocher
Mikro 1-12 (SS 2009)
33
Beachten Sie:
1. Dieses Problem taucht im Nash-Gleichgewicht (R,lr) nicht auf. Hier ist
es für Spieler B optimal, l zu spielen, wenn Spieler A L gewählt hat, und
r zu spielen, wenn Spieler A R gewählt hat.
2. Die Strategienkombination (L,ll) ist zwar nicht sehr überzeugend, sie
genügt aber der formalen Definition eines Nash-Gleichgewichtes:
Gegeben, dass Spieler B die Strategie ll wählt, ist es für A optimal, L zu
wählen, und gegeben, dass A L wählt, ist es für Spieler B optimal, ll zu
wählen. Zwar wäre l nicht optimal, wenn A R spielen würde, aber im
Gleichgewicht spielt A ja L, also wird das Ereignis R in diesem
Gleichgewicht nie eintreten.
3. Die Definition des Nash-Gleichgewichts greift bei sequentiellen Spielen
zu kurz, weil sie nicht verlangt, dass die Spieler sich auch außerhalb
des Gleichgewichtspfades optimal verhalten, und damit zulässt, dass
ein Gleichgewicht durch unglaubwürdige Drohungen gestützt wird.
Prof. Martin Kocher
Mikro 1-12 (SS 2009)
34
Wenn wir unglaubwürdige Drohungen ausschließen wollen, müssen
wir das Gleichgewichtskonzept verfeinern. Das hat Reinhard Selten
(1965, 1975) mit dem Konzept des “teilspielperfekten
Gleichgewichts” gemacht.
Definition: Ein Teilspiel beginnt in einem Knoten des
Spielbaums und umfasst alle Knoten und Auszahlungen, die
aus diesem Knoten erwachsen.
Definition: Ein Nash-Gleichgewicht eines sequentiellen Spiels
ist teilspielperfekt, wenn die Strategien der Spieler in jedem
Teilspiel (d.h. nach jeder möglichen Geschichte des Spiels)
ebenfalls ein Nash-Gleichgewicht bilden.
Ein teilspielperfektes Gleichgewicht findet am durch
Rückwärtsinduktion:
Prof. Martin Kocher
Mikro 1-12 (SS 2009)
35
Finde die optimalen Entscheidungen des Spielers, der als letzter am
Zug ist.
● Ersetze diese letzten Verzweigungen des Spielbaums durch die
Auszahlungsvektoren, die sich ergeben, wenn der letzte Spieler die
optimale Entscheidung fällt.
● Betrachte jetzt die vorletzten Entscheidungsknoten und verfahre
genauso.
● Gehe so weiter, bis der erste Spieler erreicht ist.
●
Lösen wir so den Spielbaum aus Abb. 12.8:
Spieler B:
● Wenn A L gewählt hat, spielt B l.
● Wenn A R gewählt hat, spielt B r.
Spieler A:
● Wenn A L spielt, wird B l spielen und A erhält 1.
● Wenn A R spielt, wird B r spielen und A erhält 2.
Prof. Martin Kocher
Mikro 1-12 (SS 2009)
36
Teilspielperfektes Nash-Gleichgewicht:
● A spielt R;
● B reagiert auf L mit l und auf R mit r.
● Das teilspielperfekte Gleichgewicht ist also (R,lr).
● Der Gleichgewichtspfad ist (R,r).
Beachten Sie:
● Jedes teilspielperfekte Gleichgewicht ist auch ein Nash-Gleichgewicht,
aber nicht umgekehrt. Warum?
● Sequentielle Spiele mit unendlichem Horizont oder mit Perioden, in
denen mehrere Spieler gleichzeitig am Zug sind, sind etwas
schwieriger zu lösen und können multiple teilspielperfekte
Gleichgewichte haben.
Prof. Martin Kocher
Mikro 1-12 (SS 2009)
37
12.10 Ein Marktzutrittsspiel
Zutreter
D
⎛0⎞
⎜ ⎟
⎝10 ⎠
E
Monopolist
k
n
⎛ −1⎞
⎜ ⎟
⎝ −1⎠
⎛5⎞
⎜ ⎟
⎝5⎠
Abb. 12.9: Ein Marktzutrittsspiel
● Der Marktzutreter entscheidet zunächst, ob er eintritt (E) oder
draußen bleibt (D).
● Der Monopolist entscheidet im Falle des Marktzutritts, ob er kämpft
(k) und einen Preiskrieg führt oder nicht kämpft (n) und sich den
Markt teilt.
Prof. Martin Kocher
Mikro 1-12 (SS 2009)
38
Rückwärtsinduktion liefert ein Nash-Gleichgewicht mit Marktzutritt und
anschließender Marktteilung.
Es gibt ein zweites Nash-Gleichgewicht, in dem der Monopolist mit
Kampf droht und der Zutreter dies glaubt.
Doch diese Drohung ist nicht glaubwürdig. Wenn der Monopolist wirklich
seinen Markt schützen will, dann muss er sich binden, immer zu
kämpfen. Z.B.:
● Aufbau von Überkapazitäten, die es ex post optimal machen, eine
hohe Menge zu produzieren.
● Aufbau einer “Reputation” für kämpferisches Verhalten
(wiederholtes Spiel mit asymmetrischer Information).
● Vertrag mit dem Manager der Firma, der diesen nicht nach dem
Gewinn, sondern nach dem Marktanteil (unabhängig vom Gewinn)
entlohnt. Für den Manager ist es dann optimal, zu kämpfen.
Prof. Martin Kocher
Mikro 1-12 (SS 2009)
39
12.11 Wiederholte Spiele
In vielen Situationen wird ein Spiel nicht nur einmal, sondern mehrfach
hintereinander gespielt. Betrachten wir zum Beispiel das folgende
Preissetzungsduopol, das zweimal hintereinander gespielt werden soll:
2
niedrig
hoch
niedrig
100, 100
500, 0
hoch
0, 500
400, 400
1
Abb. 12.10: „Preissetzung im Duopol“
Jeder Spieler maximiert die Summe seiner Auszahlungen über beide
Perioden.
Prof. Martin Kocher
Mikro 1-12 (SS 2009)
40
Wir müssen dieses Spiel durch Rückwärtsinduktion lösen:
1. In der zweiten Periode hat jeder Spieler die dominante Strategie, einen
niedrigen Preis zu wählen. Unabhängig davon, was in der ersten
Periode passiert, wird es in der zweiten Periode also zum Preiskampf
kommen.
2. Da das Verhalten in der ersten Periode das Ergebnis der zweiten
Periode nicht beeinflussen kann, haben die Spieler in der ersten
Periode ebenfalls die dominante Strategie, einen niedrigen Preis zu
wählen.
Beachten Sie:
Diese Argumentation ist unabhängig davon, wie oft dieses Spiel wiederholt
wird. Solange es eine letzte Periode gibt, kann das Spiel in dieser
Weise von hinten “aufgerollt” werden.
Wenn die Spieler jedoch sehr oft interagieren, scheint dieses Ergebnis
nicht sehr plausibel. Bei häufiger Interaktion gelingt es nämlich oft,
“Gefangendilemmata” zu überwinden.
Prof. Martin Kocher
Mikro 1-12 (SS 2009)
41
In solchen Fällen ist ein Modell realistischer, bei dem es kein klar
definiertes Ende der Interaktion gibt.
So könnte es etwa in jeder Periode eine Wahrscheinlichkeit d<1 geben,
dass wir auch in der nächsten Periode wieder gegeneinander spielen
werden. Eine solche Wahrscheinlichkeit d kann auch als
Diskontierungsfaktor interpretiert werden, mit dem zukünftige
Auszahlungen auf die Gegenwart abgezinst werden.
Situationen, in denen es kein klar definiertes Ende der Interaktion gibt,
modelliert man als unendlich oft wiederholte Spiele:
● In jeder Periode spielen die Spieler das Stufenspiel.
● Die Spieler maximieren die Summe der abdiskontierten zukünftigen
Auszahlungen:
∞
U i = ∑ d t −1ui (a1t , a2t )
t =1
Prof. Martin Kocher
Mikro 1-12 (SS 2009)
42
In unendlich oft wiederholten Spielen ist es möglich, Kooperation als
teilspielperfektes Gleichgewicht zu stützen, selbst wenn das im isoliert
betrachteten Stufenspiel nicht möglich ist.
Beispiel: Unendlich oft wiederholtes Preissetzungsduopol
Betrachte die folgende Strategie von Spieler iÎ{1,2}:
● Wähle den hohen Preis in Periode 1.
● Wähle den hohen Preis auch in jeder folgenden Periode, solange beide
Spieler in allen vorangegangenen Perioden hohe Preise gewählt
haben. Wenn ein Spieler in der Vergangenheit jedoch den niedrigen
Preis gewählt hat, dann wähle den niedrigen Preis in allen folgenden
Perioden.
Diese Strategien bilden ein Nash-Gleichgewicht, wenn d hinreichend hoch
ist, denn:
● Wenn sich Spieler i an diese Strategie hält, ist seine Auszahlung
∞
U = ∑d
*
i
Prof. Martin Kocher
t =1
t −1
400
400 =
1− d
Mikro 1-12 (SS 2009)
43
Wenn er in der ersten Periode abweicht, ist seine Auszahlung maximal
∞
100d
t −1
U i = 500 + ∑ d 100 = 500 +
1− d
t =2
Eine Abweichung in der ersten Periode lohnt sich nicht, falls
400
100d
≥ 500 +
1− d
1− d
⇔
d≥
1
4
Dasselbe gilt für Abweichungen in allen übrigen Perioden.
Dieses Nash-Gleichgewicht ist auch teilspielperfekt, denn:
● Wie wir oben gezeigt haben, lohnt sich eine Abweichung von der
obigen Strategie nach keiner Vorgeschichte, in der alle Spieler stets
den hohen Preis gewählt haben.
● Eine Abweichung lohnt sich auch nach keiner Vorgeschichte, in der
schon einmal ein Spieler den niedrigen Preis gewählt hat. Denn in
diesem Fall schreibt die Strategie vor, dass immer das Gleichgewicht
des Stufenspiels gespielt wird.
Prof. Martin Kocher
Mikro 1-12 (SS 2009)
44
12.12 Ausblick
Dieser Teil der Vorlesung sollte Sie mit einigen grundlegenden
Konzepten der Spieltheorie vertraut machen. Dabei haben wir uns auf
Spiele mit vollständiger Information und endlichen Strategienräumen
beschränkt.
Im nächsten Kapitel werden wir die Spieltheorie auf Oligopolmärkte
anwenden und dabei auch Spiele mit unendlichen Strategienräumen
kennenlernen.
Nicht besprochen haben wir Spiele mit unvollständiger
(asymmetrischer) Information, die in vielen ökonomische
Fragestellungen (z.B. in der Analyse von Auktionen) eine äußerst
wichtige Rolle spielen.
Solche Spiele werden ausführlich in der Vorlesung “Spieltheorie”
behandelt. Außerdem werden dort die Konzepte, denen wir in diesem
Kapitel begegnet sind, weiter vertieft.
Prof. Martin Kocher
Mikro 1-12 (SS 2009)
45