Kapitel 11: Dynamische Spiele Beispiel für einen

Werbung
Kapitel 11: Dynamische Spiele
Bezeichnungen
KAP 11. Dynamische Spiele
Informationsmengen; vollkommene u. unvollkommene Informat.
Spiele mit Zufallszügen ( Natur“ als Spieler)
”
Definition: Spielbaum, Spiel in extensiver Form
Normalform und extensive Form
Strategiebegriff
Nash-Gleichgewichte (Transformation in Normalform)
Ein Markteintrittsspiel
I
Der Punkt, an dem ein Spieler wählt, heißt Entscheidungsknoten
I
Der erste Knoten heißt Anfangsknoten oder root
I
Verbindungen zwischen Knoten heißen Zweige
I
Jedem Zweig ist eine Aktion zugeordnet
I
Die Knoten am Ende heißen Endknoten
I
Jedem Endknoten ist ein Nutzenprofil zugeordnet,
das den Nutzen jedes Spielers beschreibt,
wenn das Spiel an diesem Knoten endet
1 / 28
3 / 28
Beispiel für einen Spielbaum
Information der Spieler
SP1
I
a
b
SP2
w
SP2
y
x
z
SP1
SP1
(3, 2)
(1, 0)
c
(0, 5)
I
I
I
I
I
Ein Spiel, bei dem alle Spieler alle vorherigen Züge beobachten können
heißt: Spiel unter vollkommener Information (perfect information)
I Ein Spiel, in dem mindest. ein SP nicht alle vorherig. Züge beobachten kann
heißt: Spiel unter unvollkommener Information (imperfect information)
I Was ein Spieler beobachten kann, kennzeichnen wir durch
Informationsmengen
I Eine Informationsmenge umfasst die Knoten, die ein Spieler
NICHT voneinander unterscheiden kann
Beachte Unterschied: Vollkommene (perfect) und vollständige (complete) Info.:
I Vollkommene Information (perfect information):
Alle Spieler wissen überall, an welchem Entscheid.Knoten sie sich befinden
d
e
(3, 6) (2, 1)
f
(1, 1)
Zuerst wählt SP1 zwischen a und b
Wenn SP1 a gewählt hat, wählt SP2 zwischen w und x
Wenn SP1 b gewählt hat, wählt SP2 zwischen y und z usw.
Der Spielpfad b → y → d ergibt den Nutzen 3 für SP1 und 6 für SP2
usw.
(keine Unsicherheit über vorhergehende (oder gleichzeitige) Züge der GegenSP)
I
Vollständige Information (complete information):
Die Nutzenfunktionen (eigene u. die der GegenSP) sind den Spielern bekannt
(keine Unsicherheit über Nutzen der GegenSP)
(Vorläufig werden nur SPe mit vollständiger (complete) Informat. behandelt)
2 / 28
4 / 28
Ein Spiel unter unvollkommener Information
Ein inkorrekter Spielbaum
SP1
SP1
a
a
b
SP2
w
(3, 2)
SP2
y
x
c
(0, 5)
I
I
z
w
SP1
(1, 0)
d
c
(3, 6) (2, 1)
d
SP2
I
I
I
I
I
e
d
f
(3, 6) (2, 1)
(1, 1)
c und e sowie d und f seien unterschiedliche Aktionen
Damit der Baum einen Sinn macht, muss SP1 wissen,
ob er zwischen c und d oder zwischen e und f wählen muss
Also muss er wissen, an welchem Knoten er sich befindet
Also ist die Informationsmenge (- -) nicht korrekt
Allgemein: Ein Spiel ist nur dann wohl-definiert, wenn ein Spieler
an jedem Knoten einer Informationsmenge die gleichen Aktionen hat
7 / 28
Spieler sollen vollkommenes Gedächtnis haben
I
Ein Spiel unter vollkommener Information ist also ein Spiel,
I
in dem jede Informationsmenge genau einen Knoten enthält.
Wir nehmen an, dass sich jeder SP an alle vorherigen Züge erinnert
Alle Spieler haben vollkommenes Gedächtnis ( perfect replay“)
”
Unvollkommenes Gedächtnis lässt sich mit Informationsmengen darstellen:
Das Eingangsbeispiel ist ein Spiel unter vollkommener Information
SP1
a
Das vorhergehende Bsp. ist ein Spiel unter unvollkommener Information
b
SP2
Im Folgenden nehmen wir an, dass ein Spieler
w
seine möglichen Aktionen kennt
I
c
(0, 5)
Blau umrahmt (- -): Eine Informationsmenge für SP1 mit zwei Knoten:
SP1 kann nicht beobachten, ob SP2 y oder z gewählt hat.
D.h. SP1 weiß nicht, an welchem Knoten er sich befindet
(ob SP2 vorher y oder z gewählt hat)
Eine Informationsmenge wird mit dem zugehörigen SP gekennzeichnet
nicht mit den Knoten in der Informationsmenge
z
SP1
(1, 0)
(1, 1)
Von allen Knoten einer Info-Menge
müssen die gleichen Aktionen ausgehen
I
y
x
(3, 2)
5 / 28
I
b
SP2
SP2
y
x
z
SP1
Also müssen von jedem Knoten innerhalb einer Informationsmenge
(3, 2)
die gleichen Aktionen abzweigen
Nochmal:
I Von allen Knoten einer Informationsmenge ...
... müssen die gleichen Aktionen ausgehen
I
6 / 28
SP1
(1, 0)
a
b
(0, 5)
(3, 6) (2, 1)
e
f
(1, 1)
Hier weiß SP1 nicht, ob er schon gezogen hat oder nicht!
(Es ist ein korrekter Spielbaum, wir werden dies allerdings nicht behandeln)
8 / 28
Spiele mit Zufallszügen
Definition Spielbaum“
”
Ein Spielbaum ist eine Menge von Knoten und Zweigen mit den
Eigenschaften:
I
I
Viele dynamische Spiele unterliegen zufälligen Einflüssen
z.B. Poker, Würfelspiele, ...
Solche exogene Unsicherheit kann man durch einen
I
Es gibt genau einen Anfangsknoten
I
Jeder Zweig verbindet genau zwei Knoten
I
Jeder Knoten hat genau einen Vorgängerknoten ( Abstammknoten“,
”
Elternknoten“)
”
(verhindert insbes. geschlossene Pfade)
I
Jeder Pfad von Zweigen endet in einem Endknoten
zusätzlichen Spieler darstellen
I
Diesen Spieler nennt man Natur
Natur wählt ihre Aktionen mit exogen gegebener Wahrscheinlichkeit
Häufig (aber nicht immer) zieht Natur am Anfangsknoten
9 / 28
Ein Spiel mit Zufallszug
Definition Spiel in extensiver Form“
”
Ein Spiel in extensiver Form ohne Zufallszüge umfasst:
N
p
I
eine Menge von Spielern
einen Spielbaum
I eine Abbildung, die jedem Knoten genau einen Spieler zuordnet
I eine Abbildung, die jedem Zweig eine Aktion zuordnet
I für jeden Spieler eine Zusammenfassung seiner Knoten in Info-Mengen
wobei jedem Knoten einer Info-Menge die gleiche Menge möglicher
Aktionen folgt
I für jeden SP eine Nutzenfunktion, die jedem Endknoten eine Zahl zuordnet
Bei einem Spiel in extensiver Form mit Zufallszügen
I gibt es eine zusätzlichen Spieler Natur“
”
I der keine Nutzenfunktion hat
I und dessen Züge mit einer gegebenen Wkts-Verteilung über die am
entsprechenden Knoten verfügbaren Aktionen erfolgen
Ein Spiel in extensiver Form heißt endlich, falls die Menge der Spieler und die
Menge der Aktionen endlich ist; andernfalls heißt es unendlich
1−p
I
SP1
a
(3, 2)
a
b
(1, 0)
b
SP2
w
(0, 5)
SP2
x
y
(3, 6) (2, 1)
z
(1, 1)
Bei diesem Spiel:
I
I
11 / 28
Natur wählt links“ mit Wkt. p und rechts“ mit Wkt. 1 − p
”
”
SP1 kann den Zug von Natur nicht beobachten
aber SP2 kann
10 / 28
12 / 28
Normalform → extensive Form
Abstrakter: Strategie in extensiven Spielen
Def.: Gegeben ein Spiel in extensiver Form.
Eine (reine) Strategie für Spieler i spezifiziert für jede seiner Info-Mengen
eine an dieser Info-Menge verfügbare Aktion.
Jedes Spiel in Normalform kann ...
... als Spiel in extensiver Form dargestellt werden
I
I
denn die Unsicherheit über Aktionen der Gegenspieler in der Normalform
lässt sich mittels Info-Mengen abbilden
Beispiel:
I
– der Spieler legt vor dem Spiel seine Aktionen für alle Info-Mengen fest
– Die Ausführung der Strategie überlässt er dann einem Computer
SP1
a
a
b
x
4, 3
0, 5
y
2, 6
3, 5
→
Konkrete Strategienprofile münden in einem Spielpfad.
Beispiel:
b
SP1
SP2
y
x
(4, 3)
I
Interpretation:
x
(2, 6) (0, 5)
y
a
SP2
w
(3, 1)
Kann man auch extensive Spiele als Normalform-Spiele darstellen?
Ja, aber die Antwort erfordert, dass wir uns klar machen,
was dann die Strategien der Spieler (und ihre Strategieräume) sind.
b
Eine Strategie beschreibt das hypothetische Verhalten.
SP2
z
y
x
(4, 3)
Spielt SP1 s1 = b und SP2 s2 = (x, y),
so ergibt sich der Spielpfad b → y
(2, 6) (0, 5)
Wenn sich jeder Spieler auf eine
Strategie festgelegt hat, entsteht der
Spielpfad (der tatsächliche Spielverlauf)
(3, 1)
15 / 28
13 / 28
Strategien in extensiven Spielen
Beispiel: Extensive Form → Normalform
SP1
SP1
a
SP2
w
(4, 3)
I
I
I
I
a
b
x
y
(2, 6) (0, 5)
SP2
w
SP2
z
(4, 3)
(3, 1)
I
Die Strategien von SP1 sind a und b X
Wie sehen die Strategien von SP2 aus?
Strategien von SP2 sind von der Art:
Wenn ich im li. Knoten bin (wenn SP1 a zieht), dann ziehe ich x o
(x, z)
Wenn ich im re. Knoten bin (wenn SP1 b zieht), dann ziehe ich z
I
I
D.h. wir können eine Strategie von SP2 in folgender Form darstellen:
Damit: SP2 hat insges. vier Strategien: {(w, y), (w, z), (x, y), (x, z)}
x
y
(2, 6) (0, 5)
SP2
z
→
a
b
(w,y )
4, 3
0, 5
(w,z)
4, 3
3, 1
(x,y )
2, 6
0, 5
(x,z)
2, 6
3, 1
(3, 1)
Die Nutzeneinträge in den Matrixzellen entsprechen den Nutzen, die aus
den entsprechenden Spielpfaden resultieren
Beachte: Die Normalform des Spiels hat
ein eindeutiges Nash-GG a, (x, y)
Das Nash-GG ist das Strat.Profil a, (x, y) , der resultierende Spielpfad ist (a, x)
I
s2 = (Aktion am li. Knoten, Aktion am re. Knoten)
I
b
14 / 28
Man bekommt das Nash-GG auch auf folgende Weise (Rückwärtsinduktion!)
Wenn SP2 rational ist, dann
spielt er an seinem linken Knoten x und an seinem rechten Knoten y
Wenn SP1 rational ist u. weiß, dass SP2 rational ist, spielt er a, denn er bekommt
2, wenn er a spielt
[Nutzen aus dem Pfad (a, x)]
0, wenn er b spielt
[Nutzen aus dem Pfad (b, y)]
16 / 28
Formale Def.: Strategie in extensiven Spielen“
”(i)
(i)
I
I
I
Beispiel
SP1
Sei Ji = {J1 , . . . , JK } die Menge der Informationsmengen von SPi
(i)
Ak
Sei
die Menge der Aktionen, die SPi an der Info.Menge
Verfügung hat
SK
Sei Ai = k=1 A(i) die Menge aller Aktionen von SPi
(i)
Jk
0
a
zur
b
SP2
2
w
Def.: Eine (reine) Strategie si für Spieler i ist eine Abbildung
y
x
(1, 0)
c
mit der Eigenschaft
I
SP1
d
(0, 5)
(i)
si (Jk ) ∈ Ak
I
z
3
(3, 2)
si : Ji 7→ Ai
(i)
SP2
1
I
Anmerkung: Die formale Def. sieht komplizierter aus als sie ist.
Sie formalisiert lediglich das, was wir schon in Worten besagt haben:
I
Eine (reine) Strategie für Spieler i spezifiziert für jede seiner Info-Mengen
eine an dieser Info-Menge verfügbare Aktion.
Punkt ist: Eine Strategie von SPi muss (vor dem Spiel) in jeder Situation,
in der SPi am Zug sein könnte, festlegen, welche Aktion er dann wählt.
3
c
(3, 6) (2, 1)
d
(1, 1)
1 und ;
2
SP2 hat die beiden Info-Mengen 1
2
Darstellung der Strategien von SP2 als (Aktion in ,
Aktion in )
ergibt folgende Strategien von SP2: {(w, y), (w, z), (x, y), (x, z)}
0 und ;
3
SP1 hat die beiden Info-Mengen 0
3
Darstellung der Strategien von SP1 als (Aktion in ,
Aktion in )
ergibt folgende Strategien von SP1: {(a, c), (a, d), (b, c), (b, d)}
I Dass SP1 die Strategien (a, c), (a, d) hat, obwohl von a die Strategien c und d nicht
erreichbar sind, ist kein Fehler! (Eine Strat. legt für jede Info-Menge die Aktion fest)
17 / 28
19 / 28
Auch wenn eine Info-Menge bei manchen
Spielpfaden gar nicht erreicht wird, ...
Transformation des Beispiels in Normalform
SP1
0
a
... muss eine Strategie festlegen, welche Aktion zu wählen ist
Beispiel:
SP1
a
b
2
x
(1, 1)
w
(−1, −1)
(3, 2)
Mögl. Aktionen SP2 an der Info-Menge : x, y
⇒ Strategien von SP2: {x, y}
2
müssen in Normalform auch die Strategienpaare (a, x), (a, y) betrachtet werden:
I
a
b
(1, 0)
c
(0, 5)
I
y
0, 2
−1, −1
2
y
x
z
SP1
3
1
Mögl. Aktionen SP1 an der Info-Menge :
a,b
⇒ Strategien von SP1: {a, b}
SP2
y
Da eine Strategie für Spieler i für jede seiner Info-Mengen eine an dieser
Info-Menge verfügbare Aktion spezifiziert,
x
0, 2
1, 1
SP2
1
Beide Spieler haben eine (einzige) Info-Menge,
(die jeweils aus einem einzigen Knoten besteht)
1
(0, 2)
b
SP2
I
Der Nutzen der Spieler resultiert aus dem Spielpfad,
der bei Anwendung der Strategienpaare entsteht
Beide Strat.Paare (a, x) u. (a, y) führen zu SPpfad a
18 / 28
d
→
3
c
(3, 6) (2, 1)
(a,c)
(a,d)
(b,c)
(b,d)
(w,y )
3, 2
3, 2
0, 5
,
(w,z)
3, 2
3, 2
,
,
(x,y )
1, 0
1, 0
,
,
(x,z)
1, 0
1, 0
,
1, 1
d
(1, 1)
Übungsaufgabe: Normalform fertig ausfüllen und Nash-GGe ermitteln
Wenn man (a, c), (a, d) nicht als Strategien von SP1 betrachtet,
... ist die Reduktion auf Normalform nicht möglich
Beachte:
Normalform ⇐⇒ Spieler legen sich simultan und unabhängig voneinander
auf eine Strategie fest
Eine (Normalform-) Strategie muss vor dem Spiel festlegen, welche Aktion
die Spieler wählen, wenn sie am Zug sind.
20 / 28
Extensive Form und Normalform
I
I
Wiederholung Beispiel 3
SP1
Offenbar: Jedes Spiel in extensiver Form hat eine eindeutige
Entsprechung als Normalform-Spiel
0
a
b
SP2
Anmerkung: In umgekehrter Richtung ist auch Existenz, aber nicht Eindeutigkeit
gegeben: Das gleiche Normalform-Spiel kann mehrere Entsprechungen als Spiel in
extensiver Form haben → an Beispiel 2 (unten) verdeutlichen
w
2
y
x
3
Damit können wir sämtliche Konzepte aus der Normalform-Theorie auf
Spiele in extensiver Form anwenden:
(3, 2)
(1, 0)
– Dominanz
Das
1.
2.
3.
4.
5.
6.
– Beste Antwort
– ...
Insbesondere überträgt sich das Nash-GG-Konzept als Lösungskonzept
Def.: Ein Nash-Gleichgewicht eines Spiels in extensiver Form ist ein NashGleichgewicht in der dem extensiven Spiel entsprechenden Normalform
21 / 28
Wiederholung der Beispiele
Beispiel 1:
I
SP2
w
b
y
x
(4, 3)
SP2
z
(2, 6) (0, 5)
→
a
b
(w,y )
4, 3
0, 5
(w,z)
4, 3
3, 1
(x,y )
2, 6
0, 5
(x,z)
2, 6
3, 1
SP1
I
(0, 2)
x
SP2
y
(1, 1) (−1, −1)
→ a
b
y
0, 2
−1, −1
a
←
(0, 2)
(1, 1)
Spiel hat 6 Nash-GGe
(a, c), (w, y) mit Spielpfad: a → w
(a, c), (w, z) mit Spielpfad: a → w
(a, d), (w, y) mit Spielpfad: a → w
(a, c), (w, z) mit Spielpfad: a → w
(b, d), (w, y) mit Spielpfad: b → y → d
(b, d), (x, y) mit Spielpfad: b → y → d
23 / 28
b
y
Können wir also einfach – wie in diesen Beispielen – die
Nash-Gleichgewichte der Normalform bestimmen
Bei der Reduktion auf Normalform entstehen oft multiple
Nash-Gleichgewichte,
da sie unglaubwürdige Drohungen enthalten
SP2
x
d
von denen einige nicht plausibel sind,
SP1
x
0, 2
1, 1
(3, 6)(2, 1)
(x,z)
1, 0
1, 0
2, 1
1, 1
So einfach ist es leider nicht, denn
(3, 1)
b
c
(x,y )
1, 0
1, 0
0, 5
3, 6
und das war’s?
Das Spiel hat nur ein Nash-GG, nämlich a, (x, y) ; Spielpfad ist: a → x
Beispiel 2:
Auch:
a
d
(w,z)
3, 2
3, 2
2, 1
1, 1
Extensive Form und Nash-GG
SP1
a
c
(0, 5)
– Strategie, Strategienprofil (der Gegenspieler)
I
(a,c)
→ (a,d)
z
(b,c)
(b,d)
3
SP1
SP2
1
(w,y )
3, 2
3, 2
0, 5
3, 6
x
y
(0, 2) (1, 1) (−1, −1)
Das li. Spiel hat 2 Nash-GGe (a, y) (Spielpfad: a) u. (b, x) (Spielpfad: b → x)
Das re. Spiel hat die gleichen Nash-GGe, Spielpfade sind aber: a → y, b → x
22 / 28
I
Daher werden wir das Nash-Konzept anpassen (verfeinern)
I
Das folgende Beispiel Markteintritt“ demonstriert eine solche Situation:
”
Ein Spiel in extensiver Form,
bei dessen Reduktion auf Normalform zwei Nash-Gleichgewichte entstehen
von denen eines eine unglaubwürdige Drohung enthält
24 / 28
Markteintrittsspiel
Markteintrittsspiel – NashGG (ne, a) unplausibel
E
E
e
ne
M
(0, 2)
M
(0, 2)
a
t
I
Zwei Spieler: E = Eindringling, M = Monopolist
I
E kann in den Markt eintreten (e) oder nicht (ne)
I
Bei Markteintritt kann M agressiv sein (a) oder den Markt teilen (t)
I
Normalform:
t
0, 2
1, 1
a
0, 2
−1, −1
I
t
0, 2
1, 1
(−1, −1)
(1, 1)
I
ne
e
a
t
(−1, −1)
(1, 1)
ne
e
e
ne
a
0, 2
−1, −1
E kann sich sagen:
Wenn ich erstmal e gewählt habe,
dann ist es für M besser, den Markt zu teilen (1 > −1)
M kann noch so viel drohen – letztlich wird er’s nicht durchziehen
Also sollte ich eintreten
Das Nash-GG (ne, a) ist unplausibel, denn es basiert auf einer
unglaubwürdigen Drohung
seitens des Monopolisten
27 / 28
25 / 28
E
Markteintrittsspiel – NashGGe
E
e
ne
(0, 2)
Markteintrittsspiel – Schlussfolgerung
M
t
(1, 1)
e
ne
a
(−1, −1)
ne
e
t
0, 2
1, 1
a
(0, 2)
0, 2
−1, −1
M
t
(1, 1)
ne
e
a
t
0, 2
1, 1
(−1, −1)
a
X
X
0, 2
X
−1, −1
I
I
I
I
I
Wir würden also erwarten, dass E erkennt, ...
dass a eine unglaubwürdige Drohung darstellt
und e somit in den Markt eintritt
⇒ (e, t) ist plausibler Spielausgang
Beachte: (e, t) ist auch ein Nash-GG
I Nash-GGe ohne unglaubwürdige Drohungen nennt man
Normalform zeigt: Das Spiel hat zwei Nash-GGe: (ne, a) und (e, t)
Betrachte das Nash-GG (ne, a):
Die Strategie a von M ist eine Drohung an E:
Wenn Du eintrittst, dann werde ich aggressiv reagieren!“
”
Wenn E dieser Drohung glaubt, ...
sollte er in der Tat ne wählen
Aber: Ist diese Drohung wirklich überzeugend?
teilspielperfekt
I
I
26 / 28
Solche Nash-GGe lassen sich durch eine Rückwärts-Induktion identifizieren
Dabei werden nämlich Strategien, die ex ante als optimal erscheinen, aber
sich im Verlauf des Spiels als suboptimal erweisen, eliminiert ⇒ nä. Kapitel
28 / 28
Herunterladen