Lösungen Aufgabenblatt 6 zur Spieltheorie SS 2017

Werbung
Lösungen Aufgabenblatt 6 zur Spieltheorie SS 2017
Aufgabe 6.1: Betrachten Sie das folgende extensive Spiel zwischen Spieler 1 und 2. Zunächst
wählt Spieler 1 zwischen `, m und r. Wenn Spieler 1 ` gespielt hat, kann Spieler 2 den Zug
von Spieler 1 beobachten, aber Spieler 2 kann nicht unterscheiden, ob Spieler 1 m oder r
gespielt hat. Nach dem Zug von Spieler 1, wählt Spieler 2 zwischen a und b.
Die Auszahlungen sind wie folgt:
u1 (`, a) = 3, u1 (`, b) = 2, u1 (m, a) = 1, u1 (m, b) = 1, u1 (r, a) = 2, u1 (r, b) = 2;
u2 (`, a) = 2, u2 (`, b) = 1, u2 (m, a) = 2, u2 (m, b) = 4, u2 (r, a) = 1, u2 (r, b) = 4.
Zeichnen Sie den Spielbaum und bestimmen Sie die Normalform sowie alle Nash-Gleichgewichte
in reinen Strategien (geben Sie auch den zugehörigen Spielpfad, den sog. GG-Pfad, an).
Spielbaum:
SP1
m
`
SP2
a
(3, 2)
r
SP2
a
b
(2, 1)
a
b
(1, 2)
(1, 4)
(2, 1)
b
(2, 4)
Um die Normalform und die Nash-GGe zu bestimmen: Zuerst die Strategien der einzelnen Spieler identifizieren.
Def. einer Strategie“ in einem extensiven Spiel : Eine (reine) Strategie für Spieler i muss
”
für jede seiner Info.Mengen eine an dieser Info.Menge verfügbare Aktion spezifizieren.
Zur Verdeutlichung nummerieren wir die Info.Mengen in diesem Spiel:
SP1
1
m
`
SP2 2
a
(3, 2)
r
3
a
b
(2, 1)
a
b
(1, 2)
SP2
(1, 4)
(2, 1)
b
(2, 4)
1 ⇒ Strategien SP1: {`, m, r},
– Spieler 1 hat nur eine Info.Menge, nämlich 2 und 3
– Spieler 2 hat die beiden Info.Mengen 2 Aktion in )
3
– Wir beschreiben eine Strategie von SP2 in der Form: (Aktion in ,
– In jeder dieser beiden Info.Mengen hat er die Aktionen a und b.
– Also Strategien SP2: {(a, a), (a, b), (b, a), (b, b)}
Damit ergibt sich die Normalform:
`
m
r
(a, a)
3, 2
1, 2
2, 1
(a, b)
3, 2
1, 4
2, 4
(b, a)
2, 1
1, 2
2, 1
(b, b)
2, 1
1, 4
2, 4
⇒
1
3 Nash-GGe:
GG-Pfad
`, (a, a) ,
(`, a)=(`
ˆ → a)
`, (a, b) ,
(`, a)=(`
ˆ → a)
r, (b, b) ,
(r, b)=(r
ˆ → b)
Aufgabe 6.2: Betrachten Sie folgendes 2-Personen-Spiel:
Zunächst wählt SP1 zwischen den Aktionen f1 (fortsetzen) und z1 (zugreifen);
das Spiel endet, wenn SP1 z1 wählt; ansonsten ist SP2 am Zug, der zwischen f2 u. z2 wählt;
das Spiel endet, wenn SP2 z2 wählt; ansonsten ist SP1 am Zug, der zwischen f3 u. z3 wählt;
das Spiel endet, wenn SP1 z3 wählt; ansonsten ist SP2 am Zug, der zwischen f4 u. z4 wählt
und das Spiel endet.
Anmerkung: Obwohl die Aktionen z(ugreifen) bzw. f (fortsetzen) auf jeder Stufe für jeden Spieler die gleichen sind, sind sie hier mit der Stufennummer versehen. Das soll die
Interpretation der Strategien der Spieler erleichtern (man muss das nicht machen).
a) Wie sieht der Spielbaum eines solchen Spiels aus?
Lösung:
SP1 1
z1
SP1
z1
f1
SP2
f2
SP2 2
z2
z2
oder
SP1
z3
f3
SP2
f4
f1
f2
SP1 3
z3
f3
SP2 4
z4
z4
f4
Handelt es sich um ein Spiel mit vollkommener oder unvollkommener Information?
Es ist ein Spiel mit vollkommener Information (da keine nicht-trivialen Info-Mengen)
b) Wie viele Endknoten hat das Spiel? Wie viele Info-Mengen?
Antwort: Das Spiel hat 5 Endknoten, und 4 Info-Mengen
c) Wie viele und welche reine Strategien hat SP1?
SP1 kann in der ersten Info-Menge z1 oder f1 und in der dritten z3 oder f3 spielen.
D.h. SP1 hat die vier Strategien {(f1 , f3 ), (f1 , z3 ), (z1 , f3 ), (z1 , z3 )}
Beispiel: SP1 wählt (f1 , f3 )“ bedeutet, dass er (vor Spielbeginn für sich) festlegt, dass
”
er immer (bzw. die beiden Male, wo er am Zug ist) fortsetzt.
Anmerkung: Bei unserem Strategiebegriff sind (z1 , f3 ) und (z1 , z3 ) unterschiedliche
Strategien von SP1 (obwohl SP1 bei Wahl von z1 gar nicht mehr in die Situation kommt,
z3 bzw. f3 zu wählen). Bei den unten verwendeten Payoffs wird sich herausstellen, dass
beide Strategien (z1 , f3 ) und (z1 , z3 ) Bestandteile von NGGen sind, aber nur (z1 , z3 ) ist
Bestandteil des teilspielperfekten Nash-Gleichgewichts. Nur wenn man zwischen den
Strategien (z1 , f3 ) und (z1 , z3 ) unterscheidet, kann man feststellen, ob f3 (statt z3 ) ein
unglaubwürdiges Versprechen von SP1 darstellt, das beim TSP-perfekten Nash-GG
gerade ausgeschlossen wird.
Wie lautet die Antwort für SP2?
SP2 hat die vier Strategien {(z2 , z4 ), (z2 , f4 ), (f2 , z4 ), (f2 , f4 )}
2
d) Es sei von folgenden Auszahlungen (Nutzen) an den Endknoten ausgegangen:
Wenn SP1 z1 (z auf Stufe 1) wählt: (1,1);
Wenn SP1 z3 (z auf Stufe 3) wählt: (2,2)
Also:
SP1 1
z1
(1, 1)
Wenn SP2 z2 (z auf Stufe 2) wählt: (0,3)
Wenn SP2 z3 (z auf Stufe 4) wählt: (1,4)
Wenn SP2 f4 (f auf Stufe 4) wählt: (3,3)
f1
SP2 2
z2
(0, 3)
f2
SP1 3
z3
(2, 2)
f3
SP2 4
z4
(1, 4)
f4
(3, 3)
Anmerkung: Das modelliert folgendes Spiel über vier Stufen = zwei Runden:
Ein Topf von Geld enthält initial 2 Euro. Mit jeder Stufe, in der das Spiel noch nicht beendet
ist, vermehrt sich der Topf um einen Euro. Der Spieler am Zug kann das Spiel beenden, indem
er z ugreift. Wenn Spieler 1 am Zug ist und beendet, erhält jeder Spieler die Hälfte des Topfes.
Wenn Spieler 2 am Zug ist und beendet, erhält er 1.5 Euro mehr als die Hälfte des Topfes, Spieler 1 entsprechend weniger. Die Payoffs in den folg. Runden wären: (2,5), (4,4), (3,6), . . .
Bestimmen Sie alle Nash-GGe in reinen Strategien des Spiels (über vier Stufen).
Lösung: Normalform ist (beachte: der erste Zugriff (das erste z) legt den Payoff fest):
(f1 , f3 )
(f1 , z3 )
(z1 , f3 )
(z1 , z3 )
(f2 , f4 ) (f2 , z4 ) (z2 , f4 ) (z2 , z4 )
3, 3
1, 4
0, 3
0, 3
2, 2
2, 2
0, 3
0, 3
1, 1
1, 1
1, 1
1, 1
1, 1
1, 1
1, 1
1, 1
Es gibt vier Nash-GGe (die alle im gleichen Spielpfad enden: SP1 greift sofort zu)
(z1 , f3 ), (z2 , f4 )
(z1 , f3 ), (z2 , z4 )
(z1 , z3 ), (z2 , f4 )
(z1 , z3 ), (z2 , z4 )
GG-Pfad:
GG-Pfad:
GG-Pfad:
GG-Pfad:
z1
z1
z1
z1
Beachte: Von diesen Nash-GGen enthält nur das letzte keine unglaubwürdigen Drohungen (hier: Versprechungen). Wenn z.B. SP1 die Strategie (z1 , f3 ) wählt, verspricht
er SP2, dass er bei seinem zweiten Zug fortsetzen wird. SP2 sollte das nicht glauben.
Die einzige GG-Strategie von SP1, die keine solchen unglaubwürdigen Versprechun
gen enthält, ist (z1 , z3 ). Tatsächlich wird sich in der nä. Aufgabe (z1 , z3 ), (z2 , z4 ) als
das einzige teilspielperfekte Nash-GG herausstellen. Wir unterscheiden zwischen den
Strategien (z1 , z3 ) und (z1 , f3 ), um unglaubwürdige Versprechungen identifizieren zu
können.
3
Aufgabe 6.3: Bestimmen Sie das teilspielperfekte Nash-Gleichgewicht des Spiels in der
vorherigen Aufgabe durch Rückwärtsinduktion.
Lösung:
1 SP1
f1
z1
(1, 1)
2 SP2
f2
z2
(0, 3)
3 SP1
f3
z3
(2, 2)
4 SP2
f4
z4
(1, 4)
(3, 3)
4 ist es optimal, z4 zu spielen. ⇒ TSPNGG: (?, ?), (?, z4 )
Stufe 4: Für SP2 im Knoten 4 wird zum neuen Endknoten; die
Reduziere das Spiel um die letzte Stufe. Der Knoten Auszahlungen dort ergeben sich aus der optimalen Wahl auf der (vorherigen) letzten Stufe:
1 SP1
f1
z1
(1, 1)
2 SP2
f2
z2
(0, 3)
3 SP1
f3
z3
(2, 2)
(1, 4)
3 ist es optimal, z3 zu spielen. ⇒ TSPNGG: (?, z3 ), (?, z4 )
Stufe 3: Für SP1 im Knoten 3 wird zum neuen Endknoten; die
Reduziere das Spiel um die letzte Stufe. Der Knoten Auszahlungen dort ergeben sich aus der optimalen Wahl auf der (vorherigen) letzten Stufe:
1 SP1
f1
z1
(1, 1)
2 SP2
f2
z2
(0, 3)
(2, 2)
2 ist es optimal, z2 zu spielen. ⇒ TSPNGG: (?, z3 ), (z2 , z4 )
Stufe 2: Für SP2 im Knoten 2 wird zum neuen Endknoten; die
Reduziere das Spiel um die letzte Stufe. Der Knoten Auszahlungen dort ergeben sich aus der optimalen Wahl auf der (vorherigen) letzten Stufe:
z1
1 SP1
f1
(1, 1)
(0, 3)
1 ist es optimal, z1 zu spielen. ⇒ TSPNGG: (z1 , z3 ), (z2 , z4 )
Stufe 1: Für SP1 im Knoten Lösung der Aufgabe: Das TSPNGG ist (z1 , z3 ), (z2 , z4 ) (Die Antwort: z1 wäre falsch!)
4
Zugehörige Unterlagen
Herunterladen