2. Vorlesung

Werbung
L ETZTE Ä NDERUNG : 15. N OVEMBER 2006
Vorlesung: Einführung in die Spieltheorie
WS 2006/2007
2. Vorlesung
24. Oktober 2006
1.3
Guido Schäfer
Beste-Antwort Funktion
Notation:
◦ Definiere A−i := × j∈N\{i} A j .
Definition 1.3 (Beste-Antwort Funktion). Für jedes Profil a−i ∈ A−i , definiere die
Beste-Antwort Funktion (engl. best-response) Bi : A−i → 2Ai als
Bi (a−i ) := {ai ∈ Ai : (a−i , a0i ) i (a−i , ai ) ∀a0i ∈ Ai }.
Mit dieser Definition ergibt sich folgende alternative Definition eines NashGleichgewichts.
Definition 1.4. Ein Aktionsprofil a∗ ∈ A ist ein Nash-Gleichgewicht für ein strategisches
Spiel (N, (Ai ), i ) genau dann, wenn gilt
a∗i ∈ Bi (a∗−i ) ∀i ∈ N.
Daraus ergibt sich ein Algorithmus zur Berechnung eines Nash-Gleichgewichts:
1. Berechne die Beste-Antwort Funtionen Bi (·) für alle i ∈ N.
2. Bestimme ein Aktionsprofil a∗ , so dass a∗i ∈ Bi (a∗−i ).
Falls alle Beste-Antwort Funktionen einelementige Mengen sind, reduziert sich obiger
Algorithmus auf das Lösen eines Gleichungssystems mit n Gleichungen und n Unbekannten.
Beispiel 1.5 (Nash-Gleichgewicht via Beste-Antwort Funktion). Wir können das NashGleichgewicht mittels Berechnung der Beste-Antwort Funktion für das folgende Zweipersonenspiel wie folgt bestimmen. Markiere die Beste-Antwort Aktionen eines Spielers mit
einem Stern ∗ . Ein Nash-Gleichgewicht ist dann ein Aktionsprofil, in dem jede Aktion mit
einem Stern versehen ist.
L
C
R
∗
∗
∗
T
(1, 2 ) (2 , 1) (1 , 0)
M (2∗ , 1∗ ) (0, 1∗ )
(0, 0)
B
(0, 1)
(0, 0)
5
(1∗ , 2∗ )
1.4
Dominanz
Definition 1.5 (Starke Dominanz). In einem strategsichen Spiel (N, (Ai ), (ui )) wird eine
Aktion ai ∈ Ai von Spieler i ∈ N von einer Aktion a0i ∈ Ai stark dominiert wenn gilt
ui (ai , a−i ) < ui (a0i , a−i ) ∀a−i ∈ A−i .
Eine stark dominierte Aktion ai ∈ Ai ist nie eine Beste-Antwort auf irgendeine Aktionsprofil a−i und ist daher nach Definition 1.2 auch nie eine Nash Aktion von Spieler
i.
Fakt 1.1. Eine stark dominierte Aktion ai von Spieler i ∈ N ist nie eine Nash Aktion von
i.
Wenn wir ein Nash-Gleichgewicht identifizieren wollen, können wir also somit getrost
alle stark dominierten Aktionen eines Spielers i ∈ N von der Menge Ai entfernen.
Beispiel 1.6 (Gefangenen-Dilemma). Für beide Spieler gilt: die Aktion “nicht gestehen” wird von der Aktion “gestehen” dominiert.
gestehen
nicht gestehen
gestehen
(−3, −3)
(−4, 0)
nicht gestehen
(0, −4)
(−1, −1)
Definition 1.6 (Schwache Dominanz). In einem strategsichen Spiel (N, (Ai ), (ui )) wird
eine Aktion ai ∈ Ai von Spieler i ∈ N von einer Aktion a0i ∈ Ai schwach dominiert wenn
gilt
ui (ai , a−i ) ≤ ui (a0i , a−i ) ∀a−i ∈ A−i .
und es gibt ein Aktionsprofil a−i ∈ A−i , so dass
ui (ai , a−i ) < ui (a0i , a−i ).
In einem strikten Nash-Gleichgewicht ist keine Nash Aktion a∗i eines Spielers i ∈ N
schwach dominiert. Dies gilt jedoch nicht für ein schwaches Nash-Gleichgewicht.
1.5
Strikt Kompetitive Spiele
Wir betrachten im Folgenden Zweipersonenspiele, d.h. N = {1, 2}.
Definition 1.7.
gilt:
Ein strategisches Spiel ({1, 2}, (Ai ), (i )) ist strikt kompetitiv, wenn
∀a, b ∈ A :
a 1 b
6
⇔
b 2 a.
Oft werden strikt kompetitive Spiele auch Nullsummen-Spiele genannt: Wenn die
Präferenzrelation 1 von Spieler 1 durch die Payoff Funktion u1 repräsentiert wird, kann
man die Präferenzrelation von Spieler 2 durch u2 = −u1 repräsentieren (u1 + u2 = 0).
Wir sagen, dass Spieler 1 maxminimiert, wenn er seine Aktion wie folgt auswählt:
Assoziere mit jeder Aktion x ∈ A1 von Spieler 1 den minimalen Payoff, den er garantieren
kann (egal wie Spieler 2 seine Auswahl trifft). Wähle unter allen Aktionen x ∈ A1 eine
aus, die diesen Wert maximiert. Formal definieren wir dies wie folgt:
Definition 1.8. Sei ({1, 2}, (Ai ), (ui )) ein strikt kompetitives strategisches Spiel. Die Aktion x∗ ∈ A1 ist ein Maxminimierer von Spieler 1, wenn gilt:
min u1 (x∗ , y) ≥ min u1 (x, y) ∀x ∈ A1 .
y∈A2
y∈A2
Analog ist y∗ ∈ A2 ein Maxminimierer von Spieler 2, wenn gilt:
min u2 (x, y∗ ) ≥ min u2 (x, y) ∀y ∈ A2 .
x∈A1
x∈A1
Intuition: Der Maxminimierer von Spieler i ist eine Aktion, die den Payoff, den Spieler i
garantieren kann, maximiert. Spieler 1 löst das Problem maxx∈A1 miny∈A2 u1 (x, y). Spieler
2 löst das Problem maxy∈A2 minx∈A1 u2 (x, y).
Beispiel 1.7.
Betrachte das folgende strikt kompetitive Zweipersonenspiel.
T
M
B
L
(2, −2)
(2, −2)
(1, −1)
C
(0, 0)
(3, −3)
(2, −2)
R
(1, −1)
(2, −2)
(0, 0)
Der Maxminimierer von Spieler 1 ist M. Die Maxminimierer von Spieler 2 sind L und R.
Die Nash-Gleichgewichte sind (M, L) und (M, R).
Lemma 1.1. Sei ({1, 2}, (Ai ), (ui )) ein strikt kompetitives strategisches Spiel. Dann gilt:
max min u2 (x, y) = − min max u1 (x, y).
y∈A2 x∈A1
y∈A2 x∈A1
Beweis. Es gilt für jede Funktion f : minz (− f (z)) = − maxz f (z). Daher gilt
max min u2 (x, y) = − min (− min u2 (x, y)) = − min max u1 (x, y),
y∈A2 x∈A1
y∈A2
x∈A1
y∈A2 x∈A1
wobei wir in der letzten Gleichung u1 = −u2 ausnutzen.
Der folgende Satz zeigt (u.a.), dass wenn es ein Nash-Gleichgewicht für ein strikt
kompetitives Zweipersonenspiel gibt, dann sind die Nash Aktionen beider Spieler Maxminimierer.
7
Satz 1.1.
Sei G = ({1, 2}, (Ai ), (ui )) ein strikt kompetitives strategisches Spiel.
1. Wenn (x∗ , y∗ ) ein Nash-Gleichgewicht für G ist, so ist x∗ ein Maxminimierer von
Spieler 1, y∗ ein Maxminimierer von Spieler 2 und
max min u1 (x, y) = min max u1 (x, y) = u1 (x∗ , y∗ ).
x∈A1 y∈A2
y∈A2 x∈A1
2. Wenn
max min u1 (x, y) = min max u1 (x, y),
x∈A1 y∈A2
y∈A2 x∈A1
x∗
ein Maxminimierer von Spieler 1 ist und y∗ ein Maxminimierer von Spieler 2 ist,
dann ist (x∗ , y∗ ) ein Nash-Gleichgewicht für G.
Beweis. Wir beweisen zunächst Aussage 1. Sei (x∗ , y∗ ) ein Nash-Gleichgewicht für G.
Dann gilt nach Definition: u2 (x∗ , y∗ ) ≥ u2 (x∗ , y) für alle y ∈ A2 und somit auch u1 (x∗ , y∗ ) ≤
u1 (x∗ , y) für alle y ∈ A2 (da u1 = −u2 ). Somit gilt
u1 (x∗ , y∗ ) ≤ min u1 (x∗ , y) ≤ max min u1 (x, y).
y∈A2
x∈A1 y∈A2
(1)
Analog gilt u1 (x∗ , y∗ ) ≥ u1 (x, y∗ ) für alle x ∈ A1 und somit u1 (x∗ , y∗ ) ≥ miny∈A2 u1 (x, y)
für alle x ∈ A1 . Wir folgern, dass u1 (x∗ , y∗ ) ≥ maxx∈A1 miny∈A2 u1 (x, y), so dass zusammen
mit (1) gelten muss:
u1 (x∗ , y∗ ) = min u1 (x∗ , y) = max min u1 (x, y).
y∈A2
x∈A1 y∈A2
Die letzte Ungleichung bedeutet insbesondere auch, dass
min u1 (x∗ , y) ≥ min u1 (x, y) ∀x ∈ A1 .
y∈A2
y∈A2
D.h., x∗ ist ein Maxminimierer von Spieler 1.
Ein analoges Argument für Spieler 2 zeigt, dass y∗ ein Maxminimierer für Spieler 2
ist. Ferner gilt
u2 (x∗ , y∗ ) = max min u2 (x, y),
y∈A2 x∈A1
was äquivalent ist (siehe Lemma 1.1) zu
u1 (x∗ , y∗ ) = min max u1 (x, y).
y∈A2 x∈A1
Um Aussage 2 zu zeigen, sei
v∗ = max min u1 (x, y) = min max u1 (x, y).
y∈A2 x∈A1
x∈A1 y∈A2
Nach Lemma 1.1 gilt
max min u2 (x, y) = −v∗ .
y∈A2 x∈A1
8
Da x∗ ein Maxminimierer von Spieler 1 ist, gilt für alle y ∈ A2 ,
u1 (x∗ , y) ≥ min u1 (x∗ , y) = max min u1 (x, y) = v∗ ;
y∈A2
x∈A1 y∈A2
und da y∗ ein Maxminimierer von Spieler 2 ist, gilt u2 (x, y∗ ) ≥ −v∗ für alle x ∈ A1 . Setzen
wir y = y∗ in der ersten Ungleichung und x = x∗ in der zweiten Ungleichung, erhalten wir
u1 (x∗ , y∗ ) = v∗ (wobei wir u1 = −u2 ausnutzen). Wir haben daher:
u1 (x∗ , y) ≥ v∗ = u1 (x∗ , y∗ ) ∀y ∈ A2 ,
was äquivalent ist (wir nutzen wieder u1 = −u2 aus) zu
u2 (x∗ , y) ≤ u2 (x∗ , y∗ ) ∀y ∈ A2
und somit ist y∗ eine Beste-Antwort zu x∗ von Spieler 2.
Analog gilt:
u2 (x, y∗ ) ≥ −v∗ = u2 (x∗ , y∗ ) ∀x ∈ A1
⇔
u1 (x, y∗ ) ≤ u1 (x∗ , y∗ ) ∀x ∈ A1 ,
d.h., x∗ ist eine Beste-Antwort auf y∗ von Spieler 1. Nach Definition 1.4 ist (x∗ , y∗ ) somit
ein Nash-Gleichgewicht.
9
Herunterladen