L ETZTE Ä NDERUNG : 15. N OVEMBER 2006 Vorlesung: Einführung in die Spieltheorie WS 2006/2007 2. Vorlesung 24. Oktober 2006 1.3 Guido Schäfer Beste-Antwort Funktion Notation: ◦ Definiere A−i := × j∈N\{i} A j . Definition 1.3 (Beste-Antwort Funktion). Für jedes Profil a−i ∈ A−i , definiere die Beste-Antwort Funktion (engl. best-response) Bi : A−i → 2Ai als Bi (a−i ) := {ai ∈ Ai : (a−i , a0i ) i (a−i , ai ) ∀a0i ∈ Ai }. Mit dieser Definition ergibt sich folgende alternative Definition eines NashGleichgewichts. Definition 1.4. Ein Aktionsprofil a∗ ∈ A ist ein Nash-Gleichgewicht für ein strategisches Spiel (N, (Ai ), i ) genau dann, wenn gilt a∗i ∈ Bi (a∗−i ) ∀i ∈ N. Daraus ergibt sich ein Algorithmus zur Berechnung eines Nash-Gleichgewichts: 1. Berechne die Beste-Antwort Funtionen Bi (·) für alle i ∈ N. 2. Bestimme ein Aktionsprofil a∗ , so dass a∗i ∈ Bi (a∗−i ). Falls alle Beste-Antwort Funktionen einelementige Mengen sind, reduziert sich obiger Algorithmus auf das Lösen eines Gleichungssystems mit n Gleichungen und n Unbekannten. Beispiel 1.5 (Nash-Gleichgewicht via Beste-Antwort Funktion). Wir können das NashGleichgewicht mittels Berechnung der Beste-Antwort Funktion für das folgende Zweipersonenspiel wie folgt bestimmen. Markiere die Beste-Antwort Aktionen eines Spielers mit einem Stern ∗ . Ein Nash-Gleichgewicht ist dann ein Aktionsprofil, in dem jede Aktion mit einem Stern versehen ist. L C R ∗ ∗ ∗ T (1, 2 ) (2 , 1) (1 , 0) M (2∗ , 1∗ ) (0, 1∗ ) (0, 0) B (0, 1) (0, 0) 5 (1∗ , 2∗ ) 1.4 Dominanz Definition 1.5 (Starke Dominanz). In einem strategsichen Spiel (N, (Ai ), (ui )) wird eine Aktion ai ∈ Ai von Spieler i ∈ N von einer Aktion a0i ∈ Ai stark dominiert wenn gilt ui (ai , a−i ) < ui (a0i , a−i ) ∀a−i ∈ A−i . Eine stark dominierte Aktion ai ∈ Ai ist nie eine Beste-Antwort auf irgendeine Aktionsprofil a−i und ist daher nach Definition 1.2 auch nie eine Nash Aktion von Spieler i. Fakt 1.1. Eine stark dominierte Aktion ai von Spieler i ∈ N ist nie eine Nash Aktion von i. Wenn wir ein Nash-Gleichgewicht identifizieren wollen, können wir also somit getrost alle stark dominierten Aktionen eines Spielers i ∈ N von der Menge Ai entfernen. Beispiel 1.6 (Gefangenen-Dilemma). Für beide Spieler gilt: die Aktion “nicht gestehen” wird von der Aktion “gestehen” dominiert. gestehen nicht gestehen gestehen (−3, −3) (−4, 0) nicht gestehen (0, −4) (−1, −1) Definition 1.6 (Schwache Dominanz). In einem strategsichen Spiel (N, (Ai ), (ui )) wird eine Aktion ai ∈ Ai von Spieler i ∈ N von einer Aktion a0i ∈ Ai schwach dominiert wenn gilt ui (ai , a−i ) ≤ ui (a0i , a−i ) ∀a−i ∈ A−i . und es gibt ein Aktionsprofil a−i ∈ A−i , so dass ui (ai , a−i ) < ui (a0i , a−i ). In einem strikten Nash-Gleichgewicht ist keine Nash Aktion a∗i eines Spielers i ∈ N schwach dominiert. Dies gilt jedoch nicht für ein schwaches Nash-Gleichgewicht. 1.5 Strikt Kompetitive Spiele Wir betrachten im Folgenden Zweipersonenspiele, d.h. N = {1, 2}. Definition 1.7. gilt: Ein strategisches Spiel ({1, 2}, (Ai ), (i )) ist strikt kompetitiv, wenn ∀a, b ∈ A : a 1 b 6 ⇔ b 2 a. Oft werden strikt kompetitive Spiele auch Nullsummen-Spiele genannt: Wenn die Präferenzrelation 1 von Spieler 1 durch die Payoff Funktion u1 repräsentiert wird, kann man die Präferenzrelation von Spieler 2 durch u2 = −u1 repräsentieren (u1 + u2 = 0). Wir sagen, dass Spieler 1 maxminimiert, wenn er seine Aktion wie folgt auswählt: Assoziere mit jeder Aktion x ∈ A1 von Spieler 1 den minimalen Payoff, den er garantieren kann (egal wie Spieler 2 seine Auswahl trifft). Wähle unter allen Aktionen x ∈ A1 eine aus, die diesen Wert maximiert. Formal definieren wir dies wie folgt: Definition 1.8. Sei ({1, 2}, (Ai ), (ui )) ein strikt kompetitives strategisches Spiel. Die Aktion x∗ ∈ A1 ist ein Maxminimierer von Spieler 1, wenn gilt: min u1 (x∗ , y) ≥ min u1 (x, y) ∀x ∈ A1 . y∈A2 y∈A2 Analog ist y∗ ∈ A2 ein Maxminimierer von Spieler 2, wenn gilt: min u2 (x, y∗ ) ≥ min u2 (x, y) ∀y ∈ A2 . x∈A1 x∈A1 Intuition: Der Maxminimierer von Spieler i ist eine Aktion, die den Payoff, den Spieler i garantieren kann, maximiert. Spieler 1 löst das Problem maxx∈A1 miny∈A2 u1 (x, y). Spieler 2 löst das Problem maxy∈A2 minx∈A1 u2 (x, y). Beispiel 1.7. Betrachte das folgende strikt kompetitive Zweipersonenspiel. T M B L (2, −2) (2, −2) (1, −1) C (0, 0) (3, −3) (2, −2) R (1, −1) (2, −2) (0, 0) Der Maxminimierer von Spieler 1 ist M. Die Maxminimierer von Spieler 2 sind L und R. Die Nash-Gleichgewichte sind (M, L) und (M, R). Lemma 1.1. Sei ({1, 2}, (Ai ), (ui )) ein strikt kompetitives strategisches Spiel. Dann gilt: max min u2 (x, y) = − min max u1 (x, y). y∈A2 x∈A1 y∈A2 x∈A1 Beweis. Es gilt für jede Funktion f : minz (− f (z)) = − maxz f (z). Daher gilt max min u2 (x, y) = − min (− min u2 (x, y)) = − min max u1 (x, y), y∈A2 x∈A1 y∈A2 x∈A1 y∈A2 x∈A1 wobei wir in der letzten Gleichung u1 = −u2 ausnutzen. Der folgende Satz zeigt (u.a.), dass wenn es ein Nash-Gleichgewicht für ein strikt kompetitives Zweipersonenspiel gibt, dann sind die Nash Aktionen beider Spieler Maxminimierer. 7 Satz 1.1. Sei G = ({1, 2}, (Ai ), (ui )) ein strikt kompetitives strategisches Spiel. 1. Wenn (x∗ , y∗ ) ein Nash-Gleichgewicht für G ist, so ist x∗ ein Maxminimierer von Spieler 1, y∗ ein Maxminimierer von Spieler 2 und max min u1 (x, y) = min max u1 (x, y) = u1 (x∗ , y∗ ). x∈A1 y∈A2 y∈A2 x∈A1 2. Wenn max min u1 (x, y) = min max u1 (x, y), x∈A1 y∈A2 y∈A2 x∈A1 x∗ ein Maxminimierer von Spieler 1 ist und y∗ ein Maxminimierer von Spieler 2 ist, dann ist (x∗ , y∗ ) ein Nash-Gleichgewicht für G. Beweis. Wir beweisen zunächst Aussage 1. Sei (x∗ , y∗ ) ein Nash-Gleichgewicht für G. Dann gilt nach Definition: u2 (x∗ , y∗ ) ≥ u2 (x∗ , y) für alle y ∈ A2 und somit auch u1 (x∗ , y∗ ) ≤ u1 (x∗ , y) für alle y ∈ A2 (da u1 = −u2 ). Somit gilt u1 (x∗ , y∗ ) ≤ min u1 (x∗ , y) ≤ max min u1 (x, y). y∈A2 x∈A1 y∈A2 (1) Analog gilt u1 (x∗ , y∗ ) ≥ u1 (x, y∗ ) für alle x ∈ A1 und somit u1 (x∗ , y∗ ) ≥ miny∈A2 u1 (x, y) für alle x ∈ A1 . Wir folgern, dass u1 (x∗ , y∗ ) ≥ maxx∈A1 miny∈A2 u1 (x, y), so dass zusammen mit (1) gelten muss: u1 (x∗ , y∗ ) = min u1 (x∗ , y) = max min u1 (x, y). y∈A2 x∈A1 y∈A2 Die letzte Ungleichung bedeutet insbesondere auch, dass min u1 (x∗ , y) ≥ min u1 (x, y) ∀x ∈ A1 . y∈A2 y∈A2 D.h., x∗ ist ein Maxminimierer von Spieler 1. Ein analoges Argument für Spieler 2 zeigt, dass y∗ ein Maxminimierer für Spieler 2 ist. Ferner gilt u2 (x∗ , y∗ ) = max min u2 (x, y), y∈A2 x∈A1 was äquivalent ist (siehe Lemma 1.1) zu u1 (x∗ , y∗ ) = min max u1 (x, y). y∈A2 x∈A1 Um Aussage 2 zu zeigen, sei v∗ = max min u1 (x, y) = min max u1 (x, y). y∈A2 x∈A1 x∈A1 y∈A2 Nach Lemma 1.1 gilt max min u2 (x, y) = −v∗ . y∈A2 x∈A1 8 Da x∗ ein Maxminimierer von Spieler 1 ist, gilt für alle y ∈ A2 , u1 (x∗ , y) ≥ min u1 (x∗ , y) = max min u1 (x, y) = v∗ ; y∈A2 x∈A1 y∈A2 und da y∗ ein Maxminimierer von Spieler 2 ist, gilt u2 (x, y∗ ) ≥ −v∗ für alle x ∈ A1 . Setzen wir y = y∗ in der ersten Ungleichung und x = x∗ in der zweiten Ungleichung, erhalten wir u1 (x∗ , y∗ ) = v∗ (wobei wir u1 = −u2 ausnutzen). Wir haben daher: u1 (x∗ , y) ≥ v∗ = u1 (x∗ , y∗ ) ∀y ∈ A2 , was äquivalent ist (wir nutzen wieder u1 = −u2 aus) zu u2 (x∗ , y) ≤ u2 (x∗ , y∗ ) ∀y ∈ A2 und somit ist y∗ eine Beste-Antwort zu x∗ von Spieler 2. Analog gilt: u2 (x, y∗ ) ≥ −v∗ = u2 (x∗ , y∗ ) ∀x ∈ A1 ⇔ u1 (x, y∗ ) ≤ u1 (x∗ , y∗ ) ∀x ∈ A1 , d.h., x∗ ist eine Beste-Antwort auf y∗ von Spieler 1. Nach Definition 1.4 ist (x∗ , y∗ ) somit ein Nash-Gleichgewicht. 9