Kapitel 11: Dynamische Spiele Bezeichnungen KAP 11. Dynamische Spiele Informationsmengen; vollkommene u. unvollkommene Informat. Spiele mit Zufallszügen ( Natur“ als Spieler) ” Definition: Spielbaum, Spiel in extensiver Form Normalform und extensive Form Strategiebegriff Nash-Gleichgewichte (Transformation in Normalform) Ein Markteintrittsspiel I Der Punkt, an dem ein Spieler wählt, heißt Entscheidungsknoten I Der erste Knoten heißt Anfangsknoten oder root I Verbindungen zwischen Knoten heißen Zweige I Jedem Zweig ist eine Aktion zugeordnet I Die Knoten am Ende heißen Endknoten I Jedem Endknoten ist ein Nutzenprofil zugeordnet, das den Nutzen jedes Spielers beschreibt, wenn das Spiel an diesem Knoten endet 1 / 28 3 / 28 Beispiel für einen Spielbaum Information der Spieler SP1 I a b SP2 w SP2 y x z SP1 SP1 (3, 2) (1, 0) c (0, 5) I I I I I Ein Spiel, bei dem alle Spieler alle vorherigen Züge beobachten können heißt: Spiel unter vollkommener Information (perfect information) I Ein Spiel, in dem mindest. ein SP nicht alle vorherig. Züge beobachten kann heißt: Spiel unter unvollkommener Information (imperfect information) I Was ein Spieler beobachten kann, kennzeichnen wir durch Informationsmengen I Eine Informationsmenge umfasst die Knoten, die ein Spieler NICHT voneinander unterscheiden kann Beachte Unterschied: Vollkommene (perfect) und vollständige (complete) Info.: I Vollkommene Information (perfect information): Alle Spieler wissen überall, an welchem Entscheid.Knoten sie sich befinden d e (3, 6) (2, 1) f (1, 1) Zuerst wählt SP1 zwischen a und b Wenn SP1 a gewählt hat, wählt SP2 zwischen w und x Wenn SP1 b gewählt hat, wählt SP2 zwischen y und z usw. Der Spielpfad b → y → d ergibt den Nutzen 3 für SP1 und 6 für SP2 usw. (keine Unsicherheit über vorhergehende (oder gleichzeitige) Züge der GegenSP) I Vollständige Information (complete information): Die Nutzenfunktionen (eigene u. die der GegenSP) sind den Spielern bekannt (keine Unsicherheit über Nutzen der GegenSP) (Vorläufig werden nur SPe mit vollständiger (complete) Informat. behandelt) 2 / 28 4 / 28 Ein Spiel unter unvollkommener Information Ein inkorrekter Spielbaum SP1 SP1 a a b SP2 w (3, 2) SP2 y x c (0, 5) I I z w SP1 (1, 0) d c (3, 6) (2, 1) d SP2 I I I I I e d f (3, 6) (2, 1) (1, 1) c und e sowie d und f seien unterschiedliche Aktionen Damit der Baum einen Sinn macht, muss SP1 wissen, ob er zwischen c und d oder zwischen e und f wählen muss Also muss er wissen, an welchem Knoten er sich befindet Also ist die Informationsmenge (- -) nicht korrekt Allgemein: Ein Spiel ist nur dann wohl-definiert, wenn ein Spieler an jedem Knoten einer Informationsmenge die gleichen Aktionen hat 7 / 28 Spieler sollen vollkommenes Gedächtnis haben I Ein Spiel unter vollkommener Information ist also ein Spiel, I in dem jede Informationsmenge genau einen Knoten enthält. Wir nehmen an, dass sich jeder SP an alle vorherigen Züge erinnert Alle Spieler haben vollkommenes Gedächtnis ( perfect replay“) ” Unvollkommenes Gedächtnis lässt sich mit Informationsmengen darstellen: Das Eingangsbeispiel ist ein Spiel unter vollkommener Information SP1 a Das vorhergehende Bsp. ist ein Spiel unter unvollkommener Information b SP2 Im Folgenden nehmen wir an, dass ein Spieler w seine möglichen Aktionen kennt I c (0, 5) Blau umrahmt (- -): Eine Informationsmenge für SP1 mit zwei Knoten: SP1 kann nicht beobachten, ob SP2 y oder z gewählt hat. D.h. SP1 weiß nicht, an welchem Knoten er sich befindet (ob SP2 vorher y oder z gewählt hat) Eine Informationsmenge wird mit dem zugehörigen SP gekennzeichnet nicht mit den Knoten in der Informationsmenge z SP1 (1, 0) (1, 1) Von allen Knoten einer Info-Menge müssen die gleichen Aktionen ausgehen I y x (3, 2) 5 / 28 I b SP2 SP2 y x z SP1 Also müssen von jedem Knoten innerhalb einer Informationsmenge (3, 2) die gleichen Aktionen abzweigen Nochmal: I Von allen Knoten einer Informationsmenge ... ... müssen die gleichen Aktionen ausgehen I 6 / 28 SP1 (1, 0) a b (0, 5) (3, 6) (2, 1) e f (1, 1) Hier weiß SP1 nicht, ob er schon gezogen hat oder nicht! (Es ist ein korrekter Spielbaum, wir werden dies allerdings nicht behandeln) 8 / 28 Spiele mit Zufallszügen Definition Spielbaum“ ” Ein Spielbaum ist eine Menge von Knoten und Zweigen mit den Eigenschaften: I I Viele dynamische Spiele unterliegen zufälligen Einflüssen z.B. Poker, Würfelspiele, ... Solche exogene Unsicherheit kann man durch einen I Es gibt genau einen Anfangsknoten I Jeder Zweig verbindet genau zwei Knoten I Jeder Knoten hat genau einen Vorgängerknoten ( Abstammknoten“, ” Elternknoten“) ” (verhindert insbes. geschlossene Pfade) I Jeder Pfad von Zweigen endet in einem Endknoten zusätzlichen Spieler darstellen I Diesen Spieler nennt man Natur Natur wählt ihre Aktionen mit exogen gegebener Wahrscheinlichkeit Häufig (aber nicht immer) zieht Natur am Anfangsknoten 9 / 28 Ein Spiel mit Zufallszug Definition Spiel in extensiver Form“ ” Ein Spiel in extensiver Form ohne Zufallszüge umfasst: N p I eine Menge von Spielern einen Spielbaum I eine Abbildung, die jedem Knoten genau einen Spieler zuordnet I eine Abbildung, die jedem Zweig eine Aktion zuordnet I für jeden Spieler eine Zusammenfassung seiner Knoten in Info-Mengen wobei jedem Knoten einer Info-Menge die gleiche Menge möglicher Aktionen folgt I für jeden SP eine Nutzenfunktion, die jedem Endknoten eine Zahl zuordnet Bei einem Spiel in extensiver Form mit Zufallszügen I gibt es eine zusätzlichen Spieler Natur“ ” I der keine Nutzenfunktion hat I und dessen Züge mit einer gegebenen Wkts-Verteilung über die am entsprechenden Knoten verfügbaren Aktionen erfolgen Ein Spiel in extensiver Form heißt endlich, falls die Menge der Spieler und die Menge der Aktionen endlich ist; andernfalls heißt es unendlich 1−p I SP1 a (3, 2) a b (1, 0) b SP2 w (0, 5) SP2 x y (3, 6) (2, 1) z (1, 1) Bei diesem Spiel: I I 11 / 28 Natur wählt links“ mit Wkt. p und rechts“ mit Wkt. 1 − p ” ” SP1 kann den Zug von Natur nicht beobachten aber SP2 kann 10 / 28 12 / 28 Normalform → extensive Form Abstrakter: Strategie in extensiven Spielen Def.: Gegeben ein Spiel in extensiver Form. Eine (reine) Strategie für Spieler i spezifiziert für jede seiner Info-Mengen eine an dieser Info-Menge verfügbare Aktion. Jedes Spiel in Normalform kann ... ... als Spiel in extensiver Form dargestellt werden I I denn die Unsicherheit über Aktionen der Gegenspieler in der Normalform lässt sich mittels Info-Mengen abbilden Beispiel: I – der Spieler legt vor dem Spiel seine Aktionen für alle Info-Mengen fest – Die Ausführung der Strategie überlässt er dann einem Computer SP1 a a b x 4, 3 0, 5 y 2, 6 3, 5 → Konkrete Strategienprofile münden in einem Spielpfad. Beispiel: b SP1 SP2 y x (4, 3) I Interpretation: x (2, 6) (0, 5) y a SP2 w (3, 1) Kann man auch extensive Spiele als Normalform-Spiele darstellen? Ja, aber die Antwort erfordert, dass wir uns klar machen, was dann die Strategien der Spieler (und ihre Strategieräume) sind. b Eine Strategie beschreibt das hypothetische Verhalten. SP2 z y x (4, 3) Spielt SP1 s1 = b und SP2 s2 = (x, y), so ergibt sich der Spielpfad b → y (2, 6) (0, 5) Wenn sich jeder Spieler auf eine Strategie festgelegt hat, entsteht der Spielpfad (der tatsächliche Spielverlauf) (3, 1) 15 / 28 13 / 28 Strategien in extensiven Spielen Beispiel: Extensive Form → Normalform SP1 SP1 a SP2 w (4, 3) I I I I a b x y (2, 6) (0, 5) SP2 w SP2 z (4, 3) (3, 1) I Die Strategien von SP1 sind a und b X Wie sehen die Strategien von SP2 aus? Strategien von SP2 sind von der Art: Wenn ich im li. Knoten bin (wenn SP1 a zieht), dann ziehe ich x o (x, z) Wenn ich im re. Knoten bin (wenn SP1 b zieht), dann ziehe ich z I I D.h. wir können eine Strategie von SP2 in folgender Form darstellen: Damit: SP2 hat insges. vier Strategien: {(w, y), (w, z), (x, y), (x, z)} x y (2, 6) (0, 5) SP2 z → a b (w,y ) 4, 3 0, 5 (w,z) 4, 3 3, 1 (x,y ) 2, 6 0, 5 (x,z) 2, 6 3, 1 (3, 1) Die Nutzeneinträge in den Matrixzellen entsprechen den Nutzen, die aus den entsprechenden Spielpfaden resultieren Beachte: Die Normalform des Spiels hat ein eindeutiges Nash-GG a, (x, y) Das Nash-GG ist das Strat.Profil a, (x, y) , der resultierende Spielpfad ist (a, x) I s2 = (Aktion am li. Knoten, Aktion am re. Knoten) I b 14 / 28 Man bekommt das Nash-GG auch auf folgende Weise (Rückwärtsinduktion!) Wenn SP2 rational ist, dann spielt er an seinem linken Knoten x und an seinem rechten Knoten y Wenn SP1 rational ist u. weiß, dass SP2 rational ist, spielt er a, denn er bekommt 2, wenn er a spielt [Nutzen aus dem Pfad (a, x)] 0, wenn er b spielt [Nutzen aus dem Pfad (b, y)] 16 / 28 Formale Def.: Strategie in extensiven Spielen“ ”(i) (i) I I I Beispiel SP1 Sei Ji = {J1 , . . . , JK } die Menge der Informationsmengen von SPi (i) Ak Sei die Menge der Aktionen, die SPi an der Info.Menge Verfügung hat SK Sei Ai = k=1 A(i) die Menge aller Aktionen von SPi (i) Jk 0 a zur b SP2 2 w Def.: Eine (reine) Strategie si für Spieler i ist eine Abbildung y x (1, 0) c mit der Eigenschaft I SP1 d (0, 5) (i) si (Jk ) ∈ Ak I z 3 (3, 2) si : Ji 7→ Ai (i) SP2 1 I Anmerkung: Die formale Def. sieht komplizierter aus als sie ist. Sie formalisiert lediglich das, was wir schon in Worten besagt haben: I Eine (reine) Strategie für Spieler i spezifiziert für jede seiner Info-Mengen eine an dieser Info-Menge verfügbare Aktion. Punkt ist: Eine Strategie von SPi muss (vor dem Spiel) in jeder Situation, in der SPi am Zug sein könnte, festlegen, welche Aktion er dann wählt. 3 c (3, 6) (2, 1) d (1, 1) 1 und ; 2 SP2 hat die beiden Info-Mengen 1 2 Darstellung der Strategien von SP2 als (Aktion in , Aktion in ) ergibt folgende Strategien von SP2: {(w, y), (w, z), (x, y), (x, z)} 0 und ; 3 SP1 hat die beiden Info-Mengen 0 3 Darstellung der Strategien von SP1 als (Aktion in , Aktion in ) ergibt folgende Strategien von SP1: {(a, c), (a, d), (b, c), (b, d)} I Dass SP1 die Strategien (a, c), (a, d) hat, obwohl von a die Strategien c und d nicht erreichbar sind, ist kein Fehler! (Eine Strat. legt für jede Info-Menge die Aktion fest) 17 / 28 19 / 28 Auch wenn eine Info-Menge bei manchen Spielpfaden gar nicht erreicht wird, ... Transformation des Beispiels in Normalform SP1 0 a ... muss eine Strategie festlegen, welche Aktion zu wählen ist Beispiel: SP1 a b 2 x (1, 1) w (−1, −1) (3, 2) Mögl. Aktionen SP2 an der Info-Menge : x, y ⇒ Strategien von SP2: {x, y} 2 müssen in Normalform auch die Strategienpaare (a, x), (a, y) betrachtet werden: I a b (1, 0) c (0, 5) I y 0, 2 −1, −1 2 y x z SP1 3 1 Mögl. Aktionen SP1 an der Info-Menge : a,b ⇒ Strategien von SP1: {a, b} SP2 y Da eine Strategie für Spieler i für jede seiner Info-Mengen eine an dieser Info-Menge verfügbare Aktion spezifiziert, x 0, 2 1, 1 SP2 1 Beide Spieler haben eine (einzige) Info-Menge, (die jeweils aus einem einzigen Knoten besteht) 1 (0, 2) b SP2 I Der Nutzen der Spieler resultiert aus dem Spielpfad, der bei Anwendung der Strategienpaare entsteht Beide Strat.Paare (a, x) u. (a, y) führen zu SPpfad a 18 / 28 d → 3 c (3, 6) (2, 1) (a,c) (a,d) (b,c) (b,d) (w,y ) 3, 2 3, 2 0, 5 , (w,z) 3, 2 3, 2 , , (x,y ) 1, 0 1, 0 , , (x,z) 1, 0 1, 0 , 1, 1 d (1, 1) Übungsaufgabe: Normalform fertig ausfüllen und Nash-GGe ermitteln Wenn man (a, c), (a, d) nicht als Strategien von SP1 betrachtet, ... ist die Reduktion auf Normalform nicht möglich Beachte: Normalform ⇐⇒ Spieler legen sich simultan und unabhängig voneinander auf eine Strategie fest Eine (Normalform-) Strategie muss vor dem Spiel festlegen, welche Aktion die Spieler wählen, wenn sie am Zug sind. 20 / 28 Extensive Form und Normalform I I Wiederholung Beispiel 3 SP1 Offenbar: Jedes Spiel in extensiver Form hat eine eindeutige Entsprechung als Normalform-Spiel 0 a b SP2 Anmerkung: In umgekehrter Richtung ist auch Existenz, aber nicht Eindeutigkeit gegeben: Das gleiche Normalform-Spiel kann mehrere Entsprechungen als Spiel in extensiver Form haben → an Beispiel 2 (unten) verdeutlichen w 2 y x 3 Damit können wir sämtliche Konzepte aus der Normalform-Theorie auf Spiele in extensiver Form anwenden: (3, 2) (1, 0) – Dominanz Das 1. 2. 3. 4. 5. 6. – Beste Antwort – ... Insbesondere überträgt sich das Nash-GG-Konzept als Lösungskonzept Def.: Ein Nash-Gleichgewicht eines Spiels in extensiver Form ist ein NashGleichgewicht in der dem extensiven Spiel entsprechenden Normalform 21 / 28 Wiederholung der Beispiele Beispiel 1: I SP2 w b y x (4, 3) SP2 z (2, 6) (0, 5) → a b (w,y ) 4, 3 0, 5 (w,z) 4, 3 3, 1 (x,y ) 2, 6 0, 5 (x,z) 2, 6 3, 1 SP1 I (0, 2) x SP2 y (1, 1) (−1, −1) → a b y 0, 2 −1, −1 a ← (0, 2) (1, 1) Spiel hat 6 Nash-GGe (a, c), (w, y) mit Spielpfad: a → w (a, c), (w, z) mit Spielpfad: a → w (a, d), (w, y) mit Spielpfad: a → w (a, c), (w, z) mit Spielpfad: a → w (b, d), (w, y) mit Spielpfad: b → y → d (b, d), (x, y) mit Spielpfad: b → y → d 23 / 28 b y Können wir also einfach – wie in diesen Beispielen – die Nash-Gleichgewichte der Normalform bestimmen Bei der Reduktion auf Normalform entstehen oft multiple Nash-Gleichgewichte, da sie unglaubwürdige Drohungen enthalten SP2 x d von denen einige nicht plausibel sind, SP1 x 0, 2 1, 1 (3, 6)(2, 1) (x,z) 1, 0 1, 0 2, 1 1, 1 So einfach ist es leider nicht, denn (3, 1) b c (x,y ) 1, 0 1, 0 0, 5 3, 6 und das war’s? Das Spiel hat nur ein Nash-GG, nämlich a, (x, y) ; Spielpfad ist: a → x Beispiel 2: Auch: a d (w,z) 3, 2 3, 2 2, 1 1, 1 Extensive Form und Nash-GG SP1 a c (0, 5) – Strategie, Strategienprofil (der Gegenspieler) I (a,c) → (a,d) z (b,c) (b,d) 3 SP1 SP2 1 (w,y ) 3, 2 3, 2 0, 5 3, 6 x y (0, 2) (1, 1) (−1, −1) Das li. Spiel hat 2 Nash-GGe (a, y) (Spielpfad: a) u. (b, x) (Spielpfad: b → x) Das re. Spiel hat die gleichen Nash-GGe, Spielpfade sind aber: a → y, b → x 22 / 28 I Daher werden wir das Nash-Konzept anpassen (verfeinern) I Das folgende Beispiel Markteintritt“ demonstriert eine solche Situation: ” Ein Spiel in extensiver Form, bei dessen Reduktion auf Normalform zwei Nash-Gleichgewichte entstehen von denen eines eine unglaubwürdige Drohung enthält 24 / 28 Markteintrittsspiel Markteintrittsspiel – NashGG (ne, a) unplausibel E E e ne M (0, 2) M (0, 2) a t I Zwei Spieler: E = Eindringling, M = Monopolist I E kann in den Markt eintreten (e) oder nicht (ne) I Bei Markteintritt kann M agressiv sein (a) oder den Markt teilen (t) I Normalform: t 0, 2 1, 1 a 0, 2 −1, −1 I t 0, 2 1, 1 (−1, −1) (1, 1) I ne e a t (−1, −1) (1, 1) ne e e ne a 0, 2 −1, −1 E kann sich sagen: Wenn ich erstmal e gewählt habe, dann ist es für M besser, den Markt zu teilen (1 > −1) M kann noch so viel drohen – letztlich wird er’s nicht durchziehen Also sollte ich eintreten Das Nash-GG (ne, a) ist unplausibel, denn es basiert auf einer unglaubwürdigen Drohung seitens des Monopolisten 27 / 28 25 / 28 E Markteintrittsspiel – NashGGe E e ne (0, 2) Markteintrittsspiel – Schlussfolgerung M t (1, 1) e ne a (−1, −1) ne e t 0, 2 1, 1 a (0, 2) 0, 2 −1, −1 M t (1, 1) ne e a t 0, 2 1, 1 (−1, −1) a X X 0, 2 X −1, −1 I I I I I Wir würden also erwarten, dass E erkennt, ... dass a eine unglaubwürdige Drohung darstellt und e somit in den Markt eintritt ⇒ (e, t) ist plausibler Spielausgang Beachte: (e, t) ist auch ein Nash-GG I Nash-GGe ohne unglaubwürdige Drohungen nennt man Normalform zeigt: Das Spiel hat zwei Nash-GGe: (ne, a) und (e, t) Betrachte das Nash-GG (ne, a): Die Strategie a von M ist eine Drohung an E: Wenn Du eintrittst, dann werde ich aggressiv reagieren!“ ” Wenn E dieser Drohung glaubt, ... sollte er in der Tat ne wählen Aber: Ist diese Drohung wirklich überzeugend? teilspielperfekt I I 26 / 28 Solche Nash-GGe lassen sich durch eine Rückwärts-Induktion identifizieren Dabei werden nämlich Strategien, die ex ante als optimal erscheinen, aber sich im Verlauf des Spiels als suboptimal erweisen, eliminiert ⇒ nä. Kapitel 28 / 28