Dynamische Spiele und unvollständige Information Mehrstufige Spiele mit beobachtbaren Handlungen: Rückwärtsinduktion und Teilspielperfektheit Wiederholte Spiele und kooperatives Verhalten Unvollständige Information: Bayes-Nash- und sequentielles Gleichgewicht © K. Morasch 2007 Anwendungen der Spieltheorie in den Wirtschaftswissenschaften 42 Perfekte und vollständige Information Markteintrittsspiel: sequentielles Spiel mit perfekter Information strategische Form extensive Form (0,4) Verzicht A s11 s12 Markteintritt Preiskrieg B s21 s22 s21 (-1,-1) s11 (0,4) (0,4) s22 (1,1) s12 (-1,-1) (1,1) Aufteilung Aspekte: - strategische Form enthält nicht alle relevanten Informationen - unplausibles Nash-Gleichgewicht („leere Drohung“) - Lösung im Spielbaum durch Rückwärtsinduktion © K. Morasch 2007 Anwendungen der Spieltheorie in den Wirtschaftswissenschaften 43 Imperfekte Information Simultanspiel: Handlungen der Mitspieler nicht beobachtbar B s21 (3,3) Aspekte: • Spieler 2 hat imperfekte Information s11 s22 (0,2) s21 (4,0) • „hidden action“ und „moral hazard“: (Verschlechterung gegenüber dem Ergebnis bei perfekter Information) A s12 C © K. Morasch 2007 s22 • Normalform liefert alle relevanten Informationen über das Spiel (1,1) Anwendungen der Spieltheorie in den Wirtschaftswissenschaften 44 Konzept eines „Teilspiels“ Definition: Am Entscheidungsknoten X fängt ein (eigenständiges) Teilspiel an, wenn alle nachfolgenden Knoten mit dem Rest des Spiels nur über diesen Knoten X verbunden sind. s B s21 B s21 A A C Beispiele: Nur im Knoten D bzw. H beginnt ein neues Teilspiel! © K. Morasch 2007 31 E s11 s11 D F C G D H Anwendungen der Spieltheorie in den Wirtschaftswissenschaften 45 Erweiterung des Strategiebegriff bisher: Strategie als einzelne, unbedingte Entscheidung bzw. Handlung jetzt: Strategie als Sequenz von bedingten Aktionen (0,4) 1 0 Beispiel: a 11 (a 21 ) Markteintrittsspiel mit vorgelagerter a221 (-1, -1) Investition in Überkapazität durch 0 a 21 das etablierte Unternehmen a112 (a021 ) („strategic move“: a022 – (1, 1) a222 Investition mit Kosten c) (0, 4-c) (reine) Strategien: a022 s1i = {a1(h1)} mit h1∈{a021, a022} s2j = {a02, a22 } („history“ hl hier irrelevant!) a111 (a022 ) (-1, -1) a222 (1, 1-c) a112 (a022 ) - jeder Spieler hat vier Strategien zur Auswahl! © K. Morasch 2007 a221 Anwendungen der Spieltheorie in den Wirtschaftswissenschaften 46 Teilspielperfektes Gleichgewicht Definition: s* ist ein teilspielperfektes (Nash-)Gleichgewicht, wenn für keinen Spieler in irgendeinem Teilspiel, das an einen beliebigen Knoten des Spielbaums beginnt, ein Anreiz zur Abweichung von s* besteht. Idee: Das Verhalten eines Spielers muss auch außerhalb des betrachteten Gleichgewichtspfads optimal sein – das eliminiert „leere Drohungen“. Bestimmung: Kombination von Rückwärtsinduktion (ausreichend bei perfekter Info) und Nash-Gleichgewicht in Teilspielen mit imperfekter Information [Details siehe Beispiele Markteintrittsspiel, Stackelberglösung und F&E-Investition] © K. Morasch 2007 Anwendungen der Spieltheorie in den Wirtschaftswissenschaften 47 Perfekte Information und stetiger Strategieraum Beispiel: Duopol mit sequentieller Festlegung der Menge (si = xi) - Unternehmen 1 legt Output zuerst verbindlich fest - Unternehmen 2 beobachtet und wählt dann eigene Menge Ansatz: - Spieler 2 macht Strategiewahl von Beobachtung abhängig: s2 = r2(x1) - Spieler 1 berücksichtigt dies bei der Wahl von x1: max π1(x1,r2(x1)) Beachte: Cournot-Nash, d.h. s2 = x2C für alle x1 ist nicht teilspielperfekt! © K. Morasch 2007 x2 r1(x2) Isogewinnkurve: π1(x1,x2) Nash-Gleichgewicht (Lösung für Simultanspiel) StackelbergGleichgewicht r2(x1) (teilspielperfekt) Anwendungen der Spieltheorie in den Wirtschaftswissenschaften x1 48 Mehrstufige Spiele mit beobachtbaren Handlungen Idee: Das Spiel setzt sich aus K+1 „Stufen“ zusammen, wobei eine Stufe k aus einem Teilspiel mit simultaner Wahl von Aktionen aik besteht und alle Spieler die Aktionen auf den k-1 davor liegenden Stufen beobachten können (führt auf „history“ hk = (a0, a1,…, ak-1)). [(i) Beginn mit k = 0 wegen vereinfachter Notation bei Analyse mit Diskontierung; (ii) auch alternierende Aktionen durch einelementige Aktionsmenge „nichts tun“] Beispiele: - Cournot-Duopol (einstufig) - Stackelberg-Duopol (zweistufig, alternierende Aktionen) - strategischer F&E-Wettbewerb (zweistufig, Stufenspiele simultan) - Markteintrittsspiel von Dixit (Aktionsraum von „history“ abhängig) - Rubinstein-Verhandlungsspiel (Stufen nicht unbedingt Zeitpunkte) © K. Morasch 2007 Anwendungen der Spieltheorie in den Wirtschaftswissenschaften 49 Dynamische Spiele Mehrstufige Spiele mit beobachtbaren Handlungen: Rückwärtsinduktion und Teilspielperfektheit Wiederholte Spiele und kooperatives Verhalten Unvollständige Information: Bayes-Nash- und sequentielles Gleichgewicht © K. Morasch 2007 Anwendungen der Spieltheorie in den Wirtschaftswissenschaften 50 Konzept „wiederholtes Spiel“ • Dynamisches Spiel mit stationärer Struktur, d.h. ut (at ) = u(at ) (Sonderfall der mehrstufigen Spiele mit beobachtbaren Aktionen): Gesamtspiel Γ(T) besteht aus Wiederholungen des Stufenspiels. • Handlungen in früheren Perioden wirken sich zwar nicht auf die Auszahlungen im Stufenspiel aus, die Spieler haben aber die Möglichkeit, Aktionen in t vom bisherigen Spielverlauf abhängig zu machen (z.B. Bestrafung bei Abweichung vom kooperativen Verhalten). • Ob andere Lösungen als die Wiederholung der Nash-Gleichgewichte des Stufenspiels realisierbar sind, hängt entscheidend vom Zeithorizont ab (endlich vs. unendlich oft wiederholte Spiele). Daneben spielen aber auch die Struktur des Stufenspiels sowie die Annahmen bezüglich Rationalität und Information eine wichtige Rolle. © K. Morasch 2007 Anwendungen der Spieltheorie in den Wirtschaftswissenschaften 51 Gefangenendilemma als wiederholtes Spiel Gesamtspiel Γ(T) : Stufenspiel: a21 a11 a12 (1, 1) (2, -1) a22 (-1, 2) - Orientierung an „Durchschnittlicher abdiskontierter Auszahlung“ (DAA) 1−δ 1 − δ T +1 (0, 0) Beachte: - Aktionen statt Strategien - Auszahlungen anders normiert (erleichtert Berechnungen) © K. Morasch 2007 - einheitlicher Diskontfaktor δ T ∑δ t ui ( a t ) t=0 Umskalierung (gleiche Präferenzen), um Auswirkungen von Änderungen des Diskontfaktors und des Zeithorizonts leichter zu beurteilen - Vergleiche (i) einstufiges Spiel, (ii) mehrstufiges, aber endliches Spiel und (iii) unendliche Wiederholung Anwendungen der Spieltheorie in den Wirtschaftswissenschaften 52 Endlich vs. unendlich oft wiederholte Spiele • Theorem: Falls sC das einzige Nash-Gleichgewicht eines Stufenspiels Γ(N,S,u), so ist die ständige Wiederholung von sC das einzige teilspielperfekte Gleichgewicht des endlich oft wiederholten Spiels Γ(T) • Folktheorem: In einem unendlich oft wiederholten Spiel Γ(∞, δ ) lässt sich für δ →1 jede zulässige individuell rationale Auszahlungskombination als teilspielperfektes Gleichgewicht realisieren (auch kooperatives Verhalten) individuell rationale Auszahlungen: V C = {u(s)|s∈S, ui ≥ uiC für alle i∈N} mit uiC als Auszahlung, die sich ein Spieler mindestens sichern kann (mit Konfliktpunkt C = (u1C,…, unC ) und pareto-optimalem Punkt P ) u2 Paretogrenze P VC C u1 © K. Morasch 2007 Anwendungen der Spieltheorie in den Wirtschaftswissenschaften 53 Probleme und Erweiterungen • Stochastische Spiele: Strafpfad ohne Abweichung - wie zurück? → Rückkehr zu Kooperation nach festgelegter Strafperiode • Bei Vergeltung auch geringere Auszahlung für Bestrafende → Drohung unglaubwürdig → Lösung: neuverhandlungsstabile Gleichgewichte • Diskontinuität zwischen beschränkter und unendlichem Zeithorizont - Stufenspiel mit mehreren Nash-Gleichgewichten (Folktheorem für Τ → ∞) → Beispiel: a21 a22 a23 a11 (1,1) (-1,2) (-2,-2) - Möglichkeit „irrationaler“ Mitspieler (spielen immer kooperativ) a12 (2,-1) (0,0) (-2,-2) - beschränkte Rationalität („befriedigendes Ergebnis“) a13 (-2,-2) (-2,-2) (-2,-2) © K. Morasch 2007 Anwendungen der Spieltheorie in den Wirtschaftswissenschaften 54 Dynamische Spiele Mehrstufige Spiele mit beobachtbaren Handlungen: Rückwärtsinduktion und Teilspielperfektheit Wiederholte Spiele und kooperatives Verhalten Unvollständige Information: Bayes-Nash- und sequentielles Gleichgewicht © K. Morasch 2007 Anwendungen der Spieltheorie in den Wirtschaftswissenschaften 55 Unvollständige Information (I) Markteintrittsspiel mit unvollständiger Information über Kosten „schwacher“ Monopolist - Mw „starker“ Monopolist - Ms (0, 4) (0,4) s11 s11 s21 (b-1, -1) (b-1, 1) s22 (b, -1) s12 s12 K s21 M s22 (b, 1) K M Annahmen: 0 < b < 1 und Wahrscheinlichkeit für Ms gleich θ Problem: Grundannahme gemeinsames Wissen nicht erfüllt: Welcher Spielbaum relevant? – nicht (direkt) lösbar! © K. Morasch 2007 Anwendungen der Spieltheorie in den Wirtschaftswissenschaften 56 Unvollständige Information (II) „Trick“: Transformation in ein Spiel mit vollständiger Information • Natur legt für jeden Spieler i konkreten Typ ti ∈ Ti mit Ti = {ti1,…, tiZi} fest (konkrete Festlegung nur vom Spieler selbst beobachtbar!) • Mitspieler haben (subjektive) Wahrscheinlichkeitsschätzungen p(t-i |ti ) (Kenntnis des eigenen Typs kann Information über Mitspieler liefern!) • Jeder Typ ti wird als eigenständiger Spieler mit Auszahlungsfunktion ui(ti) = Σt-i p(t-i |ti ) ui(s1(t1),…,sn(tn),t1,…,tn) betrachtet • Ein Bayes‘sches Spiel ist dann durch Γ(N,S,T, π,u) beschrieben (mit T = {T1,…,Tn} und π als Menge der p(t-i |ti ) aller Spieler) und kann in ein Spiel Γ(T, S´,u´) mit vollständiger aber imperfekter Info transformiert werden (mit S´ als Menge der Si(ti) und u´als Menge der ui(ti)) © K. Morasch 2007 Anwendungen der Spieltheorie in den Wirtschaftswissenschaften 57 Unvollständige Information (III ) Markteintrittsspiel: Transformation und Bayes-Nash-Gleichgewicht (0,4) t21 = Mw 1-θ s11 s12 (Mw) s21 (b-1, -1) T1 = K, T2 = {Mw,Ms} π = { p(Mw) = 1−θ, p(Ms) = θ } s22 (b, 1) Gleichgewicht: (0, 4) s11 θ t22 = Ms (N) K © K. Morasch 2007 (Ms) s21 (b-1, 1) s22 (b, -1) s12 M Spiel: Mw : s22 Ms : s21 K: s12 falls (1−θ ) b +θ (b−1) ≥ 0 (d.h. wenn θ ≤ b) s11 sonst Anwendungen der Spieltheorie in den Wirtschaftswissenschaften 58 Bayes-Nash-Gleichgewicht s* = (s1*(t1),…, sn*(tn)) mit si (ti) = (si (ti1),…, si (tiZi)) ist ein Bayes-NashGleichgewicht, wenn ui(si*(ti), s-i*(t-i),ti) ≥ ui(si (ti), s-i*(t-i),ti) für alle i, si , ti Probleme: • optimale Strategiewahl der Mitspieler basiert auf der Berücksichtigung des Verhaltens aller möglichen Typen des Spielers i → obwohl Spieler i seinen Typ ti kennt, muss er sich in seine anderen Typen hineinversetzen (vgl. dazu Übungsaufgabe zum Bayes-Nash-Gleichgewicht mit stetigen Strategien) • erwartete Auszahlungen (und damit die Strategiewahl) sind abhängig von den subjektiven Wahrscheinlichkeitsschätzungen jedes Spielers → nahezu alle Strategiekombinationen als Gleichgewicht rationalisierbar Lösungsansatz: Common-prior-Annahme und Bayes‘sches Updating (ausführliche Diskussion anschließend im Zusammenhang mit Signalspielen) © K. Morasch 2007 Anwendungen der Spieltheorie in den Wirtschaftswissenschaften 59 Sequentielles Gleichgewicht - Beispiel Beispiel 1a: Markteintritt mit nicht-beobachtbarer Technologie extensive Form s11 A s12 s21 (-1,-1) s22 (1,1) s21 (-½,-½) s22 (-1,1) s13 B strategische Form (0,4) s21 s22 s11 (0,4) (0,4) s12 (-1,-1) (1,1) s13 (-½,-½) (-1,1) Problem: Beide Nash-Gleichgewichte sind hier teilspielperfekt! © K. Morasch 2007 Anwendungen der Spieltheorie in den Wirtschaftswissenschaften 60 Sequentielles Gleichgewicht - Konzept Definition: Ein Paar (s, µ) mit Strategien s und Wahrscheinlichkeitsschätzungen µ stellt ein sequentielles Gleichgewicht dar, wenn (i) jede Aktion eines Spielers zu gegebenen s-i und Wahrscheinlichkeitsschätzung µ an jeder Informationsmenge eine optimale Wahl darstellt und (ii) die Wahrscheinlichkeitsschätzungen über das Verhalten der anderen Spieler mit den im weiteren Spielverlauf optimalen Strategien dieser Spieler konsistent sind (insbesondere Anpassung der A-priori-Wahrscheinlichkeiten entsprechender Bayes‘scher Regel) Anwendung auf Beispiel 1a: (s11,s21) ist kein sequentielles Gleichgewicht, da für beliebiges µA der erwartete Nutzen für Spieler 2 bei s22 höher ist (d.h. s21 wird von s22 dominiert) © K. Morasch 2007 Anwendungen der Spieltheorie in den Wirtschaftswissenschaften 61 Grenzen des Konzepts und „Verfeinerungen“ Beispiel 1b: Unplausibles sequentielles Gleichgewicht (0,4) s11 A s12 s13 B s21 (-1,-1) s22 (1,1) s21 (-½, 2) s22 © K. Morasch 2007 Idee: geänderte Auszahlung 2 für Monopolist bei (s13, s21) ⇒ (s11, s21, µA) nun sequentielles Gleichgewicht falls µA < 1/3 Menge aller Gleichgewichte: {(s12, s22, µA =1), (s11, s21, µA < 1/3 ), (s11, p(s21 ) ≥ ½, µA = 1/3 ) } aber: µA ≤ 1/3 unplausibel, da s13 von s11 strikt dominiert → Markteintritt nur mit s12 sinnvoll! (-1,1) Anwendungen der Spieltheorie in den Wirtschaftswissenschaften 62 Unvollständige Information und Signalspiele Beispiel 2: Unvollständige Information über Markteintreter ts 1-θ Idee: potentieller Neueintreter kann schwach (tw) oder stark (ts) sein s21 (-1,-1) T1 = {ts,tw}, T2 = M π = {µ(ts) = θ , µ(tw) = 1−θ } s22 (1,1) als A-priori-Wahrscheinlichkeiten s21 (-½,2) Signal durch Markteintritt: - Trennungs-Gl.gew.: µ(ts |s12) = 1 s11 s12 θ (0,4) A s12 B tw s22 (-1,1) s11 (0,4) © K. Morasch 2007 - Pooling- Gl.gew.: µ(ts |s12) ≤ 1/3 Verfeinerung: Monopolist schließt aus, dass Neueintreter dominierte Strategie spielt Anwendungen der Spieltheorie in den Wirtschaftswissenschaften 63