Spieltheorie: Wintersemester 2001/2002 IV: Dynamische Spiele bei unvollständiger Information Dr. Achim Wambach 4.1 Dr. Achim Wambach, Spieltheorie Sequentielle Rationalität: Motivation R 1 Beispiel (Selten, 1975): 1 3 M L 2 l r 2 1 r 0 1 0 0 0 2 l 1 l 2 r L 2, 2, 11 0, 0, 00 M 0, 0, 22 0, 0, 11 R 1, 1, 33 1, 1, 33 Dr. Achim Wambach, Spieltheorie Ist (R, r) ein plausibles GG? 4.2 Sequentielle Rationalität: Definition Beachte: • (R, r) ist ein Nash-GG, sogar ein TSPN-GG. • Hier: Fortsetzungsspiele (an einer Informationsmenge), während TSPN Teilspiele (an einer einelementigen Info-menge) betrachtet. Bedingung 1: Der Spieler, der an einer Informationsmenge am Zuge ist, hat einen Belief (Einschätzung) darüber, welcher Knoten in dieser Informationsmenge erreicht wurde. Bedingung 2: Die Spieler verhalten sich sequentiell rational, wenn sie an jeder Informationsmenge Aktionen wählen, die optimal sind gegeben die Beliefs und die (Fortsetzungs-)Strategien der anderen Spieler. Anmerkungen: • Ähnlich wie Teilspielperfektheit gilt diese Bedingung auch an Informationsmengen, die nicht auf dem Gleichgewichtspfad liegen. • (R, r) ist nicht sequentiell rational. 4.3 Dr. Achim Wambach, Spieltheorie Beliefs • Wie werden Beliefs bestimmt? Bedingung 3: Entlang des Gleichgewichtspfads werden Beliefs mit Hilfe von Bayes‘ Regel und den Strategien der Spieler bestimmt. Beispiele: - Spiel S.4.2: GG (L, l) µ (Knoten i) = 1, µ (Knoten ii) = 0 - Spieler 1 mischt: prob(L) = q1, prob(M) = q2, prob(R) = 1- q1 - q2 µ (Knoten i) = q1 / (q1 + q2) - Spieler 1 spielt R µ (Knoten i) = beliebig, da nicht auf GG-Pfad • Konsistenz auch außerhalb des Gleichgewichts? Bedingung 4: An Informationsmengen außerhalb des Gleichgewichtspfads werden beliefs mit Hilfe von Bayes‘ Regel und den Strategien der Spieler bestimmt, wo immer es möglich ist. Dr. Achim Wambach, Spieltheorie 4.4 Beliefs und perfektes Bayesianisches GG A 1 • Betrachte GG: (A L l) D 1 → Knoten (i) wird nicht erreicht → Aber: µ kann bestimmt werden: µ = 1 • Randnotiz: Mit Auszahlung nach A 1:3, Spiel strategisch identisch mit Spiel S.4.2, aber hier nur ein TSPN-GG: (D L l) ! 3 3 R L 2 [µ] l r 2 1 [1-µ] l 0 0 0 2 r 0 1 Definition: Ein perfektes Bayesianisches Gleichgewicht ist ein Profil von Strategien und Beliefs (σ, µ), die Bedingungen 1 bis 4 erfüllen. Bemerkung: - benötige Strategien und Beliefs, um GG Aussagen zu machen - Strategien optimal gegeb. Beliefs, Beliefs konsistent gegeb. Strategien → keine Rückwärtsinduktion möglich 4.5 Dr. Achim Wambach, Spieltheorie Beispiel 1 A 1 2 0 0 D 2 R L 3 [µ] l 1 2 1 r [1-µ] l 3 0 3 1 3 2 Dr. Achim Wambach, Spieltheorie r • Eindeutiges PBGG und TSPNGG: (D L r), µ = 1 • Weiteres Nash-Gleichgewicht: (A L l) Gemeinsam mit Belief µ = 0 erfüllt dies Bedingungen 1-3 Aber: Bedingung 4 ist verletzt 0 1 1 4.6 Beispiel 2 1 A D 2 A‘ R L 3 [µ] l 1 2 1 2 0 0 r [1-µ] l r 0 1 1 3 0 3 1 3 2 0 2 0 • Ein PBGG wie zuvor: (D L r), µ = 1 • Weiteres PBGG: (A A‘ l), µ < 1/3 Spieler 3 darf Belief „frei wählen“, da Strategien nicht die Anwendung von Bayes‘ Regel ermöglichen. → Für µ < 1/3 ist l optimal → Falls 3 l spielt, ist A‘ optimal → Falls 2 A‘ spielt, ist A optimal Dr. Achim Wambach, Spieltheorie 4.7 Refinements von PBGG Problem: Was geschieht an Informationsmengen außerhalb des Gleichgewichtspfads, bei denen Bayes‘ Regel keine Anwendung findet? • Ansatz 1: Kreps und Wilson 1982: Sequentielles Gleichgewicht - es wird zusätzlich verlangt, dass das Gleichgewichtsprofil (σ,µ) der Grenzwert einer Folge von vollständig gemischten Strategien und zugehörigen Beliefs ist - hierbei wird ausgenutzt, dass bei vollständig gemischten Strategien Bayes‘ Regel immer Anwendung findet • Ansatz 2: Selten 1975: (Trembling Hand) Perfect Equilibrium - hierbei wird zunächst ein Gleichgewicht bestimmt, bei dem jeder Spieler jede Aktion mit mindestens einer geringen Wahrscheinlichkeit wählt (trembles). Dann wird der Grenzwert (trembles → 0) betrachtet. • Man kann zeigen, dass THPE und SE in den meisten Fällen identisch sind. • Beide Konzepte sind kompliziert in der Anwendung. Deshalb wird in der Regel nur das PBGG-Konzept verwandt. Dr. Achim Wambach, Spieltheorie 4.8 Signalisierungsspiele Struktur: 1. Natur wählt den Typ des Senders: ti ∈ T = {t1, ..., tI} mit Wahrscheinlichkeit p(ti) 2. Sender beobachtet Typ, sendet ein Signal: mj ∈ M = {m1, ..., mJ} 3. Empfänger sieht das Signal, aktualisiert seine Einschätzung über den Typ des Senders, wählt dann eine Aktion: ak ∈ A = {a1, ..., aK} Auszahlungen: US(ti, mj, ak ) und UR(ti, mj, ak ) Beispiele: • Spence (1973): Job-Markt Signal (des Arbeiters): Ausbildung; Aktion (des Unternehmens): Lohn • Myers und Majluf (1984): Kapitalstruktur/Initial Public Offering Signal (des UN): Eigenkapitalanteil; Aktion (Bank): Investiere Ja/Nein • Vickers (1986): Geldpolitik Signal (Zentralbank): Inflation in Periode 1; Aktion (UN): Inflationserwartung 4.9 Dr. Achim Wambach, Spieltheorie Allgemeine Struktur a1 m1 a2 Sender t1 Natur a1 Empf. a1 1-p m1 a1 a2 p Empf. a2 m2 Sender t2 m2 a2 Anmerkungen • (Reine) Strategie des Senders ist ein Tupel: (m(t1), m(t2)) • Empfängers hat Belief an jeder Informationsmenge, d.h. Belief über Typ: µ(t1|m1), µ(t2|m1) = 1- µ(t1|m1); µ(t1|m2), µ(t2|m2) • (Reine) Strategie des Empfängers ist ein Tupel: (a(m1), a(m2)) Dr. Achim Wambach, Spieltheorie 4.10 Klassifikation der Gleichgewichte • Pooling Gleichgewicht Sender wählt Signal unabhängig von Typ, zum Beispiel Signal m1 µ(t1|m1) = p; µ(t1|m2) unbestimmt • Separierendes Gleichgewicht Unterschiedliche Typen des Senders wählen unterschiedliche Signale, z.B. Typ t1 wählt m1, Typ t2 wählt m2 µ(t1|m1) = 1, µ(t1|m2) = 0 • Hybrides Gleichgewicht Ein Typ wählt nur ein Signal, der andere Typ mischt zwischen den Signalen, z.B. Typ t1 wählt m1, Typ t2 wählt m1 mit Wahrscheinlichkeit q µ(t1|m1) = p/[p+(1-p)q]; µ(t1|m2) = 0 • (Teilseparierendes Gleichgewicht: nur bei mehr als 2 Sendertypen) 4.11 Dr. Achim Wambach, Spieltheorie Ein Beispiel 1,3 4,0 u [p] L d t1 u 0,1 d Natur L u Empf. .5 [1-p] [q] d .5 Empf. 2,4 R t2 R 2,1 0,0 u 1,0 [1-q] d 1,2 Gleichgewichtskandidaten • Pooling bei L: p = ½, q unbestimmt PBGG falls Strategie (u d) und q≤2/3. • Pooling bei R: q = ½, p unbestimmt kein PBGG, da Empf. d wählt • Separierung I (t1 → L, t2 → R): p = 1, q = 0 Beste Antw. (u,d) kein PBGG • Separierung II (t2 → L, t1 → R) p = 0, q = 1 Beste Antw. (u,u) PBGG Dr. Achim Wambach, Spieltheorie 4.12 Spence (1973) Struktur: 1. Natur wählt Produktivität des Arbeiters: η = {L, H}; prob(η = H) = p 2. Arbeiter wählt Signal (Ausbildung): e ∈ ℜ+ 3. Arbeitgeber beobachten Ausbildung, aktualisieren Belief (q) und zahlen Löhne im Wettbewerb: (falls q=1: w=H, falls q=0: w=L) Auszahlungen: UW(η, e, w) = w – c(e,η); ce>0; cη < 0; ceη < 0 UE (q, e, w) = (q H + (1-q) L ) - w Anmerkungen: • Ausbildung hier ohne Wert, im allgemeinen hängt Produktivität von e ab. • Single Crossing Property Indifferenzkurven (im e/w) Diagramm steiler für den L-Typ, da dw/de = ce und ceη < 0 • Definiere: D = p H + (1-p) L 4.13 Dr. Achim Wambach, Spieltheorie Pooling Gleichgewichte w L H H D H H w(e) L D w(e) L e • w(e) ist eine mögliche Lohnfunktion (Belief-Funktion) • GG: - beide Typen wählen e=0 - Belief: e=0 → q=p, e>0 → q=p Dr. Achim Wambach, Spieltheorie L w e# e • GG: Beide Typen wählen e# • Ineffizientes GG • Problem: Beliefs außerhalb des GG-Pfads ermöglichen viele GG 4.14 Separierende Gleichgewichte w L H H L w H H D D w(e) w(e) L L e* e • GG: - L wählt e = 0, H wählt e = e* - Belief: e=0 → q=0, e= e* → q=1 • GG nicht Pareto optimal, falls p nahe bei 1 liegt (und D nahe bei H) e‘ e • Auch hier ermöglichen Beliefs außerhalb des GG-Pfads unplausible (?) GG 4.15 Dr. Achim Wambach, Spieltheorie Myers und Majluf (1984) Ein Projekt mit Investitionskosten I hat einen Ertrag von R > I(1+r). Eine Firma mit unbekannter Gewinnerwartung sucht einen Investor. Struktur: 1. Natur wählt Gewinnniveau der Firma: π = {L, H}; prob(π = H) = p 2. Unternehmer bietet Unternehmensanteil an: s ∈ [0, 1] 3. Investor beobachtet s, aktualisiert Belief (q), nimmt Angebot an oder nicht Auszahlungen: Unternehmer Typ π : (1-s) (π + R) Investor mit Belief q: Annahme: s(q H + (1-q) L + R) Ablehnung: I(1+r) Anmerkungen: • Warum nicht Finanzierung durch Kreditaufnahme? Benötige aufwändigeres Modell, bei dem π unsicher ist und Konkurs auftreten kann. Dr. Achim Wambach, Spieltheorie 4.16 Gleichgewichte Pooling: • Teilnahmebedingung (P.C.): s(p L + (1-p) H + R ) ≥ (1+r) I s ≥ (1+r) I / [p L + (1-p) H + R] • Anreizkompatibilitätsbedingung (I.C.) für H-Firma: (1-s) (H+R) ≥ H s ≤ R / [H+R] → existiert nur, falls p klein ist (wenig Subventionierung der L-Firmen) Separierend: • L: wähle s so dass s(L+R) = (1+r) I • H: verzichte auf Projekt. Anmerkung: • Myers und Majluf entwickeln die „Pecking Order Theory“ (Hackordnung) - benutze zunächst internes Kapital (Cash-Flow Financing) - falls externes Kapital, dann sicherste Wertpapiere zuerst (erst Schulden, dann Eigenkapital) 4.17 Dr. Achim Wambach, Spieltheorie Cheap Talk I: Vor Spielen Stufe 1: - Spieler wählen Nachricht mj ∈ M = {m1, ..., mJ} Stufe 2: - Spieler spielen ein Spiel (z.B. „Battle of the Sexes“) Proposition: Cheap Talk ermöglicht die Konvexifizierung der Nash-GG Auszahlungsvektoren. Spieler 2 (1,2) (2,1) Beispiel: Beide Spieler spielen vorher Schere/Stein/Papier. Der Sieger darf Gleichgewicht wählen → Erwartete Auszahlung: (1,5; 1,5) Spieler 1 Dr. Achim Wambach, Spieltheorie 4.18 Cheap Talk II: Crawford und Sobel (1982) Struktur: 1. Natur wählt den Typ des Senders: t ∈ [0,1], Gleichverteilung 2. Sender beobachtet Typ, sendet ein Signal: m ∈ [0,1] 3. Empfänger sieht Signal, aktualisiert Belief, wählt Aktion: a ∈[0,1] Auszahlungen: US(t, a) = -(a-(t+b))2 UR(t, a) = -(a-t)2 Anmerkungen: • Nachricht geht nicht in die Auszahlungsfunktionen ein: Cheap Talk • b misst, inwiefern Interessen angeglichen sind t 0 t+b 1 • Ein Pooling GG gibt es immer: Ignoriere Nachricht, wähle a = ½ Sender randomisiert über Signale 4.19 Dr. Achim Wambach, Spieltheorie Teilseparierendes Gleichgewicht • Sendertyp mit t ∈ [0,x] wählt eine andere Nachricht als der mit t ∈ [x,1]. 0 „tief“ x „hoch“ 1 • Reaktion des Empfängers: a= x/2 falls „tief“, a=(1+x)/2 falls „hoch“ 0 x/2 x (1+x)/2 1 • Dies ist nur ein Gleichgewicht, falls Typ „x“ indifferent ist. (x+b) – x/2 = (1+x)/2 – (x+b) 0 x/2 Dr. Achim Wambach, Spieltheorie x x+b x= ½ - b (1+x)/2 1 4.20 Struktur der Gleichgewichte • Nachricht des Senders: z.B. t ∈ [0,x] sendet 0, t ∈ [x,1] sendet 1 • Alle teilseparierende Gleichgewichte haben eine solche Struktur: [0, x1]; [x1, x2]; ...; [xn, 1], wobei alle t ∈ [xk, xk+1] dieselbe Nachricht senden • Komplett separierende Gleichgewichte gibt es nicht, da Empfänger dann immer mit a=t reagieren würde • Es gibt eine maximale Anzahl von Teilgruppen (abhängig von b). Grund: xi xi +b xi-1 l xi+1 l+4b Dr. Achim Wambach, Spieltheorie 4.21 Refinement: Intuitive Criterion • Problem: Wie gehe ich mit Signalen/Aktionen um, die außerhalb des Gleichgewichtspfads liegen, und bei denen mir die Regel von Bayes nicht weiterhilft? Definition: Gegeben sei ein PBGG in einem Signalisierungsspiel. Ein Signal mj ∈ M ist Gleichgewichts-dominiert für Typ ti ∈ T falls seine Gleichgewichtsauszahlung größer ist als die maximale Auszahlung, die er mit dem Signal mj erreichen kann: U*(ti) ≥ max US(ti, mj, a) Das Intuitive Kriterium (Cho und Kreps, 1987): Falls die Informationsmenge, die mit dem Signal mj erreicht wird, außerhalb des GG-Pfads liegt, und falls mj Gleichgewichts-dominiert für Typ ti ist, dann sollte der Belief des Empfängers keine Wahrscheinlichkeit auf Typ ti legen, falls dies möglich ist, d.h.: µ(ti| mj) = 0. Dr. Achim Wambach, Spieltheorie 4.22 Das intuitive Kriterium: Diskussion • Flair von forward induction: Wer könnte es sein, der sich nicht an das Gleichgewicht hält, und warum? • Verallgemeinerung: Iterated Intuitive Criterion 1. Keine Wahrscheinl. für die Typen, bei denen mj GG-dominiert ist 2. Nun betrachte nur noch die Aktionen, die evtl. optimal wären, gegeben dass nun eine eingeschränkte Typenmenge möglich ist 3. Keine Wahrscheinl. für die Typen, bei denen mj GG-dominiert ist, falls nun die eingeschränkte Menge der Aktionen betrachtet wird 4. Zurück zu 2. • Anwendung: - Spence Modell: Nur ein separierendes GG erfüllt das Intuitive Kriterium (siehe nächste Folie) - Myers und Majluf: Konzept findet keine Anwendung 4.23 Dr. Achim Wambach, Spieltheorie Spence und das Intuitive Kriterium Pooling GG Separierendes GG L w L w H H H H D w(e) L D w(e) L e e e e‘ e • Ausbildungsniveau e gibt für jeden Belief dem L-Typ weniger als sein GG-Payoff, somit erfüllt die Lohnfunktion (der Belief) nicht das Intuitive Kriterium Dr. Achim Wambach, Spieltheorie 4.24