IV: Dynamische Spiele bei unvollständiger Information IV

Werbung
Spieltheorie: Wintersemester 2001/2002
IV: Dynamische Spiele bei
unvollständiger Information
Dr. Achim Wambach
4.1
Dr. Achim Wambach, Spieltheorie
Sequentielle Rationalität: Motivation
R
1
Beispiel (Selten, 1975):
1
3
M
L
2
l
r
2
1
r
0
1
0 0
0 2
l
1
l
2
r
L
2,
2, 11
0,
0, 00
M
0,
0, 22
0,
0, 11
R
1,
1, 33
1,
1, 33
Dr. Achim Wambach, Spieltheorie
Ist (R, r) ein
plausibles
GG?
4.2
Sequentielle Rationalität: Definition
Beachte:
• (R, r) ist ein Nash-GG, sogar ein TSPN-GG.
• Hier: Fortsetzungsspiele (an einer Informationsmenge), während
TSPN Teilspiele (an einer einelementigen Info-menge) betrachtet.
Bedingung 1:
Der Spieler, der an einer Informationsmenge am Zuge ist, hat einen Belief
(Einschätzung) darüber, welcher Knoten in dieser Informationsmenge
erreicht wurde.
Bedingung 2:
Die Spieler verhalten sich sequentiell rational, wenn sie an jeder
Informationsmenge Aktionen wählen, die optimal sind gegeben die
Beliefs und die (Fortsetzungs-)Strategien der anderen Spieler.
Anmerkungen:
• Ähnlich wie Teilspielperfektheit gilt diese Bedingung auch an Informationsmengen, die nicht auf dem Gleichgewichtspfad liegen.
• (R, r) ist nicht sequentiell rational.
4.3
Dr. Achim Wambach, Spieltheorie
Beliefs
• Wie werden Beliefs bestimmt?
Bedingung 3:
Entlang des Gleichgewichtspfads werden Beliefs mit Hilfe von Bayes‘ Regel
und den Strategien der Spieler bestimmt.
Beispiele:
- Spiel S.4.2: GG (L, l)
µ (Knoten i) = 1, µ (Knoten ii) = 0
- Spieler 1 mischt: prob(L) = q1, prob(M) = q2, prob(R) = 1- q1 - q2
µ (Knoten i) = q1 / (q1 + q2)
- Spieler 1 spielt R
µ (Knoten i) = beliebig, da nicht auf GG-Pfad
• Konsistenz auch außerhalb des Gleichgewichts?
Bedingung 4:
An Informationsmengen außerhalb des Gleichgewichtspfads werden beliefs
mit Hilfe von Bayes‘ Regel und den Strategien der Spieler bestimmt, wo
immer es möglich ist.
Dr. Achim Wambach, Spieltheorie
4.4
Beliefs und perfektes Bayesianisches GG
A
1
• Betrachte GG: (A L l)
D
1
→ Knoten (i) wird nicht erreicht
→ Aber: µ kann bestimmt werden: µ = 1
• Randnotiz: Mit Auszahlung nach A
1:3, Spiel strategisch identisch
mit Spiel S.4.2, aber hier nur ein
TSPN-GG: (D L l) !
3
3
R
L
2
[µ]
l
r
2
1
[1-µ]
l
0 0
0 2
r
0
1
Definition:
Ein perfektes Bayesianisches Gleichgewicht ist ein Profil von Strategien
und Beliefs (σ, µ), die Bedingungen 1 bis 4 erfüllen.
Bemerkung:
- benötige Strategien und Beliefs, um GG Aussagen zu machen
- Strategien optimal gegeb. Beliefs, Beliefs konsistent gegeb. Strategien
→ keine Rückwärtsinduktion möglich
4.5
Dr. Achim Wambach, Spieltheorie
Beispiel 1
A
1
2
0
0
D
2
R
L
3
[µ]
l
1
2
1
r
[1-µ]
l
3 0
3 1
3 2
Dr. Achim Wambach, Spieltheorie
r
• Eindeutiges PBGG und TSPNGG:
(D L r), µ = 1
• Weiteres Nash-Gleichgewicht:
(A L l)
Gemeinsam mit Belief µ = 0 erfüllt
dies Bedingungen 1-3
Aber: Bedingung 4 ist verletzt
0
1
1
4.6
Beispiel 2
1
A
D
2
A‘
R
L
3
[µ]
l
1
2
1
2
0
0
r
[1-µ]
l
r
0
1
1
3 0
3 1
3 2
0
2
0
• Ein PBGG wie zuvor:
(D L r), µ = 1
• Weiteres PBGG:
(A A‘ l), µ < 1/3
Spieler 3 darf Belief „frei wählen“,
da Strategien nicht die Anwendung
von Bayes‘ Regel ermöglichen.
→ Für µ < 1/3 ist l optimal
→ Falls 3 l spielt, ist A‘ optimal
→ Falls 2 A‘ spielt, ist A optimal
Dr. Achim Wambach, Spieltheorie
4.7
Refinements von PBGG
Problem: Was geschieht an Informationsmengen außerhalb des
Gleichgewichtspfads, bei denen Bayes‘ Regel keine Anwendung findet?
• Ansatz 1: Kreps und Wilson 1982: Sequentielles Gleichgewicht
- es wird zusätzlich verlangt, dass das Gleichgewichtsprofil (σ,µ) der
Grenzwert einer Folge von vollständig gemischten Strategien und
zugehörigen Beliefs ist
- hierbei wird ausgenutzt, dass bei vollständig gemischten Strategien
Bayes‘ Regel immer Anwendung findet
• Ansatz 2: Selten 1975: (Trembling Hand) Perfect Equilibrium
- hierbei wird zunächst ein Gleichgewicht bestimmt, bei dem jeder
Spieler jede Aktion mit mindestens einer geringen Wahrscheinlichkeit
wählt (trembles). Dann wird der Grenzwert (trembles → 0) betrachtet.
• Man kann zeigen, dass THPE und SE in den meisten Fällen identisch sind.
• Beide Konzepte sind kompliziert in der Anwendung. Deshalb wird in der
Regel nur das PBGG-Konzept verwandt.
Dr. Achim Wambach, Spieltheorie
4.8
Signalisierungsspiele
Struktur:
1. Natur wählt den Typ des Senders: ti ∈ T = {t1, ..., tI} mit
Wahrscheinlichkeit p(ti)
2. Sender beobachtet Typ, sendet ein Signal: mj ∈ M = {m1, ..., mJ}
3. Empfänger sieht das Signal, aktualisiert seine Einschätzung über
den Typ des Senders, wählt dann eine Aktion: ak ∈ A = {a1, ..., aK}
Auszahlungen:
US(ti, mj, ak ) und UR(ti, mj, ak )
Beispiele:
• Spence (1973): Job-Markt
Signal (des Arbeiters): Ausbildung; Aktion (des Unternehmens): Lohn
• Myers und Majluf (1984): Kapitalstruktur/Initial Public Offering
Signal (des UN): Eigenkapitalanteil; Aktion (Bank): Investiere Ja/Nein
• Vickers (1986): Geldpolitik
Signal (Zentralbank): Inflation in Periode 1; Aktion (UN): Inflationserwartung
4.9
Dr. Achim Wambach, Spieltheorie
Allgemeine Struktur
a1
m1
a2
Sender t1
Natur
a1
Empf.
a1
1-p
m1
a1
a2
p
Empf.
a2
m2
Sender t2
m2
a2
Anmerkungen
• (Reine) Strategie des Senders ist ein Tupel: (m(t1), m(t2))
• Empfängers hat Belief an jeder Informationsmenge, d.h. Belief über Typ:
µ(t1|m1), µ(t2|m1) = 1- µ(t1|m1); µ(t1|m2), µ(t2|m2)
• (Reine) Strategie des Empfängers ist ein Tupel: (a(m1), a(m2))
Dr. Achim Wambach, Spieltheorie
4.10
Klassifikation der Gleichgewichte
• Pooling Gleichgewicht
Sender wählt Signal unabhängig von Typ, zum Beispiel Signal m1
µ(t1|m1) = p;
µ(t1|m2) unbestimmt
• Separierendes Gleichgewicht
Unterschiedliche Typen des Senders wählen unterschiedliche Signale,
z.B. Typ t1 wählt m1, Typ t2 wählt m2
µ(t1|m1) = 1, µ(t1|m2) = 0
• Hybrides Gleichgewicht
Ein Typ wählt nur ein Signal, der andere Typ mischt zwischen den
Signalen, z.B. Typ t1 wählt m1, Typ t2 wählt m1 mit Wahrscheinlichkeit q
µ(t1|m1) = p/[p+(1-p)q];
µ(t1|m2) = 0
• (Teilseparierendes Gleichgewicht: nur bei mehr als 2 Sendertypen)
4.11
Dr. Achim Wambach, Spieltheorie
Ein Beispiel
1,3
4,0
u
[p]
L
d
t1
u
0,1
d
Natur
L
u
Empf.
.5
[1-p]
[q]
d
.5
Empf.
2,4
R
t2
R
2,1
0,0
u
1,0
[1-q] d
1,2
Gleichgewichtskandidaten
• Pooling bei L:
p = ½, q unbestimmt
PBGG falls Strategie (u d) und q≤2/3.
• Pooling bei R:
q = ½, p unbestimmt
kein PBGG, da Empf. d wählt
• Separierung I (t1 → L, t2 → R):
p = 1, q = 0
Beste Antw. (u,d)
kein PBGG
• Separierung II (t2 → L, t1 → R)
p = 0, q = 1
Beste Antw. (u,u)
PBGG
Dr. Achim Wambach, Spieltheorie
4.12
Spence (1973)
Struktur:
1. Natur wählt Produktivität des Arbeiters: η = {L, H}; prob(η = H) = p
2. Arbeiter wählt Signal (Ausbildung): e ∈ ℜ+
3. Arbeitgeber beobachten Ausbildung, aktualisieren Belief (q) und zahlen
Löhne im Wettbewerb: (falls q=1: w=H, falls q=0: w=L)
Auszahlungen:
UW(η, e, w) = w – c(e,η); ce>0; cη < 0; ceη < 0
UE (q, e, w) = (q H + (1-q) L ) - w
Anmerkungen:
• Ausbildung hier ohne Wert, im allgemeinen hängt Produktivität von e ab.
• Single Crossing Property
Indifferenzkurven (im e/w) Diagramm steiler für den L-Typ, da
dw/de = ce und ceη < 0
• Definiere: D = p H + (1-p) L
4.13
Dr. Achim Wambach, Spieltheorie
Pooling Gleichgewichte
w
L
H
H
D
H
H
w(e)
L
D
w(e)
L
e
• w(e) ist eine mögliche Lohnfunktion
(Belief-Funktion)
• GG: - beide Typen wählen e=0
- Belief: e=0 → q=p, e>0 → q=p
Dr. Achim Wambach, Spieltheorie
L
w
e#
e
• GG: Beide Typen wählen e#
• Ineffizientes GG
• Problem: Beliefs außerhalb
des GG-Pfads ermöglichen
viele GG
4.14
Separierende Gleichgewichte
w
L
H
H
L
w
H
H
D
D
w(e)
w(e)
L
L
e*
e
• GG: - L wählt e = 0, H wählt e = e*
- Belief: e=0 → q=0, e= e* → q=1
• GG nicht Pareto optimal, falls
p nahe bei 1 liegt (und D nahe bei H)
e‘
e
• Auch hier ermöglichen
Beliefs außerhalb des
GG-Pfads unplausible (?)
GG
4.15
Dr. Achim Wambach, Spieltheorie
Myers und Majluf (1984)
Ein Projekt mit Investitionskosten I hat einen Ertrag von R > I(1+r). Eine
Firma mit unbekannter Gewinnerwartung sucht einen Investor.
Struktur:
1. Natur wählt Gewinnniveau der Firma: π = {L, H}; prob(π = H) = p
2. Unternehmer bietet Unternehmensanteil an: s ∈ [0, 1]
3. Investor beobachtet s, aktualisiert Belief (q), nimmt Angebot an oder nicht
Auszahlungen:
Unternehmer Typ π : (1-s) (π + R)
Investor mit Belief q:
Annahme: s(q H + (1-q) L + R)
Ablehnung: I(1+r)
Anmerkungen:
• Warum nicht Finanzierung durch Kreditaufnahme?
Benötige aufwändigeres Modell, bei dem π unsicher ist und Konkurs
auftreten kann.
Dr. Achim Wambach, Spieltheorie
4.16
Gleichgewichte
Pooling:
• Teilnahmebedingung (P.C.):
s(p L + (1-p) H + R ) ≥ (1+r) I
s ≥ (1+r) I / [p L + (1-p) H + R]
• Anreizkompatibilitätsbedingung (I.C.) für H-Firma:
(1-s) (H+R) ≥ H
s ≤ R / [H+R]
→ existiert nur, falls p klein ist (wenig Subventionierung der L-Firmen)
Separierend:
• L: wähle s so dass s(L+R) = (1+r) I
• H: verzichte auf Projekt.
Anmerkung:
• Myers und Majluf entwickeln die „Pecking Order Theory“ (Hackordnung)
- benutze zunächst internes Kapital (Cash-Flow Financing)
- falls externes Kapital, dann sicherste Wertpapiere zuerst (erst
Schulden, dann Eigenkapital)
4.17
Dr. Achim Wambach, Spieltheorie
Cheap Talk I: Vor Spielen
Stufe 1:
- Spieler wählen Nachricht mj ∈ M = {m1, ..., mJ}
Stufe 2:
- Spieler spielen ein Spiel (z.B. „Battle of the Sexes“)
Proposition:
Cheap Talk ermöglicht die Konvexifizierung der Nash-GG Auszahlungsvektoren.
Spieler 2
(1,2)
(2,1)
Beispiel:
Beide Spieler spielen vorher
Schere/Stein/Papier. Der Sieger
darf Gleichgewicht wählen
→ Erwartete Auszahlung:
(1,5; 1,5)
Spieler 1
Dr. Achim Wambach, Spieltheorie
4.18
Cheap Talk II: Crawford und Sobel (1982)
Struktur:
1. Natur wählt den Typ des Senders: t ∈ [0,1], Gleichverteilung
2. Sender beobachtet Typ, sendet ein Signal: m ∈ [0,1]
3. Empfänger sieht Signal, aktualisiert Belief, wählt Aktion: a ∈[0,1]
Auszahlungen:
US(t, a) = -(a-(t+b))2 UR(t, a) = -(a-t)2
Anmerkungen:
• Nachricht geht nicht in die Auszahlungsfunktionen ein: Cheap Talk
• b misst, inwiefern Interessen angeglichen sind
t
0
t+b
1
• Ein Pooling GG gibt es immer: Ignoriere Nachricht, wähle a = ½
Sender randomisiert über Signale
4.19
Dr. Achim Wambach, Spieltheorie
Teilseparierendes Gleichgewicht
• Sendertyp mit t ∈ [0,x] wählt eine andere Nachricht als der mit t ∈ [x,1].
0
„tief“
x
„hoch“
1
• Reaktion des Empfängers: a= x/2 falls „tief“, a=(1+x)/2 falls „hoch“
0
x/2
x
(1+x)/2
1
• Dies ist nur ein Gleichgewicht, falls Typ „x“ indifferent ist.
(x+b) – x/2 = (1+x)/2 – (x+b)
0
x/2
Dr. Achim Wambach, Spieltheorie
x x+b
x= ½ - b
(1+x)/2
1
4.20
Struktur der Gleichgewichte
• Nachricht des Senders: z.B. t ∈ [0,x] sendet 0, t ∈ [x,1] sendet 1
• Alle teilseparierende Gleichgewichte haben eine solche Struktur:
[0, x1]; [x1, x2]; ...; [xn, 1], wobei alle t ∈ [xk, xk+1] dieselbe Nachricht senden
• Komplett separierende Gleichgewichte gibt es nicht, da Empfänger dann
immer mit a=t reagieren würde
• Es gibt eine maximale Anzahl von Teilgruppen (abhängig von b). Grund:
xi xi +b
xi-1
l
xi+1
l+4b
Dr. Achim Wambach, Spieltheorie
4.21
Refinement: Intuitive Criterion
• Problem: Wie gehe ich mit Signalen/Aktionen um, die außerhalb des
Gleichgewichtspfads liegen, und bei denen mir die Regel von
Bayes nicht weiterhilft?
Definition:
Gegeben sei ein PBGG in einem Signalisierungsspiel. Ein Signal mj ∈ M
ist Gleichgewichts-dominiert für Typ ti ∈ T falls seine Gleichgewichtsauszahlung größer ist als die maximale Auszahlung, die er mit dem Signal
mj erreichen kann:
U*(ti) ≥ max US(ti, mj, a)
Das Intuitive Kriterium (Cho und Kreps, 1987):
Falls die Informationsmenge, die mit dem Signal mj erreicht wird, außerhalb
des GG-Pfads liegt, und falls mj Gleichgewichts-dominiert für Typ ti ist, dann
sollte der Belief des Empfängers keine Wahrscheinlichkeit auf Typ ti legen,
falls dies möglich ist, d.h.: µ(ti| mj) = 0.
Dr. Achim Wambach, Spieltheorie
4.22
Das intuitive Kriterium: Diskussion
• Flair von forward induction: Wer könnte es sein, der sich nicht an das
Gleichgewicht hält, und warum?
• Verallgemeinerung: Iterated Intuitive Criterion
1. Keine Wahrscheinl. für die Typen, bei denen mj GG-dominiert ist
2. Nun betrachte nur noch die Aktionen, die evtl. optimal wären,
gegeben dass nun eine eingeschränkte Typenmenge möglich ist
3. Keine Wahrscheinl. für die Typen, bei denen mj GG-dominiert ist,
falls nun die eingeschränkte Menge der Aktionen betrachtet wird
4. Zurück zu 2.
• Anwendung:
- Spence Modell: Nur ein separierendes GG erfüllt das Intuitive Kriterium
(siehe nächste Folie)
- Myers und Majluf: Konzept findet keine Anwendung
4.23
Dr. Achim Wambach, Spieltheorie
Spence und das Intuitive Kriterium
Pooling GG
Separierendes GG
L
w
L
w
H
H
H
H
D
w(e)
L
D
w(e)
L
e
e
e
e‘
e
• Ausbildungsniveau e gibt für jeden Belief dem L-Typ weniger
als sein GG-Payoff, somit erfüllt die Lohnfunktion (der Belief)
nicht das Intuitive Kriterium
Dr. Achim Wambach, Spieltheorie
4.24
Herunterladen