Perfekte und vollständige Information

Werbung
Dynamische Spiele und unvollständige Information
Mehrstufige Spiele mit beobachtbaren Handlungen:
Rückwärtsinduktion und Teilspielperfektheit
Wiederholte Spiele und kooperatives Verhalten
Unvollständige Information:
Bayes-Nash- und sequentielles Gleichgewicht
© K. Morasch 2007
Anwendungen der Spieltheorie in den Wirtschaftswissenschaften
42
Perfekte und vollständige Information
Markteintrittsspiel: sequentielles Spiel mit perfekter Information
strategische Form
extensive Form
(0,4)
Verzicht
A
s11
s12
Markteintritt
Preiskrieg
B
s21
s22
s21
(-1,-1)
s11
(0,4)
(0,4)
s22
(1,1)
s12
(-1,-1)
(1,1)
Aufteilung
Aspekte: - strategische Form enthält nicht alle relevanten Informationen
- unplausibles Nash-Gleichgewicht („leere Drohung“)
- Lösung im Spielbaum durch Rückwärtsinduktion
© K. Morasch 2007
Anwendungen der Spieltheorie in den Wirtschaftswissenschaften
43
Imperfekte Information
Simultanspiel: Handlungen der Mitspieler nicht beobachtbar
B
s21
(3,3)
Aspekte:
• Spieler 2 hat imperfekte Information
s11
s22
(0,2)
s21
(4,0)
• „hidden action“ und „moral hazard“:
(Verschlechterung gegenüber dem
Ergebnis bei perfekter Information)
A
s12
C
© K. Morasch 2007
s22
• Normalform liefert alle relevanten
Informationen über das Spiel
(1,1)
Anwendungen der Spieltheorie in den Wirtschaftswissenschaften
44
Konzept eines „Teilspiels“
Definition: Am Entscheidungsknoten X fängt ein (eigenständiges) Teilspiel an,
wenn alle nachfolgenden Knoten mit dem Rest des Spiels nur über diesen
Knoten X verbunden sind.
s
B
s21
B
s21
A
A
C
Beispiele:
Nur im Knoten
D bzw. H beginnt
ein neues Teilspiel!
© K. Morasch 2007
31
E
s11
s11
D
F
C
G
D
H
Anwendungen der Spieltheorie in den Wirtschaftswissenschaften
45
Erweiterung des Strategiebegriff
bisher: Strategie als einzelne, unbedingte Entscheidung bzw. Handlung
jetzt: Strategie als Sequenz von bedingten Aktionen
(0,4)
1
0
Beispiel:
a 11 (a 21 )
Markteintrittsspiel mit vorgelagerter
a221
(-1, -1)
Investition in Überkapazität durch
0
a 21
das etablierte Unternehmen
a112 (a021 )
(„strategic move“: a022 –
(1, 1)
a222
Investition mit Kosten c)
(0, 4-c)
(reine) Strategien:
a022
s1i = {a1(h1)} mit h1∈{a021, a022}
s2j = {a02, a22 } („history“ hl hier irrelevant!)
a111 (a022 )
(-1, -1)
a222
(1, 1-c)
a112 (a022 )
- jeder Spieler hat vier Strategien zur Auswahl!
© K. Morasch 2007
a221
Anwendungen der Spieltheorie in den Wirtschaftswissenschaften
46
Teilspielperfektes Gleichgewicht
Definition:
s* ist ein teilspielperfektes (Nash-)Gleichgewicht, wenn für keinen
Spieler in irgendeinem Teilspiel, das an einen beliebigen Knoten des
Spielbaums beginnt, ein Anreiz zur Abweichung von s* besteht.
Idee:
Das Verhalten eines Spielers muss auch außerhalb des betrachteten
Gleichgewichtspfads optimal sein – das eliminiert „leere Drohungen“.
Bestimmung:
Kombination von Rückwärtsinduktion (ausreichend bei perfekter Info)
und Nash-Gleichgewicht in Teilspielen mit imperfekter Information
[Details siehe Beispiele Markteintrittsspiel, Stackelberglösung und F&E-Investition]
© K. Morasch 2007
Anwendungen der Spieltheorie in den Wirtschaftswissenschaften
47
Perfekte Information und stetiger Strategieraum
Beispiel: Duopol mit sequentieller Festlegung der Menge (si = xi)
- Unternehmen 1 legt Output zuerst verbindlich fest
- Unternehmen 2 beobachtet und wählt dann eigene Menge
Ansatz:
- Spieler 2 macht Strategiewahl von Beobachtung
abhängig: s2 = r2(x1)
- Spieler 1 berücksichtigt
dies bei der Wahl von x1:
max π1(x1,r2(x1))
Beachte:
Cournot-Nash, d.h. s2 = x2C für
alle x1 ist nicht teilspielperfekt!
© K. Morasch 2007
x2
r1(x2)
Isogewinnkurve: π1(x1,x2)
Nash-Gleichgewicht
(Lösung für Simultanspiel)
StackelbergGleichgewicht
r2(x1) (teilspielperfekt)
Anwendungen der Spieltheorie in den Wirtschaftswissenschaften
x1
48
Mehrstufige Spiele mit beobachtbaren Handlungen
Idee:
Das Spiel setzt sich aus K+1 „Stufen“ zusammen, wobei eine Stufe k
aus einem Teilspiel mit simultaner Wahl von Aktionen aik besteht
und alle Spieler die Aktionen auf den k-1 davor liegenden Stufen
beobachten können (führt auf „history“ hk = (a0, a1,…, ak-1)).
[(i) Beginn mit k = 0 wegen vereinfachter Notation bei Analyse mit Diskontierung;
(ii) auch alternierende Aktionen durch einelementige Aktionsmenge „nichts tun“]
Beispiele:
- Cournot-Duopol (einstufig)
- Stackelberg-Duopol (zweistufig, alternierende Aktionen)
- strategischer F&E-Wettbewerb (zweistufig, Stufenspiele simultan)
- Markteintrittsspiel von Dixit (Aktionsraum von „history“ abhängig)
- Rubinstein-Verhandlungsspiel (Stufen nicht unbedingt Zeitpunkte)
© K. Morasch 2007
Anwendungen der Spieltheorie in den Wirtschaftswissenschaften
49
Dynamische Spiele
Mehrstufige Spiele mit beobachtbaren Handlungen:
Rückwärtsinduktion und Teilspielperfektheit
Wiederholte Spiele und kooperatives Verhalten
Unvollständige Information:
Bayes-Nash- und sequentielles Gleichgewicht
© K. Morasch 2007
Anwendungen der Spieltheorie in den Wirtschaftswissenschaften
50
Konzept „wiederholtes Spiel“
• Dynamisches Spiel mit stationärer Struktur, d.h. ut (at ) = u(at )
(Sonderfall der mehrstufigen Spiele mit beobachtbaren Aktionen):
Gesamtspiel Γ(T) besteht aus Wiederholungen des Stufenspiels.
• Handlungen in früheren Perioden wirken sich zwar nicht auf die Auszahlungen im Stufenspiel aus, die Spieler haben aber die Möglichkeit,
Aktionen in t vom bisherigen Spielverlauf abhängig zu machen
(z.B. Bestrafung bei Abweichung vom kooperativen Verhalten).
• Ob andere Lösungen als die Wiederholung der Nash-Gleichgewichte
des Stufenspiels realisierbar sind, hängt entscheidend vom Zeithorizont ab (endlich vs. unendlich oft wiederholte Spiele).
Daneben spielen aber auch die Struktur des Stufenspiels sowie die
Annahmen bezüglich Rationalität und Information eine wichtige Rolle.
© K. Morasch 2007
Anwendungen der Spieltheorie in den Wirtschaftswissenschaften
51
Gefangenendilemma als wiederholtes Spiel
Gesamtspiel Γ(T) :
Stufenspiel:
a21
a11
a12
(1, 1)
(2, -1)
a22
(-1, 2)
- Orientierung an „Durchschnittlicher
abdiskontierter Auszahlung“ (DAA)
1−δ
1 − δ T +1
(0, 0)
Beachte:
- Aktionen statt Strategien
- Auszahlungen anders normiert
(erleichtert Berechnungen)
© K. Morasch 2007
- einheitlicher Diskontfaktor δ
T
∑δ
t
ui ( a t )
t=0
Umskalierung (gleiche Präferenzen), um Auswirkungen von Änderungen des Diskontfaktors
und des Zeithorizonts leichter zu beurteilen
- Vergleiche (i) einstufiges Spiel,
(ii) mehrstufiges, aber endliches Spiel
und (iii) unendliche Wiederholung
Anwendungen der Spieltheorie in den Wirtschaftswissenschaften
52
Endlich vs. unendlich oft wiederholte Spiele
• Theorem: Falls sC das einzige Nash-Gleichgewicht eines Stufenspiels
Γ(N,S,u), so ist die ständige Wiederholung von sC das einzige teilspielperfekte Gleichgewicht des endlich oft wiederholten Spiels Γ(T)
• Folktheorem: In einem unendlich oft wiederholten Spiel Γ(∞, δ ) lässt sich
für δ →1 jede zulässige individuell rationale Auszahlungskombination als
teilspielperfektes Gleichgewicht realisieren (auch kooperatives Verhalten)
individuell rationale Auszahlungen:
V C = {u(s)|s∈S, ui ≥ uiC für alle i∈N}
mit uiC als Auszahlung, die sich ein
Spieler mindestens sichern kann
(mit Konfliktpunkt C = (u1C,…, unC )
und pareto-optimalem Punkt P )
u2
Paretogrenze
P
VC
C
u1
© K. Morasch 2007
Anwendungen der Spieltheorie in den Wirtschaftswissenschaften
53
Probleme und Erweiterungen
• Stochastische Spiele: Strafpfad ohne Abweichung - wie zurück?
→ Rückkehr zu Kooperation nach festgelegter Strafperiode
• Bei Vergeltung auch geringere Auszahlung für Bestrafende → Drohung
unglaubwürdig → Lösung: neuverhandlungsstabile Gleichgewichte
• Diskontinuität zwischen beschränkter und unendlichem Zeithorizont
- Stufenspiel mit mehreren
Nash-Gleichgewichten
(Folktheorem für Τ → ∞)
→ Beispiel:
a21
a22
a23
a11
(1,1)
(-1,2)
(-2,-2)
- Möglichkeit „irrationaler“ Mitspieler
(spielen immer kooperativ)
a12
(2,-1)
(0,0)
(-2,-2)
- beschränkte Rationalität
(„befriedigendes Ergebnis“)
a13
(-2,-2)
(-2,-2)
(-2,-2)
© K. Morasch 2007
Anwendungen der Spieltheorie in den Wirtschaftswissenschaften
54
Dynamische Spiele
Mehrstufige Spiele mit beobachtbaren Handlungen:
Rückwärtsinduktion und Teilspielperfektheit
Wiederholte Spiele und kooperatives Verhalten
Unvollständige Information:
Bayes-Nash- und sequentielles Gleichgewicht
© K. Morasch 2007
Anwendungen der Spieltheorie in den Wirtschaftswissenschaften
55
Unvollständige Information (I)
Markteintrittsspiel mit unvollständiger Information über Kosten
„schwacher“ Monopolist - Mw
„starker“ Monopolist - Ms
(0, 4)
(0,4)
s11
s11
s21
(b-1, -1)
(b-1, 1)
s22
(b, -1)
s12
s12
K
s21
M
s22
(b, 1)
K
M
Annahmen:
0 < b < 1 und Wahrscheinlichkeit für Ms gleich θ
Problem:
Grundannahme gemeinsames Wissen nicht erfüllt:
Welcher Spielbaum relevant? – nicht (direkt) lösbar!
© K. Morasch 2007
Anwendungen der Spieltheorie in den Wirtschaftswissenschaften
56
Unvollständige Information (II)
„Trick“: Transformation in ein Spiel mit vollständiger Information
• Natur legt für jeden Spieler i konkreten Typ ti ∈ Ti mit Ti = {ti1,…, tiZi} fest
(konkrete Festlegung nur vom Spieler selbst beobachtbar!)
• Mitspieler haben (subjektive) Wahrscheinlichkeitsschätzungen p(t-i |ti )
(Kenntnis des eigenen Typs kann Information über Mitspieler liefern!)
• Jeder Typ ti wird als eigenständiger Spieler mit Auszahlungsfunktion
ui(ti) = Σt-i p(t-i |ti ) ui(s1(t1),…,sn(tn),t1,…,tn) betrachtet
• Ein Bayes‘sches Spiel ist dann durch Γ(N,S,T, π,u) beschrieben
(mit T = {T1,…,Tn} und π als Menge der p(t-i |ti ) aller Spieler) und kann
in ein Spiel Γ(T, S´,u´) mit vollständiger aber imperfekter Info transformiert
werden (mit S´ als Menge der Si(ti) und u´als Menge der ui(ti))
© K. Morasch 2007
Anwendungen der Spieltheorie in den Wirtschaftswissenschaften
57
Unvollständige Information (III )
Markteintrittsspiel: Transformation und Bayes-Nash-Gleichgewicht
(0,4)
t21 = Mw
1-θ
s11
s12
(Mw)
s21
(b-1, -1)
T1 = K, T2 = {Mw,Ms}
π = { p(Mw) = 1−θ, p(Ms) = θ }
s22
(b, 1)
Gleichgewicht:
(0, 4)
s11
θ
t22 = Ms
(N)
K
© K. Morasch 2007
(Ms)
s21
(b-1, 1)
s22
(b, -1)
s12
M
Spiel:
Mw :
s22
Ms : s21
K: s12 falls (1−θ ) b +θ (b−1) ≥ 0
(d.h. wenn θ ≤ b)
s11 sonst
Anwendungen der Spieltheorie in den Wirtschaftswissenschaften
58
Bayes-Nash-Gleichgewicht
s* = (s1*(t1),…, sn*(tn)) mit si (ti) = (si (ti1),…, si (tiZi)) ist ein Bayes-NashGleichgewicht, wenn ui(si*(ti), s-i*(t-i),ti) ≥ ui(si (ti), s-i*(t-i),ti) für alle i, si , ti
Probleme:
• optimale Strategiewahl der Mitspieler basiert auf der Berücksichtigung
des Verhaltens aller möglichen Typen des Spielers i → obwohl Spieler i
seinen Typ ti kennt, muss er sich in seine anderen Typen hineinversetzen
(vgl. dazu Übungsaufgabe zum Bayes-Nash-Gleichgewicht mit stetigen Strategien)
• erwartete Auszahlungen (und damit die Strategiewahl) sind abhängig
von den subjektiven Wahrscheinlichkeitsschätzungen jedes Spielers
→ nahezu alle Strategiekombinationen als Gleichgewicht rationalisierbar
Lösungsansatz: Common-prior-Annahme und Bayes‘sches Updating
(ausführliche Diskussion anschließend im Zusammenhang mit Signalspielen)
© K. Morasch 2007
Anwendungen der Spieltheorie in den Wirtschaftswissenschaften
59
Sequentielles Gleichgewicht - Beispiel
Beispiel 1a: Markteintritt mit nicht-beobachtbarer Technologie
extensive Form
s11
A
s12
s21
(-1,-1)
s22
(1,1)
s21
(-½,-½)
s22
(-1,1)
s13
B
strategische Form
(0,4)
s21
s22
s11
(0,4)
(0,4)
s12
(-1,-1)
(1,1)
s13
(-½,-½) (-1,1)
Problem: Beide Nash-Gleichgewichte sind hier teilspielperfekt!
© K. Morasch 2007
Anwendungen der Spieltheorie in den Wirtschaftswissenschaften
60
Sequentielles Gleichgewicht - Konzept
Definition:
Ein Paar (s, µ) mit Strategien s und Wahrscheinlichkeitsschätzungen µ
stellt ein sequentielles Gleichgewicht dar, wenn
(i) jede Aktion eines Spielers zu gegebenen s-i und Wahrscheinlichkeitsschätzung µ an jeder Informationsmenge eine optimale Wahl darstellt und
(ii) die Wahrscheinlichkeitsschätzungen über das Verhalten der anderen
Spieler mit den im weiteren Spielverlauf optimalen Strategien dieser Spieler
konsistent sind (insbesondere Anpassung der A-priori-Wahrscheinlichkeiten
entsprechender Bayes‘scher Regel)
Anwendung auf Beispiel 1a:
(s11,s21) ist kein sequentielles Gleichgewicht, da für beliebiges µA der
erwartete Nutzen für Spieler 2 bei s22 höher ist (d.h. s21 wird von s22 dominiert)
© K. Morasch 2007
Anwendungen der Spieltheorie in den Wirtschaftswissenschaften
61
Grenzen des Konzepts und „Verfeinerungen“
Beispiel 1b: Unplausibles sequentielles Gleichgewicht
(0,4)
s11
A
s12
s13
B
s21
(-1,-1)
s22
(1,1)
s21
(-½, 2)
s22
© K. Morasch 2007
Idee: geänderte Auszahlung 2
für Monopolist bei (s13, s21)
⇒ (s11, s21, µA) nun sequentielles
Gleichgewicht falls µA < 1/3
Menge aller Gleichgewichte:
{(s12, s22, µA =1), (s11, s21, µA < 1/3 ),
(s11, p(s21 ) ≥ ½, µA = 1/3 ) }
aber: µA ≤ 1/3 unplausibel, da
s13 von s11 strikt dominiert →
Markteintritt nur mit s12 sinnvoll!
(-1,1)
Anwendungen der Spieltheorie in den Wirtschaftswissenschaften
62
Unvollständige Information und Signalspiele
Beispiel 2: Unvollständige Information über Markteintreter
ts
1-θ
Idee: potentieller Neueintreter kann
schwach (tw) oder stark (ts) sein
s21
(-1,-1)
T1 = {ts,tw}, T2 = M
π = {µ(ts) = θ , µ(tw) = 1−θ }
s22
(1,1)
als A-priori-Wahrscheinlichkeiten
s21
(-½,2)
Signal durch Markteintritt:
- Trennungs-Gl.gew.: µ(ts |s12) = 1
s11
s12
θ
(0,4)
A
s12
B
tw
s22
(-1,1)
s11
(0,4)
© K. Morasch 2007
- Pooling- Gl.gew.: µ(ts |s12) ≤ 1/3
Verfeinerung:
Monopolist schließt aus, dass Neueintreter dominierte Strategie spielt
Anwendungen der Spieltheorie in den Wirtschaftswissenschaften
63
Herunterladen