4.2 Wiederholte Spiele und kooperatives Verhalten 4.2.1 Zum

Werbung
4
Dynamische Spiele
4.2
Wiederholte Spiele und kooperatives Verhalten
81
4.2.1 Zum Konzept des wiederholten Spiels
• Die Auszahlungen der Spieler in einer Periode hängen nur von den in
der jeweiligen Periode gewählten Handlungen ab. (Also nicht: heute investiertes Kapital verändert zukünftige Kosten).
• Die Spieler haben die Möglichkeit, Aktionen in der aktuellen Periode t
vom bisherigen Spielverlauf abhängig zu machen: Es kann für einen
Spieler attraktiv sein, auf die Wahrnehmung kurzfristiger Gewinne zu
verzichten, wenn ein derartiges Verhalten Vergeltungsmaßnahmen der
Mitspieler herausfordert und damit in späteren Perioden Verluste brächte.
• Die Wirksamkeit von Vergeltungsmaßnahmen hängt davon ab, wie stark
die Spieler spätere Auszahlungen gewichten.
• Ob andere Lösungen als die Wiederholungen der Nash-Gleichgewichte
realisierbar sind, hängt entscheidend vom Zeithorizont ab (endlich vs.
unendlich oft wiederholte Spiele).
4.2.2 Das Gefangenendilemma als wiederholtes Spiel
Neuerungen: (1) Aktionen statt Strategien
(2) Auszahlungen so normiert, dass Berechnungen erleichtert
werden.
Gegeben:
Gefangenendilemma als Stufenspiel
a21
a22
a11
(1,1)
(-1,2)
a12
(2, -1)
(0,0)
*
4
Dynamische Spiele
Problem:
82
Der Grund für das Gefangenendilemma liegt letztlich nicht in der
mangelnden Kommunikation, sondern in der Unmöglichkeit, bindende Verträge abzuschließen.
(3) Das Gefangenendilemma wird nicht nur in einer, sondern über
T (endliche) Perioden hinweg gespielt (endliche Wiederholung).
Satz:
Das einzige perfekte GG ist die nicht-kooperative Strategie (a12,
a22) in T. In T ist das Spiel zu Ende. Es gibt keine Kooperationsdividende, also wird nicht kooperativ gespielt.
Beweis:
Würden beide Spieler in T-1 kooperativ spielen (a12, a22) wollen,
so ist dies kein GG, denn weicht einer davon ab – (a12, a22) oder
(a12, a21) –, so kann der andere in T keine Bestrafung mehr vornehmen. Also spielen sie auch in T-1 nicht-kooperativ. Dieser
Prozess lässt sich bis in die Gegenwart fortsetzen.
(4) Vorstellbar ist auch, dass der Zeithorizont unendlich ist; das
bedeutet, dass es keine Endperiode mehr gibt, in der Strafen
möglich sind.
Satz:
Im Falle des unendlichen Zeithorizonts kann Kooperation erreicht
werden. Jeder Spieler spielt kooperativ und zwar solange, bis ein
Mitspieler abweicht. Von da an legen alle Spieler nichtkooperatives Verhalten an den Tag.
Instrument: Triggerstrategie (am Beispiel der obigen Auszahlungsmatrix):
Grim Trigger Strategie ist eine von mehreren möglichen!
Dynamische Spiele
4
∞
∑ δ t ⋅1
≥
t =0
83
2+
∞
∑δt ⋅0
t =0
Summe der diskontierten
Summe der diskontierten ≥ Einmaliger Gewinn + anschließenden Nutzeneinbußen
aus
Vertrauensbruch.
Kooperationsvorteile
wegen Glaubwürdigkeitsverlust
∞
Für ∑ δ t =
t =0
ist
1
1− δ
und zwar im Intervall 0 ≤ δ ≤ 1
1
0 ⋅δ
≥ 2+
1− δ
1− δ
0
1
≥2
1− δ
1 ≥ 2 − 2δ −2
−1 ≥ −2δ
1 ≤ 2δ
1
≤δ
2
:2
oder
Satz:
δ≥
1
2
Wenn die Zeitpräferenz sehr hoch ist und damit δ sehr klein, spielt
die Zukunft keine Rolle. Im umgekehrten Fall spielt die Gegenwart
(fast) keine und nur die Zeitpräferenz eine wichtige Rolle.
Beispiel:
(Nicht-) Kooperation in der Wirtschaftspolitik
Gegeben:
2 Länder, die untereinander durch Handel und Kapitalverkehr verbunden sind. Betreiben beide Länder eine kooperative Strategie,
so sind ihre Geldmengenexpansion und die Inflationsrate identisch: Keines der Länder versucht, durch Geldmengenausweitung,
Inflationsratenerhöhung (von πC auf πREN bzw. π∗C auf π∗REN) und
nachfolgende Erhöhung der (nominalen + realen) Wechselkurse
(Abwertung), sich Wettbewerbsvorteile zu verschaffen.
Dynamische Spiele
4
84
Annahme: Das Inland kann gegenüber dem Ausland (*) folgende Inflationsra-
ten wählen:
πΝC
πC
wenn
C
πt+i =π
πt+i =π
π∗t = π∗C
wenn
NC
π∗t = π∗NC
wenn
REN
πt=π
π∗t-1 = π∗C
Die „Versuchung“ des Inlands besteht in der Verlustdifferenz LC- LREN wobei
LC=f(πC, π∗C) und LREN=f (πREN, π∗C). Nach einer einmaligen Täuschung des
Auslands gilt für P Perioden LNC= f(πΝC, π∗ΝC). Damit sich Täuschen nicht lohnt,
muss also gelten:
(
)
⎡⎣LNC − LC ⎤⎦ λ + λ 2 + ...λ P ≥ LC − LREN
Für λ + λ + ...λ
2
⎡⎣LNC − LC ⎤⎦ ⋅
P
gilt die Formel: =
λ (1 − λ P )
1− λ
λ (1 − λ P )
≥ ⎡⎣LC − LREN ⎤⎦
1− λ
Fall A: Für P → ∞ wird aus der Formel:
λ
1− λ
und aus der Ungleichung
λ
⎡⎣LNC − LC ⎤⎦ ⋅
≥ ⎡LC − LREN ⎤⎦
1− λ ⎣
oder
⎡ LC − LREN ⎤
≥⎢
⎥
1 − λ ⎣ LNC − LC ⎦
λ
4
Dynamische Spiele
Für λ → 1 ist lim
λ
1− λ
85
≅ ∞ für λ → 1
Für jedes λ in der Nähe von 1 kann also Kooperation durchgesetzt werden!
Fall B: Für P = 1 wird aus der Ungleichung:
λ (1 − λ )
⎡ LC − LREN ⎤
= λ ≥ ⎢ NC
C ⎥
1− λ
⎣ L −L ⎦
:[
]
Da λ ≤ 1, verlangt diese Bedingung, dass
⎡⎣LNC − LC ⎤⎦ > ⎡⎣LC − LREN ⎤⎦
die einperiodigen Vorteile aus Kooperation größer sind als die einperiodigen
Vorteile der Täuschung.
Dynamische Spiele
4
86
Exkurs 1
⎡⎣L − L ⎤⎦ ⋅
r
f
λ (1 − λ P )
1− λ
≥ ⎡⎣Lf − LC ⎤⎦
Für λ (von oben) = γ:
⎡ 1
⎤ λ (1 − λ ) P ⎡ 1
⎤
1
1
2
2
2
2
⎢ 2 ⋅ ( Rbt ) − ( Rbt ) ⎥ ⋅
≥ ⎢ ( Rbt ) − λ ( Rbt ) ⎥
2
1− λ
2
⎢⎣ 2γ
⎥
⎢⎣ 2 Z
⎥⎦
⎦
Z
Z
Z
⎡ 1
1 ⎤ λ (1 − λ )
⎡1 1 ⎤
≥ ⎢ − γ ⎥Z
⎢ 2γ 2 − 2 ⎥ Z ⋅ 1 − λ
⎣2 2 ⎦
⎣
⎦
P
⎤ λ (1 − λ )
1⎡ 1
− 1⎥ ⋅
≥ [1 − γ ]
⎢
2
2 ⎣γ
⎦ 1− λ
:Z
P
:Z
⎡1
⎤ λ (1 − λ )
−
1
≥ [1 − γ ]
⎢γ 2
⎥ ⋅ 1− λ
⎣
⎦
P
Fall A: Für P → ∞ wird aus der Formel
⎡1
⎤ λ
⎢ γ 2 − 1⎥ ⋅ 1 − λ ≥ [1 − γ ]
⎣
⎦
λ
1− λ
≥
(1 − γ )
⎛ 1
⎞
⎜ γ 2 − 1⎟
⎝
⎠
=
oder
(1 − γ )
⎛ 1− γ 2 ⎞
⎜ 2 ⎟
⎝ γ ⎠
und aus der Ungleichung
4
Dynamische Spiele
87
Exkurs 2
∞
Für λ → 1 ist lim
Für jedes λ in der Nähe von eins kann also Fixing bzw. Preisniveaustabilität
durchgesetzt werden!
Fall B: Für P = 1 wird aus der Ungleichung:
λ (1 − λ )
(1 − γ )
=λ≥
1− λ
⎛ 1− γ 2 ⎞
⎜ 2 ⎟
⎝ γ ⎠
Das λ ≤ 1 verlangt diese Bedingung, dass
⎛ 1− γ 2 ⎞
2
⎜ 2 ⎟ > (1 − γ ) ⋅γ
⎝ γ ⎠
1 − γ 2 > γ 2 − γ 3 oder
1 > 2γ 2 − γ 3
Exkurs 3
Beispiel:
γ =
γ =
α
α +θ2
; α = 0,9
θ = 0,9
0,9
= 0,526
0,9 + 0,81
γ 2 = 0,277 ⇒ 2γ 2 = 0,554
γ 3 = 0,146
Bedingung:
1 > 0,554 – 0,146 = 0,408 leicht erfüllt!
Dynamische Spiele
4
88
4.2.3 Auszahlungsmöglichkeiten
Die Menge aller zulässigen Auszahlungsvektoren ist gegeben durch die Auszahlungen des Konfliktpunktes des Nash-Gleichgewichts und der Menge aller
Auszahlungsvektoren, die besser sind als die Auszahlungen C des NashGleichgewichts (einschließlich des paretooptimalen Punktes P):
U2
P
1
0
0
U1
1
Beispiel: Lohn-Verhandlungsmodelle
Das Monopolgewerkschaftsmodell
Die Gewerkschaften bestimmen den Lohn, die Arbeitgeber müssen diesen akzeptieren, entscheiden aber entsprechend über die Höhe der Beschäftigung
im jeweiligen Sektor. In die Zielfunktion der Gewerkschaften gehen sowohl der
Reallohn w (Preisniveau auf 1 normiert), als auch die Höhe der Beschäftigung
der Gewerkschaftsmitglieder A im jeweiligen Sektor ein. Sie lautet:
(1)
U (w , A) =
A ⋅w
EK der Gewerkschaftsmitglieder
bei Beschäftigung im Sektor
mit:
+
(M − A ) ⋅ w A
(utilitaristische NF),
EK der Gewerkschaftsmitglieder
bei Nichtbeschäftigung im Sektor
M = Anzahl der Gewerkschaftsmitglieder,
A = Anzahl der im Sektor beschäftigten Gewerkschaftsmitglieder,
4
Dynamische Spiele
89
w = Reallohn im Sektor,
wa = Reallohn außerhalb des Sektors
AN= Arbeitsnachfrage mit δAN/δw < 0
Es wird also das Gesamteinkommen der Gewerkschaftsmitglieder berücksichtigt. Totales Differenzieren der Zielfunktion ergibt:
A ⋅ dw + w ⋅ dA − w A ⋅ dA = 0
(2)
Ausklammern nach dA und Umstellen ergibt:
A ⋅ dw = −dA ⋅ (w − w A )
(3)
Durch Umformen erhält man:
dw
w − wA
=−
dA
A
(4)
(Steigung der Indifferenzkurve)
Es besteht also eine Trade-off-Beziehung, da die Gewerkschaften für einen
höheren Lohn bereit sind, auf Beschäftigung zu verzichten. Der EinkommensZuwachs durch den höheren Lohn muss genau dem Einkommens-Verlust
durch die geringere Beschäftigung entsprechen, damit das Nutzenniveau unverändert bleibt.
Das Optimierungskalkül der Gewerkschaften lautet:
max U (w , A ) = A ⋅ w + (M − A ) ⋅ w A
(5)
u.d.NB: AN = AN (w ,Y )
Einsetzen der Nebenbedingung ergibt:
max U (w , A(w ,Y )) = A(w ,Y ) ⋅ w + (M − A(w ,Y )) ⋅ w A
(6)
Die Bedingung erster Ordnung lautet:
!
∂U ∂A
∂A
=
⋅w + A −
⋅wA =0
∂w ∂w
∂w
(7)
Ausklammern und Umformen ergibt:
− Aw ⋅ (w − w A ) = A bzw. −
(8)
(9)
−
(w − w A )
= 1/ Aw
A
Aw (w − w A )
=1
A
[Steigung der Indifferenzkurve = Steigung der
(inversen) AN-Kurve]
4
Dynamische Spiele
90
•
Im Optimum muss demnach die Steigung einer Indifferenzkurve gerade
der Steigung der (inversen) Arbeitsnachfragefunktion entsprechen
(Tangentialpunkt)
•
Die Indifferenzkurven weisen eine abnehmende Grenzrate der Substitution auf
•
Das Alternativeinkommen wA führt eine Untergrenze in das Indifferenzkurvenfeld ein, unter wA kann der Lohnsatz nicht fallen
•
Da bei Punkt M bereits Vollbeschäftigung unter den Gewerkschaftsmitgliedern herrscht, hat die Gewerkschaft jenseits von M an zusätzlicher
Beschäftigung kein Interesse mehr, die Indifferenzkurve knicken deshalb bei M horizontal ab
•
Der Lohn wM liegt über dem gleichgewichtigen Lohn w*, die Beschäftigung AM entsprechend unterhalb der gleichgewichtigen Beschäftigung
A*
•
Durch die Monopolgewerkschaft entsteht demnach (unfreiwillige) Arbeitslosigkeit
Optimierungskalkül der Gewerkschaften im Monopolgewerkschaftsmodell
w
U0
U1 U2
AA
wM
w*
wA
AN
AM
A*
M
A
In der Realität können die Gewerkschaften den Lohn nicht einfach festsetzen.
Vielmehr verhandeln Gewerkschaften und Arbeitgeber über die Lohnhöhe, es
liegt so etwas wie ein bilaterales Monopol vor.
Dynamische Spiele
4
91
Der Right-to-Manage-Ansatz (RTM)
Im Right-to-Manage-Ansatz (RTM) verhandeln die Tarifparteien über die
Lohnhöhe. Im Anschluss an die Verhandlungen entscheiden die Unternehmen
in Abhängigkeit des ausgehandelten Lohnes über die Beschäftigungshöhe.
Die Verhandlungen können prinzipiell zu einer einvernehmlichen Lösung führen oder auch scheitern.
Scheitern der Verhandlungen:
• Alle Gewerkschaftsmitglieder sind arbeitslos und erhalten wA (U0 =
M⋅wA)
• Die Unternehmen machen einen Gewinn von 0 (π0=0)
Erfolgreiche Verhandlungen:
• Die
Gewerkschaften
erzielen
einen
Nutzen
in
Höhe
von
U (w , A ) = A ⋅ w + ( M − A ) ⋅ w A . Der Nutzenzuwachs aufgrund der erfolg-
reichen Verhandlungen beläuft sich auf U − U 0 = A ⋅ (w − w A )
• Die Unternehmer erzielen einen Gewinn von π = y ( A) − w ⋅ A . Ihr Gewinnzuwachs aufgrund der erfolgreichen Verhandlungen beläuft sich auf
π − π0 = π = y ( A ) − w ⋅ A
Das Lösungsproblem (Nash Verhandlungslösung)
Es gibt vier Anforderungen für mögliche Lösungen des Verhandlungsproblems:
• Es kommen nur solche Lösungen in Frage, bei denen sich weder die
Gewerkschaften noch die Unternehmen schlechter stellen als bei abgebrochenen Verhandlungen ( π ≥ π 0 ; U ≥ U 0 )
• Sogenannte „Invarianz“: Die Lösung soll unabhängig von den „Einheiten” sein, in denen der Nutzen gemessen wird
• Die Lösung soll unabhängig von irrelevanten Alternativen sein
• Pareto-Effizienz soll gewährleistet sein
4
D
Dynamisch
he Spiele
92
Da die
e Lösung pareto-op
ptimal sein
n muss, kommen
k
n Lösun
nur
ngen auf der
d Begrenzu
ungslinie in Betrach
ht. Die Begrenzung
gslinie stelllt alle Pun
nkte dar, bei denen eine Steige
erung des Nutzens der Gewerkschafte
en (des G
Gewinns der
d Unternehmen) nich
ht möglich
h ist, ohne
e den Gew
winn der Unternehm
U
men (den Nutzen
der Ge
ewerkschaften) zu schmäle
ern (Analo
og zur Tra
ansformationskurve
e einer
Wirtschaft).
Möglicche Lösungen:
• Punkt A: Nur die Gewerksch
G
haft realis
siert einen Verhandlungsgew
winn
• Punkt B:: Gewerksschaft und Unterne
ehmen re
ealisieren einen Ve
erhandlungsgew
winn
• Punkt C: Nur die Unternehm
U
men realis
sieren eine
en Verhan
ndlungsge
ewinn
• Welcher Punkt auff der Begrenzungslinie erreiccht wird, iist abhäng
gig von
der Verha
andlungsm
macht derr Tarifpartteien
• Die Lage
e des Dro
ohpunktess wird bes
stimmt du
urch den Nutzen der
d Gewerkscha
aften bzw
w. den Ge
ewinn der Unterneh
hmen, wenn die Lo
ohnverhandlung
gen scheittern (Α0, U0)
Möglicche Ergebnisse der Lohnverh
handlung
Dynamische Spiele
4
93
Das Maximierungsproblem
(1)
NP = (U − U0 )β ⋅ ( π − π0 )1−β
NB : A N = A N (w ) ,
mit β (1-β) als Maß für die Verhandlungsmacht der Gewerkschaften (der Unternehmen)
(2)
max NP = (U − U 0 )β ⋅ ( π − π0 )1−β
w
mit β=1: gesamte Verhandlungsmacht bei den Gewerkschaften:
(3)
NP = U − U 0 = A ⋅ [u (w ) − u (w A )] ; A=A(w)
(4)
!
∂NP
= Aw [u(w ) − u(w A )] + A ⋅ uw = 0
∂w
(5)
−[u (w ) − u (w A )]
1
=
Aiuw
Aw
mit u(w) = w,
(6)
∂u(w )
= uw = 1 und u(wA) = wA:
d (w )
(w − w A )
−
= 1/ Aw
A
⇒ Optimalbedingung im Monopolgewerkschaftsmodell
mit β = 0: gesamte Verhandlungsmacht bei den Unternehmen:
(7)
NP = π − π 0 = Y ( A ) − w ⋅ A
(8)
!
∂NP
= YA − w = 0
∂A
(9)
YA = w = w *
⇒ Optimalbedingung bei vollkommener Konkurrenz:
• Je größer die Macht der Gewerkschaften ist, desto näher liegt das Ergebnis am Ergebnis des Monopolgewerkschaftsmodells und desto niedriger (höher) ist die Beschäftigung (der Lohn)
• Sowohl der Lohn, als auch die Beschäftigung liegen im RTM-Modell
zwischen dem Ergebnis des Monopolgewerkschaftsmodells und dem
Ergebnis bei vollkommener Konkurrenz.
4
Dynamische Spiele
94
4.2.4 Das Rubinstein-Verhandlungsmodell
Typ:
Spiel mit unendlichem Zeithorizont
Gegeben: Zwei Spieler machen abweichend Vorschläge über die Aufteilung
eines Kuchens von der Größe 1. Jeder Spieler kann entweder den
Vorschlag des anderen annehmen oder einen Gegenvorschlag
machen, allerdings erst in der nächsten Periode. Wegen des „Eisbergprinzips“ ist die Torte aber in der nächsten Periode kleiner als
in der vorangegangenen.
t
0
0 a
1
x, 1
x
ja
1
a
2
nein
Aktion von Spieler 1 Aktion von Spieler 2
in Stufe null
in Stufe eins
ja
nein
Ergebnis:
t
1
a
2
2
1
y, y
z=(z1, z2)
z= (x, 1-x)
Bewertung der Ergebnisse:
U i = δ ti zi mit 0 ≤ δ i ≤ 1;
δ =
1
; r = Diskontfaktor
1+ r
Ein δ von Null steht für vollständige Gegenwartspräferenz. Die Höhe des Nutzens für die beteiligten Spieler hängt von dem Verteilungsschlüssel und der
Dauer der Verhandlungen ab.
4
Dynamische Spiele
95
Teilspielperfektes Gleichgewicht
Für jedes Teilspiel, das in Periode t ≥ 0 beginnt, muss ein Nash-GG existieren.
Lösungshilfe:
Wir nehmen an, dass in allen geraden (ungeraden) Perioden Spieler 1 (Spieler
2) einen Vorschlag macht. Bei unendlichem Zeithorizont (T=∞) bedeutet dies,
dass das Spiel in allen geraden bzw. ungeraden Perioden identisch ist. Es sei
denn, es wurde zuvor beendet.
Arbitrage-Bedingungen:
Das Angebot von Spieler 2 (Spieler 1) an Spieler 1 (Spieler 2) in Periode t ist
so groß, wie das, was Spieler 1 (Spieler 2) in der Periode t+1 für sich selbst
vorsieht:
!
δ t 1 (1 − y ) = δ1t +1 ⋅ x
(1 − y ) = δ1 ⋅ x
Ry ( x ) : y = 1 − δ1x
δ t 2 (1 − x ) = δ 2t +1 ⋅ y
(1 − x ) = δ 2 ⋅ y
Rx ( y ) : x = 1 − δ 2 y
t
δ1
bzw.
:δ2
t
Die dazugehörige Graphik sieht wie folgt aus:
y
1
- δ1
- δ2
1
x
Dynamische Spiele
4
96
Je höher δ, desto geduldiger der jeweilige Spieler (in der Zeichnung ist Spieler
2 geduldiger als Spieler 1). Das Nash-GG stellt sich im Schnittpunkt der Reaktionskurven ein:
y
1 − x = δ 2 (1 − δ1x )
1 − x = δ 2 − δ 2δ1x
1 − δ 2 = x (1 − δ 2δ1 )
x* =
1− δ2
1 − δ1δ 2
Dieses Ergebnis gilt in den Perioden 0,2. …
Einsetzen in Ry ( x ) : y = 1 − δ1x ergibt: y = 1 −
y* =
δ1 (1 − δ 2 )
1 − δ1δ 2
1 − δ1δ 2 − δ1 + δ1δ 2 ⎛ 1 − δ1 ⎞
=⎜
⎟
1 − δ1δ 2
⎝ 1 − δ1δ 2 ⎠
Dieses Resultat gilt in den Perioden t=1,3. …
Der Ergebnis- oder Lösungsvektor lautet demnach aus der Sicht von Spieler 1:
z=
⎡
⎤
⎢
⎥
⎢ ⎡ 1 − δ 2 ⎤ ⎡ (1 − δ 1 ) δ 2 ⎤ ⎥
⎢ ⎢1 − δ δ ⎥ , ⎢ 1 − δ δ ⎥ ⎥
1 2⎦ ⎣
1 2 ⎦
⎢⎣
⎥
⎢⎣
x
1 − x = δ 2 y ⎥⎦
Auswirkungen von Reihenfolge und Diskontfaktor:
z
Ist δ 2 = 0 → (1 − x ) = 0 → (1,0 )
⎧δ = 0
Ist ⎨ 1
⇒ z = (1 − δ 2 , δ 2 )
⎩δ 2 ≠ 0
δ ⎞
⎛ 1
Ist δ1 = δ 2 = δ > 0 ⇒ z = ⎜
,
⎟
⎝ 1+ δ 1+ δ ⎠
4
Dynamische Spiele
97
⎛ 1 1⎞
Für δ → 1 ⇒ z = ⎜ , ⎟ ergibt sich die Gleichverteilung. Insgesamt zeigt sich,
⎝2 2⎠
dass es vorteilhaft ist, geduldig zu sein (je höher das eigene δ, desto größer
der eigene Anteil am Kuchen).
4.2.5 Probleme und Erweiterungen
Beispiele für stochastische Spiele: Das Kartell
In einem Oligopol-Modell mit Schwankungen der Nachfrage agieren zwei Anbieter, die sich zu einem Kartell zusammenschließen.
Exkurs: Das Kartell als Kollektivmonopol
Als Kartell bezeichnet man eine Vereinbarung zwischen Unternehmen der
gleichen Produktionsstufe zum Zwecke der Wettbewerbsbeschränkung. Gegenstand der Vereinbarung sind somit wettbewerbliche Aktionsparameter wie
Angebotsmengen, Konditionen, Qualität, Rabatte und Preise. Als Preiskartell
bezeichnet man demgemäß eine entsprechende Vereinbarung über den Preis
eines Gutes.
Gruppengewinnmaximierung im Kollektivmonopol als Ausgangspunkt der Analyse
Im Thema ist das Modell des „reinen Kollektivmonopols“ als Ausgangspunkt
der Analyse vorgegeben. Es soll zunächst dargestellt werden.
Voraussetzung des Modells:
(1) Alle Anbieter eines Marktes schließen sich zu einem Kollektivmonopol
zusammen;
(2) Der Markt sei vollkommen (keine zeitlichen, räumlichen, sachlichen und
personellen Präferenzen);
4
Dynamische Spiele
98
(3) Die Produktionsanlagen der Unternehmen seien fix und vorgegeben; es
handele sich um Ein-Produktunternehmen; technischer Fortschritt finde
somit nicht statt;
(4) Auf dem Beschaffungsmarkt herrsche vollkommene Konkurrenz; die Faktorpreise werden durch den Zusammenschluss also nicht berührt; sie
werden als „gegeben“ (konstant) angenommen; aus (3) und (4) folgt:
„Gegebene“ (konstante) langfristige Kostenfunktionen;
(5) Die Nachfragefunktion ändere sich nicht;
(6) Verhaltensannahmen: Vor Zusammenschluss Gewinnmaximierung; nach
Zusammenschluss Gruppengewinnmaximierung.
Um das Ziel der individuellen Gewinnmaximierung unter Konkurrenz erreichen
zu können, müssen sich die Anbieter entsprechend der Maxime „Grenzkosten
= Grenzerlös = Preis“ verhalten. Sie sind dann Mengenanpasser. Daher ergibt
sich die Gesamtangebotskurve am Markte durch horizontale Aggregation der
individuellen Grenzkostenkurven vom Betriebsminimum an
.
. Der
Marktpreis ist dann bestimmt durch den Schnittpunkt der Nachfrage mit der
Angebotskurve (in der Abbildung ist der Marktpreis mit pm bezeichnet).
Schließen sich nun die Unternehmen zu Kollektivmonopol zusammen, müssen
sie, wollen sein den Gruppengewinn maximieren, als Gesamtheit entsprechend der Maxime „aggregierte Grenzkosten = Grenzerlös“ planen. Es ergäbe
sich dann eine Angebotsmenge in Höhe von mk, die einen Preis in Höhe von
pk ermöglichen würde (vgl. Abbildung). Verhielten sich nun die Mitglieder des
Kollektivs weiter individuell gewinnmaximierend, so würden sie beim Preis pk
wegen GK = pk, die Menge anbieten, welche wiederum nur zum Preis pk, abgesetzt werden könnte. Das Kollektivmonopol muss also über die Preisabsprache hinaus zur Lösung des Konflikts zwischen Gruppen- und Individualinteresse
noch
eine
entsprechende
Mengenabsprache
treffen.
Die
Mengenrestriktion muss nun aber notwendigerweise dem Grenzkostenprinzip
genügen (ansonsten sind die Gruppenkosten nicht minimiert und der Gruppengewinn somit nicht maximiert).
4
Dynamische Spiele
99
GK, K, P
K
PK
’
GK, K, P
K’
f1
K1’
GK, K, P
’
2
K
f2
GK, K, P
K’ fges.
N
f3
’
3
K
DVK2
Pm
PK’
PV
K’
DVK3
E’
DVK1
m
K’ges.
m
m
mK
N
mK’
m
Dynamische Spiele
4
100
Ende Exkurs
Aufgrund von stochastischen Störeinflüssen schwankt der Marktpreis. Nun
können Preissenkungen (-Erhöhungen) von den einzelnen Kartellmitgliedern
als Signal aufgefasst werden, dass andere Kartellmitglieder von der ihnen „zustehenden“ Kartellmenge (Quote) abweichen. Als Spiel lässt sich diese Situation wie folgt modellieren: Beide Kartellmitglieder starten mit der ihnen zugeordneten Kollusionsmenge (= halbe Monopolmenge). Stellt einer der Spieler
fest, dass der Preis unter den Monopolpreis fällt (bzw. vermutet er, dass das
andere Unternehmen von der Menge
X
abgewichen ist), so wählt er die
Cournot-Angebotsmenge in T-Perioden (Strafperiode der Länge T): Eine
Rückkehr zur Kollusion zwischen den Anbietern im Oligopol ist dann nach Ablauf der Strafperiode möglich.
Beispiel für den Anreiz, Drohstrategien nicht auszuführen: Das neu verhandlungspolitische Gleichgewicht
Gegeben sei das folgende Gefangenendilemma:
s21
s22
s11
(3,3)
(1,4)
s12
(4,1)
(2,2)*
Beide Spieler können sich am Anfang auf die kooperative Lösung (3,3) einigen, die durch eine Trigger-Strategie (s. o.) auch durchgesetzt werden kann.
Weicht der eine Spieler davon ab, dann wechselt der andere sofort zur Strategie si2 und es stellt sich das altbekannte Nash-GG ein.
Diese Vorgehensweise ist aber nicht, wie man sagt, „neuverhandlungsstabil“:
Eine Rückkehr zu dem Ausgangspfad der Kooperation würde für alle Beteiligten eine Auszahlung von 3 ermöglichen, während der Vergeltungspfad nur die
Dynamische Spiele
4
101
Auszahlung 2 liefert. Es besteht deshalb ein starker Anreiz, die „Vergangenheit zu vergessen“ und aufs Neue mit dem Ausgangspfad zu beginnen.
Problem: Weil dann aber eine Abweichung ohne Folgen bleiben würde, käme
eine Kooperation von Anfang an nie zustande!
Lösung: Sobald Spieler i von dem Kooperationspfad abweicht, spielt j als
Vergeltung seine 2. Strategie (s12 oder s22). Er tut dies aber nur solange, wie der Abweichende i keine Reue zeigt. Spieler i kann sein
Vergehen bereuen, indem er selbst die kooperative Strategie (s11
oder s21) spielt, um damit dem Gegner j einen (einmaligen) Vorteil
zuzugestehen und sich selbst an der eigenen Strafe zu beteiligen.
Sobald Spieler i sein Abweichen bereut hat, kehrt auch der Strafende j zur Kooperation zurück. Es besteht dann kein Anreiz zu Neuverhandlungen!
Beispiel für ein Stufenspiel mit mehreren Nash-Gleichgewichten: F&EKooperation zwischen 2 Unternehmen:
Gegeben sei das folgende Gefangenendilemma:
a21
a22
a23
a11
(1,1)
(-1,2)
(-2,2)
a12
(2,-1)
(0,0)
(-2,-2)
a13
(-2,-2)
(-2,-2)
(-2,-2)
Die kooperative Lösung ist in der Nordwest-Ecke der Matrix, jedes Unternehmen hat allerdings den Anreiz, sich auf Kosten des anderen Unternehmens
Vorteile zu verschaffen (durch die Aktionen a12 bzw. a21). Verhält sich eins der
Unternehmen einmal nicht-kooperativ, so kann der Abbruch der Kooperation
durch die Strategie ai3 gewählt werden. Diese Kombinationen sind aber (vgl.
Matrix) für beide Unternehmen sehr ungünstig.
4
Dynamische Spiele
102
Lösung: Es existiert immer ein δ für das der völlige Abbruch der Kooperation in
der Zukunft nicht lohnend erscheint.
Periode
↓
Spieler a1i1 → 1 + δ ⋅ 0 = 1
a1i2 → 2 + δ ⋅ (-2) = 2 - 2 δ
Daraus folgt: Für 1 > 2 – 2 δ => δ > ½. Für Werte von δ > ½ ist der Übergang
zur Nash-Lösung (0,0) allemal attraktiver als der völlige Abbruch der Zusammenarbeit. Weitere Komplikationen oder Erleichterungen für kooperatives
Verhalten können immer dann auftreten, wenn etwa „irrationale“ Spieler vorhanden sind: Diese würden bei Verlassen des Kooperationspfades keine Reue
vom Gegenspieler erwarten und auch keine eigene aktive Bestrafung vornehmen. Damit wird aber der Anreiz zur Kooperation auf der Gegenseite deutlich
vermindert. Sogenannte „beschränkte Rationalität“ (Englisch: bounded rationality) liegt etwa dann vor, wenn einer der Spieler nicht nach maximalem Gewinn
strebt, sondern bereits mit einem „befriedigenden Ergebnis“ zufrieden ist. In
solchen Fällen versagen die preistheoretischen Konzepte von Cournot, Stackelberg und gemeinsamer Gewinnmaximierung.
4
Dynamische Spiele
103
4.3
Unvollständige Informationen: Bayes-Nash und sequentielles
Gleichgewicht
4.3.1 Einleitung
Zufallszüge der Natur
In vielen Spielen gibt es exogene Unsicherheit. Wir können das modellieren,
indem wir einen zusätzlichen Spieler, die „Natur“, einführen, die aus der Menge der möglichen Zustände der Welt einen nach einer gegebenen Wahrscheinlichkeitsverteilung auswählt.
Markteintrittspiel bei exogener Unsicherheit
A
Eintritt
Natur
1
2
0
4
1
2
B (niedrige NE)
(hohe NE) C
Preiskrieg
0
0
Auf tei- Preislung krieg
3
3
-1
-1
Aufteilung
1
1
Nach der Eintrittsentscheidung realisiert sich der Zustand der Welt:
•
Mit Wahrscheinlichkeit ist die Nachfrage groß, beide können hohe
Gewinne machen.
•
Mit Wahrscheinlichkeit ist die Nachfrage niedrig, beide machen bei
Wettbewerb Verluste.
Asymmetrische Information
Bisher haben wir angenommen, dass alle Spieler vollständig über die Struktur
des Spiels informiert sind. Insbesondere weiß jeder Spieler, was die Auszahlungsfunktion seines Gegenspielers ist. In diesem Kapitel werden wir diese
Dynamische Spiele
4
104
Annahme abschwächen und zeigen, wie Spiele mit asymmetrischer Information modelliert und analysiert werden können.
Als einführendes Beispiel betrachten wir das folgende (simultane) Marktzutrittsspiel:
• Spieler 1 (der bisherige Monopolist) entscheidet, ob er eine neue Fabrik
zur Kapazitätserweiterung baut oder nicht.
• Spieler 2 entscheidet, ob er in den Markt eintritt.
• Spieler 1 kennt die Kosten einer Kapazitätserweiterung, nicht aber Spieler 2. Dieser weiß nicht, ob die Auszahlungen nach Kosten 3 oder 0
sind. Er glaubt, dass die Wahrscheinlichkeit hoher Kosten p1 ist.
• Die Profitabilität des Marktzutritts für Spieler 2 hängt von der Kapazitätserweiterung und damit indirekt von deren Kosten ab:
Marktzutrittsspiel (Variante1)
2
2
1
Investition
Keine I.
Zutritt
Kein Z.
0, -1
2,0
2,1
1
3,0
Hohe Inv.-Kosten
für Spieler 1
·1
1
1
Kein Z.
3, -1
5,0
2,1
3,0
Niedrige Inv.-Kosten
für Spieler 1
Für Spieler 2 ist der Erwartungswert des Zutritts:
2
Zutritt
0
Dynamische Spiele
4
1
2
105
0
1
Analyse des Spiels
•
Spieler 1 hat eine dominante Strategie:
−
„Investiere nicht“, falls die Kosten hoch sind.
−
„Investiere“, falls sie niedrig sind.
• Spieler 2 wird zutreten, wenn
.
• Spieler 2 ist indifferent, wenn
. Dann ergibt jede Zutrittswahr-
scheinlichkeit von Spieler 2 ein Gleichgewicht.
Das Spiel wird etwas komplizierter, wenn die Auszahlungen für Spieler 1 bei
niedrigen Investitionskosten statt 0 betragen:
Marktzutrittsspiel (Variante 2)
2
1
Investition
Keine I.
Zutritt
Kein Z.
0, -1
2,0
2,1
3,0
Hohe Inv.-Kosten
für Spieler 1
(Typ Hoch)
1
2
Zutritt
Kein Z.
3
-1
2,
7
2, 0
2,1
3,0
Niedrige Inv.-Kosten
für Spieler 1
(Typ Niedrig)
Dynamische Spiele
4
106
Analyse des Spiels
Wenn Spieler 1 hohe Kosten hat, hat er wieder die dominante Strategie, nicht
zu investieren.
Wenn Spieler 1 niedrige Kosten hat, hat er keine dominante Strategie mehr.
Seine optimale Strategie hängt jetzt von der Wahrscheinlichkeit
ab, die er
dem Ereignis zuordnet, dass Spieler 2 zutritt. Er wird investieren, falls
y
1
7
2
7
2
2y
2y
0,5
y
y
2y
2y
3
y
3
y
3 1
y .
3y
oder
0,5
Analog zu den oben behandelten gemischten Strategien, wird Spieler 1 die
reine Strategie „Investieren“ wählen für y
Strategie „Nicht-Investieren“ wählen. Für y
0,5. Für y
0,5 wird er die reine
0,5 ist er indifferent, er wählt
einen Zufallsmechanismus im Intervall zwischen 0,1 .
Formal: Sei
die Wahrscheinlichkeit mit der Spieler 1 investiert. Seine Beste-
Antwort-Korrespondenz ist dann
1
0,1
0
1/2
1/2
1/2
Was wird Spieler 2 tun? Sei
die Wahrscheinlichkeit, die Spieler 2 dem
Ereignis zuordnet, dass Spieler 1 investiert, gegeben, dass Spieler 1 niedrige
Kosten hat. (Wenn er hohe Kosten hat, wird er nie investieren) 5).
Spieler 2 wird zutreten, falls
5
Da hier Nicht-Investieren für Spieler 1 die dominante Strategie ist!
Dynamische Spiele
4
1·
1
107
1
0
·
1
2
1
2
1
1
1
2
0
0
1
2
1
1
2 1
Also ist die Beste-Antwort-Korrespondenz von Spieler 2:
1
1
2 1
1
0,1
2 1
1
0
2 1
Ein (Bayesianisches) Nash-Gleichgewicht in diesem Spiel ist ein Paar
von wechselseitig besten Antworten, d. h.
1
Fallunterscheidung:
,
und
bzw. :
1
. Dann wählt Spieler 2 stets y*=1 (sicherer Zutritt), da nur
•
erfüllt und zulässig. Das eindeutige Gleichgewicht ist
0,0 ,1 , d. h. „Keine
Investition bei hohen und niedrigen Kosten, Marktzutritt“.
•
. Hier gibt es drei Gleichgewichte:
1)
0,0 ,1 : Keine Investition bei hohen und niedrigen Kosten, Marktzu-
tritt.
2)
0,1 ,0 : Keine Investition bei hohen Kosten, Investition bei niedrigen
Kosten, kein Marktzutritt.
3)
0,
,
: Keine Investition bei hohen Kosten, ansonsten ge-
mischte Strategien.
Dynamische Spiele
4
•
108
1
. Dieser Fall impliziert
Gleichgewichte:
0,1 ,0 wie oben, und
Beste-Antwort-Korrespondenzen (für
y A
1
C
x*(ye)
B
0,75
A: (0,0), 1
B: (0,1), 0
C: (0, 0,75), 0,5
0,1 , y mit 0
); Bsp.:
y*(xe)
0,5
und ergibt unendlich viele
1
x
führt zu
.
0,75
Herunterladen