Lösungen Aufgabenblatt 10 zur Spieltheorie SS 2017

Werbung
Lösungen Aufgabenblatt 10 zur Spieltheorie SS 2017
Aufgabe 10.1: Zwei Länder betreiben Fischfang im gleichen Gewässer. Eine vergrößerte Fangmenge q2 von Land 2 reduziert den Ertrag von Land 1 und umgekehrt, so dass bei einer Fangmenge
qj ≥ 30 Land i 6= j überhaupt nichts mehr fängt. Wenn die Kosten von Land i zum Fang der
Menge qi durch qi2 gegeben sind, lassen sich die Gewinnfunktionen wie folgt modellieren:
π1 (q1 , q2 ) = (30 − q2 ) q1 − q12
π2 (q1 , q2 ) = (30 − q1 ) q2 − q22
Unter dem Basisspiel soll das Spiel mit diesen Auszahlungen über eine Periode verstanden werden, wobei die Länder ihre Fangmengen unabhängig voneinander festlegen. Das Superspiel ist das
unendlich-oft wiederholte Basisspiel, bei dem die Länder die Fangmengen der Vorperioden beobachten können und zukünftige Gewinne mit einem Faktor δ ∈ [0, 1) pro Periode diskontieren.
a) Bestimmen Sie das Nash-Gleichgewicht (q1∗ , q2∗ ) des Basisspiels.
Lösung: Partielle Ableitungen:
∂π1
∂q1
∂π2
∂q2
= 30 − q2 − 2q1 ,
= 30 − q1 − 2q2 ,
∂ 2 π1
∂q12
∂ 2 π2
∂q22
= −2 < 0 X
= −2 < 0 X
Bed.2.Ordn. sind ok. Bed.1.Ordn:
∂π1
∂q1
∂π2
∂q2
= 0 ⇐⇒ 2 q1 + q2 = 30
= 0 ⇐⇒ q1 + 2 q2 = 30
⇐⇒
⇐⇒
q1
2 1
30
=
1 2
q2
30
1
q1
10
30
2 −1
=
=
10
q2
30
2
3 −1
Also: Das Nash-GG im Basisspiel ist (q1∗ , q2∗ ) = (10, 10).
Alternative 1: (geht nur bei identischen Nutzenfunktionen der Spieler):
Ansatz: q1 = q2 = q. Bed.1.Ordn ⇐⇒ 3q = 30 ⇐⇒ q = 10 = q1 = q2
Alternative 2: Reaktionsfunktionen bestimmen und schneiden (rechnerisch statt graphisch):
R1 (q2 ) = 12 (30 − q2 )
q1 = R1 R2 (q1 ) = 12 30− 12 (30−q1 ) = 21 15+ 12 q1 ⇐⇒ 34 q1 = 7.5
1
R2 (q1 ) = 2 (30 − q1 )
Das führt auf q1 = 10 und dann q2 = R2 (q1 ) = 10.
Wie hoch sind die Gewinne P := πi (q1∗ , q2∗ ) der beiden Länder im Nash-Gleichgewicht?
Gewinne im Nash-GG (das punishment“):
”
P = πi (q1∗ , q2∗ ) = (30 − q1∗ − q2∗ ) q1∗ = (30 − 10 − 10) · 10 = 100 =
1
8
· 800
b) Angenommen, im Basisspiel legen die beiden Länder ihre Fangmengen nicht unabhängig
voneinander fest, sondern vereinbaren, eine Gesamtmenge Q je zur Hälfte zu fangen, den
Gesamtgewinn
π(Q) = π1 (q1 , q2 ) + π2 (q1 , q2 ) = (30 − q1 − q2 ) · q1 + (30 − q1 − q2 ) · q2 = (30 − Q) · Q
zu maximieren und den Gewinn dann fifty-fifty aufzuteilen.
Auf welche Fangmengen (q̂1 , q̂2 ) kommen sie dabei?
Lösung (zu Auf welche Fangmengen (q̂1 , q̂2 ) kommen sie im sozialen Optimum?“):
”
!
π 0 (Q) = 30 − Q − Q = 30 − 2Q = 0 ⇐⇒ Q = 15
1
Da π 00 = −2 < 0 ist Q eine Max.Stelle von π(Q).
Sozial optimale“ (pareto-effiziente) Fangmengen sind also (q̂1 , q̂2 ) = (7.5, 7.5).
”
Wie hoch ist in diesem Fall der Gewinn R = πi (q̂1 , q̂2 ) jedes Landes?
Gewinne im sozialen Optimum“ (spätere reward“):
”
”
R = πi (q̂1 , q̂2 ) = (30 − q̂1 − q̂2 ) q̂i = (30 − 15) ·
15
2
=
225
2
= 112.5 =
1
8
· 900
Wie hoch ist die optimale Abweichungsmenge q̌1 von Land 1 und sein maximaler Abweichungsgewinn T = π1 (q̌1 , q̂1 ), wenn Land 2 sich an die Vereinbarung hält?
Lösung: Die optimale Abweichungsmenge q̌1 von Land 1, wenn Land 2 sich an die Vereinbarung hält, ist die beste Antwort R1 (q̂2 ) von Land 1 auf die Fangmenge q̂2 von Land 2:
45
q̌2 = R1 (q̂2 ) = 21 (30 − q̂2 ) = 21 30 − 15
= 12 · 45
2
2 = 4 = 11.25
Bei q̌1 =
45
4 ,
q̂2 =
15
2
erzielt Land 1 den Gewinn
T = π1 (q̌1 , q̂2 ) = 30 − q̂2 · q̌1 − q̌12 = 30 − q̂2 − q̌1 · q̌1
= (30 − 7.5 − 11.25) · 11.25 = 126.5625
45 45
2025
1
= 120−30−45
· 45
4
4 = 4 · 4 = 16 = 8 · 1012.5
Anmerkung: Die temptation T = 126.5625 ist größer als der reward R = 112.5, der wiederum größer als das punishment P = 100 ist: T > R > P .
c) Geben Sie Triggerstrategien an, mit denen es den Ländern im Superspiel gelingt, den Gewinn
R = πi (q̂1 , q̂2 ) in jeder Periode durch ein teilspielperfektes Nash-Gleichgewicht zu stützen,
sofern der Diskontfaktor δ genügend groß ist.
Lösung:
si : In der ersten Runde wählt Land i q̂i . In der t-Runde wählt Land i q̂i , wenn in allen
vorherigen Runden (q̂1 , q̂2 ) gespielt wurde, ansonsten wählt es nun qi∗ .
Wie groß muss δ dabei mindestens sein?
Lösung (knapp): Wie im Folk-Theorem, kann es mit diesen Trigger-Strategien nur an einer
Stelle ein profitables Abweichen für (sagen wir) Land 1 geben: Wenn beide Länder sich bislang
an ihre Strategien gehalten haben, Land 1 glaubt, dass Land 2 sich auch weiterhin an seine
Strategie hält, und nun vor der Versuchung steht, sich gegenüber Land 2 verräterisch“ zu
”
verhalten, indem es statt q̂1 seine beste Antwort q̌1 auf die Wahl q̂2 von Land 2 gibt:
V1Abw = π1 (q̌1 , q̂2 ) + δ π1 (q1∗ , q2∗ ) + δ 2 π1 (q1∗ , q2∗ ) + . . . = T + δ P + δ 2 P + . . . = T +
V1F olg
= π1 (q̂1 , q̂2 ) + δ π1 (q̂1 , q̂2 ) +
δ 2 π1 (q̂1 , q̂2 )
δ2 R
+ ... = R + δR +
+ ... =
1
1−δ
δ
1−δ
P
R
Für δ < 1 ist das Abweichen genau dann nicht profitabel, wenn
T+
δ
1−δ
P ≤
1
1−δ
R ⇐⇒ (1 − δ) T + δ P ≤ R ⇐⇒ T − R ≤ δ (T − P ) ⇐⇒ δ ≥
Als kritischer Diskontfaktor ergibt sich hier, da T =
δkrit =
T −R
T −P
=
1012.5−900
1012.5−800
112.5
212.5
=
=
1
8
· 1012.5, R =
225
425
=
9·25
17·25
=
1
8
9
17
· 900, P =
1
8
T −R
T −P
· 800:
≈ 0.53
Für alle δ ≥ δkrit (und δ < 1) ist der Gewinn R in jeder Periode für beide Länder durch
ein TSPNGG des Superspiels gestützt. Inhaltlich: Bei Gewichtung zukünftiger Gewinne mit
δ ≥ δkrit überwiegt die langfristige Aussicht auf das (mittelgroße) R die Versuchung, einmalig
die (hohe) T einzustreichen, dann aber langfristig nur das (geringe) P .
2
Aufgabe 10.2: Wir betrachten das Basisspiel von Aufgabe 10.1, nehmen aber an, dass Land 2 die
Fangmenge von Land 1 beobachtet, bevor es seine festlegt.
a) Welche Strategien hat Land 1, welche Land 2 in diesem Spiel?
Antwort:
• Die Strategien von Land 1 sind: Seine Fangmenge q1 ≥ 0
• Eine Strategie von Land 2 muss für jedes q1 ≥ 0 eine Fangmenge q2 ≥ 0 festlegen.
D.h. die Strategien, die Land 2 hat, sind Funktionen q2 (q1 ).
b) Bestimmen Sie das teilspielperfekte Nash-GG dieses Spiels (über eine Periode).
Lösung:
• Ein Nash-GG hat die Struktur q1∗ , q2∗ (q1 ) .
• Das teilspielperfektes Nash-GG bestimmt sich durch Rückwärtsinduktion.
• Auf Stufe 2 ist q1 gegeben und
q2 = q2∗ (q1 ) ergibt sich durch Maximierung von g(q2 ) := π2 (q1 , q2 ) über q2 bei diesem q1 :
g(q2 ) = π2 (q1 , q2 ) = (30 − q1 ) q2 − q22
g 0 (q2 ) = 30 − q1 − 2q2
g 00 (q2 ) = −2 < 0 ⇒ Bed.2.Ordn erfüllt
• Die Bed.1.Ordn. liefert q2 = 12 (30 − q1 ), d.h. q2∗ (q1 ) = 21 (30 − q1 ). TSPNGG: ?, 21 (30 − q1 )
• Auf Stufe 1 antizipiert Land 1 die Reaktion q2 = q2∗ (q1 ) von Land 2 auf seine Fangmenge q1
D.h. Land 1 maximiert G(q1 ) = π1 q1 , q2∗ (q1 ) über q1 :
G(q1 ) =
=
G0 (q1 ) =
G00 (q1 ) =
π1 q1 , q2∗ (q1 ) = 30 − q2∗ (q1 ) q1 − q12 = 30 − 21 (30 − q1 ) · q1 − q12
15q1 + 12 q12 − q12 = 15q1 − 21 q12
15 − q1
−1 < 0 ⇒ Bed.2.Ordn erfüllt
TSPNGG: q1∗ , q2∗ (q1 ) = 15, 21 (30 − q1 )
• Die Bed.1.Ordn. liefert q1 = 15 = q1∗
• Nicht gefragt, aber dennoch interessant:
Im TSPNGG wählt Land 1 die Fangmenge q1 = 15,Land 2 die Fangmnge q2 = 12 (30−15) = 7.5
c) Es sei (q1∗ , q2∗ ) das Nash-GG des Simultanspiels aus
Aufgabe 10.1. Zeigen Sie, dass durch q̂1 = q1∗
und q̂2 (q1 ) = q2∗ für alle q1“ ein Nash-GG q̂1 , q̂2 (·) des extensiven Spiels definiert wird. Ist dieses
”
Nash-Gleichgewicht teilspielperfekt?
Lösung: Zunächst: Wenn es sich um ein Nash-GG handelt, dann ist es sicher nicht TSP-perfekt.
Einfache Begründung: Das einzige teilspielperfekte Nash-GG haben wir in Teil b) bestimmt – und
das war ein anderes.
Zum Nachweis, dass es ein Nash-GG des extensiven Spieles ist, holen wir etwas weiter aus:
Begründen Sie, dass alle Nash-Gleichgewichte q̂1 , q̂2 (·) (auch die nicht-teilspielperfekten) des extensiven Spieles, das in dieser Aufgabe betrachtet wird, durch folg. Bedingungen festgelegt sind:
π1 q̂1 , q̂2 (q̂1 ) ≥ π1 q1 , q̂2 (q1 ) für alle Zahlen q1 ≥ 0
(1)
π2 q̂1 , q̂2 (q̂1 ) ≥ π2 q̂1 , q2 (q̂1 ) für alle Funktionen q2 (·) : [0, ∞) → [0, ∞)
(2)
Lösung: Diese Bedingungen drücken gerade aus, dass sich die Länder in einem Nash-GG gegenseitig
beste Antworten geben.
3
Zeigen Sie, dass die Bedingung (2) nur verlangt, dass der (eine) Funktionswert q̂2 (q̂1 ) eine beste
Antwort von Land 2 auf q̂1 von Land 1 im Simultanspiel darstellt, d.h. dass q̂2 (q̂1 ) = R2 (q̂1 ) gilt.1
Lösung: Von der Fkt. q2 (·) geht
in (2) nur
der Funktionswert q2 (q̂1 ) ein. Die Bedingung (2) reduziert
sich daher auf π2 (q̂1 , q̂2 (q̂1 ) ≥ π2 q̂1 , q2 für alle Zahlen q2“. Das bedeutet gerade, dass q̂2 (q̂1 ) eine
”
beste Antwort auf q̂1 (im Simultanspiel) ist.
Anmerkung: Inhaltlicher Grund für diese Aussage ist, dass Land 2 in einem (nicht-TSP-perfekten)
Nash-GG des Extensivspiels nur optimal auf die Vorgabe“ q̂1 = q1∗ von Land 1 reagieren muss.
”
TSP-Perfektheit verlangt eine optimale Reaktion von Land 2 auf jede denkbare Vorgabe von Land 1
Nun zu: Es sei (q1∗ , q2∗ ) das Nash-GG des Simultanspiels aus Aufgabe 10.1. Zeigen Sie, dass durch
q̂1 = q1∗ und q̂2 (q1 ) = q2∗ für alle q1“ ein Nash-GG q̂1 , q̂2 (·) des extensiven Spiels definiert wird.
”
Lösung: Im Nash-GG des Simultanspiels gibt insbes. Land 1 mit q1∗ eine beste Anwort auf q2∗ , d.h.
π1 (q1∗ , q2∗ ) ≥ π1 (q1 , q2∗ ) für alleq1 ≥ 0. Bei q̂1 = q1∗ und q̂2 (q1 ) = q2∗ für alle q1“ liefert das sofort:
”
π (q̂ , q̂ (q̂ ) ≥ π1 q1 , q̂2 (q1 ) für alle Zahlen q1 ≥ 0“. Also ist die Bedingung (1) erfüllt.
” 1 1 2 1
Wie gesehen, fordert die Bedingung (2) nur, dass Land 2 optimal auf (das eine) q̂1 im Simultanspiel
reagiert. Da (q1∗ , q2∗ ) ein Nash-GG des Simultanspiels darstellt, ist dies ist gerade bei q̂2 = q2∗ als
Reaktion auf q̂1 = q1∗ der Fall.
Nachdem man sich die Bedingungen für ein Nash-GG im extensiven Spiel klar gemacht hat, kann
man viele weitere (nicht-TSP-perfekte) Nash-GGe nachweisen. Zum Beispiel:
Gegeben ein beliebiges q̂1 ∈ [0, 30], stellt das Strategienprofil q̂1 , q̂2 (·) mit
(
R2 (q̂1 ) wenn q1 = q̂1
wobei R2 (q1 ) = 21 (30 − q1 ) die Reaktionsfunktion
q̂2 (q1 ) =
,
von Land 2 im Simultanspiel bezeichnet
30
sonst
ein Nash-GG des extensiven Spiels dieser Aufgabe dar. (Bei Verzicht auf TSP-Perfektheit kann also
jedes q̂1 ∈ [0, 30] als Bestandteil eines Nash-GGs gestützt“ werden.)
”
Beweis: Aus Sicht von Land 1, das annimmt, dass Land 2 die Strategie q̂2 (·) verwendet: Wenn
Land 1 ein q1 6= q̂1 wählt, reagiert Land 2 mit q2 = 30, was den Gewinn von Land 1 negativ
macht: π1 (q1 , 30) = (30 − 30) · q1 − q12 = −q12 . Wählt Land 1 jedoch q1 = q̂1 , reagiert Land 2 mit
q2 = R2 (q̂1 ) = 21 (30 − q̂1 ). Bei dieser Fangmengenkonstellation ist der Gewinn π1 (q̂1 , R2 (q1 )) =
(30 − 21 (30 − q̂1 ) − q̂1 ) q̂1 = (15 − 12 q̂1 ) q̂1 ≥ 0, so dass π1 (q̂1 , q̂2 (q̂1 )) ≥ 0 ≥ π1 (q1 , q̂2 (q̂1 )) ⇒ Bed. (1).
Aus Sicht von Land 2: Bei Verzicht auf TSP-Perfektheit muss Land 2 in einem NGG nur optimal
auf die Vorgabe q̂1 von Land 1 reagieren. Das macht es gerade bei diesem q̂2 (·), da q̂2 (q̂1 ) = R2 (q̂1 ).
Dagegen: (q̂1 , q̂2 (·)) mit q̂1 = 0,
q̂ (q ) = 15 für alle q1“ ist kein Nash-GG
” 2 1
Begründung: Hier ist zwar die Bedingung (2) erfüllt, denn q̂2 (q̂1 ) = 15, und das ist gleich R2 (q̂1 ) =
R2 (0) = 12 (30 − 0) = 15.
Aber Bedingung (1) ist nicht erfüllt. Diese fordert: π1 q̂1 , q̂2 (q̂1 ) ≥ π1 q1 , q̂2 (q1 ) für alle Zahlen
q1 ≥ 0, hier also
π1 0, 15 ≥ π1 q1 , 15 für alle Zahlen q1 ≥ 0
D.h. q1 = 0 müsste beste Antwort von Land 1 auf q2 = 15 im Simultanspiel sein. Aber die beste
Antwort von Land 1 auf q2 = 15 im Simultanspiel ist R1 (q2 = 15) = 12 (30 − 15) = 7.5 6= 0
Es ist einfach zu zeigen, dass die einzigen Nash-GGe (q̂1 , q̂2 (·)), die ein konstantes q̂2 (q1 ) = q2 (für
alle q1 ) verlangen, durch q̂1 = q1∗ und q̂2 (q1 ) = q2∗ gegeben sind.
1
Das bedeutet, dass Land 2 in einem (nicht notwendigerweise teispielperfekten) Nash-GG des Extensivspiels nur
optimal auf die Vorgabe“ q̂1 von Land 1 reagieren muss. TSP-Perfektheit verlangt dagegen eine optimale Reaktion
”
q2 von Land 2 auf jede denkbare Vorgabe q1 von Land 1.
4
Aufgabe 10.3: In der Situation des Basisspiels von Aufgabe 10.1 ist nun ein drittes Land involviert
und die Gewinnfunktionen sind nun:
π1 (q1 , q2 , q3 ) = (30 − q2 − q3 ) q1 − q12
π2 (q1 , q2 , q3 ) = (30 − q1 − q3 ) q2 − q22
π3 (q1 , q2 , q3 ) = (30 − q1 − q2 ) q3 − q32
a) Zunächst wählt Land 1 die Fangmenge. Die Länder 2 und 3 können q1 beobachten, bevor sie
ihre Fangmengen (q2 , q3 ) simultan und unabhängig voneinander festlegen.
Beschreiben Sie die Strategien, die die Länder in diesem Spiel haben
Antwort:
– Die Strategien von Land 1 sind: Seine Fangmenge q1 ≥ 0
– Eine Strategie von Land 2 bzw. Land 3 muss für jedes q1 ≥ 0 ein q2 bzw. q3 festlegen.
D.h. die Strategien von Land 2 und Land 3 sind Funktionen
q2 (q1 ) und q3 (q1 ).
– Ein Nash-GG hat also die Struktur q1∗ , q2∗ (q1 ), q3∗ (q1 ) ← Jedes NGG, auch ein nicht-TSPNGG
Bestimmen Sie das teilspielperfekte Nash-GG.
Lösung: Rückwärtsinduktion
– Auf Stufe 2 ist q1 gegeben; Zur Verdeutlichung schreiben wir q1 =: a
q2∗ (q1 ), q3∗ (q1 ) ergeben sich als Nash-GG im Simultanspiel zw. L2 u. L3 mit Payoffs
g2 (q2 , q3 ) = π2 (a, q2 , q3 ) = (30 − a − q3 ) q2 − q22
g3 (q2 , q3 ) = π2 (a, q2 , q3 ) = (30 − a − q2 ) q3 − q32
Partielle Ableitungen (nach eigenem Strategieparameter):
∂g2
∂q2
∂g3
∂q3
= (30 − a − q3 ) − 2q2 = (30 − a) − q3 − 2q2 ,
= (30 − a − q2 ) − 2q3 = (30 − a) − q2 − 2q3 ,
∂ 2 g2
∂q22
∂ 2 g3
∂q32
= −2 < 0 ⇒ Bed.2.Ordn. ok
= −2 < 0 ⇒ Bed.2.Ordn. ok
Die Bed.1.Ordn. liefert Gleichungssystem in (q2 , q3 ).
Da die Länder 2 und 3 identische Payoffs haben, wird die Lösung q2 = q3 =: q erfüllen.
Das q bekommen wir aus
(30 − a) − q − 2q = 0 ⇐⇒ 3 q = 30 − a ⇐⇒ q = 13 (30 − a)
D.h. bei gegebenem a = q1 ergibt sich das Nash-GG des Simultanspiels auf Stufe 3 als
q2∗ (q1 ) =
q3∗ (q1 ) =
1
3 (30
1
3 (30
− q1 )
− q1 )
⇒
TSPNGG:
q1 , q2∗ (q1 ), q3∗ (q1 ) = ?, 13 (30−q1 ), 31 (30−q1 )
– Auf Stufe 1 antizipiert Land 1 die Reaktion q2 = q2∗ (q1 ) von Land 2 und q3 = q3∗ (q1 ) von
Land 3 auf die von ihm vorgegebene Fangmenge q1
D.h. Land 1 maximiert G(q1 ) = π1 q1 , q2∗ (q1 ), q3∗ (q1 ) über q1 :
G(q1 ) = 30 − q2∗ (q1 ) − q3∗ (q1 ) q1 − q12 = 30 − 32 (30 − q1 ) q1 − q12
= 30 − 20 + 32 q1 q1 − q12 = 10 q1 − 13 q12
0
G (q1 ) = 10 − 23 q1
G00 (q1 ) = − 23 < 0 ⇒ Bed.2.Ordn erfüllt
Die Bed.1.Ordn. liefert q1∗ = 23 10 = 15
– Das TSPNGG ist:
q1∗ , q2∗ (q1 ), q3∗ (q1 ) = 15, 31 (30 − q1 ), 13 (30 − q1 )
5
Bestimmen Sie die Fangmengen q1∗ , q2∗ , q3∗ in diesem Gleichgewicht.
Lösung: Das TSPNGG war:
q1∗ , q2∗ (q1 ), q3∗ (q1 ) = 15, 31 (30 − q1 ), 13 (30 − q1 )
Auf dem GG-Pfad bekommt man
q1∗ = 15,
q2∗ = 13 (30 − q1∗ ) =
1
3
· 15 = 5,
q3∗ = 13 (30 − q1∗ ) =
1
3
· 15 = 5
Ist (q̂1 = 0, q̂2 = 10, q̂3 = 10) ein Nash-GG (nicht notwendigerweise ein teilspielperfektes) des
Spiels, wenn man q̂2 = 10“ als q̂2 (q1 ) = 10 für alle q1“ ( q̂3 = 10“ analog) auffasst?
”
”
”
Antwort: Nein.
Begründung: Wenn dies ein Nash-GG wäre, müsste Land 1 eine beste Antwort auf die Strategien q̂2 (q1 ) = 10, q̂3 (q1 ) = 10 von Land 2 und Land 3 geben, d.h. q1 müsste
G(q1 ) = π1 q1 , q̂2 (q1 ), q̂3 (q1 ) = (30 − 10 − 10) q1 − q12 = 10q1 − q12
maximieren. Aber G nimmt sein Max. in q1 = 5 an (denn G0 (q1 ) = 0 ⇐⇒ 10 − 2q1 = 0 ⇐⇒
q1 = 5), nicht in q̂1 = 0.
Da G(q̂1 = 0) = 0 < G(q1 = 5) = 10 · 5 − 52 = 50 − 25 = 25, ist q̂1 = 0 keine beste Antwort
von Land 1 auf die angegebenen Strategien von Land 2 und Land 3.
6
b) Zunächst legen Land 1 und 2 ihre Fangmengen (q1 , q2 ) simultan und unabhängig voneinander
fest. Land 3 kann (q1 , q2 ) beobachten, bevor es seine Fangmenge q3 festlegt.
Beschreiben Sie die Strategien, die die Länder in diesem Spiel haben
– Die Strategien von Land 1 und Land 2 sind: Ihre Fangmengen q1 ≥ 0, q2 ≥ 0
– Eine Strategie von Land 3 muss für jedes (q1 , q2 ) ein q3 festlegen.
D.h. die Strategien von Land 3 sind Funktionen q3 (q1 , q2 ). (Alle Strategien: Alle solche
Fktnen)
– Ein NGG hat also die Struktur q1∗ , q2∗ , q3∗ (q1 , q2 ) ← Jedes NGG, auch ein nicht-TSPNGG
und bestimmen Sie das teilspielperfekte Nash-GG
Lösung: Rückwärtsinduktion.
– Beginne mit Stufe 2: q1 , q2 sind gegeben.
Land 3 maximiert g3 (q3 ) := π3 (q1 , q2 , q3 ) über q3 :
g3 (q3 ) = (30 − q1 − q2 ) q3 − q32
g30 (q3 ) = 30 − q1 − q2 − 2q3
g300 (q3 ) = −2 < 0
⇒ Bed.2.Ordn erfüllt
Bed.1.Ordn führt auf: q3∗ (q1 , q2 ) =
1
2 (30
− q1 − q2 )
– Auf Stufe 1 ist das Nash-GG des Simultanspiels zwischen Land 1 und Land 2 zu ermitteln, wenn sie antizipieren, dass Land 3 mit q3∗ (q1 , q2 ) = 21 (30 − q1 − q2 ) auf die von ihnen
gesetzten Fangmengen reagieren wird.
Die Payofffs G1 (q1 , q2 ) und G2 (q1 , q2 ) im reduzierten Spiel ergeben sich durch Einsetzen
von q3∗ (q1 , q2 ) für q3 in π1 bzw. π2 :
G1 (q1 , q2 ) = π1 q1 , q2 , q3∗ (q1 , q2 ) = 30 − q2 − 21 (30 − q1 − q2 ) q1 − q12
= (15 + 21 q1 − 21 q2 ) q1 − q12 = 15 − 12 q2 q1 − 12 q12
G2 (q1 , q2 ) = π2 q1 , q2 , q3 (q1 , q2 ) = 30 − q1 − 21 (30 − q1 − q2 ) q2 − q22
= 15 − 21 q1 + 12 q2 q2 − q22 = 15 − 21 q1 q2 − 12 q22
Partielle Ableitungen nach eigenem Strategieparameter:
∂G1
∂q1
∂G2
∂q2
= 15 − 12 q2 − q1 ⇒
= 15 −
1
2 q1
− q2 ⇒
∂ 2 G1
∂q12
∂ 2 G2
∂q22
= −1 < 0
⇒ Bed.2.Ordn erfüllt
= −1 < 0
⇒ Bed.2.Ordn erfüllt
Lösung der Bed.1.Ordn.: Ansatz mit q2 = q1 = q führt auf 15 − 23 q = 0: q =
30
3
= 10:
(q1∗ , q2∗ ) = (10, 10)
– Das TSPNGG ist: q1∗ , q2∗ , q3∗ (q1 , q2 ) mit q1∗ = 10, q2∗ = 10, q3∗ (q1 , q2 ) = 12 (30 − q1 − q2 )
Bestimmen Sie auch die Fangmengen q1∗ , q2∗ , q3∗ in diesem Gleichgewicht.
Antwort: q1∗ = 10, q2∗ = 10 ist klar. Um q3∗ zu bekommen: (q1∗ , q2∗ ) in q3∗ (q1 , q2 ) einsetzen:
q3∗ = 21 (30 − q1∗ − q2∗ ) = 12 30 − 10 − 10 = 5
Zusatzfrage: Geben Sie ein Nash-Gleichgewicht des Spiels an, das nicht teilspielperfekt ist.
Antwort: Das Nash-GG (q̂1 , q̂2 , q̂3 ) des Simultanspiels aller drei Länder ist auch ein Nash-GG
des extensiven Spiels, wenn man für die Fkt. q3∗ (q1 , q2 ) die Konstante q̂3 für alle q1 , q2 nimmt.
1
Bed.1.Ordn: ∂π
∂q1 = (30 − q2 − q3 ) − 2q1 = 0 und analog für π2 , π3 . Das Gl.System lässt sich
leicht mit dem Symmetrie-Ansatz q1 = q2 = q3 = q lösen: 30 − 4q = 0 ⇐⇒ q = 30/4 = 7.25.
7
Aufgabe 10.5: Wir nehmen nun an, dass die beiden Länder im Basisspiel von Aufgabe 10.1
auch Grenzkosten in Höhe von c0 = 15 haben. Die Grenzkosten können sie durch Investitionen in
universitäre Projekte in Höhe von `1 bzw. `2 reduzieren, wobei (positive) externe Effekte auftreten,
da die Ergebnisse nicht geheim gehalten werden. Wir nehmen an, dass die Grenzkosten von Land
i sich mit `1 und `2 gemäß
ci (`1 , `2 ) = c0 − `i − β · `−i (in der Aufgabe nehmen wir β = 1 an)
vermindern. Für die Finanzierung seiner universitären Projekte entstehen Land i Fixkosten ( fix“
”
in Bezug auf die Fangmenge) in Höhe von Ki (`i ) = 12 `i2 . Die Gewinne seien also nun:
π1 (q1 , q2 , `1 , `2 ) = (30 − q2 ) · q1 − q12 − c1 (`1 , `2 ) · q1 − K1 (`1 ),
mit
c1 (`1 , `2 ) = 15 − `1 − `2 , K1 (`1 ) =
π2 (q1 , q2 , `1 , `2 ) = (30 − q1 ) · q2 − q22 − c2 (`1 , `2 ) · q2 − K2 (`2 ),
mit
c2 (`1 , `2 ) = 15 − `2 − `1 , K2 (`2 ) =
1 2
2 `1
1 2
2 `2
Das Spiel läuft wie folgt ab:
Stufe 1: Die Länder legen ihre Investitionen (`1 , `2 ) simultan und unabhängig voneinander fest
Stufe 2: Die Länder beobachten die Investitionen `1 , `2 in die universitären Projekte und legen dann
ihre Fangmengen q1 , q2 simultan und unabhängig voneinander fest.
Lösen Sie dieses Spiel wie folgt:
a) Beschreiben Sie die Strategien, die Land i in diesem Spiel hat.
Lösung: Auf Stufe 1 kann Land i sein Investition `i festlegen. Auf Stufe 2 beobachtet es
`1 , `2 und legt dann seine Fangmenge qi fest.
D.h. die Strategien von Land i haben die Struktur `i , qi (·, ·) , wobei qi (·, ·) für eine beliebige
Funktion von (`1 , `2 ) steht. (Der Einfachheit halber schreiben wir qi (`1 , `2 ) statt qi (·, ·) für solche
Funktionen; dabei sind `1 , `2 Dummy-Variablen“, keine Zahlen; analog qi∗ (`1 , `2 ).)
”
b) Bestimmen Sie das Nash-GG q1∗ (`1 , `2 ), q2∗ (`1 , `2 ) des Spieles um die Fangmengen“.
”
Lösung: Gefragt ist nach dem Ergebnis der Rückwärtsinduktion auf Stufe 2:
Auf Stufe 2 sind `1 und `2 und damit c1 , c2 , K1 , K2 exogene Parameter.
Wir lesen daher die Gewinne als
g1 (q1 , q2 ) = (30 − q2 ) · q1 − q12 − c1 · q1 − K1 ,
g2 (q1 , q2 ) = (30 − q1 ) · q2 − q22 − c2 · q2 − K2 ,
mit exogenen Parametern c1 , c2 , K1 , K2 .
Partielle Ableitungen (nach eigenem Strategieparameter):
∂g1
∂q1
∂g2
∂q2
= 30 − q2 − 2q1 − c1 ,
= 30 − q1 − 2q2 − c2 ,
∂ 2 g1
∂q12
∂ 2 g2
∂q22
= −2 < 0 ⇒
Bed.2.Ordn ok
= −2 < 0 ⇒
Bed.2.Ordn ok
Die Lösung der Bed.1.Ordn mit dem Ansatz q1 = q2 liefert: q1 = 31 (30 − c1 ), q2 = 13 (30 − c2 )
Mit c1 (`1 , `2 ) = 15 − `1 − β`2 und c2 (`1 , `2 ) = 15 − `2 − β`1 ergibt sich (bei uns: β = 1):
q1∗ (`1 , `2 ) = 31 30 − c1 (`1 , `2 ) = 13 15 + `1 + β `2 = 5 + 13 (`1 + β `2 )
q2∗ (`1 , `2 ) = 31 30 − c2 (`1 , `2 ) = 13 15 + `2 + β `1 = 5 + 13 (`2 + β `1 )
8
c) Bestimmen Sie das teilspielperfekte Nash-GG des Spieles.
Lösung: Auf Stufe 1 der Rückw.Induktion antizipieren die beiden Länder, dass sie bei simultaner Investition (`1 , `2 ) mit den Fangmengen qi∗ (`1 , `2 ) auf Stufe 2 reagieren werden. Das
TSP-perfekte Investitionsprofil“ (`∗1 , `∗2 ) bestimmt sich als Nash-GG des Simultanspiels mit
”
den reduzierten Auszahlungen“ G1 (`1 , `2 ), G2 (`1 , `2 ), die entstehen, wenn man in den πi die
”
Variablen qi durch die Funktionen qi∗ (`1 , `2 ) ersetzt. Um die Funktionen G1 (`1 , `2 ), G2 (`1 , `2 )
zu ermitteln, beachten wir zunächst, dass sich die Gewinne πi wie folgt schreiben lassen:
πi = (30 − qj )qi − ci qi − qi2 − Ki = (30 − qi − qj − ci ) qi − Ki = (30 − q1 − q2 − ci ) qi − Ki
Damit stellen sich die Gewinne Gi (`1 , `2 ) im reduzierten Spiel auf Stufe 1 wie folgt dar:
Gi (`1 , `2 ) = 30 − q1∗ (`1 , `2 ) − q2∗ (`1 , `2 ) − ci (`1 , `2 ) · qi∗ (q1 , q2 ) − 21 `i2
Wir werten in einer Nebenrechnung den Term ci (`1 , `2 ) + q1∗ (`1 , `2 ) + q2∗ (`1 , `2 ) aus. Zunächst
ist:
q1∗ (`1 , `2 ) + q2∗ (`1 , `2 ) = 10 + 32 (`2 + `1 )
Damit vereinfacht sich der Term zu:
ci (`1 , `2 ) + q1∗ (`1 , `2 ) + q2∗ (`1 , `2 ) = 15 − (`1 + `2 ) + 10 + 23 (`1 + `2 ) = 25 − 13 (`1 + `2 )
Die Gewinne (Auszahlungen) im reduzierten Spiel auf Stufe 1 schreiben sich damit als:
G1 (`1 , `2 ) = 30 − c1 (`1 , `2 ) − q1∗ (`1 , `2 ) − q2∗ (`1 , `2 ) · q1∗ (`1 , `2 ) − 21 `12
= 5 + 13 (`1 + `2 ) · 5 + 13 (`1 + `2 ) − 12 `12
G2 (`1 , `2 ) = 30 − c2 (`1 , `2 ) − q2∗ (`1 , `2 ) − q1∗ (`1 , `2 ) · q2∗ (`1 , `2 ) − 21 `22
= 5 + 31 (`1 + `2 ) · 5 + 13 (`1 + `2 ) − 12 `22
In dieser Form lassen sich die partiellen Ableitungen nach dem eigenen Strategieparameter
`1 bzw. `2 leicht ermitteln (mit Produktregel, es ginge auch Kettenregel, da [. . .] · [. . .] = [. . .]2 ):
1
∂G1
1
1
1
∂`1 = 3 · 5 + 3 (`1 + `2 ) + 5 + 3 (`1 + `2 ) · 3 − `1
2
10
7
2
= 10
1 = 3 − 9 `1 + 9 `2
3 +
9 (`1 + `2 ) − `
1
∂G2
1
1
1
·
5
+
(`
+
`
)
+
5
+
(`
+
`
)
· 3 − `2
=
1
2
1
2
∂`2
3
3
3
2
10
2
7
= 10
+
(`
+
`
)
−
`
=
+
`
−
`
2
2
3
9 1
3
9 1
9 2
Da
∂Gi
∂`i
= − 97 < 0, sind die Bed.2.Ordn erfüllt.
Die Bed.1.Ordn. lassen sich wieder mit dem Symmetrie-Ansatz ` = `1 = `2 leicht lösen:
10
3
Wir erhalten also:
`∗1 = 6,
=
5
9`
⇒ `=
10 9
3 5
= 6
`∗2 = 6
Im TSPNGG verwendet Land i die Strategie:
`∗i = 6, qi∗ (`1 , `2 ) = 5 + 31 (`1 + `2 )
d) Welche Investition `∗i tätigt Land i?
Antwort: Schon gesehen: `∗1 = `∗2 = 6
Wie sehr reduzieren sich dabei die Grenzkosten c∗i ?
Antwort: Damit werden die Grenzkosten von c0 = 15 auf c∗i = 15 − 6 − 6 = 3 gedrückt.
Welche Kosten Ki∗ trägt Land i zur Reduktion seiner Grenzkosten?
Antwort: Die Fixkosten dafür sind: Ki∗ = 12 `∗i 2 = 18
Welche Fangmenge qi∗ legt Land i im teilspielperfekten Nash-Gleichgewicht fest?
Antwort: Für die Fangmengen ergibt sich:
9
qi∗ = 5 + 13 (`∗1 + `∗2 ) = 5 +
12
3
= 9.
Herunterladen