Lösungen Aufgabenblatt 12 zur Spieltheorie SS 2017

Lösungen Aufgabenblatt 12 zur Spieltheorie SS 2017
Aufgabe 12.1 Zwei Firmen befinden sich in einem Wettbewerb, in dem sie ihre Produktionsmengen
q1 ∈ [0, 10] und q2 ∈ [0, 10] festlegen. Die Preis-Absatz-Funktion ist durch P (Q) = (10 − Q)2 + 4
für 0 ≤ Q ≤ 10 und P (Q) = 4 für Q > 10 gegeben. Die Firmen haben konstante und identische
Grenzkosten ci = 4, so dass
π1 (q1 , q2 ) = P (Q) · q1 − c1 · q1 = (10 − Q)2 · q1
π2 (q1 , q2 ) = P (Q) · q2 − c2 · q2 = (10 − Q)2 · q2
für Q = q1 + q2 ≤ 10 und πi (q1 , q2 ) = 0 für Q > 10.
a) Zeigen Sie, dass die beste Antwort q2∗ = R2 (q1 ) von Firma 2 auf ein q1 ∈ [0, 10] von Firma 1
gegeben ist durch:
R2 (q1 ) = 31 (10 − q1 )
Hinweis: Zeigen Sie:
∂π2
∂q2
= (10 − Q)(10 − q1 − 3q2 ) und argumentieren Sie über Monotonie.
Lösung: Ableiten von π2 (q1 , q2 ) = (10 − Q)2 · q2 nach q2 mit Produktregel (für q2 < 10 − q1 ):
∂q2
∂
∂
2
2
2
∂q2 (10 − Q) · q2 = (10 − Q) · ∂q2 ] + ∂q2 (10 − Q) · q2 = (10 − Q)2 · 1 + 2(10 − Q) ∂q∂2 (10 − Q) · q2
= (10 − Q)2 · 1 + 2(10 − Q) · (−1) · q2
= (10 − Q) (10 − Q − 2q2 ) = (10 − Q) (10 − q1 − 3q2 )
Betrachte ein gegebenes (festes) q1 ∈ [0, 10].
Das Produkt (10 − Q) (10 − q1 − 3q2 ) hat als Fkt. von q2 zwei Nullstellen q` , qr ∈ [0, 10]:
Faktor 10 − q1 − 3q2 = 0: q2 = 31 (10 − q1 ) =: q` ,
Faktor 10 − Q = 0: q2 = 10 − q1 =: qr
Offensichtlich ist 0 < q` < qr < 10
∂π2
2
Für q2 ∈ (0, q` ) ist ∂π
∂q2 > 0 (da beide Faktoren > 0). Für q2 ∈ (q` , qr ) ist ∂q2 < 0 (da 1.
2
Faktor > 0, 2. Faktor < 0). Für alle q2 ∈ (qr , 10) ist ∂π
∂q2 = 0, da für diese q2 : π2 (q1 , q2 ) = 0.
( wächst mit q für q ∈ [0, q ]
2
2
`
fällt mit q2 für q2 ∈ [q` , qr ]
D.h. für gegeb. q1 ∈ [0, 10]: Die Funktion q2 → π2 (q1 , q2 )
ist konstant = 0 für q2 ∈ [qr , 10]
Also wird das globale Max. von q2 → π2 (q1 , q2 ) in q` = 31 (10 − q1 ) angenommen. Die beste
Antwort von Firma 2 auf ein q1 ∈ [0, 10] ist somit durch R2 (q1 ) = 31 (10 − q1 ) gegeben.
Anmerkung: Für die zweite partielle Ableitung erhält man:
∂ 2 π2
∂q2 2
= −(10 − Q) · 3 − (10 − q1 − 3q2 ) = 4q1 + 6q2 − 40
Die Funktion q2 → π2 (q1 , q2 ) hat einen konkaven Verlauf (nur) für q2 < 23 10 − q1 ). Da sie
nicht global konkav auf [0, 10 − q1 ] ist, kann man hier nicht mit der Bed.2.Ordn. schließen,
dass ihr globales Max. über dem Intervall [0, 10 − q1 ] in q2 = 13 (10 − q1 ) angenommen wird.
(Das globale Max. liegt dort, aber man kann das mit der Bed.2.Ordn nicht (direkt) beweisen)
Direkt mit der Bed.2.Ordn. erhält man nur die Aussage, dass die Funktion q2 → π2 (q1 , q2 )
ein lokales Max. in q2 = 31 (10 − q1 ) hat.
Man könnte auch argumentieren, dass π2 (q1 , q2 = 0) = 0 = π2 (q1 , q2 = 10−q1 ) und offensichtlich π2 (q1 , q2 ) > 0 (nur) für q2 ∈ (0, 10 − q1 ). Da es eine einzige stationäre Stelle in (0, 10 − q1 )
gibt, nämlich q2 = 31 (10 − q1 ), muss diese die globale Max.Stelle sein.
1
b) Die Firmen legen ihre Produktionsmengen simultan und unabhängig voneinander fest. Bestimmen Sie das Nash-Gleichgewicht des Spiels.
Lösung(smöglichkeit; eine von mehreren): Aus Symmetriegründen ist R1 (q2 ) = 31 (10 − q2 )
(für 0 ≤ q2 ≤ 10) und in einem Nash-GG (q1∗ , q2∗ ) muss R1 (q2∗ ) = q1∗ und R2 (q1∗ ) = q2∗ gelten:
q1∗ = R1 (q2∗ ) = R1 (R2 (q1∗ )) = 13 10 − 31 (10 − q1∗ ) = 31 − 91 · 10 + 19 q1∗
⇐⇒ 98 q1∗ = 29 10 ⇐⇒ q1∗ = 41 10 = 2.5
Dann q2∗ = R2 (q1∗ ) =
1
3
10 − 41 10 =
13
3 4 10
=
1
4
10 = 2.5.
Einfacher: Symmetrieansatz q1 = q2 =: q in q1 = R2 (q2 ):
q = 13 (10 − q) ⇐⇒ 10 − q − 3q = 0 ⇐⇒ 4q = 10 ⇐⇒ q = 10/4 = 2.5
c) Firma 1 legt zunächst ihre Produktionsmenge q1 fest. Firma 2 kann q1 beobachten, bevor sie
ihre Produktionsmenge q2 festlegt. Welche Strategien haben die Firmen in diesem Spiel?
Antwort: Strategien von Firma 1: Zahlen q1 ∈ [0, 10],
Strategien von Firma 2: Funktionen q2 : [0, 10] → [0, 10], q1 → q2 (q1 )
Bestimmen Sie das teilspielperfekte Nash-Gleichgewicht des Spiels.
Lösung: Rückwärtsinduktion.
Auf Stufe 2 ist q1 ∈ [0, 10] gegeben. Firma 2 maximiert g(q2 ) = π2 (q1 , q2 ) über q2 . Das
maximierende q2 haben wir schon ermittelt: q2 = R2 (q1 )
D.h.: Die teilspielperfekte Strategie von Firma 2 ist q2∗ (q1 ) = 31 (10 − q1 ) .
Auf Stufe 1 antizipiert Firma 1 die Reaktion q2∗ (q1 ) von Firma 2 und maximiert
2
G(q1 ) = π1 q1 , q2∗ (q1 ) = 10 − q1 − 13 (10 − q1 ) · q1 =
2
2
3 (10 − q1 )
· q1 =
4
2
9 (10 − q1 )
· q1
Ableiten (und Faktor 10 − q1 herausziehen, analog zum Faktor 10 − Q in Teil a)):
G0 (q1 ) = −2 · 94 (10 − q1 ) · q1 + 49 (10 − q1 )2 · 1 = 49 (10 − q1 ) · 10 − 3q1
G00 (q1 ) = 94 (10 − q1 ) · (−3) − 94 (10 − 3q1 ) = 94 (−30 + 3q1 − 10 + 3q1 ) = 94 (−40 + 6q1 )
Problem auch hier: Man muss die globale Max.Stelle von
aber G
G
über [0, 10] bestimmen, 20
20
ist nicht global konkav auf [0, 10] (G ist konkav für q1 ∈ 0, 3 , aber konvex für q1 ∈ [ 3 , 10]).
Argumentiere mit Monotonie: Für q1 ∈ [0, 10] ist das Vorzeichen von G0 (q1 ) durch den zweiten
Faktor in G0 (q1 ) festgelegt: G fällt, wo dieser Faktor < 0, und wächst, wo er > 0 ist.
D.h. das maximierende q1 ∈ [0, 10] bestimmt sich durch Nullsetzen des zweiten Faktors:
10 − 3q1 = 0 ⇐⇒ q1 = 13 10 = 3.3̄ = q1∗
Man kann auch so argumentieren: G hat eine einzige stationäre Stelle in (0, 10) und
G(q1 = 0) = 0,
G(q1 = 10) = 0,
G(q1 ) > 0 für alle 0 < q1 < 10
Zusammengefasst: Das TSPNGG ist q1∗ , q2∗ (q1 ) mit q1∗ = 3.3̄ und q2∗ (q1 ) = 31 (10 − q1 ).
Nicht gefragt war: Im TSPNGG wählt
Firma 1:
q1∗ = 3.3̄
Firma 2:
q2∗ = 13 (10 − q1∗ ) =
1
3 (10
−
10
3 )
=
2
1
9 20
= 2.2̄
10
d) Ist q̂1 , q̂2 (q1 ) mit q̂1 = 10
4 und ”q̂2 (q1 ) = 4 für alle q1 ≥ 0“ ein Nash-GG (nicht notwendigerweise ein T-Spiel-perfektes) des Spieles in c).
In einem Nash-GG q̂1 , q̂2 (q1 ) des sequentiellen Spieles muss gelten:
π1 q̂1 , q̂2 (q̂1 ) ≥ π1 q1 , q̂2 (q1 ) für alle Zahlen q1 ∈ [0, 10]
π2 q̂1 , q̂2 (q̂1 ) ≥ π2 q̂1 , q2 (q̂1 ) für alle Funktionen q2 (·) : [0, 10] → [0, 10]
(1)
(2)
Da in der Bedingung (2) von
q2 (·) nur der Funktionswert q2 (q̂1 ) eingeht, reduziert
der Funktion
sie sich auf π2 (q̂1 , q̂2 (q̂1 ) ≥ π2 q̂1 , q2 für alle Zahlen q2“. Das bedeutet gerade, dass die Zahl
”
q̂2 (q̂1 ) eine beste Antwort auf q̂1 (im Simultanspiel) ist.
Bei einer konstanten Funktion q̂2 (q1 ) = q̂2 verlangen die Bedingungen (1) und (2) also:
π1 q̂1 , q̂2 ≥ π1 q1 , q̂2 für alle Zahlen q1 ∈ [0, 10]
(1)
π2 q̂1 , q̂2 ≥ π2 q̂1 , q2 für alle Zahlen q2 ∈ [0, 10]
(2)
Das sind gerade die Bedingungen dafür, dass (q̂1 , q̂2 ) Nash-GG des Simultanspiels ist. Da wir
mit q̂1 = q̂2 = 10
4 ein solches hatten, ist (q̂1 , q̂2 (q1 )) auch Nash-GG des seq. Spieles in c).
e) Ist q̂1 , q̂2 (q1 ) mit q̂1 = 5 und q̂2 (q1 ) = 35 für alle q1 ∈ [0.10]“ ein Nash-GG (nicht notwen”
digerweise ein T-Spiel-perfektes) des Spieles in c).
Antwort: Nein.
Begründung: Wenn dies ein Nash-GG wäre, müsste Firma 1 mit q̂1 = 5 eine beste Antwort
auf die Strategie q̂2 (q1 ) = 53 für alle q1 ∈ [0, 10]“ von Firma 2 geben, d.h. q1 = 5 müsste
”
G(q1 ) = π1 q1 , q̂2 (q1 ) = π1 q1 , q2 = 35
maximieren. Damit müsste q1 = 5 auch eine BA auf q2 = 53 im Simultanspiel sein. Aber die
beste Antwort auf q2 = 53 im Simultanspiel ist q1 = R1 (q2 = 53 ) = 31 (10 − 53 ) = 25
9 6= q̂1 = 5.
Anmerkung: Es ist aber q̂2 (q1 ) = 53 für alle q1 ∈ [0, 10]“ eine BA auf q̂1 = 5 im sequentiellen
”
Spiel von Teil c). Wie oben gesehen, muss dazu nur
π2 q̂1 , q̂2 (q1 ) ≥ π2 q̂1 , q2 für alle Zahlen q2 ∈ [0, 10]
gelten. D.h. es muss nur q̂2 (q1 ) = 53 eine BA auf q̂1 = 5 bei q1 = 5 im Simultanspiel darstellen.
Das ist der Fall: R2 (5) = 13 (10 − 5) = 53 .
3
Aufgabe 12.2 Drei Spieler verbrauchen Anteile x1 , x2 , x3 einer Ressource, die im Umfang von A
verfügbar ist. Wenn Spieler i die Menge xi verbraucht (i = 1, 2, 3), haben die Spieler den Nutzen
u1 (x1 , x2 , x3 ) = ln(x1 ) + ln(A − x1 − x2 − x3 )
u2 (x1 , x2 , x3 ) = ln(x2 ) + ln(A − x1 − x2 − x3 )
u3 (x1 , x2 , x3 ) = ln(x3 ) + ln(A − x1 − x2 − x3 )
a) Die Spieler wählen ihren Verbrauch simultan und unabhängig voneinander. Bestimmen Sie
das Nash-GG des Spiels.
Lösung: Partielle Ableitungen der Nutzen der SP nach ihrem Strategieparameter:
∂ui
∂xi
∂ 2 ui
∂xi2
1
xi
1
A−x1 −x2 −x3
1
− x12 − (A−x1 −x
2
2 −x3 )
i
=
=
−
Bed.1.Ordn. (hinreichend, da 2. part. Ableitungen negativ):
∂ui !
∂xi =
1
xi
1
= A−x1 −x
2 −x3
xi = A − x1 − x2 − x3
⇐⇒
⇐⇒
0
Lineares Gleichungssystem in (x1 , x2 , x3 ). Löse mit Symmetrieansatz xi = x:
x = A − x − x − x ⇐⇒ 4x = A ⇐⇒ x =
1
4
A
Also: Das Nash-GG des Simultanspiels ist: (x∗1 , x∗2 , x∗3 ) = 41 A, 14 A, 41 A .
Anmerkung: Gesamtverbrauch im Nash-GG ist
x∗1 + x∗2 + x∗3 = 34 A.
b) Die Spieler 2 und 3 beobachten den Verbrauch von SP1, bevor sie ihre Mengen x2 , x3 simultan
und unabhängig voneinander festlegen.
Bestimmen Sie das teilspielperfekte Nash-GG dieses Spiels.
Lösung: Zunächst: Die Strategien der Spieler bei diesem Spiel sind:
SP1: x1 ≥ 0;
SP2, SP3: Funktionen x2 (x1 ), x3 (x1 )
Rückwärtsinduktion:
Stufe 2: x1 ist gegeben. SP2 und SP3 bestimmen ihre Verbrauchsmengen x2 , x3 als Nash-GG
des Simultanspiels mit Nutzen:
v2 (x2 , x3 ) = ln(x2 ) + ln(A − x1 − x2 − x3 )
v3 (x2 , x3 ) = ln(x3 ) + ln(A − x1 − x2 − x3 )
Strukturell wie Teil a) mit 2 statt 3 Spielern und B := A − x1 statt A:
v2 (x2 , x3 ) = ln(x2 ) + ln(B − x2 − x3 )
v3 (x2 , x3 ) = ln(x3 ) + ln(B − x2 − x3 )
Wie bei Teil a): Die Bed.1.Ordn ist hinreichend und führt auf:
∂vi !
∂xi =
0
⇐⇒
⇐⇒
1
xi
= B−x12 −x3
xi = B − x2 − x3
Symmetrieansatz x2 = x3 = x führt auf x = B − 2x ⇐⇒ x = 13 B.
Also: Teilspielperfekte Lösung x∗2 (x1 ), x∗3 (x1 ) auf Stufe 2 ist:
x∗2 (x1 ) = 31 (A − x1 ),
4
x∗3 (x1 ) = 13 (A − x1 )
Stufe 1: SP1 maximiert
V (x1 ) =
=
=
=
ln(x1 ) + ln A − x1 − x∗2 (x1 ) − x∗3 (x1 )
ln(x1 ) + ln A − x1 − 32 (A − x1 )
ln(x1 ) + ln 31 (A − x1 )
ln(x1 ) + ln(A − x1 ) − ln(3)
(Letzte Umformung: Funktionalgleichung log, vereinfacht das Ableiten)
1
V 0 (x1 ) = x11 − A−x
1
1
V 00 (x1 ) = − x12 − (A−x
2
1)
< 0
1
Bed.2.Ordn ist ok. Die Bed.1.Ordn führt auf:
!
V 0 (x1 ) = 0
⇐⇒
⇐⇒
1
xi
1
= A−x
1
x1 = A − x1 ⇐⇒ 2x1 = A ⇐⇒ x1 = 12 A
Also: TSPNGG x∗1 , x∗2 (x1 ), x∗3 (x1 ) ist: x∗1 = 21 A, x∗2 (x1 ) = 31 (A − x1 ), x∗3 (x1 ) = 31 (A − x1 )
Anmerkung: Auf dem GG-Pfad verbrauchen SP2 und SP3: x∗2 (x∗1 ) = 16 A, x∗3 (x∗1 ) = 16 A.
Gesamtverbrauch auf dem GG-Pfad also x∗1 + x∗2 (x∗1 ) + x∗3 (x∗2 ) = 21 + 16 + 61 A = 56 A.
c) Spieler 3 beobachtet den Verbrauch von Spieler 1 und 2, die ihren Verbrauch simultan und
unabhängig voneinander festlegen.
Bestimmen Sie das teilspielperfekte Nash-GG dieses Spiels.
Lösung: Zunächst: Die Strategien der Spieler bei diesem Spiel sind:
SP1,SP2: x1 ≥ 0, x2 ≥ 0
SP3: Funktion x3 (x1 , x2 )
Rückwärtsinduktion:
Stufe 2: x1 , x2 gegeben. SP3 bestimmt seine Verbrauchsmenge x3 durch Maximierung von
v(x3 ) = ln(x3 ) + ln(A − x1 − x2 − x3 ) = ln(x3 ) + ln(C − x3 ) mit C := A − x1 − x2
Ableiten:
1
v 0 (x3 ) = x13 − C−x
3
1
v 00 (x3 ) = − x12 − (C−x
2
3)
< 0
3
Bed.2.Ordn ist ok. Die Bed.1.Ordn führt auf:
!
v 0 (x3 ) = 0
⇐⇒
⇐⇒
1
x3
1
= C−x
3
x3 = C − x3 ⇐⇒ x3 = 12 C
Also: Teilspielperfekte Lösung x∗3 (x1 , x2 ) auf Stufe 2 ist:
x∗3 (x1 , x2 ) = 21 (A − x1 − x2 ),
Stufe 1: SP1, SP2 antizipieren x3 = x∗3 (x1 , x2 ). Sie wählen ihre Verbrauchsmengen x1 , x2 als
Nash-GG des Simultanspiels mit Nutzen:
V1 (x1 , x2 ) = ln(x1 ) + ln A − x1 − x2 − 21 (A − x1 − x2 ) = ln(x1 ) + ln 21 (A − x1 − x2 )
V2 (x2 , x3 ) = ln(x2 ) + ln A − x1 − x2 − 12 (A − x1 − x2 ) = ln(x2 ) + ln 21 (A − x1 − x2 )
5
Man erhält x1 = x2 = x aus:
1
x
1
A−2x
⇐⇒ x = A − 2x ⇐⇒ 3x = A ⇐⇒ x = 13 A
Also: TSPNGG x∗1 , x∗2 , x∗3 (x1 , x2 ) durch x∗1 = x∗2 = 31 A, x∗3 (x1 , x2 ) = 21 (A−x1 −x2 ) gegeben.
Anmerkung: Auf dem GG-Pfad verbraucht SP3 x∗3 (x∗1 , x∗2 ) = 21 A − 13 A − 31 A = 16 A.
Gesamtverbrauch auf dem GG-Pfad also: x∗1 + x∗2 + x∗3 (x∗1 , x∗2 ) = 31 + 13 + 16 A = 56 A
=
d) Zunächst wählt Spieler 1 seinen Verbrauch, dann Spieler 2 und schließlich Spieler 3. Die
Spieler können jeweils den Verbrauch der Vorgänger beobachten.
Bestimmen Sie das teilspielperfekte Nash-GG dieses Spiels.
Lösung: Zunächst: Die Strategien der Spieler sind
SP1: Zahl x1 ≥ 0
SP2: Funktion x2 (x1 )
SP3: Funktion x3 (x1 , x2 )
Rückwärtsinduktion:
Stufe 3: SP3 kennt x2 und x3 ; er maximiert:
v3 (x3 ) = ln(x3 ) + ln(A − x1 − x2 − x3 )
Die Lösung x∗3 (x1 , x2 ) ergibt sich aus (analog zu vorherigen Rechnungen):
1
x3
=
1
A−x1 −x2 −x3
⇐⇒ x3 = A − x1 − x2 − x3 ⇐⇒ x3 = 12 (A − x1 − x2 )
Also: T-Spiel-perfekte Strategie von SP3: x∗3 (x1 , x2 ) = 21 (A − x1 − x2 )
Stufe 2: SP2 kennt x2 und antizipiert x3 = x∗3 (x1 , x2 ) = 21 (A − x1 − x2 ). Er maximiert
v2 (x2 ) = ln(x2 ) + ln A − x1 − x2 − x∗3 (x1 , x2 ) = ln(x2 ) + ln A − x1 − x2 − 21 (A − x1 − x2 )
= ln(x2 ) + ln 12 (A − x1 − x2 ) = ln(x2 ) + ln(A − x1 − x2 ) − ln(2)
Bed.1.Ordn. führt auf:
1
x2
=
1
A−x1 −x2
⇐⇒ x2 = A − x1 − x2 ⇐⇒ x2 =
1
2 (A
− x1 )
Also: T-Spiel-perfekte Strategie von SP2: x∗2 (x1 ) = 21 (A − x1 )
Stufe 1: SP1 antizipiert x2 = x∗2 (x1 ) = 21 (A − x1 ) und
x3 = x∗3 x1 , x∗2 (x1 ) = 21 A − x1 − x∗2 (x1 ) = 21 A − x1 − 21 (A − x1 ) =
SP1 maximiert
1
4 (A
− x1 )
v1 (x1 ) = ln(x1 ) + ln A − x1 − x∗2 (x1 ) − x∗3 x1 , x∗2 (x1 ) = ln(x1 ) + ln A − x1 − 21(A − x1 ) − 41 (A − x1 )
= ln(x1 ) + ln 41 (A − x1 ) = ln(x1 ) + ln(A − x1 ) − ln(4)
Bed.1.Ordn. führt auf:
1
x1
=
1
A−x1
⇐⇒ x1 = A − x1 ⇐⇒ x1 =
1
2A
Also: T-Spiel-perfekte Strategie von SP1: x∗1 = 12 A
Das TSPNGG x∗1 , x∗2 (x1 ), x∗3 (x1 , x2 ) ist gegeben durch: x∗1 = 12 A, x∗2 (x1 ) = 21 (A−x1 ), x∗3 (x1 , x2 ) =
1
2 (A−x1 −x2 ) (D.h.: Strategie eines nachfolgenden Spielers: Verbrauche die Hälfte der Restmenge)
Anmerkung: Aufdem GG-Pfad verbraucht
SP1: x∗1 = 21 A, SP2: x∗2 (x∗1 ) = 41 A,
SP3: x∗3 x∗1 , x∗2 (x∗1 ) = 21 A − 12 A − 14 A = 18 A.
Gesamtverbrauch auf dem GG-Pfad also: x∗1 + x∗2 (x∗1 ) + x∗3 x∗1 , x∗2 (x∗1 ) = 21 + 14 + 18 A = 78 A
Beobachtung: Da 78 A > 56 A > 43 A: Ges.Verbr in d) > Ges.Verbr in c),b) > Ges.Verbr in a)
6