Lösungen Aufgabenblatt 12 zur Spieltheorie SS 2017 Aufgabe 12.1 Zwei Firmen befinden sich in einem Wettbewerb, in dem sie ihre Produktionsmengen q1 ∈ [0, 10] und q2 ∈ [0, 10] festlegen. Die Preis-Absatz-Funktion ist durch P (Q) = (10 − Q)2 + 4 für 0 ≤ Q ≤ 10 und P (Q) = 4 für Q > 10 gegeben. Die Firmen haben konstante und identische Grenzkosten ci = 4, so dass π1 (q1 , q2 ) = P (Q) · q1 − c1 · q1 = (10 − Q)2 · q1 π2 (q1 , q2 ) = P (Q) · q2 − c2 · q2 = (10 − Q)2 · q2 für Q = q1 + q2 ≤ 10 und πi (q1 , q2 ) = 0 für Q > 10. a) Zeigen Sie, dass die beste Antwort q2∗ = R2 (q1 ) von Firma 2 auf ein q1 ∈ [0, 10] von Firma 1 gegeben ist durch: R2 (q1 ) = 31 (10 − q1 ) Hinweis: Zeigen Sie: ∂π2 ∂q2 = (10 − Q)(10 − q1 − 3q2 ) und argumentieren Sie über Monotonie. Lösung: Ableiten von π2 (q1 , q2 ) = (10 − Q)2 · q2 nach q2 mit Produktregel (für q2 < 10 − q1 ): ∂q2 ∂ ∂ 2 2 2 ∂q2 (10 − Q) · q2 = (10 − Q) · ∂q2 ] + ∂q2 (10 − Q) · q2 = (10 − Q)2 · 1 + 2(10 − Q) ∂q∂2 (10 − Q) · q2 = (10 − Q)2 · 1 + 2(10 − Q) · (−1) · q2 = (10 − Q) (10 − Q − 2q2 ) = (10 − Q) (10 − q1 − 3q2 ) Betrachte ein gegebenes (festes) q1 ∈ [0, 10]. Das Produkt (10 − Q) (10 − q1 − 3q2 ) hat als Fkt. von q2 zwei Nullstellen q` , qr ∈ [0, 10]: Faktor 10 − q1 − 3q2 = 0: q2 = 31 (10 − q1 ) =: q` , Faktor 10 − Q = 0: q2 = 10 − q1 =: qr Offensichtlich ist 0 < q` < qr < 10 ∂π2 2 Für q2 ∈ (0, q` ) ist ∂π ∂q2 > 0 (da beide Faktoren > 0). Für q2 ∈ (q` , qr ) ist ∂q2 < 0 (da 1. 2 Faktor > 0, 2. Faktor < 0). Für alle q2 ∈ (qr , 10) ist ∂π ∂q2 = 0, da für diese q2 : π2 (q1 , q2 ) = 0. ( wächst mit q für q ∈ [0, q ] 2 2 ` fällt mit q2 für q2 ∈ [q` , qr ] D.h. für gegeb. q1 ∈ [0, 10]: Die Funktion q2 → π2 (q1 , q2 ) ist konstant = 0 für q2 ∈ [qr , 10] Also wird das globale Max. von q2 → π2 (q1 , q2 ) in q` = 31 (10 − q1 ) angenommen. Die beste Antwort von Firma 2 auf ein q1 ∈ [0, 10] ist somit durch R2 (q1 ) = 31 (10 − q1 ) gegeben. Anmerkung: Für die zweite partielle Ableitung erhält man: ∂ 2 π2 ∂q2 2 = −(10 − Q) · 3 − (10 − q1 − 3q2 ) = 4q1 + 6q2 − 40 Die Funktion q2 → π2 (q1 , q2 ) hat einen konkaven Verlauf (nur) für q2 < 23 10 − q1 ). Da sie nicht global konkav auf [0, 10 − q1 ] ist, kann man hier nicht mit der Bed.2.Ordn. schließen, dass ihr globales Max. über dem Intervall [0, 10 − q1 ] in q2 = 13 (10 − q1 ) angenommen wird. (Das globale Max. liegt dort, aber man kann das mit der Bed.2.Ordn nicht (direkt) beweisen) Direkt mit der Bed.2.Ordn. erhält man nur die Aussage, dass die Funktion q2 → π2 (q1 , q2 ) ein lokales Max. in q2 = 31 (10 − q1 ) hat. Man könnte auch argumentieren, dass π2 (q1 , q2 = 0) = 0 = π2 (q1 , q2 = 10−q1 ) und offensichtlich π2 (q1 , q2 ) > 0 (nur) für q2 ∈ (0, 10 − q1 ). Da es eine einzige stationäre Stelle in (0, 10 − q1 ) gibt, nämlich q2 = 31 (10 − q1 ), muss diese die globale Max.Stelle sein. 1 b) Die Firmen legen ihre Produktionsmengen simultan und unabhängig voneinander fest. Bestimmen Sie das Nash-Gleichgewicht des Spiels. Lösung(smöglichkeit; eine von mehreren): Aus Symmetriegründen ist R1 (q2 ) = 31 (10 − q2 ) (für 0 ≤ q2 ≤ 10) und in einem Nash-GG (q1∗ , q2∗ ) muss R1 (q2∗ ) = q1∗ und R2 (q1∗ ) = q2∗ gelten: q1∗ = R1 (q2∗ ) = R1 (R2 (q1∗ )) = 13 10 − 31 (10 − q1∗ ) = 31 − 91 · 10 + 19 q1∗ ⇐⇒ 98 q1∗ = 29 10 ⇐⇒ q1∗ = 41 10 = 2.5 Dann q2∗ = R2 (q1∗ ) = 1 3 10 − 41 10 = 13 3 4 10 = 1 4 10 = 2.5. Einfacher: Symmetrieansatz q1 = q2 =: q in q1 = R2 (q2 ): q = 13 (10 − q) ⇐⇒ 10 − q − 3q = 0 ⇐⇒ 4q = 10 ⇐⇒ q = 10/4 = 2.5 c) Firma 1 legt zunächst ihre Produktionsmenge q1 fest. Firma 2 kann q1 beobachten, bevor sie ihre Produktionsmenge q2 festlegt. Welche Strategien haben die Firmen in diesem Spiel? Antwort: Strategien von Firma 1: Zahlen q1 ∈ [0, 10], Strategien von Firma 2: Funktionen q2 : [0, 10] → [0, 10], q1 → q2 (q1 ) Bestimmen Sie das teilspielperfekte Nash-Gleichgewicht des Spiels. Lösung: Rückwärtsinduktion. Auf Stufe 2 ist q1 ∈ [0, 10] gegeben. Firma 2 maximiert g(q2 ) = π2 (q1 , q2 ) über q2 . Das maximierende q2 haben wir schon ermittelt: q2 = R2 (q1 ) D.h.: Die teilspielperfekte Strategie von Firma 2 ist q2∗ (q1 ) = 31 (10 − q1 ) . Auf Stufe 1 antizipiert Firma 1 die Reaktion q2∗ (q1 ) von Firma 2 und maximiert 2 G(q1 ) = π1 q1 , q2∗ (q1 ) = 10 − q1 − 13 (10 − q1 ) · q1 = 2 2 3 (10 − q1 ) · q1 = 4 2 9 (10 − q1 ) · q1 Ableiten (und Faktor 10 − q1 herausziehen, analog zum Faktor 10 − Q in Teil a)): G0 (q1 ) = −2 · 94 (10 − q1 ) · q1 + 49 (10 − q1 )2 · 1 = 49 (10 − q1 ) · 10 − 3q1 G00 (q1 ) = 94 (10 − q1 ) · (−3) − 94 (10 − 3q1 ) = 94 (−30 + 3q1 − 10 + 3q1 ) = 94 (−40 + 6q1 ) Problem auch hier: Man muss die globale Max.Stelle von aber G G über [0, 10] bestimmen, 20 20 ist nicht global konkav auf [0, 10] (G ist konkav für q1 ∈ 0, 3 , aber konvex für q1 ∈ [ 3 , 10]). Argumentiere mit Monotonie: Für q1 ∈ [0, 10] ist das Vorzeichen von G0 (q1 ) durch den zweiten Faktor in G0 (q1 ) festgelegt: G fällt, wo dieser Faktor < 0, und wächst, wo er > 0 ist. D.h. das maximierende q1 ∈ [0, 10] bestimmt sich durch Nullsetzen des zweiten Faktors: 10 − 3q1 = 0 ⇐⇒ q1 = 13 10 = 3.3̄ = q1∗ Man kann auch so argumentieren: G hat eine einzige stationäre Stelle in (0, 10) und G(q1 = 0) = 0, G(q1 = 10) = 0, G(q1 ) > 0 für alle 0 < q1 < 10 Zusammengefasst: Das TSPNGG ist q1∗ , q2∗ (q1 ) mit q1∗ = 3.3̄ und q2∗ (q1 ) = 31 (10 − q1 ). Nicht gefragt war: Im TSPNGG wählt Firma 1: q1∗ = 3.3̄ Firma 2: q2∗ = 13 (10 − q1∗ ) = 1 3 (10 − 10 3 ) = 2 1 9 20 = 2.2̄ 10 d) Ist q̂1 , q̂2 (q1 ) mit q̂1 = 10 4 und ”q̂2 (q1 ) = 4 für alle q1 ≥ 0“ ein Nash-GG (nicht notwendigerweise ein T-Spiel-perfektes) des Spieles in c). In einem Nash-GG q̂1 , q̂2 (q1 ) des sequentiellen Spieles muss gelten: π1 q̂1 , q̂2 (q̂1 ) ≥ π1 q1 , q̂2 (q1 ) für alle Zahlen q1 ∈ [0, 10] π2 q̂1 , q̂2 (q̂1 ) ≥ π2 q̂1 , q2 (q̂1 ) für alle Funktionen q2 (·) : [0, 10] → [0, 10] (1) (2) Da in der Bedingung (2) von q2 (·) nur der Funktionswert q2 (q̂1 ) eingeht, reduziert der Funktion sie sich auf π2 (q̂1 , q̂2 (q̂1 ) ≥ π2 q̂1 , q2 für alle Zahlen q2“. Das bedeutet gerade, dass die Zahl ” q̂2 (q̂1 ) eine beste Antwort auf q̂1 (im Simultanspiel) ist. Bei einer konstanten Funktion q̂2 (q1 ) = q̂2 verlangen die Bedingungen (1) und (2) also: π1 q̂1 , q̂2 ≥ π1 q1 , q̂2 für alle Zahlen q1 ∈ [0, 10] (1) π2 q̂1 , q̂2 ≥ π2 q̂1 , q2 für alle Zahlen q2 ∈ [0, 10] (2) Das sind gerade die Bedingungen dafür, dass (q̂1 , q̂2 ) Nash-GG des Simultanspiels ist. Da wir mit q̂1 = q̂2 = 10 4 ein solches hatten, ist (q̂1 , q̂2 (q1 )) auch Nash-GG des seq. Spieles in c). e) Ist q̂1 , q̂2 (q1 ) mit q̂1 = 5 und q̂2 (q1 ) = 35 für alle q1 ∈ [0.10]“ ein Nash-GG (nicht notwen” digerweise ein T-Spiel-perfektes) des Spieles in c). Antwort: Nein. Begründung: Wenn dies ein Nash-GG wäre, müsste Firma 1 mit q̂1 = 5 eine beste Antwort auf die Strategie q̂2 (q1 ) = 53 für alle q1 ∈ [0, 10]“ von Firma 2 geben, d.h. q1 = 5 müsste ” G(q1 ) = π1 q1 , q̂2 (q1 ) = π1 q1 , q2 = 35 maximieren. Damit müsste q1 = 5 auch eine BA auf q2 = 53 im Simultanspiel sein. Aber die beste Antwort auf q2 = 53 im Simultanspiel ist q1 = R1 (q2 = 53 ) = 31 (10 − 53 ) = 25 9 6= q̂1 = 5. Anmerkung: Es ist aber q̂2 (q1 ) = 53 für alle q1 ∈ [0, 10]“ eine BA auf q̂1 = 5 im sequentiellen ” Spiel von Teil c). Wie oben gesehen, muss dazu nur π2 q̂1 , q̂2 (q1 ) ≥ π2 q̂1 , q2 für alle Zahlen q2 ∈ [0, 10] gelten. D.h. es muss nur q̂2 (q1 ) = 53 eine BA auf q̂1 = 5 bei q1 = 5 im Simultanspiel darstellen. Das ist der Fall: R2 (5) = 13 (10 − 5) = 53 . 3 Aufgabe 12.2 Drei Spieler verbrauchen Anteile x1 , x2 , x3 einer Ressource, die im Umfang von A verfügbar ist. Wenn Spieler i die Menge xi verbraucht (i = 1, 2, 3), haben die Spieler den Nutzen u1 (x1 , x2 , x3 ) = ln(x1 ) + ln(A − x1 − x2 − x3 ) u2 (x1 , x2 , x3 ) = ln(x2 ) + ln(A − x1 − x2 − x3 ) u3 (x1 , x2 , x3 ) = ln(x3 ) + ln(A − x1 − x2 − x3 ) a) Die Spieler wählen ihren Verbrauch simultan und unabhängig voneinander. Bestimmen Sie das Nash-GG des Spiels. Lösung: Partielle Ableitungen der Nutzen der SP nach ihrem Strategieparameter: ∂ui ∂xi ∂ 2 ui ∂xi2 1 xi 1 A−x1 −x2 −x3 1 − x12 − (A−x1 −x 2 2 −x3 ) i = = − Bed.1.Ordn. (hinreichend, da 2. part. Ableitungen negativ): ∂ui ! ∂xi = 1 xi 1 = A−x1 −x 2 −x3 xi = A − x1 − x2 − x3 ⇐⇒ ⇐⇒ 0 Lineares Gleichungssystem in (x1 , x2 , x3 ). Löse mit Symmetrieansatz xi = x: x = A − x − x − x ⇐⇒ 4x = A ⇐⇒ x = 1 4 A Also: Das Nash-GG des Simultanspiels ist: (x∗1 , x∗2 , x∗3 ) = 41 A, 14 A, 41 A . Anmerkung: Gesamtverbrauch im Nash-GG ist x∗1 + x∗2 + x∗3 = 34 A. b) Die Spieler 2 und 3 beobachten den Verbrauch von SP1, bevor sie ihre Mengen x2 , x3 simultan und unabhängig voneinander festlegen. Bestimmen Sie das teilspielperfekte Nash-GG dieses Spiels. Lösung: Zunächst: Die Strategien der Spieler bei diesem Spiel sind: SP1: x1 ≥ 0; SP2, SP3: Funktionen x2 (x1 ), x3 (x1 ) Rückwärtsinduktion: Stufe 2: x1 ist gegeben. SP2 und SP3 bestimmen ihre Verbrauchsmengen x2 , x3 als Nash-GG des Simultanspiels mit Nutzen: v2 (x2 , x3 ) = ln(x2 ) + ln(A − x1 − x2 − x3 ) v3 (x2 , x3 ) = ln(x3 ) + ln(A − x1 − x2 − x3 ) Strukturell wie Teil a) mit 2 statt 3 Spielern und B := A − x1 statt A: v2 (x2 , x3 ) = ln(x2 ) + ln(B − x2 − x3 ) v3 (x2 , x3 ) = ln(x3 ) + ln(B − x2 − x3 ) Wie bei Teil a): Die Bed.1.Ordn ist hinreichend und führt auf: ∂vi ! ∂xi = 0 ⇐⇒ ⇐⇒ 1 xi = B−x12 −x3 xi = B − x2 − x3 Symmetrieansatz x2 = x3 = x führt auf x = B − 2x ⇐⇒ x = 13 B. Also: Teilspielperfekte Lösung x∗2 (x1 ), x∗3 (x1 ) auf Stufe 2 ist: x∗2 (x1 ) = 31 (A − x1 ), 4 x∗3 (x1 ) = 13 (A − x1 ) Stufe 1: SP1 maximiert V (x1 ) = = = = ln(x1 ) + ln A − x1 − x∗2 (x1 ) − x∗3 (x1 ) ln(x1 ) + ln A − x1 − 32 (A − x1 ) ln(x1 ) + ln 31 (A − x1 ) ln(x1 ) + ln(A − x1 ) − ln(3) (Letzte Umformung: Funktionalgleichung log, vereinfacht das Ableiten) 1 V 0 (x1 ) = x11 − A−x 1 1 V 00 (x1 ) = − x12 − (A−x 2 1) < 0 1 Bed.2.Ordn ist ok. Die Bed.1.Ordn führt auf: ! V 0 (x1 ) = 0 ⇐⇒ ⇐⇒ 1 xi 1 = A−x 1 x1 = A − x1 ⇐⇒ 2x1 = A ⇐⇒ x1 = 12 A Also: TSPNGG x∗1 , x∗2 (x1 ), x∗3 (x1 ) ist: x∗1 = 21 A, x∗2 (x1 ) = 31 (A − x1 ), x∗3 (x1 ) = 31 (A − x1 ) Anmerkung: Auf dem GG-Pfad verbrauchen SP2 und SP3: x∗2 (x∗1 ) = 16 A, x∗3 (x∗1 ) = 16 A. Gesamtverbrauch auf dem GG-Pfad also x∗1 + x∗2 (x∗1 ) + x∗3 (x∗2 ) = 21 + 16 + 61 A = 56 A. c) Spieler 3 beobachtet den Verbrauch von Spieler 1 und 2, die ihren Verbrauch simultan und unabhängig voneinander festlegen. Bestimmen Sie das teilspielperfekte Nash-GG dieses Spiels. Lösung: Zunächst: Die Strategien der Spieler bei diesem Spiel sind: SP1,SP2: x1 ≥ 0, x2 ≥ 0 SP3: Funktion x3 (x1 , x2 ) Rückwärtsinduktion: Stufe 2: x1 , x2 gegeben. SP3 bestimmt seine Verbrauchsmenge x3 durch Maximierung von v(x3 ) = ln(x3 ) + ln(A − x1 − x2 − x3 ) = ln(x3 ) + ln(C − x3 ) mit C := A − x1 − x2 Ableiten: 1 v 0 (x3 ) = x13 − C−x 3 1 v 00 (x3 ) = − x12 − (C−x 2 3) < 0 3 Bed.2.Ordn ist ok. Die Bed.1.Ordn führt auf: ! v 0 (x3 ) = 0 ⇐⇒ ⇐⇒ 1 x3 1 = C−x 3 x3 = C − x3 ⇐⇒ x3 = 12 C Also: Teilspielperfekte Lösung x∗3 (x1 , x2 ) auf Stufe 2 ist: x∗3 (x1 , x2 ) = 21 (A − x1 − x2 ), Stufe 1: SP1, SP2 antizipieren x3 = x∗3 (x1 , x2 ). Sie wählen ihre Verbrauchsmengen x1 , x2 als Nash-GG des Simultanspiels mit Nutzen: V1 (x1 , x2 ) = ln(x1 ) + ln A − x1 − x2 − 21 (A − x1 − x2 ) = ln(x1 ) + ln 21 (A − x1 − x2 ) V2 (x2 , x3 ) = ln(x2 ) + ln A − x1 − x2 − 12 (A − x1 − x2 ) = ln(x2 ) + ln 21 (A − x1 − x2 ) 5 Man erhält x1 = x2 = x aus: 1 x 1 A−2x ⇐⇒ x = A − 2x ⇐⇒ 3x = A ⇐⇒ x = 13 A Also: TSPNGG x∗1 , x∗2 , x∗3 (x1 , x2 ) durch x∗1 = x∗2 = 31 A, x∗3 (x1 , x2 ) = 21 (A−x1 −x2 ) gegeben. Anmerkung: Auf dem GG-Pfad verbraucht SP3 x∗3 (x∗1 , x∗2 ) = 21 A − 13 A − 31 A = 16 A. Gesamtverbrauch auf dem GG-Pfad also: x∗1 + x∗2 + x∗3 (x∗1 , x∗2 ) = 31 + 13 + 16 A = 56 A = d) Zunächst wählt Spieler 1 seinen Verbrauch, dann Spieler 2 und schließlich Spieler 3. Die Spieler können jeweils den Verbrauch der Vorgänger beobachten. Bestimmen Sie das teilspielperfekte Nash-GG dieses Spiels. Lösung: Zunächst: Die Strategien der Spieler sind SP1: Zahl x1 ≥ 0 SP2: Funktion x2 (x1 ) SP3: Funktion x3 (x1 , x2 ) Rückwärtsinduktion: Stufe 3: SP3 kennt x2 und x3 ; er maximiert: v3 (x3 ) = ln(x3 ) + ln(A − x1 − x2 − x3 ) Die Lösung x∗3 (x1 , x2 ) ergibt sich aus (analog zu vorherigen Rechnungen): 1 x3 = 1 A−x1 −x2 −x3 ⇐⇒ x3 = A − x1 − x2 − x3 ⇐⇒ x3 = 12 (A − x1 − x2 ) Also: T-Spiel-perfekte Strategie von SP3: x∗3 (x1 , x2 ) = 21 (A − x1 − x2 ) Stufe 2: SP2 kennt x2 und antizipiert x3 = x∗3 (x1 , x2 ) = 21 (A − x1 − x2 ). Er maximiert v2 (x2 ) = ln(x2 ) + ln A − x1 − x2 − x∗3 (x1 , x2 ) = ln(x2 ) + ln A − x1 − x2 − 21 (A − x1 − x2 ) = ln(x2 ) + ln 12 (A − x1 − x2 ) = ln(x2 ) + ln(A − x1 − x2 ) − ln(2) Bed.1.Ordn. führt auf: 1 x2 = 1 A−x1 −x2 ⇐⇒ x2 = A − x1 − x2 ⇐⇒ x2 = 1 2 (A − x1 ) Also: T-Spiel-perfekte Strategie von SP2: x∗2 (x1 ) = 21 (A − x1 ) Stufe 1: SP1 antizipiert x2 = x∗2 (x1 ) = 21 (A − x1 ) und x3 = x∗3 x1 , x∗2 (x1 ) = 21 A − x1 − x∗2 (x1 ) = 21 A − x1 − 21 (A − x1 ) = SP1 maximiert 1 4 (A − x1 ) v1 (x1 ) = ln(x1 ) + ln A − x1 − x∗2 (x1 ) − x∗3 x1 , x∗2 (x1 ) = ln(x1 ) + ln A − x1 − 21(A − x1 ) − 41 (A − x1 ) = ln(x1 ) + ln 41 (A − x1 ) = ln(x1 ) + ln(A − x1 ) − ln(4) Bed.1.Ordn. führt auf: 1 x1 = 1 A−x1 ⇐⇒ x1 = A − x1 ⇐⇒ x1 = 1 2A Also: T-Spiel-perfekte Strategie von SP1: x∗1 = 12 A Das TSPNGG x∗1 , x∗2 (x1 ), x∗3 (x1 , x2 ) ist gegeben durch: x∗1 = 12 A, x∗2 (x1 ) = 21 (A−x1 ), x∗3 (x1 , x2 ) = 1 2 (A−x1 −x2 ) (D.h.: Strategie eines nachfolgenden Spielers: Verbrauche die Hälfte der Restmenge) Anmerkung: Aufdem GG-Pfad verbraucht SP1: x∗1 = 21 A, SP2: x∗2 (x∗1 ) = 41 A, SP3: x∗3 x∗1 , x∗2 (x∗1 ) = 21 A − 12 A − 14 A = 18 A. Gesamtverbrauch auf dem GG-Pfad also: x∗1 + x∗2 (x∗1 ) + x∗3 x∗1 , x∗2 (x∗1 ) = 21 + 14 + 18 A = 78 A Beobachtung: Da 78 A > 56 A > 43 A: Ges.Verbr in d) > Ges.Verbr in c),b) > Ges.Verbr in a) 6