Lösungen Aufgabenblatt 10 zur Spieltheorie SS 2017 Aufgabe 10.1: Zwei Länder betreiben Fischfang im gleichen Gewässer. Eine vergrößerte Fangmenge q2 von Land 2 reduziert den Ertrag von Land 1 und umgekehrt, so dass bei einer Fangmenge qj ≥ 30 Land i 6= j überhaupt nichts mehr fängt. Wenn die Kosten von Land i zum Fang der Menge qi durch qi2 gegeben sind, lassen sich die Gewinnfunktionen wie folgt modellieren: π1 (q1 , q2 ) = (30 − q2 ) q1 − q12 π2 (q1 , q2 ) = (30 − q1 ) q2 − q22 Unter dem Basisspiel soll das Spiel mit diesen Auszahlungen über eine Periode verstanden werden, wobei die Länder ihre Fangmengen unabhängig voneinander festlegen. Das Superspiel ist das unendlich-oft wiederholte Basisspiel, bei dem die Länder die Fangmengen der Vorperioden beobachten können und zukünftige Gewinne mit einem Faktor δ ∈ [0, 1) pro Periode diskontieren. a) Bestimmen Sie das Nash-Gleichgewicht (q1∗ , q2∗ ) des Basisspiels. Lösung: Partielle Ableitungen: ∂π1 ∂q1 ∂π2 ∂q2 = 30 − q2 − 2q1 , = 30 − q1 − 2q2 , ∂ 2 π1 ∂q12 ∂ 2 π2 ∂q22 = −2 < 0 X = −2 < 0 X Bed.2.Ordn. sind ok. Bed.1.Ordn: ∂π1 ∂q1 ∂π2 ∂q2 = 0 ⇐⇒ 2 q1 + q2 = 30 = 0 ⇐⇒ q1 + 2 q2 = 30 ⇐⇒ ⇐⇒ q1 2 1 30 = 1 2 q2 30 1 q1 10 30 2 −1 = = 10 q2 30 2 3 −1 Also: Das Nash-GG im Basisspiel ist (q1∗ , q2∗ ) = (10, 10). Alternative 1: (geht nur bei identischen Nutzenfunktionen der Spieler): Ansatz: q1 = q2 = q. Bed.1.Ordn ⇐⇒ 3q = 30 ⇐⇒ q = 10 = q1 = q2 Alternative 2: Reaktionsfunktionen bestimmen und schneiden (rechnerisch statt graphisch): R1 (q2 ) = 12 (30 − q2 ) q1 = R1 R2 (q1 ) = 12 30− 12 (30−q1 ) = 21 15+ 12 q1 ⇐⇒ 34 q1 = 7.5 1 R2 (q1 ) = 2 (30 − q1 ) Das führt auf q1 = 10 und dann q2 = R2 (q1 ) = 10. Wie hoch sind die Gewinne P := πi (q1∗ , q2∗ ) der beiden Länder im Nash-Gleichgewicht? Gewinne im Nash-GG (das punishment“): ” P = πi (q1∗ , q2∗ ) = (30 − q1∗ − q2∗ ) q1∗ = (30 − 10 − 10) · 10 = 100 = 1 8 · 800 b) Angenommen, im Basisspiel legen die beiden Länder ihre Fangmengen nicht unabhängig voneinander fest, sondern vereinbaren, eine Gesamtmenge Q je zur Hälfte zu fangen, den Gesamtgewinn π(Q) = π1 (q1 , q2 ) + π2 (q1 , q2 ) = (30 − q1 − q2 ) · q1 + (30 − q1 − q2 ) · q2 = (30 − Q) · Q zu maximieren und den Gewinn dann fifty-fifty aufzuteilen. Auf welche Fangmengen (q̂1 , q̂2 ) kommen sie dabei? Lösung (zu Auf welche Fangmengen (q̂1 , q̂2 ) kommen sie im sozialen Optimum?“): ” ! π 0 (Q) = 30 − Q − Q = 30 − 2Q = 0 ⇐⇒ Q = 15 1 Da π 00 = −2 < 0 ist Q eine Max.Stelle von π(Q). Sozial optimale“ (pareto-effiziente) Fangmengen sind also (q̂1 , q̂2 ) = (7.5, 7.5). ” Wie hoch ist in diesem Fall der Gewinn R = πi (q̂1 , q̂2 ) jedes Landes? Gewinne im sozialen Optimum“ (spätere reward“): ” ” R = πi (q̂1 , q̂2 ) = (30 − q̂1 − q̂2 ) q̂i = (30 − 15) · 15 2 = 225 2 = 112.5 = 1 8 · 900 Wie hoch ist die optimale Abweichungsmenge q̌1 von Land 1 und sein maximaler Abweichungsgewinn T = π1 (q̌1 , q̂1 ), wenn Land 2 sich an die Vereinbarung hält? Lösung: Die optimale Abweichungsmenge q̌1 von Land 1, wenn Land 2 sich an die Vereinbarung hält, ist die beste Antwort R1 (q̂2 ) von Land 1 auf die Fangmenge q̂2 von Land 2: 45 q̌2 = R1 (q̂2 ) = 21 (30 − q̂2 ) = 21 30 − 15 = 12 · 45 2 2 = 4 = 11.25 Bei q̌1 = 45 4 , q̂2 = 15 2 erzielt Land 1 den Gewinn T = π1 (q̌1 , q̂2 ) = 30 − q̂2 · q̌1 − q̌12 = 30 − q̂2 − q̌1 · q̌1 = (30 − 7.5 − 11.25) · 11.25 = 126.5625 45 45 2025 1 = 120−30−45 · 45 4 4 = 4 · 4 = 16 = 8 · 1012.5 Anmerkung: Die temptation T = 126.5625 ist größer als der reward R = 112.5, der wiederum größer als das punishment P = 100 ist: T > R > P . c) Geben Sie Triggerstrategien an, mit denen es den Ländern im Superspiel gelingt, den Gewinn R = πi (q̂1 , q̂2 ) in jeder Periode durch ein teilspielperfektes Nash-Gleichgewicht zu stützen, sofern der Diskontfaktor δ genügend groß ist. Lösung: si : In der ersten Runde wählt Land i q̂i . In der t-Runde wählt Land i q̂i , wenn in allen vorherigen Runden (q̂1 , q̂2 ) gespielt wurde, ansonsten wählt es nun qi∗ . Wie groß muss δ dabei mindestens sein? Lösung (knapp): Wie im Folk-Theorem, kann es mit diesen Trigger-Strategien nur an einer Stelle ein profitables Abweichen für (sagen wir) Land 1 geben: Wenn beide Länder sich bislang an ihre Strategien gehalten haben, Land 1 glaubt, dass Land 2 sich auch weiterhin an seine Strategie hält, und nun vor der Versuchung steht, sich gegenüber Land 2 verräterisch“ zu ” verhalten, indem es statt q̂1 seine beste Antwort q̌1 auf die Wahl q̂2 von Land 2 gibt: V1Abw = π1 (q̌1 , q̂2 ) + δ π1 (q1∗ , q2∗ ) + δ 2 π1 (q1∗ , q2∗ ) + . . . = T + δ P + δ 2 P + . . . = T + V1F olg = π1 (q̂1 , q̂2 ) + δ π1 (q̂1 , q̂2 ) + δ 2 π1 (q̂1 , q̂2 ) δ2 R + ... = R + δR + + ... = 1 1−δ δ 1−δ P R Für δ < 1 ist das Abweichen genau dann nicht profitabel, wenn T+ δ 1−δ P ≤ 1 1−δ R ⇐⇒ (1 − δ) T + δ P ≤ R ⇐⇒ T − R ≤ δ (T − P ) ⇐⇒ δ ≥ Als kritischer Diskontfaktor ergibt sich hier, da T = δkrit = T −R T −P = 1012.5−900 1012.5−800 112.5 212.5 = = 1 8 · 1012.5, R = 225 425 = 9·25 17·25 = 1 8 9 17 · 900, P = 1 8 T −R T −P · 800: ≈ 0.53 Für alle δ ≥ δkrit (und δ < 1) ist der Gewinn R in jeder Periode für beide Länder durch ein TSPNGG des Superspiels gestützt. Inhaltlich: Bei Gewichtung zukünftiger Gewinne mit δ ≥ δkrit überwiegt die langfristige Aussicht auf das (mittelgroße) R die Versuchung, einmalig die (hohe) T einzustreichen, dann aber langfristig nur das (geringe) P . 2 Aufgabe 10.2: Wir betrachten das Basisspiel von Aufgabe 10.1, nehmen aber an, dass Land 2 die Fangmenge von Land 1 beobachtet, bevor es seine festlegt. a) Welche Strategien hat Land 1, welche Land 2 in diesem Spiel? Antwort: • Die Strategien von Land 1 sind: Seine Fangmenge q1 ≥ 0 • Eine Strategie von Land 2 muss für jedes q1 ≥ 0 eine Fangmenge q2 ≥ 0 festlegen. D.h. die Strategien, die Land 2 hat, sind Funktionen q2 (q1 ). b) Bestimmen Sie das teilspielperfekte Nash-GG dieses Spiels (über eine Periode). Lösung: • Ein Nash-GG hat die Struktur q1∗ , q2∗ (q1 ) . • Das teilspielperfektes Nash-GG bestimmt sich durch Rückwärtsinduktion. • Auf Stufe 2 ist q1 gegeben und q2 = q2∗ (q1 ) ergibt sich durch Maximierung von g(q2 ) := π2 (q1 , q2 ) über q2 bei diesem q1 : g(q2 ) = π2 (q1 , q2 ) = (30 − q1 ) q2 − q22 g 0 (q2 ) = 30 − q1 − 2q2 g 00 (q2 ) = −2 < 0 ⇒ Bed.2.Ordn erfüllt • Die Bed.1.Ordn. liefert q2 = 12 (30 − q1 ), d.h. q2∗ (q1 ) = 21 (30 − q1 ). TSPNGG: ?, 21 (30 − q1 ) • Auf Stufe 1 antizipiert Land 1 die Reaktion q2 = q2∗ (q1 ) von Land 2 auf seine Fangmenge q1 D.h. Land 1 maximiert G(q1 ) = π1 q1 , q2∗ (q1 ) über q1 : G(q1 ) = = G0 (q1 ) = G00 (q1 ) = π1 q1 , q2∗ (q1 ) = 30 − q2∗ (q1 ) q1 − q12 = 30 − 21 (30 − q1 ) · q1 − q12 15q1 + 12 q12 − q12 = 15q1 − 21 q12 15 − q1 −1 < 0 ⇒ Bed.2.Ordn erfüllt TSPNGG: q1∗ , q2∗ (q1 ) = 15, 21 (30 − q1 ) • Die Bed.1.Ordn. liefert q1 = 15 = q1∗ • Nicht gefragt, aber dennoch interessant: Im TSPNGG wählt Land 1 die Fangmenge q1 = 15,Land 2 die Fangmnge q2 = 12 (30−15) = 7.5 c) Es sei (q1∗ , q2∗ ) das Nash-GG des Simultanspiels aus Aufgabe 10.1. Zeigen Sie, dass durch q̂1 = q1∗ und q̂2 (q1 ) = q2∗ für alle q1“ ein Nash-GG q̂1 , q̂2 (·) des extensiven Spiels definiert wird. Ist dieses ” Nash-Gleichgewicht teilspielperfekt? Lösung: Zunächst: Wenn es sich um ein Nash-GG handelt, dann ist es sicher nicht TSP-perfekt. Einfache Begründung: Das einzige teilspielperfekte Nash-GG haben wir in Teil b) bestimmt – und das war ein anderes. Zum Nachweis, dass es ein Nash-GG des extensiven Spieles ist, holen wir etwas weiter aus: Begründen Sie, dass alle Nash-Gleichgewichte q̂1 , q̂2 (·) (auch die nicht-teilspielperfekten) des extensiven Spieles, das in dieser Aufgabe betrachtet wird, durch folg. Bedingungen festgelegt sind: π1 q̂1 , q̂2 (q̂1 ) ≥ π1 q1 , q̂2 (q1 ) für alle Zahlen q1 ≥ 0 (1) π2 q̂1 , q̂2 (q̂1 ) ≥ π2 q̂1 , q2 (q̂1 ) für alle Funktionen q2 (·) : [0, ∞) → [0, ∞) (2) Lösung: Diese Bedingungen drücken gerade aus, dass sich die Länder in einem Nash-GG gegenseitig beste Antworten geben. 3 Zeigen Sie, dass die Bedingung (2) nur verlangt, dass der (eine) Funktionswert q̂2 (q̂1 ) eine beste Antwort von Land 2 auf q̂1 von Land 1 im Simultanspiel darstellt, d.h. dass q̂2 (q̂1 ) = R2 (q̂1 ) gilt.1 Lösung: Von der Fkt. q2 (·) geht in (2) nur der Funktionswert q2 (q̂1 ) ein. Die Bedingung (2) reduziert sich daher auf π2 (q̂1 , q̂2 (q̂1 ) ≥ π2 q̂1 , q2 für alle Zahlen q2“. Das bedeutet gerade, dass q̂2 (q̂1 ) eine ” beste Antwort auf q̂1 (im Simultanspiel) ist. Anmerkung: Inhaltlicher Grund für diese Aussage ist, dass Land 2 in einem (nicht-TSP-perfekten) Nash-GG des Extensivspiels nur optimal auf die Vorgabe“ q̂1 = q1∗ von Land 1 reagieren muss. ” TSP-Perfektheit verlangt eine optimale Reaktion von Land 2 auf jede denkbare Vorgabe von Land 1 Nun zu: Es sei (q1∗ , q2∗ ) das Nash-GG des Simultanspiels aus Aufgabe 10.1. Zeigen Sie, dass durch q̂1 = q1∗ und q̂2 (q1 ) = q2∗ für alle q1“ ein Nash-GG q̂1 , q̂2 (·) des extensiven Spiels definiert wird. ” Lösung: Im Nash-GG des Simultanspiels gibt insbes. Land 1 mit q1∗ eine beste Anwort auf q2∗ , d.h. π1 (q1∗ , q2∗ ) ≥ π1 (q1 , q2∗ ) für alleq1 ≥ 0. Bei q̂1 = q1∗ und q̂2 (q1 ) = q2∗ für alle q1“ liefert das sofort: ” π (q̂ , q̂ (q̂ ) ≥ π1 q1 , q̂2 (q1 ) für alle Zahlen q1 ≥ 0“. Also ist die Bedingung (1) erfüllt. ” 1 1 2 1 Wie gesehen, fordert die Bedingung (2) nur, dass Land 2 optimal auf (das eine) q̂1 im Simultanspiel reagiert. Da (q1∗ , q2∗ ) ein Nash-GG des Simultanspiels darstellt, ist dies ist gerade bei q̂2 = q2∗ als Reaktion auf q̂1 = q1∗ der Fall. Nachdem man sich die Bedingungen für ein Nash-GG im extensiven Spiel klar gemacht hat, kann man viele weitere (nicht-TSP-perfekte) Nash-GGe nachweisen. Zum Beispiel: Gegeben ein beliebiges q̂1 ∈ [0, 30], stellt das Strategienprofil q̂1 , q̂2 (·) mit ( R2 (q̂1 ) wenn q1 = q̂1 wobei R2 (q1 ) = 21 (30 − q1 ) die Reaktionsfunktion q̂2 (q1 ) = , von Land 2 im Simultanspiel bezeichnet 30 sonst ein Nash-GG des extensiven Spiels dieser Aufgabe dar. (Bei Verzicht auf TSP-Perfektheit kann also jedes q̂1 ∈ [0, 30] als Bestandteil eines Nash-GGs gestützt“ werden.) ” Beweis: Aus Sicht von Land 1, das annimmt, dass Land 2 die Strategie q̂2 (·) verwendet: Wenn Land 1 ein q1 6= q̂1 wählt, reagiert Land 2 mit q2 = 30, was den Gewinn von Land 1 negativ macht: π1 (q1 , 30) = (30 − 30) · q1 − q12 = −q12 . Wählt Land 1 jedoch q1 = q̂1 , reagiert Land 2 mit q2 = R2 (q̂1 ) = 21 (30 − q̂1 ). Bei dieser Fangmengenkonstellation ist der Gewinn π1 (q̂1 , R2 (q1 )) = (30 − 21 (30 − q̂1 ) − q̂1 ) q̂1 = (15 − 12 q̂1 ) q̂1 ≥ 0, so dass π1 (q̂1 , q̂2 (q̂1 )) ≥ 0 ≥ π1 (q1 , q̂2 (q̂1 )) ⇒ Bed. (1). Aus Sicht von Land 2: Bei Verzicht auf TSP-Perfektheit muss Land 2 in einem NGG nur optimal auf die Vorgabe q̂1 von Land 1 reagieren. Das macht es gerade bei diesem q̂2 (·), da q̂2 (q̂1 ) = R2 (q̂1 ). Dagegen: (q̂1 , q̂2 (·)) mit q̂1 = 0, q̂ (q ) = 15 für alle q1“ ist kein Nash-GG ” 2 1 Begründung: Hier ist zwar die Bedingung (2) erfüllt, denn q̂2 (q̂1 ) = 15, und das ist gleich R2 (q̂1 ) = R2 (0) = 12 (30 − 0) = 15. Aber Bedingung (1) ist nicht erfüllt. Diese fordert: π1 q̂1 , q̂2 (q̂1 ) ≥ π1 q1 , q̂2 (q1 ) für alle Zahlen q1 ≥ 0, hier also π1 0, 15 ≥ π1 q1 , 15 für alle Zahlen q1 ≥ 0 D.h. q1 = 0 müsste beste Antwort von Land 1 auf q2 = 15 im Simultanspiel sein. Aber die beste Antwort von Land 1 auf q2 = 15 im Simultanspiel ist R1 (q2 = 15) = 12 (30 − 15) = 7.5 6= 0 Es ist einfach zu zeigen, dass die einzigen Nash-GGe (q̂1 , q̂2 (·)), die ein konstantes q̂2 (q1 ) = q2 (für alle q1 ) verlangen, durch q̂1 = q1∗ und q̂2 (q1 ) = q2∗ gegeben sind. 1 Das bedeutet, dass Land 2 in einem (nicht notwendigerweise teispielperfekten) Nash-GG des Extensivspiels nur optimal auf die Vorgabe“ q̂1 von Land 1 reagieren muss. TSP-Perfektheit verlangt dagegen eine optimale Reaktion ” q2 von Land 2 auf jede denkbare Vorgabe q1 von Land 1. 4 Aufgabe 10.3: In der Situation des Basisspiels von Aufgabe 10.1 ist nun ein drittes Land involviert und die Gewinnfunktionen sind nun: π1 (q1 , q2 , q3 ) = (30 − q2 − q3 ) q1 − q12 π2 (q1 , q2 , q3 ) = (30 − q1 − q3 ) q2 − q22 π3 (q1 , q2 , q3 ) = (30 − q1 − q2 ) q3 − q32 a) Zunächst wählt Land 1 die Fangmenge. Die Länder 2 und 3 können q1 beobachten, bevor sie ihre Fangmengen (q2 , q3 ) simultan und unabhängig voneinander festlegen. Beschreiben Sie die Strategien, die die Länder in diesem Spiel haben Antwort: – Die Strategien von Land 1 sind: Seine Fangmenge q1 ≥ 0 – Eine Strategie von Land 2 bzw. Land 3 muss für jedes q1 ≥ 0 ein q2 bzw. q3 festlegen. D.h. die Strategien von Land 2 und Land 3 sind Funktionen q2 (q1 ) und q3 (q1 ). – Ein Nash-GG hat also die Struktur q1∗ , q2∗ (q1 ), q3∗ (q1 ) ← Jedes NGG, auch ein nicht-TSPNGG Bestimmen Sie das teilspielperfekte Nash-GG. Lösung: Rückwärtsinduktion – Auf Stufe 2 ist q1 gegeben; Zur Verdeutlichung schreiben wir q1 =: a q2∗ (q1 ), q3∗ (q1 ) ergeben sich als Nash-GG im Simultanspiel zw. L2 u. L3 mit Payoffs g2 (q2 , q3 ) = π2 (a, q2 , q3 ) = (30 − a − q3 ) q2 − q22 g3 (q2 , q3 ) = π2 (a, q2 , q3 ) = (30 − a − q2 ) q3 − q32 Partielle Ableitungen (nach eigenem Strategieparameter): ∂g2 ∂q2 ∂g3 ∂q3 = (30 − a − q3 ) − 2q2 = (30 − a) − q3 − 2q2 , = (30 − a − q2 ) − 2q3 = (30 − a) − q2 − 2q3 , ∂ 2 g2 ∂q22 ∂ 2 g3 ∂q32 = −2 < 0 ⇒ Bed.2.Ordn. ok = −2 < 0 ⇒ Bed.2.Ordn. ok Die Bed.1.Ordn. liefert Gleichungssystem in (q2 , q3 ). Da die Länder 2 und 3 identische Payoffs haben, wird die Lösung q2 = q3 =: q erfüllen. Das q bekommen wir aus (30 − a) − q − 2q = 0 ⇐⇒ 3 q = 30 − a ⇐⇒ q = 13 (30 − a) D.h. bei gegebenem a = q1 ergibt sich das Nash-GG des Simultanspiels auf Stufe 3 als q2∗ (q1 ) = q3∗ (q1 ) = 1 3 (30 1 3 (30 − q1 ) − q1 ) ⇒ TSPNGG: q1 , q2∗ (q1 ), q3∗ (q1 ) = ?, 13 (30−q1 ), 31 (30−q1 ) – Auf Stufe 1 antizipiert Land 1 die Reaktion q2 = q2∗ (q1 ) von Land 2 und q3 = q3∗ (q1 ) von Land 3 auf die von ihm vorgegebene Fangmenge q1 D.h. Land 1 maximiert G(q1 ) = π1 q1 , q2∗ (q1 ), q3∗ (q1 ) über q1 : G(q1 ) = 30 − q2∗ (q1 ) − q3∗ (q1 ) q1 − q12 = 30 − 32 (30 − q1 ) q1 − q12 = 30 − 20 + 32 q1 q1 − q12 = 10 q1 − 13 q12 0 G (q1 ) = 10 − 23 q1 G00 (q1 ) = − 23 < 0 ⇒ Bed.2.Ordn erfüllt Die Bed.1.Ordn. liefert q1∗ = 23 10 = 15 – Das TSPNGG ist: q1∗ , q2∗ (q1 ), q3∗ (q1 ) = 15, 31 (30 − q1 ), 13 (30 − q1 ) 5 Bestimmen Sie die Fangmengen q1∗ , q2∗ , q3∗ in diesem Gleichgewicht. Lösung: Das TSPNGG war: q1∗ , q2∗ (q1 ), q3∗ (q1 ) = 15, 31 (30 − q1 ), 13 (30 − q1 ) Auf dem GG-Pfad bekommt man q1∗ = 15, q2∗ = 13 (30 − q1∗ ) = 1 3 · 15 = 5, q3∗ = 13 (30 − q1∗ ) = 1 3 · 15 = 5 Ist (q̂1 = 0, q̂2 = 10, q̂3 = 10) ein Nash-GG (nicht notwendigerweise ein teilspielperfektes) des Spiels, wenn man q̂2 = 10“ als q̂2 (q1 ) = 10 für alle q1“ ( q̂3 = 10“ analog) auffasst? ” ” ” Antwort: Nein. Begründung: Wenn dies ein Nash-GG wäre, müsste Land 1 eine beste Antwort auf die Strategien q̂2 (q1 ) = 10, q̂3 (q1 ) = 10 von Land 2 und Land 3 geben, d.h. q1 müsste G(q1 ) = π1 q1 , q̂2 (q1 ), q̂3 (q1 ) = (30 − 10 − 10) q1 − q12 = 10q1 − q12 maximieren. Aber G nimmt sein Max. in q1 = 5 an (denn G0 (q1 ) = 0 ⇐⇒ 10 − 2q1 = 0 ⇐⇒ q1 = 5), nicht in q̂1 = 0. Da G(q̂1 = 0) = 0 < G(q1 = 5) = 10 · 5 − 52 = 50 − 25 = 25, ist q̂1 = 0 keine beste Antwort von Land 1 auf die angegebenen Strategien von Land 2 und Land 3. 6 b) Zunächst legen Land 1 und 2 ihre Fangmengen (q1 , q2 ) simultan und unabhängig voneinander fest. Land 3 kann (q1 , q2 ) beobachten, bevor es seine Fangmenge q3 festlegt. Beschreiben Sie die Strategien, die die Länder in diesem Spiel haben – Die Strategien von Land 1 und Land 2 sind: Ihre Fangmengen q1 ≥ 0, q2 ≥ 0 – Eine Strategie von Land 3 muss für jedes (q1 , q2 ) ein q3 festlegen. D.h. die Strategien von Land 3 sind Funktionen q3 (q1 , q2 ). (Alle Strategien: Alle solche Fktnen) – Ein NGG hat also die Struktur q1∗ , q2∗ , q3∗ (q1 , q2 ) ← Jedes NGG, auch ein nicht-TSPNGG und bestimmen Sie das teilspielperfekte Nash-GG Lösung: Rückwärtsinduktion. – Beginne mit Stufe 2: q1 , q2 sind gegeben. Land 3 maximiert g3 (q3 ) := π3 (q1 , q2 , q3 ) über q3 : g3 (q3 ) = (30 − q1 − q2 ) q3 − q32 g30 (q3 ) = 30 − q1 − q2 − 2q3 g300 (q3 ) = −2 < 0 ⇒ Bed.2.Ordn erfüllt Bed.1.Ordn führt auf: q3∗ (q1 , q2 ) = 1 2 (30 − q1 − q2 ) – Auf Stufe 1 ist das Nash-GG des Simultanspiels zwischen Land 1 und Land 2 zu ermitteln, wenn sie antizipieren, dass Land 3 mit q3∗ (q1 , q2 ) = 21 (30 − q1 − q2 ) auf die von ihnen gesetzten Fangmengen reagieren wird. Die Payofffs G1 (q1 , q2 ) und G2 (q1 , q2 ) im reduzierten Spiel ergeben sich durch Einsetzen von q3∗ (q1 , q2 ) für q3 in π1 bzw. π2 : G1 (q1 , q2 ) = π1 q1 , q2 , q3∗ (q1 , q2 ) = 30 − q2 − 21 (30 − q1 − q2 ) q1 − q12 = (15 + 21 q1 − 21 q2 ) q1 − q12 = 15 − 12 q2 q1 − 12 q12 G2 (q1 , q2 ) = π2 q1 , q2 , q3 (q1 , q2 ) = 30 − q1 − 21 (30 − q1 − q2 ) q2 − q22 = 15 − 21 q1 + 12 q2 q2 − q22 = 15 − 21 q1 q2 − 12 q22 Partielle Ableitungen nach eigenem Strategieparameter: ∂G1 ∂q1 ∂G2 ∂q2 = 15 − 12 q2 − q1 ⇒ = 15 − 1 2 q1 − q2 ⇒ ∂ 2 G1 ∂q12 ∂ 2 G2 ∂q22 = −1 < 0 ⇒ Bed.2.Ordn erfüllt = −1 < 0 ⇒ Bed.2.Ordn erfüllt Lösung der Bed.1.Ordn.: Ansatz mit q2 = q1 = q führt auf 15 − 23 q = 0: q = 30 3 = 10: (q1∗ , q2∗ ) = (10, 10) – Das TSPNGG ist: q1∗ , q2∗ , q3∗ (q1 , q2 ) mit q1∗ = 10, q2∗ = 10, q3∗ (q1 , q2 ) = 12 (30 − q1 − q2 ) Bestimmen Sie auch die Fangmengen q1∗ , q2∗ , q3∗ in diesem Gleichgewicht. Antwort: q1∗ = 10, q2∗ = 10 ist klar. Um q3∗ zu bekommen: (q1∗ , q2∗ ) in q3∗ (q1 , q2 ) einsetzen: q3∗ = 21 (30 − q1∗ − q2∗ ) = 12 30 − 10 − 10 = 5 Zusatzfrage: Geben Sie ein Nash-Gleichgewicht des Spiels an, das nicht teilspielperfekt ist. Antwort: Das Nash-GG (q̂1 , q̂2 , q̂3 ) des Simultanspiels aller drei Länder ist auch ein Nash-GG des extensiven Spiels, wenn man für die Fkt. q3∗ (q1 , q2 ) die Konstante q̂3 für alle q1 , q2 nimmt. 1 Bed.1.Ordn: ∂π ∂q1 = (30 − q2 − q3 ) − 2q1 = 0 und analog für π2 , π3 . Das Gl.System lässt sich leicht mit dem Symmetrie-Ansatz q1 = q2 = q3 = q lösen: 30 − 4q = 0 ⇐⇒ q = 30/4 = 7.25. 7 Aufgabe 10.5: Wir nehmen nun an, dass die beiden Länder im Basisspiel von Aufgabe 10.1 auch Grenzkosten in Höhe von c0 = 15 haben. Die Grenzkosten können sie durch Investitionen in universitäre Projekte in Höhe von `1 bzw. `2 reduzieren, wobei (positive) externe Effekte auftreten, da die Ergebnisse nicht geheim gehalten werden. Wir nehmen an, dass die Grenzkosten von Land i sich mit `1 und `2 gemäß ci (`1 , `2 ) = c0 − `i − β · `−i (in der Aufgabe nehmen wir β = 1 an) vermindern. Für die Finanzierung seiner universitären Projekte entstehen Land i Fixkosten ( fix“ ” in Bezug auf die Fangmenge) in Höhe von Ki (`i ) = 12 `i2 . Die Gewinne seien also nun: π1 (q1 , q2 , `1 , `2 ) = (30 − q2 ) · q1 − q12 − c1 (`1 , `2 ) · q1 − K1 (`1 ), mit c1 (`1 , `2 ) = 15 − `1 − `2 , K1 (`1 ) = π2 (q1 , q2 , `1 , `2 ) = (30 − q1 ) · q2 − q22 − c2 (`1 , `2 ) · q2 − K2 (`2 ), mit c2 (`1 , `2 ) = 15 − `2 − `1 , K2 (`2 ) = 1 2 2 `1 1 2 2 `2 Das Spiel läuft wie folgt ab: Stufe 1: Die Länder legen ihre Investitionen (`1 , `2 ) simultan und unabhängig voneinander fest Stufe 2: Die Länder beobachten die Investitionen `1 , `2 in die universitären Projekte und legen dann ihre Fangmengen q1 , q2 simultan und unabhängig voneinander fest. Lösen Sie dieses Spiel wie folgt: a) Beschreiben Sie die Strategien, die Land i in diesem Spiel hat. Lösung: Auf Stufe 1 kann Land i sein Investition `i festlegen. Auf Stufe 2 beobachtet es `1 , `2 und legt dann seine Fangmenge qi fest. D.h. die Strategien von Land i haben die Struktur `i , qi (·, ·) , wobei qi (·, ·) für eine beliebige Funktion von (`1 , `2 ) steht. (Der Einfachheit halber schreiben wir qi (`1 , `2 ) statt qi (·, ·) für solche Funktionen; dabei sind `1 , `2 Dummy-Variablen“, keine Zahlen; analog qi∗ (`1 , `2 ).) ” b) Bestimmen Sie das Nash-GG q1∗ (`1 , `2 ), q2∗ (`1 , `2 ) des Spieles um die Fangmengen“. ” Lösung: Gefragt ist nach dem Ergebnis der Rückwärtsinduktion auf Stufe 2: Auf Stufe 2 sind `1 und `2 und damit c1 , c2 , K1 , K2 exogene Parameter. Wir lesen daher die Gewinne als g1 (q1 , q2 ) = (30 − q2 ) · q1 − q12 − c1 · q1 − K1 , g2 (q1 , q2 ) = (30 − q1 ) · q2 − q22 − c2 · q2 − K2 , mit exogenen Parametern c1 , c2 , K1 , K2 . Partielle Ableitungen (nach eigenem Strategieparameter): ∂g1 ∂q1 ∂g2 ∂q2 = 30 − q2 − 2q1 − c1 , = 30 − q1 − 2q2 − c2 , ∂ 2 g1 ∂q12 ∂ 2 g2 ∂q22 = −2 < 0 ⇒ Bed.2.Ordn ok = −2 < 0 ⇒ Bed.2.Ordn ok Die Lösung der Bed.1.Ordn mit dem Ansatz q1 = q2 liefert: q1 = 31 (30 − c1 ), q2 = 13 (30 − c2 ) Mit c1 (`1 , `2 ) = 15 − `1 − β`2 und c2 (`1 , `2 ) = 15 − `2 − β`1 ergibt sich (bei uns: β = 1): q1∗ (`1 , `2 ) = 31 30 − c1 (`1 , `2 ) = 13 15 + `1 + β `2 = 5 + 13 (`1 + β `2 ) q2∗ (`1 , `2 ) = 31 30 − c2 (`1 , `2 ) = 13 15 + `2 + β `1 = 5 + 13 (`2 + β `1 ) 8 c) Bestimmen Sie das teilspielperfekte Nash-GG des Spieles. Lösung: Auf Stufe 1 der Rückw.Induktion antizipieren die beiden Länder, dass sie bei simultaner Investition (`1 , `2 ) mit den Fangmengen qi∗ (`1 , `2 ) auf Stufe 2 reagieren werden. Das TSP-perfekte Investitionsprofil“ (`∗1 , `∗2 ) bestimmt sich als Nash-GG des Simultanspiels mit ” den reduzierten Auszahlungen“ G1 (`1 , `2 ), G2 (`1 , `2 ), die entstehen, wenn man in den πi die ” Variablen qi durch die Funktionen qi∗ (`1 , `2 ) ersetzt. Um die Funktionen G1 (`1 , `2 ), G2 (`1 , `2 ) zu ermitteln, beachten wir zunächst, dass sich die Gewinne πi wie folgt schreiben lassen: πi = (30 − qj )qi − ci qi − qi2 − Ki = (30 − qi − qj − ci ) qi − Ki = (30 − q1 − q2 − ci ) qi − Ki Damit stellen sich die Gewinne Gi (`1 , `2 ) im reduzierten Spiel auf Stufe 1 wie folgt dar: Gi (`1 , `2 ) = 30 − q1∗ (`1 , `2 ) − q2∗ (`1 , `2 ) − ci (`1 , `2 ) · qi∗ (q1 , q2 ) − 21 `i2 Wir werten in einer Nebenrechnung den Term ci (`1 , `2 ) + q1∗ (`1 , `2 ) + q2∗ (`1 , `2 ) aus. Zunächst ist: q1∗ (`1 , `2 ) + q2∗ (`1 , `2 ) = 10 + 32 (`2 + `1 ) Damit vereinfacht sich der Term zu: ci (`1 , `2 ) + q1∗ (`1 , `2 ) + q2∗ (`1 , `2 ) = 15 − (`1 + `2 ) + 10 + 23 (`1 + `2 ) = 25 − 13 (`1 + `2 ) Die Gewinne (Auszahlungen) im reduzierten Spiel auf Stufe 1 schreiben sich damit als: G1 (`1 , `2 ) = 30 − c1 (`1 , `2 ) − q1∗ (`1 , `2 ) − q2∗ (`1 , `2 ) · q1∗ (`1 , `2 ) − 21 `12 = 5 + 13 (`1 + `2 ) · 5 + 13 (`1 + `2 ) − 12 `12 G2 (`1 , `2 ) = 30 − c2 (`1 , `2 ) − q2∗ (`1 , `2 ) − q1∗ (`1 , `2 ) · q2∗ (`1 , `2 ) − 21 `22 = 5 + 31 (`1 + `2 ) · 5 + 13 (`1 + `2 ) − 12 `22 In dieser Form lassen sich die partiellen Ableitungen nach dem eigenen Strategieparameter `1 bzw. `2 leicht ermitteln (mit Produktregel, es ginge auch Kettenregel, da [. . .] · [. . .] = [. . .]2 ): 1 ∂G1 1 1 1 ∂`1 = 3 · 5 + 3 (`1 + `2 ) + 5 + 3 (`1 + `2 ) · 3 − `1 2 10 7 2 = 10 1 = 3 − 9 `1 + 9 `2 3 + 9 (`1 + `2 ) − ` 1 ∂G2 1 1 1 · 5 + (` + ` ) + 5 + (` + ` ) · 3 − `2 = 1 2 1 2 ∂`2 3 3 3 2 10 2 7 = 10 + (` + ` ) − ` = + ` − ` 2 2 3 9 1 3 9 1 9 2 Da ∂Gi ∂`i = − 97 < 0, sind die Bed.2.Ordn erfüllt. Die Bed.1.Ordn. lassen sich wieder mit dem Symmetrie-Ansatz ` = `1 = `2 leicht lösen: 10 3 Wir erhalten also: `∗1 = 6, = 5 9` ⇒ `= 10 9 3 5 = 6 `∗2 = 6 Im TSPNGG verwendet Land i die Strategie: `∗i = 6, qi∗ (`1 , `2 ) = 5 + 31 (`1 + `2 ) d) Welche Investition `∗i tätigt Land i? Antwort: Schon gesehen: `∗1 = `∗2 = 6 Wie sehr reduzieren sich dabei die Grenzkosten c∗i ? Antwort: Damit werden die Grenzkosten von c0 = 15 auf c∗i = 15 − 6 − 6 = 3 gedrückt. Welche Kosten Ki∗ trägt Land i zur Reduktion seiner Grenzkosten? Antwort: Die Fixkosten dafür sind: Ki∗ = 12 `∗i 2 = 18 Welche Fangmenge qi∗ legt Land i im teilspielperfekten Nash-Gleichgewicht fest? Antwort: Für die Fangmengen ergibt sich: 9 qi∗ = 5 + 13 (`∗1 + `∗2 ) = 5 + 12 3 = 9.