Spieltheorie, A. Diekmann – Musterlösungen Übungsblatt 1 Aufgabe 1 a) Geben Sie die Maximin-Strategie(n) an. Lösung: die Minima sind für Zeile und Spalte bei beiden Strategien 0. Daher sind für beie Spieler beide Strategien Maximin-Strategien. b) Gibt es dominante Strategien? Wenn ja, geben sie diese an. Lösung: Steal ist schwach dominant: 1000 > 500 und 0 ≥ 0. c) Geben Sie Pareto-optimale Strategienprofile an. Lösung: (Steal, Split), (Split, Split), (Split, Steal) d) Geben Sie das oder die Nash-Gleichgewichte an. Lösung: (Steal, Split), (Steal, Steal), (Split, Steal) Aufgabe 2 Eine ziemlich unrealistische Situation: Ein grosszügiger Multi-Billionär macht zwei Spielern A und B folgendes Angebot: Die beiden Spieler wählen unabhängig voneinander jeweils eine (nicht-negative reelle) Zahl ≥ 0. Das Produkt der beiden Zahlen wird an jeden Spieler in Fr. ausgezahlt. (Wählt Spieler A 20,5 und Spieler B 1000 dann erhalten beide je 20500 Fr.). Sofern Nash-Gleichgewichte existieren: a) Geben Sie das oder die Nash-Gleichgewichte an. Lösung: (0, 0), denn das Produkt aus null mal einer beliebigen Zahl bleibt immer null. b) Geben Sie das oder die Nash-Gleichgewichte an, wenn die Spieler maximal 1000‘000 wählen dürfen. Lösung: (0, 0) und (1000‘000, 1000‘000) c) Geben Sie das oder die Nash-Gleichgewichte an, wenn die Obergrenze von 1000‘000 entfällt, aber eine Untergrenze eingeführt wird. Es dürfen nur Zahlen ≥ 1000 gewählt werden. Lösung: Es gibt kein Nash-Gleichgewicht mehr. (Etliche von Ihnen gingen von der realistischen Annahme aus, dass das Vermögen (V) des Billionärs endlich sei. Dann gäbe es wieder Nash-Gleichgewichte, nämlich alle (a, b) mit a · b = V) 1 Übungsblatt 2 Aufgabe 1: Piratenschatz Ein Piratenschatz mit 100 Goldmünzen soll unter fünf Piraten aufgeteilt werden. Die Ränge der fünf Piraten sind: 1. Anton Bonnet, 2. Bootstrap Bill, 3. Cutler Beckett, 4. Davy Jones, 5. Edward Teach (A, B, C, D, E) Die Aufteilung wird nach folgenden Regeln vorgenommen: • Der Ranghöchste macht einen Vorschlag zur Aufteilung, dann stimmen die Piraten ab. • Der Vorschlagende ist stimmberechtigt und hat die ausschlaggebende Stimme, wenn es keine Mehrheit gibt. • Wird der Vorschlag angenommen, erfolgt diese Aufteilung und das Spiel ist zu Ende. • Wird die Aufteilung nicht angenommen, dann wird der Vorschlagende über Bord geworfen und der nächste im Rang schlägt eine Aufteilung vor. • Jeder Pirat möchte viele Goldmünzen erhalten. (Erhalten sie bei einem Vorschlag gleich viele Goldmünzen, wie sie bei einem alternativen Vorschlag auch erhalten könnten, wählen sie den Vorschlag, bei dem sie den Vorschlagenden über Bord werfen können.) Welche Aufteilung wählen die strikt rationalen und eigennützigen Piraten? Hinweis: „Zäumen Sie das Pferd vom Schwanz her auf“, d.h. denken Sie an die Rückwärtsinduktion! A 98 B C D E Kommentar 100 0 Ist nur noch D und E übrig, kann sich D alle Münzen selbst zusprechen, E geht leer aus. 99 0 1 Ist C am Zug, sieht er dies voraus und gewinnt E, indem er ihm eine Münze anbietet. 99 0 1 0 Kann B einen Vorschlag machen, sieht er, dass er D gewinnen muss, weil dieser in der nächsten Runde leer ausginge und bietet ihm eine Münze. 0 1 0 1 A ist ein spieltheoretisch beschlagener Kerl, sieht all dies voraus und weiss daher, dass er C und E mit je einer Münze gewinnen muss, weil diese in der nächsten Runde sonst leer ausgingen. Weil auch C und E ihre Lage einsehen, begnügen sie sich mit diesem Angebot und stimmen für A. 2 Aufgabe 2: Zahlenwahlspiel („Beauty- Contest-Spiel“) Sie können eine Zahl von 0 bis 100 wählen (nicht notwendigerweise eine ganze Zahl). Sie spielen in einer Gruppe von 100 Personen. Von den eingesandten Zahlen in Ihrer Gruppe wird der (arithmetische) Mittelwert berechnet. Diejenige Zahl gewinnt, die zwei Dritteln des Mittelwerts (2/3 multipliziert mit dem arithmetischen Mittelwert) am nächsten kommt. a) Geben Sie die Nash-Gleichgewichtsstrategie(n) an. Begründen Sie Ihre Antwort. Lösung: Null zu wählen ist die einzige Nash-Gleichgewichtsstrategie: Wählen alle 0, ist die gewinnende Zahl auch 0 und niemand hat einen Anreiz davon abzuweichen. (Wie einige richtig angemerkt haben, hätte in der Aufgabenstellung die (implizit angenommene) Zusatzbedingung festgehalten werden sollen, dass im Fall mehrerer Sieger der Gewinn geteilt wird. Denn wenn alle Gewinner gleich viel erhalten, egal wie viele Gewinner es gibt, dann wären tatsächlich auch alle Strategienprofile, bei denen alle dieselbe Zahl wählen (schwache) Nash-Gleichgewichte.) b) Geben Sie die dominierten Strategien an. Lösung: Der maximale Durchschnitt ist 100 und somit 2/3 davon 66 ⅓. Zahlen aus dem Intervall ]66⅓, 100] können also nie gewinnen und sind damit dominierte Strategien. c) Gibt es eine dominante Strategie? Lösung: Bei 100 Spielern: Nein. Die Gewinnzahl kann jeder Wert aus dem Intervall [0, 66⅓] sein. d) Was ist im Fall N = 2, also mit genau zwei Spielern? Gibt es eine dominante Strategie? Lösung: Ja: 0. Bei zwei Zahlen liegt die kleinere der beiden Zahlen immer ⅔ des Durchschnitts der beiden Zahlen näher. Somit gewinnt die kleinste wählbare Zahl immer, also 0. Aufgabe 3: Salomonisches Urteil In der ersten Vorlesung wurde das Mechanismus-Design von Glazer und Ma (1989) erläutert. In der Darstellung der Vorlesung wird die wirkliche (echte) Mutter zuerst befragt. Natürlich ist zu Beginn unbekannt, ob die echte oder die falsche Mutter zuerst befragt wird. Untersuchen Sie den Fall, wenn die falsche Mutter zuerst befragt wird (Fall b). Wird mit dem Design auch in diesem Fall das gewünschte Ergebnis erzielt, dass sich echte und falsche Mutter zu erkennen geben, d.h. rationale wirkliche Mütter sagen „ja“ und rationale falsche Mütter sagen „nein“? Muss eine der Mütter oder müssen beide eine Strafe zahlen? Hinweis: Sie müssen die Auszahlungen an den Endknoten des Entscheidungsbaums (Spielbaum) entsprechend anpassen, da sich die Reihenfolge der Akteure umgekehrt hat. Ferner ist die Regel des Befragungsdesigns zu beachten (die unverändert bleibt): Sagen beide Mütter „ja“, zahlt die Erstbefragte die kleine Strafe s, die Zweitbefragte die grössere Strafe S. Wenn Sie die korrekten Auszahlungen im Spielbaum eingetragen haben, bestimmen Sie das Nash-Gleichgewicht. 3 Lösung: falsche Mutter echte Mutter ja ja (-s, We – S) nein nein (0, We) (Wf, 0) 0 < s < W f < S < We S = kleine Strafe, S = grosse Strafe, Wf = Wert des Kindes für die falsche Mutter, We = Wert des Kindes für die echte Mutter Da We – S > 0 ist, wird die echte Mutter auch ja sagen, sollte die falsche Mutter sich erdreisten, ja zu sagen. Da –s < 0 ist, wird die falsche Mutter aber gleich von Anfang an nein sagen. Der Mechanismus funktioniert also auch bei dieser Reihenfolge der Befragung: Die echte Mutter erhält ihr Kind und keine der beiden Frauen muss eine Strafe bezahlen. Übungsblatt 3 Aufgabe 1: Stein, Schere, Papier Zeigen Sie, dass die gemischte Strategie, Stein, Schere, Papier mit einer Wahrscheinlichkeit von je 1/3 zu wählen, ein Nash-Gleichgewicht ist. Lösung: p1, p2, p3 = 1 – p1 – p2 sind die gemischten Strategien des Zeilenspielers, q1 = q2 = q3 =1/3 sei die Strategie des Spaltenspielers. Die Auszahlungsmatrix sieht wie folgt aus: Papier q1 = 1/3 Schere q2 = 1/3 Stein q3 = 1/3 Schere p1 1 0 -1 Stein p2 -1 1 0 Papier p3 0 -1 1 Argumentation über das Indifferenztheorem: Die Auszahlungen für den Zeilenspieler sind für alle Strategien gleich: u1 = u2 = u3 = 1/3 – 1/3 = 0. Der Zeilenspieler ist also indifferent zwischen den Strategien Schere, Stein und Papier. Daher sind die Strategienprofile q1 = q2 = q3 = 1/3 und, wegen der Symmetrie der Auszahlungsmatrix, p1 = p2 = p3 = 1/3 eine gemischte Nash-Gleichgewichtsstrategie. 4 Wenn man nicht von der Vermutung ausgehen will, dass p1 = p2 = p3 = q1 = q2 = q3 = 1/3 die gemischte Nash-Gleichgewichtsstrategie ist, kann man dies auch als Lösung der Gleichungen erhalten, die üblicherweise zur Bestimmung eines Gleichgewichtes durch das Indifferenztheorem aufgestellt werden. Für die Indifferenz des Zeilenspielers: q1 – q3 = – q1 + q2 = – q2 + q3 und q1 + q2 + q3 = 1 => q1 = q2 = q3 = 1/3 Argumentation über en Erwartungswert: Der Erwartungswert des Zeilenspielers bei der Wahl des Spaltenspielers von Stein, Schere, Papier mit je 1/3 ist: E = p1 1/3 – p1 1/3 – p2 1/3 + p2 1/3 – p3 1/3 + p3 1/3 = 0. Wählt der Spaltenspieler je 1/3 kann der Zeilenspieler sich durch eine Abweichung von je 1/3 nicht verbessern. Seine Auszahlung ist immer 0. Gleiches gilt für den Spaltenspieler. Daher ist das Strategienprofil (Wahl von Stein, Schere, Papier mit Wahrscheinlichkeit 1/3) ein Nash-Gleichgewicht. (Formal kann natürlich auch über die partiellen Ableitungen von E argumentiert werden, was viele von Ihnen gemacht haben.) Aufgabe 2: Chickenspiel - das dritte Gleichgewicht! Dies ist ein (asymmetrisches) Chickenspiel. Es gibt zwei Gleichgewichte in reinen Strategien und ein drittes Gleichgewicht in gemischten Strategien. a) Berechnen Sie das Strategienprofil des gemischten Gleichgewichts (Sie können wie beim Nullsummenspiel das „Indifferenztheorem“ verwenden. Dabei müssen Sie aber bedenken, dass die Auszahlungen von Spalte nicht mehr die Auszahlungen von Zeile mit negativem Vorzeichen sind.) b) Wieviel erhält der Zeilenspieler, wieviel der Spaltenspieler im Gleichgewicht (Erwartungswerte)? a) 4q + 6(1 – q) = 9q + 1(1 – q) => q = ½, Wahl von q des Spaltenspielers so, dass Indifferenz zwischen C und D für den Zeilenspieler entsteht 4p + 2(1 – p) = 5p + 1(1 – p) => p = ½, Wahl von p des Zeilenspielers so, dass Indifferenz zwischen C und D für den Spaltenspieler entsteht b) EZ = ½·(4 + 6) = ½·(9 + 1) = ½·½(4 + 6 + 9 + 1) = 5 ES = ½·(4 + 2) = ½·(5 + 1) = ½·½(4 + 2 + 5 + 1) = 3 5 Aufgabe 3: Gefangenendilemma Statt der Gefängnisjahre nehmen Sie positive Auszahlungen: u1(C,C) = 3, u1(D,C) = 5, u1(C,D)= 0 und u1(D,D) = 1. Entsprechend für Spieler 2: u2(C,C) = 3, u2(C,D) = 5, u2(D,C)= 0 und u2(D,D) = 1. a) Stellen Sie das Spiel in Extensivform dar. Beide Spieler entscheiden simultan! Dave C D Henry C D (3, 3) C D (0, 5) (5, 0) (1, 1) b) Stellen Sie das Spiel in Extensivform dar, wenn Dave zuerst wählt und danach Henry entscheidet. (also einfach ohne gestrichelte Linie) Dave C Henry T1 D C (3, 3) D C D (0, 5) (5, 0) T2 (1, 1) Hinweis: Am besten „übersetzen“ Sie zur Lösung von c) und d) das sequenzielle Spiel in die Normalform. Henry Dave C D CC 3, 3 5, 0 CD 3, 3 1, 1 DC 0, 5 5, 0 DD 0, 5 1, 1 c) Ermitteln Sie die Nash-Gleichgewichte des sequenziellen Spiels. Lösung: (D, DD) d) Geben Sie das oder die teilspielperfekten Gleichgewichte im sequenziellen Spiel an. Lösung: (D, DD) Zur Überprüfung ist das Teilspiel T1 zu betrachten, wenn Dave bereits C gewählt hat. Dieses Teilspiel besteht nur noch aus der Entscheidung von Henry, und wenn er auf C von Dave mit D antwortet, maximiert er seine Auszahlung, was für dieses Teilspiel das Nash-Gleichgewicht bedeutet. Anmerkung: Im Gegensatz zum simultanen Spiel ist im sequentiellen Spiel die Strategie D für Dave keine dominante Strategie mehr! 6