Spieltheorie, A. Diekmann – Musterlösungen

Werbung
Spieltheorie, A. Diekmann – Musterlösungen
Übungsblatt 1
Aufgabe 1
a) Geben Sie die Maximin-Strategie(n) an.
Lösung: die Minima sind für Zeile und Spalte bei
beiden Strategien 0. Daher sind für beie Spieler
beide Strategien Maximin-Strategien.
b) Gibt es dominante Strategien? Wenn ja, geben
sie diese an.
Lösung: Steal ist schwach dominant: 1000 > 500
und 0 ≥ 0.
c) Geben Sie Pareto-optimale Strategienprofile an.
Lösung: (Steal, Split), (Split, Split), (Split, Steal)
d) Geben Sie das oder die Nash-Gleichgewichte an.
Lösung: (Steal, Split), (Steal, Steal), (Split, Steal)
Aufgabe 2
Eine ziemlich unrealistische Situation: Ein grosszügiger Multi-Billionär macht zwei Spielern A
und B folgendes Angebot: Die beiden Spieler wählen unabhängig voneinander jeweils eine
(nicht-negative reelle) Zahl ≥ 0. Das Produkt der beiden Zahlen wird an jeden Spieler in Fr.
ausgezahlt. (Wählt Spieler A 20,5 und Spieler B 1000 dann erhalten beide je 20500 Fr.).
Sofern Nash-Gleichgewichte existieren:
a) Geben Sie das oder die Nash-Gleichgewichte an.
Lösung: (0, 0), denn das Produkt aus null mal einer beliebigen Zahl bleibt immer null.
b) Geben Sie das oder die Nash-Gleichgewichte an, wenn die Spieler maximal 1000‘000
wählen dürfen.
Lösung: (0, 0) und (1000‘000, 1000‘000)
c) Geben Sie das oder die Nash-Gleichgewichte an, wenn die Obergrenze von 1000‘000
entfällt, aber eine Untergrenze eingeführt wird. Es dürfen nur Zahlen ≥ 1000 gewählt
werden.
Lösung: Es gibt kein Nash-Gleichgewicht mehr. (Etliche von Ihnen gingen von der
realistischen Annahme aus, dass das Vermögen (V) des Billionärs endlich sei. Dann gäbe es
wieder Nash-Gleichgewichte, nämlich alle (a, b) mit a · b = V)
1
Übungsblatt 2
Aufgabe 1: Piratenschatz
Ein Piratenschatz mit 100 Goldmünzen soll unter fünf Piraten aufgeteilt werden.
Die Ränge der fünf Piraten sind: 1. Anton Bonnet, 2. Bootstrap Bill, 3. Cutler Beckett, 4.
Davy Jones, 5. Edward Teach (A, B, C, D, E)
Die Aufteilung wird nach folgenden Regeln vorgenommen:
•
Der Ranghöchste macht einen Vorschlag zur Aufteilung, dann stimmen die Piraten
ab.
•
Der Vorschlagende ist stimmberechtigt und hat die ausschlaggebende Stimme, wenn
es keine Mehrheit gibt.
•
Wird der Vorschlag angenommen, erfolgt diese Aufteilung und das Spiel ist zu Ende.
•
Wird die Aufteilung nicht angenommen, dann wird der Vorschlagende über Bord
geworfen und der nächste im Rang schlägt eine Aufteilung vor.
•
Jeder Pirat möchte viele Goldmünzen erhalten. (Erhalten sie bei einem Vorschlag
gleich viele Goldmünzen, wie sie bei einem alternativen Vorschlag auch erhalten
könnten, wählen sie den Vorschlag, bei dem sie den Vorschlagenden über Bord
werfen können.)
Welche Aufteilung wählen die strikt rationalen und eigennützigen Piraten?
Hinweis: „Zäumen Sie das Pferd vom Schwanz her auf“, d.h.
denken Sie an die Rückwärtsinduktion!
A
98
B
C
D
E
Kommentar
100
0
Ist nur noch D und E übrig, kann sich D alle Münzen
selbst zusprechen, E geht leer aus.
99
0
1
Ist C am Zug, sieht er dies voraus und gewinnt E, indem
er ihm eine Münze anbietet.
99
0
1
0
Kann B einen Vorschlag machen, sieht er, dass er D
gewinnen muss, weil dieser in der nächsten Runde leer
ausginge und bietet ihm eine Münze.
0
1
0
1
A ist ein spieltheoretisch beschlagener Kerl, sieht all dies
voraus und weiss daher, dass er C und E mit je einer
Münze gewinnen muss, weil diese in der nächsten Runde
sonst leer ausgingen. Weil auch C und E ihre Lage
einsehen, begnügen sie sich mit diesem Angebot und
stimmen für A.
2
Aufgabe 2: Zahlenwahlspiel („Beauty- Contest-Spiel“)
Sie können eine Zahl von 0 bis 100 wählen (nicht notwendigerweise eine ganze Zahl). Sie
spielen in einer Gruppe von 100 Personen. Von den eingesandten Zahlen in Ihrer Gruppe
wird der (arithmetische) Mittelwert berechnet. Diejenige Zahl gewinnt, die zwei Dritteln des
Mittelwerts (2/3 multipliziert mit dem arithmetischen Mittelwert) am nächsten kommt.
a)
Geben Sie die Nash-Gleichgewichtsstrategie(n) an. Begründen Sie Ihre Antwort.
Lösung: Null zu wählen ist die einzige Nash-Gleichgewichtsstrategie: Wählen alle 0, ist die
gewinnende Zahl auch 0 und niemand hat einen Anreiz davon abzuweichen.
(Wie einige richtig angemerkt haben, hätte in der Aufgabenstellung die (implizit
angenommene) Zusatzbedingung festgehalten werden sollen, dass im Fall mehrerer Sieger
der Gewinn geteilt wird. Denn wenn alle Gewinner gleich viel erhalten, egal wie viele
Gewinner es gibt, dann wären tatsächlich auch alle Strategienprofile, bei denen alle dieselbe
Zahl wählen (schwache) Nash-Gleichgewichte.)
b)
Geben Sie die dominierten Strategien an.
Lösung: Der maximale Durchschnitt ist 100 und somit 2/3 davon 66 ⅓. Zahlen aus dem
Intervall ]66⅓, 100] können also nie gewinnen und sind damit dominierte Strategien.
c)
Gibt es eine dominante Strategie?
Lösung: Bei 100 Spielern: Nein. Die Gewinnzahl kann jeder Wert aus dem Intervall [0, 66⅓]
sein.
d)
Was ist im Fall N = 2, also mit genau zwei Spielern? Gibt es eine dominante
Strategie?
Lösung: Ja: 0. Bei zwei Zahlen liegt die kleinere der beiden Zahlen immer ⅔ des Durchschnitts
der beiden Zahlen näher. Somit gewinnt die kleinste wählbare Zahl immer, also 0.
Aufgabe 3: Salomonisches Urteil
In der ersten Vorlesung wurde das Mechanismus-Design von Glazer und Ma (1989) erläutert.
In der Darstellung der Vorlesung wird die wirkliche (echte) Mutter zuerst befragt. Natürlich
ist zu Beginn unbekannt, ob die echte oder die falsche Mutter zuerst befragt wird.
Untersuchen Sie den Fall, wenn die falsche Mutter zuerst befragt wird (Fall b). Wird mit dem
Design auch in diesem Fall das gewünschte Ergebnis erzielt, dass sich echte und falsche
Mutter zu erkennen geben, d.h. rationale wirkliche Mütter sagen „ja“ und rationale falsche
Mütter sagen „nein“? Muss eine der Mütter oder müssen beide eine Strafe zahlen?
Hinweis: Sie müssen die Auszahlungen an den Endknoten des Entscheidungsbaums
(Spielbaum) entsprechend anpassen, da sich die Reihenfolge der Akteure umgekehrt hat.
Ferner ist die Regel des Befragungsdesigns zu beachten (die unverändert bleibt): Sagen
beide Mütter „ja“, zahlt die Erstbefragte die kleine Strafe s, die Zweitbefragte die grössere
Strafe S. Wenn Sie die korrekten Auszahlungen im Spielbaum eingetragen haben, bestimmen
Sie das Nash-Gleichgewicht.
3
Lösung:
falsche Mutter echte Mutter
ja
ja
(-s, We – S)
nein
nein
(0, We)
(Wf, 0)
0 < s < W f < S < We
S = kleine Strafe, S = grosse Strafe, Wf = Wert des Kindes für die falsche Mutter, We = Wert
des Kindes für die echte Mutter
Da We – S > 0 ist, wird die echte Mutter auch ja sagen, sollte die falsche Mutter sich
erdreisten, ja zu sagen. Da –s < 0 ist, wird die falsche Mutter aber gleich von Anfang an nein
sagen. Der Mechanismus funktioniert also auch bei dieser Reihenfolge der Befragung: Die
echte Mutter erhält ihr Kind und keine der beiden Frauen muss eine Strafe bezahlen.
Übungsblatt 3
Aufgabe 1: Stein, Schere, Papier
Zeigen Sie, dass die gemischte Strategie, Stein, Schere, Papier mit einer Wahrscheinlichkeit
von je 1/3 zu wählen, ein Nash-Gleichgewicht ist.
Lösung:
p1, p2, p3 = 1 – p1 – p2 sind die gemischten Strategien des Zeilenspielers, q1 = q2 = q3 =1/3 sei die
Strategie des Spaltenspielers. Die Auszahlungsmatrix sieht wie folgt aus:
Papier q1 = 1/3
Schere q2 = 1/3
Stein q3 = 1/3
Schere p1
1
0
-1
Stein p2
-1
1
0
Papier p3
0
-1
1
Argumentation über das Indifferenztheorem: Die Auszahlungen für den Zeilenspieler sind für alle
Strategien gleich:
u1 = u2 = u3 = 1/3 – 1/3 = 0.
Der Zeilenspieler ist also indifferent zwischen den Strategien Schere, Stein und Papier. Daher sind die
Strategienprofile q1 = q2 = q3 = 1/3 und, wegen der Symmetrie der Auszahlungsmatrix,
p1 = p2 = p3 = 1/3 eine gemischte Nash-Gleichgewichtsstrategie.
4
Wenn man nicht von der Vermutung ausgehen will, dass p1 = p2 = p3 = q1 = q2 = q3 = 1/3 die gemischte
Nash-Gleichgewichtsstrategie ist, kann man dies auch als Lösung der Gleichungen erhalten, die
üblicherweise zur Bestimmung eines Gleichgewichtes durch das Indifferenztheorem aufgestellt
werden. Für die Indifferenz des Zeilenspielers:
q1 – q3 = – q1 + q2 = – q2 + q3 und q1 + q2 + q3 = 1 => q1 = q2 = q3 = 1/3
Argumentation über en Erwartungswert: Der Erwartungswert des Zeilenspielers bei der Wahl des
Spaltenspielers von Stein, Schere, Papier mit je 1/3 ist:
E = p1 1/3 – p1 1/3 – p2 1/3 + p2 1/3 – p3 1/3 + p3 1/3 = 0.
Wählt der Spaltenspieler je 1/3 kann der Zeilenspieler sich durch eine Abweichung von je 1/3 nicht
verbessern. Seine Auszahlung ist immer 0. Gleiches gilt für den Spaltenspieler. Daher ist das
Strategienprofil (Wahl von Stein, Schere, Papier mit Wahrscheinlichkeit 1/3) ein Nash-Gleichgewicht.
(Formal kann natürlich auch über die partiellen Ableitungen von E argumentiert werden, was viele
von Ihnen gemacht haben.)
Aufgabe 2: Chickenspiel - das dritte Gleichgewicht!
Dies ist ein (asymmetrisches) Chickenspiel. Es gibt zwei Gleichgewichte in reinen Strategien
und ein drittes Gleichgewicht in gemischten Strategien.
a) Berechnen Sie das Strategienprofil des gemischten Gleichgewichts (Sie können wie beim
Nullsummenspiel das „Indifferenztheorem“ verwenden. Dabei müssen Sie aber bedenken,
dass die Auszahlungen von Spalte nicht mehr die Auszahlungen von Zeile mit negativem
Vorzeichen sind.)
b) Wieviel erhält der Zeilenspieler, wieviel der Spaltenspieler im Gleichgewicht
(Erwartungswerte)?
a)
4q + 6(1 – q) = 9q + 1(1 – q)
=> q = ½, Wahl von q des Spaltenspielers so,
dass Indifferenz zwischen C und D für den Zeilenspieler entsteht
4p + 2(1 – p) = 5p + 1(1 – p)
=> p = ½, Wahl von p des Zeilenspielers so, dass
Indifferenz zwischen C und D für den Spaltenspieler entsteht
b)
EZ = ½·(4 + 6) = ½·(9 + 1) = ½·½(4 + 6 + 9 + 1) = 5
ES = ½·(4 + 2) = ½·(5 + 1) = ½·½(4 + 2 + 5 + 1) = 3
5
Aufgabe 3: Gefangenendilemma
Statt der Gefängnisjahre nehmen Sie positive Auszahlungen: u1(C,C) = 3, u1(D,C) = 5,
u1(C,D)= 0 und u1(D,D) = 1. Entsprechend für Spieler 2: u2(C,C) = 3, u2(C,D) = 5, u2(D,C)= 0 und
u2(D,D) = 1.
a) Stellen Sie das Spiel in Extensivform dar. Beide Spieler entscheiden simultan!
Dave
C
D
Henry
C
D
(3, 3)
C
D
(0, 5) (5, 0)
(1, 1)
b) Stellen Sie das Spiel in Extensivform dar, wenn Dave zuerst wählt und danach Henry
entscheidet. (also einfach ohne gestrichelte Linie)
Dave
C
Henry
T1
D
C
(3, 3)
D
C
D
(0, 5) (5, 0)
T2
(1, 1)
Hinweis: Am besten „übersetzen“ Sie zur Lösung von c) und d) das sequenzielle Spiel in die
Normalform.
Henry
Dave
C
D
CC
3, 3
5, 0
CD
3, 3
1, 1
DC
0, 5
5, 0
DD
0, 5
1, 1
c) Ermitteln Sie die Nash-Gleichgewichte des sequenziellen Spiels.
Lösung: (D, DD)
d) Geben Sie das oder die teilspielperfekten Gleichgewichte im sequenziellen Spiel an.
Lösung: (D, DD)
Zur Überprüfung ist das Teilspiel T1 zu betrachten, wenn Dave bereits C gewählt hat. Dieses Teilspiel
besteht nur noch aus der Entscheidung von Henry, und wenn er auf C von Dave mit D antwortet,
maximiert er seine Auszahlung, was für dieses Teilspiel das Nash-Gleichgewicht bedeutet.
Anmerkung: Im Gegensatz zum simultanen Spiel ist im sequentiellen Spiel die Strategie D für Dave
keine dominante Strategie mehr!
6
Herunterladen