Klausur zur Vorlesung Spieltheorie Musterlösung

Werbung
Prof. Dr. Ulrich Schwalbe
Sommersemester 2001
Klausur zur Vorlesung Spieltheorie
Musterlösung
Die Klausur besteht aus vier Vorfragen, von denen drei zu
beantworten sind sowie drei Hauptfragen, von denen zwei zu
beantworten sind. Sie haben für die Beantwortung 90 Minuten Zeit. Verwenden Sie auf eine Vorfrage nicht mehr als 10
Minuten. Es sind keine Hilfsmittel zugelassen.
Vorfragen
Aufgabe 1 Ermitteln Sie die Nash Gleichgewichte des Zwei–
Personen–Spiels, in dem die Strategienmenge jedes Spielers die Menge der nichtnegativen rellen Zahlen ist; die
Auszahlungsfunktionen sind gegeben durch p1(a1, a2) =
a1(a2 − a1) und p2(a1, a2) = a2(1 − a1 − a2). Dabei ist ai
die von Spieler i gewählte relle Zahl.
1
Lösung
Spieler 1 maximiert a1(a2 − a1).
Die Bedingung erster Ordnung (B1O) ist
a2 − 2a1 = 0.
Auflösen nach a1 ergibt die Reaktionsfunktion (beste Antwort Funktion)
a1(a2) = a2/2.
Spieler 2 maximiert a2(1 − a1 − a2).
Die Die B1O ist 1 − a1 − 2a2 = 0.
Auflösen nach a2 ergibt die Reaktionsfunktion
a2 = (1 − a1)/2.
Einsetzen von a2(a1) in die Reaktionsfunktion des Spielers
1 ergibt
a1 =
1 − a1
4
⇒
a∗1 = 1/5.
Einsetzen in die Reaktionsfunktion des Spielers 2 ergibt
a∗2 = 2/5.
Das Nash GG lautet also a∗1 = 1/5, a∗2 = 2/5.
Aufgabe 2 Siehe Skript.
2
Aufgabe 3 Jede von zwei Firmen hat eine freie Stelle. Die Firmen zahlen unterschiedliche Löhne wi mit
0.5w1 < w2 < 2w1.
Angenommen, es gibt zwei Arbeiter, die sich bei den Firmen bewerben können. Sie entscheiden simultan darüber,
wo sie sich bewerben, ihre Strategien sind also: ‘bei Firma 1 bewerben’ bzw. ‘bei Firma 2 bewerben’. Wenn sich
bei einer Firma nur einer bewirbt, bekommt er die Stelle, bewerben sich beide bei der Firma, wählt die Firma
zufällig einen aus, der andere ist arbeitslos. Ermitteln Sie
die Normalform des Spieles und alle Nash–Gleichgewichte.
Lösung Bezeichne 1 die Strategie “bei Firma 1 bewerben” und 2 die Strategie “bei Firma 2 bewerben”. Die
Auszahlungsmatrix ist
1
2
1 w1/2, w1/2
w1, w2
2
w2, w1
w2/2, w2/2
Das Spiel hat zwei Nash GGe in reinen Strategien: (2, 1)
und (1, 2).
3
Das NG in gemischten Strategien berechnet sich
wie folgt. Sei p die Wahrscheinlichkeit des Spielers 1 für
Strategie 1 und q die Wahrscheinlichkeit des Spielers 2 für
Strategie 1. Für die erwarteten Auszahlungen des Spielers
1 muss gelten:
q · w1/2 + (1 − q) · w1 = q · w2 + (1 − q) · w2/2.
Auflösen nach q ergibt
q = (2w1 − w2)/(w1 + w2).
Da das Spiel symmetrisch ist, gilt p = q. Das GG in gemischten Strategien lautet somit ((p, 1 − p), (q, 1 − q)) mit
p = q = (2w1 − w2)/(w1 + w2).
Aufgabe 4 Siehe Skript.
4
Hauptfragen
Aufgabe 1 Die Firma R (der ‘Raider’) überlegt, ob sie die Firma Z (das ‘Ziel’) übernehmen soll. Allerdings kennt sie
den Wert der Firma Z nicht genau; sie vermutet, daß der
Wert, wenn Z von Zs eigenen Management geleitet wird,
mindestens DM 0 und höchstens DM 100 beträgt. Jedem
dieser 101 möglichen DM–Werte ordnet Firma R die gleiche Wahrscheinlichkeit zu. Übernimmt R die Firma, dann
wird der Wert von Z um 50% steigen. Angenommen, Firma R bietet den Betrag y um die Firma Z zu übernehmen
und Firma Z ist (unter eigenem Management) den Betrag
x Wert. Wenn Z das Angebot von R akzeptiert, dann ist
R’s Auszahlung 1.5x − y und Z’s Auszahlung ist y; wenn
Z das Angebot ablehnt, erhält R die Auszahlung 0 und
Z’s Auszahlung ist x.
5
a) Stellen Sie diese Situation als ein Spiel mit unvollständiger Information dar, in dem R wählt, welchen
Betrag sie bieten soll und Z darüber entscheidet, was
der niedrigste Betrag ist, den sie akzeptiert.
Lösung Das Spiel kann wie folgt beschrieben werden:
• Spielermenge: {R, Z}.
• Strategiemengen: Eine Aktion für R ist ein Angebot y ∈ R∗, eine Aktion für Z ist Zustimmung (Ja)
oder Ablehnung (Nein).
• Information: Typ von Z gleichverteilt im Intervall
[0, 100].
• Auszahlungen: Die Auszahlung von R ist 1, 5x − y
falls Z zustimmt, und null sonst. Die Auszahlung
von Z ist y falls Z zustimmt und x falls Z nicht
zustimmt.
6
b) Ermitteln Sie das Bayesianische Nash–Gleichgewicht
(die Gleichgewichte?) dieses Spiels.
Lösung Da R im Laufe des Spiels keine zusätzliche
Information erhält, findet kein Bayesianisches Updating statt. Die Vermutungen des R sind gleich den a
priori Wahrscheinlichkeiten.
Strategie des Z Typ x von Z akzeptiert jedes Gebot
y ≥ x und lehnt jedes Gebot y < x ab.
Demnach muss R mindestens den Betrag x bieten. Der
erwartete Wert von Z, falls y akzeptiert wird, ist
jedoch
E(x) = y/2
(wegen der Gleichverteilung der Typen).
Beispiel: Ein Gebot von y = 50 wird von den Typen
x ∈ [0, 50] akzeptiert. Der Erwartungswert ist daher
E(x|y = 50) = 25.
7
Die erwartete Auszahlung des R bei Gebot y ist,
falls y akzeptiert wird
y
y
1, 5 · − y = − < 0.
2
4
Daher ist das optimale Gebot (die beste Antwort von
R) die Strategie y = 0.
Das einzige Bayesianische Nash GG ist daher:
• R bietet y = 0,
• Z vom Typ x akzeptiert jedes Gebot y ≥ x und
lehnt jedes Gebot y < x ab.
Somit kann es nicht zu einer Übernahme kommen.
8
Aufgabe 2 Die Armee des Landes 1 (Armee 1) muß sich überlegen, ob sie die Armee des Landes 2 (Armee 2) angreifen
soll, die eine Insel zwischen den beiden Ländern besetzt
hält. Beide Länder sind jeweils durch eine Brücke mit der
Insel verbunden. Im Falle eines Angriffs könnte die Armee 2 sich entweder in ihr Land zurückziehen oder könnte
kämpfen. Jede Armee würde die Insel lieber besetzen als
nicht besetzen, aber ein Kampf ist das schlechteste Ergebnis für beide Armeen.
9
a) Stellen Sie die Situation als ein Extensivformspiel mit
vollständiger Information dar.
Lösung Bezeichne A bzw. N die Strategien “Angreifen” bzw. “Nicht angreifen” der Armee 1, und Z bzw.
K die Strategien “Zurückziehen” bzw. “Kämpfen” der
Armee 2.
Mögliche Auszahlungen sind beispielsweise
Z
K
A 2, −2 −3, −3
N 0, 0
0, 0
Extensivform
1
A
N
PPP
PP
PP
PP
@
@
@
@
@
@
2
Z
2
−2
K
−3
−3
10
0
0
b) Zeigen Sie, daß die Armee 2 ihre Auszahlung in einem
teilspielperfekten Nash–Gleichgewicht erhöhen kann,
wenn sie die Brücke zu ihrem Heimatland verbrennt
und sich dadurch die Rückzugsmöglichkeit nimmt.
Lösung Rückwärtige Induktion ergibt das einzige
teilspiel perfekte GG (A, Z). Das Nash GG (N, K)
ist nicht teilspiel perfekt, da K beim Angriff der Armee
1 eine unglaubwürdige Drohung seitens der Armee 2
darstellt.
Zerstört Armee 2 die Brücke, so nimmt sie sich selbt die
Möglichkeit zum Rückzug. Sie bindet sich also glaubhaft an die Strategie K, da die Strategie Z für Armee
2 nicht mehr existiert. Das einzige teilspiel perfekte
Nash GG ist nun (N, K).
11
Aufgabe 3 Gegeben sei das folgende Spiel in Normalform:
L R
O 1, 1 5, 0 .
U 0, 5 4, 4
a) Was ist das Nash Gleichgewicht des Spieles, wenn das
Spiel nur einmal gespielt wird?
Lösung (O, L).
b) Zeigen Sie, daß die Pareto–effiziente Lösung ein teilspielperfektes Nash–Gleichgewicht des obigen Spiels
sein kann, wenn das Spiel unendlich oft wiederholt wird
und die Spieler die folgende Strategie verwenden: ‘Spiele U/R am Anfang und wenn es in der vergangenen
Periode gespielt wurde. Ansonsten spiele O/L.’
Lösung Die Pareto effiziente Lösung ist (U, R). Sie
wird in jeder Runde erreicht, wenn sich beide Spieler
an die vorgegebene Strategie halten. Man muss nun
prüfen, ob diese Strategiekombination ein Nash GG
des wiederholten Spiels darstellt.
12
Bezeichne a1 bzw. a2 die Aktion des Spielers 1 bzw.
2. Angenommen, Spieler 1 weicht in Periode t von der
vorgegebenen Strategie ab und spielt O. Der Spielverlauf lässt sich wie folgt skizzieren.
t 1 2 t t + 1 t + 2 ...
a1 U U O O
O O
a2 R R R L
L L
Dies ist analog zur Trigger Strategie: Nach einmaligem Abweichen wird nie wieder (U, R) gespielt. Die
diskontierte Auszahlung der Strategie Trigger (V1T ) ist
V1T =
4
.
1−δ
Die diskontierte Auszahlung, falls Spieler 1 in Periode
t abweicht (V1A), ist
V1A =
5 − 4δ
.
1−δ
Die Kombination zweier Trigger Strategien ist ein Nash
GG, falls V1T ≥ V1A:
4
5 − 4δ
≥
1−δ
1−δ
⇒
δ ≥ 1/4.
Die Kombination zweier Trigger Strategien ist ein Nash
GG für δ ≥ 1/4. Dieses GG ist auch teilspielperfekt,
da in jedem der Abweichung folgendem Teilspiel ein
Nash GG gespielt wird.
13
c) Wie ändert sich die notwendige Bedingung an den Diskontfaktor, wenn die Spieler die folgende Strategie im
unendlich oft wiederholten Spiel verwenden? ‘Spiele
U/R am Anfang oder wenn U/R bzw. O/L in der
vergangenen Periode gespielt wurde. Ansonsten spiele
O/L für eine Periode.’ Eräutern Sie das Ergebnis.
Lösung Dies ist nicht Tit for Tat: Nach Spielen des
Nash GGs (O, L) wird wieder zum Pareto Optimum
(U, R) zurückgekehrt. Weicht Spieler 1 nur in Periode
t ab, lässt sich der Spielverlauf wie folgt skizzieren.
t 1 2 t t + 1 t + 2 ...
a1 U U O O
U U
a2 R R R L
R R
Die Auszahlungen der angegebenen Strategie unterscheiden sich von denen beim Abweichen nur in den
Perioden t und t + 1. Die Auszahlungen bei der angegebenen Strategie sind 4 + 4δ, die beim Abweichen
5 + δ.
14
Dies ist jedoch nicht die einzige Möglichkeit des Abweichens. Spieler 1 könnte auch wiederholt abweichen.
Der Spielverlauf wäre dann
t 1 2 t t + 1 t + 2 t + 3 t + 4 t + 5...
a1 U U O O
U
O
O
U
a2 R R R L
R
R
L
R
Nach einmaligem Abweichen wird der Zyklus (O, R),
(O, L), (U, R) unendlich oft wiederholt. Die Auszahlung für Spieler 1 in drei aufeinander folgenden Perioden ist
V1A = 5 + δ + 4δ 2.
Diese Auszahlung ist höher als bei einmaligem Abweichen (5 + δ). Damit die Strategiekombination ein Nash
GG darstellt, muss gelten, dass die Auszahlung dreier aufeinanderfolgender Perioden bei der angegebenen
Strategie mindestens so hoch ist wie beim Abweichen:
4 + 4δ + 4δ 2 ≥ 5 + δ + 4δ 2.
Auflösen nach δ ergibt δ = 1/3.
Erläuterung Der Diskontfaktor ist grösser als bei der
Trigger Strategie, d.h. es ist schwieriger, das Pareto
Optimum in jeder Periode zu erreichen, da der Anreiz
zum Abweichen gestiegen ist.
15
Zusatzfrage Angenommen, das Spiel wird modifiziert, indem für jeden Spieler eine strikt dominierte
Strategie hinzugefügt wird. Angenommen, das modifizierte Spiel wird zweimal gespielt. Entwerfen Sie eine
Strategiekombination, die ein Nash GG des Spiels darstellt, und bei der in der ersten Runde (U, R) gespielt
wird.
Lösung Das modifizierte Spiel könnte z.B. so aussehen:
L
R
X
O 1, 1
5, 0
−2, −2
.
U
0, 5
4, 4
−2, −2
X −2, −2 −2, −2 , −4, −4
Betrachte folgende Strategie für Spieler 1 (2):
• Spiele in der ersten Runde U (R).
• In der zweiten Runde
– spiele O (L), falls in der ersten Runde das Strategiepaar (U, R) gespielt wurde,
– und spiele X sonst.
Ein solches Paar von Strategien stellt ein Nash GG
dar.
16
Beweis Es ist zu zeigen, dass sich kein Spieler durch
einseitiges Abweichen verbessern kann.
Betrachte Spieler 2. Bei der angegebenen Strategiekombination ist seine Auszahlung
4 + 1 = 5.
Kann er sich durch Abweichen verbessern? Die profitabelste Abweichung wäre, in beiden Perioden L zu
spielen. Dann bekäme er in der ersten Periode 5 (da
Spieler 1 U spielt), und in der zweiten Periode −2 (da
Spieler 1 X spielt). Seine Auszahlung wäre somit
5 − 2 = 3.
Abweichen lohnt sich demnach nicht. Ein analoges Argument gilt für Spieler 1.
17
Herunterladen