Spiele in Normalform

Werbung
Spiele in Normalform
Vorlesung: Nicht-kooperative Spieltheorie
Teil 2: Spiele in Normalform
Dr. Thomas Krieger
Wintertrimester 2009
und
Dr. Thomas Krieger
Vorlesung: Nicht-kooperative Spieltheorie
1
Spiele in Normalform
Inhaltliche Motivation
Es gibt Konfliktsituationen, in denen die Spieler ihre
Strategien unabhängig voneinander („simultan“) wählen, z.B.
bei der Frage, wieviel eine Firma produzieren soll, oder
welche Fahrtroute auszuwählen ist.
Die Spieler können ihre Strategienwahl zu verschiedenen
Zeitpunkten vornehmen. Wichtig ist, dass sie zum Zeitpunkt
ihrer eigenen Wahl die Strategienwahl der übrigen Spieler
nicht kennen (anderfalls muss die Konfliktsituation mittels
extensiven Spielen modelliert werden).
und
Dr. Thomas Krieger
Vorlesung: Nicht-kooperative Spieltheorie
2
Spiele in Normalform
Definition Normalformspiel
Definition 9
Ein Spiel in Normalform G = (N, (S1 , . . . , Sn ), (u1 , . . . , un ))
besteht aus
einer nichtleeren Menge N = { 1, 2, . . . , n } von Spielern,
einer nichtleeren Menge Si von Strategien für jeden Spieler
i ∈ N und
einer Auszahlungsfunktion ui : ×i∈N Si → R für jeden Spieler
i ∈ N.
und
Dr. Thomas Krieger
Vorlesung: Nicht-kooperative Spieltheorie
3
Spiele in Normalform
Bemerkungen zur Definition
S = S1 × S2 × . . . Sn ist die Menge der (zulässigen)
Strategienkombinationen (s1 , . . . , sn ).
si ∈ Si heisst auch reine Strategie für Spieler i (im Gegensatz
zu gemischten Strategien, siehe später).
ui (s) gibt die Auszahlung an Spieler i bei der Wahl der
Strategienkombination s = (s1 , . . . , sn ) an.
s = (s1 , . . . , sn ) wird im Folgenden oft zerlegt in
si - Strategie von Spieler i,
s−i := (s1 , . . . , si−1 , si+1 , . . . , sn ) - Strategien aller übrigen
Spieler ausser i.
Bearbeiten Sie Aufgabe 1-4 des Übungsblattes 2.
und
Dr. Thomas Krieger
Vorlesung: Nicht-kooperative Spieltheorie
4
Spiele in Normalform
Das Nash-Gleichgewicht
Definition 10
Es sei G = (N, (S1 , . . . , Sn ), (u1 , . . . , un )) ein Spiel in Normalform.
Eine Strategienkombination (s1∗ , . . . , sn∗ ) ∈ S heisst
Nash-Gleichgewicht von G, wenn für alle i ∈ N und alle
si ∈ Si gilt:
∗
∗
ui (si , s−i
) ≤ ui (si∗ , s−i
).
In Worten: kein Spieler i kann durch einseitiges Abweichen
von si∗ seine Auszahlung verbessern.
Die Komponente si∗ eines Gleichgewichtspunktes (s1∗ , . . . , sn∗ )
heisst Gleichgewichtsstrategie des Spielers i.
Bemerkung: Die obige Ungleichung muss entsprechend angepasst
werden, wenn Spieler ihre Auszahlung minimieren wollen.
und
Dr. Thomas Krieger
Vorlesung: Nicht-kooperative Spieltheorie
5
Spiele in Normalform
Axiomatische Charakterisierung von Nash-Gleichgewichten
(1)
Axiome
e ∈S
Optimalität (O): Auf seine Erwartung s−i
−i über das
Verhalten seiner Mitspieler reagiert Spieler i (i = 1, . . . , n)
optimal, d.h., er wählt ein si∗ ∈ Si mit
e
e
ui (si , s−i
) ≤ ui (si∗ , s−i
) für alle
si ∈ Si .
Rationale Erwartung (RE): Für alle Spieler i (i = 1, . . . , n)
seien die Erwartungen rational, d.h., wenn
s ∗ = (s1∗ , . . . , sn∗ ) ∈ S gespielt wird, erwartet jeder Spieler i die
e = s∗ .
Konstellation s−i
−i
und
Dr. Thomas Krieger
Vorlesung: Nicht-kooperative Spieltheorie
6
Spiele in Normalform
Axiomatische Charakterisierung von Nash-Gleichgewichten
(2)
Es sei G ein Normalformspiel. Ein Lösungskonzept L wählt aus
dem Strategienraum S eine Teilmenge von
Strategienkombinationen aus: L(G) ⊆ S.
Lemma 11
Ist s ∗ ein Nash-Gleichgewicht eines Normalformspiels G und
gilt Eigenschaften (RE), dann gilt auch (O).
Jedes Element einer Lösungsmenge L(G), das die
Bedingungen (O) und (RE) erfüllt, ist ein Nash-Gleichgewicht.
=⇒ Beweis siehe Tafel.
Bearbeiten Sie Aufgabe 1 und 2 des Übungsblattes 3.
und
Dr. Thomas Krieger
Vorlesung: Nicht-kooperative Spieltheorie
7
Spiele in Normalform
Der Satz von Nikaido-Isoda (1955)
Theorem 12 (Nikaido-Isoda, 1955)
Es sei G = (N, (S1 , . . . , Sn ), (u1 , . . . , un )) ein Spiel in Normalform,
welches die folgenden Bedingungen erfüllt:
Si ist eine kompakte und konvexe Teilmenge eines Rni ,
1 ≤ i ≤ n.
ui : S1 × S2 × . . . × Sn −→ R1 ist stetig, 1 ≤ i ≤ n.
Für jedes i ∈ {1, . . . , n} und fest gewählte Strategien sj ∈ Sj ,
j ∈ {1, . . . , n} \ {i}, ist
ui (s1 , . . . , si−1 , ., si+1 , . . . , sn ) : Si −→ R1 konkav.
Dann besitzt G mindestens ein Nash-Gleichgewicht.
=⇒ Beweis siehe extra Foliensatz.
und
Dr. Thomas Krieger
Vorlesung: Nicht-kooperative Spieltheorie
8
Spiele in Normalform
Folgerungen und Bezeichnungen
Wir haben anhand der Beispiele gesehen:
Normalformspiele mit überabzählbar vielen reinen Strategien
können Nash-Gleichgewichte besitzen (Cournot-Duopol- und
Oligopol, Satz von Nikaido-Isoda).
Normalformspiele mit endlich vielen reinen Strategien, also
|Si | < ∞ für alle i ∈ N, können aber müssen keine
Nash-Gleichgewichte in reinen Strategien besitzten.
Wir betrachten von nun an nur noch Normalformspiele mit
endlichen vielen reinen Strategien.
und
Dr. Thomas Krieger
Vorlesung: Nicht-kooperative Spieltheorie
9
Spiele in Normalform
Gemischte Strategien (1)
Definition 13
Es sei G = (N, (S1 , . . . , Sn ), (u1 , . . . , un )) ein endliches
Normalformspiel.
Eine gemischte Strategie qi des Spielers i ∈ N ist eine
Wahrscheinlichkeitsverteilung über der Menge der reinen
Strategien Si des Spielers i.
qi ordnet jedem si ∈ Si eine Wahrscheinlichkeit qi (si ) zu:
qi : Si
si
−→ [0, 1]
−→ qi (si ) mit
X
qi (si ) = 1 .
si ∈Si
und
Dr. Thomas Krieger
Vorlesung: Nicht-kooperative Spieltheorie
10
Spiele in Normalform
Gemischte Strategien (2)
Qi sei die Menge der gemischten Strategien von Spieler i und
Q = Q1 × . . . × Qn die Menge aller gemischten
Strategienkombinationen.
=⇒ Graphische Darstellung für |Si | = 2, 3.
Die reine Strategienkombination s = (s1 , . . . , sn ) wird mit der
Wahrscheinlichkeit (wegen der unabhängigen Wahl der
einzelnen gemischten Strategien)
q(s) =
n
Y
qi (si ) .
i=1
und
Dr. Thomas Krieger
Vorlesung: Nicht-kooperative Spieltheorie
11
Spiele in Normalform
Erwartete Auszahlung
Definition 14
Es sei G = (N, (S1 , . . . , Sn ), (u1 , . . . , un )) ein endliches
Normalformspiel.
Die erwartete Auszahlung an Spieler i ∈ N wenn
q = (q1 , . . . , qn ) ∈ Q gespielt wird ist definiert durch
Ui (q) :=
X
q(s) · ui (s) =
s∈S
n
XY
qi (si ) · ui (s) .
s∈S i=1
e = (N, (Q1 , . . . , Qn ), (U1 , . . . , Un )) heisst die gemischte
G
Erweiterung von G.
e ist nun ein Normalformspiel mit überabzählbaren
Bemerkung: G
Strategienmengen.
und
Dr. Thomas Krieger
Vorlesung: Nicht-kooperative Spieltheorie
12
2
Spiele in Normalform
7
4
Beispiel
Gegeben sei folgendes Normalformspiel (linke (Bi-)Matrix):
L
M
2
T
7
7
2
7
B
2
R
3
2
7
L
M
R
T
1
18
0
5
18
B
2
18
0
10
18
6
5
4
Wird q = (q1 , q2 ) mit q1 = (1/3, 2/3) und q2 = (1/6, 0, 5/6)
gespielt, so ist die erwartete Auszahlung an Spieler i:
status quo
status quo
rüsten
rüsten
status
1
5
2
10 quo
U1 (q) 0 =
·b27−+a2
·3+
·2+
·4=
18
18
18
18 0
0
−b
11
5 status quo
2
10
U2 (q) −b=
· 2−a+
·6+
·7+
·5=
0
2
1
18
18
18
18
b 1 − a1
−a2
Dr. Thomas Krieger
rüsten
66 rüsten2
=3
18 b −
3a
2
2
96
1
−b1= 5 .
18
3
−b2
Vorlesung: Nicht-kooperative
Spieltheorie
b 1 − a1
−a2
−a1
und
13
Spiele in Normalform
Der Satz von Nash
Wiederholung Nash-Gleichgewicht: Eine Kombination gemischter
e
Strategien q ∗ = (q1∗ , . . . , qn∗ ) ∈ Q ist ein Nash-Gleichgewicht von G
genau dann, wenn für alle i ∈ N gilt:
∗
∗
Ui (qi , q−i
) ≤ Ui (qi∗ , q−i
) für alle
qi ∈ Qi .
Theorem 15 (Nash, 1951)
Es sei G = (N, (S1 , . . . , Sn ), (u1 , . . . , un )) ein endliches
e = (N, (Q1 , . . . , Qn ), (U1 , . . . , Un )) seine
Normalformspiel und G
gemischte Erweiterung.
e mindestens ein Nash-Gleichgewicht.
Dann besitzt G
=⇒ Beweis mittels des Satzes von Nikaido-Isoda.
Ein weiterer Existenzsatz zu sogenannten teilspielperfekten
Gleichgewichten wird später behandelt.
und
Dr. Thomas Krieger
Vorlesung: Nicht-kooperative Spieltheorie
14
Spiele in Normalform
Mexikanisches Gaunerspiel - Gegenbeispiel (1)
Lemma 16
Es gibt Normalformspiele G mit abzählbar-unendlichen
e besitzen.
Strategienmengen, die kein Nash-Gleichgewicht in G
Beispiel (Mexikanisches Gaunerspiel): Es sei n = 2 und
S1 = S2 = N. Die Auszahlungen seien wiefolgt definiert:

for i > j
 1
0
for i = j .
u1 (i, j) = − u2 (i, j) =

−1 for i < j
e von
Behauptung: Die gemischte Erweiterung G
G = ({1, 2}, (S1 , S2 ), (u1 , u2 )) besitzt weder ein
Nash-Gleichgewicht in reinen noch in gemischten Strategien.
und
Dr. Thomas Krieger
Vorlesung: Nicht-kooperative Spieltheorie
15
Spiele in Normalform
Mexikanisches Gaunerspiel - Gegenbeispiel (2)
e besitzt kein Nash-Gleichgewicht in reinen Strategien, da
G
sich immer ein Spieler durch abweichen verbessern kann.
Es sei
∞
X
∞
Q1 = { q1 = (x1 , x2 , . . .) ∈ [0, 1] :
xi = 1 } und
i=1
Q2 = { q2 = (y1 , y2 , . . .) ∈ [0, 1]∞ :
∞
X
yi = 1 } .
j=1
Die erwartete Auszahlung ist definiert durch
∞ X
∞
∞ X
∞
X
X
U1 (q1 , q2 ) =
ai,j · xi · yj =
ai,j · xi · yj
i=1 j=1
j=1 i=1
= − U2 (q1 , q2 ) .
Die Vertauschbarkeit der Reihen – und damit überhaupt erst die sinnvolle
e – ist durch den Cauchy’schen Doppelreihensatz gewährleistet.
Definition von G
Dr. Thomas Krieger
Vorlesung: Nicht-kooperative Spieltheorie
und
16
Spiele in Normalform
Mexikanisches Gaunerspiel - Gegenbeispiel (3)
e
Angenommen (q1∗ , q2∗ ) ∈ Q sei ein Nash-Gleichgewicht von G.
Dann exitsiert nach dem Cauchy-Kriterium zu jedem > 0 ein n0 = n0 () mit
∞
∞
˛X
˛ X
˛
˛
xi∗ ˛ =
xi∗ <
˛
2
i=n
i=n
für alle
n ≥ n0 .
Damit folgt
n0 −1
U2 (q1∗ , n0 ) =
X
i=1
xi∗ −
∞
X
xi∗ = 1 −
∞
X
xi∗ −
i=n0
i=n0 +1
∞
X
xi∗ > 1 − .
i=n0 +1
Analog folgt mit einem m0 = m0 (): U1 (m0 , q2∗ ) > 1 − .
Da U1 (q1 , q2 ) = − U2 (q1 , q2 ) für alle (q1 , q2 ) ∈ Q gilt, folgt
−U1 (q1∗ , q2∗ ) = U2 (q1∗ , q2∗ ) ≥ U2 (q1∗ , n0 ) > 1 − ,
also
U1 (q1∗ , q2∗ ) < − (1 − ) ,
und andererseits U1 (q1∗ , q2∗ ) ≥ U1 (m0 , q2∗ ) > 1 − . Zusammen folgt also
1 − < U1 (q1∗ , q2∗ ) < − (1 − )
−→
Widerspruch!
und
Dr. Thomas Krieger
Vorlesung: Nicht-kooperative Spieltheorie
17
Spiele in Normalform
Bemerkungen:
Der Satz von Nash ist ein Existenzsatz und liefert kein
Verfahren zur Berechnung von Nash-Gleichgewichten.
Nashs (informelle) Bemerkung zur Berechnung von
Nash-Gleichgewichten: „The complexity of the mathematical
work needed for a complete investigation increases rather
rapidly, however, with increasing complexity of the game; so
that analysis of a game much more complex than the
examples given here might only be feasible using approximate
computational methods.“ (Nash, 1951)
und
Dr. Thomas Krieger
Vorlesung: Nicht-kooperative Spieltheorie
18
Spiele in Normalform
Test auf Nash-Gleichgewicht
Lemma 17
Es sei G = (N, (S1 , . . . , Sn ), (u1 , . . . , un )) ein endliches
e = (N, (Q1 , . . . , Qn ), (U1 , . . . , Un )) seine
Normalformspiel und G
gemischte Erweiterung.
e genau dann,
(q1∗ , . . . , qn∗ ) ∈ Q ist ein Nash-Gleichgewicht von G
∗
∗
∗
wenn Ui (si , q−i ) ≤ Ui (qi , q−i ) für alle si ∈ Si .
Beweis: „=⇒“: ist klar, da jede reine Strategie si ∈ Si mit jener gemischten Strategie
qi ∈ Qi identifiziert werden kann, für die gilt: qi (si ) = 1.
„⇐=“: Es sei i ∈ N und qi ∈ Qi beliebig. Dann folgt nach Multiplikation der obigen
Ungleichung mit qi (si )(≥ 0) und Summation
Def .
∗
Ui (qi , q−i
) =
X
∗
qi (si ) · Ui (si , q−i
)≤
si ∈Si
X
∗
∗
qi (si ) · Ui (qi∗ , q−i
) = Ui (qi∗ , q−i
),
si ∈Si
e
also ist (q1∗ , . . . , qn∗ ) ein Nash-Gleichgewicht von G.
Bearbeiten Sie Aufgabe 1 des Übungsblattes 4.
Dr. Thomas Krieger
Vorlesung: Nicht-kooperative Spieltheorie
und
19
Spiele in Normalform
Beste Antworten
Es sei q−i eine Kombination gemischter Strategien ausser für
Spieler i. Eine Strategie qi ∈ Qi heißt eine beste Antwort auf
q−i für Spieler i, falls gilt
Ui (qi , q−i ) = max Ui (e
qi , q−i ) .
e
qi ∈Qi
Diese Größe existiert stets, da Qi eine kompakte Menge und
Ui (e
qi , q−i ) eine stetige Funktion (insbesondere) auf Qi ist.
Eine reine Strategie si ∈ Si heißt eine beste Antwort auf q−i
in reinen Strategien für Spieler i, falls gilt
Ui (si , q−i ) = max Ui (e
si , q−i ) .
e
si ∈Si
e genau dann,
(q1∗ , . . . , qn∗ ) ∈ Q ist ein Nash-Gleichgewicht in G
∗
∗
wenn qi beste Antwort auf q−i für alle i ∈ N ist
(wechselseitig beste Antworten).
Dr. Thomas Krieger
Vorlesung: Nicht-kooperative Spieltheorie
und
20
Spiele in Normalform
Antwortsatz
Lemma 18
Es sei G = (N, (S1 , . . . , Sn ), (u1 , . . . , un )) ein endliches
e = (N, (Q1 , . . . , Qn ), (U1 , . . . , Un )) seine
Normalformspiel und G
gemischte Erweiterung.
Ferner sei q−i eine Kombination gemischter Strategien außer für
Spieler i, 1 ≤ i ≤ n, und qi ∈ Qi . Dann gilt
(a) Ui∗ := maxqi ∈Qi Ui (qi , q−i ) = maxsi ∈Si Ui (si , q−i )
und die folgenden Aussagen sind äquivalent:
(b) qi ist unter den gemischten Strategien beste Antwort auf q−i
mit Auszahlung Ui∗ = Ui (qi , q−i );
(c) Für alle si ∈ Si mit qi (si ) > 0 ist si unter den reinen
Strategien beste Antwort auf q−i , mit Ui (si , q−i ) = Ui∗ .
Der Antwortsatz hat eine große Bedeutung bei der Bestimmung
von Nash-Gleichgewichten.
Dr. Thomas Krieger
Vorlesung: Nicht-kooperative Spieltheorie
und
21
Spiele in Normalform
Antwortsatz - Beweis (1)
Wegen der Endlichkeit von Si existiert ein si∗ ∈ Si mit
Ui (si∗ , q−i ) = max Ui (si , q−i ) .
si ∈Si
Dann gilt zunächst
Def .
Ui (si∗ , q−i ) ≤ max Ui (qi , q−i ) = Ui∗
qi ∈Qi
und weiter ist
Def .
Ui∗ =
max Ui (qi , q−i )
qi ∈Qi
Def .
=
≤
=
max
qi ∈Qi
max
qi ∈Qi
8
<X
:
si ∈Si
8
<X
:
si ∈Si
qi (si ) · Ui (si , q−i )
;
9
=
qi (si ) · Ui (si∗ , q−i )
;
Ui (si∗ , q−i ),
womit (a) gezeigt ist.
Dr. Thomas Krieger
9
=
und
Vorlesung: Nicht-kooperative Spieltheorie
22
Spiele in Normalform
Antwortsatz - Beweis (2)
Wir zeigen (b) ⇔ (c):
Sei qi eine beliebige gemischte Strategie von Spieler i und
Si∗ := { si ∈ Si : Ui (si , q−i ) = Ui∗ }
Si∗
Für alle si ∈ Si \
gilt daher: Ui (si , q−i ) <
ein > 0. Man wähle beispielsweise
:=
Ui∗ ,
(6= ∅) .
also Ui (si , q−i ) ≤ Ui∗ − ε für
Ui∗ − maxsi ∈Si \S ∗ Ui (si , q−i )
i
2
.
(Das ist möglich, da Si endlich ist).
Es gilt zunächst für alle qi ∈ Qi
X
qi (si ) · Ui (si , q−i )
Ui (qi , q−i ) =
si ∈Si
=
X
qi (si ) · Ui (si , q−i ) +
| {z }
si ∈Si∗
≤
Ui∗ ·
= Ui∗
X
si ∈Si \Si∗
{z
qi (si ) · Ui (si , q−i )
| {z }
≤Ui∗ −
X
qi (si ) + (Ui∗ − ) ·
si ∈Si∗
|
X
qi (si ) = Ui∗ − α · .
si ∈Si \Si∗
}
= 1−α∈(0,1]
|
{z
:=α∈[0,1)
}
und
Dr. Thomas Krieger
Vorlesung: Nicht-kooperative Spieltheorie
23
Spiele in Normalform
Antwortsatz - Beweis (3)
(b) =⇒ (c): Es sei qi beste Antwort auf q−i . Dann folgt
Ui∗ = Ui (qi , q−i ) ≤ Ui∗ − α · ,
also α = 0. Dies ist gleichbedeutend mit qi (si ) = 0 für alle si ∈ Si \ Si∗ . Damit
muss ein si mit qi (si ) > 0 aus der Menge Si∗ sein, womit also per Definition
Ui∗ = Ui (si , q−i ) und damit (c) gilt. (Bemerkung: es kann durchaus si ∈ Si∗
geben, mit qi (si ) = 0.)
(c) =⇒ (b): Sei qi ∈ Qi und nach (c) gelte für alle si ∈ Si mit qi (si ) > 0, dass
Ui∗ = Ui (si , q−i ). Dann folgt
qi (si ) = 0
si ∈ Si \ Si∗ .
für alle
Also gilt
Ui (qi , q−i )
=
X
qi (si ) · Ui (si , q−i )
si ∈Si
=
X
si ∈Si∗
qi (si ) · Ui (si , q−i ) +
| {z }
d.h. qi ist beste Antwort auf q−i .
Dr. Thomas Krieger
= Ui∗
X
si ∈Si \Si∗
qi (si ) ·Ui (si , q−i ) = Ui∗ ,
| {z }
=0
Vorlesung: Nicht-kooperative Spieltheorie
und
24
Spiele in Normalform
Beispiel (1)
Wir betrachten das 2-Personen-Normalformspiel von Folie 13 mit
folgenden Bezeichnungen:
Versuch 1: Besitzt dieses Spiel Nash-Gleichgewichte in reinen
Strategien?
und
Dr. Thomas Krieger
Vorlesung: Nicht-kooperative Spieltheorie
25
Spiele in Normalform
Beispiel (2)
Versuch 2: Gibt es ein Nash-Gleichgewicht q ∗ = (q1∗ , q2∗ ) ∈ Q
mit
q1∗ (T ) > 0 , q1∗ (B) > 0
und
q2∗ (L) = 1 ?
Zunächst gilt
U1 (T , q2∗ ) = 7
und
U1 (B, q2∗ ) = 2 .
Angenommen es gäbe ein Nash-Gleichgewicht der obigen Art,
dann ist q1∗ beste Antwort auf q2∗ und nach Teil (c) des
Antwortsatzes müsste gelten U1 (T , q2∗ ) = U1 (B, q2∗ ).
Widerspruch!
Versuch 3: Analog zeigt man, dass in einem
Nash-Gleichgewicht jeder Spieler mindestens zwei reine
Strategien mischen muss.
und
Dr. Thomas Krieger
Vorlesung: Nicht-kooperative Spieltheorie
26
Spiele in Normalform
Beispiel (3)
Versuch 4: Gibt es ein vollständig-gemischtes
Nash-Gleichgewicht q ∗ = (q1∗ , q2∗ ) ∈ Q, d.h.,
q1∗ (T ) > 0 , q1∗ (B) > 0
und q2∗ (L) > 0 , q2∗ (M) > 0 , q2∗ (R) > 0 ?
Angenommen es gäbe ein Nash-Gleichgewicht der obigen Art,
dann müsste nach Teil (c) des Antwortsatzes gelten
U2∗ = U2 (q1∗ , L) = U2 (q1∗ , M) = U2 (q1∗ , R) ,
also
U2∗ = 2 · q1∗ (T ) + 7 · q1∗ (B) = 7 · q1∗ (T ) + 2 · q1∗ (B)
= 6 · q1∗ (T ) + 5 · q1∗ (B) .
Damit folgt
1
und q1∗ (T ) = 3 · q1∗ (B) .
2
Widerspruch! (nicht beides erfüllbar)
q1∗ (T ) = q1∗ (B) =
Dr. Thomas Krieger
Vorlesung: Nicht-kooperative Spieltheorie
und
27
Spiele in Normalform
Beispiel (4)
Versuch 5: Gibt es ein Nash-Gleichgewicht q ∗ = (q1∗ , q2∗ ) ∈ Q
mit
q1∗ (T ) > 0 , q1∗ (B) > 0
und q2∗ (L) = 0 , q2∗ (M) > 0 , q2∗ (R) > 0 ?
Angenommen es gäbe ein Nash-Gleichgewicht der obigen Art,
dann müsste nach Teil (c) des Antwortsatzes gelten
U1∗ = U1 (T , q2∗ ) = U1 (B, q2∗ ) ,
also
U1∗ = 2 · q2∗ (M) + 3 · q2∗ (R) = 7 · q2∗ (M) + 4 · q2∗ (R) .
Damit folgt wegen q2∗ (M) + q2∗ (R) = 1
5
1
und q2∗ (R) = .
4
4
Widerspruch! (Wahrscheinlichkeiten müssen ≥ 0 sein)
q2∗ (M) = −
Dr. Thomas Krieger
Vorlesung: Nicht-kooperative Spieltheorie
und
28
Spiele in Normalform
Beispiel (5)
Versuch 6: Gibt es ein Nash-Gleichgewicht q ∗ = (q1∗ , q2∗ ) ∈ Q
mit
q1∗ (T ) > 0 , q1∗ (B) > 0
und q2∗ (L) > 0 , q2∗ (M) > 0 , q2∗ (R) = 0 ?
Angenommen es gäbe ein Nash-Gleichgewicht der obigen Art,
dann müsste nach Teil (c) des Antwortsatzes gelten
U1∗ = U1 (T , q2∗ ) = U1 (B, q2∗ ) und
U2∗ = U2 (q1∗ , L) = U2 (q1∗ , M)
also
U1∗ = 7 · q2∗ (L) + 2 · q2∗ (M) = 2 · q2∗ (L) + 7 · q2∗ (M) und
U2∗ = 7 · q1∗ (T ) + 2 · q2∗ (B) = 2 · q2∗ (T ) + 7 · q2∗ (B) .
und
Dr. Thomas Krieger
Vorlesung: Nicht-kooperative Spieltheorie
29
Spiele in Normalform
Beispiel (6) - Versuch 6 Fortsetzung
Die Lösung dieses Gleichungssystems (unter Berücksichtigung
von qi∗ ∈ Qi ) ist
q1∗ (T ) = q1∗ (B) =
1
2
und
q2∗ (L) = q2∗ (M) =
1
2
mit
U1∗ = U2∗ =
9
= 4.5 .
2
Es gilt aber
U2∗ = 4.5 < 5.5 = U2 (q1∗ , R) .
Widerspruch! (Strategie R ausserhalb des Trägers liefert
höhere Auszahlung)
und
Dr. Thomas Krieger
Vorlesung: Nicht-kooperative Spieltheorie
30
Spiele in Normalform
Beispiel (7)
Versuch 7: ... und dieser muss wegen des Satzes von Nash
erfolgreich sein, also ein Nash-Gleichgewicht liefern.
Wir suchen also das Nash-Gleichgewicht q ∗ = (q1∗ , q2∗ ) ∈ Q
mit
q1∗ (T ) > 0 , q1∗ (B) > 0
und q2∗ (L) > 0 , q2∗ (M) = 0 , q2∗ (R) > 0 .
Mit Teil (c) des Antwortsatzes gilt
U1∗ = U1 (T , q2∗ ) = U1 (B, q2∗ ) und
U2∗ = U2 (q1∗ , L) = U2 (q1∗ , R)
also
U1∗ = 7 · q2∗ (L) + 3 · q2∗ (R) = 2 · q2∗ (L) + 4 · q2∗ (R) und
U2∗ = 2 · q1∗ (T ) + 7 · q2∗ (B) = 6 · q2∗ (T ) + 5 · q2∗ (B) .
und
Dr. Thomas Krieger
Vorlesung: Nicht-kooperative Spieltheorie
31
Spiele in Normalform
Beispiel (8) - Versuch 7 Fortsetzung
Die Lösung dieses Gleichungssystems (unter Berücksichtigung
von qi∗ ∈ Qi ) ist
q1∗ (T ) =
1 ∗
2
, q1 (B) =
3
3
und
q2∗ (L) =
1 ∗
5
, q2 (R) =
6
6
mit
U1∗ =
22
2
=3
6
3
und
U2∗ =
16
1
=5 .
3
3
Diesmal gilt
U2∗ > U2 (q1∗ , M) =
11
.
3
Nach dem Antwortsatz und mit dem Test-Lemma ist damit
obiges (q1∗ , q2∗ ) das einzige Nash-Gleichgewicht des Spiels.
Dr. Thomas Krieger
Vorlesung: Nicht-kooperative Spieltheorie
und
32
Spiele in Normalform
Algorithmus zur Bestimmung von Nash-Gleichgewichten
1
2
Wähle für jeden Spieler i ∈ {1, 2} eine beliebige Teilmenge
Di ⊆ Si .
Bestimme (q1∗ , q2∗ ) aus dem linearen (!) Gleichungssystem
X
w1 = U1 (s1 , q2∗ ) für alle s1 ∈ D1 mit
q2∗ (s2 ) = 1 ,
s2 ∈D2
w2 =
U2 (q1∗ , s2 )
für alle
s 2 ∈ D2
mit
X
q1∗ (s1 ) = 1 .
s1 ∈D1
3
Gilt überdies
qi∗ (si ) ≥ 0
U1 (s1 , q2∗ )
U2 (q1∗ , s2 )
für alle
s i ∈ Di ,
i = 1, 2 ,
≤ w1
für alle
s1 ∈ S1 \ D1
≤ w2
für alle
s2 ∈ S2 \ D2 ,
sowie
und
dann ist (q1∗ , q2∗ ) ∈ Q ein Nash-Gleichgewicht mit
U1 (q1∗ , q2∗ ) = w1 und U2 (q1∗ , q2∗ ) = w2 .
Dr. Thomas Krieger
Vorlesung: Nicht-kooperative Spieltheorie
und
33
Spiele in Normalform
Bemerkungen (1)
Bearbeiten Sie Aufgabe 2 und 3 des Übungsblattes 4.
Um alle Nash-Gleichgewichte zu bestimmen, müssen
| D1 × D2 | = (2|S1 | − 1) · (2|S2 | − 1)
Kombinationen durchprobiert werden! Nach dem Satz von
Nash existiert mindestens eine Kombination gemischter
Strategien, die alle Bedingungen der letzten Folie erfüllt.
Der obige Algorithmus kann direkt für die Bestimmung von
Nash-Gleichgewichten in n-Personen-Normalformspielen
verwendet werden.
und
Dr. Thomas Krieger
Vorlesung: Nicht-kooperative Spieltheorie
34
Spiele in Normalform
Bemerkungen (2)
Es gibt weitere Algorithmen zur Bestimmung von Nash-Gleichgewichten, namentlich werden hier nur zwei erwähnt:
Für n = 2: Algorithmus von Lemke-Howson
Für n beliebig: Algorithmus von Scarf-Hansen
Große Bedeutung haben nicht-entartete 2-Personen-Normalformspiele:
Definition 19
Ein 2-Personen-Normalformspiel heisst entartet, falls für einen
Spieler i eine gemischte Strategie qi ∈ Qi existiert, auf die der
Gegner mehr als | C (qi ) | reine beste Antworten hat.
Dabei ist C (qi ) := { si ∈ Si : qi (si ) > 0 } der Träger der
Strategie qi ∈ Qi .
und
Dr. Thomas Krieger
Vorlesung: Nicht-kooperative Spieltheorie
35
Spiele in Normalform
Bemerkungen (3)
Für nicht-entartete 2-Personen-Normalformspiele gilt nun:
Die Anzahl der Nash-Gleichgewichte ist ungerade (und damit
insbesondere endlich).
Interessant am Rande: Die Lösung eines n-Personen-Normalformspiels mit n ≥ 4 kann auf die Lösung eines geeigneten
3-Personen-Normalformspiels zurückgeführt werden (Bubelis,
1978)
Für n ≥ 3 müssen zur Bestimmung von Nash-Gleichgewichten
in gemischten Strategien i.A. nicht-lineare (!) Gleichungssysteme gelöst werden. Es gilt daher i.A. nicht mehr: wenn
ui (s) ∈ Q für alle s ∈ S, dann auch qi∗ ∈ Q|Si | für alle si ∈ Si .
und
Dr. Thomas Krieger
Vorlesung: Nicht-kooperative Spieltheorie
36
Spiele in Normalform
Bemerkungen (4)
Oft gibt es mehrer Nash-Gleichgewichte (in reinen und in
gemischten Strategien) in einem Normalformspiel: Welches
Nash-Gleichgewicht wird dann gespielt (-> Koordinierung,
Auswahltheorie)?
e2∗ ) jeweils ein Nash-Gleichgewicht, so
q1∗ , q
Sind (q1∗ , q2∗ ) und (e
gilt:
e2∗ ) noch (e
I.A. sind weder (q1∗ , q
q1∗ , q2∗ ) Nash-Gleichgewichte.
e2∗ ), i = 1, 2,
I.A. sind die Auszahlungen Ui (q1∗ , q2∗ ) und Ui (e
q1∗ , q
verschieden.
=⇒ Finden Sie Beispiele, die das zeigen!!
und
Dr. Thomas Krieger
Vorlesung: Nicht-kooperative Spieltheorie
37
Spiele in Normalform
Bemerkungen (5)
Gemeinsames Abweichen der Spieler von den Gleichgewichtsstrategien kann für beide gewinnbringend sein (vgl. auch
Gefangenen-Dilemma)
1
2
1
1
3
3
−1
0
2
5
0
2
1
2
4
4
1
2
3
3
5
0
3
0
Einziges Nash-Gleichgewicht ist
(1, 1). Die Auszahlung bei (2, 2) ist
echt besser für beide und bei (3, 1)
und (3, 2) zumindest besser für
Spieler 2. Dies zeigt, Nash-Gleichgewichte müssen nicht Paretooptimal sein.
Das Konzept des Nash-Gleichgewichts versagt, wenn die
1
2
Spieler bindende
Vereinbarungen
treffen könnten: wähle (3, 2)
− 1000
5
und teile
entsprechend
die
8
Einheiten
auf.
1
2
2
6
8
4
Dr. Thomas Krieger
und
Vorlesung: Nicht-kooperative Spieltheorie
38
Spiele in Normalform
0
2
2
1
Bemerkungen (6)
4
2
3
4
1
5
0
Aufgrund „psychologischer“ Gründe3 können3 manche0
Nash-Gleichgewichte als plausibler erscheinen als andere:
1
2
1
0
1
0
− 1000
1
− 10
1
0
2
2
1
0
5
6
8
2
0
2
10
4
3
Im linken Spiel Lsind (1,M
1) und (2,
R 2) die (einzigen) Nash-Gleichgewichte. In
(1, 1) könnte Spieler 1 „Angst“ vor einem Abweichen des Spielers 2 haben.
Daher wird Spieler 1 vielleicht eher das Nash-Gleichgewicht
(2, 2)
1
2 bevorzugen,
2
7
6
indem Spieler
2 dann sogar mehr gewinnt.
T
7 sind (2,
2 1) und
3 (1, 2) Nash-Gleichgewichte
0
Im rechten Spiel
(und es0 gibt noch
1
eines in gemischten
Strategien).
Das
Nash-Gleichgewicht
(2,
1) ist sogar
7
2
5
1
− 10
Auszahlungsdominant!
In (1, 2) hat aber kein Spieler mehr „Angst“.
B
2
7
4
Dr. Thomas Krieger
0
und
1
2 Nicht-kooperative Spieltheorie
Vorlesung:
39
Spiele in Normalform
Literatur (1)
S. K. Berninghaus, K.-M. Ehrhart, W. Güth: Strategische Spiele.
Springer-Verlag, Berlin u.a., 2. Auflage, 2006.
V. Bubelis: On Equilibria in Finite Games. International Journal of Game
Theory, Vol 8, Issue 2, pages 65-79, 1978.
B. Rauhut, N. Schmitz, E.-W. Zachow: Spieltheorie: Einführung in die
mathematische Theorie strategischer Spiele. Teubner-Verlag, Stuttgart, 1979.
R
M. J. Canty: Konfliktlösungen mit Mathematica
. Springer-Verlag, Berlin
Heidelberg, 2000.
R. B. Myerson: Game Theory - Analysis of Conflict. Havard University Press,
Cambridge, Massachusetts, London, England, 1991.
J. F. Nash: Non-cooperative Games. Annals of Mathematics, Vol 54, pages
286-295, 1951.
H. Nikoida, K. Isoda: Note on noncooperative convex games. Pacific Journal of
Mathematics, Vol 5, pages 807-815, 1955.
und
Dr. Thomas Krieger
Vorlesung: Nicht-kooperative Spieltheorie
40
Spiele in Normalform
Literatur (2)
M. Dresher: Strategische Spiele - Theorie und Praxis. Verlag Industrielle
Organisation. Zürich, 1961.
W. Güth: Markt- und Preistheorie. Springer-Verlag, Berlin Heidelberg u.a., 1994.
R. Avenhaus, Th. Krieger: Unannounced Interim Inspections. ITIS-study for the
Joint Research Centre of the European Commission, Institute for the Protection
and the Security of the Citizen, Ispra, Final Report March 2009.
H. E. Scarf: The Computation of Economic Equilibria. Yale University Press,
New Haven, Connecticut, 1973.
C. E. Lemke, J. T. Howson: Equilibrium points of bimatrix games. SIAM
Journal on Applied Mathematics, Vol 12, pages 413-423, 1964.
K. H. Borgwardt: Optimierung, Operations Research, Spieltheorie. Birkhäuser
Verlag, Basel Boston Berlin, 2001.
und
Dr. Thomas Krieger
Vorlesung: Nicht-kooperative Spieltheorie
41
Herunterladen