Grundlagen und Nash–Gleichgewichte in reinen Strategien Zahlen

Werbung
Grundlagen und Nash–Gleichgewichte in reinen
Strategien
Yves Breitmoser, EUV Frankfurt (Oder)
Zahlen und Vektoren
IR ist die Menge der reellen Zahlen
IR+ = {r ∈ IR | r ≥ 0}
IRn ist die Menge aller Vektoren von n reellen Zahlen
x ∈ IRn
⇒
Zähler:
∀
x = (x1 , . . . , xn ) = (xi )1≤i≤n = (xi )i = (xi )
...
für alle
∃
...
es existiert
IRn+ = {x ∈ IRn | ∀i : xi ≥ 0}
Intervalle
(a, b) = {r ∈ IR | a < r < b}
[a, b] = {r ∈ IR | a ≤ r ≤ b}
[a, b) = {r ∈ IR | a ≤ r < b}
(a, b] = {r ∈ IR | a < r ≤ b}
1
Vektorrelationen
∀x, y ∈ IRn
x =y
x ≥y
x >y
x y
IRn+
⇔
∀i : xi = yi
⇔
∀i : xi ≥ yi
⇔
⇔
⇔
∀i : xi ≥ yi
x ≥ y , x 6= y
und ∃i : xi > yi
∀i : xi > yi
n
o
n
~
= x ∈ IR | x ≥ 0
2
Profile und Listen
B sei die Menge der Spieler
Eine Sammlung von Werten irgendeiner Variablen heißt Profil, wenn die
Sammlung je einen Wert pro Spieler enthält,
bspw.: Auszahlungsprofil, Strategieprofil
Profile haben bei uns große Buchstaben, bspw. X
X = (Xb )b∈B = (Xb )b = (Xb )
X−b ist die Liste aller Elemente des Profils X außer Xb
X−b = (Xc )c∈B\{b} = (Xc )c6=b
X = (X−b , Xb ) = (Xb , X−b )
3
Mengen von Profilen, Listen und Werten
Vb
sei eine Variable die einen Wert für Spieler b enthält
Vb
ist die Menge aller Werte der Variablen Vb
V =
× V b = ×V b
b∈B
V −b =
ist die Menge aller Profile bzgl. V
b
×
Vc =
c∈B\{b}
×V c
ist eine Menge von Listen
c6=b
Sei V b die Anzahl der Elemente in V b
Y V = V 1 ∗ · · · ∗ V n =
V b b∈B
4
Pareto Dominanz und Effizienz
Seien X , Y zwei Auszahlungsprofile X , Y ∈ IRB
X schwach Pareto–dominiert Y
X Pareto–dominiert Y
⇔
⇔
X >Y
X Y
Sei X die Menge aller Auszahlungsprofile
X ist Pareto effizient in X
X ist nicht Pareto effizient in X
⇔
⇔
∀X 0 ∈ X : X 0 ≯ X
∃X 0 ∈ X : X 0 > X
Pareto Effizienz: niemand kann besser gestellt werden, ohne einen anderen
Spieler schlechter zu stellen
5
Statische Spiele
Modell
alle Spieler treffen sich genau einmal
sie bestimmen ihre Strategien getrennt voneinander und gleichzeitig
auch: strategische Spiele oder Spiele in Normalform–Darstellung
Die Normalform ist geeignet als Darstellung einer Interaktion
wenn es keine sequentiellen Aspekte in dieser Interaktion gibt
wenn alle Spieler vollständig informiert sind
wenn die Spieler Konsequenzen für zukünftige Interaktionen ignorieren
6
Komponenten eines statischen Spieles
(bei vollst. Information)
eine endliche Menge Spieler
für jeden b ∈ B eine nicht–leere Menge Strategien
(Aktionen)
B = {B1 , . . . , Bn }
∀b :
S b 6= ∅
eine Auszahlungsfunktion (Nutzen aus bzw. bewertete Konsequenzen der
Aktionen), die jedem Strategieprofil ein Auszahlungsprofil zuordnet
P̂ : S → IRB
ein statisches Spiel ist damit definiert durch ein Tripel
B, S, P̂
7
Tabellarische Darstellung von statischen Spielen mit
zwei Akteuren und je zwei Strategien
B = {1, 2},
S 1 = {L, R},
S 2 = {O, U},
PSb1 ,S2
:= P̂b (S1 , S2 )
O
U
L
1 ,P 2
PLO
LO
1 , P2
PLU
LU
R
1 , P2
PRO
RO
1 , P2
PRU
RU
Spieler 1 wählt die Zeilen, Spieler 2 wählt die Spalten.
8
Nash–Gleichgewicht
Angenommen, es gibt ein Strategieprofil von dem alle Spieler zuverlässig
erwarten können, daß es gespielt wird
Welche Eigenschaften muß es erfüllen?
kein Spieler darf Anreize haben zu einer einseitigen Abweichung haben
Profile, von denen niemand abweichen würde, heißen Gleichgewichte
Nash bewies: in jedem Spiel gibt es mindestens ein Gleichgewicht (in
gemischten Strategien)
das Konzept von Gleichgewichten ist nutzbar als Grundlage der
Analyse strategischer Interaktionen
9
Definition Nash–Gleichgewicht
Verbal I: Jedes Strategieprofil, wo keiner einseitig abweichen möchte
n
o
0
0
N = S ∈ S | ∀b,∀Sb ∈ S b : P̂b (S) ≥ P̂b (Sb , S−b )
Verbal II: Jedes Strategieprofil, wo die Spieler gegenseitig beste
Antworten spielen
n
o
c
N = S ∈ S | ∀b : Sb ∈ BAb (S−b )
wobei Sb eine beste Antwort auf S−b ist, wenn es keine Strategie für b
gibt, die eine höhere Auszahlung gegen S−b ermöglicht
n
o
0
0
c
BAb (S−b ) = Sb ∈ S b | ∀Sb ∈ S b : P̂b (Sb , S−b ) ≥ P̂b (Sb , S−b )
= arg max P̂b Sb0 , S−b ⊆ S b
Sb0 ∈S b
10
Gefangenendilemma
Zwei Gefangene. Der Staatsanwalt kann ihnen nur kleine Vergehen
nachweisen, sie haben aber ein Verbrechen begangen. Er versucht nun,
Geständnisse zu erhalten, und macht ihnen das folgende Angebot (in
“Freiheitsjahren”). Was kann passieren?
Geständnis
kein Geständnis
Geständnis
kein Geständnis
−3 , −3
0 , −4
−4 , 0
−1 , −1
Das einzige Nash–Gleichgewicht: beide gestehen (G , G )
D.h.: (G , G ) ist das einzige Strategieprofil, das sich auch noch ergeben
würde, wenn beide Spieler wüßten, daß ihr Gegner seinen Teil beiträgt.
11
Kampf der Geschlechter
Zwei Menschen mit unterschiedlichem Geschmack wollen zusammen
ausgehen. Spieler 1 zieht das Klavierkonzert (K ) vor, Spieler 2 dagegen
das Orgelkonzert (O). In jedem Fall finden sie es aber besser zusammen
auszugehen als getrennt. Was passiert?
Klavier
Orgel
Klavier
2,1
0, 0
Orgel
0, 0
1,2
Es gibt hier zwei Strategieprofile (in reinen Strategien), die wechselseitig
beste Antworten bieten. Das Konzept des Nash–Gleichgewichts führt also
nicht immer zu einer eindeutigen Lösung.
12
Matching Pennies
Zwei Spieler, jeder wählt entweder Kopf oder Zahl. Bei gleichen
Entscheidungen zahlt Spieler 2 einen Euro an Spieler 1, ansonsten zahlt
Spieler 1 einen Euro an Spieler 2. Was passiert?
Kopf
Zahl
Kopf
1,−1
−1,1
Zahl
−1,1
1,−1
Es gibt hier kein Strategieprofil (in reinen Strategien), das wechselseitig
beste Antworten bietet. Die Beschränkung auf reine Strategien ist also
nicht immer adäquat.
13
Herunterladen