Grundlagen und Nash–Gleichgewichte in reinen Strategien Zahlen

Werbung
Zahlen und Vektoren
IR ist die Menge der reellen Zahlen
IR+ = {r ∈ IR | r ≥ 0}
Grundlagen und Nash–Gleichgewichte in reinen
Strategien
IRn ist die Menge aller Vektoren von n reellen Zahlen
x ∈ IRn
⇒
Zähler:
∀
IRn+
x = (x1 , . . . , xn ) = (xi )1≤i≤n = (xi )i = (xi )
...
für alle
n
∃
...
es existiert
= {x ∈ IR | ∀i : xi ≥ 0}
Intervalle
Yves Breitmoser, EUV Frankfurt (Oder)
(a, b) = {r ∈ IR | a < r < b}
[a, b] = {r ∈ IR | a ≤ r ≤ b}
[a, b) = {r ∈ IR | a ≤ r < b}
(a, b] = {r ∈ IR | a < r ≤ b}
1
Vektorrelationen
Profile und Listen
B sei die Menge der Spieler
Eine Sammlung von Werten irgendeiner Variablen heißt Profil, wenn die
Sammlung je einen Wert pro Spieler enthält,
∀x, y ∈ IRn
x =y
x ≥y
x >y
x y
bspw.: Auszahlungsprofil, Strategieprofil
⇔
⇔
⇔
⇔
⇔
∀i : xi = yi
∀i : xi ≥ yi
∀i : xi ≥ yi
x ≥ y , x 6= y
Profile haben bei uns große Buchstaben, bspw. X
und ∃i : xi > yi
X = (Xb )b∈B = (Xb )b = (Xb )
∀i : xi > yi
X−b ist die Liste aller Elemente des Profils X außer Xb
n
o
IRn+ = x ∈ IRn | x ≥ ~0
X−b = (Xc )c∈B\{b} = (Xc )c6=b
X = (X−b , Xb ) = (Xb , X−b )
2
3
Mengen von Profilen, Listen und Werten
Vb
sei eine Variable die einen Wert für Spieler b enthält
Vb
ist die Menge aller Werte der Variablen Vb
V =
× V b = ×V b
b∈B
V −b =
×
Vc =
Seien X , Y zwei Auszahlungsprofile X , Y ∈ IRB
X schwach Pareto–dominiert Y
ist die Menge aller Profile bzgl. V
b
c∈B\{b}
Pareto Dominanz und Effizienz
×V c
X Pareto–dominiert Y
ist eine Menge von Listen
c6=b
⇔
⇔
X >Y
X Y
Sei X die Menge aller Auszahlungsprofile
X ist Pareto effizient in X
Sei V b die Anzahl der Elemente in V b
X ist nicht Pareto effizient in X
Y V = V 1 ∗ · · · ∗ V n =
V b ⇔
⇔
∀X 0 ∈ X : X 0 ≯ X
∃X 0 ∈ X : X 0 > X
Pareto Effizienz: niemand kann besser gestellt werden, ohne einen anderen
Spieler schlechter zu stellen
b∈B
4
Statische Spiele
5
Komponenten eines statischen Spieles
(bei vollst. Information)
Modell
alle Spieler treffen sich genau einmal
eine endliche Menge Spieler
sie bestimmen ihre Strategien getrennt voneinander und gleichzeitig
für jeden b ∈ B eine nicht–leere Menge Strategien
(Aktionen)
auch: strategische Spiele oder Spiele in Normalform–Darstellung
B = {B1 , . . . , Bn }
∀b :
S b 6= ∅
eine Auszahlungsfunktion (Nutzen aus bzw. bewertete Konsequenzen der
Aktionen), die jedem Strategieprofil ein Auszahlungsprofil zuordnet
P̂ : S → IRB
Die Normalform ist geeignet als Darstellung einer Interaktion
wenn es keine sequentiellen Aspekte in dieser Interaktion gibt
wenn alle Spieler vollständig informiert sind
wenn die Spieler Konsequenzen für zukünftige Interaktionen ignorieren
ein statisches Spiel ist damit definiert durch ein Tripel
6
B, S, P̂
7
Tabellarische Darstellung von statischen Spielen mit
zwei Akteuren und je zwei Strategien
Nash–Gleichgewicht
Angenommen, es gibt ein Strategieprofil von dem alle Spieler zuverlässig
erwarten können, daß es gespielt wird
B = {1, 2},
S 1 = {L, R},
S 2 = {O, U},
PSb1 ,S2
:= P̂b (S1 , S2 )
O
U
L
1 ,P 2
PLO
LO
1 , P2
PLU
LU
R
1 , P2
PRO
RO
1 , P2
PRU
RU
Welche Eigenschaften muß es erfüllen?
kein Spieler darf Anreize haben zu einer einseitigen Abweichung haben
Profile, von denen niemand abweichen würde, heißen Gleichgewichte
Nash bewies: in jedem Spiel gibt es mindestens ein Gleichgewicht (in
gemischten Strategien)
Spieler 1 wählt die Zeilen, Spieler 2 wählt die Spalten.
das Konzept von Gleichgewichten ist nutzbar als Grundlage der
Analyse strategischer Interaktionen
9
8
Definition Nash–Gleichgewicht
Gefangenendilemma
Verbal I: Jedes Strategieprofil, wo keiner einseitig abweichen möchte
n
o
N = S ∈ S | ∀b,∀Sb0 ∈ S b : P̂b (S) ≥ P̂b (Sb0 , S−b )
Zwei Gefangene. Der Staatsanwalt kann ihnen nur kleine Vergehen
nachweisen, sie haben aber ein Verbrechen begangen. Er versucht nun,
Geständnisse zu erhalten, und macht ihnen das folgende Angebot (in
“Freiheitsjahren”). Was kann passieren?
Verbal II: Jedes Strategieprofil, wo die Spieler gegenseitig beste
Antworten spielen
n
o
c b (S−b )
N = S ∈ S | ∀b : Sb ∈ BA
Geständnis
kein Geständnis
wobei Sb eine beste Antwort auf S−b ist, wenn es keine Strategie für b
gibt, die eine höhere Auszahlung gegen S−b ermöglicht
n
o
c b (S−b ) = Sb ∈ S b | ∀S 0 ∈ S b : P̂b (Sb , S−b ) ≥ P̂b (S 0 , S−b )
BA
b
b
0
= arg max P̂b Sb , S−b ⊆ S b
Geständnis
kein Geständnis
−3 , −3
0 , −4
−4 , 0
−1 , −1
Das einzige Nash–Gleichgewicht: beide gestehen (G , G )
D.h.: (G , G ) ist das einzige Strategieprofil, das sich auch noch ergeben
würde, wenn beide Spieler wüßten, daß ihr Gegner seinen Teil beiträgt.
Sb0 ∈S b
10
11
Kampf der Geschlechter
Matching Pennies
Zwei Menschen mit unterschiedlichem Geschmack wollen zusammen
ausgehen. Spieler 1 zieht das Klavierkonzert (K ) vor, Spieler 2 dagegen
das Orgelkonzert (O). In jedem Fall finden sie es aber besser zusammen
auszugehen als getrennt. Was passiert?
Zwei Spieler, jeder wählt entweder Kopf oder Zahl. Bei gleichen
Entscheidungen zahlt Spieler 2 einen Euro an Spieler 1, ansonsten zahlt
Spieler 1 einen Euro an Spieler 2. Was passiert?
Klavier
Orgel
Klavier
2,1
0, 0
Orgel
0, 0
1,2
Kopf
Zahl
Kopf
1,−1
−1,1
Zahl
−1,1
1,−1
Es gibt hier kein Strategieprofil (in reinen Strategien), das wechselseitig
beste Antworten bietet. Die Beschränkung auf reine Strategien ist also
nicht immer adäquat.
Es gibt hier zwei Strategieprofile (in reinen Strategien), die wechselseitig
beste Antworten bieten. Das Konzept des Nash–Gleichgewichts führt also
nicht immer zu einer eindeutigen Lösung.
12
13
Herunterladen