Spieltheorie

Werbung
Spieltheorie
Prof. Schottenloher
WS 2008/2009∗
∗
Mitschrift erstellt von Bernhard Weiß, Webseite: http://mathe.weissi.net, Korrekturen erwünscht
1
INHALTSVERZEICHNIS
Inhaltsverzeichnis
I
II
INHALTSVERZEICHNIS
A. Was ist Spieltheorie?
Spieltheorie ⊂ Mathematik
B. Anwendunsgebiete:
Wirtschaftswissenschaften
Sozialwissenschaften
Biologie
Physik
Informatik
Wirtschaft
Politik
Auktionstheorie
Preisbildung
C. Volesung
Im Kontrast zu anderen Vorlesungen:
Genauso: Rigorosität & einf. Beispiele
Anders: Modelle und exemplarische Lösungsansätze
Keine Komplexen Modelle → Angewandte Mathematik
E. Scheinerwerb:
4 Säulen:
Gestellte Aufgaben (1-2)
Selbstgestellte Aufgaben (1-2)
Artikelschreiben in Wikiludia (2-5 pro Semester)
Projekt (1 pro Semester)
F. Inhalt
• Nrmalform
• Extensive Form
• Verfeinerung des Nash-Gleichgewichts
• Information. (→ WT)
• Iterative Spiele
• Evolutionäre Spiele
• Mechanischem Design
• Kooperative Spiele
• Quantenspiele
G. Beispiele:
(a) 80%-Spiel
(b) Einsatzspiel
8 Investoren können jeder bis zu 1.000$ Investieren. Die Summe Investittinen wird vervierfacht und paritätisch ausgezahlt.
1
1
Normalformenspiel
1.1
Definition
Ein Spiel in Normalform (Strategischer Form) besteht aus:
1. M = {1, . . . , N } endliche Menge von Spielern
2. Für alle i ∈ M ist Menge Si 6= ∅ der (reinen) Strategien ausgezeichnet
Q
3. Für alle i ∈ M ist Nutzenfunktion ui : S → R festgelegt, wobei S := N
i=1 Si
der Strategieraum ist.
1.2
Bemerkung
1. Si meistens endlich
 
u1
 .. 
2. u =  .  : S → RN Nutzenfunktion
un
3. Variante: Statt Randere Zielräume Z mit Ordnung.
4. Variante: Statt ui Präferenzrelation ≤i auf S
1.3
Beispiel
Einsatzspiel:
M = {1, . . . 8}
sK = S = [0, 1000] ⊂ R
uk = 12 (s1 + s2 + . . . + s8 ) − sk
1
uK = (s1 + s2 + sˆk + . . . + s8 ) − 12 sk max auf [0,1000] d.h. sk = 0
|2
{z
}
σ
1.4
Beispiel Gefangenendilemma
2 Verdächtige werden verhört
Wenn beide leugnen ( = L) : Je 2 Jahre Gefängnis
1 leugnet und 2 gesteht (= G) : 1 erhält 10 Jahre, 2 erhällt 1 Jahr
1 gesteht und 2 leugent: Analog
Beide gestehen : Je 4 Jahre Gefängnis:
(Bi) Matrixform:
1/2
G
L
G
(4,4) (1,10)
L (10,1) (2,2)
2
2 DOMINANZ IN NORMALFORMENSPIELEN
Eigentlich (-1) Jahre S1 = s2 = {G, L}
S= {G, L}2
u1 (G, G) = 4
u1 (G, L) = 10
etc.
Was ist die Optimale Strategie:
Naiv: (L, L) gut? Analysie:
1 Überlegt Raktion auf die möglichen Wahlen von 2
1. 2 Wählt L. Dann ist G für 1 besser als L (2 → 1)
2. 2 wählt G. Dann ist G für 1 besser als L (10 → 4)
1.5
Beispiel Ölkartell
(ökonomische Interpretation des Gefangenendilemmas)
2 Spieler (M = {1, 2}) beiten Produkt an. 10 Mio. Einheiten werden verkauft u einem
Preis von 1$Gewinn/Einheit Der Markt wird geteilt: Je 5 Mio $
Jeder verpsrich den preis nicht zu unterbieten
Wenn 1 abweicht und mit 43 $ gewinn verkafut, findet Verdrängung statt:
7,5 Mio $ für 1 und 0 für 2
Falls beide den abgesprochenen Preis unterbeiten und für 34 $ Gewinn verkaufen, werden nach Preiskaufverlsut berücksichtig. Beiden bleibt Gewinn von je 2,5 Mio $ .
A
U
1/2
A
(5;5)
(0,7,5)
U (7,5;0) (2,5;2,5)
2
Dominanz in Normalformenspielen
(M, S, u) sei ein NFS.
2.1
Notation
Q
1. s ∈ S = N
i=1 Si hat die Form S = (S1 , . . . , SN ) und für k ∈ M setzen wir:
s−k := (s1 , . . . , sk−1 , sk+1 , . . . SN ) = (s1 , . . . sˆk , . . . sN )
2. (sk , s−k := (s−k , s) = S
3. S−k =
QN
i=1
i6=k
Si
4. Sk × S−k = S−k × S = S
2.2 Definition
2.2
3
Definition
k∈M
1. sk ∈ Sk wird strikt dominiert durch s˜k ∈ Sk , wenn für ale s−k ∈ S−k gilt:
uk (s˜k , s−k > uk (sk , s−k )
2. sk ∈ Sk wird schwach dominiert durch s˜k ∈ Sk ⇔
∀s−k ∈ S−k : uk (s̃k , s−k ) ≥ uk (sk , s−k ) und
∃s−k ∈ S−k : uk (s̃k , s−k ) > uk (sk , s−k )
2.3
Gefangenendilemma
G
L
1/2
G
(-4,-4) (-1,-10)
L (-10,-1) (-2,-2)
Si = {G, L}
k = 1 : s˜1 = L Strikt Dominant hieße u1 (s˜1 , ·) = u(L, ·) < u1 (G, ·)
d.h. u1 (L, L) > u1 (G, L); u1 (L, G) > u1 (G, G)
(stimmt nicht!)
s˜1 = G strikt dominant hieße:
u1 (G, L) > u1 (L, L); u1 (G, G) > u1 (L, G)
(stimmt.)
2.4
Definition
s̃ = (s˜1 , . . . , s˜N ) ∈ S heißt Gleichgewicht in (strikt) dominanten Strategien :⇔
∀k ∈ M ∀s ∈ S : s˜k 6= sk → s˜k ist (strikt) (bzw schwach) dominant über sk
d.h. ∀k ∈ M ∀s ∈ S : s˜k 6= sk ⇒ u(s˜k , s−k ) < uk (sk , s−k )
Beispeil
in 2.3 (G,G) Gleichgewicht in strikter Dominanz
2.5
Prinzip der Elemination durch strikte Dominanz
• Wenn sk ∈ Sk strikt dominiert wird dann definiere neues Spiel mit denselben
(1)
(1)
Spielern, mit S (1) anstelle von S, wobei Sk = Sk \ {sk }, Sj := Sj ∀i 6= k und
u(1) sei destriktion von u auf Telment S (1) ⊂ S
Aussage: S und S (1) haben dieselbe GG in strikter Dominanz
Dahinter steht:
4
2.6
2 DOMINANZ IN NORMALFORMENSPIELEN
Satz
Es gibt höchstens ein Gleichgewicht in strikter Dominanz. Hat das ursprüngliche Spiel
(M, S, u) ein Gleichgewciht s̃ ∈ S in strikter Dominanz so gilt für S (1) : s̃ ∈ S (1) und
ist GG in strikter Dominanz für (M, S (1)) , u(1) ) Analog für mehrere Eliminationen
unter strikter Dominanz.
(1)
(1)
Beweis: Es sei sk ∈ Sk strikt dominiert und Sj := Sj für j 6= k und Sk
Q (1) (1)
Sk \ {strichsk }, S (1) := j Sj , uj := uj |S (1)
(M, S (1) , u(1) ist aus (M, Su) durch Elimination von sk auf
Vor: s̃ ist GG in strikter Dominanz S̃ ∈ S
Dann s̃ ∈ S (1) und s̃ ist GG in strikter Dominanz in (M, S (1) , u(1) )
s̃ ∈
/ S (1) bedeutet dass s˜k = sk Aber:
sk wird strikt dominiert durch sˆk und sˆk durch s˜k
uk (sk ) < uk (sˆk ) Widerspruch
:=
Die Umkehrung der Aussage ist aber Falsch.
Bedeutung
S’ entstehe durch Elimination (strikt) aus S
Wenn s̃ ∈ S GG in strikter Dominanz ist, so findet s̃ als GG in Strikter Dominanz in
S’
Speziel: S 0 = {ŝ} Dann ist ŝ die gesuchte Strategiekombination, die GG in strikter
Dominanz des ursprünglichen Spiels ist.
(ŝ Nash-GG von (M,S,u)!)
2.7
Beispiel: Matching Pennies
2 Spieler legen je eine Münze mit Adler (A) oder Zahl (Z) auf den Tisch und decken
gleichzeitig auf.
gleiche Seite 1 gewinn beide Münzen
verschiedene Seiten 2 gewinnt beide Münzen
A
Z
1/2
A (2,0) (0,2) Weder Domiiert die Stategie A die Stategie Z noch umgekehrt
Z (0,2) (2,0)
⇒Es kann kein Gl. gewciht in (schwacher Struktur) Dominianz
(analog: Schere-Stein-Papier)
2.8 Beispiel
2.8
5
Beispiel
1/2
O
M
U
O (0,0) (6,6) (2,2)
Hier liegt keine Dominanz vor.
M (6,6) (8,8) (0,2)
U (2,2) (2,0) (1,1)
(M,M) ist ’optimale’ Strategie, denn 1 kann sich nciht verbessern und 1 steth nur
schlecht da, wenn 2 nach 0 oder U wechselt, aber in beiden Fällen verschlechtert sich
2 dabei.
M ist Nash Gleichgewicht:
2.9
Beispiel: Elimination durch strikt Dominanz
O
M
U
1/2
O (2,0) (1,1) (4,2)
s = U wird von s1 = 0 strikt dom.
M (1,4) (1,1) (0,2) 1
U (1,3) (0,2) (3,0)
s2 = M wird von s2 = u strikt dominiert
s1 = M wird von s1 = 0 strikt DOminiiert
s2 = 0 wird von s2 = U strikt DOminiert
⇒(O, U ) ist Nash Gleichgewicht
3
Nashgleichgewicht
Wieder (M, S, u)
3.1
Definition
Eine Strategiekombination S ∗ ∈ S heißt Nash-Gleichgewicht , wenn für jeden Spieler
k und jede Stategiekombination sl ∈ Sk die Ungleichung
uk (s∗k , s∗−k ) ≥ uk (sk , s∗−k )
Jeder k kann sich nicht verbessern durch abweichen von s∗k
Beispiele
1. (G,G) ist Nash Gleichgewicht
2. Einsatzspiel s∗ = (0, . . . , 0) ist Nash Gleichgewicht
k = 1 : u1 (0, . . . 0) ≥ u1 (s1 , 0, . . . , 0) = − 21 s1 , s1 ∈ [0, 1000]
3.2
Satz
Ein Gleichgewicht in strikter Dominanz ist Nash-Gleichgewicht
6
3 NASHGLEICHGEWICHT
Beweis: Sei s∗ ∈ S GG in strikter Dominanz
Sei k ∈ M sei sk ∈ Sk
Zeige uk (s∗k , s∗−k ) ≥ uk (sk , s∗−k
Aber nach Voraussetzung: uk (s∗k , ·) > uk (sk , ·)
Analog: schwache Dominanz
3.3
Satz
(M, S 0 , u0 ) sei aus (M, s, u) durch Elemination enstanden. Dann ist jedes Nash-GG
von (M, S 0 , u0 ) auch ein Nash-GG von (M, S, u)
Beweis: O.E.: S 0 = S1 × . . . Sk \ {s˙k } × . . . SN
s∗ ∈ S 0 sei Nash-GG (von (M,S’,u’))
∀j ∈ M, j 6= k, ∀sJ ∈ Sj = Sj0 , uj (s∗j , s∗−j ) ≥ uj (sj , s∗−j )
∀sk ∈ Sk0 = Sk \ {s˙k } : uk (s∗k , s∗−k ) ≥ uk (sk , s∗−k )
Damit s∗ Nash GG von (M,S,u) ist, gilt zu zeigen dass:
uk (s∗k , s∗−k ≥ uk (s˙k , s∗−k )
Dazu: s˙k strikt dominiert durch s˜k ∈ Sk \ {s˙k } = Sk0 :
uk (s˙k , s∗−k ) < uk (s˜k , s∗−k ) ≤ uk (s∗k , s∗−k )
Drei Fragen
1. Existenz von Nash GG?
2. Eindeutigkeit?
3. Stabilität
3.4
gemischte Strategien
Verfeinerung
Äquivalenz
Definition (beste Antwort)
sˆk ∈ Sk ist beste Antwort auf s−k ∈ S−k wenn
∀sk ∈ Sk : uk (sˆk , s−k ) ≥ uk (sk , s−k )
3.5
Bemerkung und Beispiele
1. S endlcih dann existiert immer eine beste Antwort
2. Im Falle uj = 0: Alle Strategien sind beste Antwort
3. Ganz allgemein hat man mengenwertige Abbildung
bk : S−k ⇒ P (Sk ); S−k → Sk
bk (s−k ) := {sk : sk ist beste antwort auf s−k }
3.6 Beispiel (Cournot-Duopol)
7
4. Im Falle bk (s−k ) 6= ∅ für alle s−k ∈ S und alle k, kann man rk (s−k ) ∈ bk (s−k )
auswählen
rk : S−k → Sk ist dann eine (feste) beste Antwort-Funktion
5. Gefangenendilemma:
Spieler1 :
G ist beste antwort auf G, und auf L
G ist beste Antwort auf Antwort stets
Gleiches gilt für Spieler 2
6. s̃ = (0, . . . , 0) ∈ T 8 beim EInsatzspiel beste Antworten
7. Variant:
Einsatzspiel mit Sj = ]0, 1000] ⊂ R ansonsten wie voher
| {z }
=I
Zu s−1 = (s2 , . . . s8 ) ∈ I 7 gibt es keine beste Antwort
max{u1 (t, s2 , . . . s8 ), t ∈ I} existiert nicht.
da sup{. . .} = 0
Satz
s∗ Nash-GG ⇔∀k ∈ M : s∗ ist beste Antwort auf s∗−k
Beweis: ’⇒’: klar
’⇐’: klar
3.6
Beispiel (Cournot-Duopol)
N=2 Anbieter eines homogenes Produktes
Angebotsmengen Qi = [0, ∞[
Preis: p(q) = p(q1 , q2 ) = P − (q1 + q2 ) für P > 0
q1 , q2 ≤ P
Kosten: ci (qi ) = Cqi für C > 0
ui (q) = p(q)qi − Cqi = (P − C − (q1 + q2 ))qi
Beste Antwot auf q1∗ auf q2 ∈ Q2 ?
u1 (q1∗ , q2 ) = max{u1 (q1 , q2 ) : q1 ∈ Q1 } wobei q2 fest
∂u1
= (P − C − q1 − q2 ) − q1 = 2q1 + P − C − q2 = 0
∂q1
∗
q1 = 12 (P − C − q2 ) ist einzige beste antwort auf q2
q2∗ = 21 (P − C − q1 ) ist einzige beste antwort auf q1
q2∗ Einsetzen in (1):
q1∗ = 21 (P − C − 21 (PC ) − q1∗ )) = 14 q1∗ + 14 (P − C)
Fazit: ( 13 (P − C), 31 (P − C)) ist ddas einzige Nash-GG
N ≥ 2 Anbeiter: p(q) = P − (q1 + . . . qN )
ci (q) = Cqi
8
3 NASHGLEICHGEWICHT
P
uk (q) = p(q)qk − Cqk = (P − C − qi )qk
..
.
P
⇒qk∗ = 12 (P − C − i6=k qi ) Im Falle dass q ∗ Nash-GG werden soll muss man lösen:
P
qk∗ = 21 (P − C − N
i=1,i6=k qi )
1
∗
kqk = N +1 (P − C)k
9
4
Gemischte Strategien
(M, S, u) Normalformenspiel
4.1
Definition
S sei endlich (d.h. alle Sk endlich)
eine geschmischte Strategie für k ∈ M ist eine (formale) Summe)
X
σk (p) =
ps s
s∈Sk
P
wobei ps ≥ 0 und s∈Sk ps = 1
Anders geschrieben:
mk = #Sk ∈ N : psµk = pµ (= pkµ )
P k k µ
P k
pµ sµk = m
σk (p) = µµ=1
µ=1 pµ sk
∆Sk = Menge der gemischten Strategien
P k
= {σk (p) : p = (p1 , . . . pmk ) ∈ Rmk , pµ ≥ 0 und m
µ=1 pµ = 1}
= {σk (p) : p ∈ ∆mk }
P
m
∆m := {p ∈ Rm : pµ ≥ 0 und m
µ=1 pµ = 1} (m-1) dim Simplex im R
∆m Komapt und konvex ⊂ Rm
Identifiziere: ∆Sk = ∆mk
k ∈ M : ∆Sk ∼
= ∆mk und dabei sind Einheitsvektoren e1 , . . . emk ∈ ∆mk ⊂ Rmk gerade
k
die ’reinen’ STrateigieen Sk = {s1k , . . . , sm
}, σk (eµ ) = sµk
k
Spiel in gemischten Strateien braucht die nutzenfunktion u˜k ist lineare fortsetzugn
von uk auf ∆mk
QN
Das bedeutet: p = (p1 , . . . , pN ) ∈ ∆m1 × . . . × ∆mN ∼
= j=1 δSmj
k = 1, . . . N : pk = (pk1 , . . . pkmk ) ∈ Rmk
u˜k (σ(p))
u˜k (σ1 (p1 ), . . P
. , σN (pN ))
Pm=
N
N µN
= u˜k ( µ1k=1 p1µ1 sµ1 1 , . . . , m
µN =1 pµN sN )
PmN
Pm1
µ1
µN
:= µ1 =1 . . . µN =1 p1µ1 p2µ2 . . . pN
µN uK (s1 , . . . , sN
Insgesammt neues Spiel: (M, ∆S, ũ)
Konvention: u statt ũ Interpretation Wahrscheinlichkeiten!
4.2
Matching Pennies
Z
A
1/2
Z (1,-1) (-1,1)
A (-1,1) (1,-1)
1 1
( 2 , 2 ) ist das einzige Nash-GG in gemischten Strategien.
σ1 ∈ ∆S1 σ1 = pA A + p2 Z
= pA + (1 − p)Z
σ2 = qA + (1 − q)Z
Beste antwort auf q ∈ [0, 1] ?
u1 (δ1 , δ2 ) = u1 (pA + (1 − p)Z, qA + (1 − q)Z) = pqu1 (A, A) + q(1 − q), u1 (A, Z) + (1 −
10
4 GEMISCHTE STRATEGIEN
pqu1 (Z, A) + (1 − p)(1 − q)u1 (Z, Z) = pq − p(1 − q) − q(1 − p) + (1 − p)(1 − q) =
4pq − 2p − 2q + 1
u2 = −u1
q vorgegeben q ∈ [0, 1]:
u1 = (4q − 2)p + 1 − 2q
Fallunterscheidung:
q > 21 ⇒ p = 1 ist beste Antwort
q = 12 ⇒ p ∈ [0, 1] ist beste Antwort
q < 12 → p = 0 ist beste Antwort
p Vorgegeben:
p > 21 ⇒ q = 0 ist beste Antwort
p = 12 ⇒ q ∈ [0, 1] ist beste Antwort
p < 12 ⇒ Q = 1 ist beste Antwort
⇒( 21 , 21 ) ist Nash GG
4.3
Hauptsatz ( Nash ’50)
EIn endliches Normalformenspiel hat immer ein Nash-G in endlichen Strategien
Beweis-Idee: Beste Antowort Korrespondenz.
Zu s ∈ S sei b(s) ∈ (b1 (s−1 , . . . , bN (s−N ) ∈ S
bK (s−k ) = {sk ∈ Sk : sk ist beste antwort auf s−k } ∈ Sk
b : S → S§
s∗ ist Nash-GG ⇔∀k ∈ M : s∗k ∈ bk (s∗−k ) ⇔ s∗ ∈ b(s∗ )
[Φ : T → T : t ∈ T Fixpunkt ⇔ t ∈ Φ(t)]
Spiel hat Nash GG ⇔b hat Fixpunkt
4.4
Definition
Sei Φ : X → 2X Korrespondenz, Φ : X → X
x ∈ X heißt Fixpunkt von Φ ⇔x∗ ∈ Φ(x∗
4.5
Lemma
s∗ Nash-GG ⇔s∗ Fixpunkt von b : S → S
4.6
Fixpunkstsatz von Kakutani
Gegeben: A ⊂ Rm sei nichtleer, komakt und konvex. Dann hat jede Korrespondenz
Φ : A → A einen Fixpunkt, wenn
• Φ(x) 6= ∅ und Φ(x) ⊂ A konvex
• Φ ist abgeschlossen (d.h. ΓΦ = {(x, y) ∈ A2 : x ∈ A, y ∈ Φ(x)} ist Abgeschlossen in A × A ⊂ Rm+m )
4.6 Fixpunkstsatz von Kakutani
11
Beweis: andersowo
Anwendung auf Hauptsatz
S = ∆S1 × . . . ∆SN = ∆m1 × ∆m2 × . . . × ∆mN ⊂ Rm1 +...mN
ist Kompakt als Pordutk der Kompakten Simpices ∆mi
A konvex :⇔∀x, y ∈ A∀t ∈ [0, 1], tx + (1 − t)y ∈ A
Klar: ∆mi Konvex daher auch S ⊂ Rm , S 6= ∅
b(s) 6= ∅ weil t → uk (t, s−k ), t ∈ ∆Sk ist stetig
bk (sk ) = {sk ∈ ∆Smk : uk (sk , s−k = maxt∈∆Sk uk (t, s−k )}
b(s) konvex :
Genügt bk (s−k ) ist Konvex
s0k , s00k ∈ ∆Sk und s0k , s00k ∈ b(s−k ), t ∈ [0, 1]uk (ts0k + (1 − t)s00k , s−k ) = tuk (s0k , s−k + (1 −
t)uk (s00k , s−k = t maxx∈∆Sk uk (x, s−k )+(1−t) maxx∈∆Sk uk (x, s−k ) = maxx∈Sk u(x, s−k )
Abgeschlossenheit: Übung
Möglichen Themen
1. Endlichkeitsbedingung fortlassen
∆Sk Wahrscheinlichkeitsmaße
2. Existenzsatz
3. Perfektes Nash-GG
12
5 2-PERSONEN-NULLSUMMENSPIELE
5
2-Personen-Nullsummenspiele
Ein Spiel (M, S, u) heißt Nullsummenspiel wenn u1 +. . . uN = 0 : ∀s ∈ S :
M = {1, 2} : u1 + u2 = 0; u1 = −u2
(-1,1) (1,-1) (-2,2)
z.b. Matching Pennies oder: (4,-4) (2,-2) (-3,3)
(-4,4) (0,0) (1,-1)
5.1
P
uj (s) = 0
Lemma
Sei (M, S, u) 2-Personen Nullsummenspiel
s∗ ∈ S :
s∗ Nash GG ⇔ ∀s ∈ S :
u1 (s1 , s∗2 ) ≤ u1 (s∗1 , s∗2 ) ≤ u1 (s∗1 , s2 ) (Sattelpunkt)
Beweis: s∗ Nash-GG ⇔
u1 (s∗ ) = maxs1 ∈S1 u1 (s1 , s∗2 ) und
u2 (s∗ ) = maxs2 ∈S2 u2 (s∗1 , s2 ) = mins2 ∈S2 u1 (s∗1 , s2 )
5.2
Satz
Für ein Nullsummenspiel mit 2 Personen existiert ein Nash-GG. Danng gilt für s∗ ∈ S
1. maxs1 ∈S1 mins2 ∈S2 u1 (s1 , s2 ) = mins2 ∈S2 maxs1 ∈S1 u1 (s1 , s2 ) =: M M ∈ R
2. Wenn s∗ Nash-GG, dann u1 (s∗ ) = M M
3. s∗ Nash-GG ⇔mins2 ∈S2 u1 (s∗1 s2 ) = maxs1 ∈S1 mins2 ∈S2 u1 (s1 , s2 ) und maxs1 ∈S1 u1 (s1 , s∗2 ) =
mins2 ∈S2 maxs1 ,∈S1 u1 (s1 , s2 )
Beweis: Vorwerg: Es gilt für alle u : X × Y → R:
maxx∈X miny∈Y u(x, y) ≤ miny∈Y maxy∈Y maxx∈X u(x, y)
Für x̂ ∈ X miny∈Y u(x̂, y) ≤ miny∈Y maxx∈X u(x, y)
⇒ maxx∈X miny∈Y u(x, y) ≤ miny∈Y maxx∈X u(x, y)
So jetzt s∗ ∈ S NashGG. Also
maxs1 ∈S1 u1 (s1 , s∗2 ) = u1 (s∗ ) = mins2 ∈S2 u1 (s∗1 , s2 )
⇒mins2 ∈S2 maxs1 ∈S1 u1 (s1 , s2 ) ≤ maxs1 ∈S1 u1 (s1 , s∗2 ) = u(s∗ )
u(s∗ ) = mins2 ∈S2 u1 (s∗1 , s2 ≤ maxs1 ∈S1 mins2 ∈S2 u1 (s1 , s2 )
⇒u1 (s∗ ) = mins2 maxs1 u1 (s1 , s2 ) = maxs1 mins2 u1 (s1 , s2 )
⇒1 und 2
Vorsicht: 1-3 nicht richtig, wenn kein Nash-GG existiert
Zusammenhang mit Optimierung: S1 = S2 endlcih mit Auszahlung u1 (si , sj ) =
uij ; (uij ) = U
13
6
Extensive Spiele
Spiele in extensiver Form, dynamische Spiele.
Wie stellt man Spiele mit der Eigenschaft, dass Spieler mehrere Züge nacheinander
oder gleichzeitig machen können vollkommene Information bedeutet, dass alle Spieler
jeweils über alle vorangegangen Züge vollkommend informiert sind und
Vollständige Information bedeutet, dass alle Spieler vollständig informiert sind über
die möglichen Strategien jedes Spielers, über alle Auszahlungen, etc und ...
6.1
Beispiel (Kleiner Affe /großer Affe)
Spiel: A, a Baum mit Frucht
Wert 10E (Frucht)
Energieaufwand für A: 2 E
Energieaufwand für a: 0 E
Strategien (AKtionen): K Klettern für A, W Warten für A
analog: k Klattern für a, w Warten für a
AUszahlungen:
(K, k) 7→ (5, 3)
(K, w) 7→ (4, 4)
(W, k) 7→ (9, 1)
(W, w) 7→ (0, 0)
6.1.1
Version
A zieht zuerst:
A wird W wählen und a wird k wählen müssen. ( w währe unglaubwürdige drohung)
(BAUMSKIZZE) Normalform:
k.k ∼
= a zieht k wenn A W zieht und k wenn A K wählt etc
k.k
k.w
w.k
w.w
W (9,1) (9,1) (0,0) (w,w) Nash-GG (W,k.w) Auch (W;k.k), (K,w.w)
K (5,39 (4,4) (5,3) (4,4)
6.1.2
a zieht zuerst
(BAUMSKIZZE) → Normalform
6.1.3
Gleichzeitig
k
W (9,1)
K (5,3)
w
(0,0)
(4,4)
14
6.2
6 EXTENSIVE SPIELE
Definition
Ein Spiel in extensiver Form mit vollkommender Definition besteht aus
• die Spielermenge M = {1, . . . N }
• Der Menge H der Historien mit einer Zerlegung H = E ∪ Z, E ∩ Z = ∅
• Der Spielerfunktion P : E → M
• Der Nutzenfunktion u : Z → RN
mit der folgenden Eigenschaften für H ist eine Menge von Folgen. Jede Flge h ∈ H
wird indiziert durch einen Abschnitt I ⊂ N,
I = {1, . . . , n} ( N oder I = N
(d.h. h = (ak )k∈I )
sodass
1. ∅ ∈ H
2. ∀h ∈ H, h = (ak )k∈I : L ⊂ I Unterabschnitt ⇒ (ak )k∈L ∈ H
3. ∀(ak )k∈N ∀I ⊂6= N Abschnitte (ak )k∈I ∈ H → (ak )k∈N ∈ H
4. E = {h ∈ H| ∃am+1 : (h, am+1 ∈ H}
5. Z = H \ E
h ∈ Z heißt terminale Historie (Endhistorie)
h ∈ E heißt Entscheidungshisotrie
Spielverlauf: Ausgangshistorie ∅ ∈ H, OE: ∅ ∈
/ Z (sonst triviales Spiel)
D.h. ∅ ∈ E und i := P (∅) ∈ M (= i∅ = i1 )
(i ist am Zug) A∅ = {a1 |(a1 ) ∈ H} Aktionsmenge für für ∅P (∅)
i = P (∅) zieht indem er ein Element a ∈ A∅ wählt und das Spiel bekommmt den
Zustand h = (a) = h1 ∈ H
..
.
Ist das Spiel nach n Zügen im Zustand h4 ∈ H so geht es folgendermaßen weiter:
hn ∈ Z : Das Spiel endet u(hn ) ist ergebnis
hn ∈
/ Z ⇒ hn ∈ E hn = (a1 , . . . an )
Ahn {a| (a1 , . . . an , a) ∈ H}
der Spieler in+1 zieht indem er ein an+1 ∈ Ahn wählt Ergebnis hn+1 := (a1 , . . . an+1 ) ∈
H ....
Entweder:
∃m : hm ∈ Z oder ∀m : hm ∈
/Z
k
Im letzten fall: h∞ = (a )k∈N ende des Spiels
6.3 Beispiel (Stackelberg-Duopol
Beispiel
Spieler A,a A zieht Zuerst, P (∅) = A, P (K) = P (W ) = a
H = {∅, (K), (W ), (K, k), (K, w), (W, k), (W, w)}
6.3
Beispiel (Stackelberg-Duopol
2 Spieler {1, 2} homogenes Produkt
P > 0 p(q) = P − q1 − q2
C > 0 ck (q) = c(q) = Cqk
uk (q) = (P − C − q1 − q2 )qk
H = {∅, (q1 ), (q1 , q2 )| q1 , q2 ∈ [0, P ]q1 + q2 ≤ P }
Optimale Strategie: Was zieht Spieler 2(nachdem q̂1 ∈ [0, P ])
2 wird (u2 (qˆ1 , q2 ) = (P − C − qˆ1 − q2 )q2 Maximieren
∂u2
= P − C − qˆ1 − 2q2 = 0 ⇒q2 = 12 (P − C − qˆ1 ) Max
∂qk
Spieler 1 : Maximales Angebot (Naiv:) q1 = C Blä :D
u1 maximieren unter voraussetung von q2 von oben:
u1 (q1 , q2 (q1 )) = (P − C − q1 − 12 (P − C − q1 ))q1
= 12 (P − C)q1 − 12 q12
⇒ q1 = 21 (P − C) ⇒ 41 (P − C)
15
16
7
7.1
7 SPIELBAUM ALS GRAPH
Spielbaum als Graph
Definition
1. Ein Graph besteht aus einer Menge K(von Knoten )
mit einer Menge A ⊂ {{p, q}|p, q ∈ K, p 6= q} (von Kanten )
2. Ein Pfad im Graphen Γ = (K, A) ist eine Folge von Kanten der Form:
({qn , qn+1 })1≤n≤M oder ({qn , qn+1 )n∈N (Der erste Pfad verbindet dabei q1 mit
qM +1
3. Γ ist zusammenhängen :⇔
je zwei Knoten miteinander verbunden werden können.
4. Ein Baum ist ein Graph Γ = (K, A) mit:
(a) ∃ ausgezeichneten Knoten w ∈ K (Wurzel) (w ist nicht Endpunkt)
(b) Je 2 verschiedene Knoten lassen sich genau einen injektiven Pfrad verbinden.
(c) ∞ injektive Pfrade verbinden den Anfang mit einem Endpunkt. Dieser
Endpunkt is keiner Kante enthalten.
5. Endknoten (Terminale Knoten) sind die Knoten mit Höchstens einer Kante
6. E = K \ Z Entscheidungsknoten
Bemerkung
Baum hat keine Schleifen
7.2
Vom Spielbaum zum Graphen
Sei H Spielbaum wie in 6.2
KH := H w = ∅
AH := {{h, (h, a)} : h ∈ E, sodass (h, a) ∈ H}
(KH , AH ) ist Baum
7.3
Vom Baum zum Spielbaum
(K, A) : ZuH : w 7→ ∅ ∈ H zu q ∈ K existiert eindeutige Folge von Knoten
w, q1 , . . . qn = q die w und q verbinden. q 7→ (q1 , . . . qn ) ∈ H
Vereinigt mit den Unendlichen Pfaden erhällt man Ganz H Nochmal:
H = {(q1 , . . . qn )| qk ∈ K und{wq1 }, . . . {qn−1 , qn } injektiver Pfad}
∪∅
∪ {(q k )|e Endpunkt eines ∞ inj. Pfades in Γ({qk , qk+1 )k∈N , q0 = w}
7.4 Jedem Baum ist Spielbaum zugeordnet
7.4
17
Jedem Baum ist Spielbaum zugeordnet
(K, A)
H := ∅ ∪ {(a1 , . . . an ) : ai ∈ K und{ai , ai+1 ∈ A} ∪
∪ {(ak )k∈N : ai ∈ K und {ai , ai+1 } ∈ A}
Beispiel
Extensives Spiel in 3 Stufen
1. H (Graph Γ)
2. M und P : E → M
3. u : Z → RN
Einfachereres Modell eines zugeh. Graphen
0
Statt KH wähle KH
:= {h ∈ H : h endliche Folge }
A wie zuvor
7.5
Beobachtung
0
0
(KH
, A) ist Graph mit ausgezeichneten w ∈ KH
(w = ∅) und (iv):
0
Für h, h0 ∈ KH
existiert injektiver Pfad der h, h0 in (K, A) verbindet
Und umgekert: Γ mit (i) und (iv) generiert H.
7.6
Nimm-Spiel
Stoß von 4 Streichhölzern wird von 2 Spielern 1, 2 abwechselnd um einen oder 2 Hölzern verringert. Gewonnen hat der der das letze Streichholz nimmt.
H = {∅, (1), (2), (1, 1), (1, 2), (2, 1), (2, 2), (1, 2, 1), (1, 2, 2), (2, 1, 1), (2, 1, 2), (1, 1, 1), (1, 1, 2), (2, 2, 1), (2, 1
1, P ((1)) = P ((2)) = 2
P (x, y) = 1 x, y ∈ {1, 2}
P (x, y, z) = 2
1 Gewinnt bei : (1, 2, 2), (2, 1, 2), (2, 2, 1), (1, 1, 1, 1, 1)
2 Gewinnt bei: (1, 2, 1, 1), (1, 1, 2, 1), (2, 1, 1, 1), (1, 1, 1, 2)
(Grafik : Baum)
Oder Verkürzung: (Grafik: Baum ohne Äste ohne verknotung)
7.7
Verhandlungsspiel
[0, 1] wird aufgeteilt durch wiederholte Angebote 1 > δ1 , δ2 > 0 nahe bei 1
Schritt 1:
1 beitet 1 − x, x ∈ [0, 1]
2 Wählt J (ja) Spielzuende → (x, 1 − x)
oder N(nein) → nächster Schritt:
2. Schritt:
188 NASH-GLEICHGEWIHT UND NORMALFORM EINES EXTENSIVEN SPIELS
2 bietet y ∈ [0, 1]
1 wählt J ⇒(δ1 (y), δ2 (1 − y))
1 wählt N ⇒Nächster Schritt:
3. Schritt:
1 bietet x ∈ [0, 1]
2 wählt J ⇒(δ12 (x), δ22 (1 − x))
2 wählt N ⇒nächster schritt.
⇒Wenn immer N gewählt wird → (0, 0)
H = {∅} ∪ {x1 , N, y 1 , . . . , N, xn ) : xi , y i ∈ [0, 1]}
∪ {x1 , N, y 1 , . . . , N, xn , N ) : xi , y i ∈ [0, 1]}
∪ {x1 , N, y 1 , . . . , N, y n ) : xi , y i ∈ [0, 1]}
∪ {x1 , N, y 1 , . . . , N, y n , N ) : xi , y i ∈ [0, 1]}
∪ {x1 , N, y 1 , . . . , N, xn , J) : xi , y i ∈ [0, 1]}
∪ {x1 , N, y 1 , . . . , N, y n , J) : xi , y i ∈ [0, 1]}
∪ {x1 , N, y n , . . . , ) : xi , y i ∈ [0, 1]}
u(x1 , N, y 1 , . . . , xn , J) = (δ12n−2 (xn ), δ22n−2 (1 − xn ))
u(x1 , . . . , y n , J) = (δ12n−1 (y n ), δ22n−1 (1 − y n ))
8
Nash-Gleichgewiht und Normalform eines extensiven Spiels
Sei (M, H, P, u)
Ah := {a|(h.a) ∈ H}, h ∈ E ⊂ H
8.1
Definition
Eine Strategie sk eines Spielers k ∈ M ist eine Abbildung sk , die jedem h ∈ P −1 (k)
−1
eine Aktion
Ssk (h) ∈ Ah zuordnet. Ek := P (k)
sk : Ek → {Ah : h ∈ Ek }, sk (h) ∈ Ak
8.2
Beispiel
1 Hat in ∅ die Aktionsmöglichkeiten a, d
und in (a, b) die möglichkeitn e, f
2 hat in (a) : b,e
8.3 Definition
19
Definition
Sk := {sk : sk Strategie für k}
S = S1 × . . . × SN
s ∈ S Strategieprofilkombination
Jedes s ∈ S hat Spielergebnis zur Folge
Genauer:
a1 := sP (∅) (∅)
h1 (s) := (a1 )
hn (s) = (a1 , . . . an ) ∈ E
an+1 := sP (hn ) (hn ) ∈ Ahn
hn+1 (s) = (a1 , . . . an , an+1 )
hn (s) ∈ Z : u(s) = u(hn (s)) ∀nhn (s) ∈
/ Z : (ak )k∈N ∈ Zu(ak ) ∈ RN
8.3
Definition
s∗ ∈ S Nash-GG ⇔
∀k ∈ M ∀sk ∈ Sk :
uk (s∗ ≥ uk (sk , s∗−k )
8.4
u(s) := u(h(s)) liefert eine Nutzenfukntion u : S → RN Das Spiel (M, S, u) ist die
Normalform von (M, H, P, u)
s∗ ∈ S ist Nash-GG von (M, H, P, u) ⇔s∗ Nasg GG im Normalformenspiel
8.5
Bemerkung
1. ∀k ∈ M ∀s−k ∈ S−k ist sˆk beste Antowr auf s−k ⇔uk (sˆk , s−k ) = max{uk (sk , s−k |sk ∈
Sk }
2. s∗ Nash-GG ⇔∀k ∈ M : s∗k ist beste Antwort auf s∗−k
3. EXISTENZ: H endlich ⇒es gibt stets ein Nash-GG
8.6
Beispiel: Nim
-
8.7
8.7.1
Zwei Affen
Großer Affe ist zuerst dran.
(k,k) (k,w) (w,k) (w,w)
W (9,1) (9.1) (0,0)
(0,0
K (5,3) (4,4) (5,3) (4,4)
Darau ergben sich folgende Nash-GG
(W, (k, w)), (W, (k, k)), (K, (w, w))
20
9 DAS TEILSPIELPERFEKTE NASH-GLEICHGEWICHT
9
Das teilspielperfekte Nash-Gleichgewicht
Γ = (M, H, p, u) extensives Spiel. Zu jedem h ∈ E ⊂ H hat man das Teilspiel Γ(h)
mit
H(h) = {h0 : (h, h0 ) ∈ H}
E(h) = H(h) ∩ E
Z(h) = H(h) e Z
M (h) = P (E(h))
u(h) = u|Z(h)
9.1
Lemma
Γ(h) = (M (h), H(h), P (h), u(h)) ist ein extensives Spiel das Teilspiel unterhalb von
h.
9.2
Definition
s∗ ∈ S heißt teilspielperfektes Nash-Gleichgewicht wenn die Restriktion von s∗ auf
das Spiel Γ(h) für alle h ∈ E jeweils Nash -GG ist
Bemerkung
1. h = ∅ ⇒ Γ(h) = Γ
2. h ∈ E und s ∈ S gilt es zu zeigen sk (h) restriktion auf Γ(h) zu definieren.
sk (h)(h0 ) := sk (h, h0 )k ∈ M (k)
9.3
Bem.
Beim Spiel der Affen gibt es ein teilspielperfektes Nash-GG
9.4
Spiel-Nimm
Das heißt Aus sicht von 2 Bleiben nur Die Strategien ((2, x, y, 2), (1, 2, 2)) übrig
Ebenfalls für Spieler eins dann: ((2, x, 2, 2), (1, 2, 2))
9.5
Markteintritt-Spiel
Ein konkurent (Spieler 1) eines Monopolist (Spieler 2) überlegt, ob er in den Markt
eintreten soll. 1 hat die Wahl zwischen J (Ja) und N (Nein) im Fall N ist das Spiel
vorbei und Auszahlen u(N ) = (0, 6)
Im Fall J: Spieler 2 hat die Wahl zwischen A(aggressiv und K(kooperativ). In jedem
fall ist das Spiel zuende.
u(J, A) = (0, 0), u(j, K) = (3, 3)
9.6 Beispiel
21
A
K
N (0,6) (0,6) (J,K) ist Nash Gleichgewicht
J (0,0) (3,3)
(N,A) ist Nashgleichgeweicht
Teilspielperfekt ist nur (J,K)
Verallgemeinerung: Kaufhauskettenspiel
Variante 2 hat in 20 Städten Monopol in allen tritt ein Konkurent ein oder nicht.
9.6
Beispiel
Ultimatumspiel Spieler 1 bietet s1 ∈ {1, . . . 100} an Spieler 2 Spieler 2 hat dei
Möglichkeit J (Ja) zu wählen dann, u(s1 , J) = (100 − s1 , s1 ) oder N (nein), dann
u(s1 , N ) = (0, 0)
H = {∅} ∪ {(s1 ) : s1 ∈ S1 } ∪ {(s1 , N ) : s1 ∈ S1 } ∪ {(s1 , J) : s1 ∈ S1 }
E1 = {∅}
E2 = {(s1 ) : s1 ∈ S1 }
s∗1 (∅) = 1 s∗2 (t)t∈S1 = J
s∗ (1, J) ist ein Nash-GG
1 = u2 (s∗ ) ≥ u2 (s∗1 , N ) = 0
99 = u1 (s∗ ) ≥ u1 (s1 , J) = 100 − s1 ∀s1 ∈ S1
∗
Betrachte
( nun s1 (∅) = m, m ∈ S1 m > 1
Jawennt ≥ m
s∗2 (t) =
N einwennt < m
∗
m = u2 (s ) ≥ u2 (s∗1 , s2 ) = m
(
100 − t für t ≥ m
100 − m = u1 (s∗ ) ≥ u1 (t, s∗ ) =
Betrachte die Teilbume in
0
für t < m
denen Spieler 2 entscheidet.
Dann ist Nash GG immer J
Also nur das erste Beispiel ist teilspielperfekt
9.7
Zuweisungspiel
2 Identische mittelbare Güter, sollen auf 2 Spieler verteilt werden.
Vorschläge von 1: 0,1,2 (bekommt 2. Spieler)
2. Spieler Zieht J oder N
Es gibt 9 Nash-GG: s1 = 1, s2 = (N,J,J)
Resultat:
(s1 , N, J, J) Nash-GG ⇔s1 = 1
(s1 , J, J, J) Nash-GG ⇔s1 = 0
22
10
10 ELIMINATION DURCH DOMINANZ
Elimination durch Dominanz
Extensive Spiele. Ziel: Existenzsatz von Zermelo (1912) Bew durch Elimination (Rückwärsinduktion)
Sei Γ = (M, H, P, u) extensives Spiel
sei ĥ ∈ H gegebe mit ĥ ∈ E und ∀a ∈ Aĥ : (ĥ, a) ∈ Z
Solch ĥ muss es nicht geben. ĥ existiert immer, wenn H endlich ist.
10.1
Definition
Die Länge l(h) von h ∈ H, h = (a1 , . . . , an ), ist n = l(h). Im Falle h = (ak )k∈N ∈ H
sei l(h) = ∞
10.2
Lemma
Sei Γ mit beschränkter länge, d.h. sup{l(h), h ∈ H} =: L < ∞
Dann gilt für h ∈ E mit l(h) = L − 1 h erfüllt: ∀a ∈ Ah : (h, a) ∈ Z
Beweis: ∀a ∈ Ah , l(h, a) = L
(h, a) ∈ Z sonst existiert b : (h, a, b) ∈ H mit l(h, a, b) = L + 1 ≤ L
daher (h, a) ∈ Z
Für solches ĥ ∈ E, ĥ 6= ∅ Setze:
H 0 := H \ {(â, a) : a ∈ Aĥ h’ ist SPielbaum Sei ĥ ∈ Ek , k = P (ĥ), Im Falle
Ek = {ĥ} Setze M 0 = M \ {k}
Ansonsten M 0 = M, E 0 = E \ {h0 }, Z 0 = (Z \ {(ĥ, a) : a ∈ Ah }) ∪ {ĥ}
(H 0 = E 0 ∪ Z 0 )
P 0 := P |E 0 : E 0 → M 0
u0 (h) := u(h)∀h ∈ Z 0 , h 6= ĥ
u0 (ĥ) := u(ĥ, a) für eines der a ∈ Ah (a noch frei)
10.3
Behauptung
Γ0 = (M 0 , H 0 , P 0 , u0 ) ist ex. Spiel (Γ = Γ0 (a)
10.4
Lemma(Elimination durch Dominanz)
Sei ĥ ∈ H wie oben ∀a ∈ Aĥ : (h, a) ∈ Z
Es sei außerdem a∗ ∈ Ah mit
uk (ĥ, a∗ ) = max{uk (ĥ, a) : a ∈ Aĥ }
Ferner sei S 0 teilspielpefekter Nash-GG von Γ0 = Γ0 (a∗ )
Dann ist durch:
s∗i (h) := s0 (h) für h ∈ E 0 = e \ {ĥ} und i ∈ M
s∗k (ĥ) := (ĥ, a∗ )
ein teilspielperfektes. Nash-GG gegenen.
Ebenso für Nash GG
10.5 Satz von Zermelo und teilspielperfekte Nash-GG
23
Beweis: Zeige: Restriktion von s∗ auf Γ(h), h ∈ E ist stets Nash-GG
1. Fall ĥ kommt in Γ(h) nicht vor: h 6= ĥ und das Teilspiel Γ(h) wird durch
Γ → Γ(h) nicht verändert. Also Γ(h) in Γ0 Teilbaum und Daher:
s0 |Γ(h) = s∗ |Γ(h) Nash-GG auf Γ(h)
2. Fall
ĥ = hΓ(ĥ) = ∅ ∪ {(a) : a ∈ Ah }
3. Fall
ĥ kommt in Γ(h) vor.
d.h. ĥ = (h, h0 ) = (a1 , . . . , an , an+1 , . . . , an+m )
| {z } |
{z
}
h
h0
OE: M = M’
Hilfsaussage: ∀i ∈ M : u0i (s0 ) = ui (s∗ )
1. Fall Spielverlauf h(s0 ) ∈ Z 0 ⊂ H 0 1. Fall h(s0 ) 6= ĥ Spielverlauf in Γ0
| {z }
∈Z
Daher h(s∗ ) = h(s0 ) u0 (s0 ) := h0 (h(s0 )), u0 (s∗ ) := u(h(s∗ )) h(s0 ) = h(s∗ ) ∈ Z 0
h(s0 ) = ĥ
h(s∗ ) = s∗k (ĥ) = (ĥ, a∗ )
Also u0 (s0 ) = u0 (ĥ) = u(ĥ, a∗ ) = u(s∗ )
Zu zeigen: s∗ Nash-GG auf Γ(h)
Wir haben: ∀i ∈ M ∀si ∈ Si0 : u0i (s0i , s0−i ) ≥ u0i (si , s0−i )
1. Fall: h(s0i , s0−i ) 6= ĥ
Dann h(si , s∗−i ) = h(si , s0i )
u0i (s0 ) ≥ u0i (si , s0−i ) = ui (si , s0−i )
uI (s∗ ) = u0i (s0 ) ≥ ui (si , s∗−i )
2. Fall:
h(si , s∗−i ) = ĥ = s∗k (ĥ) = (ĥ, a∗ )
Def
u0i (si , s0i ) = u0i (ĥ) = u(ĥ, a∗ ) = u( si , s∗−i )
1. wie oben
2. i=k:
h(sk , s∗−k ) = ĥ uk (s∗ ) = uk (ĥ, a∗ ) ≥ uk
...
10.5
Satz von Zermelo und teilspielperfekte Nash-GG
Jedes endliche extensive Spiel hat teilspielperfektes Nash-GG
24
11 UNENDLICHE STRATEGIEMENGEN
11
Unendliche Strategiemengen
Erinnerung
Normalforemnspiel(M, S, u) S = S1 × . . . × SN
Jetzt auch Si unendliche Mengen
IN der Regel: Si komakte metrische räume ui : S → R stetig
Fragestellung: Gemischte Erweiterung?
Mittelung über X(= Si ) ist ein Borel Maß mit:
σ-Algebra der Borellmengen auf X
τ (X) = {X : V ⊂ X&V offen } Topologei
σ-Algebra γ ⊂ P(X) mit:
• ∅ ∈ γ, X ∈ Γ
• Y ⊂ X&Y ∈ γ : X \ Y ∈ γ
• ∀Ak ∈ γ :
S
k
∈γ
B Borelalgebra ist die kleinste σ-Algebra auf X welche B ⊃ τ (X) erfüllt Ein Maß auf
(X, B) ist µ : B → R mit
1. µ(∅ = 0, µ ≥ 0
2. µ(A ∪ B = µ(A) + µ(B) für A, B ∈ BA ∩ B = ∅
S
P
3. Für Ak ∈ B&Ak ∩ Am = ∅ : µ( Ak ) = µ(Ak )
W-maß: µ ist Maß & µ(X) = 1 0 ≤ µ(A) ≤ 1
Beispiel
X = {x1 , . . . xM }&B =PP(X)
µ(xj ) := pj µ(A) = xj ∈A pj
P
Also Maß ist p1 , . . . pi ≥ 0& pi = 1
11.1 Definition
11.1
25
Definition
Jedes W-Maß µ auf Si heißt gemischte Strategie
∆Si ist Menge der Gemischten Strategien, d.h. Menge der W-maße
µ definiert
R linearesRFunktional Iµ : C(X, R) → R
Iµ (f ) = X f dµ = X f (x)dµ(x)
Iµ ist stetig, d.h. |Iµ (f )| ≤ kf k∞ := sup{|f (x)| : x ∈ X}
C(X, R) mit der Norm k · k∞ ist Banachraum
Auf ∆X(X = Si ) hat man die schwache Topologie
Eine Folge (µk )k∈N konvergiert gegen µ
:⇔∀f ∈ C(X, R)Iµk (f ) → Iµ (f )
∆X ist kompakt und metrisierbar
∆X ⊂ C(X, R)∗
Für σ ∈ ∆S = ∆S1 × . . . ∆SN (gemischte Strategienkomb
σ = (σ1R, . . .R, σN ) Rσi Wmaß auf ∆Si
u(σ) = S1 S2 . . . SN u(s1 , . . . , sN )dσ1 (s1 ) . . . dσN (sN )
11.2
Definition
(M, ∆S, u) ist die gemischte Erweiterung von (M, S, u)
und ist Spiel in Normalform.
11.3
Definition
σ ∗ ∈ ∆S ist Nash-GG in gemischten Strategien ( von Γ)
:⇔σ ∗ Nash GG in ∆Γ
∗
⇔∀k ∈ M ∀σk ∈ ∆Sk : uk (σ ∗ ) ≥ uk (σk , σ−k
)
∗
∗
⇔∀k ∈ M ∀sk ∈ Sk : uk (σ ) ≥ uk (sk , σ−k )
Ziel des Abschitts: Nash-GG existiert in gemischten Strategien.
11.4
Definition
σ ∗ ∈ ∆S heißt ε-GG zu ε > 0 :⇔
∗
∀k ∈ M ∀σk ∈ ∆Sk : uk (σ ∗ ) ≥ uk (σk , σ−k
)−ε
11.5
Satz
Sei û : S → RN stetig mit ku − ûk∞ < α, α > 0
Sei σ ∗ ∈ ∆S sei ε-GG von Γ. Dann ist σ ∗ ε0 -GG von Γ = (M, S, û) mit ε0 = ε + 2α
∗
Beweis: Zu zeigen: ∀k ∈ M ∀sk ∈ Sk : ûk (sk , σ−k
) − ûk (σ ∗ ) ≤ ε0
∗
∗
∗
ûk (sk , σ−k
) − ûk (σ ∗ ) = ûk (sk , s∗−k ) − uk (σk , δ−k
) + uk (sk , σ−k
) − uk (σ ∗ ) + uk (σ ∗ ) −
∗
ûk (σ ) < α + ε + α
R
R
R
Dabei : |uk (σ ∗ ) R− ûk (σ ∗ )| = | S uk (s)dσ(s) − S ĥk (s)dσ(s)| = | S (uk (s) −
ûk (s))dσ(s)| ≤ S kuk − ûk k∞ dσ(s) = kuk − ûk k∞ > α
26
11 UNENDLICHE STRATEGIEMENGEN
11.6
Satz
Seien σ (n) ∈ ∆S und εn > 0 mit
1. σ (n) ist ε-GG (bzg Γ = (M, S, u))
2. σ (n) → σ in δS
3. εn → ε ≥ 0
Dann ist σ ist ε-GG
Insbesondere: ε = 0 ⇒ σ Nash -GG
11.7
Definition
Γ = (M, S, u) heißt im wesentlichen endlich
:⇔Es gibt endliche Spiel Γ̂ = (M, Ŝ, û) und dazu eine messbare Abbildung ϕ : S → Ŝ
mit u = û ◦ ϕ
(f : S → R messbar :⇔∀ offene Mengen W ⊂ R : f −1 (W ) ∈ B(S))
ϕ : S → E (E endlich.) messbar :⇔
ϕ−1 (e) ∈ B(S), e ∈ E)
OE: σ(S) = Ŝ und Ŝ ⊂ S
Nehme zu ŝ ∈ Ŝ ein ŝ0 ∈ σ −1 (ŝ) d.h. ϕ(ŝ0 ) = ŝ
Setze ŝ0 = {ŝ0 : ŝ ∈ Ŝ}
ϕ̂0 (s) := ŝ0 für s ∈ ϕ−1 (ŝ)
11.8
Lemma
Ein im wesentlichen endloses Spiel hat ein Nash-GG in gemischten Strategien.
Beweis: Ŝ ⊂ S endlich Ŝ = Ŝ1 × . . . ŜN und
ϕ : S → Ŝ mit ∀s ∈ ϕ(ŝ) : u(s) = u(ŝ) = û(ŝ)
u|ϕ−1 (s) = const.= u(ŝ) = û(ŝ)
Satz von Nash:
Es gibt s∗ ∈ ∆Ŝ Nash-GG d.h.
∀k ∈ M ∀ŝk ∈ Ŝk : uk (s∗ ) ≥ uk (ŝk , s∗−k )
s∗ = P
(s∗1 , . . . , s∗N ) P
j
s∗ = m
qj = 1 und sj ∈ Ŝ
j=1 qj s
P
(k)
σk∗ (A) := s(i) ∈A qj
A ∈ B(Sk )
k
∗
Klar: σk ist W-Maß
∗
Behauptung: σ ∗ = (σ1∗ , . . . σN
) ist Nash-GG bzgl. ∆Γ
PN Pmr (1)
(N )
(j )
∗
∀k ∈ M ∀sk ∈ Sk : uk (σ ) = j=1 jr =1 qj1 . . . qjN uk (ŝ1 1 , . . . , ŝjNN ) = ûk (s∗ )
∀s : ûk (s∗ ) ≥ ûk (sjk , s∗−k )
11.9 Lemma
∀k ∈ M ∀ŝjk
∀j = 1, . . . , mk :
27
Z
=uk (σ ∗ )
11.9
Z
uK (s dσ ≥
uk (ŝjk , s∗−k )dσ
| S {z
} |S
{z
}
∗
∗ )
=uk (sk σ−k
Lemma
zu jedem α > 0 existiert ein Wesentlich endlich. Spiel Γ0 = (M, S, u0 ), S 0 ⊂ S mit
ku − u0 k < α
11.10
Satz
Jedes Spiel Γ = (M, S, u) S kompakt und metrisch, u stetig, hat Nash-GG in gemischten Strategien
Beweis: Zu u > 0 existiert nach 11.9 ein Wesentlich endlichen Spiel Γ(n) = (M, S, u(n) )
mit ku − u(n) k < n1
Γ(n) hat Nash-GG σ (n) in gemsichten Strategien ⇔ 0-GG
⇒σ (n) ist (0 + 2 n1 )-GG nach Lemma 11.5
(σ (n) ) Folge in ∆S = ∆S1 × . . . × ∆SN
∃ Teilfolge σ (nj ) mit σ (nj ) → σ = (σ1 , . . . , σN ) ∈ ∆S
Nach 11.6 σ (nj ) → σ und εnj = n2j → 0
⇒σ ist 0 − GG d.h. Nash-GG
α >S0∀s ∈ S : V (s) := {t ∈ S : ku(s) − u(t)k∞ < α} offen
⇒ s∈S V (s) offene Überdeckung
∃E
S ⊂ S endlich:
s∈E V (s) = S O.E: E = Ŝ1 × . . . × ŜN Ersetze V (ŝ) durch A(ŝ) ∈ B
mit A(ŝ) ∪ A(t̂) = ∅
Herunterladen