Spieltheorie Prof. Schottenloher WS 2008/2009∗ ∗ Mitschrift erstellt von Bernhard Weiß, Webseite: http://mathe.weissi.net, Korrekturen erwünscht 1 INHALTSVERZEICHNIS Inhaltsverzeichnis I II INHALTSVERZEICHNIS A. Was ist Spieltheorie? Spieltheorie ⊂ Mathematik B. Anwendunsgebiete: Wirtschaftswissenschaften Sozialwissenschaften Biologie Physik Informatik Wirtschaft Politik Auktionstheorie Preisbildung C. Volesung Im Kontrast zu anderen Vorlesungen: Genauso: Rigorosität & einf. Beispiele Anders: Modelle und exemplarische Lösungsansätze Keine Komplexen Modelle → Angewandte Mathematik E. Scheinerwerb: 4 Säulen: Gestellte Aufgaben (1-2) Selbstgestellte Aufgaben (1-2) Artikelschreiben in Wikiludia (2-5 pro Semester) Projekt (1 pro Semester) F. Inhalt • Nrmalform • Extensive Form • Verfeinerung des Nash-Gleichgewichts • Information. (→ WT) • Iterative Spiele • Evolutionäre Spiele • Mechanischem Design • Kooperative Spiele • Quantenspiele G. Beispiele: (a) 80%-Spiel (b) Einsatzspiel 8 Investoren können jeder bis zu 1.000$ Investieren. Die Summe Investittinen wird vervierfacht und paritätisch ausgezahlt. 1 1 Normalformenspiel 1.1 Definition Ein Spiel in Normalform (Strategischer Form) besteht aus: 1. M = {1, . . . , N } endliche Menge von Spielern 2. Für alle i ∈ M ist Menge Si 6= ∅ der (reinen) Strategien ausgezeichnet Q 3. Für alle i ∈ M ist Nutzenfunktion ui : S → R festgelegt, wobei S := N i=1 Si der Strategieraum ist. 1.2 Bemerkung 1. Si meistens endlich u1 .. 2. u = . : S → RN Nutzenfunktion un 3. Variante: Statt Randere Zielräume Z mit Ordnung. 4. Variante: Statt ui Präferenzrelation ≤i auf S 1.3 Beispiel Einsatzspiel: M = {1, . . . 8} sK = S = [0, 1000] ⊂ R uk = 12 (s1 + s2 + . . . + s8 ) − sk 1 uK = (s1 + s2 + sˆk + . . . + s8 ) − 12 sk max auf [0,1000] d.h. sk = 0 |2 {z } σ 1.4 Beispiel Gefangenendilemma 2 Verdächtige werden verhört Wenn beide leugnen ( = L) : Je 2 Jahre Gefängnis 1 leugnet und 2 gesteht (= G) : 1 erhält 10 Jahre, 2 erhällt 1 Jahr 1 gesteht und 2 leugent: Analog Beide gestehen : Je 4 Jahre Gefängnis: (Bi) Matrixform: 1/2 G L G (4,4) (1,10) L (10,1) (2,2) 2 2 DOMINANZ IN NORMALFORMENSPIELEN Eigentlich (-1) Jahre S1 = s2 = {G, L} S= {G, L}2 u1 (G, G) = 4 u1 (G, L) = 10 etc. Was ist die Optimale Strategie: Naiv: (L, L) gut? Analysie: 1 Überlegt Raktion auf die möglichen Wahlen von 2 1. 2 Wählt L. Dann ist G für 1 besser als L (2 → 1) 2. 2 wählt G. Dann ist G für 1 besser als L (10 → 4) 1.5 Beispiel Ölkartell (ökonomische Interpretation des Gefangenendilemmas) 2 Spieler (M = {1, 2}) beiten Produkt an. 10 Mio. Einheiten werden verkauft u einem Preis von 1$Gewinn/Einheit Der Markt wird geteilt: Je 5 Mio $ Jeder verpsrich den preis nicht zu unterbieten Wenn 1 abweicht und mit 43 $ gewinn verkafut, findet Verdrängung statt: 7,5 Mio $ für 1 und 0 für 2 Falls beide den abgesprochenen Preis unterbeiten und für 34 $ Gewinn verkaufen, werden nach Preiskaufverlsut berücksichtig. Beiden bleibt Gewinn von je 2,5 Mio $ . A U 1/2 A (5;5) (0,7,5) U (7,5;0) (2,5;2,5) 2 Dominanz in Normalformenspielen (M, S, u) sei ein NFS. 2.1 Notation Q 1. s ∈ S = N i=1 Si hat die Form S = (S1 , . . . , SN ) und für k ∈ M setzen wir: s−k := (s1 , . . . , sk−1 , sk+1 , . . . SN ) = (s1 , . . . sˆk , . . . sN ) 2. (sk , s−k := (s−k , s) = S 3. S−k = QN i=1 i6=k Si 4. Sk × S−k = S−k × S = S 2.2 Definition 2.2 3 Definition k∈M 1. sk ∈ Sk wird strikt dominiert durch s˜k ∈ Sk , wenn für ale s−k ∈ S−k gilt: uk (s˜k , s−k > uk (sk , s−k ) 2. sk ∈ Sk wird schwach dominiert durch s˜k ∈ Sk ⇔ ∀s−k ∈ S−k : uk (s̃k , s−k ) ≥ uk (sk , s−k ) und ∃s−k ∈ S−k : uk (s̃k , s−k ) > uk (sk , s−k ) 2.3 Gefangenendilemma G L 1/2 G (-4,-4) (-1,-10) L (-10,-1) (-2,-2) Si = {G, L} k = 1 : s˜1 = L Strikt Dominant hieße u1 (s˜1 , ·) = u(L, ·) < u1 (G, ·) d.h. u1 (L, L) > u1 (G, L); u1 (L, G) > u1 (G, G) (stimmt nicht!) s˜1 = G strikt dominant hieße: u1 (G, L) > u1 (L, L); u1 (G, G) > u1 (L, G) (stimmt.) 2.4 Definition s̃ = (s˜1 , . . . , s˜N ) ∈ S heißt Gleichgewicht in (strikt) dominanten Strategien :⇔ ∀k ∈ M ∀s ∈ S : s˜k 6= sk → s˜k ist (strikt) (bzw schwach) dominant über sk d.h. ∀k ∈ M ∀s ∈ S : s˜k 6= sk ⇒ u(s˜k , s−k ) < uk (sk , s−k ) Beispeil in 2.3 (G,G) Gleichgewicht in strikter Dominanz 2.5 Prinzip der Elemination durch strikte Dominanz • Wenn sk ∈ Sk strikt dominiert wird dann definiere neues Spiel mit denselben (1) (1) Spielern, mit S (1) anstelle von S, wobei Sk = Sk \ {sk }, Sj := Sj ∀i 6= k und u(1) sei destriktion von u auf Telment S (1) ⊂ S Aussage: S und S (1) haben dieselbe GG in strikter Dominanz Dahinter steht: 4 2.6 2 DOMINANZ IN NORMALFORMENSPIELEN Satz Es gibt höchstens ein Gleichgewicht in strikter Dominanz. Hat das ursprüngliche Spiel (M, S, u) ein Gleichgewciht s̃ ∈ S in strikter Dominanz so gilt für S (1) : s̃ ∈ S (1) und ist GG in strikter Dominanz für (M, S (1)) , u(1) ) Analog für mehrere Eliminationen unter strikter Dominanz. (1) (1) Beweis: Es sei sk ∈ Sk strikt dominiert und Sj := Sj für j 6= k und Sk Q (1) (1) Sk \ {strichsk }, S (1) := j Sj , uj := uj |S (1) (M, S (1) , u(1) ist aus (M, Su) durch Elimination von sk auf Vor: s̃ ist GG in strikter Dominanz S̃ ∈ S Dann s̃ ∈ S (1) und s̃ ist GG in strikter Dominanz in (M, S (1) , u(1) ) s̃ ∈ / S (1) bedeutet dass s˜k = sk Aber: sk wird strikt dominiert durch sˆk und sˆk durch s˜k uk (sk ) < uk (sˆk ) Widerspruch := Die Umkehrung der Aussage ist aber Falsch. Bedeutung S’ entstehe durch Elimination (strikt) aus S Wenn s̃ ∈ S GG in strikter Dominanz ist, so findet s̃ als GG in Strikter Dominanz in S’ Speziel: S 0 = {ŝ} Dann ist ŝ die gesuchte Strategiekombination, die GG in strikter Dominanz des ursprünglichen Spiels ist. (ŝ Nash-GG von (M,S,u)!) 2.7 Beispiel: Matching Pennies 2 Spieler legen je eine Münze mit Adler (A) oder Zahl (Z) auf den Tisch und decken gleichzeitig auf. gleiche Seite 1 gewinn beide Münzen verschiedene Seiten 2 gewinnt beide Münzen A Z 1/2 A (2,0) (0,2) Weder Domiiert die Stategie A die Stategie Z noch umgekehrt Z (0,2) (2,0) ⇒Es kann kein Gl. gewciht in (schwacher Struktur) Dominianz (analog: Schere-Stein-Papier) 2.8 Beispiel 2.8 5 Beispiel 1/2 O M U O (0,0) (6,6) (2,2) Hier liegt keine Dominanz vor. M (6,6) (8,8) (0,2) U (2,2) (2,0) (1,1) (M,M) ist ’optimale’ Strategie, denn 1 kann sich nciht verbessern und 1 steth nur schlecht da, wenn 2 nach 0 oder U wechselt, aber in beiden Fällen verschlechtert sich 2 dabei. M ist Nash Gleichgewicht: 2.9 Beispiel: Elimination durch strikt Dominanz O M U 1/2 O (2,0) (1,1) (4,2) s = U wird von s1 = 0 strikt dom. M (1,4) (1,1) (0,2) 1 U (1,3) (0,2) (3,0) s2 = M wird von s2 = u strikt dominiert s1 = M wird von s1 = 0 strikt DOminiiert s2 = 0 wird von s2 = U strikt DOminiert ⇒(O, U ) ist Nash Gleichgewicht 3 Nashgleichgewicht Wieder (M, S, u) 3.1 Definition Eine Strategiekombination S ∗ ∈ S heißt Nash-Gleichgewicht , wenn für jeden Spieler k und jede Stategiekombination sl ∈ Sk die Ungleichung uk (s∗k , s∗−k ) ≥ uk (sk , s∗−k ) Jeder k kann sich nicht verbessern durch abweichen von s∗k Beispiele 1. (G,G) ist Nash Gleichgewicht 2. Einsatzspiel s∗ = (0, . . . , 0) ist Nash Gleichgewicht k = 1 : u1 (0, . . . 0) ≥ u1 (s1 , 0, . . . , 0) = − 21 s1 , s1 ∈ [0, 1000] 3.2 Satz Ein Gleichgewicht in strikter Dominanz ist Nash-Gleichgewicht 6 3 NASHGLEICHGEWICHT Beweis: Sei s∗ ∈ S GG in strikter Dominanz Sei k ∈ M sei sk ∈ Sk Zeige uk (s∗k , s∗−k ) ≥ uk (sk , s∗−k Aber nach Voraussetzung: uk (s∗k , ·) > uk (sk , ·) Analog: schwache Dominanz 3.3 Satz (M, S 0 , u0 ) sei aus (M, s, u) durch Elemination enstanden. Dann ist jedes Nash-GG von (M, S 0 , u0 ) auch ein Nash-GG von (M, S, u) Beweis: O.E.: S 0 = S1 × . . . Sk \ {s˙k } × . . . SN s∗ ∈ S 0 sei Nash-GG (von (M,S’,u’)) ∀j ∈ M, j 6= k, ∀sJ ∈ Sj = Sj0 , uj (s∗j , s∗−j ) ≥ uj (sj , s∗−j ) ∀sk ∈ Sk0 = Sk \ {s˙k } : uk (s∗k , s∗−k ) ≥ uk (sk , s∗−k ) Damit s∗ Nash GG von (M,S,u) ist, gilt zu zeigen dass: uk (s∗k , s∗−k ≥ uk (s˙k , s∗−k ) Dazu: s˙k strikt dominiert durch s˜k ∈ Sk \ {s˙k } = Sk0 : uk (s˙k , s∗−k ) < uk (s˜k , s∗−k ) ≤ uk (s∗k , s∗−k ) Drei Fragen 1. Existenz von Nash GG? 2. Eindeutigkeit? 3. Stabilität 3.4 gemischte Strategien Verfeinerung Äquivalenz Definition (beste Antwort) sˆk ∈ Sk ist beste Antwort auf s−k ∈ S−k wenn ∀sk ∈ Sk : uk (sˆk , s−k ) ≥ uk (sk , s−k ) 3.5 Bemerkung und Beispiele 1. S endlcih dann existiert immer eine beste Antwort 2. Im Falle uj = 0: Alle Strategien sind beste Antwort 3. Ganz allgemein hat man mengenwertige Abbildung bk : S−k ⇒ P (Sk ); S−k → Sk bk (s−k ) := {sk : sk ist beste antwort auf s−k } 3.6 Beispiel (Cournot-Duopol) 7 4. Im Falle bk (s−k ) 6= ∅ für alle s−k ∈ S und alle k, kann man rk (s−k ) ∈ bk (s−k ) auswählen rk : S−k → Sk ist dann eine (feste) beste Antwort-Funktion 5. Gefangenendilemma: Spieler1 : G ist beste antwort auf G, und auf L G ist beste Antwort auf Antwort stets Gleiches gilt für Spieler 2 6. s̃ = (0, . . . , 0) ∈ T 8 beim EInsatzspiel beste Antworten 7. Variant: Einsatzspiel mit Sj = ]0, 1000] ⊂ R ansonsten wie voher | {z } =I Zu s−1 = (s2 , . . . s8 ) ∈ I 7 gibt es keine beste Antwort max{u1 (t, s2 , . . . s8 ), t ∈ I} existiert nicht. da sup{. . .} = 0 Satz s∗ Nash-GG ⇔∀k ∈ M : s∗ ist beste Antwort auf s∗−k Beweis: ’⇒’: klar ’⇐’: klar 3.6 Beispiel (Cournot-Duopol) N=2 Anbieter eines homogenes Produktes Angebotsmengen Qi = [0, ∞[ Preis: p(q) = p(q1 , q2 ) = P − (q1 + q2 ) für P > 0 q1 , q2 ≤ P Kosten: ci (qi ) = Cqi für C > 0 ui (q) = p(q)qi − Cqi = (P − C − (q1 + q2 ))qi Beste Antwot auf q1∗ auf q2 ∈ Q2 ? u1 (q1∗ , q2 ) = max{u1 (q1 , q2 ) : q1 ∈ Q1 } wobei q2 fest ∂u1 = (P − C − q1 − q2 ) − q1 = 2q1 + P − C − q2 = 0 ∂q1 ∗ q1 = 12 (P − C − q2 ) ist einzige beste antwort auf q2 q2∗ = 21 (P − C − q1 ) ist einzige beste antwort auf q1 q2∗ Einsetzen in (1): q1∗ = 21 (P − C − 21 (PC ) − q1∗ )) = 14 q1∗ + 14 (P − C) Fazit: ( 13 (P − C), 31 (P − C)) ist ddas einzige Nash-GG N ≥ 2 Anbeiter: p(q) = P − (q1 + . . . qN ) ci (q) = Cqi 8 3 NASHGLEICHGEWICHT P uk (q) = p(q)qk − Cqk = (P − C − qi )qk .. . P ⇒qk∗ = 12 (P − C − i6=k qi ) Im Falle dass q ∗ Nash-GG werden soll muss man lösen: P qk∗ = 21 (P − C − N i=1,i6=k qi ) 1 ∗ kqk = N +1 (P − C)k 9 4 Gemischte Strategien (M, S, u) Normalformenspiel 4.1 Definition S sei endlich (d.h. alle Sk endlich) eine geschmischte Strategie für k ∈ M ist eine (formale) Summe) X σk (p) = ps s s∈Sk P wobei ps ≥ 0 und s∈Sk ps = 1 Anders geschrieben: mk = #Sk ∈ N : psµk = pµ (= pkµ ) P k k µ P k pµ sµk = m σk (p) = µµ=1 µ=1 pµ sk ∆Sk = Menge der gemischten Strategien P k = {σk (p) : p = (p1 , . . . pmk ) ∈ Rmk , pµ ≥ 0 und m µ=1 pµ = 1} = {σk (p) : p ∈ ∆mk } P m ∆m := {p ∈ Rm : pµ ≥ 0 und m µ=1 pµ = 1} (m-1) dim Simplex im R ∆m Komapt und konvex ⊂ Rm Identifiziere: ∆Sk = ∆mk k ∈ M : ∆Sk ∼ = ∆mk und dabei sind Einheitsvektoren e1 , . . . emk ∈ ∆mk ⊂ Rmk gerade k die ’reinen’ STrateigieen Sk = {s1k , . . . , sm }, σk (eµ ) = sµk k Spiel in gemischten Strateien braucht die nutzenfunktion u˜k ist lineare fortsetzugn von uk auf ∆mk QN Das bedeutet: p = (p1 , . . . , pN ) ∈ ∆m1 × . . . × ∆mN ∼ = j=1 δSmj k = 1, . . . N : pk = (pk1 , . . . pkmk ) ∈ Rmk u˜k (σ(p)) u˜k (σ1 (p1 ), . . P . , σN (pN )) Pm= N N µN = u˜k ( µ1k=1 p1µ1 sµ1 1 , . . . , m µN =1 pµN sN ) PmN Pm1 µ1 µN := µ1 =1 . . . µN =1 p1µ1 p2µ2 . . . pN µN uK (s1 , . . . , sN Insgesammt neues Spiel: (M, ∆S, ũ) Konvention: u statt ũ Interpretation Wahrscheinlichkeiten! 4.2 Matching Pennies Z A 1/2 Z (1,-1) (-1,1) A (-1,1) (1,-1) 1 1 ( 2 , 2 ) ist das einzige Nash-GG in gemischten Strategien. σ1 ∈ ∆S1 σ1 = pA A + p2 Z = pA + (1 − p)Z σ2 = qA + (1 − q)Z Beste antwort auf q ∈ [0, 1] ? u1 (δ1 , δ2 ) = u1 (pA + (1 − p)Z, qA + (1 − q)Z) = pqu1 (A, A) + q(1 − q), u1 (A, Z) + (1 − 10 4 GEMISCHTE STRATEGIEN pqu1 (Z, A) + (1 − p)(1 − q)u1 (Z, Z) = pq − p(1 − q) − q(1 − p) + (1 − p)(1 − q) = 4pq − 2p − 2q + 1 u2 = −u1 q vorgegeben q ∈ [0, 1]: u1 = (4q − 2)p + 1 − 2q Fallunterscheidung: q > 21 ⇒ p = 1 ist beste Antwort q = 12 ⇒ p ∈ [0, 1] ist beste Antwort q < 12 → p = 0 ist beste Antwort p Vorgegeben: p > 21 ⇒ q = 0 ist beste Antwort p = 12 ⇒ q ∈ [0, 1] ist beste Antwort p < 12 ⇒ Q = 1 ist beste Antwort ⇒( 21 , 21 ) ist Nash GG 4.3 Hauptsatz ( Nash ’50) EIn endliches Normalformenspiel hat immer ein Nash-G in endlichen Strategien Beweis-Idee: Beste Antowort Korrespondenz. Zu s ∈ S sei b(s) ∈ (b1 (s−1 , . . . , bN (s−N ) ∈ S bK (s−k ) = {sk ∈ Sk : sk ist beste antwort auf s−k } ∈ Sk b : S → S§ s∗ ist Nash-GG ⇔∀k ∈ M : s∗k ∈ bk (s∗−k ) ⇔ s∗ ∈ b(s∗ ) [Φ : T → T : t ∈ T Fixpunkt ⇔ t ∈ Φ(t)] Spiel hat Nash GG ⇔b hat Fixpunkt 4.4 Definition Sei Φ : X → 2X Korrespondenz, Φ : X → X x ∈ X heißt Fixpunkt von Φ ⇔x∗ ∈ Φ(x∗ 4.5 Lemma s∗ Nash-GG ⇔s∗ Fixpunkt von b : S → S 4.6 Fixpunkstsatz von Kakutani Gegeben: A ⊂ Rm sei nichtleer, komakt und konvex. Dann hat jede Korrespondenz Φ : A → A einen Fixpunkt, wenn • Φ(x) 6= ∅ und Φ(x) ⊂ A konvex • Φ ist abgeschlossen (d.h. ΓΦ = {(x, y) ∈ A2 : x ∈ A, y ∈ Φ(x)} ist Abgeschlossen in A × A ⊂ Rm+m ) 4.6 Fixpunkstsatz von Kakutani 11 Beweis: andersowo Anwendung auf Hauptsatz S = ∆S1 × . . . ∆SN = ∆m1 × ∆m2 × . . . × ∆mN ⊂ Rm1 +...mN ist Kompakt als Pordutk der Kompakten Simpices ∆mi A konvex :⇔∀x, y ∈ A∀t ∈ [0, 1], tx + (1 − t)y ∈ A Klar: ∆mi Konvex daher auch S ⊂ Rm , S 6= ∅ b(s) 6= ∅ weil t → uk (t, s−k ), t ∈ ∆Sk ist stetig bk (sk ) = {sk ∈ ∆Smk : uk (sk , s−k = maxt∈∆Sk uk (t, s−k )} b(s) konvex : Genügt bk (s−k ) ist Konvex s0k , s00k ∈ ∆Sk und s0k , s00k ∈ b(s−k ), t ∈ [0, 1]uk (ts0k + (1 − t)s00k , s−k ) = tuk (s0k , s−k + (1 − t)uk (s00k , s−k = t maxx∈∆Sk uk (x, s−k )+(1−t) maxx∈∆Sk uk (x, s−k ) = maxx∈Sk u(x, s−k ) Abgeschlossenheit: Übung Möglichen Themen 1. Endlichkeitsbedingung fortlassen ∆Sk Wahrscheinlichkeitsmaße 2. Existenzsatz 3. Perfektes Nash-GG 12 5 2-PERSONEN-NULLSUMMENSPIELE 5 2-Personen-Nullsummenspiele Ein Spiel (M, S, u) heißt Nullsummenspiel wenn u1 +. . . uN = 0 : ∀s ∈ S : M = {1, 2} : u1 + u2 = 0; u1 = −u2 (-1,1) (1,-1) (-2,2) z.b. Matching Pennies oder: (4,-4) (2,-2) (-3,3) (-4,4) (0,0) (1,-1) 5.1 P uj (s) = 0 Lemma Sei (M, S, u) 2-Personen Nullsummenspiel s∗ ∈ S : s∗ Nash GG ⇔ ∀s ∈ S : u1 (s1 , s∗2 ) ≤ u1 (s∗1 , s∗2 ) ≤ u1 (s∗1 , s2 ) (Sattelpunkt) Beweis: s∗ Nash-GG ⇔ u1 (s∗ ) = maxs1 ∈S1 u1 (s1 , s∗2 ) und u2 (s∗ ) = maxs2 ∈S2 u2 (s∗1 , s2 ) = mins2 ∈S2 u1 (s∗1 , s2 ) 5.2 Satz Für ein Nullsummenspiel mit 2 Personen existiert ein Nash-GG. Danng gilt für s∗ ∈ S 1. maxs1 ∈S1 mins2 ∈S2 u1 (s1 , s2 ) = mins2 ∈S2 maxs1 ∈S1 u1 (s1 , s2 ) =: M M ∈ R 2. Wenn s∗ Nash-GG, dann u1 (s∗ ) = M M 3. s∗ Nash-GG ⇔mins2 ∈S2 u1 (s∗1 s2 ) = maxs1 ∈S1 mins2 ∈S2 u1 (s1 , s2 ) und maxs1 ∈S1 u1 (s1 , s∗2 ) = mins2 ∈S2 maxs1 ,∈S1 u1 (s1 , s2 ) Beweis: Vorwerg: Es gilt für alle u : X × Y → R: maxx∈X miny∈Y u(x, y) ≤ miny∈Y maxy∈Y maxx∈X u(x, y) Für x̂ ∈ X miny∈Y u(x̂, y) ≤ miny∈Y maxx∈X u(x, y) ⇒ maxx∈X miny∈Y u(x, y) ≤ miny∈Y maxx∈X u(x, y) So jetzt s∗ ∈ S NashGG. Also maxs1 ∈S1 u1 (s1 , s∗2 ) = u1 (s∗ ) = mins2 ∈S2 u1 (s∗1 , s2 ) ⇒mins2 ∈S2 maxs1 ∈S1 u1 (s1 , s2 ) ≤ maxs1 ∈S1 u1 (s1 , s∗2 ) = u(s∗ ) u(s∗ ) = mins2 ∈S2 u1 (s∗1 , s2 ≤ maxs1 ∈S1 mins2 ∈S2 u1 (s1 , s2 ) ⇒u1 (s∗ ) = mins2 maxs1 u1 (s1 , s2 ) = maxs1 mins2 u1 (s1 , s2 ) ⇒1 und 2 Vorsicht: 1-3 nicht richtig, wenn kein Nash-GG existiert Zusammenhang mit Optimierung: S1 = S2 endlcih mit Auszahlung u1 (si , sj ) = uij ; (uij ) = U 13 6 Extensive Spiele Spiele in extensiver Form, dynamische Spiele. Wie stellt man Spiele mit der Eigenschaft, dass Spieler mehrere Züge nacheinander oder gleichzeitig machen können vollkommene Information bedeutet, dass alle Spieler jeweils über alle vorangegangen Züge vollkommend informiert sind und Vollständige Information bedeutet, dass alle Spieler vollständig informiert sind über die möglichen Strategien jedes Spielers, über alle Auszahlungen, etc und ... 6.1 Beispiel (Kleiner Affe /großer Affe) Spiel: A, a Baum mit Frucht Wert 10E (Frucht) Energieaufwand für A: 2 E Energieaufwand für a: 0 E Strategien (AKtionen): K Klettern für A, W Warten für A analog: k Klattern für a, w Warten für a AUszahlungen: (K, k) 7→ (5, 3) (K, w) 7→ (4, 4) (W, k) 7→ (9, 1) (W, w) 7→ (0, 0) 6.1.1 Version A zieht zuerst: A wird W wählen und a wird k wählen müssen. ( w währe unglaubwürdige drohung) (BAUMSKIZZE) Normalform: k.k ∼ = a zieht k wenn A W zieht und k wenn A K wählt etc k.k k.w w.k w.w W (9,1) (9,1) (0,0) (w,w) Nash-GG (W,k.w) Auch (W;k.k), (K,w.w) K (5,39 (4,4) (5,3) (4,4) 6.1.2 a zieht zuerst (BAUMSKIZZE) → Normalform 6.1.3 Gleichzeitig k W (9,1) K (5,3) w (0,0) (4,4) 14 6.2 6 EXTENSIVE SPIELE Definition Ein Spiel in extensiver Form mit vollkommender Definition besteht aus • die Spielermenge M = {1, . . . N } • Der Menge H der Historien mit einer Zerlegung H = E ∪ Z, E ∩ Z = ∅ • Der Spielerfunktion P : E → M • Der Nutzenfunktion u : Z → RN mit der folgenden Eigenschaften für H ist eine Menge von Folgen. Jede Flge h ∈ H wird indiziert durch einen Abschnitt I ⊂ N, I = {1, . . . , n} ( N oder I = N (d.h. h = (ak )k∈I ) sodass 1. ∅ ∈ H 2. ∀h ∈ H, h = (ak )k∈I : L ⊂ I Unterabschnitt ⇒ (ak )k∈L ∈ H 3. ∀(ak )k∈N ∀I ⊂6= N Abschnitte (ak )k∈I ∈ H → (ak )k∈N ∈ H 4. E = {h ∈ H| ∃am+1 : (h, am+1 ∈ H} 5. Z = H \ E h ∈ Z heißt terminale Historie (Endhistorie) h ∈ E heißt Entscheidungshisotrie Spielverlauf: Ausgangshistorie ∅ ∈ H, OE: ∅ ∈ / Z (sonst triviales Spiel) D.h. ∅ ∈ E und i := P (∅) ∈ M (= i∅ = i1 ) (i ist am Zug) A∅ = {a1 |(a1 ) ∈ H} Aktionsmenge für für ∅P (∅) i = P (∅) zieht indem er ein Element a ∈ A∅ wählt und das Spiel bekommmt den Zustand h = (a) = h1 ∈ H .. . Ist das Spiel nach n Zügen im Zustand h4 ∈ H so geht es folgendermaßen weiter: hn ∈ Z : Das Spiel endet u(hn ) ist ergebnis hn ∈ / Z ⇒ hn ∈ E hn = (a1 , . . . an ) Ahn {a| (a1 , . . . an , a) ∈ H} der Spieler in+1 zieht indem er ein an+1 ∈ Ahn wählt Ergebnis hn+1 := (a1 , . . . an+1 ) ∈ H .... Entweder: ∃m : hm ∈ Z oder ∀m : hm ∈ /Z k Im letzten fall: h∞ = (a )k∈N ende des Spiels 6.3 Beispiel (Stackelberg-Duopol Beispiel Spieler A,a A zieht Zuerst, P (∅) = A, P (K) = P (W ) = a H = {∅, (K), (W ), (K, k), (K, w), (W, k), (W, w)} 6.3 Beispiel (Stackelberg-Duopol 2 Spieler {1, 2} homogenes Produkt P > 0 p(q) = P − q1 − q2 C > 0 ck (q) = c(q) = Cqk uk (q) = (P − C − q1 − q2 )qk H = {∅, (q1 ), (q1 , q2 )| q1 , q2 ∈ [0, P ]q1 + q2 ≤ P } Optimale Strategie: Was zieht Spieler 2(nachdem q̂1 ∈ [0, P ]) 2 wird (u2 (qˆ1 , q2 ) = (P − C − qˆ1 − q2 )q2 Maximieren ∂u2 = P − C − qˆ1 − 2q2 = 0 ⇒q2 = 12 (P − C − qˆ1 ) Max ∂qk Spieler 1 : Maximales Angebot (Naiv:) q1 = C Blä :D u1 maximieren unter voraussetung von q2 von oben: u1 (q1 , q2 (q1 )) = (P − C − q1 − 12 (P − C − q1 ))q1 = 12 (P − C)q1 − 12 q12 ⇒ q1 = 21 (P − C) ⇒ 41 (P − C) 15 16 7 7.1 7 SPIELBAUM ALS GRAPH Spielbaum als Graph Definition 1. Ein Graph besteht aus einer Menge K(von Knoten ) mit einer Menge A ⊂ {{p, q}|p, q ∈ K, p 6= q} (von Kanten ) 2. Ein Pfad im Graphen Γ = (K, A) ist eine Folge von Kanten der Form: ({qn , qn+1 })1≤n≤M oder ({qn , qn+1 )n∈N (Der erste Pfad verbindet dabei q1 mit qM +1 3. Γ ist zusammenhängen :⇔ je zwei Knoten miteinander verbunden werden können. 4. Ein Baum ist ein Graph Γ = (K, A) mit: (a) ∃ ausgezeichneten Knoten w ∈ K (Wurzel) (w ist nicht Endpunkt) (b) Je 2 verschiedene Knoten lassen sich genau einen injektiven Pfrad verbinden. (c) ∞ injektive Pfrade verbinden den Anfang mit einem Endpunkt. Dieser Endpunkt is keiner Kante enthalten. 5. Endknoten (Terminale Knoten) sind die Knoten mit Höchstens einer Kante 6. E = K \ Z Entscheidungsknoten Bemerkung Baum hat keine Schleifen 7.2 Vom Spielbaum zum Graphen Sei H Spielbaum wie in 6.2 KH := H w = ∅ AH := {{h, (h, a)} : h ∈ E, sodass (h, a) ∈ H} (KH , AH ) ist Baum 7.3 Vom Baum zum Spielbaum (K, A) : ZuH : w 7→ ∅ ∈ H zu q ∈ K existiert eindeutige Folge von Knoten w, q1 , . . . qn = q die w und q verbinden. q 7→ (q1 , . . . qn ) ∈ H Vereinigt mit den Unendlichen Pfaden erhällt man Ganz H Nochmal: H = {(q1 , . . . qn )| qk ∈ K und{wq1 }, . . . {qn−1 , qn } injektiver Pfad} ∪∅ ∪ {(q k )|e Endpunkt eines ∞ inj. Pfades in Γ({qk , qk+1 )k∈N , q0 = w} 7.4 Jedem Baum ist Spielbaum zugeordnet 7.4 17 Jedem Baum ist Spielbaum zugeordnet (K, A) H := ∅ ∪ {(a1 , . . . an ) : ai ∈ K und{ai , ai+1 ∈ A} ∪ ∪ {(ak )k∈N : ai ∈ K und {ai , ai+1 } ∈ A} Beispiel Extensives Spiel in 3 Stufen 1. H (Graph Γ) 2. M und P : E → M 3. u : Z → RN Einfachereres Modell eines zugeh. Graphen 0 Statt KH wähle KH := {h ∈ H : h endliche Folge } A wie zuvor 7.5 Beobachtung 0 0 (KH , A) ist Graph mit ausgezeichneten w ∈ KH (w = ∅) und (iv): 0 Für h, h0 ∈ KH existiert injektiver Pfad der h, h0 in (K, A) verbindet Und umgekert: Γ mit (i) und (iv) generiert H. 7.6 Nimm-Spiel Stoß von 4 Streichhölzern wird von 2 Spielern 1, 2 abwechselnd um einen oder 2 Hölzern verringert. Gewonnen hat der der das letze Streichholz nimmt. H = {∅, (1), (2), (1, 1), (1, 2), (2, 1), (2, 2), (1, 2, 1), (1, 2, 2), (2, 1, 1), (2, 1, 2), (1, 1, 1), (1, 1, 2), (2, 2, 1), (2, 1 1, P ((1)) = P ((2)) = 2 P (x, y) = 1 x, y ∈ {1, 2} P (x, y, z) = 2 1 Gewinnt bei : (1, 2, 2), (2, 1, 2), (2, 2, 1), (1, 1, 1, 1, 1) 2 Gewinnt bei: (1, 2, 1, 1), (1, 1, 2, 1), (2, 1, 1, 1), (1, 1, 1, 2) (Grafik : Baum) Oder Verkürzung: (Grafik: Baum ohne Äste ohne verknotung) 7.7 Verhandlungsspiel [0, 1] wird aufgeteilt durch wiederholte Angebote 1 > δ1 , δ2 > 0 nahe bei 1 Schritt 1: 1 beitet 1 − x, x ∈ [0, 1] 2 Wählt J (ja) Spielzuende → (x, 1 − x) oder N(nein) → nächster Schritt: 2. Schritt: 188 NASH-GLEICHGEWIHT UND NORMALFORM EINES EXTENSIVEN SPIELS 2 bietet y ∈ [0, 1] 1 wählt J ⇒(δ1 (y), δ2 (1 − y)) 1 wählt N ⇒Nächster Schritt: 3. Schritt: 1 bietet x ∈ [0, 1] 2 wählt J ⇒(δ12 (x), δ22 (1 − x)) 2 wählt N ⇒nächster schritt. ⇒Wenn immer N gewählt wird → (0, 0) H = {∅} ∪ {x1 , N, y 1 , . . . , N, xn ) : xi , y i ∈ [0, 1]} ∪ {x1 , N, y 1 , . . . , N, xn , N ) : xi , y i ∈ [0, 1]} ∪ {x1 , N, y 1 , . . . , N, y n ) : xi , y i ∈ [0, 1]} ∪ {x1 , N, y 1 , . . . , N, y n , N ) : xi , y i ∈ [0, 1]} ∪ {x1 , N, y 1 , . . . , N, xn , J) : xi , y i ∈ [0, 1]} ∪ {x1 , N, y 1 , . . . , N, y n , J) : xi , y i ∈ [0, 1]} ∪ {x1 , N, y n , . . . , ) : xi , y i ∈ [0, 1]} u(x1 , N, y 1 , . . . , xn , J) = (δ12n−2 (xn ), δ22n−2 (1 − xn )) u(x1 , . . . , y n , J) = (δ12n−1 (y n ), δ22n−1 (1 − y n )) 8 Nash-Gleichgewiht und Normalform eines extensiven Spiels Sei (M, H, P, u) Ah := {a|(h.a) ∈ H}, h ∈ E ⊂ H 8.1 Definition Eine Strategie sk eines Spielers k ∈ M ist eine Abbildung sk , die jedem h ∈ P −1 (k) −1 eine Aktion Ssk (h) ∈ Ah zuordnet. Ek := P (k) sk : Ek → {Ah : h ∈ Ek }, sk (h) ∈ Ak 8.2 Beispiel 1 Hat in ∅ die Aktionsmöglichkeiten a, d und in (a, b) die möglichkeitn e, f 2 hat in (a) : b,e 8.3 Definition 19 Definition Sk := {sk : sk Strategie für k} S = S1 × . . . × SN s ∈ S Strategieprofilkombination Jedes s ∈ S hat Spielergebnis zur Folge Genauer: a1 := sP (∅) (∅) h1 (s) := (a1 ) hn (s) = (a1 , . . . an ) ∈ E an+1 := sP (hn ) (hn ) ∈ Ahn hn+1 (s) = (a1 , . . . an , an+1 ) hn (s) ∈ Z : u(s) = u(hn (s)) ∀nhn (s) ∈ / Z : (ak )k∈N ∈ Zu(ak ) ∈ RN 8.3 Definition s∗ ∈ S Nash-GG ⇔ ∀k ∈ M ∀sk ∈ Sk : uk (s∗ ≥ uk (sk , s∗−k ) 8.4 u(s) := u(h(s)) liefert eine Nutzenfukntion u : S → RN Das Spiel (M, S, u) ist die Normalform von (M, H, P, u) s∗ ∈ S ist Nash-GG von (M, H, P, u) ⇔s∗ Nasg GG im Normalformenspiel 8.5 Bemerkung 1. ∀k ∈ M ∀s−k ∈ S−k ist sˆk beste Antowr auf s−k ⇔uk (sˆk , s−k ) = max{uk (sk , s−k |sk ∈ Sk } 2. s∗ Nash-GG ⇔∀k ∈ M : s∗k ist beste Antwort auf s∗−k 3. EXISTENZ: H endlich ⇒es gibt stets ein Nash-GG 8.6 Beispiel: Nim - 8.7 8.7.1 Zwei Affen Großer Affe ist zuerst dran. (k,k) (k,w) (w,k) (w,w) W (9,1) (9.1) (0,0) (0,0 K (5,3) (4,4) (5,3) (4,4) Darau ergben sich folgende Nash-GG (W, (k, w)), (W, (k, k)), (K, (w, w)) 20 9 DAS TEILSPIELPERFEKTE NASH-GLEICHGEWICHT 9 Das teilspielperfekte Nash-Gleichgewicht Γ = (M, H, p, u) extensives Spiel. Zu jedem h ∈ E ⊂ H hat man das Teilspiel Γ(h) mit H(h) = {h0 : (h, h0 ) ∈ H} E(h) = H(h) ∩ E Z(h) = H(h) e Z M (h) = P (E(h)) u(h) = u|Z(h) 9.1 Lemma Γ(h) = (M (h), H(h), P (h), u(h)) ist ein extensives Spiel das Teilspiel unterhalb von h. 9.2 Definition s∗ ∈ S heißt teilspielperfektes Nash-Gleichgewicht wenn die Restriktion von s∗ auf das Spiel Γ(h) für alle h ∈ E jeweils Nash -GG ist Bemerkung 1. h = ∅ ⇒ Γ(h) = Γ 2. h ∈ E und s ∈ S gilt es zu zeigen sk (h) restriktion auf Γ(h) zu definieren. sk (h)(h0 ) := sk (h, h0 )k ∈ M (k) 9.3 Bem. Beim Spiel der Affen gibt es ein teilspielperfektes Nash-GG 9.4 Spiel-Nimm Das heißt Aus sicht von 2 Bleiben nur Die Strategien ((2, x, y, 2), (1, 2, 2)) übrig Ebenfalls für Spieler eins dann: ((2, x, 2, 2), (1, 2, 2)) 9.5 Markteintritt-Spiel Ein konkurent (Spieler 1) eines Monopolist (Spieler 2) überlegt, ob er in den Markt eintreten soll. 1 hat die Wahl zwischen J (Ja) und N (Nein) im Fall N ist das Spiel vorbei und Auszahlen u(N ) = (0, 6) Im Fall J: Spieler 2 hat die Wahl zwischen A(aggressiv und K(kooperativ). In jedem fall ist das Spiel zuende. u(J, A) = (0, 0), u(j, K) = (3, 3) 9.6 Beispiel 21 A K N (0,6) (0,6) (J,K) ist Nash Gleichgewicht J (0,0) (3,3) (N,A) ist Nashgleichgeweicht Teilspielperfekt ist nur (J,K) Verallgemeinerung: Kaufhauskettenspiel Variante 2 hat in 20 Städten Monopol in allen tritt ein Konkurent ein oder nicht. 9.6 Beispiel Ultimatumspiel Spieler 1 bietet s1 ∈ {1, . . . 100} an Spieler 2 Spieler 2 hat dei Möglichkeit J (Ja) zu wählen dann, u(s1 , J) = (100 − s1 , s1 ) oder N (nein), dann u(s1 , N ) = (0, 0) H = {∅} ∪ {(s1 ) : s1 ∈ S1 } ∪ {(s1 , N ) : s1 ∈ S1 } ∪ {(s1 , J) : s1 ∈ S1 } E1 = {∅} E2 = {(s1 ) : s1 ∈ S1 } s∗1 (∅) = 1 s∗2 (t)t∈S1 = J s∗ (1, J) ist ein Nash-GG 1 = u2 (s∗ ) ≥ u2 (s∗1 , N ) = 0 99 = u1 (s∗ ) ≥ u1 (s1 , J) = 100 − s1 ∀s1 ∈ S1 ∗ Betrachte ( nun s1 (∅) = m, m ∈ S1 m > 1 Jawennt ≥ m s∗2 (t) = N einwennt < m ∗ m = u2 (s ) ≥ u2 (s∗1 , s2 ) = m ( 100 − t für t ≥ m 100 − m = u1 (s∗ ) ≥ u1 (t, s∗ ) = Betrachte die Teilbume in 0 für t < m denen Spieler 2 entscheidet. Dann ist Nash GG immer J Also nur das erste Beispiel ist teilspielperfekt 9.7 Zuweisungspiel 2 Identische mittelbare Güter, sollen auf 2 Spieler verteilt werden. Vorschläge von 1: 0,1,2 (bekommt 2. Spieler) 2. Spieler Zieht J oder N Es gibt 9 Nash-GG: s1 = 1, s2 = (N,J,J) Resultat: (s1 , N, J, J) Nash-GG ⇔s1 = 1 (s1 , J, J, J) Nash-GG ⇔s1 = 0 22 10 10 ELIMINATION DURCH DOMINANZ Elimination durch Dominanz Extensive Spiele. Ziel: Existenzsatz von Zermelo (1912) Bew durch Elimination (Rückwärsinduktion) Sei Γ = (M, H, P, u) extensives Spiel sei ĥ ∈ H gegebe mit ĥ ∈ E und ∀a ∈ Aĥ : (ĥ, a) ∈ Z Solch ĥ muss es nicht geben. ĥ existiert immer, wenn H endlich ist. 10.1 Definition Die Länge l(h) von h ∈ H, h = (a1 , . . . , an ), ist n = l(h). Im Falle h = (ak )k∈N ∈ H sei l(h) = ∞ 10.2 Lemma Sei Γ mit beschränkter länge, d.h. sup{l(h), h ∈ H} =: L < ∞ Dann gilt für h ∈ E mit l(h) = L − 1 h erfüllt: ∀a ∈ Ah : (h, a) ∈ Z Beweis: ∀a ∈ Ah , l(h, a) = L (h, a) ∈ Z sonst existiert b : (h, a, b) ∈ H mit l(h, a, b) = L + 1 ≤ L daher (h, a) ∈ Z Für solches ĥ ∈ E, ĥ 6= ∅ Setze: H 0 := H \ {(â, a) : a ∈ Aĥ h’ ist SPielbaum Sei ĥ ∈ Ek , k = P (ĥ), Im Falle Ek = {ĥ} Setze M 0 = M \ {k} Ansonsten M 0 = M, E 0 = E \ {h0 }, Z 0 = (Z \ {(ĥ, a) : a ∈ Ah }) ∪ {ĥ} (H 0 = E 0 ∪ Z 0 ) P 0 := P |E 0 : E 0 → M 0 u0 (h) := u(h)∀h ∈ Z 0 , h 6= ĥ u0 (ĥ) := u(ĥ, a) für eines der a ∈ Ah (a noch frei) 10.3 Behauptung Γ0 = (M 0 , H 0 , P 0 , u0 ) ist ex. Spiel (Γ = Γ0 (a) 10.4 Lemma(Elimination durch Dominanz) Sei ĥ ∈ H wie oben ∀a ∈ Aĥ : (h, a) ∈ Z Es sei außerdem a∗ ∈ Ah mit uk (ĥ, a∗ ) = max{uk (ĥ, a) : a ∈ Aĥ } Ferner sei S 0 teilspielpefekter Nash-GG von Γ0 = Γ0 (a∗ ) Dann ist durch: s∗i (h) := s0 (h) für h ∈ E 0 = e \ {ĥ} und i ∈ M s∗k (ĥ) := (ĥ, a∗ ) ein teilspielperfektes. Nash-GG gegenen. Ebenso für Nash GG 10.5 Satz von Zermelo und teilspielperfekte Nash-GG 23 Beweis: Zeige: Restriktion von s∗ auf Γ(h), h ∈ E ist stets Nash-GG 1. Fall ĥ kommt in Γ(h) nicht vor: h 6= ĥ und das Teilspiel Γ(h) wird durch Γ → Γ(h) nicht verändert. Also Γ(h) in Γ0 Teilbaum und Daher: s0 |Γ(h) = s∗ |Γ(h) Nash-GG auf Γ(h) 2. Fall ĥ = hΓ(ĥ) = ∅ ∪ {(a) : a ∈ Ah } 3. Fall ĥ kommt in Γ(h) vor. d.h. ĥ = (h, h0 ) = (a1 , . . . , an , an+1 , . . . , an+m ) | {z } | {z } h h0 OE: M = M’ Hilfsaussage: ∀i ∈ M : u0i (s0 ) = ui (s∗ ) 1. Fall Spielverlauf h(s0 ) ∈ Z 0 ⊂ H 0 1. Fall h(s0 ) 6= ĥ Spielverlauf in Γ0 | {z } ∈Z Daher h(s∗ ) = h(s0 ) u0 (s0 ) := h0 (h(s0 )), u0 (s∗ ) := u(h(s∗ )) h(s0 ) = h(s∗ ) ∈ Z 0 h(s0 ) = ĥ h(s∗ ) = s∗k (ĥ) = (ĥ, a∗ ) Also u0 (s0 ) = u0 (ĥ) = u(ĥ, a∗ ) = u(s∗ ) Zu zeigen: s∗ Nash-GG auf Γ(h) Wir haben: ∀i ∈ M ∀si ∈ Si0 : u0i (s0i , s0−i ) ≥ u0i (si , s0−i ) 1. Fall: h(s0i , s0−i ) 6= ĥ Dann h(si , s∗−i ) = h(si , s0i ) u0i (s0 ) ≥ u0i (si , s0−i ) = ui (si , s0−i ) uI (s∗ ) = u0i (s0 ) ≥ ui (si , s∗−i ) 2. Fall: h(si , s∗−i ) = ĥ = s∗k (ĥ) = (ĥ, a∗ ) Def u0i (si , s0i ) = u0i (ĥ) = u(ĥ, a∗ ) = u( si , s∗−i ) 1. wie oben 2. i=k: h(sk , s∗−k ) = ĥ uk (s∗ ) = uk (ĥ, a∗ ) ≥ uk ... 10.5 Satz von Zermelo und teilspielperfekte Nash-GG Jedes endliche extensive Spiel hat teilspielperfektes Nash-GG 24 11 UNENDLICHE STRATEGIEMENGEN 11 Unendliche Strategiemengen Erinnerung Normalforemnspiel(M, S, u) S = S1 × . . . × SN Jetzt auch Si unendliche Mengen IN der Regel: Si komakte metrische räume ui : S → R stetig Fragestellung: Gemischte Erweiterung? Mittelung über X(= Si ) ist ein Borel Maß mit: σ-Algebra der Borellmengen auf X τ (X) = {X : V ⊂ X&V offen } Topologei σ-Algebra γ ⊂ P(X) mit: • ∅ ∈ γ, X ∈ Γ • Y ⊂ X&Y ∈ γ : X \ Y ∈ γ • ∀Ak ∈ γ : S k ∈γ B Borelalgebra ist die kleinste σ-Algebra auf X welche B ⊃ τ (X) erfüllt Ein Maß auf (X, B) ist µ : B → R mit 1. µ(∅ = 0, µ ≥ 0 2. µ(A ∪ B = µ(A) + µ(B) für A, B ∈ BA ∩ B = ∅ S P 3. Für Ak ∈ B&Ak ∩ Am = ∅ : µ( Ak ) = µ(Ak ) W-maß: µ ist Maß & µ(X) = 1 0 ≤ µ(A) ≤ 1 Beispiel X = {x1 , . . . xM }&B =PP(X) µ(xj ) := pj µ(A) = xj ∈A pj P Also Maß ist p1 , . . . pi ≥ 0& pi = 1 11.1 Definition 11.1 25 Definition Jedes W-Maß µ auf Si heißt gemischte Strategie ∆Si ist Menge der Gemischten Strategien, d.h. Menge der W-maße µ definiert R linearesRFunktional Iµ : C(X, R) → R Iµ (f ) = X f dµ = X f (x)dµ(x) Iµ ist stetig, d.h. |Iµ (f )| ≤ kf k∞ := sup{|f (x)| : x ∈ X} C(X, R) mit der Norm k · k∞ ist Banachraum Auf ∆X(X = Si ) hat man die schwache Topologie Eine Folge (µk )k∈N konvergiert gegen µ :⇔∀f ∈ C(X, R)Iµk (f ) → Iµ (f ) ∆X ist kompakt und metrisierbar ∆X ⊂ C(X, R)∗ Für σ ∈ ∆S = ∆S1 × . . . ∆SN (gemischte Strategienkomb σ = (σ1R, . . .R, σN ) Rσi Wmaß auf ∆Si u(σ) = S1 S2 . . . SN u(s1 , . . . , sN )dσ1 (s1 ) . . . dσN (sN ) 11.2 Definition (M, ∆S, u) ist die gemischte Erweiterung von (M, S, u) und ist Spiel in Normalform. 11.3 Definition σ ∗ ∈ ∆S ist Nash-GG in gemischten Strategien ( von Γ) :⇔σ ∗ Nash GG in ∆Γ ∗ ⇔∀k ∈ M ∀σk ∈ ∆Sk : uk (σ ∗ ) ≥ uk (σk , σ−k ) ∗ ∗ ⇔∀k ∈ M ∀sk ∈ Sk : uk (σ ) ≥ uk (sk , σ−k ) Ziel des Abschitts: Nash-GG existiert in gemischten Strategien. 11.4 Definition σ ∗ ∈ ∆S heißt ε-GG zu ε > 0 :⇔ ∗ ∀k ∈ M ∀σk ∈ ∆Sk : uk (σ ∗ ) ≥ uk (σk , σ−k )−ε 11.5 Satz Sei û : S → RN stetig mit ku − ûk∞ < α, α > 0 Sei σ ∗ ∈ ∆S sei ε-GG von Γ. Dann ist σ ∗ ε0 -GG von Γ = (M, S, û) mit ε0 = ε + 2α ∗ Beweis: Zu zeigen: ∀k ∈ M ∀sk ∈ Sk : ûk (sk , σ−k ) − ûk (σ ∗ ) ≤ ε0 ∗ ∗ ∗ ûk (sk , σ−k ) − ûk (σ ∗ ) = ûk (sk , s∗−k ) − uk (σk , δ−k ) + uk (sk , σ−k ) − uk (σ ∗ ) + uk (σ ∗ ) − ∗ ûk (σ ) < α + ε + α R R R Dabei : |uk (σ ∗ ) R− ûk (σ ∗ )| = | S uk (s)dσ(s) − S ĥk (s)dσ(s)| = | S (uk (s) − ûk (s))dσ(s)| ≤ S kuk − ûk k∞ dσ(s) = kuk − ûk k∞ > α 26 11 UNENDLICHE STRATEGIEMENGEN 11.6 Satz Seien σ (n) ∈ ∆S und εn > 0 mit 1. σ (n) ist ε-GG (bzg Γ = (M, S, u)) 2. σ (n) → σ in δS 3. εn → ε ≥ 0 Dann ist σ ist ε-GG Insbesondere: ε = 0 ⇒ σ Nash -GG 11.7 Definition Γ = (M, S, u) heißt im wesentlichen endlich :⇔Es gibt endliche Spiel Γ̂ = (M, Ŝ, û) und dazu eine messbare Abbildung ϕ : S → Ŝ mit u = û ◦ ϕ (f : S → R messbar :⇔∀ offene Mengen W ⊂ R : f −1 (W ) ∈ B(S)) ϕ : S → E (E endlich.) messbar :⇔ ϕ−1 (e) ∈ B(S), e ∈ E) OE: σ(S) = Ŝ und Ŝ ⊂ S Nehme zu ŝ ∈ Ŝ ein ŝ0 ∈ σ −1 (ŝ) d.h. ϕ(ŝ0 ) = ŝ Setze ŝ0 = {ŝ0 : ŝ ∈ Ŝ} ϕ̂0 (s) := ŝ0 für s ∈ ϕ−1 (ŝ) 11.8 Lemma Ein im wesentlichen endloses Spiel hat ein Nash-GG in gemischten Strategien. Beweis: Ŝ ⊂ S endlich Ŝ = Ŝ1 × . . . ŜN und ϕ : S → Ŝ mit ∀s ∈ ϕ(ŝ) : u(s) = u(ŝ) = û(ŝ) u|ϕ−1 (s) = const.= u(ŝ) = û(ŝ) Satz von Nash: Es gibt s∗ ∈ ∆Ŝ Nash-GG d.h. ∀k ∈ M ∀ŝk ∈ Ŝk : uk (s∗ ) ≥ uk (ŝk , s∗−k ) s∗ = P (s∗1 , . . . , s∗N ) P j s∗ = m qj = 1 und sj ∈ Ŝ j=1 qj s P (k) σk∗ (A) := s(i) ∈A qj A ∈ B(Sk ) k ∗ Klar: σk ist W-Maß ∗ Behauptung: σ ∗ = (σ1∗ , . . . σN ) ist Nash-GG bzgl. ∆Γ PN Pmr (1) (N ) (j ) ∗ ∀k ∈ M ∀sk ∈ Sk : uk (σ ) = j=1 jr =1 qj1 . . . qjN uk (ŝ1 1 , . . . , ŝjNN ) = ûk (s∗ ) ∀s : ûk (s∗ ) ≥ ûk (sjk , s∗−k ) 11.9 Lemma ∀k ∈ M ∀ŝjk ∀j = 1, . . . , mk : 27 Z =uk (σ ∗ ) 11.9 Z uK (s dσ ≥ uk (ŝjk , s∗−k )dσ | S {z } |S {z } ∗ ∗ ) =uk (sk σ−k Lemma zu jedem α > 0 existiert ein Wesentlich endlich. Spiel Γ0 = (M, S, u0 ), S 0 ⊂ S mit ku − u0 k < α 11.10 Satz Jedes Spiel Γ = (M, S, u) S kompakt und metrisch, u stetig, hat Nash-GG in gemischten Strategien Beweis: Zu u > 0 existiert nach 11.9 ein Wesentlich endlichen Spiel Γ(n) = (M, S, u(n) ) mit ku − u(n) k < n1 Γ(n) hat Nash-GG σ (n) in gemsichten Strategien ⇔ 0-GG ⇒σ (n) ist (0 + 2 n1 )-GG nach Lemma 11.5 (σ (n) ) Folge in ∆S = ∆S1 × . . . × ∆SN ∃ Teilfolge σ (nj ) mit σ (nj ) → σ = (σ1 , . . . , σN ) ∈ ∆S Nach 11.6 σ (nj ) → σ und εnj = n2j → 0 ⇒σ ist 0 − GG d.h. Nash-GG α >S0∀s ∈ S : V (s) := {t ∈ S : ku(s) − u(t)k∞ < α} offen ⇒ s∈S V (s) offene Überdeckung ∃E S ⊂ S endlich: s∈E V (s) = S O.E: E = Ŝ1 × . . . × ŜN Ersetze V (ŝ) durch A(ŝ) ∈ B mit A(ŝ) ∪ A(t̂) = ∅