Grundlagen und Nash–Gleichgewichte in reinen Strategien Yves Breitmoser, EUV Frankfurt (Oder) Zahlen und Vektoren IR ist die Menge der reellen Zahlen IR+ = {r ∈ IR | r ≥ 0} IRn ist die Menge aller Vektoren von n reellen Zahlen x ∈ IRn ⇒ Zähler: ∀ x = (x1 , . . . , xn ) = (xi )1≤i≤n = (xi )i = (xi ) ... für alle ∃ ... es existiert IRn+ = {x ∈ IRn | ∀i : xi ≥ 0} Intervalle (a, b) = {r ∈ IR | a < r < b} [a, b] = {r ∈ IR | a ≤ r ≤ b} [a, b) = {r ∈ IR | a ≤ r < b} (a, b] = {r ∈ IR | a < r ≤ b} 1 Vektorrelationen ∀x, y ∈ IRn x =y x ≥y x >y x y IRn+ ⇔ ∀i : xi = yi ⇔ ∀i : xi ≥ yi ⇔ ⇔ ⇔ ∀i : xi ≥ yi x ≥ y , x 6= y und ∃i : xi > yi ∀i : xi > yi n o n ~ = x ∈ IR | x ≥ 0 2 Profile und Listen B sei die Menge der Spieler Eine Sammlung von Werten irgendeiner Variablen heißt Profil, wenn die Sammlung je einen Wert pro Spieler enthält, bspw.: Auszahlungsprofil, Strategieprofil Profile haben bei uns große Buchstaben, bspw. X X = (Xb )b∈B = (Xb )b = (Xb ) X−b ist die Liste aller Elemente des Profils X außer Xb X−b = (Xc )c∈B\{b} = (Xc )c6=b X = (X−b , Xb ) = (Xb , X−b ) 3 Mengen von Profilen, Listen und Werten Vb sei eine Variable die einen Wert für Spieler b enthält Vb ist die Menge aller Werte der Variablen Vb V = × V b = ×V b b∈B V −b = ist die Menge aller Profile bzgl. V b × Vc = c∈B\{b} ×V c ist eine Menge von Listen c6=b Sei V b die Anzahl der Elemente in V b Y V = V 1 ∗ · · · ∗ V n = V b b∈B 4 Pareto Dominanz und Effizienz Seien X , Y zwei Auszahlungsprofile X , Y ∈ IRB X schwach Pareto–dominiert Y X Pareto–dominiert Y ⇔ ⇔ X >Y X Y Sei X die Menge aller Auszahlungsprofile X ist Pareto effizient in X X ist nicht Pareto effizient in X ⇔ ⇔ ∀X 0 ∈ X : X 0 ≯ X ∃X 0 ∈ X : X 0 > X Pareto Effizienz: niemand kann besser gestellt werden, ohne einen anderen Spieler schlechter zu stellen 5 Statische Spiele Modell alle Spieler treffen sich genau einmal sie bestimmen ihre Strategien getrennt voneinander und gleichzeitig auch: strategische Spiele oder Spiele in Normalform–Darstellung Die Normalform ist geeignet als Darstellung einer Interaktion wenn es keine sequentiellen Aspekte in dieser Interaktion gibt wenn alle Spieler vollständig informiert sind wenn die Spieler Konsequenzen für zukünftige Interaktionen ignorieren 6 Komponenten eines statischen Spieles (bei vollst. Information) eine endliche Menge Spieler für jeden b ∈ B eine nicht–leere Menge Strategien (Aktionen) B = {B1 , . . . , Bn } ∀b : S b 6= ∅ eine Auszahlungsfunktion (Nutzen aus bzw. bewertete Konsequenzen der Aktionen), die jedem Strategieprofil ein Auszahlungsprofil zuordnet P̂ : S → IRB ein statisches Spiel ist damit definiert durch ein Tripel B, S, P̂ 7 Tabellarische Darstellung von statischen Spielen mit zwei Akteuren und je zwei Strategien B = {1, 2}, S 1 = {L, R}, S 2 = {O, U}, PSb1 ,S2 := P̂b (S1 , S2 ) O U L 1 ,P 2 PLO LO 1 , P2 PLU LU R 1 , P2 PRO RO 1 , P2 PRU RU Spieler 1 wählt die Zeilen, Spieler 2 wählt die Spalten. 8 Nash–Gleichgewicht Angenommen, es gibt ein Strategieprofil von dem alle Spieler zuverlässig erwarten können, daß es gespielt wird Welche Eigenschaften muß es erfüllen? kein Spieler darf Anreize haben zu einer einseitigen Abweichung haben Profile, von denen niemand abweichen würde, heißen Gleichgewichte Nash bewies: in jedem Spiel gibt es mindestens ein Gleichgewicht (in gemischten Strategien) das Konzept von Gleichgewichten ist nutzbar als Grundlage der Analyse strategischer Interaktionen 9 Definition Nash–Gleichgewicht Verbal I: Jedes Strategieprofil, wo keiner einseitig abweichen möchte n o 0 0 N = S ∈ S | ∀b,∀Sb ∈ S b : P̂b (S) ≥ P̂b (Sb , S−b ) Verbal II: Jedes Strategieprofil, wo die Spieler gegenseitig beste Antworten spielen n o c N = S ∈ S | ∀b : Sb ∈ BAb (S−b ) wobei Sb eine beste Antwort auf S−b ist, wenn es keine Strategie für b gibt, die eine höhere Auszahlung gegen S−b ermöglicht n o 0 0 c BAb (S−b ) = Sb ∈ S b | ∀Sb ∈ S b : P̂b (Sb , S−b ) ≥ P̂b (Sb , S−b ) = arg max P̂b Sb0 , S−b ⊆ S b Sb0 ∈S b 10 Gefangenendilemma Zwei Gefangene. Der Staatsanwalt kann ihnen nur kleine Vergehen nachweisen, sie haben aber ein Verbrechen begangen. Er versucht nun, Geständnisse zu erhalten, und macht ihnen das folgende Angebot (in “Freiheitsjahren”). Was kann passieren? Geständnis kein Geständnis Geständnis kein Geständnis −3 , −3 0 , −4 −4 , 0 −1 , −1 Das einzige Nash–Gleichgewicht: beide gestehen (G , G ) D.h.: (G , G ) ist das einzige Strategieprofil, das sich auch noch ergeben würde, wenn beide Spieler wüßten, daß ihr Gegner seinen Teil beiträgt. 11 Kampf der Geschlechter Zwei Menschen mit unterschiedlichem Geschmack wollen zusammen ausgehen. Spieler 1 zieht das Klavierkonzert (K ) vor, Spieler 2 dagegen das Orgelkonzert (O). In jedem Fall finden sie es aber besser zusammen auszugehen als getrennt. Was passiert? Klavier Orgel Klavier 2,1 0, 0 Orgel 0, 0 1,2 Es gibt hier zwei Strategieprofile (in reinen Strategien), die wechselseitig beste Antworten bieten. Das Konzept des Nash–Gleichgewichts führt also nicht immer zu einer eindeutigen Lösung. 12 Matching Pennies Zwei Spieler, jeder wählt entweder Kopf oder Zahl. Bei gleichen Entscheidungen zahlt Spieler 2 einen Euro an Spieler 1, ansonsten zahlt Spieler 1 einen Euro an Spieler 2. Was passiert? Kopf Zahl Kopf 1,−1 −1,1 Zahl −1,1 1,−1 Es gibt hier kein Strategieprofil (in reinen Strategien), das wechselseitig beste Antworten bietet. Die Beschränkung auf reine Strategien ist also nicht immer adäquat. 13