Spiele in Normalform Vorlesung: Nicht-kooperative Spieltheorie Teil 2: Spiele in Normalform Dr. Thomas Krieger Wintertrimester 2009 und Dr. Thomas Krieger Vorlesung: Nicht-kooperative Spieltheorie 1 Spiele in Normalform Inhaltliche Motivation Es gibt Konfliktsituationen, in denen die Spieler ihre Strategien unabhängig voneinander („simultan“) wählen, z.B. bei der Frage, wieviel eine Firma produzieren soll, oder welche Fahrtroute auszuwählen ist. Die Spieler können ihre Strategienwahl zu verschiedenen Zeitpunkten vornehmen. Wichtig ist, dass sie zum Zeitpunkt ihrer eigenen Wahl die Strategienwahl der übrigen Spieler nicht kennen (anderfalls muss die Konfliktsituation mittels extensiven Spielen modelliert werden). und Dr. Thomas Krieger Vorlesung: Nicht-kooperative Spieltheorie 2 Spiele in Normalform Definition Normalformspiel Definition 9 Ein Spiel in Normalform G = (N, (S1 , . . . , Sn ), (u1 , . . . , un )) besteht aus einer nichtleeren Menge N = { 1, 2, . . . , n } von Spielern, einer nichtleeren Menge Si von Strategien für jeden Spieler i ∈ N und einer Auszahlungsfunktion ui : ×i∈N Si → R für jeden Spieler i ∈ N. und Dr. Thomas Krieger Vorlesung: Nicht-kooperative Spieltheorie 3 Spiele in Normalform Bemerkungen zur Definition S = S1 × S2 × . . . Sn ist die Menge der (zulässigen) Strategienkombinationen (s1 , . . . , sn ). si ∈ Si heisst auch reine Strategie für Spieler i (im Gegensatz zu gemischten Strategien, siehe später). ui (s) gibt die Auszahlung an Spieler i bei der Wahl der Strategienkombination s = (s1 , . . . , sn ) an. s = (s1 , . . . , sn ) wird im Folgenden oft zerlegt in si - Strategie von Spieler i, s−i := (s1 , . . . , si−1 , si+1 , . . . , sn ) - Strategien aller übrigen Spieler ausser i. Bearbeiten Sie Aufgabe 1-4 des Übungsblattes 2. und Dr. Thomas Krieger Vorlesung: Nicht-kooperative Spieltheorie 4 Spiele in Normalform Das Nash-Gleichgewicht Definition 10 Es sei G = (N, (S1 , . . . , Sn ), (u1 , . . . , un )) ein Spiel in Normalform. Eine Strategienkombination (s1∗ , . . . , sn∗ ) ∈ S heisst Nash-Gleichgewicht von G, wenn für alle i ∈ N und alle si ∈ Si gilt: ∗ ∗ ui (si , s−i ) ≤ ui (si∗ , s−i ). In Worten: kein Spieler i kann durch einseitiges Abweichen von si∗ seine Auszahlung verbessern. Die Komponente si∗ eines Gleichgewichtspunktes (s1∗ , . . . , sn∗ ) heisst Gleichgewichtsstrategie des Spielers i. Bemerkung: Die obige Ungleichung muss entsprechend angepasst werden, wenn Spieler ihre Auszahlung minimieren wollen. und Dr. Thomas Krieger Vorlesung: Nicht-kooperative Spieltheorie 5 Spiele in Normalform Axiomatische Charakterisierung von Nash-Gleichgewichten (1) Axiome e ∈S Optimalität (O): Auf seine Erwartung s−i −i über das Verhalten seiner Mitspieler reagiert Spieler i (i = 1, . . . , n) optimal, d.h., er wählt ein si∗ ∈ Si mit e e ui (si , s−i ) ≤ ui (si∗ , s−i ) für alle si ∈ Si . Rationale Erwartung (RE): Für alle Spieler i (i = 1, . . . , n) seien die Erwartungen rational, d.h., wenn s ∗ = (s1∗ , . . . , sn∗ ) ∈ S gespielt wird, erwartet jeder Spieler i die e = s∗ . Konstellation s−i −i und Dr. Thomas Krieger Vorlesung: Nicht-kooperative Spieltheorie 6 Spiele in Normalform Axiomatische Charakterisierung von Nash-Gleichgewichten (2) Es sei G ein Normalformspiel. Ein Lösungskonzept L wählt aus dem Strategienraum S eine Teilmenge von Strategienkombinationen aus: L(G) ⊆ S. Lemma 11 Ist s ∗ ein Nash-Gleichgewicht eines Normalformspiels G und gilt Eigenschaften (RE), dann gilt auch (O). Jedes Element einer Lösungsmenge L(G), das die Bedingungen (O) und (RE) erfüllt, ist ein Nash-Gleichgewicht. =⇒ Beweis siehe Tafel. Bearbeiten Sie Aufgabe 1 und 2 des Übungsblattes 3. und Dr. Thomas Krieger Vorlesung: Nicht-kooperative Spieltheorie 7 Spiele in Normalform Der Satz von Nikaido-Isoda (1955) Theorem 12 (Nikaido-Isoda, 1955) Es sei G = (N, (S1 , . . . , Sn ), (u1 , . . . , un )) ein Spiel in Normalform, welches die folgenden Bedingungen erfüllt: Si ist eine kompakte und konvexe Teilmenge eines Rni , 1 ≤ i ≤ n. ui : S1 × S2 × . . . × Sn −→ R1 ist stetig, 1 ≤ i ≤ n. Für jedes i ∈ {1, . . . , n} und fest gewählte Strategien sj ∈ Sj , j ∈ {1, . . . , n} \ {i}, ist ui (s1 , . . . , si−1 , ., si+1 , . . . , sn ) : Si −→ R1 konkav. Dann besitzt G mindestens ein Nash-Gleichgewicht. =⇒ Beweis siehe extra Foliensatz. und Dr. Thomas Krieger Vorlesung: Nicht-kooperative Spieltheorie 8 Spiele in Normalform Folgerungen und Bezeichnungen Wir haben anhand der Beispiele gesehen: Normalformspiele mit überabzählbar vielen reinen Strategien können Nash-Gleichgewichte besitzen (Cournot-Duopol- und Oligopol, Satz von Nikaido-Isoda). Normalformspiele mit endlich vielen reinen Strategien, also |Si | < ∞ für alle i ∈ N, können aber müssen keine Nash-Gleichgewichte in reinen Strategien besitzten. Wir betrachten von nun an nur noch Normalformspiele mit endlichen vielen reinen Strategien. und Dr. Thomas Krieger Vorlesung: Nicht-kooperative Spieltheorie 9 Spiele in Normalform Gemischte Strategien (1) Definition 13 Es sei G = (N, (S1 , . . . , Sn ), (u1 , . . . , un )) ein endliches Normalformspiel. Eine gemischte Strategie qi des Spielers i ∈ N ist eine Wahrscheinlichkeitsverteilung über der Menge der reinen Strategien Si des Spielers i. qi ordnet jedem si ∈ Si eine Wahrscheinlichkeit qi (si ) zu: qi : Si si −→ [0, 1] −→ qi (si ) mit X qi (si ) = 1 . si ∈Si und Dr. Thomas Krieger Vorlesung: Nicht-kooperative Spieltheorie 10 Spiele in Normalform Gemischte Strategien (2) Qi sei die Menge der gemischten Strategien von Spieler i und Q = Q1 × . . . × Qn die Menge aller gemischten Strategienkombinationen. =⇒ Graphische Darstellung für |Si | = 2, 3. Die reine Strategienkombination s = (s1 , . . . , sn ) wird mit der Wahrscheinlichkeit (wegen der unabhängigen Wahl der einzelnen gemischten Strategien) q(s) = n Y qi (si ) . i=1 und Dr. Thomas Krieger Vorlesung: Nicht-kooperative Spieltheorie 11 Spiele in Normalform Erwartete Auszahlung Definition 14 Es sei G = (N, (S1 , . . . , Sn ), (u1 , . . . , un )) ein endliches Normalformspiel. Die erwartete Auszahlung an Spieler i ∈ N wenn q = (q1 , . . . , qn ) ∈ Q gespielt wird ist definiert durch Ui (q) := X q(s) · ui (s) = s∈S n XY qi (si ) · ui (s) . s∈S i=1 e = (N, (Q1 , . . . , Qn ), (U1 , . . . , Un )) heisst die gemischte G Erweiterung von G. e ist nun ein Normalformspiel mit überabzählbaren Bemerkung: G Strategienmengen. und Dr. Thomas Krieger Vorlesung: Nicht-kooperative Spieltheorie 12 2 Spiele in Normalform 7 4 Beispiel Gegeben sei folgendes Normalformspiel (linke (Bi-)Matrix): L M 2 T 7 7 2 7 B 2 R 3 2 7 L M R T 1 18 0 5 18 B 2 18 0 10 18 6 5 4 Wird q = (q1 , q2 ) mit q1 = (1/3, 2/3) und q2 = (1/6, 0, 5/6) gespielt, so ist die erwartete Auszahlung an Spieler i: status quo status quo rüsten rüsten status 1 5 2 10 quo U1 (q) 0 = ·b27−+a2 ·3+ ·2+ ·4= 18 18 18 18 0 0 −b 11 5 status quo 2 10 U2 (q) −b= · 2−a+ ·6+ ·7+ ·5= 0 2 1 18 18 18 18 b 1 − a1 −a2 Dr. Thomas Krieger rüsten 66 rüsten2 =3 18 b − 3a 2 2 96 1 −b1= 5 . 18 3 −b2 Vorlesung: Nicht-kooperative Spieltheorie b 1 − a1 −a2 −a1 und 13 Spiele in Normalform Der Satz von Nash Wiederholung Nash-Gleichgewicht: Eine Kombination gemischter e Strategien q ∗ = (q1∗ , . . . , qn∗ ) ∈ Q ist ein Nash-Gleichgewicht von G genau dann, wenn für alle i ∈ N gilt: ∗ ∗ Ui (qi , q−i ) ≤ Ui (qi∗ , q−i ) für alle qi ∈ Qi . Theorem 15 (Nash, 1951) Es sei G = (N, (S1 , . . . , Sn ), (u1 , . . . , un )) ein endliches e = (N, (Q1 , . . . , Qn ), (U1 , . . . , Un )) seine Normalformspiel und G gemischte Erweiterung. e mindestens ein Nash-Gleichgewicht. Dann besitzt G =⇒ Beweis mittels des Satzes von Nikaido-Isoda. Ein weiterer Existenzsatz zu sogenannten teilspielperfekten Gleichgewichten wird später behandelt. und Dr. Thomas Krieger Vorlesung: Nicht-kooperative Spieltheorie 14 Spiele in Normalform Mexikanisches Gaunerspiel - Gegenbeispiel (1) Lemma 16 Es gibt Normalformspiele G mit abzählbar-unendlichen e besitzen. Strategienmengen, die kein Nash-Gleichgewicht in G Beispiel (Mexikanisches Gaunerspiel): Es sei n = 2 und S1 = S2 = N. Die Auszahlungen seien wiefolgt definiert: for i > j 1 0 for i = j . u1 (i, j) = − u2 (i, j) = −1 for i < j e von Behauptung: Die gemischte Erweiterung G G = ({1, 2}, (S1 , S2 ), (u1 , u2 )) besitzt weder ein Nash-Gleichgewicht in reinen noch in gemischten Strategien. und Dr. Thomas Krieger Vorlesung: Nicht-kooperative Spieltheorie 15 Spiele in Normalform Mexikanisches Gaunerspiel - Gegenbeispiel (2) e besitzt kein Nash-Gleichgewicht in reinen Strategien, da G sich immer ein Spieler durch abweichen verbessern kann. Es sei ∞ X ∞ Q1 = { q1 = (x1 , x2 , . . .) ∈ [0, 1] : xi = 1 } und i=1 Q2 = { q2 = (y1 , y2 , . . .) ∈ [0, 1]∞ : ∞ X yi = 1 } . j=1 Die erwartete Auszahlung ist definiert durch ∞ X ∞ ∞ X ∞ X X U1 (q1 , q2 ) = ai,j · xi · yj = ai,j · xi · yj i=1 j=1 j=1 i=1 = − U2 (q1 , q2 ) . Die Vertauschbarkeit der Reihen – und damit überhaupt erst die sinnvolle e – ist durch den Cauchy’schen Doppelreihensatz gewährleistet. Definition von G Dr. Thomas Krieger Vorlesung: Nicht-kooperative Spieltheorie und 16 Spiele in Normalform Mexikanisches Gaunerspiel - Gegenbeispiel (3) e Angenommen (q1∗ , q2∗ ) ∈ Q sei ein Nash-Gleichgewicht von G. Dann exitsiert nach dem Cauchy-Kriterium zu jedem > 0 ein n0 = n0 () mit ∞ ∞ ˛X ˛ X ˛ ˛ xi∗ ˛ = xi∗ < ˛ 2 i=n i=n für alle n ≥ n0 . Damit folgt n0 −1 U2 (q1∗ , n0 ) = X i=1 xi∗ − ∞ X xi∗ = 1 − ∞ X xi∗ − i=n0 i=n0 +1 ∞ X xi∗ > 1 − . i=n0 +1 Analog folgt mit einem m0 = m0 (): U1 (m0 , q2∗ ) > 1 − . Da U1 (q1 , q2 ) = − U2 (q1 , q2 ) für alle (q1 , q2 ) ∈ Q gilt, folgt −U1 (q1∗ , q2∗ ) = U2 (q1∗ , q2∗ ) ≥ U2 (q1∗ , n0 ) > 1 − , also U1 (q1∗ , q2∗ ) < − (1 − ) , und andererseits U1 (q1∗ , q2∗ ) ≥ U1 (m0 , q2∗ ) > 1 − . Zusammen folgt also 1 − < U1 (q1∗ , q2∗ ) < − (1 − ) −→ Widerspruch! und Dr. Thomas Krieger Vorlesung: Nicht-kooperative Spieltheorie 17 Spiele in Normalform Bemerkungen: Der Satz von Nash ist ein Existenzsatz und liefert kein Verfahren zur Berechnung von Nash-Gleichgewichten. Nashs (informelle) Bemerkung zur Berechnung von Nash-Gleichgewichten: „The complexity of the mathematical work needed for a complete investigation increases rather rapidly, however, with increasing complexity of the game; so that analysis of a game much more complex than the examples given here might only be feasible using approximate computational methods.“ (Nash, 1951) und Dr. Thomas Krieger Vorlesung: Nicht-kooperative Spieltheorie 18 Spiele in Normalform Test auf Nash-Gleichgewicht Lemma 17 Es sei G = (N, (S1 , . . . , Sn ), (u1 , . . . , un )) ein endliches e = (N, (Q1 , . . . , Qn ), (U1 , . . . , Un )) seine Normalformspiel und G gemischte Erweiterung. e genau dann, (q1∗ , . . . , qn∗ ) ∈ Q ist ein Nash-Gleichgewicht von G ∗ ∗ ∗ wenn Ui (si , q−i ) ≤ Ui (qi , q−i ) für alle si ∈ Si . Beweis: „=⇒“: ist klar, da jede reine Strategie si ∈ Si mit jener gemischten Strategie qi ∈ Qi identifiziert werden kann, für die gilt: qi (si ) = 1. „⇐=“: Es sei i ∈ N und qi ∈ Qi beliebig. Dann folgt nach Multiplikation der obigen Ungleichung mit qi (si )(≥ 0) und Summation Def . ∗ Ui (qi , q−i ) = X ∗ qi (si ) · Ui (si , q−i )≤ si ∈Si X ∗ ∗ qi (si ) · Ui (qi∗ , q−i ) = Ui (qi∗ , q−i ), si ∈Si e also ist (q1∗ , . . . , qn∗ ) ein Nash-Gleichgewicht von G. Bearbeiten Sie Aufgabe 1 des Übungsblattes 4. Dr. Thomas Krieger Vorlesung: Nicht-kooperative Spieltheorie und 19 Spiele in Normalform Beste Antworten Es sei q−i eine Kombination gemischter Strategien ausser für Spieler i. Eine Strategie qi ∈ Qi heißt eine beste Antwort auf q−i für Spieler i, falls gilt Ui (qi , q−i ) = max Ui (e qi , q−i ) . e qi ∈Qi Diese Größe existiert stets, da Qi eine kompakte Menge und Ui (e qi , q−i ) eine stetige Funktion (insbesondere) auf Qi ist. Eine reine Strategie si ∈ Si heißt eine beste Antwort auf q−i in reinen Strategien für Spieler i, falls gilt Ui (si , q−i ) = max Ui (e si , q−i ) . e si ∈Si e genau dann, (q1∗ , . . . , qn∗ ) ∈ Q ist ein Nash-Gleichgewicht in G ∗ ∗ wenn qi beste Antwort auf q−i für alle i ∈ N ist (wechselseitig beste Antworten). Dr. Thomas Krieger Vorlesung: Nicht-kooperative Spieltheorie und 20 Spiele in Normalform Antwortsatz Lemma 18 Es sei G = (N, (S1 , . . . , Sn ), (u1 , . . . , un )) ein endliches e = (N, (Q1 , . . . , Qn ), (U1 , . . . , Un )) seine Normalformspiel und G gemischte Erweiterung. Ferner sei q−i eine Kombination gemischter Strategien außer für Spieler i, 1 ≤ i ≤ n, und qi ∈ Qi . Dann gilt (a) Ui∗ := maxqi ∈Qi Ui (qi , q−i ) = maxsi ∈Si Ui (si , q−i ) und die folgenden Aussagen sind äquivalent: (b) qi ist unter den gemischten Strategien beste Antwort auf q−i mit Auszahlung Ui∗ = Ui (qi , q−i ); (c) Für alle si ∈ Si mit qi (si ) > 0 ist si unter den reinen Strategien beste Antwort auf q−i , mit Ui (si , q−i ) = Ui∗ . Der Antwortsatz hat eine große Bedeutung bei der Bestimmung von Nash-Gleichgewichten. Dr. Thomas Krieger Vorlesung: Nicht-kooperative Spieltheorie und 21 Spiele in Normalform Antwortsatz - Beweis (1) Wegen der Endlichkeit von Si existiert ein si∗ ∈ Si mit Ui (si∗ , q−i ) = max Ui (si , q−i ) . si ∈Si Dann gilt zunächst Def . Ui (si∗ , q−i ) ≤ max Ui (qi , q−i ) = Ui∗ qi ∈Qi und weiter ist Def . Ui∗ = max Ui (qi , q−i ) qi ∈Qi Def . = ≤ = max qi ∈Qi max qi ∈Qi 8 <X : si ∈Si 8 <X : si ∈Si qi (si ) · Ui (si , q−i ) ; 9 = qi (si ) · Ui (si∗ , q−i ) ; Ui (si∗ , q−i ), womit (a) gezeigt ist. Dr. Thomas Krieger 9 = und Vorlesung: Nicht-kooperative Spieltheorie 22 Spiele in Normalform Antwortsatz - Beweis (2) Wir zeigen (b) ⇔ (c): Sei qi eine beliebige gemischte Strategie von Spieler i und Si∗ := { si ∈ Si : Ui (si , q−i ) = Ui∗ } Si∗ Für alle si ∈ Si \ gilt daher: Ui (si , q−i ) < ein > 0. Man wähle beispielsweise := Ui∗ , (6= ∅) . also Ui (si , q−i ) ≤ Ui∗ − ε für Ui∗ − maxsi ∈Si \S ∗ Ui (si , q−i ) i 2 . (Das ist möglich, da Si endlich ist). Es gilt zunächst für alle qi ∈ Qi X qi (si ) · Ui (si , q−i ) Ui (qi , q−i ) = si ∈Si = X qi (si ) · Ui (si , q−i ) + | {z } si ∈Si∗ ≤ Ui∗ · = Ui∗ X si ∈Si \Si∗ {z qi (si ) · Ui (si , q−i ) | {z } ≤Ui∗ − X qi (si ) + (Ui∗ − ) · si ∈Si∗ | X qi (si ) = Ui∗ − α · . si ∈Si \Si∗ } = 1−α∈(0,1] | {z :=α∈[0,1) } und Dr. Thomas Krieger Vorlesung: Nicht-kooperative Spieltheorie 23 Spiele in Normalform Antwortsatz - Beweis (3) (b) =⇒ (c): Es sei qi beste Antwort auf q−i . Dann folgt Ui∗ = Ui (qi , q−i ) ≤ Ui∗ − α · , also α = 0. Dies ist gleichbedeutend mit qi (si ) = 0 für alle si ∈ Si \ Si∗ . Damit muss ein si mit qi (si ) > 0 aus der Menge Si∗ sein, womit also per Definition Ui∗ = Ui (si , q−i ) und damit (c) gilt. (Bemerkung: es kann durchaus si ∈ Si∗ geben, mit qi (si ) = 0.) (c) =⇒ (b): Sei qi ∈ Qi und nach (c) gelte für alle si ∈ Si mit qi (si ) > 0, dass Ui∗ = Ui (si , q−i ). Dann folgt qi (si ) = 0 si ∈ Si \ Si∗ . für alle Also gilt Ui (qi , q−i ) = X qi (si ) · Ui (si , q−i ) si ∈Si = X si ∈Si∗ qi (si ) · Ui (si , q−i ) + | {z } d.h. qi ist beste Antwort auf q−i . Dr. Thomas Krieger = Ui∗ X si ∈Si \Si∗ qi (si ) ·Ui (si , q−i ) = Ui∗ , | {z } =0 Vorlesung: Nicht-kooperative Spieltheorie und 24 Spiele in Normalform Beispiel (1) Wir betrachten das 2-Personen-Normalformspiel von Folie 13 mit folgenden Bezeichnungen: Versuch 1: Besitzt dieses Spiel Nash-Gleichgewichte in reinen Strategien? und Dr. Thomas Krieger Vorlesung: Nicht-kooperative Spieltheorie 25 Spiele in Normalform Beispiel (2) Versuch 2: Gibt es ein Nash-Gleichgewicht q ∗ = (q1∗ , q2∗ ) ∈ Q mit q1∗ (T ) > 0 , q1∗ (B) > 0 und q2∗ (L) = 1 ? Zunächst gilt U1 (T , q2∗ ) = 7 und U1 (B, q2∗ ) = 2 . Angenommen es gäbe ein Nash-Gleichgewicht der obigen Art, dann ist q1∗ beste Antwort auf q2∗ und nach Teil (c) des Antwortsatzes müsste gelten U1 (T , q2∗ ) = U1 (B, q2∗ ). Widerspruch! Versuch 3: Analog zeigt man, dass in einem Nash-Gleichgewicht jeder Spieler mindestens zwei reine Strategien mischen muss. und Dr. Thomas Krieger Vorlesung: Nicht-kooperative Spieltheorie 26 Spiele in Normalform Beispiel (3) Versuch 4: Gibt es ein vollständig-gemischtes Nash-Gleichgewicht q ∗ = (q1∗ , q2∗ ) ∈ Q, d.h., q1∗ (T ) > 0 , q1∗ (B) > 0 und q2∗ (L) > 0 , q2∗ (M) > 0 , q2∗ (R) > 0 ? Angenommen es gäbe ein Nash-Gleichgewicht der obigen Art, dann müsste nach Teil (c) des Antwortsatzes gelten U2∗ = U2 (q1∗ , L) = U2 (q1∗ , M) = U2 (q1∗ , R) , also U2∗ = 2 · q1∗ (T ) + 7 · q1∗ (B) = 7 · q1∗ (T ) + 2 · q1∗ (B) = 6 · q1∗ (T ) + 5 · q1∗ (B) . Damit folgt 1 und q1∗ (T ) = 3 · q1∗ (B) . 2 Widerspruch! (nicht beides erfüllbar) q1∗ (T ) = q1∗ (B) = Dr. Thomas Krieger Vorlesung: Nicht-kooperative Spieltheorie und 27 Spiele in Normalform Beispiel (4) Versuch 5: Gibt es ein Nash-Gleichgewicht q ∗ = (q1∗ , q2∗ ) ∈ Q mit q1∗ (T ) > 0 , q1∗ (B) > 0 und q2∗ (L) = 0 , q2∗ (M) > 0 , q2∗ (R) > 0 ? Angenommen es gäbe ein Nash-Gleichgewicht der obigen Art, dann müsste nach Teil (c) des Antwortsatzes gelten U1∗ = U1 (T , q2∗ ) = U1 (B, q2∗ ) , also U1∗ = 2 · q2∗ (M) + 3 · q2∗ (R) = 7 · q2∗ (M) + 4 · q2∗ (R) . Damit folgt wegen q2∗ (M) + q2∗ (R) = 1 5 1 und q2∗ (R) = . 4 4 Widerspruch! (Wahrscheinlichkeiten müssen ≥ 0 sein) q2∗ (M) = − Dr. Thomas Krieger Vorlesung: Nicht-kooperative Spieltheorie und 28 Spiele in Normalform Beispiel (5) Versuch 6: Gibt es ein Nash-Gleichgewicht q ∗ = (q1∗ , q2∗ ) ∈ Q mit q1∗ (T ) > 0 , q1∗ (B) > 0 und q2∗ (L) > 0 , q2∗ (M) > 0 , q2∗ (R) = 0 ? Angenommen es gäbe ein Nash-Gleichgewicht der obigen Art, dann müsste nach Teil (c) des Antwortsatzes gelten U1∗ = U1 (T , q2∗ ) = U1 (B, q2∗ ) und U2∗ = U2 (q1∗ , L) = U2 (q1∗ , M) also U1∗ = 7 · q2∗ (L) + 2 · q2∗ (M) = 2 · q2∗ (L) + 7 · q2∗ (M) und U2∗ = 7 · q1∗ (T ) + 2 · q2∗ (B) = 2 · q2∗ (T ) + 7 · q2∗ (B) . und Dr. Thomas Krieger Vorlesung: Nicht-kooperative Spieltheorie 29 Spiele in Normalform Beispiel (6) - Versuch 6 Fortsetzung Die Lösung dieses Gleichungssystems (unter Berücksichtigung von qi∗ ∈ Qi ) ist q1∗ (T ) = q1∗ (B) = 1 2 und q2∗ (L) = q2∗ (M) = 1 2 mit U1∗ = U2∗ = 9 = 4.5 . 2 Es gilt aber U2∗ = 4.5 < 5.5 = U2 (q1∗ , R) . Widerspruch! (Strategie R ausserhalb des Trägers liefert höhere Auszahlung) und Dr. Thomas Krieger Vorlesung: Nicht-kooperative Spieltheorie 30 Spiele in Normalform Beispiel (7) Versuch 7: ... und dieser muss wegen des Satzes von Nash erfolgreich sein, also ein Nash-Gleichgewicht liefern. Wir suchen also das Nash-Gleichgewicht q ∗ = (q1∗ , q2∗ ) ∈ Q mit q1∗ (T ) > 0 , q1∗ (B) > 0 und q2∗ (L) > 0 , q2∗ (M) = 0 , q2∗ (R) > 0 . Mit Teil (c) des Antwortsatzes gilt U1∗ = U1 (T , q2∗ ) = U1 (B, q2∗ ) und U2∗ = U2 (q1∗ , L) = U2 (q1∗ , R) also U1∗ = 7 · q2∗ (L) + 3 · q2∗ (R) = 2 · q2∗ (L) + 4 · q2∗ (R) und U2∗ = 2 · q1∗ (T ) + 7 · q2∗ (B) = 6 · q2∗ (T ) + 5 · q2∗ (B) . und Dr. Thomas Krieger Vorlesung: Nicht-kooperative Spieltheorie 31 Spiele in Normalform Beispiel (8) - Versuch 7 Fortsetzung Die Lösung dieses Gleichungssystems (unter Berücksichtigung von qi∗ ∈ Qi ) ist q1∗ (T ) = 1 ∗ 2 , q1 (B) = 3 3 und q2∗ (L) = 1 ∗ 5 , q2 (R) = 6 6 mit U1∗ = 22 2 =3 6 3 und U2∗ = 16 1 =5 . 3 3 Diesmal gilt U2∗ > U2 (q1∗ , M) = 11 . 3 Nach dem Antwortsatz und mit dem Test-Lemma ist damit obiges (q1∗ , q2∗ ) das einzige Nash-Gleichgewicht des Spiels. Dr. Thomas Krieger Vorlesung: Nicht-kooperative Spieltheorie und 32 Spiele in Normalform Algorithmus zur Bestimmung von Nash-Gleichgewichten 1 2 Wähle für jeden Spieler i ∈ {1, 2} eine beliebige Teilmenge Di ⊆ Si . Bestimme (q1∗ , q2∗ ) aus dem linearen (!) Gleichungssystem X w1 = U1 (s1 , q2∗ ) für alle s1 ∈ D1 mit q2∗ (s2 ) = 1 , s2 ∈D2 w2 = U2 (q1∗ , s2 ) für alle s 2 ∈ D2 mit X q1∗ (s1 ) = 1 . s1 ∈D1 3 Gilt überdies qi∗ (si ) ≥ 0 U1 (s1 , q2∗ ) U2 (q1∗ , s2 ) für alle s i ∈ Di , i = 1, 2 , ≤ w1 für alle s1 ∈ S1 \ D1 ≤ w2 für alle s2 ∈ S2 \ D2 , sowie und dann ist (q1∗ , q2∗ ) ∈ Q ein Nash-Gleichgewicht mit U1 (q1∗ , q2∗ ) = w1 und U2 (q1∗ , q2∗ ) = w2 . Dr. Thomas Krieger Vorlesung: Nicht-kooperative Spieltheorie und 33 Spiele in Normalform Bemerkungen (1) Bearbeiten Sie Aufgabe 2 und 3 des Übungsblattes 4. Um alle Nash-Gleichgewichte zu bestimmen, müssen | D1 × D2 | = (2|S1 | − 1) · (2|S2 | − 1) Kombinationen durchprobiert werden! Nach dem Satz von Nash existiert mindestens eine Kombination gemischter Strategien, die alle Bedingungen der letzten Folie erfüllt. Der obige Algorithmus kann direkt für die Bestimmung von Nash-Gleichgewichten in n-Personen-Normalformspielen verwendet werden. und Dr. Thomas Krieger Vorlesung: Nicht-kooperative Spieltheorie 34 Spiele in Normalform Bemerkungen (2) Es gibt weitere Algorithmen zur Bestimmung von Nash-Gleichgewichten, namentlich werden hier nur zwei erwähnt: Für n = 2: Algorithmus von Lemke-Howson Für n beliebig: Algorithmus von Scarf-Hansen Große Bedeutung haben nicht-entartete 2-Personen-Normalformspiele: Definition 19 Ein 2-Personen-Normalformspiel heisst entartet, falls für einen Spieler i eine gemischte Strategie qi ∈ Qi existiert, auf die der Gegner mehr als | C (qi ) | reine beste Antworten hat. Dabei ist C (qi ) := { si ∈ Si : qi (si ) > 0 } der Träger der Strategie qi ∈ Qi . und Dr. Thomas Krieger Vorlesung: Nicht-kooperative Spieltheorie 35 Spiele in Normalform Bemerkungen (3) Für nicht-entartete 2-Personen-Normalformspiele gilt nun: Die Anzahl der Nash-Gleichgewichte ist ungerade (und damit insbesondere endlich). Interessant am Rande: Die Lösung eines n-Personen-Normalformspiels mit n ≥ 4 kann auf die Lösung eines geeigneten 3-Personen-Normalformspiels zurückgeführt werden (Bubelis, 1978) Für n ≥ 3 müssen zur Bestimmung von Nash-Gleichgewichten in gemischten Strategien i.A. nicht-lineare (!) Gleichungssysteme gelöst werden. Es gilt daher i.A. nicht mehr: wenn ui (s) ∈ Q für alle s ∈ S, dann auch qi∗ ∈ Q|Si | für alle si ∈ Si . und Dr. Thomas Krieger Vorlesung: Nicht-kooperative Spieltheorie 36 Spiele in Normalform Bemerkungen (4) Oft gibt es mehrer Nash-Gleichgewichte (in reinen und in gemischten Strategien) in einem Normalformspiel: Welches Nash-Gleichgewicht wird dann gespielt (-> Koordinierung, Auswahltheorie)? e2∗ ) jeweils ein Nash-Gleichgewicht, so q1∗ , q Sind (q1∗ , q2∗ ) und (e gilt: e2∗ ) noch (e I.A. sind weder (q1∗ , q q1∗ , q2∗ ) Nash-Gleichgewichte. e2∗ ), i = 1, 2, I.A. sind die Auszahlungen Ui (q1∗ , q2∗ ) und Ui (e q1∗ , q verschieden. =⇒ Finden Sie Beispiele, die das zeigen!! und Dr. Thomas Krieger Vorlesung: Nicht-kooperative Spieltheorie 37 Spiele in Normalform Bemerkungen (5) Gemeinsames Abweichen der Spieler von den Gleichgewichtsstrategien kann für beide gewinnbringend sein (vgl. auch Gefangenen-Dilemma) 1 2 1 1 3 3 −1 0 2 5 0 2 1 2 4 4 1 2 3 3 5 0 3 0 Einziges Nash-Gleichgewicht ist (1, 1). Die Auszahlung bei (2, 2) ist echt besser für beide und bei (3, 1) und (3, 2) zumindest besser für Spieler 2. Dies zeigt, Nash-Gleichgewichte müssen nicht Paretooptimal sein. Das Konzept des Nash-Gleichgewichts versagt, wenn die 1 2 Spieler bindende Vereinbarungen treffen könnten: wähle (3, 2) − 1000 5 und teile entsprechend die 8 Einheiten auf. 1 2 2 6 8 4 Dr. Thomas Krieger und Vorlesung: Nicht-kooperative Spieltheorie 38 Spiele in Normalform 0 2 2 1 Bemerkungen (6) 4 2 3 4 1 5 0 Aufgrund „psychologischer“ Gründe3 können3 manche0 Nash-Gleichgewichte als plausibler erscheinen als andere: 1 2 1 0 1 0 − 1000 1 − 10 1 0 2 2 1 0 5 6 8 2 0 2 10 4 3 Im linken Spiel Lsind (1,M 1) und (2, R 2) die (einzigen) Nash-Gleichgewichte. In (1, 1) könnte Spieler 1 „Angst“ vor einem Abweichen des Spielers 2 haben. Daher wird Spieler 1 vielleicht eher das Nash-Gleichgewicht (2, 2) 1 2 bevorzugen, 2 7 6 indem Spieler 2 dann sogar mehr gewinnt. T 7 sind (2, 2 1) und 3 (1, 2) Nash-Gleichgewichte 0 Im rechten Spiel (und es0 gibt noch 1 eines in gemischten Strategien). Das Nash-Gleichgewicht (2, 1) ist sogar 7 2 5 1 − 10 Auszahlungsdominant! In (1, 2) hat aber kein Spieler mehr „Angst“. B 2 7 4 Dr. Thomas Krieger 0 und 1 2 Nicht-kooperative Spieltheorie Vorlesung: 39 Spiele in Normalform Literatur (1) S. K. Berninghaus, K.-M. Ehrhart, W. Güth: Strategische Spiele. Springer-Verlag, Berlin u.a., 2. Auflage, 2006. V. Bubelis: On Equilibria in Finite Games. International Journal of Game Theory, Vol 8, Issue 2, pages 65-79, 1978. B. Rauhut, N. Schmitz, E.-W. Zachow: Spieltheorie: Einführung in die mathematische Theorie strategischer Spiele. Teubner-Verlag, Stuttgart, 1979. R M. J. Canty: Konfliktlösungen mit Mathematica . Springer-Verlag, Berlin Heidelberg, 2000. R. B. Myerson: Game Theory - Analysis of Conflict. Havard University Press, Cambridge, Massachusetts, London, England, 1991. J. F. Nash: Non-cooperative Games. Annals of Mathematics, Vol 54, pages 286-295, 1951. H. Nikoida, K. Isoda: Note on noncooperative convex games. Pacific Journal of Mathematics, Vol 5, pages 807-815, 1955. und Dr. Thomas Krieger Vorlesung: Nicht-kooperative Spieltheorie 40 Spiele in Normalform Literatur (2) M. Dresher: Strategische Spiele - Theorie und Praxis. Verlag Industrielle Organisation. Zürich, 1961. W. Güth: Markt- und Preistheorie. Springer-Verlag, Berlin Heidelberg u.a., 1994. R. Avenhaus, Th. Krieger: Unannounced Interim Inspections. ITIS-study for the Joint Research Centre of the European Commission, Institute for the Protection and the Security of the Citizen, Ispra, Final Report March 2009. H. E. Scarf: The Computation of Economic Equilibria. Yale University Press, New Haven, Connecticut, 1973. C. E. Lemke, J. T. Howson: Equilibrium points of bimatrix games. SIAM Journal on Applied Mathematics, Vol 12, pages 413-423, 1964. K. H. Borgwardt: Optimierung, Operations Research, Spieltheorie. Birkhäuser Verlag, Basel Boston Berlin, 2001. und Dr. Thomas Krieger Vorlesung: Nicht-kooperative Spieltheorie 41