2. Statische Spiele mit vollständiger Information Klaus M. Schmidt LMU München Spieltheorie, Wintersemester 2014/15 Klaus M. Schmidt (LMU München) 2. Statische Spiele mit vollständiger Information Spieltheorie, Wintersemester 2014/15 1 / 82 Literaturhinweise zu Kapitel 2: Osborne (2004), Kapitel 2-4 Gibbons (1992), Kapitel 1 MasColell, Whinston, Green (1995), Kapitel 7 und 8 Fudenberg und Tirole (1991), Kapitel 1 und 2 c 2014 Klaus M. Schmidt Klaus M. Schmidt (LMU München) 2. Statische Spiele mit vollständiger Information Spieltheorie, Wintersemester 2014/15 2 / 82 2.1 Beschreibung eines Spieles Die “Normalform” eines Spiels besteht aus: 1) Menge der Spieler I = {1, 2, . . . , n} 2) Menge aller möglichen Strategien für jeden Spieler Si für alle {i ∈ I wobei si ∈ Si ein Element (also eine Strategie) aus der Menge Si bezeichnet. Ein Profil von Strategien für alle Spieler ist ein Vektor s = (s1 , s2 , . . . , sn ) ∈ ×ni=1 Si . Manchmal ist es nützlich, diesen Vektor zu schreiben als: s = (si , s−i ) ∈ (Si , S−i ) , wobei s−i der Vektor der Strategien aller übrigen Spieler (außer Spieler i) ist. Klaus M. Schmidt (LMU München) 2. Statische Spiele mit vollständiger Information Spieltheorie, Wintersemester 2014/15 3 / 82 3) Auszahlungsfunktionen für jeden Spieler ui : S1 × S2 × · · · × Sn → R für alle i ∈ {1, . . . , n}, die jedem möglichen Strategienprofil eine Auszahlung für jeden Spieler zuordnet. Definition 2.1 (Normalform) Die Normalform eines Spiels G = {I; S1 , . . . , Sn ; u1 , . . . , un } spezifiziert 1) die Menge der Spieler, I = {1, . . . , n}, 2) die Strategienräume der Spieler, S1 , . . . , Sn , 3) die Nutzenfunktionen der Spieler, u1 , . . . , un . Klaus M. Schmidt (LMU München) 2. Statische Spiele mit vollständiger Information Spieltheorie, Wintersemester 2014/15 4 / 82 2.2 Ein Bei-Spiel Zwei Unternehmen stehen auf einem Duopolmarkt im Preiswettbewerb. Jedes Unternehmen muss entscheiden, ob es einen hohen oder einen niedrigen Preis verlangt. Die Entscheidungen werden gleichzeitig getroffen. Wenn beide Firmen den hohen Preis wählen, machen beide einen Gewinn von jeweils 2 Mio. Euro. Wenn eine Firma einen hohen Preis und die andere einen niedrigen Preis wählt, macht die Firma mit dem niedrigen Preis einen Gewinn von 3 Mio. Euro und die mit dem hohen Preis einen Gewinn von 0 Euro. Wenn beide Firmen den niedrigen Preis wählen, machen beide einen Gewinn von 1 Mio. Euro. Klaus M. Schmidt (LMU München) 2. Statische Spiele mit vollständiger Information Spieltheorie, Wintersemester 2014/15 5 / 82 Ein Normalformspiel mit nur zwei Spielern und endlich vielen Strategien kann in einer Bimatrix dargestellt und analysiert werden: 2 @ 1 @ @ H N H 2, 2 0, 3 N 3, 0 1, 1 Abb. 2.1: Duopolmarkt Klaus M. Schmidt (LMU München) 2. Statische Spiele mit vollständiger Information Spieltheorie, Wintersemester 2014/15 6 / 82 Menge der Spieler: I = Strategienmengen der Spieler: S1 = S2 = S= Auszahlungsfunktionen: u1 (N, N) = u1 (N, H) = u1 (H, N) = u1 (H, H) = u2 (N, N) = u2 (N, H) = u2 (H, N) = u2 (H, H) = Welche Strategie sollte Unternehmen 1 in diesem Beispiel wählen? Klaus M. Schmidt (LMU München) 2. Statische Spiele mit vollständiger Information Spieltheorie, Wintersemester 2014/15 7 / 82 Bemerkungen: 1) Bei einem statischen Spiel ist nicht entscheidend, dass die Spieler simultan handeln. Entscheidend ist, dass kein Spieler weiß, welche Strategien die anderen Spieler gewählt haben, wenn er selbst am Zug ist. 2) Wir werden im Folgenden grundsätzlich annehmen, dass die Auszahlungen der Spieler durch von Neumann-Morgensternsche Nutzenfunktionen beschrieben werden. Eine solche Nutzenfunktion ordnet jedem möglichen Ergebnis der Interaktion und damit jedem möglichen Strategientupel (s1 , . . . , sn ) einen Nutzenwert zu, der nicht nur die ordinalen Präferenzen über die Ergebnisse, sondern auch die Risikopräferenzen eines Spielers reflektiert. Sie ist eindeutig bis auf eine positive lineare Transformation. Bei Unsicherheit über das Ergebnis ist die Auszahlung gleich dem Erwartungswert der Nutzenfunktion. 3) In einem Spiel mit vollständiger Information sind sowohl die Struktur des Spiels als auch die Auszahlungen “common knowledge” (gemeinsames Wissen). 4) Die Normalform eines Spiels wird oft auch die “strategische Form” genannt, im Gegensatz zur “extensiven Form” eines Spiels, die wir bei dynamischen Spielen kennenlernen werden. Klaus M. Schmidt (LMU München) 2. Statische Spiele mit vollständiger Information Spieltheorie, Wintersemester 2014/15 8 / 82 2.3 Dominanz Definition 2.2 (Streng dominierte Strategie) Eine Strategie ŝi von Spieler i wird streng dominiert, wenn es eine andere Strategie s̃i ∈ Si gibt, so dass s̃i zu einer streng größeren Auszahlung führt als ŝi , ganz gleich welches Strategientupel von den Gegenspielern gewählt wird: ui (ŝi , s−i ) < ui (s̃i , s−i ) ∀s−i ∈ S−i . Im Duopolmarktbeispiel ist die Strategie “H” streng dominiert. Warum wird ein rationaler Spieler wird niemals eine streng dominierte Strategie spielen? Klaus M. Schmidt (LMU München) 2. Statische Spiele mit vollständiger Information Spieltheorie, Wintersemester 2014/15 9 / 82 Definition 2.3 (Dominante Strategie) Die Strategie si∗ von Spieler i ist eine (streng) dominante Strategie, falls sie alle anderen Strategien von Spieler i streng dominiert. D.h., eine dominante Strategie ist eine streng beste Antwort gegen alle Strategientupel s−i : ui (si∗ , s−i ) > ui (si , s−i ) ∀si ∈ Si \ {si∗ }, s−i ∈ S−i . Wenn von einer “dominanten Strategie” die Rede ist, ist immer eine streng dominante Strategie gemeint. Wenn eine Strategie nur schwach dominant ist, muss das ausdrücklich gesagt werden. Gibt es eine dominante Strategie im Duopolmarkt-Beispiel? Wenn eine dominante Strategie si∗ existiert, wird sie ein rationaler Spieler immer wählen, ganz gleich, was er über das Verhalten seiner Gegenspieler annimmt. Warum? Klaus M. Schmidt (LMU München) 2. Statische Spiele mit vollständiger Information Spieltheorie, Wintersemester 2014/15 10 / 82 Satz 2.1 Wenn in G = {I, S1 , . . . , Sn ; u1 , . . . , un } jeder Spieler i eine dominante Strategie hat und alle Spieler rational sind, dann gibt es ein Gleichgewicht in dominanten Strategien. Beweis von Satz 2.1: Klaus M. Schmidt (LMU München) 2. Statische Spiele mit vollständiger Information Spieltheorie, Wintersemester 2014/15 11 / 82 Bemerkungen: 1) Dieser Satz verlangt nur, dass jeder Spieler rational ist. Er verlangt nicht, dass jeder Spieler weiß, dass seine Gegenspieler rational sind. 2) Im Duopolspiel ist es für beide Spieler eine dominante Strategie, den niedrigen Preis zu wählen. Also gibt es ein eindeutiges Gleichgewicht in dominanten Strategien: Beide Firmen wählen den niedrigen Preis, obwohl sich beide Firmen besser stellen würden, wenn sie beide den hohen Preis wählen würden. Warum ist dieses Verhalten trotzdem “rational”? 3) Das Duopolspiel hat dieselbe strategische Struktur wie das “Gefangenendilemma”. In beiden Fällen hat jeder Spieler die streng dominante Strategie, etwas sozial Ineffizientes zu tun. In der folgenden Bimatrix bezeichnen die Auszahlungen die “Jahre im Gefängnis”, die den beiden Gefangenen bevorstehen, wenn sie die jeweiligen Strategien wählen. Klaus M. Schmidt (LMU München) 2. Statische Spiele mit vollständiger Information Spieltheorie, Wintersemester 2014/15 12 / 82 B Leugnen Gestehen @ A @ (“cooperate”) (“defect”) @ Leugnen (“cooperate”) -1, -1 -4, 0 Gestehen (“defect”) 0, -4 -3, -3 Abb. 2.2: Gefangenendilemma Das Gefangenendilemma ist eine sog. “soziale Dilemmasituation”, die immer dann auftritt, wenn optimales individuelles Verhalten zu einem sozial ineffizienten Ergebnis führt. Andere wichtige Beispiele für soziale Dilemmasituationen sind Spiele, in denen die Spieler zu einem öffentlichen Gut beitragen müssen (public good games) und Wettbewerbsspiele (z.B. das Cournot- oder das Bertrandspiel). Klaus M. Schmidt (LMU München) 2. Statische Spiele mit vollständiger Information Spieltheorie, Wintersemester 2014/15 13 / 82 4) Obwohl die Vorhersage “Ein Spieler wird seine dominante Strategie spielen, wenn eine solche existiert” fast trivial ist, scheint sie von tatsächlichen Spielern oft verletzt zu werden. In Experimenten zum Gefangenendilemma entscheiden sich viele Versuchspersonen zu kooperieren. Viele bleiben bei dieser Entscheidung, obwohl man ihnen erklärt, dass “Gestehen” eine dominante Strategie ist. 5) Eine mögliche Erklärung ist, dass die Auszahlungen oder die Spielstruktur nicht richtig spezifiziert wurden: I I Vielleicht geht es den Versuchspersonen nicht nur um ihr eigenes Einkommen, sondern auch um Fairness und Reziprozität. Vielleicht betrachten die Versuchspersonen das Spiel als Teil eines wiederholten Spiels. Im Labor kann man diese Hypothesen überprüfen. 6) Die meisten Spiele haben kein Gleichgewicht in dominanten Strategien. Was soll ein Spieler dann tun? Klaus M. Schmidt (LMU München) 2. Statische Spiele mit vollständiger Information Spieltheorie, Wintersemester 2014/15 14 / 82 2.4 Iterierte Elimination von streng dominierten Strategien, Rationalisierbarkeit Betrachten Sie das folgende Spiel: 2 @ 1 @ @ Links Mitte Rechts Oben 1, 0 1, 2 0, 1 Unten 0, 3 0, 1 2, 0 Abb. 2.3: Iterierte Elimination von streng dominierten Strategien Welche Strategien werden hier streng dominiert? Klaus M. Schmidt (LMU München) 2. Statische Spiele mit vollständiger Information Spieltheorie, Wintersemester 2014/15 15 / 82 “Rechts” wird streng dominiert durch “Mitte” ⇒ Ein rationaler Spieler 2 wird “Rechts” nicht wählen. ⇒ Wenn Spieler 1 weiß, dass Spieler 2 rational ist, kann er “Rechts” eliminieren. Dann ist für ihn “Unten” streng dominiert. ⇒ Wenn Spieler 2, weiß, dass Spieler 1 rational ist und dass Spieler 1 weiß, dass 2 rational ist, kann er “Unten” eliminieren. Dann ist für ihn “Links” streng dominiert. ⇒ (“Oben”, “Mitte”) wird gespielt. Bemerkungen: 1) Iterierte Elimination von streng dominierten Strategien (IESDS) verlangt nicht nur, (i) dass alle Spieler rational sind, sondern auch, (ii) dass alle Spieler wissen, dass alle Spieler rational sind, (iii) dass alle Spieler wissen, dass alle Spieler wissen, dass alle Spieler rational sind, usw. ad infinitum. Das heißt, Rationalität muss “common knowledge” sein. 2) Die Reihenfolge der Eliminierung spielt bei streng dominierten Strategien für das Ergebnis keine Rolle. 3) Schwach dominierte Strategien dürfen nicht eliminiert werden! Klaus M. Schmidt (LMU München) 2. Statische Spiele mit vollständiger Information Spieltheorie, Wintersemester 2014/15 16 / 82 2.5 Nash-Gleichgewicht Wenn ein Spieler erwartet, dass seine Gegenspieler die Strategienkombination s−i spielen, sollte er eine Strategie wählen, die eine “beste Antwort” gegen s−i ist. Definition 2.4 (Beste Antwort) Die Strategie si von Spieler i ist eine (schwach) beste Antwort gegen die Strategien s−i seiner Gegenspieler, wenn ui (si , s−i ) ≥ ui (si0 , s−i ) ∀si0 ∈ Si . Klaus M. Schmidt (LMU München) 2. Statische Spiele mit vollständiger Information Spieltheorie, Wintersemester 2014/15 17 / 82 Das folgende Konzept des Nash-Gleichgewichts ist von fundamentaler Bedeutung für die Spieltheorie: Definition 2.5 (Nash-Gleichgewicht) Die Strategien (s1∗ , s2∗ , . . . , sn∗ ) bilden ein Nash-Gleichgewicht, falls jede ∗ ist, d.h. Strategie si∗ eine beste Antwort gegen s−i ∗ ∗ ui (s1∗ , .., si∗ , .., sn∗ ) ≥ ui (s1∗ , .., si−1 , si , si+1 , .., sn∗ ) für alle i ∈ {1, . . . , n} und alle si ∈ Si . Ein Nash-Gleichgewicht ist also eine Strategienkombination aus wechselseitig besten Antworten: Für jeden Spieler gilt, dass er eine beste Antwort gegen die Strategien aller übrigen Spieler spielt. Diese Situation ist ein Gleichgewicht (eine stabile Situation), weil kein Spieler einen Anreiz hat, seine Strategie zu ändern. Klaus M. Schmidt (LMU München) 2. Statische Spiele mit vollständiger Information Spieltheorie, Wintersemester 2014/15 18 / 82 Beachten Sie: 1) In der Definition des Nash-Gleichgewichts wird nur die schwache Ungleichheit verlangt. Warum? 2) Beachten Sie, dass das Nash-Gleichgewicht verlangt, dass alle Spieler korrekte Erwartungen bilden. Kein Spieler weiß, welche Strategien seine Gegenspieler gewählt haben. Seine optimale Strategie hängt also von den Erwartungen über die gewählten Strategien der anderen Spieler ab. Betrachten Sie zur Illustration ein Spiel mit zwei Spielern: I I Im Nash-Gleichgewicht ist die Strategie von Spieler 1 optimal, gegeben seine korrekte Erwartung über die Strategie von Spieler 2 und für Spieler 2 ist es tatsächlich optimal, sich entsprechend der Erwartung von Spieler 1 zu verhalten, wenn er selbst korrekt erwartet, welche Strategie Spieler 1 wählen wird. Ein Nash-Gleichgewicht ist also nicht nur eine Kombination von wechselseitig besten Antworten, sondern auch eine Kombination von miteinander konsistenten Erwartungen. Klaus M. Schmidt (LMU München) 2. Statische Spiele mit vollständiger Information Spieltheorie, Wintersemester 2014/15 19 / 82 3) Angenommen, die Spieler können sich vor dem Spiel darüber unterhalten, welche Strategien sie spielen werden. Diese Abstimmung ist jedoch nicht bindend (nicht-kooperative Spieltheorie!). Frage: Gibt es eine Absprache auf eine Strategienkombination, die selbst-durchsetzend ist, d.h., von der niemand einen Anreiz hat abzuweichen? Eine Strategienkombination ist selbst-durchsetzend dann und nur dann, wenn sie ein Nash-Gleichgewicht ist: I I In einem Nash-Gleichgewicht hat kein Spieler einen Anreiz von seiner Gleichgewichtsstrategie abzuweichen. Wenn eine Strategienkombination kein Nash-Gleichgewicht ist, dann existiert wenigstens ein Spieler i und eine Strategie s̃i , so dass ui (ŝ1 , .., ŝi , .., ŝn ) < ui (ŝ1 , .., ŝi−1 , s̃i , ŝi+1 , .., ŝn ) . Also hat i einen Anreiz, von der Übereinkunft abzuweichen. Klaus M. Schmidt (LMU München) 2. Statische Spiele mit vollständiger Information Spieltheorie, Wintersemester 2014/15 20 / 82 Wie findet man ein Nash-Gleichgewicht in einem 2-Personen-Spiel mit endlich vielen Strategien? Betrachte jede Strategie von Spieler 1 und überlege, welche Strategie von Spieler 2 dagegen eine beste Antwort ist. Unterstreiche die höchste Auszahlung von Spieler 2 für jede gegebene Strategie von Spieler 1. Betrachte jede Strategie von Spieler 2 und überlege, welche Strategie von Spieler 1 dagegen eine beste Antwort ist. Unterstreiche die höchste Auszahlung von Spieler 1 für jede gegebene Strategie von Spieler 2. Gibt es eine Zelle in der Auszahlungsbimatrix, in der beide Auszahlungen unterstrichen sind? Wenn ja, dann sind die Strategien der Spieler hier wechselseitig beste Antworten, also ein Nash-Gleichgewicht. Klaus M. Schmidt (LMU München) 2. Statische Spiele mit vollständiger Information Spieltheorie, Wintersemester 2014/15 21 / 82 Beispiel: 2 @ 1 @ @ ` m r O 0, 4 4, 0 5, 3 M 4, 0 0, 4 5, 3 U 3, 5 3, 5 6, 6 Abb. 2.4: Finden eines Nash-Gleichgewichts Klaus M. Schmidt (LMU München) 2. Statische Spiele mit vollständiger Information Spieltheorie, Wintersemester 2014/15 22 / 82 2.6 Multiple Nash-Gleichgewichte Leider gibt es oft mehrere Gleichgewichte. Beispiele: Sie @ Er @ @ Boxen Ballett Boxen 2, 1 0, 0 Ballett 0, 0 1, 2 Abb. 2.5: Kampf der Geschlechter Klaus M. Schmidt (LMU München) 2. Statische Spiele mit vollständiger Information Spieltheorie, Wintersemester 2014/15 23 / 82 2 @ 1 @ @ Falke Taube Falke -10, -10 5, 0 Taube 0, 5 1, 1 Abb. 2.6: Feigling (“Chicken”), Falke-Taube (“Hawk-Dove”) Ohne zusätzliche Information ist unklar, ob die Spieler überhaupt ein Nash-Gleichgewicht spielen werden und, wenn ja, welches. In manchen Spielen ragt ein Nash-Gleichgewicht aus der Menge aller Nash-Gleichgewichte heraus, weil es “offensichtlich" von allen Spielern gespielt werden sollte. Wann ist ein Nash-Gleichgewicht “offensichtlich”? Klaus M. Schmidt (LMU München) 2. Statische Spiele mit vollständiger Information Spieltheorie, Wintersemester 2014/15 24 / 82 2.6.1 Fokus-Punkte (Focal Points) Schelling (1960): Bei vielen Koordinationsproblemen gibt es gesellschaftliche Normen oder Konventionen, die festlegen, welches Gleichgewicht gespielt wird. Beispiele: 1. Normen Sie fahren mit dem Auto aus der Garage auf die Straße. Welche Straßenseite wählen Sie? Was würden Sie in England tun? Wie ist das bei Radfahrern, Fußgängern? 2. Das Aufteilungsspiel Sie müssen 10 EUR zwischen sich selbst und einem Gegenspieler aufteilen. Schreiben Sie auf einen Zettel, wie viel Sie für sich selbst beanspruchen. Zwei Zettel werden zufällig ausgewählt. Wenn die Summe der Forderungen kleiner oder gleich 10 EUR ist, bekommt jeder seine Forderung. Ansonsten bekommen beide nichts. Welche Zahl würden Sie auf Ihren Zettel schreiben? Klaus M. Schmidt (LMU München) 2. Statische Spiele mit vollständiger Information Spieltheorie, Wintersemester 2014/15 25 / 82 3. Das Städte-Spiel Teilen Sie die folgende Liste von Städten in zwei beliebige Gruppen auf: Berlin, Havanna, London, Moskau, Paris, Ottawa, Washington. Schreiben Sie Ihre Aufteilung und Ihren Namen auf einen Zettel. Zwei Zettel werden zufällig ausgewählt. Wenn die beiden Zettel dieselbe Aufteilung der Städte aufweisen, bekommt jeder 5 Euro. Ansonsten bekommen beide nichts. Welche Aufteilung der Städte würden Sie vornehmen? Klaus M. Schmidt (LMU München) 2. Statische Spiele mit vollständiger Information Spieltheorie, Wintersemester 2014/15 26 / 82 2.6.2 Kommunikation vor dem Spiel Wenn die Spieler vor dem Spiel miteinander kommunizieren können, können sie sich auf ein Gleichgewicht einigen, das damit zu einem Fokus-Punkt wird. Beispiel 1: Kampf der Geschlechter Wenn die beiden Spieler sich absprechen, zum Boxkampf zu gehen, was wird dann jeder Spieler tun? Beispiel 2: Das Duopolspiel Wenn die beiden Spieler sich absprechen, hohe Preise zu wählen, was wird dann jeder Spieler tun? Fazit: Eine unverbindliche Absprache wird von den Parteien dann und nur dann eingehalten, wenn es sich um ein Nash-Gleichgewicht handelt! Klaus M. Schmidt (LMU München) 2. Statische Spiele mit vollständiger Information Spieltheorie, Wintersemester 2014/15 27 / 82 2.6.3 Pareto-Optimalität Im folgenden Spiel gibt es zwei Gleichgewichte, aber es scheint offensichtlich, welches gespielt werden sollte, auch wenn die Parteien sich nicht absprechen können. 2 @ 1 @ @ ` r O 100, 100 0, 0 U 0, 0 1, 1 Abb. 2.7: Pareto-optimales Nash-Gleichgewicht Klaus M. Schmidt (LMU München) 2. Statische Spiele mit vollständiger Information Spieltheorie, Wintersemester 2014/15 28 / 82 Ist es immer “offensichtlich”, ein Pareto-effizientes Gleichgewicht zu spielen, falls dieses eindeutig ist? Gegenbeispiel von Harsanyi und Selten (1988): 2 @ 1 @ @ ` r O 9, 9 0, 8 U 8, 0 7, 7 Abb. 2.8: Pareto-Effizienz und Risiko-Dominanz Klaus M. Schmidt (LMU München) 2. Statische Spiele mit vollständiger Information Spieltheorie, Wintersemester 2014/15 29 / 82 Spieler 1 könnte sich denken: O ist sehr riskant, wenn nicht völlig sicher ist, dass Spieler 2 ` wählt. U führt zu einer nur unwesentlich kleineren Auszahlung, ist aber sehr viel sicherer. Harsanyi und Selten argumentieren, dass das Nash-GG (U, r ) das Nash-GG (O, l) risikodominiert und deshalb gespielt werden sollte.1 Werden die Spieler das Pareto-effiziente Gleichgewicht spielen, wenn sie sich vor dem Spiel absprechen können? Aumann (1990): Nein! Spieler 1 wird sich sagen: “Ganz gleich, welche Strategie ich spielen werde, ich sollte immer versuchen, Spieler 2 davon zu überzeugen, dass ich O spiele, damit er ` spielt.” Also enthält die Mitteilung von Spieler 1, dass er O spielen wird, keine neue Information. 1 In einem symmetrischen 2x2 Spiel (zwei Spieler mit jeweils zwei Strategien) “risikodominiert” das Gleichgewicht (a, a) das Gleichgewicht (b, b), wenn beide Spieler a wählen würden, falls sie glauben, dass der jeweils andere Spieler die Strategien a und b jeweils mit gleicher Wahrscheinlichkeit wählt. Klaus M. Schmidt (LMU München) 2. Statische Spiele mit vollständiger Information Spieltheorie, Wintersemester 2014/15 30 / 82 2.7 Anwendungsbeispiele 2.7.1 Öffentliche Güter Betrachten Sie das folgende lineare Public Good Spiel: Vier Spieler, i ∈ {1, 2, 3, 4}. Jeder Spieler hat ein Vermögen von 10. Jeder Spieler entscheidet, welchen Betrag xi ∈ [0, 10] er zu einem öffentlichen Gut beiträgt. Wenn Spieler i den Betrag xi zum öffentlichen Gut beiträgt, erhöht sich die Auszahlung von jedem Spieler um a · xi mit 41 < a < 1. Die Monetäre Auszahlungsfunktion von Spieler i, i ∈ {1, 2 , 3 , 4} ist also: Ui = a · 4 X xj + (10 − xi ) j=1 Welche Strategie wäre sozial effizient? Welche Strategie ist für jeden Spieler dominant? Vergleichen Sie das Public Good Spiel mit dem Gefangenendilemma. Klaus M. Schmidt (LMU München) 2. Statische Spiele mit vollständiger Information Spieltheorie, Wintersemester 2014/15 31 / 82 2.7.2 Cournot-Duopol (Auguste Cournot, 1838): Zwei Unternehmen produzieren ein homogenes Gut keine Fixkosten; identische, konstante Grenzkosten c1 = c2 = c simultane Wahl der Mengen, x1 ∈ R+ , x2 ∈ R+ Preis ergibt sich bei Gesamtproduktion x = x1 + x2 aus der inversen Nachfragefunktion: P(x) = a − b · (x1 + x2 ) Gewinnfunktion von Unternehmen i, i ∈ {1, 2}: πi = [a − b · (xi + xj )] · xi − c · xi Klaus M. Schmidt (LMU München) 2. Statische Spiele mit vollständiger Information Spieltheorie, Wintersemester 2014/15 32 / 82 Bestimmung der Reaktionsfunktion (Beste-Antwort-Funktion) von Unternehmen 1: max[a − b · (x1 + x2 )] · x1 − c · x1 x1 Bedingung erster Ordnung für Maximum: ∂π1 = a − b · (x1 + x2 ) − bx1 − c = 0 ∂x1 Reaktionsfunktion: x1∗ (x2 ) = R1 (x2 ) = 1 (a − c − bx2 ) 2b Analog für Unternehmen 2: x2∗ (x1 ) = R2 (x1 ) = Klaus M. Schmidt (LMU München) 1 (a − c − bx1 ) 2b 2. Statische Spiele mit vollständiger Information Spieltheorie, Wintersemester 2014/15 33 / 82 Nash-Gleichgewicht muss wechselseitig beste Antwort sein, d.h. x1 = 1 (a − c − bx2 ) 2b x2 = 1 (a − c − bx1 ) 2b müssen gleichzeitig erfüllt sein. Auflösen ergibt: x1∗ = a−c = x2∗ 3b Dieses Gleichgewicht wird auch Cournot-Gleichgewicht oder Cournot-Nash-Gleichgewicht genannt. Klaus M. Schmidt (LMU München) 2. Statische Spiele mit vollständiger Information Spieltheorie, Wintersemester 2014/15 34 / 82 x2 ...... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .................................................................................................................. x1 Abb. 2.9: Reaktionsfunktionen und Cournot-Gleichgewicht Der Schnittpunkt der beiden Reaktionsfunktionen ist das Cournot-Gleichgewicht. Klaus M. Schmidt (LMU München) 2. Statische Spiele mit vollständiger Information Spieltheorie, Wintersemester 2014/15 35 / 82 Bemerkungen: 1. Ineffizienz des Cournot-Gleichgewicht Im Cournotgleichgewicht macht jedes Unternehmen positive Gewinne: 2b(a − c) a−c (a − c)2 πi = [a − 2bx ∗ ]x ∗ − cx ∗ = a − −c = > 0 3b 3b 9b Die beiden Unternehmen könnten aber noch höhere Gewinne machen, wenn Sie ein Kartell bilden würden. Monopolproblem: max[a − bx]x − cx =⇒ a − c − 2bx = 0 =⇒ x M = x a−c 2b Monopolgewinn: π M = [a − b a−c a−c (a − c)2 − c] = 2b 2b 4b Wenn jedes Unternehmen xi = Unternehmen den Gewinn xM 2 (a−c)2 8b produzieren würde, würde jedes > (a−c)2 9b machen. Warum ist das Kartell nicht stabil? Klaus M. Schmidt (LMU München) 2. Statische Spiele mit vollständiger Information Spieltheorie, Wintersemester 2014/15 36 / 82 2. Dynamische Interpretation des Cournot-Gleichgewichts Das Cournot-Gleichgewicht ist von Cournot selbst als Ergebnis eines dynamischen Anpassungsprozesses interpretiert worden: Jedes Unternehmen erwartet, dass der Konkurrent in der nächsten Periode dieselbe Mengenentscheidung wie in dieser Periode treffen wird. ⇒ x1t+1 = R1 (x2t ) ⇒ x2t+1 = R2 (x1t ) Diese Gleichungen beschreiben ein dynamisches System. In unserem linearen Beispiel konvergiert dieses System zum Cournot-Gleichgewicht. Diese Interpretation ist jedoch nicht überzeugend: Jedes Unternehmen bildet in jeder Periode systematisch falsche Erwartungen, ohne im Zeitablauf zu lernen. Da bessere Erwartungsbildung zu höherem Gewinn führt, hat jedes Unternehmen einen starken Anreiz seine Erwartungen zu verbessern. Nur konsistente Erwartungen können nicht weiter verbessert werden. Klaus M. Schmidt (LMU München) 2. Statische Spiele mit vollständiger Information Spieltheorie, Wintersemester 2014/15 37 / 82 3. Cournot-Gleichgewicht und IESDS Das Cournot-Gleichgewicht ist die einzige Strategienkombination, die iterierte Eliminierung von streng dominierten Strategien überlebt. Siehe Übungsaufgabe. 4. Cournot-Gleichgewicht mit mehr als zwei Unternehmen Man kann auch leicht das Cournot-Gleichgewicht in einem Spiel mit mehr als zwei Unternehmen bestimmen. Wenn die Zahl der Spieler im Cournot-Oligopol gegen ∞ geht, dann konvergiert der Gleichgewichtspreis gegen die Grenzkosten. Siehe Übungsaufgabe. Klaus M. Schmidt (LMU München) 2. Statische Spiele mit vollständiger Information Spieltheorie, Wintersemester 2014/15 38 / 82 2.7.3 Bertrand-Duopol (Joseph Bertrand, 1883): Modell wie bei Cournot, aber: Unternehmen wählen Preise, p1 ∈ R+ , p2 ∈ R+ . Alle Konsumenten kaufen beim Anbieter mit dem niedrigsten Preis p = min{p1 , p2 }, der die gesamte Nachfrage X (p) zu diesem Preis bedienen muss. Bei gleichen Preisen teilen sich die Konsumenten 50:50 zwischen den beiden Anbietern auf. Auszahlungsfunktion von Unternehmen i (pi − c)X (pi ) Πi = 12 (pi − c)X (pi ) 0 Klaus M. Schmidt (LMU München) ∈ {1, 2}: wenn pi < pj wenn pi = pj wenn pi > pj 2. Statische Spiele mit vollständiger Information Spieltheorie, Wintersemester 2014/15 39 / 82 Satz 2.2 Es existiert ein eindeutiges Nash-Gleichgewicht, in dem die Unternehmen p1 = p2 = c wählen. Jedes Unternehmen bedient den halben Markt und macht Nullgewinne. Beweis von Satz 2.2: Klaus M. Schmidt (LMU München) 2. Statische Spiele mit vollständiger Information Spieltheorie, Wintersemester 2014/15 40 / 82 Bemerkungen: 1) Hier ist das eindeutige Nash-GG ein Gleichgewicht in schwach dominierten Strategien. 2) Das Marktergebnis ist dasselbe wie bei vollkommener Konkurrenz: Preis gleich Grenzkosten, Nullgewinne. 3) Manche Autoren sprechen von Bertrand- und Cournot-Gleichgewichten. Besser: Nash-Gleichgewichte im Cournot- bzw. Bertrand-Spiel. 4) Das Resultat wird Bertrand-Paradox genannt, weil es unplausibel scheint, dass bei nur zwei Anbietern keine Marktmacht herrscht. 5) Das extreme Resultat beruht auf der extremen Preiselastizität der Nachfrage bei einem homogenem Gut. 6) Es gibt Marktsituationen, die durch das Bertrand-Modell sehr gut beschrieben werden. Beispiel: Bieterwettbewerb bei Auktion (z.B. für öffentlichen Auftrag). 7) Vergleichen Sie das Bertrand-Spiel mit dem Gefangenendilemma und dem Cournot-Spiel. 8) Hausaufgabe: Welche Gleichgewichte gibt es, wenn es eine kleinste Geldeinheit für den Preis gibt (z.B. 1 Cent)? Nehmen Sie an, dass c = 0. Klaus M. Schmidt (LMU München) 2. Statische Spiele mit vollständiger Information Spieltheorie, Wintersemester 2014/15 41 / 82 2.7.4 Bertrand-Duopol mit differenzierten Gütern Betrachten wir jetzt ein Duopol, in dem beide Unternehmen Preise setzen, in dem die Güter aber differenziert sind. Die Nachfragefunktionen der beiden Unternehmen sind: x1 (p1 , p2 ) = a − p1 + bp2 x2 (p1 , p2 ) = a − p2 + bp1 Beide Unternehmen haben dieselbe Kostenfunktion c(xi ) = cxi Wir nehmen an, dass 0 < b < 1 und a > (1 − b)c (warum?). Unternehmen i ∈ {1, 2} maximiert: max πi (pi , pj ) = pi xi (pi , pj ) − cxi (pi , pj ) = (pi − c)[a − pi + bpj ] pi ≥0 Klaus M. Schmidt (LMU München) 2. Statische Spiele mit vollständiger Information Spieltheorie, Wintersemester 2014/15 42 / 82 Die BEO für ein Gewinnmaximum verlangt: ∂πi = a − 2pi + bpj + c = 0 ∂pi Daraus ergeben sich die Reaktionsfunktionen: pi = 1 (a + bpj + c) 2 pj = 1 (a + bpi + c) 2 Die Lösung dieses Gleichungssystems ergibt die Gleichgewichtspreise pi∗ = pj∗ = Klaus M. Schmidt (LMU München) a+c 2−b 2. Statische Spiele mit vollständiger Information Spieltheorie, Wintersemester 2014/15 43 / 82 p2 ....... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .................................................................................................................. p1 Abb. 2.10: Reaktionsfunktionen bei differenzierten Gütern Klaus M. Schmidt (LMU München) 2. Statische Spiele mit vollständiger Information Spieltheorie, Wintersemester 2014/15 44 / 82 Bemerkungen: 1. Der Preis ist höher als die Grenzkosten (zeigen!), d.h., die Unternehmen machen positive Gewinne. 2. Im Gegensatz zum Standard-Bertrand-Modell ist die Preiselastizität der Nachfrage für jedes Unternehmen kleiner als unendlich. 3. Die Strategievariablen der beiden Firmen sind strategische Komplemente: Je höher der Preis meines Konkurrenten, um so höher ist mein eigener optimaler Preis. 4. Im Cournot-Modell sind die Strategievariablen der beiden Firmen strategische Substitute: Je höher die Menge meines Konkurrenten, um so geringer ist meine eigene optimale Menge. 5. Wenn b = 0, setzen beide Unternehmen den Monopolpreis (warum?). Klaus M. Schmidt (LMU München) 2. Statische Spiele mit vollständiger Information Spieltheorie, Wintersemester 2014/15 45 / 82 2.7.5 Ein Bankenzusammenbruch Eine Bank finanziert ein langfristiges Projekt, das K Geldeinheiten kostet und R > K Geldeinheiten zum Zeitpunkt 2 auszahlt. Die Bank kann sich aber nur kurzfristig finanzieren. Sie hat Einlagen von zwei Investoren in Höhe von je K /2. Jeder Investor kann entweder K /2 bereits zum Zeitpunkt 1 zurückverlangen oder R/2 zum Zeitpunkt 2. Wenn ein Investor sein Geld in Periode 1 zurückverlangt, muss die Bank das Projekt vorzeitig liquidieren und kann nur r einnehmen, r < K < R. Klaus M. Schmidt (LMU München) 2. Statische Spiele mit vollständiger Information Spieltheorie, Wintersemester 2014/15 46 / 82 2 @ 1 @ @ run wait run r r 2, 2 r− K K 2, 2 wait K 2, r− K 2 R R 2, 2 Abb. 2.11: Möglicher Bankenzusammenbruch Hier gibt es zwei Nash-Gleichgewichte in reinen Strategien: (run,run) und (wait,wait). Der Bankenzusammenbruch wird durch die Erwartung der Sparer ausgelöst, dass die anderen Sparer ihr Geld abziehen werden. Gegegeben, dass die anderen ihr Geld abziehen, sollte ich auch mein Geld abziehen, selbst wenn dann die Bank zusammenbricht. Klaus M. Schmidt (LMU München) 2. Statische Spiele mit vollständiger Information Spieltheorie, Wintersemester 2014/15 47 / 82 2.7.6 Politischer Wettbewerb Das folgende Modell von Macht-orientierten Parteien geht auf Hotelling (1929) und Downs (1957) zurück. Es gibt zwei Parteien, A und B. Jede Partei interessiert sich ausschließlich dafür, die nächste Wahl zu gewinnen. Das politische Spektrum wird durch das Intervall [0, 1] beschrieben. Dabei ist die Position “0” ganz links und die Position “1” ganz rechts. Jeder Wähler hat im politischen Spektrum [0, 1] eine Position, die ihm am liebsten ist. Die Wähler sind über dem Intervall [0, 1] gleich verteilt. Die beiden Parteien müssen sich vor der Wahl auf eine Position im Links-Rechts Spektrum festlegen und diese Position nach der Wahl auch umsetzen. Wenn die Partei i ∈ {A, B}, die die Wahl gewinnt, die Position si ∈ [0, 1] vertritt, erleidet ein Wähler mit der präferierten Position x ∈ [0, 1] einen Nutzenverlust in Höhe von | x − si |. Darum wird jeder Wähler die Partei wählen, die seiner Position am nächsten steht. Klaus M. Schmidt (LMU München) 2. Statische Spiele mit vollständiger Information Spieltheorie, Wintersemester 2014/15 48 / 82 Diejenige Partei, die die meisten Stimmen auf sich vereinigt, wird gewählt und bekommt die Auszahlung R. Der Wahlverlierer bekommt eine Auszahlung von 0. Bei Stimmengleichheit gewinnt jede Partei mit Wahrscheinlichkeit 0,5. Die beiden Parteien müssen zeitgleich und unabhängig voneinander entscheiden, welche Positionen sA und sB sie vertreten wollen. Auszahlungsfunktion von Partei i ∈ {A, B}: 1 wenn si < sj si + 2 (sj − si ) 1 Ui = 2 wenn si = sj 1 1 − si + 2 (si − sj ) wenn si > sj 0 si si + si +sj 2 sj 1 Abb. 2.12: Politischer Wettbewerb Klaus M. Schmidt (LMU München) 2. Statische Spiele mit vollständiger Information Spieltheorie, Wintersemester 2014/15 49 / 82 Was ist das eindeutige Nash-Gleichgewicht in diesem Spiel? Angenommen: sB < 12 . Dann möchte Partei A die Position sB + einnehmen. sB > 12 . Dann möchte Partei A die Position sB − einnehmen. sB = 12 . Dann möchte Partei A die Position 0, 5 einnehmen. ⇒ Das einzige Nash-Gleichgewicht in diesem Spiel ist, dass beide Parteien sA = sB = 12 wählen. Was ändert sich an diesem Resultat, wenn die Verteilung der Wähler keine Gleichverteilung ist? Warum wird dieses Ergebnis auch Medianwählertheorem genannt? Wie gut sagt dieses Theorem die Wirklichkeit voraus? Klaus M. Schmidt (LMU München) 2. Statische Spiele mit vollständiger Information Spieltheorie, Wintersemester 2014/15 50 / 82 Ideologie-orientierte Parteien Bisher hatten wir angenommen, dass sich die Parteien nur für die Macht interessieren. Jetzt machen die umgekehrte (ebenfalls extreme) Annahme, dass sich die Parteien nur für ihre jeweilige Ideologie interessieren. Partei A möchte am liebsten die Position xA < xB > 12 vertreten. 1 2 und Partei B die Position Wenn von der gewählten Regierung (egal ob diese von Partei A oder B gestellt wird) die Politik s ∈ [0, 1] durchgeführt wird, sind die politischen Auszahlungen der beiden Parteien UA = −|s − xA | B = −|s − xB | U Die Parteien müssen sich auf eine Politik sA und sB festlegen. Diese Positionen können von ihren eigentlichen Position abweichen, müssen nach der Wahl aber “eins-zu-eins” umgesetzt werden. Die Wähler entscheiden wie oben. Die Partei mit der höchsten Stimmenzahl gewinnt und setzt ihre Politik si um. Bei Stimmengleichheit wird die Politik s = 12 [sA + sB ] realisiert. Klaus M. Schmidt (LMU München) 2. Statische Spiele mit vollständiger Information Spieltheorie, Wintersemester 2014/15 51 / 82 Bestimmen Sie die Menge der Nash-Gleichgewichte für dieses Spiel. Klaus M. Schmidt (LMU München) 2. Statische Spiele mit vollständiger Information Spieltheorie, Wintersemester 2014/15 52 / 82 2.8 Gemischte Strategien Das Elfmeter-Spiel: Der Torwart muss entscheiden, ob er nach links oder rechts springt. Der Schütze muss entscheiden, ob er nach links oder rechts schießt. Wenn der Torwart in dieselbe Ecke springt, in die der Schütze schießt, hält er den Ball. Wenn der Torwart in die andere Ecke springt, erzielt der Schütze ein Tor. Beide Entscheidungen fallen gleichzeitig. Klaus M. Schmidt (LMU München) 2. Statische Spiele mit vollständiger Information Spieltheorie, Wintersemester 2014/15 53 / 82 Schütze @ Links Torwart @ @ Rechts Links 1, -1 -1, 1 Rechts -1, 1 1, -1 Abb. 2.13: Das Elfmeter-Spiel Gibt es ein Nash-Gleichgewicht in diesem Spiel? Klaus M. Schmidt (LMU München) 2. Statische Spiele mit vollständiger Information Spieltheorie, Wintersemester 2014/15 54 / 82 Definition 2.6 (Gemischte Strategie) Betrachte ein Spiel in Normalform G mit endlichen Strategienräumen Si . Sei Si = {si1 , . . . , siKi }. Eine gemischte Strategie für Spieler i ist eine Wahrscheinlichkeitsverteilung σi = (σi1 , . . . , σiKi ) über Si , wobei 0 ≤ σik ≤ 1 für k = 1, . . . , Ki und σi1 + . . . + σiKi = 1. Bemerkungen: 1) Eine reine Strategie ist nur der Extremfall einer gemischten Strategie: die Wahrscheinlichkeit einer Strategie ist 1, die aller anderen ist 0. 2) Der Träger einer gemischten Strategie ist die Menge all der Aktionen, die mit positiver Wahrscheinlichkeit gespielt werden. 3) Beachten Sie, dass die Spieler bei gemischten Strategien nur unabhängig voneinander randomisieren können. 4) Eine gemischte Strategie kann eine reine Strategie streng dominieren: Klaus M. Schmidt (LMU München) 2. Statische Spiele mit vollständiger Information Spieltheorie, Wintersemester 2014/15 55 / 82 2 @ 1 @ @ ` r O 3, - 0, - M 0, - 3, - U 1, - 1, - Abb. 2.14: Dominanz einer gemischten Strategie U wird weder von O noch M dominiert, aber die gemischte Strategie, die O mit Wahrscheinlichkeit 12 und M mit 21 spielt, dominiert U streng! Klaus M. Schmidt (LMU München) 2. Statische Spiele mit vollständiger Information Spieltheorie, Wintersemester 2014/15 56 / 82 5) Eine reine Strategie von Spieler 1, die gegen keine reine Strategie von Spieler 2 eine beste Antwort ist, kann doch gegen eine gemischte Strategie von Spieler 2 eine beste Antwort sein: 2 @ r ` 1 @ @ O 3, - 0, - M 0, - 3, - U 2, - 2, - Abb. 2.15: Beste Antwort gegen gemischte Strategie Wenn Spieler 2 ` mit Wahrscheinlichkeit beste Antwort von Spieler 1. Klaus M. Schmidt (LMU München) 1 2 und r mit 2. Statische Spiele mit vollständiger Information 1 2 spielt, ist U eine Spieltheorie, Wintersemester 2014/15 57 / 82 Satz 2.3 Im “Elfmeter-Spiel” ist das einzige Nash-Gleichgewicht ein Gleichgewicht in gemischten Strategien, in dem beide Spieler mit Wahrscheinlichkeit 12 Links bzw. Rechts wählen. Beachten Sie: Eine gemischte Strategie ist eine beste Antwort gegen ein (gemischtes) Strategienprofil der Mitspieler genau dann, wenn jedes Element des Trägers eine (reine) beste Antwort ist. (Warum?) Klaus M. Schmidt (LMU München) 2. Statische Spiele mit vollständiger Information Spieltheorie, Wintersemester 2014/15 58 / 82 Beweis von Satz 2.3: Klaus M. Schmidt (LMU München) 2. Statische Spiele mit vollständiger Information Spieltheorie, Wintersemester 2014/15 59 / 82 Graphische Darstellung: q ....... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .................................................................................................................. p Abb. 2.16: Beste-Antwort-Korrespondenz beim Elfmeter-Spiel Einziger Schnittpunkt ist p = q = 21 . Klaus M. Schmidt (LMU München) 2. Statische Spiele mit vollständiger Information Spieltheorie, Wintersemester 2014/15 60 / 82 Systematische Bestimmung aller Nash-Gleichgewichte Betrachte erneut den “Kampf der Geschlechter”, aber diesmal mit allgemeinen Auszahlungen: p. 2 1@ @ Bo Ba Bo X1 , X2 0, 0 Ba 0, 0 Y1 , Y2 ....... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .................................................................................................... ... q Abb. 2.17: Alle Nash-GGe im Kampf der Geschlechter Klaus M. Schmidt (LMU München) 2. Statische Spiele mit vollständiger Information Spieltheorie, Wintersemester 2014/15 61 / 82 Sei p die Wahrscheinlichkeit, mit der Spieler 1 zum Boxen geht, und q die W., mit der Spieler 2 zum Boxen geht. u1 (Bo) = q · X1 + (1 − q) · 0 = qX1 u1 (Ba) = q · 0 + (1 − q) · Y1 = (1 − q)Y1 u1 (Bo) ≥ u1 (Ba) ⇔ qX1 ≥ (1 − q)Y1 ⇔ q≥ Y1 X1 + Y1 u2 (Bo) ≥ u2 (Ba) ⇔ pX2 ≥ (1 − p)Y2 ⇔ p≥ Y2 X2 + Y2 Analog: Klaus M. Schmidt (LMU München) 2. Statische Spiele mit vollständiger Information Spieltheorie, Wintersemester 2014/15 62 / 82 Bemerkungen: 1) Hier gibt es zwei Nash-GGe in reinen Strategien und eines in gemischten Strategien. 2) Im gemischten Nash-GG wählt Spieler 1 “Boxen” mit Wahrscheinlichkeit 2 und Spieler 2 die Strategie “Boxen” mit Wahrscheinlichkeit p∗ = X2Y+Y 2 Y1 ∗ q = X1 +Y1 . Beachten Sie, dass im Gleichgewicht p∗ unabhängig von den Auszahlungen X1 , Y1 von Spieler 1 ist: Wenn X1 steigt, wird Spieler 1 deshalb nicht mit größerer Wahrscheinlichkeit zum Boxen gehen. p∗ hängt nur von den Auszahlungen X2 , Y2 des Gegenspielers ab. Jeder Spieler wählt seine Randomisierungswahrscheinlichkeit so, dass der andere Spieler indifferent gehalten wird! 3) Man kann zeigen, dass für (fast) alle Spiele gilt: Wenn ein Spiel eine endliche Zahl von Gleichgewichten hat, dann ist die Anzahl der Nash-Gleichgewichte ungerade. Nützlicher Test, ob man alle Nash-GGe gefunden hat. Klaus M. Schmidt (LMU München) 2. Statische Spiele mit vollständiger Information Spieltheorie, Wintersemester 2014/15 63 / 82 Interpretation von gemischten Strategien Gemischte Strategien sind oft als “unnatürlich” kritisiert worden. Beachten Sie, dass ein Spieler im Gleichgewicht indifferent zwischen der gemischten Strategie und den reinen Strategien im Träger der gemischten Strategie ist. Mögliche Rechtfertigungen für gemischte Strategien: 1) In vielen Spielen wird von “guten Spielern” tatsächlich randomisiert (z.B. beim Elfmeter im Fußball). Prüfen Sie sich selbst: Wie spielen Sie “Stein, Schere, Papier”? 2) Man kann sich vorstellen, dass jeder Spieler eine reine Strategie spielt, dass sein Gegenspieler aber unsichere Erwartungen über diese Strategie hat. Dieses Argument steht jedoch im Widerspruch zur Philosophie des Nash-Gleichgewichts, weil hier die Erwartungen miteinander konsistent und korrekt sein sollen. Klaus M. Schmidt (LMU München) 2. Statische Spiele mit vollständiger Information Spieltheorie, Wintersemester 2014/15 64 / 82 3) Es gibt unvollständige Information über die Auszahlungsfunktion der Gegenspieler. Jeder Spieler wählt eine reine Strategie, die von seinem “Typ” abhängt, aber sein Typ ist dem Gegenspieler nicht bekannt. Man kann zeigen: Ein gemischtes Gleichgewicht ist der Grenzwert einer Folge von Gleichgewichten in reinen Strategien eines Spiels mit unvollständiger Information, wenn die Informationsunvollständigkeit gegen 0 geht. Harsanyi (1973): Purification Theorem. Klaus M. Schmidt (LMU München) 2. Statische Spiele mit vollständiger Information Spieltheorie, Wintersemester 2014/15 65 / 82 2.9 Wer ruft die Polizei? Stellen Sie sich die folgende Situation vor: Sie werden nachts durch lautes Schreien auf der Straße geweckt. Sie machen das Licht an, gehen zum Fenster und beobachten eine gefährliche Schlägerei zwischen zwei Personen. Sie beobachten auch, dass in N − 1 anderen Wohnungen das Licht angegangen ist und Nachbarn zum Fenster gekommen sind. Jeder der N Nachbarn muss entscheiden, ob er die Polizei anruft. Wenn er das tut, muss er auch als Zeuge aussagen. Jeder der Nachbarn wäre bereit die Kosten des Anrufs und der Zeugenaussage auf sich zu nehmen, damit die Polizei die Schlägerei beendet, aber jeder Nachbar hätte es noch lieber, wenn ein anderer Nachbar das erledigt. Klaus M. Schmidt (LMU München) 2. Statische Spiele mit vollständiger Information Spieltheorie, Wintersemester 2014/15 66 / 82 Dieses Spiel hat die folgende Struktur: Spieler: N Nachbarn Strategien: “Anrufen”, “Schweigen” Auszahlungen von Spieler i ∈ {1, . . . , N}: I I I Wenn niemand die Polizei anruft: Ui = 0 Wenn i nicht die Polizei anruft, aber wenigstens ein anderer anruft: Ui = v > 0 Wenn i die Polizei anruft: Ui = v − c > 0 Klaus M. Schmidt (LMU München) 2. Statische Spiele mit vollständiger Information Spieltheorie, Wintersemester 2014/15 67 / 82 Gibt es ein Gleichgewicht in reinen Strategien? Gibt es ein symmetrisches Gleichgewicht in reinen Strategien? Gibt es ein symmetrisches Gleichgewicht in gemischten Strategien? Klaus M. Schmidt (LMU München) 2. Statische Spiele mit vollständiger Information Spieltheorie, Wintersemester 2014/15 68 / 82 Bestimmung des GG in gemischten Strategien: In einem symmetrischen, gemischten GG ruft jeder Spieler die Polizei mit derselben Wahrscheinlichkeit p∗ ∈ (0, 1). Also muss jeder Spieler indifferent sein, ob er anruft oder nicht. Darum muss gelten: v −c = 0 · W (niemand sonst ruft an) +v · W (wenigstens ein anderer ruft an) bzw.: v −c = 0 · W (niemand sonst ruft an) +v · (1 − W (niemand sonst ruft an)) bzw.: c = v · W (niemand sonst ruft an) Klaus M. Schmidt (LMU München) 2. Statische Spiele mit vollständiger Information Spieltheorie, Wintersemester 2014/15 69 / 82 Die Wahrscheinlichkeit, dass keiner der anderen anruft ist (1 − p∗ )N−1 . Also muss im GG gelten: c = (1 − p∗ )N−1 v bzw.: p∗ = 1 − 1 c N−1 v Beachten Sie: Die Wahrscheinlichkeit, dass Spieler i die Polizei ruft steigt mit v fällt mit c fällt mit N Klaus M. Schmidt (LMU München) 2. Statische Spiele mit vollständiger Information Spieltheorie, Wintersemester 2014/15 70 / 82 Wie verändert sich die W., dass die Polizei von irgendjemandem gerufen wird, wenn N steigt? W (jemand ruft an) = 1 − W (keiner ruft an) Die W., dass niemand anruft, ist gleich der W., dass i nicht anruft und dass kein anderer j 6= i anruft. W (keiner ruft an) = W (i ruft nicht an) ·W (niemand sonst ruft an) Aus der Gleichgewichtsbedingung wissen wir, dass W (niemand sonst ruft an) = (1 − p∗ )N−1 = c v Dieser Ausdruck ist also unabhängig von N. Klaus M. Schmidt (LMU München) 2. Statische Spiele mit vollständiger Information Spieltheorie, Wintersemester 2014/15 71 / 82 Wir wissen auch, dass W (i ruft nicht an) = 1 − p∗ = 1 c N−1 v mit N steigt. Also fällt die Wahrscheinlichkeit, dass die Polizei gerufen, wird mit der Zahl der Zeugen! Bemerkungen: Dieses Resultat ist bemerkenswert. Es erklärt, warum die Wahrscheinlichkeit, dass wenigstens ein Außenstehender hilft, fällt, wenn die Anzahl der Außenstehenden steigt. Wenn ein Außenstehender dazu kommt, gibt es zwei Effekte: I I I Es gibt eine zusätzliche Person, die mit positiver Wahrscheinlichkeit hilft. Dadurch steigt die Wahrscheinlichkeit, dass wenigstens eine Person hilft. Alle bisherigen Personen haben jetzt einen geringeren Anreiz zu helfen, weil sich jeder noch mehr auf die anderen verlässt. Dieser Effekt geht in die entgegengesetzte Richtung. Der zweite Effekt überkompensiert den ersten! Klaus M. Schmidt (LMU München) 2. Statische Spiele mit vollständiger Information Spieltheorie, Wintersemester 2014/15 72 / 82 2.10 Existenz von Nash-Gleichgewichten Unter welchen Umständen können wir sicher sein, dass in einem Spiel ein Nash-Gleichgewicht existiert? a) Solange wir nicht wissen, ob Nash-Gleichgewichte existieren, ist es wenig sinnvoll, über die allgemeinen Eigenschaften solcher Gleichgewichte nachzudenken. b) Wenn Nash-Gleichgewichte in natürlichen Spielen nicht existieren würden, dann wäre etwas faul mit unserer interpersonellen Entscheidungstheorie. Wie sollten sich rationale Individuen dann verhalten? Klaus M. Schmidt (LMU München) 2. Statische Spiele mit vollständiger Information Spieltheorie, Wintersemester 2014/15 73 / 82 John Nash hat gezeigt, dass unter relativ schwachen hinreichenden Bedingungen wenigstens ein Nash-Gleichgewicht existiert: Satz 2.4 (Existenz) Jedes Normalform-Spiel mit einer endlichen Anzahl von Spielern und endlichen Strategienräumen hat wenigstens ein Nash-Gleichgewicht in reinen oder gemischten Strategien. Bemerkungen: 1) Dieser Existenzsatz zeigt, dass in einer großen Klasse von Spielen Nash-Gleichgewichte existieren. 2) Dieser Satz ist später erheblich verallgemeinert worden (für unendliche Strategienräume, stetige Nutzenfunktionen etc.). 3) Die Beweise dieser Sätze beruhen auf Fixpunktargumenten, die wir an dieser Stelle nicht zeigen werden. Klaus M. Schmidt (LMU München) 2. Statische Spiele mit vollständiger Information Spieltheorie, Wintersemester 2014/15 74 / 82 2.11 Warum sollten die Spieler ein Nash-Gleichgewicht spielen? 2.11.1 Rationalität und Nash-Gleichgewicht Impliziert Rationalität plus Common Knowledge von Rationalität, dass ein Nash-Gleichgewicht gespielt werden sollte? Nein! Rationale Spieler können falsche Erwartungen hegen. Aber: Nur ein Nash-Gleichgewicht hat die Eigenschaft, dass die Erwartungen der Spieler miteinander konsistent sind. Bei jeder Strategienkombination, die kein Nash-Gleichgewicht ist, muss wenigstens ein Spieler einen Fehler machen: entweder wählt er keine beste Antwort, gegeben seine Erwartungen, oder er wählt eine beste Antwort, aber seine Erwartungen sind falsch. Klaus M. Schmidt (LMU München) 2. Statische Spiele mit vollständiger Information Spieltheorie, Wintersemester 2014/15 75 / 82 Wenn ein eindeutiges Nash-Gleichgewicht existiert, kann man argumentieren, dass es von rationalen Spielern, die konsistent sein wollen, gespielt werden sollte, denn: 1) Nash-GG ist die einzige rationalisierbare Strategienkombination mit konsistenten Erwartungen. 2) Nash-GG ist die einzige Strategienkombination, die selbst-durchsetzend wäre, wenn sich die Spieler vorab über ihre Strategien unterhalten könnten. Klaus M. Schmidt (LMU München) 2. Statische Spiele mit vollständiger Information Spieltheorie, Wintersemester 2014/15 76 / 82 Bemerkungen: Wenn es mehrere Nash-Gleichgewichte gibt, reicht diese Argumentation nicht mehr aus. Jetzt müssen wir zusätzliche Anforderungen an das Gleichgewichtskonzept stellen, bis nur noch ein Gleichgewicht übrig bleibt, das alle Anforderungen erfüllt. Beispiele für solche Verfeinerungen des Gleichgewichtskonzepts (equilibrium refinements): “Das Gleichgewicht eines symmetrischen Spiels sollte symmetrisch sein” oder “Das Gleichgewichtsergebnis sollte von keinem anderen Gleichgewichtsergebnis Pareto-dominiert werden”. Harsanyi und Selten (1988) haben eine axiomatische Theorie entwickelt, das für jedes Spiel ein eindeutiges Gleichgewicht als dasjenige auszeichnet, das von (hyper-)rationalen Spielern gespielt werden sollte. Selten interpretiert diese Theorie aber als normative Theorie. Wenn wir das Verhalten von tatsächlichen Spielern voraussagen wollen, müssen wir verstehen, wie beschränkt rationale Spieler lernen. Klaus M. Schmidt (LMU München) 2. Statische Spiele mit vollständiger Information Spieltheorie, Wintersemester 2014/15 77 / 82 2.11.2 Lernenprozesse und Nash-Gleichgewicht Lernmodelle gehen davon aus, dass tatsächliche Spieler nur beschränkt rational sind, dass sie aber versuchen, ihr Verhalten im im Zeitablauf zu verbessern. Einige einfache Lernprozesse: Spiele eine beste Antwort gegen das, was die Gegenspieler in der letzten Periode getan haben. Imitiere die Stratgegie eines Gegenspielers, der in der letzten Periode am erfolgreichsten von allen Spielern war. Experimentieren: Wähle in jeder Periode mit einer kleinen Wahrscheinlichkeit eine (zufällig ausgewählte) neue Strategie. Wenn die neue Strategie zu einer höheren Auszahlung führt als die alte Strategie, dann wechsele zu der neuen Strategie, sonst bleibe bei der alten Strategie. Klaus M. Schmidt (LMU München) 2. Statische Spiele mit vollständiger Information Spieltheorie, Wintersemester 2014/15 78 / 82 Es kann gezeigt werden, dass diese sehr einfachen Lernprozesse in vielen Situationen langfristig dazu führen, dass die Spieler ein Nash-Gleichgewicht spielen. Wenn es mehrere Nash-Gleichgewichte gibt, kann es sein, dass bestimmte Lernprozesse immer zu demselben dieser Gleichgewichte führen. Hier erfolgt die Gleichgewichtsauswahl durch den Lernprozess. Klaus M. Schmidt (LMU München) 2. Statische Spiele mit vollständiger Information Spieltheorie, Wintersemester 2014/15 79 / 82 Beispiel für einen tatsächlichen Lernprozess Schätze zwei Drittel des Durchschnitts: Jeder muss eine ganze Zahl zwischen 1 und 100 wählen. Derjenige, dessen Zahl am nächsten an 2/3 des Durchschnitts aller gewählten Zahlen liegt, hat gewonnen. Alle Spieler erfahren den Durchschnitt der gewählten Zahlen und welche Zahl gewonnen hat. Dann spielen Sie das Spiel noch einmal, usw. Wie haben Sie in diesem Spiel Ihr Verhalten im Zeitablauf angepasst? Wohin konvergiert das Verhalten? Keynes hat ein ähnliches Spiel beschrieben: Ein “Beauty Contest", bei dem es darauf ankommt, diejenige Schönheit auszuwählen, die von den meisten anderen als größte Schönheit betrachtet wird. Hier gibt es offensichtlich viele Gleichgewichte. Keynes hat dieses Spiel mit Finanzmärkten verglichen, auf denen jeder Anleger diejenige Aktie kaufen will, deren Kurs am stärksten steigen wird (weil viele andere Anleger sie auch kaufen). Das kann erklären, warum Finanzmärkte oft volatil und instabil sind. Klaus M. Schmidt (LMU München) 2. Statische Spiele mit vollständiger Information Spieltheorie, Wintersemester 2014/15 80 / 82 Fazit: Wenn erfahrene Spieler in einer stabilen Umgebung interagieren, ist das Nash-Gleichgewicht ein gutes Konzept, um tatsächliches Verhalten vorauszusagen. Wenn die Spieler jedoch unerfahren sind und sich zum ersten Mal in einer komplexen strategischen Situation befinden, ist es unwahrscheinlich, dass ein Nash-Gleichgewicht gespielt wird. Wenn Sie nicht glauben, dass Ihre Gegenspieler das Nash Gleichgewicht, kann es für Sie optimal sein, ebenfalls vom Nash Gleichgewicht abzuweichen. Klaus M. Schmidt (LMU München) 2. Statische Spiele mit vollständiger Information Spieltheorie, Wintersemester 2014/15 81 / 82 2.11.3 Evolution und Nash-Gleichgewicht In der theoretischen Biologie spielt die evolutionäre Spieltheorie eine wichtige Rolle, um das Verhalten von Tieren und die Evolution von Eigenschaften einer Species zu erklären. Die evolutionäre Spieltheorie geht davon aus, dass Strategien genetisch programmiert sind und vererbt werden. Sie zeigt, dass nur solche Strategien evolutionär stabil sind, die ein Gleichgewicht bilden. Die evolutionäre Spieltheorie kann erklären, warum die Evolution zu offensichtlich ineffizienten Entwicklungen führen kann: Warum kämpfen Tiere um Territorien oder Paarungspartner, auch wenn sie sich dabei mit positiver Wahrscheinlichkeit stark verletzen können? Warum entwickeln manche Tier- und Pflanzenarten Eigenschaften, die eine Behinderung darstellen (z.B. der Pfauenschwanz)? Wir können die evolutionäre Spieltheorie in dieser Vorlesung leider nicht vertiefen. Klaus M. Schmidt (LMU München) 2. Statische Spiele mit vollständiger Information Spieltheorie, Wintersemester 2014/15 82 / 82