Überblick Mehrere Entscheider agieren simultan, vollständige Information Alle Entscheider müssen gleichzeitig Vorstellungen über Gegner entwickeln Nullsummenspiele mit simultanen Zügen Jetzt: Gleichgewichte sind eindeutig und soziale Präferenzen sind sekundär v.a. wenn sich Auszahlungen zu Null/Konstante addieren (Nullsummenspiel) strategische Überlegungen sind dominant (sonst ergeben sich zusätzlich strategische und soziale Koordinationsprobleme – kommt später) Themen Ratespiele, Strategische Dominanz, Nash-Gleichgewicht gemischte Strategien, Quantal-response Gleichgewichte, Level-k Matching pennies, gemischte Gleichgewichte, Existenz Yves Breitmoser, HU Berlin Zusammenhang Beliefs und Strategien 1 Ein einfaches Ratespiel (Nagel, 1995) Ratespiel Jeder von Ihnen tippt eine Zahl aus dem Interval [0, 100]. Jede reelle Zahl ist erlaubt, einschliesslich der Intervalgrenzen. Von allen Tipps berechnen wir dann den Durchschnitt x und multiplizieren den mit 2/3. Die Person, deren Tipp am nächsten an diesem Wert 2/3 · x ist, gewinnt. Notieren Sie bitte Ihre Tipps. Was haben Sie sich dabei gedacht? Das Ratespiel 2 3 Beauty Contests Das strategische Problem: Es gewinnt der, der am besten die Tipps der anderen vorhersagt Bzw. der, der am besten vorhersagt, was die anderen vorhersagen Oder noch eine Stufe weiter? Keynes bezeichnete dieses Spiel als “Beauty Contest” Es ähnelt Preisauschreiben wie “Tor des Monats”, wo unter allen Teilnehmern, die auf den Sieger tippten, ein Preis verlost wird Wenn man gewinnen möchte, sollte man nicht auf den eigenen Favoriten tippen, sondern auf das, was man für den Favoriten der Mehrheit hält Bzw. auf das, was man glaubt, was die Mehrheit für den Favoriten der Mehrheit hält Ähnliche Probleme bspw. in Auktionen oder auf Aktienmärkten Denkschritte Es geht nicht darum, was man selbst für richtig hält, sondern was die anderen für richtig halten Oder was man glaubt, was die Mehrheit glaubt, was die anderen für richtig halten 4 5 Schrittweises Denken und Denktiefe Formalisierung Gibt es solches “schrittweises” Denken? Kann man das in den Daten erkennen? Woran könnte man Denkschritte erkennen? 1. Jeder hat eine grobe Vorstellung über das Verhalten der anderen Konkret: Wie kann man die Denkschritte in Zahlen (“Tipps”) ausdrücken 2. Jeder versucht, einen zu seinem Belief passenden Tipp abzugeben Formal “Belief”: subjektive Wahrscheinlichkeiten über deren Strategien Es gewinnt der, der am besten die Tipps der anderen vorhersagt Formal: eine gute oder beste Antwort auf seinen Belief Bzw. der, der am besten vorhersagt, was die anderen vorhersagen, was die Tipps der anderen wären, usw. Angenommen das stimmt. Dann ergeben sich folgende Fragen: Sind alle Beliefs richtig? (= Gleichgewicht) Die Stufen haben keinen Anfang, sie sind zirkulär Falls nicht, haben zumindest alle die gleichen falschen Beliefs? Jeder gehört zu den “anderen” aus Sicht der “anderen” Woher kommen dann die Beliefs, bzw. wie werden sie geformt? Wählen alle Personen die besten Antworten auf ihre Beliefs? Worauf wir uns vielleicht einigen können: Jeder, der einen Tipp abgibt, Falls nicht, können wir die Fehler darstellen und quantifizieren? hat eine grobe Vorstellung über das Verhalten der anderen, und versucht, einen dazu passenden Tipp abzugeben Antworten: Nein; Könnte sein; Schwer zu sagen; Nein; Einigermaßen. 6 7 Richtige Beliefs + Beste Antworten = Nash-Ggw Eigenschaften der Nash-Gleichgewichte Betrachten wir ein diskretes Ratespiel: Spieler i = 1, . . . , n wählen aus den Aktionen Ai = {0, 1, . . . , 100} Reines Gleichgewicht Alle Spieler wählen eine ihrer Aktionen mit Wahrscheinlichkeit 1 Strategie Gemischtes Gleichgewicht Mindestens ein Spieler “randomisiert” Eine Strategie σi ist eine Wahrscheinlichkeitsverteilung über die eigenen Aktionen ai ∈ Ai . Hier ist σi (ai ) die Wahrscheinlichkeit, P mit der man ai wählt. Die Summe aller Wahrscheinlichkeiten ist 1: ai ∈Ai σi (ai ) = 1. Im diskreten Ratespiel mit n > 3: Es gibt zwei (reine) Nash-Ggws Alle wählen 0 (mit Wahrscheinlichkeit 1) Alle wählen 1 (bzw. die kleinste Zahl größer als 0) Liste gegnerischer Strategien: σ−i = (σ1 , . . . , σi−1 , σi+1 , . . . , σn ) Allgemeine Eigenschaften von Nash-Gleichgewichten Erwartete Auszahlung von σi gegen σ−i sei πi (σi , σ−i ) Mindestens ein Nash-Gleichgewicht existiert immer; das kann gemischt sein Richtige Beliefs: Man kennt/ahnt die Strategie der anderen Die Anzahl der Nash-Gleichgewichte ist “fast immer” ungerade Nash-Gleichgewicht (Nash, 1951) Wenn man mischt (randomisiert), dann muss man indifferent zwischen den Aktionen sein, über die man randomisiert (sonst würde man die bessere Strategie immer wählen) Ein Strategieprofil σ = (σ1 , . . . , σn ) ist ein Nash-Ggw, wenn für alle Spieler i gilt: σi ist eine beste Antwort auf σ−i : σi ∈ arg maxσi0 πi (σi0 , σ−i ). Da indifferent, gibt es keinen Grund, genau wie im Ggw zu randomisieren Aber Purifizierbarkeit: Erklärung durch Verhalten in ähnlichen Spielen 9 8 Bosch-Domenech, Montalvo, Nagel, Satorra (2002) THEAMERICANECONOMICREVIEW 1694 2. Classroom experiments (6,7) 1. Lab experiments (1-5) ' C ? 0.16 0.14 ? 0120.10 0.080.06 0.04- 0.16 0.14 0.12 0.10D 0.08 0.06 average: 35.13 a 3 _Z 0.02- 0o.oo 1! ,l,.l...... t............ 0 15 22 ,33 = 50 choices I average: 26.84 0.04 0.02 o.oo,1t lll, 0 100 *? ? 3 ao 0.16 0.14* 0.12- .0)<U~~~~~ .0.20 ~~.14-~~ 0? average: 25.20 n u-10or ~0 .08 0.068o34 0.06 002 0 0021.~ ll o = rBRIBClnTIN. 15 22 0 33 0.18 Q 0.16 0.14 -11 0.102 t 0.08 0.02 15 22 0 100 0* 0.02 -I2 = 0.00 0.00 0 100 6. Newspaper experiments (15-17) . c average: 22.16 0.^10 . , 50 33 choices 5. InternetNewsgroup experiment C 100 average: 17.15 a choices 0.16 0.14 0.121 0.10 = 0.08 0.06 0.04 ....... 50 choices 33 0.22 = klrlr,lllrlkL.t. ............ll.. r,o0w;ltlll................................ 50 . l . .. ., l 15 22 4. Theorists experiments (10-13) 3. Take-home experiments (8,9) n DECEMBER2002 cr = cr 0.16 0.140.120.100.08- average: 23.08 006 . Logit-Gleichgewichte 0.04| I b . rrwfr. 15 22 33 k I Po' iPPJP 50 choices ....... 1 .......1 ., ............. 100 . lllliII 'iI L Wir., , fWWf,, .00 r .,,,0 0 15 22 33 , , 50 choices f, tf ,,, 100 FIGURE 3. RELATIVE FREQUENCIES OF CHOICES IN THE SIX GROUPS OF EXPERIMENTS Die Masse spielt kein Nash-Gleichgewicht, aber zumindest bis zu 20% bei terval containing all of the averages in the aware, however, of some large.und They are Theoretikern Newsgroup three Newspaper experiments.22 By contrast, of their basic sociodemographic character2/3 istics (age, sex, training ...). In a news- among the entire population of all Newspaper 10 11 Richtige Beliefs + Logit-Antworten = Logit-Ggw Eigenschaften der Logit-Gleichgewichte Einfachste Fehlerform: stochastische Nutzenschwankungen, die zu Abweichungen von der “objektiv” besten Antwort führen exp{λ · πi (ai , σ−i )} Zur Erinnerung: σi (ai ) = P 0 a0 exp{λ · πi (ai , σ−i )} i Sei πi (σi , σ−i ) wieder die eigene Auszahlung durch σi gegen σ−i λ ∈ R+ ist der Präzisionsparameter Logit-Gleichgewicht (McKelvey and Palfrey, 1995) Je höher λ, desto weniger Rauschen, desto höher die Wahrscheinlichkeit, dass die beste Antwort gewählt wird Ein Strategieprofil σ = (σ1 , . . . , σn ) ist ein Logit-Ggw, wenn es ein λ ≥ 0 gibt, so dass für alle Spieler i gilt: σi ist eine Logit-Antwort auf σ−i , λ → ∞ führt zur besten Antwort (Nash-Gleichgewicht) λ = 0: Gleichverteilung über den Aktionen (“reines Rauschen”) exp{λ · πi (ai , σ−i )} für jede Aktion ai gilt: σi (ai ) = P . 0 a0 exp{λ · πi (ai , σ−i )} Allgemeine Eigenschaften: Logit-Gleichgewichte existieren immer i Es gibt einen geschlossen Pfad von Logit-Ggws ausgehend von λ = 0 bis λ → ∞, und der konvergiert zum “Risiko-dominanten” Gleichgewicht Gegenseitige Logit-Antworten anstelle gegenseitig bester Antworten. Für alle λ < ∞: jede Aktion hat positive Wahrscheinlichkeit Die Logit-Formel ist die gleiche wie zuvor (im “Zufälliger-Nutzen-Modell”) Abweichungen von “Logit” sind wie im Roter-Bus-Blauer-Bus-Problem denkbar Logit-Gleichgewicht sind der bekannteste (und einzig relevante) Spezialfall der Quantal-Response-Gleichgewichte (QRE). Daher oft: QRE = Logit 12 Weitere bekannte Fehler 13 Anwendung der Logit-Gleichgewichte in Ratespielen Mit illusorischem Clustering: Gegner verteilen sich auf m ≤ n − 1 Cluster 562 Illusorisches Clustering Y. Breitmoser / Games and Economic Behavior 75 (2012) 555–569 Bei vielen Gegnern: Zusammenfassung der Gegner zu wenigen Clustern “Ein paar machen vielleicht das, ein paar dieses, und der Rest jenes”; “Der Markt hat heute positiv reagiert.”; “Der Wähler hat entschieden” Dadurch Unterschätzung der Unabhängigkeit und Heterogenität der anderen, Überschätzung des eigenen Verständnisses/Gewinnchancen False Consensus / Projection (Ross et al., 1977) Bei unbekannten Attributen der anderen überschätzt man die Wahrscheinlichkeit, dass sie einem selbst ähnlich sind Je höcher λ, desto näher am Nash-Ggw 0 Berücksichtigung in Analysen: Im Prinzip möglich, bisher noch selten Je höher Cluster-Anzahl m, desto breiter die Verteilung Mit kleinem m ist das vielleicht eine passende Darestellung der “Masse” 14 15 Falsche Beliefs + Beste Antworten = Dominanz Belief σ̃−i : die Liste gegnerischer Strategien, mit der i rechnet Rationalität Spieler i ist rational, wenn seine Strategie σi eine beste Antwort auf seinen Belief σ̃−i ist. Der Belief σ̃−i ist hier beliebig. Gegenseitiges Wissen von Rationaliät Alle Spieler sind rational und wissen, dass alle Spieler rational sind. Allgemeinwissen von Rationalität Dominanz Alle Spieler sind rational, wissen, dass alle Spieler rational sind, wissen, dass alle wissen, dass alle rational sind, usw. 17 16 Anwendung von Rationalität Anwendung: Gegenseitiges Wissen von Rationalität Ein rationaler Spieler wählt also Strategien, die beste Antworten sind (auf beliebige Beliefs). Das schließt u.a. alle dominierten Strategien aus. Im Ratespiel: Wenn man weiß, dass alle rational sind, dann kann man schließen, dass keiner 100 wählen wird. Dominanz Im diskreten Ratespiel {0, . . . , 100}: Dann sollte man weder 100 noch 99 wählen. Strategie σi dominiert σi0 , wenn sie gegen jede gegnerische Strategie zu einer höheren Auszahlung führt: πi (σi , σ−i ) > πi (σi0 , σ−i ) ∀σ−i . Aber 98 ist z.B. eine beste Antwort auf den Belief, dass alle Gegner 99 wählen, und dieser Belief ist konsistent mit dem Wissen um Rationalität Mit jeder weiteren Wissensstufe können wir dann eine weitere Zahl eliminieren, bis schließlich nur noch 0 und 1 übrig sind Nur 0 und 1 sind “rationalisierbar” (d.h. nach ∞ Stufen noch übrig) Im Ratespiel: Stetig, Aktionen aus dem Interval [0, 100]: man sollte nicht 100 wählen Diskret, Aktionen aus der Menge {0, . . . , 100}: man sollte nicht 100 wählen Rationalisierbarkeit (Bernheim, 1984; Pearce, 1984) Schwache Dominanz Schritt 1: Eliminiere alle Strategien, die keine besten Antworten sein können Schritt 2: Eliminiere alle Strategien, die nun keine besten Antworten sein können . . . usw. Alle Strategien, die am Ende übrig sind, heißen rationalisierbar. Strategie σi dominiert σi0 , wenn sie gegen jede gegnerische Strategie zu einer schwach höheren Auszahlung führt, πi (σi , σ−i ) ≥ πi (σi0 , σ−i ) ∀σ−i , und zu einer streng höheren Auszahlung gegen mindestens ein σ−i . Im stetigen Ratespiel [0, 100]: Keine weiteren Konsequenzen Bspw. 99.9 ist eine beste Antwort auf den Belief, dass alle Gegner 99.99 wählen, und dieser Belief ist konsistent mit dem Wissen um Rationalität Im Ratespiel: alles über 2/3 · 100 ≈ 66.67 ist schwach dominiert 18 19 Sind das die ursprünglich angesprochenen Denkschritte? Wohl nicht. In den meisten Experimenten war die Schrittgröße höchstens .01 Damit benötigt man 5000 Schritte, um von 100, über 99.99, 99.98 usw. bis unter 50 zu kommen Für die meisten Teilnehmer ist das aber schon nach dem ersten Schritt klar Dann vielleicht die Schritte aus “schwacher Dominanz” Schritt 1: 100 · 2/3 ≈ 66.7 Schritt 2: 100 · (2/3)2 ≈ 44.4 Schritt 3: 100 · (2/3)3 ≈ 29.6, . . . Level-k Hatte jemand diese Zahlen im Kopf? 21 20 Das Level-k Modell (Nagel, 1995; Stahl and Wilson, 1995) Zur Erinnerung: Hier die Daten THEAMERICANECONOMICREVIEW 1694 2. Classroom experiments (6,7) 1. Lab experiments (1-5) Intuitives Problem des obigen Ansatzes: Zu Beginn betrachtet er alle Strategien als gleich plausibel ' C ? 0.16 0.14 0.12 0.10D 0.08 0.06 average: 35.13 a 3 _Z 0.02- (0, 0, . . . , 0) ist genauso plausible wie (100, . . . , 100) Diese Vielfalt im ersten Schritt ist das “Worst-Case” Szenario Unbewusst eliminieren wir aber bestimmte Strategien wie (100, . . . , 100) schon vor dem ersten Schritt 0o.oo 1! ,l,.l...... t............ 0 15 22 ,33 = 50 choices I average: 26.84 0.04 0.02 o.oo,1t lll, 0 100 Idee: Der tatsächliche erste Schritt basiert auf einer Gleichverteilung ao 0.16 0.14* 0.12- .0)<U~~~~~ average: 25.20 u-10or ~0 .08 0.068o34 0.06 002 0 0021.~ ll o = rBRIBClnTIN. 15 22 0 Im Durchschnitt wählen die Gegner also 50, die beste Antwort darauf ist ca. 2/3 · 50 = 33 Schritt 2: Angenommen, man glaubt, der durchschnittliche Gegner denkt auch so, dann sollte ich einen Schritt weiter gehen: Beste Antwort auf 33 ist 2/3 · 33 = 22 Weitere Schritte: 14.81, 9.87, 6.58, . . . .0.20 ~~.14-~~ 0? n 33 0.18 Q 0.16 0.14 -11 0.102 t 0.08 0.02 15 22 0 100 0* = 0.^10 0.00 0.00 I b . rrwfr. 15 22 33 0.02 -I2 0 . , 50 33 100 choices 6. Newspaper experiments (15-17) 5. InternetNewsgroup experiment C 100 average: 17.15 a choices 0.16 0.14 0.121 0.10 = 0.08 0.06 0.04 ....... 50 choices 33 0.22 = klrlr,lllrlkL.t. ............ll.. r,o0w;ltlll................................ 50 . l . .. ., l 15 22 4. Theorists experiments (10-13) 3. Take-home experiments (8,9) n *? ? 3 Dies ist das Level-k Modell strategischen Denkens. Hatte jemand diese Schritte im Kopf? 0.16 0.14 ? 0120.10 0.080.06 0.04- DECEMBER2002 . c average: 22.16 cr = cr 0.16 0.140.120.100.08- average: 23.08 006 . 0.04| k I Po' iPPJP 50 choices ....... 1 .......1 ., ............. 100 . lllliII 'iI L Wir., , fWWf,, .00 r .,,,0 0 15 22 33 , , 50 choices f, tf ,,, 100 FIGURE 3. RELATIVE FREQUENCIES OF CHOICES IN THE SIX GROUPS OF EXPERIMENTS 22 large. They are aware, however, of some of their basic sociodemographic character- terval containing all 2/3 of the averages in the three Newspaper experiments.22 By contrast, 23 Ist das eine Erklärung? Insgesamt wählen 10%–15% entweder 22 oder 33; Ausnahme Classroom, dort insgesamt 25% Mit Nash-Ggw zusammen sind das bis zu 30% der Teilnehmer – 70% spielen etwas anderes Level-k und Ggw streng genommen reichen nicht Ist es vielleicht Level-k mit “Rauschen”, also Logit-Level-k Das müsste dann so aussehen . . . Evaluation der Modelle 25 24 Level-k mit logistischen Fehlern (Logit Level-k) Y. Breitmoser / Games and Economic Behavior 75 (2012) 555–569 Rationalisierbarkeit + Logit = Noisy Introspection 561 Es gibt noch eine weitere Idee: Nicht beste Antwort auf beste Antwort auf beste Antwort . . . , wie in Rationalisierbarkeit, sondern: Noisy Introspection (Goeree and Holt, 2004) Logit Antwort auf Logit Antwort auf Logit Antwort wobei jeder glaubt, er hat eine leicht höhere Präzision als die Gegner Bspw. jeder glaubt, er ist doppelt so präzise wie seine Gegner Präzision λ verdoppelt sich in jedem Schritt Rückwärts: Ich habe 100, meine Gegner 50 Jeder Gegner hat 50, glaubt seine Gegner hätten 25 Die mit 25 glauben, ihre Gegner hätten 12.5, usw. Dieses Modell der Noisy Introspection führt zu folgenden Vorhersagen . . . Note: The plots are “proportional” representations of the choice probabilities in the discrete beauty contest with 1001 choices (0, 0.001, 0.002, . . . , 1). The actual choice probabilities had been taken to the power of 0.25, as they often are very close to zero and hardly visible on a [0, 1] axis. Die Übergänge müssten sein zumindest diem =70% Fig. 5. Level-kglatter predictions for various– precision levels (n = 30 and n − 1). “Rest” orientieren sich nicht an den Leveln 1 f i (xi ) = exp λk · π (xi |m, f k−1 ) exp λk · π (x̃i |m, f k−1 ) d x̃i . (9) 26 27 Vergleich Logit-Ggw und Noisy Introspection 562 Ergebnis: Was passt am besten? Y. Breitmoser / Games and Economic Behavior 75 (2012) 555–569 Umfangreiche ökonometrische Analyse (Breitmoser, 2012) Masse der Teilnehmer (70%) wird am besten durch Logit-Ggw (QRE) erfasst Die drei Massepunkte: 33 Level-1 oder Noisy Introspection 22 Noisy Introspection (Level 2 oder 3 streng genommen sind anders) 0 QRE oder Noisy Introspection mit hoher Präzision (= Nash-Ggw) Es gibt hier kein echtes “schrittweises Denken”. Die Hoch-Level-Konzepte QRE und NI erklären alles bis auf 33 besser, und 33 selbst genauso gut. Note: Similarly to Fig. 5, the choice probabilities are rescaled (by taking them to the power of 0.25) to accentuate the effects on the [0, 1] scale. Further, m = 4 in the NI models. NI-Verteilungen sind etwasFig.spitzer als Logit-Ggw (QRE) Verteilungen 6. QRE and NI predictions. 29 28 payoff of choosing xi ∈ X := {0, 0.001, 0.002, . . . , 1} if all opponents play according to the strategy the discrete logit choice probabilities for given λ and m as σ xi |λ, σ = exp λ · π xi |m, σ exp λ · π xi |m, σ σ ∈ ( X ), and define . (11) x ∈ X Die Erklärung passt ziemlich gut The quantal response equilibrium is defined as follows. (In the analysis, I will consider mixture models with up to K = 4 i 566 Y. Breitmoser / Games and Economic Behavior 75 (2012) 555–569 such QRE components.) Definition 3.2 (QRE). Given λ ∈ R+ , the QRE choice probabilities σ ∈ ( X ) satisfy σ = σ (·|λ, σ ). In p-beauty contests, it seems plausible to assert uniqueness of QREs for moderate λ, but a general result confirming this assertion is not available. The QREs underlying my analysis are the ones located along the principal branch, which is a result of using the following simple homotopy method (for more elaborate methods, see Turocy, 2005, 2010). Starting at a known solution (i.e. at the one for λ = 0 initially), I increase λ in steps of at most 0.25, and after each increase of λ, I solve for the respective QRE by function iteration. If the function iteration does not converge, the step size is reduced. Thanks to the simplicity of the beauty contest game, this simple method worked well. Noisy introspection, in contrast, is defined as follows. Definition 3.3 (NI). Fix λ ∈ R+ , all k 0, σk = σ (·|λk , σk+1 ). μ ∈ [0, 1), and for all k ∈ N0 define λk = λ · μk . The NI choice probabilities are σ0 , where for Essentially, NI captures a continuum of subjective beliefs ranging from uniform randomization (μ = 0) to equilibrium (μ ≈ 1). The unifying idea is that players believe their precision exceeds their opponents’ precision by factor μ−1 , who in turn believe to be μ−1 as precise as their opponents (including me), and so on, consistently for an infinite number of steps. In the analysis, I will assume a maximum of K = 100 induction steps and μ 0.95. In order to model choices based on a larger number of induction steps or larger μ, the equilibrium concept QRE can be adopted virtually without loss. Fig. 6 illustrates the differences between QRE and noisy introspection for various λ and μ ∈ {0.1, 0.3, 0.6, 0.9}. Basically, QRE distributions have larger variance than NI distributions, and for m 7 and intermediate λ, they exhibit an increasingly pronounced bimodal shape. Thus, some players may play the right tail, while other players play those playing the right Weitere Experimente Note: The predictions of the models with the “estimated numbers of components” (highest number of components that is not significantly improved upon at α = 0.1) are plotted on top of the histograms of the respective data set, and the predictions are aggregated to match the bins of the histograms. The broken line is the kernel estimate labeled “Kernel-0.5” in Fig. 1. Fig. 7. Predictions of the Noisy Introspection models with the estimated numbers of components. observations around 0.222 is not compatible with level-k if applied strictly (Fig. 2), that this mode or any higher-level 30 31 Weitere Experimente Fazit der Ratespiele: Die meisten Teilnehmer haben eine hohe Denktiefe in folgendem Sinne Sie spielen eine passende Antwort auf einen Belief Dieser Belief ist eine verschwommene Vorstellung der Aktionen der anderen; Bspw. Wahrscheinlichkeitsverteilung, die nicht “einfach” ist (nicht Level-k) Diese Verteilung lässt sich i.A. ganz gut als Logit-Ggw darstellen (Level ∞), mit geringer bis mittlerer Präzision Darauf antworten sie mit ähnlicher oder höherer Präzision Die Ratespiele sind die bekanntesten Beispiele zur Analyse der Denktiefe Ähnlich den Diktatorspielen zur Analyse sozialer Präferenzen Matching-Penny Spiele Aber nicht die einzigen Spiele. Hier kommen noch ein paar . . . 32 33 Matching-Penny Spiele Angenommen, Spieler 2 wählt 50-50. Was würde Spieler 1 machen? Zwei Spieler entscheiden gleichzeitig. Spieler 1 wählt O (oben) oder U (unten), Spieler 2 wählt L (links) oder R (rechts). Logit σ1 (O) = exp{λ·π1 (O)} exp{λ·π1 (O)}+exp{λ·π1 (U)} Spieler 1 wählt die Zeile, Spieler 2 wählt die Spalte. Daraus ergibt sich das Auszahlungsprofil (π1 , π2 ), d.h. 1’ Auszahlung ist die erste Zahl. L R O (1, 0) (0, 1) U (0, 1) (1, 0) L R O (5, 0) (0, 1) U (0, 1) (1, 0) Erwartete Auszahlung π1 (O) π1 (U) Logit σ1 (O) λ = 0.5 λ=1 λ=2 Angenommen, Sie sind Spieler 1. Was würden Sie wählen? Und nun? L R L R O (1, 0) (0, 1) O (5, 0) (0, 1) U (0, 1) (1, 0) U (0, 1) (1, 0) .5 · 1 + .5 · 0 = 0.5 .5 · 0 + .5 · 1 = 0.5 .5 · 5 + .5 · 0 = 2.5 .5 · 0 + .5 · 1 = 0.5 exp{.5·0.5} exp{.5·0.5}+exp{.5·0.5} = 0.5 exp{1·0.5} exp{1·0.5}+exp{1·0.5} = 0.5 exp{2·0.5} exp{2·0.5}+exp{2·0.5} = 0.5 exp{.5·2.5} exp{.5·2.5}+exp{.5·0.5} = 0.73 exp{1·2.5} exp{1·2.5}+exp{1·0.5} = 0.88 exp{2·2.5} exp{2·2.5}+exp{2·0.5} = 0.98 Spieler 1 würde mit erhöhter W-keit O wählen (im rechten Spiel) Matching-Penny Spiel Spieler sagen gleichzeitig “Kopf” oder “Zahl”; Spieler 1 gewinnt, wenn beide das gleiche sagen; Spieler 2 gewinnt sonst Daher sollte 2 R öfter als 50-50 spielen, woraufhin 1 seltener O spielt Wo pendelt es sich im Gleichgewicht ein? 34 35 Nash-Gleichgewichte im Matching-Penny Spiel L R O (x, 0) (0, 1) U (0, 1) (1, 0) Das gemischte Nash-Gleichgewicht L R O (x, 0) (0, 1) U (0, 1) (1, 0) Notation: σO Wahrscheinlichkeit, dass 1 Aktion O wählt; σU = 1 − σO σL Wahrscheinlichkeit, dass 2 Aktion L wählt; σR = 1 − σL Es gibt keine reinen Nash-Gleichgewichte, d.h. keine gegenseitig besten Antworten in reinen Strategien. Spieler 1 ist indifferent, wenn π1 (O) = π1 (U). Daraus ergibt sich für 2: Beste Antwort auf O ist R, auf R ist U, auf U ist L, auf L ist O σL · x + (1 − σL ) · 0 = σL · 0 + (1 − σL ) · 1 Es gibt also nur ein gemischtes Ggw, d.h. beide Spieler wählen zufällig. ⇔ σL = 1 1+x Spieler 2 ist indifferent, wenn π2 (L) = π2 (R). Daraus ergibt sich für 1: Man wählt aber nur zufällig, wenn man indifferent ist – der Gegner muss so mischen, dass man selbst indifferent ist Bzw. man selbst muss so mischen, dass Gegner indifferent: Damit macht man es dem Gegner so schwer wie möglich, den “Penny” zu gewinnen σO · 0 + (1 − σO ) · 1 = σO · 1 + (1 − σO ) · 0 ⇔ σO = 1 2 Spieler 1’ Verhalten sollte unabhängig von x sein, das von 2 nicht 37 36 Ochs (1995) R.D. McKelvey et al. / J. of Economic & Org. 42 (2000) 523–548 525 McKelvey, Palfrey undBehavior Weber (2000): Passt Logit? Table 1 Payoff tables for Games A–D Drei Spiele: x = 1, x = 9, x = 4 Game A Ergebnisse U D Bei x = 1 ist alles wie vorhergesagt (5050 Wahrscheinlichkeiten) Game B Game C Game D L R L R L R L R 9,0 0,1 0,1 1,0 9,0 0,4 0,4 1,0 36,0 0,4 0,4 4,0 4,0 0,1 0,1 1,0 2. Payoff magnitude effects and quantal response equilibria Die Nash-Ggw sind: Bei x > 1 spielt 2 zwar seltener L (bzw. A hier), aber noch zu oft Games A, B, C : Oben (Up) mit σ1 = 1/2, Links mit σ2 = 1/10 The Quantal Response model incorporates best response eines of players a (Sie sind strategisch äquivalent, daerror nur into die the Auszahlungen oderinbeider Spieler mit game. Thus, the perfectly rational model of choice usually assumed to govern players’ einer Konstante multipliziert werden) actions is replaced by a probabilistic one where better responses are more likely to be Game D: Oben (Up) mit σ1 = 1/2, Links mit σ2 = 1/5 played, but no action is played with certainty. The logistic specification of the QRE, which we use here, measures error in terms of a precision parameter, which is inversely related to the variance of the error. 5 If the Hypothese Es ist λ,Logit-Ggw expected utility to strategy j for agent i is denoted by uij , then the probability that i will use Im Logit-Ggw: Spieler antizipieren Fehler gegenseitig strategy j is given by the Logit formula Spieler 1 antizipiert das, ist nicht indifferent und spielt öfter O (bzw. A hier) als im Nash-Ggw Oder anders herum?! Spieler 1 reagiert auf den eigenen Payoff (Own Payoff Effect), spielt zu oft O, und 2 antizipiert das, spielt daher öfter R als im Ggw zu oft “Up”, Logit-Antwort (6= beste Antwort) ⇒ zu oft L ⇒ zu oft “Up” eλuij Test: Wenn Logit, dann sollte die Payoff-Magnitude relevant sein , pij = P λuik ke exp{λ·π 2 (L)} where k runs over theA available strategiesB forbei agentσ i. If(L) λ=0,= then players are acting entirely Beispiel Game vs. Game 2 exp{λ·π2 (L)}+exp{λ·π2 (R)} Können wir das mit dem Logit-Ggw erklären? 38 randomly (i.e. completely unresponsive to payoffs), while for λ=∞, players’ actions are In B towurde 2’s Auszahlungen mit 4 multipliziert equivalent perfect expected utility maximizing behavior. Table presentsist the games studied in this paper. Game A is the same a payoff matrix Bei1 Logit das identisch zur Multiplikation deras Präzision λ mit 4 studied recently by Ochs (1995). Games B and C are variations of Game A which only Spieler 2 sollte daher dichter am Nash-Gleichgewicht σ (L) 2 A are= 1/10 involve payoff magnitude changes. In Game B, the column player’s payoffs of Game multiplied by a factor of 4. In Game C, both the row and the column player’s payoffs of sein 39 for each of the games. At this very high level of aggregation, the effects of varying payoff 2 B to be particularly 0.647 0.237 300 magnitude do not appear strong, and therefore, provide at most weak A 0.623 0.243 300 support of the hypotheses. Increasing the column players’ payoffs from Game A to Game R.D.on McKelvey et al. / J.of of Economic Behavior & Org. 42 (2000) 525 3 0.607 0.363 300 B has little effect theBbehavior those players, but it appears to523–548 make the row players C 0.570 0.393 300 somewhat less likely to play action U. The latter is predicted by the payoff magnitude Table 1 4 C 0.623 0.163 300 hypotheses. Payoff tables forIncreasing Games A–Dthe row players’ payoffs in Game C appears to have the effect of 0.180 L. The latter effect 300 decreasing the frequencyB of theGame action U and0.693 decreasing that of action Game A B Game C Game D 5 A 0.623one is not. The effects 0.187 of altering payoff 300 is consistent with the hypothesis, but the former L R L R 0.590 L R L R C individual magnitude vary within the sessions. Finally, notice that0.197 for none of the games300 is U 0,1 C behavior 9,0 corresponds 0,4 0.593to that 36,0 4,0equilibrium. 0,1 it the case9,0 that the observed predicted0,4 by the Nash 6 0.273 300 Ergebnisse D 0,4 1,0 0.607 7 A Table 3 D Experimental results by session and game 2. Payoff magnitude effects and 8 D Session Game A 0,1 1,0 A 0.640 0.457 0,4 0.230 0.313 300 300 0.643 U 0.683 0.343 L 0.243 300 n300 quantal response equilibria 4,0 0.223 0,1 Goeree, Holt und Palfrey (2003): Neue Analyse Weder Nash- noch Logit-Gleichgewichte passen hier Gegen Nash-Ggw spricht der “Own Payoff Effect” Logit Ggw erklärt “Own Payoff Effect” ganz gut, aber gegen Logit spricht der fehlende “Payoff Magnitude Effect” 1,0 300 These: Was noch fehlt, ist Risiko-Aversion Abnutzender Grenznutzen des Geldes The Quantal Response model incorporates0.680 error into the best 0.317 response of players in a A 300 A 0.643 0.241 1800 game. Thus, the perfectly rational model of0.573 choice usually assumed to govern players’ B 0.197 300 B 0.630 0.244 1200 actions is replaced by aCprobabilistic one where better responses are more likely to1200 be 0.594 0.257 2 B 0.647 0.237 300 played, but no action is played with certainty.0.550 D 0.328 600 A 0.623 0.243 300 The logistic specification of the QRE, which we use here, measures error in terms of 3 B 0.607 0.363 300 the a precision parameter, λ,C which is inversely 0.570 related to the variance of the error. 5 If 300 0.393 , then the probability that i will use expected utility to strategy j for agent i is denoted by u ij Die Nash-Ggw sind: 4 C 0.623 0.163 300 strategy j is given by the Logit formula Ökonometrische Analyse bestätigt: So passt Logit sehr gut zu den Daten, J.K. Goeree et al. / Games and Economic Behavior 45 (2003) 97–113 105 mit konstanten, plausiblen Risiko-Aversions-Maßen in allen Fällen 1 Aggregate 5 0.180 Games A, B, C : BOben (Up) mit σ0.693 = 1/2, Links mit σ = 1/10 λuij e A 0.623 0.187 Game D: Oben , (Up) mit σ = 1/2, Links mit σ = 1/5 pij = P k 6 eλuik Schwächung der Payoff-Magnitude Table 3 Maximum likelihood estimates; asymptotic standard errors in parentheses r µ pR (obs) pR (pred) pU (obs) pU (pred) Log L (# observations) Games 1–3 (Ochs, 1995) 0.42 (0.06) 0.010 (0.003) 0.44 (0.07) 0.42 (0.02) 0.150 (0.060) 0.039 (0.004) 0.50 0.66 0.74 0.35 0.50 0.54 0.60 0.47 0.50 0.56 0.59 0.47 −2071.9 (1560) Game 4 (this paper) Games A–D (McKelvey et al., 2000) 0.50 0.66 0.74 0.35 0.77 0.76 0.75 0.68 0.74 0.76 0.77 0.65 0.64 0.63 0.59 0.55 0.65 0.57 0.58 0.59 Experiment 300 C 0.590 0.197 300 300 C 0.593 0.273 300 where k runs over the available strategies for agent A 0.607 i. If λ=0, then players 0.223 are acting entirely 300 Ergebnisse randomly (i.e. completely unresponsive to payoffs), while for λ=∞, players’ actions 300 are 7 A 0.640 0.230 Fehlverhalten wie bei Ochs: zu oft “Up”, zu oft “L” equivalent to perfect expected utility maximizing D 0.457 behavior. 0.313 300 Table 1 presents the games studied in this paper. Game A is the same as a payoff matrix 8 D 0.643irrelevant 0.343 300 Payoff-Magnitude ist praktisch studied recently by OchsA (1995). Games B and of Game A which only 0.683C are variations0.243 300 involve payoff magnitude changes. In Game B, the column player’s payoffs of Game A are Aggregate A 0.643 0.241 1800 multiplied by a factor ofB4. In Game C, both0.630 the row and the column player’s payoffs of 0.244 1200 Game A are multiplied by D was included primarily of C a factor of 4. Game0.594 0.257 as a replication 1200 Ochs (1995) study. D 0.550 0.328 600 All four games have unique mixed strategy Nash equilibria. Since Nash equilibria are insensitive to positive affine transformations in the payoffs, they are identical for Games A, B, and C. Letting p denote the probability the row player chooses U and q denote the probability the column player chooses L, these equilibrium probabilities are p∗ =0.5 and q∗ =0.1. For Game D, the Nash equilibrium is at p∗ =0.5 and q∗ =0.2. Thus, the predictions of Nash equilibrium are easily summarized: 6 (i) in all games, the row players’ choice −455.8 (340) −5898.8 (4800) 40 41 VOL Game 4. Asymptotic standard errors are in parenthesis, and indicate that r is significantly different from one (risk neutrality) and µ is significantly different from zero (no error). CONCEPTS FOR EXPERIMENTAL2X2-GAMES 951 98NO 3 SELTENAND CHMURA STATIONARY Thus both error and risk aversion are significant components for explaining deviations 7 from Constant the minimax strategies of his game. Nonconstant sum games sum games Note that the risk aversion estimate for the Ochs (1995) data is virtually identical 10 10 to the other risk aversion estimates in the table.8 This suggests that the binary lottery 18 procedure failed to induce risk neutrality. 12 While the 22risk aversion estimates are stable, Game 7 Game 1 10 the error parameter estimates are not, which we14conjecture to be caused by differences in payoff scales, subject pools, and procedures. For example, some sessions were done by hand and others were computerized. Furthermore, subjects in Ochs’ experiments played the mixed extension of the game. Another relevant factor is the scale and normalization of payoffs. For instance, estimated Spieler 1 wählt Zeile (O oder error U) parameter 16would be 100 times as high when 13 the Game 8 Game 2 payoffs are measured in pennies instead of dollars. 11 We attempted to construct comparable Spieler 2 wähltbut Spalte (L odernormalizations R) payoff measures, the appropriate become less obvious when payoffs are in lottery tickets (as in Ochs, or when only die one out decisionsunten is selected Auszahlung von Spieler 1 1995) ist links oben, vonof 2tenrechts ex post to determine earnings, as in our lottery choice experiment discussed below. We also estimate the quantal response model for the four matching pennies games in 17 Game 9 Frage Sind O etund L 14unterschiedlich häufig inandden Spielen? al. (2000); see Appendix B for game payoffs aggregate results. The third Game 3 McKelvey Selten und Chmura (2008) 5 For a formal and more detailed explanation of QRE, see McKelvey and Palfrey (1995, 1996, 1998). Those papers also provide discussion about the conceptual interpretation of λ. 6 This actually glosses over a subtle issue of multiple equilibria that arises due to the experimental protocol. Consider an experiment with 16 subjects (eight row and eight column), where subjects are randomly repaired with a new opponent every time they replay the game. This creates many new equilibria. For example, having four of the row players always play U and the other four row players always play D is not inconsistent with equilibrium, since, from the column players’ point of view, this is indistinguishable from all eight of the players independently randomizing 50/50 between U and D. There are a continuum of multiple equilibria of this sort. However, aggregate choice frequencies are the same in all such equilibria. 10 13 Wenn Nash oder Logit-Ggw, dann nicht 7 Observed autocorrelation in some people’s decisions might be due to heterogeneity in individual risk attitudes. One gilt can accommodate such heterogeneity by specifying a(nur randomDifferenzen effects model, which requires that Bei Logit ja additive Separierbarkeit zählen) there be a separate choice probability for each possible draw from the distribution of risk aversion parameters. 13 11 10 Gameequations has to be solved to determine the likelihood function for each Game 4 Therefore, a system of simultaneous exp{λ π1 (O)} 1 iteration over the parameter space, which ·includes an error parameter and the mean and variance of the distribution σ1of(O) = parameters. We estimated such a model for Game 4 and = risk aversion the estimated mean and variance of the exp{λ · π (O)} + exp{λ · π (U)} 1 + exp{λ · (π 1 and 0.40, respectively. 1 1 (U) − π1 (O))} risk aversion distribution are 0.55 Gemischte Gleichgewichte im Allgemeinen 8 Pooling the data from all the experiments in Table 3 and imposing a common risk aversion parameter yields estimated error parameters of µ = 0.010 (0.002) in Games 1–3, µ = 0.139 (0.047) in Game 4, µ = 0.039 (0.004) in Games A–D and the estimated risk 11 parameter is r = 0.42 (0.01).11The loglikelihood is −8426.6, which is Game Game 5 virtually identical to the sum of the three loglikelihoods 10 in Table 3: −8426.5. Hence, one cannot reject the hypothesis that the 1 risk aversion1parameter is constant across the games in Table 3. In Game 7 wurde zu 1’ Auszahlung von O und U (bei R) jeweils 4 addiert Differenz π (U) − π (O) bleibt konstant, Logit-Ggw daher auch 42 43 Selten und Chmura (2008), vollständig VOL 98NO 3 CONCEPTS FOR EXPERIMENTAL2X2-GAMES SELTENAND CHMURA STATIONARY 10 Ergebnisse (nach Brunner, Camerer, Goeree, 2011) VOL. 101 NO. 2 10 18 Game 1 Insgesamt 6 × 2 Spiele 951 1033 Brunner ET Al.: Stationary Concepts: Comment Nonconstant sum games Constant sum games 10 Game 7 Game 1 Game 2 Game 3 Game 4 Game 5 Game 6 1.0 12 0.9 22 0.8 14 0.7 0.6 p(left) 0.5 Links Sechs Konstant-Summen-Spiele 13 Game 2 (strategisch äquival. zu Nullsummenspielen) Oben Darstellung der Vorhersagen und der empirischen Ergebnisse 1.0 0.9 16 Game 8 0.8 11 0.7 0.6 0.5 0 Rechts Sechs Nicht-Konst-Sum-Spiele 14 Game 3 (Beste Antworten äquiv. zu Links, Addition von Konstanten zu Auszahlungen: zu Spieler 1 wenn 2 R spielt, zu 2 wenn 1 O spielt) 10 11 Game 4 0.1 0.2 0.3 0.4 0.5 0 0.1 0.2 Game 9 13 0.4 0.5 0 0.1 0.2 0.3 0.4 0.5 Nash QRE Action-sampling Payoff-sampling Impulse balance Observation Figure 2. Visualization of the Theoretical Equilibria and the Observed Average in the Constant Sum Games (cf. SC 2008, Figure 8) 13 Game 10 0.3 p(up) 17 Unten Darstellung der mittleren Abweichungen der Konzepte Unterschiede zwischen Konzepten sind insignifikant und unerheblich 0.035 Dies sollte hat keinen Einfluss auf Vorhersagen von Nash und Logit haben Sampling variance S 0.03 Game 5 10 0.02 Q Es hat aber Einfluss auf Vorhersagen des Konzeptes der Autoren (Impulse-BalanceGgw) – passt es besser? 11 Game 11 Theory specific component T 0.025 0.015 0.01 Game 12 Game 6 0.005 10 0 U up L left D down R right 5 Experimentally Investigated games in a pair also have the same action-sampling equilibrium. Payoff−s. Action−s. Impulse−b. 44 45 Games in a row does not change the quantal response equilibrium, even if this concept does not depend only on thebest response structure.Therefore, quantal response equilibrium also yields the same prediction for the two games in a pair. The QRE Figure 3. Overall Mean Squared Distances of the Five Stationary Concepts Compared to the Observed Average (cf. SC 2008, Figure 12) Player 1 's payoff in the uppeMeft corner Player 2's payoff in the lower-rightcorner Figure Nash In anderen Spielen muss auch Risiko-/Verlustaversion berücksichtigt werden, aber insgesamt passt Logit-Ggw (QRE) gut A best response to a sample of pure strategies of the other player in one of the two games is also a best response to (correcting their Figure 12). It is notable that all models fit substantially better in the last block than in the first block, as one would hope for reasonable concepts of stationary behavior (which are not necessarily designed to explain early behavior). It is also the case that impulse balance equilibrium is the best model in the first block of 100 periods, the worst in the second block of 100 periods, and is best using Weizsäcker (2003) Hypothese Wahrheit liegt zwischen QRE und Level-1 QRE: Gegner sind genauso präzise wie ich; Level-1: Gegner agieren rein zuällig Asymmetric Logit Ggw (ALE): Gegner sind weniger präzise als ich, aber nicht rein zufällig (sie haben Präzision λ̃ mit 0 < λ̃ < λ) Jeder spielt ein subjektives Ggw, gegen Gegner mit geringer Präzision This content downloaded from 141.20.105.233 on Tue, 11 Jun 2013 04:42:10 AM All use subject to JSTOR Terms and Conditions Daten Von insgesamt 22 Spielen (2 × 2, 2 × 3, 3 × 3) aus drei vorhergehenden Experimenten Stahl und Wilson (1994, 1995), Costa-Gomes, Crawford und Broseta (2001) Hauptergebnisse Hypothese bestätigt: Teilnehmer ignorieren Anreize der Gegner weitgehend, sie betrachten nur die eigenen Anreize (Asymmetrie) Strenge Gleichgewichts-Annahme passt hier nicht Vergleich “Random-Utility” (Logit, bzw. ALE) mit “Noisy-Nash” (Nash-Ggw plus Fehler) zeigt, dass Logit-Ansatz die Fehler gut erfasst Asymmetrische Logit-Gleichgewichte 46 47 Die geschätzten Präzisionsparameter Costa-Gomes and Weizsäcker (2008) 736 Durchschnittliche eigene Präzision: λ = 4.08 Durschnittliche angenommene Präzision für Gegner: λ̃ = 2.18 14 Spiele mit eindeutigen Nash-Ggws 3×3 Spiele für erhöhte Komplexität und Variation ( erlaubt präzisere Analyse) Verteilung der Präzisionsparameter 158 REVIEW OF ECONOMIC STUDIES G. Weizsäcker / Games and Economic Behavior 44 (2003) 145–171 Manche Spiele Dominanz-lösbar, verschiedene Konzepte mit unterschiedlichen Vorhersagen 734 REVIEW OF ECONOMIC STUDIES TABLE 1 Games classified by strategic structure and models’ predicted actions Game COSTA-GOMES & WEIZSÄCKER STATED BELIEFS AND PLAY TABLE 3 #1 #2 #3 #4 #5 #6 #7 #8 #9 #10 #11 #12 #13 #14 741 (a) (b) Summary statistics of stated beliefs (data pooled across treatments) Fig. 3. Estimated densities parameters using pooled data. (a) Depicts the estimated density fγ (λi | ρ, K); Game Mean squared deviation of ALE Mean squared error from mean from opponent’s choice (b) the estimated density f (λ̃j | ρ̃, K). Columns Rows Columns γ Rows 1 2 3 4 5 6 7 8 9 10 11 12 13 14 Average 0·44 0·32 0·28 0·20 0·20 0·22 0·26 0·30 0·32 0·46 0·28 0·32 0·20 0·41 0·30 0·47 0·34 0·26 0·29 0·27 0·16 0·22 0·36 0·28 0·52 0·33 0·33 0·29 0·47 0·33 0·22 0·18 0·22 0·16 0·20 0·22 0·24 0·19 0·21 0·11 0·19 0·27 0·16 0·21 0·20 0·26 0·29 0·31 0·25 0·36 0·13 0·17 0·29 0·19 0·16 0·26 0·31 0·25 0·25 0·25 48 Note: Feasible range is [0, 2]. (a) Rounds of dominance Nash Naïve L1 L2 D1 Optimistic Y Y Y Y Y Y Y Y Y Y N N N N 2,3 3,2 2,3 3,2 2,3 3,2 2,3 3,2 3,4 4,3 –,– –,– –,– –,– T-L M-L B-R M-M T-M B-M M-R B-R T-R B-L M-M B-L T-R T-L M-L M-M T-M T-L B-L M-R B-R B-L T-L T-L B-M M-R T-M B-M T-M T-L B-M T-M T-L M-M M-R B-R M-R B-M M-R M-M B-R M-M T-L M-L B-M T-M T-L M-M M-R B-R T-M M-L B-M M-R T-M B-M B-M T-R M-M T-R M-L M-L T-M T-M M-L T-M T-L T-L M-L T-R Note: The games are ordered as in Table 1, but with decisions ordered as they appeared to the subjects; the equilibrium is identified by underlining its pay-offs. F IGURE 1 of each of their decisions, enabling them to infer their opponents’ choices. This feature simplifies our data analysis because subjects could not condition their decisions in the course of a session on the outcomes of previous decisions. The subjects were paid according to their action choice in one randomly chosen game, at a rate of $0·15 per point, and according to the accuracy of their belief statement in one randomly chosen game, using a proper scoring rule (described below), with the range of monetary earnings c 2008 The Review of Economic Studies Limited for belief statements between $0 and $10.11 Games 49 2.2. The games Überblick über Aktionen und Beliefs 744 Dominance solvable Analyse der Aktionen Table 1 summarizes the strategic structures of the 14 games and presents the action predictions of five models of game play that we used to design our games: Nash, Naïve-L1, L2, D1, and Optimistic. These models, along with three additional models, which make different predictions depending on the underlying parameter values (see Section 5), have played a role in the literature on one shot normal-form game experiments (Stahl and Wilson, 1994, 1995; McKelvey and Palfrey, 1995; Costa-Gomes, Crawford and Broseta, 2001; Weizsäcker, 2003; Goeree and Holt, 2004). We used the model predictions as criteria to select the 14 games, as we attempted to separate their predictions of play as much as possible (together with restrictions of dominance solvability and equivalence between pairs of games, see below).12 The Naïve-L1 model chooses REVIEW OF ECONOMIC STUDIES NE Nash-Ggw; L1 Level 1; D1 Level 1 nach Elim. Domin. Strats; L2 Level 2; Opt. Optimistic (Gegner spielt die Strategie, die mir am besten passen würde); LE Logit-Ggw; ALE Asymmetric Logit-Ggw; NI Noisy Introspection (b) Fig. 4. Estimated densities of ANNE parameters using pooled data. (a) Depicts the estimated density fβ ( i | a, b); (b) the estimated density fβ (˜ j | ã, b̃). IGURE −672·97 7·85 −556·83 3·48 −633·05 3·63 −3105·03 1·34 −652·37 1·57 −3177·03 0·59 −669·99 0·71 −3288·29 NI ALE λa ln L −565·87 −581·18 −637·33 −585·98 3·34 −625·96 3·88 −3005·67 λ̃a λa ln L 0·00 −541·90 0·00 −540·83 0·00 −602·35 0·70 −555·18 0·00 −603·99 0·00 −2853·47 6·13 7·65 7·10 8·41 5·94 7·01 λ̃a 6·48 7·65 7·23 8·93 6·10 7·19 ln L 1·17 −539·11 0·69 −539·75 1·01 −599·56 2·21 −542·35 1·27 −600·33 1·25 −2832·80 ALE, Asymmetric Logit Equilibrium; L1, Level-1; L2 Level-2; LE, Logit Equilibrium; NE, Nash equilibrium, NI, Noisy Introspection; Opt., Optimistic. Ergebnis NI passt leicht besser als ALE und L1, Rest passt nicht TABLE 10 Estimates of low-parameter models using belief statement data L1 D1 ALE NI Verbal NETeilnehmer spielen rechtL2 präziseOpt.Antwort LEauf recht “verwaschene” Beliefs λ λ̃ λ̃ ln L λ ln L λ ln L λ ln L λ ln L λ λ ln L λ λ ln L λ λ ln L (d.h. Beliefs nahe Gleichverteilung), Bestätigung von Weizsäcker (2003) A1 0·00 −4769·63 0·00 −4769·63 0·00 −4769·63 0·18 −4717·64 0·00 −4769·63 7·59 0·00 −4769·63 0·00 28·20 0·20 −4716·89 87·19 20·06 0·20 −4748·54 bs der Spielen Beste Antworten auf die eigenen Beliefs best responses to their own stated beliefs would actually have increased their earnings, given the (ex ante unknown) observed behaviour of their opponents. First consider the subjectively expected losses, which each subject could calculate by asking the question “By how much is my action in a given game a suboptimal response to my stated belief in the same game?” Notice that for each subject and in each game, these losses have an upper bound that is a function of the belief that the subject states and of the set of possible pay-offs c 2008 The Review of Economic Studies Limited 1A1AC 0·57 c 2008 The Review0·69 of Economic Studies 6·99 Limited Pooled −3310·02 −2855·22 IGURE LE 50 1A 1A1A 1AQ 1A1AC Pooled 0·00 0·00 0·00 0·00 0·00 bs −5008·11 −5485·07 −5365·83 −5246·59 −25875·2 0·00 0·00 0·00 0·00 0·00 bs −5008·11 −5485·07 −5365·83 −5246·59 −25875·2 0·04 0·00 0·00 0·10 0·00 bs −5007·74 −5485·07 −5365·83 −5243·82 −25875·2 0·23 0·22 0·29 0·20 0·22 bs −4924·41 −5402·75 −5233·33 −5177·45 −25464·6 0·00 0·00 0·00 0·00 0·00 a −5008·11 −5485·07 −5365·83 −5246·59 −25875·2 8·08 9·02 8·09 8·29 8·09 bs 0·11 0·00 0·18 0·06 0·07 −5000·79 −5483·38 −5348·37 −5244·40 −25860·9 a a 0·00 0·03 0·07 0·00 0·00 21·70 40·10 27·22 28·76 28·76 bs 0·28 0·22 0·32 0.22 0·24 −4921·45 −5402·56 −5230·81 −5176·13 −25458·6 a a 76·76 96·65 75·33 62·49 79·79 18·42 24·17 18·65 15·47 19·64 REVIEW OF ECONOMIC STUDIES In particular, it appears that subjects have a systematically distorted perception of their opponents: Both distributions of the actual response parameters λj and j lie in the more “rational” area of the parameter range, as compared to the distributions of the perceived response parameters λ̃j and ˜ j . The estimated means are E[λi ] = 7.20 as compared to E[λ̃j ] = 3.92, and E[ i ] = 0.30 as compared to E[˜ j ] = 0.58 (with estimated variances of var(λi ) = 20.83, var(λ̃j ) = 26.62, var( i ) = 0.02, and var(˜ j ) = 0.10). F 3 between the means of the subjects’ actual and perceived response This discrepancy Action frequencies and average belief statements (pooled across treatments and isomorphic player roles, numbering F 4 according perspective) parameters canto Row beplayer’s tested statistically by reestimating the models under the restriction (a) Empirical p.d.f. and (b) empirical c.d.f. of number of subjects with x best-responses to stated first-order beliefs c 2008 The Review of Economic Studies Limited that the expected values of the respective pairs of parameters are equal, i.e., under the null hypotheses that E[λi ] = E[λ̃j ] and E[ i ] decision-making = E[˜ j ]processes, hold,eitherrespectively. when they choose their Denoting actions or when they state their beThe observed inconsistencies may or may not be statistically significant, noise is r , liefs. ∗ − the likelihood-ratio statistic l r )showoncethatthewhen the log-likelihood of the restricted model by l appropriately taken into account. The structural approach2(l in Section 4 will this Links Allgemeine Verteilung von Aktionen und Beliefs. is done most deviations are indeed significant. ofmuchfreedom. The resulting critical is (asymptotically) χ 2 -distributed with one degree How does it cost subjects that their actions and stated beliefs are not consistent with Rechts Häufigkeit von Aktionen, die Beste Antworten auf die eigenen Beliefs sind. each other? We address this issue by two sets of calculations. First, we simulate the subjectively significance levels of rejecting the null hypotheses arelosses, p by=taking 0.021 forstated thebeliefs ALE expected the subjects’ as theirstrategy “true” underlying beliefs. Under this simplifying assumption (which we avoid elsewhere in the paper, but which is convenient model (two-tailed). thehave to expect from model and p = 2.749 × 10−9 for the ANNE strategy for our purposes here), we can measure the losses that Hence, the subjects would their action choices, relative to the actions that are the best responses to in their stated beliefs. Ergebnis Weit verteilte Aktionen und Beliefs, 50% der Teilnehmer spielen 50% observation that subjects on average behave as if Second, underestimating response precision we determine the ex postthe realized losses, by asking whether changing their actions to 756 c 2008 The Review of Economic Studies Limited 11. For treatments 1AQ and 1A1AC, which were conducted more than four years after the other treatments, we adjusted the payments for inflation by paying $0·18 per point in the games and up to $12 in the belief statement task. In the rest of the paper, we use real payments (in 2000 terms) whenever we calculate $ earnings. Subjects’ average earnings for playing the games were $8·42, $9·07, $9·51, $9·76, and $9·71 for A1, 1A, 1A1A, 1AQ, and 1A1AC subjects, respectively; their average earnings for their belief statements were $6·32, $6·95, $6·30, $6·19, and $6·27 for A1, 1A, 1A1A,91AQ, TABLE and 1A1AC subjects, respectively. Their total average earnings including show-up fees and earnings from Part III in A1 Estimates of low-parameter models using action data and 1A were $30·25, $31·52, $29·13, $28·28, and $28·33 for A1, 1A, 1A1A, 1AQ, and 1A1AC subjects, respectively. 12. Apart from separating the predictions of the models that make a pure-strategy prediction in our games (Nash, NEalso attempted to select L1 the games in orderD1to achieve high discriminatory L2 Opt. L1, L2, D1, Optimistic), we power among the additional models,aLE, ALE, and NI, which predict different behaviour only for intermediate parameter values (see ln L λa ln L λa ln L λa ln L λa ln L λa λ Section 5). This was done by considering several sets of parameter values for these models, and selecting the games such that for intermediate ranges of the parameter values (i) each of these models predicts that in some games the probability 6·13 −541·90 3·73 −571·94 1·31 −593·08 0·65 −607·91 3·34 A1 0·60 −611·66 mass is concentrated on one action, and in other games it is distributed roughly equally (so the intermediate models can be 1A and0·53 −643·01 7·60 −540·90 −602·03 1·46 predictions −618·89for comparable 0·90 −628·22 3·73 better identified separated from the pure models), and (ii) the 3·53 three models make different 1A1A values, 0·75 at least −699·82 7·09 −602·36 3·84 −652·99 −676·66 −694·96 3·87 sets of parameter in one of the predicted choice probabilities. Both criteria1·49 could be satisfied only0·84 partially, −680·15 6·27 −609·69 3·60 −644·64 2·26 −629·39 0·59 −685·05 4·81 however, 1AQ as the three1·00 models are highly correlated. bs 0·35 0·26 0·41 0·26 0·29 −4943·00 −5443·67 −5273·67 −5205·22 −25630·0 51 W OF ECONOMIC STUDIES ted ALE, Asymmetric Logit Equilibrium; L1, Level-1; L2 Level-2; LE, Logit Equilibrium; NE, Nash equilibrium, NI, Noisy Introspection; Opt., Optimistic. Analyse der Beliefs TABLE 10 Estimates of low-parameter models using belief statement data NE A1 1A 1A1A 1AQ 1A1AC Pooled L1 D1 L2 Opt. LE ALE NI λbs ln L λbs ln L λbs ln L λbs ln L λbs ln L λa λbs ln L λa λ̃a λbs ln L λa λ̃a λbs ln L 0·00 0·00 0·00 0·00 0·00 0·00 −4769·63 −5008·11 −5485·07 −5365·83 −5246·59 −25875·2 0·00 0·00 0·00 0·00 0·00 0·00 −4769·63 −5008·11 −5485·07 −5365·83 −5246·59 −25875·2 0·00 0·04 0·00 0·00 0·10 0·00 −4769·63 −5007·74 −5485·07 −5365·83 −5243·82 −25875·2 0·18 0·23 0·22 0·29 0·20 0·22 −4717·64 −4924·41 −5402·75 −5233·33 −5177·45 −25464·6 0·00 0·00 0·00 0·00 0·00 0·00 −4769·63 −5008·11 −5485·07 −5365·83 −5246·59 −25875·2 7·59 8·08 9·02 8·09 8·29 8·09 0·00 0·11 0·00 0·18 0·06 0·07 −4769·63 −5000·79 −5483·38 −5348·37 −5244·40 −25860·9 0·00 0·00 0·03 0·07 0·00 0·00 28·20 21·70 40·10 27·22 28·76 28·76 0·20 0·28 0·22 0·32 0.22 0·24 −4716·89 −4921·45 −5402·56 −5230·81 −5176·13 −25458·6 87·19 76·76 96·65 75·33 62·49 79·79 20·06 18·42 24·17 18·65 15·47 19·64 0·20 0·35 0·26 0·41 0·26 0·29 −4748·54 −4943·00 −5443·67 −5273·67 −5205·22 −25630·0 ALE, Asymmetric Logit Equilibrium; L1, Level-1; L2, Level-2; LE, Logit Equilibrium; NE, Nash equilibrium, NI, Noisy Introspection; Opt., Optimistic. Ergebnis ALE und L2 passen am besten, NI geht noch, Rest passt nicht Fazit: Aktionen sind L1, Beliefs sind L2; ALE passt insgesamt Wahl einer Aktion: Wenig Hineinversetzen in Gegner, Ignorieren seiner Anreize, Annahme Gegner randomisiert fast gleichförmig Wahl eines Beliefs: ≈ Wahl einer Aktion aus seinen Augen (wenig Hineinversetzen in mich, ignorieren meiner Anreize) Insgesamt konsistent, aber nicht rational: Die abgefragten Beliefs passen nicht zu den Beliefs, die implizit meine Aktionen rechtfertigen Zusammenfassung 53 52 Zusammenfassung Menschen spielen keine Nash-Gleichgewichte Zufällige Abweichungen (logistische Fehler, zufälliger Nutzen) Systematische Abweichungen Wesentliche systematische Abweichung: Menschen unterschätzen/ignorieren die Anreize Anderer Sie haben ein vereinfachtes Modell der Entscheidungen anderer im Kopf, insgesamt stark verrauschte Beliefs, teils nahe Gleichverteilung Menschen reagieren jedoch auf Änderung eigener Anreize Passend sind bspw. Asymmetric Logit Equilibrium und Noisy Introspection Präzision und Asymmetrie schwanken recht stark zwischen Spielen und zwischen Menschen Vorhersagen und robuste Anwendung schwierig Themen Noch lange kein Konsens in der Literatur 54 55 Mögliche Themen für die Hausarbeit Die angegebenen Quellen unten sind nicht erschöpfend oder notwendig, sondern gedacht als Ausgangspunkte für die Suche Vergleich von Ratespielen mit unterschiedlichen p-Faktoren (Bosch-Domenech et al., 2002; Ho et al., 1998) Ratespiele mit zwei Spielern (Costa-Gomes and Crawford, 2006; Grosskopf and Nagel, 2008) Alternative Varianten des Ratespiels (Duffy and Nagel, 1997; Shapiro et al., 2014) Das Cognitive Hierarchy Modell (Camerer et al., 2004; Crawford et al., 2013) Literatur Endogene Anzahl an Denkschritten (Agranov et al., 2012; Alaoui and Penta, 2015) 56 Literatur I 57 Literatur II Costa-Gomes, M. and Weizsäcker, G. (2008). Stated beliefs and play in normal-form games. Review of Economic Studies, 75(3):729–762. Agranov, M., Potamites, E., Schotter, A., and Tergiman, C. (2012). Beliefs and endogenous cognitive levels: An experimental study. Games and Economic Behavior, 75(2):449–463. Crawford, V. P., Costa-Gomes, M. A., and Iriberri, N. (2013). Structural models of nonequilibrium strategic thinking: Theory, evidence, and applications. Journal of Economic Literature, 51(1):5–62. Alaoui, L. and Penta, A. (2015). Depth of reasoning and incentives. Review of Economic Studies (accepted). Duffy, J. and Nagel, R. (1997). On the robustness of behaviour in experimental’beauty contest’games. The Economic Journal, 107(445):1684–1700. Bernheim, B. (1984). Rationalizable strategic behavior. Econometrica, 52(4):1007–1028. Bosch-Domenech, A., Montalvo, J., Nagel, R., and Satorra, A. (2002). One, two,(three), infinity,. . . : Newspaper and lab beauty-contest experiments. American Economic Review, 92(5):1687–1701. Goeree, J. and Holt, C. (2004). A model of noisy introspection. Games and Economic Behavior, 46(2):365–382. Goeree, J. K., Holt, C. A., and Palfrey, T. R. (2003). Risk averse behavior in generalized matching pennies games. Games and Economic Behavior, 45(1):97–113. Breitmoser, Y. (2012). Strategic reasoning in p-beauty contests. Games and Economic Behavior, 75(2):555–569. Grosskopf, B. and Nagel, R. (2008). The two-person beauty contest. Games and Economic Behavior, 62(1):93–99. Brunner, C., Camerer, C., and Goeree, J. K. (2011). Stationary concepts for experimental 2 2 games: Comment. American Economic Review, 101(2):1029–1040. Ho, T., Camerer, C., and Weigelt, K. (1998). Iterated dominance and iterated best response in experimental ”p-beauty contests”. American Economic Review, 88(4):947–969. Camerer, C., Ho, T., and Chong, J. (2004). A cognitive hierarchy model of games. Quarterly Journal of Economics, 119(3):861–898. Costa-Gomes, M. and Crawford, V. (2006). Cognition and behavior in two-person guessing games: An experimental study. American Economic Review, 96(5):1737–1768. McKelvey, R. D. and Palfrey, T. R. (1995). Quantal response equilibria for normal form games. Games and Economic Behavior, 10(1):6–38. 58 59 Literatur III Literatur IV McKelvey, R. D., Palfrey, T. R., and Weber, R. (2000). The effects of payoff magnitude and heterogeneity on behavior in 2 × 2 games with unique mixed strategy equilibria. Journal of Economic Behavior and Organization, 42(4):523–548. Nagel, R. (1995). Unraveling in guessing games: An experimental study. American Economic Review, 85(5):1313–1326. Nash, J. (1951). Non-cooperative games. Ann. Math., 2(54):286–295. Stahl, D. O. and Wilson, P. W. (1995). On players’ models of other players: Theory and experimental evidence. Games and Economic Behavior, 10(1):218–254. Ochs, J. (1995). Games with unique, mixed strategy equilibria: An experimental study. Games and Economic Behavior, 10(1):202–217. Weizsäcker, G. (2003). Ignoring the rationality of others: evidence from experimental normal-form games. Games and Economic Behavior, 44(1):145–171. Pearce, D. (1984). Rationalizable strategic behavior and the problem of perfection. Econometrica, 52(4):1029–1050. Ross, L., Greene, D., and House, P. (1977). The “false consensus effect”: An egocentric bias in social perception and attribution processes. Journal of Experimental Social Psychology, 13(3):279–301. Selten, R. and Chmura, T. (2008). Stationary concepts for experimental 2x2-games. American Economic Review, 98(3):938–966. Shapiro, D., Shi, X., and Zillante, A. (2014). Level-k reasoning in a generalized beauty contest. Games and Economic Behavior. 60 61