Das Ratespiel - Advanced Experimental Economics 2016/17

Werbung
Überblick
Mehrere Entscheider agieren simultan, vollständige Information
Alle Entscheider müssen gleichzeitig Vorstellungen über Gegner entwickeln
Nullsummenspiele mit simultanen Zügen
Jetzt: Gleichgewichte sind eindeutig und soziale Präferenzen sind sekundär
v.a. wenn sich Auszahlungen zu Null/Konstante addieren (Nullsummenspiel)
strategische Überlegungen sind dominant (sonst ergeben sich zusätzlich
strategische und soziale Koordinationsprobleme – kommt später)
Themen
Ratespiele, Strategische Dominanz, Nash-Gleichgewicht
gemischte Strategien, Quantal-response Gleichgewichte, Level-k
Matching pennies, gemischte Gleichgewichte, Existenz
Yves Breitmoser, HU Berlin
Zusammenhang Beliefs und Strategien
1
Ein einfaches Ratespiel (Nagel, 1995)
Ratespiel
Jeder von Ihnen tippt eine Zahl aus dem Interval [0, 100]. Jede reelle Zahl
ist erlaubt, einschliesslich der Intervalgrenzen. Von allen Tipps berechnen
wir dann den Durchschnitt x und multiplizieren den mit 2/3. Die Person,
deren Tipp am nächsten an diesem Wert 2/3 · x ist, gewinnt.
Notieren Sie bitte Ihre Tipps.
Was haben Sie sich dabei gedacht?
Das Ratespiel
2
3
Beauty Contests
Das strategische Problem:
Es gewinnt der, der am besten die Tipps der anderen vorhersagt
Bzw. der, der am besten vorhersagt, was die anderen vorhersagen
Oder noch eine Stufe weiter?
Keynes bezeichnete dieses Spiel als “Beauty Contest”
Es ähnelt Preisauschreiben wie “Tor des Monats”, wo unter allen
Teilnehmern, die auf den Sieger tippten, ein Preis verlost wird
Wenn man gewinnen möchte, sollte man nicht auf den eigenen Favoriten
tippen, sondern auf das, was man für den Favoriten der Mehrheit hält
Bzw. auf das, was man glaubt, was die Mehrheit für den Favoriten der
Mehrheit hält
Ähnliche Probleme bspw. in Auktionen oder auf Aktienmärkten
Denkschritte
Es geht nicht darum, was man selbst für richtig hält, sondern was die
anderen für richtig halten
Oder was man glaubt, was die Mehrheit glaubt, was die anderen für richtig
halten
4
5
Schrittweises Denken und Denktiefe
Formalisierung
Gibt es solches “schrittweises” Denken? Kann man das in den Daten
erkennen? Woran könnte man Denkschritte erkennen?
1. Jeder hat eine grobe Vorstellung über das Verhalten der anderen
Konkret: Wie kann man die Denkschritte in Zahlen (“Tipps”) ausdrücken
2. Jeder versucht, einen zu seinem Belief passenden Tipp abzugeben
Formal “Belief”: subjektive Wahrscheinlichkeiten über deren Strategien
Es gewinnt der, der am besten die Tipps der anderen vorhersagt
Formal: eine gute oder beste Antwort auf seinen Belief
Bzw. der, der am besten vorhersagt, was die anderen vorhersagen, was die
Tipps der anderen wären, usw.
Angenommen das stimmt. Dann ergeben sich folgende Fragen:
Sind alle Beliefs richtig? (= Gleichgewicht)
Die Stufen haben keinen Anfang, sie sind zirkulär
Falls nicht, haben zumindest alle die gleichen falschen Beliefs?
Jeder gehört zu den “anderen” aus Sicht der “anderen”
Woher kommen dann die Beliefs, bzw. wie werden sie geformt?
Wählen alle Personen die besten Antworten auf ihre Beliefs?
Worauf wir uns vielleicht einigen können: Jeder, der einen Tipp abgibt,
Falls nicht, können wir die Fehler darstellen und quantifizieren?
hat eine grobe Vorstellung über das Verhalten der anderen, und
versucht, einen dazu passenden Tipp abzugeben
Antworten: Nein; Könnte sein; Schwer zu sagen; Nein; Einigermaßen.
6
7
Richtige Beliefs + Beste Antworten = Nash-Ggw
Eigenschaften der Nash-Gleichgewichte
Betrachten wir ein diskretes Ratespiel: Spieler i = 1, . . . , n wählen aus den
Aktionen Ai = {0, 1, . . . , 100}
Reines Gleichgewicht Alle Spieler wählen eine ihrer Aktionen mit
Wahrscheinlichkeit 1
Strategie
Gemischtes Gleichgewicht Mindestens ein Spieler “randomisiert”
Eine Strategie σi ist eine Wahrscheinlichkeitsverteilung über die eigenen
Aktionen ai ∈ Ai . Hier ist σi (ai ) die Wahrscheinlichkeit,
P mit der man ai
wählt. Die Summe aller Wahrscheinlichkeiten ist 1: ai ∈Ai σi (ai ) = 1.
Im diskreten Ratespiel mit n > 3: Es gibt zwei (reine) Nash-Ggws
Alle wählen 0 (mit Wahrscheinlichkeit 1)
Alle wählen 1 (bzw. die kleinste Zahl größer als 0)
Liste gegnerischer Strategien: σ−i = (σ1 , . . . , σi−1 , σi+1 , . . . , σn )
Allgemeine Eigenschaften von Nash-Gleichgewichten
Erwartete Auszahlung von σi gegen σ−i sei πi (σi , σ−i )
Mindestens ein Nash-Gleichgewicht existiert immer; das kann gemischt sein
Richtige Beliefs: Man kennt/ahnt die Strategie der anderen
Die Anzahl der Nash-Gleichgewichte ist “fast immer” ungerade
Nash-Gleichgewicht (Nash, 1951)
Wenn man mischt (randomisiert), dann muss man indifferent zwischen den
Aktionen sein, über die man randomisiert (sonst würde man die bessere
Strategie immer wählen)
Ein Strategieprofil σ = (σ1 , . . . , σn ) ist ein Nash-Ggw, wenn für alle Spieler
i gilt: σi ist eine beste Antwort auf σ−i : σi ∈ arg maxσi0 πi (σi0 , σ−i ).
Da indifferent, gibt es keinen Grund, genau wie im Ggw zu randomisieren
Aber Purifizierbarkeit: Erklärung durch Verhalten in ähnlichen Spielen
9
8
Bosch-Domenech, Montalvo, Nagel, Satorra (2002)
THEAMERICANECONOMICREVIEW
1694
2. Classroom experiments (6,7)
1. Lab experiments (1-5)
'
C
?
0.16
0.14
?
0120.10
0.080.06
0.04-
0.16
0.14
0.12
0.10D 0.08
0.06
average: 35.13
a
3
_Z
0.02-
0o.oo
1!
,l,.l......
t............
0
15
22
,33
=
50
choices
I
average: 26.84
0.04
0.02
o.oo,1t
lll,
0
100
*?
?
3
ao
0.16
0.14*
0.12-
.0)<U~~~~~
.0.20
~~.14-~~
0?
average: 25.20
n
u-10or
~0
.08
0.068o34
0.06
002
0 0021.~
ll
o
=
rBRIBClnTIN.
15 22
0
33
0.18
Q
0.16
0.14
-11
0.102
t
0.08
0.02
15 22
0
100
0*
0.02
-I2
= 0.00
0.00
0
100
6. Newspaper experiments (15-17)
.
c
average: 22.16
0.^10
.
,
50
33
choices
5. InternetNewsgroup experiment
C
100
average: 17.15
a
choices
0.16
0.14
0.121
0.10 =
0.08
0.06
0.04
.......
50
choices
33
0.22
=
klrlr,lllrlkL.t.
............ll..
r,o0w;ltlll................................
50
. l . .. ., l
15 22
4. Theorists experiments (10-13)
3. Take-home experiments (8,9)
n
DECEMBER2002
cr
=
cr
0.16
0.140.120.100.08-
average: 23.08
006
.
Logit-Gleichgewichte
0.04|
I b .
rrwfr.
15 22
33
k
I Po'
iPPJP
50
choices
....... 1 .......1 .,
.............
100
. lllliII 'iI L
Wir., ,
fWWf,,
.00 r
.,,,0
0
15
22
33
,
,
50
choices
f,
tf
,,,
100
FIGURE 3. RELATIVE FREQUENCIES OF CHOICES IN THE SIX GROUPS OF EXPERIMENTS
Die Masse spielt kein Nash-Gleichgewicht, aber zumindest bis zu 20% bei
terval containing all
of the averages in the
aware, however, of some
large.und
They are
Theoretikern
Newsgroup
three Newspaper experiments.22 By contrast,
of their basic sociodemographic character2/3
istics (age, sex, training ...). In a news-
among the entire population of all Newspaper
10
11
Richtige Beliefs + Logit-Antworten = Logit-Ggw
Eigenschaften der Logit-Gleichgewichte
Einfachste Fehlerform: stochastische Nutzenschwankungen, die zu
Abweichungen von der “objektiv” besten Antwort führen
exp{λ · πi (ai , σ−i )}
Zur Erinnerung: σi (ai ) = P
0
a0 exp{λ · πi (ai , σ−i )}
i
Sei πi (σi , σ−i ) wieder die eigene Auszahlung durch σi gegen σ−i
λ ∈ R+ ist der Präzisionsparameter
Logit-Gleichgewicht (McKelvey and Palfrey, 1995)
Je höher λ, desto weniger Rauschen, desto höher die Wahrscheinlichkeit,
dass die beste Antwort gewählt wird
Ein Strategieprofil σ = (σ1 , . . . , σn ) ist ein Logit-Ggw, wenn es ein λ ≥ 0
gibt, so dass für alle Spieler i gilt: σi ist eine Logit-Antwort auf σ−i ,
λ → ∞ führt zur besten Antwort (Nash-Gleichgewicht)
λ = 0: Gleichverteilung über den Aktionen (“reines Rauschen”)
exp{λ · πi (ai , σ−i )}
für jede Aktion ai gilt: σi (ai ) = P
.
0
a0 exp{λ · πi (ai , σ−i )}
Allgemeine Eigenschaften:
Logit-Gleichgewichte existieren immer
i
Es gibt einen geschlossen Pfad von Logit-Ggws ausgehend von λ = 0 bis
λ → ∞, und der konvergiert zum “Risiko-dominanten” Gleichgewicht
Gegenseitige Logit-Antworten anstelle gegenseitig bester Antworten.
Für alle λ < ∞: jede Aktion hat positive Wahrscheinlichkeit
Die Logit-Formel ist die gleiche wie zuvor (im “Zufälliger-Nutzen-Modell”)
Abweichungen von “Logit” sind wie im Roter-Bus-Blauer-Bus-Problem denkbar
Logit-Gleichgewicht sind der bekannteste (und einzig relevante) Spezialfall
der Quantal-Response-Gleichgewichte (QRE). Daher oft: QRE = Logit
12
Weitere bekannte Fehler
13
Anwendung der Logit-Gleichgewichte in Ratespielen
Mit illusorischem Clustering: Gegner verteilen sich auf m ≤ n − 1 Cluster
562
Illusorisches Clustering
Y. Breitmoser / Games and Economic Behavior 75 (2012) 555–569
Bei vielen Gegnern: Zusammenfassung der Gegner zu wenigen Clustern
“Ein paar machen vielleicht das, ein paar dieses, und der Rest jenes”;
“Der Markt hat heute positiv reagiert.”; “Der Wähler hat entschieden”
Dadurch Unterschätzung der Unabhängigkeit und Heterogenität der
anderen, Überschätzung des eigenen Verständnisses/Gewinnchancen
False Consensus / Projection (Ross et al., 1977)
Bei unbekannten Attributen der anderen überschätzt man die
Wahrscheinlichkeit, dass sie einem selbst ähnlich sind
Je höcher λ, desto näher am Nash-Ggw 0
Berücksichtigung in Analysen: Im Prinzip möglich, bisher noch selten
Je höher Cluster-Anzahl m, desto breiter die Verteilung
Mit kleinem m ist das vielleicht eine passende Darestellung der “Masse”
14
15
Falsche Beliefs + Beste Antworten = Dominanz
Belief σ̃−i : die Liste gegnerischer Strategien, mit der i rechnet
Rationalität
Spieler i ist rational, wenn seine Strategie σi eine beste Antwort auf seinen
Belief σ̃−i ist. Der Belief σ̃−i ist hier beliebig.
Gegenseitiges Wissen von Rationaliät
Alle Spieler sind rational und wissen, dass alle Spieler rational sind.
Allgemeinwissen von Rationalität
Dominanz
Alle Spieler sind rational, wissen, dass alle Spieler rational sind, wissen,
dass alle wissen, dass alle rational sind, usw.
17
16
Anwendung von Rationalität
Anwendung: Gegenseitiges Wissen von Rationalität
Ein rationaler Spieler wählt also Strategien, die beste Antworten sind (auf
beliebige Beliefs). Das schließt u.a. alle dominierten Strategien aus.
Im Ratespiel: Wenn man weiß, dass alle rational sind, dann kann man
schließen, dass keiner 100 wählen wird.
Dominanz
Im diskreten Ratespiel {0, . . . , 100}: Dann sollte man weder 100 noch 99
wählen.
Strategie σi dominiert σi0 , wenn sie gegen jede gegnerische Strategie zu
einer höheren Auszahlung führt: πi (σi , σ−i ) > πi (σi0 , σ−i ) ∀σ−i .
Aber 98 ist z.B. eine beste Antwort auf den Belief, dass alle Gegner 99
wählen, und dieser Belief ist konsistent mit dem Wissen um Rationalität
Mit jeder weiteren Wissensstufe können wir dann eine weitere Zahl
eliminieren, bis schließlich nur noch 0 und 1 übrig sind
Nur 0 und 1 sind “rationalisierbar” (d.h. nach ∞ Stufen noch übrig)
Im Ratespiel:
Stetig, Aktionen aus dem Interval [0, 100]: man sollte nicht 100 wählen
Diskret, Aktionen aus der Menge {0, . . . , 100}: man sollte nicht 100 wählen
Rationalisierbarkeit (Bernheim, 1984; Pearce, 1984)
Schwache Dominanz
Schritt 1: Eliminiere alle Strategien, die keine besten Antworten sein können
Schritt 2: Eliminiere alle Strategien, die nun keine besten Antworten sein können
. . . usw. Alle Strategien, die am Ende übrig sind, heißen rationalisierbar.
Strategie σi dominiert σi0 , wenn sie gegen jede gegnerische Strategie zu
einer schwach höheren Auszahlung führt, πi (σi , σ−i ) ≥ πi (σi0 , σ−i ) ∀σ−i ,
und zu einer streng höheren Auszahlung gegen mindestens ein σ−i .
Im stetigen Ratespiel [0, 100]: Keine weiteren Konsequenzen
Bspw. 99.9 ist eine beste Antwort auf den Belief, dass alle Gegner 99.99
wählen, und dieser Belief ist konsistent mit dem Wissen um Rationalität
Im Ratespiel: alles über 2/3 · 100 ≈ 66.67 ist schwach dominiert
18
19
Sind das die ursprünglich angesprochenen
Denkschritte?
Wohl nicht.
In den meisten Experimenten war die Schrittgröße höchstens .01
Damit benötigt man 5000 Schritte, um von 100, über 99.99, 99.98 usw. bis
unter 50 zu kommen
Für die meisten Teilnehmer ist das aber schon nach dem ersten Schritt klar
Dann vielleicht die Schritte aus “schwacher Dominanz”
Schritt 1: 100 · 2/3 ≈ 66.7
Schritt 2: 100 · (2/3)2 ≈ 44.4
Schritt 3: 100 · (2/3)3 ≈ 29.6, . . .
Level-k
Hatte jemand diese Zahlen im Kopf?
21
20
Das Level-k Modell (Nagel, 1995; Stahl and Wilson,
1995)
Zur Erinnerung: Hier die Daten
THEAMERICANECONOMICREVIEW
1694
2. Classroom experiments (6,7)
1. Lab experiments (1-5)
Intuitives Problem des obigen Ansatzes: Zu Beginn betrachtet er alle
Strategien als gleich plausibel
'
C
?
0.16
0.14
0.12
0.10D 0.08
0.06
average: 35.13
a
3
_Z
0.02-
(0, 0, . . . , 0) ist genauso plausible wie (100, . . . , 100)
Diese Vielfalt im ersten Schritt ist das “Worst-Case” Szenario
Unbewusst eliminieren wir aber bestimmte Strategien wie (100, . . . , 100)
schon vor dem ersten Schritt
0o.oo
1!
,l,.l......
t............
0
15
22
,33
=
50
choices
I
average: 26.84
0.04
0.02
o.oo,1t
lll,
0
100
Idee: Der tatsächliche erste Schritt basiert auf einer Gleichverteilung
ao
0.16
0.14*
0.12-
.0)<U~~~~~
average: 25.20
u-10or
~0
.08
0.068o34
0.06
002
0 0021.~
ll
o
=
rBRIBClnTIN.
15 22
0
Im Durchschnitt wählen die Gegner also 50, die beste Antwort darauf ist ca.
2/3 · 50 = 33
Schritt 2: Angenommen, man glaubt, der durchschnittliche Gegner denkt
auch so, dann sollte ich einen Schritt weiter gehen: Beste Antwort auf 33 ist
2/3 · 33 = 22
Weitere Schritte: 14.81, 9.87, 6.58, . . .
.0.20
~~.14-~~
0?
n
33
0.18
Q
0.16
0.14
-11
0.102
t
0.08
0.02
15 22
0
100
0*
=
0.^10
0.00
0.00
I b .
rrwfr.
15 22
33
0.02
-I2
0
.
,
50
33
100
choices
6. Newspaper experiments (15-17)
5. InternetNewsgroup experiment
C
100
average: 17.15
a
choices
0.16
0.14
0.121
0.10 =
0.08
0.06
0.04
.......
50
choices
33
0.22
=
klrlr,lllrlkL.t.
............ll..
r,o0w;ltlll................................
50
. l . .. ., l
15 22
4. Theorists experiments (10-13)
3. Take-home experiments (8,9)
n
*?
?
3
Dies ist das Level-k Modell strategischen Denkens. Hatte jemand diese
Schritte im Kopf?
0.16
0.14
?
0120.10
0.080.06
0.04-
DECEMBER2002
.
c
average: 22.16
cr
=
cr
0.16
0.140.120.100.08-
average: 23.08
006
.
0.04|
k
I Po'
iPPJP
50
choices
....... 1 .......1 .,
.............
100
. lllliII 'iI L
Wir., ,
fWWf,,
.00 r
.,,,0
0
15
22
33
,
,
50
choices
f,
tf
,,,
100
FIGURE 3. RELATIVE FREQUENCIES OF CHOICES IN THE SIX GROUPS OF EXPERIMENTS
22
large. They are aware, however, of some
of their basic sociodemographic character-
terval containing all 2/3 of the averages in the
three Newspaper experiments.22 By contrast,
23
Ist das eine Erklärung?
Insgesamt wählen 10%–15% entweder 22 oder 33; Ausnahme Classroom,
dort insgesamt 25%
Mit Nash-Ggw zusammen sind das bis zu 30% der Teilnehmer – 70%
spielen etwas anderes
Level-k und Ggw streng genommen reichen nicht
Ist es vielleicht Level-k mit “Rauschen”, also Logit-Level-k
Das müsste dann so aussehen . . .
Evaluation der Modelle
25
24
Level-k mit logistischen Fehlern (Logit Level-k)
Y. Breitmoser / Games and Economic Behavior 75 (2012) 555–569
Rationalisierbarkeit + Logit = Noisy Introspection
561
Es gibt noch eine weitere Idee: Nicht beste Antwort auf beste Antwort auf
beste Antwort . . . , wie in Rationalisierbarkeit, sondern:
Noisy Introspection (Goeree and Holt, 2004)
Logit Antwort auf Logit Antwort auf Logit Antwort
wobei jeder glaubt, er hat eine leicht höhere Präzision als die Gegner
Bspw. jeder glaubt, er ist doppelt so präzise wie seine Gegner
Präzision λ verdoppelt sich in jedem Schritt
Rückwärts: Ich habe 100, meine Gegner 50
Jeder Gegner hat 50, glaubt seine Gegner hätten 25
Die mit 25 glauben, ihre Gegner hätten 12.5, usw.
Dieses Modell der Noisy Introspection führt zu folgenden Vorhersagen . . .
Note: The plots are “proportional” representations of the choice probabilities in the discrete beauty contest with 1001 choices (0, 0.001, 0.002, . . . , 1).
The actual choice probabilities had been taken to the power of 0.25, as they often are very close to zero and hardly visible on a [0, 1] axis.
Die Übergänge müssten
sein
zumindest
diem =70%
Fig. 5. Level-kglatter
predictions for
various–
precision
levels (n = 30 and
n − 1). “Rest” orientieren sich
nicht an den Leveln
1
f i (xi ) = exp λk · π (xi |m, f k−1 )
exp λk · π (x̃i |m, f k−1 ) d x̃i .
(9)
26
27
Vergleich Logit-Ggw und Noisy Introspection
562
Ergebnis: Was passt am besten?
Y. Breitmoser / Games and Economic Behavior 75 (2012) 555–569
Umfangreiche ökonometrische Analyse (Breitmoser, 2012)
Masse der Teilnehmer (70%) wird am besten durch Logit-Ggw (QRE)
erfasst
Die drei Massepunkte:
33 Level-1 oder Noisy Introspection
22 Noisy Introspection (Level 2 oder 3 streng genommen sind anders)
0 QRE oder Noisy Introspection mit hoher Präzision (= Nash-Ggw)
Es gibt hier kein echtes “schrittweises Denken”. Die Hoch-Level-Konzepte
QRE und NI erklären alles bis auf 33 besser, und 33 selbst genauso gut.
Note: Similarly to Fig. 5, the choice probabilities are rescaled (by taking them to the power of 0.25) to accentuate the effects on the [0, 1] scale. Further,
m = 4 in the NI models.
NI-Verteilungen sind etwasFig.spitzer
als Logit-Ggw (QRE) Verteilungen
6. QRE and NI predictions.
29
28
payoff of choosing xi ∈ X := {0, 0.001, 0.002, . . . , 1} if all opponents play according to the strategy
the discrete logit choice probabilities for given λ and m as
σ xi |λ, σ = exp λ · π xi |m, σ exp λ · π xi |m, σ σ ∈ ( X ), and define
.
(11)
x ∈ X
Die
Erklärung passt ziemlich gut
The quantal response equilibrium is defined as follows. (In the analysis, I will consider mixture models with up to K = 4
i
566
Y. Breitmoser / Games and Economic Behavior 75 (2012) 555–569
such QRE components.)
Definition 3.2 (QRE). Given λ ∈ R+ , the QRE choice probabilities
σ ∈ ( X ) satisfy σ = σ (·|λ, σ ).
In p-beauty contests, it seems plausible to assert uniqueness of QREs for moderate λ, but a general result confirming
this assertion is not available. The QREs underlying my analysis are the ones located along the principal branch, which is a
result of using the following simple homotopy method (for more elaborate methods, see Turocy, 2005, 2010). Starting at a
known solution (i.e. at the one for λ = 0 initially), I increase λ in steps of at most 0.25, and after each increase of λ, I solve
for the respective QRE by function iteration. If the function iteration does not converge, the step size is reduced. Thanks to
the simplicity of the beauty contest game, this simple method worked well.
Noisy introspection, in contrast, is defined as follows.
Definition 3.3 (NI). Fix λ ∈ R+ ,
all k 0, σk = σ (·|λk , σk+1 ).
μ ∈ [0, 1), and for all k ∈ N0 define λk = λ · μk . The NI choice probabilities are σ0 , where for
Essentially, NI captures a continuum of subjective beliefs ranging from uniform randomization (μ = 0) to equilibrium
(μ ≈ 1). The unifying idea is that players believe their precision exceeds their opponents’ precision by factor μ−1 , who in
turn believe to be μ−1 as precise as their opponents (including me), and so on, consistently for an infinite number of steps.
In the analysis, I will assume a maximum of K = 100 induction steps and μ 0.95. In order to model choices based on a
larger number of induction steps or larger μ, the equilibrium concept QRE can be adopted virtually without loss.
Fig. 6 illustrates the differences between QRE and noisy introspection for various λ and μ ∈ {0.1, 0.3, 0.6, 0.9}. Basically,
QRE distributions have larger variance than NI distributions, and for m 7 and intermediate λ, they exhibit an increasingly
pronounced bimodal shape. Thus, some players may play the right tail, while other players play those playing the right
Weitere Experimente
Note: The predictions of the models with the “estimated numbers of components” (highest number of components that is not significantly improved upon
at α = 0.1) are plotted on top of the histograms of the respective data set, and the predictions are aggregated to match the bins of the histograms.
The broken line is the kernel estimate labeled “Kernel-0.5” in Fig. 1.
Fig. 7. Predictions of the Noisy Introspection models with the estimated numbers of components.
observations around 0.222 is not compatible with level-k if applied strictly (Fig. 2), that this mode or any higher-level
30
31
Weitere Experimente
Fazit der Ratespiele: Die meisten Teilnehmer haben eine hohe Denktiefe in
folgendem Sinne
Sie spielen eine passende Antwort auf einen Belief
Dieser Belief ist eine verschwommene Vorstellung der Aktionen der anderen;
Bspw. Wahrscheinlichkeitsverteilung, die nicht “einfach” ist (nicht Level-k)
Diese Verteilung lässt sich i.A. ganz gut als Logit-Ggw darstellen (Level ∞),
mit geringer bis mittlerer Präzision
Darauf antworten sie mit ähnlicher oder höherer Präzision
Die Ratespiele sind die bekanntesten Beispiele zur Analyse der Denktiefe
Ähnlich den Diktatorspielen zur Analyse sozialer Präferenzen
Matching-Penny Spiele
Aber nicht die einzigen Spiele. Hier kommen noch ein paar . . .
32
33
Matching-Penny Spiele
Angenommen, Spieler 2 wählt 50-50. Was würde Spieler 1 machen?
Zwei Spieler entscheiden gleichzeitig. Spieler 1 wählt O (oben) oder U
(unten), Spieler 2 wählt L (links) oder R (rechts).
Logit
σ1 (O) =
exp{λ·π1 (O)}
exp{λ·π1 (O)}+exp{λ·π1 (U)}
Spieler 1 wählt die Zeile, Spieler 2 wählt die Spalte. Daraus ergibt sich das
Auszahlungsprofil (π1 , π2 ), d.h. 1’ Auszahlung ist die erste Zahl.
L
R
O
(1, 0)
(0, 1)
U
(0, 1)
(1, 0)
L
R
O
(5, 0)
(0, 1)
U
(0, 1)
(1, 0)
Erwartete Auszahlung
π1 (O)
π1 (U)
Logit σ1 (O)
λ = 0.5
λ=1
λ=2
Angenommen, Sie sind Spieler 1. Was würden Sie wählen? Und nun?
L
R
L
R
O
(1, 0)
(0, 1)
O
(5, 0)
(0, 1)
U
(0, 1)
(1, 0)
U
(0, 1)
(1, 0)
.5 · 1 + .5 · 0 = 0.5
.5 · 0 + .5 · 1 = 0.5
.5 · 5 + .5 · 0 = 2.5
.5 · 0 + .5 · 1 = 0.5
exp{.5·0.5}
exp{.5·0.5}+exp{.5·0.5} = 0.5
exp{1·0.5}
exp{1·0.5}+exp{1·0.5} = 0.5
exp{2·0.5}
exp{2·0.5}+exp{2·0.5} = 0.5
exp{.5·2.5}
exp{.5·2.5}+exp{.5·0.5} = 0.73
exp{1·2.5}
exp{1·2.5}+exp{1·0.5} = 0.88
exp{2·2.5}
exp{2·2.5}+exp{2·0.5} = 0.98
Spieler 1 würde mit erhöhter W-keit O wählen (im rechten Spiel)
Matching-Penny Spiel Spieler sagen gleichzeitig “Kopf” oder “Zahl”;
Spieler 1 gewinnt, wenn beide das gleiche sagen; Spieler 2 gewinnt sonst
Daher sollte 2 R öfter als 50-50 spielen, woraufhin 1 seltener O spielt
Wo pendelt es sich im Gleichgewicht ein?
34
35
Nash-Gleichgewichte im Matching-Penny Spiel
L
R
O
(x, 0)
(0, 1)
U
(0, 1)
(1, 0)
Das gemischte Nash-Gleichgewicht
L
R
O
(x, 0)
(0, 1)
U
(0, 1)
(1, 0)
Notation:
σO Wahrscheinlichkeit, dass 1 Aktion O wählt; σU = 1 − σO
σL Wahrscheinlichkeit, dass 2 Aktion L wählt; σR = 1 − σL
Es gibt keine reinen Nash-Gleichgewichte, d.h. keine gegenseitig besten
Antworten in reinen Strategien.
Spieler 1 ist indifferent, wenn π1 (O) = π1 (U). Daraus ergibt sich für 2:
Beste Antwort auf O ist R, auf R ist U, auf U ist L, auf L ist O
σL · x + (1 − σL ) · 0 = σL · 0 + (1 − σL ) · 1
Es gibt also nur ein gemischtes Ggw, d.h. beide Spieler wählen zufällig.
⇔
σL =
1
1+x
Spieler 2 ist indifferent, wenn π2 (L) = π2 (R). Daraus ergibt sich für 1:
Man wählt aber nur zufällig, wenn man indifferent ist – der Gegner muss so
mischen, dass man selbst indifferent ist
Bzw. man selbst muss so mischen, dass Gegner indifferent: Damit macht
man es dem Gegner so schwer wie möglich, den “Penny” zu gewinnen
σO · 0 + (1 − σO ) · 1 = σO · 1 + (1 − σO ) · 0
⇔
σO =
1
2
Spieler 1’ Verhalten sollte unabhängig von x sein, das von 2 nicht
37
36
Ochs (1995)
R.D. McKelvey
et al. / J. of Economic
& Org. 42 (2000)
523–548
525
McKelvey,
Palfrey
undBehavior
Weber
(2000):
Passt
Logit?
Table 1
Payoff tables for Games A–D
Drei Spiele: x = 1, x = 9, x = 4
Game A
Ergebnisse
U
D
Bei x = 1 ist alles wie vorhergesagt (5050 Wahrscheinlichkeiten)
Game B
Game C
Game D
L
R
L
R
L
R
L
R
9,0
0,1
0,1
1,0
9,0
0,4
0,4
1,0
36,0
0,4
0,4
4,0
4,0
0,1
0,1
1,0
2. Payoff
magnitude
effects and quantal response equilibria
Die
Nash-Ggw
sind:
Bei x > 1 spielt 2 zwar seltener L (bzw.
A hier), aber noch zu oft
Games A, B, C : Oben (Up) mit σ1 = 1/2, Links mit σ2 = 1/10
The
Quantal
Response model
incorporates
best response eines
of players
a
(Sie
sind strategisch
äquivalent,
daerror
nur into
die the
Auszahlungen
oderinbeider
Spieler mit
game.
Thus,
the perfectly
rational model
of choice usually assumed to govern players’
einer
Konstante
multipliziert
werden)
actions is replaced by a probabilistic one where better responses are more likely to be
Game D: Oben (Up) mit σ1 = 1/2, Links mit σ2 = 1/5
played, but no action is played with certainty.
The logistic specification of the QRE, which we use here, measures error in terms of
a precision parameter,
which is inversely related to the variance of the error. 5 If the
Hypothese
Es ist λ,Logit-Ggw
expected utility to strategy j for agent i is denoted by uij , then the probability that i will use
Im Logit-Ggw: Spieler antizipieren Fehler gegenseitig
strategy j is given by the Logit formula
Spieler 1 antizipiert das, ist nicht indifferent und spielt öfter O (bzw. A hier)
als im Nash-Ggw
Oder anders herum?!
Spieler 1 reagiert auf den eigenen Payoff
(Own Payoff Effect), spielt zu oft O, und
2 antizipiert das, spielt daher öfter R als
im Ggw
zu oft “Up”,
Logit-Antwort (6= beste Antwort) ⇒ zu oft L ⇒ zu oft “Up”
eλuij
Test:
Wenn
Logit,
dann sollte die Payoff-Magnitude relevant sein
,
pij = P
λuik
ke
exp{λ·π
2 (L)}
where k runs
over theA
available
strategiesB
forbei
agentσ
i. If(L)
λ=0,=
then players are
acting entirely
Beispiel
Game
vs. Game
2
exp{λ·π2 (L)}+exp{λ·π2 (R)}
Können wir das mit dem Logit-Ggw
erklären?
38
randomly (i.e. completely unresponsive to payoffs), while for λ=∞, players’ actions are
In B towurde
2’s Auszahlungen
mit
4 multipliziert
equivalent
perfect expected
utility maximizing
behavior.
Table
presentsist
the games
studied in this
paper.
Game A is the same
a payoff matrix
Bei1 Logit
das identisch
zur
Multiplikation
deras Präzision
λ mit 4
studied recently by Ochs (1995). Games B and C are variations of Game A which only
Spieler
2
sollte
daher
dichter
am
Nash-Gleichgewicht
σ
(L)
2 A are= 1/10
involve payoff magnitude changes. In Game B, the column player’s payoffs of Game
multiplied by a factor of 4. In Game C, both the row and the column player’s payoffs of
sein
39
for each of the games. At this very high level of aggregation, the effects of varying payoff
2
B to be particularly 0.647
0.237
300
magnitude do not appear
strong, and therefore,
provide at most weak
A
0.623
0.243
300
support of the hypotheses. Increasing the column players’ payoffs from Game A to Game
R.D.on
McKelvey
et al. / J.of
of Economic
Behavior
& Org.
42 (2000)
525
3
0.607
0.363
300
B has little effect
theBbehavior
those players,
but
it appears
to523–548
make the row players
C
0.570
0.393
300
somewhat
less
likely
to
play
action
U.
The
latter
is
predicted
by
the
payoff
magnitude
Table 1
4
C
0.623
0.163
300
hypotheses.
Payoff tables forIncreasing
Games A–Dthe row players’ payoffs in Game C appears to have the effect of
0.180 L. The latter effect
300
decreasing
the frequencyB of theGame
action
U and0.693
decreasing
that of action
Game A
B
Game C
Game D
5
A
0.623one is not. The effects
0.187 of altering payoff
300
is consistent with the hypothesis,
but the former
L
R
L
R 0.590
L
R
L
R
C individual
magnitude vary within the
sessions.
Finally, notice that0.197
for none of the games300
is
U
0,1 C behavior
9,0 corresponds
0,4 0.593to that
36,0
4,0equilibrium.
0,1
it the case9,0
that the observed
predicted0,4
by the Nash
6
0.273
300
Ergebnisse
D
0,4
1,0 0.607
7
A
Table 3
D
Experimental
results by session
and game
2. Payoff magnitude
effects
and
8
D
Session
Game
A
0,1
1,0 A
0.640
0.457
0,4
0.230
0.313
300
300
0.643
U
0.683
0.343
L
0.243
300
n300
quantal response equilibria
4,0
0.223
0,1
Goeree, Holt und Palfrey (2003): Neue Analyse
Weder Nash- noch Logit-Gleichgewichte passen hier
Gegen Nash-Ggw spricht der “Own Payoff Effect”
Logit Ggw erklärt “Own Payoff Effect” ganz gut,
aber gegen Logit spricht der fehlende “Payoff Magnitude Effect”
1,0
300
These: Was noch fehlt, ist Risiko-Aversion
Abnutzender Grenznutzen des Geldes
The Quantal Response
model incorporates0.680
error into the best 0.317
response of players in
a
A
300
A
0.643
0.241
1800
game. Thus, the perfectly
rational model of0.573
choice usually assumed
to govern players’
B
0.197
300
B
0.630
0.244
1200
actions is replaced by aCprobabilistic one where
better responses
are more likely to1200
be
0.594
0.257
2
B
0.647
0.237
300
played, but no action is played
with certainty.0.550
D
0.328
600
A
0.623
0.243
300
The logistic specification of the QRE, which we use here, measures error in terms of
3
B
0.607
0.363
300
the
a precision parameter, λ,C which is inversely 0.570
related to the variance
of the error. 5 If 300
0.393
,
then
the
probability
that
i
will
use
expected
utility
to
strategy
j
for
agent
i
is
denoted
by
u
ij
Die
Nash-Ggw sind:
4
C
0.623
0.163
300
strategy j is given by the Logit formula
Ökonometrische Analyse bestätigt: So passt Logit sehr gut zu den Daten,
J.K. Goeree et al. / Games and Economic Behavior 45 (2003) 97–113
105
mit konstanten, plausiblen
Risiko-Aversions-Maßen in allen Fällen
1
Aggregate
5
0.180
Games A, B, C : BOben (Up) mit σ0.693
= 1/2, Links mit
σ = 1/10
λuij
e
A
0.623
0.187
Game
D: Oben
, (Up) mit σ = 1/2, Links mit σ = 1/5
pij = P
k
6
eλuik
Schwächung der Payoff-Magnitude
Table 3
Maximum likelihood estimates; asymptotic standard errors in parentheses
r
µ
pR (obs)
pR (pred)
pU (obs)
pU (pred)
Log L
(# observations)
Games 1–3
(Ochs, 1995)
0.42
(0.06)
0.010
(0.003)
0.44
(0.07)
0.42
(0.02)
0.150
(0.060)
0.039
(0.004)
0.50
0.66
0.74
0.35
0.50
0.54
0.60
0.47
0.50
0.56
0.59
0.47
−2071.9
(1560)
Game 4
(this paper)
Games A–D
(McKelvey et al., 2000)
0.50
0.66
0.74
0.35
0.77
0.76
0.75
0.68
0.74
0.76
0.77
0.65
0.64
0.63
0.59
0.55
0.65
0.57
0.58
0.59
Experiment
300
C
0.590
0.197
300
300
C
0.593
0.273
300
where k runs over the available
strategies for agent
A
0.607 i. If λ=0, then players
0.223 are acting entirely
300
Ergebnisse
randomly
(i.e. completely
unresponsive to payoffs),
while for λ=∞,
players’ actions 300
are
7
A
0.640
0.230
Fehlverhalten
wie
bei
Ochs:
zu
oft
“Up”,
zu
oft
“L”
equivalent to perfect expected
utility maximizing
D
0.457 behavior.
0.313
300
Table 1 presents the games studied in this paper. Game A is the same as a payoff matrix
8
D
0.643irrelevant
0.343
300
Payoff-Magnitude
ist praktisch
studied recently by OchsA (1995). Games B and
of Game A which only
0.683C are variations0.243
300
involve payoff magnitude changes. In Game B, the column player’s payoffs of Game A are
Aggregate
A
0.643
0.241
1800
multiplied by a factor ofB4. In Game C, both0.630
the row and the column
player’s
payoffs
of
0.244
1200
Game A are multiplied by
D was included primarily
of
C a factor of 4. Game0.594
0.257 as a replication
1200
Ochs (1995) study.
D
0.550
0.328
600
All four games have unique mixed strategy Nash equilibria. Since Nash equilibria are
insensitive to positive affine transformations in the payoffs, they are identical for Games
A, B, and C. Letting p denote the probability the row player chooses U and q denote the
probability the column player chooses L, these equilibrium probabilities are p∗ =0.5 and
q∗ =0.1. For Game D, the Nash equilibrium is at p∗ =0.5 and q∗ =0.2. Thus, the predictions
of Nash equilibrium are easily summarized: 6 (i) in all games, the row players’ choice
−455.8
(340)
−5898.8
(4800)
40
41
VOL
Game 4. Asymptotic standard errors are in parenthesis, and indicate that r is significantly
different from one (risk neutrality) and µ is significantly different from zero (no error).
CONCEPTS FOR EXPERIMENTAL2X2-GAMES 951
98NO 3 SELTENAND CHMURA STATIONARY
Thus both error and risk aversion are significant components for explaining deviations
7
from Constant
the minimax
strategies of his game.
Nonconstant sum games
sum games
Note that the risk aversion estimate for the Ochs (1995) data is virtually identical
10
10
to the other risk aversion estimates in the table.8 This suggests that the binary lottery
18
procedure failed to induce
risk neutrality. 12
While the 22risk aversion estimates are stable,
Game 7
Game 1
10
the error parameter
estimates are not, which we14conjecture to be caused by differences in
payoff scales, subject pools, and procedures. For example, some sessions were done by
hand and others were computerized. Furthermore, subjects in Ochs’ experiments played
the mixed extension of the game. Another relevant factor is the scale and normalization
of payoffs.
For instance,
estimated
Spieler
1 wählt
Zeile
(O
oder error
U) parameter 16would be 100 times as high when
13 the
Game 8
Game 2 payoffs are measured in pennies
instead of dollars.
11 We attempted to construct comparable
Spieler
2 wähltbut
Spalte
(L odernormalizations
R)
payoff measures,
the appropriate
become less obvious when payoffs
are in lottery tickets
(as in Ochs,
or when
only die
one out
decisionsunten
is selected
Auszahlung
von Spieler
1 1995)
ist links
oben,
vonof 2tenrechts
ex post to determine earnings, as in our lottery choice experiment discussed below.
We also estimate the quantal response model for the four matching pennies games in
17
Game
9
Frage
Sind O etund
L 14unterschiedlich
häufig
inandden
Spielen?
al. (2000);
see
Appendix
B for game
payoffs
aggregate
results. The third
Game 3 McKelvey
Selten und Chmura (2008)
5 For a formal and more detailed explanation of QRE, see McKelvey and Palfrey (1995, 1996, 1998). Those
papers also provide discussion about the conceptual interpretation of λ.
6 This actually glosses over a subtle issue of multiple equilibria that arises due to the experimental protocol.
Consider an experiment with 16 subjects (eight row and eight column), where subjects are randomly repaired with
a new opponent every time they replay the game. This creates many new equilibria. For example, having four of
the row players always play U and the other four row players always play D is not inconsistent with equilibrium,
since, from the column players’ point of view, this is indistinguishable from all eight of the players independently
randomizing 50/50 between U and D. There are a continuum of multiple equilibria of this sort. However, aggregate
choice frequencies are the same in all such equilibria.
10
13
Wenn Nash
oder Logit-Ggw, dann nicht
7 Observed autocorrelation in some people’s decisions might be due to heterogeneity in individual risk
attitudes.
One gilt
can accommodate
such heterogeneity
by specifying a(nur
randomDifferenzen
effects model, which
requires that
Bei
Logit
ja additive
Separierbarkeit
zählen)
there be a separate choice probability for each possible draw from the distribution of risk aversion parameters.
13
11
10
Gameequations
has to be solved to determine the likelihood function for each
Game 4 Therefore, a system of simultaneous
exp{λ
π1 (O)}
1
iteration over the parameter space,
which ·includes
an error parameter and the mean and variance of the distribution
σ1of(O)
= parameters. We estimated such a model for Game 4 and =
risk aversion
the estimated mean and variance of the
exp{λ
·
π
(O)}
+
exp{λ
·
π
(U)}
1
+
exp{λ
·
(π
1 and 0.40, respectively.
1
1 (U) − π1 (O))}
risk aversion distribution are 0.55
Gemischte Gleichgewichte im Allgemeinen
8 Pooling the data from all the experiments in Table 3 and imposing a common risk aversion parameter yields
estimated error parameters of µ = 0.010 (0.002) in Games 1–3, µ = 0.139 (0.047) in Game 4, µ = 0.039 (0.004)
in Games A–D and the estimated
risk 11
parameter is r = 0.42 (0.01).11The loglikelihood is −8426.6, which is
Game
Game 5
virtually identical to the sum of the three loglikelihoods 10
in Table 3: −8426.5. Hence, one cannot reject the
hypothesis that the
1 risk aversion1parameter is constant across the games in Table 3.
In Game 7 wurde zu 1’ Auszahlung von O und U (bei R) jeweils 4 addiert
Differenz π (U) − π (O) bleibt konstant, Logit-Ggw daher auch
42
43
Selten und Chmura (2008), vollständig
VOL 98NO 3
CONCEPTS FOR EXPERIMENTAL2X2-GAMES
SELTENAND CHMURA STATIONARY
10
Ergebnisse (nach Brunner, Camerer, Goeree, 2011)
VOL. 101 NO. 2
10
18
Game 1
Insgesamt 6 × 2 Spiele
951
1033
Brunner ET Al.: Stationary Concepts: Comment
Nonconstant sum games
Constant sum games
10
Game 7
Game 1
Game 2
Game 3
Game 4
Game 5
Game 6
1.0
12
0.9
22
0.8
14
0.7
0.6
p(left)
0.5
Links Sechs Konstant-Summen-Spiele
13
Game 2
(strategisch äquival. zu Nullsummenspielen)
Oben Darstellung der Vorhersagen
und der empirischen Ergebnisse
1.0
0.9
16
Game 8
0.8
11
0.7
0.6
0.5
0
Rechts Sechs Nicht-Konst-Sum-Spiele
14
Game 3
(Beste Antworten äquiv. zu Links, Addition
von Konstanten zu Auszahlungen: zu Spieler
1 wenn 2 R spielt, zu 2 wenn 1 O spielt)
10
11
Game 4
0.1
0.2
0.3
0.4
0.5
0
0.1
0.2
Game 9
13
0.4
0.5
0
0.1
0.2
0.3
0.4
0.5
Nash
QRE
Action-sampling
Payoff-sampling
Impulse balance
Observation
Figure 2. Visualization of the Theoretical Equilibria and the
Observed Average in the Constant Sum Games (cf. SC 2008, Figure 8)
13
Game 10
0.3
p(up)
17
Unten Darstellung der mittleren
Abweichungen der Konzepte
Unterschiede zwischen Konzepten
sind insignifikant und unerheblich
0.035
Dies sollte hat keinen Einfluss auf Vorhersagen von Nash und Logit haben
Sampling variance S
0.03
Game 5
10
0.02
Q
Es hat aber Einfluss auf Vorhersagen des
Konzeptes der Autoren (Impulse-BalanceGgw) – passt es besser?
11
Game 11
Theory specific component T
0.025
0.015
0.01
Game 12
Game 6
0.005
10
0
U up
L left
D down
R right
5 Experimentally
Investigated
games
in a pair
also
have
the
same
action-sampling
equilibrium.
Payoff−s.
Action−s.
Impulse−b.
44
45
Games
in a row does not change the quantal response equilibrium, even if this concept does not depend
only on thebest response structure.Therefore, quantal response equilibrium also yields the same
prediction for the two games in a pair.
The
QRE
Figure 3. Overall Mean Squared Distances of the Five Stationary Concepts
Compared to the Observed Average (cf. SC 2008, Figure 12)
Player 1 's payoff in the uppeMeft corner
Player 2's payoff in the lower-rightcorner
Figure
Nash
In anderen Spielen muss auch
Risiko-/Verlustaversion berücksichtigt werden, aber insgesamt
passt Logit-Ggw (QRE) gut
A
best
response
to a
sample of pure strategies of the other player in one of the two games is also a best response to
(correcting their Figure 12). It is notable that all models fit substantially better in
the last block than in the first block, as one would hope for reasonable concepts of
stationary behavior (which are not necessarily designed to explain early behavior).
It is also the case that impulse balance equilibrium is the best model in the first
block of 100 periods, the worst in the second block of 100 periods, and is best using
Weizsäcker (2003)
Hypothese Wahrheit liegt zwischen QRE und Level-1
QRE: Gegner sind genauso präzise wie ich;
Level-1: Gegner agieren rein zuällig
Asymmetric Logit Ggw (ALE): Gegner sind weniger präzise als ich, aber
nicht rein zufällig (sie haben Präzision λ̃ mit 0 < λ̃ < λ)
Jeder spielt ein subjektives Ggw, gegen Gegner mit geringer Präzision
This content downloaded from 141.20.105.233 on Tue, 11 Jun 2013 04:42:10 AM
All use subject to JSTOR Terms and Conditions
Daten Von insgesamt 22 Spielen (2 × 2, 2 × 3, 3 × 3) aus drei
vorhergehenden Experimenten
Stahl und Wilson (1994, 1995), Costa-Gomes, Crawford und Broseta (2001)
Hauptergebnisse
Hypothese bestätigt: Teilnehmer ignorieren Anreize der Gegner weitgehend,
sie betrachten nur die eigenen Anreize (Asymmetrie)
Strenge Gleichgewichts-Annahme passt hier nicht
Vergleich “Random-Utility” (Logit, bzw. ALE) mit “Noisy-Nash”
(Nash-Ggw plus Fehler) zeigt, dass Logit-Ansatz die Fehler gut erfasst
Asymmetrische Logit-Gleichgewichte
46
47
Die geschätzten Präzisionsparameter
Costa-Gomes and Weizsäcker (2008)
736
Durchschnittliche eigene Präzision: λ = 4.08
Durschnittliche angenommene Präzision für Gegner: λ̃ = 2.18
14 Spiele mit eindeutigen Nash-Ggws
3×3 Spiele für erhöhte Komplexität und Variation ( erlaubt präzisere Analyse)
Verteilung der Präzisionsparameter
158
REVIEW OF ECONOMIC STUDIES
G. Weizsäcker / Games and Economic Behavior 44 (2003) 145–171
Manche Spiele Dominanz-lösbar,
verschiedene Konzepte mit unterschiedlichen
Vorhersagen
734
REVIEW OF ECONOMIC STUDIES
TABLE 1
Games classified by strategic structure and models’ predicted actions
Game
COSTA-GOMES & WEIZSÄCKER
STATED BELIEFS AND PLAY
TABLE 3
#1
#2
#3
#4
#5
#6
#7
#8
#9
#10
#11
#12
#13
#14
741
(a)
(b)
Summary statistics of stated beliefs (data pooled across
treatments)
Fig. 3.
Estimated
densities
parameters
using pooled data. (a) Depicts the estimated density fγ (λi | ρ, K);
Game
Mean squared
deviation of ALE
Mean squared
error
from mean
from opponent’s choice
(b) the estimated
density
f (λ̃j | ρ̃, K).
Columns
Rows
Columns γ Rows
1
2
3
4
5
6
7
8
9
10
11
12
13
14
Average
0·44
0·32
0·28
0·20
0·20
0·22
0·26
0·30
0·32
0·46
0·28
0·32
0·20
0·41
0·30
0·47
0·34
0·26
0·29
0·27
0·16
0·22
0·36
0·28
0·52
0·33
0·33
0·29
0·47
0·33
0·22
0·18
0·22
0·16
0·20
0·22
0·24
0·19
0·21
0·11
0·19
0·27
0·16
0·21
0·20
0·26
0·29
0·31
0·25
0·36
0·13
0·17
0·29
0·19
0·16
0·26
0·31
0·25
0·25
0·25
48
Note: Feasible range is [0, 2].
(a)
Rounds of
dominance
Nash
Naïve
L1
L2
D1
Optimistic
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
N
N
N
N
2,3
3,2
2,3
3,2
2,3
3,2
2,3
3,2
3,4
4,3
–,–
–,–
–,–
–,–
T-L
M-L
B-R
M-M
T-M
B-M
M-R
B-R
T-R
B-L
M-M
B-L
T-R
T-L
M-L
M-M
T-M
T-L
B-L
M-R
B-R
B-L
T-L
T-L
B-M
M-R
T-M
B-M
T-M
T-L
B-M
T-M
T-L
M-M
M-R
B-R
M-R
B-M
M-R
M-M
B-R
M-M
T-L
M-L
B-M
T-M
T-L
M-M
M-R
B-R
T-M
M-L
B-M
M-R
T-M
B-M
B-M
T-R
M-M
T-R
M-L
M-L
T-M
T-M
M-L
T-M
T-L
T-L
M-L
T-R
Note:
The games are ordered as in Table 1, but with decisions ordered as they appeared to the
subjects; the equilibrium is identified by underlining its pay-offs.
F IGURE 1
of each of their decisions, enabling them to infer their opponents’ choices. This feature simplifies
our data analysis because subjects could not condition their decisions in the course of a session
on the outcomes of previous decisions.
The subjects were paid according to their action choice in one randomly chosen game, at a
rate of $0·15 per point, and according to the accuracy of their belief statement in one randomly
chosen game, using a proper scoring rule (described below), with the range of monetary earnings
c 2008 The Review of Economic Studies Limited
for belief statements between $0 and $10.11
Games
49
2.2. The games
Überblick über Aktionen und Beliefs
744
Dominance
solvable
Analyse der Aktionen
Table 1 summarizes the strategic structures of the 14 games and presents the action predictions
of five models of game play that we used to design our games: Nash, Naïve-L1, L2, D1, and
Optimistic. These models, along with three additional models, which make different predictions
depending on the underlying parameter values (see Section 5), have played a role in the literature on one shot normal-form game experiments (Stahl and Wilson, 1994, 1995; McKelvey
and Palfrey, 1995; Costa-Gomes, Crawford and Broseta, 2001; Weizsäcker, 2003; Goeree and
Holt, 2004). We used the model predictions as criteria to select the 14 games, as we attempted
to separate their predictions of play as much as possible (together with restrictions of dominance
solvability and equivalence between pairs of games, see below).12 The Naïve-L1 model chooses
REVIEW OF ECONOMIC STUDIES
NE Nash-Ggw; L1 Level 1; D1 Level 1 nach Elim. Domin. Strats; L2 Level 2;
Opt. Optimistic (Gegner spielt die Strategie, die mir am besten passen würde);
LE Logit-Ggw; ALE Asymmetric Logit-Ggw; NI Noisy Introspection
(b)
Fig. 4. Estimated densities of ANNE parameters using pooled data. (a) Depicts the estimated density fβ ( i | a, b);
(b) the estimated density fβ (˜ j | ã, b̃).
IGURE
−672·97
7·85
−556·83
3·48 −633·05
3·63 −3105·03
1·34 −652·37
1·57 −3177·03
0·59 −669·99
0·71 −3288·29
NI
ALE
λa
ln L
−565·87
−581·18
−637·33
−585·98
3·34 −625·96
3·88 −3005·67
λ̃a
λa
ln L
0·00 −541·90
0·00 −540·83
0·00 −602·35
0·70 −555·18
0·00 −603·99
0·00 −2853·47
6·13
7·65
7·10
8·41
5·94
7·01
λ̃a
6·48
7·65
7·23
8·93
6·10
7·19
ln L
1·17 −539·11
0·69 −539·75
1·01 −599·56
2·21 −542·35
1·27 −600·33
1·25 −2832·80
ALE, Asymmetric Logit Equilibrium; L1, Level-1; L2 Level-2; LE, Logit Equilibrium; NE, Nash equilibrium, NI, Noisy Introspection; Opt., Optimistic.
Ergebnis NI passt leicht besser als ALE und L1, Rest passt nicht
TABLE 10
Estimates of low-parameter models using belief statement data
L1
D1
ALE
NI
Verbal NETeilnehmer
spielen
rechtL2 präziseOpt.Antwort LEauf recht “verwaschene”
Beliefs
λ
λ̃
λ̃
ln L
λ
ln L
λ
ln L
λ
ln L
λ
ln L
λ
λ
ln L
λ
λ
ln L
λ
λ
ln L
(d.h.
Beliefs nahe Gleichverteilung), Bestätigung von Weizsäcker (2003)
A1
0·00 −4769·63 0·00 −4769·63 0·00 −4769·63 0·18 −4717·64 0·00 −4769·63 7·59 0·00 −4769·63 0·00 28·20 0·20 −4716·89 87·19 20·06 0·20 −4748·54
bs
der Spielen Beste Antworten auf die eigenen Beliefs
best responses to their own stated beliefs would actually have increased their earnings, given the
(ex ante unknown) observed behaviour of their opponents.
First consider the subjectively expected losses, which each subject could calculate by asking
the question “By how much is my action in a given game a suboptimal response to my stated belief in the same game?” Notice that for each subject and in each game, these losses have an upper
bound that is a function of the belief that the subject states and of the set of possible pay-offs
c 2008 The Review of Economic Studies Limited
1A1AC 0·57
c 2008 The
Review0·69
of Economic
Studies 6·99
Limited
Pooled
−3310·02
−2855·22
IGURE
LE
50
1A
1A1A
1AQ
1A1AC
Pooled
0·00
0·00
0·00
0·00
0·00
bs
−5008·11
−5485·07
−5365·83
−5246·59
−25875·2
0·00
0·00
0·00
0·00
0·00
bs
−5008·11
−5485·07
−5365·83
−5246·59
−25875·2
0·04
0·00
0·00
0·10
0·00
bs
−5007·74
−5485·07
−5365·83
−5243·82
−25875·2
0·23
0·22
0·29
0·20
0·22
bs
−4924·41
−5402·75
−5233·33
−5177·45
−25464·6
0·00
0·00
0·00
0·00
0·00
a
−5008·11
−5485·07
−5365·83
−5246·59
−25875·2
8·08
9·02
8·09
8·29
8·09
bs
0·11
0·00
0·18
0·06
0·07
−5000·79
−5483·38
−5348·37
−5244·40
−25860·9
a
a
0·00
0·03
0·07
0·00
0·00
21·70
40·10
27·22
28·76
28·76
bs
0·28
0·22
0·32
0.22
0·24
−4921·45
−5402·56
−5230·81
−5176·13
−25458·6
a
a
76·76
96·65
75·33
62·49
79·79
18·42
24·17
18·65
15·47
19·64
REVIEW OF ECONOMIC STUDIES
In particular, it appears that subjects have a systematically distorted perception of their
opponents: Both distributions of the actual response parameters λj and j lie in the more
“rational” area of the parameter range, as compared to the distributions of the perceived
response parameters λ̃j and ˜ j . The estimated means are E[λi ] = 7.20 as compared to
E[λ̃j ] = 3.92, and E[ i ] = 0.30 as compared to E[˜ j ] = 0.58 (with estimated variances
of var(λi ) = 20.83, var(λ̃j ) = 26.62, var( i ) = 0.02, and var(˜ j ) = 0.10).
F
3 between the means of the subjects’ actual and perceived response
This discrepancy
Action frequencies and average belief statements (pooled across treatments and isomorphic player roles, numbering
F
4
according
perspective)
parameters
canto Row
beplayer’s
tested
statistically by reestimating
the models under
the
restriction
(a) Empirical p.d.f. and (b) empirical c.d.f. of number of subjects with x best-responses to stated first-order beliefs
c 2008 The Review of Economic Studies Limited
that the expected values of the respective pairs of parameters are equal, i.e., under the
null hypotheses that E[λi ] = E[λ̃j ] and E[ i ] decision-making
= E[˜ j ]processes,
hold,eitherrespectively.
when they choose their Denoting
actions or when they state their beThe observed inconsistencies may or may not be statistically
significant,
noise is
r , liefs.
∗ −
the
likelihood-ratio
statistic
l r )showoncethatthewhen
the
log-likelihood
of
the
restricted
model
by
l
appropriately
taken into account. The structural
approach2(l
in Section
4 will
this
Links Allgemeine Verteilung von Aktionen und
Beliefs.
is done most deviations are indeed significant.
ofmuchfreedom.
The
resulting
critical
is (asymptotically) χ 2 -distributed with one degree
How
does it cost subjects
that their
actions and stated
beliefs are not consistent with
Rechts Häufigkeit von Aktionen, die Beste Antworten
auf die eigenen Beliefs sind.
each other? We address this issue by two sets of calculations. First, we simulate the subjectively
significance levels of rejecting the null hypotheses
arelosses,
p by=taking
0.021
forstated
thebeliefs
ALE
expected
the subjects’
as theirstrategy
“true” underlying beliefs. Under
this simplifying assumption (which we avoid elsewhere in the paper, but which is convenient
model
(two-tailed).
thehave to expect from
model and p = 2.749 × 10−9 for the ANNE strategy
for our purposes
here), we can
measure the losses that Hence,
the subjects would
their
action
choices,
relative
to
the
actions
that
are
the
best
responses
to in
their stated
beliefs.
Ergebnis
Weit verteilte
Aktionen
und
Beliefs,
50%
der Teilnehmer
spielen
50%
observation
that subjects
on average
behave
as if Second,
underestimating
response
precision
we determine the ex postthe
realized
losses, by asking
whether changing their actions to
756
c 2008 The Review of Economic Studies Limited
11. For treatments 1AQ and 1A1AC, which were conducted more than four years after the other treatments, we
adjusted the payments for inflation by paying $0·18 per point in the games and up to $12 in the belief statement task. In the
rest of the paper, we use real payments (in 2000 terms) whenever we calculate $ earnings. Subjects’ average earnings for
playing the games were $8·42, $9·07, $9·51, $9·76, and $9·71 for A1, 1A, 1A1A, 1AQ, and 1A1AC subjects, respectively;
their average earnings for their belief statements were $6·32, $6·95, $6·30, $6·19, and $6·27 for A1, 1A,
1A1A,91AQ,
TABLE
and 1A1AC subjects, respectively. Their total average earnings including show-up fees and earnings from Part III in A1
Estimates
of low-parameter
models using action data
and 1A were $30·25, $31·52, $29·13, $28·28, and $28·33 for A1, 1A, 1A1A, 1AQ,
and 1A1AC
subjects, respectively.
12. Apart from separating the predictions of the models that make a pure-strategy prediction in our games (Nash,
NEalso attempted to select
L1 the games in orderD1to achieve high discriminatory
L2
Opt.
L1, L2, D1, Optimistic), we
power among
the additional models,aLE, ALE, and NI, which
predict different behaviour
only for intermediate
parameter values
(see
ln L
λa
ln L
λa
ln L
λa
ln L
λa
ln L
λa
λ
Section 5). This was done by considering several sets of parameter values for these models, and selecting the games such
that for intermediate ranges of the parameter values (i) each of these models predicts that in some games the probability
6·13 −541·90
3·73 −571·94
1·31 −593·08
0·65 −607·91
3·34
A1
0·60 −611·66
mass is concentrated on one action, and in other games it is distributed roughly equally (so the intermediate models can be
1A and0·53
−643·01
7·60
−540·90
−602·03
1·46 predictions
−618·89for comparable
0·90 −628·22
3·73
better identified
separated
from the pure
models),
and (ii) the 3·53
three models
make different
1A1A values,
0·75 at least
−699·82
7·09
−602·36
3·84 −652·99
−676·66
−694·96
3·87
sets of parameter
in one of the
predicted
choice probabilities.
Both criteria1·49
could be
satisfied only0·84
partially,
−680·15
6·27 −609·69
3·60 −644·64
2·26 −629·39
0·59 −685·05
4·81
however, 1AQ
as the three1·00
models
are highly correlated.
bs
0·35
0·26
0·41
0·26
0·29
−4943·00
−5443·67
−5273·67
−5205·22
−25630·0
51
W OF ECONOMIC STUDIES
ted
ALE, Asymmetric Logit Equilibrium; L1, Level-1; L2 Level-2; LE, Logit Equilibrium; NE, Nash equilibrium, NI, Noisy Introspection; Opt., Optimistic.
Analyse der Beliefs
TABLE 10
Estimates of low-parameter models using belief statement data
NE
A1
1A
1A1A
1AQ
1A1AC
Pooled
L1
D1
L2
Opt.
LE
ALE
NI
λbs
ln L
λbs
ln L
λbs
ln L
λbs
ln L
λbs
ln L
λa
λbs
ln L
λa
λ̃a
λbs
ln L
λa
λ̃a
λbs
ln L
0·00
0·00
0·00
0·00
0·00
0·00
−4769·63
−5008·11
−5485·07
−5365·83
−5246·59
−25875·2
0·00
0·00
0·00
0·00
0·00
0·00
−4769·63
−5008·11
−5485·07
−5365·83
−5246·59
−25875·2
0·00
0·04
0·00
0·00
0·10
0·00
−4769·63
−5007·74
−5485·07
−5365·83
−5243·82
−25875·2
0·18
0·23
0·22
0·29
0·20
0·22
−4717·64
−4924·41
−5402·75
−5233·33
−5177·45
−25464·6
0·00
0·00
0·00
0·00
0·00
0·00
−4769·63
−5008·11
−5485·07
−5365·83
−5246·59
−25875·2
7·59
8·08
9·02
8·09
8·29
8·09
0·00
0·11
0·00
0·18
0·06
0·07
−4769·63
−5000·79
−5483·38
−5348·37
−5244·40
−25860·9
0·00
0·00
0·03
0·07
0·00
0·00
28·20
21·70
40·10
27·22
28·76
28·76
0·20
0·28
0·22
0·32
0.22
0·24
−4716·89
−4921·45
−5402·56
−5230·81
−5176·13
−25458·6
87·19
76·76
96·65
75·33
62·49
79·79
20·06
18·42
24·17
18·65
15·47
19·64
0·20
0·35
0·26
0·41
0·26
0·29
−4748·54
−4943·00
−5443·67
−5273·67
−5205·22
−25630·0
ALE, Asymmetric Logit Equilibrium; L1, Level-1; L2, Level-2; LE, Logit Equilibrium; NE, Nash equilibrium, NI, Noisy Introspection; Opt., Optimistic.
Ergebnis ALE und L2 passen am besten, NI geht noch, Rest passt nicht
Fazit: Aktionen sind L1, Beliefs sind L2; ALE passt insgesamt
Wahl einer Aktion: Wenig Hineinversetzen in Gegner, Ignorieren seiner
Anreize, Annahme Gegner randomisiert fast gleichförmig
Wahl eines Beliefs: ≈ Wahl einer Aktion aus seinen Augen (wenig
Hineinversetzen in mich, ignorieren meiner Anreize)
Insgesamt konsistent, aber nicht rational: Die abgefragten Beliefs passen
nicht zu den Beliefs, die implizit meine Aktionen rechtfertigen
Zusammenfassung
53
52
Zusammenfassung
Menschen spielen keine Nash-Gleichgewichte
Zufällige Abweichungen (logistische Fehler, zufälliger Nutzen)
Systematische Abweichungen
Wesentliche systematische Abweichung: Menschen
unterschätzen/ignorieren die Anreize Anderer
Sie haben ein vereinfachtes Modell der Entscheidungen anderer im Kopf,
insgesamt stark verrauschte Beliefs, teils nahe Gleichverteilung
Menschen reagieren jedoch auf Änderung eigener Anreize
Passend sind bspw. Asymmetric Logit Equilibrium und Noisy Introspection
Präzision und Asymmetrie schwanken recht stark zwischen Spielen und
zwischen Menschen
Vorhersagen und robuste Anwendung schwierig
Themen
Noch lange kein Konsens in der Literatur
54
55
Mögliche Themen für die Hausarbeit
Die angegebenen Quellen unten sind nicht erschöpfend oder notwendig, sondern
gedacht als Ausgangspunkte für die Suche
Vergleich von Ratespielen mit unterschiedlichen p-Faktoren (Bosch-Domenech
et al., 2002; Ho et al., 1998)
Ratespiele mit zwei Spielern (Costa-Gomes and Crawford, 2006; Grosskopf and
Nagel, 2008)
Alternative Varianten des Ratespiels (Duffy and Nagel, 1997; Shapiro et al., 2014)
Das Cognitive Hierarchy Modell (Camerer et al., 2004; Crawford et al., 2013)
Literatur
Endogene Anzahl an Denkschritten (Agranov et al., 2012; Alaoui and Penta,
2015)
56
Literatur I
57
Literatur II
Costa-Gomes, M. and Weizsäcker, G. (2008). Stated beliefs and play in normal-form
games. Review of Economic Studies, 75(3):729–762.
Agranov, M., Potamites, E., Schotter, A., and Tergiman, C. (2012). Beliefs and
endogenous cognitive levels: An experimental study. Games and Economic Behavior,
75(2):449–463.
Crawford, V. P., Costa-Gomes, M. A., and Iriberri, N. (2013). Structural models of
nonequilibrium strategic thinking: Theory, evidence, and applications. Journal of
Economic Literature, 51(1):5–62.
Alaoui, L. and Penta, A. (2015). Depth of reasoning and incentives. Review of
Economic Studies (accepted).
Duffy, J. and Nagel, R. (1997). On the robustness of behaviour in experimental’beauty
contest’games. The Economic Journal, 107(445):1684–1700.
Bernheim, B. (1984). Rationalizable strategic behavior. Econometrica, 52(4):1007–1028.
Bosch-Domenech, A., Montalvo, J., Nagel, R., and Satorra, A. (2002). One,
two,(three), infinity,. . . : Newspaper and lab beauty-contest experiments. American
Economic Review, 92(5):1687–1701.
Goeree, J. and Holt, C. (2004). A model of noisy introspection. Games and Economic
Behavior, 46(2):365–382.
Goeree, J. K., Holt, C. A., and Palfrey, T. R. (2003). Risk averse behavior in generalized
matching pennies games. Games and Economic Behavior, 45(1):97–113.
Breitmoser, Y. (2012). Strategic reasoning in p-beauty contests. Games and Economic
Behavior, 75(2):555–569.
Grosskopf, B. and Nagel, R. (2008). The two-person beauty contest. Games and
Economic Behavior, 62(1):93–99.
Brunner, C., Camerer, C., and Goeree, J. K. (2011). Stationary concepts for
experimental 2 2 games: Comment. American Economic Review, 101(2):1029–1040.
Ho, T., Camerer, C., and Weigelt, K. (1998). Iterated dominance and iterated best
response in experimental ”p-beauty contests”. American Economic Review,
88(4):947–969.
Camerer, C., Ho, T., and Chong, J. (2004). A cognitive hierarchy model of games.
Quarterly Journal of Economics, 119(3):861–898.
Costa-Gomes, M. and Crawford, V. (2006). Cognition and behavior in two-person
guessing games: An experimental study. American Economic Review,
96(5):1737–1768.
McKelvey, R. D. and Palfrey, T. R. (1995). Quantal response equilibria for normal form
games. Games and Economic Behavior, 10(1):6–38.
58
59
Literatur III
Literatur IV
McKelvey, R. D., Palfrey, T. R., and Weber, R. (2000). The effects of payoff magnitude
and heterogeneity on behavior in 2 × 2 games with unique mixed strategy equilibria.
Journal of Economic Behavior and Organization, 42(4):523–548.
Nagel, R. (1995). Unraveling in guessing games: An experimental study. American
Economic Review, 85(5):1313–1326.
Nash, J. (1951). Non-cooperative games. Ann. Math., 2(54):286–295.
Stahl, D. O. and Wilson, P. W. (1995). On players’ models of other players: Theory and
experimental evidence. Games and Economic Behavior, 10(1):218–254.
Ochs, J. (1995). Games with unique, mixed strategy equilibria: An experimental study.
Games and Economic Behavior, 10(1):202–217.
Weizsäcker, G. (2003). Ignoring the rationality of others: evidence from experimental
normal-form games. Games and Economic Behavior, 44(1):145–171.
Pearce, D. (1984). Rationalizable strategic behavior and the problem of perfection.
Econometrica, 52(4):1029–1050.
Ross, L., Greene, D., and House, P. (1977). The “false consensus effect”: An egocentric
bias in social perception and attribution processes. Journal of Experimental Social
Psychology, 13(3):279–301.
Selten, R. and Chmura, T. (2008). Stationary concepts for experimental 2x2-games.
American Economic Review, 98(3):938–966.
Shapiro, D., Shi, X., and Zillante, A. (2014). Level-k reasoning in a generalized beauty
contest. Games and Economic Behavior.
60
61
Herunterladen