Rational Choice Theory Rational Choice and Rationale

Werbung
Rational Choice Theory
Rational Choice and Rationale Entscheidung ist eine Sammelbezeichnung f ür verschiedene
Ansätze in den Wirtschafts- und Sozialwissenschaften. Generell schreiben diese Ans ätze handelnden
Subjekten rationales Verhalten zu, wobei diese Subjekte aufgrund gewisser Pr äferenzen ein
nutzenmaximierendes (oder kostenminimierendes) Verhalten zeigen.
Ziel und Methode
Historisch orientieren sich die Theorien der Rationalen Entscheidung an der klassischen Ökonomie Adam Smiths und der erklärenden Soziologie Max Webers. Sie versuchen, komplexe soziale
Handlungen mit Hilfe möglichst einfacher Modellannahmen zu fassen. Das angestrebte Ziel der
Theoretiker liegt darin, soziale Gesetze zu finden, die einfach und klar wie die der Newtonschen
Physik sind. Darüber, wie dieses Ziel zu erreichen ist, herrscht Uneinigkeit.
Menschenbilder der Rationalen Entscheidung reichen vom klassischen Homo oeconomicus bis zum
PREEM (Restricted Rational Expecting Evaluating Maximising Man) der modernen Soziologie.
Über den Rationalitätsbegriff des rationalen Entscheiders gibt es ebenso wie über die Gewichtung
und Entstehung der Präferenzen keine Einigkeit.
Monien/Bleischwitz
Universität Paderborn
Algorithmische Spieltheorie
1.23
Umstrittene Punkte
Während Rationale Entscheidung in den Wirtschaftswissenschaften das dominante Paradigma ist,
ist sie in Soziologie und Politikwissenschaft stärker umstritten. Einer der Hauptstreitpunkte ist
der verwendete methodologische Individualisimus; es ist in der Debatte, ob sich soziales Verhalten
und soziale Gesetze wirklich durch das Verhalten vieler einzelner Individuen bestimmen l ässt, oder
ob das soziale eigene Gesetzmäßigkeiten vorweist. Eine schwächere Version dieser Kritik wirft
dem Ansatz der Rationalen Entscheidung vor, soziale Probleme strukturell bedingt unterkomplex
zu fassen. Zum anderen steht die starke Modellhaftigkeit des Ansatzes in der Kritik: es l ässt
sich empirisch einfach beweisen, dass Menschen nur begrenzt rational handeln. Die meisten
Theoretiker der Rationalen Entscheidung räumen das ein, machen aber geltend, dass rationale
Nutzenmaximierung eine plausible Grundannahme darstellt, von der aus die Modelle bestimmten
Situationen angepasst werden können.
Trotz den teilweise sehr heftigen Diskussionen ist aber unübersehbar, dass Ansätze, die auf
Rationaler Entscheidung basieren, einen immer stärkeren Einfluss sowohl auf die globalen als auch
auf die deutschen Sozialwissenschaften haben.
Monien/Bleischwitz
Universität Paderborn
Algorithmische Spieltheorie
1.24
Darstellung eines Spiels in Normalform
G
n
si
s
s−i
Si
S
S−i
ui
U
∆(Si)
= (n, S, U )
Anzahl der Spieler
Strategie von Spieler i, i ∈ {1, . . . , n}
Strategietupel: s = (s1, . . . , sn)
Strategientupel der Gegenspieler von i,
s−i = (s1, . . . , si−1 , si+1, . . . , sn)
Wir schreiben: s = (si, s−i )
Strategieraum (Menge der möglichen Strategien)
für Spieler i
= S1 × . . . × S n , s ∈ S
= S1 × . . . × Si−1 × Si+1 × Sn, s−i ∈ S−i
Nutzenfunktion von Spieler i ui : S → IR
= (u1, . . . , un)
= Menge der gemischten Strategien des Spielers i
Monien/Bleischwitz
Universität Paderborn
Algorithmische Spieltheorie
1.18
2. Nash Equilibria
Situation: n Spieler 1, . . . , n spielen ein (einzügiges) Spiel. Si 1 ≤ i ≤ n ist die Menge der
Strategien (= Aktionen) von Spieler i. ui : S1 × . . . × Sn → IR ist die Nutzenfunktion für
Spieler i.
Das Spiel kann dann beschrieben werden durch
G = (n, S1, . . . Sn, u1, . . . , un).
Definition 2.1: Es sei G = (n, S1, . . . , Sn, u1, . . . , un) ein Spiel. Ein n-Tupel (s1, . . . , sn) ∈
S1 × . . . × Sn ist im Nash Equilibrium, falls für alle i ∈ {1, . . . , n} gilt:
0
0
∀si ∈ Si : ui(s1, . . . , si−1 , si, si+1, . . . , sn) ≥ ui(s1, . . . , si−1 , si, si+1 , . . . , sn)
Im Nash Equilibrium will kein Spieler seine Strategie ändern, solange die anderen Spieler
bei ihrer gewählten Strategie bleiben ⇒ stabiler Zustand
Monien/Bleischwitz
Universität Paderborn
Algorithmische Spieltheorie
2.1
Beispiele: (Bi-)Matrixspiele
Bach-Stravinsky
Mozart-Mahler
s21
2,1
0,0
s21
2,2
0,0
s11
s12
s21
0,0
1,2
s11
s12
2
Nash-Equilibria
Gefangenendilemma
s21
0,0
1,1
Minderwertiges
Nash-Equilibrium
L
G
L
1,1
0,5
G
5,0
4,4
eindeutiges
Nash-Equilibrium
Münzseiten
K
Z
K
1,-1
-1,1
Z
-1,1
1,-1
kein
Nash-Equilibrium
Stein-Schere-Papier
St
Sch
P
Monien/Bleischwitz
Universität Paderborn
St
0,0
-1,1
1,-1
Sch
1,-1
0,0
-1,1
P
-1,1
1,-1
0,0
Algorithmische Spieltheorie
kein Nash-Equilibrium
2.2
Gemischte Strategien
Die Menge der gemischten Strategien für
einen Spieler mit zwei reinen Strategien ist
2
2
S := {π ∈ IR | π1 + π2 = 1, πi ≥ 0}
Die Menge der gemischten Strategien für
einen Spieler mit drei reinen Strategien ist
3
3
S := {π ∈ IR | π1 + π2 + π3 = 1, πi ≥ 0}
x3
y2
X
Y
x1
y1
x2
2
S ist Strecke von (1, 0) nach (0, 1).
S 3 ist Fläche zwischen
(0, 0, 1), (0, 1, 0), (1, 0, 0)
Der (n − 1)-dimensionale (Standard-) Simplex S n ist definiert als
n
n
T
S n := {x ∈ IRn |
x
=
1,
x
≥
0}
=
{x
∈
I
R
|
1
1
x = 1, xi ≥ 0}.
i
i
i=1
Monien/Bleischwitz
Universität Paderborn
Algorithmische Spieltheorie
2.3
Gemischte Nash Equilibria
• Für einen Spieler i sei Si := {si1 , . . . , sik }
• Dann definiert πi = (πi1 , . . . , πik ) ∈ S k eine gemischte Strategie für Spieler i, in der er die
Strategie sij mit Wahrscheinlichkeit πij wählt.
• Der erwartete Nutzen von Spieler i, wenn die gemischten Strategien aller Spieler durch
(π1, . . . , πn) definiert sind, ist dann:
n
ui (Π1, . . . , Πn) =
Πk (sk )
(s1 ,...,sn )∈S1 ×...×Sn
ui(s1, . . . , sn)
k=1
Definition 2.2: Es sei G = (n, S1, . . . , Sn, u1, . . . , un) ein Spiel. Ein n-Tupel (Π1, . . . , Πn)
ist im gemischten Nash-Equilibrium, falls für alle i ∈ {1, . . . , n} gilt:
0
0
∀Πi ∈ ∆(Si) : ui(Π1, . . . , Πi−1 , Πi, Πi+1 , . . . , Πn) ≥ ui(Π1, . . . , Πi−1 , Πi , Πi+1, . . . , Πn)
Monien/Bleischwitz
Universität Paderborn
Algorithmische Spieltheorie
2.4
Beispiel Gemischtes Nash Equilibrium
A=
2
3
1
0
,
B=
S2 = {s21, s22}
S1 = {s11, s12},
4
1
0
4
(π1, π2) mit
• π1 = (3/7, 4/7) und
• π2 = (1/2, 1/2)
ist ein gemischtes Nash Equilibrium.
Monien/Bleischwitz
Universität Paderborn
Algorithmische Spieltheorie
2.5
2.1 Existenz von Nash Equilibria
Satz 2.1: (J. Nash, 1951) Es existiert immer ein gemischtes Nash-Equilibrium.
Sperner’s Lemma
Brouwer’s Fixpunksatz
Kakutani’s Fixpunktsatz
Nash’s Theorem
Brouwer’s Fixpunktsatz: Es sei f : S n → S n eine stetige Funktion. Dann existiert ein Punkt
x∗ ∈ S n mit f (x∗) = x∗, ein sogenannter Fixpunkt.
Monien/Bleischwitz
Universität Paderborn
Algorithmische Spieltheorie
2.6
2.2 Aufwand zur Bestimmung von Nash-Equilibrien
Der Satz von Nash garantiert die Existenz eines gemischten Nash-Equilibriums.
Aber: Betrachte das folgende Problem:
MIXED-2-NE:
geg.: Ein Spiel G = (2, S1, S2, u1, u2), S1, S2 endlich.
ges.: Ein gemischtes Nash-Equilibrium (Π1(S1), Π2(S2)) für G .
Es ist bis heute offen, ob MIXED-2-NE in P ist.
MIXED-2-NE is PPAD-vollständig (Chen, Deng: Settling the Complexity of 2-Player NashEquilibrium. Electronic Colloquium on Computational Complexity, 2005).
Monien/Bleischwitz
Universität Paderborn
Algorithmische Spieltheorie
2.7
2.3 2-Personen Matrix Spiele
2-Personen Matrix Spiele sind Spiele der Form G = (2, (S1, S2), (u1, u2)) mit
• S1 = {s11, . . . , s1m }, S2 = {s21, . . . , s2n}.
• u1, u2 sind gegeben als Matrizen A ∈ ZZ m×n und B ∈ ZZ m×n , mit
u1(s1i , s2j ) = Ai,j und u2(s2i , s2j ) = Bi,j , für 1 ≤ i ≤ m, 1 ≤ j ≤ n.
• Jeder Spieler maximiert seinen Nutzen.
Monien/Bleischwitz
Universität Paderborn
Algorithmische Spieltheorie
2.8
Bemerkung 2.1: Es sei x ∈ X = ∆(S1) eine gemischte Strategie für Spieler 1, y ∈ Y =
∆(S2) eine gemischte Strategie für Spieler 2. Dann ist der erwartete Nutzen u1(x, y) = xT Ay
und u2(x, y) = xT By.
Definition 2.3:
a) Es sei y ∈ Y fest. x ∈ X heißt beste Antwort auf y ⇔ xT (Ay) ist maximal über X .
b) Es sei x ∈ X fest. y ∈ Y heißt beste Antwort auf x ⇔ (xT B)y ist maximal über Y .
Bemerkung 2.2:
a) Eine beste Antwort x (y ) ist eine gemischte Strategie mit dem größten erwarteten Nutzen für
Spieler 1 (2), wenn Spieler 2 (1) die gemischte Strategie y (x) spielt.
b) Ein Nash Equilibrium (x, y) ist dann ein Paar von wechselseitig besten Antworten x und y .
Satz 2.2: Es sei y eine gemischte Strategie von Spieler 2. Eine gemischte Strategie x ist beste
Antwort auf y genau dann, wenn Spieler 1 nur reine Strategien si mit positiver Wahrscheinlichkeit
spielt, die beste Antworten sind.
Monien/Bleischwitz
Universität Paderborn
Algorithmische Spieltheorie
2.9
Beispiele: (Bi-)Matrixspiele
B=
1
0
4
0
2
3
,
6
5
3
S2 = {4, 5}
0
2
3
A=
S1 = {1, 2, 3},
1
2
3
4
0,1
2,0
3,4
5
6,0
5,2
3,3
G hat reines Nash-Equilibrium (3, 4) (Spaltenmaximum in A und Zeilenmaximum in B )
s1
1
1
2
2
3
s2
4
5
4
5
4
3
5
Bemerkung
Spieler 1 → 3
Spieler 2 → 4
Spieler 1 → 3
Spieler 1 → 1
Nash Equilibrium mit Nutzen
u1 (3, 4) = A3,1 = 3, u2 (3, 4) = B3,1 = 4
Spieler 1 → 1
Monien/Bleischwitz
Universität Paderborn
Algorithmische Spieltheorie
2.10
Nash Equilibria
i=1
xi = 1 ,
Monien/Bleischwitz
Universität Paderborn
1
2
2
=
{s1 , . . . , sm } , S2 = {s1 , . . . , sn }
x
=
(x1 , . . . , xm ) , xi ∈ [0, 1]
y
=
(y1 , . . . , yn ) , yi ∈ [0, 1]
m
1
S1
n
i=1
yi = 1
T1
=
{i ∈ {1, . . . , m} ; xi > 0}
T2
=
{j ∈ {1, . . . , n} ; yj > 0}
Algorithmische Spieltheorie
2.11
Linear Complementary Problem (LCP)
(x, y) ist NE ⇔ ∃ α, β ∈ IR mit
(x, y) ist NE ⇔ ∃ α, β ∈ IR mit
x ∈ S m, y ∈ S n
x, y
≥
0
11 x
T
=
1
11 y
T
=
1
Ay
≤
11 α
B x
≤
11 β
x (11 α − A y)
=
0
T
=
0
n
Aij yj
=
α ∀ i ∈ T1
j=1
n
Aij yj
≤
α ∀i ∈ {1, . . . , m}
j=1
T
m
Bij xi
=
β
T
∀ j ∈ T2
i=1
T
y (11 β − B x)
m
Bij xi
≤
β
∀j ∈ {1, . . . , n}
i=1
Monien/Bleischwitz
Universität Paderborn
Algorithmische Spieltheorie
2.12
Eigennützige Schritte
Definition: Sei (s1, ..., sn) ∈ S = S1 × ... × Sn, i ∈ [1, n], s0i ∈ Si.
Ein Übergang (s1, ..., sn) 7→ (s1, ..., si−1 , s0i, si+1 , ..., sn) heißt eigennütziger Schritt falls
ui(s1, ..., sn) < ui (s1, ..., si−1 , s0i, si+1 , ..., sn).
Selfish Step Algorithmus:
while (s1, ..., sn) ist kein Nash Equilibrium
perform eigennützigen Schritt
Definition: GS = (S, ES ) mit ES = {(s, s); s, s ∈ S, s 7→ s ist eigennütziger Schritt} heißt
Nash-Graph.
Beachte:
(a) Ein reines Nash Equilibrium entspricht einem Knoten in GS mit Ausgangsgrad 0.
(b) Hat GS keine gerichteten Kreise so existiert ein reines Nash Equilibrium.
(c) GS kann Pfade exponentieller Länge enthalten.
Monien/Bleischwitz
Universität Paderborn
Algorithmische Spieltheorie
2.13
Beispiel: Routing Spiel
7 Spieler, 3 Kanten, Spieler i hat Gewicht wi
si = {1, 2, 3}∀i = 1, ..., 7
ui(s1, ..., s7) =
s =s wj
j
i
1
2
4
1
2
2
1
2
2
2
2
2
1
2
2
2
4
3
4
2
Monien/Bleischwitz
Universität Paderborn
3
4
4
3
4
Algorithmische Spieltheorie
4
3
4
2.14
Herunterladen