Folienskriptum Spieltheorie, Professor Berger

Werbung
Spieltheorie
Teil 1: Statische Spiele mit
vollständiger Information
Folienskriptum Spieltheorie (U. Berger, 2015)
1
Worum geht es?
 Wir untersuchen Entscheidungssituationen, in denen



alle Entscheidungsträger (Agenten, Spieler) rational sind,
jeder Spieler eine genau definierte Menge an Handlungsmöglichkeiten
(Strategien) zur Wahl hat,
und das Ergebnis (die Auszahlungen für die Spieler) von den gewählten
Strategien aller Spieler abhängt – also wo es “strategische Interaktion”
gibt.
 Beispiel: Sie gehen mit 5 Freunden in ein Restaurant. Was bestellen Sie?


Jeder bezahlt sein eigenes Essen  simples Entscheidungsproblem.
Vor dem Essen wurde vereinbart, dass jeder 1/6 der Gesamtrechnung
bezahlt  ein Spiel!
Folienskriptum Spieltheorie (U. Berger, 2015)
2
Was ist Spieltheorie?
3 kurze Antworten:
 Spieltheorie ist ein anderes Wort für “mehr-Personen
Entscheidungstheorie".
 Spieltheorie ist ein Werkzeug zur Analyse von strategischer
Interaktion.
 Spieltheorie ist eine formale Methode zur Analyse von strategischem
Verhalten in einer Gruppe von rationalen Spielern.
 Spieltheorie kommt aus der Mathematik und hat
innerwissenschaftliche Anwendungen in
 Wirtschaftswissenschaften und Soziologie
 Politik- und Rechtswissenschaften
 Philosophie und Computerwissenschaften
 Biologie
Folienskriptum Spieltheorie (U. Berger, 2015)
3
Spieltheorie in den Wirtschaftswissenschaften
 John von Neumann & Oskar Morgenstern 1944, Theory of Games
and Economic Behavior
 Nobelpreise (Wirtschaftswissenschaften) für Spieltheoretiker:
 1994: John Nash, John Harsanyi und Reinhard Selten
 2005: Robert Aumann und Thomas Schelling
 2007: Eric Maskin und Robert Myerson
 2012: Alvin Roth und Lloyd Shapley
Folienskriptum Spieltheorie (U. Berger, 2015)
4
Statische Spiele mit vollständiger Information:
Was ist ein Spiel?
Ein statisches Spiel ist eine Menge G = {I, S, u}, wobei gilt:
 I ist eine nichtleere Menge von Spielern.
Bei uns eine endliche Menge: I = {1, 2, …, n}
• i  I bezeichnet einen Spieler
 S = S1 × S2 × … × Sn = Si × S-i
• Si ist eine nichtleere Menge, sie heißt Spieler i's Strategiemenge
• S-i = S1 × ... × Si-1 × Si+1 × … × Sn ist das Produkt der
Strategiemengen von i's Gegenspielern.
• s = (s1, ... , sn) = (si, s-i)  S ist ein reines Strategieprofil der Spieler
• si  Si bezeichnet eine reine Strategie von Spieler i
• s-i = (s1, ... , si-1, si+1, ... , sn)  S-i ist das reine Strategieprofil von i's
Gegenspielern
 u = (u1, u2, ... , un): S → ℝn ist die Auszahlungsfunktion des Spiels, dabei
ist ui: S → ℝ die Auszahlungsfunktion von Spieler i.
•
Folienskriptum Spieltheorie (U. Berger, 2015)
5
Bimatrix Spiele
 Ein Spiel heißt endlich, wenn I und S endliche Mengen sind.
 Ein endliches 2-Personen Spiel kann als Bimatrix dargestellt werden,
man nennt es daher Bimatrix Spiel. Hat Spieler 1 v und Spieler 2 w
Strategien, spricht man von einem v×w Bimatrix Spiel.
 Als Konvention wählt Spieler 1 aus den Zeilen und Spieler 2 aus den
Spalten der Bimatrix. Die Auszahlungen stehen in der Reihenfolge u1, u2
in den Zellen.
 Beispiel: Ein 3×2 Bimatrix Spiel mit I = {Spieler 1, Spieler 2} und
S1 = {a, b, c}, S2 = {d, e}
Spieler 2
d
e
a
u1(a,d), u2(a,d)
u1(a,e), u2(a,e)
Spieler 1 b
u1(b,d), u2(b,d)
u1(b,e), u2(b,e)
c
u1(c,d), u2(c,d)
u1(c,e), u2(c,e)
Folienskriptum Spieltheorie (U. Berger, 2015)
6
Beispiel: Gefangenendilemma
 Zwei Gefangene sind eines gemeinsamen Verbrechens angeklagt. In
getrennten Zellen erhält jeder folgendes Angebot: "Wenn ihr beide
schweigt, können wir euch nur 2 Jahre festhalten. Wenn ihr beide
gesteht, sitzt ihr je 4 Jahre. Aber wenn du gestehst und dein Komplize
dichthält, gehst du als Kronzeuge frei, und er bekommt 5 Jahre."
 I = {Gefangener 1, Gefangener 2}, S1 = S2 = {Dichthalten, Gestehen},
Auszahlungsfunktionen: u1(D,D) = -2, u1(D,G) = -5, u1(G,D) = 0,
u1(G,G) = -4, u2(D,D) = -2, u2(D,G) = 0, u2(G,D) = -5, u2(G,G) = -4
Spieler
Strategien
D
G
Gefangener 1
Gefangener 2
D
G
-2 , -2
-5 , 0
0 , -5
-4 , -4
Auszahlungen
Folienskriptum Spieltheorie (U. Berger, 2015)
7
Beispiel: Dating Game (Verabredungsspiel)
Pat
Oper
Chris
Boxen
Oper
2, 1
0, 0
Boxen
0, 0
1, 2
 Chris und Pat wollen den Abend zusammen verbringen. Chris möchte
gern in die Oper, aber Pat lieber zum Boxen. Am Abend allein zu sein
ist gleich unbefriedigend, egal wo man ist.
 Menge der Spieler I = {Chris, Pat}
 Strategiemengen S1 = S2 = {Oper, Boxen}
 Auszahlungsfunktionen:
u1(O, O) = 2, u1(O, B) = 0, u1(B, O) = 0, u1(B, B) = 1
u2(O, O) = 1, u2(O, B) = 0, u2(B, O) = 0, u2(B, B) = 2
Folienskriptum Spieltheorie (U. Berger, 2015)
8
Beispiel: Matching Pennies (Kopf oder Zahl)
Spieler 1
Kopf
Spieler 2
Kopf
Zahl
-1 , 1
1 , -1
Zahl
1 , -1
-1 , 1
 Zwei Spieler zeigen gleichzeitig eine Seite einer Münze. Wenn die
Seiten verschieden sind, bekommt Spieler 1 die Münze von Spieler 2.
Wenn beide Seiten Kopf oder beide Zahl zeigen, bekommt Spieler 2
die Münze von Spieler 1.
 Menge der Spieler I = {Spieler 1, Spieler 2}
 Strategiemengen S1 = S2 = {Kopf, Zahl}
 Auszahlungsfunktionen:
u1(K, K) = -1, u1(K, Z) = 1, u1(Z, K) = 1, u1(Z, Z) = -1
u2(K, K) = 1, u2(K, Z) = -1, u2(Z, K) = -1, u2(Z, Z) = 1
Folienskriptum Spieltheorie (U. Berger, 2015)
9
Definition: Gemischte Strategien
Eine gemischte Strategie von Spieler i ist eine
Wahrscheinlichkeitsverteilung σi auf seinen reinen Strategien.
 Interpretation: Spieler i wählt nicht eine reine Strategie aus,
sondern eine Wahrscheinlichkeitsverteilung σi. Die Auswahl der
tatsächlich gespielten reinen Strategie trifft dann der Zufall.
 σi(si) ist die Wahrscheinlichkeit, die auf si liegt; auch das
Gewicht von si genannt.
 Σi bezeichnet die Menge der gemischten Strategien von Spieler i.
Σ, σ-i und Σ-i sind analog wie bei reinen Strategien definiert.
 Die reine Strategie si kann mit jener gemischten Strategie
identifiziert werden, für die σi(si) = 1 ist.
Folienskriptum Spieltheorie (U. Berger, 2015)
10
Mehr über gemischte Strategien
 Symbolische Schreibweise für gemischte Strategien: z.B. für
Si = {L, R} und σi(L) = ¼ , σi(R) = ¾ … σi = ¼ L + ¾ R
 σi heißt echt gemischt, wenn σi(si) < 1 f.a. si ist.
 σi heißt total gemischt, wenn σi(si) > 0 f.a. si ist.
 Der support (“Träger”) einer gemischten Strategie σi ist die
Menge jener reinen Strategien, die positives Gewicht erhalten:
supp(σi) = {si  Si: σi(si) > 0 }.
 Durch die Verwendung von erwarteten Auszahlungen
erweitern wir die Auszahlungsfunktionen ui zu Funktionen auf
der Menge der gemischten Strategieprofile Σ.
 ui(σi, σ-i) = E(ui(si, s-i))
Folienskriptum Spieltheorie (U. Berger, 2015)
11
Eine Anmerkung zu Auszahlungen
 In Beispielen geht es oft um Geldbeträge, "Punkte" oder ähnliches. Das
vereinfacht die Darstellung, aber bedenken Sie dabei immer:
 Auszahlungen sind stets von-Neumann-Morgenstern Nutzenwerte.
Das bedeutet, dass die Risikoeinstellung der Spieler schon in den
Auszahlungen berücksichtigt ist. Wenn also Risiko (Zufall) involviert
ist, so maximieren rationale Spieler immer ihre erwartete Auszahlung.
 Ein rationaler Spieler steht vor der Entscheidung „ui = 40 mit Sicherheit
oder ui = 0 bzw. ui = 100 mit Wahrscheinlichkeit je ½“. Wie wird er sich
entscheiden?
 Ein rationaler Spieler steht vor der Entscheidung „€ 40 mit Sicherheit
oder € 0 bzw. € 100 mit Wahrscheinlichkeit je ½“. Wie wird er sich
entscheiden?
Folienskriptum Spieltheorie (U. Berger, 2015)
12
Auszahlungen in einem total gemischten Strategieprofil
Spieler 2
left
right
Spieler 1
up
9,4
-6 , 5
down
0,1
1, 2
 Angenommen, σ = (0.2 up + 0.8 down, 0.4 left + 0.6 right), also Spieler 1
spielt σ1 = 0.2 up + 0.8 down und Spieler 2 spielt σ2 = 0.4 left + 0.6 right.
Welche Auszahlungen erhalten die Spieler?
 u(σ) = 0.2 0.4 (9, 4) + 0.2 0.6 (-6, 5) + 0.8 0.4 (0, 1) + 0.8 0.6 (1, 2) =
= 0.08 (9, 4) + 0.12 (-6, 5) + 0.32 (0, 1) + 0.48 (1, 2) =
= (0.72, 0.32) + (-0.72, 0.6) + (0, 0.32) + (0.48, 0.96) =
= (0.48, 2.2)
 Also u1(σ) = 0.48 und u2(σ) = 2.2
Folienskriptum Spieltheorie (U. Berger, 2015)
13
Transformation von Auszahlungen
 vNM-Nutzenfunktionen sind positiv linear transfomierbar, d.h. die
Auszahlungsfunktionen ui und vi = a ui + b, mit a > 0, repräsentieren
dieselben Präferenzen.
C
D
 Z.B. kann das Gefangenendilemma
-2 , -2
-5 , 0
C
durch die Transformation beider
Auszahlungsfunktionen mit
D
0 , -5
-4 , -4
a = 1 und b = 5 in die übliche Form
transformiert werden.
C
D
3,3
0,5
 Die Standardform des GD:
C
C steht für cooperate (dichthalten),
D
5,0
1,1
D für defect (gestehen)
Folienskriptum Spieltheorie (U. Berger, 2015)
14
Nicht-kooperative Spiele: Bindende Verträge sind
ausgeschlossen. Drei Grundannahmen:
 Einmaliges Spiel mit simultaner Wahl

Jeder Spieler wählt eine Strategie, ohne die Wahl der anderen
Spieler zu kennen. Die Spieler erhalten ihre Auszahlungen und das
Spiel endet.
 Vollständige Information

Das Spiel, also I, S und U, sind Common Knowledge (CK =
"gemeinsames Wissen").
•
Eine Tatsache T ist CK, wenn jeder Spieler T weiß, und jeder
weiß dass jeder T weiß, und jeder weiß dass jeder weiß dass jeder
T weiß, und ... (ad infinitum).
 Rationalität


Alle Spieler sind rational, d.h. jeder Spieler maximiert seine
Auszahlung, gegeben seinen belief (= Glauben, Einschätzung)
über die Strategiewahl der anderen Spieler.
Die Rationalität der Spieler ist CK.
Folienskriptum Spieltheorie (U. Berger, 2015)
15
Definition: streng dominierte Strategie
 Seien d, h  Σi. Strategie d wird streng dominiert durch
Strategie h, wenn ui(d, s-i) < ui(h, s-i) für alle s-i  S-i.
 D.h. Strategie h liefert eine höhere Auszahlung für i als Strategie d,
egal was die Gegenspieler spielen.
 Man sagt kurz: Strategie d ist streng dominiert.
 Zum Nachdenken:
 Kann ein rationaler Spieler eine streng dominierte Strategie spielen?
 Warum genügt … für alle s-i  S-i statt … für alle σ-i  Σ-i ?
 Kann eine reine Strategie streng dominiert sein, ohne durch eine andere
reine Strategie streng dominiert zu sein?
Folienskriptum Spieltheorie (U. Berger, 2015)
16
Definition: schwach dominierte Strategie
 Seien d, h  Σi. Strategie d wird schwach dominiert durch
Strategie h, wenn ui(d, s-i) ≤ ui(h, s-i) für alle s-i  S-i und
ui(d, s-i) < ui(h, s-i) für ein s-i  S-i.
 D.h. Strategie h liefert eine mindestens so hohe Auszahlung wie
Strategie d für Spieler i, egal was die Gegenspieler spielen, und eine
echt höhere Auszahlung für mindestens ein gegnerisches
Strategieprofil.
 Man sagt Strategie h domininiert Strategie d schwach.
 Zum Nachdenken:
Kann ein rationaler Spieler eine schwach dominierte Strategie spielen?
Folienskriptum Spieltheorie (U. Berger, 2015)
17
Definition: dominante Strategie
 Strategie si ist streng dominant, wenn für alle si'  Si\{si}:
ui(si, s-i) > ui(si', s-i) für alle s-i  S-i .
 Strategie si ist schwach dominant, wenn für alle si'  Si\{si}:
ui(si, s-i) ≥ ui(si', s-i) für alle s-i  S-i, und ui(si, s-i) > ui(si', s-i)
für ein s-i  S-i.
 D.h.: Eine Strategie ist genau dann streng [schwach] dominant, wenn
sie alle anderen Strategien des Spielers streng [schwach] dominiert.
 Zum Nachdenken:
Warum kann eine streng dominante Strategie nicht echt gemischt sein?
Folienskriptum Spieltheorie (U. Berger, 2015)
18
Definition: beste Antwort
 Strategie σi ist eine beste Antwort von Spieler i auf σ-i, wenn
ui(σi, σ-i) ≥ ui(σi', σ-i) für alle σi'  Σi.
 Wir bezeichnen die Menge der besten Antworten von Spieler i auf σ-i
mit Bi(σ-i). Wenn Spieler i den belief σ-i hat, dann wird er (weil er
rational ist) jedenfalls ein Element dieser Menge, also eine beste
Antwort auf σ-i, spielen.
 Eine Strategie von Spieler i, die auf keinen belief σ-i eine beste
Antwort ist, wird niemals-beste Antwort genannt.
Folienskriptum Spieltheorie (U. Berger, 2015)
19
Echt gemischte Strategien als beste Antworten
 Fundamentaltheorem oder Indifferenzprinzip:
σi ist genau dann eine beste Antwort auf σ-i , wenn alle
reinen Strategien in supp(σi) beste Antworten auf σ-i
sind.
 Intuition für das Fundamentaltheorem: Wenn eine bestimmte reine
Strategie im support keine beste Antwort wäre, dann könnte der Spieler
seine erwartete Auszahlung erhöhen, indem er Gewicht von dieser
Strategie wegnimmt und zu einer reinen besten Antwort hin verschiebt.
Folienskriptum Spieltheorie (U. Berger, 2015)
20
IESDS – Iterierte Elimination streng dominierter
Strategien

1.
2.


Ein rationaler Spieler spielt nie eine streng dominierte Strategie. Eine streng
dominierte Strategie kann also eliminiert werden. Hier ist ein Algorithmus
für die IESDS:
Prüfen Sie, ob irgendein Spieler eine streng dominierte reine Strategie
besitzt. Wenn nein, sind Sie fertig. Wenn ja, eliminieren Sie diese Strategie
aus dem Spiel.
Das Spiel ist jetzt reduziert, es ist "kleiner" und weniger komplex. Gehen
Sie zu Schritt 1.
Übrig bleibt ein Spiel ohne streng dominierte Strategien. Die übrig
gebliebenen Strategien heißen iterativ undominiert. Wenn pro Spieler nur
eine Strategie überlebt, heißt das Spiel Dominanz-lösbar.
Da Rationalität CK ist, wird ein Spieler nie eine iterativ streng dominierte
Strategie wählen (= eine Strategie, die im Zuge der IESDS eliminiert wird).
Wenn ein Spiel Dominanz-lösbar ist, wird also jeder Spieler seine einzige
überlebende Strategie spielen.
Folienskriptum Spieltheorie (U. Berger, 2015)
21
IESDS – ein Beispiel
Spieler 1
Left
Spieler 2
Middle
Up
1, 0
1, 2
0, 1
Down
0, 3
0, 1
2, 0
Folienskriptum Spieltheorie (U. Berger, 2015)
Right
22
IESDS – ein Beispiel
Spieler 1
Left
Spieler 2
Middle
Up
1, 0
1, 2
0, 1
Down
0, 3
0, 1
2, 0
Right
 2 > 1 und 1 > 0, daher ist Right streng dominiert (und zwar von Middle).
Right wird von Spieler 2 also nicht gespielt werden, und Spieler 1 weiß das.
Right kann also aus dem Spiel eliminiert werden.
Folienskriptum Spieltheorie (U. Berger, 2015)
23
IESDS – ein Beispiel
Spieler 1
Left
Spieler 2
Middle
Up
1, 0
1, 2
0, 1
Down
0, 3
0, 1
2, 0
Right
 1 > 0, daher ist nun Down streng dominiert (und zwar von Up).
Down wird von Spieler 1 also nicht gespielt werden, und Spieler 2 weiß das.
Down kann also aus dem Spiel eliminiert werden.
Folienskriptum Spieltheorie (U. Berger, 2015)
24
IESDS – ein Beispiel
Spieler 1
Left
Spieler 2
Middle
Up
1, 0
1, 2
0, 1
Down
0, 3
0, 1
2, 0
Right
 2 > 0, daher ist nun Left streng dominiert (und zwar von Middle).
Left wird von Spieler 2 also nicht gespielt werden, und Spieler 1 weiß das.
Left kann also aus dem Spiel eliminiert werden.
Folienskriptum Spieltheorie (U. Berger, 2015)
25
IESDS – ein Beispiel
Spieler 1
Left
Spieler 2
Middle
Up
1, 0
1, 2
0, 1
Down
0, 3
0, 1
2, 0
Right
 Die einzigen überlebenden Strategien sind Up (für Spieler 1) und Middle (für
Spieler 2). Das Spiel ist Dominanz-lösbar. Die Lösung lautet (Up, Middle).
Folienskriptum Spieltheorie (U. Berger, 2015)
26
Rationalisierbarkeit und IENBA (iterierte
Elimination von niemals-besten Antworten)

1.
2.

Ein rationaler Spieler spielt immer eine beste Antwort auf
seinen belief. Eine niemals-beste Antwort kann man also
eliminieren. Hier ist ein Algorithmus für die IENBA:
Prüfen Sie ob einer der Spieler eine reine niemals-beste
Antwort hat. Wenn nein, sind Sie fertig. Wenn ja,
eliminieren Sie diese Strategie aus dem Spiel.
Das Spiel ist jetzt reduziert, es ist "kleiner" und weniger
komplex. Gehen Sie zu Schritt 1.
Übrig bleibt ein Spiel, in dem jede Strategie eine beste
Antwort auf zumindest einen belief ist. Die überlebenden
Strategien heißen rationalisierbar.
Folienskriptum Spieltheorie (U. Berger, 2015)
27
Mehr über Rationalisierbarkeit




Ein rationaler Spieler spielt nur rationalisierbare
Strategien!
In 2-Personen-Spielen sind die Konzepte IESDS und
IENBA identisch: Eine Strategie ist genau dann iterativ
undominiert, wenn sie rationalisierbar ist.
Aber in Spielen mit 3 oder mehr Personen ist
Rationalisierbarkeit ein stärkeres Konzept als IESDS!
D.h. es gibt Spiele mit iterativ undominierten Strategien,
die nicht rationalisierbar sind.
Folienskriptum Spieltheorie (U. Berger, 2015)
28
Definition: Nash Gleichgewicht (NG)
 Wir wissen, dass ein Spieler immer eine beste Antwort auf seinen
belief spielt, und dass dieser belief nur rationalisierbare Strategien
beinhaltet. Trotzdem kann sich der belief nach dem Spiel als falsch
erweisen.
 Auf lange Sicht sollten die beliefs aber entsprechend angepasst werden
und sich schließlich als korrekt erweisen. Ist das der Fall, so spielt
jeder Spieler sogar eine beste Antwort auf das tatsächlich gewählte
Strategieprofil der Gegenspieler. In diesem Fall nennt man das
Strategieprofil ein Nash Gleichgewicht.
 Ein Strategieprofil σ* ist ein Nash Gleichgewicht, wenn
σi*  Bi(σ-i*) für alle i  I.
 In Worten: Ein Strategieprofil ist ein Nash Gleichgewicht, wenn jeder
Spieler eine beste Antwort auf die Wahl seiner Gegenspieler spielt.
Folienskriptum Spieltheorie (U. Berger, 2015)
29
Warum NG ein wichtiges Konzept ist
1. Die beliefs können nicht dauerhaft falsch sein. Wenn die
beliefs aller Spieler korrekt sind, so spielen sie ein NG.
2. In einem NG spielt jeder Spieler optimal, gegeben die
Entscheidungen der Gegenspieler. Wenn also ein NG
gespielt wird, bereut kein Spieler seine Strategiewahl
nach dem Spiel. Nur NGs haben diese Eigenschaft!
3. Jede "plausible Lösung" eines Spiels muss ein NG sein!
(Warum?) Andererseits ist aber nicht jedes NG eine
plausible Lösung – dazu später mehr.
Folienskriptum Spieltheorie (U. Berger, 2015)
30
Pareto-Optimalität und mehr über NGs




NGs müssen nicht existieren, d.h. nicht jedes Spiel besitzt ein NG.
NGs, wenn sie existieren, müssen nicht eindeutig sein, d.h. ein Spiel
kann mehrere NGs haben.
Ein NG, wenn es existiert, muss nicht Pareto-optimal (effizient) sein.
Wiederholung: Pareto-Optimalität
 Ein reines Strategieprofil s ist Pareto-besser als Strategieprofil s',
wenn ui(s) ≥ ui(s') für alle i  I, und ui(s) > ui(s') für ein i  I.
 Man nennt dann s auch eine Pareto-Verbesserung gegenüber s'.
 Ein Strategieprofil s is Pareto-optimal, wenn es keine ParetoVerbesserung gegenüber s gibt, d.h. wenn kein anderes Strategieprofil
Pareto-besser als s ist.
 Welche Strategieprofile im Gefangenendilemma sind Pareto-optimal?
Folienskriptum Spieltheorie (U. Berger, 2015)
31
Wie man reine NGs in Bimatrix Spielen findet

Für Bimatrix Spiele gibt es eine einfache Methode, um reine NGs zu
finden:



In jeder Spalte der Bimatrix unterstreichen Sie die höchste(n)
Auszahlung(en) von Spieler 1 (links stehend!).
In jeder Zeile der Bimatrix unterstreichen Sie die höchste(n)
Auszahlung(en) von Spieler 2 (rechts stehend!).
Wenn in einer Zelle der Bimatrix beide Auszahlungen unterstrichen
sind, so ist das entsprechende Strategieprofil ein Nash Gleichgewicht.
Folienskriptum Spieltheorie (U. Berger, 2015)
32
Nashs Theorem
 Zur Erinnerung: Ein Strategieprofil σ* ist ein Nash
Gleichgewicht (NG), wenn σi*  Bi(σ-i*) für alle i  I.
1950 bewies John F. Nash:
 Jedes endliche Spiel besitzt mindestens ein Nash
Gleichgewicht.
 Konstruieren Sie ein Spiel ohne NG!
Folienskriptum Spieltheorie (U. Berger, 2015)
33
Spieltheorie
Teil 2: Dynamische Spiele mit
vollständiger Information
Folienskriptum Spieltheorie (U. Berger, 2015)
34
Dynamische Spiele mit vollständiger Information:
Bäume, Knoten und Züge
 In einem dynamischen Spiel mit vollständiger Information
ziehen die Spieler abwechselnd, es gibt also eine zeitliche
Abfolge von Spielzügen. Die exakte Definition ist zu komplex,
hier ist eine Beschreibung:
 Ein dynamisches Spiel wird durch einen Spielbaum dargestellt.
Ein Spielbaum spezifiziert, welcher Spieler wann zieht, welche
Information er hat, welche Züge für ihn möglich sind und welche
Auszahlungen mit den Zugfolgen verknüpft sind.
 Ein Spielbaum startet an der sog. Wurzel. Ein Spieler beginnt
dort mit einem von mehreren möglichen Zügen. Jeder Zug führt
zu einer neuen Verzweigung, genannt Knoten, des Spielbaumes.
Bei jedem Knoten macht entweder einer der Spieler einen Zug
(Entscheidungsknoten), oder die "Natur" macht einen
Zufallszug, oder das Spiel endet in einem Endknoten. Zu jedem
Endknoten gehört ein Auszahlungsvektor mit den jeweiligen
Auszahlungen für alle Spieler.
Folienskriptum Spieltheorie (U. Berger, 2015)
35
Informationsmengen und perfekte Information
 Die Entscheidungsknoten eines jeden Spielers sind in
Informationsmengen partitioniert. Eine Informationsmenge
enthält jene Knoten, zwischen denen der Spieler nicht
unterscheiden kann. (Er weiß in welcher Informationsmenge er
sich befindet, aber nicht an welchem Knoten in dieser Menge. Für
jeden Knoten in der Informationsmenge muss die Menge der
möglichen Züge notwendigerweise dieselbe sein.) Eine
Informationsmenge wird durch eine strichlierte Linie zwischen
den jeweiligen Knoten im Spielbaum dargestellt.
 Wenn eine Informationsmenge nur einen einzigen Knoten enthält,
nennt man sie ein-elementig. Ein dynamisches Spiel, in dem alle
Informationsmengen ein-elementig sind, nennt man ein Spiel mit
perfekter Information, andernfalls ein Spiel mit imperfekter
Information.
Folienskriptum Spieltheorie (U. Berger, 2015)
36
Spielverlauf und Strategien in dynamischen
Spielen
 Eine Zugfolge, die von der Wurzel eines Spiels bis zu einem
Endknoten verläuft, nennt man einen Spielverlauf.
 Wenn ein dynamisches Spiel nur endlich viel Knoten enthält,
heißt es endlich. Wenn es unendlich ist, enthält es entweder
Knoten mit unendlich vielen möglichen Zügen, oder es sind
unendliche Spielverläufe möglich. Wenn alle Spielverläufe
endlich sind, sagt man, das Spiel hat einen endlichen Horizont.
 Eine reine Strategie eines Spielers in einem dynamischen Spiel
ist ein vollständiger Verhaltensplan. D.h. sie muss für jede
Informationsmenge des Spielers einen der möglichen Züge
vorschreiben. Dies gilt auch für Informationsmengen, die gar
nicht erreicht werden, wenn diese Strategie gespielt wird!
Folienskriptum Spieltheorie (U. Berger, 2015)
37
Die strategische Form eines dynamischen Spiels
 Durch ein reines Strategieprofil ist der Spielverlauf (bis auf
Zufallszüge) eindeutig bestimmt, ebenso der Auszahlungsvektor.
 Damit können wir ein dynamisches Spiel in ein statisches Spiel
übersetzen. Wir konstruieren einfach aus dem Spielbaum die
Menge der reinen Strategien für jeden Spieler und daraus die
Auszahlungsfunktionen. Das so konstruierte statische Spiel nennt
man die strategische Form des dynamischen Spiels.
 Auf diese Weise lassen sich alle Definitionen, inklusive
Dominanz, gemischte Strategien, etc., auch auf dynamische
Spiele übertragen. Ein wichtiges Beispiel:
 Ein Strategieprofil σ* in einem dynamischen Spiel heißt Nash
Gleichgewicht, wenn es ein Nash Gleichgewicht in der
strategischen Form des Spiels ist.
Folienskriptum Spieltheorie (U. Berger, 2015)
38
Ein Beispiel
1
a
 Zum Nachdenken:
b
N
2
[0.8]
[0.2]
c
d
e
1
f
4
0
f
g
0
2
4
1
g
8
4
2
h
0
3
15
15
0
-5
i
-5
10
Folienskriptum Spieltheorie (U. Berger, 2015)
Was sind die reinen
Strategien der Spieler?
Wie lautet die
strategische Form
dieses Spiels?
Finden Sie alle reinen
NGs dieses Spiels!
39
Beispiel: Entry Deterrence
 Firma Y ist Monopolist im Markt,
wird aber durch den Markteintritt
von X bedroht. Wenn X draußen
bleibt macht es 0 Gewinn, und Y
behält den Monopolgewinn von 8.
Wenn X eintritt, kann Y entweder
den Markt teilen (Gewinn jeweils 3) share
oder einen Preiskampf beginnen, der
3
mit einem Verlust von 1 für beide
3
Firmen endet.
X
in
out
Y
fight
0
8
-1
-1
 Lösen Sie dieses Spiel! Was werden
die Firmen tun?
Folienskriptum Spieltheorie (U. Berger, 2015)
40
Analyse von Entry Deterrence
 Jede Firma hat nur einen
Entscheidungsknoten, also sind die
Strategiemengen {in, out} für X
und {share, fight}für Y.
 Die strategische Form des Spiels ist:
Y
share
fight
3,3
-1 , -1
in
X
0,8
0,8
out
X
in
out
Y
share
fight
3
3
-1
-1
0
8
 Die NGs sind leicht zu finden, es sind
(in, share) und (out, fight).
 Halten Sie (out, fight) für eine
plausible Lösung?
Folienskriptum Spieltheorie (U. Berger, 2015)
41
Analyse von Entry Deterrence (Forts.)
 Wenn der Spielverlauf den
Entscheidungsknoten von Y
erreicht, also wenn X "in" wählt,
dann wird Y nicht kämpfen. Das
NG (out, fight) beruht auf Ys
unglaubwürdiger Drohung, zu
kämpfen falls X eintritt.
 Rational ist es für X einzutreten und
für Y den Markt zu teilen. Das NG
(in, share) ist eine plausible Lösung.
 Das NG (out, fight) ist unplausibel,
da es in dem Teilspiel, das an Ys
Entscheidungsknoten beginnt, einen
irrationalen Zug vorschreibt.
X
in
out
Y
share
fight
3
3
-1
-1
Folienskriptum Spieltheorie (U. Berger, 2015)
0
8
ein Teilspiel
42
Teilspiele
1
 Ein Teilspiel eines dynamischen
Spiels ist ein Teil des Spielbaums,
der an einer ein-elementigen
Informationsmenge beginnt und alle
darauf folgenden Knoten (und nur
diese) enthält.
 Diese Definition impliziert, dass das
ganze Spiel immer ein Teilspiel
seiner selbst ist. Alle anderen
Teilspiele heißen echte Teilspiele.
 Ein Spiel muss kein echtes Teilspiel
haben. Geben Sie ein Beispiel!
 Ein Strategieprofil in einem Spiel
induziert (erzeugt) ein (Teilspiel-)
Strategieprofil in jedem Teilspiel.
N
2
1
2
Die echten Teilspiele in dem
Beispiel von S. 35.
Folienskriptum Spieltheorie (U. Berger, 2015)
43
Teilspielperfektes Gleichgewicht (TPG)
 Ein Nash Gleichgewicht eines
X
dynamischen Spiels heißt
teilspielperfekt, wenn es in jedem
Teilspiel ein Nash Gleichgewicht
induziert.
 Teilspielperfektion schließt alle
NGs aus, die auf unglaubwürdigen
Drohungen beruhen.
in
out
Y
share
fight
3
3
-1
-1
0
8
 Man kann zeigen, dass jedes
endliche dynamische Spiel mit
vollständiger Information ein
teilspielperfektes Nash
Gleichgewicht besitzt.
Dieses Teilspiel ist ein 1-Personen Spiel
mit NG (share). Das NG (out, fight) des
Originalspiels induziert (fight) in diesem
Teilspiel, also ist es nicht teilspielperfekt.
Nur das NG (in, share) ist ein TPG.
Folienskriptum Spieltheorie (U. Berger, 2015)
44
TPGs in Spielen mit perfekter Information finden:
Rückwärtsinduktion
 In einem Spiel mit perfekter
Information und endlichem
Horizont gibt es eine einfache
Methode, um TPGs zu finden,
genannt Rückwärtsinduktion.
 Sie beginnen am Ende des
Spielbaums (bei einem der letzten
Entscheidungsknoten) und
bestimmen den optimalen Zug des
ziehenden Spielers. Gehen Sie dann
zum vorletzten Entscheidungsknoten
und bestimmen Sie den optimalen
Zug des dort ziehenden Spielers,
wobei der zuvor bestimmte optimale
Zug als gegeben angenommen wird.
Arbeiten Sie sich auf diesem Weg bis
zur Wurzel zurück.
X
in
out
Y
share
fight
3
3
-1
-1
0
8
Falls Y zum Zug kommt, ist sein
optimaler Zug "share". X weiß das,
entscheidet also effektiv zwischen den
Auszahlungsvektoren (3,3) und (0,8).
Optimal für X ist daher "in". Die
Rückwärtsinduktion liefert also das
TPG (in, share).
Folienskriptum Spieltheorie (U. Berger, 2015)
45
Beispiel: Tausendfüßler
 Sie und ein Gegenspieler sitzen in getrennten Räumen vor einer
"Münzmaschine". Die beiden Maschinen sind verbunden und jede
hat einen Münzschlitz und einen Stop-Knopf. Wenn einer von Ihnen
1€ in den Schlitz wirft, kommen beim anderen 2€ heraus. Wenn aber
einer auf Stop drückt, ist das Spiel zu Ende. Die Spieler ziehen
abwechselnd und höchstens je 10 Mal. Sie beginnen.
 Wie würden Sie dieses Spiel in der Realität spielen?
 Wie würden rationale Spieler dieses Spiel spielen?
Folienskriptum Spieltheorie (U. Berger, 2015)
46
Beispiel: Wiederholtes Gefangenendilemma mit
fixer Anzahl von Runden
Cooperate
1
2
Defect
Cooperate
3,3
0,5
Defect
5,0
1,1
 Sie (Spieler 1) und Ihr Gegenspieler (Spieler 2) spielen diese
Variante des Gefangenendilemmas. Im einmaligen Spiel ist D(efect)
offensichtlich streng dominant. Sie spielen dieses Spiel aber
wiederholt, nämlich 5 Mal hintereinander. Nach jeder Runde wird
deren Resultat bekannt gegeben.
 Wie würden Sie das wiederholte Spiel in der Realität spielen?
 Wie würden rationale Spieler das wiederholte Spiel spielen?
Folienskriptum Spieltheorie (U. Berger, 2015)
47
Beispiel: Wiederholtes Gefangenendilemma mit
unbestimmter Anzahl von Runden (wGD)
 Sie spielen das GD wiederholt, aber die
Anzahl der Runden ist eine Zufallsvariable.
C
Nach jeder Runde endet das Spiel mit einer
Wahrsch. von p bzw. wird eine weitere Runde 1 D
gespielt mit einer Wahrsch. von 1-p.
C
2
D
3,3
0,5
5,0
1,1
 Zeigen Sie, dass (immer D, immer D) ein NG für das wGD ist!
 Die folgende Strategie T heißt eine Trigger-Strategie für das wGD:

Beginne mit C. In jeder weiteren Runde, spiele C wenn in allen
bisherigen Runden (C, C) gespielt wurde, sonst spiele D.
 Zeigen Sie, dass das Profil (T, T) zu durchgehender Kooperation führt!
 Zeigen Sie, dass (T, T) für kleine Werte von p ein Nash Gleichgewicht
des wGD ist!
 Zeigen Sie, dass (T, T) dann sogar teilspielperfekt ist!
Folienskriptum Spieltheorie (U. Berger, 2015)
48
Herunterladen