Vorlesung: Nicht-kooperative Spieltheorie

Werbung
Spiele in extensiver Form
Vorlesung: Nicht-kooperative Spieltheorie
Teil 5: Spiele in extensiver Form
Dr. Thomas Krieger
Wintertrimester 2009
und
Dr. Thomas Krieger
Vorlesung: Nicht-kooperative Spieltheorie
1
Spiele in extensiver Form
Das Steuer-Spiel nach Selten (1)
Informelle Beschreibung der Konfliktsituation:
Finanzamt (Spieler 1) steht einem Steuerpflichtigen (Spieler 2) gegenüber.
Steuerpflichtiger ist möglicherweise unehrlich und kann eine Steuerhinterziehung
von 10 Geldeinheiten erwägen.
Das Finanzamt weiss, dass im Mittel 20% aller Steuerpflichtigen Steuern in
Höhe von 10 Geldeinheiten hinterziehen, falls die Situation dafür günstig ist
(potentieller Betrüger).
Das Finanzamt kann zunächst eine oberflächliche Überprüfung (K) durchführen,
an die eine gründlichere (N) angeschlossen wird, falls sich Anhaltspunkte für
einen Steuerbetrug ergeben haben.
Die oberflächliche Überprüfung belastet das Finanzamt mit Kosten in Höhe von
1 und die gründlichere mit zusätzlichen Kosten in Höhe von 4.
Falls tatsächlich Steuern hinterzogen werden, wird bei einer oberflächlichen
Überprüfung immer ein Anzeichen des Steuerbetruges entdeckt und eine
eventuelle anschließende gründliche Untersuchung deckt den Betrug immer auf.
Im Falle der Aufdeckung muß das Zweieinhalbfache des hinterzogenen Betrages,
also 25, vom Steuerpflichtigen an das Finanzamt entrichtet werden. Anzeichen
für einen Steuerbetrug können sich bei der oberflächlichen Überprüfung mit
Wahrscheinlichkeit 0.25 auch dann ergeben, wenn keine Steuern hinterzogen
werden. Jedoch stellt die genaue Nachprüfung dann klar, daß keine
Steuerhinterziehung vorliegt.
Dr. Thomas Krieger
Vorlesung: Nicht-kooperative Spieltheorie
und
2
Spiele in extensiver Form
Das Steuer-Spiel nach Selten (2)
¼
¾
¼
¼
½
½
Dr. Thomas Krieger
Vorlesung: Nicht-kooperative Spieltheorie
und
3
Spiele in extensiver Form
Das Steuer-Spiel nach Selten (3)
Erläuterungen zur letzten Folie:
Finanzamt ist Spieler 1
Steuerpflichtiger ist Spieler 2
Zufallszug ist Spieler 0
B: Betrugsversuch des Steuerpflichtigen
B̄: Kein Betrugsversuch des Steuerpflichtigen
K : Oberflächliche Überprüfung des Finanzamtes
K̄ : Keine Überprüfung des Finanzamtes
N: Genaue Nachprüfung durch das Finanzamt
N̄: Keine Nachprüfung durch das Finanzamt
und
Dr. Thomas Krieger
Vorlesung: Nicht-kooperative Spieltheorie
4
Spiele in extensiver Form
Vorbereitung (1)
Ein gerichteter Graph besteht aus einer – hier stets endlichen
– Menge K von Knoten und einer Menge E ⊂ K × K von
Kanten (u, v ) vom Knoten u zum Knoten v .
Ein Pfad von u nach v ist eine Folge u0 , u1 , . . . , un von
Knoten, n ≥ 0, so daß (ui , ui+1 ) Kante des Graphen ist,
i = 0, . . . , n − 1, mit u0 = u, un = v .
Ein Baum ist ein gerichteter Graph mit einem ausgezeichneten
Knoten, Wurzel genannt, so daß gilt (siehe z.B. Knuth 1968):
(i) Zu der Wurzel geht keine, zu jedem anderen Knoten genau
eine Kante, und
(ii) von der Wurzel gibt es zu jedem Knoten einen Pfad.
und
Dr. Thomas Krieger
Vorlesung: Nicht-kooperative Spieltheorie
5
Spiele in extensiver Form
Vorbereitung (2)
Für eine Kante (u, v ) des Baumes heißt u Vater von v und v
Sohn von u. Für einen Pfad von u nach v heißt v Nachfahr
von u (auch für u = v ). Ein Knoten ohne Söhne heißt Blatt,
sonst innerer Knoten.
Der Baum heißt geordnet, wenn unter Brüdern, d.h. den
Söhnen jedes inneren Knotens, stets eine Reihenfolge
/
"
festgelegt
ist,z.B.
von
links nach rechts bei der graphischen
(Darstellung.
/
$ heißt
%
a(x
)
" ( Dabei
Anzahl
derSöhne
von x und
G %
( D $" 1 /
, l)
l-ter
Sohn
x , l ∈ { 1, . . . , a(x ) }.
(S(x
%
von
!
7
6 *
" 8
' " ( $ D ! $ D )"
Dr. Thomas Krieger
Vorlesung: Nicht-kooperative Spieltheorie
und
6
Spiele in extensiver Form
Definition extensives Spiel (1)
Definition 28
Ein n-Personen-Spiel in extensiver Form ist ein 5-Tupel
(K , h, P, w , U) mit den folgenden Komponenten:
K ist ein endlicher geordneter Baum; x ∈ K steht für “x ist ein
Knoten des Baumes”. Einen inneren Knoten nennen wir
Entscheidungspunkt, ein Blatt einen Spielausgang. Die Menge
der inneren Knoten sei I, die Menge der Blätter (Endknoten)
sei E genannt.
h ist eine Funktion, die jedem Spielausgang z ∈ E einen Wert
im Rn zuordnet. Die i-te Komponente von h für
i ∈ { 1, . . . , n }, heißt die Auszahlung an Spieler i.
P ordnet jedem Entscheidungspunkt x ∈ I einen Wert aus
0, 1, . . . , n zu. P(x ) ist der Spieler, der in x am Zug ist,
Spieler 0 heißt der Zufall.
und
Dr. Thomas Krieger
Vorlesung: Nicht-kooperative Spieltheorie
7
Spiele in extensiver Form
Definition extensives Spiel (2)
Definition 28- Fortführung
w bestimmt für jeden Knoten x mit P(x ) = 0 eine
Wahrscheinlichkeitsverteilung auf seinen Söhnen.
U ist eine Partition der Menge I der Entscheidungspunkte, wobei
für jede Klasse A ∈ U gilt:
(i) In A ist nur ein Spieler i, bezeichnet mit P(A), am Zug, d.h.
P(x ) = i für alle x ∈ A falls P(A) = i. Dann heißt A
Informationsbezirk für Spieler i.
(ii) Alle Knoten in A haben gleich viele, etwa k Söhne. Die Zahl k
der Auswahlen von A heißt a(A).
(iii) Für l ∈ { 1, . . . , a(A) } sei
Nl (A) := {y ∈ K | y Nachfahr von S(x , l) für ein x ∈ A}.
Dann ist jedes B ∈ U mit P(B) = P(A) entweder in der
Menge Nl (A) enthalten oder aber zu ihr disjunkt.
und
Dr. Thomas Krieger
Vorlesung: Nicht-kooperative Spieltheorie
8
Spiele in extensiver Form
Reine Strategien
Bearbeiten Sie Aufgabe 1 und 2 des Übungsblattes 5.
Definition 29
Eine reine Strategie si des Spielers i, i ∈ { 1, . . . , n }, in einem
extensiven n-Personenspiel (K , h, P, w , U) ist eine Funktion, die
jedem Informationsbezirk A ∈ U des Spielers i (d.h. mit P(A) = i)
genau einen Zug, d.h. eine Zahl zwischen 1 und a(A) zuordnet,
also si (A) ∈ { 1, . . . a(A) }.
Anschaulich kann eine reine Strategie als ein vollständiger
Verhaltensplan beschrieben werden, der einem Spieler i genau
vorschreibt, was er in jeder überhaupt nur denkbaren Situation
zu tun hat. (Wozu braucht man das?)
Menge der reinen Strategien im Steuerspiel:
SFinanzamt = { K N, K N, K N, KN } und
SSteuerpflichtiger = { B, B }.
Dr. Thomas Krieger
Vorlesung: Nicht-kooperative Spieltheorie
und
9
Spiele in extensiver Form
Erwartete Auszahlung (1)
Zu jeder reinen Strategienkombination s = (s1 , . . . , sn ) gehört
eine Menge von Endpunkten Z (s), die mit positiver
Wahrscheinlichkeit erreicht werden können, falls s gespielt
wird.
z.B. für s = (KN, B̄) erhalten wir im Steuerspiel die
Endpunktmenge Z (s) = { z2 , z4 , z9 , z11 }.
Die Wahrscheinlichkeit, mit der jeder der Endpunkte z ∈ Z (s)
erreicht wird, falls s gespielt wird, ist nichts anderes als das
Produkt aller Wahrscheinlichkeiten von Zufallszügen auf dem
Pfad von der Wurzel nach z. Wir bezeichnen diese
Wahrscheinlichkeit mit p(z).
und
Dr. Thomas Krieger
Vorlesung: Nicht-kooperative Spieltheorie
10
Spiele in extensiver Form
Erwartete Auszahlung (2)
Auszahlungsbeiträge
Endpunkt
p(z)
z1
z2
z3
z4
z5
z6
z7
z8
z9
z10
z11
0.2
0.15
0.05
0.05
0.2
0.2
0.2
0.8
0.6
0.2
0.2
p(z) · h1 (z)
p(z) · h2 (z)
0
−0.15
−0.05
−0.25
−2
−2.2
4
0
−0.6
−0.2
−1
0
0
0
0
2
2
−5
0
0
0
0
Allgemein gilt
für jede reine
Strategienkombination
s (ohne
Beweis):
X
p(z) = 1 .
z∈Z (s)
und
Dr. Thomas Krieger
Vorlesung: Nicht-kooperative Spieltheorie
11
Spiele in extensiver Form
Erwartete Auszahlung (3)
Definition 30
Die Erwartungsauszahlung oder kurz Auszahlung Hi (s) des Spielers
i für s ist der Erwartungswert von hi (z), falls s gespielt wird. Dies
ist die Summe der Beiträge p(z) · hi (z) mit z ∈ Z (s), wobei Z (s)
die Menge der Endpunkte ist, die für s erreicht wird,
X
Hi (s) =
p(z) · hi (z) .
z∈Z (s)
Die Auszahlungsfunktion H ordnet jedem s ∈ S den zugehörigen
Auszahlungsvektor H(s) = (H1 (s), . . . , Hn (s)) zu.
Achtung: wenn es einen Zufallszug im Spiel G gibt und
zusätzlich gemischte Strategien betrachtet werden, findet eine
zweifache Erwartungswertbildung für jeden Spieler statt!
und
Dr. Thomas Krieger
Vorlesung: Nicht-kooperative Spieltheorie
12
Spiele in extensiver Form
Zurück zum Steuer-Spiel (1)
Für das Steuerspiel erhalten wir mit Definition 30
Reine Strategien
s1
s2
KN
B
KN
B̄
B
K N̄
K N̄
B̄
K̄ N
B
K̄ N
B̄
K̄ N̄
B
K̄ N̄
B̄
realisierte Endpunktmenge Z (s)
z7 , z9 , z11
z2 , z4 , z9 , z11
z6 , z9 , z10
z2 , z3 , z9 , z10
z5 , z8
z1 , z8
z5 , z8
z1 , z8
Erwartungsauszahlung
H1 (s)
H2 (s)
2.4
−5
−2
0
−3
2
−1
0
−2
2
0
0
−2
2
0
0
und
Dr. Thomas Krieger
Vorlesung: Nicht-kooperative Spieltheorie
13
Spiele in extensiver Form
Zurück zum Steuer-Spiel (2)
Die reinen Strategienmengen { K N, K N, K N, KN }
für das Finanzamt und
{ B, B } für den Steuerpflichtigen bilden zusammen
mit der auf der letzten Folie
angegebenen Auszahlungsfunktion H die Normalform
G = ({1, 2}, (S1 , S2 ); H)
des Steuer-Spiels:
#
!
>
>
> >
>
!,
)
!
!
.
!
!
#
!
5
5
5
5
!
5
5
' !"#
Bestimmen Sie alle +
Nash-Gleichgewichte
des
Steuer-Spiels.
( (
( : ( " * ( J
/
( B G
D !$ D D "
und
Dr.
Thomas Krieger
Vorlesung: Nicht-kooperative Spieltheorie
14
Spiele in extensiver Form
Verallgemeinerung dieses Vorgehens
Die reinen Strategienmengen S1 , . . . , Sn bilden zusammen mit
der in Definition 30 angegebenen Auszahlungsfunktion H die
Normalform G = (S1 , . . . , Sn ; H) eines extensiven Spieles
(K , h, P, w , U).
Auch hier können nun gemischte Strategien betrachtet werden
und der Satz von Nash garantiert, dass jedes extensive Spiel
ein Nash-Gleichgewicht in gemischten Strategien besitzt.
Weiteres Strategiekonzept: Eine Verhaltensstrategie bi für
Spieler i ordnet jedem Informationsbezirk A mit P(A) = i eine
Wahrscheinlichkeitsverteilung auf der Menge {1, . . . , a(A)}
der Auswahlen zu. Bei Einsatz von bi wählt i die Alternative l,
l ∈ { 1, . . . , a(A) }, mit der Wahrscheinlichkeit bi (A, l).
und
Dr. Thomas Krieger
Vorlesung: Nicht-kooperative Spieltheorie
15
Spiele in extensiver Form
Teilspiele
1
52 Definition 31 !
*! %!9
0, h
0 , P 0 , 0 in extensiver
12 # # (K
'
# )!
9
Ein n-Personen-Spiel
w 0,# U
Form heißt
12
+ ! <
Teilspiel eines Spieles (K , h, P, w , U), wenn gilt
¼
¼
¼
¼
¼
¼
¼
¼
# 4 von
&
>
die
(i) K 0 ist Teilbaum
K , d.h.
K 0
hat als Knotenmenge
,'. > "# ' 0!
#
! eines
Knotens
# &
o ∈ ,.#
Menge
aller
Nachfahren
K (und damit o 0
' # als Wurzel)
sowiedie
entsprechenden
und
!
+ Kanten
die gleiche
1 2 K Reihenfolge
der Nachfahren;
!
4 5 #
¼
¼
¼
¼
¼
¼
¼
¼
# " /3 12# ! 9
! (ii) h0 , P 0 , w 0
sind Einschränkungen
von
h, P,
w auf
K 0;
¼
(iii)
1 2# ! ¼ > ¼ > "
U 0 ist#
genau
die
Menge
der%!
in K 0enthaltenen
Informationsbezirke
aus U.
6 =3 ! > 1
2
1
1
2
1
1
und
'( Vorlesung:
>Nicht-kooperative
12
Dr. Thomas Krieger
Spieltheorie
16
Spiele in extensiver Form
Ein Existenzsatz
Ein Spiel in extensiver Form ohne Teilspiel ist das Steuer-Spiel.
Theorem 32
Jedes extensive Spiel (K , h, P, w , U) mit vollkommener
Information, d.h. |A| = 1 für alle A ∈ U, und endlichem Spielbaum
K hat einen Gleichgewichtspunkt in reinen Strategien.
Der Beweis wird z.B. in Burger (1966) oder Rauhut et al.
(1979) geführt.
Welche Gesellschaftspiele erfüllen die Forderung nach
vollkommener Information?
Welche Beziehung besteht zwischen dem Konzept der
perfekten Erinnerung (perfect recall) und dem Konzept der
vollkommener Information?
Dr. Thomas Krieger
Vorlesung: Nicht-kooperative Spieltheorie
und
17
Spiele in extensiver Form
Teilspielperfekte Gleichgewichte (1)
Für extensive Spiele mit vollkommener Information können
Nash-Gleichgewichte in reinen Strategien mittels
Rückwärtsinduktion gefunden werden, vgl. die beiden
Beispiele auf den nächsten beiden Folien:
„Hundertfüsslerspiel“ (strenge Forderung an Rationalität):
Spieltheorie
Jörg Naeve
1
2
1
2
1
!
1
1
!
0
3
!
2
2
!
1
4
3
3
SoSe 2003
1
!
2
1
2
97
!
100
100
!
!
!
!
98
97
99
98
98
100
99
101
Abbildung 3.11: Extensivform des Hundertfüßerspiels
Die mittels Rückwärtsinduktion gefundenen Nash-Gleichge• Im letzten Knoten wird Spielerin 2 Stop“ sagen, weil sie dadurch 101 Euro erhält,
”
wichte
haben die Eigenschaft,
dass deren Einschränkung auf
während sie bei Weiter“ lediglich 100 Euro erhielte.
jedes Teilspiel” auch ein Nash-Gleichgewicht im betrachteten
• In vorletzten Runde antizipiert Spielerin 1, dass Spielerin 2 in der letzten Runde
Teilspiel
ist (daher: teilspielperfekt).
Stop“ sagen wird. Sie bekommt demnach 98 Euro, wenn sie W wählt, aber 99 Euro,
”
Dr. Also
Thomas
Krieger
Vorlesung:
Spieltheorie
wenn sie Stop“ sagt.
wählt
Spielerin
1 in derNicht-kooperative
vorletzten Runde
S.
und
18
Spiele in extensiver Form
Teilspielperfekte Gleichgewichte (2)
Berechnen Sie Nash-Gleichgewichte in reinen Strategien des
abgebildeten extensiven Spiels
durch Rückwärstinduktion und
über die Transformation in Normalform. Was fällt Ihnen auf?
und
Dr. Thomas Krieger
Vorlesung: Nicht-kooperative Spieltheorie
19
Spiele in extensiver Form
Literatur
R. Avenhaus: Vorlesungen über Nicht-kooperative Spieltheorie, Vorlesungsskript,
Universität der Bundeswehr München, Frühjahr 1999.
D. E. Knuth: Fundamental Algorithms. The Art of Computer Programming Vol.
I. Addison-Wesley, Reading Mass., 1968.
R. Selten: Einführung in die Theorie der Spiele mit unvollständiger Information.
Schriften des Vereins für Socialpolitik, Gesellschaft für Wirtschafts- und
Sozialwissenschaften. Neue Folge Bd. 126: Information in der Wirtschaft, 1982,
S. 81–147.
H. W. Kuhn: Extensive games and the problem of information. Annals of Math.
Studies 28, 1953, S. 193–216.
B. Rauhut, N. Schmitz, E.-W. Zachow: Spieltheorie: Einführung in die
mathematische Theorie strategischer Spiele. Teubner-Verlag, Stuttgart, 1979.
E. Burger: Einführung in die Theorie der Spiele. de Gruyter, 1966.
T. Arnold, J. Naeve, U. Schwalbe: Spieltheorie. Vorlesungsskript, Universität
Hohenheim, Sommersemester 2003.
und
Dr. Thomas Krieger
Vorlesung: Nicht-kooperative Spieltheorie
20
Herunterladen