Kapitel 1 Einführung

Werbung
Kapitel 1
Einführung
1.1 Definition und Beispiele strategischer Spiele
1.2 Nash–Gleichgewichte
1.3 Andere Lösungskonzepte
1.4 Klassifikation strategischer Spiele
1.1
Definition und Beispiele strategischer Spiele
Wir beginnen diesen Abschnitt mit der zentralen Definition eines strategischen Spiels.
Definition 1.1 Ein (strategisches) Spiel (in Normalform) wird beschrieben durch
(a) eine Menge {1, . . . , N } von (endlich vielen) Spielern;
(b) Strategiemengen Xν für jeden Spieler ν = 1, . . . , N ;
(c) Auszahlungsfunktionen oder Nutzenfunktionen θν : X → R für jeden Spieler ν =
1, . . . , N , wobei X := X1 × . . . × XN das kartesische Produkt aller Strategiemengen
bezeichnet.
Zur Abkürzung für ein solches Spiel schreiben wir Γ = {θν , Xν }N
ν=1 und bezeichnen Γ auch
als ein N –Personen–Spiel.
In der Literatur findet man häufig eine allgemeinere Definition eines (strategischen) Spiels,
bei der als Bildbereich der Auszahlungsfunktionen nicht notwendig die Menge der reellen
Zahlen steht, vergleiche etwa [35]. Für unsere (und viele andere) Zwecke reicht jedoch die
obige Definition.
Wir illustrieren den Begriff eines Spiels zunächst an einigen (sehr populären) Beispielen.
Beispiel 1.2 ( Gefangenendilemma )
Nach einem Raubüberfall werden zwei Personen 1 und 2 festgenommen, da sie unter dringendem Tatverdacht stehen. Die Polizei trennt beide Personen, damit zwischen diesen
keine Absprachen möglich sind, und macht beiden unabhängig voneinander den folgenden
Vorschlag:
1
2
KAPITEL 1. EINFÜHRUNG
• Wenn einer sich schuldig bekennt und der andere nicht, so erhält der Geständige
als Strafe 1 Jahr Gefängnis aufgrund einer Kronzeugenregelung, während der andere
(Nichtgeständige) dann für 10 Jahre ins Gefängnis kommt.
• Wenn beide gestehen, bekommt jeder 5 Jahre Gefängnis.
• Wenn keiner gesteht, bekommt jeder 2 Jahre Gefängnis wegen illegalen Waffenbesitzes.
Hierbei handelt es sich um ein Spiel im Sinne der Definition 1.1 mit der Menge {1, 2} von
zwei Spielern, den Strategiemengen
X1 := X2 := {S, G} mit S:=schweigen,
G:=gestehen
und den Auszahlungsfunktionen
θ1 : X1 × X2 → R,
θ2 : X1 × X2 → R,
die elementweise definiert sind durch
θ1 (S, S) := 2,
θ1 (S, G) := 10,
θ2 (S, S) := 2,
θ2 (S, G) := 1,
θ1 (G, S) := 1,
θ1 (G, G) := 5
θ2 (G, S) := 10,
θ2 (G, G) := 5.
und
Dies ist die formale Beschreibung des Gefangenendilemmas als ein 2–Personen–Spiel in
Normalform.
3
In dem Beispiel 1.2 traten lediglich 2 Spieler auf und die zugehörigen Strategiemengen waren beide endlich. In einem solchen Fall lassen sich die Auszahlungsfunktionen einfacher in
der Gestalt einer Auszahlungsmatrix angeben, wobei man, je nach Zusammenhang, auch
von einer Gewinn– oder Verlustmatrix spricht. Im Beispiel 1.2 sind die Auszahlungsmatrizen der beiden Spieler gegeben durch:
Auszahlungsmatrix für Spieler 1
Spieler 1
Spieler 2
S G
S 2 10
G 1 5
Auszahlungsmatrix für Spieler 2
Spieler 1
Spieler
S
S 2
G 10
2
G
1
5
Zur Analyse des Spiels: Offenbar ist (S,S) die beste Lösung, denn dann bekämen beide
Spieler nur“ eine Strafe von 2 Jahren. Allerdings dürfen sich die Spieler ja nicht abspre”
chen, daher besteht für jeden Spieler, der die Strategie S wählt, die große Gefahr, dass der
jeweils andere Spieler die Strategie G wählt, um dann nur 1 Jahr Gefängnis zu erhalten,
während der andere 10 Jahre aufgebrummt bekommt. Um dieser Gefahr vorzubeugen, wird
ein strategisch denkender Spieler deshalb die Strategie G wählen, denn dann bekommt er
1.1. DEFINITION UND BEISPIELE STRATEGISCHER SPIELE
3
5 Jahre (statt 10 Jahre) Gefängnis, wenn der andere Spieler gesteht, bzw. 1 Jahr (statt
2 Jahre) Gefängnis, wenn der andere schweigt. Aus analogen Überlegungen heraus wird
der andere Spieler ebenfalls die Strategie G wählen. Beide erhalten somit 5 Jahre aufgebrummt. Dies ist insofern ein Dilemma, als dass sie beide mit nur 2 Jahren davonkommen
könnten, sofern sie sich beide auf die Strategie S einigen würden. Eine Einigung ist aber
nicht möglich, da beide Spieler sich nicht absprechen konnten und man davon ausgehen
muss, dass jeder Spieler selbstsüchtig ist und im Falle der Strategie S die Gegenstrategie
G wählt, um möglichst doch nur 1 Jahr Gefängnis zu erhalten.
Beispiel 1.3 ( Kampf der Geschlechter )
Ein Ehepaar möchte gemeinsam ein Konzert besuchen, allerdings bevorzugt sie ein Konzert
mit Musik von Bach, während er lieber ein Konzert mit Musik von Stravinsky hören
möchte. Bezeichnen wir die Ehefrau als Spieler 1 und den Ehemann als Spieler 2, so haben
beide Spieler die Strategiemengen
X1 := X2 := {Bach, Stravinsky}.
Die Auszahlungsfunktionen θ1 und θ2 ergeben sich aus der nachfolgenden Auszahlungsmatrix:
Spieler 1 (Ehefrau)
Spieler 2 (Ehemann)
Bach Stravinsky
Bach
2, 1
0, 0
Stravinsky 0, 0
1, 2
Die jeweils erste Zahl soll dabei die Bewertung der Ehefrau sein, die zweitgenannte Ziffer die
Bewertung des Mannes. Wir haben die eigentlich zwei Auszahlungsmatrizen somit etwas
kompakter in einer Matrix zusammengefasst.
3
Die Situation im Beispiel 1.3 ist anders als im Beispiel 1.2, denn jetzt können (und wollen)
beide Spieler sich miteinander absprechen (in der Spieltheorie nennt man dies kooperieren). Da man gemeinsam ausgehen will, sind die beiden Strategientupel (Bach, Stravinsky)
und (Stravinsky, Bach) wertlos. Die Bewertungen der beiden Kombinationen (Bach, Bach)
und (Stravinsky, Stravinsky) sind bei Mann und Frau zwar verschieden, in ihrer Summe
allerdings gleich. Daher wird keine dieser beiden Kombinationen bevorzugt. Dass sich das
Ehepaar in der Praxis dann doch meist im Bach–Konzert wiederfindet, liegt letztlich daran, dass der Kampf der Geschlechter (in Patt–Situationen) im Allgemeinen von der Frau
gewonnen wird . . .
Beispiel 1.4 ( Stein, Schere, Papier )
Gegeben seien zwei Spieler 1 und 2, die unabhängig voneinander Stein, Schere oder Papier
wählen. Die Strategiemengen beider Spieler sind also gegeben durch
X1 := X2 := {Stein, Schere, Papier}.
4
KAPITEL 1. EINFÜHRUNG
Es gelten die bekannten Regeln: Das Papier hüllt den Stein ein, der Stein macht die Schere
stumpf, und die Schere wiederum zerschneidet das Papier. Das können wir auch auf die
folgende Weise ausdrücken:
Papier schlägt Stein, Stein schlägt Schere, Schere schlägt Papier.
Gewinnt Spieler 1, so erhält er 1 Euro von Spieler 2, verliert Spieler 1, so zahlt er hingegen
1 Euro an den Gegenspieler. In Patt–Situationen müssen keine Zahlungen erfolgen. Die
Auszahlungsmatrix dieses Spiels lautet daher wie folgt:
Spieler 1
Stein
Schere
Papier
Stein
0, 0
−1, 1
1, −1
Spieler 2
Schere Papier
1, −1
−1, 1
0, 0
1, −1
−1, 1
0, 0
Die Einträge in dieser Matrix haben ansonsten dieselbe Bedeutung wie im vorigen Beispiel.3
Im obigen Spiel gibt es offensichtlich keine Strategie, die garantiert zum Sieg führt. Würde
man hingegen die Wahl des Gegenspielers kennen, so gäbe es stets eine Strategie, die einem
den Sieg einbringt. Ansonsten ist der Gewinn des einen Spielers stets gleich dem Verlust
des anderen, so dass die Summe der Auszahlungsfunktionen θ1 und θ2 stets gleich Null ist.
Wir werden solche Spiele später Nullsummenspiele nennen.
Beispiel 1.5 ( Oligopol–Modell nach Cournot )
Ein gewisses Produkt möge von N Unternehmen produziert werden (wobei der Ökonom
bei einem Oligopol davon ausgeht, dass es sich hierbei um nur wenige Unternehmen handelt, während für den Mathematiker die Zahl N auch groß sein darf). Sei xν die vom ν-ten
Unternehmen hergestellte Menge dieses Produkts. Es seien ferner cν (xν ) die gesamten Kosten, die für
Pdas Unternehmen ν zur Erzeugung von xν Einheiten des Produktes anfallen.
Seien ξ := N
ν=1 xν die insgesamt vom Produkt hergestellte Menge und p(ξ) der Preis pro
Einheit des Produktes, bei dem die Konsumenten gewillt sind, insgesamt ξ Einheiten zu
kaufen (p heißt auch inverse Nachfragefunktion 1 ). Jedes Unternehmen ν wird natürlich
versuchen, seinen Gewinn zu maximieren. Für das Unternehmen ν ergibt sich daher das
Optimierungsproblem
X max xν p xν +
xµ − cν (xν ) u.d.N. xν ≥ 0,
xν
µ6=ν
wobei xµ mit µ 6= ν die Produktionsmengen der Konkurrenzunternehmen bezeichnet. Das
Unternehmen ν besitzt somit die Strategiemenge Xν := [0, +∞) (da nur nichtnegative
1
Die Nachfragefunktion f (p) gibt zu jedem Preis p die gesamte Nachfrage ξ = f (p) des Produktes an.
Nehmen wir f als streng monoton fallend an, was aus ökonomischer Sicht sinnvoll erscheint, so besitzt
f insbesondere eine Inverse p(ξ) := f −1 (ξ). Dies liefert gerade die inverse Nachfragefunktion, die dann
natürlich ebenfalls streng monoton fällt.
1.2. NASH–GLEICHGEWICHTE
5
Stückzahlen produziert werden können) und die Auszahlungsfunktion
θν (x) := xν p xν +
X
µ6=ν
xµ − cν (xν ),
welche gerade die Differenz zwischen den Einnahmen und den Ausgaben (Kosten) angibt.3
Das vorige Beispiel unterscheidet sich von seinen Vorgängern darin, dass die Strategiemengen jetzt nicht mehr endlich sind. Wir werden dies später ein kontinuierliches Spiel nennen.
Die möglichen Auszahlungen lassen sich offenbar nicht mehr in Form einer einfachen Tabelle oder Matrix angeben.
1.2
Nash–Gleichgewichte
Wir haben im vorigen Abschnitt mehrere Beispiele von strategischen Spielen betrachtet
und uns dabei intuitiv klar gemacht, welches wohl die Lösung des gegebenen strategischen
Spiels ist, ohne hierfür einen formalen Lösungsbegriff zur Hand zu haben. Dies soll in diesem
Abschnitt nachgeholt werden. Dabei sei bereits an dieser Stelle erwähnt, dass es eine Reihe
von verschiedenen Lösungsbegriffen gibt. Der bedeutendste seiner Art ist aber sicherlich
der eines Nash–Gleichgewichts, den wir deshalb auch an den Anfang dieses Abschnitts
stellen.
∗
Definition 1.6 Gegeben sei ein strategisches Spiel Γ = {θν , Xν }N
ν=1 . Ein Vektor x =
∗,ν N
∗,ν
(x )ν=1 heißt Nash–Gleichgewicht dieses Spiels, wenn x ∈ Xν und
θν (x∗ ) ≤ θν (x∗,1 , . . . , x∗,ν−1 , xν , x∗,ν+1 , . . . , x∗,N )
∀xν ∈ Xν
(1.1)
und alle ν = 1, . . . , N gilt.
Zur bequemeren Formulierung der Bedingung (1.1) führen wir noch eine neue und in
der Spieltheorie übliche Schreibweise ein: Ist x = (x1 , . . . , xN )T ein gegebener Vektor
mit den Block–Komponenten xν ∈ Xν , ν = 1, . . . , N , und wollen wir die ν-te Block–
Komponente xν besonders hervorheben, so schreiben wir hierfür x = (xν , x−ν )T , wobei
x−ν alle Block–Komponenten xµ mit µ 6= ν enthält. Dann ist (xν , x∗,−ν ) eine abkürzende Bezeichnung für den Vektor (x∗,1 , . . . , x∗,ν−1 , xν , x∗,ν+1 , . . . , x∗,N )T , bei dem die Block–
Komponente x∗,ν durch xν ersetzt wird. In dieser Notation ist x∗ = (x∗,ν )N
ν=1 genau dann
∗,ν
ein Nash–Gleichgewichtspunkt des gegebenen Spiels, wenn x ∈ Xν und
θν (x∗ ) ≤ θν (xν , x∗,−ν ) ∀xν ∈ Xν
und alle ν = 1, . . . , N gelten, wenn x∗,ν also eine Lösung des Optimierungsproblems
min
θν (xν , x∗,−ν ) u.d.N. xν ∈ Xν
ν
x
(1.2)
6
KAPITEL 1. EINFÜHRUNG
für alle ν = 1, . . . , N ist (u.d.N. = unter der Nebenbedingung). Man beachte hierbei, dass
die Zielfunktion θν von der optimalen Strategie aller Mitspieler abhängt und daher im
Allgemeinen nicht explizit bekannt ist.
Das Lösungskonzept von Nash lässt sich auch noch etwas anders formulieren. Sei dazu
x = (x1 , . . . , xN )T ein gegebener Vektor und Sν (x−ν ) die Lösungsmenge des Optimierungsproblems
min
θν (xν , x−ν ) u.d.N. xν ∈ Xν
ν
x
∗
für ν = 1, . . . , N . Dann ist x = (x∗,ν )N
ν=1 offenbar genau dann ein Nash–Gleichgewicht des
gegebenen Spiels, wenn
x∗,ν ∈ Sν (x∗,−ν ) ∀ν = 1, . . . , N
gilt. Wir halten diese Beobachtung formal in dem folgenden Resultat fest.
∗
Satz 1.7 Gegeben sei ein strategisches Spiel Γ = {θν , Xν }N
ν=1 . Dann ist x genau dann ein
∗,ν
∗,−ν
Nash–Gleichgewicht von Γ, wenn x ∈ Sν (x
) für alle ν = 1, . . . , N gilt.
Im Zusammenhang mit dem obigen Resultat ist der nachfolgende Begriff manchmal recht
nützlich.
Definition 1.8 Die Abbildung x−ν 7→ Sν (x−ν ) heißt die Beste–Antwort–Funktion des
Spielers ν. Die hieraus zusammengesetzte Abbildung x 7→ S(x) mit
S(x) := S1 (x−1 ) × . . . × SN (x−N )
wird auch als Beste–Antwort–Funktion des gegebenen Spiels bezeichnet.
Mit diesen Bezeichnungen lässt sich der Satz 1.7 auch so formulieren, dass x∗ genau dann
ein Nash–Gleichgewicht ist, wenn x∗ ∈ S(x∗ ) gilt.
Bemerkung 1.9 Wir haben bislang den Fall betrachtet, dass die Block–Komponenten
x∗,ν eines Nash–Gleichgewichtes die Lösung eines Minimierungsproblems sind, siehe (1.2).
Häufig haben wir es jedoch auch mit Maximierungsproblemen zu tun, vergleiche etwa
Beispiel 1.5. In diesem Fall heißt x∗ natürlich ein Nash–Gleichgewicht des gegebenen Spieles
Γ = {θν , Xν }N
ν=1 , wenn
θν (x∗ ) ≥ θν (xν , x∗,−ν ) ∀xν ∈ Xν
und alle ν = 1, . . . , N gilt. Offenbar ist x∗ genau dann eine Lösung der Minimierungsprobleme
min
θν (xν , x∗,−ν ) u.d.N. xν ∈ Xν
ν
x
∗
für ν = 1, . . . , N , wenn x die Maximierungsprobleme
max
−θν (xν , x∗,−ν ) u.d.N. xν ∈ Xν
ν
x
für ν = 1, . . . , N löst. Durch Ersetzen von θν durch −θν lassen sich alle Ausführungen
und Ergebnisse für Nash–Gleichgewichte in Minimierungsform auf Nash–Gleichgewichte in
Maximierungsform übertragen (und umgekehrt).
1.2. NASH–GLEICHGEWICHTE
7
Die obige Bemerkung ist für unsere weiteren Ausführungen sehr wichtig, da wir häufig
zwischen Nash–Gleichgewichten in Minimierungsform und Nash–Gleichgewichten in Maximierungsform springen werden. Aus dem jeweiligen Zusammenhang ist stets klar, ob wir
nun minimieren oder maximieren wollen. Im Beispiel 1.2 soll die Strafe in Gefängnisjahren natürlich minimiert werden, während im Beispiel 1.5 der Gewinn der Unternehmen zu
maximieren ist.
Wir überprüfen das Lösungskonzept von Nash kurz an den Beispielen des vorigen Abschnitts.
Beispiel 1.10 (a) Das Gefangenendilemma aus dem Beispiel 1.2 besitzt offenbar genau einen Nash–Gleichgewichtspunkt, nämlich die Strategiekombination (G, G), bei
dem beide Spieler gestehen. Dies entspricht gerade der im vorigen Abschnitt intuitiv
herausgearbeiteten Lösung.
(b) Im Kampf der Geschlechter aus dem Beispiel 1.3 gibt es zwei Nash–Gleichgewichte,
nämlich die beiden Strategiekombinationen (Bach, Bach) und (Stravinsky, Stravinsky). Durch das Lösungskonzept von Nash wird keine dieser beiden Strategien bevorzugt (und damit die häufig größere Durchsetzungsfähigkeit der Frau nicht berücksichtigt).
(c) Das Stein–Schere–Papier–Spiel aus dem Beispiel 1.4 schließlich hat gar keinen Nash–
Gleichgewichtspunkt. Dies entspricht genau unserer früheren Beobachtung, dass es
hier keine Lösung gibt.
3
Wir betrachten als Nächstes auch noch ein konkretes Beispiel zum Oligopol–Modell von
Cournot. Da hier nur N = 2 Unternehmen (Spieler) beteiligt sind, spricht man statt von
einem Oligopol meist von einem Duopol.
Beispiel 1.11 ( Duopol–Modell nach Cournot )
Betrachte das Oligopol–Modell aus dem Beispiel 1.5 mit N = 2 Unternehmen, den linearen
Kostenfunktionen cν (xν ) := αxν für ν = 1, 2 (mit einer Konstanten α > 0) und der inversen
Nachfragefunktion
γ − ξ,
falls ξ ≤ γ,
p(ξ) :=
0,
falls ξ ≥ γ,
für eine weitere Konstante γ > α. Damit lautet die zu maximierende Zielfunktion des
Unternehmens 1
x1 (γ − x1 − x2 ) − αx1 , falls x1 + x2 ≤ γ,
θ1 (x1 , x2 ) := x1 p(x1 + x2 ) − c1 (x1 ) =
−αx1 ,
falls x1 + x2 ≥ γ.
Entsprechend lautet die zu maximierende Zielfunktion des Unternehmens 2
x2 (γ − x1 − x2 ) − αx2 , falls x1 + x2 ≤ γ,
θ2 (x1 , x2 ) := x2 p(x1 + x2 ) − c2 (x2 ) =
−αx2 ,
falls x1 + x2 ≥ γ.
8
KAPITEL 1. EINFÜHRUNG
Eine elementare Überlegung zeigt nun, dass die
der beiden Unternehmen bei gegebenem x1 bzw.
Fall x1 + x2 < γ) wie folgt lauten:
1
(γ − α − x2 ),
2
S1 (x2 ) =
0,
und
S2 (x1 ) =
zugehörigen Beste–Antwort–Funktionen
x2 (in dem letztlich nur interessierenden
falls x2 ≤ γ − α,
falls x2 ≥ γ − α
1
(γ
2
− α − x1 ), falls x1 ≤ γ − α,
0,
falls x1 ≥ γ − α
(beachte hierbei, dass die Produktionszahlen x1 , x2 nichtnegativ sein sollen). Nun ist x∗ =
(x∗1 , x∗2 ) genau dann ein Nash–Gleichgewicht, wenn x∗1 ∈ S1 (x∗2 ) und x∗2 ∈ S2 (x∗1 ) gelten. Da
die beiden Beste–Antwort–Funktionen jeweils einelementig sind, ist dies äquivalent zu
1
(γ − α − x∗2 ), falls x∗2 ≤ γ − α,
∗
2
x1 =
0,
falls x∗2 ≥ γ − α
und
x∗2
=
1
(γ
2
− α − x∗1 ), falls x∗1 ≤ γ − α,
0,
falls x∗1 ≥ γ − α.
Eine elementare geometrische
Überlegung zeigt nun (vergleiche die Abbildung 1.1), dass
x∗ := 13 (γ − α), 31 (γ − α) der einzige Nash–Gleichgewichtspunkt im gegebenen Duopol–
Modell ist.
3
γ−α
x2
S1 (x∗2 )
1
(γ
2
x∗
− α)
S2 (x∗1 )
1
(γ
2
− α)
x1
γ−α
Abbildung 1.1: Nash–Gleichgewicht beim Duopol aus dem Beispiel 1.11
Die Nash–Gleichgewichte im Zusammenhang mit dem Oligopol–Modell von Cournot werden in der Literatur oft auch als Cournot–Nash–Gleichgewichte bezeichnet.
Das folgende Resultat beschäftigt sich mit der Äquivalenz von strategischen Spielen.
1.3. ANDERE LÖSUNGSKONZEPTE
9
e N
e
Satz 1.12 Seien Γ = {Xν , θν }N
ν=1 und Γ = {Xν , θν }ν=1 zwei Spiele mit gleicher Zahl an
Spielern und gleichen Strategiemengen derart, dass für die zugehörigen Auszahlungsfunktionen eine Beziehung der Gestalt
θeν (x) = rν θν (x) + ην (x−ν ) ∀ν = 1, . . . , N
(1.3)
mit gewissen Konstanten rν > 0 und gewissen Funktionen ην gilt. Dann sind die beiden
e strategisch äquivalent, d.h. besitzen die gleichen Nash–Gleichgewichte.
Spiele Γ und Γ
Beweis: Sei x∗ ein Nash–Gleichgewicht von Γ. Dann ist x∗ ∈ X1 × . . . × XN und
θν (x∗ ) ≤ θν (xν , x∗,−ν ) ∀xν ∈ Xν
und für alle ν = 1, . . . , N . Dies impliziert aber
θeν (x∗ ) = rν θν (x∗ ) + ην (x∗,−ν ) ≤ rν θν (xν , x∗,−ν ) + ην (x∗,−ν ) = θeν (xν , x∗,−ν ) ∀xν ∈ Xν
e
und für alle ν = 1, . . . , N . Also ist x∗ auch ein Nash–Gleichgewicht von Γ.
e also
Sei umgekehrt x∗ ein Nash–Gleichgewicht von Γ,
θeν (x∗ ) ≤ θeν (xν , x∗,−ν ) ∀xν ∈ Xν
∀ν = 1, . . . , N.
Wegen (1.3) ist dies äquivalent zu
rν θν (x∗ ) + ην (x∗,−ν ) ≤ rν θν (xν , x∗,−ν ) + ην (x∗,−ν ) ∀xν ∈ Xν
∀ν = 1, . . . , N.
Durch geeignetes Kürzen erhalten wir hieraus
θν (x∗ ) ≤ θν (xν , x∗,−ν ) ∀xν ∈ Xν
Also ist x∗ auch ein Nash–Gleichgewicht von Γ.
∀ν = 1, . . . , N.
2
Wegen Satz 1.12 bleibt die Menge der Nash–Gleichgewichte also unverändert, wenn wir
bei einem gegebenen Spiel die Auszahlungsfunktionen θν mit einer positiven Konstanten
multiplizieren oder eine beliebige von xν unabhängige Funktion addieren.
1.3
Andere Lösungskonzepte
Mit dem Nash–Gleichgewicht haben wir das zentrale Lösungskonzept der Spieltheorie kennengelernt. Es gibt allerdings eine Reihe weiterer Lösungsansätze, von denen wir hier zumindest zwei vorstellen wollen.
Bei einem Nash–Gleichgewicht wird die optimale Strategie des Spielers ν so gewählt,
dass er seine eigene Auszahlungsfunktion bei gegebener optimaler Strategie aller Mitspieler minimiert (bzw. maximiert). Kann jeder Spieler seine Strategie hingegen unabhängig
davon wählen, wie sich die übrigen Spieler verhalten, so gelangt man zu dem Begriff eines
Gleichgewichtes in dominanten Strategien.
10
KAPITEL 1. EINFÜHRUNG
Definition 1.13 Gegeben sei ein Spiel Γ = {θν , Xν }N
ν=1 .
(a) Eine Strategie x̄ν ∈ Xν dominiert eine Strategie xν ∈ Xν des Spielers ν, wenn
θν (x̄ν , x−ν ) ≤ θν (xν , x−ν )
für alle x−ν ist.
(b) Eine Strategie x̄ν ∈ Xν heißt dominant für den Spieler ν, wenn sie jede andere
Strategie xν ∈ Xν des Spielers ν dominiert.
(c) Ein Vektor x∗ ∈ X := X1 × . . . × XN heißt Gleichgewicht in dominanten Strategien,
wenn für alle Spieler ν = 1, . . . , N
θν (x∗,ν , x−ν ) ≤ θν (xν , x−ν )
∀(xν , x−ν ) ∈ X
gilt, also x∗,ν für alle Spieler ν = 1, . . . , N dominant ist.
Die obigen Definitionen entsprechen nicht immer jenen aus der Literatur, wo insbesondere
im Teil (a) oft noch zusätzlich verlangt wird, dass die dortige Ungleichung für mindestens
ein x−ν strikt erfüllt ist. Dies wäre dann allerdings nicht mehr konsistent mit dem Teil (c)
der Definition, so dass wir unsere Version hier bevorzugen.
Ist x∗ ein Gleichgewicht in dominanten Strategien und wählt man speziell x−ν = x∗,−ν ,
so gelangt man unmittelbar zu dem folgenden Resultat.
Satz 1.14 Jedes Gleichgewicht in dominanten Strategien ist auch ein Nash–Gleichgewicht.
Die Umkehrung des Satzes 1.14 gilt im Allgemeinen nicht. Tatsächlich ist ein Gleichgewicht
in dominanten Strategien zwar ein sehr schöner Lösungsbegriff, der aber in der Praxis viel
zu stark ist, da ein solches Gleichgewicht nur relativ selten existiert. Beispielsweise besitzt
das Gefangenendilemma aus dem Beispiel 1.2 kein Gleichgewicht in dominanten Strategien.
Dennoch ist der Begriff einer dominierten Strategie in einigen Fällen sinnvoll. So wird
ein Spieler eine dominierte Strategie beispielsweise als wenig sinnvoll erachten und diese
Möglichkeit daher völlig außer Acht lassen. Dies führt auf die so genannte Elimination
dominierter Strategien, mit deren Hilfe man ein strategisches Spiel manchmal sogar lösen
kann. Wir illustrieren die Vorgehensweise an einem Beispiel, wobei man beachte, dass wir
dem Beispiel ein Maximierungsproblem zu Grunde legen.
Beispiel 1.15 ( Elimination dominierter Strategien )
Wir betrachten ein abstraktes Spiel mit zwei Spielern (und zwar in Maximierungsform).
Spieler 1 habe die Strategiemenge X1 := {U, D}, Spieler 2 die Strategiemenge X2 :=
{L, M, R}. Die Auszahlungsmatrix lautet wie folgt:
Spieler 1
U
D
Spieler 2
L
M
R
1, 0 1, 2 0, 1
0, 3 0, 1 2, 0
1.3. ANDERE LÖSUNGSKONZEPTE
11
Beide Spieler mögen rational denken. Dann wird Spieler 2 keinesfalls die Strategie R wählen,
denn diese wird von seiner Strategie M (strikt) dominiert (wegen 2 > 1 und 1 > 2).
Spieler 1 bemerkt dies natürlich ebenfalls. Daher reduziert sich das Spiel auf die folgende
Auszahlungsmatrix:
Spieler 1
Spieler
L
U 1, 0
D 0, 3
2
M
1, 2
0, 1
Hier wird die Strategie D von Spieler 1 aber (strikt) dominiert von der Strategie U (wegen
1 > 0 und 1 > 0). Elimination dieser (strikt) dominierten Strategie liefert die Auszahlungsmatrix:
Spieler 1
Spieler 2
L
M
U 1, 0 1, 2
Jetzt wird die Strategie L von Spieler 2 aber (strikt) dominiert durch die Strategie M
(wegen 2 > 0). Durch sukzessive Elimination (strikt) dominierter Strategien erhalten wir
damit die Lösung (U,M) als einziges Gleichgewicht.
Wir erwähnen als Nächstes zumindest noch ein weiteres Lösungskonzept, das in der spieltheoretischen Literatur manchmal auftritt und aus der mehrkriteriellen Optimierung (Optimierung mit mehreren Zielfunktionen) stammt, vergleiche [7].
∗
Definition 1.16 Gegeben sei ein Spiel Γ = {θν , Xν }N
ν=1 . Dann heißt x ∈ X := X1 × . . . ×
XN ein Pareto–Gleichgewicht, wenn es kein x ∈ X gibt mit
θν (xν , x−ν ) ≤ θν (x∗,ν , x∗,−ν )
∀ν = 1, . . . , N,
so dass für zumindest ein ν ∈ {1, . . . , N } diese Ungleichung strikt ist.
Wir haben also genau dann ein Pareto–Gleichgewicht x∗ vorliegen, wenn dieses durch
keine andere Strategie x ∈ X dominiert werden kann in dem Sinne, dass sie für alle
Spieler zumindest keinen schlechteren Wert der Auszahlungsfunktion als x∗ liefert, und für
mindestens einen Spieler sogar eine echte Verbesserung bringt.
Einen direkten Zusammenhang zwischen Nash– und Pareto–Gleichgewichten gibt es
nicht. Die Schnittmenge dieser beiden Gleichgewichtskonzepte mag leer sein. Im Beispiel
1.2 etwa sind die Strategien (S, S), (S, G) und (G, S) allesamt Pareto–Gleichgewichte, nicht
jedoch das einzige Nash–Gleichgewicht (G, G). Dieses Beispiel deutet allerdings auch an,
dass die Anzahl der Pareto–Gleichgewichte im Allgemeinen sehr viel größer als die Anzahl
der Nash–Gleichgewichte ist. Tatsächlich ist der Begriff eines Pareto–Gleichgewichtes in
der Spieltheorie meist nicht differenziert genug, um als ein brauchbares Lösungskonzept zu
gelten.
12
1.4
KAPITEL 1. EINFÜHRUNG
Klassifikation strategischer Spiele
Wir führen in diesem Abschnitt einige Begriffe ein, die zur Klassifikation von strategischen
Spielen nützlich sind und später bei der Wahl eines geeigneten Lösungsverfahrens eine
gewisse Rolle spielen.
Definition 1.17 Ein Spiel Γ = {θν , Xν }N
ν=1 heißt
(a) endlich, wenn alle Strategiemengen Xν nur endlich viele Elemente enthalten.
(b) abzählbar, wenn mindestens eine Strategiemenge Xν abzählbar viele Elemente enthält.
(c) überabzählbar oder kontinuierlich, wenn mindestens eine Strategiemenge Xν überabzählbar viele Elemente enthält.
Endliche Spiele sind beispielsweise das Gefangenendilemma aus dem Beispiele 1.2, der
Kampf der Geschlechter aus dem Beispiel 1.3 und das Stein–Schere–Papier–Spiel aus dem
Beispiel 1.4. Hingegen ist das Oligopol–Modell nach Cournot aus dem Beispiel 1.5 ein kontinuierliches Spiel. Wir werden uns im Folgenden ausschließlich mit endlichen und kontinuierlichen Spielen auseinandersetzen, wobei letztere den Schwerpunkt unserer Ausführungen
bilden.
Eine andere Klassifikation von strategischen Spielen basiert auf gewissen Eigenschaften
der Auszahlungsfunktionen.
Definition 1.18 Ein Spiel Γ = {θν , Xν }N
ν=1 heißt
(a) Nullsummenspiel, falls
PN
ν=1 θν (x)
= 0 für alle x ∈ X := X1 × . . . × XN gilt.
(b) Konstantsummenspiel, falls eine Konstante c ∈ R existiert mit
alle x ∈ X := X1 × . . . × XN .
PN
ν=1 θν (x)
= c für
(c) Nicht–Nullsummenspiel, wenn es kein Nullsummenspiel ist.
Das Stein–Schere–Papier–Spiel aus dem Beispiel 1.4 ist nach obiger Definition etwa ein
Nullsummenspiel. Alle anderen im Abschnitt 1.1 vorgestellten Beispiele von strategischen
Spielen sind Nicht–Nullsummenspiele.
Konstantsummenspiele können stets auf Nullsummenspiele zurückgeführt werden. Dies
ist der Inhalt des folgenden Resultates.
Lemma 1.19 Jedes Konstantsummenspiel ist strategisch äquivalent zu einem Nullsummenspiel.
Beweis: Sei Γ = {θν , Xν }N
ν=1 ein Konstantsummenspiel. Dann existiert ein c ∈ R mit
P
N
θ
(x)
=
c
für
alle
x
∈
X := X1 × . . . × XN . Definiere nun ein zweites Spiel Γ̃ =
ν=1 ν
1.4. KLASSIFIKATION STRATEGISCHER SPIELE
13
c
{θ̃ν , Xν }N
ν=1 durch θ̃ν (x) := θν (x) − N für ν = 1, . . . , N . Wegen Satz 1.12 ist das Spiel Γ̃
strategisch äquivalent zu dem Konstantsummenspiel Γ. Wegen
N
X
ν=1
θ̃ν (x) =
N
X
ν=1
θν (x) −
c
=c−c=0
N
für alle x ∈ X handelt es sich bei Γ̃ außerdem um ein Nullsummenspiel.
2
Aufgrund des vorigen Resultates braucht man also nur zwischen Nullsummenspielen und
Nicht–Nullsummenspielen zu unterscheiden.
Endliche Spiele mit nur zwei Spielern sind oft von besonderer Bedeutung und erhalten
daher einen eigenen Namen. Sie werden von uns im Kapitel 3 allerdings nur relativ kurz
behandelt.
Definition 1.20
(a) Ein endliches 2–Personen–Nullsummenspiel heißt Matrixspiel.
(b) Ein endliches 2–Personen–Spiel heißt Bi–Matrixspiel.
Wir wollen noch kurz erläutern, warum man von einem Matrix– bzw. Bi–Matrixspiel
spricht. Betrachte dazu zunächst ein endliches 2–Personen–Spiel Γ = {θν , Xν }2ν=1 . Nach
Voraussetzung sind die beiden Strategiemengen X := X1 und Y := X2 endlich, etwa
X = {x1 , . . . , xm } und Y := {y1 , . . . , yn }. Definieren wir dann zwei Matrizen A, B ∈ Rm×n
elementweise durch die Auszahlungen
aij := θ1 (xi , yj ),
bij := θ2 (xi , yj ) ∀i = 1, . . . , m, ∀j = 1, . . . , n,
so kann man die Auszahlungsfunktionen θ1 und θ2 durch die beiden Matrizen A und B
vollständig darstellen. Man benötigt hierzu allerdings im Allgemeinen tatsächlich zwei
Matrizen, weshalb man von einem Bi–Matrix–Spiel spricht. Im Falle eines 2–Personen–
Nullsummenspiels hingegen ist B = −A, so dass man mit nur einer Matrix auskommt
und daher von einem Matrixspiel spricht. Beispiele von Bi–Matrixspielen sind das Gefangenendilemma aus dem Beispiel 1.2 und der Kampf der Geschlechter aus dem Beispiel 1.3,
während es sich bei dem Stein–Schere–Papier–Spiel aus dem Beispiel 1.4 um ein Matrixspiel
handelt (die Summe der Auszahlungen ist stets Null).
Neben den gerade eingeführten Klassifikationsmerkmalen, die für unsere Ausführungen
eine gewisse Rolle spielen, existieren verschiedene weitere Unterscheidungsmöglichkeiten,
die insbesondere dann wichtig werden, wenn man weitere spieltheoretische Themen behandeln möchte, die im Rahmen dieser Ausarbeitung nicht weiter vorkommen. Die folgende
Liste entstammt im Wesentlichen dem Vorlesungsskript [20] und mag bei der Einordnung
der in der Literatur zur Spieltheorie behandelten Probleme sehr hilfreich sein:
• kooperative vs. nicht-kooperative Spiele
Bei den nicht–kooperativen Spielen wird davon ausgegangen, dass die einzelnen Spieler strikt gegeneinander agieren und es keine bindenden Absprachen (Kooperationen)
zwischen den Teilnehmern gibt, wie sie bei den kooperativen Spielen erlaubt sind.
14
KAPITEL 1. EINFÜHRUNG
Zur Sicherung des Wettbewerbs ist das Bundeskartellamt beispielsweise dafür verantwortlich, dass es in gewissen Bereichen (etwa bei den Mineralölkonzernen) keine
Kooperationen (Preisabsprachen) gibt. Ein bekanntes Beispiel einer Kooperation verschiedener beteiligter Personen (Länder) ist das Ölkartell der OPEC, bei der sich alle
Teilnehmerländer auf eine Förderquote einlassen und auf diese verpflichten müssen.
Wir werden in unseren Ausführungen ausschließlich nicht–kooperative Spiele betrachten.
• statische vs. dynamische Spiele
Bei den statischen Spielen wählen alle Spieler ihre Strategien simultan aus. Keinem
Spieler sind die Entscheidungen der Gegenspieler bekannt. Bei den dynamischen Spielen hingegen tritt eine zeitliche Reihenfolge der Spielzüge auf.
Wir werden hier nur statische Spiele untersuchen. Eine wichtige Klasse von dynamischen Spielen sind die so genannten Stackelberg–Spiele. Im Prinzip handelt es
sich bei diesen Stackelberg–Spielen um eine Duopol–Situation, bei der, anders als
im Cournot–Beispiel, ein Unternehmen (der Stackelberg–Führer) zuerst entscheidet
und das andere Unternehmen (der Stackelberg–Folger) erst danach seine Strategie
optimal anpasst.
• One-shot games vs. wiederholte Spiele
One-short games werden genau einmal gespielt, bei den wiederholten Spielen hingegen
kann ein und dasselbe Spiel mehrfach hintereinander gespielt werden. Die Lösung des
wiederholten Spiels muss dabei nicht notwendigerweise einer immer gleichen Abfolge
der Lösung des one-shot games entsprechen (dies würde eine Unterscheidung auch
völlig überflüssig machen), da jetzt Lerneffekte auftreten können, die einen Einfluss
auf die Wahl der möglichen Strategien haben können.
Als Beispiel für einen solchen Lerneffekt betrachten wir den Elfmeter beim Fußballspiel. Nehmen wir an, Miroslav Klose hat schon drei Elfmeter gegen Oliver Kahn
verwandelt. Jeder Schuss möge in die linke Ecke gegangen sein, während Oliver Kahn
sich stets für die rechte Ecke entschieden hatte. Wenn Klose dann erneut zu einem
Elfmeter gegen Kahn antritt, so könnte Kahn aus den bisherigen Abläufen gelernt
haben und sich dieses Mal für die linke Ecke entscheiden.
Wir betrachten hier lediglich one-shot games.
• Spiele mit vollständiger vs. unvollständiger Information
Das hier angesprochene Unterscheidungsmerkmal bezieht sich auf die Informationslage der Spieler. Bei Spielen mit vollständiger Informationen stehen sämtliche relevanten Informationen allen Spielern zur Verfügung. Jeder Spieler kennt die möglichen
Strategien sowie die Auszahlungsfunktionen von allen Mitspielern. Man spricht in diesem Zusammenhang auch von Spielen mit vollkommener Information. Anderenfalls
handelt es sich um eine Spiel mit unvollständiger (unvollkommener) Information.
1.4. KLASSIFIKATION STRATEGISCHER SPIELE
15
Schach ist etwa ein Paradebeispiel für ein Spiel mit vollkommener Information:
Beide Spieler kennen den kompletten bisherigen Spielverlauf und wissen, welche
Zugmöglichkeiten im Augenblick bestehen. Skat hingegen ist ein Spiel mit unvollständiger Information. Zwar weiß man, welche Karten die beteiligten Spieler in jeder
Runde abgelegt haben, jedoch ist die anfängliche Kartenverteilung zufallsbedingt, so
dass man nicht weiß, welche Karten die Mitspieler noch auf der Hand halten.
Bei uns treten ausschließlich Spiele mit vollständiger Information auf.
Herunterladen