9.4 Teilspiel-perfekte Gleichgewichte

Werbung
1
9.4 Teilspiel-perfekte Gleichgewichte
In diesem Abschnitt werden wir, von einer Variation der Auszahlungsmatrix des
vorangegangenen Abschnitts ausgehend, einige weitere Kritikpunkte an dem CournotModell aufgreifen. Damit werden wir dann quasi automatisch zu dem Selten'schen Konzept
eines Teilspiel-perfekten Gleichgewichts geführt. Wir werden nun davon ausgehen, daß
beide Spieler drei Strategien wählen können: eine hohe Menge (H), eine mittelgroße
Menge (M) oder eine niedrige Menge (N). Die Auszahlungsmatrix sei wie folgt:
Spieler 2
H
M
N
H
(0, 0)
(48, 32)
(72, 36)
M
(32, 48)
(64, 64)
(80, 60)
N
(36, 72)
(60, 80)
(72, 72)
Spieler 1
Vergleicht man die beiden Auszahlungsmatrizen miteinander, so wird man feststellen, daß
die hohe Menge aus der vorangegangenen Matrix jetzt der mittleren Menge entspricht.
Zunächst kann man feststellen, daß (M, M) das eindeutige Nash-Gleichgewicht dieses
Spiels ist.
Wir werden uns nun der Frage widmen, warum - sagen wir - der erste Spieler nicht
erreichen kann, daß er selbst H wählt und sein Gegenspieler N. Dann steht er sich offenbar
besser als im Cournot-Gleichgewicht. Wir werden diese Frage dadurch beantworten, daß
wir zunächst ein Szenario vorstellen, in dem der erste Spieler diese Situation erreichen
kann: Der erste Spieler wählt seine Menge zuerst. Der zweite Spieler beobachtet diese
Wahl und reagiert darauf optimal. Wenn der erste Spieler H wählt, wird der andere Spieler
mit N reagieren. Sie können leicht überprüfen, daß der erste Spieler unter diesen
Umständen tatsächlich H wählt. Damit dies eine rationale Entscheidungssituation abbildet,
haben wir demnach zwei Anforderungen gestellt: (1) Ein Spieler wählt zuerst. (2) Der
zweite Spieler beobachtet, welche Entscheidung der erste Spieler getroffen hat. Reicht dies
aus? Die Antwort ist Nein. Wir brauchen noch die Annahme, daß der erste Spieler seine
Entscheidung nicht mehr revidieren kann. Könnte er dies nämlich tun, dann wäre es für ihn
besser, er würde M wählen. Dann wäre es für den zweiten Spieler lohnend, seine Strategie
ebenfalls auf M zu ändern. Wir müssen also fordern, daß (3) der Spieler, der zuerst wählt,
seine Wahl nicht revidieren kann. Unter diesen Umständen ist es tatsächlich möglich, daß
der erste Spieler eine bessere Position erreicht als im Cournot-Gleichgewicht.
2
Was hat im Cournot-Modell diese Lösung ausgeschlossen? Wir haben dort implizit das
Gegenteil zu den obigen Forderungen angenommen. Zum Zeitpunkt der Festlegung der
Menge weiß keiner der beiden Spieler, welche Menge der jeweils andere Spieler gewählt
hat. Dies ist ja der Grund, warum beide Spieler rationale Erwartungen darüber bilden
müssen, was der Gegenspieler macht. Wenn der erste Spieler als erster wählt und seine
Entscheidung beobachtbar und irreversibel ist, dann braucht der zweite Spieler keine
Erwartung mehr bilden. Die Tatsache, daß der erste Spieler dann unabänderliche Fakten
schaffen kann, verschafft ihm in unserem Beispiel einen Vorteil, der in der
angelsächsischen Literatur first mover advantage genannt wird.
Wenn wir im Cournot-Modell solche möglichen Vorteile des frühen Zuges ausgeschlossen
haben, so hat dies natürlich seine Konsequenzen darauf, welche wirtschaftlichen
Situationen durch dieses Modell sinnvoll abgebildet werden können. Eine Situation, in der
ein Unternehmen einen großen Vorsprung bei der Einführung eines neuen Produktes hat
und frühzeitig Kunden an sich binden kann, gehört offenbar nicht zu diesen Situationen.
Die beispielhafte Situation unserer beiden Marmeladeproduzenten ist jedoch eine solche
Situation. Beachten Sie, daß der zweite Spieler einen Anreiz hat, nicht zu wissen, welche
Mengenentscheidung der erste Spieler trifft. Er wird sich daher auf den Standpunkt stellen,
daß jedes Unternehmen für sich handeln soll und sich ostentativ von dem ersten Spieler
fernhalten. Die Tatsache, daß das erste Unternehmen sich nun darüber Gedanken machen
muß, welche Erwartungen das zweite Unternehmen bildet, verschafft ihm einen Vorteil.
Hier ist natürlich anzunehmen, daß beide Unternehmen gleichzeitig über ihre Mengen
entscheiden, ohne zu wissen, was das jeweils andere Unternehmen macht.
Sicherlich paßt das Cournot-Modell nicht immer. Die Situation, in der ein Unternehmen
irreversible Fakten vor anderen Unternehmen schaffen kann und damit eine dominante
Stellung auf einem Markt erreichen kann, wurde von dem deutschen
Wirtschaftswissenschaftler von Stackelberg zum Anlaß genommen, um eine Modellierung
vorzuschlagen, die dieser Situation Rechnung trägt. Die Lösung (H, N) in dem obigen Spiel
nennt man auch Stackelberg-Gleichgewicht oder Stackelberg-Lösung. Die Formulierung
dieses Spiels mit nur drei möglichen Mengenentscheidungen ist ein Spezialfall. Im
allgemeinen kann man von beliebig teilbaren Mengen ausgehen. In diesem Kontext
bestimmt man die Stackelberg-Lösung wie folgt: Der erste Spieler geht davon aus, daß der
zweite auf seine Strategiewahl optimal reagiert. Mit anderen Worten, er wird sich gemäß
seiner Reaktionsfunktion verhalten. Setzt man die Reaktionsfunktion in die
Gewinnfunktion des ersten Spielers ein und maximiert diese, dann erhält man die
3
Strategieentscheidung des ersten Spielers. Setzt man diese in die Reaktionsfunktion ein, so
erhält man die Entscheidung des zweiten Spielers.
Wir haben eben die Stackelberg-Lösung auch Gleichgewicht genannt. Offenbar ist es aber
nicht das Nash-Gleichgewicht des obigen Spiels. Wenn wir beide vergleichen, ist es
hilfreich, daran zu denken, daß wir für die beiden Lösungen Cournot-Gleichgewicht und
Stackelberg-Lösung verschiedene zeitliche Abläufe und verschiedene Informationsannahmen getroffen haben. Diese erscheinen in der obigen Matrix-Darstellung nicht. Dazu
ist eine andere Beschreibungsform notwendig, die wir nun einführen: die extensive Form
eines Spiels. Darunter muß man sich vorstellen, daß man genau sagt, welcher Spieler zu
welchen Zeitpunkten mit welcher Information welche Entscheidungen trifft. Die extensive
Form wird üblicherweise durch einen Spielbaum dargestellt, der diese Gesichtspunkte
graphisch darstellt. Die Idee wird schnell klar, wenn wir uns das Stackelberg-Spiel in
extensiver Form ansehen:
1
H
M
2
N
2
HM
N
0
0
72 32 64 80 36 60 72
36 48 64 60 72 80 72
48
32
HM
2
N
HM
N
Die umkreisten Punkte dieses Spielbaums heißen Entscheidungsknoten. Die unteren Enden
des Spielbaums heißen Endknoten. Der Baum ist zeitlich immer von oben zu lesen. Der
oberste Entscheidungsknoten entspricht also der zeitlich ersten Entscheidung. In den
kleinen Kreisen stehen die Bezeichnungen der Spieler, die an einem bestimmten
Entscheidungsknoten entscheiden können. In dem Stackelberg-Spiel entscheidet der
Spieler 1 zuerst, dann entscheidet der Spieler 2. Die Verzweigungen des Spielbaums
entsprechen den Entscheidungen der Spieler (Spielzüge) bei ihrem Entscheidungsknoten.
An den Endknoten werden die Auszahlungen angegeben, die durch die Entscheidungen
festgelegt werden. Oben stehen die Auszahlungen an den ersten, unten diejenigen an den
zweiten Spieler.
Dieser extensiven Form kann immer eine Normalform eines Spiels zugeordnet werden.
Die Normalform kennen wir schon: es ist einfach die Beschreibung des Spiels mit den
4
Auszahlungsfunktionen. In dem Spielbaum sind Spielzüge wiedergegeben, aber nicht
unbedingt Strategien. Diese werden jedoch benötigt, wenn die Auszahlungsfunktionen
bestimmt werden sollen. Was ist also hier eine Strategie? Wenn ein Spiel zunächst in
Extensivform - wie oben - angegeben ist, besteht eine Strategie eines Spielers in der
Angabe der vorgesehenen Spielzüge an allen ihm zugeordneten Entscheidungsknoten. Das
heißt in dem obigen Beispiel, daß eine Strategie des zweiten Spielers für drei Situationen
angeben muß, was er tun will: für den Fall, daß Spieler 1 H wählt, daß er M wählt und daß
er N wählt. Mögliche Strategien sind z.B. (M, M, M) - hier wählt er in jedem Fall den Zug
M - oder (N, M, M) - hier wählt er N, falls der Spieler 1 H gewählt hat, und sonst M. Es gibt
für den zweiten Spieler in dieser Situation demnach viel mehr Strategien, als in der
Normalform, die wir oben betrachtet haben. Schon daran sieht man, daß die Normalform
des Stackelberg-Spiels nicht in der obigen Matrix bestehen kann. Da der erste Spieler nur
einen Entscheidungsknoten hat, entsprechen seine Strategien wieder der Entscheidung
zwischen H, M oder N. Die Auszahlungsmatrix, die ja nichts anderes ist als eine spezielle
Darstellung einer Normalform des Stackelberg-Spiels, ist auf der folgenden Seite
dargestellt. Die Zeilen der Tabelle entsprechen den verschiedenen Strategien des zweiten
Spielers, die Spalten den Strategien des ersten Spielers. Die jeweils erste Zahl in den Zellen
bezieht sich auf die Auszahlung an den zweiten Spieler. Überprüfen Sie anhand einiger
Stichproben, ob Sie diese Tabelle nachvollziehen können. Wir werden nun einige spezielle
Strategienkombinationen herausgreifen und nachweisen, daß sie Nash-Gleichgewichte für
dieses Spiel in Normalform sind.
Die Strategie H für den ersten Spieler und die Strategie (N, M, M) für den zweiten Spieler
ist z.B. ein Nash-Gleichgewicht. Gegeben, der erste Spieler wählt H, ist es für den zweiten
Spieler optimal, eine seiner Strategien zu wählen, die mit N beginnen, z.B. die genannte
Strategie. Gegeben, der zweite Spieler wählt diese Strategie, ist es für den ersten Spieler
auch optimal, H zu wählen. Dies entspricht gerade dem Stackelberg-Gleichgewicht. Dieses
ist also kein neues spieltheoretisches Konzept. Sondern es ergibt sich als NashGleichgewicht in der Normalform des Spiels, das den zeitlichen Ablauf des Spiels
wiedergibt.
5
Spieler 1
H
M
N
(H, H, H)
(0, 0)
(48, 32)
(72, 36)
(H, H, M)
(0, 0)
(48, 32)
(80, 60)
(H, H, N)
(0, 0)
(48, 32)
(72, 72)
(H, M, H)
(0, 0)
(64, 64)
(72, 36)
(H, M, M)
(0, 0)
(64, 64)
(80, 60)
(H, M, N)
(0, 0)
(64, 64)
(72, 72)
(H, N, H)
(0, 0)
(60, 80)
(72, 36)
(H, N, M)
(0, 0)
(60, 80)
(80, 60)
(H, N, N)
(0, 0)
(60, 80)
(72, 72)
(M, H, H)
(32, 48)
(48, 32)
(72, 36)
(M, H, M)
(32, 48)
(48, 32)
(80, 60)
(M, H, N)
(32, 48)
(48, 32)
(72, 72)
(M, M, H)
(32, 48)
(64, 64)
(72, 36)
(M, M, M)
(32, 48)
(64, 64)
(80, 60)
(M, M, N)
(32, 48)
(64, 64)
(72, 72)
(M, N, H)
(32, 48)
(60, 80)
(72, 36)
(M, N, M)
(32, 48)
(60, 80)
(80, 60)
(M, N, N)
(32, 48)
(60, 80)
(72, 72)
(N, H, H)
(36, 72)
(48, 32)
(72, 36)
(N, H, M)
(36, 72)
(48, 32)
(80, 60)
(N, H, N)
(36, 72)
(48, 32)
(72, 72)
(N, M, H)
(36, 72)
(64, 64)
(72, 36)
(N, M, M)
(36, 72)
(64, 64)
(80, 60)
(N, M, N)
(36, 72)
(64, 64)
(72, 72)
(N, N, H)
(36, 72)
(60, 80)
(72, 36)
(N, N, M)
(36, 72)
(60, 80)
(80, 60)
(N, N, N)
(36, 72)
(60, 80)
(72, 72)
Spieler 2
Dies ist aber nicht das einzige Nash-Gleichgewicht in diesem Spiel. Hier ist ein weiteres:
Der erste Spieler wählt M und der zweite Spieler wählt immer M: (M, M, M). Dies kann
man schnell überprüfen. An dieser Stelle setzt die Kritik von Selten ein. Diese
Strategienkombination ist zwar ein Nash-Gleichgewicht, aber ihm unterliegt kein
6
besonders rationales Verhalten. Betrachten Sie, wie der erste Spieler dazu gebracht wird, M
zu wählen. Dies geschieht durch die "Drohung", daß der zweite Spieler M spielt, wenn der
erste Spieler H spielt. Diese Drohung ist aber nicht glaubhaft: Wenn nämlich der erste
Spieler H spielt, ist es für den zweiten Spieler rational, N zu spielen. Eine Strategie, die
leere Drohungen enthält, welche für das Ergebnis der Interaktion aber entscheidend sind,
sollten nicht als Ergebnis rationalen Verhaltens angesehen werden. Mit anderen Worten:
nicht jedes Nash-Gleichgewicht entspricht rationalem Verhalten. Wir brauchen eine
Verfeinerung des Konzepts.
Ein solches Konzept liefert das Selten'sche Teilspiel-perfekte Gleichgewicht. Es geht von
der Erkenntnis aus, daß die Normalform den zeitlichen Ablauf des Spiels nicht vollständig
wiedergibt. Es verlangt, daß die Strategien in jedem Teilspiel Gleichgewichtsstrategien
sind. Was heißt nun Teilspiel? In erster Annäherung kann man sagen, daß mit jedem
Entscheidungsknoten ein Teilspiel beginnt. In dem obigen Spielbaum haben wir also
insgeamt 4 Teilspiele. Das gesamte Spiel ist eins. Der Teil des Spielbaums, der bei dem
linken Entscheidungsknoten des Spielers 2 beginnt, ist selbst ein Spielbaum und daher ein
Spiel - eben ein Teilspiel des gesamten Spiels. Dasselbe gilt für den mittleren und den
rechten Entscheidungsknoten des zweiten Spielers.
Was heißt es nun, daß die Strategien in jedem Teilspiel Gleichgewichtsstrategien sein
sollen? I.a. heißt dies, daß die Strategien für jedes Teilspiel ein Nash-Gleichgewicht
darstellen sollen. In unserem Beispiel ist dies ganz einfach. Bei den Teilspielen, die bei den
Entscheidungsknoten von Spieler 2 beginnen, entscheidet nur Spieler 2. Das bedeutet, daß
es in diesem Teilspiel nur einen Spieler gibt. Dann ist die Forderung nach einem NashGleichgewicht äquivalent mit der Forderung, daß der Spieler seine Wahl so treffen soll,
daß seine Auszahlung maximiert wird. Dies legt in unserem Beispiel eindeutig fest, was in
einer Teilspiel-perfekten Strategie des zweiten Spielers steht: Im linken Teilspiel steht er
sich am besten, wenn er N wählt, im mittleren, wenn er M wählt, und im rechten, wenn er
ebenfalls M wählt. Diese Information kann nun der erste Spieler benutzen, um selbst seine
Strategie festzulegen. Daraus folgt die eindeutige Festlegung von H für den ersten Spieler.
Das, was wir oben Stackelberg-Lösung genannt haben, ist also das eindeutige Teilspielperfekte Gleichgewicht des Stackelberg-Spiels.
Kommen wir nun nochmals auf das Cournot-Spiel zurück, das am Anfang dieses
Abschnitts stand. Wir haben schon oben auf die unterschiedlichen Entscheidungsstrukturen
zum Stackelberg-Spiel hingewiesen. Insbesondere wissen die Spieler nicht, was der
7
Gegenspieler machen wird. Wenn wir dies in extensiver Form darstellen wollen, können
wir dies wie folgt tun:
1
H
M
2
HM
N
HM
N
0
0
72 32 64 80 36 60 72
36 48 64 60 72 80 72
48
32
N
HM
N
Der einzige graphische Unterschied zum Spielbaum des Stackelberg-Spiels besteht darin,
daß alle drei Entscheidungsknoten des zweiten Spielers in einer Menge zusammengefaßt
werden. Diese Zusammenfassung soll bedeuten, daß der Spieler 2 zum Zeitpunkt seiner
Entscheidung nicht weiß, in welchem seiner Entscheidungsknoten er sich befindet. Die
Menge der Knoten, die ein Spieler zu einem bestimmten Zeitpunkt nicht unterscheiden
kann, heißt in der Spieltheorie Informationsmenge. Wenn die Informationsmengen der
Spieler - wie in dem Stackelberg-Spiel - nur jeweils ein Element enthalten, sprechen wir
von einem Spiel mit perfekter Information. Die obige Darstellung des Cournot-Spiels ist
ein Spiel mit imperfekter Information. Bei solchen Spielen ist es sinnvoll, den Begriff der
Strategie anzupassen. Allgemein ist eine Strategie die Festlegung der Züge an allen
Informationsmengen des Spielers. Da er innerhalb einer Informationsmenge nichts
unterscheiden kann, kann er pro Informationsmenge auch nur einen Zug festlegen. In dem
obigen Beispiel bedeutet dies, daß sich der zweite Spieler für eine seiner drei Alternativen
entscheiden muß. Die eingangs dargestellte Auszahlungsmatrix ist daher gerade die
Normalform für dieses Spiel.
Auch auf den Begriff des Teilspiels hat die Situation eines Spiels mit imperfekter
Information seine Auswirkungen. Grob gesprochen kann man jetzt sagen, daß jedes
Teilspiel mit einer Informationsmenge beginnt. Umgekehrt ausgedrückt: Von jeder
Informationsmenge aus beginnt ein weiteres Teilspiel. In dem obigen Beispiel haben wir
also nur noch zwei Teilspiele, das gesamte Spiel und das Spiel, das mit der
Informationsmenge des zweiten Spielers beginnt. Diese beiden Spiele sind jedoch von den
Spielern nicht zu unterscheiden. Im Grunde haben wir nur ein Teilspiel, das ganze Spiel.
8
In der Literatur finden sich noch weitere Charakterisierungen der obigen beiden Spiele. Das
Stackelberg-Spiel ist ein Beispiel für ein sequentielles oder dynamisches Spiel. Das
Cournot-Spiel ist ein Beispiel für ein simultanes oder statisches Spiel. Die Begriffsbildung
dürfte einleuchten.
Zum Abschluß dieses Abschnitts wollen wir kurz auf das Preissetzungsverhalten im
Cournot-Modell zurückkommen. Damit kommen wir auch gleichzeitig auf einen
Kritikpunkt am Bertrand-Modell zurück. Als erstes interpretieren wir die Mengen im
Cournot-Modell nicht als Mengen sondern als Kapazitäten. Stellen wir uns vor, daß die
Unternehmen zuerst über die Kapazitäten entscheiden und dann über die Preise, die sie für
ihre Produkte verlangen wollen. Da Kapazitäten Geld kosten, ist es naheliegend, daß sie
keine Überkapazitäten aufbauen wollen. Daher wird im Ergebnis die Outputmenge wieder
mit den Kapazitäten übereinstimmen. Wie aber schon bei der Kritik am Bertrand-Modell
angedeutet wurde, haben die Kapazitäten einen wichtigen Einfluß auf den Preiswettbewerb.
Dies läßt sich in einem zweistufigen Spiel modellieren. In der ersten Stufe entscheiden die
Unternehmen simultan über ihre Kapazitäten. Wenn dies geschehen ist, beobachten die
Unternehmen diese Kapazitäten und entscheiden simultan über die Preise. Dies läßt sich
als Spiel modellieren. Wenn man das Teilspiel-perfekte Gleichgewicht dieses Spiels
bestimmt, ergibt sich, daß die Unternehmen gerade die "Cournot-Mengen" als Kapazitäten
wählen und die Preise genau diejenigen sind, die vom Cournot-Modell vorhergesagt
werden. Dafür müssen natürlich einige Annahmen getroffen werden. Die notwendige
Analyse ist auch viel zu umfangreich, um hier präsentiert zu werden. Die Details findet
man beispielsweise in der Vorlesung "Preistheorie". Hier soll nur festgehalten werden, daß
die Kritik am Cournot-Modell, es könne die Preisgestaltung nicht erklären, nicht fundiert
ist.
Im folgenden werden wir daher das Cournot-Modell weiter benutzen. Auf die weiteren
spieltheoretischen Konzepte werden wir wiederholt zurückgreifen.
Herunterladen