1 9.4 Teilspiel-perfekte Gleichgewichte In diesem Abschnitt werden wir, von einer Variation der Auszahlungsmatrix des vorangegangenen Abschnitts ausgehend, einige weitere Kritikpunkte an dem CournotModell aufgreifen. Damit werden wir dann quasi automatisch zu dem Selten'schen Konzept eines Teilspiel-perfekten Gleichgewichts geführt. Wir werden nun davon ausgehen, daß beide Spieler drei Strategien wählen können: eine hohe Menge (H), eine mittelgroße Menge (M) oder eine niedrige Menge (N). Die Auszahlungsmatrix sei wie folgt: Spieler 2 H M N H (0, 0) (48, 32) (72, 36) M (32, 48) (64, 64) (80, 60) N (36, 72) (60, 80) (72, 72) Spieler 1 Vergleicht man die beiden Auszahlungsmatrizen miteinander, so wird man feststellen, daß die hohe Menge aus der vorangegangenen Matrix jetzt der mittleren Menge entspricht. Zunächst kann man feststellen, daß (M, M) das eindeutige Nash-Gleichgewicht dieses Spiels ist. Wir werden uns nun der Frage widmen, warum - sagen wir - der erste Spieler nicht erreichen kann, daß er selbst H wählt und sein Gegenspieler N. Dann steht er sich offenbar besser als im Cournot-Gleichgewicht. Wir werden diese Frage dadurch beantworten, daß wir zunächst ein Szenario vorstellen, in dem der erste Spieler diese Situation erreichen kann: Der erste Spieler wählt seine Menge zuerst. Der zweite Spieler beobachtet diese Wahl und reagiert darauf optimal. Wenn der erste Spieler H wählt, wird der andere Spieler mit N reagieren. Sie können leicht überprüfen, daß der erste Spieler unter diesen Umständen tatsächlich H wählt. Damit dies eine rationale Entscheidungssituation abbildet, haben wir demnach zwei Anforderungen gestellt: (1) Ein Spieler wählt zuerst. (2) Der zweite Spieler beobachtet, welche Entscheidung der erste Spieler getroffen hat. Reicht dies aus? Die Antwort ist Nein. Wir brauchen noch die Annahme, daß der erste Spieler seine Entscheidung nicht mehr revidieren kann. Könnte er dies nämlich tun, dann wäre es für ihn besser, er würde M wählen. Dann wäre es für den zweiten Spieler lohnend, seine Strategie ebenfalls auf M zu ändern. Wir müssen also fordern, daß (3) der Spieler, der zuerst wählt, seine Wahl nicht revidieren kann. Unter diesen Umständen ist es tatsächlich möglich, daß der erste Spieler eine bessere Position erreicht als im Cournot-Gleichgewicht. 2 Was hat im Cournot-Modell diese Lösung ausgeschlossen? Wir haben dort implizit das Gegenteil zu den obigen Forderungen angenommen. Zum Zeitpunkt der Festlegung der Menge weiß keiner der beiden Spieler, welche Menge der jeweils andere Spieler gewählt hat. Dies ist ja der Grund, warum beide Spieler rationale Erwartungen darüber bilden müssen, was der Gegenspieler macht. Wenn der erste Spieler als erster wählt und seine Entscheidung beobachtbar und irreversibel ist, dann braucht der zweite Spieler keine Erwartung mehr bilden. Die Tatsache, daß der erste Spieler dann unabänderliche Fakten schaffen kann, verschafft ihm in unserem Beispiel einen Vorteil, der in der angelsächsischen Literatur first mover advantage genannt wird. Wenn wir im Cournot-Modell solche möglichen Vorteile des frühen Zuges ausgeschlossen haben, so hat dies natürlich seine Konsequenzen darauf, welche wirtschaftlichen Situationen durch dieses Modell sinnvoll abgebildet werden können. Eine Situation, in der ein Unternehmen einen großen Vorsprung bei der Einführung eines neuen Produktes hat und frühzeitig Kunden an sich binden kann, gehört offenbar nicht zu diesen Situationen. Die beispielhafte Situation unserer beiden Marmeladeproduzenten ist jedoch eine solche Situation. Beachten Sie, daß der zweite Spieler einen Anreiz hat, nicht zu wissen, welche Mengenentscheidung der erste Spieler trifft. Er wird sich daher auf den Standpunkt stellen, daß jedes Unternehmen für sich handeln soll und sich ostentativ von dem ersten Spieler fernhalten. Die Tatsache, daß das erste Unternehmen sich nun darüber Gedanken machen muß, welche Erwartungen das zweite Unternehmen bildet, verschafft ihm einen Vorteil. Hier ist natürlich anzunehmen, daß beide Unternehmen gleichzeitig über ihre Mengen entscheiden, ohne zu wissen, was das jeweils andere Unternehmen macht. Sicherlich paßt das Cournot-Modell nicht immer. Die Situation, in der ein Unternehmen irreversible Fakten vor anderen Unternehmen schaffen kann und damit eine dominante Stellung auf einem Markt erreichen kann, wurde von dem deutschen Wirtschaftswissenschaftler von Stackelberg zum Anlaß genommen, um eine Modellierung vorzuschlagen, die dieser Situation Rechnung trägt. Die Lösung (H, N) in dem obigen Spiel nennt man auch Stackelberg-Gleichgewicht oder Stackelberg-Lösung. Die Formulierung dieses Spiels mit nur drei möglichen Mengenentscheidungen ist ein Spezialfall. Im allgemeinen kann man von beliebig teilbaren Mengen ausgehen. In diesem Kontext bestimmt man die Stackelberg-Lösung wie folgt: Der erste Spieler geht davon aus, daß der zweite auf seine Strategiewahl optimal reagiert. Mit anderen Worten, er wird sich gemäß seiner Reaktionsfunktion verhalten. Setzt man die Reaktionsfunktion in die Gewinnfunktion des ersten Spielers ein und maximiert diese, dann erhält man die 3 Strategieentscheidung des ersten Spielers. Setzt man diese in die Reaktionsfunktion ein, so erhält man die Entscheidung des zweiten Spielers. Wir haben eben die Stackelberg-Lösung auch Gleichgewicht genannt. Offenbar ist es aber nicht das Nash-Gleichgewicht des obigen Spiels. Wenn wir beide vergleichen, ist es hilfreich, daran zu denken, daß wir für die beiden Lösungen Cournot-Gleichgewicht und Stackelberg-Lösung verschiedene zeitliche Abläufe und verschiedene Informationsannahmen getroffen haben. Diese erscheinen in der obigen Matrix-Darstellung nicht. Dazu ist eine andere Beschreibungsform notwendig, die wir nun einführen: die extensive Form eines Spiels. Darunter muß man sich vorstellen, daß man genau sagt, welcher Spieler zu welchen Zeitpunkten mit welcher Information welche Entscheidungen trifft. Die extensive Form wird üblicherweise durch einen Spielbaum dargestellt, der diese Gesichtspunkte graphisch darstellt. Die Idee wird schnell klar, wenn wir uns das Stackelberg-Spiel in extensiver Form ansehen: 1 H M 2 N 2 HM N 0 0 72 32 64 80 36 60 72 36 48 64 60 72 80 72 48 32 HM 2 N HM N Die umkreisten Punkte dieses Spielbaums heißen Entscheidungsknoten. Die unteren Enden des Spielbaums heißen Endknoten. Der Baum ist zeitlich immer von oben zu lesen. Der oberste Entscheidungsknoten entspricht also der zeitlich ersten Entscheidung. In den kleinen Kreisen stehen die Bezeichnungen der Spieler, die an einem bestimmten Entscheidungsknoten entscheiden können. In dem Stackelberg-Spiel entscheidet der Spieler 1 zuerst, dann entscheidet der Spieler 2. Die Verzweigungen des Spielbaums entsprechen den Entscheidungen der Spieler (Spielzüge) bei ihrem Entscheidungsknoten. An den Endknoten werden die Auszahlungen angegeben, die durch die Entscheidungen festgelegt werden. Oben stehen die Auszahlungen an den ersten, unten diejenigen an den zweiten Spieler. Dieser extensiven Form kann immer eine Normalform eines Spiels zugeordnet werden. Die Normalform kennen wir schon: es ist einfach die Beschreibung des Spiels mit den 4 Auszahlungsfunktionen. In dem Spielbaum sind Spielzüge wiedergegeben, aber nicht unbedingt Strategien. Diese werden jedoch benötigt, wenn die Auszahlungsfunktionen bestimmt werden sollen. Was ist also hier eine Strategie? Wenn ein Spiel zunächst in Extensivform - wie oben - angegeben ist, besteht eine Strategie eines Spielers in der Angabe der vorgesehenen Spielzüge an allen ihm zugeordneten Entscheidungsknoten. Das heißt in dem obigen Beispiel, daß eine Strategie des zweiten Spielers für drei Situationen angeben muß, was er tun will: für den Fall, daß Spieler 1 H wählt, daß er M wählt und daß er N wählt. Mögliche Strategien sind z.B. (M, M, M) - hier wählt er in jedem Fall den Zug M - oder (N, M, M) - hier wählt er N, falls der Spieler 1 H gewählt hat, und sonst M. Es gibt für den zweiten Spieler in dieser Situation demnach viel mehr Strategien, als in der Normalform, die wir oben betrachtet haben. Schon daran sieht man, daß die Normalform des Stackelberg-Spiels nicht in der obigen Matrix bestehen kann. Da der erste Spieler nur einen Entscheidungsknoten hat, entsprechen seine Strategien wieder der Entscheidung zwischen H, M oder N. Die Auszahlungsmatrix, die ja nichts anderes ist als eine spezielle Darstellung einer Normalform des Stackelberg-Spiels, ist auf der folgenden Seite dargestellt. Die Zeilen der Tabelle entsprechen den verschiedenen Strategien des zweiten Spielers, die Spalten den Strategien des ersten Spielers. Die jeweils erste Zahl in den Zellen bezieht sich auf die Auszahlung an den zweiten Spieler. Überprüfen Sie anhand einiger Stichproben, ob Sie diese Tabelle nachvollziehen können. Wir werden nun einige spezielle Strategienkombinationen herausgreifen und nachweisen, daß sie Nash-Gleichgewichte für dieses Spiel in Normalform sind. Die Strategie H für den ersten Spieler und die Strategie (N, M, M) für den zweiten Spieler ist z.B. ein Nash-Gleichgewicht. Gegeben, der erste Spieler wählt H, ist es für den zweiten Spieler optimal, eine seiner Strategien zu wählen, die mit N beginnen, z.B. die genannte Strategie. Gegeben, der zweite Spieler wählt diese Strategie, ist es für den ersten Spieler auch optimal, H zu wählen. Dies entspricht gerade dem Stackelberg-Gleichgewicht. Dieses ist also kein neues spieltheoretisches Konzept. Sondern es ergibt sich als NashGleichgewicht in der Normalform des Spiels, das den zeitlichen Ablauf des Spiels wiedergibt. 5 Spieler 1 H M N (H, H, H) (0, 0) (48, 32) (72, 36) (H, H, M) (0, 0) (48, 32) (80, 60) (H, H, N) (0, 0) (48, 32) (72, 72) (H, M, H) (0, 0) (64, 64) (72, 36) (H, M, M) (0, 0) (64, 64) (80, 60) (H, M, N) (0, 0) (64, 64) (72, 72) (H, N, H) (0, 0) (60, 80) (72, 36) (H, N, M) (0, 0) (60, 80) (80, 60) (H, N, N) (0, 0) (60, 80) (72, 72) (M, H, H) (32, 48) (48, 32) (72, 36) (M, H, M) (32, 48) (48, 32) (80, 60) (M, H, N) (32, 48) (48, 32) (72, 72) (M, M, H) (32, 48) (64, 64) (72, 36) (M, M, M) (32, 48) (64, 64) (80, 60) (M, M, N) (32, 48) (64, 64) (72, 72) (M, N, H) (32, 48) (60, 80) (72, 36) (M, N, M) (32, 48) (60, 80) (80, 60) (M, N, N) (32, 48) (60, 80) (72, 72) (N, H, H) (36, 72) (48, 32) (72, 36) (N, H, M) (36, 72) (48, 32) (80, 60) (N, H, N) (36, 72) (48, 32) (72, 72) (N, M, H) (36, 72) (64, 64) (72, 36) (N, M, M) (36, 72) (64, 64) (80, 60) (N, M, N) (36, 72) (64, 64) (72, 72) (N, N, H) (36, 72) (60, 80) (72, 36) (N, N, M) (36, 72) (60, 80) (80, 60) (N, N, N) (36, 72) (60, 80) (72, 72) Spieler 2 Dies ist aber nicht das einzige Nash-Gleichgewicht in diesem Spiel. Hier ist ein weiteres: Der erste Spieler wählt M und der zweite Spieler wählt immer M: (M, M, M). Dies kann man schnell überprüfen. An dieser Stelle setzt die Kritik von Selten ein. Diese Strategienkombination ist zwar ein Nash-Gleichgewicht, aber ihm unterliegt kein 6 besonders rationales Verhalten. Betrachten Sie, wie der erste Spieler dazu gebracht wird, M zu wählen. Dies geschieht durch die "Drohung", daß der zweite Spieler M spielt, wenn der erste Spieler H spielt. Diese Drohung ist aber nicht glaubhaft: Wenn nämlich der erste Spieler H spielt, ist es für den zweiten Spieler rational, N zu spielen. Eine Strategie, die leere Drohungen enthält, welche für das Ergebnis der Interaktion aber entscheidend sind, sollten nicht als Ergebnis rationalen Verhaltens angesehen werden. Mit anderen Worten: nicht jedes Nash-Gleichgewicht entspricht rationalem Verhalten. Wir brauchen eine Verfeinerung des Konzepts. Ein solches Konzept liefert das Selten'sche Teilspiel-perfekte Gleichgewicht. Es geht von der Erkenntnis aus, daß die Normalform den zeitlichen Ablauf des Spiels nicht vollständig wiedergibt. Es verlangt, daß die Strategien in jedem Teilspiel Gleichgewichtsstrategien sind. Was heißt nun Teilspiel? In erster Annäherung kann man sagen, daß mit jedem Entscheidungsknoten ein Teilspiel beginnt. In dem obigen Spielbaum haben wir also insgeamt 4 Teilspiele. Das gesamte Spiel ist eins. Der Teil des Spielbaums, der bei dem linken Entscheidungsknoten des Spielers 2 beginnt, ist selbst ein Spielbaum und daher ein Spiel - eben ein Teilspiel des gesamten Spiels. Dasselbe gilt für den mittleren und den rechten Entscheidungsknoten des zweiten Spielers. Was heißt es nun, daß die Strategien in jedem Teilspiel Gleichgewichtsstrategien sein sollen? I.a. heißt dies, daß die Strategien für jedes Teilspiel ein Nash-Gleichgewicht darstellen sollen. In unserem Beispiel ist dies ganz einfach. Bei den Teilspielen, die bei den Entscheidungsknoten von Spieler 2 beginnen, entscheidet nur Spieler 2. Das bedeutet, daß es in diesem Teilspiel nur einen Spieler gibt. Dann ist die Forderung nach einem NashGleichgewicht äquivalent mit der Forderung, daß der Spieler seine Wahl so treffen soll, daß seine Auszahlung maximiert wird. Dies legt in unserem Beispiel eindeutig fest, was in einer Teilspiel-perfekten Strategie des zweiten Spielers steht: Im linken Teilspiel steht er sich am besten, wenn er N wählt, im mittleren, wenn er M wählt, und im rechten, wenn er ebenfalls M wählt. Diese Information kann nun der erste Spieler benutzen, um selbst seine Strategie festzulegen. Daraus folgt die eindeutige Festlegung von H für den ersten Spieler. Das, was wir oben Stackelberg-Lösung genannt haben, ist also das eindeutige Teilspielperfekte Gleichgewicht des Stackelberg-Spiels. Kommen wir nun nochmals auf das Cournot-Spiel zurück, das am Anfang dieses Abschnitts stand. Wir haben schon oben auf die unterschiedlichen Entscheidungsstrukturen zum Stackelberg-Spiel hingewiesen. Insbesondere wissen die Spieler nicht, was der 7 Gegenspieler machen wird. Wenn wir dies in extensiver Form darstellen wollen, können wir dies wie folgt tun: 1 H M 2 HM N HM N 0 0 72 32 64 80 36 60 72 36 48 64 60 72 80 72 48 32 N HM N Der einzige graphische Unterschied zum Spielbaum des Stackelberg-Spiels besteht darin, daß alle drei Entscheidungsknoten des zweiten Spielers in einer Menge zusammengefaßt werden. Diese Zusammenfassung soll bedeuten, daß der Spieler 2 zum Zeitpunkt seiner Entscheidung nicht weiß, in welchem seiner Entscheidungsknoten er sich befindet. Die Menge der Knoten, die ein Spieler zu einem bestimmten Zeitpunkt nicht unterscheiden kann, heißt in der Spieltheorie Informationsmenge. Wenn die Informationsmengen der Spieler - wie in dem Stackelberg-Spiel - nur jeweils ein Element enthalten, sprechen wir von einem Spiel mit perfekter Information. Die obige Darstellung des Cournot-Spiels ist ein Spiel mit imperfekter Information. Bei solchen Spielen ist es sinnvoll, den Begriff der Strategie anzupassen. Allgemein ist eine Strategie die Festlegung der Züge an allen Informationsmengen des Spielers. Da er innerhalb einer Informationsmenge nichts unterscheiden kann, kann er pro Informationsmenge auch nur einen Zug festlegen. In dem obigen Beispiel bedeutet dies, daß sich der zweite Spieler für eine seiner drei Alternativen entscheiden muß. Die eingangs dargestellte Auszahlungsmatrix ist daher gerade die Normalform für dieses Spiel. Auch auf den Begriff des Teilspiels hat die Situation eines Spiels mit imperfekter Information seine Auswirkungen. Grob gesprochen kann man jetzt sagen, daß jedes Teilspiel mit einer Informationsmenge beginnt. Umgekehrt ausgedrückt: Von jeder Informationsmenge aus beginnt ein weiteres Teilspiel. In dem obigen Beispiel haben wir also nur noch zwei Teilspiele, das gesamte Spiel und das Spiel, das mit der Informationsmenge des zweiten Spielers beginnt. Diese beiden Spiele sind jedoch von den Spielern nicht zu unterscheiden. Im Grunde haben wir nur ein Teilspiel, das ganze Spiel. 8 In der Literatur finden sich noch weitere Charakterisierungen der obigen beiden Spiele. Das Stackelberg-Spiel ist ein Beispiel für ein sequentielles oder dynamisches Spiel. Das Cournot-Spiel ist ein Beispiel für ein simultanes oder statisches Spiel. Die Begriffsbildung dürfte einleuchten. Zum Abschluß dieses Abschnitts wollen wir kurz auf das Preissetzungsverhalten im Cournot-Modell zurückkommen. Damit kommen wir auch gleichzeitig auf einen Kritikpunkt am Bertrand-Modell zurück. Als erstes interpretieren wir die Mengen im Cournot-Modell nicht als Mengen sondern als Kapazitäten. Stellen wir uns vor, daß die Unternehmen zuerst über die Kapazitäten entscheiden und dann über die Preise, die sie für ihre Produkte verlangen wollen. Da Kapazitäten Geld kosten, ist es naheliegend, daß sie keine Überkapazitäten aufbauen wollen. Daher wird im Ergebnis die Outputmenge wieder mit den Kapazitäten übereinstimmen. Wie aber schon bei der Kritik am Bertrand-Modell angedeutet wurde, haben die Kapazitäten einen wichtigen Einfluß auf den Preiswettbewerb. Dies läßt sich in einem zweistufigen Spiel modellieren. In der ersten Stufe entscheiden die Unternehmen simultan über ihre Kapazitäten. Wenn dies geschehen ist, beobachten die Unternehmen diese Kapazitäten und entscheiden simultan über die Preise. Dies läßt sich als Spiel modellieren. Wenn man das Teilspiel-perfekte Gleichgewicht dieses Spiels bestimmt, ergibt sich, daß die Unternehmen gerade die "Cournot-Mengen" als Kapazitäten wählen und die Preise genau diejenigen sind, die vom Cournot-Modell vorhergesagt werden. Dafür müssen natürlich einige Annahmen getroffen werden. Die notwendige Analyse ist auch viel zu umfangreich, um hier präsentiert zu werden. Die Details findet man beispielsweise in der Vorlesung "Preistheorie". Hier soll nur festgehalten werden, daß die Kritik am Cournot-Modell, es könne die Preisgestaltung nicht erklären, nicht fundiert ist. Im folgenden werden wir daher das Cournot-Modell weiter benutzen. Auf die weiteren spieltheoretischen Konzepte werden wir wiederholt zurückgreifen.