Kapitel 1 Einführung 1.1 Definition und Beispiele strategischer Spiele 1.2 Nash–Gleichgewichte 1.3 Andere Lösungskonzepte 1.4 Klassifikation strategischer Spiele 1.1 Definition und Beispiele strategischer Spiele Wir beginnen diesen Abschnitt mit der zentralen Definition eines strategischen Spiels. Definition 1.1 Ein (strategisches) Spiel (in Normalform) wird beschrieben durch (a) eine Menge {1, . . . , N } von (endlich vielen) Spielern; (b) Strategiemengen Xν für jeden Spieler ν = 1, . . . , N ; (c) Auszahlungsfunktionen oder Nutzenfunktionen θν : X → R für jeden Spieler ν = 1, . . . , N , wobei X := X1 × . . . × XN das kartesische Produkt aller Strategiemengen bezeichnet. Zur Abkürzung für ein solches Spiel schreiben wir Γ = {θν , Xν }N ν=1 und bezeichnen Γ auch als ein N –Personen–Spiel. In der Literatur findet man häufig eine allgemeinere Definition eines (strategischen) Spiels, bei der als Bildbereich der Auszahlungsfunktionen nicht notwendig die Menge der reellen Zahlen steht, vergleiche etwa [35]. Für unsere (und viele andere) Zwecke reicht jedoch die obige Definition. Wir illustrieren den Begriff eines Spiels zunächst an einigen (sehr populären) Beispielen. Beispiel 1.2 ( Gefangenendilemma ) Nach einem Raubüberfall werden zwei Personen 1 und 2 festgenommen, da sie unter dringendem Tatverdacht stehen. Die Polizei trennt beide Personen, damit zwischen diesen keine Absprachen möglich sind, und macht beiden unabhängig voneinander den folgenden Vorschlag: 1 2 KAPITEL 1. EINFÜHRUNG • Wenn einer sich schuldig bekennt und der andere nicht, so erhält der Geständige als Strafe 1 Jahr Gefängnis aufgrund einer Kronzeugenregelung, während der andere (Nichtgeständige) dann für 10 Jahre ins Gefängnis kommt. • Wenn beide gestehen, bekommt jeder 5 Jahre Gefängnis. • Wenn keiner gesteht, bekommt jeder 2 Jahre Gefängnis wegen illegalen Waffenbesitzes. Hierbei handelt es sich um ein Spiel im Sinne der Definition 1.1 mit der Menge {1, 2} von zwei Spielern, den Strategiemengen X1 := X2 := {S, G} mit S:=schweigen, G:=gestehen und den Auszahlungsfunktionen θ1 : X1 × X2 → R, θ2 : X1 × X2 → R, die elementweise definiert sind durch θ1 (S, S) := 2, θ1 (S, G) := 10, θ2 (S, S) := 2, θ2 (S, G) := 1, θ1 (G, S) := 1, θ1 (G, G) := 5 θ2 (G, S) := 10, θ2 (G, G) := 5. und Dies ist die formale Beschreibung des Gefangenendilemmas als ein 2–Personen–Spiel in Normalform. 3 In dem Beispiel 1.2 traten lediglich 2 Spieler auf und die zugehörigen Strategiemengen waren beide endlich. In einem solchen Fall lassen sich die Auszahlungsfunktionen einfacher in der Gestalt einer Auszahlungsmatrix angeben, wobei man, je nach Zusammenhang, auch von einer Gewinn– oder Verlustmatrix spricht. Im Beispiel 1.2 sind die Auszahlungsmatrizen der beiden Spieler gegeben durch: Auszahlungsmatrix für Spieler 1 Spieler 1 Spieler 2 S G S 2 10 G 1 5 Auszahlungsmatrix für Spieler 2 Spieler 1 Spieler S S 2 G 10 2 G 1 5 Zur Analyse des Spiels: Offenbar ist (S,S) die beste Lösung, denn dann bekämen beide Spieler nur“ eine Strafe von 2 Jahren. Allerdings dürfen sich die Spieler ja nicht abspre” chen, daher besteht für jeden Spieler, der die Strategie S wählt, die große Gefahr, dass der jeweils andere Spieler die Strategie G wählt, um dann nur 1 Jahr Gefängnis zu erhalten, während der andere 10 Jahre aufgebrummt bekommt. Um dieser Gefahr vorzubeugen, wird ein strategisch denkender Spieler deshalb die Strategie G wählen, denn dann bekommt er 1.1. DEFINITION UND BEISPIELE STRATEGISCHER SPIELE 3 5 Jahre (statt 10 Jahre) Gefängnis, wenn der andere Spieler gesteht, bzw. 1 Jahr (statt 2 Jahre) Gefängnis, wenn der andere schweigt. Aus analogen Überlegungen heraus wird der andere Spieler ebenfalls die Strategie G wählen. Beide erhalten somit 5 Jahre aufgebrummt. Dies ist insofern ein Dilemma, als dass sie beide mit nur 2 Jahren davonkommen könnten, sofern sie sich beide auf die Strategie S einigen würden. Eine Einigung ist aber nicht möglich, da beide Spieler sich nicht absprechen konnten und man davon ausgehen muss, dass jeder Spieler selbstsüchtig ist und im Falle der Strategie S die Gegenstrategie G wählt, um möglichst doch nur 1 Jahr Gefängnis zu erhalten. Beispiel 1.3 ( Kampf der Geschlechter ) Ein Ehepaar möchte gemeinsam ein Konzert besuchen, allerdings bevorzugt sie ein Konzert mit Musik von Bach, während er lieber ein Konzert mit Musik von Stravinsky hören möchte. Bezeichnen wir die Ehefrau als Spieler 1 und den Ehemann als Spieler 2, so haben beide Spieler die Strategiemengen X1 := X2 := {Bach, Stravinsky}. Die Auszahlungsfunktionen θ1 und θ2 ergeben sich aus der nachfolgenden Auszahlungsmatrix: Spieler 1 (Ehefrau) Spieler 2 (Ehemann) Bach Stravinsky Bach 2, 1 0, 0 Stravinsky 0, 0 1, 2 Die jeweils erste Zahl soll dabei die Bewertung der Ehefrau sein, die zweitgenannte Ziffer die Bewertung des Mannes. Wir haben die eigentlich zwei Auszahlungsmatrizen somit etwas kompakter in einer Matrix zusammengefasst. 3 Die Situation im Beispiel 1.3 ist anders als im Beispiel 1.2, denn jetzt können (und wollen) beide Spieler sich miteinander absprechen (in der Spieltheorie nennt man dies kooperieren). Da man gemeinsam ausgehen will, sind die beiden Strategientupel (Bach, Stravinsky) und (Stravinsky, Bach) wertlos. Die Bewertungen der beiden Kombinationen (Bach, Bach) und (Stravinsky, Stravinsky) sind bei Mann und Frau zwar verschieden, in ihrer Summe allerdings gleich. Daher wird keine dieser beiden Kombinationen bevorzugt. Dass sich das Ehepaar in der Praxis dann doch meist im Bach–Konzert wiederfindet, liegt letztlich daran, dass der Kampf der Geschlechter (in Patt–Situationen) im Allgemeinen von der Frau gewonnen wird . . . Beispiel 1.4 ( Stein, Schere, Papier ) Gegeben seien zwei Spieler 1 und 2, die unabhängig voneinander Stein, Schere oder Papier wählen. Die Strategiemengen beider Spieler sind also gegeben durch X1 := X2 := {Stein, Schere, Papier}. 4 KAPITEL 1. EINFÜHRUNG Es gelten die bekannten Regeln: Das Papier hüllt den Stein ein, der Stein macht die Schere stumpf, und die Schere wiederum zerschneidet das Papier. Das können wir auch auf die folgende Weise ausdrücken: Papier schlägt Stein, Stein schlägt Schere, Schere schlägt Papier. Gewinnt Spieler 1, so erhält er 1 Euro von Spieler 2, verliert Spieler 1, so zahlt er hingegen 1 Euro an den Gegenspieler. In Patt–Situationen müssen keine Zahlungen erfolgen. Die Auszahlungsmatrix dieses Spiels lautet daher wie folgt: Spieler 1 Stein Schere Papier Stein 0, 0 −1, 1 1, −1 Spieler 2 Schere Papier 1, −1 −1, 1 0, 0 1, −1 −1, 1 0, 0 Die Einträge in dieser Matrix haben ansonsten dieselbe Bedeutung wie im vorigen Beispiel.3 Im obigen Spiel gibt es offensichtlich keine Strategie, die garantiert zum Sieg führt. Würde man hingegen die Wahl des Gegenspielers kennen, so gäbe es stets eine Strategie, die einem den Sieg einbringt. Ansonsten ist der Gewinn des einen Spielers stets gleich dem Verlust des anderen, so dass die Summe der Auszahlungsfunktionen θ1 und θ2 stets gleich Null ist. Wir werden solche Spiele später Nullsummenspiele nennen. Beispiel 1.5 ( Oligopol–Modell nach Cournot ) Ein gewisses Produkt möge von N Unternehmen produziert werden (wobei der Ökonom bei einem Oligopol davon ausgeht, dass es sich hierbei um nur wenige Unternehmen handelt, während für den Mathematiker die Zahl N auch groß sein darf). Sei xν die vom ν-ten Unternehmen hergestellte Menge dieses Produkts. Es seien ferner cν (xν ) die gesamten Kosten, die für Pdas Unternehmen ν zur Erzeugung von xν Einheiten des Produktes anfallen. Seien ξ := N ν=1 xν die insgesamt vom Produkt hergestellte Menge und p(ξ) der Preis pro Einheit des Produktes, bei dem die Konsumenten gewillt sind, insgesamt ξ Einheiten zu kaufen (p heißt auch inverse Nachfragefunktion 1 ). Jedes Unternehmen ν wird natürlich versuchen, seinen Gewinn zu maximieren. Für das Unternehmen ν ergibt sich daher das Optimierungsproblem X max xν p xν + xµ − cν (xν ) u.d.N. xν ≥ 0, xν µ6=ν wobei xµ mit µ 6= ν die Produktionsmengen der Konkurrenzunternehmen bezeichnet. Das Unternehmen ν besitzt somit die Strategiemenge Xν := [0, +∞) (da nur nichtnegative 1 Die Nachfragefunktion f (p) gibt zu jedem Preis p die gesamte Nachfrage ξ = f (p) des Produktes an. Nehmen wir f als streng monoton fallend an, was aus ökonomischer Sicht sinnvoll erscheint, so besitzt f insbesondere eine Inverse p(ξ) := f −1 (ξ). Dies liefert gerade die inverse Nachfragefunktion, die dann natürlich ebenfalls streng monoton fällt. 1.2. NASH–GLEICHGEWICHTE 5 Stückzahlen produziert werden können) und die Auszahlungsfunktion θν (x) := xν p xν + X µ6=ν xµ − cν (xν ), welche gerade die Differenz zwischen den Einnahmen und den Ausgaben (Kosten) angibt.3 Das vorige Beispiel unterscheidet sich von seinen Vorgängern darin, dass die Strategiemengen jetzt nicht mehr endlich sind. Wir werden dies später ein kontinuierliches Spiel nennen. Die möglichen Auszahlungen lassen sich offenbar nicht mehr in Form einer einfachen Tabelle oder Matrix angeben. 1.2 Nash–Gleichgewichte Wir haben im vorigen Abschnitt mehrere Beispiele von strategischen Spielen betrachtet und uns dabei intuitiv klar gemacht, welches wohl die Lösung des gegebenen strategischen Spiels ist, ohne hierfür einen formalen Lösungsbegriff zur Hand zu haben. Dies soll in diesem Abschnitt nachgeholt werden. Dabei sei bereits an dieser Stelle erwähnt, dass es eine Reihe von verschiedenen Lösungsbegriffen gibt. Der bedeutendste seiner Art ist aber sicherlich der eines Nash–Gleichgewichts, den wir deshalb auch an den Anfang dieses Abschnitts stellen. ∗ Definition 1.6 Gegeben sei ein strategisches Spiel Γ = {θν , Xν }N ν=1 . Ein Vektor x = ∗,ν N ∗,ν (x )ν=1 heißt Nash–Gleichgewicht dieses Spiels, wenn x ∈ Xν und θν (x∗ ) ≤ θν (x∗,1 , . . . , x∗,ν−1 , xν , x∗,ν+1 , . . . , x∗,N ) ∀xν ∈ Xν (1.1) und alle ν = 1, . . . , N gilt. Zur bequemeren Formulierung der Bedingung (1.1) führen wir noch eine neue und in der Spieltheorie übliche Schreibweise ein: Ist x = (x1 , . . . , xN )T ein gegebener Vektor mit den Block–Komponenten xν ∈ Xν , ν = 1, . . . , N , und wollen wir die ν-te Block– Komponente xν besonders hervorheben, so schreiben wir hierfür x = (xν , x−ν )T , wobei x−ν alle Block–Komponenten xµ mit µ 6= ν enthält. Dann ist (xν , x∗,−ν ) eine abkürzende Bezeichnung für den Vektor (x∗,1 , . . . , x∗,ν−1 , xν , x∗,ν+1 , . . . , x∗,N )T , bei dem die Block– Komponente x∗,ν durch xν ersetzt wird. In dieser Notation ist x∗ = (x∗,ν )N ν=1 genau dann ∗,ν ein Nash–Gleichgewichtspunkt des gegebenen Spiels, wenn x ∈ Xν und θν (x∗ ) ≤ θν (xν , x∗,−ν ) ∀xν ∈ Xν und alle ν = 1, . . . , N gelten, wenn x∗,ν also eine Lösung des Optimierungsproblems min θν (xν , x∗,−ν ) u.d.N. xν ∈ Xν ν x (1.2) 6 KAPITEL 1. EINFÜHRUNG für alle ν = 1, . . . , N ist (u.d.N. = unter der Nebenbedingung). Man beachte hierbei, dass die Zielfunktion θν von der optimalen Strategie aller Mitspieler abhängt und daher im Allgemeinen nicht explizit bekannt ist. Das Lösungskonzept von Nash lässt sich auch noch etwas anders formulieren. Sei dazu x = (x1 , . . . , xN )T ein gegebener Vektor und Sν (x−ν ) die Lösungsmenge des Optimierungsproblems min θν (xν , x−ν ) u.d.N. xν ∈ Xν ν x ∗ für ν = 1, . . . , N . Dann ist x = (x∗,ν )N ν=1 offenbar genau dann ein Nash–Gleichgewicht des gegebenen Spiels, wenn x∗,ν ∈ Sν (x∗,−ν ) ∀ν = 1, . . . , N gilt. Wir halten diese Beobachtung formal in dem folgenden Resultat fest. ∗ Satz 1.7 Gegeben sei ein strategisches Spiel Γ = {θν , Xν }N ν=1 . Dann ist x genau dann ein ∗,ν ∗,−ν Nash–Gleichgewicht von Γ, wenn x ∈ Sν (x ) für alle ν = 1, . . . , N gilt. Im Zusammenhang mit dem obigen Resultat ist der nachfolgende Begriff manchmal recht nützlich. Definition 1.8 Die Abbildung x−ν 7→ Sν (x−ν ) heißt die Beste–Antwort–Funktion des Spielers ν. Die hieraus zusammengesetzte Abbildung x 7→ S(x) mit S(x) := S1 (x−1 ) × . . . × SN (x−N ) wird auch als Beste–Antwort–Funktion des gegebenen Spiels bezeichnet. Mit diesen Bezeichnungen lässt sich der Satz 1.7 auch so formulieren, dass x∗ genau dann ein Nash–Gleichgewicht ist, wenn x∗ ∈ S(x∗ ) gilt. Bemerkung 1.9 Wir haben bislang den Fall betrachtet, dass die Block–Komponenten x∗,ν eines Nash–Gleichgewichtes die Lösung eines Minimierungsproblems sind, siehe (1.2). Häufig haben wir es jedoch auch mit Maximierungsproblemen zu tun, vergleiche etwa Beispiel 1.5. In diesem Fall heißt x∗ natürlich ein Nash–Gleichgewicht des gegebenen Spieles Γ = {θν , Xν }N ν=1 , wenn θν (x∗ ) ≥ θν (xν , x∗,−ν ) ∀xν ∈ Xν und alle ν = 1, . . . , N gilt. Offenbar ist x∗ genau dann eine Lösung der Minimierungsprobleme min θν (xν , x∗,−ν ) u.d.N. xν ∈ Xν ν x ∗ für ν = 1, . . . , N , wenn x die Maximierungsprobleme max −θν (xν , x∗,−ν ) u.d.N. xν ∈ Xν ν x für ν = 1, . . . , N löst. Durch Ersetzen von θν durch −θν lassen sich alle Ausführungen und Ergebnisse für Nash–Gleichgewichte in Minimierungsform auf Nash–Gleichgewichte in Maximierungsform übertragen (und umgekehrt). 1.2. NASH–GLEICHGEWICHTE 7 Die obige Bemerkung ist für unsere weiteren Ausführungen sehr wichtig, da wir häufig zwischen Nash–Gleichgewichten in Minimierungsform und Nash–Gleichgewichten in Maximierungsform springen werden. Aus dem jeweiligen Zusammenhang ist stets klar, ob wir nun minimieren oder maximieren wollen. Im Beispiel 1.2 soll die Strafe in Gefängnisjahren natürlich minimiert werden, während im Beispiel 1.5 der Gewinn der Unternehmen zu maximieren ist. Wir überprüfen das Lösungskonzept von Nash kurz an den Beispielen des vorigen Abschnitts. Beispiel 1.10 (a) Das Gefangenendilemma aus dem Beispiel 1.2 besitzt offenbar genau einen Nash–Gleichgewichtspunkt, nämlich die Strategiekombination (G, G), bei dem beide Spieler gestehen. Dies entspricht gerade der im vorigen Abschnitt intuitiv herausgearbeiteten Lösung. (b) Im Kampf der Geschlechter aus dem Beispiel 1.3 gibt es zwei Nash–Gleichgewichte, nämlich die beiden Strategiekombinationen (Bach, Bach) und (Stravinsky, Stravinsky). Durch das Lösungskonzept von Nash wird keine dieser beiden Strategien bevorzugt (und damit die häufig größere Durchsetzungsfähigkeit der Frau nicht berücksichtigt). (c) Das Stein–Schere–Papier–Spiel aus dem Beispiel 1.4 schließlich hat gar keinen Nash– Gleichgewichtspunkt. Dies entspricht genau unserer früheren Beobachtung, dass es hier keine Lösung gibt. 3 Wir betrachten als Nächstes auch noch ein konkretes Beispiel zum Oligopol–Modell von Cournot. Da hier nur N = 2 Unternehmen (Spieler) beteiligt sind, spricht man statt von einem Oligopol meist von einem Duopol. Beispiel 1.11 ( Duopol–Modell nach Cournot ) Betrachte das Oligopol–Modell aus dem Beispiel 1.5 mit N = 2 Unternehmen, den linearen Kostenfunktionen cν (xν ) := αxν für ν = 1, 2 (mit einer Konstanten α > 0) und der inversen Nachfragefunktion γ − ξ, falls ξ ≤ γ, p(ξ) := 0, falls ξ ≥ γ, für eine weitere Konstante γ > α. Damit lautet die zu maximierende Zielfunktion des Unternehmens 1 x1 (γ − x1 − x2 ) − αx1 , falls x1 + x2 ≤ γ, θ1 (x1 , x2 ) := x1 p(x1 + x2 ) − c1 (x1 ) = −αx1 , falls x1 + x2 ≥ γ. Entsprechend lautet die zu maximierende Zielfunktion des Unternehmens 2 x2 (γ − x1 − x2 ) − αx2 , falls x1 + x2 ≤ γ, θ2 (x1 , x2 ) := x2 p(x1 + x2 ) − c2 (x2 ) = −αx2 , falls x1 + x2 ≥ γ. 8 KAPITEL 1. EINFÜHRUNG Eine elementare Überlegung zeigt nun, dass die der beiden Unternehmen bei gegebenem x1 bzw. Fall x1 + x2 < γ) wie folgt lauten: 1 (γ − α − x2 ), 2 S1 (x2 ) = 0, und S2 (x1 ) = zugehörigen Beste–Antwort–Funktionen x2 (in dem letztlich nur interessierenden falls x2 ≤ γ − α, falls x2 ≥ γ − α 1 (γ 2 − α − x1 ), falls x1 ≤ γ − α, 0, falls x1 ≥ γ − α (beachte hierbei, dass die Produktionszahlen x1 , x2 nichtnegativ sein sollen). Nun ist x∗ = (x∗1 , x∗2 ) genau dann ein Nash–Gleichgewicht, wenn x∗1 ∈ S1 (x∗2 ) und x∗2 ∈ S2 (x∗1 ) gelten. Da die beiden Beste–Antwort–Funktionen jeweils einelementig sind, ist dies äquivalent zu 1 (γ − α − x∗2 ), falls x∗2 ≤ γ − α, ∗ 2 x1 = 0, falls x∗2 ≥ γ − α und x∗2 = 1 (γ 2 − α − x∗1 ), falls x∗1 ≤ γ − α, 0, falls x∗1 ≥ γ − α. Eine elementare geometrische Überlegung zeigt nun (vergleiche die Abbildung 1.1), dass x∗ := 13 (γ − α), 31 (γ − α) der einzige Nash–Gleichgewichtspunkt im gegebenen Duopol– Modell ist. 3 γ−α x2 S1 (x∗2 ) 1 (γ 2 x∗ − α) S2 (x∗1 ) 1 (γ 2 − α) x1 γ−α Abbildung 1.1: Nash–Gleichgewicht beim Duopol aus dem Beispiel 1.11 Die Nash–Gleichgewichte im Zusammenhang mit dem Oligopol–Modell von Cournot werden in der Literatur oft auch als Cournot–Nash–Gleichgewichte bezeichnet. Das folgende Resultat beschäftigt sich mit der Äquivalenz von strategischen Spielen. 1.3. ANDERE LÖSUNGSKONZEPTE 9 e N e Satz 1.12 Seien Γ = {Xν , θν }N ν=1 und Γ = {Xν , θν }ν=1 zwei Spiele mit gleicher Zahl an Spielern und gleichen Strategiemengen derart, dass für die zugehörigen Auszahlungsfunktionen eine Beziehung der Gestalt θeν (x) = rν θν (x) + ην (x−ν ) ∀ν = 1, . . . , N (1.3) mit gewissen Konstanten rν > 0 und gewissen Funktionen ην gilt. Dann sind die beiden e strategisch äquivalent, d.h. besitzen die gleichen Nash–Gleichgewichte. Spiele Γ und Γ Beweis: Sei x∗ ein Nash–Gleichgewicht von Γ. Dann ist x∗ ∈ X1 × . . . × XN und θν (x∗ ) ≤ θν (xν , x∗,−ν ) ∀xν ∈ Xν und für alle ν = 1, . . . , N . Dies impliziert aber θeν (x∗ ) = rν θν (x∗ ) + ην (x∗,−ν ) ≤ rν θν (xν , x∗,−ν ) + ην (x∗,−ν ) = θeν (xν , x∗,−ν ) ∀xν ∈ Xν e und für alle ν = 1, . . . , N . Also ist x∗ auch ein Nash–Gleichgewicht von Γ. e also Sei umgekehrt x∗ ein Nash–Gleichgewicht von Γ, θeν (x∗ ) ≤ θeν (xν , x∗,−ν ) ∀xν ∈ Xν ∀ν = 1, . . . , N. Wegen (1.3) ist dies äquivalent zu rν θν (x∗ ) + ην (x∗,−ν ) ≤ rν θν (xν , x∗,−ν ) + ην (x∗,−ν ) ∀xν ∈ Xν ∀ν = 1, . . . , N. Durch geeignetes Kürzen erhalten wir hieraus θν (x∗ ) ≤ θν (xν , x∗,−ν ) ∀xν ∈ Xν Also ist x∗ auch ein Nash–Gleichgewicht von Γ. ∀ν = 1, . . . , N. 2 Wegen Satz 1.12 bleibt die Menge der Nash–Gleichgewichte also unverändert, wenn wir bei einem gegebenen Spiel die Auszahlungsfunktionen θν mit einer positiven Konstanten multiplizieren oder eine beliebige von xν unabhängige Funktion addieren. 1.3 Andere Lösungskonzepte Mit dem Nash–Gleichgewicht haben wir das zentrale Lösungskonzept der Spieltheorie kennengelernt. Es gibt allerdings eine Reihe weiterer Lösungsansätze, von denen wir hier zumindest zwei vorstellen wollen. Bei einem Nash–Gleichgewicht wird die optimale Strategie des Spielers ν so gewählt, dass er seine eigene Auszahlungsfunktion bei gegebener optimaler Strategie aller Mitspieler minimiert (bzw. maximiert). Kann jeder Spieler seine Strategie hingegen unabhängig davon wählen, wie sich die übrigen Spieler verhalten, so gelangt man zu dem Begriff eines Gleichgewichtes in dominanten Strategien. 10 KAPITEL 1. EINFÜHRUNG Definition 1.13 Gegeben sei ein Spiel Γ = {θν , Xν }N ν=1 . (a) Eine Strategie x̄ν ∈ Xν dominiert eine Strategie xν ∈ Xν des Spielers ν, wenn θν (x̄ν , x−ν ) ≤ θν (xν , x−ν ) für alle x−ν ist. (b) Eine Strategie x̄ν ∈ Xν heißt dominant für den Spieler ν, wenn sie jede andere Strategie xν ∈ Xν des Spielers ν dominiert. (c) Ein Vektor x∗ ∈ X := X1 × . . . × XN heißt Gleichgewicht in dominanten Strategien, wenn für alle Spieler ν = 1, . . . , N θν (x∗,ν , x−ν ) ≤ θν (xν , x−ν ) ∀(xν , x−ν ) ∈ X gilt, also x∗,ν für alle Spieler ν = 1, . . . , N dominant ist. Die obigen Definitionen entsprechen nicht immer jenen aus der Literatur, wo insbesondere im Teil (a) oft noch zusätzlich verlangt wird, dass die dortige Ungleichung für mindestens ein x−ν strikt erfüllt ist. Dies wäre dann allerdings nicht mehr konsistent mit dem Teil (c) der Definition, so dass wir unsere Version hier bevorzugen. Ist x∗ ein Gleichgewicht in dominanten Strategien und wählt man speziell x−ν = x∗,−ν , so gelangt man unmittelbar zu dem folgenden Resultat. Satz 1.14 Jedes Gleichgewicht in dominanten Strategien ist auch ein Nash–Gleichgewicht. Die Umkehrung des Satzes 1.14 gilt im Allgemeinen nicht. Tatsächlich ist ein Gleichgewicht in dominanten Strategien zwar ein sehr schöner Lösungsbegriff, der aber in der Praxis viel zu stark ist, da ein solches Gleichgewicht nur relativ selten existiert. Beispielsweise besitzt das Gefangenendilemma aus dem Beispiel 1.2 kein Gleichgewicht in dominanten Strategien. Dennoch ist der Begriff einer dominierten Strategie in einigen Fällen sinnvoll. So wird ein Spieler eine dominierte Strategie beispielsweise als wenig sinnvoll erachten und diese Möglichkeit daher völlig außer Acht lassen. Dies führt auf die so genannte Elimination dominierter Strategien, mit deren Hilfe man ein strategisches Spiel manchmal sogar lösen kann. Wir illustrieren die Vorgehensweise an einem Beispiel, wobei man beachte, dass wir dem Beispiel ein Maximierungsproblem zu Grunde legen. Beispiel 1.15 ( Elimination dominierter Strategien ) Wir betrachten ein abstraktes Spiel mit zwei Spielern (und zwar in Maximierungsform). Spieler 1 habe die Strategiemenge X1 := {U, D}, Spieler 2 die Strategiemenge X2 := {L, M, R}. Die Auszahlungsmatrix lautet wie folgt: Spieler 1 U D Spieler 2 L M R 1, 0 1, 2 0, 1 0, 3 0, 1 2, 0 1.3. ANDERE LÖSUNGSKONZEPTE 11 Beide Spieler mögen rational denken. Dann wird Spieler 2 keinesfalls die Strategie R wählen, denn diese wird von seiner Strategie M (strikt) dominiert (wegen 2 > 1 und 1 > 2). Spieler 1 bemerkt dies natürlich ebenfalls. Daher reduziert sich das Spiel auf die folgende Auszahlungsmatrix: Spieler 1 Spieler L U 1, 0 D 0, 3 2 M 1, 2 0, 1 Hier wird die Strategie D von Spieler 1 aber (strikt) dominiert von der Strategie U (wegen 1 > 0 und 1 > 0). Elimination dieser (strikt) dominierten Strategie liefert die Auszahlungsmatrix: Spieler 1 Spieler 2 L M U 1, 0 1, 2 Jetzt wird die Strategie L von Spieler 2 aber (strikt) dominiert durch die Strategie M (wegen 2 > 0). Durch sukzessive Elimination (strikt) dominierter Strategien erhalten wir damit die Lösung (U,M) als einziges Gleichgewicht. Wir erwähnen als Nächstes zumindest noch ein weiteres Lösungskonzept, das in der spieltheoretischen Literatur manchmal auftritt und aus der mehrkriteriellen Optimierung (Optimierung mit mehreren Zielfunktionen) stammt, vergleiche [7]. ∗ Definition 1.16 Gegeben sei ein Spiel Γ = {θν , Xν }N ν=1 . Dann heißt x ∈ X := X1 × . . . × XN ein Pareto–Gleichgewicht, wenn es kein x ∈ X gibt mit θν (xν , x−ν ) ≤ θν (x∗,ν , x∗,−ν ) ∀ν = 1, . . . , N, so dass für zumindest ein ν ∈ {1, . . . , N } diese Ungleichung strikt ist. Wir haben also genau dann ein Pareto–Gleichgewicht x∗ vorliegen, wenn dieses durch keine andere Strategie x ∈ X dominiert werden kann in dem Sinne, dass sie für alle Spieler zumindest keinen schlechteren Wert der Auszahlungsfunktion als x∗ liefert, und für mindestens einen Spieler sogar eine echte Verbesserung bringt. Einen direkten Zusammenhang zwischen Nash– und Pareto–Gleichgewichten gibt es nicht. Die Schnittmenge dieser beiden Gleichgewichtskonzepte mag leer sein. Im Beispiel 1.2 etwa sind die Strategien (S, S), (S, G) und (G, S) allesamt Pareto–Gleichgewichte, nicht jedoch das einzige Nash–Gleichgewicht (G, G). Dieses Beispiel deutet allerdings auch an, dass die Anzahl der Pareto–Gleichgewichte im Allgemeinen sehr viel größer als die Anzahl der Nash–Gleichgewichte ist. Tatsächlich ist der Begriff eines Pareto–Gleichgewichtes in der Spieltheorie meist nicht differenziert genug, um als ein brauchbares Lösungskonzept zu gelten. 12 1.4 KAPITEL 1. EINFÜHRUNG Klassifikation strategischer Spiele Wir führen in diesem Abschnitt einige Begriffe ein, die zur Klassifikation von strategischen Spielen nützlich sind und später bei der Wahl eines geeigneten Lösungsverfahrens eine gewisse Rolle spielen. Definition 1.17 Ein Spiel Γ = {θν , Xν }N ν=1 heißt (a) endlich, wenn alle Strategiemengen Xν nur endlich viele Elemente enthalten. (b) abzählbar, wenn mindestens eine Strategiemenge Xν abzählbar viele Elemente enthält. (c) überabzählbar oder kontinuierlich, wenn mindestens eine Strategiemenge Xν überabzählbar viele Elemente enthält. Endliche Spiele sind beispielsweise das Gefangenendilemma aus dem Beispiele 1.2, der Kampf der Geschlechter aus dem Beispiel 1.3 und das Stein–Schere–Papier–Spiel aus dem Beispiel 1.4. Hingegen ist das Oligopol–Modell nach Cournot aus dem Beispiel 1.5 ein kontinuierliches Spiel. Wir werden uns im Folgenden ausschließlich mit endlichen und kontinuierlichen Spielen auseinandersetzen, wobei letztere den Schwerpunkt unserer Ausführungen bilden. Eine andere Klassifikation von strategischen Spielen basiert auf gewissen Eigenschaften der Auszahlungsfunktionen. Definition 1.18 Ein Spiel Γ = {θν , Xν }N ν=1 heißt (a) Nullsummenspiel, falls PN ν=1 θν (x) = 0 für alle x ∈ X := X1 × . . . × XN gilt. (b) Konstantsummenspiel, falls eine Konstante c ∈ R existiert mit alle x ∈ X := X1 × . . . × XN . PN ν=1 θν (x) = c für (c) Nicht–Nullsummenspiel, wenn es kein Nullsummenspiel ist. Das Stein–Schere–Papier–Spiel aus dem Beispiel 1.4 ist nach obiger Definition etwa ein Nullsummenspiel. Alle anderen im Abschnitt 1.1 vorgestellten Beispiele von strategischen Spielen sind Nicht–Nullsummenspiele. Konstantsummenspiele können stets auf Nullsummenspiele zurückgeführt werden. Dies ist der Inhalt des folgenden Resultates. Lemma 1.19 Jedes Konstantsummenspiel ist strategisch äquivalent zu einem Nullsummenspiel. Beweis: Sei Γ = {θν , Xν }N ν=1 ein Konstantsummenspiel. Dann existiert ein c ∈ R mit P N θ (x) = c für alle x ∈ X := X1 × . . . × XN . Definiere nun ein zweites Spiel Γ̃ = ν=1 ν 1.4. KLASSIFIKATION STRATEGISCHER SPIELE 13 c {θ̃ν , Xν }N ν=1 durch θ̃ν (x) := θν (x) − N für ν = 1, . . . , N . Wegen Satz 1.12 ist das Spiel Γ̃ strategisch äquivalent zu dem Konstantsummenspiel Γ. Wegen N X ν=1 θ̃ν (x) = N X ν=1 θν (x) − c =c−c=0 N für alle x ∈ X handelt es sich bei Γ̃ außerdem um ein Nullsummenspiel. 2 Aufgrund des vorigen Resultates braucht man also nur zwischen Nullsummenspielen und Nicht–Nullsummenspielen zu unterscheiden. Endliche Spiele mit nur zwei Spielern sind oft von besonderer Bedeutung und erhalten daher einen eigenen Namen. Sie werden von uns im Kapitel 3 allerdings nur relativ kurz behandelt. Definition 1.20 (a) Ein endliches 2–Personen–Nullsummenspiel heißt Matrixspiel. (b) Ein endliches 2–Personen–Spiel heißt Bi–Matrixspiel. Wir wollen noch kurz erläutern, warum man von einem Matrix– bzw. Bi–Matrixspiel spricht. Betrachte dazu zunächst ein endliches 2–Personen–Spiel Γ = {θν , Xν }2ν=1 . Nach Voraussetzung sind die beiden Strategiemengen X := X1 und Y := X2 endlich, etwa X = {x1 , . . . , xm } und Y := {y1 , . . . , yn }. Definieren wir dann zwei Matrizen A, B ∈ Rm×n elementweise durch die Auszahlungen aij := θ1 (xi , yj ), bij := θ2 (xi , yj ) ∀i = 1, . . . , m, ∀j = 1, . . . , n, so kann man die Auszahlungsfunktionen θ1 und θ2 durch die beiden Matrizen A und B vollständig darstellen. Man benötigt hierzu allerdings im Allgemeinen tatsächlich zwei Matrizen, weshalb man von einem Bi–Matrix–Spiel spricht. Im Falle eines 2–Personen– Nullsummenspiels hingegen ist B = −A, so dass man mit nur einer Matrix auskommt und daher von einem Matrixspiel spricht. Beispiele von Bi–Matrixspielen sind das Gefangenendilemma aus dem Beispiel 1.2 und der Kampf der Geschlechter aus dem Beispiel 1.3, während es sich bei dem Stein–Schere–Papier–Spiel aus dem Beispiel 1.4 um ein Matrixspiel handelt (die Summe der Auszahlungen ist stets Null). Neben den gerade eingeführten Klassifikationsmerkmalen, die für unsere Ausführungen eine gewisse Rolle spielen, existieren verschiedene weitere Unterscheidungsmöglichkeiten, die insbesondere dann wichtig werden, wenn man weitere spieltheoretische Themen behandeln möchte, die im Rahmen dieser Ausarbeitung nicht weiter vorkommen. Die folgende Liste entstammt im Wesentlichen dem Vorlesungsskript [20] und mag bei der Einordnung der in der Literatur zur Spieltheorie behandelten Probleme sehr hilfreich sein: • kooperative vs. nicht-kooperative Spiele Bei den nicht–kooperativen Spielen wird davon ausgegangen, dass die einzelnen Spieler strikt gegeneinander agieren und es keine bindenden Absprachen (Kooperationen) zwischen den Teilnehmern gibt, wie sie bei den kooperativen Spielen erlaubt sind. 14 KAPITEL 1. EINFÜHRUNG Zur Sicherung des Wettbewerbs ist das Bundeskartellamt beispielsweise dafür verantwortlich, dass es in gewissen Bereichen (etwa bei den Mineralölkonzernen) keine Kooperationen (Preisabsprachen) gibt. Ein bekanntes Beispiel einer Kooperation verschiedener beteiligter Personen (Länder) ist das Ölkartell der OPEC, bei der sich alle Teilnehmerländer auf eine Förderquote einlassen und auf diese verpflichten müssen. Wir werden in unseren Ausführungen ausschließlich nicht–kooperative Spiele betrachten. • statische vs. dynamische Spiele Bei den statischen Spielen wählen alle Spieler ihre Strategien simultan aus. Keinem Spieler sind die Entscheidungen der Gegenspieler bekannt. Bei den dynamischen Spielen hingegen tritt eine zeitliche Reihenfolge der Spielzüge auf. Wir werden hier nur statische Spiele untersuchen. Eine wichtige Klasse von dynamischen Spielen sind die so genannten Stackelberg–Spiele. Im Prinzip handelt es sich bei diesen Stackelberg–Spielen um eine Duopol–Situation, bei der, anders als im Cournot–Beispiel, ein Unternehmen (der Stackelberg–Führer) zuerst entscheidet und das andere Unternehmen (der Stackelberg–Folger) erst danach seine Strategie optimal anpasst. • One-shot games vs. wiederholte Spiele One-short games werden genau einmal gespielt, bei den wiederholten Spielen hingegen kann ein und dasselbe Spiel mehrfach hintereinander gespielt werden. Die Lösung des wiederholten Spiels muss dabei nicht notwendigerweise einer immer gleichen Abfolge der Lösung des one-shot games entsprechen (dies würde eine Unterscheidung auch völlig überflüssig machen), da jetzt Lerneffekte auftreten können, die einen Einfluss auf die Wahl der möglichen Strategien haben können. Als Beispiel für einen solchen Lerneffekt betrachten wir den Elfmeter beim Fußballspiel. Nehmen wir an, Miroslav Klose hat schon drei Elfmeter gegen Oliver Kahn verwandelt. Jeder Schuss möge in die linke Ecke gegangen sein, während Oliver Kahn sich stets für die rechte Ecke entschieden hatte. Wenn Klose dann erneut zu einem Elfmeter gegen Kahn antritt, so könnte Kahn aus den bisherigen Abläufen gelernt haben und sich dieses Mal für die linke Ecke entscheiden. Wir betrachten hier lediglich one-shot games. • Spiele mit vollständiger vs. unvollständiger Information Das hier angesprochene Unterscheidungsmerkmal bezieht sich auf die Informationslage der Spieler. Bei Spielen mit vollständiger Informationen stehen sämtliche relevanten Informationen allen Spielern zur Verfügung. Jeder Spieler kennt die möglichen Strategien sowie die Auszahlungsfunktionen von allen Mitspielern. Man spricht in diesem Zusammenhang auch von Spielen mit vollkommener Information. Anderenfalls handelt es sich um eine Spiel mit unvollständiger (unvollkommener) Information. 1.4. KLASSIFIKATION STRATEGISCHER SPIELE 15 Schach ist etwa ein Paradebeispiel für ein Spiel mit vollkommener Information: Beide Spieler kennen den kompletten bisherigen Spielverlauf und wissen, welche Zugmöglichkeiten im Augenblick bestehen. Skat hingegen ist ein Spiel mit unvollständiger Information. Zwar weiß man, welche Karten die beteiligten Spieler in jeder Runde abgelegt haben, jedoch ist die anfängliche Kartenverteilung zufallsbedingt, so dass man nicht weiß, welche Karten die Mitspieler noch auf der Hand halten. Bei uns treten ausschließlich Spiele mit vollständiger Information auf.