Einführung rationale Individuen, die das Beste für sich herausholen wollen” ” I Nutzenmaximierung des Haushaltes I Gewinnmaximierung des Unternehmers Nebenbedingungen: technologische Sachverhalte, Nachfragebedingungen, staatliche Regulierung Möglichkeiten der Unternehmen: Aktionsparameter (Preis, Produkt, Innovation, Differenzierung, etc.) 1 / 22 Ein-/Mehr-Personenentscheidungssituationen Ein-Personen-E.: Anpassung der Person an die Umweltzustände (triviales Spiel ohne Mitspieler); spieltheoretisch uninteressant, aber für uns sinnvoller Spezialfall als Referenz; was macht eine Firma wenn sie allein am Markt ist? (Monopol) Mehr-P.-E.: Anpassung an die Umweltzustände und an die Anpassungen” (das Verhalten) der anderen, die zu erwarten sind; ” echte“ Spielsituation ” 2 / 22 Ein-Personen-Spiel, am Beispiel Monopol triviales Spiel; Ziel: max Π(x) x die optimale Menge ist arg max Π(x) x die Lösung ist daher: max Π(x) = Π(x ∗ ) x für alle x ∗ aus arg max Π(x) x arg maxx Π(x) kann mehrere Elemente enthalten, wird aber in den meisten Fällen bei uns nur ein Element enthalten; dann gilt einfach x ∗ = arg maxx Π(x); quadratische Gewinnfunktion (Abb. folgt) 3 / 22 Quadratische Gewinnfunktion Monopolist 4 / 22 Simultane und Sequentielle Spiele Eine wichtige Unterscheidung für die Analyse von Spielen ist die zeitliche Struktur. Wenn die Spieler gleichzeitig (simultan) entscheiden, dann kann wird das Spiel in Normalform dargestellt. Oder es gibt eine zeitliche Aufeinanderfolge von Entscheidungen: Spieler 1 entscheidet zum Zeitpunkt 1, Spieler 2 sieht das und entscheidet danach, zum Zeitpunkt 2. Die zeitliche Struktur wird in der Darstellung der extensiven Form berücksichtigt. 5 / 22 Mehr-Personen-Spiel Charakteristik eines Spiels: gewählte Strategien der Spieler beeinflußen die eigene Auszahlung und die der anderen Spieler; z.B.: Π1 (x1 , x2 ), Π2 (x1 , x2 ) Vektor (x1 , x2 ) ist eine Strategiekombination; besagt für jede Firma, welche Menge er wählt. Bsp.: Hasenfußspiel”, Variante 1 (ökonomisch): zwei ” symmetrische Möglichkeiten, viel produzieren, wenig produzieren; Preis steht in negativem Zusammenhang mit Menge; es gibt folgende erschöpfende Matrix aus Entscheidungen und Resultaten: 6 / 22 Mehr-Personen-Spiel in Normalform U2 wenig viel wenig 100, 100 25, 150 viel 150, 25 -10, -10 U1 Variante 2 (klassisch): zwei Autofahrer fahren aufeinander zu, wer ausweicht ist ein Hasenfuß, der andere ein Siegertyp; weichen beide aus, ist es besser für jeden als der alleinige Hasenfuß zu sein, aber schlechter als der Sieger; weicht keiner aus, beide z.B. tot, was noch schlechter ist als Hasenfuß zu sein; Anm.: Auszahlungen können auch Nutzenniveaus sein, die mit Aktionskombinationen verbunden sind (wie in Variante 2) 7 / 22 Spiel Spiel besteht aus: I Spielern: Individuen, die Entscheidungen treffen; sind sich bewußt, dass ihre Aktionen den anderen beeinflußen, und dass sie von den Aktionen der anderen beeinflußt werden; U1 und U2 I Strategien: aus welchen Aktionen kann ein Spieler wählen. Z.B. {hoch, niedrig}. I Auszahlungen: ordnet jeder möglichen Kombination von Aktionen aller Spieler (Strategienkombination) eine Auszahlung für jeden Spieler zu; z.B. (wenig, wenig) → (100, 100). 8 / 22 Spiel in Normalform Normalform eines Spiels wird auch strategische Form genannt. Diese Form der Darstellung besteht aus I der Menge der Spieler: I = {1, . . . , i, . . . , n} I der Menge der Strategien, die dem Spieler i zur Verfügung stehen: Si , für alle i = 1, . . . , n I den Auszahlungen, die Spieler i erhält, wenn jeder Spieler j = 1, . . . , n eine Strategie sj ∈ Sj wählt: ui (s1 , . . . , si , . . . , sn ) 9 / 22 Industrieökonomisches Spiel Ein wichtiges Beispiel ist der Cournot-Mengenwettbewerb, der als Spiel modelliert wird: I Menge der Firmen: I = {1, . . . , i, . . . , n} I eine Firma i wählt als Strategie eine Produktionsmenge si ∈ Si = {si |si ≥ 0} I Firmen produzieren für einen Markt mit inverser Nachfragefunktion:1 p = p(Q) = p(s1 + s2 + . . . + sn ) und eine Firma i hat die Kostenfunktion Ci (si ). Die Auszahlung der Firma i ist dann gegeben durch den Gewinn Πi (s1 , . . . , sn ) = p(s1 + . . . + sn )si − Ci (si ). 1 Sei Q = Q(p) eine Nachfragefunktion, die die nachgefragte Menge eines Gutes für jeden Preis p angibt. Dann nennt man p = Q −1 (Q) = p(Q) die inverse Nachfragefunktion. 10 / 22 Gleichgewicht Frage, die sich stellt: gegeben unsere Annahmen (Rationalität), wie wird das beschriebene Spiel ausgehen? Welche Strategien werden die Firmen wählen? 2 wichtige Lösungskonzepte: I dominante Strategien I Nash-Gleichgewicht (NP 1994) 11 / 22 Dominante Strategien manche Spiele, wie das Gefangenendilemma, haben eine dominante Strategie eine Strategie ist dominant wenn sie immer zur besten Auszahlung führt, unabhängig davon, was die anderen Mitspieler machen Bsp. Prisoners Dilemma”, Variante 1 (ökonomisch): zwei Hotels ” können einen hohen Preis setzen oder einen niedrigen, wiederum negativer Zusammenhang Preis-Menge; Auszahlungen gemäß Verhaltensmatrix: 12 / 22 Mehr-Personen-Spiele in Normalform U2 hoch niedrig hoch 100, 100 25, 150 niedrig 150, 25 30, 30 U1 Unabhängig davon, was das andere Hotel macht, ist es besser, einen niedrigen Preis zu setzen Dilemma: (hoch, hoch) wäre eine Verbesserung für beide Hotels ( Pareto-besser”), aber bei unkoordinierten Handlungen nicht ” erreichbar 13 / 22 Mehr-Personen-Spiele in Normalform Variante 2 (klassisch): 2 Verbrecher werden bei einem Delikt gefasst; es gibt ein schweres Delikt, und ein kleineres Delikt; nur das kleine kann nachgewiesen werden, dafür bekommt jeder 2 Jahre; für das große braucht man eine Zeugenaussage von mindestens einem Verbrecher; wenn einer gesteht, wird der andere verurteilt, bekommt 10 Jahre, der Geständige als Kronzeuge 0 Jahre; gestehen beide, bekommen beide 8 Jahre gestehen U2 schweigen gestehen 8, 8 0, 10 schweigen 10, 0 2, 2 U1 14 / 22 Dominante Strategie Strategie x1d heißt dominant, wenn Π1 (x1d , x2 ) ≥ Π1 (x1 , x2 ) ∀x1 6= x1d , ∀x2 , und es gibt ein x2 : Π1 (x1d , x2 ) > Π1 (x1 , x2 ) ∀x1 6= x1d . Strategie x1d heißt streng dominant, wenn Π1 (x1d , x2 ) > Π1 (x1 , x2 ) ∀x1 6= x1d , ∀x2 . Strategien x1 6= x1d heißen dominierte Strategien. Im Prisoner’s Dilemma: niedrig (gestehen) ist streng dominant, hoch (nicht gestehen) ist dominiert. 15 / 22 Nash-Gleichgewicht Wenn es keine dominanten Strategien gibt (z.B. Hasenfußpiel), dann hilft Nash-Gleichgewicht bei Gleichgewichtslösung; Strategiekombination, bei der niemand einen Anreiz hat, abzuweichen; Definition: (x1N , x2N ) ist ein NG falls Π1 (x1N , x2N ) ≥ Π1 (x1 , x2N ) ∀x1 , und Π2 (x1N , x2N ) ∀x2 . ≥ Π2 (x1N , x2 ) 16 / 22 Nash-Gleichgewicht Methode zum Auffinden eines Nash-Gleichgewichts: 1. suche alle besten Antworten auf alle möglichen Strategiewahlen der Gegner 2. suche Strategiekombinationen, die mit allen besten Antworten vereinbar sind beste Antworten heißen auch Reaktionskorrespondenz oder Reaktionsfunktion (auch wenn sie simultan sind); z.B.: x1R (x2 ) = arg max Π1 (x1 , x2 ) x1 Eine Mengenkombination (x1N , x2N ) ist ein NG wenn x1N ∈ x1R (x2N ) und x2N ∈ x2R (x1N ). Bei Eindeutigkeit kann ∈ durch = ersetzt werden. 17 / 22 Auffinden des NG im Hasenfußpiel U2 wenig viel wenig 100, 100 25, 150 viel 150, 25 -10, -10 U1 I beste Antwort für U1 wenn U2 wenig: viel I beste Antwort für U1 wenn U2 viel: wenig I beste Antwort für U2 wenn U1 wenig: viel I beste Antwort für U2 wenn U1 viel: wenig beide besten Antworten sind vereinbar miteinander; es gibt zwei NG, aber es ist ungewiß, welches der beiden beobachtet werden wird 18 / 22 Mehr-Personen-Spiele in extensiver Form bisher: simultane Entscheidungen; bei sequentiellen Entscheidungen ist die Formulierung in extensiver Form nötig, die angibt, welcher Spieler wann am Zug ist (und was er dann über die vorherigen Spielzüge weiß) Bsp.: Markteintrittsspiel, oder Eintrittsabschreckung, mit 2 Stufen (oder 2 Zeitpunkten): ein Monopolist bedient einen Markt, hat Profit von 5; Konkurrent überlegt, ob sich Eintritt lohnt; wenn Monopolist Eintritt akzeptiert, setzen sie gemeinsam einen profitablen Preis (friedlich); Monopolist kann aber auch einen Preiskrieg beginnen, beide haben einen Gewinn von -1; wenn kein Eintritt erfolgt, gibt es keinen Preiskrieg; Abfolge: 1: Unternehmen 1 entscheidet über Eintritt/Nicht-Eintritt 2: Unternehmen 2 ( Etablierter”, incumbent) entscheidet ” zwischen aggressivem” und friedlichem” Verhalten ” ” Kann der Monopolist den Eintritt durch Drohung verhindern? 19 / 22 Mehr-Personen-Spiele in extensiver Form Darstellung der extensiven Form mit Hilfe eines Spielbaums: Spiel besteht aus Teilspielen; jedes Spiel hat sich selbst als Teilspiel; Strategiekombination ist ein teilspielperfektes NG wenn es für alle Teilspiele ein NG ist; Strategiekombination: eine S. für einen Spieler gibt für jeden Knoten an, wie er sich an diesem Knoten verhalten soll bzw. wird; auch für Knoten, die wegen Nicht-Teilspielperfektheit nicht erreichbar sind; 20 / 22 Mehr-Personen-Spiele in extensiver Form Lösungsmöglichkeit: Rückwärtsinduktion 1. löse alle Teilspiele der letzten Stufe 2. löse alle Teilspiele der vorletzten Stufe: gegeben das Resultat der letzten Stufe, suche nach dem besten Resultat, das auf der vorletzten Stufe erreichbar ist; nur Auszahlungen, die auf jeder Stufe eine b.A. sind, sind erreichbar ... n. löse das erste Teilspiel; gegeben das optimale Verhalten auf allen nachfolgendenden Stufen, wähle den besten Zug auf der ersten Stufe daher: nur (tritt ein, friedlich) ist ein NG ist die Drohung von U2: wenn du eintrittst, dann werde ich ” aggressiv” glaubwürdig? nein, da es auf Stufe 2 kein NG ist; Teilspielperfektheit entlarvt leere Drohungen” ” 21 / 22 Beschreibung in extensiver Form Elemente des Spielbaums: I das Spiel beginnt mit einem eindeutigen Anfangsknoten und endet an den Endknoten, welche die Auszahlungen der Spieler angeben I alle Knoten außer den Endknoten sind Entscheidungsknoten, an denen einer der Spieler eine Aktion wählt I die einzelnen Knoten befinden sich in einer Reihenfolge, welche die zeitliche Struktur des Spieles beschreibt I an jedem Knoten trifft ein Spieler eine Entscheidung, und durch dessen Entscheidung wird der nächste Knoten erreicht 22 / 22