Einführung

Werbung
Einführung
rationale Individuen, die das Beste für sich herausholen wollen”
”
I Nutzenmaximierung des Haushaltes
I
Gewinnmaximierung des Unternehmers
Nebenbedingungen: technologische Sachverhalte,
Nachfragebedingungen, staatliche Regulierung
Möglichkeiten der Unternehmen: Aktionsparameter (Preis,
Produkt, Innovation, Differenzierung, etc.)
1 / 22
Ein-/Mehr-Personenentscheidungssituationen
Ein-Personen-E.: Anpassung der Person an die Umweltzustände
(triviales Spiel ohne Mitspieler); spieltheoretisch uninteressant,
aber für uns sinnvoller Spezialfall als Referenz; was macht eine
Firma wenn sie allein am Markt ist? (Monopol)
Mehr-P.-E.: Anpassung an die Umweltzustände und an die
Anpassungen” (das Verhalten) der anderen, die zu erwarten sind;
”
echte“ Spielsituation
”
2 / 22
Ein-Personen-Spiel, am Beispiel Monopol
triviales Spiel;
Ziel:
max Π(x)
x
die optimale Menge ist
arg max Π(x)
x
die Lösung ist daher:
max Π(x) = Π(x ∗ )
x
für alle x ∗ aus arg max Π(x)
x
arg maxx Π(x) kann mehrere Elemente enthalten, wird aber in den
meisten Fällen bei uns nur ein Element enthalten; dann gilt einfach
x ∗ = arg maxx Π(x); quadratische Gewinnfunktion (Abb. folgt)
3 / 22
Quadratische Gewinnfunktion Monopolist
4 / 22
Simultane und Sequentielle Spiele
Eine wichtige Unterscheidung für die Analyse von Spielen ist die
zeitliche Struktur.
Wenn die Spieler gleichzeitig (simultan) entscheiden, dann kann
wird das Spiel in Normalform dargestellt.
Oder es gibt eine zeitliche Aufeinanderfolge von Entscheidungen:
Spieler 1 entscheidet zum Zeitpunkt 1, Spieler 2 sieht das und
entscheidet danach, zum Zeitpunkt 2. Die zeitliche Struktur wird
in der Darstellung der extensiven Form berücksichtigt.
5 / 22
Mehr-Personen-Spiel
Charakteristik eines Spiels: gewählte Strategien der Spieler
beeinflußen die eigene Auszahlung und die der anderen Spieler;
z.B.:
Π1 (x1 , x2 ), Π2 (x1 , x2 )
Vektor (x1 , x2 ) ist eine Strategiekombination; besagt für jede
Firma, welche Menge er wählt.
Bsp.: Hasenfußspiel”, Variante 1 (ökonomisch): zwei
”
symmetrische Möglichkeiten, viel produzieren, wenig produzieren;
Preis steht in negativem Zusammenhang mit Menge; es gibt
folgende erschöpfende Matrix aus Entscheidungen und Resultaten:
6 / 22
Mehr-Personen-Spiel in Normalform
U2
wenig
viel
wenig
100, 100
25, 150
viel
150, 25
-10, -10
U1
Variante 2 (klassisch): zwei Autofahrer fahren aufeinander zu, wer
ausweicht ist ein Hasenfuß, der andere ein Siegertyp; weichen beide
aus, ist es besser für jeden als der alleinige Hasenfuß zu sein, aber
schlechter als der Sieger; weicht keiner aus, beide z.B. tot, was
noch schlechter ist als Hasenfuß zu sein;
Anm.: Auszahlungen können auch Nutzenniveaus sein, die mit
Aktionskombinationen verbunden sind (wie in Variante 2)
7 / 22
Spiel
Spiel besteht aus:
I
Spielern: Individuen, die Entscheidungen treffen; sind sich
bewußt, dass ihre Aktionen den anderen beeinflußen, und dass
sie von den Aktionen der anderen beeinflußt werden; U1 und
U2
I
Strategien: aus welchen Aktionen kann ein Spieler wählen.
Z.B. {hoch, niedrig}.
I
Auszahlungen: ordnet jeder möglichen Kombination von
Aktionen aller Spieler (Strategienkombination) eine
Auszahlung für jeden Spieler zu; z.B. (wenig, wenig)
→ (100, 100).
8 / 22
Spiel in Normalform
Normalform eines Spiels wird auch strategische Form genannt.
Diese Form der Darstellung besteht aus
I
der Menge der Spieler: I = {1, . . . , i, . . . , n}
I
der Menge der Strategien, die dem Spieler i zur Verfügung
stehen: Si , für alle i = 1, . . . , n
I
den Auszahlungen, die Spieler i erhält, wenn jeder Spieler
j = 1, . . . , n eine Strategie sj ∈ Sj wählt: ui (s1 , . . . , si , . . . , sn )
9 / 22
Industrieökonomisches Spiel
Ein wichtiges Beispiel ist der Cournot-Mengenwettbewerb, der als
Spiel modelliert wird:
I
Menge der Firmen: I = {1, . . . , i, . . . , n}
I
eine Firma i wählt als Strategie eine Produktionsmenge
si ∈ Si = {si |si ≥ 0}
I
Firmen produzieren für einen Markt mit inverser
Nachfragefunktion:1
p = p(Q) = p(s1 + s2 + . . . + sn )
und eine Firma i hat die Kostenfunktion Ci (si ). Die
Auszahlung der Firma i ist dann gegeben durch den Gewinn
Πi (s1 , . . . , sn ) = p(s1 + . . . + sn )si − Ci (si ).
1
Sei Q = Q(p) eine Nachfragefunktion, die die nachgefragte Menge eines
Gutes für jeden Preis p angibt. Dann nennt man p = Q −1 (Q) = p(Q) die
inverse Nachfragefunktion.
10 / 22
Gleichgewicht
Frage, die sich stellt: gegeben unsere Annahmen (Rationalität), wie
wird das beschriebene Spiel ausgehen? Welche Strategien werden
die Firmen wählen?
2 wichtige Lösungskonzepte:
I
dominante Strategien
I
Nash-Gleichgewicht (NP 1994)
11 / 22
Dominante Strategien
manche Spiele, wie das Gefangenendilemma, haben eine dominante
Strategie
eine Strategie ist dominant wenn sie immer zur besten Auszahlung
führt, unabhängig davon, was die anderen Mitspieler machen
Bsp. Prisoners Dilemma”, Variante 1 (ökonomisch): zwei Hotels
”
können einen hohen Preis setzen oder einen niedrigen, wiederum
negativer Zusammenhang Preis-Menge; Auszahlungen gemäß
Verhaltensmatrix:
12 / 22
Mehr-Personen-Spiele in Normalform
U2
hoch
niedrig
hoch
100, 100
25, 150
niedrig
150, 25
30, 30
U1
Unabhängig davon, was das andere Hotel macht, ist es besser,
einen niedrigen Preis zu setzen
Dilemma: (hoch, hoch) wäre eine Verbesserung für beide Hotels
( Pareto-besser”), aber bei unkoordinierten Handlungen nicht
”
erreichbar
13 / 22
Mehr-Personen-Spiele in Normalform
Variante 2 (klassisch): 2 Verbrecher werden bei einem Delikt
gefasst; es gibt ein schweres Delikt, und ein kleineres Delikt; nur
das kleine kann nachgewiesen werden, dafür bekommt jeder 2
Jahre; für das große braucht man eine Zeugenaussage von
mindestens einem Verbrecher; wenn einer gesteht, wird der andere
verurteilt, bekommt 10 Jahre, der Geständige als Kronzeuge 0
Jahre; gestehen beide, bekommen beide 8 Jahre
gestehen
U2
schweigen
gestehen
8, 8
0, 10
schweigen
10, 0
2, 2
U1
14 / 22
Dominante Strategie
Strategie x1d heißt dominant, wenn
Π1 (x1d , x2 ) ≥ Π1 (x1 , x2 )
∀x1 6= x1d ,
∀x2 ,
und es gibt ein x2 :
Π1 (x1d , x2 ) > Π1 (x1 , x2 )
∀x1 6= x1d .
Strategie x1d heißt streng dominant, wenn
Π1 (x1d , x2 ) > Π1 (x1 , x2 )
∀x1 6= x1d ,
∀x2 .
Strategien x1 6= x1d heißen dominierte Strategien.
Im Prisoner’s Dilemma: niedrig (gestehen) ist streng dominant,
hoch (nicht gestehen) ist dominiert.
15 / 22
Nash-Gleichgewicht
Wenn es keine dominanten Strategien gibt (z.B. Hasenfußpiel),
dann hilft Nash-Gleichgewicht bei Gleichgewichtslösung;
Strategiekombination, bei der niemand einen Anreiz hat,
abzuweichen;
Definition: (x1N , x2N ) ist ein NG falls
Π1 (x1N , x2N ) ≥ Π1 (x1 , x2N )
∀x1 , und
Π2 (x1N , x2N )
∀x2 .
≥
Π2 (x1N , x2 )
16 / 22
Nash-Gleichgewicht
Methode zum Auffinden eines Nash-Gleichgewichts:
1. suche alle besten Antworten auf alle möglichen
Strategiewahlen der Gegner
2. suche Strategiekombinationen, die mit allen besten Antworten
vereinbar sind
beste Antworten heißen auch Reaktionskorrespondenz oder
Reaktionsfunktion (auch wenn sie simultan sind); z.B.:
x1R (x2 ) = arg max Π1 (x1 , x2 )
x1
Eine Mengenkombination (x1N , x2N ) ist ein NG wenn x1N ∈ x1R (x2N )
und x2N ∈ x2R (x1N ). Bei Eindeutigkeit kann ∈ durch = ersetzt
werden.
17 / 22
Auffinden des NG im Hasenfußpiel
U2
wenig
viel
wenig
100, 100
25, 150
viel
150, 25
-10, -10
U1
I
beste Antwort für U1 wenn U2 wenig: viel
I
beste Antwort für U1 wenn U2 viel: wenig
I
beste Antwort für U2 wenn U1 wenig: viel
I
beste Antwort für U2 wenn U1 viel: wenig
beide besten Antworten sind vereinbar miteinander; es gibt zwei
NG, aber es ist ungewiß, welches der beiden beobachtet werden
wird
18 / 22
Mehr-Personen-Spiele in extensiver Form
bisher: simultane Entscheidungen; bei sequentiellen
Entscheidungen ist die Formulierung in extensiver Form nötig, die
angibt, welcher Spieler wann am Zug ist (und was er dann über die
vorherigen Spielzüge weiß)
Bsp.: Markteintrittsspiel, oder Eintrittsabschreckung, mit 2 Stufen
(oder 2 Zeitpunkten): ein Monopolist bedient einen Markt, hat
Profit von 5; Konkurrent überlegt, ob sich Eintritt lohnt; wenn
Monopolist Eintritt akzeptiert, setzen sie gemeinsam einen
profitablen Preis (friedlich); Monopolist kann aber auch einen
Preiskrieg beginnen, beide haben einen Gewinn von -1; wenn kein
Eintritt erfolgt, gibt es keinen Preiskrieg; Abfolge:
1: Unternehmen 1 entscheidet über Eintritt/Nicht-Eintritt
2: Unternehmen 2 ( Etablierter”, incumbent) entscheidet
”
zwischen aggressivem” und friedlichem” Verhalten
”
”
Kann der Monopolist den Eintritt durch Drohung verhindern?
19 / 22
Mehr-Personen-Spiele in extensiver Form
Darstellung der extensiven Form mit Hilfe eines Spielbaums:
Spiel besteht aus Teilspielen; jedes Spiel hat sich selbst als
Teilspiel; Strategiekombination ist ein teilspielperfektes NG wenn
es für alle Teilspiele ein NG ist;
Strategiekombination: eine S. für einen Spieler gibt für jeden
Knoten an, wie er sich an diesem Knoten verhalten soll bzw. wird;
auch für Knoten, die wegen Nicht-Teilspielperfektheit nicht
erreichbar sind;
20 / 22
Mehr-Personen-Spiele in extensiver Form
Lösungsmöglichkeit: Rückwärtsinduktion
1. löse alle Teilspiele der letzten Stufe
2. löse alle Teilspiele der vorletzten Stufe: gegeben das Resultat
der letzten Stufe, suche nach dem besten Resultat, das auf
der vorletzten Stufe erreichbar ist; nur Auszahlungen, die auf
jeder Stufe eine b.A. sind, sind erreichbar
...
n. löse das erste Teilspiel; gegeben das optimale Verhalten auf
allen nachfolgendenden Stufen, wähle den besten Zug auf der
ersten Stufe
daher: nur (tritt ein, friedlich) ist ein NG
ist die Drohung von U2: wenn du eintrittst, dann werde ich
”
aggressiv” glaubwürdig?
nein, da es auf Stufe 2 kein NG ist; Teilspielperfektheit entlarvt
leere Drohungen”
”
21 / 22
Beschreibung in extensiver Form
Elemente des Spielbaums:
I
das Spiel beginnt mit einem eindeutigen Anfangsknoten und
endet an den Endknoten, welche die Auszahlungen der Spieler
angeben
I
alle Knoten außer den Endknoten sind Entscheidungsknoten,
an denen einer der Spieler eine Aktion wählt
I
die einzelnen Knoten befinden sich in einer Reihenfolge,
welche die zeitliche Struktur des Spieles beschreibt
I
an jedem Knoten trifft ein Spieler eine Entscheidung, und
durch dessen Entscheidung wird der nächste Knoten erreicht
22 / 22
Herunterladen