Was ist „Spieltheorie“ \(Game Theory\)

Werbung
WS 2001/02 - Privatissimum: E-Commerce
Gerald Röhrling
Grundkonzepte der Spieltheorie
Nach OZ SHY (2001): The Economics of Network Industries, Appendix A-C
1. Was ist „Spieltheorie“ (Game Theory) ?
• Werkzeugsammlung um Ergebnisse (outcomes) für eine Gruppe von sich
gegenseitig beeinflussenden Personen vorherzusagen – eine Aktion einer einzelnen
Person wirkt sich auf die Auszahlungsbeträge (payoffs) anderer teilnehmenden
Personen aus
• Spieltheorie ist besonders nützlich wenn die Anzahl der interaktiven Personen klein
ist
• Anwendungsgebiete: Wirtschafts- und Politikwissenschaften, Psychologie,
Tierverhalten, Militärstudien etc.
• Hilfreich bei der Analyse von Industrien, in denen sich wenige Firmen einen
Wettbewerb liefern – jede Aktion einer Firma (z.B.: Preisfestsetzung,
Mengenproduktion, Forschung und Entwicklung oder Marketing – Techniken) hat
Auswirkungen auf das Profitlevel der konkurrierenden Firmen
2 Arten der Spielrepräsentation:
(a) Normal form games: Spieler wählen ihre Aktionen simultan
(b) Extensive form games: Spieler wählen ihre Aktionen zu verschiedenen
Zeitpunkten
2 Arten von Aktionen:
(a) reine Aktionen (pure actions): Spieler spielt eine Aktion von jener Menge von
Aktionen die dem Spieler verfügbar sind
(b) gemischte Aktionen (mixed actions): Spieler spielt jede Aktion mit einer
angenommenen Wahrscheinlichkeit
Information spielt in der Spieltheorie eine Schlüsselrolle:
Perfekte Information (perfect information):
Jeder Spieler hat Information bezüglich der anderen Spieler, sodass die Entscheidung
des Spielers, welche Aktion dieser wählt, beeinflusst wird.
WS 2001/02 - Privatissimum: E-Commerce
Gerald Röhrling
2. Normal Form Games (NFG)
Ein NFG kann folgend geschrieben werden:
(a) Menge von N Spielern I:={1,2,.....N}
(b) Jeder Spieler i,j ∈ I hat eine Aktionsmenge (action set) Ai (=Menge aller
Aktionen, die für die für Spieler i verfügbar sind.)
ai ∈ Ai ... Aktion von Spieler i
Ai := {ai1, ... aik} ; ki ... Anzahl der verfügbaren Aktionen für Spieler i
Ergebnis (outcome) des Spieles: a := {a1, a2, a3 ... aN} ... Liste der Aktionen, die
von jedem Spieler gewählt werden
(c) Jeder Spieler hat eine Auszahlungsfunktion (payoff function) πi , die eine reelle
Zahl πi(a) jedem Ergebnis des Spieles zuordnet
Beispiel 1:
„Low price – high price game“ (oder „Prisoner’s Dilemma“)
Firma2
Firma 1
Low price
High price
Low price
100
0
High price
100 300
300 200
0
200
N = 2 : (Firma1, Firma2)
A1=A2 = {LP, HP}
4 Ergebnisse des Spieles: (LP,LP), (LP,HP), (HP,LP), (LP,LP)
Lesebeispiel: Ergebnis (LP,HP)
π1(a) = π1(LP,HP) = 300
π2(a) = π2(LP,HP) = 0
2.1: Gleichgewichtskonzepte
Ziel: Entwicklung von Methoden und Algorithmen, welche die Menge aller Ergebnisse
verkleinert Æ Gleichgewichtsergebnisse: diese können eindeutig (unique) oder
vielfach (multiple) sein oder nicht existieren
Notation: entfernen vom Ergebnis a die Aktion, die der Spieler i selbst spielt
a i := (a1, a2, ... ai-1, ai+1, ... aN)
Æ a = (ai, a i)
WS 2001/02 - Privatissimum: E-Commerce
Gerald Röhrling
2.1.1: Gleichgewicht in dominanten Aktionen
Eine bestimmte Aktion a~i heißt dominante Aktion für den Spieler i, falls das Spielen
von a~i immer den payoff von Spieler i maximiert (unabhängig davon was die
anderen Spieler spielen).
Formal: πi(a~i, a i) ≥ πi(ai, a i) für jedes ai ∈ Ai
πi(a~i, a i) > πi(ai, a i) für wenigstens eine Aktion ai ∈ Ai
Beispiel 1: a1= LP ist eine dominante Aktion für Spieler 1
Beweis: z.z.: Unabhängig was Fa. 2 macht, für Fa. 1 ist es immer besser LP zu
spielen.
Falls a2=LP ⇒ π1(LP, LP)=100 > 0= π1(HP, LP)
Falls a2=HP ⇒ π1(LP, HP)=300 > 200= π1(HP, HP)
Analog: a2=LP ist eine dominante Aktion für Fa. 2
Ein Ergebnis (a~1, a~2, ... a~N) (a~i ∈ Ai, i=1,...N) heißt Gleichgewicht in dominanten
Aktionen (equilibrium in dominant actions), wenn a~i eine dominante Aktion für
jeden Spieler i ist.
Beispiel 1: (a1, a2) = (LP,LP) ist ein Gleichgewicht in dominanten Aktionen
Problem: In den meisten Fällen existiert ein Gleichgewicht in dominanten Aktionen
nicht ! (siehe Beispiel 2)
Beispiel 2:
Standardization game (oder Battle of the sexes case)
Firma2
Firma 1
Standard α
Standard β
Standard α
200
0
Standard β
100 0
0 100
0
200
2.1.2: Nash equilibrium (NE)
John Nash 1951: verbreitetstes Gleichgewichtskonzept
Ein Ergebnis a^ = (a^1, a^2,...a^N) (wobei a^i ∈ ai für i= 1,...N) heißt Nash
Gleichgewicht (Nash equilibrium), falls kein Spieler einen Vorteil daraus zieht von
seiner Strategie abzuweichen, vorausgesetzt alle anderen Spieler weichen nicht von
ihren Strategien ab, die im NE gespielt werden.
Formal: für jeden Spieler i=1, 2, ...N
πi(a^i, a^ i) ≥ πi(ai, a^ i) für jedes ai ∈ Ai
WS 2001/02 - Privatissimum: E-Commerce
Gerald Röhrling
Zusammenhang zwischen Nash Gleichgewicht und dem Gleichgewicht in dominanten
Aktionen:
Ein Gleichgewichtsergebnis in dominanten Aktionen ist auch ein Nash Gleichgewicht.
Jedoch ein Nash Gleichgewicht muss kein Gleichgewicht in dominanten Aktionen
sein.
In Beispiel 1 gibt es ein eindeutiges Nash Gleichgewicht.
2.1.2.1 Mehrere Nash Gleichgewichte
Beispiel 2 besitzt genau zwei Nash Gleichgewichte: (α,α) und (β,β).
Beweis:
(α,α): a2=α: π1(α,α)=200 ≥ 0=π1(β,α)
a1=α: π2(α,α)=100 ≥ 0=π2(α,β)
(β,β): a2=β: π1(β,β)=100 ≥ 0=π1(α,β)
a1=β: π2(β,β)=200 ≥ 0=π2(β,α)
(α,β): π1(α,β)=0 < 100=π1((β,β)
Fa. 1 weicht zu a1=β ab
(β,α): π1(β,α)=0 < 200=π1(α,α)
Fa. 1 weicht zu a1=α ab
Nash Gleichgewichte
2.1.2.2 Nicht-Existenz eines Nash Gleichgewichts
Beispiel 3:
Firma 1
Standard α
Standard β
Firma2
Standard α
200
0
Beweis:
(α,α): π2(α,α)=0 < 200=π2(α,β)
Fa. 2 weicht zu a2=β ab
(β,β): π2(β,β)=0 < 100=π2(β,α)
Fa. 2 weicht zu a2=α ab
(α,β): π1(α,β)=0 < 100=π1(β,β)
Fa. 1 weicht zu a1=β ab
(β,α): π1(β,α)=0 < 200=π1(α,α)
Fa. 1 weicht zu a1=α ab
Standard β
0 0
100 100
200
0
WS 2001/02 - Privatissimum: E-Commerce
Gerald Röhrling
2.2 Best-Response Functions (BRF)
⇒ vereinfachen die Suche nach Nash Gleichgewichten
In einem 2-Spieler Spiel ist die Best-Response Function für Spieler i die Funktion
Ri(aj), die jeder gegebenen Aktion aj von Spieler j eine Aktion ai=Ri(aj) zuordnet,
welche den payoff πi(ai,aj) von Spieler i maximiert.
Allgemein, in einem N-Spieler Spiel ist die Best-Response Function für Spieler i die
Funktion Ri(a i ), die jeder gegebenen Aktion a i von Spieler 1,2,...i-1,i+1,...N eine
Aktion ai= Ri(a i ) zuordnet, welche den payoff πi(ai, a i) von Spieler i maximiert.
Beispiel 2: Best-Response Functions
R1(a2)=
R2(a1)=
α falls a2=α
β falls a2=β
α falls a1=α
β falls a1=β
Wenn Fa.2 α spielt, so ist die beste Antwort für Fa. 1 auch α zu spielen.
Wenn Fa.2 β spielt, so ist die beste Antwort für Fa. 1 auch β zu spielen.
Da das Spiel symmetrisch ist, ist die Best-Response Function für Fa.2 die gleiche.
Wenn a^ ein Nash Gleichgewicht ist, dann gilt a^i=R(a i) für jeden Spieler i.
Im Nash Gleichgewicht wählt jeder Spieler eine Aktion i, die die beste Antwort zu den
Aktionen ist, die von den anderen Spielern gewählt wurden.
Die Prozedur um ein Nash Gleichgewicht zu finden ist nun sehr einfach:
1.)
Berechne für jeden Spieler die Best-Response Function
2.)
Prüfe, welche Ergebnisse auf den Best-Response Functions von allen Spielern
beruhen
In Beispiel 2.2 erfüllen die Ergebnisse (α,α) und (β,β) die Best-Response Function
von beiden Spielern.
WS 2001/02 - Privatissimum: E-Commerce
Gerald Röhrling
3. Extensive-Form Games
⇒ Spieler agieren zu unterschiedlichen Zeitpunkten
Beispiel 4:
Das Spiel wird durch einen Baum dargestellt, mit einem Start-Entscheidungsknoten
(Knoten I), andere Entscheidungsknoten (IIE und IINE) und Endknoten. Die Zweige,
welche die Knoten miteinander verbinden, beschreiben Aktionen, die am
entsprechenden Knoten für den jeweiligen Spieler möglich sind.
In Beispiel 4 gibt es zwei Stufen:
Stufe 1: Fa. A entscheidet ob sie in den Markt eintritt oder nicht
Stufe 2: Fa. B befindet sich entweder in der Situation mit A zu konkurrieren (Knoten
IIE) oder in einer Monopol-Stellung (Knoten IINE)
An jedem dieser Knoten hat Fa. B eine knoten-spezifische Aktionsmenge.
AIIEB={STAY, EXIT}
AIINEB={STAY, EXIT}
Ein Extensive-Form Game ist charakterisiert durch:
(a) Ein Spielbaum, welcher einen Startknoten, andere Entscheidungsknoten und
Endknoten besitzt, und Zweige, die jeden Entscheidungsknoten zu einem
Nachfolgeknoten verbinden
(b) Eine Liste von N ≥ 1 Spielern mit Index i=1, ...,N.
(c) An jedem Entscheidungsknoten kann der dazu berechtigte Spieler ein Aktion
wählen.
(d) Eine Spezifikation der Aktionsmenge von i an jedem Knoten an dem der Spieler i
berechtigt ist zu handeln.
(e) Eine Spezifikation des Auszahlungsbetrages von jedem Spieler an jedem
Endknoten.
WS 2001/02 - Privatissimum: E-Commerce
Gerald Röhrling
3.1 Definition von Strategien und Ergebnissen in Extensive-Form Games
Eine Strategie für Spieler i (si) ist ein vollständiger Plan (Liste) von Aktionen; eine
Aktion für jeden Entscheidungsknoten an dem der Spieler berechtigt ist eine Aktion
zu wählen (d.h. eine Strategie ist nicht, was ein Spieler an einem einzelnen Knoten
macht – vielmehr ist eine Strategie eine Liste, was ein Spieler an jedem Knoten
macht, an dem dieser berechtigt ist eine Aktion zu wähle).
Strategie in Beispiel 4:
Obwohl klar ist, dass sich Spieler B (der Teilnehmer) entweder bei Knoten IIE oder
Knoten IINE befindet, spezifiziert eine Strategie für diesen Spieler, was er an jedem
der zwei Knoten macht.
⇒ 4 mögliche Strategien: (STAY,STAY), (STAY,EXIT), (EXIT,STAY), (EXIT,EXIT)
(1. Komponente: Aktion an Knoten IIE
(2. Komponente: Aktion an Knoten IINE)
Ergebnisse eines Spieles: Liste aller Aktionen, die von jedem Spieler an jedem Knoten
(an dem dieser berechtigt ist zu handeln) gemacht werden können.
Allgemein: (A‘s Aktion bei I, (B’s Aktion bei IIE, B’s Aktion bei IINE))
3.2 Normalformdarstellung von Extensive Form Games
Firma 1
ENTER
NOT ENTER
Firma2
SS
SE
-2
-2 -2
-2
0
3 0
-1
ES
3
0
EE
-1
3
3
0
-1
-1
Es gibt in diesem Spiel 3 Nash Gleichgewichte: (E, (ES)), (E, (EE)), (N, (SS))
Beweis: Best Response Functions:
RA(aB)=
N
N
E
E
falls
falls
falls
falls
aB=SS
aB=SE
aB=ES
aB=EE
RB(aA)=
ES, EE
falls aA=E
SS, ES
falls aA=N
⇒ mehrere Nach Gleichgewichte
Ziel: Wollen ein Konzept finden, welches die Menge der Nash Gleichgewichte
verkleinert
WS 2001/02 - Privatissimum: E-Commerce
Gerald Röhrling
3.3 Subgames (Teilspiele) – Subgame perfect equilibrium
Betrachten die NE-Ergebnisse aus Beispiel 4:
Welche der Nash-Gleichgewichte sind unvernünftig ?
Was würden Sie Fa. A raten ?
ENTER – In diesem Fall würde B den Markt verlassen (EXIT), da πB(S)=-2, πB(E)=-1.
Fa. A würde dann πA=3, verglichen mit πA=0, bekommen.
Definition eines Konzepts, wo der zuerst Agierende berücksichtigt wie anschließende
Spieler auf ihren Zug antworten. Der erste Spieler kann somit optimieren indem er
sich auf die Menge der Aktionen beschränkt, die ihm höhere Auszahlungsbeträge
liefern.
Ein Teilspiel (Subgame) ist ein Entscheidungsknoten des Originalspieles, zusammen
mit den Entscheidungsknoten und den Endknoten, die direkt diesem Knoten folgen.
Ein Teilspiel heißt echtes Teilspiel (proper subgame), wenn es sich vom
Originalspiel unterscheidet.
Das Beispiel beinhaltet drei Teilspiele:
1.) das Originalspiel selbst
2.) zwei echte Teilspiele mit Knoten IIE und IINE als Startknoten
Ein Ergebnis heißt Teilspiel-perfektes Gleichgewicht (Subgame perfect
equilibrium - SPE), falls es jedes Teilspiel des Originalspieles ein Nash
Gleichgewicht beinhaltet. Es ist eine Liste von Strategien (eine für jeden Spieler)
bestehend aus den Aktionen der Spieler, die in jedem Teilspiel ein Nach
Gleichgewicht bestimmen. Im speziellen ist ein SPE Ergebnis ein Nach Gleichgewicht
im Originalspiel, da das Originalspiel selbst ein Teilspiel ist.
Methode um SPE- Ergebnisse zu finden:
Rückwärts- Induktion:
• Start der Suche nach NE in den Teilspielen, die zu den Endknoten führen.
• Suche nach NE in den Teilspielen, die zu den Endknoten führen. Die NE Aktionen,
die in den letzten Teilspielen vor den Endknoten gespielt wurden, werden als
gegeben angenommen.
• Danach wird der Startknoten erreicht und man sucht nach jener Aktion, die den
payoff von Spieler 1 maximiert, gegeben den NE der anderen echten Teilspiele.
Diese Methode ist besonders nützlich, wenn der Spielbaum sehr groß ist.
Das Ergebnis (E, (E,S)) bestimmt ein echtes SPE.
WS 2001/02 - Privatissimum: E-Commerce
Gerald Röhrling
4. Undercut-Proof Equilibrium (UPE)
In einem UPE wählt jede Firma ihren Preis so, dass sie ihren Profit maximiert.
Währenddessen stellt sie sicher, dass ihr Preis niedrig genug ist, sodass eine
rivalisierende Firma es für nicht erstrebenswert erachtet einen niedrigeren Preis zu
setzen, um sich die Kunden von Firma 1 zu schnappen.
4.1 Das einfachste Produkt-Unterscheidungsmodell
Beispiel 5:
Markt mit 2 Geschäften A, B; beide verkaufen unterschiedliche Markenartikel
Annahme: Produktionskosten = 0
2 Gruppen von Konsumenten:
Typ A: bevorzugt den Markenartikel A
Typ B: bevorzugt den Markenartikel B
ηA (Typ A – Konsumenten) > 0
ηB (Typ B – Konsumenten) > 0
Jeder Konsument kauft eine Einheit entweder in Geschäft A oder in Geschäft B.
pA, pB ... Preis im jeweiligen Geschäft
δ ... Kosten, die der Konsument trägt, wenn er den nicht bevorzugten Markenartikel
kauft
Der Nutzen der Konsumenten von Typ A und B kann wie folgt angenommen werden.
UA=
-pA
gekauft in Geschäft A
-pB-δ
gekauft in Geschäft B
UB=
-pA-δ
gekauft in Geschäft A
-pB
gekauft in Geschäft B
Interpretation des Beispieles:
Diskrete Version von Hotelling:
Standortmodell, wo sich die beiden Geschäfte an gegenüberliegenden Seiten eines
Sees befinden, und wo ein überqueren von einer zur anderen Seite ein Bezahlen von
fixen Transportkosten δ erfordert.
WS 2001/02 - Privatissimum: E-Commerce
Gerald Röhrling
qA ... die Anzahl der Konsumenten, die in Geschäft A kaufen
qB ... die Anzahl der Konsumenten, die in Geschäft B kaufen
q A=
0
ηA
ηA+ηB
falls pA>pB+δ
falls pB-δ≤ pA≤ pB+δ
falls pA< pB-δ
qB=
0
ηA
ηA+ηB
falls pB>pA+δ
falls pA-δ≤ pB≤ pA+δ
falls pB< pA-δ
4.2 Nicht-Existenz eines Nash-Bertrand Gleichgewichts
Ein Nash-Bertrand Gleichgewicht ist das nichtnegative Paar (pAN,pBN), sodass für
einen gegebenen Preis pBN, das Geschäft A pAN so wählt um πA=pA*qA zu
maximieren. Umgekehrt wählt Geschäft B, für gegebenen Preis pAN, pBN so , dass
πB=pA*qA maximiert wird.
Es existiert für das Modell mit verschiedenen Produkten kein Nash-Bertrand
Gleichgewicht in reinen Preisstrategien.
4.3 Das Undercut-Proof Gleichgewicht
Geschäft i unterbietet (undercuts) Geschäft j, wenn pi ≤ pj-δ, wobei i, j= A, B; i≠j
Dieses Unterbieten findet statt, wenn Geschäft i seinen Preis gegenüber dem Preis
des Mitstreiters um die Transportkosten reduziert.
Das Undercut-Proof Gleichgewicht ist jenes Preispaar (pAU, pBU), welches folgendes
erfüllt:
(a) Firma A wählt den höchsten Preis p UA gemäß
πUB= p UB *q UB ≥ (pA-δ)*(ηA + ηB) ; gegeben p UB, q UB
(b) Firma B wählt den höchsten Preis p UB gemäß
πUA= p UA *q UA ≥ (pB-δ)*(ηA + ηB) ; gegeben p UA, q UA
(c) Die Verteilung der Konsumenten zwischen den Firmen ist wie oben bestimmt.
WS 2001/02 - Privatissimum: E-Commerce
Gerald Röhrling
Firma A wählt p UA so hoch wie möglich, sodass B’s Gewinn wenn sie nicht
unterbietet größer ist, als wenn B unterbietet indem p~B < p UA-δ gesetzt wird und an
q ~B = ηA + ηB Konsumenten verkauft wird.
Betrachtet man die obigen Ungleichungen als Gleichungen, so ergeben sich die
Gleichgewichtspreise wie folgt:
p UA = [(ηA + ηB)*( ηA + 2ηB)*δ] / [(ηA)^2 + ηAηB + (ηB)^2] > δ
p UB = [(ηA + ηB)*( 2ηA + ηB)*δ] / [(ηA)^2 + ηAηB + (ηB)^2] > δ
pi ≤ δ bedeutet, dass sich jede Firma einen strickt positiven Marktanteil sichert, ohne
unterboten worden zu sein
In einem Undercut Proof Gleichgewicht wahren beide Firmen einen strickt positiven
Marktanteil (q UA = ηA; q UA = ηA).
Wie wird ein Undercut – Proof Gleichgewicht bestimmt ?
(1)
(2)
(3)
(1)
A wählt pA so, dass B keinen Vorteil daraus zieht pUA zu unterbieten
(2)
B wählt pB so, dass A keinen Vorteil daraus zieht pUB zu unterbieten
(3)
Zeigt z.B. die Region, wo keine der Firmen es für profitabel betrachtet den Rivalen zu
unterbieten.
Die Kurven sind keine Best Response Functions, sie teilen einfach die Regionen in
Preise, die ein Unterbieten profitabel oder unprofitabel machen.
WS 2001/02 - Privatissimum: E-Commerce
Gerald Röhrling
Eigenschaften des Undercut-Proof Equilibriums:
1.) Gleichgewichtspreise steigen mit den Transportkosten und fallen monoton gegen
Null, wenn die Transportkosten gegen Null streben.
2.) Differenz ∆pU = pUB- pUA ≥ 0, genau dann wenn ηA ≥ ηB
Im UPE hat das Geschäft, das an die größere Anzahl von Kunden verkauft, den
niedrigeren Preis.
3.) Differenez ∆πU = πUB- πUA ≥ 0, genau dann wenn ηB ≥ ηA
Im UPE macht jene Firma einen größeren Gewinn, die an die größere Anzahl
Kunden verkauft, obwohl sie zu einem niedrigeren Preis verkauft.
4.) Falls die ηB = ηA ergeben sich die Gleichgewichtspreise zu pUB= pUA= 2δ.
Beide Firmen können ihren Preis zweimal den Transportkosten wählen ohne
unterboten zu werden.
Herunterladen