WS 2001/02 - Privatissimum: E-Commerce Gerald Röhrling Grundkonzepte der Spieltheorie Nach OZ SHY (2001): The Economics of Network Industries, Appendix A-C 1. Was ist „Spieltheorie“ (Game Theory) ? • Werkzeugsammlung um Ergebnisse (outcomes) für eine Gruppe von sich gegenseitig beeinflussenden Personen vorherzusagen – eine Aktion einer einzelnen Person wirkt sich auf die Auszahlungsbeträge (payoffs) anderer teilnehmenden Personen aus • Spieltheorie ist besonders nützlich wenn die Anzahl der interaktiven Personen klein ist • Anwendungsgebiete: Wirtschafts- und Politikwissenschaften, Psychologie, Tierverhalten, Militärstudien etc. • Hilfreich bei der Analyse von Industrien, in denen sich wenige Firmen einen Wettbewerb liefern – jede Aktion einer Firma (z.B.: Preisfestsetzung, Mengenproduktion, Forschung und Entwicklung oder Marketing – Techniken) hat Auswirkungen auf das Profitlevel der konkurrierenden Firmen 2 Arten der Spielrepräsentation: (a) Normal form games: Spieler wählen ihre Aktionen simultan (b) Extensive form games: Spieler wählen ihre Aktionen zu verschiedenen Zeitpunkten 2 Arten von Aktionen: (a) reine Aktionen (pure actions): Spieler spielt eine Aktion von jener Menge von Aktionen die dem Spieler verfügbar sind (b) gemischte Aktionen (mixed actions): Spieler spielt jede Aktion mit einer angenommenen Wahrscheinlichkeit Information spielt in der Spieltheorie eine Schlüsselrolle: Perfekte Information (perfect information): Jeder Spieler hat Information bezüglich der anderen Spieler, sodass die Entscheidung des Spielers, welche Aktion dieser wählt, beeinflusst wird. WS 2001/02 - Privatissimum: E-Commerce Gerald Röhrling 2. Normal Form Games (NFG) Ein NFG kann folgend geschrieben werden: (a) Menge von N Spielern I:={1,2,.....N} (b) Jeder Spieler i,j ∈ I hat eine Aktionsmenge (action set) Ai (=Menge aller Aktionen, die für die für Spieler i verfügbar sind.) ai ∈ Ai ... Aktion von Spieler i Ai := {ai1, ... aik} ; ki ... Anzahl der verfügbaren Aktionen für Spieler i Ergebnis (outcome) des Spieles: a := {a1, a2, a3 ... aN} ... Liste der Aktionen, die von jedem Spieler gewählt werden (c) Jeder Spieler hat eine Auszahlungsfunktion (payoff function) πi , die eine reelle Zahl πi(a) jedem Ergebnis des Spieles zuordnet Beispiel 1: „Low price – high price game“ (oder „Prisoner’s Dilemma“) Firma2 Firma 1 Low price High price Low price 100 0 High price 100 300 300 200 0 200 N = 2 : (Firma1, Firma2) A1=A2 = {LP, HP} 4 Ergebnisse des Spieles: (LP,LP), (LP,HP), (HP,LP), (LP,LP) Lesebeispiel: Ergebnis (LP,HP) π1(a) = π1(LP,HP) = 300 π2(a) = π2(LP,HP) = 0 2.1: Gleichgewichtskonzepte Ziel: Entwicklung von Methoden und Algorithmen, welche die Menge aller Ergebnisse verkleinert Æ Gleichgewichtsergebnisse: diese können eindeutig (unique) oder vielfach (multiple) sein oder nicht existieren Notation: entfernen vom Ergebnis a die Aktion, die der Spieler i selbst spielt a i := (a1, a2, ... ai-1, ai+1, ... aN) Æ a = (ai, a i) WS 2001/02 - Privatissimum: E-Commerce Gerald Röhrling 2.1.1: Gleichgewicht in dominanten Aktionen Eine bestimmte Aktion a~i heißt dominante Aktion für den Spieler i, falls das Spielen von a~i immer den payoff von Spieler i maximiert (unabhängig davon was die anderen Spieler spielen). Formal: πi(a~i, a i) ≥ πi(ai, a i) für jedes ai ∈ Ai πi(a~i, a i) > πi(ai, a i) für wenigstens eine Aktion ai ∈ Ai Beispiel 1: a1= LP ist eine dominante Aktion für Spieler 1 Beweis: z.z.: Unabhängig was Fa. 2 macht, für Fa. 1 ist es immer besser LP zu spielen. Falls a2=LP ⇒ π1(LP, LP)=100 > 0= π1(HP, LP) Falls a2=HP ⇒ π1(LP, HP)=300 > 200= π1(HP, HP) Analog: a2=LP ist eine dominante Aktion für Fa. 2 Ein Ergebnis (a~1, a~2, ... a~N) (a~i ∈ Ai, i=1,...N) heißt Gleichgewicht in dominanten Aktionen (equilibrium in dominant actions), wenn a~i eine dominante Aktion für jeden Spieler i ist. Beispiel 1: (a1, a2) = (LP,LP) ist ein Gleichgewicht in dominanten Aktionen Problem: In den meisten Fällen existiert ein Gleichgewicht in dominanten Aktionen nicht ! (siehe Beispiel 2) Beispiel 2: Standardization game (oder Battle of the sexes case) Firma2 Firma 1 Standard α Standard β Standard α 200 0 Standard β 100 0 0 100 0 200 2.1.2: Nash equilibrium (NE) John Nash 1951: verbreitetstes Gleichgewichtskonzept Ein Ergebnis a^ = (a^1, a^2,...a^N) (wobei a^i ∈ ai für i= 1,...N) heißt Nash Gleichgewicht (Nash equilibrium), falls kein Spieler einen Vorteil daraus zieht von seiner Strategie abzuweichen, vorausgesetzt alle anderen Spieler weichen nicht von ihren Strategien ab, die im NE gespielt werden. Formal: für jeden Spieler i=1, 2, ...N πi(a^i, a^ i) ≥ πi(ai, a^ i) für jedes ai ∈ Ai WS 2001/02 - Privatissimum: E-Commerce Gerald Röhrling Zusammenhang zwischen Nash Gleichgewicht und dem Gleichgewicht in dominanten Aktionen: Ein Gleichgewichtsergebnis in dominanten Aktionen ist auch ein Nash Gleichgewicht. Jedoch ein Nash Gleichgewicht muss kein Gleichgewicht in dominanten Aktionen sein. In Beispiel 1 gibt es ein eindeutiges Nash Gleichgewicht. 2.1.2.1 Mehrere Nash Gleichgewichte Beispiel 2 besitzt genau zwei Nash Gleichgewichte: (α,α) und (β,β). Beweis: (α,α): a2=α: π1(α,α)=200 ≥ 0=π1(β,α) a1=α: π2(α,α)=100 ≥ 0=π2(α,β) (β,β): a2=β: π1(β,β)=100 ≥ 0=π1(α,β) a1=β: π2(β,β)=200 ≥ 0=π2(β,α) (α,β): π1(α,β)=0 < 100=π1((β,β) Fa. 1 weicht zu a1=β ab (β,α): π1(β,α)=0 < 200=π1(α,α) Fa. 1 weicht zu a1=α ab Nash Gleichgewichte 2.1.2.2 Nicht-Existenz eines Nash Gleichgewichts Beispiel 3: Firma 1 Standard α Standard β Firma2 Standard α 200 0 Beweis: (α,α): π2(α,α)=0 < 200=π2(α,β) Fa. 2 weicht zu a2=β ab (β,β): π2(β,β)=0 < 100=π2(β,α) Fa. 2 weicht zu a2=α ab (α,β): π1(α,β)=0 < 100=π1(β,β) Fa. 1 weicht zu a1=β ab (β,α): π1(β,α)=0 < 200=π1(α,α) Fa. 1 weicht zu a1=α ab Standard β 0 0 100 100 200 0 WS 2001/02 - Privatissimum: E-Commerce Gerald Röhrling 2.2 Best-Response Functions (BRF) ⇒ vereinfachen die Suche nach Nash Gleichgewichten In einem 2-Spieler Spiel ist die Best-Response Function für Spieler i die Funktion Ri(aj), die jeder gegebenen Aktion aj von Spieler j eine Aktion ai=Ri(aj) zuordnet, welche den payoff πi(ai,aj) von Spieler i maximiert. Allgemein, in einem N-Spieler Spiel ist die Best-Response Function für Spieler i die Funktion Ri(a i ), die jeder gegebenen Aktion a i von Spieler 1,2,...i-1,i+1,...N eine Aktion ai= Ri(a i ) zuordnet, welche den payoff πi(ai, a i) von Spieler i maximiert. Beispiel 2: Best-Response Functions R1(a2)= R2(a1)= α falls a2=α β falls a2=β α falls a1=α β falls a1=β Wenn Fa.2 α spielt, so ist die beste Antwort für Fa. 1 auch α zu spielen. Wenn Fa.2 β spielt, so ist die beste Antwort für Fa. 1 auch β zu spielen. Da das Spiel symmetrisch ist, ist die Best-Response Function für Fa.2 die gleiche. Wenn a^ ein Nash Gleichgewicht ist, dann gilt a^i=R(a i) für jeden Spieler i. Im Nash Gleichgewicht wählt jeder Spieler eine Aktion i, die die beste Antwort zu den Aktionen ist, die von den anderen Spielern gewählt wurden. Die Prozedur um ein Nash Gleichgewicht zu finden ist nun sehr einfach: 1.) Berechne für jeden Spieler die Best-Response Function 2.) Prüfe, welche Ergebnisse auf den Best-Response Functions von allen Spielern beruhen In Beispiel 2.2 erfüllen die Ergebnisse (α,α) und (β,β) die Best-Response Function von beiden Spielern. WS 2001/02 - Privatissimum: E-Commerce Gerald Röhrling 3. Extensive-Form Games ⇒ Spieler agieren zu unterschiedlichen Zeitpunkten Beispiel 4: Das Spiel wird durch einen Baum dargestellt, mit einem Start-Entscheidungsknoten (Knoten I), andere Entscheidungsknoten (IIE und IINE) und Endknoten. Die Zweige, welche die Knoten miteinander verbinden, beschreiben Aktionen, die am entsprechenden Knoten für den jeweiligen Spieler möglich sind. In Beispiel 4 gibt es zwei Stufen: Stufe 1: Fa. A entscheidet ob sie in den Markt eintritt oder nicht Stufe 2: Fa. B befindet sich entweder in der Situation mit A zu konkurrieren (Knoten IIE) oder in einer Monopol-Stellung (Knoten IINE) An jedem dieser Knoten hat Fa. B eine knoten-spezifische Aktionsmenge. AIIEB={STAY, EXIT} AIINEB={STAY, EXIT} Ein Extensive-Form Game ist charakterisiert durch: (a) Ein Spielbaum, welcher einen Startknoten, andere Entscheidungsknoten und Endknoten besitzt, und Zweige, die jeden Entscheidungsknoten zu einem Nachfolgeknoten verbinden (b) Eine Liste von N ≥ 1 Spielern mit Index i=1, ...,N. (c) An jedem Entscheidungsknoten kann der dazu berechtigte Spieler ein Aktion wählen. (d) Eine Spezifikation der Aktionsmenge von i an jedem Knoten an dem der Spieler i berechtigt ist zu handeln. (e) Eine Spezifikation des Auszahlungsbetrages von jedem Spieler an jedem Endknoten. WS 2001/02 - Privatissimum: E-Commerce Gerald Röhrling 3.1 Definition von Strategien und Ergebnissen in Extensive-Form Games Eine Strategie für Spieler i (si) ist ein vollständiger Plan (Liste) von Aktionen; eine Aktion für jeden Entscheidungsknoten an dem der Spieler berechtigt ist eine Aktion zu wählen (d.h. eine Strategie ist nicht, was ein Spieler an einem einzelnen Knoten macht – vielmehr ist eine Strategie eine Liste, was ein Spieler an jedem Knoten macht, an dem dieser berechtigt ist eine Aktion zu wähle). Strategie in Beispiel 4: Obwohl klar ist, dass sich Spieler B (der Teilnehmer) entweder bei Knoten IIE oder Knoten IINE befindet, spezifiziert eine Strategie für diesen Spieler, was er an jedem der zwei Knoten macht. ⇒ 4 mögliche Strategien: (STAY,STAY), (STAY,EXIT), (EXIT,STAY), (EXIT,EXIT) (1. Komponente: Aktion an Knoten IIE (2. Komponente: Aktion an Knoten IINE) Ergebnisse eines Spieles: Liste aller Aktionen, die von jedem Spieler an jedem Knoten (an dem dieser berechtigt ist zu handeln) gemacht werden können. Allgemein: (A‘s Aktion bei I, (B’s Aktion bei IIE, B’s Aktion bei IINE)) 3.2 Normalformdarstellung von Extensive Form Games Firma 1 ENTER NOT ENTER Firma2 SS SE -2 -2 -2 -2 0 3 0 -1 ES 3 0 EE -1 3 3 0 -1 -1 Es gibt in diesem Spiel 3 Nash Gleichgewichte: (E, (ES)), (E, (EE)), (N, (SS)) Beweis: Best Response Functions: RA(aB)= N N E E falls falls falls falls aB=SS aB=SE aB=ES aB=EE RB(aA)= ES, EE falls aA=E SS, ES falls aA=N ⇒ mehrere Nach Gleichgewichte Ziel: Wollen ein Konzept finden, welches die Menge der Nash Gleichgewichte verkleinert WS 2001/02 - Privatissimum: E-Commerce Gerald Röhrling 3.3 Subgames (Teilspiele) – Subgame perfect equilibrium Betrachten die NE-Ergebnisse aus Beispiel 4: Welche der Nash-Gleichgewichte sind unvernünftig ? Was würden Sie Fa. A raten ? ENTER – In diesem Fall würde B den Markt verlassen (EXIT), da πB(S)=-2, πB(E)=-1. Fa. A würde dann πA=3, verglichen mit πA=0, bekommen. Definition eines Konzepts, wo der zuerst Agierende berücksichtigt wie anschließende Spieler auf ihren Zug antworten. Der erste Spieler kann somit optimieren indem er sich auf die Menge der Aktionen beschränkt, die ihm höhere Auszahlungsbeträge liefern. Ein Teilspiel (Subgame) ist ein Entscheidungsknoten des Originalspieles, zusammen mit den Entscheidungsknoten und den Endknoten, die direkt diesem Knoten folgen. Ein Teilspiel heißt echtes Teilspiel (proper subgame), wenn es sich vom Originalspiel unterscheidet. Das Beispiel beinhaltet drei Teilspiele: 1.) das Originalspiel selbst 2.) zwei echte Teilspiele mit Knoten IIE und IINE als Startknoten Ein Ergebnis heißt Teilspiel-perfektes Gleichgewicht (Subgame perfect equilibrium - SPE), falls es jedes Teilspiel des Originalspieles ein Nash Gleichgewicht beinhaltet. Es ist eine Liste von Strategien (eine für jeden Spieler) bestehend aus den Aktionen der Spieler, die in jedem Teilspiel ein Nach Gleichgewicht bestimmen. Im speziellen ist ein SPE Ergebnis ein Nach Gleichgewicht im Originalspiel, da das Originalspiel selbst ein Teilspiel ist. Methode um SPE- Ergebnisse zu finden: Rückwärts- Induktion: • Start der Suche nach NE in den Teilspielen, die zu den Endknoten führen. • Suche nach NE in den Teilspielen, die zu den Endknoten führen. Die NE Aktionen, die in den letzten Teilspielen vor den Endknoten gespielt wurden, werden als gegeben angenommen. • Danach wird der Startknoten erreicht und man sucht nach jener Aktion, die den payoff von Spieler 1 maximiert, gegeben den NE der anderen echten Teilspiele. Diese Methode ist besonders nützlich, wenn der Spielbaum sehr groß ist. Das Ergebnis (E, (E,S)) bestimmt ein echtes SPE. WS 2001/02 - Privatissimum: E-Commerce Gerald Röhrling 4. Undercut-Proof Equilibrium (UPE) In einem UPE wählt jede Firma ihren Preis so, dass sie ihren Profit maximiert. Währenddessen stellt sie sicher, dass ihr Preis niedrig genug ist, sodass eine rivalisierende Firma es für nicht erstrebenswert erachtet einen niedrigeren Preis zu setzen, um sich die Kunden von Firma 1 zu schnappen. 4.1 Das einfachste Produkt-Unterscheidungsmodell Beispiel 5: Markt mit 2 Geschäften A, B; beide verkaufen unterschiedliche Markenartikel Annahme: Produktionskosten = 0 2 Gruppen von Konsumenten: Typ A: bevorzugt den Markenartikel A Typ B: bevorzugt den Markenartikel B ηA (Typ A – Konsumenten) > 0 ηB (Typ B – Konsumenten) > 0 Jeder Konsument kauft eine Einheit entweder in Geschäft A oder in Geschäft B. pA, pB ... Preis im jeweiligen Geschäft δ ... Kosten, die der Konsument trägt, wenn er den nicht bevorzugten Markenartikel kauft Der Nutzen der Konsumenten von Typ A und B kann wie folgt angenommen werden. UA= -pA gekauft in Geschäft A -pB-δ gekauft in Geschäft B UB= -pA-δ gekauft in Geschäft A -pB gekauft in Geschäft B Interpretation des Beispieles: Diskrete Version von Hotelling: Standortmodell, wo sich die beiden Geschäfte an gegenüberliegenden Seiten eines Sees befinden, und wo ein überqueren von einer zur anderen Seite ein Bezahlen von fixen Transportkosten δ erfordert. WS 2001/02 - Privatissimum: E-Commerce Gerald Röhrling qA ... die Anzahl der Konsumenten, die in Geschäft A kaufen qB ... die Anzahl der Konsumenten, die in Geschäft B kaufen q A= 0 ηA ηA+ηB falls pA>pB+δ falls pB-δ≤ pA≤ pB+δ falls pA< pB-δ qB= 0 ηA ηA+ηB falls pB>pA+δ falls pA-δ≤ pB≤ pA+δ falls pB< pA-δ 4.2 Nicht-Existenz eines Nash-Bertrand Gleichgewichts Ein Nash-Bertrand Gleichgewicht ist das nichtnegative Paar (pAN,pBN), sodass für einen gegebenen Preis pBN, das Geschäft A pAN so wählt um πA=pA*qA zu maximieren. Umgekehrt wählt Geschäft B, für gegebenen Preis pAN, pBN so , dass πB=pA*qA maximiert wird. Es existiert für das Modell mit verschiedenen Produkten kein Nash-Bertrand Gleichgewicht in reinen Preisstrategien. 4.3 Das Undercut-Proof Gleichgewicht Geschäft i unterbietet (undercuts) Geschäft j, wenn pi ≤ pj-δ, wobei i, j= A, B; i≠j Dieses Unterbieten findet statt, wenn Geschäft i seinen Preis gegenüber dem Preis des Mitstreiters um die Transportkosten reduziert. Das Undercut-Proof Gleichgewicht ist jenes Preispaar (pAU, pBU), welches folgendes erfüllt: (a) Firma A wählt den höchsten Preis p UA gemäß πUB= p UB *q UB ≥ (pA-δ)*(ηA + ηB) ; gegeben p UB, q UB (b) Firma B wählt den höchsten Preis p UB gemäß πUA= p UA *q UA ≥ (pB-δ)*(ηA + ηB) ; gegeben p UA, q UA (c) Die Verteilung der Konsumenten zwischen den Firmen ist wie oben bestimmt. WS 2001/02 - Privatissimum: E-Commerce Gerald Röhrling Firma A wählt p UA so hoch wie möglich, sodass B’s Gewinn wenn sie nicht unterbietet größer ist, als wenn B unterbietet indem p~B < p UA-δ gesetzt wird und an q ~B = ηA + ηB Konsumenten verkauft wird. Betrachtet man die obigen Ungleichungen als Gleichungen, so ergeben sich die Gleichgewichtspreise wie folgt: p UA = [(ηA + ηB)*( ηA + 2ηB)*δ] / [(ηA)^2 + ηAηB + (ηB)^2] > δ p UB = [(ηA + ηB)*( 2ηA + ηB)*δ] / [(ηA)^2 + ηAηB + (ηB)^2] > δ pi ≤ δ bedeutet, dass sich jede Firma einen strickt positiven Marktanteil sichert, ohne unterboten worden zu sein In einem Undercut Proof Gleichgewicht wahren beide Firmen einen strickt positiven Marktanteil (q UA = ηA; q UA = ηA). Wie wird ein Undercut – Proof Gleichgewicht bestimmt ? (1) (2) (3) (1) A wählt pA so, dass B keinen Vorteil daraus zieht pUA zu unterbieten (2) B wählt pB so, dass A keinen Vorteil daraus zieht pUB zu unterbieten (3) Zeigt z.B. die Region, wo keine der Firmen es für profitabel betrachtet den Rivalen zu unterbieten. Die Kurven sind keine Best Response Functions, sie teilen einfach die Regionen in Preise, die ein Unterbieten profitabel oder unprofitabel machen. WS 2001/02 - Privatissimum: E-Commerce Gerald Röhrling Eigenschaften des Undercut-Proof Equilibriums: 1.) Gleichgewichtspreise steigen mit den Transportkosten und fallen monoton gegen Null, wenn die Transportkosten gegen Null streben. 2.) Differenz ∆pU = pUB- pUA ≥ 0, genau dann wenn ηA ≥ ηB Im UPE hat das Geschäft, das an die größere Anzahl von Kunden verkauft, den niedrigeren Preis. 3.) Differenez ∆πU = πUB- πUA ≥ 0, genau dann wenn ηB ≥ ηA Im UPE macht jene Firma einen größeren Gewinn, die an die größere Anzahl Kunden verkauft, obwohl sie zu einem niedrigeren Preis verkauft. 4.) Falls die ηB = ηA ergeben sich die Gleichgewichtspreise zu pUB= pUA= 2δ. Beide Firmen können ihren Preis zweimal den Transportkosten wählen ohne unterboten zu werden.