Definition eines Spiels

Werbung
Definition eines Spiels
1. Einleitung
1.1 Einführung:
Die mathematische Spieltheorie beschäftigt sich nicht nur mit der Beschreibung und Analyse von
Spielen im üblichen Sinn, sondern allgemein mit Konfliktsituationen zwischen mehreren
Beteiligten, die verschiedene Handlungsmöglichkeiten haben und damit den Ausgang des
Konflikts zu ihrem jeweiligen Nutzen beeinflussen können. Es kann sich bei einer solchen
Konfliktsituation um einen Markt mit konkurrierenden oder interagierenden Unternehmen, um
politische Gruppen mit unterschiedlichen Zielen, aber auch um die Gegner einer Schachpartie
handeln.
Für die mathematische Behandlung muss man ein Modell bilden, dass die Situation, die Spieler,
die Handlungsmöglichkeiten und Zielsetzungen möglichst real beschreibt. Bei einem
Gesellschaftsspiel mit gegebenen Spielregeln ist die Modellbildung in der Regel einfacher als bei
einer realen Situation. Im Laufe der Zeit haben sich verschiedene formale Beschreibungen
ergeben, die jeweils Vor- und Nachteile für bestimmte Spiele, für die Erläuterung verschiedener
Beurteilungskonzepte und für die Analyse oder Lösung eines Spiels haben. Um verschiedene
Ausgänge und Strategien beurteilen und vergleichen zu können, muss der Gewinn oder der Nutzen
für die Spieler am Ende des Spiels quantifizierbar sein. Dies kann mittels absoluter oder erwarteter
Auszahlungen in Form von Geld ,Prestige oder Zufriedenheit berücksichtigt werden. Erwartete
Auszahlungen entstehen durch Zufallsentscheidungen oder zufällige Züge, wie z.B. Würfeln.
Generell können zufällige Einflüsse durch einen zusätzlichen Spieler berücksichtigt werden.
Ziel der Spieltheorie ist neben einer Beschreibung des Spiels, auch eine Analyse der
Gewinnmöglichkeiten für einzelne Spieler und wenn möglich auch eine Empfehlung für die zu
treffenden Entscheidungen des Spielers, also die Entwicklung einer Strategie. Falls alle Spieler nur
die eigenen Ziele verfolgen, können allerdings am Spielende auch Situationen entstehen, die für
alle Spieler ungünstig sind.
2. Spiele in extensiver Form
Definition 2.1 (Spiel in extensiver Form)
Ein Spiel in Extensivform bezeichnet in der Spieltheorie ein Spiel, bei dem die Spieler zu
verschiedenen Zeitpunkten Entscheidungen treffen müssen und dabei zumindest teilweise die
zuvor getätigten Züge ihrer Gegenspieler kennen. Damit unterscheidet sich die Extensivform von
der Normalform, bei der sämtliche Spieler ihre Strategien gleichzeitig festlegen.
Ein n-Personenspiel in extensiver Form mit Auszahlungsfunktion besteht aus:
(i) einem (Spiel-)Baum Γ mit einem Startknoten A
(ii) einer Auszahlungsfunktion ,die jedem Endknoten von Γ eine Auszahlung für jeden Spieler
zuordnet
(iii) einer Zerlegung der Zwischenknoten von Γ in (n+1) Mengen S0,S1, …,Sn, die Spielermengen
genannt werden
(iv) einer Wahrscheinlichkeitsverteilung zu jedem Knoten von S0,
(v) einer Zerlegung für jedes Si (i =1, …,n) in disjunkte Teilmengen Sij(Informationsmengen)so
dass,
– kein Weg, der von A ausgeht, zwei oder mehr Elemente von Sji enthält
– alle Knoten aus Sji gleich viele und entsprechend übereinstimmend indizierte
Nachfolgeknoten haben
– die Zahl der Zugpositionen von i vor allen Knoten von Sji identisch ist
– die von i auf dem Weg zum Knoten Sji gewählten Aktionen für alle solche Knoten
übereinstimmen
In (i) ist ein Baum im Sinne der Graphentheorie gemeint , also ein Kreisfreier ,
zusammenhängender Graph mit einem Startpunkt. (ii) ergibt die Auszahlungsfunktion. (iii)Die
Zerlegung der Knoten in die Mengen Si gibt an, welcher Spieler am Zug ist, und trennt die
zufälligen Züge (S0) von den Spielerzügen ab(S1,…Si). (iv) Definiert eine Zufallsverteilung bei
jedem zufälligen Zug.(v)Diese Mengen Sji werden als Informationsmengen eines Spielers
bezeichnet. Ihren Knoten sind aufgrund der von ihm gemachten Züge und der Information über die
Züge der anderen Spieler nicht unterscheidbar für den Spieler.
Definition 2.2 (vollständige Information)
Bei Spielen mit perfekter Information ist jedem Spieler zum Zeitpunkt einer Entscheidung stets
das vorangegangene Spielgeschehen, d.h. die zuvor getroffenen Entscheidungen seiner Mitspieler
sowie die zuvor getroffenen Zufallsentscheidungen, vollständig bekannt.
Beispiele für Spiele mit perfekter Information sind Brettspiele wie Schach, Mühle und
Backgammon. Gegenbeispiele sind Kartenspiele wie Skat und Poker sowie Spiele mit simultanen
Zügen wie Schere-Stein-Papier.
Sei Γ ein n-Personenspiel in extensiver Form.
(i) Ein
Spieler i hat vollständige (perfekte) Information, wenn |Sji| = 1
gilt. Das Spiel Γ ist ein Spiel mit vollständiger Information wenn alle
vollständige (perfekte) Informationen besitzen
Spieler in Γ
Beispiel 2.3
(Verteilungsspiel). Zwei gleiche Objekte sollen auf zwei Spieler verteilt werden. Spieler 1 schlägt
die Aufteilung vor, Spieler 2 akzeptiert den Vorschlag oder lehnt ihn ab. Wenn Spieler 2 akzeptiert,
werden die Objekte so aufgeteilt, wie von Spieler 1 vorgeschlagen, ansonsten erhält keiner der
Spieler etwas. Darstellung als Spielbaum:
A
Spieler 1
(2,0)
(1,1)
B1
Spieler 2
B2
j
(2,0)
(0,2)
n
(0,0)
B3
j
n
j
n
(1,1)
(0,0)
(0,2)
(0,0)
- Anfangspunkt des Baumes: A
- Spielermengen:
S1= {A}
- Informationsmengen: S11={A}
S2= {B1,B2,B3}
S2 ={B1}; S22={B2} ; S23={B3}
1
3. Spiele in Normalform
Definition 3.1 (Normalform)
In der Spieltheorie bezeichnen Spiele in Normalform diejenigen Spiele, bei denen alle Spieler ihre
Strategien zeitgleich und ohne Kenntnis der Wahl der anderen Spieler festlegen.
Sie unterscheiden sich von den Spielen in Extensivform, bei denen die Spieler ihre
Entscheidungen zu unterschiedlichen Zeitpunkten treffen müssen und dabei teilweise oder
vollständige Kenntnis der bereits getätigten Züge der Mitspieler haben können.
Ein n-Personen-Spiel in Normalform ist gegeben durch:
(i) eine Spielermenge I = {1, . . . , n} bzw. I = {0, 1, . . . , n}, falls es Zufallseinflüsse gibt (Spieler
0).
(ii) die Strategiemengen ∑1, . . . , ∑i der einzelnen Spieler und ∑0, die Strategiemenge für Spieler 0
mit ihren Verwirklichungswahrscheinlichkeiten.
(iii) eine Auszahlungsfunktion mit
π((σ0), σ1, . . . , σn) = (π1((σ0), σ1, . . . , σn), . . . , πn((σ0), σ1, . . . , σn)),
die jeder Strategienkombination ((σ0), σ1, . . . , σn) einen Erwartungswert der Auszahlungsfunftion
πi((σ ), σ , . . . , σn)) für jeden Spieler i = 1,…,n zuordnet
0
1
Die Durchführung eines Spiels besteht darin, dass jeder Spieler eine Strategie aus seiner
Strategiemenge ∑i wählt – ohne die Entscheidung der Mitspieler zu kennen. Die sich ergebende
Strategienkombination beurteilt dann jeder Spieler entsprechend seiner Auszahlungsfunktion.
Folgerung 3.2
Ein Spiel Γ lässt sich als n-dimensionale Anordnung mit n-dimensionalen Auszahlungsvektoren
darstellen. Diese Darstellung heißt Normalform des Spiels Γ.
Beispiel 3.3 (ohne) Wahrscheinlichkeiten
S
Spieler 1
Schere
S
1
Papier
Stein
1
2
S
2
2
S
Spieler 2
Papier
Schere
Sch.
(0,0)
-
(-1,1)
.
St.
Stein
(1,-1)
(1,-1)
3
2
Pap
(0,0)
Pap.
Sch.
(-1,1) (-1,1)
St.
(1,-1)
(0,0)
Anzahl der Spieler :
I = {1,2}
Strategiemengen:
∑1= {Schere,Stein,Papier} ∑2 ={Schere‘,Stein‘,Papier‘}
Strategie: σi ist die gespielte Strategie des Spielers i σi ∈∑i
Auszahlungsfunktion:
z.B. π(Schere,Schere‘) = ( π1(Schere,Schere‘) , π2(Schere,Schere‘)
(0,0)
= (
0
,
0
)
Dazugehörige Normalform:
Spieler 2
Spieler 1
Schere
Stein
Papier
Schere
(0,0)
(-1,1)
(1,-1)
Stein
(1.-1)
(0,0)
(-1,1)
Papier
(-1,1)
(1,-1)
(0,0)
Beispiel 3.4 (mit Wahrscheinlichkeiten)
S
Spieler 1
1/4
Schere
S
1
1/4
1/2
Stein
1
2
Papier
S
2
2
S
Spieler 2
2/3
Papier
0
Schere
1/3
Stein
(0,0) 1/12(-1,1) 1/6(1,-1)
0
Sch.
1/3
St.
2/3
0
.
Pap
3
2
Sch.
2/3
Pap.
1/3
St.
(0,0) 1/3(-1,1) (0,0) 1/12(1,-1)
(0,0)
(0,0)
Dazugehörige Normalform
Spieler 2
Spieler 1
Schere
Stein
Papier
Schere
(0,0)
(-1/12,1/12)
(1/6,-1/6)
Stein
(0,0)
(0,0)
(-1/3,1/3)
Papier
(0,0)
(1/12,-1/12)
(0,0)
Definition 3.5 (endliche Spiele)
Ein n-Personen-Spiel heißt endlich, wenn alle Si kompakte Teilmengen sind d.h. wenn Γ nur
endlich viele Knoten enthält
4. Equilibrium
Zur Beurteilung eines Spiels kann man die Menge aller Strategienkombinationen analysieren, da
der Ausgang des Spiels durch die gewählte Strategienkombination festgelegt ist. Aus Sicht eines
einzelnen Spielers ist es interessant die Wahl der eigenen Strategie im Vergleich zu einer
Festlegung der Strategien der Mitspieler zu beurteilen.
Das Equilibrium ist ein zentraler Begriff der mathematischen Spieltheorie. Es beschreibt in Spielen
einen Zustand eines strategischen Gleichgewichts, von dem ausgehend kein einzelner Spieler für
sich einen Vorteil erzielen kann, indem er allein seine Strategie verändert.
Definition 4.1
Eine Strategienkombination σ* = (σ *, σ *, …,σn* ) heißt im Gleichgewicht oder Equilibrium n - Tupel ,
1
2
wenn für jedes i = 1,…,n und für jedes σi* ∈∑i gilt:
πi (σ1* ,…, σn*)
≥ πi ( σ1* ,…, σi-1* , σi , σi+1* ,…,σn*)
Ein n-Tupel von Strategien ist im Gleichgewicht, wenn das Abweichen von der Strategie zu keiner
Verbesserung führt, wobei die anderen Spieler stets ihre Strategien beibehalten.
Nicht jedes Spiel besitzt ein Gleichgewichts n-Tupel in solchen Spielen wollen die Spieler ihre
Strategie sehr geheim halten.Dies lässt vermuten ,dass in Spielen mit vollständiger Information
Gleichgewichts n-Tupel existieren.
Definition 4.2 (Zerlegung eines Spiels)
Ein Spiel Γ heißt am Knoten X zerlegt, wenn es keine Informationsmenge gibt, die sowohl X oder
Nachfolgerknoten als auch andere Knoten enthält. Dann lässt sich Γalso zerlegen in:
-
Teilspiel Γx mit Startknoten X und dessen Nachfolgern
Quotientenspiel Γ/X mit Endknoten X und dem Restbaum. Die Auszahlung an X ist
die Auszahlung beim Ausspielen von Γx
Satz 4.3
Sei Γ zerlegt an X. Für σi ∈∑i sei πx (σ1Γx , … , σnΓx ) die Auszahlung am Endknoten X des
Quotientenspiels Γ/X
Dann gilt:
π(σ1, . . . , σn) = π Γ/X ( σ1Γ/X , … , σnΓ/X)
Beweis:
Sei px = px(σ1, . . . , σn) die Wahrscheinlichkeit, dass Knoten X mit Strategien σi erreicht wird.
Dann gilt:
π(σ1, . . . , σn)
= px *π(σ1, . . . , σn) + (1-px ) π(σ1, . . . , σn)
= px * πx (σ1Γx , … , σnΓx ) + (1-px ) π ( σ1Γ/X , … , σnΓ/X)
= π Γ/X ( σ1Γ/X , … , σnΓ/X)
Satz 4.4
Sei Γ zerlegt an X und seien σi ∈∑i i so gewählt, dass
i)
(σ1Γx , … , σnΓx ) ein Equilibrium von Γx und
ii) ( σ1Γ/X , … , σnΓ/X) ein Equilibrium von Γ/X ist.
Dann gilt:
(σ1, . . . , σn) ist ein Equilibrium von Γ
Beweis:
Sei σi* ∈∑i dann gilt:
πi ( σ1,…, σi-1, σi *, σi+1 ,…,σn)
= π ( σ1Γ/X , … , σi*Γ/X ,…, σnΓ/X) mit Auszahlung
πi ((σ1Γx , … , σi*Γx , … σnΓx ) an X (Satz 4.3)
<=π ( σ1Γ/X , … , σi*Γ/X ,…,σnΓ/X) mit Auszahlung
πi ((σ1Γx , … , σi|Γx , … σnΓx ) an X (nach i)
<=π ( σ1Γ/X , … , σnΓ/X) mit Auszahlung πi ((σ1Γx , … , σi|Γx , … σnΓx ) an X (nach ii)
= πi (σ1, . . . , σn) (nach Satz 4.3)
Satz 4.5
Jedes endliche Spiel mit vollständiger Information besitzt ein Equilibrium.
Beweis: Durch Induktion über die Höhe h des Spielbaums Γ
- h = 1: Höchstens ein Spieler macht einen Zug und wählt die für ihn beste Alternative.
- Ist h > 1: lässt sich Γ wegen vollständiger Information in kleinere
Spielbäume zerlegen. Diese besitzen nach Induktionsvoraussetzung Equilibiria. Damit
besitzt nach Satz 4.4 auch Γ ein Equilibrium.
Ein einfacher Algorithmus zur Identifizierung von Gleichgewichten:
Liegt ein Spiel in strategischer Form vor, so lassen sich alle Equilibria in reinen Strategien durch
folgenden Algorithmus bestimmen:
- Optimiere die Entscheidung von Spieler i=1,...,n bei (beliebig) fixierten Strategien aller
anderen Spieler: Markiere die unter diesen Umständen erreichbaren höchsten Auszahlungen
für Spieler i. Wiederhole dies für alle möglichen Strategiekombinationen der anderen
Spieler.
- Führe 1. für alle Spieler durch. Dann sind genau die Strategienkombinationen
Equilibria, bei denen alle Auszahlungen markiert sind.
Spieler2
Spieler2
Spieler2
links
mitte
rechts
Spieler1
oben
4,2
1,1
2,0
Spieler1
mitte
2,3
1,1
1,4
Spieler1
unten
3,0
0,2
1,3
Dann funktioniert der Algorithmus wie folgt:
• i = 1:
• gegeben Spieler 2 spielt Rechts: Für Spieler 1 ist oben optimal – markiere die 2
• gegeben Spieler 2 spielt Mitte: oben und mitte ist optimal – markiere die beiden 1en
• gegeben Spieler 2 spielt Links: oben ist optimal – markiere die 4
•
• i = 2:
• gegeben Spieler 1 spielt oben: Für Spieler 2 ist Links optimal – markiere die 2
• gegeben Spieler 1 spielt mitte: Rechts ist optimal – markiere die 4
• gegeben Spieler 1 spielt unten: Rechts ist optimal – markiere die 3
Das eindeutige Equilibrium n-Tupel ist also die Strategie die zur Auszahlung 4, 2 führt
Herunterladen