Algorithmische Spieltheorie

Werbung
Algorithmische Spieltheorie
im Wintersemester 2016/17
- Dr. Oliver Schaudt -
Universität zu Köln
Mathematisches Institut
8. März 2017
Inhaltsverzeichnis
Inhaltsverzeichnis
1 Mechanism Design
1.1 Eingutauktionen . . . . . . . . . . .
1.1.1 Erstpreisauktionen . . . . .
1.1.2 Zweitpreisauktionen . . . . .
1.2 Auktionen bei gesponsorter Suche .
1.3 Myerson’s Lemma . . . . . . . . . .
1.4 Rucksackauktionen . . . . . . . . . .
1.5 Jenseits der Anreizkompabilität . .
1.6 Gewinnmaximale Auktionen . . . .
1.7 Fast-optimale Auktionen . . . . . .
1.7.1 Die Propheten-Ungleichung
1.8 Mehr-Parameter Umgebungen . . .
1.9 Mechanism Design ohne Geld . . .
2 Der
2.1
2.2
2.3
2.4
2.5
2.6
2.7
1
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
2
2
2
2
3
4
7
8
9
11
11
14
16
Preis der Anarchie
Braess’ Paradoxon . . . . . . . . . . . . . . . . . .
Pigou-Netzwerke . . . . . . . . . . . . . . . . . . .
Der Preis der Anarchie für atomare Flüsse . . .
Hierarchie von Gleichgewichten . . . . . . . . . .
Der Preis der Anarchie bei Maximierungsspielen
Glatte Spiele . . . . . . . . . . . . . . . . . . . . .
Preis der Stabilität . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
20
20
20
23
26
27
30
31
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
3 Die Berechnung von Gleichgewichten
34
Abbildungsverzeichnis
36
Liste der Algorithmen
36
Mitschrift der Vorlesung von Dario Antweiler. Keine Garantie auf Richtigkeit oder Vollständigkeit. Lob, Kritik, Kommentare an [email protected]. Lizensiert unter (CC
BY-SA 4.0). Stand 8. März 2017.
= hier fehlt noch etwas
1
Mechanism Design
Im Mechanism Design untersucht man die Frage, welche Kriterien ein Regelsystem erfüllen
muss, um zu ’funktionieren’.
Beispiel. Ein Mechanismus der nicht funktioniert hat: Turniermodus, Badminton Olympia
2012. Vor dem entscheidenden Spiel CHN vs. KOR in Gruppe B stehen folgende Tabellen:
Gruppe A
DEN
CHN
***
***
Punkte
6
4
2
0
Gruppe B
CHN
KOR
***
***
Punkte
4
4
2
0
Der Sieger von Gruppe B müsste geben die hochfavorisierten Chinesen aus Gruppe A
antreten, der zweitplatzierte ’nur’ gegen die Dänen. Beide Teams wurden disqualifiziert, da
sie absichtlich schlecht spielten. Es fehlen ’Anreizkompabilitäten’.
1.1
Eingutauktionen
Angenommen ein Anbieter stellt ein einzelnes Gut zum Verkauf. Es gibt eine Menge N =
{1, . . . , n} von Bietern. Wie definiert man Auktionen, bei denen klar ist, wie sich die Bieter
verhalten? Das hängt vom Folgenden ab:
• Was sind die Bieter bereit zu zahlen?
• Wie verhalten sich Bieter?
Wir treffen die folgenden Annahmen:
• Jeder Bieter i ∈ N hat eine Bewertung vi ∈ R≥0 . Das entspricht dem Preis, den Bieter
i bereit wäre, zu zahlen
• Diese vi sind privat, d.h. anderen Bietern unbekannt
• Der Nutzen des Bieters i ist 0, wenn er das Gut nicht ersteht und vi − p sonst. Dabei
ist p der Preis, den Spieler i zahlt.
Definition. Die letzte Bedingung heißt quasi-lineares Nutzenmodell. Die Bieter geben
parallel und verdeckt ihr Gebot bi ab.
1.1.1
Erstpreisauktionen
Dabei erhält der Spieler i mit dem höchsten Gebot bi den Zuschlag. Er zahlt p = bi . Problem:
Es ist nicht klar, wie die Bieter sich verhalten. Zudem ist der Mechanismus anfällig für
Manipulationen durch Bieter, wenn die Gebote teilweise bekannt ist.
1.1.2
Zweitpreisauktionen
Dabei erhält der höchstbietende Bieter das Gut und er zahlt das zweithöchste Gebot als
Preis p. (eBay) Die Bieter haben eine dominante Strategie, d.h. es gibt für jeden Bieter eine
Wahl des Gebots, welche den Nutzen maximiert. Die Eigenschaft, den Nutzen zu maximieren
ist unabhängig von den Geboten der anderen Spieler.
Lemma 1.1. Bei einer Zweitpreisauktion hat jeder Bieter i ∈ N die dominante Strategie bi = vi zu setzen.
17.10.16
VL01
1
3
MECHANISM DESIGN
Beweis. Fixiere i ∈ N und auch die Gebote der anderen Bieter außer i. Wir müssen zeigen,
dass
ui (b1 , . . . , bi−1 , vi , bi+1 , . . . , bn ) ≥ ui (b1 , . . . , bi−1 , bi , bi+1 , . . . , bn )
für bi ∈ R≥0
Sei bi ∈ R und B = maxj∈N ∖i bj . Ist bi < B, dann ist der Nutzen unter dem Gebot bi gleich 0.
Ist bi ≥ B, dann ist der Nutzen höchstens max {0, vi − B}. Angenommen vi < B. Dann ist der
maximal erreichbare Nutzen 0. Dieser wird erreicht von vi . Im Fall vi = B ist der maximale
Nutzen gleich 0. Im Falle, dass Bieter i den Zuschlag erhält ist sein Nutzen vi − B = 0. Sei
also vi > B. Dann erhält Bieter i das Gut auf jeden Fall. Sein Nutzen ist höchstens vi − B
und diesen Nutzen erreicht er mit dem Gebot vi .
Lemma 1.2. Bietet ein Bieter wahrheitsgemäß, hat er nichtnegativen Nutzen.
Beweis. Erhält Bieter i ∈ N den Zuschlag nicht, hat er Nutzen 0. Andernfalls ist sein Nutzen
ui (b) = vi − p, wobei p ≤ bi = vi .
Definition. Die Eigenschaft eines Mechanismus, dass wahrheitsgemäßes Bieten eine
dominante Strategie ist und wahrheitsgemäßes Bieten nicht-negativen Nutzen garantiert, nennt man Anreiz-Kompabilität (engl. dominant strategy incentive compatible bzw.
DSIC )
Wir wünschen uns noch zwei weitere Eigenschaften:
• Wenn alle Bieter wahrheitsgemäß bieten, wird der soziale Überschuss maximiert:
n
max ∑ vi xi ,
i=1
⎧
⎪
⎪1,
mit xi = ⎨
⎪
0,
⎪
⎩
wenn i Gut erhält
sonst
• Die Auktion kann in Polynomialzeit implementiert werden
Definition. Auktionen mit diesen drei Eigenschaften nennen wir gut.
Satz 1.3. Die Zweitpreisauktion ist gut.
Beweis. Lemma 1.1/2 gibt Anreiz-Kompabilität. Das Gebot geht an den Bieter i ∈ N mit
maximalen bi = vi . Die Auktion lässt sich sogar in Linearzeit implementieren.
1.2
Auktionen bei gesponsorter Suche
Solche Auktionen werden u.a. bei Suchmaschinen verwendet, um Werbung zu platzieren.
Beispiel. Verschiedene Felder auf der Ergebnisseite von Google haben eine unterschiedliche
Attraktivität für den Werbenden.
Wird ein Schlüsselbegriff eingegeben, werden damit verbundene Anzeigen geschaltet.
Die verschiedenen Felder haben unterschiedliche Attraktivität für den Werbenden. Im Standardmodell gibt es wieder N = {1, . . . , n} als Bietermenge. Diese bieten darum, auf einem
möglichst attraktives Feld angzeigt zu werden. Es gibt K Felder in denen Werbung angezeigt wird. Die Attraktivität eines Feldes messen wir mit seiner Klickrate. Dies ist eine
Wahrscheinlichkeit, mit der auf das Feld geklickt wird.
19.10.16
VL02
1
4
MECHANISM DESIGN
• Die Klickrate von Feld j sei αj
• Wir nehmen an, dass α1 ≥ α2 ≥ ⋅ ⋅ ⋅ ≥ αk
• Jeder Bieter i ∈ N hat den Wert vi eines Klicks
• Der Wert von Feld j für Bieter i ist αj vi
Beispiel. Google benutzt eine verallgemeinerte Zweitpreisauktion. Dabei erhält der Höchstbietende das erste Feld und zahlt das zweithöchste Gebot. Der Zweithöchstbietende erhält
das zweite Feld zum Preis des dritthöchsten Gebots usw. Der Mechanismus ist nicht anreizkompatibel. Angenommen n = 3 mit vi = 7, v2 = 6, v3 = 1. Es gibt zwei Felder mit
α1 = 1 und α2 = 0, 4. Wahrheitsgemäßes Bieten liefert b1 = 7, b2 = 6, b3 = 1. Damit ist
u1 (7, 6, 1) = α1 vi − p1 = 7 − 6 = 1. Bietet Bieter 1 stattdessen b′1 = 5, hat er den Nutzen
u1 (5, 6, 1) = α2 v1 − p1 = 2, 8 − 1 = 1, 8 > 1. Facebook nutzt einen guten Auktionsmechanismus.
Wie sieht ein guter Mechanismus überhaupt aus? Diesen entwickelt man in zwei Schritten:
Schritt 1 Angenommen, die Bieter bieten wahrheitsgemäß. Wie sollen wir dann die Felder
verteilen, sodass der soziale Überschuss maximiert wird?
Schritt 2 Gegeben ein Mechanismus zur Verteilung der Felder aus Schritt 1. Welche Preise
machen den Mechanismus anreizkompatibel?
Schritt 1 ist klar: Wir ordnen dem j-höchsten Bieter das j-beste Feld zu. Damit maximieren wir ∑ vi xi , wobei
⎧
⎪
⎪αj
xi = ⎨
⎪
0
⎪
⎩
wenn Bieter i Feld j ersteht
sonst
Zur Realisierung von Schritt 2 benutzen wir ein allgemeines Werkzeug:
1.3
Myerson’s Lemma
Wir befassen uns mit Ein-Parameter-Umgebung. Dabei haben wir die Bieter N = {1, . . . , n}
und jeder Bieter i ∈ N hat ein Wert vi . Zudem gibt es eine Menge X ⊆ Rn von Allokationen.
Für x ∈ X ist xi die Menge von Gut, die Bieter i erhält. Das vi ist der Wert einer Einheit
an Gut.
Beispiel.
n
• Eingutauktionen: X = {x ∈ {0, 1} ∶ ∑ni=1 xi ≤ 1}
• Gesponsorte Suche: X = {(απ(1) , . . . , απ(n) ) ∶ π ∈ Sn }. Dabei ist αj+1 = ⋅ ⋅ ⋅ = αn = 0
Unsere Auktionen laufen wie folgt ab:
1. Die Gebote werden gesammelt: b = (b1 , . . . , bn ) ∈ Rn≥0
2. Es wird eine Allokation X(b) ∈ X ausgewählt (Allokationsregel )
3. Ein Zahlungsvektor p(b) ∈ Rn≥0 wird ausgewählt (Zahlungsregel )
Weiterhin gilt für das quasi-lineare Nutzenmodell:
ui (b) = vi xi (b) − pi (b)
Dabei fordern wir pi (b) ∈ [0, bi xi (b)]. Damit gilt, das wahrheitsgemäßes Bieten nicht-negativen
Nutzen hat. Die Zahlungsregel ist unabhängig von den vi .
24.10.16
VL03
1
5
MECHANISM DESIGN
Definition. Eine Allokationsregel x nennen wir implementierbar, wenn es eine Zahlungsregel p gibt, sodass (x, p) ein anreizkompatibler Mechanismus ist.
Beispiel. Die Eingutauktion bei der dem Höchstbietenden das Gut zugewiesen wird, ist
implementierbar mit Hilfe der Zweitpreisregel.
Definition. Eine Allokationsregel x nennen wir monoton, falls
xi (b1 , . . . , bi−1 , bi , bi+1 , . . . , bn ) ≤ xi (b1 , . . . , bi−1 , b′i , bi+1 , . . . , bn )
0 ≤ bi ≤ b′i
Satz 1.4 (Myerson’s Lemma). Fixiere eine Ein-Parameter-Umgebung. Dann gilt:
1. Eine Allokationsregel ist implementierbar genau dann, wenn sie monoton ist
2. Ist x eine monotone Allokationsregel, dann existiert eine eindeutige Zahlungsregel
p, sodass (x, p) anreizkompatibel ist (sofern pi = 0 bei bi = 0 ist!)
3. Es gibt eine explizite Formel, die das p aus 2.) beschreibt
Beweis. ”⇒”: Angenommen die Allokationsregel x ist implementierbar. Sei p eine Zahlungsregel so, dass (x, p) ein anreizkompatibler Mechanismus ist. Fixiere i ∈ N und
b1 , . . . , bi−1 , bi+1 , . . . , bn ∈ R≥0
Für λ ∈ R≥0 schreiben wir x(λ) bzw. p(λ) für
xi (b1 , . . . , bi−1 , λ, bi+1 , . . . , bn )
bzw.
pi (b1 , . . . , bi−1 , λ, bi+1 , . . . , bn )
Sei 0 ≤ y < z. Setzen wir vi = z liefert die Anreizkompatibilität:
ui (z) = z ⋅ x(z) − p(z) ≥ z ⋅ x(y) − p(y) = ui (y)
(1)
Ebenso könnte vi = y sein daher gilt
y ⋅ x(y) − p(y) ≥ y ⋅ x(z) − p(z)
(2)
Wir erhalten
(1)
(2)
z ⋅ (x(y) − x(z)) ≤ p(y)p(z) ≤ y(x(y) − x(z))
Aus (3) folgt
(3)
(z − y)(x(y) − x(z)) ≤ 0
also x(y) ≤ x(z). Somit ist x monoton. ”⇐”: Sei nun x eine beliebige monotone Allokationsregel. Wir suchen eine Zahlungsregel p so, dass (x, p) anreizkompatibel ist. Wir schränken
uns auf den Fall ein, dass x stückweise konstant ist.
Um die Zahlungsregel p herzuleiten, untersuchen wir wieder (3). Sei z ≥ 0 fest und h > 0
sehr klein. Dann muss gelten:
(z + h)(x(z) − x(z + h)) ≤ p(z) − p(z + h) ≤ z(x(z) − x(z + h))
Ist z keine Sprungstelle, dann ist x(z) = x(z + h). Insbesondere p(z) = p(z + h). Ist z eine
Sprungstelle, dann ist x(z + h) − x(z) = sj , wobei z = zj . Also ist p(z + h) − p(z) = zj ⋅ sj .
Somit ist p gegeben durch
l
p(z) = ∑ zj sj
j=1
(4)
1
6
MECHANISM DESIGN
x(λ)
s3
s2
s1
z1
z2
z3
λ
z4
Abbildung 1: Stückweise konstante Zahlungsregel
wobei l = max {j ∶ zj < z} Ist z ≤ z1 , dann ist p(z) = 0. Ist x differenzierbar, dann folgt aus
(3), dass
p′ (z) = z ⋅ x′ (z)
Dann gilt p(z) = ∫0 λ ⋅ x′ (λ) dλ. Sei nun p durch (4) definiert. Es bleibt zu zeigen, dass
(x, p) anreizkompatibel ist. Sei x wieder stückweise konstant. Angenommen Bieter i bietet
wahrheitsgemäß bi = vi . Der Bieter zahlt ∑lj=1 zj sj = p(bi ), wobei l = maxj {j ∶ zj < bi }. Der
Nutzen von Bieter i entspricht genau der restlichen Fläche.
z
x(λ)
u(vi ) = vi · x(vi ) − p(vi )
x(vi )
z 2 s2
z 1 s1
vi
λ
Abbildung 2: Die grau markierte Fläche ist vi ⋅ x(vi ) und der Nutzen ergibt sich als die graue
Fläche unterhalb der Zahlungsfunktion
Bei Unterbieten, d.h. bi < vi passiert das folgende: Insgesamt ist ui (bi ) maximal bei
bi = vi , somit ist wahrheitsgemäßes Bieten eine dominante Strategie. Zudem haben wir dabei
nicht-negativen Nutzen. Somit ist (x, p) anreizkompatibel.
Damit lässt sich die Zahlungsregel für Auktionen zur gesponsorten Suche hinschreiben.
Seien Klickraten α1 ≥ α2 ≥ ⋅ ⋅ ⋅ ≥ αk gegeben. Zudem sei b = (b1 , . . . , bn ) ein Gebotsvektor.
Nach Umnummerieren gilt b1 ≥ b2 ≥ ⋅ ⋅ ⋅ ≥ bn . Bei unserer Allokationsregel erhält der Höchstbietende α1 , der Zweithöchstbietende α2 usw. Halten wir b2 , . . . , bn fest, hat Bieter 1 folgende
Allokationsfunktion: Bild Somit gilt
k
pi (b) = ∑ bj+1 (αj − αj+1 )
j=1
1
7
MECHANISM DESIGN
wobei αk+1 = 0. Das gilt nach Myersons Lemma. Angenommen die Bieter zahlen pro Klick.
Dann sollte Bieter i pro Klick α1 zahlen. Damit wäre die erwartete Zahlung von Bieter i
gleich αi ⋅ α1i pi (b) = pi (b). Es gilt
k
αj − αj+1
1
pi (b) = ∑ bj+1
αi
αi
j=i
Dabei ist 0 ≤
αj −αj+1
αi
≤ 1 und
αj − αj+1 αi − αk+1
=
=1
αi
αi
j=i
k
∑
Also ist
1.4
1
p (b)
α i
eine Konvexkombination aus den niedrigeren Geboten.
26.10.16
VL04
Rucksackauktionen
In einer Rucksackauktion hat jeder Bieter i ∈ N eine Größe wi und eine Bewertung vi . Der
Anbieter hat eine Kapazität W und die zulässigen Allokationen sind die 0−1-Vektoren x ∈ Rn
mit ∑ni=1 wi xi ≤ W . Die Auktionen, in der die Bieter auf Plätze im Rucksack bieten ist eine
Ein-Parameter-Umgebung. Wir wollen eine gute Auktion definieren. Für Schritt 1 brauchen
wir eine Allokationsregel x, welche bei wahrheitsgemäßen Geboten den sozialen Überschuss
maximiert. Ist b so ein Gebotsvektor, muss gelten
n
x(b) = arg max ∑ bi xi
x∈X i=1
d.h. x(b) ist eine Optimallösung von max ∑ni=1 bi xi wobei x ∈ [0, 1]n und ∑ni=1 xi wi ≤ W .
Schritt 2 erledigen wir mit Myersons Lemma. Jeder Bieter erhäl 0 oder 1 an Gut. Sind
b1 , . . . , bi−1 , bi+1 , . . . , bn feste Gebote, dann existiert ein Wert ci ∈ R≥0 . Bieter Bieter i weniger,
erhält er 0, sonst 1. Das Paar (x, p) ist ein anreizkompatibler Mechanismus, sofern x monoton
ist. Zudem wird der soziale Überschuss maximiert.
Das Problem ist: Das Berechnen von x(b) ist N P-schwer, d.h. wir können x(b) nicht mit
einem Polynomialzeitalgorithmus berechnen, außer P = N P. Es somit vermutlich keine gute
Auktion.
Satz 1.5. Es gibt keine gute Rucksackauktion, außer P = N P.
Wenn wir die Bedingung, den sozialen Überschuss zu maximieren, relaxieren, dann können wir eine ”näherungsweise gute” Rucksackauktion definieren. Dazu nutzen wir den GreedyAlgorithmus zur Approximation des Rucksackproblems. Wir nehmen an, dass Wi ≤ W für
alle i ∈ N .
• Schritt 1: Sortiere und nummeriere um, sodass für die Gebots-Größenverhältnisse gilt
b1
bn
≥ ⋅⋅⋅ ≥
w1
wn
• Schritt 2: Wähle die Bieter in dieser Reihenfolge als Gewinner aus, bis der nächste
Bieter nicht mehr in den Rucksack passt. Dann beende die Auswahl
• Schritt 3: Gebe die Lösung aus Schritt 2 aus, oder falls besser, den höchstbietenden
Bieter
Im Allokationsvektor setzen wir die in Schritt 3 gewählten Bieter auf 1, die übrigen auf 0.
31.10.16
VL05
1
8
MECHANISM DESIGN
Satz 1.6. Angenommen die Bieter bieten wahrheitsgemäß. Dann generiert unsere Allokationsfunktion mindestens die Hälfte des maximal erreichbaren sozialen Überschuss.
Beweis. Angenommen bi = vi für alle i ∈ N und wir könnten Bieter fraktional in den Rucksack packen. Packen wir Bieter i zum Bruchteil λ ∈ [0, 1] ein, dann hat er die Größe λ⋅wi und
bringt λ⋅bi an Gewinn. Die fraktionale Optimallösung bringt dem Anbieter stets mindestens
so viel wie die ganzzahlige Optimallösung. Eine Optimallösung des fraktionalen Rucksackproblems erhält man mit Schritt 1 und 2. Dabei packen wir in Schritt 2 den ersten nicht
mehr passenden Bieter zum maximalen Bruchteil rein. Es sei also
j
∑ wi + λ ⋅ wj+1 = W
i=1
für ein λ ∈ [0, 1]. Der maximal erreichbare soziale Überschuss sei OPT. Zudem sei OPTf der
maximal erreichbare Überschuss für das fraktionale Problem. Dann gilt
OPT ≤ OPTf
j
= ∑ vi + λvj+1
i=1
j
= ∑ bi + λbj+1
i=1
j+1
≤ ∑ bi
i=1
j
≤ 2 ⋅ max {∑ bi , bj+1 }
i=1
≤ 2 ⋅ Lösung des Greedy-Algorithmus
Diese Allokationsregel x ist monoton, d.h. Myerson’s Lemma liefert eine Zahlungsfunktion p, sodass (x, p) anreizkompatibel ist. Tatsächlich gibt es ein Polynomial Time Approximation Scheme (PTAS) für das Rucksackproblem, d.h. für jedes > 0 existiert ein
Polynomialzeit-Algorithmus, welcher mindestens (1 − ) des sozialen Überschuss generiert.
Kann man auch als monotone Allokationsregel implementieren. (Idee: ”Runden” der Objektgrößen)
Frage 1.7. Gibt es eine ’natürliche’ Einparameter-Umgebung, bei der die Maximierung
des sozialen Überschuss nur durch nicht-monotone Allokationsregeln gut approximiert
werden kann?
1.5
Jenseits der Anreizkompabilität
Im Wesentlichen bedeutet Anreizkompabilität zwei Dinge:
1. Es existiert für jeden Bieter, unabhängig von seiner privaten Information eine dominante Strategie
2. Diese dominante Strategie lautet ’Offenbarung’, d.h. Bieter teilen ihre private Information dem Mechanismus mit
Es gibt Auktionen die (1) erfüllen, aber nicht (2). Beispiel: Eine Zweitpreisauktion bei
der der Mechanismus, statt b den Gebotsvektor 2b verwendet. Eigenschaft (1) gilt, aber die
dominante Strategie ist bi = 21 vi , also gilt (2) nicht.
Dennoch gilt das ’Offenbarungsprinzip’: Zu jedem Mechanismus der (1) erfüllt, existiert
einer, der (1) und (2) erfüllt:
02.11.16
VL06
1
9
MECHANISM DESIGN
Satz 1.8. Zu jedem Mechanismus M in welcher jeder Teilnehmer eine dominante Strategie besitzt (unabh. von der privaten Information) existiert ein äquivalenter anreizkompatibler Mechanismus M ′ , d.h. M ′ liefert genau den gleichen Ausgang wie M , sofern
die privaten Informationen gleich sind und die Teilnehmer der Mechanismen sich nach
ihrer dominanten Strategie verhalten.
Beweis. Der Beweis nutzt folgendes Simulationsargument. Wir zeigen den Satz in der Sprache von Auktionen. Angenommen zur privaten Information vi nennt Bieter i das Gebot si (vi )
gegenüber M . M ′ ist nun der Mechanismus, welcher erst die ’Verschlüsselung’ si durchführt
und danach M . M ′ sammelt also die Gebote der Bieter, spielt dass die dominante Strategie
der Bieter durch und wendet dann M an. Die Bieter haben nun die dominante Strategie
ihre private Information vi gegenüber M ′ aufzudecken.
v1
v2
s1 (v1 )
s2 (v2 )
..
.
vn
M
sn (vn )
Abbildung 3: Situation im Beweis von Satz 1.8
Somit gilt: Die wesentliche Eigenschaft von Anreizkompabilität ist die Existenz von dominanten Strategien.
1.6
Gewinnmaximale Auktionen
Wir stellen die Frage, wie der Anbieter maximalen Gewinn erwirtschaften kann.
Beispiel. Angenommen wir haben einen Bieter in einer Eingutauktion. Wir interessieren
uns für anreizkompatible Mechanismen, um etwas über das Verhalten der Bieter sagen zu
können. Die Anreizkompabilität lässt nur folgenden Mechanismus zu: Der Mechanismus
wählt einen Preis r. Bietet der Bieter r oder mehr, erhält er das Gut zum Preis r. Sonst
passiert nichts. Der soziale Überschuss wird bei r = 0 maximiert. Der Gewinn des Anbieters
wird bei r = vi maximiert. Problem: vi ist privat!
Wir brauchen also Informationen über die vi . Dazu betrachten wir folgendes Standardmodell, das Bayes’sche Modell. Dabei haben wir
• eine Ein-Parameter-Umgebung
• Eine private Bewertung vi , i ∈ N. Dabei wird das vi aus dem Intervall [0, vmax ] zufällig
nach der Verteilung Fi mit Dichte fi gezogen
• Der Mechanismus kennt die vi nicht, wohl aber die Fi und fi , i ∈ N
Einschub: Dichtefunktion & Verteilungsfunktion
• Dichtefunktion: Gibt die Wahrscheinlichkeit an, mit der das vi aus dem Intervall
[a, b] stammt. Es gilt
P(vi ∈ [a, b]) = ∫
b
a
fi (x)dx
1
10
MECHANISM DESIGN
• Verteilung: Es gilt
Fi (x) = P(vi ≤ x) = ∫
x
0
fi (z)dz
Wir wollen die Auktionen bestimmen, welche den erwarteten Gewinn maximieren, d.h.
E(p(V )) → max
Wir unterstellen, dass die Bieter wahrheitsgemäß bieten.
Beispiel. Ein Bieter, Eingutauktion. Wenn wir den Preis r festlegen, haben wir bi = vi , also
ist
E(p(v1 )) = r ⋅ (1 − Fi (r)) = r ⋅ (1 − P(r < vi ))
Ist F1 bekannt, dann kann leicht das optimale r gefunden werden. Da nur Festpreisauktionen
anreizkompatibel sind, ist unsere Frage praktisch beantwortet. Bei zwei Bietern ist es etwas
komplizierter. Sagen wir, die Bieter haben eine Gleichverteilung zu Grunde liegen, d.h. f1 , f2
sind konstant auf [0, vmax ]. Die Zweitpreisauktion gibt einen Erlös von vmax
. Besser ist es,
3
einen Reservepreis r einzuführen. Dabei zahlt der Höchstbietende als Preis für das Gut,
sofern sein Gebot über dem Reservepreis liegt, max {r, v ′ }, wobei v ′ das zweithöchste Gebot
5
liefert einen erwarteten Erlös von 12
vmax .
ist. Ein Reservepreis r = vmax
2
Situation Wir betrachten Ein-Parameter-Umgebungen mit privaten Bewertungen vi . Der
Mechanismus kennt die Verteilung Fi der vi . Wir nehmen an, Fi hat die Dichte-Funktion fi
und Träger [0, vmax ].
Ziel Wir möchten den Ertrag ∑ pi (b) maximieren, über alle anreizkompatiblen Mechanismen.
• Schritt 0: Sei (x, p) ein anreizkompatibler Mechanismus und OE bieten Bieter wahrheitsgemäß, d.h. es reicht Ev∼F [∑ pi (v)] zu maximieren
• Schritt 1: Nach Myerson’s Lemma ist pi gegeben durch
pi (z, v) = ∫
z
0
λx′ (λ, v)dλ
falls x differenzierbar ist. Sei i und vj für i ≠ j fest. Dann gilt:
E [pi (z, v)] = ∫
=∫
vmax
z=0
vmax
λ=0
(∫
(∫
z
0
λx′i (λ, v) dλ) fi (z) dz
vmax
λ
fi (z) dz) λx′i (λ, v) dλ
= [(1 − Fi (λ) ⋅ λx′i (λ, v))]0 max − ∫
0
´¹¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¸¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹¶
λ
∞
xi (λ, v)(1 − Fi (λ) − λfi (λ)) dλ
=0
wobei die zweite Gleichung durch Vertauschung der Integrale und die dritte durch
partielle Integration gilt.
• Schritt 2: Wir betrachten diesen Term als Erwartungswert:
vmax
∫
0
(λ −
1 − Fi (λ)
1 − Fi (λ)
) fi (λ) ⋅ xi (λ, v)dλ = Eλ∼Fi [(λ −
) xi (λ, v)]
fi (λ)
fi (λ)
= Evi ∼Fi [(vi −
1 − Fi (vi )
) xi (v)]
fi (vi )
=∶ Evi ∼Fi [ϕi (vi )xi (v)]
07.11.16
VL07
1
11
MECHANISM DESIGN
Definition. Wir nennen ϕi (vi ) die virtuelle Bewertung und ∑ ϕi (vi )xi (v) den virtuellen sozialen Überschuss.
Fazit Es gilt: ’Erwarteter Ertrag’ = ’Erwarteter virtueller sozialer Überschuss’ bzw.
E [∑ pi (v)] = Ev∼F [∑ ϕi (vi )xi (v)]
(5)
Bemerkung. Betrachte eine Gleichverteilung auf [0, 1], also F (λ) = λ, fi (λ) = 1 und
ϕi (λ) = λ −
1−λ
= 2λ − 1
1
Frage Wie maximieren wir Gleichung 5? Wir haben keinen Einfluss auf ui (vi ), können
aber x modifizieren, unter der Voraussetzung, dass ∀v ∈ R ∶ x(v) ∈ X. Es liegt nahe, die
Gleichung für jeden Punkt individuell zu maximieren.
Definition. Die Allokation x, welche den virtuellen sozialen Überschuss maximiert
heißt die den virtuellen soialen Überschuss maximierende Allokation.
Beispiel. Betrachte folgende Eingutauktion: xi (v) ∈ {0, 1} und ∑ xi (v) ≤ 1. Obige Allokation teilt das Gut dem Bieter mit höchster virtueller Bewertung zu, sofern diese nicht-negativ
ist. Ansonsten erhält niemand das Gut.
Definition 1.9. Eine Verteilung heißt regulär, falls die zugehörige virtuelle Bewertung
streng monoton ist.
Bemerkung. Nehmen wir an, dass vi alle unabhängig, identisch verteilt sind und diese Verteilung regulär ist. Dann ist die den virtuellen sozialen Überschuss maximierende Allokation
monoton.
Satz 1.10. Gegeben fi , Fi für i ∈ N . Dann gilt für jeden anreizkompatiblen Mechanismus (x, p), dass
E [∑ pi (v)] = Ev∼F [∑ ϕi (vi )xi (v)]
i (v)
Dabei ϕi (vi ) = vi − 1−F
. Sind die Fi alle regulär, d.h. ϕi streng monoton steigend,
fi (vi )
dann ist die Allokationsregel x(v) = arg max ∑ni=1 ϕi (vi )xi (v) monoton. Nach Myersons
Lemma existiert eine Zahlungsfunktion p, sodass (x, p) anreizkompatibel ist.
1.7
Fast-optimale Auktionen
Wir betrachten Eingutauktionen. Sind die Fi alle gleich und regulär, dann ist eine Zweitpreisauktion mit Reservepreis erlösmaximal. Sind die Fi verschieden, dann entstehen kompliziertere Auktionen. Wenn man sich mit Auktionen zufrieden gibt, welche den optimalen Erlös
approximieren, kann man die Allokationsregel vereinfachen. Dafür brauchen wir folgendes
Werkzeug.
1.7.1
Die Propheten-Ungleichung
Angenommen, wir bekommen n Runden lang je einen Preis genannt. Unser Ziel ist, den
höchsten Preis abzugreifen. Formal:
14.11.16
VL08
1
12
MECHANISM DESIGN
• Wir kennen Verteilungen Gi , i ∈ N . Diese sind unabhängig
• In Runde i, i ∈ N wird ein Preis πi gemäß Gi gezogen
• In Runde i können wir πi akzeptieren, dann endet das Spiel. Oder wir lassen πi verfallen
und gehen zu Runde i + 1 über
• Wir wollen das abgegriffene πi maximieren
Satz 1.11 (Propheten-Ungleichung). Es gibt eine Zahl t0 , sodass folgende Strategie
einen erwarteten Erlös von mind. 12 E(maxi∈N ) hat: Wir akzeptieren das erste πi mit
πi ≥ t0 . Diese Strategie ist mind. halb so gut wie ein Prophet, der alle πi kennt.
Bemerkung. Wir zeigen den Satz für ’vernünftige’ Gi . Insbesondere für Gi , die von DichteFunktionen induziert sind.
Beweis. Angenommen wir haben einen Reservepreis t, unter dem wir die Preise nicht akzeptieren. Es sei p(t) die Wahrscheinlichkeit, dass wir einen der Preise akzeptieren. Es sei
q(t) = 1 − p(t), also die Wahrscheinlichkeit von Erlös 0. Mit Wahrscheinlichkeit p(t) haben
wir einen Erlös von mindestens t. Akzeptieren wir πi , dann haben wir zusätzlich πi − t an
Erlös. Dies rechnen wir (der Einfachheit halber) nur dann ein, wenn πi der einzige Preis ist,
mit πi ≥ t, d.h. πj < t für j ≠ i. Wir erhalten:
E [Erlös bei Reservepreis t]
≥ p(t)t + ∑ E[πi − t ∣ πi ≥ t, πj < t, j ≠ i] ⋅ P(πi ≥ t) ⋅ ∏ P(πj < t)
j≠i
i∈N
≥ p(t)t + ∑ E[πi − t ∣ πi ≥ t] ⋅ P(πi ≥ t) ⋅ q(t)
≥ p(t)t + q(t) ⋅ ∑ E(πi − t)+ ∣ πi ≥ t) ⋅ P(πi ≥ t) + E((πi − t)− ∣ πi < t) ⋅ P(πi < t)
= p(t)t + q(t) ⋅ ∑ E(max {0, πi − t})
i∈N
= p(t)t + q(t) ⋅ ∑ E[(πi − t)+ ]
i∈N
Ein Prophet erwartet einen Erlös von
E ( max πi ) = E (t + max(πi − t))
i=1,...,n
≤ t + E (max(πi − t)+ )
n
≤ t + ∑ E((πi − t)+ )
i=1
Da die Gi vernüftig sind, können wir t0 wählen mit p(t0 ) =
beiden obigen Abschätzungen
1
2
= q(t0 ). Damit ist nach den
1
E (Erlös bei Reservepreis t0 ) ≥ E (max πi )
2
Wir betrachten wieder Eingutauktionen. Es seien wieder reguläre Verteilungen Fi gegeben. Wir interpretieren die virtuelle Bewertung ϕi (vi )+ als πi . Der Erlös der optimalen
Auktion ist, nach Satz 1.10
Ev∼F [∑ ϕi (vi )xi (v)] = E [max ϕi (vi )+ ]
Dies ist genau der erwartete Erlös eines Propheten, wenn die ϕi (vi )+ die Preise πi sind.
Somit sollten wir (wie in der Propheten-Ungleichung) folgende Auktion durchführen:
1. Wähle t0 so, dass P(max ϕi (vi )+ ≥ t0 ) =
1
2
23.11.16
VL09
1
13
MECHANISM DESIGN
2. Wähle einen Bieter mit ϕi (vi )+ ≥ t0 und gebe diesem das Gut. Mache dies auf monotone Art
Jede Allokationsregel dieser Art liefert als erwarteten Erlös mindestens die Hälfte dessen,
was die optimale Allokation (im Erwartungswert) liefert. Konkret können wir folgende Regel
verwenden:
1. Berechne t0 wie vorher. Setze ri ∶= ϕ−1
i (t0 ) als Reservepreis für Bieter i ∈ N
2. Gebe das Gut an den Bieter, der
(a) mindestens seinen Reservepreis bietet und
(b) unter diesen Bietern der höchstbietende ist
Der Bieter i, welcher den Zuschlag erhält, zahlt dann das Maximum aus dem Reservepreis
ri und dem zweithöchsten Gebot.
Satz 1.12. Es gibt einen anonymen Reservepreis, welcher mindestens
Erlös der optimalen Auktion liefert.
1
4
des erwarteten
Bemerkung. Es gibt Beispiele, bei denen ein anonymer Reservepreis höchstens 50% des
erwarteten Erlöses einer Auktion mit individuellen Reservepreisen liefert.
Beweis der Bemerkung. Wir nehmen zwei Bieter A, B. Die Verteilungen F1 und F2 seien
wir in der Abbildung.
FA (x)
FB (x)
1
1
1−ǫ 1
x
1
x
Abbildung 4: Die Verteilungen der beiden Bieter
• Sei r ein anonymer Reservepreis. Ist r ≤ 1, dann bietet B mindestens r und zahlt
max {v1 , r} ≤ 1. Ist r > 1, dann unterbietet A den Reservepreis. Die Wahrscheinlichkeit,
dass Bieter B mindestens r bietet ist
1
1
P(vB ≥ r) = 1 − P(vB < r) = 1 − (1 − ) =
r
r
Der erwartete Erlös ist
1
r
⋅ r = 1.
• Stattdessen können wir rA = 1 − und rB = H setzen. Bieter A bietet in jedem Fall rA .
Bieter B bietet mit Wahrscheinlichkeit H1 seinen Reservepreis rB . Ist H > 1, so gilt
E(Erlös) =
→0,H→∞
1
1
⋅ H + (1 − ) (1 − ) Ð→ 2
H
H
Die Frage, wie groß der ’Gap’ zwischen dem maximalen Erlös und dem Erlös mit (anonymen) Reservepreis ist, ist weitesgehend offen. Selbst in dem Fall von identisch verteilten
Bietern, d.h. F1 = ⋅ ⋅ ⋅ = Fn , muss man den anonymen Reservepreis berechnen, was ggf. schwierig ist. Folgendes Resultat zeigt, dass ein weiterer Bieter mindestens so viel bringt, wie den
optimalen Reservepreis zu kennen.
28.11.16
VL10
1
14
MECHANISM DESIGN
Satz 1.13. Es seien n Bieter mit der regulären Verteilung F gegeben. Es sei A die
erlösmaximale Eingutauktion dazu. Dann ist der erwartete Erlös von A höchstens der
erwartete Erlös der Zweitpreisauktion auf n + 1 nach F verteilten Bietern.
Beweis. Wir analysieren anstatt A die Auktion A′ mit n + 1 Bietern.
• Schritt 1: A wird auf den ersten n Bietern durchgeführt. Wird das Gut vergeben endet
die Auktion.
• Schritt 2: Wird das Gut nicht in Schritt 1 vergeben, dann erhält Bieter n + 1 das Gut
umsonst.
Wichtig: Unter A′ wird das Gut in jedem Fall vergeben. A′ ist anreizkompatibel. Nach
Satz 1.10 ist der erwartete Erlös gleich ϕi (vi ) für den Bieter i, welcher den Zuschlag erhält.
Bei der Zweitpreisauktion auf den n + 1 Bietern ist wieder der erwartete Erlös gleich ϕj (vj )
für den Bieter j mit maximalem vj . Da die ϕ1 = ⋅ ⋅ ⋅ = ϕn+1 monoton steigend sind, ist das
der Bieter mit maximalem ϕj (vj ). Somit ist stets ϕj (vj ) ≥ ϕi (vi ), somit ist nach Satz 1.10
der Erlös der Zweitpreisauktion mindestens so hoch wie der von A′ .
1.8
Mehr-Parameter Umgebungen
Wir haben jetzt nicht mehr nur ein Gut, auf welches geboten wird. Dazu haben die Bieter
verschiedene Bewertungen der Güter. Folgendes Modell gilt:
• Es gibt wieder n Bieter N = {1, . . . , n}
• Es gibt eine Menge Ω von Ergebnissen. Dies sind die möglichen Ergebnisse der Auktion
• Jeder Bieter i ∈ N hat für jedes Ergebnis ω ∈ Ω eine Bewertung vi (ω)
Beispiel. In einer Ein-Parameter-Umgebung werden wir Ω = X setzen, d.h. die Ergebnisse sind die Allokationsvektoren. Ist ω ∈ Ω ein Ergebnis, d.h. jeder Bieter gibt ein ∣Ω∣dimensionalen Bietvektor bi ab. Der Mechanismus wählt ein ω ∈ Ω als Allokation aus, dann
zahlen die Bieter.
Beispiel. Hier kann man wieder Eingutauktionen durchführen. Es gibt die n Ergebnisse,
bei denen genau ein Bieter das Gut erhält, und das n + 1-te Ergebnis, dass kein Bieter das
Gut erhält. Wir zeigen, dass diese abstrakten Auktionen stets einen Mechanismus zulassen,
welcher anreizkompatibel ist und den sozialen Überschuss maximiert. Dies ist der VickreyClarke-Grove-Mechanismus (VCG).
Wir nehmen zuerst wieder an, dass die Bieter wahrheitsgemäß bieten. Also ist bi (ω) =
vi (ω) für alle i ∈ N, ω ∈ Ω. Demnach ist die Allokationsregel festgelegt auf die Wahl des
ω ∗ ∈ Ω, welches des sozialen Überschuss maximiert. Also
n
n
x(b) = w∗ = arg max ∑ vi (ω) = arg max ∑ bi (ω)
ω∈Ω i=1
ω∈Ω i=1
Jetzt fehlt noch eine passende Zahlungsregel.
Dazu lassen wir einen Bieter i ∈ N zahlen, was er die übrigen Bieter an sozialen Überschuss kostet:
pi (b) = max ∑ bj (ω) − ∑ bj (ω ∗ )
ω∈Ω j≠i
j≠i
Äquivalent dazu ist folgende Zahlungsregel
⎛n
⎞
pi (b) = bi (ω ∗ ) − ∑ bj (ω ∗ ) − max ∑ bj (ω)
ω∈Ω j≠i
⎠
⎝j=1
Dabei ist
30.11.16
VL11
1
15
MECHANISM DESIGN
• bi (ω ∗ ) das Gebot von Bieter i und
• ∑nj=1 bj (ω ∗ ) − maxω∈Ω ∑j≠i bj (ω) der Anstieg des sozialen Überschusses durch das Mitbieten von Bieter i
Definition. Das Paar (x, p) ist der Vickrey-Clarke-Groves-Mechanismus (VCG).
Satz 1.14. Der VCG-Mechanismus ist anreizkompatibel und maximiert den sozialen
Überschuss.
Beweis. Fixiere Bieter i und Gebote b1 , . . . , bi−1 , bi+1 , . . . , bn . Sei bi das variable Gebot von
Bieter i. Bieter i maximiert seinen Nutzen
ui (b) = vi (ω ∗ ) − pi (b)
= vi (ω ∗ ) + ∑ bj (ω ∗ ) − max ∑ bj (ω)
ω∈Ω j≠i
j≠i
Sei ω ′ ∈ Ω, sodass vi (ω ′ ) + ∑j≠i bj (ω ′ ) maximal ist. Durch sein Gebot bi versucht Bieter
i den Mechanismus zur Wahl von ω ′ (oder gleichwertig) zu zwingen. Da
w∗ = arg max bi (ω) + ∑ bj (ω)
ω∈Ω
j≠i
wird bei dem Gebot bi = vi das Ergebnis ω ′ (oder ein gleich gutes Ergebnis) vom Mechanismus ausgesucht. Somit maximiert Bieter i seinen Nutzen durch wahrheitsgemäßes Bieten.
Es bleibt zu zeigen, dass ui (b) ≥ 0, wenn bi = vi ist. Wir zeigen pi (ω ∗ ) ≤ bi (ω ∗ ) für alle bi .
Daraus folgt die Aussage, da
ui (b) = vi (ω ∗ ) − pi (ω ∗ ) ≥ vi (ω ∗ ) − bi (ω ∗ ) = 0
Es gilt
n
n
max ∑ bj (ω) ≤ max ∑ bj (ω) = ∑ bj (ω ∗ )
ω∈Ω j≠i
und somit ist
ω∈Ω j=1
j=1
pi (ω ∗ ) = bi (ω ∗ ) − Rabatt ≤ bi (ω ∗ )
Das Problem ist in der Regel die Maximierung des sozialen Überschusses. Es kostet meistens die effiziente Berechenbarkeit. Diese Auktionen sind also nicht gut. Unter Umständen
kann die Maximierung des sozialen Überschuss auch den Erlös kosten, wie das folgende
Beispiel zeigt:
Beispiel. Es gebe zwei Objekte X, Y . Zudem haben wir zwei Bieter 1, 2.
• Bieter 1 möchte beide Objekte kaufen: v1 ({X, Y }) = 1, sonst 0
• Bieter 2 möchte X kaufen: v2 ({X} = v2 ({X, Y }) = 1, sonst 0
Wir führen eine kombinatorische Auktion durch. Die Ergebnisse sind Paare (S, T ) mit
S, T ⊆ {X, Y } , S ∩ T = ∅. Dabei ist v1 (S, T ) = v1 (S) und v2 (S, T ) = v2 (T ). Eine Allokation
unter VCG wäre ({X, Y } , ∅) = ω ∗ , diese maximiert den sozialen Überschuss. Offensichtlich
ist p2 (ω ∗ ) = 0. Der erste Bieter kostet den zweiten Bieter 1 Einheit sozialen Überschuss.
Daher ist p2 (ω ∗ ) = 1. Der Erlös ist also 1.
Jetzt kommt Bieter 3 dazu mit v3 ({X, Y } = v3 ({Y }) = 1, sonst 0. Der VCG-Mechanismus
muss ω ∗ = (∅, {X} , {Y }) wählen. Jetzt gilt p1 (ω ∗ ) = 0, p2 (ω ∗ ) = 0, p3 (ω ∗ ) = 0. Damit ist der
Erlös 0.
1
16
MECHANISM DESIGN
1.9
Mechanism Design ohne Geld
Problem Betrachte eine Gruppe von n Kindern K1 , . . . , Kn . Jedes Kind hat ein Geschenk
G1 , . . . , Gn . Manche Kinder hätten gerne das Geschenk eines anderen Kindes. Jedes Kind
Ki hat eine totale Ordnung πi auf den Geschenken
Gπi (1) < Gπi (2) < ⋅ ⋅ ⋅ < Gπi (n)
Frage Wie können wir durch sukzessives Tauschen von Geschenken, ein Lächeln in die
niedlichen Kindergesichter zaubern? Dies geht mit dem Top-Trading-Cycle-Algorithmus:
• Schritt 1: Jedes Kind Ki zeigt auf das Kind Kj , dessen Geschenk es am liebsten
hätte. Wir schreiben top(i) = j
• Schritt 2: Konstruiere einen gerichteten Graphen, dessen Knotenmenge die Kinder
sind und für alle Paare (i, j) mit top(i) = j eine gerichtete Kante (Ki , Kj )
• Schritt 3: Suche gerichteten Kreis C in dem Graphen. Dieser existiert, da jeder Knoten
eine ausgehende Kante hat
• Schritt 4: Tausche die Geschenke entlang des Kreises. Lösche die Kinder aus dem
Graphen. Gehe zu Schritt 1
Bemerkung.
• Der Algorithmus terminiert und jedes Kind erhält ein Geschenk
• Mit diesem Geschenk ist es mindestens so zufrieden wie mit dem Geschenk, welches es
zu Beginn hatte
Satz 1.15. Der TTCA ist anreizkompatibel.
Beweis. Betrachte Kind Ki und fixiere für alle übrigen Kinder jeweils eine beliebige totale
Ordnung. Nehme an, Ki gibt die echte Ordnung an. Sei M1 die erste Menge von Kindern,
welche von TTCA gelöscht wird, Mi analog, d.h.
k
⋃ Mj = M
j=1
wobei M die Menge aller Kinder ist. OBdA Ki ∈ Mj .
• Ist j = 1, dann erhält Ki seine erste Wahl, hat also keinen Anreiz abzuweichen.
• Ist j = 2, dann hat das Kind nur dann eine Verbesserungsmöglichkeit, wenn sein Favorit
in M1 liegt. Da jedes Kind nur eine ausgehende Kante hat, ist C1 zu jedem Zeitpunkt
des Algorithmus disjunkt von allen anderen gerichteten Kreisen. Da alle Knoten aus
M1 auf ihre erste Wahl zeigen, wird C1 irgendwann als Ganzes gelöscht. Somit kann
Ki durch Ändern der Ordnung kein besserers Ergebnis erzielen.
• Ist j ≥ 3, dann gilt obiges für M1 . Die Knoten aus M2 zeigen zu keinem Zeitpunkt
auf Knoten aus M ∖ (M1 ∪ M2 ). Allgemeiner zeigen Knoten aus M1 ∪ ⋅ ⋅ ⋅ ∪ Mj−1 nie
auf Knoten aus M ∖ (M1 ∪ ⋅ ⋅ ⋅ ∪ Mj−1 ). Somit kann Kind Ki niemals ein Geschenk aus
M1 ∪ ⋅ ⋅ ⋅ ∪ Mj−1 erhalten. Damit ist das präferierte Geschenk aus M ∖ (M1 ∪ ⋅ ⋅ ⋅ ∪ Mj−1 )
bestmöglich für Ki Somit ist das Geschenk aus Mj das bestmögliche Ergebnis für Ki .
Insgesamt gibt es also keinen Anreiz abzuweichen.
Wir können annehmen, dass alle Ordnungen wahrheitsgemäß angegeben werden. Dann
gilt:
05.12.16
VL12
1
MECHANISM DESIGN
17
Satz 1.16. Es gibt keine Teilmenge der Kinder, die durch das Tauschen untereinander
besser weggekommen wären, als mit dem TTCA. Der TTCA bestimmt die einzige
Lösung mit dieser Eigenschaft.
Beweis. Sei Mi wie oben. Angenommen es existiert eine Menge S, die der Aussage widerspricht, wähle kleinstmöglich. Sei j minimal, sodass S ∩Mj ≠ ∅. Angenommen S ⊈ Mj , sagen
wir S ′ = S ∩ Mj und S ′′ = S ∖ S ′ . In der Lösung, welche die Kinder aus S vorschlagen, erhält
jedes Kind aus S ′ seine Wahl aus Mj , da es sonst weniger zufrieden wäre. D.h. mit einem
Geschenk aus Mj+1 ∪ ⋅ ⋅ ⋅ ∪ Mk . Somit tauscht kein Kind aus S ′ sein Geschenk mit einem Kind
aus S ′′ , weshalb S ′′ eine kleinere Menge als S ist. Dies ist ein Widerspruch zur Minimalität
von S.
Also gilt S ⊆ Mj . Daher erhält jedes Kind aus S unter der TTCA-Lösung sein favorisiertes
Geschenk aus Mj ∪ ⋅ ⋅ ⋅ ∪ Mk . Durch das Tauschen innerhalb von S kann sich aber kein Kind
echt verbessern. Also kann S nicht existieren.
Zur Eindeutigkeit: Jedes Kind aus M1 erhält seine erste Wahl. Danach muss jede Zuordnung mit der gewünschten Eigenschaft auf M1 mit der TTCA-Lösung übereinstimmen.
Jedes Kind aus M2 bekommt in der TTCA-Lösung die nächstbeste Wahl, somit muss jede
Lösung mit der gewünschten Eigenschaft aus M2 mit der TTCA-Lösung übereinstimmen,
usw.
Man sagt, die TTCA-Lösung liegt im Kern des Problems. Wir haben gezeigt, dass man
die (hier eindeutige) Lösung aus dem Kern effizient bestimmen kann.
Kidney-Exchange-Problem Ähnlich zum vorherigen Problem. Dabei geht es um das
’optimale’ Verteilen von Nierenspenden. Ist P ein Nierenpatient, dann können drei Dinge
passieren:
1. P hat einen Spender S und die Niere von S ist kompatibel
2. P hat einen Spender S, aber die Niere von S ist nicht kompatibel
3. P bringt keinen Spender mit
Wir interessieren uns für Fall 2. Dabei wollen wir durch Spendertausch möglichst viele
Operationen ermöglichen.
Beispiel. Gegeben (P1 , S1 ), (P2 , S2 ), wobei S1 an P2 und S2 an P1 spenden kann. Dann
kann durch 4 Operationen eben diese Spende erfolgen.
Formal ergibt sich folgendes Problem:
• Gegeben n Paare von Patienten und inkompatiblen Spendern V = {(Pi , Si ), i = 1, . . . , n}
• Ein gerichteter Graph D = (V, A)
• Dabei ist (u, v) ∈ A, falls der Spender von u die Niere an v spenden kann
Wie können wir möglichst viele Spender reduzieren, unter der Bedingung, dass wenn
Si spendet, Pi eine Niere erhält? Das geht prinzipiell mit dem TTCA, wenn jeder Patient
folgende totale Ordnung angibt:
Pi bevorzugt Sj gegenüber Si ⇔ Sj ist kompatibel mit Pi
Dadurch wird unser Problem optimal gelöst. Das Problem sind lange Tauschkreise von der
Form
(Pi1 , Si1 ) → (Pi2 , Si2 ) → (Pi3 , Si3 ) → ⋅ ⋅ ⋅ → (Pik , Sik ) → (Pi1 , Si1 )
Die Spenden müssten aus ethischen Gründen simultan stattfinden, daher ist schon n ≥ 3
nicht unproblematisch. Wir suchen also eine Lösung mit sehr kurzen Tauschkreisen.
Der Fall von Kreisen der Länge 2 ist gutartig. Wir können so vorgehen:
07.12.16
VL13
1
18
MECHANISM DESIGN
a
a
b
b
D
G
d
c
d
c
e
e
Abbildung 5: Beispiel eines Graphen D mit Kreisen der Länge 2 und der zugehörige Graph
G
• Definiere den ungerichteten Graphen G = (V, E)
• Dabei werden Paare von antiparallelen Kanten aus D zu einer Kante in G
In G suchen wir ein maximales Matching. Das geht effizient, z.B. mit Edmonds Blütenschrumpfalgorithmus. Auch hier gibt es die Frage nach der Anreizkompabilität. Die Kanten
(Pi , Si ) → (Pj , Sj ) fallen nicht vom Himmel, sondern werden der Datenbank von den Ärzten
mitgeteilt.
Satz 1.17. Das Kidney-Exchange-Problem kann durch einen effizienten, anreizkompatiblen Algorithmus gelöst werden.
Bemerkung. Wir nehmen an, dass es eine totale Ordnung auf den Patienten gibt:
Pπ(1) < ⋅ ⋅ ⋅ < Pπ(n)
wobei Pπ(n) der dringlichste Patient ist.
Beweis. OBdA gilt Pn < Pn−1 < ⋅ ⋅ ⋅ < P1 . Iteriere:
1. Sei M0 die Menge aller maximalen Matchings. Sei i = 1.
2. Bestimme die Menge Mi , welche alle Matchings aus Mi−1 enthält, welche (Pi , Si )
matcht
3. Ist Mi = ∅, setze Mi = Mi−1
4. Ist i ≤ n − 1, erhöhe i um 1 und gehe zu Schritt 2
Offenbar ist Mn nicht leer. Zudem sind die Matchings aus Mn maximal und matchen
alle dieselbe Kantenmenge. Ist
V ′ = {Vij ∣ i, j = 1, . . . , r}
die Menge der gematchten Kanten, so ist V ′ die lexikografisch kleinste Menge von Kanten,
die durch ein maximales Matching gematcht wird werden kann. Angenommen Patient i gibt
die Kompabilitäten wahrheitsgemäß an. Wird Patient i gematcht durch ein (und dann alle!)
Matchings aus Mn , dann wird sein Nutzen maximiert. Wird i nicht gematcht, könnte es Sinn
machen abzuweichen. Dadurch wird die Menge der maximalen Matchings M0 nicht größer.
Die Menge der Matchings in Mn wird aber auch nicht kleiner. Damit gibt der Mechanismus
weiterhin ein Matching aus Mn aus. Dies kann effizient berechnet werden (→ Übung 7).
Das Problem wird schwieriger, wenn man auch Tauschkreise der Länge 3 erlaubt.
12.12.16
VL14
1
MECHANISM DESIGN
19
Satz 1.18. Das folgende Problem ist NP-vollständig: Gegeben ein gerichteter Graph
D = (V, A) und eine Zahl k. Können wir k Knoten überdecken durch gerichtete Kreise
der Länge höchstens 3, welche paarweise disjunkt sind?
Beweisskizze. Das Problem liegt offensichtlich in NP. Wir reduzieren auf folgendes NPvollständiges Problem: ”Gegeben ein Hypergraph H = (V, E) und eine Zahl k, gibt es k
paarweise disjunkte Mengen in E?” Das wäre ein Matching in H.
Das Problem bleibt hart, wenn E nur 3-elementige Teilmengen von V enthält. H ist
dann 3-uniform. Zusätzlich können wir unterstellen, dass
• ∣e ∩ f ∣ ≤ 1 für alle e ≠ f ∈ E
• (e ∩ f ≠ ∅ und f ∩ g ≠ ∅) ⇒ e ∩ g = ∅ für je drei verschiedene Kanten e, f, g ∈ E
Abbildung 6: Die Situation im Beweis von Satz 1.18: Ein Hypergraph H und der assoziierte
gerichtete Graph D = (V, A)
Es gilt: Es gibt k paarweise disjunkte Mengen in E genau dann, wenn es k paarweise
disjunkte gerichtete Kreise der Länge max. 3 in D gibt. Dies ist genau dann der Fall, wenn
man 3k viele Knoten durch paarweise disjunkte, gerichtete Kreise der Länge max. 3 in D
überdecken kann. Damit ist letzteres Problem ebenfalls NP-vollständig.
In der realen Anwendung stellt man ein ganzzahliges Programm auf und löst dieses.
Dabei nutzt man die ”typische Struktur” der auftretenden Graphen aus.
2
20
DER PREIS DER ANARCHIE
2
Der Preis der Anarchie
In diesem Kapitel untersuchen wir, wie schädlich egoistisches Verhalten von Spielern für die
Performanz eines Systems ist. Dabei vergleicht man sich mit dem Spielerverhalten, weches
ein ’Diktator’ den Spielern aufzwingen würde.
2.1
Braess’ Paradoxon
Gegeben sei ein Netzwerk wie in Abbildung 7(a). Dabei wollen Autofahrer von s nach t
fahren. Für uns ist dieser Verkehrsstrom ein Fluss mit Flusswert 1. Die Kosten des Flusses
sind wie an den Kanten angegeben. Der Verkehrsstrom wird sich wie folgt aufteilen: 50% über
die oberen und 50% über die untere Kanten. Jeder Verkehrsteilnehmer zahlt 3/2 Einheiten.
In jeder anderen Lösung würde sich ein Teil der Fahrer umentscheiden. Man nennt dies ein
Wardrop-Gleichgewicht.
v
(a)
v
1
x
s
t
x
1
1
x
(b)
0
s
x
1
u
t
u
Abbildung 7: Ein Netzwerk mit und ohne Erweiterung veranschaulicht Braess’ Paradoxon
Um den Verkehrsfluss zu verbessern, bauen wir eine weitere Verbindung ein, siehe Abbildung 7(b). Ein Gleichgewicht der Fahrer ist: Jeder fährt die Strecke x → v → u → t und zahlt
2 Einheiten. Ein Diktator würde dagegen den Verkehrsfluss wie oben aufteilen und damit
die Kosten im Schnitt minimieren.
Definition. Der Preis der Anarchie (PoA) ist das Verhältnis zwischen einem Gleichgewicht und der optimalen Verteilung.
Der PoA ist im obigen Beispiel 4/3.
Braess’ Paradoxon ist ein Beispiel dafür, dass öffentlich bereitgestelltes Gut der Situation
aller schaden kann.
2.2
Pigou-Netzwerke
Wir haben folgendes Modell:
• s-t-Netzwerk D = (V, A), wir suchen s-t-Flüsse vom Wert r
• Jede Kante hat eine Kostenfunktion ce ∶ R≥0 → R≥0 , welche stetig und schwach monoton
steigend ist
Definition. Sei P die Menge aller gerichteten Wege von s nach t. Dann ist ein s-t-Fluss
∣P ∣
f mit Wert r gegeben durch einen Vektor (fp )p∈P ∈ R≥0 mit ∑p∈P fp = r.
Definition. Ein Wardrop-Gleichgewicht (bzw. Gleichgewicht) ist dann ein Fluss f mit
der Eigenschaft:
fp > 0 ⇒ p ist ein kostenminimaler Weg von s nach t
14.12.16
VL15
2
21
DER PREIS DER ANARCHIE
bzw. äquivalent
p ∈ arg min
∑ ce (fe )
′
p ∈P e∈p′
Dies bedeutet, dass P ein kürzester Weg in D ist, unter den aktuellen Kantenkosten
(ce (fe )). Wir schreiben
cp (f ) ∶= ∑ ce (fe ), ∀p ∈ P
e∈p
für die Kosten eines Weges und
c(f ) ∶= ∑ fe ⋅ ce (fe ) = ∑ cp (f ) ⋅ fp
a∈A
p∈P
für die Gesamtkosten eines Flusses.
• Gleichgewichte existieren immer.
• Alle benutzten Wege kosten gleich viel in einem Gleichgewicht.
• Die Gesamtkosten eines Gleichgewichts sind immer gleich.
Definition. Der Preis der Anarchie bei Flüssen ist gleich dem Verhältnis
PoA ∶=
c(f )
c(g)
wobei f ein Gleichgewicht und g ein kostenminimaler Fluss ist.
Frage Wie groß ist der Preis der Anarchie abhängig von den Kosten des Netzwerks? Wichtig für die Beantwortung dieser Frage sind sogenannte Pigou-Netzwerke.
Definition. Sei C eine Klasse von Kostenfunktionen. Ein Netzwerk der Form
c(r)
s
t
c(x)
mit einer Kostenfunktion c ∈ C nennen wir Pigou-Netzwerk.
Beispiel. Bezeichne die obere Kante mit a und die untere mit b.
• Sei ca (x) = 1, cb (x) = x, r = 1. Dann ist der PoA 1, da f (a) = 0, f (b) = 1 ein Gleichgewicht und g(a) = g(b) = 1/2 kostenminimal ist. Somit ist der PoA 4/3, genau wie bei
Braess.
• Sei c(x) = xd mit sehr großem d und r = 1. Das Gleichgewicht ist immer noch f (a) =
0, f (b) = 1. Der kostenminimale Fluss g setzt g(a) = , g(b) = 1 − , denn das kostet
1
, was beliebig groß werden kann.
c(g) = + (1 − )(1 − )d ≤ 2. Somit ist PoA ≥ 2
Im Allgemeinen ist f (a) = 0, f (b) = r ein Gleichgewicht und der günstigste Fluss hat
Kosten
inf {xc(x) + (r − x)c(r)} = inf {xc(x) + (r − x)c(r)}
x≥0
x∈[0,r]
Also gilt
PoA = sup {
x≥0
rc(r)
}
xc(x) + (r − x)c(r)
2
22
DER PREIS DER ANARCHIE
Ist c(x) = ax + b, dann ist PoA ≤ 4/3 (Übung 8). Unser nächster Satz sagt, dass PigouNetzwerke den größten Preis der Anarchie haben. Dabei vergleichen wir mit jedem beliebigen
Netzwerk, dessen Kostenfunktionen aus einer Menge C stammen, z.B.
C = {Polynome vom Grad ≤ d, schwach monoton steigend auf R≥0 }
Satz 2.1. Sei C eine Menge von Funktionen. Unter allen Netzwerken, deren Kostenfunktionen aus C stammen, ist der Preis der Anarchie maximal auf einem Pigou-Netzwerk.
Eine obere Schranke an den PoA eines beliebigen Netzwerks ist also
α(C) ∶= sup sup sup {
c∈C r≥0 x≥0
r ⋅ c(r)
}
x ⋅ c(x) + (r − x)c(r)
Beweis. Sei C eine Funktionenklasse und D = (V, A) ein s-t-Netzwerk. Wir nehmen an, dass
α(C) < ∞. Sei f ein Gleichgewicht und g ein kostenminimaler Fluss auf D. Wir zeigen:
Der Fluss f ist optimal unter den Kosten ce (fe ), e ∈ A. Wir halten also die Kosten bei
ce (fe ), e ∈ A. Für jeden Weg p ∈ P mit fp > 0 gilt cp (f ) = L für ein L ∈ R≥0 (Alle Wege
kosten gleich viel, sonst wäre es kein Gleichgewicht). Demnach hat jeder Weg in P Kosten
mindestens L, d.h. für ein r gilt
c(f ) ∶= ∑ fp ⋅ cp (f ) = L ⋅ ∑ fp = L ⋅ r
p∈P
p∈P
Zudem gilt
∑ gp ⋅ cp (f ) ≥ r ⋅ L
p∈P
Wir erhalten
0 ≤ ∑ (gp − fp )cp (f ) = ∑ (ge − fe )ce (fe )
e∈A
p∈P
Wir stellen uns für jede Kante e ∈ A das Pigou-Netzwerk vor mit c = ce , r = fe , x = ge , ca =
ce (fe ), cb = ce . Es gilt
r ⋅ c(r)
fe ⋅ ce (fe )
} = α(C)
≤ sup sup sup {
ge ⋅ ce (ge ) + (fe − ge )ce (fe ) c∈C r≥0 x≥0 x ⋅ c(x) + (r − x)c(r)
Also gilt
ge ce (ge ) ≥
1
⋅ fe ce (fe ) + (ge − fe )ce (fe )
α(C)
Insgesamt ist
c(g) = ∑ ge ce (ge ) ≥
e∈A
also
1
c(f )
∑ fe ce (fe ) + ∑ (ge − fe )ce (fe ) ≥
α(C) e∈A
α(C)
e∈A
c(f )
≤ α(C)
c(g)
Der Diktator kann die Leistung eines Netzwerks (je nach Netzwerk) beliebig gut werden
lassen. Dies gilt, weil der PoA i.A. unbeschränkt ist. Dies bedeutet aber nicht, dass er
wesentlich mehr Fluss durch das Netzwerk leiten kann, ohne wesentlich mehr zu bezahlen.
Das Gleichgewicht in einem Netzwerk bei Flussrate r ist immer mindestens so gut, wie der
kostenminimale Fluss bei Flussrate 2r.
Beispiel. Sei ca (r) = 1, cb (x) = xd und r = 1 mit d groß. Der PoA ist dann riesig. Sollen 2
Einheiten durchgepumpt werden, kostet das immer mindestens 1.
19.12.16
VL16
2
23
DER PREIS DER ANARCHIE
Satz 2.2. Die Kosten eines Gleichgewichts bei Flussrate r sind höchstens so groß wie
die Kosten eines optimalen Flusses bei Flussrate 2r.
Bemerkung. Eine andere Interpretation: Die Kosten eines Gleichgewichts in einem verbesserten Netzwerk (Technologie-Sprung, Ausbau, etc.) sind höchstens so groß wie die optimalen
Kosten im ursprünglichen Netzwerk. Verbessert heißt hier: c′e (x) = 21 ce ( x2 ) (→ Übung).
Beispiel. Eine Anwendung unserer Theorie ist das Routen von Datenflüssen über Leitungen. Im einfachsten Fall sind die Kosten von der Form
⎧
⎪
⎪ 1 ,
ce (x) = ⎨ ue −x
⎪
⎪
⎩∞,
x < ue
x ≥ ue
Dabei ist ue die ’Kapazität’ der Kante e ∈ A. Es ist
⎧
⎪
⎪ 1 ,
c′e (x) = ⎨ 2ue −x
⎪
⎪
⎩∞,
x < 2ue
x ≥ 2ue
d.h. die Verbesserung zu c′e (x) entspricht gerade einer Verdoppelung der Kapazität ue .
Beweis des Satzes. Sei f das Gleichgewicht bei Flussrate r und g ein kostenminimaler Fluss
bei Flussrate 2r. Wir vorher ist für ein L ∈ R
c(f ) = ∑ fp cp (f ) = r ⋅ L
p∈P
Ebenso ist
∑ gp cp (f ) ≥ 2r ⋅ L
p∈P
Jetzt zeigen wir, dass wir die Kosten von g nur um höchstens r ⋅ L überschätzt haben. Also
ist zzg.
∑ ge ce (ge ) ≥ ∑ ge ce (fe ) − ∑ fe ce (fe )
e∈A
e∈A
e∈A
Wir zeigen
ge (ce (fe ) − ce (ge )) ≤ fe ce (fe ),
∀e ∈ A
(6)
Ist ge ≥ fe , so gilt ce (fe ) − ce (ge ) ≤ 0 und somit gilt (6). Sei also ge < fe , dann ist
ge (ce (fe ) − ce (ge )) < fe (ce (fe ) − ce (ge )) ≤ fe ce (fe )
Aufsummieren von (6) liefert die Behauptung.
2.3
Der Preis der Anarchie für atomare Flüsse
Bisher hatten die einzelnen Spieler eine vernachlässigbare Größe. Im Modell von atomaren
Flüssen tragen wir jedem Spieler Rechnung.
Definition. Wir haben k Spieler und jeder hat einen Startknoten si und einen Zielknoten ti für i = 1, . . . , k. Jeder Spieler i routet eine Flusseinheit durch das Netzwerk von
si nach ti . Dieser Fluss benutzt einen Weg Pi ∈ P . Die Kostenfunktionen sind von der
Form ce ∶ Z≥0 → Z≥0 . Diese ce sind schwach monoton steigend. Dann heißt f atomarer
Fluss.
Beispiel. Sei k = 2, s1 = s = s2 , t1 = t = t2 im Pigou-Netzwerk. Ein Gleichgewicht ist dann
P1 = b = P2 . Beide zahlen 2, insgesamt also 4. Ein weiteres Gleichgewicht ist P1 = a, P2 = b.
Dies kostet insgesamt 3 und ist optimal.
21.12.16
VL17
2
24
DER PREIS DER ANARCHIE
ca (x) = 2
s
t
cb (x) = x
Gleichgewichte existieren immer. Aber sie haben i.A. unterschiedliche Gesamtkosten.
Formal sind wir an Nash-Gleichgewichten interessiert.
Definition. Wir definieren diese für Kostenminimierungsspiele. Dabei haben wir endlich viele Spieler 1, . . . , k. Jeder Spieler i hat eine Strategie Si . Außerdem hat jeder
Spieler hat eine Kostenfunktion ci ∶ S1 × ⋅ ⋅ ⋅ × Sk → R, die er minimieren möchte.
Im Beispiel atomarer Flüsse wäre Si die Menge aller Wege von si nach ti und ci wären
die Kosten des gewählten Weges unter der gegebenen Belastung.
Definition. Sei S = S1 × ⋅ ⋅ ⋅ × Sk ein sogenanntes Strategieprofil. Dann heißt S reines
Nash-Gleichgewicht (RNG), falls gilt
ci (S) ≤ ci (S1 , . . . , Si−1 , Si′ , Si+1 , . . . , Sk )
für alle Si′ ∈ Si und alle i ∈ {1, . . . , k}.
Wir untersuchen reine Nash-Gleichgewichte in atomaren Flüssen. Der Preis der Anarchie
ist in diesem Fall das Verhältnis aus den Kosten des teuersten reinen Nash-Gleichgewicht
und des kostenminimalen Flusses. Zum Beispiel ist im Pigou-Netzwerk von vorher der PoA
genau 4/3. Im Gegensatz zum nicht-atomaren Fall kann der PoA echt größer als 4/3 sein,
selbst wenn wir uns auf affine Kostenfunktionen beschränken, d.h. Kosten von der Form
ce (x) = ae ⋅ x + be .
Beispiel. Betrachte folgenden Graphen für k = 4
• Gegeben u = s1 , s2 , v = t1 , s3 , t4 , w = t2 , t3 , s4
• Die Optimale Lösung (und ein Nash-Gleichgewicht) ist P1 = (u, v), P2 = (u, w), P3 =
(v, w), P4 = (w, v) mit Gesamtkosten 4
• Ein weiteres Gleichgewicht ist P1 = (u, w, v), P2 = (u, v, w), P3 = (v, u, w), P4 = (w, u, v)
mit Gesamtkosten 10
• Damit ist der PoA
10
4
= 52 .
Wir sehen im nächsten Satz, das dies ein Worst Case ist.
1
x
u
v
0
4
0
x
2
x
x
w
3
2
25
DER PREIS DER ANARCHIE
Satz 2.3. In einem beliebigen Netzwerk ist der PoA durch 5/2 beschränkt, wenn alle
Kostenfunktionen affin linear sind.
Beweis. Sei f ein Gleichgewicht und g ein kostenminimaler Fluss. Es sei Pif der Weg, welcher
Spieler i unter f benutzt. Analog Pig . Wir schreiben fe bzw. ge für die Anzahl Spieler, welche
die Kante e ∈ A benutzen. Kein Spieler i möchte unter f von Pif abweichen. Insbesondere
nicht zu Pig . Es gilt also
∑ ce (fe ) ≤
e∈Pif
ce (fe ) +
∑
e∈Pif ∩Pig
∑
ce (fe + 1)
e∈Pig ∖Pif
≤ ∑ ce (fe + 1)
e∈Pig
Wir summieren die letzte Ungleichung auf für alle Spieler i:
k
c(f ) = ∑ ∑ ce (fe )
i=1 e∈P f
i
k
≤ ∑ ∑ ce (fe + 1)
i=1 e∈Pig
= ∑ ge ⋅ ce (fe + 1)
e∈A
= ∑ ae (fe + 1)ge + be ge
e∈A
Wir wollen jetzt (fe + 1)ge trennen. Dazu benutzen wir eine Standard-Abschätzung:
1
5
y(z + 1) ≤ y 2 + z 2
3
3
∀y, z ∈ Z≥0
Wir erhalten
5
1
c(f ) ≤ ∑ ae ( ge2 + fe2 ) + be ge
3
3
e∈A
5
1
= ∑ ( ae ⋅ ge2 + be ge ) + ∑ ae fe2
3
3
e∈A
e∈A
5
1
≤ ∑ ge ( ae ge + be ) + ∑ fe (ae fe + be )
3
3 e∈A
e∈A
5
1
≤ c(g) + c(f )
3
3
09.01.17
VL18
Definition. Sei Φ eine Funktion die einem Fluss eine reelle Zahl zuordnet. Wir nennen Φ eine Potentialfunktion, wenn alle Spieler Φ unbewusst minimieren und dessen
Minimum ein Gleichgewicht ist. Genauer: Φ soll folgende Eigenschaft erfüllen: Sei f
ein Fluss und P der Pfad, den Spieler i unter f gewählt hat. Sei fˆ der Fluss, in dem
Spieler i auf Pfad P̂ abweicht und der ansonsten f entspricht. Dann gilt
Φ(fˆ) − Φ(f ) = ∑ ce (fˆe ) − ∑ ce (fe )
e∈P̂
e∈P
Satz 2.4. Jedes atomare Routingspiel (=Flussnetzwerk) besitzt einen Gleichgewichtsfluss.
2
26
DER PREIS DER ANARCHIE
Beweis. Wir zeigen, dass jedes Routingspiel ein Potentialspiel ist. Angenommen wir hätten
eine Potentialfunktion. Dann gilt: Wenn f das Potential Φ(f ) minimiert, dann gilt: Kein
anderer Fluss hat ein niedrigeres Potential, insbesondere auch kein Fluss, der durch einseitiges Abweichen ensteht. Nach der Definition können Spieler durch Einseitiges Abweichen
ihre Kosten nicht verringern. Wir zeigen die Existenz von Φ: Setze
fe
Φ(f ) = ∑ ∑ ce (i)
e∈A i=1
Sei fˆ wir in der Definition. Dann gilt
fˆe
fe
Φ(fˆ) − Φ(f ) = ∑ ∑ ce (i) − ∑ ∑ ce (i)
e∈A i=1
e∈A i=1
⎞
⎞
⎛ fe
⎛ fe
∑ ce (i) + ce (fe + 1) + ∑ ∑ ce (i) − ce (fe )
⎠
⎠ e∈P ∖P̂ ⎝i=1
⎝
e∈P̂ ∖P i=1
fe
= ∑ ∑ ce (i) + ∑
e∉P̂ ∪P i=1
fe
− ∑ ∑ ce (i)
e∈A i=1
= ∑ ce (fe + 1) − ∑ ce (fe )
e∈P̂ ∖P
e∈P ∖P̂
= ∑ ce (fˆe ) − ∑ ce (fe )
e∈P̂
e∈P
Ein Minimum existiert, da nur endlich viele Flüsse existieren.
Bemerkung. Wir können den obigen Beweis auf eine größere Klasse von Spielen verallgemeinern:
• Wir haben keine Voraussetzung an c gestellt, insbesondere muss c nicht monoton
sein
• Wir haben die Graphenstruktur nicht ausgenutzt, d.h. der Beweis gilt auch für Auslastungsspiele, bei denen wir die Knotenmenge durch eine abstrakte Menge von
Ressourcen ersetzen und Pfade entsprechen Teilmengen dieser Ressourcen
• Außerdem gilt der Beweis für nicht-atomare Flüsse, d.h. der Fluss setzt sich aus
einer kontinuierlichen Menge von Spielern zusammen. Dazu ersetzen wir ∑ ce (i) durch
fe
∫0 ce (λ)dλ
Jetzt zu Spielen ohne solch ’schöne’ Gleichgewichte.
2.4
Hierarchie von Gleichgewichten
Im Folgenden möchten wir allgemeine Gleichgewichtskonzepte betrachten. Wir sehen uns
dazu allgemeine Kostenminimierungsspiele (KMS) an. Es gibt viele interessante Spiele (z.B.
Schere/Stein/Papier) für die kein reines Nash-Gleichgewicht existiert. Dies motiviert uns,
schwächere Konzepte zu betrachten.
Definition. Verteilungen σ1 , . . . , σk über die Strategiemengen S1 , . . . , Sk heißt gemischtes Nash-Gleichgewicht (GNG), falls für jede einseitige Abweichung s′i ∈ Si gilt
ES∼σ [ci (s)] ≤ ES∼σ [ci (s′i )]
wobei σ = σ1 × ⋅ ⋅ ⋅ × σk die Produktverteilung ist.
Beispiel. Schere/Stein/Papier hat Strategiemengen S1 = S2 = {ST, SCH, P AP } und die
Gleichverteilung auf S1 , S2 ist eine GNG.
2
DER PREIS DER ANARCHIE
27
Bemerkung. Jedes RNG ist auch ein GNG (wobei die Verteilung dem definierten Spielen
von einer bestimmten Strategie entspricht). Es gilt (hier ohne Beweis): Jedes KMS hat ein
GNG. Im Allgemeinen ist es jedoch schwer zu berechnen. Insbesondere ist der PoA für KMS
dadurch wohldefiniert.
Definition. Eine Verteilung σ auf S1 × ⋅ ⋅ ⋅ × Sk heißt korreliertes Gleichgewicht, falls
für jeden Spieler i und je zwei Strategien si , s′i ∈ Si gilt
ES∼σ [ci (s) ∣ si ] ≤ ES∼σ [ci (s′i ) ∣ si ]
Bemerkung. Insbesondere sind in dieser Definition die Strategien der Spieler nicht unbedingt unabhängig. Eine Interpretation dieser Definition ist: Die Verteilung σ ist den Spielern
bekannt. Es gibt eine vertrauenswürdige dritte Partei, die einen Ausgang s nach σ zieht und
Spieler i die Komponente si mitteilt. σ ist ein korreliertes Gleichgewicht genau dann, falls
Spieler i mit Strategie si seine Kosten minimiert unter der Annahme, dass die anderen
Spieler der Empfehlung folgen.
Beispiel. An einer Kreuzung treffen zwei Autos aufeinander. Ein korelliertes Gleichgewicht
wäre eine Ampel, welche zu 50% (fahren/halten) und zu 50% (halten/fahren) anzeigt. Auszahlungsmatrix:
Spieler 1/2 fahren halten
fahren
5/5
0/1
halten
1/0
2/2
Definition. Eine Verteilung σ auf S1 × ⋅ ⋅ ⋅ × Sk heißt grobes korreliertes Gleichgewicht,
falls
Es∼σ [ci (s)] ≤ Es∼σ [ci (s′i )], für alle s′i ∈ Si
Hier muss Spieler i entscheiden, von dem Strategieprofil s abzuweichen, allein aufgrund
der Verteilung σ.
Abbildung 8: Venn-Diagramm der Gleichgewichtsklassen
2.5
Der Preis der Anarchie bei Maximierungsspielen
Wir betrachten folgendes Standortspiel. Gegeben ist eine Menge T von Standorten und eine
Menge M von Märkten. Außerdem für jedes t ∈ T und m ∈ M sind Kosten ct,m ≥ 0 gegeben.
16.01.17
VL19
2
28
DER PREIS DER ANARCHIE
1
t1
1
m1
2
t2 2
2
t3
m2
1
Abbildung 9: Beispiel für ein Standortspiel
Für jeden Spieler i ∈ {1, . . . , k} sind mögliche Standorte Ti ⊆ T gegeben. Jeder Markt m ∈ M
hat eine Bewertung vm ≥ 0, welche ihm die Leistung der Spieler höchstens wert ist.
Wenn die Spieler ihre Standorte gewählt haben, verkaufen sie den Märkten die Leistung.
Dabei wählen sie den Preis maximal, sodass die Märkte zufrieden sind und kein anderer
Spieler sie unterbieten kann.
Beispiel. Sei s1 = t1 , s2 = t3 . Dann kann Spieler i dem Markt mi die Leistung für 3 Einheiten
verkaufen (i = 1, 2). Der Gewinn von Spieler i ist dann 3 − 1 = 2 Einheiten.
Ist s1 = t2 , s2 = t3 , dann kann Spieler 1 Gewinn 1 aus m1 ziehen. Spieler 2 kann seine
Leistung an m2 für 2 Einheiten verkaufen und macht Gewinn 2 − 1 = 1. Für jeden höheren
Preis kann Spieler 1 ihn immer noch gewinnträchtig unterbieten.
Allgemein gilt für den Gewinn πi von Spieler i wenn er Standort l wählt und die Spieler
insgesamt die Standortmenge C wählen:
πi (s) = ∑ πij (s)
j∈M
wobei
⎧
⎪
⎪0
πij (s) = ⎨ (2)
⎪
⎪
⎩dj (s) − cij
vj ≤ cij oder l nicht der nächste Standort an Markt j ist, unter c
sonst
Dabei ist
(2)
dj
= min {vj , min {ctj ∣ t ist Standort eines Spielers aus {1, . . . , k} ∖ i}}
(2)
d.h. dj ist der größte Preis, den der Spieler i verlangen kann, ohne unterboten zu werden.
Als Zielfunktion wählen wir den sozialen Überschuss:
V (s) = ∑ vj − dj (s)
j∈M
wobei dj (s) = min {vj , ctj ∣ t ∈ C}.
Dies entspricht dem Wert der Standortwahlen (ohne Preiskampf). Wir werden zeigen:
Der Beitrag eines Spielers zu V (s) ist genau sein Gewinn. Der soziale Überschuss hängt nur
von den gewählten Standorten ab, wir können also auch V (T ) definieren für alle T ′ ⊆ T . Der
Preis der Anarchie in diesem Maximierungsspiel ist
sozialer Überschuss des schlechtesten (reinen Nash-)Gleichgewicht
∈ [0, 1]
sozialer Überschuss der besten Standortwahl
Je näher an 1, desto besser.
Satz 2.9 (Vetta, ’82). Der Preis der Anarchie ist bei jedem Standortspiel mindestens
1/2.
18.01.17
VL20
2
29
DER PREIS DER ANARCHIE
Bemerkung. Diese Schranke ist scharf; es gibt Beispiele mit einem PoA von 12 , siehe Übung
10.1.
Beweis. Wir zeigen drei Eigenschaften:
1. Für jedes Strategiespiel s gilt ∑ki=1 πi (s) ≤ V (s). Dies gilt anschaulich, da der soziale
Überschuss den Wert der Standortwahlen vor dem ’Preiskampf’ misst. Formal:
k
k
k
(2)
∑ πi (s) = ∑ ∑ πij (s) = ∑ ∑ πij (s) = ∑ dj (s) − dj (s) ≤ ∑ vj − dj (s) = V (s)
i=1
i=1 j∈M
j∈M i=1
j∈M
j∈M
2. Für jedes Strategieprofil s gilt πi (s) = V (s)−V (s′ ), wobei s′ = (s1 , . . . , si−1 , si+1 , . . . , sk ).
Ist der Standort von i bereits in s′ gewählt worden (von einem anderen Spieler), dann
ist πi (s) = 0 wegen des Preiskampfs. Zudem ist V (s) = V (s′ ), da die Standorte in s
und s′ gleich sind. Allgemein gilt
V (s) − V (s′ ) = ∑ (vj − dj (s)) − (vj − dj (s′ )) = ∑ dj (s′ ) − dj (s)
j∈M
j∈M
Ist Spieler i nicht der Nächste an Markt j, dann ist πij = 0 = dj (s)−dj (s′ ). Andernfalls
(2)
(2)
ist dj (s) = dj (s′ ) also πij = dj (s) − dj (s) = dj (s′ ) − dj (s). Somit ist
V (s) − V (s′ ) = ∑ dj (s′ ) − dj (s) = ∑ πij (s) = πi (s)
j∈M
j∈M
3. Die Funktion V ∶ 2T → R≥0 ist monoton steigend, also V (T1 ) ≤ V (T2 ) für alle T1 ⊆
T2 ⊆ T . Zudem ist V submodular : Es gilt
V (T2 ∪ {l}) − V (T2 ) ≤ V (T1 ∪ {l}) − V (T1 )
für alle T1 ⊆ T2 ⊆ T und l ∈ T . Dies bedeutet, dass der soziale Überschuss durch die Erschließung neuer Standorte langsamer steigt, je mehr Standorte bereits enthalten sind.
Das folgt direkt aus der Definition von V . Wir gehen wie üblich vor. Sei s ein Gleichgewicht und s∗ eine Optimallösung. Zudem ist wieder s′ = (s1 , . . . , si−1 , si+1 , . . . , sk ).
Es gilt
πi (s) ≥ πi (s1 , . . . , si−1 , ski , si+1 , . . . , sk )
und somit
(1) k
V (s) ≥ ∑ πi (s1 , . . . , si−1 , s∗i , si+1 , . . . , sk )
i=1
Wegen (2) gilt dann
k
∗
k
∗
′
∑ πi (s1 , . . . , si−1 , si , si+1 , . . . , sk ) = ∑(V (s1 , . . . , si−1 , si , si+1 , . . . , sk ) − V (s ))
i=1
i=1
k
=∶ ∑ V (s∗i , s′ ) − V (s′ )
i=1
Um zu vereinfachen, nutzen wir die Submodularität aus:
V (s∗i , s′ ) − V (s′ ) ≥ V (s∗1 , . . . , s∗i , s) − V (s∗1 , . . . , s∗i−1 , s)
(7)
Es gilt
k
(7) k
(3)
V (s) ≥ ∑ V (s∗i , s′ ) ≥ ∑ V (s∗1 , . . . , s∗i , s)−V (s∗1 , . . . , s∗i−1 , s) = V (s∗ , s)−V (s) ≥ V (s∗ )−V (s)
i=1
Also
V (s)
V (s∗ )
i=1
≥
1
2
und somit auch PoA≥ 12 .
2
30
DER PREIS DER ANARCHIE
2.6
Glatte Spiele
Wir wollen die Schranken PoA ≤ 5/2 für atomare Flüsse und PoA ≥ 1/2 für Standortspiele
verallgemeinern.
Definition. Ein Minimierungsspiel heißt (λ, µ)-glatt, falls
k
∗
∗
∑ ci (s1 , . . . , si−1 , si , si+1 , . . . , sk ) ≤ λ ⋅ cost(s ) + µ ⋅ cost(s)
i=1
für je zwei Strategieprofile s, s∗ . Dabei ist cost die Zielfunktion des Spiels und soll
k
cost(s) ≤ ∑ ci (s)
i=1
für jedes Strategieprofil s erfüllen. Entsprechend heißt ein Maximierungsspiel (λ, µ)glatt, falls
k
∗
∗
∑ πi (s1 , . . . , si−1 , si , si+1 , . . . , sk ) ≥ λ ⋅ V (s ) − µ ⋅ V (s)
i=1
für je zwei Strategieprofile s, s∗ . Dabei ist V die Zielfunktion des Spiels und soll
k
V (s) ≥ ∑ πi (s)
i=1
für jedes Strategieprofil s erfüllen.
Beispiel.
• Das Spiel zu den atomaren Flüssen ist ( 53 , 21 )-glatt
• Das Standortspiel ist (1, 1)-glatt
In jedem (λ, µ)-glatten Minimierungsspiel ist
k
k
i=1
i=1
cost(s) ≤ ∑ ci (s) ≤ ∑ ci (s1 , . . . , si−1 , s∗i , si+1 , . . . , sk ≤ λ ⋅ cost(s∗ ) + µ ⋅ cost(s)
λ
Somit gilt PoA≤
Analog ist PoA≥ 1+µ
bei (λ, µ)-glatten Maximierungsspielen. Wir
können folgende, wesentlich stärkere Eigenschaft zeigen:
λ
.
1−µ
Satz 2.10. In einem (λ, µ)-glatten Minimierungsspiel ist der PoA höchstens
gilt selbst in Bezug auf grob korrelierte Gleichgewichte.
λ
.
1−µ
Dies
Beweisidee. Sei σ ein solches Gleichgewicht und s∗ ein optimales Strategieprofil. Es gilt
k
Es∼σ [cost(s)] ≤ Es∼σ [∑ ci (s)]
i=1
k
= ∑ Es∼σ [ci (s)]
i=1
k
≤ ∑ Es∼σ [ci (s1 , . . . , si−1 , s∗i , . . . , sk )]
i=1
k
= Es∼σ [∑ ci (s1 , . . . , si−1 , s∗i , . . . , sk )]
i=1
≤ Es∼σ [λ ⋅ cost(s∗ ) + µ ⋅ cost(s)]
= λ ⋅ cost(s∗ ) + µEs∼σ [cost(s)]
2
31
DER PREIS DER ANARCHIE
Insbesondere ist
Es∼σ [cost(s)]
λ
≤
cost(s∗ )
1−µ
Analog gilt für (λ, µ)-glatte Maximierungsspiele, dass der PoA im Bezug auf GNG minλ
destens 1+µ
ist. Das sind die ’Worst-Cases’. Was ist mit den ’Best-Cases’ ?
2.7
Preis der Stabilität
Beim PoA haben wir mit dem schlechtesten Gleichgewicht gerechnet. Stattdessen schauen
wir uns jetzt das beste Gleichgewicht an. Die Idee ist, dass der Diktator Vorschäge zur Strategiewahl an die Spieler machen kann. Ist das vorgeschlagene Strategieprofil ein Gleichgewicht,
werden die Spieler nicht abweichen. Wir schauen uns das Konzept an Kostenteilungsspielen
an.
• Gegeben ist ein Graph D = (V, A) mit Kosten ce ∈ R≥0 für alle e ∈ A
• Jeder Spieler i ∈ {1, . . . , k} hat ein Paar (si , ti ) von Start- und Zielknoten
• Die Strategiemenge von Spieler i ist die Menge der Wege von si nach ti
• Die Kosten von Spieler i sind
ci (S) = ∑
e∈Si
ce
fe
mit fe ist Anzahl der Spieler auf e (d.h. die Spieler einer Kante teilen sich deren
Kosten)
• Die Zielfunktion cost ist gegeben durch
cost(S) =
∑
ce
e∈A,fe >0
Beispiel. Der PoA ist dramatisch schlecht, selbst bei einfachen Netzwerken. Sei für den
Graphen aus Abbildung 10 (s1 , t1 ) = ⋅ ⋅ ⋅ = (sk , tk ) = (s, t). Dann ist ein Gleichgewicht, dass
alle Spieler die Kante b wählen mit Gesamtkosten k. Die Optimallösung (ebenfalls ein GG)
ist, dass alle Spieler Kante a nutzen mit Gesamtkosten 1 + . Somit ist der PoA ≈ k, aber es
gibt ein optimales Gleichgewicht.
ca = 1 + ǫ
s
t
cb = k
Abbildung 10: Der Graph mit schlechtem PoA
Definition. Der Preis der Stabilität ist das Verhältnis der Kosten des günstigsten
Gleichgewichts zu den Kosten des Optimums.
Bemerkung. Im Beispiel oben ist der PoS gleich 1.
2
32
DER PREIS DER ANARCHIE
Beispiel. Der PoS ist nicht immer gleich 1. Betrachte Abbildung 11. In der Optimallösung
wählen alle Spieler den Weg über v nach t mit Kosten 1 + . Das einzige Gleichgewicht ist
das Strategieprofil, bei dem keine Spieler über v gehen mit Kosten
k
1
=∶ Hk ≈ log k
i=1 i
∑
Damit ist der Preis der Stabilität Hk ≈ log k.
v
0
s1
0
0
s3
s2
1
3
1
2
0
: : : sk
1+ǫ
1
k
1
t
Abbildung 11: Der Graph mit PoS von Hk
Folgender Satz zeigt, dass dieses Beispiel schlechtest möglich ist.
Satz 2.11. In jedem Kostenteilungsspiel (unserer Art) mit k Spielern ist der PoS
maximal Hk .
e ce
Beweis. Wieder über die Potentialfunktion, siehe Satz 2.4. Diese ist φ(s) = ∑e∈A ∑fi=1
und
i
das Strategieprofil, welches die Potentialfunktion minimiert ist ein reines Nash-Gleichgewicht.
Ist s ein beliebiges Strategieprofil, dann gilt
cost(s) =
≤
fe
⎛
1⎞
= φ(s)
ce ≤ ∑ ce ⋅ ∑
⎝
i=1 i ⎠
e∈A
e∈A,fe ≥1
∑
∑
e∈A,fe ≥1
ce ⋅ Hk = Hk ⋅ cost(s)
Ist s das Profil, welches φ minimiert und s∗ die Optimallösung, dann gilt
cost(s) ≤ φ(s) ≤ φ(s∗ ) ≤ Hk ⋅ cost(s∗ )
also PoS ≤ Hk .
Bisher haben wir uns gegen unilaterale Abweichungen abgesichert. Wir schränken unseren Gleichgewichtsbegriff ein und zwar auf solche Gleichgewichte, die gegen das Abweichen
ganzer Gruppen von Spielern abgesichert sind.
Definition. Ein starkes Nash-Gleichgewicht ist ein Strategieprofil s mit folgender Eigenschaft. Es gibt keine Mege I ⊆ {1, . . . , k} mit Strategien {s′i ∣ i ∈ I}, sodass die
Kosten aller Spieler i ∈ I beim gleichzeitigen Abweichen auf Strategie s′ nicht steigen
und in mindestens einem Fall echt fallen.
Bemerkung. Jedes starke Nash-Gleichgewicht ist ein reines Nash-Gleichgewicht. Die Rückrichtung dieser Aussage gilt i.A. nicht, siehe folgendes Beispiel.
Beispiel. Im Graph aus Abbildung 10 gilt: Fahren alle Spieler unten lang, so ist dies ein
reines Nash-Gleichgewicht, aber kein starkes Nash-Gleichgewicht. Im anderen Beispiel gab
es nur ein reines NG. Dieses ist auch ein stark NG. Somit gibt es Beispiele in denen der PoA
(und der PoS) in Bezug auf starke NG gleich Hk ist.
25.01.17
VL??
2
33
DER PREIS DER ANARCHIE
Satz 2.12. In jedem Kostenteilungsspiel mit k Spielern kostet jedes starke NashGleichgewicht höchstens Hk mal so viel wie die optimale Lösung. Der PoA in Bezug
auf starke NG ist also höchstens Hk .
Der Satz ist stärker als der vorherige Satz für Spiele, die ein starkes NG besitzen. Das
ist leider nicht immer der Fall.
Beispiel. Hier ist die Lösung, bei der beide keinen Umweg machen das einzige RNG, aber
es ist kein starkes NG.
t1
s2
3
1
s1
2
1
3
2
v
t2
Abbildung 12: Ein Netzwerk ohne starkes Nash-Gleichgewicht
s1 über s2
¬s1 über s2
s2 über t1
(4,4)
(5.5,3.5)
¬s2 über t1
(3.5,5.5)
(5,5)
Beweis des Satzes. Sei s ein starkes Nash-Gleichgewicht und s∗ eine Optimallösung. Betrache die Menge In = {1, . . . , n} von Spielern. Da s ein starkes Nash-Gleichgewicht ist,
verbessert sich nicht jeder Spieler, wenn die Spieler gemeinsam auf s∗ abweichen. D.h. es
gibt einen Spieler i ∈ In mit ci (s) ≤ ci (s∗ ), oBdA i = k. Ebenso gibt es einen Spieler j aus
Ik−1 = {1, . . . , k − 1} mit cj (s) ≤ cj (s∗1 , . . . , s∗k−1 , sk ). OBdA j = k − 1. Induktiv für alle i:
ci (s∗1 , . . . , s∗i , si+1 , . . . , sk ) ≥ ci (s)
Aufsummieren ergibt
k
k
k
i=1
i=1
i=1
cost(s) = ∑ ci (s) ≤ ∑ ci (s∗1 , . . . , s∗i−1 , si+1 , . . . , sk ) ≤ ∑ ci (s∗1 , . . . , s∗i )
Jetzt benutzen wir wieder die Potentialfunktion φ. Es gilt
fe
ce
e∈A i=1 i
φ(s̃) = ∑ ∑
für jedes Strategieprofil s̃. Also ist
ci (s∗1 , . . . , s∗i ) = ∑
e∈s∗i
ce
= φ(s∗1 , . . . , s∗i ) − φ(s∗1 , . . . , s∗i−1 )
fe
Dabei ist f der Fluss zum Profil (s∗1 , . . . , s∗k ). Somit ist
k
cost(s) ≤ ∑ ci (s∗1 , . . . , s∗i )
i=1
k
= ∑ φ(s∗1 , . . . , s∗i ) − φ(s∗1 , . . . , s∗i−1 )
i=1
= φ(s∗ ) ≤ Hk ⋅ cost(s∗ )
wobei die letzte Abschätzung nach dem Beweis des letzten Satzes gilt. Also
cost(s)
cost(s∗ )
≤ Hk .
3
3
DIE BERECHNUNG VON GLEICHGEWICHTEN
34
Die Berechnung von Gleichgewichten
In diesem Kapitel untersuchen wir, ob und wie Gleichgewichte berechnet werden können.
Dabei stehen zunächst Algorithmen im Fokus, die schrittweise Verbesserungen der einzelnen
Spieler ausnutzen. Wir schauen uns Minimierungsspiele an. Ein einfacher Algorithmus geht
wie folgt:
1. Starte mit einem beliebigen Profil s
2. Wähle einen Spieler mit Strategie s′i ∈ Si und ci (s1 , . . . , si−1 , s′i , si+1 , . . . , sk ) < ci (s)
3. Iteriere
Der Algorithmus endet, wenn s ein reines Nash-Gleichgewicht ist. Für Potentialspiele
terminiert der Algorithmus garantiert. Dann gilt nämlich
ci (s1 , . . . , si−1 , s′i , si+1 , . . . , sk ) − ci (s) = φ(s1 , . . . , si−1 , s′i , si+1 , . . . , sk ) − φ(s)
Satz 3.1. Jedes Minimierungsspiel mit einer Potentialfunktion hat ein reines NashGleichgewicht. Dieses kann mit obigen Algorithus gefunden werden.
Beweis. In jedem Schritt fällt das Potential des aktuellen Profils. Nach endlich vielen Schritten haben wir φ lokal minimiert, d.h. es gibt keine verbessernde Abweichung eines einzelnen
Spielers. Dies muss ein reines NG sein.
Dies ist ein Einfinden in ein reines NG. Das Problem ist die Laufzeit. Die Eingabe ist
die Menge der Strategiemengen der einzelnen Spieler. Die Eingabegröße ist ∣S1 ∣ + ⋅ ⋅ ⋅ + ∣Sk ∣.
Dabei nehmen wir Si ≠ ∅ für alle i = 1, . . . , k an.
Ab hier nicht mehr klausurrelevant
0)
)
Satz 3.2. Der Algorithmus findet ein -reines Nash-Gleichgewicht in O ( kα
⋅ φ(S
φmin
vielen Schritten. Dabei ist S0 das Strategieprofil, mit dem der Algorithmus startet und
φmin ist das kleinste Potential, welches ein Strategieprofil haben kann.
Beweis.
Satz 3.3. Gegeben ein λ, µ-glattes
Beweis.
Satz 3.4.
Beweis.
Beispiel.
Bemerkung.
Lemke–Howson-Algorithmus
30.01.17
VL??
3
DIE BERECHNUNG VON GLEICHGEWICHTEN
Satz 3.5. Der Lemke–Howson-Algorithmus terminiert und gibt ein GNG aus.
Beweisidee.
Ende der Vorlesung
35
ABBILDUNGSVERZEICHNIS
36
Abbildungsverzeichnis
1
2
3
4
5
6
7
8
9
10
11
12
Stückweise konstante Zahlungsregel . . . . . . . . . . . . . . . . . . . . . . . . . .
Die grau markierte Fläche ist vi ⋅ x(vi ) und der Nutzen ergibt sich als die
graue Fläche unterhalb der Zahlungsfunktion . . . . . . . . . . . . . . . . . . . .
Situation im Beweis von Satz 1.8 . . . . . . . . . . . . . . . . . . . . . . . . . . .
Die Verteilungen der beiden Bieter . . . . . . . . . . . . . . . . . . . . . . . . . .
Beispiel eines Graphen D mit Kreisen der Länge 2 und der zugehörige Graph G
Die Situation im Beweis von Satz 1.18: Ein Hypergraph H und der assoziierte
gerichtete Graph D = (V, A) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Ein Netzwerk mit und ohne Erweiterung veranschaulicht Braess’ Paradoxon .
Venn-Diagramm der Gleichgewichtsklassen . . . . . . . . . . . . . . . . . . . . .
Beispiel für ein Standortspiel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Der Graph mit schlechtem PoA . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Der Graph mit PoS von Hk . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Ein Netzwerk ohne starkes Nash-Gleichgewicht . . . . . . . . . . . . . . . . . . .
Liste der Algorithmen
6
6
9
13
18
19
20
27
28
31
32
33
Herunterladen