Spieltheorie- Zusammenfassung HS09

Werbung
Spieltheorie- Zusammenfassung HS09
Kapitel 1&2:
Im Gefangenendilemma haben die Spieler eine dominante Strategie, wenn dessen beste
Strategie nicht davon abhängt, welche Strategien seine Mitspieler ausführen.
Kapitel 3
Perfekte Information: Spieler wissen, was zuvor gespielt wurde.
Strategisches Denken: Wie der laufende Spielzug eines Spielers die zukünftigen
Spielzüge seines Gegenübers beeinflusst.
Rückwärts Denken: Spieler denken das Spiel ausgehend vom letzten Spielzug rückwärts
durch.
Knoten/Äste: Punkt an welchem Aktion stattfindet/ Repräsentieren mögliche
Handlungsalternativen der Spieler an jedem Knoten.
Strategie: Plan auf dem festgehalten wird, was ich an welchem Knotenpunkt mache.
Reine Strategie: Detaillierter Plan, welcher dem Spieler in jeder erdenklichen Situation
(an jedem Entscheidungsknoten) sagt, welche Aktion er wählt.
Gemischte Strategie: Wahrscheinlichkeitsverteilung über die reinen Strategien (z.B.:
Münze werfen.)
Rückwärtsinduktion: Ist ein Verfahren, welche Handlungen eliminiert, welche von
rationalen Spielern nie gespielt werden. Zuerst wird die letzte Periode analysiert, dann
die zweitletzte usw.
Kapitel 4: Diskrete Strategien
In einem Spiel mit simultanen Zügen, müssen die Spieler ihre Handlungen ohne jede
Kenntnis der Handlung der anderen Spieler wählen.
Was wissen die Spieler?
-
Die Spieler kennen die Struktur des Spiels (Anzahl Spieler,
Handlungsalternativen, Auszahlungen).
Sie wissen, dass ihre Mitspieler rational sind.
Sie wissen, dass ihre Mitspieler diese Information haben.
o Gemeinsames Wissen ( Common knowledge)
Nullsummenspiel: Wie es der Name schon sagt, addieren sich die Auszahlungen, in
einem solchen Spiel immer zu Null. (Was der eine gewinnt, verliert der Andere) z.B.:
Schere-Stein-Papier
Nash- Gleichgewicht: - In einem NG ist die Strategie eines jeden Spielers optimal
gegeben der Strategien der anderen Spieler.
-Die beste Antwort eines Spielers ist diejenige Strategie, welche seine Auszahlung
maximiert gegeben der Strategien der anderen Spieler.
-Jeder Spieler wählt jeweils eine beste Antwort auf die erwarteten Strategien der
Mitspieler. Es gibt NG sowohl in gemischten als auch in reinen Strategien.
Dominante Strategie:
- Eine Strategie ist dominant für einen Spieler wenn sie für jede Strategiewahl seiner
Mitspieler eine strikt grössere Auszahlung als alle seine anderen Strategien fährt.
-Die dominante Strategie ist eine beste antwort, egal wie sich die anderen Spieler
verhalten.
-Ein Gleichgewicht in dominanten Strategien ist immer ein NG.
Dominierte Strategien:
-
Eine Strategie ist dominiert für einen Spieler wenn er eine andere Strategie
besitzt, die für jede Strategiewahl der andern Spieler eine strikt höhere
Auszahlung liefert.
-Eine dominierte Strategie kann also nicht Bestandteil eines NG sein.
Dominanzlösung: Entsteht dann, wenn alle anderen Strategiekombinationen durch
sukzessive Elimination eliminiert wurden => einziges NG.
Kapitel 5 Spiele mit simultanen und sequentiellen Spielzügen
NG vs. Rückwärtsinduktion: Theorem: Jede Rückwärtsinduktionslösung in einem Spiel
mit perfekter Information ist auch ein NG. Aber nicht jedes NG in einem solchen Spiel ist
auch eine Rückwärtsinduktionslösung.
Skizze Notitzblatt 3
Definition Teilspielperfektes Nash-Gleichgewicht: Eine Strategiekombination ist ein
teilspielperfektes NG wenn sie in jedem Teilspiel ein NG induziert
Ein NG in gemischten Strategien ist nur ein anderer Name für ein NG in einem Spiel mit
gemischten Strategien.
Theorem: Jedes endliche extensive Spiel mit perfekter Information, hat ein
teilspielperfektes NG. ( endlich= endliche Anzahl Spieler)
Kapitel 7&8 Gleichgewicht in gemischten Strategien
- Auch ein NG in reinen Strategien ist ein NG in gemischten Strategien.
- Kein Spieler kann sich verbessern gegeben der gemischten Strategie des anderen
Spieler. Die Strategien sind gegenseitig beste Antworten.
- Die Spieler wählen eine Strategie, welche den Gegner indifferent macht zwischen
seinen Handlungen.
Theorem: Jedes endliche Spiel mit simultanen Zügen besitzt mindestens ein NG in
gemischten Strategien.
Kapitel 9: Unsicherheit und Information
Kontrolle und Beeinflussung des Risikos: Es gibt zwei Möglichkeiten sich gegen das
Risiko von Einkommensschwankungen abzusichern: 1. Pooling( Bündeln) des Risikos 2.
Handel des Risikos
Damit Pooling effektiv ist, dürfen die Risiken nicht exakt positiv korreliert sein. Pooling
von Risiken ist die Grundlage des Versicherungsgeschäfts.
Moral Hazard: beschreibt das Problem einer Verhaltensänderung durch eine
Versicherung gegen ein Risiko. Kann nach Vertragabschluss das Verhalten eines
Versicherungsnehmers nicht beobachtet werden, kann Moral Hazard eine effektive
Versicherung sogar verunmöglichen. (Bsp: Autofahrer gehen nach Abschluss einer
Versicherung ein höheres Risiko beim Autofahren ein, weil durch die Versicherung ein
eventueller Schaden gedeckt würde.)
Adverse Selektion: Kann vor Vertragabschluss der Typ eines Versicherungsnehmers
nicht beobachtet werden, kann Adverse Selektion eine effektive Versicherung
verunmöglichen. Viele Individuen sind besser informiert über ihre Risiken als die
Versicherung. Die hat dann oftmals das Problem, dass die Kunden nur die schlechten
Risiken versichern lassen wollen =>Adverse Selektion.
-Versicherungen versuchen dieses Problem zu minimieren, indem sie unterschiedlichen
Risikogruppen unterschiedliche Verträge anbieten.
Asymmetrische Information: Ein Spieler besitzt Information, welche den anderen
Spielern nicht zur Verfügung steht. Trotzdem versuchen beide Parteien den Ausgang des
Spiels zu ihren Gunsten zu manipulieren.
-
Wir unterscheiden die Information in ``Gute``bezw. `Schlechte`` Information.
``Gute``Information: Ist vorhanden wenn die anderen Spieler diese Information hätten,
würden diese ihre Aktionen so ändern, dass sie eine höhere Auszahlung bekämen.
``Schlecht``Information: Wenn die anderen Spieler diese Information hätten, würden sie
ihre Aktionen so ändern, dass Sie eine tiefere Auszahlung bekämen.
–Hat die Handlung eines Spielers den Zweck, die Mitspieler davon zu überzeugen, dass
der Spieler gute Informationen hat, wird diese Handlung ``Signal`` genannt.
-Wenn eine Handlung eines Spielers mit schlechter Information den Zweck hat, diese
vor den Mitspielern zu verbergen, wird diese Handlung ``Signal Jamming`` genannt
Screening: Strategie, einen anderen Spieler dazu zu bringen seine private Information
wahrheitsgemäss mitzuteilen.
 Gelingt es der schlechter informierten Partei die Spieler zum wahrheitsgemässen
signalisieren ihrer Typen zu bewegen, so entsteht ein Trenngleichgewicht. Das heisst,
jeder Typ kann unterschiedlich behandelt werden.
Können die Spieler jedoch einen anderen Typ imitieren, so kann vom Signal auf den Typ
geschlossen werden Poolinggleichgewicht
Adverse Selektion, Signaling und Screening: Auf dem Arbeitsmarkt versuchen die
Arbeitnehmer oftmals ihren Typen zu verheimlichen.
Als angehender Arbeitnehmer hat man einen Anreiz zu signalisieren, dass man eine gute
Arbeitskraft ist. Der Arbeitgeber wiederum versucht die produktivsten Arbeiter zu
sortieren. Das Ziel jedes Screening Mechanismus ist eine Selbstselektion zu bewirken.
Kapitel 14: Mechanism Design
Mechanism Design beschäftigt sich mit der Frage: Wie muss der schlechter Informierte
Spieler (Prinzipal) die Spielregeln setzten, so dass die resultierende Anreizstruktur den
besser informierten Spieler (Agent) dazu veranlasst im Sinne des Prinzipals zu handeln.
(Z:B: Manager Lohn und Boni)
Kapitel 11: Wiederholte Spiele
Viele strategische Interaktionen sind in fortlaufende Beziehungen eingebettet, (z.B:
Leben in einer Dorfgemeinschaft) In einer solchen Beziehung besteht die Möglichkeit,
das eigene Verhalten von dem Verhalten der Mitspieler in der Vergangenheit abhängig
zu machen (Belohnen, Bestrafen). Das spieltheoretische Modell einer solchen Beziehung
ist ein wiederholtes Spiel.
Endlich wiederholte Spiele Definition: Ein endlich wiederholtes Spiel wird durch die
folgengenden Angaben definiert:  das Stufen Spiel  die Anzahl der Wiederholungen:
T  der Diskontierungsfaktor ∂.
Dieser Faktor stellt die Ungeduld der Spieler dar. Je kleiner der Wert ∂ desto
unbedeutender sind die zukünftigen Perioden.
Theorem: Besitzt ein Stufenspiel ein eindeutiges NG (wie das GD) so besitzt das endlich
wiederholte Spiel ein eindeutiges teilspielperfektes Gleichgewicht. In diesem wählt jeder
Spieler stets seine Gleichgewichtsaktion aus dem Stufenspiel. Bemerkung: Ergebnis gilt
nicht wenn das Stufenspiel mehrere NG hat.
Unendlich wiederholte Spiele: In endlichen Spielen führt, wenn die Spieler die Länge des
Spiels kennen, Wiederholung nicht zu Kooperation.
Um zu modellieren, dass die Spieler das Ende einer Beziehung nicht in Betracht ziehen
gibt es nur eine Möglichkeit, nämlich ein wiederholtes Spiel ohne letzte Periode zu
betrachten  Modell eines unendlich wiederholten Spiels
In unendlichen Spielen, kann Kooperation entstehen. Grund: Da das Spiel eine Zukunft
hat, besteht die Möglichkeit einen Mitspieler zu bestrafen.
Methoden welche zu Kooperation führen:
Belohnen/ Bestrafen
Wiederholung des Spiels
Führerschaft
Triggerstrategien: 1) Grimmstrategie: Spieler kooperiert solange der Gegenüber auch
kooperiert. Weicht dieser aber ab, verweigertder Spieler jegliche Kooperation für den
Rest des Spiels.
2) Tit-for-tat: Spieler kooperiert in der Periode t+1 wenn der Gegenüber in Periode t
kooperiert hat, weicht ab, wenn Gegenüber abgewichen ist
 werden die zukünftigen Auszahlungen von den Spielern genügend hoch bewertet, so
können sie es vorziehen zu kooperieren.
-
Sei r der reale Zinssatz
Der Barwert einer Geldzahlung a, welche in jeder Periode eingeht ist.
BW=a+∂a+∂^2+a∂^3....
= a+∂BW = a/1-∂ = a+a/r; wobei ∂= 1/1+r < 1
 sei p die Wahrscheinlichkeit, dass das Spiel fortgesetzt wird. Dann ist ∂p die
effektive Diskontrate. Effektiver Zinssatz R= 1-∂p/∂p
Führerschaft: Der eine Spieler kann in aktuellen Situationen relativ ``gross``sein
(Führer) und der andere relativ ``klein``(Nachfolger). Wenn die Höhe der Auszahlungen
unterschiedlich ist, fällt ein so grosser Teil des Verlusts auf den ``grösseren``Spieler, so
dass dieser kooperiert (Bsp. Saudi Arabien in der OPEC)
Kapitel 13 Evolutionäre Spieltheorie
Grundlagen der evolutionären Spieltheorie: Tierisches Verhalten ist weitgehend
genetisch bestimmt.
Phänotyp: Spezielles Verhaltensmuster, welches durch ein oder mehrere Gene bestimmt
wird.
Fitness: Mass für den Erfolg eines Phänotypen. (Einige Phänotypen passen besser zu den
herrschenden Umweltbedingungen als andere.
Selektion: Ändert die Zusammensetzung der Phänotypen.
Mutationen: Der Zufall produziert Mutationen. Es entstehen neue Phänotypen. Fitness
und Selektion bestimmen den Erfolg des Mutanten. Durch Mutation entstandene
Phänotypen sind oft schlecht an die Umwelt angepasst und verschwinden unmittelbar
wieder. Teils entstehen jedoch besser angepasste Phänotypen, die sich in der
bestehenden Population eindringen und durchsetzen können.
Evolutionäre Stabilität: Ein Phänotyp wird evolutionär Stabil genannt, wenn keine
Mutanten den Phänotyp verdrängen können.
Monomorph/Polymorph: Eine Population heisst monomorph, wenn sie aus nur einem
Phänotypen besteht./ Polymorph ist die Population dann, wenn sie aus mehreren
besteht.
Evolutionäre Spieltheorie: Idee
Wir nutzen die evolutionäre Spieltheorie, um die Annahme der Rationalität vollständig
fallen zu lassen.  Spieler treffen keine bewussten Entscheidungen, da sie die Strategie
``erben``.(Erben: Imitation, Erziehung)
Fitness: Beinhaltet Gewinne, Macht, Prestig usw.
Das NG wird ersetzt durch zwei Konzepte: 1) Evolutionäre stabile Strategie 2)
Populationsdynamik
Ersteres versucht einen Bevölkerungsstand zu beschreiben, unter der sich keine
alternative Strategie(Mutation) verbreitet. Letzteres betrachtet die dynamischen
Prozesse, die beschreiben wie sich die relative Häufigkeit, mit den unterschiedlichen
Strategien in einer Bevölkerung, im Zeitablauf ändern.
Kapitel 12 Kollektives Handeln
Viele soziale Interaktionen führen oft zu Ergebnissen, welche von vielen Beteiligten als
wenig zufriedenstellend erachtet werden, da private Interessen und die Interessen des
Kollektivs geprägt von Spannungen sind.
Eine Spieltheoretische Analyse identifiziert Ursachen dieses Problems: In Spielen
kollektiven Handelns, werden die Ziele der Gemeinschaft am besten bedient, wenn die
Mitglieder ihre Aktionen koordinieren.
Die koordinierten Aktionen stimmen aber in der Regel nicht mit den privaten Interessen
der Mitglieder überein. Die Divergenz wird durch externe Effekte verursacht.
Wohlfahrtsmass: W=u1+u2 Mit diesem Wohlfahrtsmass befindet sich das „soziale“
Optimum in Spielen kollektiven Handelns dort, wo die Summe der Auszahlungen der
Spieler maximal ist.
Divergenz zwischen Nashgleichgewicht und sozialem Optimum: Grundproblem in allen
Spielen kollektiven Handelns. Individuelle und kollektive Interessen stimmen nicht
überein.
Kollektives Handeln: Modellrahmen:
-Es gibt N ≥ 2 Spieler. Jeder Spieler wählt zwischen zwei Aktionen: A und B. �
(Beispiele aus dem Buch: Bewässerungsprojekt: Wahl zwischen “Arbeiten” oder “Drücken.”)
-Die Aktionen werden simultan gewählt.
-Die Auszahlung eines Spielers hängt nur von der eigenen Aktion und der Gesamtzahl
der Spieler ab, welche die beiden Aktionen wählen:
� -Auszahlung eines Spielers, der Aktion A wählt, wenn insgesamt n Spieler die Aktion A wählen: p(n).
� -Auszahlung eines Spielers, der Aktion B wählt, wenn insgesamt N − n Spieler die Aktion B wählen: s(n).
-Beachte: Die strategische Situation aller Spieler ist identisch.
-Da das Spiel symmetrisch ist, können wir das Ergebnis eines Nashgleichgewichts durch
die Anzahl der Spieler beschreiben, welche die Aktion A wählen.
-Gibt es ein Nashgleichgewicht, in dem n Spieler A wählen, so ist jedes andere Ergebnis,
in dem ebenfalls n Spieler A wählen, ein Nash- Gleichgewicht.
Nashgleichgewichte in reinen Strategien:
-n* = 0 ist das Ergebnis eines Nashgleichgewichts genau dann, wenn s(0) ≥ p(1).
-n* = N ist das Ergebnis eines Nashgleichgewichts genau dann, wenn p(N) ≥ s(N − 1).
-0 < n* < N ist das Ergebnis eines Nashgleichgewichts genau dann, wenn s(n*) ≥ p(n* +
1) und p(n*) ≥ s(n* − 1).
-Das soziale Optimum ist im Lehrbuch als diejenige Anzahl von Spielern, die A wählen,
definiert, welche die Summe der Auszahlungen maximiert.
-Im allgemeinen könnte es mehrere soziale Optima geben. Wir gehen zur Vereinfachung
aber davon aus, dass es nur eines gibt.
Die Summe der Auszahlungen, wenn n Spieler die Aktion A wählen, ist
T(n) = np(n) + (N − n)s(n).
Die Anzahl n' ist das soziale Optimum, wenn T(n') > T(n), fur alle n ≠ n'.
Beachte: In dem so definierten sozialen Optimum erzielen im allgemeinen nicht alle
Spieler die gleiche Auszahlung.
Um zu verstehen, warum das Ergebnis eines Nash-Gleichgewichtes im allgemeinen nicht
mit dem sozialen Optimum übereinstimmt, ist es nützlich, eine Ausgangssituation zu
betrachten, in der n < N Spieler die Aktion A wählen und die Auswirkung auf die
Auszahlungen zu betrachten, wenn ein weiterer Spieler von der Aktion B zu der Aktion
A wechselt.
�Die Auszahlung des Wechslers ändert sich um p(n + 1) − s(n).
� Die Summe der Auszahlungen ändert sich um T(n + 1) − T(n), was geschrieben
werden kann als: p(n + 1) − s(n) + n [p(n + 1) − p(n)] + (N − n − 1) [s(n + 1) − s(n)]
Der Ausdruck: n [p(n + 1) − p(n)] + (N − n − 1) [s(n + 1) − s(n)] ist der externe Effekt der
Verhaltensänderung, nämlich die Auswirkung auf die Auszahlungen der anderen Spieler.
Spillovers oder Externalitäten:
Sozialer Grenzgewinn: Effekt auf soziale Wohlfahrt, wenn eine Person ihr Verhalten
ändert. T(n + 1) – T(n)
Privater Grenzgewinn: Effekt auf persönlichen Nutzen, wenn eine Person ihr Verhalten
ändert. p(n + 1) – s(n)
Externalität oder Spillover effect: Differenz zwischen sozialem und persönlichem
Gewinn. T(n + 1) – T(n) – [p(n + 1) – s(n)] = n [p(n + 1) – p(n)] + [N – (n + 1)][s(n + 1) –
s(n)]
-Aus individueller Sicht lohnt sich der Wechsel von B auf A, wenn die Auswirkung auf die
eigene Auszahlung positiv ist:p(n + 1) − s(n) > 0.
-Aus sozialer Sicht lohnt sich der Wechsel hingegen, wenn die Auswirkung auf die
Summe der Auszahlungen positiv ist. Hier ist also der externe Effekt zusätzlich zu
berücksichtigen.
-Insbesondere können die folgenden Fälle auftreten:
� -Das Individuum will von B zu A wechseln, aus sozialer Sicht ist dieses jedoch nicht
wünschenswert, da der externe Effekt negativ (und hinreichend gross) ist.
� -Das Individuum will nicht von B zu A wechseln, aus sozialer Sicht wäre der Wechsel
jedoch wünschenswert, da der externe Effekt positiv (und hinreichend gross) ist.
Beispiel Bewässerungsprojekt:
-N > 1 Farmer Davon beteiligen sich n Farmer an der Errichtung des
Bewässerungsprojekts.
-Kosten c(n) sind abhängig von n.
-Nutzen b(n) ist auch abhängig von n.
-Nutzen kommt einem zu, ob man sich beteiligt oder nicht.
-Nehmen wir an, dass es n Teilnehmer und N - n Drückeberger gibt.
-Dann ist die Auszahlung eines Teilnehmers (participating): p(n) = b(n) – c(n)
-Auszahlung eines „Drückebergers“ (shirking): s(n) = b(n)
-Jeder Spieler entscheidet gegeben das Verhalten der anderen N-1 Spieler.
-Falls n Spieler beitragen und der Spieler entscheidet sich zu drücken, ist seine
Auszahlung:
s(n) = b(n) � Falls der Spieler entscheidet sich zu beteiligen, ist seine Auszahlung:
p(n + 1) = b(n + 1) – c(n + 1)
-Spieler entscheidet sich für Beteiligung, wenn p(n + 1) > s(n)
-Spieler entscheidet sich für „Drücken“, wenn p(n + 1) < s(n)
� Totale Auszahlung der Gesellschaft als eine Funktion von n ist:
T(n) = n p(n) + (N – n) s(n) = N s(n) – n[s(n) – p(n)]
� Welches n ist optimal? � Muss für jedes Spiel neu untersucht werden.
Gefangenendilemma
-Spiel ist ein Gefangenendilemma wenn s(n) > p(n + 1) für alle n. Sich drücken ist eine
dominante Strategie. Dies gilt für alle Spieler → Im Nashgleichgewicht drücken sich alle.
-Wenn sich alle Spieler beteiligen würden, wären im Vergleich zum Nashgleichgewicht
alle Spieler besser gestellt, da: s(0) < p(N).
Chicken-Spiel:
-Beteiligung aller Spieler muss aber nicht immer „sozial“ optimal sein.
-Es kann optimal sein wenn sich einige beteiligen und einige nicht.
-Spieler bevorzugen es, sich zu beteiligen, wenn die meisten sich drücken: p(n + 1) >
s(n) für kleine n
-Spieler bevorzugen es, sich zu drücken, wenn die meisten anderen sich beteiligen:
p(n + 1) < s(n) für grosse n
-Welches n ist sozial optimal? Im Chicken-Spiel kann aber muss eine Beteiligung aller
nicht „sozial“ optimal sein.
Koordinationsspiel:
-Spieler bevorzugen es, sich zu drücken, wenn die anderen sich drücken:
s(n) > p(n + 1) für kleine n �
-Spieler bevorzugen es, sich zu beteiligen, wenn sich viele Spieler auch beteiligen.
s(n) < p(n + 1) für grosse n
-Zwei Nashgleichgewicht in reinen Strategien: Entweder es beteiligen oder es drücken
sich alle.
-Beteiligung aller ist immer „sozial“ optimal.
Grosse Gruppen
-Wenn N gross ist und damit jedes Individuum einen „kleinen“ Einfluss hat, dann ist die
Differenz zwischen p(n) und p(n + 1) sehr klein.
-In diesem Fall bevorzugt jeder Spieler sich zu drücken, wenn p(n) < s(n)
-Diese Bedingung ist in grossen Gruppen fast immer erfüllt, da p(n) < s(n)b(n) – c(n) <
b(n)
-Problem der kollektiven Bereitstellung öffentlicher Projekte in grossen Gruppen.
Lösungsansätze:
Koordinationsspiel:
-Wenn das Spiel kollektiven Handelns ein Koordinationsspiel ist, dann generiert eines
der beiden Nashgleichgewichte in reinen Strategien das sozial optimale Ergebnis.
-Dieses Gleichgewicht kann durch einen Fokus- Punkt wie Sitte (Brauch) entstehen. �
-Eine Sitte ist ein Verhalten, welches automatisch Akzeptanz findet, weil es im
Eigeninteresse der Spieler ist, dieses Verhalten zu übernehmen, wenn es alle anderen
auch tun.
Gefangenendilemma:
-Sanktionen werden von Mitgliedern des Kollektivs verhängt (z. B. Ausschluss von
zukünftigen Spielen, Boykott, etc.). Neben Bestrafung kann natürlich auch Belohnung die
Auszahlungen derart ändern, dass das soziale Optimum möglich wird. �
-Entdeckung und Bestrafung ist problematisch bei Unsicherheit. Es können
versehentlich kooperative Spieler bestraft werden oder die Drückeberger kommen
ungeschoren davon. �
-Erfolgreiche Lösungen beinhalten: -identifizierbare und stabile Gruppen potentieller
Teilnehmer
�
-„genügend“ grossen Nutzen der Kooperation, um die
Überwachungskosten und die Kosten der Bestrafung abzudecken.
�
-Mitglieder der Gruppe, welche miteinander
kommunizieren können.
Chicken-Spiel �
-Gleiche „Lösungen“ wie im Gefangenendilemma.
Kapitel 5: Spiele mit simultanen Spielzügenund reinen Strategien:
Kontinuierliche Strategien
Reine Strategien als stetige Variablen:
Beste-Antworten: Im Gleichgewicht muss jede Strategie eine beste Antwort auf die beste
Antwort der anderen Spieler sein.
Rationalizability: Eine Strategie, die dominiert wird, kann nie eine beste Antwort sein.
-Es gibt aber Strategien, welche nie eine beste Antwort sind und trotzdem nicht
dominiert werden (in Spielen mit mehr als zwei Spielern).
-Daher: „Nie eine beste Antwort“ ist ein allgemeineres Konzept als „dominiert“.� 
-Ist Rationalität der Spieler common knowledge, können wir das Konzept der iterierten
Elimination dominierter Strategien anwenden.
-Zusätzlich dazu können Strategien eliminiert werden, welche nie eine beste Antwort
darstellen.
-Die Menge der Strategien, welche diese Elimination überlebt, heisst rationalizable.
-D.h.: wenn ein Spiel ein Nash Gleichgewicht hat, ist es rationalizable aber auch ein Spiel
das kein Nash Gleichgewicht besitzt, kann es rationalizable Ergebnisse haben.
Herunterladen