6 Entscheidungen bei bewusst handelnden Gegenspielern 6.1

Werbung
Präskriptive
Entscheidungstheorie
6 Entscheidungen bei
bewusst handelnden
Gegenspielern
Gliederung
6 Entscheidungen bei bewusst handelnden Gegenspielern
6.1 Kurzer Überblick über die Zweige der Entscheidungstheorie
6.2 Grundmodell und Grundbegriffe der Spieltheorie
6.3 Überblick über unterschiedliche Spielformen
6.4 Zwei-Personen-Nullsummenspiele
6.5 Das Gefangenendilemma
6.5.1 Allgemeine Darstellung
6.5.2 Wiederholtes Gefangenendilemma
6.5.3 Beispiel für eine betriebswirtschaftliche Anwendung
(6.5.3 Gefangenendilemma und Unternehmensethik
6.6 Kooperative Spiele) wahrscheinlich erst nächste Sitzung
6.1 Zweige der
Entscheidungstheorie
Mehrere Aktoren
Ein Aktor
Risiko
Theorie sozialer
Entscheidungen
Spieltheorie
Sicherheit
- ein Ziel
- mehrere Ziele
Ungewissheit
6.2 Grundmodell und Grundbegriffe
der Spieltheorie
Spieler 2
b1
b2
a1
u1(a1,b1),u2(a1,b1)
u1(a1,b2),u2(a1,b2)
a2
u1(a2,b1),u2(a2,b1)
u1(a2,b2),u2(a2,b2)
Spieler 1





Spieler 1 hat die Strategiemenge Ai = {a1,…,am} (hier a1 und a2)
Spieler 2 hat die Strategiemenge Bj = {b1,…,bn} (hier b1 und b2)
Aus jeder Strategiekombination (ai,bj) ergibt sich eine Auszahlungskombination für
Spieler 1 (u1) und Spieler 2 (u2). Eine solche Darstellung heißt Bimatrix.
Die Funktionen, die die Konsequenzen der Strategien in Abhängigkeit von der Wahl
der Spieler angeben heißen Auszahlungsfunktionen ui.
Für Spieler 1 stehen die Auszahlungen für seine Strategie 1 in der 1. Zeile, für Spieler
2 stehen die Auszahlungen für seine Strategie 1 in der 1. Spalte der Bimatrix.
Charakteristika von
Spielsituationen



Die Ergebnisse der Entscheidungen eines
Aktors hängen ab von den bewussten
Entscheidungen anderer Aktoren. Die
Entscheidungen sind interdependent.
Die Spieler haben zumindest teilweise
konfligierende Ziele und verfolgen ihren eigenen
Nutzen.
Jeder Aktor muss bei seinen Entscheidungen
berücksichtigen, wie sich der Gegenspieler
vermutlich entscheiden wird.
Begriffe der Spieltheorie



Interdependente Entscheidungen werden „strategisch“
genannt. Ein Plan mit passenden Handlungsschritten
heißt Strategie.
Der Zweig der Sozialwissenschaften, der sich mit
strategischem Entscheiden beschäftigt, nennt sich
Spieltheorie. Die Aktoren sind die Spieler.
Ein beendetes Spiel ist eine Partie. Spiele, bei denen
jeder Spieler nur einen Zug pro Partie ausführt, heißen
Spiele in Normalform. (Beispiel: Preisfestlegung im
Dyopol).
Begriffe der Spieltheorie


Spiele, bei denen jeder Spieler pro Partie mehrere Züge
auszuführen hat, heißen Spiele in extensiver Form
(Beispiel: Schach).
Durch einen Kunstgriff können Spiele in extensiver Form
in Spiele in Normalform überführt werden. Als
Handlungsalternativen gelten nicht mehr die einzelnen
Züge eines Spielers, sondern umfassende Strategien.
Als Strategie bezeichnet man einen Plan, der für jede
Information, die dem Spieler i im Zeitpunkt der
Ausführung eines Zuges zur Verfügung stehen kann,
eine bedingte Anweisung enthält, wie der Zug
auszuführen ist (vollständiger Verhaltensplan).
6.3 Überblick über Spielformen
Kriterium
Anzahl der Spielzüge pro
Partie
Jeder Spieler macht
unabhängig vom anderen
einen Spielzug pro Partie;
Spiele in Normalform
Mehrere Spielzüge pro
Partie; Spiele in extensiver
Form
Anzahl der Spieler
Zwei-Personen-Spiele
N-Personen-Spiele
Reihenfolge der Spielzüge
Simultan; beide Spieler
entscheiden gleichzeitig
Sequentiell; Spieler 1
beginnt, dann entscheidet
Spieler 2
Absprachen zwischen den
Spielern
Jeder Spieler entscheidet
für sich; unkooperative
Spiele
Spieler einigen sich auf eine
gemeinsame Strategiewahl;
kooperative Spiele
Anzahl der Partien
Eine Partie
Wiederholte Partien
Anzahl der Strategien
Endlich; Matrixspiele
Unendlich; kontinuierliche
Spiele
Überblick über Spielformen
Auszahlungssumme
Nullsummenspiele; die
Auszahlungssumme für
die Spieler ist konstant;
was der eine gewinnt,
muss der andere
verlieren, d.h. die
Summe der Gewinne
und Verluste ist Null.
Nicht-Nullsummenspiele;
die Spieler können durch
Kooperation gemeinsam
eine bessere Situation
erreichen (win-winSituation).
Anzahl der Lösungen
Determinierte Spiele; es
existiert genau eine Lösung
Indeterminierte Spiele
Informationen
Perfekte Information;
jeder kennt die Anzahl
der Spieler, Strategien,
die Auszahlungen und
den Verlauf der
bisherigen Partie.
Imperfekte Information;
6.4 Zwei-PersonenNullsummenspiele


Der Gewinn des ersten Spielers ist genau gleich
dem Verlust des zweiten Spielers: u2 = -u1
Die Interessen der Spieler sind antagonistisch,
eine Kooperation ist nicht sinnvoll.
Spieler 2
b1
b2
b3
4/-4
1/-1
4/-4
1/-1
5/-5
3/-3
2/-2
0/0
3/-3
4
5
3
Minimum ai
Spieler 1
a1
a2
a3
Maximum bj
1
0
3
Zwei-Personen-Nullsummenspiel


Eine Möglichkeit zur Entscheidung ist die
Maximin-Strategie. Spieler 1 schaut sich die
Auszahlungen für seine 3 Strategien an und
bestimmt jeweils das Zeilenminimum. Dann
wählt er die Alternative mit dem maximalen
Minimum, hier also a3.
Diese Auszahlung, die der Spieler aus eigener
Kraft garantieren kann, heißt unterer Spielwert.
Zwei-Personen-Nullsummenspiel
Spieler 2 schaut sich die Auszahlungen für
seine 3 Strategien an und bestimmt die
maximalen Verluste für die Strategien,
also das Spaltenmaximum. Dann wählt er
das Minimum der Maxima, hier also b3.
 Dieser Verlust, den der Spieler 2 maximal
riskiert, heißt oberer Spielwert.

Zwei-Personen-Nullsummenspiel
Die aus dem Spiel resultierende
Auszahlung liegt auf jeden Fall zwischen
dem unteren und dem oberen Spielwert,
im sog. Indeterminiertheitsintervall.
 Stimmen oberer und unterer Spielwert
überein, dann ist die Lösung eindeutig,
das Spiel ist determiniert.

Zwei-Personen-Nullsummenspiel
Im Beispiel ist die Lösung determiniert im
Punkt a3/b3.
 Da beide Spieler in diesem Punkt ihre
beste Strategie sehen, besteht dort ein
sog. Gleichgewichtspunkt. Es handelt sich
um eine wechselseitig beste Antwort und
eine stabile Lösung, von der keiner
abweicht.

Zwei-Personen-Nullsummenspiel
Wechselseitig beste Antworten heißt:
Spieler 1 bestimmt zu jedem möglichen b
seine beste Antwort. Wenn Spieler 2 b3
wählt, dann ist die beste Antwort a3 mit
einer Auszahlung von 3.
 Spieler 2 bestimmt zu jedem möglichen a
seine beste Antwort. Wenn Spieler 1 a3
wählt, dann ist b3 eine beste Antwort.

Zwei-Personen-Nullsummenspiel
Spieler 2
b1
b2
Spieler 1
a1
a2
a3
Maximum bj



Minimum ai
10/-10
0/0
2000/-2000
1/-1
1000/-1000
0/0
2000
1000
1
0
0
Spieler 1 wählt a1. Unterer Spielwert ist1.
Spieler 2 wählt b2. Oberer Spielwert ist 1000.
a1/b2 ist kein Gleichgewichtspunkt. Warum?
Zwei-Personen-Nullsummenspiel



Rechnet Spieler 1 mit der Maximinstrategie von Spieler 2
und dass dieser b2 wählt, dann würde er besser a2
wählen und einen Gewinn von 1000 einstreichen.
Da Spieler 2 in diesem Fall einen Verlust von 1000
erleiden würde, legt er sich lieber nicht auf b2 fest.
Allerdings darf er sich auch nicht auf b1 festlegen, denn
dann würde Spieler 1wiederum a3 wählen und ihm sogar
einen Verlust von 2000 zufügen. Es ist für Spieler 2
unmöglich, eine optimale Strategie festzulegen.
Die Spieler gehen am besten zu sog. gemischten
Strategien über.
Gemischte Strategien
Von gemischten Strategien spricht man,
wenn alle Strategien mit einer gewissen
Wahrscheinlichkeit in Betracht kommen.
 Die Entscheidung wird einem
Zufallsmechanismus überlassen, der die
gewünschte Wahrscheinlichkeitsverteilung
abbildet, bspw. Münzwurf bei zwei gleich
wahrscheinlichen Strategien.

Unberechenbarkeit



Der große Vorteil einer solchen Vorgehensweise
ist die Unberechenbarkeit der Strategiewahl für
den Gegner.
Unberechenbarkeit ist immer dann von Vorteil,
wenn der Gegner das Wissen um unsere
Entscheidung ausnutzen könnte.
Unberechenbarkeit ist bspw. sehr vorteilhaft bei
Kontrollen. (Kontrolleur = Spieler 1, Kontrollierter
= Spieler 2)
6.5 Gefangenendilemma
Eines der bekanntesten Zwei-PersonenSpiele in der BWL.
 Unkooperatives Zwei-Personen
Matrixspiel, aber kein Nullsummenspiel.
 Kooperation kann nützlich sein. Es gibt
Interessenharmonien und –konflikte
gleichzeitig.

6.5.1 Allgemeine Auszahlungsmatrix beim
Gefangenendilemma
Spieler 2
b1
b2
b,b
a,c
c,a
d,d
Spieler 1
a1
a2

a = bestes Ergebnis
b = zweitbestes Ergebnis
c = schlechtestes Ergebnis
d = drittbestes Ergebnis
Beispiel
Spieler 2
nicht gestehen
gestehen
Spieler 1
nicht gestehen
gestehen


2,2
0,10
10,0
6,6
Zwei des schweren Raubes Verdächtige werden
getrennt verhört. Beide haben zwei Strategien: nicht
gestehen (a1,b1) oder gestehen (a2,b2).
a1,b1 sind kooperative Strategien, a2,b2 defektive
Strategien.
Beispiel
Spieler 2
nicht gestehen
gestehen
Spieler 1
nicht gestehen
gestehen



2,2
0,10
10,0
6,6
Halten beide dicht, bekommen sie nur wegen unerlaubten
Waffenbesitzes je 2 Jahre.
Gestehen beide, bekommen sie beide 6 Jahre.
Gesteht nur einer, dann kommt dieser als Kronzeuge ungestraft
davon, während der andere 10 Jahre bekommt.
Gleichgewichtspunkt


Spieler 1 überlegt:
Wenn ich nicht gestehe (a1) und der andere gesteht (b2),
dann bekomme ich 10 Jahre und der Verräter geht nach
Hause. Also gestehe ich besser (a2). Wenn der andere
nicht gesteht (b1) und ich gestehe (a2), dann komme ich
ungestraft davon. Also gestehe ich besser. Es ist für ihn
die dominante Strategie zu gestehen.
Spieler 2 stellt genau die gleichen Überlegungen an, so
dass bei a2,b2 ein Gleichgewichtspunkt liegt. Man spricht
auch von einem Nash-Gleichgewicht.
Das Dilemma


Das Dilemma besteht darin, dass beide durch ihre individuell beste
Strategie eine Situation herbeiführen, die für beide schlechter ist als
die Kooperation.
Diese Überlegung trifft auf viele Situationen zu:
- zwei Unternehmen im Dyopol, die versuchen, sich durch
Preissenkungen Marktanteile abzujagen, erzeugen gemeinsam
einen ruinösen Wettbewerb.
- Fischer, die versuchen durch engmaschige Netze einen größeren
Fang zu erzielen, erzeugen gemeinsam die Vernichtung ihrer
Existenzgrundlage.
- zwei Nationen, die durch Aufrüstung versuchen der anderen
Nation militärisch überlegen zu werden, erzeugen gemeinsam ein
teures Wettrüsten.
- usw.
Das Dilemma
Manchmal ist ein Gefangenendilemma
erwünscht, nämlich bspw. als
Wettbewerbsanreiz im Dyopol, zur
Destabilisierung von Kartellen.
 Meistens führt die Situation aber dazu,
dass die kollektiv rationale Lösung gerade
dadurch verhindert wird, dass alle Spieler
ihren individuellen Nutzen maximieren.

Wege aus dem Dilemma

Eigentlich sind beide Spieler daran interessiert,
den schlechten Gleichgewichtspunkt zu
verlassen. Allerdings nur, wenn der andere auch
(zuverlässig) kooperiert. Was könnte man tun?
- einfache Absprachen
- persönlichkeitsbestimmte Lösung
- Defektieren entdecken und bestrafen
- Selbstbindung an kooperative Strategie
Absprachen

Einfache Absprachen ohne zusätzliche
Sicherungsinstrumente gelten als nicht
sehr zuverlässig, da bei jedem der Anreiz
zum Defektieren groß bleibt.
Persönlichkeitsbestimmte Lösung


Damit ist gemeint, dass die Spieler sich
gegenseitig gut kennen und deshalb das
Verhalten des anderen gut einschätzen können.
Vertrauen sie einander, bspw. weil sie
langjährige Freunde sind, dann kommen sie
eher zu einer kooperativen Lösung.
Auch wer den anderen als besonders
rachsüchtige Person kennt, könnte deshalb auf
ein Defektieren verzichten, aus Angst vor Strafe.
Garantierte Bestrafung


Man kann versuchen, den Gegenspieler zu
kooperativem Verhalten zu zwingen, indem man
jedes Defektieren garantiert bestraft.
Beispiel: Eine Niedrigpreisgarantie an die
eigenen Kunden zu geben führt bei jeder
Preissenkung der Konkurrenz unweigerlich zu
einem Preiskrieg, der auch dem anderen
schadet. Das stabilisiert die Preise auf einem
höheren Niveau.
Selbstbindung


Kooperation kann auch erleichtert werden,
indem man sich selbst auf kooperatives
Verhalten unwiderruflich verpflichtet.
Beispiel: Man schließt einen Vertrag ab mit
Garantien und Vertragsstrafen für den Fall der
Nichteinhaltung. Damit verschwindet sozusagen
der Vorteil aus dem Defektieren. Man kann auch
noch einen Dritten mit der Vertragsüberwachung
beauftragen.
6.5.2 Wiederholtes
Gefangenendilemma
Das Entdecken und Bestrafen von
unkooperativem Verhalten wird leichter bei
wiederholten Partien zwischen den
gleichen Spielern.
 Auch eine glaubwürdige Selbstbindung
wird leichter, weil man mit fortdauernder
Kooperation eine Reputation aufbaut, die
man nicht verlieren möchte.

Wiederholtes Gefangenendilemma

Ist die Anzahl der Spielrunden ex ante bekannt,
dann ist das Nash-Gleichgewicht allerdings
wieder der gegenseitige Verrat. In der letzten
Runde wird auf jeden Falle defektiert, weil keine
Bestrafung mehr folgen kann. Dann wird aber
auch in der vorletzten Runde defektiert, weil kein
Spieler sich ausbeuten lassen will. Dann wird
auch in vorvorletzten Runde defektiert usw. Es
findet keine Kooperation mehr statt.
Wiederholtes Gefangenendilemma


Bei einem von Robert Axelrod durchgeführten
Turnier mit verschiedenen Strategien bei zufällig
oft wiederholten Spielen, schnitt im Durchschnitt
die Strategie „tit-for-tat“ am besten ab.
Der Spieler kooperiert in der ersten Runde und
spielt danach immer so, wie der Gegner in der
Vorrunde gespielt hat, also kooperativ, wenn der
Gegner kooperativ war und defektiv, wenn der
Gegner defektiert hat.
Stärken von „tit-for-tat“




Die Strategie ist klar und einfach.
Sie ist „nett“, weil sie mit Kooperation startet.
Sie ist „provozierbar“, d.h. sie bestraft das
Defektieren des anderen sofort.
Sie ist „nachsichtig“, denn wenn der andere
wieder kooperiert, dann ist man auch wieder zur
Kooperation bereit.
Schwächen von „tit-for-tat“



Man muss einseitig mit Kooperation in „Vorleistung“
gehen.
Spielen beide Spieler nach dieser Strategie, dann bricht
durch ein einziges Missverständnis die ganze
Kooperation zusammen, weil man dann nie mehr zu
kooperativem Verhalten zurückfindet. (Echos)
Die Strategie ist im Durchschnitt die beste, weil sie fast
immer zumindest ein Unentschieden erreicht, aber sie
gewinnt so gut wie nie im direkten Paarvergleich mit
anderen Strategien.
Weitere Strategien






Immer defektieren
Immer kooperieren
zufällig defektieren oder kooperieren
mit Kooperation beginnen, aber nach einer
Defektion des anderen nie mehr kooperieren.
Tit-for-tat, aber in 10% der Fälle defektieren
nach einer Kooperation des anderen
Tit-for-n-tat, erst wenn der andere n-mal
defektiert, reagiert man auch mit Defektion
Beste Strategie?



Es gibt keine beste Strategie, da es immer auf die
Strategie des Gegners ankommt. Das Zusammenspiel
ist entscheidend!
Insgesamt schneiden die „freundlichen“ Strategien
besser ab, die zunächst mal mit Kooperation beginnen
und die auf Defektion begrenzt nachsichtig reagieren.
Die Strategie, immer zu kooperieren, ist dann besonders
erfolgreich, wenn der andere auch diese Strategie hat.
Gegen ausbeuterische Strategien verliert sie.
Empfehlungen für das
Spielverhalten




Sei nicht neidisch! Beachte, dass es nicht um ein
Nullsummenspiel geht, bei dem du um jeden Preis
gewinnen willst. Versuche, gemeinsam Erfolg zu haben.
Defektiere nie als erster! Das erzeugt nur Vergeltung
und schadet beiden.
Erwidere sowohl Kooperation als auch Defektion! Sei
nicht zu rachsüchtig und kehre zur Kooperation zurück,
wenn der andere es auch tut. Lasse dich aber auch nicht
endlos ausnutzen.
Sei nicht zu raffiniert! Erlaube dem anderen, deine
Strategie zu durchschauen, damit er sich darauf
einstellen kann.
6.5.3 Beispiel für eine
betriebswirtschaftliche Anwendung



Bei der Weitergabe von Wissen an die Kollegen in einem
Betrieb kann ein Gefangenendilemma auftreten.
Für alle zusammen wäre es das beste, wenn jeder sein
Wissen weitergibt. Für den Einzelnen kann es noch
attraktiver sein, das eigene Wissen zu behalten, zugleich
aber vom Wissen der anderen zu profitieren.
Wenn jeder versucht, die Trittbrettfahrerposition
einzunehmen, landet man bei der unkooperativen
Lösung, die für alle schlechter ist.
(Wissensweitergabe als spieltheoretisches Problem, in
Zeitschrift für Personalforschung, 2003, Heft 1, S. 37-57)
Maßnahmen zur Förderung der
Wissensweitergabe





Defektieren bestrafen bzw. kooperieren belohnen; schon im
Arbeitsvertrag die Wissensweitergabe verpflichtend machen und
Strafen androhen bzw. Belohnungen versprechen. Problem:
Wissensweitergabe beobachten und messen, insbesondere auch
die Qualität des Wissens.
Längere Spiele in Aussicht stellen, bspw. durch langfristige
Beschäftigungsverhältnisse und interne Arbeitsmärkte.
Eher kleinere Gruppen bilden, damit die Mitarbeiter sich besser
kennen und wechselseitig kontrollieren und Vertrauen aufbauen.
Den Mitarbeitern viele Gelegenheiten zum Austausch geben, bspw.
in Qualitätszirkeln.
Sorgfältige Mitarbeiterauswahl, Pflege einer offenen
Unternehmenskultur, Schulung der Führungskräfte.
Herunterladen