Ф (a i ) für λ = 0,4

Werbung
Präskriptive
Entscheidungstheorie
5 Entscheidungen bei
Ungewissheit und Risiko
Gliederung
5 Entscheidungen bei Unsicherheit
5.1 Entscheidungen bei Ungewissheit
5.1.1 Maximin-Regel
5.1.2 Maximax-Regel
5.1.3 Hurwicz-Regel
5.1.4 Savage-Niehans-Regel
5.1.5 Laplace-Kriterium
5.2 Entscheidungen bei Risiko
5.2.1 Bayes-Regel
5.2.2 (μσ)-Prinzip
5.2.3 Bernoulli-Prinzip
Das Grundmodell
Ziele
Z
Umfeld-
u1
u2
a1
e11
e12
a2
e21
zustände
u3
Alternativen


e22
e13
e23
Im Folgenden gehen wir von einem Ziel aus, betrachten
aber mehrere mögliche Umfeldzustände.
Für den Eintritt der Umfeldzustände sind keine
Wahrscheinlichkeiten bekannt → Ungewissheit.
Beispiel
u1
u2
u3
u4
a1
60
30
50
60
a2
10
10
10
140
a3
-30
100
120
130


Für eine Entscheidung bei Ungewissheit sei
obige Ergebnismatrix gegeben.
Wie würden sie entscheiden?
5.1.1 Maximin-Regel (MinimaxRegel)


Man wählt die Alternative, die im ungünstigsten Fall noch das beste
Ergebnis bringt, hier also Alternative 1 mit dem Minimum von 30.
Maximin!
Wenn die Zahlen in der Matrix für einen Schaden stehen, dann
minimiert man den maximalen Schaden. Auch dabei wäre
Alternative 1 am besten, da der maximale Schaden dann nur 60
beträgt. Minimax!
u1
u2
u3
u4
Minimum
a1
60
30
50
60
30
a2
10
10
10
140
10
a3
-30
100
120
130
-30
Kritik an der Maximin-Regel


Der Entscheidungsträger ist extrem risikoscheu bzw. pessimistisch,
da er immer vom schlechtesten möglichen Zustand ausgeht.
Es geht nur ein Ergebnis in die Bewertung ein. Das wird um so
unsinniger, je weiter die Ergebnisse streuen. Im Beispiel unten wäre
Alternative 2 nach der Maximin-Regel vorzuziehen.
u1
u2
u3
u4
Minimum
a1
1.000.000 1.000.000 0,99
1.000.000 0,99
a2
1
1
1
1
1
5.1.2 Maximax-Regel

Man wählt die Alternative, die im günstigsten Fall
das höchste Ergebnis bringt. Hier also
Alternative 2. Maximax!
u1
u2
u3
u4
Maximum
a1
60
30
50
60
60
a2
10
10
10
140
140
a3
-30
100
120
130
130
Kritik an der Maximax-Regel


Der Entscheider ist extrem risikofreudig bzw. optimistisch, da er nur
vom bestmöglichen Zustand ausgeht. Die meisten Menschen sind
eher risikoscheu.
Sich nur an einem Ergebnis zu orientieren, kann besonders dann zu
falschen Entscheidungen führen, wenn die Ergebnisse stark
streuen. Nach der Maximax-Regel wäre im Beispiel unten
Alternative 1 vorzuziehen.
u1
u2
u3
u4
Maximum
a1
1
1
150
1
150
a2
100
120
130
130
130
5.1.3 Hurwicz-Regel
Die Maximin und die Maximax-Regel
werden kombiniert.
 Ein Optimismusparameter λ, der zwischen
0 und 1 liegt, gewichtet das minimale und
das maximale Ergebnis.
 Für jede Alternative ai errechnet sich der
Präferenzwert durch
Ф(ai) = λ x maxj (eij) + (1- λ) x minj (eij)

Beispiel für die Hurwicz-Regel
u1
u2
u3
u4
Max
Min
Ф (ai) für λ = 0,4
a1
60
30
50
60
60
30
0,4 x 60 + 0,6 x 30 = 42
a2
10
10
10
140
140
10
0,4 x 140 + 0,6 x 10 = 62
a3
-30
100
120
130
130
-30
0,4 x 130 + 0,6 x (-30) = 34


Der Parameter λ spiegelt den Optimismus wider. Ist λ =1, dann ist der
Entscheider sehr optimistisch und lässt nur das beste Ergebnis einfließen
(=Maximax). Ist λ = 0, dann ist er pessimistisch und richtet sich nur am
Minimum aus (=Maximin).
Mit Werten für λ zwischen 0 und 1 kann man beide Werte einfließen lassen.
Je näher λ bei 1 liegt, desto optimistischer ist der Entscheider. Hier: λ = 0,4.
Kritik an der Hurwicz-Regel


Es werden immerhin zwei Ergebniswerte berücksichtigt. Da es sich
aber um die Extremwerte handelt, kann auch diese Regel zu
falschen Entscheidungen führen.
Berechnet man den Präferenzwert nach der Hurwicz-Regel, dann
sind Alternative 1 und 2 gleichwertig, obwohl Alternative a2 eindeutig
besser ist.
u1
u2
u3
u4
Max
Min
Ф (ai) für λ = 0,4
a1
1
0
0
0
1
0
0,4 x 1 + 0,6 x 0 = 0,4
a2
0
1
1
1
1
0
0,4 x 1 + 0,6 x 0 = 0,4
5.1.4 Savage-Niehans-Regel
u1
u2
u3
u4
a1
60
30
50
60
a2
10
10
10
a3
-30
100
120


u1
u2
u3
u4
a1
60 -60 = 0
70
70
80
140
a2
60-10 = 50
90
110
0
130
a3
60-(-30) = 90
0
0
10
Zunächst wird eine Matrix des Bedauerns aufgestellt. Dazu
bestimmt man für jeden möglichen Umfeldzustand die Alternative,
die das maximale Ergebnis bringen würde (rot geschrieben).
Daraus ergibt sich die Bedauernsmatrix (rechts), indem von dem
Spaltenmaximum das jeweilige Ergebnis abgezogen wird.
Savage-Niehans-Regel
u1
u2
u3
u4
Maximum
a1
0
70
70
80
80
a2
50
90
110
0
110
a3
90
0
0
10
90


Die Bedauernsmatix wird auch als Opportunitätskostenmatrix oder
Nutzenentgangsmatrix bezeichnet. Sie gibt an, was ich dadurch
„verliere“, dass ich beim Eintritt eines Umfeldzustandes uj nicht die
Alternative gewählt habe, die dann am besten gewesen wäre.
Man wählt die Alternative, bei der das maximale Bedauern minimal
ist, also hier Alternative 1.
Kritik an der Savage-NiehansRegel



Es gehen wieder nicht alle Werte in die
Entscheidung ein, sondern nur Extremwerte.
Der Entscheider ist sehr pessimistisch, weil er
vom schlechtesten möglichen Fall ausgeht.
Die Rangfolge zwischen zwei Alternativen a1
und a2 kann sich dadurch verändern, dass eine
dritte Alternative hinzukommt.
5.1.5 Laplace-Kriterium



Es wird einfach der Durchschnitt der Ergebnisse für alle
Umfeldzustände gebildet.
Es wird unterstellt, dass alle Umfeldzustände gleich wahrscheinlich
sind.
Das entspricht der Berechnung des Erwartungswertes in
Risikosituationen.
u1
u2
u3
u4
Фai
a1
60
30
50
60
(60 + 30 + 50 + 60):4 = 50
a2
10
10
10
140
(10 + 10+ 10 + 140):4 = 42,5
a3
-30
100
120
130
(-30 + 100 + 120 + 130):4 = 80
Kritik am Laplace-Kriterium



Positiv ist, dass alle Werte in die Entscheidung
einfließen.
Passt nur für einen risikoneutralen Entscheider.
Man kann sich fragen, ob tatsächliche alle
Umfeldzustände gleich wahrscheinlich sind.
Wenn nicht, sollte man den Umfeldzuständen
Wahrscheinlichkeiten zuordnen, also zu einer
Entscheidung bei Risiko übergehen.
Rationalität der Entscheidung

Entscheidungsregel
Optimale Alternative
Maximin
a1
Maximax
a2
Hurwicz (mit λ = 0,4)
a2
Savage-Niehans
a1
Laplace
a3
Die Entscheidung fällt je nach Regel
unterschiedlich aus. Sind die Regeln deshalb
Unsinn?
Rationalität der Entscheidung


Die unterschiedlichen Ergebnisse drücken die
unterschiedliche Einstellung des Entscheiders zum
Risiko aus. Für einen Pessimisten ist es subjektiv
rational, vom schlechtesten Ergebnis auszugehen.
Die Entscheidungsregeln genügen aber tatsächlich nicht
allen Rationalitätsanforderungen:
- Bei der Maximin, der Maximax und der Hurwicz-Regel kann eine
Alternative als optimal gelten, die von einer anderen dominiert wird.
- Bei der Savage-Niehans-Regel kann sich die Präferenz zwischen
zwei Alternativen dadurch ändern, dass eine dritte Alternative
dazukommt.
5.2 Entscheidung bei Risiko
Ziele
Z
u1
u2
w1
w2
w3
a1
e11
e12
e13
a2
e21
Umfeldzustände
Alternativen


W
e22
u3
e23
Es werden nun Eintrittswahrscheinlichkeiten für die
Umfeldzustände angegeben.
Diese können objektiv oder subjektiv sein.
Beispiel
U1
W1 = 0,3
U2
W2 = 0,5
U3
W3 = 0,2
a1
90
110
150
a2
95
105
120

Wie würden Sie entscheiden?
5.2.1 Bayes-Regel (μ-Prinzip)



Man gewichtet das beim Umweltzustand j eintretende
Ergebnis eij mit der Eintrittswahrscheinlichkeit wj.
Die so gewonnenen Produkte werden addiert und der
Erwartungswert μ ermittelt. μ = E(ai) = ∑ eij wj
Wähle die Alternative mit dem höchsten Erwartungswert!
U1
W1 = 0,3
U2
W2 = 0,5
U3
W3 = 0,2
μ
a1
90
110
150
0,3 * 90 + 0,5 * 110 + 0,2 * 150 = 112
a2
95
105
120
0,3 * 95 + 0,5 * 105 + 0,2 * 120 = 105
Kritik an der Bayes-Regel



Die Bayes-Regel hat den Vorteil der Einfachheit.
Sie liefert gute Ergebnisse bei Entscheidungen,
die häufig anfallen, da sich nach dem Gesetz
der großen Zahl dann die Ergebnisse dem
Erwartungswert annähern.
Sie passt allerdings nur für risikoneutrale
Entscheider, da die Streuung der Ergebnisse
nicht berücksichtigt wird.
5.2.2 (μσ)-Prinzip


Bei dieser Entscheidungsregel wird zusätzlich zum
Erwartungswert μ die Streuung berücksichtigt.
Die Streuung erfasst man über die Standardabweichung
nach der Formel σ = √ ∑wj (eij – μi)2
U1
W1 = 0,3
U2
W2 = 0,5
U3
W3 = 0,2
μ
σ
a1
90
110
150
112
20,88
a2
95
105
120
105
8,66
(μσ)-Prinzip


Der Entscheider drückt seine Risikopräferenz über den
Einbezug von σ in seine Präferenzfunktion aus.
Bewertet er die Streuung negativ, dann ist er
risikoscheu, bewertet er sie positiv, dann ist er
risikofreudig.
μ
U1
U2
U3
W1=0,3
W2=0,5
W3=0,2
a1
90
110
150
112
a2
95
105
120
105
σ
Ф = μ - 2σ
Ф = μ + 2σ
(risikoscheu)
(risikofreudig)
20,88
70,24
153,76
8,66
87,68
122,32
Kritik am μσ-Prinzip
An dieser Entscheidungsregel wird
kritisiert, dass Alternativen auch bei
gleichem Erwartungswert und gleicher
Streuung sehr unterschiedlich aussehen
können.
 Es kann passieren, dass eine dominante
Alternative den niedrigeren Präferenzwert
bekommt.

5.2.3 Bernoulli-Prinzip



Benannt nach Daniel Bernoulli, der 1738 einen
Aufsatz veröffentlichte, auf dem die
Entscheidungsregel beruht.
Wird auch als Erwartungsnutzentheorie
bezeichnet.
Die Ergebnismatrix wird zunächst in eine
Nutzenmatrix überführt. Jedem Ergebnis eij wird
ein Nutzen n(eij) zugeordnet, der sich nach der
Höhen- und Risikopräferenz des Entscheiders
richtet.
Bernoulli-Prinzip

Aus den Nutzwerten wird durch Gewichtung mit
den Wahrscheinlichkeiten der Erwartungswert
bestimmt. Daher auch Erwartungsnutzentheorie.

Entscheidungsprinzip: Wähle die Alternative mit
dem höchsten Erwartungsnutzen!
Ф(ai) = ∑ nij wj max!
Bedeutung von Risikopräferenzen
a1
U1
W1 = 0,5
200
U2
W2 = 0,5
200
a2
100
300



a1 = a2, der Entscheider ist risikoneutral.
a1 > a2, der Entscheider ist risikoscheu.
a1 < a2, der Entscheider ist risikofreudig.
Risikonutzenfunktion

Die unterschiedliche subjektive Einstellung zum Risiko
bringt der Entscheider bei der Erwartungsnutzentheorie
über die Risikonutzenfunktion (RNF) zum Ausdruck, mit
deren Hilfe er die Ergebnisse in Nutzwerte umrechnet.

Die Ermittlung der RNF ist schwierig und erfolgt über die
sog. Bernoulli-Befragung.

Es gibt verschiedene Methoden der Befragung, die auf
gemeinsamen Grundüberlegungen basieren.
Bernoulli-Befragung



Der Entscheider muss sagen,
wann er indifferent ist zwischen
einem sicheren Betrag (a1) und
den Chancen aus einer Lotterie
(a2), bei der er mit Wahrscheinlichkeit w mehr bekommt als den
sicheren Betrag und mit Wahrscheinlichkeit 1-w weniger.
Die riskante Alternative 2 nennt
man Basis-Referenz-Lotterie.
Der sichere Betrag, der den
gleichen Nutzen hat wie die
Lotterie, wird
Sicherheitsäquivalent genannt.
1
Sicherer Betrag
Maximaler Betrag mit
Wahrscheinlichkeit w
2
Minimaler Betrag mit
Wahrscheinlichkeit 1-w
Bernoulli-Befragung

Im Falle der Indifferenz zwischen a1 und a2 gilt:
Erwartungsnutzen der Basis-Referenz-Lotterie = Nutzen des Sicherheitsäquivalents.
EN (BRL) = w * n (emax) + (1-w) * n (emin) = n (SÄ)

Setze ich den Nutzen für das minimale Ergebnis
mit 0 fest und für das maximale Ergebnis mit 1
dann gilt:
EN (BRL) = w = n (SÄ)
Bernoulli-Befragung
In der Formel EN(BRL) = w = n(SÄ)
stecken 4 Größen: Die Wahrscheinlichkeit
w, die beiden Ergebnisse emin und emax
und das Sicherheitsäquivalent.
 Methoden zur Ermittlung der
Nutzenfunktion unterscheiden sich
danach, welche dieser Größen gegeben
sind und nach welcher gefragt wird.

Bernoulli-Befragung
Die Lotterie ist gegeben und es wird nach
dem Sicherheitsäquivalent gefragt:
Welchen sicheren Betrag würden sie einer
Lotterie gleich stellen, bei der sie mit der
Wahrscheinlichkeit 0,4 1000 € bekommen
und mit der Wahrscheinlichkeit 0,6 nichts?
 Certainty equivalent methods: MittelwertKettungs-Methode, Fraktilmethode.

Bernoulli-Befragung


Man gibt das Sicherheitsäquivalent vor und fragt
nach der Wahrscheinlichkeit, bei welcher die
Lotterie als gleichwertig empfunden wird:
Wie hoch muss die Wahrscheinlichkeit für einen
Betrag von 1000 € sein, damit die Lotterie ihnen
400 € wert ist?
Probability-equivalent-methods: Methode
variabler Wahrscheinlichkeiten, LotterieVergleich-Methode.
Methode variabler
Wahrscheinlichkeiten

Man bestimmt zwei Ergebniswerte, einen maximalen
und einen minimalen und ordnet ihnen Nutzen zu.
emax = 1000
n(1000) = 1
emin = 0
n(0) = 0

Der Entscheider soll wählen zwischen einem sicheren
Ergebnis von 400 (SÄ) und einer Lotterie, in welcher er
mit Wahrscheinlichkeit w 1000 € und mit Wahrscheinlichkeit 1-w 0 € bekommt.
W sei zunächst 0,5.
Methode variabler
Wahrscheinlichkeiten
Der Entscheider wähle im ersten
Durchgang a1, d.h. 400 € sicher sind ihm
lieber als die fifty-fifty-Chance auf 1000 €.
 Die Wahrscheinlichkeit wird variiert. Als
Alternative 2 wird eine Lotterie angeboten,
bei der die Wahrscheinlichkeit 1000 € zu
gewinnen auf 0,6 gestiegen ist.

Methode variabler
Wahrscheinlichkeiten



Der Entscheider wähle nun a2.
Da man die Wahrscheinlichkeit sucht, bei
welcher der Entscheider indifferent wird
zwischen a1 und a2, wählt man im dritten
Durchgang eine Wahrscheinlichkeit zwischen
0,5 und 0,6, bspw. 0,55.
Die Wahrscheinlichkeit wird solange variiert, bis
dem Entscheider die Lotterie genauso viel wert
ist, wie die 400 € Sicherheitsäquivalent.
Methode variabler
Wahrscheinlichkeiten

Der Entscheider werde indifferent bei w = 0,58. Nach der
Gleichung
EN(BRL) = w = n(SÄ)
entspricht w dem Nutzen des Sicherheitsäquivalents.

Damit hat man einen ersten Wert für die Nutzenfunktion
n(400) = 0,58.

Auf diese Weise kann man für mehrere
Sicherheitsäquivalente den Nutzen ermitteln und die
zugehörige Nutzenfunktion zeichnen.
Erkennen der Risikopräferenz



Die Risikopräferenz des Entscheiders ergibt sich aus
einem Vergleich seines Sicherheitsäquivalents mit dem
Erwartungswert der Lotterie.
In der ersten Runde waren dem Entscheider sichere
400 € lieber als eine 50%ige Chance auf 1000 €. Sein
Sicherheitsäquivalent liegt unter dem Erwartungswert
von 500 €. Damit ist er risikoscheu.
Die Differenz zwischen dem Erwartungswert und dem
SÄ (E – SÄ) nennt man Risikoprämie. Der Entscheider
verzichtet quasi auf 100 €, um auf Nummer sicher zu
gehen.
Nutzenfunktion und
Risikopräferenz



Eine lineare Nutzenfunktion
spiegelt einen risikoneutralen
Entscheider wider. SÄ = E
Eine konvexe Nutzenfunktion
spiegelt einen risikofreudigen
Entscheider wider. SÄrf > E
Eine konkave Nutzenfunktion
spiegelt einen risikoscheuen
Entscheider wider. SÄrs < E
n
N rs
N rf
0,5
SÄ rs
e
E
SÄ rf
Erkennen der Risikopräferenz
Risikoscheu
Sicherheitsäquivalent Risikoprämie positiv
kleiner als
Konkave Nutzenfunktion
Erwartungswert
Risikofreude
Sicherheitsäquivalent Risikoprämie negativ
größer als
Konvexe Nutzenfunktion
Erwartungswert
Risikoneutralität
Sicherheitsäquivalent Risikoprämie Null
gleich
Lineare Nutzenfunktion
Erwartungswert
Beispiel




Ein Landwirt überlegt, ob er Weizen oder Erdbeeren anbauen soll.
(Alternativen ai)
Sein Ziel ist Gewinnmaximierung (Z).
Entscheidender Umfeldzustand ist das Wetter. Er kann die Eintrittswahrscheinlichkeiten für die Uj schätzen.
Er hat für jede Alternative und jeden Umfeldzustand eine Ergebnisfunktion,
kann also die eij (Gewinne) prognostizieren.
Wetter
heiß/trocken
W = 0,1
mild/trocken
W = 0,3
mild/feucht
W = 0,6
Weizen
1.600
3.600
10.000
Erdbeeren
12.100
8.100
6.400
Beispiel



Der Landwirt hat die Risiko-Nutzen-Funktion RNF (eij) = √eij
Daraus ergibt sich die Nutzenmatrix und der Erwartungsnutzen.
Da der Erwartungsnutzen für die Erdbeeren höher ist, wählt er die
Erdbeeren.
Wetter
heiß/trocken
0,1
mild/trocken
0,3
mild/feucht Erwartungsnutzen
0,6
Weizen
40
60
100
0,1 * 40 + 0,3 * 60 +
0,6 * 100 = 82
Erdbeeren
110
90
80
0,1 * 110 + 0,3 * 90 +
0,6 * 80 = 86
Beispiel



Sein Sicherheitsäquivalent ist der sichere
Betrag, der ihm den gleichen Nutzen bringt wie
die Erdbeeren, also 86. Gesucht ist der Betrag,
der eingesetzt in die RNF genau 86 ergibt.
RNF(SÄ) = 86
√SÄ = 86 | hoch 2
SÄ = 86² = 7.396
Für mindestens 7396 € würde der Landwirt auf
den Anbau verzichten und bspw. das Land
verpachten.
Beispiel



Der Landwirt ist risikoscheu. Der
Erwartungswert des Erdbeeranbaus ist
0,1 * 12.100 + 0,3 * 8.100 + 0,6 * 6400 = 7480.
Das SÄ liegt unter dem Erwartungswert.
Die Risikoprämie ist positiv: 7480 – 7396 = 84.
Die Nutzenfunktion ist konkav.
Kritik



Die meisten Menschen haben keine eindeutige
Risikonutzenfunktion, sondern mischen risikoscheues
und risikofreudiges Verhalten. Sie zahlen bspw.
Versicherungsprämien, die über dem Schadenserwartungswert liegen (risikoscheu) und spielen Lotto
(risikofreudig).
Risikofreude oder –scheu variieren auch mit der Höhe
des Einsatzes und der Vermögensposition. Verluste
werden stärker bewertet als Gewinne.
Wahrscheinlichkeiten werden nicht linear bewertet. Eine
Steigerung von 0,98 auf 1 wird viel stärker positiv
gewertet als eine Steigerung von 0,02 auf 0,05.
Herunterladen