Seminar:
Differentialspiele
1
Gliederung
A.) Pollution vs.Nature
► a differential game model
B.) Battle around natural gas
► a nonzero-sum game with variable
final time
2
Pollution vs. Nature
Gliederung
I.
II.
III.
IV.
Einführung
Das Modell
Lösungskonzept
Anwendung des Modells auf ein Beispiel
Interpretation
Schlussfolgerungen (Empfehlungen)
4
Das Modell
Variablen
siehe Zettel
5
Das Modell
• Populationsdynamik
x G(x) h(t) F(y)
x(0) x 0
• Verschmutzungsdynamik
y H(v) D(y)
y(0) y 0
6
Das Modell
• Die Payoffs der Spieler sind dann
T
J1 (p1 (Ex) c1 (x))Ex exp( r1t)dt
0
T
J 2 (p 2 (v) c 2 (.))v exp( r2 t)dt
0
wobei
0 E E E
0 v v v
7
Das Modell
• Also erhalten wir folgende Hamiltonfunktionen
H1 (p1 (Ex) c1 (x))Exe r1t 11 (G(x) h(t) F(y))
12 (H(v) D(y))
H 2 (p 2 (v) c 2 (.))ve r2 t 21 (H(v) D(y))
22 (G(x) h(t) F(y))
8
Lösungskonzept
• Definition (Nash Gleichgewicht)
Das Paar (E*,v*) heißt Nash Gleichgewicht, wenn gilt
J1(E,v*) ≤
J1(E*,v*) , für alle zulässigen E
J2(E*,v) ≤
J2(E*,v*) , für alle zulässigen v
und
9
Lösungskonzept
• Notwendige Bedingungen:
(E*,v*) Nash Gleichgewicht, dann gilt:
1. Es existiert eine nicht triviale Lösung des Systems
Hi
ii
ii
x
Hi
ij
ij
y
(i 1, 2)
(i 1, 2; j 1, 2;i j)
2. E* maximiert H1(t,x,y,E,v*) und
v* maximiert H2(t,x,y,E*,v).
3.Es muss die Transversilitätsbedingung erfüllt sein
λij(T) = 0
für alle i,j
10
Lösungskonzept
Damit müssen wir also das folgende System lösen:
x(t) G(x) h(t) F(y)
y(t) H(v) D(y)
,
x(0) x 0
,
y(0) y 0
11 (t) e r1t ((c1 p1 )E (c1 p1 )Ex) 11 (G (x) E)
12 (t) 11F(y) 12 D(y)
,
11 (T) 0
12 (T) 0
21 (t) c2 (y)ve r2 t 21D(y) 22 F(y)
22 (t) c2 (x)ve r2 t 22 (G (x) E)
unter
,
,
,
21 (T) 0
22 (T) 0
Berücksichtigung
0EEE
0vvv
H1E (p1 (Ex)E p1 (Ex) c1 )xe r1t 11x 0
H 2v (p2 (v)v p 2 (v) c 2 )e r2 t 21H (v) 0
11
Lösungskonzept
Gradientenverfahren (Algorithmus)
1.
2.
3.
4.
5.
6.
Schätze einige Werte für die Steuerungen E und v .
Bestimme die Werte für die Variablen x und y aus den
Zustands-Gleichungen.
Bestimme λij aus den „adjungierten“ Gleichungen.
Bestimme HE1 und Hv2 , i. A. sind diese ungleich Null.
HE1 und Hv2 als Steigungen auffassend, ändere die
Schätzungen von E und v durch
ΔE = W1 HE1 und Δv = W2 Hv2
mit geeigneten Gewichten Wi.
Berechne mit diesen Werten die Payoffs
if
|| J1n-1 – J1n || < ε und || J2n-1 – J2n || < ε STOP
else
GO TO 1.
12
Anwendung
• Für die Fischdynamik gelte
x(t) a1x a 2 x 2 Ex a 3 y 2 (a1 , a 2a 3 0)
x(0) x
0
• Für die Verschmutzungsdynamik gelte
y(t) b1v b 2 y (b1 , b 2 0)
y(0) y
0
13
• Für die Preise und Kosten gelte:
p1 p1 (h) p1 (Ex) 1 2 Ex, (1 , 2 0)
p 2 p 2 (v) 1 2 v,
(1 , 2 0)
1
c1 c1 (x) 2 ,
x
(1 , 2 0)
c2 c2 (x) 1 2 x,
c2 c2 (y) 3 y,
( 1 , 2 , 3 0)
14
• Wir wählen folgende Parameter
a1 101
a2
1 101
2 301
a3
1
40
1 2 2 101
1
25
b1 15
b 2 501
3 151 1 15 2
3 103
1 2 2
1
25
1
2
Fall 1:
x0 = 3, y0 = 3,T= 3, E Є [0.5 , 1], v Є [0.5 , 2] und
E = v = 0, wenn x < 1
c2 c2 (x) 1 2 x,
linkes Bild
c2 c2 (y) 3 y,
( 1 , 2 , 3 0)
rechte Bild
15
Fall 1
16
• Damit erhalten wir mit den Konstanten
a1 101
a2
1 101
2 301
1
40
1 2 2 101
a3
1
25
b1 15
b 2 501
3 151 1 15 2
3 103
1 2 2
1
25
1
2
Fall 1:
x0 = 3, y0 = 3,T= 3, E Є [0.5 , 1], v Є [0.5 , 2] und
E = v = 0, wenn x < 1
Fall 2:
x0 =3, y0 = 1, T = 6, E Є [0.5 , 1], v Є [0.5 , 2] und
E = v = 0, wenn x < 1
17
Fall 2
18
Fall 3:
Alles wie im Fall 2 außer o.1 ≤ E ≤ 1 und 0.1 ≤ v ≤ 2
19
Fall 3
20
Fall 3:
Alles wie im Fall 2 außer o.1 ≤ E ≤ 1 und 0.1 ≤ v ≤ 2
Fall 4:
Wir haben jetzt wieder T = 3 und kein Minimum mehr
für x, alles andere wie zuvor.
21
Fall 4
22
Schlussfolgerungen
• Der Produzent verhält sich „anständiger“,
wenn die Produktionskosten direkt von dem
Ausmaß der Umweltverschmutzung
abhängen.
Empfehlung: Die „Produktion des
Verschmutzungsmaterials“
sollte direkt besteuert
werden.
23
Battle around natural gas
• A nonzero-sum game with variable final
time
24
Gliederung
1.
Einführung
Was ist ein Oligopol?
2.
3.
Das Problem
Lösungskonzepte (open loop)
- Einzelkämpfer
Definition (Nash Gleichgewicht)
Notwendige Bedingungen
Stabilität der Lösungen
- strategische Allianzen
Definition (Pareto-Optimum)
Berechnung
25
Oligopol
• Charakterisierung des Marktes im Hinblick auf die
Angebots- und Nachfragestrucktur des Marktes
Anbieter
viele
wenige
viele
atomistische
Konkurrenz
AngebotsOligopol
wenige
NachfrageOligopol
bilaterales
Oligopol
Nachfrager
26
Das Problem
Variablen
Blatt
27
Das Problem
• Die Zustandsgleichung lautet
x(t) f (t, x(t), u1 (t),..., u N (t)),
{
t [o, T]
x(0) x 0 0
mit
f (t, x(t), u1 (t),..., u N (t)) U(t)
28
Das Problem
• Die Erlösfunktion lautet dann:
T
J i (u1 ,..., u N )
t
e
Li (u1 (t),..., u N (t))dt,
0
wobei 0 und
Li (u1 ,..., u N ) u i P(U) Ci (u i )
mit
P(U) a bU
Ci (u i ) d i u i2
weiterhin
a, b 0
di 0
gilt
x(T) 0
i 1,..., N
29
Definition
• Sei μi(t) die Information-Strucktur des
Spielers Pi zur Zeit t.
Dann heißt μi(t)
(i) open loop, falls
μi(t) = {x(0) , t}
(ii) feedback, falls
μi(t) = {x(t) , t}, für 0 ≤ t ≤ T
30
Definition
• Nash Gleichgewicht:
Sei (γ1*,...,γN*) ein N-Tuppel von Strategien mit γi* aus
Γi. Dann heißt (γ1*,...,γN*) Nash Gleichgewicht, falls
Ji* = Ji (γ1*,...,γN*) ≤ Ji (γ1*,...,γi-1*,γi,γi+1*,γN*)
für alle γi aus Γi , i = 1,...,N
Γi = Menge aller zulässigen Strategien:
open loop Fall
i
mi
feedback Fall
i
mi
mit
und
u i (t) i (x 0 , t)
u i (t) i (x(t))
31
Notwendige Bedingungen
1.
2.
x (t) f (t, x (t), u1 (t),..., u N (t)) , x(0) x 0
u i (t) arg max
ui
mi
H i (t, i (t), x (t), u1 (t),..., u i 1 (t),
u i (t), u i 1 (t),..., u N (t))
4.
i (t) H i (t, i (t), x (t), u1 (t),..., u N (t))
x
x(T) 0
5.
H i (T, i (T), x (T), u1 (T),..., u N (T)) 0
3.
mit
H i (t, i , x , u1 ,..., u N ) et L i (u1 ,..., u N ) i f (t, x, u 1,..., u N )
32
Open loop Nash Gleichgewicht
Mit den Parametern a = 2, b = 1, d1 = d2 = 1 erhalten wir
Beispiel:
x (u1 u 2 ) , x 0 1
T
J i et Li (u1 , u 2 )dt
0
mit Li 2u i 2u u i u j , i, j 1, 2 i j
2
i
Dann ist die Hamilton Funktion
t
H i (t, i , x, u1 , u 2 ) e Li (u1 , u 2 ) i (u1 u 2 )
33
Lösung Steuerungen
A
B
C
D
u1 = 2/5 - 2/5et – T
u2 = 2/5 - 2/5et – T
u1 = 2/5 - 4/35et -T
u2 = 2/5 - 4/35et -T
u1 = 2/5 - 22/5et -T
u2 = 2/5 + 8/5et - T
u1 = 2/5 + 8/5et -T
u2 = 2/5 - 22/5et -T
Profits
Endzeit
J1 = 0.272
J2 = 0.272
J1 = 0255
J2 = 0.255
J1 = 0.001
J2 = 0.408
J1 = 0.408
J2 = 0.001
TA=2.131
TB=1.470
TC=4.719
TD=4.719
Erfüllen nicht die Bedingung ui(.) ≥ 0
34
Algorithmus
1.
Setze Iterationsindex i = 0 und j = 1
Wähle eine Startsteuerung u (j0) 0, Tu(0) .
j
2.
Löse
max J 2 (u1(i ) , u2 , T )
für ein festes, aber
u2
s.t. x u1(i ) u2 , x(0) x0
beliebiges T 0, Tu(i )
*
(i )
*
Definiere T : arg max J 2 (u1 , u2 , T )
T 0,T
1
(i )
u1
3.
Setze Tu(i ) : T *
2
.
J 2 (u1(i ) , u2 , T * )
und u2(i ) : max
u
2
35
4.
Löse
max J1 (u1 , u2(i ) , T )
u1
s.t. x u1 u , x(0) x0
(i )
2
für ein festes, aber
beliebiges T 0, Tu(i )
*
*
(i )
T
:
arg
max
J
(
u
,
u
Definiere
1 1
2 ,T )
2
T 0,Tu( i )
( i 1)
u1
: T
*
2
5.
Setze T
6.
Wenn || u (ji 1) u (ji ) ||
sonst
und
u1(i 1) : max J1 (u1 , u2(i ) , T * )
u1
STOP
GOTO 2.
36
Definition (Stabilität der Lösung)
• Konvergieren die Startsteuerungen im
Algorithmus gegen eine andere mögliche Lösung
oder konvergieren diese überhaupt nicht, so heißen
die Strategien (Startsteuerungen) instabil.
• Andererseits, wenn die Startsteuerungen sich nicht
ändern, heißen sie stabil.
37
Iterationsprozess
38
Payoff - Funktion
REMARK
lim TA
,
0
lim J iA x 0
0
und
lim TB
0
7
4
,
lim J iB
0
7
4
x0
39
Strategische Allianzen
• Eine Strategische Allianzist die Zusammenarbeit
zwischen Unternehmen
1. ... die rechtlich und wirtschaftlich selbstständig sind,
2. ... die durch wechselseitige Abstimmung (Koordination)
und/ oder gemeinsame Erfüllung (Kooperation) von (Teil-)
Aufgaben gekennzeichnet ist,
3. ... die auf freiwilligem Entschluss aller
Kooperationspartner beruht,
4. ... die der Verfolgung von gemeinsamen Zielen und/
oder miteinander kompatiblen Zielen der
Kooperationspartner dient,
5. ... aus der sich die Partner im Vergleich zum alleinigen
Vorgehen eine höhere Zielerreichung versprechen.
40
Definiton:Pareto-Optimum
Ein zulässiges Strategiepaar (γ1* , γ2*)
heißt Pareo-Optimal, falls
Ji(γ1 , γ2) ≥ Ji (γ1* , γ2*)
für alle γ1 , γ2 und i = 1,2
41
Problemformulierung:
• Damit ergibt sich für die beiden Firmen das folgende Problem
max J 1 J1 2 J 2
u1 ,u 2 0
unter
x (u1 u 2 ) ,
mit
1 2 1 i 0
x(0) x0 ,
x(T ) 0
T max Ti
i{1, 2}
Ti
mit
J i e t Li (u1 , u 2 )dt
0
und
Li (a bU )ui ki ui2
42
• Dann ist die Hamiltonfunktion gegeben
durch
H(t, , x, u1 , u 2 ) e t {1L1 (u1 , u 2 ) 2L 2 (u1, u 2 )} ' x
• Und die Lagrangefunktion ist
2
(t, , x, u1 , u 2 ) H(t, , x, u1, u 2 ) q iu i
i 1
43
• Die notwendigen Bedingungen für ein zulässiges Trippel
(x*(t),u1*(t),u2*(t)) sind
*
x*
*
x
* H
0
qi
u i u i
H(t, , x * , u1* , u *2 ) H(t, , x * , u1, u 2 ), u i 0 i 1, 2
H i
0,
ui
ui 0
und
ui
H i
0,
ui
da
qi ui 0
44
• Nehmen wir nun an k1=k2 und α1 > α2 , so
folgt aus den notwendogen
Bedingungen und der Nichtnegativität
der Lösung, dass
uPareto = uNash
45