Optimale Steuerung ökonomischer Prozesse am Beispiel eines

Werbung
Westfälische Wilhelms-Universität Münster
Institut für numerische und instrumentelle Mathematik
Diplomarbeit
Optimale Steuerung ökonomischer
Prozesse am Beispiel eines
komplexen Unternehmensmodells mit
bang-bang, singulären Steuerungen
und Zustandsbeschränkungen
Nadja Balzer
Betreuer: Prof. Dr. H. Maurer
Februar 2006
Inhaltsverzeichnis
1 Einleitung
1
2 Theorie der optimalen Steuerprozesse
2.1 Formulierung optimaler Steuerprozesse . . . . . . . . . . . . . . . .
2.2 Äquivalente Umformungen eines Steuerprozesses . . . . . . . . . . .
2.2.1 Transformation eines Bolza-Problems auf ein MayerProblem . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.2.2 Transformation einer freien Endzeit auf eine feste Endzeit .
2.2.3 Transformation nicht-autonomer Probleme auf autonome Probleme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.3 Das Minimumprinzip von Pontryagin . . . . . . . . . . . . . . . . .
2.4 Probleme mit linear auftretender Steuerung - Bang-bang und singuläre Steuerungen . . . . . . . . . . . . . . . . . . . . . . . . . . .
.
.
5
5
8
.
.
8
9
. 10
. 10
. 12
3 Optimale Steuerprozesse mit reinen Zustandsbeschränkungen
15
3.1 Grundbegriffe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
3.2 Direkte Methode - Direct adjoining approach“ . . . . . . . . . . . . 18
”
3.3 Indirekte Methode - Indirect adjoining approach“ . . . . . . . . . . . 20
”
4 Hinreichende Optimalitätsbedingungen
24
4.1 Exkurs in die nichtlineare Optimierung . . . . . . . . . . . . . . . . . 24
4.2 Konvexe Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
4.3 Hinreichende Optimalitätsbedingungen für unbeschränkte Steuerprozesse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
4.4 Hinreichende Optimalitätsbedingungen für OSP mit Zustandsbeschränkungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
5 Numerische Lösung optimaler Steuerprozesse mittels direkter Verfahren 37
5.1 Diskretisierung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
5.2 Vor- und Nachteile der direkten Verfahren . . . . . . . . . . . . . . . 39
ii
Inhaltsverzeichnis
6 Das
6.1
6.2
6.3
6.4
6.5
modifizierte Modell von Lesourne und Leban
Beschreibung des Modells von Lesourne und Leban . . .
Formulierung des modifizierten Steuerungsproblems . . .
Auswertung des Minimumprinzips . . . . . . . . . . . . .
Numerische Ergebnisse . . . . . . . . . . . . . . . . . . .
Überprüfung der hinreichenden Optimalitätsbedingungen
7 Ein
7.1
7.2
7.3
7.4
komplexes Unternehmensmodell
Beschreibung des komplexen Unternehmensmodells . . . . . . . . .
Formulierung des komplexen Steuerungsproblems . . . . . . . . . .
Auswertung des erweiterten Minimumprinzips . . . . . . . . . . . .
Numerische Ergebnisse . . . . . . . . . . . . . . . . . . . . . . . . .
7.4.1 Optimale Steuerung des komplexen Unternehmensmodells bei
variierendem Preis . . . . . . . . . . . . . . . . . . . . . . .
7.4.2 Optimale Steuerung des komplexen Unternehmensmodells bei
konstantem Preis . . . . . . . . . . . . . . . . . . . . . . . .
7.4.3 Optimale Steuerung des komplexen Unternehmensmodells bei
Verdoppelung der Planungsperiode . . . . . . . . . . . . . .
8 Schlussbemerkung
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
41
41
44
45
48
57
.
.
.
.
61
61
66
68
71
. 71
. 84
. 92
99
A Beispieldateien: AMPL-Code
100
A.1 Komplexes Modell beim variierenden Preis mit Heun-Verfahren . . . 100
A.2 Komplexes Modell beim variierenden Preis mit Euler-Verfahren . . . 106
B Eidesstattliche Erklärung
112
C Danksagung
113
D Literaturverzeichnis
114
iii
Abbildungsverzeichnis
3.1
6.1
6.2
6.3
6.4
6.5
7.1
7.2
7.3
7.4
7.5
7.6
7.7
7.8
7.9
7.10
7.11
7.12
7.13
7.14
7.15
7.16
7.17
7.18
7.19
7.20
7.21
Zustandsbeschränkung xmin ≤ x(t) ≤ xmax
. . . . . . . . . . . 16
Die optimalen Steuerungen des modifizierten Modells . . . . . . . .
Die optimalen Trajektorien des modifizierten Modells . . . . . . . .
Die optimalen Adjungierten des modifizierten Modells . . . . . . .
Die Schaltfunktionen des modifizierten Modells . . . . . . . . . . .
Multiplikatorfunktion: (links) mittels IPOPT erhaltene µ(t), (rechts)
theoretisch ausgerechnete µ(t) . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
Die steigende Lohnkostenfunktion . . . . . . . . . . . .
Veranschaulichung des komplexen Unternehmensmodells
x1 bei variierendem Preis . . . . . . . . . . . . . . . . .
x3 bei variierendem Preis . . . . . . . . . . . . . . . . .
x5 bei variierendem Preis . . . . . . . . . . . . . . . . .
x2 bei variierendem Preis . . . . . . . . . . . . . . . . .
x4 bei variierendem Preis . . . . . . . . . . . . . . . . .
x6 bei variierendem Preis . . . . . . . . . . . . . . . . .
x7 bei variierendem Preis . . . . . . . . . . . . . . . . .
λ2 bei variierendem Preis . . . . . . . . . . . . . . . . .
λ4 bei variierendem Preis . . . . . . . . . . . . . . . . .
λ1 bei variierendem Preis . . . . . . . . . . . . . . . . .
λ3 beim variierenden Preis . . . . . . . . . . . . . . . . .
λ5 bei variierendem Preis . . . . . . . . . . . . . . . . .
λ6 bei variierendem Preis . . . . . . . . . . . . . . . . .
u1 bei variierendem Preis . . . . . . . . . . . . . . . . .
u3 bei variierendem Preis . . . . . . . . . . . . . . . . .
λ7 bei variierendem Preis . . . . . . . . . . . . . . . . .
u2 bei variierendem Preis . . . . . . . . . . . . . . . . .
u4 bei variierendem Preis . . . . . . . . . . . . . . . . .
Σ1 bei variierendem Preis . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
iv
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
49
50
51
52
. 53
63
65
72
72
72
72
72
72
73
73
73
73
73
73
74
74
74
74
74
74
75
Abbildungsverzeichnis
7.22
7.23
7.24
7.25
7.26
7.27
7.28
7.29
7.30
7.31
7.32
7.33
7.34
7.35
7.36
7.37
7.38
7.39
7.40
7.41
7.42
7.43
7.44
7.45
7.46
7.47
7.48
7.49
7.50
7.51
7.52
7.53
7.54
7.55
7.56
7.57
7.58
7.59
Σ3 bei variierendem Preis . . . . . . . . . .
µ1 bei variierendem Preis . . . . . . . . . .
Σ2 bei variierendem Preis . . . . . . . . . .
Σ4 bei variierendem Preis . . . . . . . . . .
µ2 bei variierendem Preis . . . . . . . . . .
Variierende Preisfunktion p2 (t). . . . . . . .
Zinsfunktionen (links); Inflationsrate (rechts)
x1 bei konstantem Preis . . . . . . . . . . .
x3 bei konstantem Preis . . . . . . . . . . .
x5 bei konstantem Preis . . . . . . . . . . .
x2 bei konstantem Preis . . . . . . . . . . .
x4 bei konstantem Preis . . . . . . . . . . .
x6 bei konstantem Preis . . . . . . . . . . .
x7 bei konstantem Preis . . . . . . . . . . .
λ2 bei konstantem Preis . . . . . . . . . . .
λ4 bei konstantem Preis . . . . . . . . . . .
λ1 bei konstantem Preis . . . . . . . . . . .
λ3 bei konstantem Preis . . . . . . . . . . .
λ5 bei konstantem Preis . . . . . . . . . . .
λ6 bei konstantem Preis . . . . . . . . . . .
u1 bei konstantem Preis . . . . . . . . . . .
u3 bei konstantem Preis . . . . . . . . . . .
λ7 bei konstantem Preis . . . . . . . . . . .
u2 bei konstantem Preis . . . . . . . . . . .
u4 bei konstantem Preis . . . . . . . . . . .
Σ1 bei konstantem Preis . . . . . . . . . . .
Σ3 bei konstantem Preis . . . . . . . . . . .
µ1 bei konstantem Preis . . . . . . . . . . .
Σ2 bei konstantem Preis . . . . . . . . . . .
Σ4 bei konstantem Preis . . . . . . . . . . .
µ2 bei konstantem Preis . . . . . . . . . . .
x1 bei Verdoppelung der Planungsperiode .
x3 bei Verdoppelung der Planungsperiode .
x5 bei Verdoppelung der Planungsperiode .
x2 bei Verdoppelung der Planungsperiode .
x4 bei Verdoppelung der Planungsperiode .
x6 bei Verdoppelung der Planungsperiode .
x7 bei Verdoppelung der Planungsperiode .
v
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
75
75
75
75
75
77
83
85
85
85
85
85
85
86
86
86
86
86
86
87
87
87
87
87
87
88
88
88
88
88
88
93
93
93
93
93
93
94
Abbildungsverzeichnis
7.60
7.61
7.62
7.63
7.64
7.65
7.66
7.67
7.68
7.69
7.70
7.71
7.72
7.73
7.74
7.75
7.76
λ2 bei Verdoppelung der Planungsperiode
λ4 bei Verdoppelung der Planungsperiode
λ1 bei Verdoppelung der Planungsperiode
λ3 bei Verdoppelung der Planungsperiode .
λ5 bei Verdoppelung der Planungsperiode
λ6 bei Verdoppelung der Planungsperiode
u1 bei Verdoppelung der Planungsperiode
u3 bei Verdoppelung der Planungsperiode
λ7 bei Verdoppelung der Planungsperiode
u2 bei Verdoppelung der Planungsperiode
u4 bei Verdoppelung der Planungsperiode
Σ1 bei Verdoppelung der Planungsperiode
Σ3 bei Verdoppelung der Planungsperiode
µ1 bei Verdoppelung der Planungsperiode
Σ2 bei Verdoppelung der Planungsperiode
Σ4 bei Verdoppelung der Planungsperiode
µ2 bei Verdoppelung der Planungsperiode
vi
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
94
94
94
94
94
95
95
95
95
95
95
96
96
96
96
96
96
Tabellenverzeichnis
6.1
6.2
6.3
Liste der gewählten Parameter für modifiziertes Modell . . . . . . . . 45
Optimale Schaltstruktur des modifizierten Problems . . . . . . . . . 48
Schaltpunkte des modifizierten Problems . . . . . . . . . . . . . . . . 48
7.1
7.2
Liste der Parameter des komplexen Unternehmensmodells . . . . .
Vergleich der Rechenzeiten für unterschiedliche Parameter bei 5000
Diskretisierungspunkten. . . . . . . . . . . . . . . . . . . . . . . . .
Schaltstruktur der optimalen Steuerungen bei variierendem Preis .
Schaltstruktur der optimalen Steuerungen bei konstantem Preis . .
Schaltstruktur der optimalen Steuerungen bei variierendem Preis .
7.3
7.4
7.5
vii
. 68
.
.
.
.
71
76
89
97
1 Einleitung
Die Theorie der optimalen Steuerprozesse kann dem Oberbegriff Optimierung“ un”
tergeordnet werden, sie beschäftigt sich mit der Minimierung bzw. Maximierung
eines Leistungsmaßes in einem Zeitintervall unter Berücksichtigung bestimmter Nebenbedingungen. Einen wichtigen Teil dieser Nebenbedingungen bildet das dynamische System, welches einen realen Vorgang meist durch gewöhnliche Differentialgleichungen beschreibt. Durch die Einführung einer so genannten Steuerfunktion kann
auf die Dynamik des Prozesses von außen Einfluss genommen werden. Nicht zuletzt
dank dieser Eigenschaften gewinnen die Steuerprozesse in den unterschiedlichsten
Gebieten immer mehr an Bedeutung. Die Anwendung der Theorie der optimalen
Steuerprozesse findet man heute sowohl in der Medizin, Physik, Chemie als auch in
der Ökonomie.
In den Wirtschaftswissenschaften ist die Optimierung ein fester Bestandteil der Lehre. Im Laufe der letzten Jahrzehnte hat sich unter dem Namen Operations Research
ein eigenständiger Zweig, der sich unter anderem mit den Optimierungsproblemen
befasst, entwickelt. Zu den Aufgaben des Operations Research gehören:
• die Ermittlung relevanter Einflussgrößen für ein reales Problem,
• die Erstellung eines (typischerweise mathematischen) Modells, das ein vereinfachtes Abbild der Realität darstellt,
• das Lösen des Problems,
• die anschließende Auswertung der Ergebnisse.
Die meisten in Operations Research angewendeten Methoden sind statischer“ Art,
”
d. h. der zugrunde liegende Sachverhalt wird nur zu einem Zeitpunkt oder während
eines relativ kurzen Zeitintervalls ohne jegliche zeitliche Änderung betrachtet. Die
Vernachlässigung des dynamischen Elements in der wirtschaftlichen Planung zählt
jedoch zu den größten Nachteilen der besagten Methoden. Die Theorie der optimalen Steuerprozesse bietet dagegen das richtige Instrumentarium zur Behandlung
der Probleme, bei denen die Veränderung des Systems im Zeitablauf eine signifikante Rolle spielt. In der Ökonomie beschränkten sich die Berechnungen der optimalen Steuerung lange Zeit auf vergleichsweise einfache Modelle, die man analytisch
1
1 Einleitung
lösen konnte. Durch die Entwicklung leistungsfähigerer Verfahren, die auf modernen
Rechnern Aufgaben mit einer Vielzahl von Variablen und Nebenbedingungen mit
vertretbarem Aufwand lösen können, ist die Berechnung der optimalen Steuerung
für komplexe Modelle ermöglicht worden.
In dem hier behandelten Unternehmensmodell, das den Schwerpunkt der vorliegenden Arbeit bildet, geht es um solch einen komplexen optimalen Steuerprozess
aus dem Bereich des Unternehmenswachstums. Das komplexe Unternehmensmodell
wurde, ausgehend von dem Modell von Lesourne und Leban, von B. Koslik in ihrer
Diplomarbeit im Jahre 1994 aufgestellt. Die Problematik besteht darin ein Unternehmen mithilfe von Investitionen, Kreditauf-/abbau, gegebenenfalls Änderung des
Lagerbestandes und/oder der Anzahl der Beschäftigten so zu steuern, dass der Gewinn der Eigenkapitalgeber am Ende der Planungsperiode maximiert wird. Wie bei
den meisten ökonomischen Modellen sind auch hier bestimmte Ressourcen nur beschränkt verfügbar, z. B. sind die Beschaffung des Kapitals sowie die Lagerung der
Ware nur begrenzt möglich, außerdem dürfen die Zustandsvariablen nicht negativ
werden. Somit handelt es sich hier also um einen optimalen Steuerprozess mit reinen
Zustandsbeschränkungen.
Doch bevor man mit der Bearbeitung ausgewählter praxisbezogener Beispiele aus der
Wirtschaft beginnt, ist eine theoretische Basis der optimalen Steuerprozesse nötig.
Im zweiten Kapitel werden alle zur Formulierung und Lösung der unbeschränkten
Steuerprozesse benötigten Definitionen und Sätze vorgestellt. Diese beinhalten das
Pontryaginsche Minimumprinzip, welches die notwendigen Optimalitätsbedingungen
der optimalen Steuerprozesse darstellt. Darüber hinaus wird in Abschnitt 2.4 näher
auf die Prozesse mit linear auftretender Steuerung eingegangen. Bei solchen Problemen können zwei verschieden Arten der Steuerung vorkommen, nämlich bang-bang
Steuerungen und die singulären Steuerungen. Die bang-bang Steuerungen sind unstetig, sie nehmen nur Werte auf dem Rand des Steuerbereiches an. Die singulären
Steuerungen dagegen können einen beliebigen Verlauf innerhalb des zulässigen Steuerbereiches aufzeigen und sind schwerer zu bestimmen.
Die Bearbeitung von Steuerprozessen mit Zustandsbeschränkungen bedarf einiger
Erweiterungen der notwendigen Optimalitätsbedingungen der unbeschränkten Prozesse. Dabei spielt der Begriff der Ordnung einer Beschränkung eine wichtige Rolle.
In Rahmen dieser Arbeit werden zwei verschiedene Methoden zur Behandlung von
optimalen Steuerprozessen mit reinen Zustandsbeschränkungen beschrieben: die direkte und die indirekte Methode. Beide Verfahren führen auf die Begriffsbildung der
erweiterten Hamiltonfunktion zurück. Die direkte Methode ist dadurch gekennzeichnet, dass die Zustandsbeschränkung mit einem Multiplikator direkt an die Hamiltonfunktion angehängt wird. Bei der indirekten Methode wird erst die Beschränkung
2
1 Einleitung
solange total differenziert bis die Steuerungsvariable explizit in der Ableitung auftaucht und diesen Term koppelt man dann an die Hamiltonfunktion an. Die indirekte
Methode wird in der vorliegenden Arbeit hauptsächlich der Vollständigkeit halber
vorgestellt, zur Behandlung der praktischen Beispiele wird ausschließlich die direkte
Methode verwendet.
Mittels der notwendigen Optimalitätsbedingungen werden nur Kandidaten für das
Vorliegen eines Optimums bestimmt. Um sicher zu stellen, dass es sich bei der berechneten Lösung tatsächlich um eine Minimal- bzw. Maximalstelle handelt, ist man
auf hinreichenden Optimalitätsbedingungen angewiesen. Für viele Probleme wurde jedoch bis heute noch keine umfassende Theorie der hinreichenden Bedingungen entwickelt. So gibt es z. B. auch keine hinreichenden Kriterien, um die Lösung
des komplexen Unternehmensmodells prüfen zu können. Es existiert aber eine sehr
große Klasse der optimalen Steuerprozesse, bei denen gezeigt werden kann, dass
die notwendigen Optimalitätsbedingungen auch hinreichend sind. Dabei handelt es
sich, falls die Minimierung eines Zielfunktionals gefordert wird, um die so genannten
konvexen Probleme“. Diese sind in den ökonomischen Anwendungen besonders oft
”
vertreten, dazu zählt z. B. auch das modifizierte Modell. Aus diesem Grund wird in
Kapitel 4 erst der Begriff der Konvexität definiert und näher erläutert. Anschließend
werden die Beweise der hinreichenden Optimalitätsbedingungen unter zusätzlichen
Konvexitätsannahmen für unbeschränkte und zustandsbeschränkte Steuerprozesse
durchgeführt.
Aufgrund der Komplexität sind viele praktische Probleme analytisch nicht mehr
lösbar, wie z. B. komplexes Unternehmensmodell, welches in Kapitel 7 behandelt
wird. Deshalb wird in Kapitel 5 kurz die Vorgehnsweise bei numerischer Bearbeitung der optimalen Steuerprozesse erläutert.
Im Kapitel 6 wird zuerst ein von Lesourne und Leban (1978) entwickeltes Modell
vorgestellt. Dieses, aus dem Bereich des Firmenwachstums stammende Modell, verfolgt das Ziel den diskontierten Zahlungsstrom an Dividenden zu minimieren. Der
Zustand des Unternehmens wird durch das Eigenkapital und das Fremdkapital beschrieben. Dabei kann das dynamische System durch die Steuerungen, wie Beschäftigungsänderung, Investitionen und Dividendenzahlungen, beeinflusst werden. Den
Kern der vorliegenden Arbeit bilden die optimalen Steuerprozesse mit Zustandsbeschränkungen und linear eingehenden Steuerungen. Da aber eine der genannten
Steuerungen, nämlich die Beschäftigungsänderung im Ursprungsmodell von Lesourne und Leban nicht linear auftritt, wird das Beispiel in Abschnitt 6.2 ein wenig
verändert. In den nachfolgenden Abschnitten 6.3, 6.4 werden die notwendigen Optimalitätsbedingungen diskutiert und die optimale Lösung des modifizierten Problems
vorgestellt. Zudem wird in Abschnitt 6.5 gezeigt, dass dieses Beispiel die zusätzlichen
3
1 Einleitung
Konvexitätsannahmen erfüllt. Somit erweisen sich hier die notwendigen Bedingungen für ein Minimum als hinreichend.
Schließlich wird in Kapitel 7 das oben angesprochene komplexe Unternehmensmodell bearbeitet. Hier wird zunächst eine Lösung des Modells mit einem variierenden
Produktpreis bei zehnjähriger Planung, inklusive einer ausführlichen Diskussion der
Theorie, vorgestellt. Anschließend wird die Lösung bei konstantem Preis angegeben
und beide optimalen Strategien miteinander verglichen. Als Letztes wird geprüft
wie empfindlich die optimalen Trajektorien (am Beispiel mit variierendem Preis)
gegenüber einer Änderung der Planungszeitdauer sind. Anhand einer Analyse der
erhaltenen Ergebnisse wird veranschaulicht, dass dieses komplexe Unternehmensmodell sehr realitätsnahe und aussagekräftig ist.
Alle Beispiele in dieser Arbeit wurden mithilfe der beiden Optimierungssolver LOQO von Prof. R. J. Vanderbei und/oder IPOPT von A. Wächter und L. T. Biegler
bearbeitet. Eine CD mit den Kopien der entsprechenden Eingabedateien ist am Ende
der Arbeit beigefügt, außerdem findet man zwei ausgewählte Beispiele im Anhang.
4
2 Theorie der optimalen
Steuerprozesse
In diesem einführenden Kapitel werden in Anlehnung an Maurer [10] die wesentlichen Definitionen und Sätze der unbeschränkten optimalen Steuerprozesse bereitgestellt. Eine zentrale Rolle dabei spielt das Minimumprinzip von Pontryagin, welches die notwendigen Optimalitätsbedingungen für eine optimale Steuerung angibt.
Außerdem wird ein besonderer Schwerpunkt auf Probleme mit linear auftretender
Steuerung gelegt.
2.1 Formulierung optimaler Steuerprozesse
Betrachtet wird ein System, das durch n Differentialgleichungen erster Ordnung
bestimmt ist. Der Zustandsvektor
x(t) = (x1 (t), . . . , xn (t))T ∈ Rn
des Systems beinhaltet alle Variablen, welche das Verhalten des Systems auf dem
Zeitintervall [0, tf ] beschreiben. Die Endzeit tf wird, je nach Problemstellung, entweder fest vorgegeben oder fungiert als eine freie zusätzliche Variable. Durch den
Steuervektor
u(t) = (u1 (t), . . . , um (t))T ∈ Rm
kann der Zustand zu jedem Zeitpunkt t beeinflusst werden.
Definition 2.1.1 Das System von Differentialgleichungen
ẋ(t) =
dx(t)
= f (t, x(t), u(t))
dt
wird als Dynamik des Systems bezeichnet. Hierbei sei
f : [0, tf ] × Rn × Rm −→ Rn
stetige und bzgl. x ∈ Rn , u ∈ Rm stetig partiell differenzierbare Funktion.
5
(2.1)
2 Theorie der optimalen Steuerprozesse
Definition 2.1.2 Ein Funktionenpaar (x, u) mit x : [0, tf ] −→ Rn stückweise stetig
differenzierbar und u : [0, tf ] −→ Rm stückweise stetig heißt Lösung von (2.1), falls
gilt
dx(t)
= f (t, x(t), u(t))
ẋ(t) =
dt
für alle Stetigkeitsstellen t ∈ [0, tf ] von u(t).
In der Regel muss der Zustandsvektor x(t) an bestimmten Stellen gewisse Nebenbedingungen, etwa
x(ti ) ∈ Mti , ti ∈ [0, tf ], i = 1, . . . , k
(2.2)
mit abgeschlossenen Mengen Mti ⊂ Rn , erfüllen. In den praktischen Beispielen sind
diese häufig nur für den Anfangszustand x(0) und den Endzustand x(tf ) in der Form
von Gleichungen
M0 := {x ∈ Rn | ϕ(x) = 0}
Mtf := {x ∈ Rn | ψ(x) = 0}
mit den stetig differenzierbaren Funktionen ϕ : Rn → Rs , ψ : Rn → Rr , 0 ≤ s, r ≤ n
vorgegeben. Die Randbedingungen (2.2) bedeuten demnach:
ϕ(x(0)) = 0 ,
ψ(x(tf )) = 0
(2.3)
Für den Fall s = 0, bzw. r = 0 ergibt sich dann M0 = Rn , bzw. Mtf = Rn , dass also
x(0) bzw. x(tf ) frei ist. In den meisten Anwendungen treten jedoch die Randbedingungen in einer einfacheren Struktur auf, als so genannte Standard-Randbedingungen.
Definition 2.1.3 Die Randbedingungen der Form
x(0) = x0
,
ψ(x(tf )) = 0
(2.4)
mit x0 ∈ Rn fest, ψ : Rn → Rr wie oben, nennt man Standard-Randbedingungen.
Eine weitere wichtige Komponente eines optimalen Steuerprozesses bildet der Steuerbereich U , durch den für die Steuerung u der zulässige Wertebereich festgelegt
wird.
Definition 2.1.4 Eine nichtleere, konvexe und abgeschlossene Teilmenge U ⊂ Rm ,
die die zulässige Wertemenge für den Steuervektor
u(t) ∈ U
∀ t ∈ [0, tf ]
(2.5)
enthält, nennt man Steuerbereich.
Definition 2.1.5 Ein Funktionenpaar (x(·), u(·)) heißt zulässig zur Endzeit tf > 0,
wenn die Nebenbedingungen (2.1)-(2.5) erfüllt sind.
6
2 Theorie der optimalen Steuerprozesse
Schließlich wird durch das Zielfunktional die zu optimierende Größe eines optimalen
Steuerprozesses gegeben. Dabei wird in der Literatur je nach Verfasser unter opti”
miere“ entweder minimiere“ oder auch maximiere“ verstanden. In der vorliegenden
”
”
Arbeit handelt es sich jedoch stets um die Minimierung einer Funktion.
Definition 2.1.6 Die Funktion
F (x, u) := g (x(tf )) +
Z
tf
f0 (t, x(t), u(t)) dt
(2.6)
0
wird als Zielfunktional bezeichnet. Hierbei seien g : Rn → R stetig differenzierbar
und f0 : [0, tf ] × Rn × Rm → Rn stetige und bzgl. x ∈ Rn , u ∈ Rm stetig partiell
differenzierbare Funktionen.
Mit den obigen Bezeichnungen und Definitionen kann man nun einen optimalen
Steuerprozess in eine Kurzform zusammenfassen.
Definition 2.1.7 Kompakte Form eines Optimalen Steuerprozesses:
M inimiere F (x, u) := g (x(tf )) +
Z
tf
f0 (t, x(t), u(t)) dt
0
unter
dx(t)
= f (t, x(t), u(t))
dt
x(0) = x0 , ψ(x(tf )) = 0
ẋ(t) =
u(t)
∈
U
(2.7)
∀ t ∈ [0, tf ].
Definition 2.1.8 Ein zulässiges Paar (x∗ , u∗ ) zur einer festen Endzeit tf > 0 heißt
optimale Lösung bzw. globale Minimalstelle von (2.7), wenn
F (x∗ , u∗ ) ≤ F (x, u)
für alle zulässigen Paare (x, u) zur Endzeit tf gilt.
Ein zulässiges Paar (x∗ , u∗ ) zur einer freien Endzeit t∗f > 0 heißt optimale Lösung
bzw. globale Minimalstelle von (2.7), wenn
F (x∗ , u∗ ) ≤ F (x, u)
für alle zulässigen Paare (x, u) zu einer beliebigen Endzeit tf > 0 gilt. Hier ist tf
eine zusätzliche Optimierungsvariable.
Die Funktion x∗ (t) heißt optimale Trajektorie und die Funktion u∗ (t) optimale
Steuerung des Steuerprozesses (2.7).
7
2 Theorie der optimalen Steuerprozesse
2.2 Äquivalente Umformungen eines Steuerprozesses
In den bisherigen Betrachtungen wurden die Steuerprozesse in der so genannten
Bolza-Form eingeführt. In diesem Fall besteht das Zielfunktional aus zwei Komponenten: der Funktion g und dem Integral. Es gibt jedoch viele verschiedene Möglichkeiten zur Formulierung eines optimalen Steuerprozesses. Z. B. kann erreicht werden,
dass in dem Zielfunktional nur das Integral bzw. nur die Funktion g vorkommt. Dabei
spricht man von einem Lagrange-Problem bzw. von einem Mayer-Problem. Außerdem können Probleme mit freier Endzeit auf Probleme mit fester Endzeit zurückgeführt werden. Letztendlich kann jedes Steuerproblem in ein autonomes Problem
transformiert werden. Hierbei werden mit autonom diejenigen Prozesse bezeichnet,
die nicht explizit von der Zeit t abhängen. Häufig kann es von großem Nutzen sein,
ein Steuerproblem in eine andere Form zu transformieren. Aus diesem Grund werden
im Nachfolgenden einige Möglichkeiten zur Überführung eines optimalen Steuerprozesses in eine andere Darstellungsform aufgezeigt.
2.2.1 Transformation eines Bolza-Problems auf ein MayerProblem
Bei der Mayer-Form besteht das Zielfunktional nur aus dem Term g(x(tf )). Um diese Konstruktion zu bekommen muss demnach das Integral im Funktional eliminiert
werden. Dies erreicht man durch die Definition einer neuen Zustandsvariablen. Gegeben sei also der optimale Steuerprozess (2.7). Man definiere:
x0 (t) :=
Z
t
f0 (s, x(s), u(s))ds,
0 ≤ t ≤ tf ,
0
und erweitere den Zustandsvektor zu:
x̃(t) :=
x0 (t)
x(t)
!
∈ Rn+1 .
Das transformierte Problem lässt sich damit folgendermaßen in der gewünschten
Mayer-Form formulieren:
M inimiere
unter
g̃(x̃(tf )) = g(x(tf )) + x0 (tf )
dx̃(t)
= f˜(t, x̃(t), u(t)), t ∈ [0, tf ],
dt
x̃(0) = x̃0 , ψ̃(x̃(tf )) = 0,
u(t) ∈ U
∀ t ∈ [0, tf ].
8
(2.8)
2 Theorie der optimalen Steuerprozesse
Dabei gilt
f˜(t, x̃(t), u(t)) :=
x̃0 :=
0
x0
!
f0 (t, x, u)
f (t, x, u)
!
,
und ψ̃(x̃(tf )) := ψ(x(tf )).
2.2.2 Transformation einer freien Endzeit auf eine feste Endzeit
Gegeben sei ein optimaler Steuerprozess der Form (2.7) mit freier Endzeit tf .
Mit der Einführung einer neuen Zeitvariablen s ∈ [0, 1] durch:
t = s · tf ,
0 ≤ s ≤ tf .
werden die Zustands- und Steuervariablen in der Abhängigkeit von s folgendermaßen
definiert:
x̄(s) := x(s · tf ) = x(t) und ū(s) := u(s · tf ) = u(t).
Für die Dynamik des Systems erhält man daraus:
dx̄
dx dt
=
·
= f (s · tf , x̄(s), ū(s)) · tf
ds
dt ds
und für das Zielfunktional:
Z tf
Z
g(x(tf )) +
f0 (t, x(t), u(t))dt = g(x̄(1)) +
0
1
f0 (s · tf , x̄(s), ū(s))tf ds.
0
Zudem wird die freie Endzeit tf als zusätzliche Zustandsvariable durch
xn+1 (s) := tf
mit in die Dynamik aufgenommen. Für den erweiterten Zustandsvektor ergibt sich:
!
x̄(s)
x̃(s) :=
∈ Rn+1 .
tf
Insgesamt kann nun folgender optimaler Steuerprozess mit fester Endzeit sf = 1
formuliert werden:
Z 1
f˜0 (s, x̃(s), ũ(s)) ds
M inimiere
F̃ (x̃, ũ) = g̃(x̃(1)) +
0
unter
dx̃(s)
= f˜(s, x̃(s), ũ(s)), s ∈ [0, 1],
ds
x̃(0) = x̃0 , ψ̃(x̃(1)) = 0,
ũ(s) ∈ U
∀ s ∈ [0, 1].
9
(2.9)
2 Theorie der optimalen Steuerprozesse
Mit den Bezeichnungen
g̃(x̃(1)) := g(x̄(1)), f˜0 (s, x̃(s), ũ(s)) := tf · f0 (s · tf , x̄(s), ū(s)),
!
!
t
·
f
(s
·
t
,
x̄(s),
ū(s))
x
f
f
0
f˜(s, x̃(s), ũ(s)) :=
, x̃0 :=
, ξ frei
0
ξ
ũ(s) := ū(s),
ψ̃(x̃) := ψ(x̄).
2.2.3 Transformation nicht-autonomer Probleme auf autonome
Probleme
Ein nicht-autonomer Steuerprozess läßt sich in ein autonomes Problem umwandeln,
indem man die Zeitvariable t, die explizit in f0 oder f auftaucht, als zusätzliche
Zustandsvariable einführt. Mit dem neuen erweiterten Zustandsvektor
!
x(t)
x̃(t) :=
∈ Rn+1
t
erhält man folgenden autonomen Steuerprozess:
M inimiere
F̃ (x̃, ũ) = g̃(x̃(tf )) +
Z
tf
f˜0 (t, x̃(t), u(t)) dt
0
unter
dx̃(t)
= f˜(t, x̃(t), u(t)), t ∈ [0, tf ],
dt
x̃(0) = x̃0 , ψ̃(x̃(tf )) = 0,
u(t) ∈ U
(2.10)
∀ t ∈ [0, tf ]
mit
g̃(x̃) := g(x),
f˜(x̃, u) :=
f˜0 (x̃, u) := f0 (x̃n+1 , x̃, u),
!
!
f (x̃n+1 , x̃, u)
x0
, x̃0 :=
,
1
x̃n+1
ψ̃(x̃) := ψ(x).
2.3 Das Minimumprinzip von Pontryagin
Nachdem nun alle wichtigen Grundbegriffe und Bezeichnungen aufgelistet worden
sind, kann das Minimumprinzip von Pontryagin formuliert werden. Doch zuvor wird
noch folgende Definition benötigt.
Definition 2.3.1 Sei das Steuerproblem (2.7) gegeben. Des Weiteren sei λ0 ∈ R
und λ : [0, tf ] → Rn ein Zeilenvektor. Die Funktion
H (t, x(t), λ(t), u(t)) = λ0 f0 (t, x(t), u(t)) + λf (t, x(t), u(t))
10
(2.11)
2 Theorie der optimalen Steuerprozesse
wird als Hamilton-Funktion des Steuerprozesses (2.7) bezeichnet. Die Variablen
λi , i = 1, . . . , n werden als adjungierte Variablen oder Kozustand bezeichnet.
Bemerkung 2.3.2 Im Falle eines Steuerprozesses in Mayer-Form vereinfacht sich
die Hamilton-Funktion zu:
H (t, x(t), λ(t), u(t)) = λf (t, x(t), u(t)) .
(2.12)
Satz 2.3.3 (Minimumprinzip von Pontryagin) Sei (x*,u*) eine optimale Lösung
von (2.7). Dann gibt es eine Zahl λ0 ≥ 0, eine stetige und stückweise stetig differenzierbare Funktion λ : [0, tf ] → Rn und einen Zeilenvektor ν ∈ Rr mit (λ0 , λ(t), ν) 6= 0
für alle t ∈ [0, tf ], so dass die folgenden Aussagen gelten:
(i) An allen Stetigkeitsstellen t ∈ [0, tf ] von u∗ (t) gilt die Minimumbedingung:
H (t, x∗ (t), λ(t), u∗ (t)) = min H (t, x∗ (t), λ(t), u)
u∈ U
und die adjungierten Differentialgleichungen:
λ̇(t) = −Hx (t, x∗ (t), λ(t), u∗ (t)) .
(ii) Im Endzeitpunkt tf gilt die Transversalitätsbedingung:
λ(tf ) = λ0 gx (x∗ (tf )) + νψx (x∗ (tf )).
(iii) Im Falle einer freien Endzeit tf gilt für die optimale Endzeit tf ∗ :
H (tf ∗ , x∗ (tf ∗ ), λ∗ (tf ∗ ), u∗ (tf ∗ )) = 0.
(iv) Für autonome Probleme gilt außerdem:
H (x∗ (t), λ(t), u∗ (t)) ≡ const.
Für λ0 unterscheidet man zwischen λ0 = 0, dem so genannten abnormalen Fall und
λ0 > 0. Man rechnet leicht nach, dass in dem normalen Fall λ0 > 0 eine Skalierung
des Vektors (λ0 , λ) der Form (λ0 , λ) → (1, λλ0 ) keine Auswirkung auf die Aussagen
des Minimumprinzips hat. Man kann also, sofern λ0 > 0 gilt, die Bedingungen
aus Satz (2.3.3) durch Setzen von λ0 = 1 vereinfachen. Außerdem kann für den
Fall λ0 = 1 unter zusätzlichen Konvexitätsannahmen gezeigt werden, dass durch das
Pontryaginsche-Minimumprinzip auch eine hinreichende Bedingung für die Existenz
einer optimalen Lösung gegeben ist. Allerdings stellt sich der Nachweis von λ0 > 0
im Allgemeinen als problematisch dar. In einigen konkreten Anwendungen ist das
folgende Lemma vom großen Nutzen.
Lemma 2.3.4 Bei freiem Endzustand x(tf ), d. h., wenn formal ψ ≡ 0 gilt, ist
λ0 > 0, d. h. im Pontryaginschen Minimumprinzip kann λ0 = 1 gesetzt werden.
11
2 Theorie der optimalen Steuerprozesse
2.4 Probleme mit linear auftretender Steuerung Bang-bang und singuläre Steuerungen
Im Allgemeinen unterscheidet man in der Theorie der optimalen Steuerprozesse zwischen Problemen mit linear und nichtlinear auftretender Steuerung. Während bei
den Problemen mit linearer Steuerung diese häufig in einigen Punkten unstetig ist,
ist die optimale Steuerung bei nichtlinearen Prozessen stetig und für U = Rm sogar
eine C k -Funktion. Den Schwerpunkt der vorliegenden Arbeit bilden die Probleme
mit linear eingehender Steuerung (d. h. die Steuerung tritt sowohl in der Dynamik
als auch im Zielfunktional linear auf). Deshalb werden diese im nachfolgenden Abschnitt näher behandelt.
Es liegt also ein Problem der Form
Z tf
(a0 (t, x) + b0 (t, x)u) dt
M inimiere F (x, u) := g (x(tf )) +
0
unter
dx(t)
= a(t, x) + b(t, x)u
dt
x(t0 ) = x0 , ψ(x(tf )) = 0
ẋ(t) =
u(t)
∈
U
∀ t ∈ [t0 , tf ]
vor. Hierbei seien a0 ein Skalar, b0 ∈ Rm ein Zeilenvektor, a ∈ Rn , b eine (n × m)
Matrix und U ⊂ Rm konvex und kompakt. Für die zugehörige Hamiltonfunktion
mit λ0 = 1 ergibt sich dann:
H (t, x(t), λ(t), u(t)) = λ0 (a0 (t, x) + b0 (t, x)u) + λ(t)(a(t, x) + b(t, x)u)
= λ0 a0 (t, x) + λ(t)a(t, x) + [λ0 b0 (t, x) + λ(t)b(t, x)] u.
Eine bedeutende Rolle bei der Behandlung von optimalen Steuerprozessen mit linear
eingehender Steuerung spielt der Begriff der Schaltfunktion.
Definition 2.4.1 Die Funktion
Σ(t) := Hu (t, x(t), u(t), λ(t)) = λ0 b0 (t, x) + λ(t)b(t, x)
(2.13)
heißt Schaltfunktion.
Insbesondere kann man somit die Hamiltonfunktion folgendermaßen zusammenfassen
H(t, x(t), u(t), λ(t)) = λ0 a0 (t, x) + λ(t)a(t, x) + Σ(t)u
(2.14)
und man sieht, dass diese Funktion genau dann minimal bezüglich u wird, wenn
Σ(t)u minimal wird. Die Minimumbedingung
H (t, x∗ (t), λ(t), u∗ (t)) = min H (t, x∗ (t), λ(t), u)
u∈ U
12
2 Theorie der optimalen Steuerprozesse
ist somit äquivalent zu dem linearen Optimierungsproblem:
minimiere
{Σ(t)u | u ∈ U }
∀ t ∈ [0, tf ].
(2.15)
Aus Gründen der Vereinfachung beschränken sich alle weiteren Betrachtungen auf
den skalaren Fall m = 1, U = [umin , umax ] ∈ R (im Falle einer vektorwertigen
Steuerfunktion erfolgt die Auswertung komponentenweise). Die optimale Steuerung
kann direkt an der Schaltfunktion abgelesen werden, es gilt:



, Σ(t) > 0 
 umin

∗
u (t) =
(2.16)
umax
, Σ(t) < 0 .




unbestimmt , Σ(t) = 0
Definition 2.4.2 Sei [t1 , t2 ] ⊂ [0, tf ] mit t1 < t2
(i) Die Steuerung u(t) heißt bang-bang in [t1 , t2 ], wenn Σ(t) nur isolierte Nullstellen in [t1 , t2 ] hat, d. h. u(t) ∈ {umin , umax }. Die Nullstellen von Σ(t) heißen
Schaltpunkte.
(ii) Die Steuerung u(t) heißt singulär in [t1 , t2 ], wenn Σ(t) ≡ 0 auf dem gesamten
Intervall [t1 , t2 ] gilt.
Für Σ(t) 6= 0 liegt demnach eine bang-bang Steuerung vor, die gemäß (2.16) angegeben werden kann. Sobald jedoch singuläre Stücke auftreten, bedarf es weiterführender nachfolgender Überlegungen.
Es sei Σ(t) ≡ 0 für t ∈ [t1 , t2 ].
Man definiere rekursiv die Funktionen Σ(k) (t, x, λ, u), 0 ≤ k ≤ ∞ durch:
Σ(0) (t, x, λ, u) := Σ(t, x, λ),
∂ (k)
∂
∂ (k)
∂
∂
Σ (t, x, λ, u) +
Σ (t, x, λ, u) .
Σ(k+1) (t, x, λ, u) := Σ(k) (t, x, λ, u) +
∂t
∂x
∂t ∂λ
∂t
Entweder gilt dann
k > 0 mit
∂
Σ(k) (t, x, λ, u)
∂u
≡ 0 für alle k, 0 ≤ k ≤ ∞ oder es existiert ein
∂ (k)
Σ (t, x, λ, u) ≡ 0,
∂u
∂ (k)
Σ (t, x, λ, u) 6= 0.
∂u
für k = 0, . . . , k − 1
∂
Σ(k) (t, x, λ, u) eine Darstellung
Aufgrund der Linearität der Steuerung u gibt es für ∂u
der Form:
∂ (k)
Σ (t, x, λ, u) = A(t, x(t), λ(t)) + B(t, x(t), λ(t))u
∂u
mit geeigneten Funktionen A : [t1 , t2 ] × Rn × Rn → R und B : [t1 , t2 ] × Rn × Rn → R.
Außerdem gilt wegen
Σ(t, x, λ, u) ≡ 0
13
2 Theorie der optimalen Steuerprozesse
offensichtlich
Σ(k) (t, x, λ, u) ≡ 0.
Somit ergibt sich für die singuläre Steuerung:
using = −
A(t, x(t), λ(t))
B(t, x(t), λ(t))
für alle t ∈ [t1 , t2 ] mit B(t, x(t), λ(t)) 6= 0.
Satz 2.4.3 (Ordnung einer singulären Steuerung)
1. Gilt k < ∞, so ist k = 2q, q ∈ N+ eine gerade Zahl. Die Zahl q ≥ 1 heißt die
Ordnung der singulären Steuerung.
2. Für eine optimale Lösung (x(t), using (t), λ(t)) gilt die verallgemeinerte LegendreClebsch-Bedingung:
2q
d
q
q ∂
Hu (t, x(t), using (t), λ(t)) . (2.17)
0 ≤ (−1) B(t, x(t), λ(t)) = (−1)
∂u dt2q
Einen Beweis dieses Satzes findet man z.B. in Knobloch [6].
14
3 Optimale Steuerprozesse mit
reinen Zustandsbeschränkungen
Bisher wurden allgemeine Steuerprozesse und notwendige Optimalitätsbedingungen
für Probleme ohne Beschränkungen betrachtet. Doch in den meisten praktischen Anwendungen treten solche öfters im Zustandsbereich sowie in der gemischten Form,
im Zustands-Steuerbereich auf. Man unterscheidet demnach zwischen reinen Zustandsbeschränkungen und gemischten Beschränkungen. Für die vorliegende Arbeit
und die hier behandelten Beispiele aus der Unternehmenspolitik ist jedoch nur der
erste Typ der besagten Beschränkungen von Interesse. Bei solchen Steuerprozessen
können die Beschränkungen einen entscheidenden Einfluss auf die Optimalitätsbedingungen ausüben. Außerdem ist die Struktur der Lösung in der Regel komplexer.
Zur Bearbeitung der zustandsbeschränkten Steuerprozesse bedarf es des erweiterten
Pontryaginschen Minimumprinzips, welches in den Abschnitten 3.2 und 3.3 formuliert wird.
3.1 Grundbegriffe
Zunächst werden in diesem Abschnitt die Grundbegriffe und wichtige Definitionen
der optimalen Steuerprozesse mit reinen Zustandsbeschränkungen bereitgestellt.
Gegeben sei also ein optimaler Steuerprozess:
Z tf
f0 (t, x(t), u(t)) dt
M inimiere F (x, u) := g (x(tf )) +
0
dx(t)
= f (t, x(t), u(t))
unter ẋ(t) =
dt
x(0) = x0 , ψ(x(tf )) = 0
u(t)
∈
U
(3.1)
∀ t ∈ [0, tf ]
mit der reinen Zustandsbeschränkung
S(x(t)) ≤ 0,
t ∈ [0, tf ].
(3.2)
Dabei sei S : Rn → Rk , k ∈ N+ eine hinreichend oft stetig differenzierbare Funktion.
15
3 Optimale Steuerprozesse mit reinen Zustandsbeschränkungen
x(t)
xmax
Kontaktpunkt
Eintrittspunkt
Austrittspunkt
Verbindungspunkte
xmin
inneres
Teilstück
Randstück
ti
ti+1
ti+2
ti+3
ti+4
ti+5
ti+6
t
Abbildung 3.1: Zustandsbeschränkung xmin ≤ x(t) ≤ xmax
Bei der Lösung solcher Steuerprozesse unterscheidet man zwischen inneren Teilstücken
und Randstücken.
Definition 3.1.1 Ein Intervall [ti , ti+1 ] ∈ [0, tf ] wird inneres Teilstück genannt,
wenn
S(x(t)) < 0
∀ t ∈ [0, tf ]
(3.3)
gilt.
Per Definition ist die Zustandsbeschränkung auf inneren Teilstücken im gesamten
Zeitintervall nicht aktiv, daher gelten für die optimale Lösung die notwendigen Bedingungen von Satz (2.3.3). Wirklich interessant für dieses Kapitel sind also nur die
Probleme, in denen die Beschränkung (3.2) aktiv wird.
Definition 3.1.2 Die abgeschlossene Menge
I0 := { t ∈ [0, tf ] | S(x(t)) = 0 }
(3.4)
heißt Menge der aktiven Zeitpunkte.
Definition 3.1.3 Ein Intervall [te , ta ] ∈ [0, tf ] wird Randstück genannt, wenn
S(x(t)) ≡ 0
∀
t ∈ [te , ta ]
gilt. Der Zeitpunkt te heißt Eintrittspunkt, falls gilt
S(x(te − ε)) < 0 f ür ε > 0 hinreichend klein.
16
(3.5)
3 Optimale Steuerprozesse mit reinen Zustandsbeschränkungen
Der Zeitpunkt ta heißt Austrittspunkt, falls gilt
S(x(ta + ε)) < 0 f ür ε > 0 hinreichend klein.
Ein Punkt τ ∈ [0, tf ] heißt Kontaktpunkt, falls gilt
S(x(τ )) = 0,
S(x(τ ± ε)) < 0 f ür ε > 0 hinreichend klein.
Definition 3.1.4 Ein Eintritts- bzw. Austrittspunkt heißt Verbindungspunkt zwischen dem inneren Teilstück und dem Randstück.
Definition 3.1.5 Die Steuerung auf einem Randstück [te , ta ] wird als Randsteuerung bezeichnet.
Im Folgenden soll die Randsteuerung für den skalaren Fall m = 1 genauer untersucht
werden. Eine wichtige Rolle hierbei spielt die Ordnung der Zustandsbeschränkung.
Man definiere rekursiv die Funktionen S i , i ∈ N durch:
S 0 := S,
(3.6)
S i+1 := (S i )x f.
Definition 3.1.6 Die Zustandsbeschränkung S(x(t)) ≤ 0 heißt p-ter Ordnung
falls gilt:
∂S i
≡0
∂u
∂S p
6≡ 0.
=
∂u
(S i )u =
(S p )u
für i = 0, ..., p − 1
und
Anders ausgedrückt enthalten die ersten p − 1 totalen Ableitungen nach der Zeit t
keine Steuervariable, die Steuerung u tritt erstmals in der p-ten Ableitung explizit
auf, d. h.:
S i = S i (x)
S p = S p (x, u).
(3.7)
Daher gilt auf einem Randstück für alle t ∈ [te , ta ]:
S i (x(t)) = 0,
i = 0, . . . , p − 1
S p (x(t)) = 0.
(3.8)
Diese Bedingungen sind aufgrund des Eindeutigkeitssatzes für Differentialgleichungen äquivalent zu:
S i (x(te )) = 0,
i = 0, . . . , p − 1
S p (x(t)) = 0,
t ∈ [te , ta ].
17
(3.9)
3 Optimale Steuerprozesse mit reinen Zustandsbeschränkungen
Bevor nun die notwendigen Optimalitätsbedingungen für Steuerprozesse mit reinen
Zustandsbeschränkungen im nächsten Abschnitt formuliert werden, wird noch folgende Voraussetzung benötigt.
Voraussetzung 3.1.7
1. Die Gleichung S p (x, u) = 0 ist eindeutig auflösbar nach u = u(x) mit einer
C p+1 -Funktion u(x).
2. Auf jedem Randstück [te , ta ] gelte:
∂S p
(x, u) 6= 0,
∂u
∀ t ∈ [te , ta ].
3. Die Randsteuerung liege echt im Inneren des Steuerbereiches, d. h.:
u(t) ∈ int U,
∀ t ∈ [te , ta ].
Demnach gilt auf einem Randstück [te , ta ] eine eindeutige Beziehung u(t) = u(x(t)).
3.2 Direkte Methode - Direct adjoining approach“
”
Zur Behandlung von Problemen mit reinen Zustandsbeschränkungen existieren mehrere verschiedene Verfahren. Eine der meist angewandten Methoden, die in diesem
Abschnitt erläutert werden soll, ist die direkte Methode. Hierbei wird die Funktion
S(x(t)) mit einem Multiplikator versehen und direkt zur Hamiltonfunktion adjungiert.
Definition 3.2.1 Es seien das Steuerproblem (5.1), λ : [0, tf ] → Rn , λ0 ∈ R und
µ : [0, tf ] → Rk gegeben. Die Funktion
H̃ (t, x, λ, µ, u) = λ0 f0 (t, x, u) + λf (t, x, u) + µS(x)
(3.10)
H̃ (t, x, λ, µ, u) = H (t, x, λ, u) + µS(x)
heißt die erweiterte Hamilton-Funktion zum Steuerprozess (5.1).
Satz 3.2.2 (erweitertes Minimumprinzip)
Sei (x*,u*) eine optimale Lösung des zustandsbeschränkten Steuerprozesses (5.1).
Außerdem erfülle das Paar (x*,u*) die Voraussetzung (3.1.7). Dann existieren
1. eine Konstante λ0 ∈ R, λ0 ≥ 0,
2. stückweise stetige und stückweise stetig differenzierbare Funktion λ : [0, tf ] → Rn ,
18
3 Optimale Steuerprozesse mit reinen Zustandsbeschränkungen
3. ein Zeilenvektor ρ ∈ Rr ,
4. eine stückweise stetige Multiplikator-Funktion µ : [0, tf ] → Rk ,
5. in jedem Verbindungs- und Kontaktpunkt Multiplikatoren ν(ti ) ∈ R, ν(ti ) ≥ 0,
sodass folgende Aussagen gelten:
(i) An allen Stetigkeitsstellen t ∈ [0, tf ] von u∗ (t) gilt die Minimumbedingung:
H̃ (t, x∗ (t), λ(t), µ(t), u∗ (t)) = min H̃ (t, x∗ (t), λ(t), µ(t), u)
u∈ U
und die adjungierten Differentialgleichungen:
λ̇(t) = −H̃x (t, x∗ (t), λ(t), µ(t), u∗ (t)) .
(ii) Im Endzeitpunkt tf gilt die Transversalitätsbedingung:
λ(tf ) = λ0 gx (x∗ (tf )) + ρψx (x∗ (tf )) + γSx (x∗ (tf )),
γ ≥ 0,
γS(x∗ (tf )) = 0.
(iii) Für alle t ∈ [0, tf ] gilt die Vorzeichenbedingung:
µ(t) ≥ 0
und die Komplementaritätsbedingung:
µ(t)S(x∗ (t)) ≡ 0.
(iv) In jedem Verbindungs- und Kontaktpunkt gelten die Sprungbedingungen:
−
∗
λ(t+
i ) = λ(ti ) − ν(ti )Sx (x (ti )).
(v) Im Falle einer freien Endzeit tf gilt für die optimale Endzeit tf ∗ :
H̃ (tf ∗ , x∗ (tf ∗ ), λ∗ (tf ∗ ), µ∗ (tf ∗ ), u∗ (tf ∗ )) = 0.
Einen Beweis findet man in [11].
Für Probleme mit linear eingehender Steuerung lässt sich die optimale Steuerung
formal wie folgt berechnen:
Auf einem Randstück [te , ta ] ∈ [0, tf ] gilt nach Definition:
S(x(t)) = 0,
19
t ∈ [te , ta ].
3 Optimale Steuerprozesse mit reinen Zustandsbeschränkungen
Da S p (x, u) affin-linear in u ist, existiert eine Darstellung der Form:
S p (x, u) = α(x) + β(x)u
mit geeigneten Funktionen α(x) und β(x).
Außerdem gilt auf dem Randstück [te , ta ] nach Voraussetzung (3.1.7):
∂S p
(x, u) 6= 0,
∂u
∀ t ∈ [te , ta ]
und die Randsteuerung urand kann in Abhängigkeit von x ermittelt werden:
urand (x) = −
α(x)
.
β(x)
In dem Minimumprinzip wird vorausgesetzt, dass die optimale Steuerung auf einem
Randstück echt im Inneren des Steuerbereiches U liegt:
u(t) ∈ int U,
∀ t ∈ [te , ta ].
Nach der Minimumbedingung wird die Hamiltonfunktion im Optimum bezüglich der
Steuerung u minimiert. Dies impliziert:
0 = H̃(t) = Σ(t).
(3.11)
Die Randsteuerung verhält sich somit formal wie eine singuläre Steuerung.
Im Gegensatz zu unbeschränkten Problemen können bei den Steuerprozessen mit
Zustandsbeschränkungen Unstetigkeiten in den adjungierten Variablen auftreten.
Bei linear auftretender Steuerung kann der folgende Satz eine wichtige Rolle spielen.
Satz 3.2.3 Sei p = 1 und u(t) unstetig in einem Verbindungspunkt ti , dann gilt
ν(ti ) = 0. λ(t) ist also stetig in ti und es gilt Σ(ti ) = 0.
Einen Beweis findet man in Maurer [12].
3.3 Indirekte Methode - Indirect adjoining
”
approach“
Eine weitere Möglichkeit zur Auswertung zustandsbeschränkter Steuerprozesse bietet die indirekte Methode. Bei diesem Ansatz, der historisch gesehen älter als der Direkte ist, wird nicht die reine Beschränkung S(x(t)) ≤ 0 an die Hamilton-Funktion
angekoppelt, sondern die p-te Ableitung der Zustandsbeschränkung nach der Zeit
t, wobei p der Ordnung der Beschränkung entspricht. In dieser Arbeit werden die
notwendigen Bedingungen der indirekten Methode nur für den Fall p = 1 formuliert,
20
3 Optimale Steuerprozesse mit reinen Zustandsbeschränkungen
außerdem soll zur Vereinfachung die Steuerung u wieder skalar vorliegen.
Zunächst wird der in 3.2.1 eingeführte Begriff der erweiterten Hamilton-Funktion
modifiziert.
Definition 3.3.1 Es sei das Steuerproblem (5.1) mit der Zustandsbeschränkung
(3.2) der Ordnung p = 1 gegeben. Die Funktion
H 1 t, x, λ1 , µ1 , u
H1
= λ10 f0 (t, x, u) + λ1 f (t, x, u) + µ1 S 1 (x)
t, x, λ1 , µ1 , u = H t, x, λ1 , u + µ1 S 1 (x)
(3.12)
heißt die erweiterte Hamilton-Funktion der indirekten Methode zum Steuerprozess (5.1). Hierbei sind λ1 : [0, tf ] → Rn und µ1 : [0, tf ] → Rk .
Um den Zusammenhang zwischen den beiden Verfahren herzustellen, muss man
folgende Beziehungen zwischen den verwendeten Multiplikatoren beachten.
1. Die Multiplikatoren λ1 , µ1 aus 3.3 werden durch Integration der Multiplikatoren λ0 := λ und µ0 := µ aus dem Abschnitt 3.2 erzeugt.
2. Der Multiplikator λ1 (t) ist definiert durch:
λ1 (t) = λ0 (t) − µ1 (t)(S 0 )x (x(t)).
3. Für den Multiplikator µ1 gilt:
(
Rt
ν(ta ) + t a µ0 (s)ds, für t ∈ [te , ta ]
1
µ (t) =
0,
sonst.
(3.13)
(3.14)
4. Für den Multiplikator ν 1 gilt:
ν 1 (te ) = ν 0 (te ) + µ1 (te ).
(3.15)
Man beachte, dass hier angeführten Beziehungen zwischen den Multiplikatoren in
beide Richtungen gelten, d. h. wenn die Multiplikatoren der indirekten Methode
hinreichend glatt sind, können aus ihnen mittels der obigen Gleichungen die Multiplikatoren der direkten Methode gewonnen werden.
Mit den Bezeichnungen aus der Definition (3.3.1) lauten die notwendigen Optimalitätsbedingungen:
Satz 3.3.2 (erweitertes Minimumprinzip der indirekten Methode)
Sei (x*,u*) eine optimale Lösung des zustandsbeschränkten Steuerprozesses (5.1)
mit der Zustandsbeschränkung S(x(t) ≤ 0 der Ordnung p=1. Außerdem seien f und
S C 2 -Funktionen und die beiden folgenden Bedingungen erfüllt:
21
3 Optimale Steuerprozesse mit reinen Zustandsbeschränkungen
1. Auf jedem Randstück [te , ta ] gelte:
∂S 1 ∗ ∗
(x , u ) 6= 0,
∂u
∀ t ∈ [te , ta ].
2. Die Randsteuerung liege echt im Inneren des Steuerbereichs, d. h.:
u(t) ∈ int U,
∀ t ∈ [te , ta ].
Dann existieren
1. eine Konstante λ0 ∈ R, λ0 ≥ 0,
2. stückweise stetige und stückweise stetig differenzierbare Funktion λ1 : [0, tf ] → Rn ,
3. ein Zeilenvektor ρ1 ∈ Rr ,
4. eine stückweise stetige Multiplikator-Funktion µ1 : [0, tf ] → R,
5. in jedem Verbindungs- und Kontaktpunkt Multiplikatoren ν 1 (ti ) ∈ R, ν 1 (ti ) ≥ 0,
sodass folgende Aussagen gelten:
(i) An allen Stetigkeitsstellen t ∈ [0, tf ] von u∗ (t) gelten die Minimumbedingung:
H 1 t, x∗ (t), λ1 (t), µ1 (t), u∗ (t) = min H 1 t, x∗ (t), λ1 (t), µ1 (t), u
u∈ U
und die adjungierten Differentialgleichungen:
λ̇1 (t) = −Hx1 t, x∗ (t), λ(t)1 , µ1 (t), u∗ (t) .
(ii) Im Endzeitpunkt tf gilt die Transversalitätsbedingung:
λ1 (tf ) = λ10 gx (x∗ (tf )) + ρ1 ψx (x∗ (tf )),
(f alls
S(x∗ (tf )) < 0)
(iii) Für alle t ∈ [0, tf ] gilt die Komplementaritätsbedingung:
µ1 (t) ≥ 0,
µ(t)1 S(x∗ (t)) ≡ 0
und für alle t ∈ [te , ta ] die Vorzeichenbedingung:
µ1 (t) ≥ 0
∀ t ∈ [te , ta ].
(iv) In jedem Eintrittspunkt gilt die Sprungbedingung:
1 −
1
∗
λ1 (t+
e ) = λ (te ) − ν (te )Sx (x (ti )).
22
3 Optimale Steuerprozesse mit reinen Zustandsbeschränkungen
(v) In jedem Kontaktpunkt gilt:
λ1 (τ + ) = λ1 (τ − ) − νk1 Sx (x∗ (τ )),
νk1 ≥ 0.
(vi) In jedem Austrittspunkt gilt die Stetigkeitsbedingung:
1 −
λ1 (t+
a ) = λ (ta ).
(vii) Im Falle einer freien Endzeit tf gilt für die optimale Endzeit tf ∗ :
H 1 tf ∗ , x∗ (tf ∗ ), λ1 (tf ∗ ), µ1 (tf ∗ ), u∗ (tf ∗ ) = 0.
Einen Beweis hierzu findet man in Maurer [11] und Hartl, Sethi und Vickson [4].
Im Gegensatz zum direkten Ansatz gilt die Sprungbedingung für die adjungierten
Variablen beim indirekten Ansatz nur in den Eintrittspunkten. Demnach ist die
adjungierte Funktion λ1 (t) bei der Anwendung der indirekten Methode in den Austrittspunkten stetig.
23
4 Hinreichende
Optimalitätsbedingungen
Durch das Minimumprinzip von Pontryagin und dessen Erweiterung auf die Probleme mit Beschränkungen werden notwendige Optimalitätsbedingungen für das Vorliegen einer Extremalstelle gegeben. Um nachweisen zu können, dass es sich bei der
berechneten Lösung tatsächlich um ein Optimum handelt, werden die hinreichenden Bedingungen benötigt. In einigen Fällen kann jedoch gezeigt werden, dass unter
zusätzlichen Konvexitätsannahmen durch das Pontryaginsche Minimumprinzip auch
hinreichende Optimalitätsbedingungen gegeben sind. Diese Tatsache erweist sich besonders für ökonomische Probleme als sehr hilfreich. Denn in den meisten wirtschaftlichen Modellen geht man von einer Maximierung des Zielfunktionals aus und somit
werden für hinreichende Bedingungen zusätzliche Konkavitätsannahmen gefordert.
Diese Voraussetzung wird, da viele ökonomische Funktionen einen konkaven Verlauf
aufweisen, sehr häufig erfüllt. Als ein Beispiel wäre z.B. die Nutzenfunktion1 , die in
zahlreichen Problemen eine wichtige Rolle spielt, zu nennen.
4.1 Exkurs in die nichtlineare Optimierung
Um zu beweisen, dass die notwendigen Bedingungen unter zusätzlichen Konvexitätsannahmen auch hinreichend sind, werden die Kuhn-Tucker-Bedingungen der nichtlinearen Optimierung benötigt. Aus diesem Grunde wird zunächst ein kleiner Rückblick auf die nichtlineare Optimierung gegeben.
Definition 4.1.1 Gegeben seien die differenzierbare Abbildung f : Rn → R und die
stetig differenzierbare Abbildung g : Rn → Rm . Dann lautet das Standardproblem
der nichtlinearen Optimierung:
M inimiere
unter
1
f (x)
gi (x) ≤ 0,
i = 1, ..., k,
gi (x) = 0,
i = k + 1, ..., m.
(4.1)
Die Nutzenfunktion ist in der Volkswirtschaftslehre eine häufig gewählte Modellierung der Präferenzen einzelner Wirtschaftssubjekte.
24
4 Hinreichende Optimalitätsbedingungen
Definition 4.1.2 Erfüllt ein Punkt x ∈ Rn die Bedingungen:
gi (x) ≤ 0 f ür i = 1, ..., k
gi (x) = 0 f ür i = k + 1, ..., m,
so heißt er zulässig für das Optimierungsproblem (4.1).
Definition 4.1.3 Die Mengen
I(x̄) := {i ∈ {1, ..., k} | gi (x̄) = 0}
J(x̄) := I(x̄) ∪ {k + 1, ..., m}
werden als Mengen der aktiven Indizies bezeichnet.
Definition 4.1.4 Ein zulässiger Punkt x̄ des Standardproblems (4.1) heißt regulär,
wenn gilt:
(a) Die Gradienten (gk+1 )x (x̄), ..., (gm )x (x̄) sind linear unabhängig,
(b) ∃ v ∈ Rn mit : (gi )x (x̄)v < 0 f ür i ∈ I(x̄),
(gi )x (x̄)v = 0 f ür i ∈ {k + 1, ..., m}.
Definition 4.1.5 Ein zulässiger Punkt x̄ des Standardproblems (4.1) heißt normal,
wenn gilt: Die Gradienten (gi )x (x̄), i ∈ J(x̄) sind linear unabhängig.
Mit den obigen Definitionen können nun die notwendigen Optimalitätsbedingungen
der nichtlinearen Optimierung angegeben werden.
Satz 4.1.6 (Satz von John und Karush-Kuhn-Tucker)
Sei x̄ eine lokale Minimalstelle des Optimierungsproblems (4.1). Dann gilt:
(i) Es existiert ein Zeilenvektor (λ0 , λ) ∈ R × Rm \ {0, 0m } mit:
X
λ0 fx (x̄) +
λi (gi )x (x̄) = 0,
i∈J(x̄)
λ0 ≥ 0,
λi ≥ 0 f ür i ∈ I(x̄),
λi = 0 f ür i ∈
/ J(x̄).
(ii) Ist x̄ regulär, d. h. es gelte:
(a) Die Gradienten (gk+1 )x (x̄), ..., (gm )x (x̄) sind linear unabhängig,
(b) ∃ v ∈ Rn mit : (gi )x (x̄)v < 0 f ür i ∈ I(x̄),
(gi )x (x̄)v = 0 f ür i ∈ {k + 1, ..., m},
so kann λ0 = 1 gesetzt werden.
25
4 Hinreichende Optimalitätsbedingungen
(iii) Ist x̄ normal, d. h. die Gradienten (gi )x (x̄), i ∈ J(x̄) sind linear unabhängig,
so ist λ ∈ Rm mit λ0 = 1 eindeutig bestimmt.
Einen Beweis dieses Satzes findet man z. B. in Luenberger [9].
Definition 4.1.7 Die Komponenten λi , i = 0, 1, ..., m aus den Bedingungen des
Satzes (4.1.6) heißen Lagrange-Multiplikatoren und die Funktion
L(x, λ0 , λ) := λ0 f (x) + λg(x),
(4.2)
mit λ ∈ Rm Zeilenvektor, λ0 ∈ R heißt Lagrange-Funktion.
4.2 Konvexe Funktionen
Im folgenden Abschnitt werden zunächst die Begriffe der Konvexität und der QuasiKonvexität, die in diesem Kapitel eine sehr wichtige Rolle spielen, vorgestellt. Es
werden einige Sätze formuliert, die zum Beweis der hinreichenden Bedingungen notwendig sind. Zum Schluss wird ein ausgewähltes Kriterium zur Überprüfung der
Konvexität eingeführt. Dieses wird zur Behandlung des modifizierten Modells von
Lesourne und Leban in Kapitel 5 verwendet.
Definition 4.2.1 Eine nicht-leere Teilmenge D ⊆ Rn heißt konvex, wenn für alle
α mit 0 ≤ α ≤ 1 und für alle x1 , x2 ∈ D gilt:
αx1 + (1 − α)x2 ∈ D.
Definition 4.2.2 Sei D eine konvexe Teilmenge des Rn . Eine auf D definierte Funktion f : D → R heißt konvex, wenn für alle x1 , x2 aus ihrem Definitionsbereich D
und für alle α ∈ [0, 1] gilt:
f (αx1 + (1 − α)x2 ) ≤ αf (x1 ) + (1 − α)f (x2 )).
Falls f differenzierbar ist, so ist ihre Konvexität äquivalent zu:
fx (x1 )(x2 − x1 ) ≤ f (x2 ) − f (x1 ).
Gilt in diesen Ungleichungen anstelle von ≤ das ≥ Zeichen, so ist die Funktion f
konkav.
Definition 4.2.3 Eine Funktion f : Rn → R heißt quasi-konvex auf dem konvexen Definitionsbereich D ∈ Rn , wenn für alle x1 , x2 ∈ D und für alle ζ ∈ [0, 1]
gilt:
f (ζx1 + (1 − ζ)x2 ) ≤ min {f (x1 ), f (x2 )}
Gilt in diesen Ungleichungen anstelle von ≤ das ≥ Zeichen, so ist die Funktion f
quasi-konkav.
26
4 Hinreichende Optimalitätsbedingungen
Bemerkung 4.2.4 Jede konvexe Funktion ist auch quasi-konvex.
Bemerkung 4.2.5 Eine lineare Funktion f : D → R ist auf jeder konvexen Menge
D ⊆ Rn sowohl konvex als auch konkav.
Satz 4.2.6 Sei f : D → R quasi-konvex und differenzierbar auf der konvexen Menge
D ⊆ Rn . Dann gilt für alle x, x∗ ∈ D mit f (x) ≤ f (x∗ ):
fx (x∗ )(x − x∗ ) ≤ 0.
(4.3)
Satz 4.2.7 Sei f : D → R quasi-konvex und differenzierbar auf der konvexen Menge
D ⊆ Rn . Ferner existiere ein Vektor x∗ und ein Skalar γ mit
f (x∗ ) ≤ 0,
γ ≥ 0,
f (x∗ )γ = 0.
(4.4)
Dann gilt für alle x ∈ D mit f (x) ≤ 0:
γfx (x∗ )(x − x∗ ) ≤ 0.
(4.5)
Ein Beweis des Satzes (4.2.6) folgt unmittelbar aus der Definition einer quasikonvexen Funktion. Die Behauptung des Satzes (4.2.7) kann mittels des Satzes
(4.2.6) direkt nachvollzogen werden.
Des Weiteren werden einige Sätze über konvexe und quasi-konvexe Funktionen angegeben, deren Beweise sich direkt aus den jeweiligen Definitionen ergeben.
Satz 4.2.8 f (x) ist genau dann quasi-konvex, wenn die Menge
Aα = {x | f (x) ≤ α}
für jedes α ∈ Rn konvex ist.
Satz 4.2.9 Seien K ∈ Rn eine konvexe Menge und f1 , . . . , fm : K → Rn konvexe
Funktionen. Dann ist auch jede nichtnegative Linearkombination der Funktionen:
f :=
m
X
αi fi ,
αi ≥ 0
i = 1, . . . , m
i=1
eine konvexe Funktion.
Satz 4.2.10 Sind D1 , . . . , Dk ⊆ Rn konvexe Mengen, so ist deren Durchschnitt
T
T
D1 , . . . , Dk ebenfalls konvex.
Schließlich wird für den Beweis der hinreichenden Optimalitätsbedingungen noch
folgendes Resultat, entnommen aus Rockafellar [15], verwendet.
27
4 Hinreichende Optimalitätsbedingungen
Satz 4.2.11 Sei f (x) eine konvexe Funktion auf einem konvexen Definitionsbereich
D ⊆ Rn . Dann existiert für jedes x∗ aus D ein Zeilenvektor a = a(x∗ ), so dass für
alle f ∈ D gilt:
f (x) − f (x∗ ) ≥ a(x − x∗ ).
(4.6)
a wird als Subgradient von f bezeichnet. Ist f differenzierbar in x∗ , dann ist a
eindeutig bestimmt und gleich dem Gradienten, also a = fx (x∗ ). Ist φ konkav, so gilt
für alle x ∈ D:
f (x) − f (x∗ ) ≤ a(x − x∗ )
(4.7)
und a wird als Supergradient von x bezeichnet.
Um eine Funktion auf Konvexität zu überprüfen, benötigt man den Begriff der Defintheit einer Matrix:
Definition 4.2.12 Sei A eine symmetrische Matrix in Rn×n .
(i) A heißt positiv semidefinit, wenn xT Ax ≥ 0 für alle x ∈ Rn \0 gilt.
(ii) A heißt positiv definit, wenn sogar xT Ax > 0 für alle x ∈ Rn \0 gilt.
(iii) A heißt negativ semidefinit, wenn xT Ax ≤ 0 für alle x ∈ Rn \0 gilt.
(iv) A heißt negativ definit, wenn sogar xT Ax < 0 für alle x ∈ Rn \0 gilt.
Satz 4.2.13 Sei D ⊆ Rn eine konvexe Menge und sei f : D → R zweimal stetig
differenzierbar. Es gilt:
(i) Eine Funktion f ist genau dann auf D konvex, wenn die Hesse-Matrix ∇2 f (x)
für alle x ∈ D positiv semidefinit ist.
(ii) Eine Funktion f ist genau dann auf D konkav, wenn die Hesse-Matrix ∇2 f (x)
für alle x ∈ D negativ semidefinit ist.
(iii) Eine Funktion f ist genau dann auf D streng konvex, wenn die Hesse-Matrix
∇2 f (x) für alle x ∈ D positiv definit ist.
(iv) Eine Funktion f ist genau dann auf D streng konkav, wenn die Hesse-Matrix
∇2 f (x) für alle x ∈ D negativ definit ist.
Zur Überprüfung der Definitheit einer symmetrischen Matrix kann das Eigenwertkriterium zur Rate gezogen werden.
Satz 4.2.14 Sei A ∈ Rn×n eine symmetrische Matrix A ∈ Rn×n .
(i) A ist genau dann positiv definit, falls für alle Eigenwerte λi von A gilt: λi > 0.
28
4 Hinreichende Optimalitätsbedingungen
(ii) A ist genau dann positiv semidefinit, falls für alle Eigenwerte λi von A gilt:
λi ≥ 0.
(iii) A ist genau dann negativ definit, falls für alle Eigenwerte λi von A gilt: λi < 0.
(iv) A ist genau dann negativ semidefinit, falls für alle Eigenwerte λi von A gilt:
λi ≤ 0.
(v) A ist genau dann indefinit, wenn A mindestens einen positiven und einen
negativen Eigenwert besitzt.
4.3 Hinreichende Optimalitätsbedingungen für
unbeschränkte Steuerprozesse
Die hinreichenden Optimalitätsbedingungen können nun folgendermaßen formuliert
werden:
Satz 4.3.1 Sei (x*,u*) ein zulässiges Paar für das Problem (2.7). Es existiere eine Funktion λ : [0, tf ] → Rn , sowie ein Vektor ν ∈ Rr , so dass die notwendigen
Optimalitätsbedingungen von Satz (2.3.3) mit λ0 = 1 erfüllt sind. Ferner seien:
(i) g(x) konvex,
(ii) ψ(x) affin-linear,
(iii) H 0 (t, x, λ) konvex in x für alle (t, λ(t)), t ∈ [0, tf ], wobei
H 0 (t, x, λ) := min H (t, x∗ (t), λ(t), u) ,
u∈ U
t ∈ [0, tf ].
Dann ist (x*,u*) eine optimale Lösung.
Bemerkung 4.3.2 Die Konvexität von H 0 in x kann durch die stärkere Voraussetzung der Konvexität von H in (x, u) ersetzt werden.
In diesem Abschnitt wird zunächst ein Beweis des Satzes (4.3.1) über das so genannte Enveloppentheorem geführt. Hierbei wird jedoch die Differenzierbarkeit der
minimierten Hamiltonfunktion in x vorausgesetzt. Ein allgemeinerer Beweis, der auf
diese Bedingung verzichtet, wird im nächsten Abschnitt im Rahmen zustandsbeschränkter Steuerprozesse vorgestellt.
29
4 Hinreichende Optimalitätsbedingungen
Lemma 4.3.3 (Enveloppentheorem)
Eine Funktion φ : Rn × Rm → R sei definiert für (x, u) ∈ D × U , wobei D offen sei.
φ0 : Rn → R sowie u∗ : Rn → Rm seien gegeben durch:
φ0 (x) = min φ(x, u),
u∈U
u∗ (x) = arg min φ(x, u).
u∈U
Sind φ0 und φ stetig differenzierbar in x, so gilt:
φx (x, u) |u=u∗ (x) = φ0x (x).
Einen Beweis hierzu findet man bei Derzko at al. [2].
Für die minimierte Hamiltonfunktion
H 0 (t, x, λ) := min H (t, x, λ, u)
u∈U
(4.8)
ergibt sich aus dem Hilfssatz, dass für
u∗ (x, λ, t) = arg min H (t, x, λ, u)
u∈U
folgende Beziehungen gelten:
H 0 (t, x, λ) = H(t, x, λ, u∗ ),
Hx0 (t, x, λ) = Hx (t, x, λ, u∗ ).
(4.9)
Beweis zu Satz 4.3.1
Gemäß (2.1.8) ist die Behauptung des Satzes (4.3.1) bewiesen, falls gezeigt werden
kann, dass die Differenz
∆ := F (x, u) − F (x∗ , u∗ )
(4.10)
nicht negativ ist. Es sei (x(t), u(t)) ein beliebiges, zulässiges Funktionenpaar auf
[0, tf ]. Mittels der Hamiltonfunktion, mit λ0 = 1, lässt sich die Funktion f0 (t, x(t), u(t))
schreiben als
f0 (t, x(t), u(t)) = H(t, x, λ, u) − λf (t, x, u) .
Damit kann man die obige Differenz folgendermaßen umformulieren:
30
4 Hinreichende Optimalitätsbedingungen
∆ = g (x(tf )) +
Z
tf
f0 (t, x(t), u(t)) dt
0
Z
tf
f0 (t, x∗ (t), u∗ (t)) dt
− g (x (tf )) −
0
Z tf
(H(t, x, λ, u) − λf (t, x, u))dt
= g (x(tf )) +
0
Z tf
∗
− g (x (tf )) −
(H(t, x∗ , λ, u∗ ) − λf (t, x∗ , u∗ ))dt
Z 0tf
= g (x(tf )) +
(H(t, x, λ, u) − λẋ)dt
0
Z tf
∗
(H(t, x∗ , λ, u∗ ) − λẋ∗ )dt
− g (x (tf )) −
∗
0
= g (x(tf )) − g (x∗ (tf ))
Z tf
+
(H(t, x, λ, u) − H(t, x∗ , λ, u∗ ) − λ(ẋ − ẋ∗ ))dt.
(4.11)
0
Aus der Konvexitätsannahme von H 0 (t, x, λ) bezüglich x und (4.8)-(4.9) folgt nun:
H(t, x, λ, u) − H(t, x∗ , λ, u∗ ) ≥ H 0 (t, x, λ) − H 0 (t, x∗ , λ)
≥ Hx0 (t, x∗ , λ)(x − x∗ )
(4.12)
= Hx (t, x∗ , λ)(x − x∗ )
und aus der Konvexität von g(x) erhält man die Ungleichung:
g (x(tf )) − g (x∗ (tf )) ≥ gx (x∗ (tf ))(x(tf ) − x∗ (tf )).
(4.13)
Durch das Einsetzen der beiden Abschätzungen und der adjungierten Differentialgleichungen in die Differenz ergibt sich nun folgendes:
∗
∗
∆ ≥ gx (x (tf ))(x(tf ) − x (tf )) +
= gx (x∗ (tf ))(x(tf ) − x∗ (tf )) −
= gx (x∗ (tf ))(x(tf ) − x∗ (tf )) −
Z
tf
(Hx (t, x∗ , λ)(x − x∗ ) − λ(ẋ − ẋ∗ ))dt
Z0 tf
Z0 tf
(λ̇(x − x∗ ) + λ(ẋ − ẋ∗ ))dt
(
0
∗
∗
d
λ(x − x∗ ))dt
dt
t
= gx (x (tf ))(x(tf ) − x (tf )) − [λ(t)(x(t) − x∗ (t))]0f
= gx (x∗ (tf ))(x(tf ) − x∗ (tf )) − λ(0) [x(0) − x∗ (0)] + λ(tf ) [x(tf ) − x∗ (tf )] .
31
4 Hinreichende Optimalitätsbedingungen
Beachtet man die Transversalitätsbedingung, die Linearität von ψ(x), sowie die Tatsache, dass stets x(0) = x∗ (0) gilt, folgt unmittelbar:
∆ ≥ gx (x∗ (tf ))(x(tf ) − x∗ (tf )) − λ(0) [x(0) − x∗ (0)] + λ(tf ) [x(tf ) − x∗ (tf )]
= gx (x∗ (tf ))(x(tf ) − x∗ (tf )) + [gx (x∗ (tf ∗ )) + ρψx (x∗ (tf ))] [x(tf ) − x∗ (tf )]
= ρψx (x∗ (tf )) [x(tf ) − x∗ (tf )]
= ρ [ψ(x(tf )) − ψ(x∗ (tf ))]
= 0.
Insgesamt ergibt sich somit:
∆ := F (x, u) − F (x∗ , u∗ ) ≥ 0.
2
4.4 Hinreichende Optimalitätsbedingungen für OSP
mit Zustandsbeschränkungen
Auch für zustandsbeschränkte Steuerprozesse können, analog zu unbeschränkten
Problemen aus den notwendigen Optimalitätsbedingungen, im Falle einer konvexen
minimierten Hamiltonfunktion, hinreichende Bedingungen gewonnen werden. Dabei
wird von der reinen Zustandsbeschränkung die Quasi-Konvexität gefordert.
Die hinreichenden Optimalitätsbedingungen für beschränkte Probleme lassen sich
nun im folgenden Satz zusammenfassen.
Satz 4.4.1 Sei (x*,u*) ein zulässiges Paar für das Problem (5.1), welches die Voraussetzung 3.1.7 erfüllt. Es existiere eine Funktion λ : [0, tf ] → Rn , µ : [0, tf ] → R
sowie Multiplikatoren ν(ti ), ρ ∈ Rr , so dass die notwendigen Optimalitätsbedingungen von Satz (2.3.3) mit λ0 = 1 erfüllt sind. Ferner seien:
(i) g(x) konvex,
(ii) ψ(x) affin-linear,
(iii) S(x) quasi-konvex,
(iv) H 0 (t, x, λ) sei konvex in x für alle (t, λ(t)), t ∈ [0, tf ], wobei
H 0 (t, x, λ) := min H (t, x∗ (t), λ(t), u) ,
u∈ U
Dann ist (x*,u*) eine optimale Lösung.
32
t ∈ [0, tf ].
4 Hinreichende Optimalitätsbedingungen
Der Beweis des Satzes (4.4.1) wird mittels des folgenden Satzes geführt.
Satz 4.4.2 Sei (x*,u*) ein zulässiges Paar für das Problem (5.1) mit (3.2). Es
existiere eine stückweise stetig differenzierbare Funktion λ : [0, tf ] → Rn , so dass
mit der Hamiltonfunktion H (t, x, λ, u) und λ0 = 1 für jedes andere zulässiges Paar
(x,u) folgende Bedingungen erfüllt sind:
(i) Für fast alle t ∈ [0, tf ] gilt:
H (t, x, λ, u) − H (t, x∗ , λ, u∗ ) ≥ λ̇ [x∗ (t) − x(t)] .
(4.14)
(ii) An allen Unstetigkeitsstellen τ von λ gilt die Sprungbedingung:
−
λ(τ ) − λ(τ + ) [x∗ (τ ) − x(τ )] ≥ 0.
(4.15)
(iii) Im Endzeitpunkt tf gilt:
λ(tf ) [x∗ (tf ) − x(tf )] − g(x∗ (tf )) + g(x(tf )) ≥ 0.
(4.16)
Dann ist (x*,u*) eine optimale Lösung.
Beweis: Analog zu dem Beweis des Satzes (4.3.1) ist die Aussage dieses Satzes
bewiesen, wenn gezeigt wird, dass für alle zulässige (x, u) die Ungleichung
∆ := F (x, u) − F (x∗ , u∗ ) ≥ 0
erfüllt ist. Auch hier kann die Differenz mittels der Definition der Hamiltonfunktion
umgeformt werden. Es gilt also:
∗
∆ = g (x(tf )) − g (x (tf )) +
Z
tf
(H(t, x, λ, u) − H(t, x∗ , λ, u∗ ) − λ(ẋ − ẋ∗ ))dt.
t0
Aus der Bedingung (4.14 ) ergibt sich somit:
∗
∆ ≥ g (x(tf )) − g (x (tf )) +
= g (x(tf )) − g (x∗ (tf )) +
= g (x(tf )) − g (x∗ (tf )) +
Z
tf
Z0 tf
Z0 tf
0
33
(λ̇(x∗ − x) − λ(ẋ − ẋ∗ ))dt
(λ̇(x∗ − x) + λ(ẋ∗ − ẋ))dt
(
d
λ(x − x∗ ))dt.
dt
4 Hinreichende Optimalitätsbedingungen
Unter Berücksichtigung möglicher Unstetigkeitsstellen τi der adjungierten Variablen
λ(t) erhält man:
∆ ≥ g (x(tf )) − g (x∗ (tf )) + λ(tf ) [x∗ (tf ) − x(tf )]
X
λ(τi− ) − λ(τi+ ) [x∗ (τi ) − x(τi )] − λ(0) [x∗ (0) − x(0)] .
+
i
Beachtet man, dass stets x∗ (0) = x(0) = x0 gilt, folgt aus (4.15) und (4.16) direkt
die Behauptung:
F (x, u) − F (x∗ , u∗ ) ≥ 0.
2
Beweis zu Satz 4.4.1: Es sei der Steuerbereich U durch Ungleichungen der Form:
U := {u ∈ Rm |
mit h(t, u) ≤ 0}
gegeben.
Nach Voraussetzung ist U konvex. Außerdem ist die minimierte Hamiltonfunktion
H 0 (t, x, λ) ebenfalls konvex. Demnach existiert laut Satz (4.2.11) ein Subgradient
a(t) mit
H 0 (t, x, λ) − H 0 (t, x∗ (t), λ) ≥ a(t) [x − x(t)∗ ]
(4.17)
für alle x ∈ Rn .
Mittels Definition der minimierten Hamiltonfunktion gilt somit die Abschätzung:
H(t, x, λ, u) − H(t, x∗ (t), λ, u∗ ) ≥ H 0 (t, x, λ) − H 0 (t, x∗ (t), λ) ≥ a(t) [x − x(t)∗ ]
⇒ H(t, x, λ, u) − a(t)x ≥ H(t, x∗ (t), λ, u∗ ) − a(t)x∗ .
(4.18)
Daher ist das Paar (x∗ , u∗ ) zu jedem Zeitpunkt t eine optimale Lösung für das
nichtlineare Optimierungsproblem:
M inimiere
unter
H(t, x, λ, u) − a(t)x
h(t, u) ≤ 0.
(4.19)
Die Lagrange-Funktion zu diesem Problem lautet:
L(t, x, η) = H(t, x, λ, u) − a(t)x + η(t)h(t, u)
Nach dem Satz von Karusch-Kuhn-Tucker gilt für die optimale Lösung (x∗ , u∗ ) unter
anderem folgende Bedingung:
Lx (t, x∗ , u∗ η) = Hx (t, x∗ , λ, u∗ ) − a(t) = 0.
34
(4.20)
4 Hinreichende Optimalitätsbedingungen
Des Weiteren folgt aus der adjungierten Differentialgleichung des Minimumprinzips
λ̇ = −H̃x (t, x∗ , λ, u∗ ) = −Hx (t, x∗ , λ, u∗ ) − µ(t)Sx (x∗ (t))
⇒ Hx (t, x∗ , λ, u∗ ) = −λ̇ − µ(t)Sx (x∗ (t)).
(4.21)
Durch das Einsetzen von (4.21) in (4.20) erhält man für den Subgradienten a(t):
a(t) = −λ̇ − µ(t)Sx (x∗ (t)).
(4.22)
Und damit kann die Ungleichung (4.18) weiter umgeformt werden:
H(t, x, λ, u) − H(t, x∗ (t), λ, u∗ ) ≥ [−λ̇ − µ(t)Sx (x∗ (t))][x − x(t)∗ ]
∗
∗
∗
(4.23)
∗
H(t, x, λ, u) − H(t, x (t), λ, u ) ≥ [λ̇ + µ(t)Sx (x (t))][x(t) − x]
H(t, x, λ, u) − H(t, x∗ (t), λ, u∗ ) ≥ λ̇[x(t)∗ − x] + µ(t)Sx (x∗ (t))[x(t)∗ − x].
Zudem ist der Term µ(t)Sx (x∗ (t))[x(t)∗ − x] nach Satz (4.2.8) nicht negativ. Somit
gilt:
H(t, x, λ, u) − H(t, x∗ (t), λ, u∗ ) ≥ λ̇[x(t)∗ − x]
(4.24)
und die Bedingung (4.14) des Satzes (4.4.2) ist erfüllt.
Laut der Sprungbedingung des erweiterten Minimumprinzips gilt für jede Verbindungsstelle τ von λ(t):
λ(τ − ) − λ(τ + ) = ν(τ )Sx (x∗ (τ ))
(4.25)
mit ν(τ ) ≥ 0. Laut Satz (4.2.7) ist der Ausdruck ν(τ )Sx (x∗ (τ ))(x − x∗ ) für alle x mit
S(x(t)) ≤ 0 nicht positiv, da S(x(t)) nach Voraussetzung quasi-konvex ist. Somit
kann (4.25) folgendermaßen abgeschätzt werden.
(λ(τ − ) − λ(τ + ))[x∗ − x] = [ν(τ )Sx (x∗ (τ ))][x∗ − x]
(λ(τ − ) − λ(τ + ))[x∗ − x] = −[ν(τ )Sx (x∗ (τ ))][x − x∗ ]
(4.26)
⇒ (λ(τ − ) − λ(τ + ))[x∗ − x] ≥ 0.
Damit ist die Ungleichung (4.15) des Satzes (4.4.2) sichergestellt und es bleibt nur
noch (4.16) zu zeigen. Hierfür wird die Transversalitätsbedingung verwendet. Mit
λ0 = 1 lautet diese:
λ(tf ) = λ0 gx (x∗ (tf )) + ρψx (x∗ (tf )) + γSx (x∗ (tf )),
γ ≥ 0,
γS(x∗ (tf )) = 0
35
4 Hinreichende Optimalitätsbedingungen
und aufgrund der Quasi-Konvexität von S(x) folgt mittels des Satzes (4.2.7):
γSx (x∗ (tf ))(x∗ (tf ) − x(tf )) ≥ 0.
(4.27)
Ferner ist g(x) konvex, d.h. es gilt:
g (x(tf )) − g (x∗ (tf )) ≥ gx (x∗ (tf ))(x(tf ) − x∗ (tf ))
⇔ −g (x(tf )) + g (x∗ (tf )) ≤ −gx (x∗ (tf ))(x(tf ) − x∗ (tf ))
∗
∗
(4.28)
∗
⇔ −g (x(tf )) + g (x (tf )) ≤ gx (x (tf ))(x (tf ) − x(tf )).
Außerdem folgt aus der Linearität von ψ(x)
ρψx (x∗ (tf )) [x(tf ) − x∗ (tf )] = ρ [ψ(x(tf )) − ψ(x∗ (tf ))] = 0.
(4.29)
Unter Beachtung der obigen Abschätzungen ergibt sich:
λ(tf ) = gx (x∗ (tf )) + ρψx (x∗ (tf )) + γSx (x∗ (tf ))
⇔ λ(tf )(x∗ (tf ) − x(tf )) = (gx (x∗ (tf )) + ρψx (x∗ (tf )) + γSx (x∗ (tf )) (x∗ (tf ) − x(tf ))
⇔ λ(tf )(x∗ (tf ) − x(tf )) ≥ −g (x(tf )) + g (x∗ (tf )) + γSx (x∗ (tf ))(x∗ (tf ) − x(tf ))
⇔ λ(tf )(x∗ (tf ) − x(tf )) − g (x∗ (tf )) + g (x(tf )) ≥ γSx (x∗ (tf ))(x∗ (tf ) − x(tf ))
⇔ λ(tf )(x∗ (tf ) − x(tf )) − g (x∗ (tf )) + g (x(tf )) ≥ 0.
(4.30)
Damit sind alle Voraussetzungen des Satzes (4.4.2) erfüllt. Das Paar (x∗ , u∗ ), welches den notwendigen Optimalitätsbedingungen des erweiterten Minimumprinzips
genügt, ist optimal.
2
36
5 Numerische Lösung optimaler
Steuerprozesse mittels direkter
Verfahren
Bei der Bearbeitung optimaler Steuerprozesse spielen numerische Verfahren eine
sehr wichtige Rolle, denn viele praktische Probleme sind so komplex, dass sie nicht
mehr analytisch gelöst werden können. Im wesentlichen lassen sich die numerischen
Lösungsmethoden der optimalen Steuerprozesse in zwei Klassen einteilen: direkte
und indirekte Verfahren1 . Bei den indirekten Verfahren werden die notwendigen Optimalitätsbedingungen aus der Theorie verwendet, um den Steuerprozess auf ein
Randwertproblem zurückzuführen. Zur numerischen Lösung des erhaltenen Randwertproblems kann dann eines der existierenden Verfahren, wie z.B.
• Einfach-Schießverfahren,
• Mehrfach-Schießverfahren,
• Kollokationsverfahren,
• Differenzverfahren
eingesetzt werden. Ein Vorteil indirekter Verfahren ist, dass mit deren Hilfe sehr
gute Ergebnisse, mit einer Genauigkeit der Größenordnung 10−10 , erzielt werden
können. Deren Verwendung ist jedoch auch mit sehr großen Nachteilen verbunden.
Der Benutzer sollte sich mit der Theorie der optimalen Steuerprozesse, um z. B. die
adjungierten Differentialgleichungen aufstellen zu können, gut auskennen. Zudem
wird eine anfängliche Schätzung adjungierter Variablen, die unter Umständen Unstetigkeitsstellen aufweisen, benötigt. Des Weiteren muss die Struktur der Lösung
dem Anwender bekannt sein. Es ist jedoch im Allgemeinen nicht möglich diese a
priori zu bestimmen. Besonders bei komplexen Modellen ist der Verlauf der optimalen Steuerung meistens dem Problem von vornherein nicht anzusehen.
1
Man beachte, dass die Namensgebung nichts mit dem Direkten und dem Indirekten Ansatz zur
Behandlung der reinen Zustandsbeschränkungen hat.
37
5 Numerische Lösung optimaler Steuerprozesse mittels direkter Verfahren
Bei den direkten Verfahren wird ein unendlich dimensionales Steuerungsproblem
durch Diskretisierung in ein endlich dimensionales, im Allgemeinen nichtlineares
Optimierungsproblem überführt, welches dann mit einem numerischen Algorithmus
gelöst werden kann. Auf diese Weise wurden auch die praktischen Beispiele der vorliegenden Arbeit behandelt.
5.1 Diskretisierung
Zur Diskretisierung der optimalen Steuerprozesse wird das Zeitintervall [0, tf ] in ein
Gitter mit den Gitterpunkten ti , an denen schließlich alle relevanten Größen ausgewertet werden, eingeteilt. Die einfachste Art der Diskretisierung ist die äquidistante
Aufteilung der Gitterpunkte.
Gegeben sei also ein autonomer optimaler Steuerprozess mit fester Endzeit tf 2 der
Form:
M inimiere
g (x(tf )) +
Z
tf
f0 (t, x(t), u(t)) dt
0
unter
dx(t)
= f (t, x(t), u(t))
dt
x(0) = x0 , ψ(x(tf )) = 0 ∈ Rr
ẋ(t) =
S(x(t), u(t)) ≤ 0,
t ∈ [0, tf ],
(5.1)
wobei S : Rn × Rm → Rk , k ∈ N+ eine hinreichend oft stetig differenzierbare
Funktion ist.
Sei N ∈ N+ und seien ti die Gitterpunkte des Zeitintervalls [0, tf ] mit
0 = t1 < t2 < · · · < tN −1 < tN = tf ,
des Weiteren seien die Näherungswerte für x(ti ), bzw. u(ti ) mit
xi := x(ti )
bzw.
ui := u(ti )
bezeichnet.
Dann kann ein Steuerprozess als ein Optimierungsproblem in den Variablen
(x1 , . . . , xN , u1 , . . . , uN ) ∈ R(n+m)N
2
In Abschnitt 2.2 wurde gezeigt, dass jeder Steuerprozess in so eine Form überführt werden kann.
38
5 Numerische Lösung optimaler Steuerprozesse mittels direkter Verfahren
folgendermaßen formuliert werden:
M inimiere
g (xN ) +
N
−1
X
(ti+1 − ti )f0 (xi , ui )
i=1
unter
xi+1 = xi + (ti+1 − ti )f (xi , ui ),
x1 = x0 ,
S(xi , ui ) ≤ 0,
i = 1, . . . , N − 1
(5.2)
ψ(xN ) = 0 ∈ Rr
(5.3)
i = 1, . . . , N.
(5.4)
Dabei wurde hier zur Approximation der Differentialgleichungen das Euler-Verfahren
verwendet und das Integral durch eine Treppenfunktion angenähert. Natürlich können
neben diesen Verfahren auch andere Verfahren höherer Ordnung eingesetzt werden.
Bei der Erstellung einer Lösung der praktischen Beispiele in dieser Arbeit wurde
z. B. zur Approximation des Zustandes auf das Euler-Verfahren der Ordnung O(h)
und auf das Heun-Verfahren, welches die Fehlerordnung O(h2 ) besitzt, zurückgegriffen. Beide Verfahren zeichnen sich dadurch aus, dass zur Berechnung die Werte
der Steuerung im Inneren der Teilintervalle [ti , ti+1 ] nicht benötigt werden. Bei einigen anderen Verfahren (z. B. das Runge-Kutta-Verfahren) bedarf es jedoch einer
Bestimmung der Näherungen der Steuerfunktion in den Intervallinnenpunkten. Die
zusätzlichen Werte können in solchen Fällen z. B. durch Interpolation oder auch
konstante, lineare oder kubische Splines gewonnen werden.
Eine detaillierte Beschreibung verschiedener Verfahren zur Approximation der Steuerung, des Zustandes, des Zielfunktionals, sowie der Beschränkungen kann in Kim [5]
oder Büskens [1] gefunden werden.
5.2 Vor- und Nachteile der direkten Verfahren
Die wesentlichen Vorteile der direkten Verfahren im Vergleich zu den indirekten
Verfahren sind:
• Es werden dem Anwender keine Kenntnisse der Theorie optimaler Steuerprozesse abverlangt.
• Die Schaltstruktur muss nicht bekannt sein.
• Direkte Verfahren zeichnen sich durch einen sehr großen Konvergenzradius aus.
• Die adjungierten Differentialgleichungen werden nicht benötigt.
• Eine Startschätzung der kritischen Punkte (wie z. B. Unstetigkeitsstellen, Verbindungspunkte) sowie eine Startschätzung der adjungierten Variablen sind
nicht erforderlich.
39
5 Numerische Lösung optimaler Steuerprozesse mittels direkter Verfahren
Zudem konnten höhere Rechenzeiten und geringere Genauigkeiten, die sich nachteilig
auf direkte Verfahren auswirkten, in der Vergangenheit dank neuer Entwicklungen
und Technologien soweit verbessert werden, dass sie kaum noch ins Gewicht fallen.
Die direkten Verfahren haben allerdings den Nachteil, dass sie relativ viel Speicherplatz verbrauchen. Dies macht sich insbesondere bei größeren Problemen (wie z. B.
komplexes Unternehmensmodell aus Kapitel 7 mit sieben Zustandsvariablen und
vier Steuerungen) bemerkbar.
Das Fehlen der adjungierten Variablen erweist sich nicht als ein Nachteil, denn diese
können nachträglich leicht berechnet werden.
Zur Bearbeitung der praktischen Beispiele dieser Arbeit wurden Optimierungsalgorithmen LOQO von Prof. R. J. Vanderbei sowie IPOPT von A. Wächter und
L. T. Biegler eingesetzt. Dabei wurden beide Solver unter der Programmierumgebung AMPL (AMPL ist eine algebraische Modellierungssprache zur Formulierung
von Optimierungsproblemen.) aufgerufen. Beide Programme benutzen das InnerePunkte-Verfahren zur Lösung nichtlinearer Optimierungsprobleme. Die genauen Details zur Implementierung der beiden Optimierer können in [16] bzw. [17] nachgeschlagen werden.
40
6 Das modifizierte Modell von
Lesourne und Leban
Nachdem in den vorherigen Kapiteln die benötigten Instrumente zur Lösung optimaler Steuerprozesse mit reinen Zustandsbeschränkungen vorgestellt wurden, werden nun zwei praktische Probleme aus dem Bereich der Ökonomie behandelt. Beide
Beispiele basieren auf dem in der Literatur weit verbreiteten Modell von Lesourne
und Leban [8], welches in Abschnitt 6.1 beschrieben wird. In diesem Kapitel wird
zunächst eine numerische Lösung, inklusive ausführlicher Diskussion des erweiterten
Pontryaginschen Minimumprinzips, eines abgeänderten Modells von Lesourne und
Leban vorgestellt. Die durchgeführte Modifikation war für die vorliegende Arbeit
erforderlich, um ein Problem mit nur linear auftretenden Steuerungen zu erhalten.
Das modifizierte Modell dient in dieser Arbeit vor allem als Beispiel eines ökonomischen Steuerprozesses, bei dem die notwendigen Optimalitätsbedingungen auch
hinreichend sind. Dies wird in Abschnitt 6.5 gezeigt.
6.1 Beschreibung des Modells von Lesourne und
Leban
Betriebswirtschaftlich gesehen kann das Modell von Lesourne und Leban dem Sektor
Unternehmenswachstum: Investition, Finanzierung und Beschäftigung“ zugeordnet
”
werden. Im Vordergrund des Modells steht das Firmenwachstum in einer bestimmten
Planungsperiode [0, tf ] unter Berücksichtigung der Finanz- und Beschäftigungspolitik. Die signifikante Größe des Problems, die sich in der Unternehmensdynamik
niederschlägt, ist die Kapitalstruktur des Unternehmens. Der Kapitalstock K(t)
wird aus den Finanzierungsmitteln Eigenkapital x1 (t) und Fremdkapital x2 (t) gebildet. Als Steuerungsmöglichkeiten stehen den Unternehmenseignern das Beschäftigungsniveau u1 (t), die Investitionen u2 (t) und die Dividendenauszahlung u3 (t) zur
Verfügung. Das Wachstum des Unternehmens wird am diskontierten Zahlungsfluss
der Dividenden gemessen. Das Zielfunktional lautet somit:
Z tf
Maximiere:
e−rt u3 (t)dt.
0
41
6 Das modifizierte Modell von Lesourne und Leban
Die Änderung des Eigenkapitals wird als Differenz zwischen dem mit dem Steuersatz
τ versteuerten Gewinn G und der Dividendenauszahlung u3 bestimmt:
ẋ1 (t) = (1 − τ )G(t) − u3 (t).
Zur Berechnung des reinen Gewinns wird der Erlös, der sich aus der Produktionsmenge F und dem Produktpreis p berechnen lässt, den angefallenen Kosten gegenübergestellt. Dabei wird in dem Modell davon ausgegangen, dass die gesamte
Produktionsmenge F (t) auf dem Markt umgehend absetzbar ist. Die Kosten setzen sich aus Zinsauszahlungen an die Fremdkapitalgeber, Abschreibungen auf das
Kapital und Lohnkosten zusammen. Es gilt also:
G(t) = pF (t) − ωu1 (t) − ρk x2 (t) − δK(t).
Dabei repräsentiert ω die jährliche Lohnrate, ρk den Fremdkapitalzins und δ die
Abschreibungsrate. Als Produktionsfunktion wird die in der Volkswirtschaft weit
verbreitete sublineare Cobb-Douglas-Produktionsfunktion gewählt:
F (t) = α(x1 (t) + x2 (t))α1 u1 (t)α2 ,
α, α1 , α2 > 0 und α1 + α2 < 1.
Die Veränderung des Gesamtkapitals K̇ = ẋ1 + ẋ2 ergibt sich aus der Gleichung:
K̇(t) = ẋ1 (t) + ẋ2 (t) := u3 (t) − δK(t).
Somit gilt für die Fremdkapitaländerung:
ẋ2 (t) = u3 (t) − δK(t) − ẋ1 (t) = u3 (t) − δ(x1 (t) + x2 (t)) − ẋ1 (t).
Von den beiden Zustandsvariablen x1 (t) und x2 (t) wird die Nichtnegativität verlangt.
Außerdem erwarten die Fremdkapitalgeber gewisse Sicherheiten von den Kreditnehmern. Üblicherweise wird von den Kreditgebern ein maximaler Verschuldungsgrad
κ > 0, dessen Höhe von der angestrebten Rendite des Unternehmens abhängt, festgelegt. Somit wird gesichert, dass das maximale Darlehen einen durch den Verschuldungsgrad κ gegebenen Anteil des Eigenkapitals nicht überschreitet. Mathematisch
betrachtet bedeutet das:
x2 (t) ≤ κx1 (t).
Die Randbedingungen sind für die Anfangswerte x1 (0) und x2 (0) gegeben. Da negative Beschäftigung, Investitionsrate sowie negative Dividendenauszahlung realitätsfremd sind, wird verständlicherweise von allen drei Steuerungen gefordert:
0 ≤ u1 (t)
0 ≤ u2 (t)
0 ≤ u3 (t).
42
6 Das modifizierte Modell von Lesourne und Leban
Für die Investitionsrate u2 (t) gilt zusätzlich:
u2 (t) ≤ u2max ,
denn auf einem unvollkommenen Kapitalmarkt1 sind die Investitionsmöglichkeiten
begrenzt.
Insgesamt erhält man ein Problem der Form:
Maximiere
Z
tf
e−rt u3 (t)dt
0
unter
ẋ1 = (1 − τ )(pα(x1 + x2 )α1 u1 α2 − ωu1 − ρk x2 − δ(x1 + x2 )) − u3
ẋ2 = u2 − δ(x1 + x2 ) − ẋ1
x1 (0) = x10 ,
x2 (0) = x20
0 ≤ x2
0 ≤ κx1 − x2
0 ≤ u1
0 ≤ u2 ≤ u2max
0 ≤ u3 .
Man beachte, dass das zeitliche Argument bei den Zustandsvariablen sowie den
Steuerungsvariablen aus Gründen der Vereinfachung und zur besseren Lesbarkeit
weggelassen wurde. Diese Schreibweise wird in diesem Kapitel beibehalten. Die übrigen Größen werden auf dem gesamten Planungszeitraum [0, tf ] als feste Parameter
vorgegeben und sind somit von der Zeit t unabhängig.
1
Die Prämissen für einen vollkommenen Kapitalmarkt (nach [14]) sind:
• es stehen unbeschränkte Kreditaufnahme- und Finanzmittelanlagemöglichkeiten zur
Verfügung,
• keine Differenzierung des Marktes hinsichtlich Eigen- oder Fremdkapitals und unterschiedlicher Bonität der Kunden,
• es herrscht vollständige Markttransparenz,
• es existiert einheitlicher Soll- und Habenzinssatz,
• es gibt keine Steuern und/oder keine Transaktionskosten.
43
6 Das modifizierte Modell von Lesourne und Leban
6.2 Formulierung des modifizierten
Steuerungsproblems
In dem Modell, das im oberen Abschnitt beschrieben wurde, wird das dynamische
System unter anderem auch über die Beschäftigung u1 gesteuert. Diese taucht aber
als klassischer Produktionsfaktor in der Cobb-Douglas-Produktionsfunktion als nicht
lineare Variable auf. Für die vorliegende Arbeit sind jedoch die Probleme mit linear
auftretender Steuerung von besonderem Interesse. Daher ist eine leichte Modifikation des beschriebenen Modells von Lesourne und Leban nötig. Hierfür wird die
Beschäftigung, die zuvor als Steuerungsvariable fungierte, als zusätzliche Zustandsvariable x3 unter Berücksichtigung deren Veränderung in der Dynamik eingeführt.
Auf diese Weise wird auch der Beschäftigungssektor neben dem Kapitalsektor in die
Unternehmensdynamik einbezogen. Außerdem ist die Betrachtung der Beschäftigung
als eine stetige Zustandsgröße viel realitätsnäher. Somit erhält man eine weitere Differentialgleichung:
ẋ3 = u1 ,
mit einem geeigneten Anfangswert x3 (0). Um den Beschäftigungsabbau nicht zu
vernachlässigen, werden für die Steuerung u1 auch negative Werte bis zu einem
bestimmten u1min < 0 zugelassen. Zusätzlich wird der Beschäftigungsaufbau durch
u1max begrenzt. Des Weiteren wird für die Dividendenauszahlung u3 eine obere Grenze u3max gesetzt. Die Beschäftigung x3 darf wiederum aus ökonomischen Gründen
nicht negativ werden. Für die Produktionsfunktion gilt jetzt:
F = α(x1 + x2 )α1 xα3 2 ,
α, α1 , α2 > 0 und α1 + α2 < 1.
Das so entstandene modifizierte Steuerungsproblem in Mayer-Form lautet:
Minimiere:
− x4
unter: ẋ1 = (1 − τ )(pα(x1 + x2 )α1 xα3 2 − ωx3 − ρk x2 − δ(x1 + x2 )) − u3
ẋ2 = u2 − δ(x1 + x2 ) − ẋ1
ẋ3 = u1
ẋ4 = e−rt u3
0 ≤ x2 ,
0 ≤ x3 ,
u1min ≤ u1 ≤ u1max ,
x1 (0) = x10 ,
0 ≤ κx1 − x2
0 ≤ u2 ≤ u2max ,
x2 (0) = x20 ,
0 ≤ u3 ≤ u3max
x3 (0) = x30 ,
x4 (0) = 0.
Für numerische Berechnungen müssen noch konkrete Werte der einzelnen Parameter angegeben werden. Die benötigten Angaben wurden aus [7] entnommen und
44
6 Das modifizierte Modell von Lesourne und Leban
tf
p
κ
ω
δ
τ
α
α1
α2
ρk
r
10
Planungszeitraum
0.05
konstanter Produktpreis
0.8
maximaler Verschuldungsgrad
2.0
jährliche Lohnrate
0.440
Abschreibungsrate
0.5
Steuersatz
100
Effizienzparameter
0.35
Produktionselastizität des Kapitals
0.5 Produktionselastizität der Beschäftigung
0.11
Fremdkapitalzins
0.112
Kalkulationszinssatz
Tabelle 6.1: Liste der gewählten Parameter für modifiziertes Modell
sind in der Tabelle 6.1 erfasst. Die Anfangswerte für x1 (0) und x2 (0), sowie die
Ober- und Untergrenzen für die Steuerungen wurden ebenfalls wie in [7] festgelegt.
Der Anfangswert für die neu eingeführte Zustandsvariable x3 (0), welche für den Lagerbestand steht, wurde letztendlich von der entsprechenden Variable aus dem im
nächsten Kapitel beschriebenen komplexen Unternehmensmodell übernommen. Die
gewählten Werte lauten:
x1 (0) = 100
x2 (0) = 50
x3 (0) = 30
u1min = −10
u1max = 10
u2min = 0
u2max = 100
u3min = 0
u3max = 300.
6.3 Auswertung des Minimumprinzips
Bei dem eben vorgestellten modifizierten Modell von Lesourne und Leban handelt
es sich um einen optimalen Steuerprozess mit drei reinen Zustandsbeschränkungen.
45
6 Das modifizierte Modell von Lesourne und Leban
Während die beiden Nicht-Negativitätsbedingungen,
0 ≤ x2
0 ≤ x3 ,
durch die optimale Trajektorie nicht verletzt werden und somit irrelevant sind, ist
die Beschränkung für den maximalen Verschuldungsgrad,
S(x) = x2 − κx1 ≤ 0
aktiv. Dabei handelt es sich um eine Beschränkung der ersten Ordnung, denn es gilt:
S 1 = ẋ2 − κẋ1
(6.1)
= u2 − δ(x1 + x2 ) − ẋ1 − κẋ1
= u2 − δ(x1 + x2 ) − ẋ1 (1 + κ),
d. h. S 1 ist die erste Ableitung von S, die die Steuerung u explizit enthält.
Zunächst wird die Hamiltonfunktion aufgestellt, wobei angesichts des freien Endzustandes x(tf ), λ0 = 1 gesetzt werden kann.
H = λ1 ((1 − τ )(pα(x1 + x2 )α1 xα3 2 − ωx3 − ρk x2 − δ(x1 + x2 )) − u3 )
+ λ2 (u2 − δ(x1 + x2 ) − ẋ1 ) + λ3 u1 + λ4 e−rt u3 .
Für die erweiterte Hamiltonfunktion folgt mittels des direkten Verfahrens
H̃ = λ1 ((1 − τ )(pα(x1 + x2 )α1 xα3 2 − ωx3 − ρk x2 − δ(x1 + x2 )) − u3 )
+ λ2 (u2 − δ(x1 + x2 ) − ẋ1 ) + λ3 u1 + λ4 e−rt u3 + µ(x2 − κx1 ).
Die adjungierten Differentialgleichungen lauten:
λ̇1 = −(λ1 − λ2 )(1 − τ ) pαα1 (x1 + x2 )α1 −1 xα3 2 − δ − λ2 δ − κµ
λ̇2 = −(λ1 − λ2 )(1 − τ ) pαα1 (x1 + x2 )α1 −1 xα3 2 − ρk − δ − λ2 δ + µ
λ̇3 = −(λ1 − λ2 )(1 − τ ) pαα2 (x1 + x2 )α1 xα3 2 −1 − ω
λ̇4 = 0.
Durch partielle Ableitung der erweiterten Hamiltonfunktion nach den Steuerungen
u1 , u2 , u3 erhält man folgende Schaltfunktionen:
Hu1 = Σ1 = λ3
Hu2 = Σ2 = λ2
Hu3 = Σ3 = λ4 e−rt − λ1 + λ2 .
46
6 Das modifizierte Modell von Lesourne und Leban
Nach der Minimumbedingung des Pontryaginschen Minimumprinzips (??) wird die
erweiterte Hamiltonfunktion durch optimale Steuerungen u1 , u2 , u3 minimiert. Somit
ergibt sich die folgende Struktur für optimale Steuerungen:


, Σi (t) > 0
 uimin
∗
ui (t) =
uimax
, Σi (t) < 0


unbestimmt , Σi (t) = 0



,
i = 1, 2, 3.
(6.2)


Ein Schaltpunkt tk wird durch die Bedingung Σi (tk ) = 0 festgelegt.
Aufgrund des freien Endzustands x(tf ) erhält man aus der Transversalitätsbedingung folgende Randbedingungen für die adjungierten Differentialgleichungen:
λ1 (tf ) = 0
λ2 (tf ) = 0
λ3 (tf ) = 0
(6.3)
λ4 (tf ) = −1.
Man beachte jedoch, dass die Endbedingungen (6.3) nur dann ihre Gültigkeit behalten, wenn die Zustandsbeschränkung am Ende der Planungsperiode inaktiv ist.
D. h. falls gilt:
S(x∗ (tf )) < 0.
Für den Fall S(x∗ (tf )) = 0, welcher bei dem betrachteten Problem tatsächlich auftritt, gilt:
λ1 (tf ) = −κγ
λ2 (tf ) = γ
λ3 (tf ) = 0
(6.4)
λ4 (tf ) = −1,
mit γ ∈ R, γ ≥ 0.
Außerdem gilt nach Komplementaritätsbedingung im Optimum für die Multiplikatorfunktion µ(t):
µ(t) ≥ 0,
µ(t) = 0,
f alls S(x∗ (t)) < 0.
47
6 Das modifizierte Modell von Lesourne und Leban
t
[ 0 , t1
[ t1 , t2
[ t2 , t3
[ t3 , t4
[ t4 , tf
u1
]
]
]
]
]
u2
u3
x2 − κx1 ≤ 0
u1max
u2min
u3max
u1max
u2min
singulär
u1min
u2min
singulär
singulär singulär singulär
singulär
u2min
singulär
n.a
a.
a.
a.
a.
Tabelle 6.2: Optimale Schaltstruktur des modifizierten Problems
t1
t2
t3
t4
0.062 0.9051 1.76 6.57
Tabelle 6.3: Schaltpunkte des modifizierten Problems
6.4 Numerische Ergebnisse
Bei der Erstellung einer numerischen Lösung des oben beschriebenen Modells wurden
zuerst die Fortran-Routine NUDOCCCS und der Optimierungsalgorithmus LOQO
zu Rate gezogen. Doch konnten die beiden Solver das vorliegende Problem nicht
lösen. NUDOCCCS lieferte immerhin einige Ergebnisse, die der später erhaltenen
optimalen Lösung ähnelten. Der Löser LOQO gab dagegen nur Fehlermeldungen
aus, er könne mit den gewählten Anfangswerten nicht rechnen. Auch eine Vorgabe
der Anfangswerte bei der Deklaration der Variablen, die erfahrungsgemäß schon mal
(beim Lösen des komplexen Modells2 ) geholfen hatte, führte nicht zum Ziel. Darauf wurde der Optimierungssolver IPOPT, der sich genau wie LOQO mit AMPL
schneidet und auf dem Innere-Punkte-Verfahren basiert, eingesetzt. Dabei wurde
dieselbe Quelldatei benutzt, die vorher mit LOQO nicht funktionierte. Schließlich
bekam man mithilfe des neu gewählten Solvers eine Lösung, die im nachfolgenden
vorgestellt wird. Die Rechenzeit betrug ca. 296.45 Sekunden, wobei zur Approximation des Zustandes das Euler-Verfahren bei 10000 Diskretisierungspunkten verwendet
wurde.
In der Tabelle (6.2) ist die Schaltstruktur der optimalen Steuerungen zusammengefasst. Die zugehörigen Schaltpunkte können der Tabelle (6.3) entnommen werden.
Die optimalen Zustände und die adjungierten Variablen sind in den Abbildungen
(6.2), (6.3) zu finden. Die Abbildung (6.1) zeigt den Verlauf der optimalen Steuerungen, während in der Abbildung (6.4) die Schaltfunktionen des modifizierten Modells
2
Im Entstehungsprozess dieser Arbeit wurde erst komplexes Unternehmensmodell, welches im
nächsten Kapitel behandelt wird, bearbeitet.
48
6 Das modifizierte Modell von Lesourne und Leban
10
40
8
6
4
30
u_2
u_1
2
0
20
-2
-4
-6
10
-8
-10
0
0
1
2
3
4
5
t
6
7
8
9
10
0
1
2
3
4
5
t
5
t
6
7
8
9
10
6
7
8
9
10
300
270
240
210
u_3
180
150
120
90
60
30
0
0
1
2
3
4
Abbildung 6.1: Die optimalen Steuerungen des modifizierten Modells
dargestellt sind. In der Abbildung (6.5) ist die Multiplikatorfunktion zu sehen.
Zunächst wird überprüft, ob die von dem Programm gelieferte optimale Lösung des
Problems die notwendigen Optimalitätsbedingungen tatsächlich erfüllt. Hierfür wird
jedes Zeitintervall einzeln betrachtet.
1. Zeitintervall [0, t1 ]
Auf dem ersten Intervall [0, t1 ] weisen alle drei Steuerungen eine bang-bang Struktur
auf. Für die Schaltfunktionen gilt hier:
Σ1 (t) < 0,
∀ t ∈ [0, t1 )
Σ2 (t) > 0,
∀ t ∈ [0, t1 )
Σ3 (t) < 0,
∀ t ∈ [0, t1 ).
49
6 Das modifizierte Modell von Lesourne und Leban
70
100
60
50
40
60
x_2
x_1
80
30
40
20
20
10
0
0
0
1
2
3
4
5
t
6
7
8
9
10
0
40
1
2
3
4
5
t
6
7
8
9
10
4
5
t
6
7
8
9
10
160
140
35
120
30
x_4
x_3
100
25
80
60
20
40
15
20
10
0
0
1
2
3
4
5
t
6
7
8
9
10
0
1
2
3
Abbildung 6.2: Die optimalen Trajektorien des modifizierten Modells
Die Steuerung u∗1 und u∗3 nehmen ihren Maximalwert und die Steuerung u∗2 ihren Minimalwert an. In diesem kleinen Zeitraum, der in den Grafen zwar schlecht
zu erkennen ist, aber dennoch vorhanden, findet demnach die maximal mögliche
Ausschüttung der Dividenden statt.
Die Verschuldungsbeschränkung ist auf [0, t1 ] nicht aktiv, d. h. es handelt sich hier
also um ein inneres Teilstück. Die Komplementaritätsbedingung ist mit µ(t) = 0 für
alle t ∈ [0, t1 ) erfüllt.
2. Zeitintervall [t1 , t2 ]
Der Zeitpunkt t1 = 0.062 ist der Eintrittspunkt der Verschuldungsbeschränkung,
welche ab t1 bis zum Ende der Planungsperiode tf = 10 aktiv ist, d. h. es gilt:
x2 − κx1 = 0,
∀ t ∈ [t1 , tf ].
Demnach liegt bei dem gegebenen Problem auf dem Intervall [t1 , tf ] ein Randstück
vor. Man beachte hier insbesondere, dass sich dadurch die Endbedingungen für die
50
0
0.2
-0.2
0.16
{/Symbol l_2^1}
{/Symbol l_1^1}
6 Das modifizierte Modell von Lesourne und Leban
-0.4
-0.6
-0.8
0.12
0.08
0.04
-1
0
0
1
2
3
4
5
t
6
7
8
9
10
0
0.02
1
2
3
4
5
t
6
7
8
9
10
4
5
t
6
7
8
9
10
-1.01
0
-1.005
-0.04
{/Symbol l_3^1}
{/Symbol l_3^1}
-0.02
-0.06
-1
-0.08
-0.1
-0.995
-0.12
-0.14
-0.99
0
1
2
3
4
5
t
6
7
8
9
10
0
1
2
3
Abbildung 6.3: Die optimalen Adjungierten des modifizierten Modells
adjungierten Differentialgleichungen, die man mittels der Transversalitätsbedingung
erhält, ändern. In t1 = 0.062 ändert sich auch das Verhalten der Steuerung u∗3 ,
diese zeigt von da an einen singulären Verlauf. Die erste bzw. die zweite Steuerung
nimmt auf [t1 , t2 ) weiterhin ihre Ober- bzw. ihre Untergrenze an. Die Grafen der
Schaltfunktion (6.4) zeigen, dass die Minimumbedingung auch hier erfüllt wird, denn
es gilt:
Σ1 (t) < 0,
∀ t ∈ [t1 , t2 ),
Σ2 (t) > 0,
∀ t ∈ [t1 , t2 ],
Σ3 (t) = 0,
∀ t ∈ [t1 , tf ].
Des Weiteren sieht man an dem Grafen (6.5), dass die Vorzeichen- und Komplementaritätsbedingung ebenfalls eingehalten werden. Die Multiplikatorfunktion µ(t)
weist folgenden Verlauf auf:
µ(t) = 0,
∀ t ∈ [0, t1 ]
µ(t) > 0,
∀ t ∈ [t1 , tf ].
51
6 Das modifizierte Modell von Lesourne und Leban
0.02
0.2
0
0.16
-0.04
{/Symbol l_2^1}
{/Symbol l_3^1}
-0.02
-0.06
-0.08
0.12
0.08
-0.1
0.04
-0.12
-0.14
0
0
1
2
3
4
5
t
6
7
8
9
10
0
1
2
3
4
5
t
6
7
8
9
10
0
{/Symbol s_1^4}
-0.05
-0.1
-0.15
-0.2
0
1
2
3
4
5
t
6
7
8
9
10
Abbildung 6.4: Die Schaltfunktionen des modifizierten Modells
Mit Hilfe der Minimumbedingung lässt sich die Multiplikatorfunktion berechnen,
denn auf dem gesamten Randstück [t1 , tf ] gilt Σ3 (t) = 0. Daraus folgt unmittelbar,
dass auch die Ableitung der Schaltfunktion auf diesem Stück verschwindet, d. h. es
gilt:
Σ̇3 (t) = λ̇4 e−rt − rλ4 e−rt − λ̇1 + λ̇2 = 0.
Wie man der nachfolgenden Rechnung entnehmen kann, ist der Multiplikator µ in
dem obigen Term enthalten.
⇒ 0 = Σ̇3 (t) = −rλ4 e−rt + (λ1 − λ2 )(1 − τ ) pαα1 (x1 + x2 )α1 −1 xα3 2 − δ − λ2 δ
− κµ − (λ1 − λ2 )(1 − τ ) pαα1 (x1 + x2 )α1 −1 xα3 2 − ρk − δ − λ2 δ + µ
= −rλ4 e−rt − ρk (λ2 − λ1 )(1 − τ ) + (1 + κ)µ.
52
4
4
3.5
3.5
3
3
10^2 x {/Symbol m_1}
10^2 x {/Symbol m_1}
6 Das modifizierte Modell von Lesourne und Leban
2.5
2
1.5
2.5
2
1.5
1
1
0.5
0.5
0
0
0
2
4
6
8
10
0
2
t
4
6
8
10
t
Abbildung 6.5: Multiplikatorfunktion: (links) mittels IPOPT erhaltene µ(t), (rechts)
theoretisch ausgerechnete µ(t)
Durch Auflösen der Gleichung nach µ erhält man schließlich:
⇒ µ(t) =
rλ4 e−rt + ρk (λ2 − λ1 )(1 − τ )
.
(1 + κ)
In dem rechten Grafen der Abbildung (6.5) ist die theoretisch ausgerechnete Multiplikatorfunktion µ(t) auf dem Intervall [t1 , tf ] dargestellt. Diese stimmt auf [t1 , tf ]
exakt mit der, von dem Optimierungssolver IPOPT gelieferten µ(t) überein.
Außerdem lässt sich die optimale Steuerung u∗3 auf dem gesamten Randstück in
Abhängigkeit von x1 , x2 , x3 , u2 bestimmen. Laut (6.1) handelt es sich bei der Verschuldungsbeschränkung um eine Zustandsbeschränkung der Ordnung p = 1. Die
Voraussetzung (3.1.7) ist mit
∂S 1
(x, u) = −(1 − τ )(1 + κ) 6= 0 ∀ t ∈ [t1 , tf ]
∂u3
erfüllt. Somit gilt auf [t1 , tf ] folgendes:
x2 − κx1 = 0
⇒ ẋ2 − κẋ1 = 0
⇒ u2 − δ(x1 + x2 ) − ẋ1 − κẋ1 = 0
⇒ u2 − δ(x1 + x2 ) − ẋ1 (1 + κ) = 0
⇒ −((1 − τ )(pα(x1 + x2 )α1 xα3 2 − ωx3 − ρk x2 − δ(x1 + x2 )) − u3 )(1 + κ) −
−δ(x1 + x2 ) + u2 = 0.
Bedenkt man noch, dass auf dem Randstück x2 = κx1 gilt, so resultiert offensichtlich
daraus:
u2 − δx1 (1 + κ)
. (6.5)
u3 = (1−τ )(pα(x1 (1+κ))α1 x3α2 −ωx3 −ρk κx1 −δx1 (1+κ))−
1+κ
53
6 Das modifizierte Modell von Lesourne und Leban
Die oben ausgerechnete Gleichung für u3 gilt auf dem gesamten Randstück [t1 , tf ].
Durch Einsetzen des optimalen Wertes u∗2 = 0, erhält man auf dem betrachteten
Zeitintervall [t1 , t2 ] folgende Vorschrift für u∗3 :
u∗3 = (1 − τ )(pα(x1 (1 + κ))α1 xα3 2 − ωx3 − ρk κx1 − δx1 (1 + κ)) + δx1 .
(6.6)
3. Zeitintervall [t2 , t3 ]
Im Zeitpunkt t2 = 0.9051 springt der Wert der Steuerung u∗1 von u1max auf u1min .
Für den Schaltpunkt t2 gilt:
Σ1 (t2 ) = 0,
und die Schaltfunktion der ersten Steuerung nimmt auf dem ganzen Intervall nur
streng positive Werte an,
Σ1 (t) > 0 ∀ t ∈ (t2 , t3 ).
4. Zeitintervall [t3 , t4 ]
Auf diesem Zeitintervall verhalten sich alle drei Steuerungen singulär, was durch den
Verlauf der Schaltfunktionen, wie man den Grafen der Abbildung (6.4) entnehmen
kann, bestätitgt wird:
Σ1 (t) = 0
Σ2 (t) = 0
Σ3 (t) = 0.
Da es sich bei dem betrachteten Intervall immer noch um einen Randstück handelt,
bleibt die für die Steuerung u3 berechnete Vorschrift auch hier erhalten. Es müssen
nur noch die Steuerungen u1 und u2 bestimmt werden. Laut Kapitel 2.4 kann der
Verlauf einer singulären Steuerung in einigen Fällen mittels der Schaltfunktion ausgerechnet werden. Dazu wird die Schaltfunktion solange nach der Zeit t differenziert
bis die gesuchte Steuerung in der Ableitung auftaucht. Bei dem gegebenen Problem
treten die benötigten Steuerungen schon in der zweiten Ableitung auf. Es gilt hier:
Σ1 (t) = 0 ⇒ Σ̇1 (t) = λ̇3 = 0
⇒
Σ̈1 (t) = λ̈3 = 0
Σ2 (t) = 0 ⇒ Σ̇2 (t) = λ̇2 = 0
⇒
Σ̈2 (t) = λ̈2 = 0,
54
6 Das modifizierte Modell von Lesourne und Leban
mit
Σ̈1 = (1 − τ )[((λ2 − λ1 )(1 − τ )ρk + µ(1 + κ)) pαα2 (x1 + x2 )α1 x3α2 −1 − ω
α1 (u2 − δ(x1 + x2 )) (α2 − 1)u1
+ (λ2 − λ1 )pα2 F (
+
)]
(x1 + x2 )x3
x23
Σ̈2 = (1 − τ )[((λ2 − λ1 )(1 − τ )ρk + µ(1 + κ))(pαα1 (x1 + x2 )α1 −1 xα3 2 − ρk − δ)
α2 u1
(α1 − 1)(u2 − δ(x1 + x2 ))
+
)]
+ (λ2 − λ1 )pα1 F (
2
(x1 + x2 )
(x1 + x2 )x3
+ δ((λ1 − λ2 )(1 − τ ) pαα1 (x1 + x2 )α1 −1 xα3 2 − ρk − δ − λ2 δ + µ) + µ̇.
Dabei stehen G bzw. F für die Gewinnfunktion bzw. die Produktionsfunktion, die
in dem vorliegenden Beispiel folgendermaßen gewählt wurden3 :
G = pF − ωx3 − ρk x2 − δ(x1 + x2 )
F = pα(x1 + x2 )α1 xα3 2 .
Nach einigen Umformulierungen der beiden Gleichungen erhält man ein lineares
(2 × 2) Gleichungssystem der Form:
a11 u1 + a12 u2 = b1
a21 u1 + a22 u2 = b2
mit den Koeffizienten
b1 =
b2 =
−
+
a11 =
a12 =
a21 =
a22 =
((λ1 − λ2 )(1 − τ )ρk + µ(1 + κ)) pαα2 (x1 + x2 )α1 x3α2 −1 − ω
δα1
+
α2 pF (λ2 − λ1 )
x3
α1 −1 α2
δ((λ2 − λ1 )(1 − τ ) [pαα1 (x1 + x2 )
x3 − ρk − δ − λ2 δ + µ) + µ̇]
α1 pF (λ2 − λ1 )(1 − τ )
((λ2 − λ1 )(1 − τ )ρk + µ(1 + κ))(pαα1 (x1 + x2 )α1 −1 xα3 2 − ρk − δ)
α1 pF (λ2 − λ1 )
δ(α1 − 1)
(x1 + x2 )
α2 − 1
x23
α1
(x1 + x2 )x3
α2
(x1 + x2 )x3
α1 − 1
.
(x1 + x2 )2
Unter Zuhilfenahme des Gauß-Eliminationsverfahrens ergibt sich folgende Lösung:
3
siehe Abschnitt (6.2)
55
6 Das modifizierte Modell von Lesourne und Leban
u∗1 =
u∗2 =
b1 − a12 u2
a11
21
b2 − aa11
b1
a22 −
(6.7)
.
a21
a
a11 12
(6.8)
Man beachte, dass in dem Term b2 sowohl der Multiplikator µ als auch dessen Ableitung,
−r2 λ4 e−rt + ρk (1 − τ ) [(λ2 − λ1 )(1 − τ )ρk + µ(1 + κ)]
,
(1 + κ)
auftauchen. Beide enthalten keine Steuerungsvariablen.
µ̇ =
5. Zeitintervall [t4 , tf ]
Auf dem letzten Intervall springt die Steuerung u∗2 im Schaltpunkt t4 = 6.57 wiederum auf ihren Minimalwert. Es gilt:
Σ2 (t4 ) = 0
Σ2 (t) > 0 ∀ t ∈ (t4 , tf ].
Die Steuerung u∗1 und u∗3 weisen weiterhin einen singulären Verlauf auf. Die beiden
Schaltfunktionen verschwinden auch auf dem letzten Zeitintervall:
Σ1 (t) = 0 ∀ t ∈ [t4 , tf ]
Σ3 (t) = 0 ∀ t ∈ [t4 , tf ].
Für die optimale Steuerung u∗3 gilt weiterhin die Vorschrift (6.5). Die Berechnung
der Steuerung u∗1 erfolgt genau wie im 4. Zeitintervall, wobei in die Gleichung (6.7)
für die Steuerung u∗2 der neue optimale Wert u∗2 = 0 eingesetzt wird. Demnach sieht
die u∗1 auf [t4 , tf ] folgendermaßen aus:
b1
.
(6.9)
a11
In den obigen Ausführungen wurde nun gezeigt, dass sowohl die Minimumbedingung
als auch die Vorzeichen- Komplementaritätsbedingung überall eingehalten werden.
Es bleibt also nur noch die Transversalitätsbedingung (6.4) zu prüfen. Hierfür werden die Werte der adjungierten Variablen an den Grafen der Abbildung (6.3) im
Endzeitpunkt tf = 10 abgelesen, diese lauten:
u∗1 =
λ1 (tf ) = −0.145,
λ2 (tf ) = 0.181,
λ3 (tf ) = 0,
λ4 (tf ) = −1.
Somit ist auch die Transversalitätsbedingung mit γ = 0.181 erfüllt.
Die von dem Optimierungsalgorithmus IPOPT gelieferte Lösung genügt also auf der
ganzen Planungsperiode [0, tf ] den notwendigen Optimalitätsbedingungen.
56
6 Das modifizierte Modell von Lesourne und Leban
6.5 Überprüfung der hinreichenden
Optimalitätsbedingungen
Um zu zeigen, dass die notwendigen Optimalitätsbedingungen auch hinreichend sind,
müssen die Voraussetzungen von Satz (4.4.1) nachgeprüft werden. Die ersten drei
Bedingungen sind trivialerweise erfüllt, denn es gilt:
1. g(x) ist als eine lineare Funktion konvex,
2. ψ(x) = 0,
3. S(x) = x2 − κx1 ist ebenfalls linear.
Es bleibt noch zu zeigen, dass die minimierte Hamiltonfunktion konvex in x ist, bzw.
gemäß Bemerkung (4.3.2), dass die Hamiltonfunktion konvex in x und u ist.
Die Hamiltonfunktion zu dem modifizierten Modell von Lesourne und Leban lautet:
H = (λ1 − λ2 ) ((1 − τ )(pα(x1 + x2 )α1 xα3 2 − ωx3 − ρk x2 − δ(x1 + x2 )) − u3 )
+ λ2 (u2 − δ(x1 + x2 )) + λ3 u1 + λ4 e−rt u3 .
Beim näheren Betrachten der obigen Funktion fällt auf, dass sowohl x als auch u
mit der Ausnahme des ersten Terms
T := (λ1 − λ2 )(1 − τ )pα(x1 + x2 )α1 xα3 2
linear auftreten. Nach Satz (4.2.9) ist eine positive Linearkombination konvexer
Funktionen wiederum konvex. Demnach ist die Hamiltonfunktion konvex, falls die
Funktion T auf ihrem Definitionsbereich konvex ist. Dies wird anhand folgender
Überlegungen nachgewiesen.
Zuerst betrachte man die Funktion F1 , die durch
F1 := (x1 + x2 )α1 xα3 2
definiert sei. Die Hesse-Matrix der Funktion F1 lautet:

α
α
(x1 +x2 )α1 x3 2
(x +x2 )α1 x3 2
α
(α
−
1)
α1 (α1 − 1) 1(x1 +x
1
1
2
2
)
(x
+x
)
2
1
2
α
α

(x1 +x2 )α1 x3 2
(x1 +x2 )α1 x3 2
∇2 F1 = 
α
(α
−
1)
α
(α
−
1)
1
1
(x1 +x2 )2
(x1 +x2 )2
 1 1
α
α
(x1 +x2 )α1 x3 2
(x1 +x2 )α1 x3 2
α1 α2 (x1 +x2 )x2
α1 α2 (x1 +x2 )x2
Oder mit den Bezeichnungen:
(x1 + x2 )α1 xα3 2
(x1 + x2 )2
(x1 + x2 )α1 xα3 2
b := α1 α2
(x1 + x2 )x2
(x1 + x2 )α1 xα3 2
c := α2 (α2 − 1)
x22
a := α1 (α1 − 1)
57
α
(x1 +x2 )α1 x3 2
(x1 +x2 )x2
α
(x1 +x2 )α1 x3 2
α1 α2 (x1 +x2 )x2
α
(x +x )α1 x 2
α2 (α2 − 1) 1 x2 2 3
2
α1 α2


.

6 Das modifizierte Modell von Lesourne und Leban


a a b


∇2 F1 :=  a a b  .
b b c
Für die Trajektorien x1 (t), x2 (t), x3 (t) gilt für alle t ∈ [0, tf ] die Nichtnegativitätsbedingung. Aufgrund der Wahl der Parameter α1 = 0.35 und α2 = 0.5 gilt:
α1 − 1 < 0
und
α2 − 1 < 0.
Somit ergeben sich für die Komponenten der Hesse-Matrix der F1 Funktion folgende
Abschätzungen:
a < 0
b > 0
c < 0.
Da die Matrix ∇2 F1 symmetrisch ist, kann zur Überprüfung der Definitheit dieser Matrix das Eigenwertkriterium (4.2.14) benutzt werden. Man rechnet für die
Eigenwerte EW von ∇2 F1 leicht nach:
EW1 = 0
p
(2a − c)2 + 8b2
2a + c
−
EW2 =
2
2
p
(2a − c)2 + 8b2
2a + c
+
.
EW3 =
2
2
Aufgrund der Negativität von a und c folgt für EW2 unmittelbar EW2 ≤ 0. Für
EW3 gilt:
p
(2a − c)2 + 8b2
2a + c
EW3 =
+
≤0
2
p 2
(2a − c)2 + 8b2
2a + c
)≥
⇔ −(
2
2
p
⇔ −(2a + c) ≥ (2a − c)2 + 8b2
⇔ (2a + c)2 ≥ (2a − c)2 + 8b2
⇔ (2a + c)2 ≥ (2a + c)2 − 8ac + 8b2
⇔ 0 ≥ −8ac + 8b2
⇔ 0 ≥ −ac + b2 .
Die letzte Ungleichung wird mit den gewählten Parametern erfüllt, denn es gilt:
F1
−ac + b2 = −α1 (α1 − 1)α2 (α2 − 1) + α12 α22
{z
} (x1 + x2 )2 x23
|
{z
}
|
:=−0.02625
≥0
58
6 Das modifizierte Modell von Lesourne und Leban
Die Eigenwerte EW der Hesse-Matrix sind also kleiner bzw. gleich Null. Damit ist
die Funktion F1 laut Satz (4.2.14) konkav in x.
Des Weiteren ist die Differenz:
(λ1 − λ2 )
wegen λ1 < 0, λ2 ≥ 0 auf dem gesamten Zeitintervall [0, tf ] negativ. Die Parameter
(1 − τ ), p und α sind positive Konstanten. Demnach ist T konvex in x. Somit ist die
Hamiltonfunktion konvex in x und u.
Alle Voraussetzungen von Satz (4.4.1) sind erfüllt und ein Paar (x∗ , u∗ ), welches
den notwendigen Bedingungen des erweiterten Pontryaginschen Minimumprinzips
genügt, ist optimal.
Interpretation der Ergebnisse
Die erhaltene Lösung des modifizierten Modells von Lesourne und Leban zeigt, dass
bei Anwendung der optimalen Strategie die Verschuldungsbeschränkung sehr früh
aktiv wird. Der Anfangsbestand von 100 GE an Eigenkapital wird schnell abgebaut
und der Fremdkapitalbestand rasch aufgebaut, bis man bei maximaler Fremdkapitalaufnahme von x2 = κx1 angelangt ist. Außerdem erfolgt in der Zeit maximale Auszahlung der Dividenden, u∗3 = u3max . Danach (im Zeitraum [t2 , t3 ]) wird der gesamte
Kapitalstock x1 + x2 des Unternehmens solange verringert bis die optimalen Werte
von ungefähr 39 GE an x1 und 31 GE an x2 erreicht sind. Dieses Verhalten weist eindeutig darauf hin, dass die gewählten Anfangswerte der beiden Kapitalbestände viel
zu hoch sind. In den ersten zwei Jahren (bis t3 = 1.76) werden keine Investitionen
getätigt (u∗2 = u2min = 0). Es findet eine sehr hohe Dividendenausschüttung statt
und die anfängliche Fremdkapitalaufnahme kann damit erklärt werden, dass es für
die Eigenkapitalgeber stets von Vorteil ist, die maximale Verschuldungsmöglichkeit
auszuschöpfen. Denn deren Kalkulationszinssatz r = 0.112 liegt deutlich über dem
Fremdkapitalzins ρk = 0.11. Demnach ist es für die Unternehmenseigner günstiger“
”
Fremdkapital aufzunehmen als Eigenkapital zu verarbeiten. Genau dies begründet
auch das Aktivsein der Verschuldungsbeschränkung (fast) auf der ganzen Planungsperiode.
Sobald der optimale Kapitalstock erreicht ist, werden alle Größen auf einem konstanten Wert gehalten. Auch an der Anzahl der Beschäftigten x2 ändert sich in dieser
Zeitspanne [t3 , t4 ] nichts. Es finden fortwährend gleich bleibende Investitionen von
annährend 30.8 GE sowie Dividendenauszahlungen in Höhe von ca. 13 GE statt.
Schließlich kann gegen Ende der Planungsperiode wiederum ein deutlicher Abbau
an allen dem Unternehmen zur Verfügung stehenden Kapitalbeständen beobachtet werden. Die beiden Zustandsvariablen x1 , x2 fallen monoton. Das Verhalten der
59
6 Das modifizierte Modell von Lesourne und Leban
optimalen Steuerungen und Trajektorien auf [t4 , tf ] hängt offensichtlich mit dem
anvisierten Ziel, die diskontierten Dividendenauszahlungen in tf zu maximieren, zusammen. Die Investitionsrate u∗2 springt in t4 erneut auf Null, wo sie auch auf dem
letzten Zeitintervall [t4 , tf ] bleibt. Außerdem nimmt die Beschäftigungsänderung u∗1
negative Werte an, d. h. die Anzahl der Arbeitskräfte wird reduziert. Dies sieht man
selbstverständlich auch an dem Grafen der optimalen Beschäftigung x2 .
Der Wert des betragsmäßig zu minimierenden Zielfunktionswerts liegt bei |148.06047|
GE.
60
7 Ein komplexes
Unternehmensmodell
In diesem Kapitel geht es um die Lösung eines komplexen Unternehmensmodells,
welches von B. Koslik in [7] aufgestellt wurde. Dabei handelt es sich um ein ökonomisches Modell mit vier linear auftretenden Steuerungen, sieben Zustandsvariablen
und zwei aktiven Zustandsbeschränkungen.
Bei der Modellierung des komplexen Unternehmensproblems war man bemüht, ausgehend von dem Beispiel von Lesourne und Leban, einen optimalen Steuerprozess
aufzustellen, welcher die realen wirtschaftlichen Vorgänge möglichst gut abbildet.
Dabei wurde das ursprüngliche Modell, das nur die Kapitalstruktur eines Unternehmens einbezieht, um die Größen aus dem Beschäftigungs- und Produktionsbereich
erweitert. Zusätzlich wurden die konjunkturellen Schwankungen in den Zinssätzen
und in der Inflationsrate berücksichtigt. Das so entstandene sehr realitätsnahe Modell erlaubt die Wiedergabe und Erklärung bekannter realer Phänomene.
In der Diplomarbeit von B. Koslik wurden zur Vermeidung von Oszillationen die
wirksamen Zustandsbeschränkungen in härtere Steuerungsbeschränkungen transformiert. Hier aber wird komplexes Unternehmensmodell unter Berücksichtigung der
beiden reinen Zustandsbeschränkungen behandelt. Außerdem wird anstatt konstanter Lohnkosten mit im laufe der Zeit steigenden Lohnkosten gerechnet.
In dieser Arbeit werden erst die Lösungen des komplexen Modells bei variierendem
sowie bei konstantem Produktpreis vorgestellt und miteinander verglichen. Anschließend wird am Fall des variierenden Preises gezeigt, dass sich bei einer Verdoppelung
der Planungsperiode an dem optimalen Verhalten nur wenig ändert.
7.1 Beschreibung des komplexen
Unternehmensmodells
In diesem Abschnitt werden zunächst die wichtigsten Erweiterungen von dem Modell von Lesourne und Leban auf komplexes Unternehmensmodell kurz erläutert.
Da es sehr unwahrscheinlich ist, dass ein Unternehmen seine gesamten Produkti61
7 Ein komplexes Unternehmensmodell
onsgüter sofort auf dem Markt absetzen kann, wird in dem komplexen Problem
die Möglichkeit der Lagerhaltung der produzierten Güter berücksichtigt. Der Lagerbestand x1 (t) kann durch die neue Steuerungsvariable u1 (t), die Lageränderung,
organisiert werden:
ẋ1 (t) = u1 (t).
Für den Lagerbestand x1 (t) werden minimaler x1min und maximaler Wert x1max
eingeführt. Denn um eventuellen Engpässen bei der Nachfrage entgegen zu steuern,
muss ein Mindestbestand definiert werden. Zudem kann nur eine begrenzte Menge
an Waren deponiert werden.
Des Weiteren geht die Beschäftigung x2 (t) wie schon im modifizierten Modell in das
dynamische System als eine Zustandsvariable, die über die Beschäftigungsänderung
u2 (t) gesteuert wird, ein:
ẋ2 (t) = u2 (t).
Einen großen Vorteil des komplexen Unternehmensmodells bildet die genauere Differenzierung im Finanzierungsbereich. So wird hier, im Gegensatz zu dem Ursprungsmodell, zwischen der Fremdkapitaländerung u3 (t) und der Eigenkapitaländerung
u4 (t) als Steuerungsmaßnahmen des Geldflusses unterschieden. Die Dividendenauszahlung ist trivialerweise in der Eigenkapitaländerung enthalten. Zudem beinhaltet
der Zustandsvektor die neuen Größen: alternative (sichere) Anlagen x5 (t) und Risikozahlung x6 (t). Während durch die Fremdkapitaländerung der Aufbau/Abbau
(u3 (t) > 0/u3 (t) < 0) des Fremdkapitalbestandes x3 (t) geregelt wird, wird mittels
der neuen Steuerung, Eigenkapitaländerung, das Eigenkapital x4 (t) auf die Investitionen (u4 (t) > 0) in das eigene Unternehmen oder in die alternativen Anlagen
(u4 (t) < 0) unterteilt. Die Entwicklung der vier Kapitalgrößen unterliegt der folgenden Dynamik:
ẋ3 (t) = u3 (t)
ẋ4 (t) = u4 (t) + (1 − τ )(G(t) − ρr (t)x4 (t))
ẋ5 (t) = −u4 + (1 − τ )ρm (t)x5 (t)
ẋ6 (t) = (1 − τ )ρr (t)x4 (t).
Dabei ist G(t) die Gewinnfunktion des Unternehmens mit
G(t) =
1
((p(t)(F (t) − u1 (t)) − σx1 (t) − ωx2 (t)) − ρk (t)x3 (t) − δ(x3 (t) + x4 (t))
x7 (t)
und F (t) die Cobb-Douglas-Produktionsfunktion
F = α(x3 (t) + x4 (t))α1 xα2 2 (t),
α, α1 , α2 > 0
62
α1 + α2 < 1.
7 Ein komplexes Unternehmensmodell
2.45
2.4
2.35
2.3
2.25
2.2
2.15
2.1
2.05
2
0
1
2
3
4
5
6
7
8
9
10
Abbildung 7.1: Die steigende Lohnkostenfunktion
Durch σ werden die jährlichen Lagerhaltungskosten pro aufbewahrte Einheit gegeben und durch ω die jährliche Lohnrate. δ steht für die Abschreibungsrate auf das
Kapital und τ für den Steuersatz. Mit ρk wird der Fremdkapitalzins, mit ρm der
Geldmarktzins und mit ρr die Risikoversicherung der Eigenkapitalgeber bezeichnet.
Schließlich sind α, α1 , α2 produktionsspezifische Parameter und p der Preis, zu dem
die Ware auf dem Markt abgesetzt wird.
Für numerische Berechnungen müssen für alle diese Parameter konkrete Werte vorgegeben werden. Dabei gilt, je realitätsnäher diese gewählt werden, desto realitätsnäher
und aussagekräftiger sind die Ergebnisse. Aus diesem Grunde wurden bei der Modellierung des vorliegenden Beispiels für den Fremdkapitalzinssatz und den Geldmarktzinssatz reale ökonomische Werte eingesetzt. Diese wurden durch trigonometrische
Funktionen approximiert. Bei der ersten Lösung des Problems in der Diplomarbeit
von B. Koslik wurden die übrigen Parameter, um das Problem nicht zu komplex
zu gestalten, auf der ganzen Planungsperiode als konstante Größen gesetzt. Dies ist
jedoch nicht sehr wirklichkeitsnahe. Deswegen wird z. B. in der später erschienen
Publikation [18] von S. Winderl und B. Naumer dieses komplexe Unternehmensmodell mit einer variierenden Preisfunktion p(t) bearbeitet.
Um das Modell weiter den herrschenden Marktverhältnissen anzupassen, wird in
dieser Arbeit statt konstanter Lohnkosten ω = 2.0 eine steigende Lohnkostenfunktion eingeführt. Diese soll sich gemäß der folgenden exponentiellen Funktion, die sich
durch strenges monotones Wachstum auszeichnet, entwickeln:
ω(t) = 2.0 exp(0.02t).
Für alle anderen Parameter werden die Werte aus [7] bzw. [18] übernommen. Diese sind in der Tabelle (7.1) zusammengefasst. Dabei werden in den nachfolgenden
Abschnitten die Lösungen für den Fall der konstanten Preisfunktion p1 (t) ≡ 0.05
und der variierenden Preisfunktion p2 (t) = 0.05 + 0.01 sin(kp − π2 ) bei steigenden
63
7 Ein komplexes Unternehmensmodell
Lohnkosten diskutiert. Zunächst soll jedoch das Modell weiter beschrieben werden.
Ein großer Nachteil des Modells von Lesourne und Leban ist, dass die Inflation
vernachlässigt wird. Im komplexen Unternehmensmodell dagegen werden die permanenten Schwankungen des Marktes mit einkalkuliert. Dazu wird die Diskontierungsfunktion, die in der Wirtschaft folgendermaßen definiert ist,
x7 (t) =
1
,
(1 + i)t
x7 (0) = 1,
als zusätzliche Zustandsvariable, um die zeitabhängige Inflationsrate zu ermöglichen,
eingeführt. Nach der Definition des Differenzquotients gilt
x7 (t + dt) − x7 (t)
dt→0
dt
x˙7 = lim
und wegen
x7 (t + dt) = (1 + i)−(t+dt) =
= x7 (t)(1 + i)−dt =
dt(dt + 1) 2 dt(dt + 1)(dt + 2) 3
·i −
· i + ... =
= x7 (t) 1 − dt · i +
2!
3!
i2 i3
2
= x7 (t) 1 − dt i − + − . . . + O(dt ) =
2
3
= x7 (t) − dt · x7 (t) ln(1 + i) + O(dt2 ),
da − 1 < i ≤ 1
folgt für dt → 0
ẋ7 (t) = −x7 (t)ln(1 + i(t)).
Als neue zu maximierende Größe wird der Gewinn der Eigenkapitalgeber am Ende
des Planungszeitraumes gesetzt. Dieser entspricht der Summe aus dem Eigenkapital, den sicheren Anlagen und dem besteuerten Verkaufswert des Lagerbestandes,
bezogen auf den Endzeitpunkt tf :
x4 (tf ) + x5 (tf ) + (1 − τ )p
x1 (tf )
.
x7 (tf )
Alle vier Steuerungen des komplexen Unternehmensmodells sind sowohl nach unten
als auch nach oben begrenzt. Denn unbeschränkte Lager, - Beschäftigungs, - Fremdkapital, - Eigenkapitaländerung sind realitätsfremd. An alle Zustandsvariablen wird
erneut die Nicht-Negativitätsforderung gestellt. Außerdem wird die Beschränkung
des maximalen Verschuldungsgrades
κx4 (t) − x3 (t) ≥ 0
aus dem Modell von Lesourne und Leban übernommen.
64
7 Ein komplexes Unternehmensmodell
Risikozahlung
x6
M
A
u4
Eigenkapital
x4
u3
Sichere Anlagen
x5
Fremdkapital
x3
R
Produktion
F (x2 , x3 , x4 )
u1
K
T
u2
Lagerbestand
x1
Beschäftigung
x2
Abbildung 7.2: Veranschaulichung des komplexen Unternehmensmodells
65
7 Ein komplexes Unternehmensmodell
7.2 Formulierung des komplexen Steuerungsproblems
Mit den Bezeichnungen
x1 (t) : Lagerbestand
x2 (t) : Beschäftigung
x3 (t) : Fremdkapital
x4 (t) : Eigenkapital
x5 (t) : sichere Anlagen
x6 (t) : Risikozahlung
x7 (t) : Diskontierungsfunktion
u1 (t) : Lagerbestandsänderung
u2 (t) : Beschäftigungsänderung
u3 (t) : Fremdkapitaländerung
u4 (t) : Eigenkapitaländerung
für den Zustandsvektor
x(t)T = (x1 (t), x2 (t), x3 (t), x4 (t), x5 (t), x6 (t), x7 (t))
und die Steuerfunkftion
u(t)T = (u1 (t), u2 (t), u3 (t), u4 (t))
kann nun das komplexe Unternehmensmodell folgendermaßen formuliert werden:
Minimiere:
x1 (tf )
− x4 (tf ) + x5 (tf ) + (1 − τ )p
x7 (tf )
unter:
ẋ1 = u1
ẋ2 = u2
ẋ3 = u3
ẋ4 = u4 + (1 − τ )(G − ρr (t)x4 )
ẋ5 = −u4 + (1 − τ )ρm (t)x5
ẋ6 = (1 − τ )ρr (t)x4
ẋ7 = −x7 ln(1 + i(t))
mit der Gewinnfunktion
G(t) =
1
((p(t)(F − u1 ) − σx1 − ω(t)x2 ) − ρk (t)x3 − δ(x3 + x4 )
x7
66
7 Ein komplexes Unternehmensmodell
und der Cobb-Douglas-Produktionsfunktion
F = α(x3 + x4 )α1 xα2 2 ,
α, α1 , α2 > 0
α1 + α2 < 1
Steuerbeschränkungen:
−100 ≤ u1 ≤ 100
−10 ≤ u2 ≤ 10
−100 ≤ u3 ≤ 100
−100 ≤ u4 ≤ 100
Zustandsbeschränkungen:
50 := x1min ≤
x1
0≤
x2
0≤
x3
0≤
x5
0≤
x6
0≤
x7
≤ x1max := 200
0 ≤ κx4 − x3
Randbedingungen:
x1 (0) = 100 , x2 (0) = 30
x3 (0) = 50 , x4 (0) = 100
x5 (0) = 100 , x6 (0) = 0
x7 (0) = 1
Die Bedeutung der Parameter und die in dieser Arbeit verwendeten Werte sind
der Tabelle (7.1) zu entnehmen. Zudem beachte man bei der Schreibweise des optimalen Steuerprozesses, dass die Zustandsvariablen, die Steuerungsvariablen sowie
die Gewinn- und die Produktionsfunktion von der Zeit t abhängen. Dies wird jedoch aus Gründen der besseren Lesbarkeit im weiteren Verlauf der Arbeit nicht
explizit erwähnt. Um Verwirrungen zu vermeiden, wird bei den übrigen ökonomischen Größen, falls diese mit der Zeit t variieren (z. B. die Umlaufrendite), die
Zeitabhängigkeit ausdrücklich genannt.
67
7 Ein komplexes Unternehmensmodell
tf
p1
p2
κ
ω
δ
τ
σ
α
α1
α2
kl
kp (t)
10
0.05
0.05 + 0.01 sin(kp − π2 )
0.8
2.0 exp(0.02t)
0.322
0.5
0.01
100
0.35
0.5
8
π
+ 2π
·t
2
kl
Planungszeitraum
konstanter Produktpreis
variierender Produktpreis
maximaler Verschuldungsgrad
jährliche Lohnrate
Abschreibungsrate 2
Steuersatz
Lagerhaltungskosten
Effizienzparameter
Produktionselastizität des Kapitals
Produktionselastizität der Arbeit
Konjukturzykluslänge
Konjukturposition
i(t)
ρk (t)
ρm (t)
ρr (t)
0.019 + 0.029 sin kp (t)
0.110 + 0.030 sin kp (t)
0.074 + 0.018 sin kp (t)
ρk (t) − 0.05
Inflationsrate
Fremdkapitalzins
Geldmarktzins
Risikoversicherung für risikoscheue EKG.
Tabelle 7.1: Liste der Parameter des komplexen Unternehmensmodells
7.3 Auswertung des erweiterten Minimumprinzips
Bevor in den nachfolgenden Abschnitten die Lösungen des komplexen Unternehmensmodells für verschiedene Parameter vorgestellt und ausdiskutiert werden, werden hier vorab die notwendigen Optimalitätsbedingungen für das vorliegende Beispiel aufgestellt. Zur Behandlung der Randstücke wird die direkte Methode verwendet.
Die Hamilton-Funktion des betrachteten Problems lautet:
λ4 (1 − τ )
(pα(x3 + x4 )α1 xα2 2 − pu1 − x1 σ − x2 ω)
H = λ 1 u1 + λ 2 u2 + λ 3 u3 + λ 4 u4 +
x7
− λ4 (1 − τ ) (x3 (ρk (t) + δ) − x4 (ρr (t) + δ)) − λ5 (u4 − x5 (1 − τ )ρm (t))
+ λ6 (1 − τ )ρr (t)x4 − λ7 x7 ln(1 + i(t)).
An die Variablen des komplexen Unternehmensmodells werden mehrere Zustandsbeschränkungen gestellt (siehe Abschnitt 7.2), doch nur die Beschränkungen des
maximalen Verschuldungsgrades
S1 := x3 − κx4 ≤ 0
68
(7.1)
7 Ein komplexes Unternehmensmodell
und des minimalen Lagerbestandes
S2 = 50 − x1 ≤ 0
(7.2)
werden aktiv. Somit können alle anderen außer Acht gelassen werden. Beide Beschränkungen sind von der Ordnung p = 1. Denn für die Verschuldungsbeschränkung
gilt:
S11 = x˙3 − κẋ4
(7.3)
= u3 − κ(u4 + (1 − τ )(G − ρr (t)x4 )),
und für den minimalen Lagerbestand egibt sich:
S21 = −ẋ1 = −u1 .
(7.4)
In beiden Fällen tauchen die Steuerungsvariablen schon in der ersten Ableitung
explizit auf.
Für die erweiterte Hamiltonfunktion ergibt sich:
λ4 (1 − τ )
(pα(x3 + x4 )α1 xα2 2 − pu1
x7
− x1 σ − x2 ω) − λ4 (1 − τ ) (x3 (ρk (t) + δ) − x4 (ρr (t) + δ)))
H̃ = u1 λ1 + u2 λ2 + u3 λ3 + u4 λ4 +
− λ5 (u4 − x5 (1 − τ )ρm (t)) + x4 λ6 (1 − τ )ρr (t)
− x7 λ7 ln(1 + i(t)) + µ1 (x3 − κx4 ) + µ2 (50 − x1 ).
Die adjungierten Differentialgleichungen für den zustandsbeschränkten Steuerprozess lauten:
λ4 (1 − τ )σ
− µ2
x7
α2 λ4 (1 − τ )
α1 x 2
=
ω − pαα2 (x3 + x4 )
x7
x2
p
(x3 + x4 )α1 α2
= λ4 (1 − τ ) ρk (t) + δ − αα1
+ µ1
x
x7
(x3 + x4 ) 2
(x3 + x4 )α1 α2
p
− κµ1
x
= (1 − τ ) λ4 (ρr (t) + δ) − λ6 ρr (t) − λ4 αα1
x7
(x3 + x4 ) 2
λ̇1 =
λ̇2
λ̇3
λ̇4
λ̇5 = −λ5 (1 − τ )ρm (t)
λ̇6 = 0
λ̇7 = λ7 ln(1 + i(t)) +
λ4 (1 − τ )
(pF − pu1 − x1 σ − x2 ω) .
x27
69
7 Ein komplexes Unternehmensmodell
Zudem ergeben sich durch partielle Differentation von H̃ nach u folgende Schaltfunktionen:
Σ1 (t) = λ1 −
(1 − τ )λ4 p
x7
Σ2 (t) = λ2
Σ3 (t) = λ3
Σ4 (t) = λ4 − λ5 .
Nach dem Minimumprinzip wird die erweiterte Hamiltonfunktion durch die Steuerung u minimiert, d. h. für die optimalen Steuerungen des komplexen Unternehmensmodell gilt:



, Σi (t) > 0 
 uimin

∗
ui (t) =
i = 1, 2, 3, 4.
(7.5)
uimax
, Σi (t) < 0 ,




unbestimmt , Σi (t) = 0
Ein Schaltpunkt tk wird durch die Bedingung Σi (tk ) = 0 festgelegt.
Die beiden Multiplikatorfunktionen µ1 (t) und µ2 (t) müssen die Vorzeichen-/Komplementaritätsbedingung erfüllen:
µ1 (t) ≥ 0;
µ1 (t) ≡ 0,
f alls S1 (x∗ (t)) < 0
µ2 (t) ≥ 0;
µ2 (t) ≡ 0,
f alls S2 (x∗ (t)) < 0.
Da beide Beschränkungen zum Endzeitpunkt tf aktiv sind, führt die Transversalitätsbedingung für zustandsbeschränkte Probleme auf folgende Endbedingungen
für die adjungierten Variablen:
λ1 (tf ) = −
(1 − τ )p
− γ1
x7
λ2 (tf ) = 0
λ3 (tf ) = γ2
λ4 (tf ) = −1 − κγ2
λ5 (tf ) = −1
λ6 (tf ) = 0
(1 − τ )x1 (tf )p
λ7 (tf ) =
x27 (tf )
mit γ1 , γ2 ∈ R und γ1 , γ2 ≥ 0.
70
(7.6)
7 Ein komplexes Unternehmensmodell
N=5000
LOQO(Euler-Verfahren)
LOQO(Heun-Verfahren)
IPOPT(Euler-Verfahren )
IPOPT(Heun-Verfahren)
konstanter Preis variierender Preis
7.39 sec.
23.64 sec.
25.23 sec.
247.88 sec.
11.88 sec.
37.45 sec.
45.96 sec.
5108.94 sec.
tf = 20
9.75 sec.
39.08 sec.
282.02 sec.
566.57 sec.
Tabelle 7.2: Vergleich der Rechenzeiten für unterschiedliche Parameter bei 5000 Diskretisierungspunkten.
7.4 Numerische Ergebnisse
Bei dem Versuch eine numerische Lösung des vorliegenden Problems zu erstellen,
wurde zunächst die Fortran-Routine NUDOCCCS, die zu direkten numerischen
Lösungsmethoden der optimalen Steuerprozesse zählt, eingesetzt. Leider lieferte diese keine brauchbaren Ergebnisse, denn die Struktur der optimalen Steuerungen war
nicht erkennbar. Auch die Wahl größerer Anzahl der Diskretisierungspunkte sowie
Verfahren höherer Ordnung zur Approximation der Zustände (wie z.B. das RungeKutta-Verfahren) halfen nicht weiter. Schließlich ist es nach Überwindung einiger
Schwierigkeiten gelungen das Problem in diskretisierter Form mit dem Optimierungssolver LOQO zu lösen. So mussten z. B. die Anfanswerte der Zustände schon
bei deren Deklaration angegeben werden. Diese Lösungen wurden auch hinterher
durch das Optimierungspaket IPOPT bestätigt. Dabei wurde erst einmal zur Approximation des Zustandes das Euler-Verfahren verwendet und anschließend auch
das Heun-Verfahren. In der Tabelle (7.2) sind zum Vergleich die Rechenzeiten beider
Verfahren für unterschiedliche Parameter bei 5000 Diskretisierungspunkten angegeben.
Alle erstellten Programme sind auf einer CD am Ende dieser Arbeit beigefügt. Außerdem sind zwei (Approximation der Zustände mit Euler und Heun Verfahren)
ausgewählte Beispiele des AMPL-Codes im Anhang zu finden.
7.4.1 Optimale Steuerung des komplexen Unternehmensmodells
bei variierendem Preis
Als erstes wird die Lösung des komplexen Modells im Falle eines schwankenden
Preises vorgestellt. Der Verlauf der Preisfunktion p2 (t) ist in der Abbildung (7.27)
zu sehen. Die Schaltstruktur der optimalen Steuerungen u∗1 , u∗2 , u∗3 , u∗4 für dieses
Problem ist in der Tabelle (7.3) zusammengefasst. Die Grafen der optimalen Trajektorien, der Adjungierten, der optimalen Steuerungen, sowie die Grafen der Schaltund der Multiplikatorfunktionen sind in den Abbildungen (7.3)-(7.26) zu sehen.
71
7 Ein komplexes Unternehmensmodell
65
Lagerbestand
Beschaeftigung
100
60
55
80
50
45
60
40
35
40
30
25
0
1
2
3
4
5
6
7
8
9
10
0
2
4
6
8
10
Abbildung 7.3: x1 bei variierendem Preis Abbildung 7.6: x2 bei variierendem Preis
180
220
Fremdkapital
Eigenkapital
200
160
180
140
160
120
140
100
120
80
100
60
80
40
60
20
40
0
2
4
6
8
10
0
2
4
6
8
10
Abbildung 7.4: x3 bei variierendem Preis Abbildung 7.7: x4 bei variierendem Preis
400
40
sichere Anlagen
Risikoabsicherung
350
30
300
250
20
200
10
150
100
0
0
1
2
3
4
5
6
7
8
9
10
0
1
2
3
4
5
6
7
8
9
10
Abbildung 7.5: x5 bei variierendem Preis Abbildung 7.8: x6 bei variierendem Preis
72
7 Ein komplexes Unternehmensmodell
1
-0.024
Diskontierung
-0.026
-0.028
0.95
-0.03
-0.032
0.9
-0.034
-0.036
-0.038
0.85
-0.04
-0.042
0.8
-0.044
0
1
2
3
4
5
6
7
8
9
10
0
1
2
3
4
5
6
7
Abbildung 7.9: x7 bei variierendem Preis Abbildung 7.12: λ1 bei
Preis
0.4
8
9
10
variierendem
0.006
0.2
0.005
0
0.004
-0.2
-0.4
0.003
-0.6
0.002
-0.8
-1
0.001
-1.2
0
-1.4
-1.6
-0.001
0
1
2
3
4
5
6
7
Abbildung 7.10: λ2 bei
Preis
8
9
10
0
1
2
3
4
5
6
7
8
9
10
variierendem Abbildung 7.13: λ3 beim variierenden
Preis
-1
-1.05
-1.1
-1.15
-1.2
-1.25
-1.3
-1.35
-1.4
-1.45
-1.5
0
1
2
3
4
5
6
Abbildung 7.11: λ4 bei
Preis
7
8
9
10
0
1
2
3
4
5
6
variierendem Abbildung 7.14: λ5 bei
Preis
73
7
8
9
10
variierendem
7 Ein komplexes Unternehmensmodell
0.5
1000
800
0.25
600
0
400
-0.25
200
-0.5
0
0
1
2
3
4
5
6
7
Abbildung 7.15: λ6 bei
Preis
8
9
10
0
2
3
4
5
6
7
variierendem Abbildung 7.18: λ7 bei
Preis
Lagerveraenderung
100
1
8
9
10
variierendem
Besch.veraenderung
10
8
75
6
50
4
25
2
0
0
-2
-25
-4
-50
-6
-75
-8
-100
-10
0
1
2
3
4
5
6
7
Abbildung 7.16: u1 bei
Preis
8
9
10
0
1
2
3
4
5
6
7
variierendem Abbildung 7.19: u2 bei
Preis
FK-Veraenderug
100
75
50
50
25
25
0
0
-25
-25
-50
-50
-75
-75
-100
9
10
variierendem
Investition
100
75
8
-100
0
1
2
3
4
5
6
Abbildung 7.17: u3 bei
Preis
7
8
9
10
0
1
2
3
4
5
6
variierendem Abbildung 7.20: u4 bei
Preis
74
7
8
9
10
variierendem
7 Ein komplexes Unternehmensmodell
0.0035
0.4
0.2
0.003
0
0.0025
-0.2
0.002
-0.4
0.0015
-0.6
-0.8
0.001
-1
0.0005
-1.2
0
-1.4
-0.0005
-1.6
0
1
2
3
4
5
6
7
Abbildung 7.21: Σ1 bei
Preis
8
9
10
0
1
2
3
4
5
6
7
variierendem Abbildung 7.24: Σ2 bei
Preis
0.006
8
9
10
variierendem
0.018
0.016
0.005
0.014
0.004
0.012
0.01
0.003
0.008
0.002
0.006
0.004
0.001
0.002
0
0
-0.001
-0.002
0
1
2
3
4
5
6
7
Abbildung 7.22: Σ3 bei
Preis
8
9
10
0
1
2
3
4
5
6
7
variierendem Abbildung 7.25: Σ4 bei
Preis
0.018
8
9
10
variierendem
0.014
0.016
0.012
0.014
0.01
0.012
0.008
0.01
0.008
0.006
0.006
0.004
0.004
0.002
0.002
0
0
0
1
2
3
4
5
6
Abbildung 7.23: µ1 bei
Preis
7
8
9
10
0
1
2
3
4
5
6
variierendem Abbildung 7.26: µ2 bei
Preis
75
7
8
9
10
variierendem
7 Ein komplexes Unternehmensmodell
t
u∗1
[0.0000,0.16603] u1min
[0.1660,0.3947 ] u1min
[0.3947,0.4998 ] u1min
[0.4981,2.8529 ]
0
[2.8529,6.1988 ]
0
[6.1988,10.000 ]
0
u∗2
u∗3
u∗4
u2max
u2max
u2max
u2max
u2min
u2max
u3min
u3max
singulär
singulär
singulär
singulär
u4min
u4min
singulär
singulär
singulär
singulär
x1 − 50 ≤ 0 x3 − 0.8x4 ≤ 0
n.a.
n.a.
n.a.
a.
a.
a.
n.a
n.a.
a.
a.
a.
a.
Tabelle 7.3: Schaltstruktur der optimalen Steuerungen bei variierendem Preis
Zunächst wird geprüft, ob die vorliegende Lösung das (erweiterte) Pontryaginsche
Minimumprinzip nicht verletzt. Hierzu werden, wie schon beim modifizierten Problem, die notwendigen Optimalitätsbedingungen auf jedem Zeitintervall ausgewertet.
1. Zeitintervall [0, t1 ]
In diesem Intervall ist weder die Lagerbeschränkung noch die Verschuldungsbeschränkung aktiv. Es gilt nach der Komplementaritätsbedingung µ1 (t) = 0 und
µ2 (t) = 0 für alle t in [0, t1 ], dieses wird auch durch die Grafen der beiden Multiplikatorfunktionen in den Abbildungen 7.23, 7.26 bestätigt.
Alle vier Steuerungen weisen eine Bang-Bang-Struktur auf. Es gilt:
Σ1 (t) > 0
∀ t ∈ [0, t1 ),
⇒ u∗1 = u1min
Σ2 (t) < 0
∀ t ∈ [0, t1 ),
⇒ u∗2 = u2max
Σ3 (t) > 0
∀ t ∈ [0, t1 ),
⇒ u∗3 = u3min
Σ4 (t) > 0
∀ t ∈ [0, t1 ),
⇒ u∗4 = u4min .
2. Zeitintervall [t1 , t2 ]
Im ersten Schaltpunkt t1 = 0.16603 springt die Steuerung u∗3 von u3min auf u3max .
Die Schaltfunktion Σ3 (t) hat in t1 eine isolierte Nullstelle, Σ3 (t1 ) = 0. Die Minimumbedingung wird auch hier eingehalten, denn alle vier Schaltfunktionen weisen
folgenden Verlauf auf:
Σ1 (t) > 0
∀ t ∈ [t1 , t2 ],
Σ2 (t) < 0
∀ t ∈ [t1 , t2 ],
Σ3 (t) < 0
∀ t ∈ (t1 , t2 ),
Σ4 (t) > 0
∀ t ∈ [t1 , t2 ].
76
7 Ein komplexes Unternehmensmodell
0.06
0.058
0.056
0.054
0.052
0.05
0.048
0.046
0.044
0.042
0.04
0
1
2
3
4
5
6
7
8
9
10
Abbildung 7.27: Variierende Preisfunktion p2 (t).
Beide Beschränkungen sind inaktiv. Die Werte der Multiplikatorenfunktionen µ1 (t),
µ2 (t) liegen für alle t in [t1 , t2 ) bei Null.
3. Zeitintervall [t2 , t3 ]
Der Zeitpunkt t2 = 0.3947 ist der Eintrittspunkt der Verschuldungsbeschränkung.
Diese wird in t2 aktiv und bleibt es bis zum Ende der Planungsperiode tf = 10, d. h.
es gilt:
x3 − κx4 = 0,
∀ t ∈ [t2 , tf ].
Die optimale Trajektorie von x3 kann also in Abhängigkeit von x4 angegeben werden.
Die Steuerungen u∗3 , u∗4 nehmen in t2 = 0.3947 einen singulären Verlauf an. Die
notwendige Bedingung, die besagt, dass die Schaltfunktionen auf diesem Zeitintervall
verschwinden müssen, ist erfüllt.
Σ3 (t) = 0
∀ t ∈ [t2 , t3 ],
Σ4 (t) = 0
∀ t ∈ [t2 , t3 ].
Des Weiteren zeigen die Multiplikatorfunktionen folgenden Verlauf:
µ1 (t) ≥ 0
∀ t ∈ [t2 , tf ]
µ2 (t) = 0
∀ t ∈ [t2 , t3 ].
Die Funktion µ1 (t) kann mittels der Schaltfunktionen Σ3 (t) und Σ4 (t) bestimmt
werden, denn es gilt folgendes:
Σ3 (t) = λ3 = 0 ⇒ Σ̇3 (t) = λ̇3 = 0
Σ4 (t) = λ4 − λ5 = 0 ⇒ Σ̇4 (t) = λ̇4 − λ̇5 = 0.
77
7 Ein komplexes Unternehmensmodell
In den beiden Termen ist der Multiplikator µ1 enthalten und durch Auflösen nach
µ1 erhält man:
µ1 (t) =
(1 − τ )
[0.05λ4 + λ6 ρr (t) − λ5 ρm (t)] .
(1 + κ)
Für die optimalen Steuerungen u∗1 , u∗2 gilt auf diesem Stück weiterhin:
u∗1 = u1min
u∗2 = u2max ,
die jeweiligen Schaltfunktionen bleiben im positiven, bzw. negativen Bereich:
Σ1 (t) > 0
∀ t ∈ [t2 , t3 ],
Σ2 (t) < 0
∀ t ∈ [t2 , t3 ].
Im Abschnitt 7.3 wurde schon nachgerechnet, dass es sich bei der Verschuldungsbeschränkung um eine Zustandsbeschränkung erster Ordnung handelt. Nach (3.9) gilt
dann folgendes:
S(x) ≡ 0 ⇒ S 1 (x) ≡ 0 ⇒ ẋ3 − κẋ4 = u3 − κẋ4
⇒ u3 = κẋ4
⇒ u3 = κ(u4 + (1 − τ )(G − ρr (t)x4 ))
(7.7)
1
⇒ u3 = κ(u4 + (1 − τ )(( (p(t)(F − u1 ) − σx1 − ωx2 )
x7
− ρk (t)x3 − δ(x3 + x4 )) − ρr (t)x4 )).
Die Steuerung u∗3 kann auf dem Randstück in Abhängigkeit von u1 , u4 , xi ermittelt
werden.
u∗3 = κ(u4 + (1 − τ )((
1
(p2 (t)(α(x3 + x4 )α1 xα2 2 − u1 ) − σx1 − ωx2 ) − ρr (t)x4 )).
x7
Die oben berechnete Gleichung für die Steuerung u3 gilt auf dem gesamten Randstück
der Verschuldungsbeschränkung. Um u4 zu bestimmen, wird wiederum die Schaltfunktion Σ4 (t) solange differentiert bis die gesuchte Steuerung in der Ableitung auftaucht. In dem vorliegenden Beispiel ist das für k = 2, also q = 1 der Fall.
Σ4 (t) = λ4 − λ5 = 0,
⇒ λ̇4 − λ̇5 = 0,
⇒ λ̈4 − λ̈5 = 0,
78
∂
(λ4 − λ5 ) = 0
∂u
∂
(λ̇4 − λ̇5 ) = 0
∂u
∂ ¨
(λ4 ) 6= 0.
∂u
7 Ein komplexes Unternehmensmodell
Dies sieht man anhand folgender Berechnungen:
λ̈4 − λ̈5 = (1 − τ )[λ̇4 (ρr (t) + δ) + (λ4 − λ6 )ρ̇r (t) − λ̇5 ρm (t) − λ5 ρ̇m ]
i
h
λ̇
p(t)
+
λ
ṗ(t)
+
λ
p(t)ln(1
+
i(t))
4
4
α1 F (1 − τ ) 4
−
(x3 + x4 )
x7
λ4 p(t)
(α1 − 1)(u3 + u4 + (1 − τ )(G − ρr (t)x4 ))
− (1 − τ )
α1 F
x7
(x3 + x4 )2
α2 u2
λ4 p(t)
− κµ̇1
α1 F
− (1 − τ )
x7
(x3 + x4 )x2
Durch Auflösen der obigen Gleichung nach u4 erhält man:
(x3 + x4 )2
[λ̇4 (ρr (t) + δ) + (λ4 − λ6 )ρ̇r (t) − λ̇5 ρm (t) − λ5 ρ̇m ]
α1 (α1 − 1)p(t)λ4 F
"
#
(x3 + x4 )
λ̇4 p(t) + λ4 ṗ(t) + λ4 p(t)ln(1 + i(t))
−
(α1 − 1)p(t)λ4
x7
u4 =
(x3 + x4 ) λ4 α2 u2
(x3 + x4 )2
κµ̇1 − u3
(7.8)
−
(α1 − 1)λ4 x7 x2
α1 (α1 − 1)(1 − τ )p(t)λ4 F
1
+ (1 − τ )( ((p(t)(F − u1 ) − σx1 − ωx2 ) − ρk (t)x3 − δ(x3 + x4 ) − ρr (t)x4 ))
x7
−
Dabei gilt:
i
(1 − τ ) h
0.05λ̇4 + λ6 ρ̇r (t) − λ̇5 ρm (t) − λ5 ρ̇m (t)
(1 + κ)
π
π
ṗ(t) =
cos( t)
400
4
π
π π
ρ̇m (t) =
0.018 cos( + t)
4
2
4
π
π π
ρ̇r (t) =
0.030 cos( + t).
4
2
4
µ̇1 (t) =
4. Zeitintervall [t3 , t4 ]
In t3 = 0.4998 wird die Lagerbeschränkung
S2 = 50 − x1 ≤ 0,
welche von der Ordnung p = 1 ist, aktiv. Diese bleibt bis zum Ende der Planungsperiode tf = 10 in Kraft. Es gilt demnach x1 (t) = 50 für alle t ∈ [t3 , tf ].
Laut Bedingung (3.9) muss dann auch für alle t ∈ [t3 , tf ] folgendes erfüllt sein:
S21 = −ẋ1 = −u1 = 0.
79
7 Ein komplexes Unternehmensmodell
Außerdem gilt offensichtlich
∂S21
= −1 6= 0.
∂u1
Somit wird der optimale Verlauf der Steuerung u∗1 durch die Lagerbeschränkung
festgelegt:
u∗1 = 0 ∈ int U
∀ t ∈ [t3 , tf ].
(7.9)
Der Graf der Steuerung u∗1 (7.16) bestätigt dies, der Zeitpunkt t3 ist gleichzeitig
ein Schaltpunkt von u∗1 . Eine Randsteuerung verhält sich formal wie eine singuläre
Steuerung und die Schaltfunktion Σ1 (t) ist auf [t3 , tf ] überall gleich Null.
Des Weiteren sieht man in der Abbildung (7.26), dass die Multiplikatorfunktion
µ2 (t) die Vorzeichen-/Komplementaritätsbedingung tatsächlich erfüllt. Der Verlauf
von µ2 (t) auf [t3 , tf ] kann durch Differentation der Schaltfunktion Σ1 (t) bestimmt
werden. Man rechnet leicht nach:
i
(1 − τ ) h
λ̇4 p(t) + λ4 ṗ(t) + λ4 p(t)ln(1 + i(t)) = 0
Σ̇1 (t) = λ̇1 −
x7
i
(1 − τ ) h
λ4 (1 − τ )σ
− µ2 −
λ̇4 p(t) + λ4 ṗ(t) + λ4 p(t)ln(1 + i(t)) = 0
Σ̇1 (t) =
x7
x7
(1 − τ ) λ4 [σ − ṗ2 (t) − p2 (t)ln(1 + i(t))] − λ̇4 p2 (t) .
⇒ µ2 (t) =
x7
Für die Steuerung u∗2 gilt weiterhin u∗2 = u2max und die Steuerungen u∗3 , u∗4 zeigen
einen singulären Verlauf auf. Die Schaltfunktionen zeigen, dass die Minimumbedingung erfüllt ist.
Σ1 (t) = 0
∀ t ∈ [t3 , t4 ],
Σ2 (t) < 0
∀ t ∈ [t3 , t4 ),
Σ3 (t) = 0
∀ t ∈ [t3 , t4 ],
Σ3 (t) = 0
∀ t ∈ [t3 , t4 ].
Die Berechnungen, die für die beiden letzten Steuerungen im Zeitintervall [t2 , t3 ]
durchgeführt wurden, behalten ihre Gültigkeit. In den erhaltenen Gleichungen für
u∗3 , u∗4 muss jedoch der neue Wert der ersten Steuerung eingegeben werden.
Man beachte, dass der oben beschriebene Sachverhalt unabhängig von der Wahl der
Parameter immer seine Gültigkeit behält. Sobald die Lagerbeschränkung aktiv wird,
springt u∗1 auf Null.
4. Zeitintervall [t4 , t5 ]
Die Steuerung u∗2 , die bis t4 = 2.8529 konstant bei u2max lag, springt auf u2min . Die
Schaltfunktion von u∗2 hat in t4 eine isolierte Nullstelle, Σ2 (t4 ) = 0 und für t ∈ (t4 , t5 )
80
7 Ein komplexes Unternehmensmodell
gilt Σ2 (t) > 0. Die Schaltfunktionen von u1 , u3 , u4 verschwinden auch auf diesem
Zeitintervall. Der Verlauf der drei Steuerungen kann genau wie in den vorherigen
Intervallen bestimmt werden. Dabei muss in die Gleichung (7.8) von u∗4 der neue
Wert der Steuerung u∗2 eingesetzt werden. Diese Änderung der Steuerung u∗2 hat eine
direkte Auswirkung auf u∗3 und u∗4 . Der ausgerechnete Term für u∗3 hängt zwar nicht
von u∗2 ab, aber dafür von u∗4 . Beide Funktionen u∗3 , u∗4 weisen Unstetigkeitsstellen
in den Schaltpunkten von u∗2 , dies ist in den Grafen (7.17) und (7.20) deutlich zu
sehen.
5. Zeitintervall [t5 , tf ] mit tf = 10
Im letzten Zeitintervall springt u∗2 in t5 = 6.1988 erneut auf u2max . Es gilt:
Σ1 (t) = 0
∀ t ∈ [t4 , tf ],
Σ2 (t) > 0
∀ t ∈ (t5 , tf ) und Σ2 (t5 ) = 0,
Σ3 (t) = 0
∀ t ∈ [t4 , tf ],
Σ3 (t) = 0
∀ t ∈ [t4 , tf ].
Die Berechnung der singulären Steuerung erfolgt analog zum vorletzten Intervall. In
die Gleichung von u∗4 muss diesmal u∗2 = u2max eingesetzt werden.
Die Minimumbedingung sowie Vorzeichen- und Komplementaritätsbedingung werden also von der vorliegenden Lösung erfüllt. Es bleibt nur noch die Transversalitätsbedingung zu überprüfen.
Die Werte der adjungierten Variablen in tf = 10 lauten:
λ1 (tf ) = −0.03753,
λ2 (tf ) = 0,
λ3 (tf ) = 0,
λ4 (tf ) = −1,
λ5 (tf ) = −1,
λ6 (tf ) = 0,
λ7 (tf ) = 2.34.
Somit wird auch die Bedingung (7.6) mit γ1 = γ2 = 0 eingehalten.
Nachdem die notwendigen Optimalitätsbedingungen eingehend untersucht wurden,
müssten die hinreichenden Bedingungen überprüft werden. Doch leider gibt es in diesem Fall kein bekanntes Kriterium, welches zu Rate gezogen werden könnte. Obwohl
das komplexe Unternehmensmodell ausgehend vom Modell von Lesourne und Leban
konstruiert wurde, werden hier im Gegensatz zum Ursprungsmodell die zusätzlichen
Konvexitätsannahmen nicht erfüllt. Das neu gewählte Zielfunktional
x1 (tf )
− x4 (tf ) + x5 (tf ) + (1 − τ )p
x7 (tf )
81
7 Ein komplexes Unternehmensmodell
ist nicht konvex. Denn die Hesse Matrix der letzten Komponenten
!
1
0
−
2
x
1
x7
:=
∇2
.
2x1
1
x7
− x2 x3
7
x1 (tf )
x7 (tf )
lautet:
7
Diese Matrix ist symmetrisch und hat folgende Eigenwerte:
p
p
x1 − x21 + x27
x1 + x21 + x27
,
EW2 =
.
EW1 =
x37
x37
Wegen x1 > 0, x7 > 0 auf [0, tf ] gilt EW1 > 0 und EW2 < 0und nach Satz (4.2.14)
ist die Hesse- Matrix indefinit.
Man muss sich also beim komplexen Unternehmensmodell erst einmal mit den notwendigen Bedingungen zufrieden geben.
Interpretation der Ergebnisse
In der Wirtschaft spielen die individuellen Präferenzen eines Marktakteurs eine große
Rolle. Insbesondere wird das Verhalten der einzelnen Teilnehmer stark von deren Risikobereitschaft beeinflusst. Bei der Behandlung des komplexen Modells in dieser Arbeit wurde stets von den risikoscheuen Eigenkapitalgebern ausgegangen. Damit wird
diesen unterstellt, dass sie den Nutzen eines sicheren Ereignisses (z.B. Bundesanleihe) höher einschätzen als den Nutzen eines unsicheren Ereignisses. Eine Investition in
ein Unternehmen (auch das Eigene) ist in der Regel mit größeren Gefahren behaftet
als eine sichere Geldanlage und muss daher, um attraktiv zu sein, höhere Gewinne
abwerfen. Die erwartete Rendite lässt sich aus der Sicht der Eigenkapitalgeber als
Summe des Geldmartktzinses ρm und der verlangten Risikoversicherung ρr berechnen. Aufgrund der Risikoscheue der Eigenkapitalgeber liegt der Wert ρm + ρr , mit
den hier gewählten Funktionen ρm , ρr , allzeit über dem Fremdkapitalzinssatz ρk . Der
Profit der Unternehmenseigner wird also durch die Aufnahme vom Fremdkapital, das
sie für sich immer noch Gewinn bringend arbeiten lassen können, weiter gesteigert.
Dies spiegelt sich auch in der erhaltenen optimalen Strategie des Unternehmens wider. Denn sie besagt gerade, dass der maximale Verschuldungsgrad beinahe auf der
ganzen Planungsperiode, mit Ausnahme des ersten sehr kurzen Zeitintervalls [0, t2 ],
ausgeschöpft werden soll. Die kurze Einschwingphase der Kapitalbestände kann darauf zurückgeführt werden, dass die gewählten Anfangswerte nicht optimal sind. Es
bedarf erst einer Umschichtung des Kapitals. Die Eigenkapitaländerung u4 nimmt,
bis zum Aktivwerden der Verschuldungsbeschränkung, ihren Minimalwert an. Dies
entspricht gerade den Investitionen in die alternativen Anlagen x5 , die in dieser
Zeit sehr rasch anwachsen. Danach steigt die ersten ca. 2.85 Jahre der Eigenkapitalbestand des Unternehmens. Auch der Fremdkapitalbestand x3 wird in dieser Zeitspanne, nach einer kurzen Abbauphase (u∗3 = u3min < 0) bis t1 = 0.166, permanent
82
7 Ein komplexes Unternehmensmodell
0.2
0.05
"rhokv.dat"
"rhormv.dat"
0.18
0.04
0.16
0.03
0.14
0.02
0.12
0.01
0.1
0
0.08
0.06
-0.01
0
1
2
3
4
5
6
7
8
9
10
0
1
2
3
4
5
6
7
8
9
10
Abbildung 7.28: Zinsfunktionen (links); Inflationsrate (rechts)
erhöht. Die Steuerung u∗3 nimmt nur positive Werte an. Außerdem wird auf [0, t4 ] die
maximal mögliche Beschäftigungsänderung (u2 = u2max ) ausgeschöpft, die Anzahl
der Beschäftigten x2 steigt linear an. Schließlich werden auf [t4 , t5 ] alle Unternehmensbestände (x2 , x3 , x4 ) abgebaut. Ab dem Zeitpunkt t5 = 6.1988 wachsen sowohl
die Beschäftigung als auch die Kapitalbestände erneut monoton an. Dieses Verhalten der drei Steuerungen u2 , u3 , u4 sowie der Trajektorien x2 , x3 , x4 kann eindeutig
auf den Verlauf der Zinssätze ρm + ρr , ρk und der Preisfunktion p2 (t) zurückgeführt
werden. Denn ab dem zweiten bis zum sechsten Jahr fällt der Produktpreis monoton.
Zudem ist in dieser Zeitperiode die erwartete Rendite der Eigenkapitalgeber am niedrigsten. Demnach hängt die Aufschwungs/Abschwungsphase des Unternehmens sehr
eng mit der Entwicklung der Zinssätze zusammen. In der Hochzinsperiode wächst
der Betrieb, es wird vermehrt neues Personal eingestellt. Außerdem wird der Kapitalstock ständig erhöht. Teilweise werden sogar die Bestände an sicheren Anlagen x5
(u∗4 > 0) abgebaut. Demnach wird in diesem Zeitraum in wachsendem Maße produziert, denn die Werte der beiden Produktionsfaktoren (Beschäftigung und Kapital)
und damit auch die Ausbringungsmenge steigen. In der Niedrigzinsphase schrumpft
das Unternehmen, die Anzahl der Beschäftigten sowie der Kapitalbestand sinken.
Es wird zunehmend in alternative Anlagen investiert.
Der oben beschriebene Sachverhalt hat keinen Einfluss auf den Verlauf des Lagerbestandes x1 und der Diskontierungsfunktion x7 . Denn die Differentialgleichungen
der beiden Zustandsvariablen sind von den anderen entkoppelt. Die Diskontierungsfunktion x7 nimmt, mit Ausnahme des Zeitintervalls mit negativer Inflationsrate,
ständig ab. Das hängt damit zusammen, dass die zukünftigen Zahlungen niedriger
als die gegenwärtigen bewertet werden.
Der berechnete optimale Lösungsverlauf des Lagerbestandes x1 zeigt, dass zur Ma83
7 Ein komplexes Unternehmensmodell
ximierung des Gewinns der Unternehmenseigner der anfängliche Bestand von 100
Produktionseinheiten so schnell wie möglich auf den minimalen Wert von 50 PE
reduziert werden muss. Die Lageränderung u∗1 nimmt, bis der minimale Bestand erreicht ist, ihren kleinstmöglichen Wert u1min an. Dies bedeutet aber, dass in der Zeit
der maximal mögliche Abbau des Lagers stattfindet. Danach liegt u∗1 konstant bei 0,
d. h., der Lagerbestand bleibt in dem übrigen Zeitraum, von ungefähr 9.5 Jahren,
auf dem Minimalbestand von 50 PE, der zur Vermeidung des eventuellen Engpasses bei der Nachfrage vorgegebenen wurde. Diese Taktik ist aus ökonomischer Sicht
sehr sinnvoll, denn erstens verursacht die Einlagerung der Ware Kosten und diese
mindern natürlich den Gewinn. Außerdem binden alle deponierten Produktionsgüter
das schon investierte Kapital. Aus diesen Gründen ist ein wirtschaftlich handelnder
Unternehmer stets bestrebt, die Lagerbestände so gering wie möglich zu halten.
Die Änderung der Risikoversicherung x6 hängt nur von der Entwicklung des Eigenkapitals x4 ab, dementsprechend ist diese auf der ganzen Planungsperiode monoton
wachsend.
Der reine Gewinn der Unternehmenseigner am Ende der Planungsperiode tf = 10
beträgt bei Anwendung der eben geschilderten Strategie |591.247| GE.
Die durchgeführte Analyse zeigt, dass das komplexe Unternehmensmodell tatsächlich
sehr realitätsnah ist. Alle erhaltenen Ergebnisse sind wirtschaftlich gesehen gut nachvollziehbar und äußerst rational.
7.4.2 Optimale Steuerung des komplexen Unternehmensmodells
bei konstantem Preis
Nachdem nun die Lösung des komplexen Unternehmensmodells im Falle eines variierenden Produktpreises vorgestellt wurde, wird hier das optimale Verhalten der Unternehmenseigner bei konstantem Preis p1 = 0.05 aufgezeigt. Dabei werden die notwendigen Optimalitätsbedingungen nur beiläufig diskutiert. Der besondere Schwerpunkt dieses Abschnittes wird auf den Vergleich der beiden Lösungen gelegt.
In der Tabelle (7.4) ist die optimale Schaltstruktur der Steuerungen zusammengefasst. Die Abbildungen (7.29) - (7.35) zeigen die Grafen der optimalen Trajektorien.
Die zugehörigen adjungierten Variablen sind in den Abbildungen (7.38) - (7.41),
(7.44) zu finden. Die Verläufe der optimalen Steuerungen u∗1 , u∗2 , u∗3 , u∗4 sind in den
Abbildungen (7.42), (7.45), (7.43), (7.46) veranschaulicht. Schließlich sind in den
Abbildungen (7.47) - (7.52) die Schaltfunktionen der vier Steuerungen sowie die
beiden Multiplikatorfunktionen dargestellt.
84
7 Ein komplexes Unternehmensmodell
100
70
Lagerbestand
Beschaeftigung
95
65
90
60
85
55
80
75
50
70
45
65
40
60
35
55
50
30
0
2
4
6
8
10
0
2
4
6
8
10
Abbildung 7.29: x1 bei konstantem Preis Abbildung 7.32: x2 bei konstantem Preis
130
160
Fremdkapital
Eigenkapital
120
150
110
140
100
130
90
120
80
110
70
100
60
90
50
80
40
70
30
60
0
2
4
6
8
10
0
2
4
6
8
10
Abbildung 7.30: x3 bei konstantem Preis Abbildung 7.33: x4 bei konstantem Preis
450
35
sichere Anlagen
Risikoabsicherung
400
30
350
25
300
20
250
15
200
10
150
5
100
0
0
2
4
6
8
10
0
2
4
6
8
10
Abbildung 7.31: x5 bei konstantem Preis Abbildung 7.34: x6 bei konstantem Preis
85
7 Ein komplexes Unternehmensmodell
1
-0.031
Diskontierung
0.98
-0.032
0.96
0.94
-0.033
0.92
0.9
-0.034
0.88
-0.035
0.86
0.84
-0.036
0.82
0.8
-0.037
0
2
4
6
8
10
0
1
2
3
4
5
6
7
8
9
10
Abbildung 7.35: x7 bei konstantem Preis Abbildung 7.38: λ1 bei konstantem Preis
0.05
0.007
0
0.006
-0.05
0.005
-0.1
0.004
-0.15
0.003
-0.2
0.002
-0.25
0.001
-0.3
0
-0.35
-0.4
-0.001
0
1
2
3
4
5
6
7
8
9
10
0
1
2
3
4
5
6
7
8
9
10
Abbildung 7.36: λ2 bei konstantem Preis Abbildung 7.39: λ3 bei konstantem Preis
-1
-1
-1.05
-1.05
-1.1
-1.1
-1.15
-1.15
-1.2
-1.2
-1.25
-1.25
-1.3
-1.3
-1.35
-1.35
-1.4
-1.4
-1.45
-1.45
-1.5
0
1
2
3
4
5
6
7
8
9
10
0
1
2
3
4
5
6
7
8
9
10
Abbildung 7.37: λ4 bei konstantem Preis Abbildung 7.40: λ5 bei konstantem Preis
86
7 Ein komplexes Unternehmensmodell
1
800
700
0.5
600
500
0
400
300
-0.5
200
100
-1
0
0
1
2
3
4
5
6
7
8
9
10
0
1
2
3
4
5
6
7
8
9
10
Abbildung 7.41: λ6 bei konstantem Preis Abbildung 7.44: λ7 bei konstantem Preis
10
Lagerveraenderung
100
Besch.veraenderung
8
75
6
50
4
25
2
0
0
-25
-2
-4
-50
-6
-75
-8
-100
-10
0
1
2
3
4
5
6
7
8
9
10
0
1
2
3
4
5
6
7
8
9
10
Abbildung 7.42: u1 bei konstantem Preis Abbildung 7.45: u2 bei konstantem Preis
100
20
FK-Veraenderug
Investition
80
0
60
40
-20
20
0
-40
-20
-60
-40
-60
-80
-80
-100
-100
0
1
2
3
4
5
6
7
8
9
10
0
1
2
3
4
5
6
7
8
9
10
Abbildung 7.43: u3 bei konstantem Preis Abbildung 7.46: u4 bei konstantem Preis
87
7 Ein komplexes Unternehmensmodell
0.0035
0.05
0.003
0
-0.05
0.0025
-0.1
0.002
-0.15
0.0015
-0.2
0.001
-0.25
0.0005
-0.3
0
-0.35
-0.0005
-0.4
0
1
2
3
4
5
6
7
8
9
10
0
1
2
3
4
5
6
7
8
9
10
Abbildung 7.47: Σ1 bei konstantem Preis Abbildung 7.50: Σ2 bei konstantem Preis
0.007
0.02
0.018
0.006
0.016
0.005
0.014
0.012
0.004
0.01
0.003
0.008
0.002
0.006
0.004
0.001
0.002
0
0
-0.001
-0.002
0
1
2
3
4
5
6
7
8
9
10
0
1
2
3
4
5
6
7
8
9
10
Abbildung 7.48: Σ3 bei konstantem Preis Abbildung 7.51: Σ4 bei konstantem Preis
0.012
0.018
0.016
0.01
0.014
0.008
0.012
0.01
0.006
0.008
0.004
0.006
0.004
0.002
0.002
0
0
0
1
2
3
4
5
6
7
8
9
0
10
1
2
3
4
5
6
7
8
9
10
Abbildung 7.49: µ1 bei konstantem Preis Abbildung 7.52: µ2 bei konstantem Preis
88
7 Ein komplexes Unternehmensmodell
t
u∗1
[0.00,0.20140] u1min
[0.2014,0.4273 ] u1min
[0.4273,0.4998 ] u1min
[0.4981,3.8550 ]
0
[3.8550,6.4872 ]
0
[6.4872,10.00]
0
u∗2
u∗3
u∗4
u2max
u2max
u2max
u2max
u2min
singulär
u3min
u3max
singulär
singulär
singulär
singulär
u4min
u4min
singulär
singulär
singulär
singulär
x1 − 50 ≤ 0 x3 − κx4 ≤ 0
n.a.
n.a.
n.a.
a.
a.
a.
n.a
n.a.
a.
a.
a.
a.
Tabelle 7.4: Schaltstruktur der optimalen Steuerungen bei konstantem Preis
Der optimale Verlauf der Steuerung u∗1 wird, wie es im letzten Abschnitt erläutert
wurde, durch die Lagerbeschränkung festgelegt und ist von der Wahl der Parameter
unabhängig. Es gilt hier wiederum:
(
u1min ,
∀ t ∈ [0, t3 ]
u∗1 (t) =
0,
∀ t ∈ [t3 , tf ].
Σ1 (t) =
(
> 0,
= 0,
∀ t ∈ [0, t3 ]
∀ t ∈ [t3 , tf ].
(
= 0,
> 0,
∀ t ∈ [0, t3 ]
∀ t ∈ [t3 , tf ].
Für den Multiplikator µ2 gilt:
µ2 (t) =
Der Eintrittspunkt der Lagerbeschränkung (t3 = 0.4998) stimmt ebenfalls überein.
Denn das Lager wird mit maximaler Geschwindigkeit, bis der Minimalbestand erreicht ist, abgebaut und in beiden Fällen wird von den gleichen Anfangswerten ausgegangen.
Die Struktur der beiden letzten Steuerungen, mittels denen der Geldfluss des Unternehmens geregelt wird, bleibt unverändert. Am Anfang nehmen u∗3 , u∗4 nur ihre
Grenzwerte an und mit dem Aktivwerden der Verschuldungsbeschränkung weisen
beide wieder singulären Verlauf auf. Die Schaltfunktionen haben folgende Form:

(

∀ t ∈ [0, t1 )
 > 0,
> 0,
∀ t ∈ [0, t1 )
Σ3 (t) =
< 0,
∀ t ∈ (t1 , t2 ) und Σ4 (t) =

= 0,
∀ t ∈ [t2 , tf ].

= 0,
∀ t ∈ [t2 , tf ]
Aber die Schaltpunkte t1 , t2 (bzw. Eintrittspunkt t2 ) liegen diesmal etwas weiter
hinten.
Da die erwartete Rendite auch hier stets über dem Fremdkapitalzinssatz liegt, wird
89
7 Ein komplexes Unternehmensmodell
im Falle eines konstanten Preises die Verschuldungsbeschränkung früh aktiv (in
t2 = 0.4273) und bleibt es bis zum Ende der Planungsperiode. Die zugehörige Multiplikatorfunktion erfüllt die Vorzeichen- und Komplementaritätsbedingung:
(
= 0,
∀ t ∈ [0, t2 ]
µ1 (t) =
> 0,
∀ t ∈ [t2 , tf ].
Im Gegensatz zu den übrigen Steuerungen tritt bei der Beschäftigungsänderung u∗2
eine wesentliche Änderung auf. Diese hat nicht mehr reine bang-bang Struktur, sondern enthält im Zeitintervall [t5 , tf ] (mit t5 = 6.4872) auch ein singuläres Teilstück.
Die Schaltfunktion Σ2 (t) hat folgende Gestalt:


∀t ∈ [0, t4 )
 < 0,
Σ2 (t) =
> 0,
∀t ∈ (t4 , t5 )


= 0,
∀t ∈ [t5 , tf ],
mit Σ2 (t4 ) = 0. Darüber hinaus wird mit t4 = 3.8550 ca. ein Jahr später auf maximalen Beschäftigungsabbau (u∗2 = u2min ) umgeschaltet, als im Falle der variierenden
Preisfunktion. Dort liegt der Schaltpunkt t4 bei 2.8522. Vor allem aber wird in der
Zeitspanne [t5 , tf ] nicht sofort mit dem maximalen Beschäftigungsaufbau angefangen, die Beschäftigtenanzahl wird fast bis zum achten Jahr weiter reduziert (u∗2 < 0).
Alle Konsequenzen der eingetretenen Veränderungen sowie die möglichen Gründe
hierfür werden noch zum späteren Zeitpunkt detaillierter diskutiert. Erst sollen die
theoretischen Ausführungen beendet werden.
Die Transversalitätsbedingung (7.6) wird auch von der Lösung des komplexen Modells bei konstantem Preis mit γ1 = γ2 = 0 eingehalten. Die Endwerte der adjungierten Variablen lauten hier:
λ1 (tf ) = −0.03125,
λ2 (tf ) = 0,
λ3 (tf ) = 0,
λ4 (tf ) = −1,
λ5 (tf ) = −1,
λ6 (tf ) = 0,
λ7 (tf ) = 1.949.
Zudem zeigen die obigen Ausführungen, dass sowohl die Minimumbedingung als auch
die Vorzeichen- und Komplementaritätsbedingung überall erfüllt werden. Demnach
genügt die vorliegende Lösung den notwendigen Optimalitätsbedingungen.
Die beiden Multiplikatorfunktionen können erneut durch Differentation der entsprechenden Schaltfunktionen gewonnen werden. Beim direkten Vergleich der Funktionen µ1 (t) beider Lösungen (siehe Abbildungen 7.49,7.23) fällt auf, dass deren
Verläufe identisch sind. Dies wird auch durch den theoretisch ausgerechneten Term
bestätigt, denn dieser hängt nicht vom Preis ab.
µ1 (t) =
(1 − τ )
[0.05λ4 + λ6 ρr (t) − λ5 ρm (t)] .
(1 + κ)
90
7 Ein komplexes Unternehmensmodell
Die Funktion µ2 (t) enthält dagegen den Preis p1 (bzw. p2 (t)) als eine Variable. Diese
lautet hier (da ṗ1 = 0):
µ2 (t) =
(1 − τ ) λ4 [σ − p1 ln(1 + i(t))] − λ̇4 p1 .
x7
Auch die Berechnung der singulären Steuerungen erfolgt analog zu den durchgeführten Rechnungen bei variierendem Preis. Diesmal muss jedoch zusätzlich der Verlauf
von u∗2 auf dem letzten Zeitintervall bestimmt werden. Dazu wird die Funktion Σ2 (t)
nach der Zeit t abgeleitet bis die gesuchte Steuerung darin auftaucht. Es gilt hier:
∂
∂
λ̇2 = 0
Σ̇2 (t) =
∂u
∂u
∂
∂
λ̈2 6= 0.
Σ̈2 (t) =
∂u
∂u
Demnach muss auf dem Zeitintervall [t5 , tf ] zur Bestimmung der singulären Steuerungen u∗2 , u∗4 ein (2 × 2) - Gleichungssystem gelöst werden. Auf die Angabe der
ausgerechneten Lösung wird an dieser Stelle jedoch verzichtet. Es wird nur darauf
hingewiesen, dass u∗2 , u∗4 sowohl von dem Verlauf der Zustände xi abhängen als auch
von den adjungierten Variablen λi .
Vergleich der Lösungen für verschiedene Preisfunktionen
In den obigen Ausführungen wurde schon deutlich, dass der wohl markanteste Unterschied der beiden optimalen Strategien in dem Beschäftigungsbereich des Untenehmens liegt. Doch auch in dem Kapitalsektor können erhebliche Abweichungen
festgestellt werden. Die anfängliche Wachstumsphase der beiden Ressorts (x2 , x3 , x4 )
endet im Falle eines variierenden Preises schon nach ca. 2.85 Jahren, bei konstantem
Preis dagegen erst ein Jahr später. Dafür ist aber die anschließende Abschwungsphase im ersten Beispiel etwa um sieben Monate kürzer als im zweiten. Außerdem fällt
bei konstantem Preis der erneute Zuwachs an Kapitalbeständen und Arbeitskräften
am Ende der Planungsperiode geringer aus.
Dieses Verhalten ist erstaunlich, wenn man den Verlauf der Preisfunktion p2 (t)
(Abbildung 7.27) berücksichtigt. Denn die ersten vier Jahre liegt der variierende
Produktpreis über dem konstanten und vom vierten bis zum achten Jahr unter
p1 = 0.05. Somit hätte man erwarten können, dass bei schwankendem Preis die
erste Aufschwungsphase länger andauert und die zweite erst später eintritt. Doch
offensichtlich spielt nicht nur der Preis selbst, sondern auch die zukünftige Tendenz
(p2 (t) ist auf [2, 6] monoton fallend und auf [6, 10] monoton steigend) eine Rolle.
Die Werte der Ableitung ṗ2 (t) sind auch in den berechneten Steuerungen (sieh 7.8)
enthalten und wirken sich somit tatsächlich auf den optimalen Lösungsverlauf aus.
91
7 Ein komplexes Unternehmensmodell
Da aber bei beiden Lösungen verschiedene Wachstumsphasen zu beobachten sind,
wird deutlich, dass diese nicht auf den schwankenden Preis zurückgeführt werden
können, sondern eindringlich mit der Entwicklung der Zinssatze zusammenhängen.
Des Weiteren ist anzumerken, dass auch die beiden Vermögensgrößen x5 , x6 geringfügig abweichende Verläufe annehmen. So hat die Risikoversicherung x6 bei konstantem Produktpreis fast überall die gleiche Steigung. Im Falle einer variierenden
Preisfunktion dagegen schwankt die Höhe des Anstiegs, in Abhängigkeit von der
jeweiligen Wachstumsphase.
Während die alternativen Anlagen x5 bei schwankendem Preis in beiden Wachstumsperioden zugunsten des Unternehmens abgebaut werden, sind sie bei der Wahl
eines konstanten Preises fast überall streng monoton wachsend. Nur zwischen dem
zweiten und dem dritten Jahr bleibt das Guthaben unverändert. Zwar nimmt die
Steuerung u∗4 auf den Zeitintervallen [0.5, 3] und [9, 10] positive Werte an, was einem
Abzug der sicheren Anlagen gleicht, aber offensichtlich wird diese Differenz durch
anfallende Zinserträge gedeckt.
Der Verlauf des Lagerbestandes x1 sowie die Diskontierungsfunktion x7 stimmen
in beiden Lösungen vollkommen überein. Dies ist auch nicht weiter verwunderlich,
denn beide sind von der Preisentwicklung unabhängig. Zudem sind die Differentialgleichungen dieser Zustandsvariablen von den anderen entkoppelt.
Ein direkter Vergleich der Lösungen zeigt also, dass in beiden Fällen das zu steuernde Unternehmen in 10 Jahren drei Phasen durchläuft: Aufschwung - Abschwung
- Aufschwung. Bei der Wahl eines konstanten Preises ist die letzte Phase sehr kurz
und eher gering. Dies macht sich auch in dem betragsmäßigen Zielfunktionswert bemerkbar. Denn dieser liegt mit |522.566| GE etwa 13% unter dem erwirtschafteten
Gewinn bei varriierendem Preis, der |591.247| GE beträgt. Demnach ist es ökonomisch unvorteilhaft den Produktpreis auf dem ganzen Planungszeitraum, insbesondere bei gleichzeitig steigenden Kosten, konstant zu setzen. Dies bestätigt erneut die
altbekannten Wirtschaftsprinzipien und somit die ausgesprochene Realitätsnähe des
komplexen Unternehmensmodells.
7.4.3 Optimale Steuerung des komplexen Unternehmensmodells
bei Verdoppelung der Planungsperiode
Jedes Unternehmen strebt generell eine dauerhafte Existenz an. Aus diesem Grunde
ist es von äußerster Wichtigkeit zu prüfen, ob eine kurzzeitig ausgelegte (optimale) Strategie nicht zu erheblichen Defiziten in der Zukunft führt. Daher wird hier
noch zum Schluss die Lösung des komplexen Modells bei einer Verlängerung der
Planungsperiode im Falle eines variierenden Preises demonstriert.
92
7 Ein komplexes Unternehmensmodell
100
65
Lagerbestand
Beschaeftigung
60
90
55
50
80
45
70
40
35
60
30
25
50
20
40
15
0
5
10
15
20
0
5
10
15
20
Abbildung 7.53: x1 bei Verdoppelung der Abbildung 7.56: x2 bei Verdoppelung der
Planungsperiode
Planungsperiode
220
300
Fremdkapital
Eigenkapital
200
250
180
160
200
140
120
150
100
100
80
60
50
40
20
0
0
5
10
15
20
0
5
10
15
20
Abbildung 7.54: x3 bei Verdoppelung der Abbildung 7.57: x4 bei Verdoppelung der
Planungsperiode
Planungsperiode
1000
80
sichere Anlagen
Risikoabsicherung
900
70
800
60
700
50
600
40
500
30
400
20
300
10
200
100
0
0
5
10
15
20
0
5
10
15
20
Abbildung 7.55: x5 bei Verdoppelung der Abbildung 7.58: x6 bei Verdoppelung der
Planungsperiode
Planungsperiode
93
7 Ein komplexes Unternehmensmodell
1
-0.03
Diskontierung
0.95
-0.035
0.9
-0.04
0.85
-0.045
0.8
-0.05
0.75
-0.055
0.7
-0.06
0.65
-0.065
0
5
10
15
20
0
2
4
6
8
10
12
14
16
18
20
Abbildung 7.59: x7 bei Verdoppelung der Abbildung 7.62: λ1 bei Verdoppelung der
Planungsperiode
Planungsperiode
1
0.009
0.008
0.5
0.007
0
0.006
0.005
-0.5
0.004
-1
0.003
0.002
-1.5
0.001
-2
0
-2.5
-0.001
0
2
4
6
8
10
12
14
16
18
20
0
2
4
6
8
10
12
14
16
18
20
Abbildung 7.60: λ2 bei Verdoppelung der Abbildung 7.63: λ3 bei Verdoppelung der
Planungsperiode
Planungsperiode
-1
-1
-1.2
-1.2
-1.4
-1.4
-1.6
-1.6
-1.8
-1.8
-2
-2
-2.2
-2.2
0
2
4
6
8
10
12
14
16
18
20
0
2
4
6
8
10
12
14
16
18
20
Abbildung 7.61: λ4 bei Verdoppelung der Abbildung 7.64: λ5 bei Verdoppelung der
Planungsperiode
Planungsperiode
94
7 Ein komplexes Unternehmensmodell
1
2500
2000
0.5
1500
0
1000
-0.5
500
-1
0
0
2
4
6
8
10
12
14
16
18
20
0
2
4
6
8
10
12
14
16
18
20
Abbildung 7.65: λ6 bei Verdoppelung der Abbildung 7.68: λ7 bei Verdoppelung der
Planungsperiode
Planungsperiode
10
10
0
8
-10
6
-20
4
-30
2
-40
0
-50
-2
-60
-4
-70
-6
-80
-8
-90
-100
-10
0
2
4
6
8
10
12
14
16
18
20
0
2
4
6
8
10
12
14
16
18
20
Abbildung 7.66: u1 bei Verdoppelung der Abbildung 7.69: u2 bei Verdoppelung der
Planungsperiode
Planungsperiode
100
40
80
20
60
0
40
20
-20
0
-40
-20
-40
-60
-60
-80
-80
-100
-100
0
2
4
6
8
10
12
14
16
18
20
0
2
4
6
8
10
12
14
16
18
20
Abbildung 7.67: u3 bei Verdoppelung der Abbildung 7.70: u4 bei Verdoppelung der
Planungsperiode
Planungsperiode
95
7 Ein komplexes Unternehmensmodell
0.0007
1
0.0006
0.5
0.0005
0
0.0004
-0.5
0.0003
-1
0.0002
-1.5
0.0001
-2
0
-2.5
0
2
4
6
8
10
12
14
16
18
20
0
2
4
6
8
10
12
14
16
18
20
Abbildung 7.71: Σ1 bei Verdoppelung Abbildung 7.74: Σ2 bei Verdoppelung
der Planungsperiode
der Planungsperiode
0.009
0.03
0.008
0.025
0.007
0.006
0.02
0.005
0.004
0.015
0.003
0.01
0.002
0.001
0.005
0
-0.001
0
0
2
4
6
8
10
12
14
16
18
20
0
2
4
6
8
10
12
14
16
18
20
Abbildung 7.72: Σ3 bei Verdoppelung Abbildung 7.75: Σ4 bei Verdoppelung
der Planungsperiode
der Planungsperiode
0.025
0.025
0.02
0.02
0.015
0.015
0.01
0.01
0.005
0.005
0
0
0
2
4
6
8
10
12
14
16
18
20
0
2
4
6
8
10
12
14
16
18
20
Abbildung 7.73: µ1 bei Verdoppelung der Abbildung 7.76: µ2 bei Verdoppelung der
Planungsperiode
Planungsperiode
96
7 Ein komplexes Unternehmensmodell
t
u∗1
[0.0000,0.16603] u1min
[0.1660,0.3947 ] u1min
[0.3947,0.4998 ] u1min
[0.4981,2.8529 ]
0
[2.8529,6.1988 ]
0
[6.1988,10.00 ]
0
[10.000,14.321 ]
0
[14.321,18.790 ]
0
[18.790,18.873 ]
0
[18.873,19.522 ]
0
[19.522,20.00 ]
0
u∗2
u∗3
u∗4
u2max
u2max
u2max
u2max
u2min
u2max
u2min
u2max
u2max
u2min
u2min
u3min
u3max
singulär
singulär
singulär
singulär
singulär
singulär
singulär
singulär
singulär
u4min
u4min
singulär
singulär
singulär
singulär
singulär
singulär
u4min
u4min
u4min
x1 − 50 ≤ 0 x3 − 0.8x4 ≤ 0
n.a.
n.a.
n.a.
a.
a.
a.
a.
a.
a.
a.
a.
n.a
n.a.
a.
a.
a.
a.
a.
a.
a.
a.
n.a.
Tabelle 7.5: Schaltstruktur der optimalen Steuerungen bei variierendem Preis
Diesmal wird auf die Überprüfung der notwendigen Optimalitätsbedingungen ganz
verzichtet. Es sei aber darauf hingewiesen, dass diese auch hier eingehalten werden.
Das primäre Ziel dieses Abschnittes besteht darin herauszufinden, welche Konsequenzen eine Verdoppelung der Planungsperiode nach sich zieht.
In den Abbildungen (7.53) - (7.70) sind die Grafen der optimalen Trajektorien,
der zugehörigen Adjungierten sowie der optimalen Steuerungen dargestellt. Die Abbildungen (7.71) - (7.76) zeigen den Verlauf der Schaltfunktionen und der beiden
Multiplikatorfunktionen. Die Schaltstruktur der optimalen Steuerungen ist in der
Tabelle (7.5) zusammengefasst.
Bei näherem Betrachten der optimalen Lösung in den Abbildungen (7.53) - (7.76)
stellt man erfreulicherweise fest, dass diese auf den ersten 10 Jahren mit den Grafen (7.3) - (7.26) übereinstimmen. Sogar die Schaltpunkte optimaler Steuerungen
für unterschiedlich lange Planungsperioden sind in den ersten zehn Jahren identisch
(siehe Tabellen 7.3, 7.5). Dies bedeutet gerade, dass die für kürzere Periode empfohlene Taktik auch auf lange Sicht erfolgsversprechend ist.
Somit hängt die optimale Strategie der Unternehmenseigner zur Maximierung der
Gewinne nicht von der Dauer des Planungszeitraumes ab.
Die Gründe dafür lassen sich in mehreren (realen) Voraussetzungen dieses Modells
finden. Zunächst ein Mal hängt der Verlauf der Diskontierungsfunktion nur von der
Inflationsrate i(t) ab und ist dadurch zu jedem Zeitpunkt festgelegt. Des Weiteren stellt der Lagerbestand x1 in der Gewinnfunktion G(t) einen Kostenfaktor dar,
deswegen wird dieser mittels der Steuerung u∗1 soweit wie möglich reduziert. Die
Entwicklung der übrigen drei Steuerungen wird von dem Verlauf der Zinsfunktionen
97
7 Ein komplexes Unternehmensmodell
ρm +ρr , ρk bestimmt. Durch Berücksichtigung der konjunkturellen Schwankungen in
den Zinsfunktionen wird die aktuelle Marktlage, an welcher sich die Entwicklung des
Unternehmens letztendlich richtet, bewertet. Dementsprechend wird zu jedem Zeitpunkt eine Entscheidung aufgrund der gegenwärtigen Wirtschaftsbedingungen und
des Markttrends getroffen. Der Letzte wird mittels der Ableitungen der Zinsfunktionen einbezogen, welche sich ebenfalls in den optimalen Steuerungen auswirken.
Dies wird insbesondere anhand der theoretischen Berechnungen ersichtlich.
Die ausschlaggebende Größe dieses Modells ist also die Zinsstruktur, anhand welcher
bestimmt wird, ob das Unternehmen wächst oder schrumpft.
Diese Feststellung wird auch durch den Verlauf der optimalen Trajektorien auf dem
Zeitintervall [10, 20] (bei einer Verdoppelung der Planungsperiode) untermauert.
Auch hier lösen sich die Aufschwungs- und Abschwungsphase nacheinander ab. Dabei kommt die Steuerung u∗4 immer näher an ihre Grenzen, sodass diese in t = 18.79
sogar ihren Minimalwert annimmt, d. h. es werden maximal mögliche Investitionen
in alternative Anlagen getätigt. Damit ist auch der Austrittspunkt (t = 19.522) der
Verschuldungsbeschränkung zu erklären. Da das Unternehmen sich gerade in einer
Abschwungsphase befindet, ist es vom Vorteil alle Betriebsbestände (Beschäftigung,
Kapital) zu reduzieren. In den früheren Abbauperioden wurde die maximale Verschuldungsbeschränkung trotzdem noch ausgeschöpft, denn es bestand die Möglichkeit das Geld für die sicheren Anlagen zu verwenden. Diesmal wird jedoch die Kapazität der Eigenkapitaländerung u∗4 vollkommen ausgenutzt. Demnach wird hier nicht
mehr das maximal zur Verfügung stehende Kapital benötigt.
Die oben genannten Sachverhalte spiegeln sich auch in dem Zielfunktionswert wider.
Dieser ist im Falle einer zwanzigjährigen Planung mit |1174.71| GE fast doppelt so
hoch wie bei einer zehnjährigen Planungsperiode.
98
8 Schlussbemerkung
In dieser Arbeit wurden zunächst, um eine tragende Basis für das Verständnis der
vorgeführten Beispiele zu schaffen, die theoretischen Hintergründe der optimalen
Steuerprozesse näher erläutert. Hierbei wurde insbesondere der interessante Fall,
in welchem durch das Pontrayginsche Minimumprinzip unter zusätzlichen Konvexitätsannahmen auch hinreichende Bedingungen gegeben werden, hervorgehoben.
Denn solche Probleme sind gerade in den wirtschaftlichen Anwendungen öfters vertreten. Anschließend wurden zwei ökonomische Beispiele aus dem Bereich des Unternehmenswachstum vorgestellt. Dabei war die Behandlung des ersten Beispiels,
modifizierten Modell von Lesourne und Leban, für die vorliegende Arbeit aus zwei
unterschiedlichen Gründen vom Interesse. Erstens bildet dieses den Ausgangspunkt
des komplexen Modells und zweitens gehört es zu der Klasse der Probleme, welche
die zusätzlichen Konvexitätsannahmen erfüllen.
Den Kern der vorliegenden Arbeit bildete die Bearbeitung eines komplexen Unternehmensmodells. Dabei handelt es sich um einen wirklich komplexen parameterreichen optimalen Steuerprozess mit vier linearen Steuerungen, sieben Zustandsvariablen und zwei aktiven Zustandsbeschränkungen. Solche Anwendungen sind in der
Literatur eher selten vertreten. Mit diesem Modell konnte ein sehr aufschlussreiches
Beispiel, welches in der Lage ist wirtschaftliche Vorgänge äußerst realitätsnahe zu
repräsentieren, demonstriert werden.
Im Rahmen dieser Arbeit wurde eingehend untersucht, welchen Einfluss eine Änderung der Parameter, mämlich Produktpreis sowie die Dauer der Planungsperiode,
auf den optimalen Lösungsverlauf hat. Doch auch eine Analyse der anderen Parameter wäre mit Sicherheit lehrreich. Z. B. wäre interessant zu sehen inwieweit die
optimale Lösung von der Wahl der Koeffizienten der Produktionsfunktion abhängt,
denn mit höherer Produktionselastizität (α1 , α2 ) steigt die Ausbringungsmenge. Dies
führt zu höheren Gewinnen und könnte eventuell einen raschen Abbau der Unternehmensbestände in den Niedrigzinsphasen verhindern.
Die fundierten Ergebnisse dieser Arbeit zeigen deutlich, dass es in der Behandlung
ökonomischer Modelle mittels optimaler Steuerprozesse sehr viel Potenzial steckt.
99
A Beispieldateien: AMPL-Code
A.1 Komplexes Modell beim variierenden Preis mit
Heun-Verfahren
####################################################################
#
Komplexes Modell für risikoscheue EK-Geber
#
#
HEUN-Verfahren
#
#
beim variierenden Preis
#
####################################################################
####################################################################
# DEKLARATION DER PARAMETER:
#
####################################################################
param t_0
:= 0.0;
param t_f
:= 10.0;
param n
:= 5000;
param h
:= (t_f-t_0)/n;
param u1_min := -100.0;
param u1_max := 100.0;
param u2_min := -10.0;
param u2_max := 10.0;
param u3_min := -100.0;
param u3_max := 100.0;
param u4_min := -100.0;
param u4_max := 100.0;
param tau
:= 0.5;
param alpha
:= 100.0;
param alpha1 := 0.35;
param alpha2 := 0.5;
param sigma
:= 0.01;
param delta
:= 0.322;
param kappa
:= 0.8;
100
A Beispieldateien: AMPL-Code
param kl
:= 8.0;
param pi
:= 3.1415927;
####################################################################
# DEKLARATION DER VARIABLEN:
#
####################################################################
var x_1 {i in 0..n}:=100;
var x_2 {i in 0..n}:=30;
var x_3 {i in 0..n}:=50;
var x_4 {i in 0..n}:=100;
var x_5 {i in 0..n}:=100;
var x_6 {i in 0..n}:=0.0;
var x_7 {i in 0..n}:=1.0;
var u_1 {i in 0..n-1};
var u_2 {i in 0..n-1};
var u_3 {i in 0..n-1};
var u_4 {i in 0..n-1};
param k
{i in 0..n} := (pi/2.0)+(2.0*pi/kl)*i*h;
param w
{i in 0..n} := 2*exp(0.02*i*h);
param zin {i in 0..n} := 0.019+0.029*sin(k[i]);
param rhok {i in 0..n} := 0.110+0.030*sin(k[i]);
param rhom {i in 0..n} := 0.074+0.018*sin(k[i]);
param rhor {i in 0..n-1} := rhok[i]-0.05;
param p
{i in 0..n} := 0.05+0.01*sin(k[i]-(pi/2.0));
var dgl_1 {i in 0..n-1} = u_1[i];
var dgl_2 {i in 0..n-1} = u_2[i];
var dgl_3 {i in 0..n-1} = u_3[i];
var dgl_4 {i in 0..n-1} = u_4[i]+(1-tau)*((1.0/x_7[i])*(p[i]*
(alpha*(x_3[i]+x_4[i])^alpha1*x_2[i]^alpha2-u_1[i])-sigma*x_1[i]w[i]*x_2[i])-rhok[i]*x_3[i]-delta*(x_3[i]+x_4[i])-rhor[i]*x_4[i]);
var dgl_5 {i in 0..n-1} = -1.0*u_4[i]+(1-tau)*rhom[i]*x_5[i];
var dgl_6 {i in 0..n-1} = (1-tau)*rhor[i]*x_4[i];
var dgl_7 {i in 0..n-1} = log(1+zin[i])*(-x_7[i]);
var euler_1 {i in 0..n-1} = x_1[i] + h * (u_1[i]);
var euler_2 {i in 0..n-1} = x_2[i] + h * (u_2[i]);
var euler_3 {i in 0..n-1} = x_3[i] + h * (u_3[i]);
var euler_4 {i in 0..n-1} = x_4[i] + h * (u_4[i]+(1-tau)*((1.0/x_7[i])
*(p[i]*(alpha*(x_3[i]+x_4[i])^alpha1*x_2[i]^alpha2-u_1[i])-sigma*x_1[i]
-w[i]*x_2[i])-rhok[i]*x_3[i]-delta*(x_3[i]+x_4[i])-rhor[i]*x_4[i]));
101
A Beispieldateien: AMPL-Code
var euler_5 {i in 0..n-1}=x_5[i]+h*(-1.0*u_4[i]+(1-tau)*rhom[i]*x_5[i]);
var euler_6 {i in 0..n-1}=x_6[i]+h*((1-tau)*rhor[i]*x_4[i]);
var euler_7 {i in 0..n-1}=x_7[i]+h*(log(1+zin[i])*(-x_7[i]));
####################################################################
# ANGABE DES ZIELFUNKIONALS:
#
####################################################################
minimize Zielfkt: -(x_4[n]+x_5[n]+(1-tau)*p[n]*(x_1[n]/x_7[n]));
####################################################################
# ANGABE DER ANFANGSWERTE:
#
####################################################################
s.t. aw_1 : x_1[0] = 100.0;
s.t. aw_2 : x_2[0] = 30.0;
s.t. aw_3 : x_3[0] = 50.0;
s.t. aw_4 : x_4[0] = 100.0;
s.t. aw_5 : x_5[0] = 100.0;
s.t. aw_6 : x_6[0] = 0.0;
s.t. aw_7 : x_7[0] = 1.0;
####################################################################
# DIE DYNAMIK DES SYSTEMS:
#
####################################################################
s.t.heun_1 {i in 0..n-1}: x_1[i+1]=x_1[i]+0.5*h*(dgl_1[i]+u_1[i]);
s.t.heun_2 {i in 0..n-1}: x_2[i+1]=x_2[i]+0.5*h*(dgl_2[i]+u_2[i]);
s.t.heun_3 {i in 0..n-1}: x_3[i+1]=x_3[i]+0.5*h*(dgl_3[i]+u_3[i]);
s.t.heun_4 {i in 0..n-1}: x_4[i+1]=x_4[i]+0.5*h*(dgl_4[i]+(u_4[i]+
(1-tau)*((1.0/euler_7[i])*(p[i]*(alpha*(euler_3[i]+euler_4[i])^alpha1*
euler_2[i]^alpha2-u_1[i])-sigma*euler_1[i]-w[i]*euler_2[i])rhok[i]*euler_3[i]-delta*(euler_3[i]+euler_4[i])rhor[i]*euler_4[i])));
s.t. heun_5 {i in 0..n-1}: x_5[i+1] = x_5[i] + 0.5*h * (dgl_5[i]+
(-1.0*u_4[i]+(1-tau)*rhom[i]*euler_5[i]));
s.t. heun_6 {i in 0..n-1}: x_6[i+1] = x_6[i] + 0.5*h * (dgl_6[i]+
((1-tau)*rhor[i]*euler_4[i]));
s.t. heun_7 {i in 0..n-1}: x_7[i+1] = x_7[i] + 0.5*h * (dgl_7[i]+
log(1+zin[i])*(-euler_7[i]));
####################################################################
102
A Beispieldateien: AMPL-Code
# ANGABE DER ZUSTANDS- UND STEUERBESCHRAENKUNGEN
#
####################################################################
s.t. beschr_1 {i in 0..n-1} : u1_min <= u_1[i] <= u1_max;
s.t. beschr_2 {i in 0..n-1} : u2_min <= u_2[i] <= u2_max;
s.t. beschr_3 {i in 0..n-1} : u3_min <= u_3[i] <= u3_max;
s.t. beschr_4 {i in 0..n-1} : u4_min <= u_4[i] <= u4_max;
s.t. beschr_5a {i in 0..n-1} : 50.0 - x_1[i] <= 0.0;
s.t. beschr_5b {i in 0..n-1} : x_1[i]<=200;
s.t. beschr_6 {i in 0..n-1} : 0.0 <= x_2[i];
s.t. beschr_7 {i in 0..n-1} : 0.0 <= x_3[i];
s.t. beschr_8 {i in 0..n-1} : 0.0 <= kappa*x_4[i]-x_3[i];
s.t. beschr_9 {i in 0..n-1} : 0.0 <= x_5[i];
####################################################################
# ANGABE DER ANFANGSSCHAETZUNGEN
#
####################################################################
let {i in 0..n-1} u_1[i] := u1_min;
let {i in 0..n-1} u_2[i] := u2_max;
let {i in 0..n-1} u_3[i] := u3_min;
let {i in 0..n-1} u_4[i] := u4_min;
####################################################################
# AUSWAHL DES SOLVERS
#
####################################################################
# option solver loqo;
option solver ipopt;
# option abs_boundtol 1;
#option rel-boundtol 1e-4;
####################################################################
# ANGABE DER OPTIONALEN LOQO-OPTIONS
#
####################################################################
option loqo_options "verbose=2 timing=1 maxit=2000";
option rel_boundtol 1;
option abs_boundtol 1;
####################################################################
# BEFEHL ZUM LOESEN DES PROBLEMS
#
####################################################################
solve;
####################################################################
# AUSGABE IN DIE JEWEILIGEN DATEIEN
#
103
A Beispieldateien: AMPL-Code
####################################################################
printf {i in 0..n} "%12.6f %12.6f\n", i*h, x_1[i]
> ’/u/balzern/LOQO/
Risikoscheu/vx1h.dat’;
printf {i in 0..n} "%12.6f %12.6f\n", i*h, x_2[i]
> ’/u/balzern/LOQO/
Risikoscheu/vx2h.dat’;
printf {i in 0..n} "%12.6f %12.6f\n", i*h, x_3[i]
> ’/u/balzern/LOQO/
Risikoscheu/vx3h.dat’;
printf {i in 0..n} "%12.6f %12.6f\n", i*h, x_4[i]
> ’/u/balzern/LOQO/
Risikoscheu/vx4h.dat’;
printf {i in 0..n} "%12.6f %12.6f\n", i*h, x_5[i]
> ’/u/balzern/LOQO/
Risikoscheu/vx5h.dat’;
printf {i in 0..n} "%12.6f %12.6f\n", i*h, x_6[i]
> ’/u/balzern/LOQO/
Risikoscheu/vx6h.dat’;
printf {i in 0..n} "%12.6f %12.6f\n", i*h, x_7[i]
> ’/u/balzern/LOQO/
Risikoscheu/vx7h.dat’;
printf {i in 0..n-1} "%12.6f %12.6f\n", i*h, heun_1[i] > ’/u/balzern/
LOQO/Risikoscheu/vlambda1h.dat’;
printf {i in 0..n-1} "%12.6f %12.6f\n", i*h, heun_2[i] > ’/u/balzern/
LOQO/Risikoscheu/vlambda2h.dat’;
printf {i in 0..n-1} "%12.6f %12.6f\n", i*h, heun_3[i] > ’/u/balzern/
LOQO/Risikoscheu/vlambda3h.dat’;
printf {i in 0..n-1} "%12.6f %12.6f\n", i*h, heun_4[i] > ’/u/balzern/
LOQO/Risikoscheu/vlambda4h.dat’;
printf {i in 0..n-1} "%12.6f %12.6f\n", i*h, heun_5[i] > ’/u/balzern/
LOQO/Risikoscheu/vlambda5h.dat’;
printf {i in 0..n-1} "%12.6f %12.6f\n", i*h, heun_6[i] > ’/u/balzern/
LOQO/Risikoscheu/vlambda6h.dat’;
printf {i in 0..n-1} "%12.6f %12.6f\n", i*h, heun_7[i] > ’/u/balzern/
LOQO/Risikoscheu/vlambda7h.dat’;
printf {i in 0..n-1} "%12.6f %12.6f\n", i*h, heun_4[i]-heun_5[i] > ’
/u/balzern/LOQO/Risikoscheu/vsigma4h.dat’;
printf {i in 0..n-1} "%12.6f %12.6f\n", i*h, heun_1[i]-(heun_4[i]*tau*
p[i])/x_7[i] > ’/u/balzern/LOQO/Risikoscheu/vsigma1h.dat’;
printf {i in 0..n-1} "%12.6f %12.6f\n", i*h, u_1[i] > ’/u/balzern/LOQO/
Risikoscheu/vu1h.dat’;
printf {i in 0..n-1} "%12.6f %12.6f\n", i*h, u_2[i] > ’/u/balzern/LOQO/
Risikoscheu/vu2h.dat’;
printf {i in 0..n-1} "%12.6f %12.6f\n", i*h, u_3[i] > ’/u/balzern/LOQO/
104
A Beispieldateien: AMPL-Code
Risikoscheu/vu3h.dat’;
printf {i in 0..n-1} "%12.6f %12.6f\n", i*h, u_4[i] > ’/u/balzern/LOQO/
Risikoscheu/vu4h.dat’;
printf {i in 0..n-1} "%12.6f %12.6f\n", i*h, -(1.0/h)*beschr_5a[i]
>
’/u/balzern/LOQO/Risikoscheu/vmju1h.dat’;
printf {i in 0..n-1} "%12.6f %12.6f\n", i*h, (1.0/h)*beschr_5b[i]
>
’/u/balzern/LOQO/Risikoscheu/vmju1bh.dat’;
printf {i in 0..n-1} "%12.6f %12.6f\n", i*h, (1.0/h)*beschr_6[i]
>
’/u/balzern/LOQO/Risikoscheu/vmju2ah.dat’;
printf {i in 0..n-1} "%12.6f %12.6f\n", i*h, (1.0/h)*beschr_7[i]
>
’/u/balzern/LOQO/Risikoscheu/vmju3h.dat’;
printf {i in 0..n-1} "%12.6f %12.6f\n", i*h, -(1.0/h)*beschr_8[i]
>
’/u/balzern/LOQO/Risikoscheu/vmju2h.dat’;
printf {i in 0..n-1} "%12.6f %12.6f\n", i*h, ((1-tau)/(1+kappa))*
(0.05*heun_4[i]+heun_6[i]*rhor[i]-heun_5[i]*rhom[i])
>
’/u/balzern/LOQO/Risikoscheu/vmju1theoh.dat’;
printf {i in 0..n-1} "%12.6f %12.6f\n", i*h,0.8*(u_4[i]+(1-tau)*
((1.0/x_7[i])*(p[i]*(alpha*(x_3[i]+x_4[i])^alpha1*x_2[i]^alpha2u_1[i])-sigma*x_1[i]-w[i]*x_2[i])-rhok[i]*x_3[i]-delta*(x_3[i]+x_4[i])
-rhor[i]*x_4[i]))
> ’/u/balzern/LOQO/Risikoscheu/vu3theoh.dat’;
105
A Beispieldateien: AMPL-Code
A.2 Komplexes Modell beim variierenden Preis mit
Euler-Verfahren
####################################################################
#
Konzernmodell für risikoscheuen EK-Geber
#
#
beim variierenden Preis
#
#
Euler-Verfahren
#
####################################################################
####################################################################
# DEKLARATION DER PARAMETER:
#
####################################################################
param t_0
:= 0.0;
param t_f
:= 10.0;
param n
:= 1000;
param h
:= (t_f-t_0)/n;
param u1_min := -100.0;
param u1_max := 100.0;
param u2_min := -10.0;
param u2_max := 10.0;
param u3_min := -100.0;
param u3_max := 100.0;
param u4_min := -100.0;
param u4_max := 100.0;
param tau
:= 0.5;
param alpha
:= 100.0;
param alpha1 := 0.35;
param alpha2 := 0.5;
param sigma
:= 0.01;
param delta
:= 0.322;
param kappa
:= 0.8;
param pi
:= 3.1415927;
param kl
:= 8.0;
####################################################################
# DEKLARATION DER VARIABLEN:
#
####################################################################
var x_1 {i in 0..n}:=100;
var x_2 {i in 0..n}:=30;
106
A Beispieldateien: AMPL-Code
var x_3 {i in 0..n}:=50;
var x_4 {i in 0..n}:=100;
var x_5 {i in 0..n}:=100;
var x_6 {i in 0..n}:=0.0;
var x_7 {i in 0..n}:=1.0;
var u_1 {i in 0..n-1};
var u_2 {i in 0..n-1};
var u_3 {i in 0..n-1};
var u_4 {i in 0..n-1};
param k
{i in 0..n} := pi/2.0+(2.0*pi/kl)*i*h;
param w
{i in 0..n} := 2*exp(0.02*i*h);
param zin {i in 0..n} := 0.019+0.029*sin(k[i]);
param rhok {i in 0..n} := 0.110+0.030*sin(k[i]);
param rhom {i in 0..n} := 0.074+0.018*sin(k[i]);
param p
{i in 0..n} := 0.05+0.01*sin(k[i]-(pi/2.0));
param rhor {i in 0..n-1} := rhok[i]-0.05;
var x_22 {i in 0..n}:=(1-tau)*(dgl_4[i]);
####################################################################
# ANGABE DES ZIELFUNKIONALS:
#
####################################################################
minimize Zielfkt: -(x_4[n]+x_5[n]+(1-tau)*p[n]*(x_1[n]/x_7[n]));
####################################################################
# ANGABE DER ANFANGSWERTE:
#
####################################################################
s.t. aw_1 : x_1[0] = 100.0;
s.t. aw_2 : x_2[0] = 30.0;
s.t. aw_3 : x_3[0] = 50.0;
s.t. aw_4 : x_4[0] = 100.0;
s.t. aw_5 : x_5[0] = 100.0;
s.t. aw_6 : x_6[0] = 0.0;
s.t. aw_7 : x_7[0] = 1.0;
####################################################################
# DIE DYNAMIK DES SYSTEMS:
#
####################################################################
s.t. dgl_1 {i in 0..n-1}: x_1[i+1] = x_1[i] + h * (u_1[i]);
s.t. dgl_2 {i in 0..n-1}: x_2[i+1] = x_2[i] + h * (u_2[i]);
107
A Beispieldateien: AMPL-Code
s.t. dgl_3 {i in 0..n-1}: x_3[i+1] = x_3[i] + h * (u_3[i]);
s.t. dgl_4 {i in 0..n-1}: x_4[i+1] = x_4[i] + h * (u_4[i]+(1-tau)*
((1.0/x_7[i])*(p[i]*(alpha*(x_3[i]+x_4[i])^alpha1*x_2[i]^alpha2-u_1[i])
-sigma*x_1[i]-w[i]*x_2[i])-rhok[i]*x_3[i]-delta*(x_3[i]+x_4[i])rhor[i]*x_4[i]));
s.t. dgl_5 {i in 0..n-1}: x_5[i+1] = x_5[i] + h * (-1.0*u_4[i]+
(1-tau)*rhom[i]*x_5[i]);
s.t. dgl_6 {i in 0..n-1}: x_6[i+1] = x_6[i] + h * ((1-tau)*rhor[i]
*x_4[i]);
s.t. dgl_7 {i in 0..n-1}: x_7[i+1] = x_7[i] + h * (log(1+zin[i])*
(-x_7[i]));
####################################################################
# ANGABE DER ZUSTANDS- UND STEUERBESCHRAENKUNGEN
#
####################################################################
s.t. beschr_1 {i in 0..n-1} : u1_min <= u_1[i] <= u1_max;
s.t. beschr_2 {i in 0..n-1} : u2_min <= u_2[i] <= u2_max;
s.t. beschr_3 {i in 0..n-1} : u3_min <= u_3[i] <= u3_max;
s.t. beschr_4 {i in 0..n-1} : u4_min <= u_4[i] <= u4_max;
s.t. beschr_5 {i in 0..n-1} : 50.0 - x_1[i] <= 0.0;
s.t. beschr_6 {i in 0..n-1} : 0.0 <= x_2[i];
s.t. beschr_7 {i in 0..n-1} : 0.0 <= x_3[i];
s.t. beschr_8 {i in 0..n-1} : -kappa*x_4[i]+x_3[i]<= 0;
s.t. beschr_9 {i in 0..n-1} : -x_5[i] <= 0.0;
####################################################################
# ANGABE DER ANFANGSSCHAETZUNGEN
#
####################################################################
let {i in 0..n-1} u_1[i] := u1_min;
let {i in 0..n-1} u_2[i] := u2_min;
let {i in 0..n-1} u_3[i] := u3_min;
let {i in 0..n-1} u_4[i] := u4_min;
####################################################################
# AUSWAHL DES SOLVERS
#
####################################################################
# option solver loqo;
option solver ipopt;
option abs_boundtol 1;
#option rel-boundtol 1e-4;
####################################################################
108
A Beispieldateien: AMPL-Code
# ANGABE DER OPTIONALEN LOQO-OPTIONS
#
####################################################################
#
option loqo_options "verbose=2 timing=1 maxit=500";
####################################################################
# BEFEHL ZUM LOESEN DES PROBLEMS
#
####################################################################
solve;
####################################################################
# AUSGABE IN DIE JEWEILIGEN DATEIEN
#
####################################################################
printf {i in 0..n} "%12.6f %12.6f\n", i*h, x_1[i]
> ’/u/balzern/
LOQO/Risikoscheu/vx1e.dat’;
printf {i in 0..n} "%12.6f %12.6f\n", i*h, x_2[i]
> ’/u/balzern/
LOQO/Risikoscheu/vx2e.dat’;
printf {i in 0..n} "%12.6f %12.6f\n", i*h, x_3[i]
> ’/u/balzern/
LOQO/Risikoscheu/vx3e.dat’;
printf {i in 0..n} "%12.6f %12.6f\n", i*h, x_4[i]
> ’/u/balzern/
LOQO/Risikoscheu/vx4e.dat’;
printf {i in 0..n} "%12.6f %12.6f\n", i*h, x_5[i]
> ’/u/balzern/
LOQO/Risikoscheu/vx5e.dat’;
printf {i in 0..n} "%12.6f %12.6f\n", i*h, x_6[i]
> ’/u/balzern/
LOQO/Risikoscheu/vx6e.dat’;
printf {i in 0..n} "%12.6f %12.6f\n", i*h, x_7[i]
> ’/u/balzern/
LOQO/Risikoscheu/vx7e.dat’;
printf {i in 0..n-1} "%12.6f %12.6f\n", i*h, dgl_1[i] > ’/u/balzern/
LOQO/Risikoscheu/vlambda1e.dat’;
printf {i in 0..n-1} "%12.6f %12.6f\n", i*h, dgl_2[i] > ’/u/balzern/
LOQO/Risikoscheu/vlambda2e.dat’;
printf {i in 0..n-1} "%12.6f %12.6f\n", i*h, dgl_3[i] > ’/u/balzern/
LOQO/Risikoscheu/vlambda3e.dat’;
printf {i in 0..n-1} "%12.6f %12.6f\n", i*h, dgl_4[i] > ’/u/balzern/
LOQO/Risikoscheu/vlambda4e.dat’;
printf {i in 0..n-1} "%12.6f %12.6f\n", i*h, dgl_5[i] > ’/u/balzern/
LOQO/Risikoscheu/vlambda5e.dat’;
printf {i in 0..n-1} "%12.6f %12.6f\n", i*h, dgl_6[i] > ’/u/balzern/
LOQO/Risikoscheu/vlambda6e.dat’;
printf {i in 0..n-1} "%12.6f %12.6f\n", i*h, dgl_7[i] > ’/u/balzern/
LOQO/Risikoscheu/vlambda7e.dat’;
109
A Beispieldateien: AMPL-Code
printf {i in 0..n-1} "%12.6f %12.6f\n", i*h, dgl_4[i]-dgl_5[i] > ’
/u/balzern/LOQO/Risikoscheu/vsigma4e.dat’;
printf {i in 0..n-1} "%12.6f %12.6f\n", i*h, dgl_1[i]-(dgl_4[i]*tau
*p[i])/x_7[i] > ’/u/balzern/LOQO/Risikoscheu/vsigma1e.dat’;
printf {i in 0..n-1} "%12.6f %12.6f\n", i*h, u_1[i]
> ’/u/balzern/
LOQO/Risikoscheu/vu1e.dat’;
printf {i in 0..n-1} "%12.6f %12.6f\n", i*h, u_2[i]
> ’/u/balzern
LOQO/Risikoscheu/vu2e.dat’;
printf {i in 0..n-1} "%12.6f %12.6f\n", i*h, u_3[i]
> ’/u/balzern/
LOQO/Risikoscheu/vu3e.dat’;
printf {i in 0..n-1} "%12.6f %12.6f\n", i*h, u_4[i]
> ’/u/balzern/
LOQO/Risikoscheu/vu4e.dat’;
printf {i in 0..n-1} "%12.6f %12.6f\n", i*h, rhok[i]
> ’/u/balzern/
LOQO/Risikoscheu/rhokv.dat’;
printf {i in 0..n-1} "%12.6f %12.6f\n", i*h, rhor[i] +rhom[i] > ’
/u/balzern/LOQO/Risikoscheu/rhormv.dat’;
printf {i in 0..n-1} "%12.6f %12.6f\n", i*h, ((1-tau)/(1+kappa))*
(0.05*dgl_4[i]+dgl_6[i]*rhor[i]-dgl_5[i]*rhom[i])
> ’/u/balzern/LOQO/
Risikoscheu/vmju1theo.dat’;
printf {i in 0..n-1} "%12.6f %12.6f\n", i*h, ((1-tau)*dgl_4[i]*(p[i]
-sigma))/x_7[i]
> ’/u/balzern/LOQO/Risikoscheu/vmju2theo.dat’;
printf {i in 0..n-1} "%12.6f %12.6f\n", i*h, -(1.0/h)*beschr_5[i] > ’
/u/balzern/LOQO/Risikoscheu/vmju1e.dat’;
printf {i in 0..n-1} "%12.6f %12.6f\n", i*h, (1.0/h)*beschr_6[i] > ’
/u/balzern/LOQO/Risikoscheu/vmju1be.dat’;
printf {i in 0..n-1} "%12.6f %12.6f\n", i*h, (1.0/h)*beschr_7[i] > ’
/u/balzern/LOQO/Risikoscheu/vmju3e.dat’;
printf {i in 0..n-1} "%12.6f %12.6f\n", i*h, -(1.0/h)*beschr_8[i] > ’
/u/balzern/LOQO/Risikoscheu/vmju2e.dat’;
printf {i in 0..n-1} "%12.6f %12.6f\n", i*h, (1.0/h)*beschr_9[i] > ’
/u/balzern/LOQO/Risikoscheu/vmju5e.dat’;
printf {i in 0..n-1} "%12.6f %12.6f\n", i*h, 0.8*(u_4[i]+(1-tau)*
((1.0/x_7[i])*(p[i]*(alpha*(x_3[i]+x_4[i])^alpha1*x_2[i]^alpha2u_1[i])-sigma*x_1[i]-w[i]*x_2[i])-rhok[i]*x_3[i]-delta*(x_3[i]+x_4[i])rhor[i]*x_4[i])) > ’/u/balzern/LOQO/Risikoscheu/vu3theo.dat’;
printf {i in 0..n-1} "%12.6f %12.6f\n", i*h, 0.05+0.01*sin(k[i]-(pi/2))
> ’/u/balzern/LOQO/Risikoscheu/preis.dat’;
printf {i in 0..n-1} "%12.6f %12.6f\n", i*h, 2*exp(0.02*i*h) > ’
110
A Beispieldateien: AMPL-Code
/u/balzern/LOQO/Risikoscheu/kosten.dat’;
111
B Eidesstattliche Erklärung
Ich versichere hiermit, dass ich diese Arbeit selbständig verfasst habe und neben
der beiden Optimierungspakete, LOQO von Prof. R. J. Vanderbei und IPOPT von
A. Wächter und L. T. Biegler, keine weiteren als die im Literaturverzeichnis angegebenen Hilfsmittel verwendet habe.
Münster, den 30. Juli 2006
112
C Danksagung
Herrn Prof. Dr. Maurer danke ich für die interessante Themenstellung und stets
wohlwollende und freundliche Betreuung. Des Weiteren gilt mein Dank Herrn Georg
Vossen sowie Herrn K. Theißen für die zahlreichen Hilfestellungen.
113
D Literaturverzeichnis
[1] Ch. Büskens: Optimierungsmethoden und Sensitivitätsanalyse für optimale
Steuerprozesse mit Steuer- und Zustandsbeschränkungen, Dissertation am Institut für numerische und instrumentelle Mathematik der Universität Münster,
1998.
[2] N. A. Derzko, S. P. Sethi, G. L. Thompson: Necessary and sufficient conditions for optimal control of quasulinear partial differential systems, Journal of
Optimization Theory and Applications, S. 89-101, 1984.
[3] G. Feichtinger, R. F. Hartl: Optimale Kontrolle ökonomischer Prozesse, Walter
de Gruyter, Berlin, New-York, 1986.
[4] R. F. Hartl, S. P. Sethi, R. G. Vickson: A Survey of the Maximum Principle
for Optimal Control Problems with State Constraints, SIAM Review, Vol. 37,
S. 181-218, Juni 1995.
[5] J. R. Kim:Optimierungsmethoden und Sensitivitätsanalyse für optimale bangbang Steuerungen mit Anwendungen in der Nichtlinearen Optik, Dissertation
am Institut für numerische und instrumentelle Mathematik der Universität
Münster, 2002.
[6] H. W. Knobloch, F. Kappel: Gewöhnliche Differentialgleichungen, B. G. Teubner Verlagsgesellschaft, Stuttgart, 1974.
[7] B. Koslik: Entwicklung eines komplexen Unternehmensmodells und numerische
Berechnung optimaler Steuerungen mit direkten und indirekten Verfahren, Diplomarbeit, Technische Universität München, Mai 1994.
[8] J. Lesourne, R. Leban: La Substitution Capital-Travail au Cours de la
Croissance de l‘Entreprise, Revue d‘Economie Politique, Vol. 4, S. 540-564,
1978.
[9] D. G. Luenberger: Introduction to Linear and Nonlinear Programming,
Addison-Wesley Publishing Company, Inc., Reading, Massachusetts, 1973.
114
D Literaturverzeichnis
[10] H. Maurer: Optimale Steuerprozesse, Vorlesung der Westfälischen Wilhelms
Universität Münster, WS 02/03.
[11] H. Maurer: On the Minimum Principle for Optimal Control Problems with State
Constraints, Schriftenreihe des Rechenzentrums der Universität Münster, ISSN
o344-o842, Oktober 1979.
[12] H. Maurer: On Optimal Control Problems with Bounded State Variables and
Control Appearing Linearly, SIAM Journal on Control and Optimization, Vol.
15, No. 3, 1976.
[13] H. Maurer: Optimierung, Vorlesung der Westfälischen Wilhelms Universität
Münster, WS 01/02.
[14] L. Perridon, M. Steiner: Finanzwirtschaft der Unternehmung, Verlag Vahlen,
11 Auflage.
[15] R. T. Rockafellar: Convex Analysis, Princeton Univ. Press, Princeton, 1970.
[16] R. J. Vanderbei, D. F. Shanno: An Interior-Point Algorithm for Nonkonvex
Nonlinear Programming, Computational Optimization and Applications, Vol.
13, S. 231-252, 1999.
[17] A. Wächter, L. T. Biegler: On the Implementation of an Interior-Point Filter
Line-Search Algorithm for Large-Scale Nonlinear Programming, Mathematical
Programming 106(1), pp. 25-57, 2006 (As Research Report RC 23149, IBM T.
J. Watson Research Center, Yorktown, USA.
[18] S. Winderl, B. Naumer: On a State Constrained Optimal Control
Problem in Economics with Four Linear Controls, Preprint 00-9,
< http://www.zib.de/dfg-echtzeit/Publikationen >.
115
Herunterladen