Optimale Steuerung ökonomischer Prozesse am Beispiel eines

Westfälische Wilhelms-Universität Münster
Institut für numerische und instrumentelle Mathematik
Diplomarbeit
Optimale Steuerung ökonomischer
Prozesse am Beispiel eines
komplexen Unternehmensmodells mit
bang-bang, singulären Steuerungen
und Zustandsbeschränkungen
Nadja Balzer
Betreuer: Prof. Dr. H. Maurer
Februar 2006
Inhaltsverzeichnis
1 Einleitung
1
2 Theorie der optimalen Steuerprozesse
2.1 Formulierung optimaler Steuerprozesse . . . . . . . . . . . . . . . .
2.2 Äquivalente Umformungen eines Steuerprozesses . . . . . . . . . . .
2.2.1 Transformation eines Bolza-Problems auf ein MayerProblem . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.2.2 Transformation einer freien Endzeit auf eine feste Endzeit .
2.2.3 Transformation nicht-autonomer Probleme auf autonome Probleme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.3 Das Minimumprinzip von Pontryagin . . . . . . . . . . . . . . . . .
2.4 Probleme mit linear auftretender Steuerung - Bang-bang und singuläre Steuerungen . . . . . . . . . . . . . . . . . . . . . . . . . . .
.
.
5
5
8
.
.
8
9
. 10
. 10
. 12
3 Optimale Steuerprozesse mit reinen Zustandsbeschränkungen
15
3.1 Grundbegriffe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
3.2 Direkte Methode - Direct adjoining approach“ . . . . . . . . . . . . 18
”
3.3 Indirekte Methode - Indirect adjoining approach“ . . . . . . . . . . . 20
”
4 Hinreichende Optimalitätsbedingungen
24
4.1 Exkurs in die nichtlineare Optimierung . . . . . . . . . . . . . . . . . 24
4.2 Konvexe Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
4.3 Hinreichende Optimalitätsbedingungen für unbeschränkte Steuerprozesse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
4.4 Hinreichende Optimalitätsbedingungen für OSP mit Zustandsbeschränkungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
5 Numerische Lösung optimaler Steuerprozesse mittels direkter Verfahren 37
5.1 Diskretisierung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
5.2 Vor- und Nachteile der direkten Verfahren . . . . . . . . . . . . . . . 39
ii
Inhaltsverzeichnis
6 Das
6.1
6.2
6.3
6.4
6.5
modifizierte Modell von Lesourne und Leban
Beschreibung des Modells von Lesourne und Leban . . .
Formulierung des modifizierten Steuerungsproblems . . .
Auswertung des Minimumprinzips . . . . . . . . . . . . .
Numerische Ergebnisse . . . . . . . . . . . . . . . . . . .
Überprüfung der hinreichenden Optimalitätsbedingungen
7 Ein
7.1
7.2
7.3
7.4
komplexes Unternehmensmodell
Beschreibung des komplexen Unternehmensmodells . . . . . . . . .
Formulierung des komplexen Steuerungsproblems . . . . . . . . . .
Auswertung des erweiterten Minimumprinzips . . . . . . . . . . . .
Numerische Ergebnisse . . . . . . . . . . . . . . . . . . . . . . . . .
7.4.1 Optimale Steuerung des komplexen Unternehmensmodells bei
variierendem Preis . . . . . . . . . . . . . . . . . . . . . . .
7.4.2 Optimale Steuerung des komplexen Unternehmensmodells bei
konstantem Preis . . . . . . . . . . . . . . . . . . . . . . . .
7.4.3 Optimale Steuerung des komplexen Unternehmensmodells bei
Verdoppelung der Planungsperiode . . . . . . . . . . . . . .
8 Schlussbemerkung
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
41
41
44
45
48
57
.
.
.
.
61
61
66
68
71
. 71
. 84
. 92
99
A Beispieldateien: AMPL-Code
100
A.1 Komplexes Modell beim variierenden Preis mit Heun-Verfahren . . . 100
A.2 Komplexes Modell beim variierenden Preis mit Euler-Verfahren . . . 106
B Eidesstattliche Erklärung
112
C Danksagung
113
D Literaturverzeichnis
114
iii
Abbildungsverzeichnis
3.1
6.1
6.2
6.3
6.4
6.5
7.1
7.2
7.3
7.4
7.5
7.6
7.7
7.8
7.9
7.10
7.11
7.12
7.13
7.14
7.15
7.16
7.17
7.18
7.19
7.20
7.21
Zustandsbeschränkung xmin ≤ x(t) ≤ xmax
. . . . . . . . . . . 16
Die optimalen Steuerungen des modifizierten Modells . . . . . . . .
Die optimalen Trajektorien des modifizierten Modells . . . . . . . .
Die optimalen Adjungierten des modifizierten Modells . . . . . . .
Die Schaltfunktionen des modifizierten Modells . . . . . . . . . . .
Multiplikatorfunktion: (links) mittels IPOPT erhaltene µ(t), (rechts)
theoretisch ausgerechnete µ(t) . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
Die steigende Lohnkostenfunktion . . . . . . . . . . . .
Veranschaulichung des komplexen Unternehmensmodells
x1 bei variierendem Preis . . . . . . . . . . . . . . . . .
x3 bei variierendem Preis . . . . . . . . . . . . . . . . .
x5 bei variierendem Preis . . . . . . . . . . . . . . . . .
x2 bei variierendem Preis . . . . . . . . . . . . . . . . .
x4 bei variierendem Preis . . . . . . . . . . . . . . . . .
x6 bei variierendem Preis . . . . . . . . . . . . . . . . .
x7 bei variierendem Preis . . . . . . . . . . . . . . . . .
λ2 bei variierendem Preis . . . . . . . . . . . . . . . . .
λ4 bei variierendem Preis . . . . . . . . . . . . . . . . .
λ1 bei variierendem Preis . . . . . . . . . . . . . . . . .
λ3 beim variierenden Preis . . . . . . . . . . . . . . . . .
λ5 bei variierendem Preis . . . . . . . . . . . . . . . . .
λ6 bei variierendem Preis . . . . . . . . . . . . . . . . .
u1 bei variierendem Preis . . . . . . . . . . . . . . . . .
u3 bei variierendem Preis . . . . . . . . . . . . . . . . .
λ7 bei variierendem Preis . . . . . . . . . . . . . . . . .
u2 bei variierendem Preis . . . . . . . . . . . . . . . . .
u4 bei variierendem Preis . . . . . . . . . . . . . . . . .
Σ1 bei variierendem Preis . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
iv
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
49
50
51
52
. 53
63
65
72
72
72
72
72
72
73
73
73
73
73
73
74
74
74
74
74
74
75
Abbildungsverzeichnis
7.22
7.23
7.24
7.25
7.26
7.27
7.28
7.29
7.30
7.31
7.32
7.33
7.34
7.35
7.36
7.37
7.38
7.39
7.40
7.41
7.42
7.43
7.44
7.45
7.46
7.47
7.48
7.49
7.50
7.51
7.52
7.53
7.54
7.55
7.56
7.57
7.58
7.59
Σ3 bei variierendem Preis . . . . . . . . . .
µ1 bei variierendem Preis . . . . . . . . . .
Σ2 bei variierendem Preis . . . . . . . . . .
Σ4 bei variierendem Preis . . . . . . . . . .
µ2 bei variierendem Preis . . . . . . . . . .
Variierende Preisfunktion p2 (t). . . . . . . .
Zinsfunktionen (links); Inflationsrate (rechts)
x1 bei konstantem Preis . . . . . . . . . . .
x3 bei konstantem Preis . . . . . . . . . . .
x5 bei konstantem Preis . . . . . . . . . . .
x2 bei konstantem Preis . . . . . . . . . . .
x4 bei konstantem Preis . . . . . . . . . . .
x6 bei konstantem Preis . . . . . . . . . . .
x7 bei konstantem Preis . . . . . . . . . . .
λ2 bei konstantem Preis . . . . . . . . . . .
λ4 bei konstantem Preis . . . . . . . . . . .
λ1 bei konstantem Preis . . . . . . . . . . .
λ3 bei konstantem Preis . . . . . . . . . . .
λ5 bei konstantem Preis . . . . . . . . . . .
λ6 bei konstantem Preis . . . . . . . . . . .
u1 bei konstantem Preis . . . . . . . . . . .
u3 bei konstantem Preis . . . . . . . . . . .
λ7 bei konstantem Preis . . . . . . . . . . .
u2 bei konstantem Preis . . . . . . . . . . .
u4 bei konstantem Preis . . . . . . . . . . .
Σ1 bei konstantem Preis . . . . . . . . . . .
Σ3 bei konstantem Preis . . . . . . . . . . .
µ1 bei konstantem Preis . . . . . . . . . . .
Σ2 bei konstantem Preis . . . . . . . . . . .
Σ4 bei konstantem Preis . . . . . . . . . . .
µ2 bei konstantem Preis . . . . . . . . . . .
x1 bei Verdoppelung der Planungsperiode .
x3 bei Verdoppelung der Planungsperiode .
x5 bei Verdoppelung der Planungsperiode .
x2 bei Verdoppelung der Planungsperiode .
x4 bei Verdoppelung der Planungsperiode .
x6 bei Verdoppelung der Planungsperiode .
x7 bei Verdoppelung der Planungsperiode .
v
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
75
75
75
75
75
77
83
85
85
85
85
85
85
86
86
86
86
86
86
87
87
87
87
87
87
88
88
88
88
88
88
93
93
93
93
93
93
94
Abbildungsverzeichnis
7.60
7.61
7.62
7.63
7.64
7.65
7.66
7.67
7.68
7.69
7.70
7.71
7.72
7.73
7.74
7.75
7.76
λ2 bei Verdoppelung der Planungsperiode
λ4 bei Verdoppelung der Planungsperiode
λ1 bei Verdoppelung der Planungsperiode
λ3 bei Verdoppelung der Planungsperiode .
λ5 bei Verdoppelung der Planungsperiode
λ6 bei Verdoppelung der Planungsperiode
u1 bei Verdoppelung der Planungsperiode
u3 bei Verdoppelung der Planungsperiode
λ7 bei Verdoppelung der Planungsperiode
u2 bei Verdoppelung der Planungsperiode
u4 bei Verdoppelung der Planungsperiode
Σ1 bei Verdoppelung der Planungsperiode
Σ3 bei Verdoppelung der Planungsperiode
µ1 bei Verdoppelung der Planungsperiode
Σ2 bei Verdoppelung der Planungsperiode
Σ4 bei Verdoppelung der Planungsperiode
µ2 bei Verdoppelung der Planungsperiode
vi
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
94
94
94
94
94
95
95
95
95
95
95
96
96
96
96
96
96
Tabellenverzeichnis
6.1
6.2
6.3
Liste der gewählten Parameter für modifiziertes Modell . . . . . . . . 45
Optimale Schaltstruktur des modifizierten Problems . . . . . . . . . 48
Schaltpunkte des modifizierten Problems . . . . . . . . . . . . . . . . 48
7.1
7.2
Liste der Parameter des komplexen Unternehmensmodells . . . . .
Vergleich der Rechenzeiten für unterschiedliche Parameter bei 5000
Diskretisierungspunkten. . . . . . . . . . . . . . . . . . . . . . . . .
Schaltstruktur der optimalen Steuerungen bei variierendem Preis .
Schaltstruktur der optimalen Steuerungen bei konstantem Preis . .
Schaltstruktur der optimalen Steuerungen bei variierendem Preis .
7.3
7.4
7.5
vii
. 68
.
.
.
.
71
76
89
97
1 Einleitung
Die Theorie der optimalen Steuerprozesse kann dem Oberbegriff Optimierung“ un”
tergeordnet werden, sie beschäftigt sich mit der Minimierung bzw. Maximierung
eines Leistungsmaßes in einem Zeitintervall unter Berücksichtigung bestimmter Nebenbedingungen. Einen wichtigen Teil dieser Nebenbedingungen bildet das dynamische System, welches einen realen Vorgang meist durch gewöhnliche Differentialgleichungen beschreibt. Durch die Einführung einer so genannten Steuerfunktion kann
auf die Dynamik des Prozesses von außen Einfluss genommen werden. Nicht zuletzt
dank dieser Eigenschaften gewinnen die Steuerprozesse in den unterschiedlichsten
Gebieten immer mehr an Bedeutung. Die Anwendung der Theorie der optimalen
Steuerprozesse findet man heute sowohl in der Medizin, Physik, Chemie als auch in
der Ökonomie.
In den Wirtschaftswissenschaften ist die Optimierung ein fester Bestandteil der Lehre. Im Laufe der letzten Jahrzehnte hat sich unter dem Namen Operations Research
ein eigenständiger Zweig, der sich unter anderem mit den Optimierungsproblemen
befasst, entwickelt. Zu den Aufgaben des Operations Research gehören:
• die Ermittlung relevanter Einflussgrößen für ein reales Problem,
• die Erstellung eines (typischerweise mathematischen) Modells, das ein vereinfachtes Abbild der Realität darstellt,
• das Lösen des Problems,
• die anschließende Auswertung der Ergebnisse.
Die meisten in Operations Research angewendeten Methoden sind statischer“ Art,
”
d. h. der zugrunde liegende Sachverhalt wird nur zu einem Zeitpunkt oder während
eines relativ kurzen Zeitintervalls ohne jegliche zeitliche Änderung betrachtet. Die
Vernachlässigung des dynamischen Elements in der wirtschaftlichen Planung zählt
jedoch zu den größten Nachteilen der besagten Methoden. Die Theorie der optimalen Steuerprozesse bietet dagegen das richtige Instrumentarium zur Behandlung
der Probleme, bei denen die Veränderung des Systems im Zeitablauf eine signifikante Rolle spielt. In der Ökonomie beschränkten sich die Berechnungen der optimalen Steuerung lange Zeit auf vergleichsweise einfache Modelle, die man analytisch
1
1 Einleitung
lösen konnte. Durch die Entwicklung leistungsfähigerer Verfahren, die auf modernen
Rechnern Aufgaben mit einer Vielzahl von Variablen und Nebenbedingungen mit
vertretbarem Aufwand lösen können, ist die Berechnung der optimalen Steuerung
für komplexe Modelle ermöglicht worden.
In dem hier behandelten Unternehmensmodell, das den Schwerpunkt der vorliegenden Arbeit bildet, geht es um solch einen komplexen optimalen Steuerprozess
aus dem Bereich des Unternehmenswachstums. Das komplexe Unternehmensmodell
wurde, ausgehend von dem Modell von Lesourne und Leban, von B. Koslik in ihrer
Diplomarbeit im Jahre 1994 aufgestellt. Die Problematik besteht darin ein Unternehmen mithilfe von Investitionen, Kreditauf-/abbau, gegebenenfalls Änderung des
Lagerbestandes und/oder der Anzahl der Beschäftigten so zu steuern, dass der Gewinn der Eigenkapitalgeber am Ende der Planungsperiode maximiert wird. Wie bei
den meisten ökonomischen Modellen sind auch hier bestimmte Ressourcen nur beschränkt verfügbar, z. B. sind die Beschaffung des Kapitals sowie die Lagerung der
Ware nur begrenzt möglich, außerdem dürfen die Zustandsvariablen nicht negativ
werden. Somit handelt es sich hier also um einen optimalen Steuerprozess mit reinen
Zustandsbeschränkungen.
Doch bevor man mit der Bearbeitung ausgewählter praxisbezogener Beispiele aus der
Wirtschaft beginnt, ist eine theoretische Basis der optimalen Steuerprozesse nötig.
Im zweiten Kapitel werden alle zur Formulierung und Lösung der unbeschränkten
Steuerprozesse benötigten Definitionen und Sätze vorgestellt. Diese beinhalten das
Pontryaginsche Minimumprinzip, welches die notwendigen Optimalitätsbedingungen
der optimalen Steuerprozesse darstellt. Darüber hinaus wird in Abschnitt 2.4 näher
auf die Prozesse mit linear auftretender Steuerung eingegangen. Bei solchen Problemen können zwei verschieden Arten der Steuerung vorkommen, nämlich bang-bang
Steuerungen und die singulären Steuerungen. Die bang-bang Steuerungen sind unstetig, sie nehmen nur Werte auf dem Rand des Steuerbereiches an. Die singulären
Steuerungen dagegen können einen beliebigen Verlauf innerhalb des zulässigen Steuerbereiches aufzeigen und sind schwerer zu bestimmen.
Die Bearbeitung von Steuerprozessen mit Zustandsbeschränkungen bedarf einiger
Erweiterungen der notwendigen Optimalitätsbedingungen der unbeschränkten Prozesse. Dabei spielt der Begriff der Ordnung einer Beschränkung eine wichtige Rolle.
In Rahmen dieser Arbeit werden zwei verschiedene Methoden zur Behandlung von
optimalen Steuerprozessen mit reinen Zustandsbeschränkungen beschrieben: die direkte und die indirekte Methode. Beide Verfahren führen auf die Begriffsbildung der
erweiterten Hamiltonfunktion zurück. Die direkte Methode ist dadurch gekennzeichnet, dass die Zustandsbeschränkung mit einem Multiplikator direkt an die Hamiltonfunktion angehängt wird. Bei der indirekten Methode wird erst die Beschränkung
2
1 Einleitung
solange total differenziert bis die Steuerungsvariable explizit in der Ableitung auftaucht und diesen Term koppelt man dann an die Hamiltonfunktion an. Die indirekte
Methode wird in der vorliegenden Arbeit hauptsächlich der Vollständigkeit halber
vorgestellt, zur Behandlung der praktischen Beispiele wird ausschließlich die direkte
Methode verwendet.
Mittels der notwendigen Optimalitätsbedingungen werden nur Kandidaten für das
Vorliegen eines Optimums bestimmt. Um sicher zu stellen, dass es sich bei der berechneten Lösung tatsächlich um eine Minimal- bzw. Maximalstelle handelt, ist man
auf hinreichenden Optimalitätsbedingungen angewiesen. Für viele Probleme wurde jedoch bis heute noch keine umfassende Theorie der hinreichenden Bedingungen entwickelt. So gibt es z. B. auch keine hinreichenden Kriterien, um die Lösung
des komplexen Unternehmensmodells prüfen zu können. Es existiert aber eine sehr
große Klasse der optimalen Steuerprozesse, bei denen gezeigt werden kann, dass
die notwendigen Optimalitätsbedingungen auch hinreichend sind. Dabei handelt es
sich, falls die Minimierung eines Zielfunktionals gefordert wird, um die so genannten
konvexen Probleme“. Diese sind in den ökonomischen Anwendungen besonders oft
”
vertreten, dazu zählt z. B. auch das modifizierte Modell. Aus diesem Grund wird in
Kapitel 4 erst der Begriff der Konvexität definiert und näher erläutert. Anschließend
werden die Beweise der hinreichenden Optimalitätsbedingungen unter zusätzlichen
Konvexitätsannahmen für unbeschränkte und zustandsbeschränkte Steuerprozesse
durchgeführt.
Aufgrund der Komplexität sind viele praktische Probleme analytisch nicht mehr
lösbar, wie z. B. komplexes Unternehmensmodell, welches in Kapitel 7 behandelt
wird. Deshalb wird in Kapitel 5 kurz die Vorgehnsweise bei numerischer Bearbeitung der optimalen Steuerprozesse erläutert.
Im Kapitel 6 wird zuerst ein von Lesourne und Leban (1978) entwickeltes Modell
vorgestellt. Dieses, aus dem Bereich des Firmenwachstums stammende Modell, verfolgt das Ziel den diskontierten Zahlungsstrom an Dividenden zu minimieren. Der
Zustand des Unternehmens wird durch das Eigenkapital und das Fremdkapital beschrieben. Dabei kann das dynamische System durch die Steuerungen, wie Beschäftigungsänderung, Investitionen und Dividendenzahlungen, beeinflusst werden. Den
Kern der vorliegenden Arbeit bilden die optimalen Steuerprozesse mit Zustandsbeschränkungen und linear eingehenden Steuerungen. Da aber eine der genannten
Steuerungen, nämlich die Beschäftigungsänderung im Ursprungsmodell von Lesourne und Leban nicht linear auftritt, wird das Beispiel in Abschnitt 6.2 ein wenig
verändert. In den nachfolgenden Abschnitten 6.3, 6.4 werden die notwendigen Optimalitätsbedingungen diskutiert und die optimale Lösung des modifizierten Problems
vorgestellt. Zudem wird in Abschnitt 6.5 gezeigt, dass dieses Beispiel die zusätzlichen
3
1 Einleitung
Konvexitätsannahmen erfüllt. Somit erweisen sich hier die notwendigen Bedingungen für ein Minimum als hinreichend.
Schließlich wird in Kapitel 7 das oben angesprochene komplexe Unternehmensmodell bearbeitet. Hier wird zunächst eine Lösung des Modells mit einem variierenden
Produktpreis bei zehnjähriger Planung, inklusive einer ausführlichen Diskussion der
Theorie, vorgestellt. Anschließend wird die Lösung bei konstantem Preis angegeben
und beide optimalen Strategien miteinander verglichen. Als Letztes wird geprüft
wie empfindlich die optimalen Trajektorien (am Beispiel mit variierendem Preis)
gegenüber einer Änderung der Planungszeitdauer sind. Anhand einer Analyse der
erhaltenen Ergebnisse wird veranschaulicht, dass dieses komplexe Unternehmensmodell sehr realitätsnahe und aussagekräftig ist.
Alle Beispiele in dieser Arbeit wurden mithilfe der beiden Optimierungssolver LOQO von Prof. R. J. Vanderbei und/oder IPOPT von A. Wächter und L. T. Biegler
bearbeitet. Eine CD mit den Kopien der entsprechenden Eingabedateien ist am Ende
der Arbeit beigefügt, außerdem findet man zwei ausgewählte Beispiele im Anhang.
4
2 Theorie der optimalen
Steuerprozesse
In diesem einführenden Kapitel werden in Anlehnung an Maurer [10] die wesentlichen Definitionen und Sätze der unbeschränkten optimalen Steuerprozesse bereitgestellt. Eine zentrale Rolle dabei spielt das Minimumprinzip von Pontryagin, welches die notwendigen Optimalitätsbedingungen für eine optimale Steuerung angibt.
Außerdem wird ein besonderer Schwerpunkt auf Probleme mit linear auftretender
Steuerung gelegt.
2.1 Formulierung optimaler Steuerprozesse
Betrachtet wird ein System, das durch n Differentialgleichungen erster Ordnung
bestimmt ist. Der Zustandsvektor
x(t) = (x1 (t), . . . , xn (t))T ∈ Rn
des Systems beinhaltet alle Variablen, welche das Verhalten des Systems auf dem
Zeitintervall [0, tf ] beschreiben. Die Endzeit tf wird, je nach Problemstellung, entweder fest vorgegeben oder fungiert als eine freie zusätzliche Variable. Durch den
Steuervektor
u(t) = (u1 (t), . . . , um (t))T ∈ Rm
kann der Zustand zu jedem Zeitpunkt t beeinflusst werden.
Definition 2.1.1 Das System von Differentialgleichungen
ẋ(t) =
dx(t)
= f (t, x(t), u(t))
dt
wird als Dynamik des Systems bezeichnet. Hierbei sei
f : [0, tf ] × Rn × Rm −→ Rn
stetige und bzgl. x ∈ Rn , u ∈ Rm stetig partiell differenzierbare Funktion.
5
(2.1)
2 Theorie der optimalen Steuerprozesse
Definition 2.1.2 Ein Funktionenpaar (x, u) mit x : [0, tf ] −→ Rn stückweise stetig
differenzierbar und u : [0, tf ] −→ Rm stückweise stetig heißt Lösung von (2.1), falls
gilt
dx(t)
= f (t, x(t), u(t))
ẋ(t) =
dt
für alle Stetigkeitsstellen t ∈ [0, tf ] von u(t).
In der Regel muss der Zustandsvektor x(t) an bestimmten Stellen gewisse Nebenbedingungen, etwa
x(ti ) ∈ Mti , ti ∈ [0, tf ], i = 1, . . . , k
(2.2)
mit abgeschlossenen Mengen Mti ⊂ Rn , erfüllen. In den praktischen Beispielen sind
diese häufig nur für den Anfangszustand x(0) und den Endzustand x(tf ) in der Form
von Gleichungen
M0 := {x ∈ Rn | ϕ(x) = 0}
Mtf := {x ∈ Rn | ψ(x) = 0}
mit den stetig differenzierbaren Funktionen ϕ : Rn → Rs , ψ : Rn → Rr , 0 ≤ s, r ≤ n
vorgegeben. Die Randbedingungen (2.2) bedeuten demnach:
ϕ(x(0)) = 0 ,
ψ(x(tf )) = 0
(2.3)
Für den Fall s = 0, bzw. r = 0 ergibt sich dann M0 = Rn , bzw. Mtf = Rn , dass also
x(0) bzw. x(tf ) frei ist. In den meisten Anwendungen treten jedoch die Randbedingungen in einer einfacheren Struktur auf, als so genannte Standard-Randbedingungen.
Definition 2.1.3 Die Randbedingungen der Form
x(0) = x0
,
ψ(x(tf )) = 0
(2.4)
mit x0 ∈ Rn fest, ψ : Rn → Rr wie oben, nennt man Standard-Randbedingungen.
Eine weitere wichtige Komponente eines optimalen Steuerprozesses bildet der Steuerbereich U , durch den für die Steuerung u der zulässige Wertebereich festgelegt
wird.
Definition 2.1.4 Eine nichtleere, konvexe und abgeschlossene Teilmenge U ⊂ Rm ,
die die zulässige Wertemenge für den Steuervektor
u(t) ∈ U
∀ t ∈ [0, tf ]
(2.5)
enthält, nennt man Steuerbereich.
Definition 2.1.5 Ein Funktionenpaar (x(·), u(·)) heißt zulässig zur Endzeit tf > 0,
wenn die Nebenbedingungen (2.1)-(2.5) erfüllt sind.
6
2 Theorie der optimalen Steuerprozesse
Schließlich wird durch das Zielfunktional die zu optimierende Größe eines optimalen
Steuerprozesses gegeben. Dabei wird in der Literatur je nach Verfasser unter opti”
miere“ entweder minimiere“ oder auch maximiere“ verstanden. In der vorliegenden
”
”
Arbeit handelt es sich jedoch stets um die Minimierung einer Funktion.
Definition 2.1.6 Die Funktion
F (x, u) := g (x(tf )) +
Z
tf
f0 (t, x(t), u(t)) dt
(2.6)
0
wird als Zielfunktional bezeichnet. Hierbei seien g : Rn → R stetig differenzierbar
und f0 : [0, tf ] × Rn × Rm → Rn stetige und bzgl. x ∈ Rn , u ∈ Rm stetig partiell
differenzierbare Funktionen.
Mit den obigen Bezeichnungen und Definitionen kann man nun einen optimalen
Steuerprozess in eine Kurzform zusammenfassen.
Definition 2.1.7 Kompakte Form eines Optimalen Steuerprozesses:
M inimiere F (x, u) := g (x(tf )) +
Z
tf
f0 (t, x(t), u(t)) dt
0
unter
dx(t)
= f (t, x(t), u(t))
dt
x(0) = x0 , ψ(x(tf )) = 0
ẋ(t) =
u(t)
∈
U
(2.7)
∀ t ∈ [0, tf ].
Definition 2.1.8 Ein zulässiges Paar (x∗ , u∗ ) zur einer festen Endzeit tf > 0 heißt
optimale Lösung bzw. globale Minimalstelle von (2.7), wenn
F (x∗ , u∗ ) ≤ F (x, u)
für alle zulässigen Paare (x, u) zur Endzeit tf gilt.
Ein zulässiges Paar (x∗ , u∗ ) zur einer freien Endzeit t∗f > 0 heißt optimale Lösung
bzw. globale Minimalstelle von (2.7), wenn
F (x∗ , u∗ ) ≤ F (x, u)
für alle zulässigen Paare (x, u) zu einer beliebigen Endzeit tf > 0 gilt. Hier ist tf
eine zusätzliche Optimierungsvariable.
Die Funktion x∗ (t) heißt optimale Trajektorie und die Funktion u∗ (t) optimale
Steuerung des Steuerprozesses (2.7).
7
2 Theorie der optimalen Steuerprozesse
2.2 Äquivalente Umformungen eines Steuerprozesses
In den bisherigen Betrachtungen wurden die Steuerprozesse in der so genannten
Bolza-Form eingeführt. In diesem Fall besteht das Zielfunktional aus zwei Komponenten: der Funktion g und dem Integral. Es gibt jedoch viele verschiedene Möglichkeiten zur Formulierung eines optimalen Steuerprozesses. Z. B. kann erreicht werden,
dass in dem Zielfunktional nur das Integral bzw. nur die Funktion g vorkommt. Dabei
spricht man von einem Lagrange-Problem bzw. von einem Mayer-Problem. Außerdem können Probleme mit freier Endzeit auf Probleme mit fester Endzeit zurückgeführt werden. Letztendlich kann jedes Steuerproblem in ein autonomes Problem
transformiert werden. Hierbei werden mit autonom diejenigen Prozesse bezeichnet,
die nicht explizit von der Zeit t abhängen. Häufig kann es von großem Nutzen sein,
ein Steuerproblem in eine andere Form zu transformieren. Aus diesem Grund werden
im Nachfolgenden einige Möglichkeiten zur Überführung eines optimalen Steuerprozesses in eine andere Darstellungsform aufgezeigt.
2.2.1 Transformation eines Bolza-Problems auf ein MayerProblem
Bei der Mayer-Form besteht das Zielfunktional nur aus dem Term g(x(tf )). Um diese Konstruktion zu bekommen muss demnach das Integral im Funktional eliminiert
werden. Dies erreicht man durch die Definition einer neuen Zustandsvariablen. Gegeben sei also der optimale Steuerprozess (2.7). Man definiere:
x0 (t) :=
Z
t
f0 (s, x(s), u(s))ds,
0 ≤ t ≤ tf ,
0
und erweitere den Zustandsvektor zu:
x̃(t) :=
x0 (t)
x(t)
!
∈ Rn+1 .
Das transformierte Problem lässt sich damit folgendermaßen in der gewünschten
Mayer-Form formulieren:
M inimiere
unter
g̃(x̃(tf )) = g(x(tf )) + x0 (tf )
dx̃(t)
= f˜(t, x̃(t), u(t)), t ∈ [0, tf ],
dt
x̃(0) = x̃0 , ψ̃(x̃(tf )) = 0,
u(t) ∈ U
∀ t ∈ [0, tf ].
8
(2.8)
2 Theorie der optimalen Steuerprozesse
Dabei gilt
f˜(t, x̃(t), u(t)) :=
x̃0 :=
0
x0
!
f0 (t, x, u)
f (t, x, u)
!
,
und ψ̃(x̃(tf )) := ψ(x(tf )).
2.2.2 Transformation einer freien Endzeit auf eine feste Endzeit
Gegeben sei ein optimaler Steuerprozess der Form (2.7) mit freier Endzeit tf .
Mit der Einführung einer neuen Zeitvariablen s ∈ [0, 1] durch:
t = s · tf ,
0 ≤ s ≤ tf .
werden die Zustands- und Steuervariablen in der Abhängigkeit von s folgendermaßen
definiert:
x̄(s) := x(s · tf ) = x(t) und ū(s) := u(s · tf ) = u(t).
Für die Dynamik des Systems erhält man daraus:
dx̄
dx dt
=
·
= f (s · tf , x̄(s), ū(s)) · tf
ds
dt ds
und für das Zielfunktional:
Z tf
Z
g(x(tf )) +
f0 (t, x(t), u(t))dt = g(x̄(1)) +
0
1
f0 (s · tf , x̄(s), ū(s))tf ds.
0
Zudem wird die freie Endzeit tf als zusätzliche Zustandsvariable durch
xn+1 (s) := tf
mit in die Dynamik aufgenommen. Für den erweiterten Zustandsvektor ergibt sich:
!
x̄(s)
x̃(s) :=
∈ Rn+1 .
tf
Insgesamt kann nun folgender optimaler Steuerprozess mit fester Endzeit sf = 1
formuliert werden:
Z 1
f˜0 (s, x̃(s), ũ(s)) ds
M inimiere
F̃ (x̃, ũ) = g̃(x̃(1)) +
0
unter
dx̃(s)
= f˜(s, x̃(s), ũ(s)), s ∈ [0, 1],
ds
x̃(0) = x̃0 , ψ̃(x̃(1)) = 0,
ũ(s) ∈ U
∀ s ∈ [0, 1].
9
(2.9)
2 Theorie der optimalen Steuerprozesse
Mit den Bezeichnungen
g̃(x̃(1)) := g(x̄(1)), f˜0 (s, x̃(s), ũ(s)) := tf · f0 (s · tf , x̄(s), ū(s)),
!
!
t
·
f
(s
·
t
,
x̄(s),
ū(s))
x
f
f
0
f˜(s, x̃(s), ũ(s)) :=
, x̃0 :=
, ξ frei
0
ξ
ũ(s) := ū(s),
ψ̃(x̃) := ψ(x̄).
2.2.3 Transformation nicht-autonomer Probleme auf autonome
Probleme
Ein nicht-autonomer Steuerprozess läßt sich in ein autonomes Problem umwandeln,
indem man die Zeitvariable t, die explizit in f0 oder f auftaucht, als zusätzliche
Zustandsvariable einführt. Mit dem neuen erweiterten Zustandsvektor
!
x(t)
x̃(t) :=
∈ Rn+1
t
erhält man folgenden autonomen Steuerprozess:
M inimiere
F̃ (x̃, ũ) = g̃(x̃(tf )) +
Z
tf
f˜0 (t, x̃(t), u(t)) dt
0
unter
dx̃(t)
= f˜(t, x̃(t), u(t)), t ∈ [0, tf ],
dt
x̃(0) = x̃0 , ψ̃(x̃(tf )) = 0,
u(t) ∈ U
(2.10)
∀ t ∈ [0, tf ]
mit
g̃(x̃) := g(x),
f˜(x̃, u) :=
f˜0 (x̃, u) := f0 (x̃n+1 , x̃, u),
!
!
f (x̃n+1 , x̃, u)
x0
, x̃0 :=
,
1
x̃n+1
ψ̃(x̃) := ψ(x).
2.3 Das Minimumprinzip von Pontryagin
Nachdem nun alle wichtigen Grundbegriffe und Bezeichnungen aufgelistet worden
sind, kann das Minimumprinzip von Pontryagin formuliert werden. Doch zuvor wird
noch folgende Definition benötigt.
Definition 2.3.1 Sei das Steuerproblem (2.7) gegeben. Des Weiteren sei λ0 ∈ R
und λ : [0, tf ] → Rn ein Zeilenvektor. Die Funktion
H (t, x(t), λ(t), u(t)) = λ0 f0 (t, x(t), u(t)) + λf (t, x(t), u(t))
10
(2.11)
2 Theorie der optimalen Steuerprozesse
wird als Hamilton-Funktion des Steuerprozesses (2.7) bezeichnet. Die Variablen
λi , i = 1, . . . , n werden als adjungierte Variablen oder Kozustand bezeichnet.
Bemerkung 2.3.2 Im Falle eines Steuerprozesses in Mayer-Form vereinfacht sich
die Hamilton-Funktion zu:
H (t, x(t), λ(t), u(t)) = λf (t, x(t), u(t)) .
(2.12)
Satz 2.3.3 (Minimumprinzip von Pontryagin) Sei (x*,u*) eine optimale Lösung
von (2.7). Dann gibt es eine Zahl λ0 ≥ 0, eine stetige und stückweise stetig differenzierbare Funktion λ : [0, tf ] → Rn und einen Zeilenvektor ν ∈ Rr mit (λ0 , λ(t), ν) 6= 0
für alle t ∈ [0, tf ], so dass die folgenden Aussagen gelten:
(i) An allen Stetigkeitsstellen t ∈ [0, tf ] von u∗ (t) gilt die Minimumbedingung:
H (t, x∗ (t), λ(t), u∗ (t)) = min H (t, x∗ (t), λ(t), u)
u∈ U
und die adjungierten Differentialgleichungen:
λ̇(t) = −Hx (t, x∗ (t), λ(t), u∗ (t)) .
(ii) Im Endzeitpunkt tf gilt die Transversalitätsbedingung:
λ(tf ) = λ0 gx (x∗ (tf )) + νψx (x∗ (tf )).
(iii) Im Falle einer freien Endzeit tf gilt für die optimale Endzeit tf ∗ :
H (tf ∗ , x∗ (tf ∗ ), λ∗ (tf ∗ ), u∗ (tf ∗ )) = 0.
(iv) Für autonome Probleme gilt außerdem:
H (x∗ (t), λ(t), u∗ (t)) ≡ const.
Für λ0 unterscheidet man zwischen λ0 = 0, dem so genannten abnormalen Fall und
λ0 > 0. Man rechnet leicht nach, dass in dem normalen Fall λ0 > 0 eine Skalierung
des Vektors (λ0 , λ) der Form (λ0 , λ) → (1, λλ0 ) keine Auswirkung auf die Aussagen
des Minimumprinzips hat. Man kann also, sofern λ0 > 0 gilt, die Bedingungen
aus Satz (2.3.3) durch Setzen von λ0 = 1 vereinfachen. Außerdem kann für den
Fall λ0 = 1 unter zusätzlichen Konvexitätsannahmen gezeigt werden, dass durch das
Pontryaginsche-Minimumprinzip auch eine hinreichende Bedingung für die Existenz
einer optimalen Lösung gegeben ist. Allerdings stellt sich der Nachweis von λ0 > 0
im Allgemeinen als problematisch dar. In einigen konkreten Anwendungen ist das
folgende Lemma vom großen Nutzen.
Lemma 2.3.4 Bei freiem Endzustand x(tf ), d. h., wenn formal ψ ≡ 0 gilt, ist
λ0 > 0, d. h. im Pontryaginschen Minimumprinzip kann λ0 = 1 gesetzt werden.
11
2 Theorie der optimalen Steuerprozesse
2.4 Probleme mit linear auftretender Steuerung Bang-bang und singuläre Steuerungen
Im Allgemeinen unterscheidet man in der Theorie der optimalen Steuerprozesse zwischen Problemen mit linear und nichtlinear auftretender Steuerung. Während bei
den Problemen mit linearer Steuerung diese häufig in einigen Punkten unstetig ist,
ist die optimale Steuerung bei nichtlinearen Prozessen stetig und für U = Rm sogar
eine C k -Funktion. Den Schwerpunkt der vorliegenden Arbeit bilden die Probleme
mit linear eingehender Steuerung (d. h. die Steuerung tritt sowohl in der Dynamik
als auch im Zielfunktional linear auf). Deshalb werden diese im nachfolgenden Abschnitt näher behandelt.
Es liegt also ein Problem der Form
Z tf
(a0 (t, x) + b0 (t, x)u) dt
M inimiere F (x, u) := g (x(tf )) +
0
unter
dx(t)
= a(t, x) + b(t, x)u
dt
x(t0 ) = x0 , ψ(x(tf )) = 0
ẋ(t) =
u(t)
∈
U
∀ t ∈ [t0 , tf ]
vor. Hierbei seien a0 ein Skalar, b0 ∈ Rm ein Zeilenvektor, a ∈ Rn , b eine (n × m)
Matrix und U ⊂ Rm konvex und kompakt. Für die zugehörige Hamiltonfunktion
mit λ0 = 1 ergibt sich dann:
H (t, x(t), λ(t), u(t)) = λ0 (a0 (t, x) + b0 (t, x)u) + λ(t)(a(t, x) + b(t, x)u)
= λ0 a0 (t, x) + λ(t)a(t, x) + [λ0 b0 (t, x) + λ(t)b(t, x)] u.
Eine bedeutende Rolle bei der Behandlung von optimalen Steuerprozessen mit linear
eingehender Steuerung spielt der Begriff der Schaltfunktion.
Definition 2.4.1 Die Funktion
Σ(t) := Hu (t, x(t), u(t), λ(t)) = λ0 b0 (t, x) + λ(t)b(t, x)
(2.13)
heißt Schaltfunktion.
Insbesondere kann man somit die Hamiltonfunktion folgendermaßen zusammenfassen
H(t, x(t), u(t), λ(t)) = λ0 a0 (t, x) + λ(t)a(t, x) + Σ(t)u
(2.14)
und man sieht, dass diese Funktion genau dann minimal bezüglich u wird, wenn
Σ(t)u minimal wird. Die Minimumbedingung
H (t, x∗ (t), λ(t), u∗ (t)) = min H (t, x∗ (t), λ(t), u)
u∈ U
12
2 Theorie der optimalen Steuerprozesse
ist somit äquivalent zu dem linearen Optimierungsproblem:
minimiere
{Σ(t)u | u ∈ U }
∀ t ∈ [0, tf ].
(2.15)
Aus Gründen der Vereinfachung beschränken sich alle weiteren Betrachtungen auf
den skalaren Fall m = 1, U = [umin , umax ] ∈ R (im Falle einer vektorwertigen
Steuerfunktion erfolgt die Auswertung komponentenweise). Die optimale Steuerung
kann direkt an der Schaltfunktion abgelesen werden, es gilt:



, Σ(t) > 0 
 umin

∗
u (t) =
(2.16)
umax
, Σ(t) < 0 .




unbestimmt , Σ(t) = 0
Definition 2.4.2 Sei [t1 , t2 ] ⊂ [0, tf ] mit t1 < t2
(i) Die Steuerung u(t) heißt bang-bang in [t1 , t2 ], wenn Σ(t) nur isolierte Nullstellen in [t1 , t2 ] hat, d. h. u(t) ∈ {umin , umax }. Die Nullstellen von Σ(t) heißen
Schaltpunkte.
(ii) Die Steuerung u(t) heißt singulär in [t1 , t2 ], wenn Σ(t) ≡ 0 auf dem gesamten
Intervall [t1 , t2 ] gilt.
Für Σ(t) 6= 0 liegt demnach eine bang-bang Steuerung vor, die gemäß (2.16) angegeben werden kann. Sobald jedoch singuläre Stücke auftreten, bedarf es weiterführender nachfolgender Überlegungen.
Es sei Σ(t) ≡ 0 für t ∈ [t1 , t2 ].
Man definiere rekursiv die Funktionen Σ(k) (t, x, λ, u), 0 ≤ k ≤ ∞ durch:
Σ(0) (t, x, λ, u) := Σ(t, x, λ),
∂ (k)
∂
∂ (k)
∂
∂
Σ (t, x, λ, u) +
Σ (t, x, λ, u) .
Σ(k+1) (t, x, λ, u) := Σ(k) (t, x, λ, u) +
∂t
∂x
∂t ∂λ
∂t
Entweder gilt dann
k > 0 mit
∂
Σ(k) (t, x, λ, u)
∂u
≡ 0 für alle k, 0 ≤ k ≤ ∞ oder es existiert ein
∂ (k)
Σ (t, x, λ, u) ≡ 0,
∂u
∂ (k)
Σ (t, x, λ, u) 6= 0.
∂u
für k = 0, . . . , k − 1
∂
Σ(k) (t, x, λ, u) eine Darstellung
Aufgrund der Linearität der Steuerung u gibt es für ∂u
der Form:
∂ (k)
Σ (t, x, λ, u) = A(t, x(t), λ(t)) + B(t, x(t), λ(t))u
∂u
mit geeigneten Funktionen A : [t1 , t2 ] × Rn × Rn → R und B : [t1 , t2 ] × Rn × Rn → R.
Außerdem gilt wegen
Σ(t, x, λ, u) ≡ 0
13
2 Theorie der optimalen Steuerprozesse
offensichtlich
Σ(k) (t, x, λ, u) ≡ 0.
Somit ergibt sich für die singuläre Steuerung:
using = −
A(t, x(t), λ(t))
B(t, x(t), λ(t))
für alle t ∈ [t1 , t2 ] mit B(t, x(t), λ(t)) 6= 0.
Satz 2.4.3 (Ordnung einer singulären Steuerung)
1. Gilt k < ∞, so ist k = 2q, q ∈ N+ eine gerade Zahl. Die Zahl q ≥ 1 heißt die
Ordnung der singulären Steuerung.
2. Für eine optimale Lösung (x(t), using (t), λ(t)) gilt die verallgemeinerte LegendreClebsch-Bedingung:
2q
d
q
q ∂
Hu (t, x(t), using (t), λ(t)) . (2.17)
0 ≤ (−1) B(t, x(t), λ(t)) = (−1)
∂u dt2q
Einen Beweis dieses Satzes findet man z.B. in Knobloch [6].
14
3 Optimale Steuerprozesse mit
reinen Zustandsbeschränkungen
Bisher wurden allgemeine Steuerprozesse und notwendige Optimalitätsbedingungen
für Probleme ohne Beschränkungen betrachtet. Doch in den meisten praktischen Anwendungen treten solche öfters im Zustandsbereich sowie in der gemischten Form,
im Zustands-Steuerbereich auf. Man unterscheidet demnach zwischen reinen Zustandsbeschränkungen und gemischten Beschränkungen. Für die vorliegende Arbeit
und die hier behandelten Beispiele aus der Unternehmenspolitik ist jedoch nur der
erste Typ der besagten Beschränkungen von Interesse. Bei solchen Steuerprozessen
können die Beschränkungen einen entscheidenden Einfluss auf die Optimalitätsbedingungen ausüben. Außerdem ist die Struktur der Lösung in der Regel komplexer.
Zur Bearbeitung der zustandsbeschränkten Steuerprozesse bedarf es des erweiterten
Pontryaginschen Minimumprinzips, welches in den Abschnitten 3.2 und 3.3 formuliert wird.
3.1 Grundbegriffe
Zunächst werden in diesem Abschnitt die Grundbegriffe und wichtige Definitionen
der optimalen Steuerprozesse mit reinen Zustandsbeschränkungen bereitgestellt.
Gegeben sei also ein optimaler Steuerprozess:
Z tf
f0 (t, x(t), u(t)) dt
M inimiere F (x, u) := g (x(tf )) +
0
dx(t)
= f (t, x(t), u(t))
unter ẋ(t) =
dt
x(0) = x0 , ψ(x(tf )) = 0
u(t)
∈
U
(3.1)
∀ t ∈ [0, tf ]
mit der reinen Zustandsbeschränkung
S(x(t)) ≤ 0,
t ∈ [0, tf ].
(3.2)
Dabei sei S : Rn → Rk , k ∈ N+ eine hinreichend oft stetig differenzierbare Funktion.
15
3 Optimale Steuerprozesse mit reinen Zustandsbeschränkungen
x(t)
xmax
Kontaktpunkt
Eintrittspunkt
Austrittspunkt
Verbindungspunkte
xmin
inneres
Teilstück
Randstück
ti
ti+1
ti+2
ti+3
ti+4
ti+5
ti+6
t
Abbildung 3.1: Zustandsbeschränkung xmin ≤ x(t) ≤ xmax
Bei der Lösung solcher Steuerprozesse unterscheidet man zwischen inneren Teilstücken
und Randstücken.
Definition 3.1.1 Ein Intervall [ti , ti+1 ] ∈ [0, tf ] wird inneres Teilstück genannt,
wenn
S(x(t)) < 0
∀ t ∈ [0, tf ]
(3.3)
gilt.
Per Definition ist die Zustandsbeschränkung auf inneren Teilstücken im gesamten
Zeitintervall nicht aktiv, daher gelten für die optimale Lösung die notwendigen Bedingungen von Satz (2.3.3). Wirklich interessant für dieses Kapitel sind also nur die
Probleme, in denen die Beschränkung (3.2) aktiv wird.
Definition 3.1.2 Die abgeschlossene Menge
I0 := { t ∈ [0, tf ] | S(x(t)) = 0 }
(3.4)
heißt Menge der aktiven Zeitpunkte.
Definition 3.1.3 Ein Intervall [te , ta ] ∈ [0, tf ] wird Randstück genannt, wenn
S(x(t)) ≡ 0
∀
t ∈ [te , ta ]
gilt. Der Zeitpunkt te heißt Eintrittspunkt, falls gilt
S(x(te − ε)) < 0 f ür ε > 0 hinreichend klein.
16
(3.5)
3 Optimale Steuerprozesse mit reinen Zustandsbeschränkungen
Der Zeitpunkt ta heißt Austrittspunkt, falls gilt
S(x(ta + ε)) < 0 f ür ε > 0 hinreichend klein.
Ein Punkt τ ∈ [0, tf ] heißt Kontaktpunkt, falls gilt
S(x(τ )) = 0,
S(x(τ ± ε)) < 0 f ür ε > 0 hinreichend klein.
Definition 3.1.4 Ein Eintritts- bzw. Austrittspunkt heißt Verbindungspunkt zwischen dem inneren Teilstück und dem Randstück.
Definition 3.1.5 Die Steuerung auf einem Randstück [te , ta ] wird als Randsteuerung bezeichnet.
Im Folgenden soll die Randsteuerung für den skalaren Fall m = 1 genauer untersucht
werden. Eine wichtige Rolle hierbei spielt die Ordnung der Zustandsbeschränkung.
Man definiere rekursiv die Funktionen S i , i ∈ N durch:
S 0 := S,
(3.6)
S i+1 := (S i )x f.
Definition 3.1.6 Die Zustandsbeschränkung S(x(t)) ≤ 0 heißt p-ter Ordnung
falls gilt:
∂S i
≡0
∂u
∂S p
6≡ 0.
=
∂u
(S i )u =
(S p )u
für i = 0, ..., p − 1
und
Anders ausgedrückt enthalten die ersten p − 1 totalen Ableitungen nach der Zeit t
keine Steuervariable, die Steuerung u tritt erstmals in der p-ten Ableitung explizit
auf, d. h.:
S i = S i (x)
S p = S p (x, u).
(3.7)
Daher gilt auf einem Randstück für alle t ∈ [te , ta ]:
S i (x(t)) = 0,
i = 0, . . . , p − 1
S p (x(t)) = 0.
(3.8)
Diese Bedingungen sind aufgrund des Eindeutigkeitssatzes für Differentialgleichungen äquivalent zu:
S i (x(te )) = 0,
i = 0, . . . , p − 1
S p (x(t)) = 0,
t ∈ [te , ta ].
17
(3.9)
3 Optimale Steuerprozesse mit reinen Zustandsbeschränkungen
Bevor nun die notwendigen Optimalitätsbedingungen für Steuerprozesse mit reinen
Zustandsbeschränkungen im nächsten Abschnitt formuliert werden, wird noch folgende Voraussetzung benötigt.
Voraussetzung 3.1.7
1. Die Gleichung S p (x, u) = 0 ist eindeutig auflösbar nach u = u(x) mit einer
C p+1 -Funktion u(x).
2. Auf jedem Randstück [te , ta ] gelte:
∂S p
(x, u) 6= 0,
∂u
∀ t ∈ [te , ta ].
3. Die Randsteuerung liege echt im Inneren des Steuerbereiches, d. h.:
u(t) ∈ int U,
∀ t ∈ [te , ta ].
Demnach gilt auf einem Randstück [te , ta ] eine eindeutige Beziehung u(t) = u(x(t)).
3.2 Direkte Methode - Direct adjoining approach“
”
Zur Behandlung von Problemen mit reinen Zustandsbeschränkungen existieren mehrere verschiedene Verfahren. Eine der meist angewandten Methoden, die in diesem
Abschnitt erläutert werden soll, ist die direkte Methode. Hierbei wird die Funktion
S(x(t)) mit einem Multiplikator versehen und direkt zur Hamiltonfunktion adjungiert.
Definition 3.2.1 Es seien das Steuerproblem (5.1), λ : [0, tf ] → Rn , λ0 ∈ R und
µ : [0, tf ] → Rk gegeben. Die Funktion
H̃ (t, x, λ, µ, u) = λ0 f0 (t, x, u) + λf (t, x, u) + µS(x)
(3.10)
H̃ (t, x, λ, µ, u) = H (t, x, λ, u) + µS(x)
heißt die erweiterte Hamilton-Funktion zum Steuerprozess (5.1).
Satz 3.2.2 (erweitertes Minimumprinzip)
Sei (x*,u*) eine optimale Lösung des zustandsbeschränkten Steuerprozesses (5.1).
Außerdem erfülle das Paar (x*,u*) die Voraussetzung (3.1.7). Dann existieren
1. eine Konstante λ0 ∈ R, λ0 ≥ 0,
2. stückweise stetige und stückweise stetig differenzierbare Funktion λ : [0, tf ] → Rn ,
18
3 Optimale Steuerprozesse mit reinen Zustandsbeschränkungen
3. ein Zeilenvektor ρ ∈ Rr ,
4. eine stückweise stetige Multiplikator-Funktion µ : [0, tf ] → Rk ,
5. in jedem Verbindungs- und Kontaktpunkt Multiplikatoren ν(ti ) ∈ R, ν(ti ) ≥ 0,
sodass folgende Aussagen gelten:
(i) An allen Stetigkeitsstellen t ∈ [0, tf ] von u∗ (t) gilt die Minimumbedingung:
H̃ (t, x∗ (t), λ(t), µ(t), u∗ (t)) = min H̃ (t, x∗ (t), λ(t), µ(t), u)
u∈ U
und die adjungierten Differentialgleichungen:
λ̇(t) = −H̃x (t, x∗ (t), λ(t), µ(t), u∗ (t)) .
(ii) Im Endzeitpunkt tf gilt die Transversalitätsbedingung:
λ(tf ) = λ0 gx (x∗ (tf )) + ρψx (x∗ (tf )) + γSx (x∗ (tf )),
γ ≥ 0,
γS(x∗ (tf )) = 0.
(iii) Für alle t ∈ [0, tf ] gilt die Vorzeichenbedingung:
µ(t) ≥ 0
und die Komplementaritätsbedingung:
µ(t)S(x∗ (t)) ≡ 0.
(iv) In jedem Verbindungs- und Kontaktpunkt gelten die Sprungbedingungen:
−
∗
λ(t+
i ) = λ(ti ) − ν(ti )Sx (x (ti )).
(v) Im Falle einer freien Endzeit tf gilt für die optimale Endzeit tf ∗ :
H̃ (tf ∗ , x∗ (tf ∗ ), λ∗ (tf ∗ ), µ∗ (tf ∗ ), u∗ (tf ∗ )) = 0.
Einen Beweis findet man in [11].
Für Probleme mit linear eingehender Steuerung lässt sich die optimale Steuerung
formal wie folgt berechnen:
Auf einem Randstück [te , ta ] ∈ [0, tf ] gilt nach Definition:
S(x(t)) = 0,
19
t ∈ [te , ta ].
3 Optimale Steuerprozesse mit reinen Zustandsbeschränkungen
Da S p (x, u) affin-linear in u ist, existiert eine Darstellung der Form:
S p (x, u) = α(x) + β(x)u
mit geeigneten Funktionen α(x) und β(x).
Außerdem gilt auf dem Randstück [te , ta ] nach Voraussetzung (3.1.7):
∂S p
(x, u) 6= 0,
∂u
∀ t ∈ [te , ta ]
und die Randsteuerung urand kann in Abhängigkeit von x ermittelt werden:
urand (x) = −
α(x)
.
β(x)
In dem Minimumprinzip wird vorausgesetzt, dass die optimale Steuerung auf einem
Randstück echt im Inneren des Steuerbereiches U liegt:
u(t) ∈ int U,
∀ t ∈ [te , ta ].
Nach der Minimumbedingung wird die Hamiltonfunktion im Optimum bezüglich der
Steuerung u minimiert. Dies impliziert:
0 = H̃(t) = Σ(t).
(3.11)
Die Randsteuerung verhält sich somit formal wie eine singuläre Steuerung.
Im Gegensatz zu unbeschränkten Problemen können bei den Steuerprozessen mit
Zustandsbeschränkungen Unstetigkeiten in den adjungierten Variablen auftreten.
Bei linear auftretender Steuerung kann der folgende Satz eine wichtige Rolle spielen.
Satz 3.2.3 Sei p = 1 und u(t) unstetig in einem Verbindungspunkt ti , dann gilt
ν(ti ) = 0. λ(t) ist also stetig in ti und es gilt Σ(ti ) = 0.
Einen Beweis findet man in Maurer [12].
3.3 Indirekte Methode - Indirect adjoining
”
approach“
Eine weitere Möglichkeit zur Auswertung zustandsbeschränkter Steuerprozesse bietet die indirekte Methode. Bei diesem Ansatz, der historisch gesehen älter als der Direkte ist, wird nicht die reine Beschränkung S(x(t)) ≤ 0 an die Hamilton-Funktion
angekoppelt, sondern die p-te Ableitung der Zustandsbeschränkung nach der Zeit
t, wobei p der Ordnung der Beschränkung entspricht. In dieser Arbeit werden die
notwendigen Bedingungen der indirekten Methode nur für den Fall p = 1 formuliert,
20
3 Optimale Steuerprozesse mit reinen Zustandsbeschränkungen
außerdem soll zur Vereinfachung die Steuerung u wieder skalar vorliegen.
Zunächst wird der in 3.2.1 eingeführte Begriff der erweiterten Hamilton-Funktion
modifiziert.
Definition 3.3.1 Es sei das Steuerproblem (5.1) mit der Zustandsbeschränkung
(3.2) der Ordnung p = 1 gegeben. Die Funktion
H 1 t, x, λ1 , µ1 , u
H1
= λ10 f0 (t, x, u) + λ1 f (t, x, u) + µ1 S 1 (x)
t, x, λ1 , µ1 , u = H t, x, λ1 , u + µ1 S 1 (x)
(3.12)
heißt die erweiterte Hamilton-Funktion der indirekten Methode zum Steuerprozess (5.1). Hierbei sind λ1 : [0, tf ] → Rn und µ1 : [0, tf ] → Rk .
Um den Zusammenhang zwischen den beiden Verfahren herzustellen, muss man
folgende Beziehungen zwischen den verwendeten Multiplikatoren beachten.
1. Die Multiplikatoren λ1 , µ1 aus 3.3 werden durch Integration der Multiplikatoren λ0 := λ und µ0 := µ aus dem Abschnitt 3.2 erzeugt.
2. Der Multiplikator λ1 (t) ist definiert durch:
λ1 (t) = λ0 (t) − µ1 (t)(S 0 )x (x(t)).
3. Für den Multiplikator µ1 gilt:
(
Rt
ν(ta ) + t a µ0 (s)ds, für t ∈ [te , ta ]
1
µ (t) =
0,
sonst.
(3.13)
(3.14)
4. Für den Multiplikator ν 1 gilt:
ν 1 (te ) = ν 0 (te ) + µ1 (te ).
(3.15)
Man beachte, dass hier angeführten Beziehungen zwischen den Multiplikatoren in
beide Richtungen gelten, d. h. wenn die Multiplikatoren der indirekten Methode
hinreichend glatt sind, können aus ihnen mittels der obigen Gleichungen die Multiplikatoren der direkten Methode gewonnen werden.
Mit den Bezeichnungen aus der Definition (3.3.1) lauten die notwendigen Optimalitätsbedingungen:
Satz 3.3.2 (erweitertes Minimumprinzip der indirekten Methode)
Sei (x*,u*) eine optimale Lösung des zustandsbeschränkten Steuerprozesses (5.1)
mit der Zustandsbeschränkung S(x(t) ≤ 0 der Ordnung p=1. Außerdem seien f und
S C 2 -Funktionen und die beiden folgenden Bedingungen erfüllt:
21
3 Optimale Steuerprozesse mit reinen Zustandsbeschränkungen
1. Auf jedem Randstück [te , ta ] gelte:
∂S 1 ∗ ∗
(x , u ) 6= 0,
∂u
∀ t ∈ [te , ta ].
2. Die Randsteuerung liege echt im Inneren des Steuerbereichs, d. h.:
u(t) ∈ int U,
∀ t ∈ [te , ta ].
Dann existieren
1. eine Konstante λ0 ∈ R, λ0 ≥ 0,
2. stückweise stetige und stückweise stetig differenzierbare Funktion λ1 : [0, tf ] → Rn ,
3. ein Zeilenvektor ρ1 ∈ Rr ,
4. eine stückweise stetige Multiplikator-Funktion µ1 : [0, tf ] → R,
5. in jedem Verbindungs- und Kontaktpunkt Multiplikatoren ν 1 (ti ) ∈ R, ν 1 (ti ) ≥ 0,
sodass folgende Aussagen gelten:
(i) An allen Stetigkeitsstellen t ∈ [0, tf ] von u∗ (t) gelten die Minimumbedingung:
H 1 t, x∗ (t), λ1 (t), µ1 (t), u∗ (t) = min H 1 t, x∗ (t), λ1 (t), µ1 (t), u
u∈ U
und die adjungierten Differentialgleichungen:
λ̇1 (t) = −Hx1 t, x∗ (t), λ(t)1 , µ1 (t), u∗ (t) .
(ii) Im Endzeitpunkt tf gilt die Transversalitätsbedingung:
λ1 (tf ) = λ10 gx (x∗ (tf )) + ρ1 ψx (x∗ (tf )),
(f alls
S(x∗ (tf )) < 0)
(iii) Für alle t ∈ [0, tf ] gilt die Komplementaritätsbedingung:
µ1 (t) ≥ 0,
µ(t)1 S(x∗ (t)) ≡ 0
und für alle t ∈ [te , ta ] die Vorzeichenbedingung:
µ1 (t) ≥ 0
∀ t ∈ [te , ta ].
(iv) In jedem Eintrittspunkt gilt die Sprungbedingung:
1 −
1
∗
λ1 (t+
e ) = λ (te ) − ν (te )Sx (x (ti )).
22
3 Optimale Steuerprozesse mit reinen Zustandsbeschränkungen
(v) In jedem Kontaktpunkt gilt:
λ1 (τ + ) = λ1 (τ − ) − νk1 Sx (x∗ (τ )),
νk1 ≥ 0.
(vi) In jedem Austrittspunkt gilt die Stetigkeitsbedingung:
1 −
λ1 (t+
a ) = λ (ta ).
(vii) Im Falle einer freien Endzeit tf gilt für die optimale Endzeit tf ∗ :
H 1 tf ∗ , x∗ (tf ∗ ), λ1 (tf ∗ ), µ1 (tf ∗ ), u∗ (tf ∗ ) = 0.
Einen Beweis hierzu findet man in Maurer [11] und Hartl, Sethi und Vickson [4].
Im Gegensatz zum direkten Ansatz gilt die Sprungbedingung für die adjungierten
Variablen beim indirekten Ansatz nur in den Eintrittspunkten. Demnach ist die
adjungierte Funktion λ1 (t) bei der Anwendung der indirekten Methode in den Austrittspunkten stetig.
23
4 Hinreichende
Optimalitätsbedingungen
Durch das Minimumprinzip von Pontryagin und dessen Erweiterung auf die Probleme mit Beschränkungen werden notwendige Optimalitätsbedingungen für das Vorliegen einer Extremalstelle gegeben. Um nachweisen zu können, dass es sich bei der
berechneten Lösung tatsächlich um ein Optimum handelt, werden die hinreichenden Bedingungen benötigt. In einigen Fällen kann jedoch gezeigt werden, dass unter
zusätzlichen Konvexitätsannahmen durch das Pontryaginsche Minimumprinzip auch
hinreichende Optimalitätsbedingungen gegeben sind. Diese Tatsache erweist sich besonders für ökonomische Probleme als sehr hilfreich. Denn in den meisten wirtschaftlichen Modellen geht man von einer Maximierung des Zielfunktionals aus und somit
werden für hinreichende Bedingungen zusätzliche Konkavitätsannahmen gefordert.
Diese Voraussetzung wird, da viele ökonomische Funktionen einen konkaven Verlauf
aufweisen, sehr häufig erfüllt. Als ein Beispiel wäre z.B. die Nutzenfunktion1 , die in
zahlreichen Problemen eine wichtige Rolle spielt, zu nennen.
4.1 Exkurs in die nichtlineare Optimierung
Um zu beweisen, dass die notwendigen Bedingungen unter zusätzlichen Konvexitätsannahmen auch hinreichend sind, werden die Kuhn-Tucker-Bedingungen der nichtlinearen Optimierung benötigt. Aus diesem Grunde wird zunächst ein kleiner Rückblick auf die nichtlineare Optimierung gegeben.
Definition 4.1.1 Gegeben seien die differenzierbare Abbildung f : Rn → R und die
stetig differenzierbare Abbildung g : Rn → Rm . Dann lautet das Standardproblem
der nichtlinearen Optimierung:
M inimiere
unter
1
f (x)
gi (x) ≤ 0,
i = 1, ..., k,
gi (x) = 0,
i = k + 1, ..., m.
(4.1)
Die Nutzenfunktion ist in der Volkswirtschaftslehre eine häufig gewählte Modellierung der Präferenzen einzelner Wirtschaftssubjekte.
24
4 Hinreichende Optimalitätsbedingungen
Definition 4.1.2 Erfüllt ein Punkt x ∈ Rn die Bedingungen:
gi (x) ≤ 0 f ür i = 1, ..., k
gi (x) = 0 f ür i = k + 1, ..., m,
so heißt er zulässig für das Optimierungsproblem (4.1).
Definition 4.1.3 Die Mengen
I(x̄) := {i ∈ {1, ..., k} | gi (x̄) = 0}
J(x̄) := I(x̄) ∪ {k + 1, ..., m}
werden als Mengen der aktiven Indizies bezeichnet.
Definition 4.1.4 Ein zulässiger Punkt x̄ des Standardproblems (4.1) heißt regulär,
wenn gilt:
(a) Die Gradienten (gk+1 )x (x̄), ..., (gm )x (x̄) sind linear unabhängig,
(b) ∃ v ∈ Rn mit : (gi )x (x̄)v < 0 f ür i ∈ I(x̄),
(gi )x (x̄)v = 0 f ür i ∈ {k + 1, ..., m}.
Definition 4.1.5 Ein zulässiger Punkt x̄ des Standardproblems (4.1) heißt normal,
wenn gilt: Die Gradienten (gi )x (x̄), i ∈ J(x̄) sind linear unabhängig.
Mit den obigen Definitionen können nun die notwendigen Optimalitätsbedingungen
der nichtlinearen Optimierung angegeben werden.
Satz 4.1.6 (Satz von John und Karush-Kuhn-Tucker)
Sei x̄ eine lokale Minimalstelle des Optimierungsproblems (4.1). Dann gilt:
(i) Es existiert ein Zeilenvektor (λ0 , λ) ∈ R × Rm \ {0, 0m } mit:
X
λ0 fx (x̄) +
λi (gi )x (x̄) = 0,
i∈J(x̄)
λ0 ≥ 0,
λi ≥ 0 f ür i ∈ I(x̄),
λi = 0 f ür i ∈
/ J(x̄).
(ii) Ist x̄ regulär, d. h. es gelte:
(a) Die Gradienten (gk+1 )x (x̄), ..., (gm )x (x̄) sind linear unabhängig,
(b) ∃ v ∈ Rn mit : (gi )x (x̄)v < 0 f ür i ∈ I(x̄),
(gi )x (x̄)v = 0 f ür i ∈ {k + 1, ..., m},
so kann λ0 = 1 gesetzt werden.
25
4 Hinreichende Optimalitätsbedingungen
(iii) Ist x̄ normal, d. h. die Gradienten (gi )x (x̄), i ∈ J(x̄) sind linear unabhängig,
so ist λ ∈ Rm mit λ0 = 1 eindeutig bestimmt.
Einen Beweis dieses Satzes findet man z. B. in Luenberger [9].
Definition 4.1.7 Die Komponenten λi , i = 0, 1, ..., m aus den Bedingungen des
Satzes (4.1.6) heißen Lagrange-Multiplikatoren und die Funktion
L(x, λ0 , λ) := λ0 f (x) + λg(x),
(4.2)
mit λ ∈ Rm Zeilenvektor, λ0 ∈ R heißt Lagrange-Funktion.
4.2 Konvexe Funktionen
Im folgenden Abschnitt werden zunächst die Begriffe der Konvexität und der QuasiKonvexität, die in diesem Kapitel eine sehr wichtige Rolle spielen, vorgestellt. Es
werden einige Sätze formuliert, die zum Beweis der hinreichenden Bedingungen notwendig sind. Zum Schluss wird ein ausgewähltes Kriterium zur Überprüfung der
Konvexität eingeführt. Dieses wird zur Behandlung des modifizierten Modells von
Lesourne und Leban in Kapitel 5 verwendet.
Definition 4.2.1 Eine nicht-leere Teilmenge D ⊆ Rn heißt konvex, wenn für alle
α mit 0 ≤ α ≤ 1 und für alle x1 , x2 ∈ D gilt:
αx1 + (1 − α)x2 ∈ D.
Definition 4.2.2 Sei D eine konvexe Teilmenge des Rn . Eine auf D definierte Funktion f : D → R heißt konvex, wenn für alle x1 , x2 aus ihrem Definitionsbereich D
und für alle α ∈ [0, 1] gilt:
f (αx1 + (1 − α)x2 ) ≤ αf (x1 ) + (1 − α)f (x2 )).
Falls f differenzierbar ist, so ist ihre Konvexität äquivalent zu:
fx (x1 )(x2 − x1 ) ≤ f (x2 ) − f (x1 ).
Gilt in diesen Ungleichungen anstelle von ≤ das ≥ Zeichen, so ist die Funktion f
konkav.
Definition 4.2.3 Eine Funktion f : Rn → R heißt quasi-konvex auf dem konvexen Definitionsbereich D ∈ Rn , wenn für alle x1 , x2 ∈ D und für alle ζ ∈ [0, 1]
gilt:
f (ζx1 + (1 − ζ)x2 ) ≤ min {f (x1 ), f (x2 )}
Gilt in diesen Ungleichungen anstelle von ≤ das ≥ Zeichen, so ist die Funktion f
quasi-konkav.
26
4 Hinreichende Optimalitätsbedingungen
Bemerkung 4.2.4 Jede konvexe Funktion ist auch quasi-konvex.
Bemerkung 4.2.5 Eine lineare Funktion f : D → R ist auf jeder konvexen Menge
D ⊆ Rn sowohl konvex als auch konkav.
Satz 4.2.6 Sei f : D → R quasi-konvex und differenzierbar auf der konvexen Menge
D ⊆ Rn . Dann gilt für alle x, x∗ ∈ D mit f (x) ≤ f (x∗ ):
fx (x∗ )(x − x∗ ) ≤ 0.
(4.3)
Satz 4.2.7 Sei f : D → R quasi-konvex und differenzierbar auf der konvexen Menge
D ⊆ Rn . Ferner existiere ein Vektor x∗ und ein Skalar γ mit
f (x∗ ) ≤ 0,
γ ≥ 0,
f (x∗ )γ = 0.
(4.4)
Dann gilt für alle x ∈ D mit f (x) ≤ 0:
γfx (x∗ )(x − x∗ ) ≤ 0.
(4.5)
Ein Beweis des Satzes (4.2.6) folgt unmittelbar aus der Definition einer quasikonvexen Funktion. Die Behauptung des Satzes (4.2.7) kann mittels des Satzes
(4.2.6) direkt nachvollzogen werden.
Des Weiteren werden einige Sätze über konvexe und quasi-konvexe Funktionen angegeben, deren Beweise sich direkt aus den jeweiligen Definitionen ergeben.
Satz 4.2.8 f (x) ist genau dann quasi-konvex, wenn die Menge
Aα = {x | f (x) ≤ α}
für jedes α ∈ Rn konvex ist.
Satz 4.2.9 Seien K ∈ Rn eine konvexe Menge und f1 , . . . , fm : K → Rn konvexe
Funktionen. Dann ist auch jede nichtnegative Linearkombination der Funktionen:
f :=
m
X
αi fi ,
αi ≥ 0
i = 1, . . . , m
i=1
eine konvexe Funktion.
Satz 4.2.10 Sind D1 , . . . , Dk ⊆ Rn konvexe Mengen, so ist deren Durchschnitt
T
T
D1 , . . . , Dk ebenfalls konvex.
Schließlich wird für den Beweis der hinreichenden Optimalitätsbedingungen noch
folgendes Resultat, entnommen aus Rockafellar [15], verwendet.
27
4 Hinreichende Optimalitätsbedingungen
Satz 4.2.11 Sei f (x) eine konvexe Funktion auf einem konvexen Definitionsbereich
D ⊆ Rn . Dann existiert für jedes x∗ aus D ein Zeilenvektor a = a(x∗ ), so dass für
alle f ∈ D gilt:
f (x) − f (x∗ ) ≥ a(x − x∗ ).
(4.6)
a wird als Subgradient von f bezeichnet. Ist f differenzierbar in x∗ , dann ist a
eindeutig bestimmt und gleich dem Gradienten, also a = fx (x∗ ). Ist φ konkav, so gilt
für alle x ∈ D:
f (x) − f (x∗ ) ≤ a(x − x∗ )
(4.7)
und a wird als Supergradient von x bezeichnet.
Um eine Funktion auf Konvexität zu überprüfen, benötigt man den Begriff der Defintheit einer Matrix:
Definition 4.2.12 Sei A eine symmetrische Matrix in Rn×n .
(i) A heißt positiv semidefinit, wenn xT Ax ≥ 0 für alle x ∈ Rn \0 gilt.
(ii) A heißt positiv definit, wenn sogar xT Ax > 0 für alle x ∈ Rn \0 gilt.
(iii) A heißt negativ semidefinit, wenn xT Ax ≤ 0 für alle x ∈ Rn \0 gilt.
(iv) A heißt negativ definit, wenn sogar xT Ax < 0 für alle x ∈ Rn \0 gilt.
Satz 4.2.13 Sei D ⊆ Rn eine konvexe Menge und sei f : D → R zweimal stetig
differenzierbar. Es gilt:
(i) Eine Funktion f ist genau dann auf D konvex, wenn die Hesse-Matrix ∇2 f (x)
für alle x ∈ D positiv semidefinit ist.
(ii) Eine Funktion f ist genau dann auf D konkav, wenn die Hesse-Matrix ∇2 f (x)
für alle x ∈ D negativ semidefinit ist.
(iii) Eine Funktion f ist genau dann auf D streng konvex, wenn die Hesse-Matrix
∇2 f (x) für alle x ∈ D positiv definit ist.
(iv) Eine Funktion f ist genau dann auf D streng konkav, wenn die Hesse-Matrix
∇2 f (x) für alle x ∈ D negativ definit ist.
Zur Überprüfung der Definitheit einer symmetrischen Matrix kann das Eigenwertkriterium zur Rate gezogen werden.
Satz 4.2.14 Sei A ∈ Rn×n eine symmetrische Matrix A ∈ Rn×n .
(i) A ist genau dann positiv definit, falls für alle Eigenwerte λi von A gilt: λi > 0.
28
4 Hinreichende Optimalitätsbedingungen
(ii) A ist genau dann positiv semidefinit, falls für alle Eigenwerte λi von A gilt:
λi ≥ 0.
(iii) A ist genau dann negativ definit, falls für alle Eigenwerte λi von A gilt: λi < 0.
(iv) A ist genau dann negativ semidefinit, falls für alle Eigenwerte λi von A gilt:
λi ≤ 0.
(v) A ist genau dann indefinit, wenn A mindestens einen positiven und einen
negativen Eigenwert besitzt.
4.3 Hinreichende Optimalitätsbedingungen für
unbeschränkte Steuerprozesse
Die hinreichenden Optimalitätsbedingungen können nun folgendermaßen formuliert
werden:
Satz 4.3.1 Sei (x*,u*) ein zulässiges Paar für das Problem (2.7). Es existiere eine Funktion λ : [0, tf ] → Rn , sowie ein Vektor ν ∈ Rr , so dass die notwendigen
Optimalitätsbedingungen von Satz (2.3.3) mit λ0 = 1 erfüllt sind. Ferner seien:
(i) g(x) konvex,
(ii) ψ(x) affin-linear,
(iii) H 0 (t, x, λ) konvex in x für alle (t, λ(t)), t ∈ [0, tf ], wobei
H 0 (t, x, λ) := min H (t, x∗ (t), λ(t), u) ,
u∈ U
t ∈ [0, tf ].
Dann ist (x*,u*) eine optimale Lösung.
Bemerkung 4.3.2 Die Konvexität von H 0 in x kann durch die stärkere Voraussetzung der Konvexität von H in (x, u) ersetzt werden.
In diesem Abschnitt wird zunächst ein Beweis des Satzes (4.3.1) über das so genannte Enveloppentheorem geführt. Hierbei wird jedoch die Differenzierbarkeit der
minimierten Hamiltonfunktion in x vorausgesetzt. Ein allgemeinerer Beweis, der auf
diese Bedingung verzichtet, wird im nächsten Abschnitt im Rahmen zustandsbeschränkter Steuerprozesse vorgestellt.
29
4 Hinreichende Optimalitätsbedingungen
Lemma 4.3.3 (Enveloppentheorem)
Eine Funktion φ : Rn × Rm → R sei definiert für (x, u) ∈ D × U , wobei D offen sei.
φ0 : Rn → R sowie u∗ : Rn → Rm seien gegeben durch:
φ0 (x) = min φ(x, u),
u∈U
u∗ (x) = arg min φ(x, u).
u∈U
Sind φ0 und φ stetig differenzierbar in x, so gilt:
φx (x, u) |u=u∗ (x) = φ0x (x).
Einen Beweis hierzu findet man bei Derzko at al. [2].
Für die minimierte Hamiltonfunktion
H 0 (t, x, λ) := min H (t, x, λ, u)
u∈U
(4.8)
ergibt sich aus dem Hilfssatz, dass für
u∗ (x, λ, t) = arg min H (t, x, λ, u)
u∈U
folgende Beziehungen gelten:
H 0 (t, x, λ) = H(t, x, λ, u∗ ),
Hx0 (t, x, λ) = Hx (t, x, λ, u∗ ).
(4.9)
Beweis zu Satz 4.3.1
Gemäß (2.1.8) ist die Behauptung des Satzes (4.3.1) bewiesen, falls gezeigt werden
kann, dass die Differenz
∆ := F (x, u) − F (x∗ , u∗ )
(4.10)
nicht negativ ist. Es sei (x(t), u(t)) ein beliebiges, zulässiges Funktionenpaar auf
[0, tf ]. Mittels der Hamiltonfunktion, mit λ0 = 1, lässt sich die Funktion f0 (t, x(t), u(t))
schreiben als
f0 (t, x(t), u(t)) = H(t, x, λ, u) − λf (t, x, u) .
Damit kann man die obige Differenz folgendermaßen umformulieren:
30
4 Hinreichende Optimalitätsbedingungen
∆ = g (x(tf )) +
Z
tf
f0 (t, x(t), u(t)) dt
0
Z
tf
f0 (t, x∗ (t), u∗ (t)) dt
− g (x (tf )) −
0
Z tf
(H(t, x, λ, u) − λf (t, x, u))dt
= g (x(tf )) +
0
Z tf
∗
− g (x (tf )) −
(H(t, x∗ , λ, u∗ ) − λf (t, x∗ , u∗ ))dt
Z 0tf
= g (x(tf )) +
(H(t, x, λ, u) − λẋ)dt
0
Z tf
∗
(H(t, x∗ , λ, u∗ ) − λẋ∗ )dt
− g (x (tf )) −
∗
0
= g (x(tf )) − g (x∗ (tf ))
Z tf
+
(H(t, x, λ, u) − H(t, x∗ , λ, u∗ ) − λ(ẋ − ẋ∗ ))dt.
(4.11)
0
Aus der Konvexitätsannahme von H 0 (t, x, λ) bezüglich x und (4.8)-(4.9) folgt nun:
H(t, x, λ, u) − H(t, x∗ , λ, u∗ ) ≥ H 0 (t, x, λ) − H 0 (t, x∗ , λ)
≥ Hx0 (t, x∗ , λ)(x − x∗ )
(4.12)
= Hx (t, x∗ , λ)(x − x∗ )
und aus der Konvexität von g(x) erhält man die Ungleichung:
g (x(tf )) − g (x∗ (tf )) ≥ gx (x∗ (tf ))(x(tf ) − x∗ (tf )).
(4.13)
Durch das Einsetzen der beiden Abschätzungen und der adjungierten Differentialgleichungen in die Differenz ergibt sich nun folgendes:
∗
∗
∆ ≥ gx (x (tf ))(x(tf ) − x (tf )) +
= gx (x∗ (tf ))(x(tf ) − x∗ (tf )) −
= gx (x∗ (tf ))(x(tf ) − x∗ (tf )) −
Z
tf
(Hx (t, x∗ , λ)(x − x∗ ) − λ(ẋ − ẋ∗ ))dt
Z0 tf
Z0 tf
(λ̇(x − x∗ ) + λ(ẋ − ẋ∗ ))dt
(
0
∗
∗
d
λ(x − x∗ ))dt
dt
t
= gx (x (tf ))(x(tf ) − x (tf )) − [λ(t)(x(t) − x∗ (t))]0f
= gx (x∗ (tf ))(x(tf ) − x∗ (tf )) − λ(0) [x(0) − x∗ (0)] + λ(tf ) [x(tf ) − x∗ (tf )] .
31
4 Hinreichende Optimalitätsbedingungen
Beachtet man die Transversalitätsbedingung, die Linearität von ψ(x), sowie die Tatsache, dass stets x(0) = x∗ (0) gilt, folgt unmittelbar:
∆ ≥ gx (x∗ (tf ))(x(tf ) − x∗ (tf )) − λ(0) [x(0) − x∗ (0)] + λ(tf ) [x(tf ) − x∗ (tf )]
= gx (x∗ (tf ))(x(tf ) − x∗ (tf )) + [gx (x∗ (tf ∗ )) + ρψx (x∗ (tf ))] [x(tf ) − x∗ (tf )]
= ρψx (x∗ (tf )) [x(tf ) − x∗ (tf )]
= ρ [ψ(x(tf )) − ψ(x∗ (tf ))]
= 0.
Insgesamt ergibt sich somit:
∆ := F (x, u) − F (x∗ , u∗ ) ≥ 0.
2
4.4 Hinreichende Optimalitätsbedingungen für OSP
mit Zustandsbeschränkungen
Auch für zustandsbeschränkte Steuerprozesse können, analog zu unbeschränkten
Problemen aus den notwendigen Optimalitätsbedingungen, im Falle einer konvexen
minimierten Hamiltonfunktion, hinreichende Bedingungen gewonnen werden. Dabei
wird von der reinen Zustandsbeschränkung die Quasi-Konvexität gefordert.
Die hinreichenden Optimalitätsbedingungen für beschränkte Probleme lassen sich
nun im folgenden Satz zusammenfassen.
Satz 4.4.1 Sei (x*,u*) ein zulässiges Paar für das Problem (5.1), welches die Voraussetzung 3.1.7 erfüllt. Es existiere eine Funktion λ : [0, tf ] → Rn , µ : [0, tf ] → R
sowie Multiplikatoren ν(ti ), ρ ∈ Rr , so dass die notwendigen Optimalitätsbedingungen von Satz (2.3.3) mit λ0 = 1 erfüllt sind. Ferner seien:
(i) g(x) konvex,
(ii) ψ(x) affin-linear,
(iii) S(x) quasi-konvex,
(iv) H 0 (t, x, λ) sei konvex in x für alle (t, λ(t)), t ∈ [0, tf ], wobei
H 0 (t, x, λ) := min H (t, x∗ (t), λ(t), u) ,
u∈ U
Dann ist (x*,u*) eine optimale Lösung.
32
t ∈ [0, tf ].
4 Hinreichende Optimalitätsbedingungen
Der Beweis des Satzes (4.4.1) wird mittels des folgenden Satzes geführt.
Satz 4.4.2 Sei (x*,u*) ein zulässiges Paar für das Problem (5.1) mit (3.2). Es
existiere eine stückweise stetig differenzierbare Funktion λ : [0, tf ] → Rn , so dass
mit der Hamiltonfunktion H (t, x, λ, u) und λ0 = 1 für jedes andere zulässiges Paar
(x,u) folgende Bedingungen erfüllt sind:
(i) Für fast alle t ∈ [0, tf ] gilt:
H (t, x, λ, u) − H (t, x∗ , λ, u∗ ) ≥ λ̇ [x∗ (t) − x(t)] .
(4.14)
(ii) An allen Unstetigkeitsstellen τ von λ gilt die Sprungbedingung:
−
λ(τ ) − λ(τ + ) [x∗ (τ ) − x(τ )] ≥ 0.
(4.15)
(iii) Im Endzeitpunkt tf gilt:
λ(tf ) [x∗ (tf ) − x(tf )] − g(x∗ (tf )) + g(x(tf )) ≥ 0.
(4.16)
Dann ist (x*,u*) eine optimale Lösung.
Beweis: Analog zu dem Beweis des Satzes (4.3.1) ist die Aussage dieses Satzes
bewiesen, wenn gezeigt wird, dass für alle zulässige (x, u) die Ungleichung
∆ := F (x, u) − F (x∗ , u∗ ) ≥ 0
erfüllt ist. Auch hier kann die Differenz mittels der Definition der Hamiltonfunktion
umgeformt werden. Es gilt also:
∗
∆ = g (x(tf )) − g (x (tf )) +
Z
tf
(H(t, x, λ, u) − H(t, x∗ , λ, u∗ ) − λ(ẋ − ẋ∗ ))dt.
t0
Aus der Bedingung (4.14 ) ergibt sich somit:
∗
∆ ≥ g (x(tf )) − g (x (tf )) +
= g (x(tf )) − g (x∗ (tf )) +
= g (x(tf )) − g (x∗ (tf )) +
Z
tf
Z0 tf
Z0 tf
0
33
(λ̇(x∗ − x) − λ(ẋ − ẋ∗ ))dt
(λ̇(x∗ − x) + λ(ẋ∗ − ẋ))dt
(
d
λ(x − x∗ ))dt.
dt
4 Hinreichende Optimalitätsbedingungen
Unter Berücksichtigung möglicher Unstetigkeitsstellen τi der adjungierten Variablen
λ(t) erhält man:
∆ ≥ g (x(tf )) − g (x∗ (tf )) + λ(tf ) [x∗ (tf ) − x(tf )]
X
λ(τi− ) − λ(τi+ ) [x∗ (τi ) − x(τi )] − λ(0) [x∗ (0) − x(0)] .
+
i
Beachtet man, dass stets x∗ (0) = x(0) = x0 gilt, folgt aus (4.15) und (4.16) direkt
die Behauptung:
F (x, u) − F (x∗ , u∗ ) ≥ 0.
2
Beweis zu Satz 4.4.1: Es sei der Steuerbereich U durch Ungleichungen der Form:
U := {u ∈ Rm |
mit h(t, u) ≤ 0}
gegeben.
Nach Voraussetzung ist U konvex. Außerdem ist die minimierte Hamiltonfunktion
H 0 (t, x, λ) ebenfalls konvex. Demnach existiert laut Satz (4.2.11) ein Subgradient
a(t) mit
H 0 (t, x, λ) − H 0 (t, x∗ (t), λ) ≥ a(t) [x − x(t)∗ ]
(4.17)
für alle x ∈ Rn .
Mittels Definition der minimierten Hamiltonfunktion gilt somit die Abschätzung:
H(t, x, λ, u) − H(t, x∗ (t), λ, u∗ ) ≥ H 0 (t, x, λ) − H 0 (t, x∗ (t), λ) ≥ a(t) [x − x(t)∗ ]
⇒ H(t, x, λ, u) − a(t)x ≥ H(t, x∗ (t), λ, u∗ ) − a(t)x∗ .
(4.18)
Daher ist das Paar (x∗ , u∗ ) zu jedem Zeitpunkt t eine optimale Lösung für das
nichtlineare Optimierungsproblem:
M inimiere
unter
H(t, x, λ, u) − a(t)x
h(t, u) ≤ 0.
(4.19)
Die Lagrange-Funktion zu diesem Problem lautet:
L(t, x, η) = H(t, x, λ, u) − a(t)x + η(t)h(t, u)
Nach dem Satz von Karusch-Kuhn-Tucker gilt für die optimale Lösung (x∗ , u∗ ) unter
anderem folgende Bedingung:
Lx (t, x∗ , u∗ η) = Hx (t, x∗ , λ, u∗ ) − a(t) = 0.
34
(4.20)
4 Hinreichende Optimalitätsbedingungen
Des Weiteren folgt aus der adjungierten Differentialgleichung des Minimumprinzips
λ̇ = −H̃x (t, x∗ , λ, u∗ ) = −Hx (t, x∗ , λ, u∗ ) − µ(t)Sx (x∗ (t))
⇒ Hx (t, x∗ , λ, u∗ ) = −λ̇ − µ(t)Sx (x∗ (t)).
(4.21)
Durch das Einsetzen von (4.21) in (4.20) erhält man für den Subgradienten a(t):
a(t) = −λ̇ − µ(t)Sx (x∗ (t)).
(4.22)
Und damit kann die Ungleichung (4.18) weiter umgeformt werden:
H(t, x, λ, u) − H(t, x∗ (t), λ, u∗ ) ≥ [−λ̇ − µ(t)Sx (x∗ (t))][x − x(t)∗ ]
∗
∗
∗
(4.23)
∗
H(t, x, λ, u) − H(t, x (t), λ, u ) ≥ [λ̇ + µ(t)Sx (x (t))][x(t) − x]
H(t, x, λ, u) − H(t, x∗ (t), λ, u∗ ) ≥ λ̇[x(t)∗ − x] + µ(t)Sx (x∗ (t))[x(t)∗ − x].
Zudem ist der Term µ(t)Sx (x∗ (t))[x(t)∗ − x] nach Satz (4.2.8) nicht negativ. Somit
gilt:
H(t, x, λ, u) − H(t, x∗ (t), λ, u∗ ) ≥ λ̇[x(t)∗ − x]
(4.24)
und die Bedingung (4.14) des Satzes (4.4.2) ist erfüllt.
Laut der Sprungbedingung des erweiterten Minimumprinzips gilt für jede Verbindungsstelle τ von λ(t):
λ(τ − ) − λ(τ + ) = ν(τ )Sx (x∗ (τ ))
(4.25)
mit ν(τ ) ≥ 0. Laut Satz (4.2.7) ist der Ausdruck ν(τ )Sx (x∗ (τ ))(x − x∗ ) für alle x mit
S(x(t)) ≤ 0 nicht positiv, da S(x(t)) nach Voraussetzung quasi-konvex ist. Somit
kann (4.25) folgendermaßen abgeschätzt werden.
(λ(τ − ) − λ(τ + ))[x∗ − x] = [ν(τ )Sx (x∗ (τ ))][x∗ − x]
(λ(τ − ) − λ(τ + ))[x∗ − x] = −[ν(τ )Sx (x∗ (τ ))][x − x∗ ]
(4.26)
⇒ (λ(τ − ) − λ(τ + ))[x∗ − x] ≥ 0.
Damit ist die Ungleichung (4.15) des Satzes (4.4.2) sichergestellt und es bleibt nur
noch (4.16) zu zeigen. Hierfür wird die Transversalitätsbedingung verwendet. Mit
λ0 = 1 lautet diese:
λ(tf ) = λ0 gx (x∗ (tf )) + ρψx (x∗ (tf )) + γSx (x∗ (tf )),
γ ≥ 0,
γS(x∗ (tf )) = 0
35
4 Hinreichende Optimalitätsbedingungen
und aufgrund der Quasi-Konvexität von S(x) folgt mittels des Satzes (4.2.7):
γSx (x∗ (tf ))(x∗ (tf ) − x(tf )) ≥ 0.
(4.27)
Ferner ist g(x) konvex, d.h. es gilt:
g (x(tf )) − g (x∗ (tf )) ≥ gx (x∗ (tf ))(x(tf ) − x∗ (tf ))
⇔ −g (x(tf )) + g (x∗ (tf )) ≤ −gx (x∗ (tf ))(x(tf ) − x∗ (tf ))
∗
∗
(4.28)
∗
⇔ −g (x(tf )) + g (x (tf )) ≤ gx (x (tf ))(x (tf ) − x(tf )).
Außerdem folgt aus der Linearität von ψ(x)
ρψx (x∗ (tf )) [x(tf ) − x∗ (tf )] = ρ [ψ(x(tf )) − ψ(x∗ (tf ))] = 0.
(4.29)
Unter Beachtung der obigen Abschätzungen ergibt sich:
λ(tf ) = gx (x∗ (tf )) + ρψx (x∗ (tf )) + γSx (x∗ (tf ))
⇔ λ(tf )(x∗ (tf ) − x(tf )) = (gx (x∗ (tf )) + ρψx (x∗ (tf )) + γSx (x∗ (tf )) (x∗ (tf ) − x(tf ))
⇔ λ(tf )(x∗ (tf ) − x(tf )) ≥ −g (x(tf )) + g (x∗ (tf )) + γSx (x∗ (tf ))(x∗ (tf ) − x(tf ))
⇔ λ(tf )(x∗ (tf ) − x(tf )) − g (x∗ (tf )) + g (x(tf )) ≥ γSx (x∗ (tf ))(x∗ (tf ) − x(tf ))
⇔ λ(tf )(x∗ (tf ) − x(tf )) − g (x∗ (tf )) + g (x(tf )) ≥ 0.
(4.30)
Damit sind alle Voraussetzungen des Satzes (4.4.2) erfüllt. Das Paar (x∗ , u∗ ), welches den notwendigen Optimalitätsbedingungen des erweiterten Minimumprinzips
genügt, ist optimal.
2
36
5 Numerische Lösung optimaler
Steuerprozesse mittels direkter
Verfahren
Bei der Bearbeitung optimaler Steuerprozesse spielen numerische Verfahren eine
sehr wichtige Rolle, denn viele praktische Probleme sind so komplex, dass sie nicht
mehr analytisch gelöst werden können. Im wesentlichen lassen sich die numerischen
Lösungsmethoden der optimalen Steuerprozesse in zwei Klassen einteilen: direkte
und indirekte Verfahren1 . Bei den indirekten Verfahren werden die notwendigen Optimalitätsbedingungen aus der Theorie verwendet, um den Steuerprozess auf ein
Randwertproblem zurückzuführen. Zur numerischen Lösung des erhaltenen Randwertproblems kann dann eines der existierenden Verfahren, wie z.B.
• Einfach-Schießverfahren,
• Mehrfach-Schießverfahren,
• Kollokationsverfahren,
• Differenzverfahren
eingesetzt werden. Ein Vorteil indirekter Verfahren ist, dass mit deren Hilfe sehr
gute Ergebnisse, mit einer Genauigkeit der Größenordnung 10−10 , erzielt werden
können. Deren Verwendung ist jedoch auch mit sehr großen Nachteilen verbunden.
Der Benutzer sollte sich mit der Theorie der optimalen Steuerprozesse, um z. B. die
adjungierten Differentialgleichungen aufstellen zu können, gut auskennen. Zudem
wird eine anfängliche Schätzung adjungierter Variablen, die unter Umständen Unstetigkeitsstellen aufweisen, benötigt. Des Weiteren muss die Struktur der Lösung
dem Anwender bekannt sein. Es ist jedoch im Allgemeinen nicht möglich diese a
priori zu bestimmen. Besonders bei komplexen Modellen ist der Verlauf der optimalen Steuerung meistens dem Problem von vornherein nicht anzusehen.
1
Man beachte, dass die Namensgebung nichts mit dem Direkten und dem Indirekten Ansatz zur
Behandlung der reinen Zustandsbeschränkungen hat.
37
5 Numerische Lösung optimaler Steuerprozesse mittels direkter Verfahren
Bei den direkten Verfahren wird ein unendlich dimensionales Steuerungsproblem
durch Diskretisierung in ein endlich dimensionales, im Allgemeinen nichtlineares
Optimierungsproblem überführt, welches dann mit einem numerischen Algorithmus
gelöst werden kann. Auf diese Weise wurden auch die praktischen Beispiele der vorliegenden Arbeit behandelt.
5.1 Diskretisierung
Zur Diskretisierung der optimalen Steuerprozesse wird das Zeitintervall [0, tf ] in ein
Gitter mit den Gitterpunkten ti , an denen schließlich alle relevanten Größen ausgewertet werden, eingeteilt. Die einfachste Art der Diskretisierung ist die äquidistante
Aufteilung der Gitterpunkte.
Gegeben sei also ein autonomer optimaler Steuerprozess mit fester Endzeit tf 2 der
Form:
M inimiere
g (x(tf )) +
Z
tf
f0 (t, x(t), u(t)) dt
0
unter
dx(t)
= f (t, x(t), u(t))
dt
x(0) = x0 , ψ(x(tf )) = 0 ∈ Rr
ẋ(t) =
S(x(t), u(t)) ≤ 0,
t ∈ [0, tf ],
(5.1)
wobei S : Rn × Rm → Rk , k ∈ N+ eine hinreichend oft stetig differenzierbare
Funktion ist.
Sei N ∈ N+ und seien ti die Gitterpunkte des Zeitintervalls [0, tf ] mit
0 = t1 < t2 < · · · < tN −1 < tN = tf ,
des Weiteren seien die Näherungswerte für x(ti ), bzw. u(ti ) mit
xi := x(ti )
bzw.
ui := u(ti )
bezeichnet.
Dann kann ein Steuerprozess als ein Optimierungsproblem in den Variablen
(x1 , . . . , xN , u1 , . . . , uN ) ∈ R(n+m)N
2
In Abschnitt 2.2 wurde gezeigt, dass jeder Steuerprozess in so eine Form überführt werden kann.
38
5 Numerische Lösung optimaler Steuerprozesse mittels direkter Verfahren
folgendermaßen formuliert werden:
M inimiere
g (xN ) +
N
−1
X
(ti+1 − ti )f0 (xi , ui )
i=1
unter
xi+1 = xi + (ti+1 − ti )f (xi , ui ),
x1 = x0 ,
S(xi , ui ) ≤ 0,
i = 1, . . . , N − 1
(5.2)
ψ(xN ) = 0 ∈ Rr
(5.3)
i = 1, . . . , N.
(5.4)
Dabei wurde hier zur Approximation der Differentialgleichungen das Euler-Verfahren
verwendet und das Integral durch eine Treppenfunktion angenähert. Natürlich können
neben diesen Verfahren auch andere Verfahren höherer Ordnung eingesetzt werden.
Bei der Erstellung einer Lösung der praktischen Beispiele in dieser Arbeit wurde
z. B. zur Approximation des Zustandes auf das Euler-Verfahren der Ordnung O(h)
und auf das Heun-Verfahren, welches die Fehlerordnung O(h2 ) besitzt, zurückgegriffen. Beide Verfahren zeichnen sich dadurch aus, dass zur Berechnung die Werte
der Steuerung im Inneren der Teilintervalle [ti , ti+1 ] nicht benötigt werden. Bei einigen anderen Verfahren (z. B. das Runge-Kutta-Verfahren) bedarf es jedoch einer
Bestimmung der Näherungen der Steuerfunktion in den Intervallinnenpunkten. Die
zusätzlichen Werte können in solchen Fällen z. B. durch Interpolation oder auch
konstante, lineare oder kubische Splines gewonnen werden.
Eine detaillierte Beschreibung verschiedener Verfahren zur Approximation der Steuerung, des Zustandes, des Zielfunktionals, sowie der Beschränkungen kann in Kim [5]
oder Büskens [1] gefunden werden.
5.2 Vor- und Nachteile der direkten Verfahren
Die wesentlichen Vorteile der direkten Verfahren im Vergleich zu den indirekten
Verfahren sind:
• Es werden dem Anwender keine Kenntnisse der Theorie optimaler Steuerprozesse abverlangt.
• Die Schaltstruktur muss nicht bekannt sein.
• Direkte Verfahren zeichnen sich durch einen sehr großen Konvergenzradius aus.
• Die adjungierten Differentialgleichungen werden nicht benötigt.
• Eine Startschätzung der kritischen Punkte (wie z. B. Unstetigkeitsstellen, Verbindungspunkte) sowie eine Startschätzung der adjungierten Variablen sind
nicht erforderlich.
39
5 Numerische Lösung optimaler Steuerprozesse mittels direkter Verfahren
Zudem konnten höhere Rechenzeiten und geringere Genauigkeiten, die sich nachteilig
auf direkte Verfahren auswirkten, in der Vergangenheit dank neuer Entwicklungen
und Technologien soweit verbessert werden, dass sie kaum noch ins Gewicht fallen.
Die direkten Verfahren haben allerdings den Nachteil, dass sie relativ viel Speicherplatz verbrauchen. Dies macht sich insbesondere bei größeren Problemen (wie z. B.
komplexes Unternehmensmodell aus Kapitel 7 mit sieben Zustandsvariablen und
vier Steuerungen) bemerkbar.
Das Fehlen der adjungierten Variablen erweist sich nicht als ein Nachteil, denn diese
können nachträglich leicht berechnet werden.
Zur Bearbeitung der praktischen Beispiele dieser Arbeit wurden Optimierungsalgorithmen LOQO von Prof. R. J. Vanderbei sowie IPOPT von A. Wächter und
L. T. Biegler eingesetzt. Dabei wurden beide Solver unter der Programmierumgebung AMPL (AMPL ist eine algebraische Modellierungssprache zur Formulierung
von Optimierungsproblemen.) aufgerufen. Beide Programme benutzen das InnerePunkte-Verfahren zur Lösung nichtlinearer Optimierungsprobleme. Die genauen Details zur Implementierung der beiden Optimierer können in [16] bzw. [17] nachgeschlagen werden.
40
6 Das modifizierte Modell von
Lesourne und Leban
Nachdem in den vorherigen Kapiteln die benötigten Instrumente zur Lösung optimaler Steuerprozesse mit reinen Zustandsbeschränkungen vorgestellt wurden, werden nun zwei praktische Probleme aus dem Bereich der Ökonomie behandelt. Beide
Beispiele basieren auf dem in der Literatur weit verbreiteten Modell von Lesourne
und Leban [8], welches in Abschnitt 6.1 beschrieben wird. In diesem Kapitel wird
zunächst eine numerische Lösung, inklusive ausführlicher Diskussion des erweiterten
Pontryaginschen Minimumprinzips, eines abgeänderten Modells von Lesourne und
Leban vorgestellt. Die durchgeführte Modifikation war für die vorliegende Arbeit
erforderlich, um ein Problem mit nur linear auftretenden Steuerungen zu erhalten.
Das modifizierte Modell dient in dieser Arbeit vor allem als Beispiel eines ökonomischen Steuerprozesses, bei dem die notwendigen Optimalitätsbedingungen auch
hinreichend sind. Dies wird in Abschnitt 6.5 gezeigt.
6.1 Beschreibung des Modells von Lesourne und
Leban
Betriebswirtschaftlich gesehen kann das Modell von Lesourne und Leban dem Sektor
Unternehmenswachstum: Investition, Finanzierung und Beschäftigung“ zugeordnet
”
werden. Im Vordergrund des Modells steht das Firmenwachstum in einer bestimmten
Planungsperiode [0, tf ] unter Berücksichtigung der Finanz- und Beschäftigungspolitik. Die signifikante Größe des Problems, die sich in der Unternehmensdynamik
niederschlägt, ist die Kapitalstruktur des Unternehmens. Der Kapitalstock K(t)
wird aus den Finanzierungsmitteln Eigenkapital x1 (t) und Fremdkapital x2 (t) gebildet. Als Steuerungsmöglichkeiten stehen den Unternehmenseignern das Beschäftigungsniveau u1 (t), die Investitionen u2 (t) und die Dividendenauszahlung u3 (t) zur
Verfügung. Das Wachstum des Unternehmens wird am diskontierten Zahlungsfluss
der Dividenden gemessen. Das Zielfunktional lautet somit:
Z tf
Maximiere:
e−rt u3 (t)dt.
0
41
6 Das modifizierte Modell von Lesourne und Leban
Die Änderung des Eigenkapitals wird als Differenz zwischen dem mit dem Steuersatz
τ versteuerten Gewinn G und der Dividendenauszahlung u3 bestimmt:
ẋ1 (t) = (1 − τ )G(t) − u3 (t).
Zur Berechnung des reinen Gewinns wird der Erlös, der sich aus der Produktionsmenge F und dem Produktpreis p berechnen lässt, den angefallenen Kosten gegenübergestellt. Dabei wird in dem Modell davon ausgegangen, dass die gesamte
Produktionsmenge F (t) auf dem Markt umgehend absetzbar ist. Die Kosten setzen sich aus Zinsauszahlungen an die Fremdkapitalgeber, Abschreibungen auf das
Kapital und Lohnkosten zusammen. Es gilt also:
G(t) = pF (t) − ωu1 (t) − ρk x2 (t) − δK(t).
Dabei repräsentiert ω die jährliche Lohnrate, ρk den Fremdkapitalzins und δ die
Abschreibungsrate. Als Produktionsfunktion wird die in der Volkswirtschaft weit
verbreitete sublineare Cobb-Douglas-Produktionsfunktion gewählt:
F (t) = α(x1 (t) + x2 (t))α1 u1 (t)α2 ,
α, α1 , α2 > 0 und α1 + α2 < 1.
Die Veränderung des Gesamtkapitals K̇ = ẋ1 + ẋ2 ergibt sich aus der Gleichung:
K̇(t) = ẋ1 (t) + ẋ2 (t) := u3 (t) − δK(t).
Somit gilt für die Fremdkapitaländerung:
ẋ2 (t) = u3 (t) − δK(t) − ẋ1 (t) = u3 (t) − δ(x1 (t) + x2 (t)) − ẋ1 (t).
Von den beiden Zustandsvariablen x1 (t) und x2 (t) wird die Nichtnegativität verlangt.
Außerdem erwarten die Fremdkapitalgeber gewisse Sicherheiten von den Kreditnehmern. Üblicherweise wird von den Kreditgebern ein maximaler Verschuldungsgrad
κ > 0, dessen Höhe von der angestrebten Rendite des Unternehmens abhängt, festgelegt. Somit wird gesichert, dass das maximale Darlehen einen durch den Verschuldungsgrad κ gegebenen Anteil des Eigenkapitals nicht überschreitet. Mathematisch
betrachtet bedeutet das:
x2 (t) ≤ κx1 (t).
Die Randbedingungen sind für die Anfangswerte x1 (0) und x2 (0) gegeben. Da negative Beschäftigung, Investitionsrate sowie negative Dividendenauszahlung realitätsfremd sind, wird verständlicherweise von allen drei Steuerungen gefordert:
0 ≤ u1 (t)
0 ≤ u2 (t)
0 ≤ u3 (t).
42
6 Das modifizierte Modell von Lesourne und Leban
Für die Investitionsrate u2 (t) gilt zusätzlich:
u2 (t) ≤ u2max ,
denn auf einem unvollkommenen Kapitalmarkt1 sind die Investitionsmöglichkeiten
begrenzt.
Insgesamt erhält man ein Problem der Form:
Maximiere
Z
tf
e−rt u3 (t)dt
0
unter
ẋ1 = (1 − τ )(pα(x1 + x2 )α1 u1 α2 − ωu1 − ρk x2 − δ(x1 + x2 )) − u3
ẋ2 = u2 − δ(x1 + x2 ) − ẋ1
x1 (0) = x10 ,
x2 (0) = x20
0 ≤ x2
0 ≤ κx1 − x2
0 ≤ u1
0 ≤ u2 ≤ u2max
0 ≤ u3 .
Man beachte, dass das zeitliche Argument bei den Zustandsvariablen sowie den
Steuerungsvariablen aus Gründen der Vereinfachung und zur besseren Lesbarkeit
weggelassen wurde. Diese Schreibweise wird in diesem Kapitel beibehalten. Die übrigen Größen werden auf dem gesamten Planungszeitraum [0, tf ] als feste Parameter
vorgegeben und sind somit von der Zeit t unabhängig.
1
Die Prämissen für einen vollkommenen Kapitalmarkt (nach [14]) sind:
• es stehen unbeschränkte Kreditaufnahme- und Finanzmittelanlagemöglichkeiten zur
Verfügung,
• keine Differenzierung des Marktes hinsichtlich Eigen- oder Fremdkapitals und unterschiedlicher Bonität der Kunden,
• es herrscht vollständige Markttransparenz,
• es existiert einheitlicher Soll- und Habenzinssatz,
• es gibt keine Steuern und/oder keine Transaktionskosten.
43
6 Das modifizierte Modell von Lesourne und Leban
6.2 Formulierung des modifizierten
Steuerungsproblems
In dem Modell, das im oberen Abschnitt beschrieben wurde, wird das dynamische
System unter anderem auch über die Beschäftigung u1 gesteuert. Diese taucht aber
als klassischer Produktionsfaktor in der Cobb-Douglas-Produktionsfunktion als nicht
lineare Variable auf. Für die vorliegende Arbeit sind jedoch die Probleme mit linear
auftretender Steuerung von besonderem Interesse. Daher ist eine leichte Modifikation des beschriebenen Modells von Lesourne und Leban nötig. Hierfür wird die
Beschäftigung, die zuvor als Steuerungsvariable fungierte, als zusätzliche Zustandsvariable x3 unter Berücksichtigung deren Veränderung in der Dynamik eingeführt.
Auf diese Weise wird auch der Beschäftigungssektor neben dem Kapitalsektor in die
Unternehmensdynamik einbezogen. Außerdem ist die Betrachtung der Beschäftigung
als eine stetige Zustandsgröße viel realitätsnäher. Somit erhält man eine weitere Differentialgleichung:
ẋ3 = u1 ,
mit einem geeigneten Anfangswert x3 (0). Um den Beschäftigungsabbau nicht zu
vernachlässigen, werden für die Steuerung u1 auch negative Werte bis zu einem
bestimmten u1min < 0 zugelassen. Zusätzlich wird der Beschäftigungsaufbau durch
u1max begrenzt. Des Weiteren wird für die Dividendenauszahlung u3 eine obere Grenze u3max gesetzt. Die Beschäftigung x3 darf wiederum aus ökonomischen Gründen
nicht negativ werden. Für die Produktionsfunktion gilt jetzt:
F = α(x1 + x2 )α1 xα3 2 ,
α, α1 , α2 > 0 und α1 + α2 < 1.
Das so entstandene modifizierte Steuerungsproblem in Mayer-Form lautet:
Minimiere:
− x4
unter: ẋ1 = (1 − τ )(pα(x1 + x2 )α1 xα3 2 − ωx3 − ρk x2 − δ(x1 + x2 )) − u3
ẋ2 = u2 − δ(x1 + x2 ) − ẋ1
ẋ3 = u1
ẋ4 = e−rt u3
0 ≤ x2 ,
0 ≤ x3 ,
u1min ≤ u1 ≤ u1max ,
x1 (0) = x10 ,
0 ≤ κx1 − x2
0 ≤ u2 ≤ u2max ,
x2 (0) = x20 ,
0 ≤ u3 ≤ u3max
x3 (0) = x30 ,
x4 (0) = 0.
Für numerische Berechnungen müssen noch konkrete Werte der einzelnen Parameter angegeben werden. Die benötigten Angaben wurden aus [7] entnommen und
44
6 Das modifizierte Modell von Lesourne und Leban
tf
p
κ
ω
δ
τ
α
α1
α2
ρk
r
10
Planungszeitraum
0.05
konstanter Produktpreis
0.8
maximaler Verschuldungsgrad
2.0
jährliche Lohnrate
0.440
Abschreibungsrate
0.5
Steuersatz
100
Effizienzparameter
0.35
Produktionselastizität des Kapitals
0.5 Produktionselastizität der Beschäftigung
0.11
Fremdkapitalzins
0.112
Kalkulationszinssatz
Tabelle 6.1: Liste der gewählten Parameter für modifiziertes Modell
sind in der Tabelle 6.1 erfasst. Die Anfangswerte für x1 (0) und x2 (0), sowie die
Ober- und Untergrenzen für die Steuerungen wurden ebenfalls wie in [7] festgelegt.
Der Anfangswert für die neu eingeführte Zustandsvariable x3 (0), welche für den Lagerbestand steht, wurde letztendlich von der entsprechenden Variable aus dem im
nächsten Kapitel beschriebenen komplexen Unternehmensmodell übernommen. Die
gewählten Werte lauten:
x1 (0) = 100
x2 (0) = 50
x3 (0) = 30
u1min = −10
u1max = 10
u2min = 0
u2max = 100
u3min = 0
u3max = 300.
6.3 Auswertung des Minimumprinzips
Bei dem eben vorgestellten modifizierten Modell von Lesourne und Leban handelt
es sich um einen optimalen Steuerprozess mit drei reinen Zustandsbeschränkungen.
45
6 Das modifizierte Modell von Lesourne und Leban
Während die beiden Nicht-Negativitätsbedingungen,
0 ≤ x2
0 ≤ x3 ,
durch die optimale Trajektorie nicht verletzt werden und somit irrelevant sind, ist
die Beschränkung für den maximalen Verschuldungsgrad,
S(x) = x2 − κx1 ≤ 0
aktiv. Dabei handelt es sich um eine Beschränkung der ersten Ordnung, denn es gilt:
S 1 = ẋ2 − κẋ1
(6.1)
= u2 − δ(x1 + x2 ) − ẋ1 − κẋ1
= u2 − δ(x1 + x2 ) − ẋ1 (1 + κ),
d. h. S 1 ist die erste Ableitung von S, die die Steuerung u explizit enthält.
Zunächst wird die Hamiltonfunktion aufgestellt, wobei angesichts des freien Endzustandes x(tf ), λ0 = 1 gesetzt werden kann.
H = λ1 ((1 − τ )(pα(x1 + x2 )α1 xα3 2 − ωx3 − ρk x2 − δ(x1 + x2 )) − u3 )
+ λ2 (u2 − δ(x1 + x2 ) − ẋ1 ) + λ3 u1 + λ4 e−rt u3 .
Für die erweiterte Hamiltonfunktion folgt mittels des direkten Verfahrens
H̃ = λ1 ((1 − τ )(pα(x1 + x2 )α1 xα3 2 − ωx3 − ρk x2 − δ(x1 + x2 )) − u3 )
+ λ2 (u2 − δ(x1 + x2 ) − ẋ1 ) + λ3 u1 + λ4 e−rt u3 + µ(x2 − κx1 ).
Die adjungierten Differentialgleichungen lauten:
λ̇1 = −(λ1 − λ2 )(1 − τ ) pαα1 (x1 + x2 )α1 −1 xα3 2 − δ − λ2 δ − κµ
λ̇2 = −(λ1 − λ2 )(1 − τ ) pαα1 (x1 + x2 )α1 −1 xα3 2 − ρk − δ − λ2 δ + µ
λ̇3 = −(λ1 − λ2 )(1 − τ ) pαα2 (x1 + x2 )α1 xα3 2 −1 − ω
λ̇4 = 0.
Durch partielle Ableitung der erweiterten Hamiltonfunktion nach den Steuerungen
u1 , u2 , u3 erhält man folgende Schaltfunktionen:
Hu1 = Σ1 = λ3
Hu2 = Σ2 = λ2
Hu3 = Σ3 = λ4 e−rt − λ1 + λ2 .
46
6 Das modifizierte Modell von Lesourne und Leban
Nach der Minimumbedingung des Pontryaginschen Minimumprinzips (??) wird die
erweiterte Hamiltonfunktion durch optimale Steuerungen u1 , u2 , u3 minimiert. Somit
ergibt sich die folgende Struktur für optimale Steuerungen:


, Σi (t) > 0
 uimin
∗
ui (t) =
uimax
, Σi (t) < 0


unbestimmt , Σi (t) = 0



,
i = 1, 2, 3.
(6.2)


Ein Schaltpunkt tk wird durch die Bedingung Σi (tk ) = 0 festgelegt.
Aufgrund des freien Endzustands x(tf ) erhält man aus der Transversalitätsbedingung folgende Randbedingungen für die adjungierten Differentialgleichungen:
λ1 (tf ) = 0
λ2 (tf ) = 0
λ3 (tf ) = 0
(6.3)
λ4 (tf ) = −1.
Man beachte jedoch, dass die Endbedingungen (6.3) nur dann ihre Gültigkeit behalten, wenn die Zustandsbeschränkung am Ende der Planungsperiode inaktiv ist.
D. h. falls gilt:
S(x∗ (tf )) < 0.
Für den Fall S(x∗ (tf )) = 0, welcher bei dem betrachteten Problem tatsächlich auftritt, gilt:
λ1 (tf ) = −κγ
λ2 (tf ) = γ
λ3 (tf ) = 0
(6.4)
λ4 (tf ) = −1,
mit γ ∈ R, γ ≥ 0.
Außerdem gilt nach Komplementaritätsbedingung im Optimum für die Multiplikatorfunktion µ(t):
µ(t) ≥ 0,
µ(t) = 0,
f alls S(x∗ (t)) < 0.
47
6 Das modifizierte Modell von Lesourne und Leban
t
[ 0 , t1
[ t1 , t2
[ t2 , t3
[ t3 , t4
[ t4 , tf
u1
]
]
]
]
]
u2
u3
x2 − κx1 ≤ 0
u1max
u2min
u3max
u1max
u2min
singulär
u1min
u2min
singulär
singulär singulär singulär
singulär
u2min
singulär
n.a
a.
a.
a.
a.
Tabelle 6.2: Optimale Schaltstruktur des modifizierten Problems
t1
t2
t3
t4
0.062 0.9051 1.76 6.57
Tabelle 6.3: Schaltpunkte des modifizierten Problems
6.4 Numerische Ergebnisse
Bei der Erstellung einer numerischen Lösung des oben beschriebenen Modells wurden
zuerst die Fortran-Routine NUDOCCCS und der Optimierungsalgorithmus LOQO
zu Rate gezogen. Doch konnten die beiden Solver das vorliegende Problem nicht
lösen. NUDOCCCS lieferte immerhin einige Ergebnisse, die der später erhaltenen
optimalen Lösung ähnelten. Der Löser LOQO gab dagegen nur Fehlermeldungen
aus, er könne mit den gewählten Anfangswerten nicht rechnen. Auch eine Vorgabe
der Anfangswerte bei der Deklaration der Variablen, die erfahrungsgemäß schon mal
(beim Lösen des komplexen Modells2 ) geholfen hatte, führte nicht zum Ziel. Darauf wurde der Optimierungssolver IPOPT, der sich genau wie LOQO mit AMPL
schneidet und auf dem Innere-Punkte-Verfahren basiert, eingesetzt. Dabei wurde
dieselbe Quelldatei benutzt, die vorher mit LOQO nicht funktionierte. Schließlich
bekam man mithilfe des neu gewählten Solvers eine Lösung, die im nachfolgenden
vorgestellt wird. Die Rechenzeit betrug ca. 296.45 Sekunden, wobei zur Approximation des Zustandes das Euler-Verfahren bei 10000 Diskretisierungspunkten verwendet
wurde.
In der Tabelle (6.2) ist die Schaltstruktur der optimalen Steuerungen zusammengefasst. Die zugehörigen Schaltpunkte können der Tabelle (6.3) entnommen werden.
Die optimalen Zustände und die adjungierten Variablen sind in den Abbildungen
(6.2), (6.3) zu finden. Die Abbildung (6.1) zeigt den Verlauf der optimalen Steuerungen, während in der Abbildung (6.4) die Schaltfunktionen des modifizierten Modells
2
Im Entstehungsprozess dieser Arbeit wurde erst komplexes Unternehmensmodell, welches im
nächsten Kapitel behandelt wird, bearbeitet.
48
6 Das modifizierte Modell von Lesourne und Leban
10
40
8
6
4
30
u_2
u_1
2
0
20
-2
-4
-6
10
-8
-10
0
0
1
2
3
4
5
t
6
7
8
9
10
0
1
2
3
4
5
t
5
t
6
7
8
9
10
6
7
8
9
10
300
270
240
210
u_3
180
150
120
90
60
30
0
0
1
2
3
4
Abbildung 6.1: Die optimalen Steuerungen des modifizierten Modells
dargestellt sind. In der Abbildung (6.5) ist die Multiplikatorfunktion zu sehen.
Zunächst wird überprüft, ob die von dem Programm gelieferte optimale Lösung des
Problems die notwendigen Optimalitätsbedingungen tatsächlich erfüllt. Hierfür wird
jedes Zeitintervall einzeln betrachtet.
1. Zeitintervall [0, t1 ]
Auf dem ersten Intervall [0, t1 ] weisen alle drei Steuerungen eine bang-bang Struktur
auf. Für die Schaltfunktionen gilt hier:
Σ1 (t) < 0,
∀ t ∈ [0, t1 )
Σ2 (t) > 0,
∀ t ∈ [0, t1 )
Σ3 (t) < 0,
∀ t ∈ [0, t1 ).
49
6 Das modifizierte Modell von Lesourne und Leban
70
100
60
50
40
60
x_2
x_1
80
30
40
20
20
10
0
0
0
1
2
3
4
5
t
6
7
8
9
10
0
40
1
2
3
4
5
t
6
7
8
9
10
4
5
t
6
7
8
9
10
160
140
35
120
30
x_4
x_3
100
25
80
60
20
40
15
20
10
0
0
1
2
3
4
5
t
6
7
8
9
10
0
1
2
3
Abbildung 6.2: Die optimalen Trajektorien des modifizierten Modells
Die Steuerung u∗1 und u∗3 nehmen ihren Maximalwert und die Steuerung u∗2 ihren Minimalwert an. In diesem kleinen Zeitraum, der in den Grafen zwar schlecht
zu erkennen ist, aber dennoch vorhanden, findet demnach die maximal mögliche
Ausschüttung der Dividenden statt.
Die Verschuldungsbeschränkung ist auf [0, t1 ] nicht aktiv, d. h. es handelt sich hier
also um ein inneres Teilstück. Die Komplementaritätsbedingung ist mit µ(t) = 0 für
alle t ∈ [0, t1 ) erfüllt.
2. Zeitintervall [t1 , t2 ]
Der Zeitpunkt t1 = 0.062 ist der Eintrittspunkt der Verschuldungsbeschränkung,
welche ab t1 bis zum Ende der Planungsperiode tf = 10 aktiv ist, d. h. es gilt:
x2 − κx1 = 0,
∀ t ∈ [t1 , tf ].
Demnach liegt bei dem gegebenen Problem auf dem Intervall [t1 , tf ] ein Randstück
vor. Man beachte hier insbesondere, dass sich dadurch die Endbedingungen für die
50
0
0.2
-0.2
0.16
{/Symbol l_2^1}
{/Symbol l_1^1}
6 Das modifizierte Modell von Lesourne und Leban
-0.4
-0.6
-0.8
0.12
0.08
0.04
-1
0
0
1
2
3
4
5
t
6
7
8
9
10
0
0.02
1
2
3
4
5
t
6
7
8
9
10
4
5
t
6
7
8
9
10
-1.01
0
-1.005
-0.04
{/Symbol l_3^1}
{/Symbol l_3^1}
-0.02
-0.06
-1
-0.08
-0.1
-0.995
-0.12
-0.14
-0.99
0
1
2
3
4
5
t
6
7
8
9
10
0
1
2
3
Abbildung 6.3: Die optimalen Adjungierten des modifizierten Modells
adjungierten Differentialgleichungen, die man mittels der Transversalitätsbedingung
erhält, ändern. In t1 = 0.062 ändert sich auch das Verhalten der Steuerung u∗3 ,
diese zeigt von da an einen singulären Verlauf. Die erste bzw. die zweite Steuerung
nimmt auf [t1 , t2 ) weiterhin ihre Ober- bzw. ihre Untergrenze an. Die Grafen der
Schaltfunktion (6.4) zeigen, dass die Minimumbedingung auch hier erfüllt wird, denn
es gilt:
Σ1 (t) < 0,
∀ t ∈ [t1 , t2 ),
Σ2 (t) > 0,
∀ t ∈ [t1 , t2 ],
Σ3 (t) = 0,
∀ t ∈ [t1 , tf ].
Des Weiteren sieht man an dem Grafen (6.5), dass die Vorzeichen- und Komplementaritätsbedingung ebenfalls eingehalten werden. Die Multiplikatorfunktion µ(t)
weist folgenden Verlauf auf:
µ(t) = 0,
∀ t ∈ [0, t1 ]
µ(t) > 0,
∀ t ∈ [t1 , tf ].
51
6 Das modifizierte Modell von Lesourne und Leban
0.02
0.2
0
0.16
-0.04
{/Symbol l_2^1}
{/Symbol l_3^1}
-0.02
-0.06
-0.08
0.12
0.08
-0.1
0.04
-0.12
-0.14
0
0
1
2
3
4
5
t
6
7
8
9
10
0
1
2
3
4
5
t
6
7
8
9
10
0
{/Symbol s_1^4}
-0.05
-0.1
-0.15
-0.2
0
1
2
3
4
5
t
6
7
8
9
10
Abbildung 6.4: Die Schaltfunktionen des modifizierten Modells
Mit Hilfe der Minimumbedingung lässt sich die Multiplikatorfunktion berechnen,
denn auf dem gesamten Randstück [t1 , tf ] gilt Σ3 (t) = 0. Daraus folgt unmittelbar,
dass auch die Ableitung der Schaltfunktion auf diesem Stück verschwindet, d. h. es
gilt:
Σ̇3 (t) = λ̇4 e−rt − rλ4 e−rt − λ̇1 + λ̇2 = 0.
Wie man der nachfolgenden Rechnung entnehmen kann, ist der Multiplikator µ in
dem obigen Term enthalten.
⇒ 0 = Σ̇3 (t) = −rλ4 e−rt + (λ1 − λ2 )(1 − τ ) pαα1 (x1 + x2 )α1 −1 xα3 2 − δ − λ2 δ
− κµ − (λ1 − λ2 )(1 − τ ) pαα1 (x1 + x2 )α1 −1 xα3 2 − ρk − δ − λ2 δ + µ
= −rλ4 e−rt − ρk (λ2 − λ1 )(1 − τ ) + (1 + κ)µ.
52
4
4
3.5
3.5
3
3
10^2 x {/Symbol m_1}
10^2 x {/Symbol m_1}
6 Das modifizierte Modell von Lesourne und Leban
2.5
2
1.5
2.5
2
1.5
1
1
0.5
0.5
0
0
0
2
4
6
8
10
0
2
t
4
6
8
10
t
Abbildung 6.5: Multiplikatorfunktion: (links) mittels IPOPT erhaltene µ(t), (rechts)
theoretisch ausgerechnete µ(t)
Durch Auflösen der Gleichung nach µ erhält man schließlich:
⇒ µ(t) =
rλ4 e−rt + ρk (λ2 − λ1 )(1 − τ )
.
(1 + κ)
In dem rechten Grafen der Abbildung (6.5) ist die theoretisch ausgerechnete Multiplikatorfunktion µ(t) auf dem Intervall [t1 , tf ] dargestellt. Diese stimmt auf [t1 , tf ]
exakt mit der, von dem Optimierungssolver IPOPT gelieferten µ(t) überein.
Außerdem lässt sich die optimale Steuerung u∗3 auf dem gesamten Randstück in
Abhängigkeit von x1 , x2 , x3 , u2 bestimmen. Laut (6.1) handelt es sich bei der Verschuldungsbeschränkung um eine Zustandsbeschränkung der Ordnung p = 1. Die
Voraussetzung (3.1.7) ist mit
∂S 1
(x, u) = −(1 − τ )(1 + κ) 6= 0 ∀ t ∈ [t1 , tf ]
∂u3
erfüllt. Somit gilt auf [t1 , tf ] folgendes:
x2 − κx1 = 0
⇒ ẋ2 − κẋ1 = 0
⇒ u2 − δ(x1 + x2 ) − ẋ1 − κẋ1 = 0
⇒ u2 − δ(x1 + x2 ) − ẋ1 (1 + κ) = 0
⇒ −((1 − τ )(pα(x1 + x2 )α1 xα3 2 − ωx3 − ρk x2 − δ(x1 + x2 )) − u3 )(1 + κ) −
−δ(x1 + x2 ) + u2 = 0.
Bedenkt man noch, dass auf dem Randstück x2 = κx1 gilt, so resultiert offensichtlich
daraus:
u2 − δx1 (1 + κ)
. (6.5)
u3 = (1−τ )(pα(x1 (1+κ))α1 x3α2 −ωx3 −ρk κx1 −δx1 (1+κ))−
1+κ
53
6 Das modifizierte Modell von Lesourne und Leban
Die oben ausgerechnete Gleichung für u3 gilt auf dem gesamten Randstück [t1 , tf ].
Durch Einsetzen des optimalen Wertes u∗2 = 0, erhält man auf dem betrachteten
Zeitintervall [t1 , t2 ] folgende Vorschrift für u∗3 :
u∗3 = (1 − τ )(pα(x1 (1 + κ))α1 xα3 2 − ωx3 − ρk κx1 − δx1 (1 + κ)) + δx1 .
(6.6)
3. Zeitintervall [t2 , t3 ]
Im Zeitpunkt t2 = 0.9051 springt der Wert der Steuerung u∗1 von u1max auf u1min .
Für den Schaltpunkt t2 gilt:
Σ1 (t2 ) = 0,
und die Schaltfunktion der ersten Steuerung nimmt auf dem ganzen Intervall nur
streng positive Werte an,
Σ1 (t) > 0 ∀ t ∈ (t2 , t3 ).
4. Zeitintervall [t3 , t4 ]
Auf diesem Zeitintervall verhalten sich alle drei Steuerungen singulär, was durch den
Verlauf der Schaltfunktionen, wie man den Grafen der Abbildung (6.4) entnehmen
kann, bestätitgt wird:
Σ1 (t) = 0
Σ2 (t) = 0
Σ3 (t) = 0.
Da es sich bei dem betrachteten Intervall immer noch um einen Randstück handelt,
bleibt die für die Steuerung u3 berechnete Vorschrift auch hier erhalten. Es müssen
nur noch die Steuerungen u1 und u2 bestimmt werden. Laut Kapitel 2.4 kann der
Verlauf einer singulären Steuerung in einigen Fällen mittels der Schaltfunktion ausgerechnet werden. Dazu wird die Schaltfunktion solange nach der Zeit t differenziert
bis die gesuchte Steuerung in der Ableitung auftaucht. Bei dem gegebenen Problem
treten die benötigten Steuerungen schon in der zweiten Ableitung auf. Es gilt hier:
Σ1 (t) = 0 ⇒ Σ̇1 (t) = λ̇3 = 0
⇒
Σ̈1 (t) = λ̈3 = 0
Σ2 (t) = 0 ⇒ Σ̇2 (t) = λ̇2 = 0
⇒
Σ̈2 (t) = λ̈2 = 0,
54
6 Das modifizierte Modell von Lesourne und Leban
mit
Σ̈1 = (1 − τ )[((λ2 − λ1 )(1 − τ )ρk + µ(1 + κ)) pαα2 (x1 + x2 )α1 x3α2 −1 − ω
α1 (u2 − δ(x1 + x2 )) (α2 − 1)u1
+ (λ2 − λ1 )pα2 F (
+
)]
(x1 + x2 )x3
x23
Σ̈2 = (1 − τ )[((λ2 − λ1 )(1 − τ )ρk + µ(1 + κ))(pαα1 (x1 + x2 )α1 −1 xα3 2 − ρk − δ)
α2 u1
(α1 − 1)(u2 − δ(x1 + x2 ))
+
)]
+ (λ2 − λ1 )pα1 F (
2
(x1 + x2 )
(x1 + x2 )x3
+ δ((λ1 − λ2 )(1 − τ ) pαα1 (x1 + x2 )α1 −1 xα3 2 − ρk − δ − λ2 δ + µ) + µ̇.
Dabei stehen G bzw. F für die Gewinnfunktion bzw. die Produktionsfunktion, die
in dem vorliegenden Beispiel folgendermaßen gewählt wurden3 :
G = pF − ωx3 − ρk x2 − δ(x1 + x2 )
F = pα(x1 + x2 )α1 xα3 2 .
Nach einigen Umformulierungen der beiden Gleichungen erhält man ein lineares
(2 × 2) Gleichungssystem der Form:
a11 u1 + a12 u2 = b1
a21 u1 + a22 u2 = b2
mit den Koeffizienten
b1 =
b2 =
−
+
a11 =
a12 =
a21 =
a22 =
((λ1 − λ2 )(1 − τ )ρk + µ(1 + κ)) pαα2 (x1 + x2 )α1 x3α2 −1 − ω
δα1
+
α2 pF (λ2 − λ1 )
x3
α1 −1 α2
δ((λ2 − λ1 )(1 − τ ) [pαα1 (x1 + x2 )
x3 − ρk − δ − λ2 δ + µ) + µ̇]
α1 pF (λ2 − λ1 )(1 − τ )
((λ2 − λ1 )(1 − τ )ρk + µ(1 + κ))(pαα1 (x1 + x2 )α1 −1 xα3 2 − ρk − δ)
α1 pF (λ2 − λ1 )
δ(α1 − 1)
(x1 + x2 )
α2 − 1
x23
α1
(x1 + x2 )x3
α2
(x1 + x2 )x3
α1 − 1
.
(x1 + x2 )2
Unter Zuhilfenahme des Gauß-Eliminationsverfahrens ergibt sich folgende Lösung:
3
siehe Abschnitt (6.2)
55
6 Das modifizierte Modell von Lesourne und Leban
u∗1 =
u∗2 =
b1 − a12 u2
a11
21
b2 − aa11
b1
a22 −
(6.7)
.
a21
a
a11 12
(6.8)
Man beachte, dass in dem Term b2 sowohl der Multiplikator µ als auch dessen Ableitung,
−r2 λ4 e−rt + ρk (1 − τ ) [(λ2 − λ1 )(1 − τ )ρk + µ(1 + κ)]
,
(1 + κ)
auftauchen. Beide enthalten keine Steuerungsvariablen.
µ̇ =
5. Zeitintervall [t4 , tf ]
Auf dem letzten Intervall springt die Steuerung u∗2 im Schaltpunkt t4 = 6.57 wiederum auf ihren Minimalwert. Es gilt:
Σ2 (t4 ) = 0
Σ2 (t) > 0 ∀ t ∈ (t4 , tf ].
Die Steuerung u∗1 und u∗3 weisen weiterhin einen singulären Verlauf auf. Die beiden
Schaltfunktionen verschwinden auch auf dem letzten Zeitintervall:
Σ1 (t) = 0 ∀ t ∈ [t4 , tf ]
Σ3 (t) = 0 ∀ t ∈ [t4 , tf ].
Für die optimale Steuerung u∗3 gilt weiterhin die Vorschrift (6.5). Die Berechnung
der Steuerung u∗1 erfolgt genau wie im 4. Zeitintervall, wobei in die Gleichung (6.7)
für die Steuerung u∗2 der neue optimale Wert u∗2 = 0 eingesetzt wird. Demnach sieht
die u∗1 auf [t4 , tf ] folgendermaßen aus:
b1
.
(6.9)
a11
In den obigen Ausführungen wurde nun gezeigt, dass sowohl die Minimumbedingung
als auch die Vorzeichen- Komplementaritätsbedingung überall eingehalten werden.
Es bleibt also nur noch die Transversalitätsbedingung (6.4) zu prüfen. Hierfür werden die Werte der adjungierten Variablen an den Grafen der Abbildung (6.3) im
Endzeitpunkt tf = 10 abgelesen, diese lauten:
u∗1 =
λ1 (tf ) = −0.145,
λ2 (tf ) = 0.181,
λ3 (tf ) = 0,
λ4 (tf ) = −1.
Somit ist auch die Transversalitätsbedingung mit γ = 0.181 erfüllt.
Die von dem Optimierungsalgorithmus IPOPT gelieferte Lösung genügt also auf der
ganzen Planungsperiode [0, tf ] den notwendigen Optimalitätsbedingungen.
56
6 Das modifizierte Modell von Lesourne und Leban
6.5 Überprüfung der hinreichenden
Optimalitätsbedingungen
Um zu zeigen, dass die notwendigen Optimalitätsbedingungen auch hinreichend sind,
müssen die Voraussetzungen von Satz (4.4.1) nachgeprüft werden. Die ersten drei
Bedingungen sind trivialerweise erfüllt, denn es gilt:
1. g(x) ist als eine lineare Funktion konvex,
2. ψ(x) = 0,
3. S(x) = x2 − κx1 ist ebenfalls linear.
Es bleibt noch zu zeigen, dass die minimierte Hamiltonfunktion konvex in x ist, bzw.
gemäß Bemerkung (4.3.2), dass die Hamiltonfunktion konvex in x und u ist.
Die Hamiltonfunktion zu dem modifizierten Modell von Lesourne und Leban lautet:
H = (λ1 − λ2 ) ((1 − τ )(pα(x1 + x2 )α1 xα3 2 − ωx3 − ρk x2 − δ(x1 + x2 )) − u3 )
+ λ2 (u2 − δ(x1 + x2 )) + λ3 u1 + λ4 e−rt u3 .
Beim näheren Betrachten der obigen Funktion fällt auf, dass sowohl x als auch u
mit der Ausnahme des ersten Terms
T := (λ1 − λ2 )(1 − τ )pα(x1 + x2 )α1 xα3 2
linear auftreten. Nach Satz (4.2.9) ist eine positive Linearkombination konvexer
Funktionen wiederum konvex. Demnach ist die Hamiltonfunktion konvex, falls die
Funktion T auf ihrem Definitionsbereich konvex ist. Dies wird anhand folgender
Überlegungen nachgewiesen.
Zuerst betrachte man die Funktion F1 , die durch
F1 := (x1 + x2 )α1 xα3 2
definiert sei. Die Hesse-Matrix der Funktion F1 lautet:

α
α
(x1 +x2 )α1 x3 2
(x +x2 )α1 x3 2
α
(α
−
1)
α1 (α1 − 1) 1(x1 +x
1
1
2
2
)
(x
+x
)
2
1
2
α
α

(x1 +x2 )α1 x3 2
(x1 +x2 )α1 x3 2
∇2 F1 = 
α
(α
−
1)
α
(α
−
1)
1
1
(x1 +x2 )2
(x1 +x2 )2
 1 1
α
α
(x1 +x2 )α1 x3 2
(x1 +x2 )α1 x3 2
α1 α2 (x1 +x2 )x2
α1 α2 (x1 +x2 )x2
Oder mit den Bezeichnungen:
(x1 + x2 )α1 xα3 2
(x1 + x2 )2
(x1 + x2 )α1 xα3 2
b := α1 α2
(x1 + x2 )x2
(x1 + x2 )α1 xα3 2
c := α2 (α2 − 1)
x22
a := α1 (α1 − 1)
57
α
(x1 +x2 )α1 x3 2
(x1 +x2 )x2
α
(x1 +x2 )α1 x3 2
α1 α2 (x1 +x2 )x2
α
(x +x )α1 x 2
α2 (α2 − 1) 1 x2 2 3
2
α1 α2


.

6 Das modifizierte Modell von Lesourne und Leban


a a b


∇2 F1 :=  a a b  .
b b c
Für die Trajektorien x1 (t), x2 (t), x3 (t) gilt für alle t ∈ [0, tf ] die Nichtnegativitätsbedingung. Aufgrund der Wahl der Parameter α1 = 0.35 und α2 = 0.5 gilt:
α1 − 1 < 0
und
α2 − 1 < 0.
Somit ergeben sich für die Komponenten der Hesse-Matrix der F1 Funktion folgende
Abschätzungen:
a < 0
b > 0
c < 0.
Da die Matrix ∇2 F1 symmetrisch ist, kann zur Überprüfung der Definitheit dieser Matrix das Eigenwertkriterium (4.2.14) benutzt werden. Man rechnet für die
Eigenwerte EW von ∇2 F1 leicht nach:
EW1 = 0
p
(2a − c)2 + 8b2
2a + c
−
EW2 =
2
2
p
(2a − c)2 + 8b2
2a + c
+
.
EW3 =
2
2
Aufgrund der Negativität von a und c folgt für EW2 unmittelbar EW2 ≤ 0. Für
EW3 gilt:
p
(2a − c)2 + 8b2
2a + c
EW3 =
+
≤0
2
p 2
(2a − c)2 + 8b2
2a + c
)≥
⇔ −(
2
2
p
⇔ −(2a + c) ≥ (2a − c)2 + 8b2
⇔ (2a + c)2 ≥ (2a − c)2 + 8b2
⇔ (2a + c)2 ≥ (2a + c)2 − 8ac + 8b2
⇔ 0 ≥ −8ac + 8b2
⇔ 0 ≥ −ac + b2 .
Die letzte Ungleichung wird mit den gewählten Parametern erfüllt, denn es gilt:
F1
−ac + b2 = −α1 (α1 − 1)α2 (α2 − 1) + α12 α22
{z
} (x1 + x2 )2 x23
|
{z
}
|
:=−0.02625
≥0
58
6 Das modifizierte Modell von Lesourne und Leban
Die Eigenwerte EW der Hesse-Matrix sind also kleiner bzw. gleich Null. Damit ist
die Funktion F1 laut Satz (4.2.14) konkav in x.
Des Weiteren ist die Differenz:
(λ1 − λ2 )
wegen λ1 < 0, λ2 ≥ 0 auf dem gesamten Zeitintervall [0, tf ] negativ. Die Parameter
(1 − τ ), p und α sind positive Konstanten. Demnach ist T konvex in x. Somit ist die
Hamiltonfunktion konvex in x und u.
Alle Voraussetzungen von Satz (4.4.1) sind erfüllt und ein Paar (x∗ , u∗ ), welches
den notwendigen Bedingungen des erweiterten Pontryaginschen Minimumprinzips
genügt, ist optimal.
Interpretation der Ergebnisse
Die erhaltene Lösung des modifizierten Modells von Lesourne und Leban zeigt, dass
bei Anwendung der optimalen Strategie die Verschuldungsbeschränkung sehr früh
aktiv wird. Der Anfangsbestand von 100 GE an Eigenkapital wird schnell abgebaut
und der Fremdkapitalbestand rasch aufgebaut, bis man bei maximaler Fremdkapitalaufnahme von x2 = κx1 angelangt ist. Außerdem erfolgt in der Zeit maximale Auszahlung der Dividenden, u∗3 = u3max . Danach (im Zeitraum [t2 , t3 ]) wird der gesamte
Kapitalstock x1 + x2 des Unternehmens solange verringert bis die optimalen Werte
von ungefähr 39 GE an x1 und 31 GE an x2 erreicht sind. Dieses Verhalten weist eindeutig darauf hin, dass die gewählten Anfangswerte der beiden Kapitalbestände viel
zu hoch sind. In den ersten zwei Jahren (bis t3 = 1.76) werden keine Investitionen
getätigt (u∗2 = u2min = 0). Es findet eine sehr hohe Dividendenausschüttung statt
und die anfängliche Fremdkapitalaufnahme kann damit erklärt werden, dass es für
die Eigenkapitalgeber stets von Vorteil ist, die maximale Verschuldungsmöglichkeit
auszuschöpfen. Denn deren Kalkulationszinssatz r = 0.112 liegt deutlich über dem
Fremdkapitalzins ρk = 0.11. Demnach ist es für die Unternehmenseigner günstiger“
”
Fremdkapital aufzunehmen als Eigenkapital zu verarbeiten. Genau dies begründet
auch das Aktivsein der Verschuldungsbeschränkung (fast) auf der ganzen Planungsperiode.
Sobald der optimale Kapitalstock erreicht ist, werden alle Größen auf einem konstanten Wert gehalten. Auch an der Anzahl der Beschäftigten x2 ändert sich in dieser
Zeitspanne [t3 , t4 ] nichts. Es finden fortwährend gleich bleibende Investitionen von
annährend 30.8 GE sowie Dividendenauszahlungen in Höhe von ca. 13 GE statt.
Schließlich kann gegen Ende der Planungsperiode wiederum ein deutlicher Abbau
an allen dem Unternehmen zur Verfügung stehenden Kapitalbeständen beobachtet werden. Die beiden Zustandsvariablen x1 , x2 fallen monoton. Das Verhalten der
59
6 Das modifizierte Modell von Lesourne und Leban
optimalen Steuerungen und Trajektorien auf [t4 , tf ] hängt offensichtlich mit dem
anvisierten Ziel, die diskontierten Dividendenauszahlungen in tf zu maximieren, zusammen. Die Investitionsrate u∗2 springt in t4 erneut auf Null, wo sie auch auf dem
letzten Zeitintervall [t4 , tf ] bleibt. Außerdem nimmt die Beschäftigungsänderung u∗1
negative Werte an, d. h. die Anzahl der Arbeitskräfte wird reduziert. Dies sieht man
selbstverständlich auch an dem Grafen der optimalen Beschäftigung x2 .
Der Wert des betragsmäßig zu minimierenden Zielfunktionswerts liegt bei |148.06047|
GE.
60
7 Ein komplexes
Unternehmensmodell
In diesem Kapitel geht es um die Lösung eines komplexen Unternehmensmodells,
welches von B. Koslik in [7] aufgestellt wurde. Dabei handelt es sich um ein ökonomisches Modell mit vier linear auftretenden Steuerungen, sieben Zustandsvariablen
und zwei aktiven Zustandsbeschränkungen.
Bei der Modellierung des komplexen Unternehmensproblems war man bemüht, ausgehend von dem Beispiel von Lesourne und Leban, einen optimalen Steuerprozess
aufzustellen, welcher die realen wirtschaftlichen Vorgänge möglichst gut abbildet.
Dabei wurde das ursprüngliche Modell, das nur die Kapitalstruktur eines Unternehmens einbezieht, um die Größen aus dem Beschäftigungs- und Produktionsbereich
erweitert. Zusätzlich wurden die konjunkturellen Schwankungen in den Zinssätzen
und in der Inflationsrate berücksichtigt. Das so entstandene sehr realitätsnahe Modell erlaubt die Wiedergabe und Erklärung bekannter realer Phänomene.
In der Diplomarbeit von B. Koslik wurden zur Vermeidung von Oszillationen die
wirksamen Zustandsbeschränkungen in härtere Steuerungsbeschränkungen transformiert. Hier aber wird komplexes Unternehmensmodell unter Berücksichtigung der
beiden reinen Zustandsbeschränkungen behandelt. Außerdem wird anstatt konstanter Lohnkosten mit im laufe der Zeit steigenden Lohnkosten gerechnet.
In dieser Arbeit werden erst die Lösungen des komplexen Modells bei variierendem
sowie bei konstantem Produktpreis vorgestellt und miteinander verglichen. Anschließend wird am Fall des variierenden Preises gezeigt, dass sich bei einer Verdoppelung
der Planungsperiode an dem optimalen Verhalten nur wenig ändert.
7.1 Beschreibung des komplexen
Unternehmensmodells
In diesem Abschnitt werden zunächst die wichtigsten Erweiterungen von dem Modell von Lesourne und Leban auf komplexes Unternehmensmodell kurz erläutert.
Da es sehr unwahrscheinlich ist, dass ein Unternehmen seine gesamten Produkti61
7 Ein komplexes Unternehmensmodell
onsgüter sofort auf dem Markt absetzen kann, wird in dem komplexen Problem
die Möglichkeit der Lagerhaltung der produzierten Güter berücksichtigt. Der Lagerbestand x1 (t) kann durch die neue Steuerungsvariable u1 (t), die Lageränderung,
organisiert werden:
ẋ1 (t) = u1 (t).
Für den Lagerbestand x1 (t) werden minimaler x1min und maximaler Wert x1max
eingeführt. Denn um eventuellen Engpässen bei der Nachfrage entgegen zu steuern,
muss ein Mindestbestand definiert werden. Zudem kann nur eine begrenzte Menge
an Waren deponiert werden.
Des Weiteren geht die Beschäftigung x2 (t) wie schon im modifizierten Modell in das
dynamische System als eine Zustandsvariable, die über die Beschäftigungsänderung
u2 (t) gesteuert wird, ein:
ẋ2 (t) = u2 (t).
Einen großen Vorteil des komplexen Unternehmensmodells bildet die genauere Differenzierung im Finanzierungsbereich. So wird hier, im Gegensatz zu dem Ursprungsmodell, zwischen der Fremdkapitaländerung u3 (t) und der Eigenkapitaländerung
u4 (t) als Steuerungsmaßnahmen des Geldflusses unterschieden. Die Dividendenauszahlung ist trivialerweise in der Eigenkapitaländerung enthalten. Zudem beinhaltet
der Zustandsvektor die neuen Größen: alternative (sichere) Anlagen x5 (t) und Risikozahlung x6 (t). Während durch die Fremdkapitaländerung der Aufbau/Abbau
(u3 (t) > 0/u3 (t) < 0) des Fremdkapitalbestandes x3 (t) geregelt wird, wird mittels
der neuen Steuerung, Eigenkapitaländerung, das Eigenkapital x4 (t) auf die Investitionen (u4 (t) > 0) in das eigene Unternehmen oder in die alternativen Anlagen
(u4 (t) < 0) unterteilt. Die Entwicklung der vier Kapitalgrößen unterliegt der folgenden Dynamik:
ẋ3 (t) = u3 (t)
ẋ4 (t) = u4 (t) + (1 − τ )(G(t) − ρr (t)x4 (t))
ẋ5 (t) = −u4 + (1 − τ )ρm (t)x5 (t)
ẋ6 (t) = (1 − τ )ρr (t)x4 (t).
Dabei ist G(t) die Gewinnfunktion des Unternehmens mit
G(t) =
1
((p(t)(F (t) − u1 (t)) − σx1 (t) − ωx2 (t)) − ρk (t)x3 (t) − δ(x3 (t) + x4 (t))
x7 (t)
und F (t) die Cobb-Douglas-Produktionsfunktion
F = α(x3 (t) + x4 (t))α1 xα2 2 (t),
α, α1 , α2 > 0
62
α1 + α2 < 1.
7 Ein komplexes Unternehmensmodell
2.45
2.4
2.35
2.3
2.25
2.2
2.15
2.1
2.05
2
0
1
2
3
4
5
6
7
8
9
10
Abbildung 7.1: Die steigende Lohnkostenfunktion
Durch σ werden die jährlichen Lagerhaltungskosten pro aufbewahrte Einheit gegeben und durch ω die jährliche Lohnrate. δ steht für die Abschreibungsrate auf das
Kapital und τ für den Steuersatz. Mit ρk wird der Fremdkapitalzins, mit ρm der
Geldmarktzins und mit ρr die Risikoversicherung der Eigenkapitalgeber bezeichnet.
Schließlich sind α, α1 , α2 produktionsspezifische Parameter und p der Preis, zu dem
die Ware auf dem Markt abgesetzt wird.
Für numerische Berechnungen müssen für alle diese Parameter konkrete Werte vorgegeben werden. Dabei gilt, je realitätsnäher diese gewählt werden, desto realitätsnäher
und aussagekräftiger sind die Ergebnisse. Aus diesem Grunde wurden bei der Modellierung des vorliegenden Beispiels für den Fremdkapitalzinssatz und den Geldmarktzinssatz reale ökonomische Werte eingesetzt. Diese wurden durch trigonometrische
Funktionen approximiert. Bei der ersten Lösung des Problems in der Diplomarbeit
von B. Koslik wurden die übrigen Parameter, um das Problem nicht zu komplex
zu gestalten, auf der ganzen Planungsperiode als konstante Größen gesetzt. Dies ist
jedoch nicht sehr wirklichkeitsnahe. Deswegen wird z. B. in der später erschienen
Publikation [18] von S. Winderl und B. Naumer dieses komplexe Unternehmensmodell mit einer variierenden Preisfunktion p(t) bearbeitet.
Um das Modell weiter den herrschenden Marktverhältnissen anzupassen, wird in
dieser Arbeit statt konstanter Lohnkosten ω = 2.0 eine steigende Lohnkostenfunktion eingeführt. Diese soll sich gemäß der folgenden exponentiellen Funktion, die sich
durch strenges monotones Wachstum auszeichnet, entwickeln:
ω(t) = 2.0 exp(0.02t).
Für alle anderen Parameter werden die Werte aus [7] bzw. [18] übernommen. Diese sind in der Tabelle (7.1) zusammengefasst. Dabei werden in den nachfolgenden
Abschnitten die Lösungen für den Fall der konstanten Preisfunktion p1 (t) ≡ 0.05
und der variierenden Preisfunktion p2 (t) = 0.05 + 0.01 sin(kp − π2 ) bei steigenden
63
7 Ein komplexes Unternehmensmodell
Lohnkosten diskutiert. Zunächst soll jedoch das Modell weiter beschrieben werden.
Ein großer Nachteil des Modells von Lesourne und Leban ist, dass die Inflation
vernachlässigt wird. Im komplexen Unternehmensmodell dagegen werden die permanenten Schwankungen des Marktes mit einkalkuliert. Dazu wird die Diskontierungsfunktion, die in der Wirtschaft folgendermaßen definiert ist,
x7 (t) =
1
,
(1 + i)t
x7 (0) = 1,
als zusätzliche Zustandsvariable, um die zeitabhängige Inflationsrate zu ermöglichen,
eingeführt. Nach der Definition des Differenzquotients gilt
x7 (t + dt) − x7 (t)
dt→0
dt
x˙7 = lim
und wegen
x7 (t + dt) = (1 + i)−(t+dt) =
= x7 (t)(1 + i)−dt =
dt(dt + 1) 2 dt(dt + 1)(dt + 2) 3
·i −
· i + ... =
= x7 (t) 1 − dt · i +
2!
3!
i2 i3
2
= x7 (t) 1 − dt i − + − . . . + O(dt ) =
2
3
= x7 (t) − dt · x7 (t) ln(1 + i) + O(dt2 ),
da − 1 < i ≤ 1
folgt für dt → 0
ẋ7 (t) = −x7 (t)ln(1 + i(t)).
Als neue zu maximierende Größe wird der Gewinn der Eigenkapitalgeber am Ende
des Planungszeitraumes gesetzt. Dieser entspricht der Summe aus dem Eigenkapital, den sicheren Anlagen und dem besteuerten Verkaufswert des Lagerbestandes,
bezogen auf den Endzeitpunkt tf :
x4 (tf ) + x5 (tf ) + (1 − τ )p
x1 (tf )
.
x7 (tf )
Alle vier Steuerungen des komplexen Unternehmensmodells sind sowohl nach unten
als auch nach oben begrenzt. Denn unbeschränkte Lager, - Beschäftigungs, - Fremdkapital, - Eigenkapitaländerung sind realitätsfremd. An alle Zustandsvariablen wird
erneut die Nicht-Negativitätsforderung gestellt. Außerdem wird die Beschränkung
des maximalen Verschuldungsgrades
κx4 (t) − x3 (t) ≥ 0
aus dem Modell von Lesourne und Leban übernommen.
64
7 Ein komplexes Unternehmensmodell
Risikozahlung
x6
M
A
u4
Eigenkapital
x4
u3
Sichere Anlagen
x5
Fremdkapital
x3
R
Produktion
F (x2 , x3 , x4 )
u1
K
T
u2
Lagerbestand
x1
Beschäftigung
x2
Abbildung 7.2: Veranschaulichung des komplexen Unternehmensmodells
65
7 Ein komplexes Unternehmensmodell
7.2 Formulierung des komplexen Steuerungsproblems
Mit den Bezeichnungen
x1 (t) : Lagerbestand
x2 (t) : Beschäftigung
x3 (t) : Fremdkapital
x4 (t) : Eigenkapital
x5 (t) : sichere Anlagen
x6 (t) : Risikozahlung
x7 (t) : Diskontierungsfunktion
u1 (t) : Lagerbestandsänderung
u2 (t) : Beschäftigungsänderung
u3 (t) : Fremdkapitaländerung
u4 (t) : Eigenkapitaländerung
für den Zustandsvektor
x(t)T = (x1 (t), x2 (t), x3 (t), x4 (t), x5 (t), x6 (t), x7 (t))
und die Steuerfunkftion
u(t)T = (u1 (t), u2 (t), u3 (t), u4 (t))
kann nun das komplexe Unternehmensmodell folgendermaßen formuliert werden:
Minimiere:
x1 (tf )
− x4 (tf ) + x5 (tf ) + (1 − τ )p
x7 (tf )
unter:
ẋ1 = u1
ẋ2 = u2
ẋ3 = u3
ẋ4 = u4 + (1 − τ )(G − ρr (t)x4 )
ẋ5 = −u4 + (1 − τ )ρm (t)x5
ẋ6 = (1 − τ )ρr (t)x4
ẋ7 = −x7 ln(1 + i(t))
mit der Gewinnfunktion
G(t) =
1
((p(t)(F − u1 ) − σx1 − ω(t)x2 ) − ρk (t)x3 − δ(x3 + x4 )
x7
66
7 Ein komplexes Unternehmensmodell
und der Cobb-Douglas-Produktionsfunktion
F = α(x3 + x4 )α1 xα2 2 ,
α, α1 , α2 > 0
α1 + α2 < 1
Steuerbeschränkungen:
−100 ≤ u1 ≤ 100
−10 ≤ u2 ≤ 10
−100 ≤ u3 ≤ 100
−100 ≤ u4 ≤ 100
Zustandsbeschränkungen:
50 := x1min ≤
x1
0≤
x2
0≤
x3
0≤
x5
0≤
x6
0≤
x7
≤ x1max := 200
0 ≤ κx4 − x3
Randbedingungen:
x1 (0) = 100 , x2 (0) = 30
x3 (0) = 50 , x4 (0) = 100
x5 (0) = 100 , x6 (0) = 0
x7 (0) = 1
Die Bedeutung der Parameter und die in dieser Arbeit verwendeten Werte sind
der Tabelle (7.1) zu entnehmen. Zudem beachte man bei der Schreibweise des optimalen Steuerprozesses, dass die Zustandsvariablen, die Steuerungsvariablen sowie
die Gewinn- und die Produktionsfunktion von der Zeit t abhängen. Dies wird jedoch aus Gründen der besseren Lesbarkeit im weiteren Verlauf der Arbeit nicht
explizit erwähnt. Um Verwirrungen zu vermeiden, wird bei den übrigen ökonomischen Größen, falls diese mit der Zeit t variieren (z. B. die Umlaufrendite), die
Zeitabhängigkeit ausdrücklich genannt.
67
7 Ein komplexes Unternehmensmodell
tf
p1
p2
κ
ω
δ
τ
σ
α
α1
α2
kl
kp (t)
10
0.05
0.05 + 0.01 sin(kp − π2 )
0.8
2.0 exp(0.02t)
0.322
0.5
0.01
100
0.35
0.5
8
π
+ 2π
·t
2
kl
Planungszeitraum
konstanter Produktpreis
variierender Produktpreis
maximaler Verschuldungsgrad
jährliche Lohnrate
Abschreibungsrate 2
Steuersatz
Lagerhaltungskosten
Effizienzparameter
Produktionselastizität des Kapitals
Produktionselastizität der Arbeit
Konjukturzykluslänge
Konjukturposition
i(t)
ρk (t)
ρm (t)
ρr (t)
0.019 + 0.029 sin kp (t)
0.110 + 0.030 sin kp (t)
0.074 + 0.018 sin kp (t)
ρk (t) − 0.05
Inflationsrate
Fremdkapitalzins
Geldmarktzins
Risikoversicherung für risikoscheue EKG.
Tabelle 7.1: Liste der Parameter des komplexen Unternehmensmodells
7.3 Auswertung des erweiterten Minimumprinzips
Bevor in den nachfolgenden Abschnitten die Lösungen des komplexen Unternehmensmodells für verschiedene Parameter vorgestellt und ausdiskutiert werden, werden hier vorab die notwendigen Optimalitätsbedingungen für das vorliegende Beispiel aufgestellt. Zur Behandlung der Randstücke wird die direkte Methode verwendet.
Die Hamilton-Funktion des betrachteten Problems lautet:
λ4 (1 − τ )
(pα(x3 + x4 )α1 xα2 2 − pu1 − x1 σ − x2 ω)
H = λ 1 u1 + λ 2 u2 + λ 3 u3 + λ 4 u4 +
x7
− λ4 (1 − τ ) (x3 (ρk (t) + δ) − x4 (ρr (t) + δ)) − λ5 (u4 − x5 (1 − τ )ρm (t))
+ λ6 (1 − τ )ρr (t)x4 − λ7 x7 ln(1 + i(t)).
An die Variablen des komplexen Unternehmensmodells werden mehrere Zustandsbeschränkungen gestellt (siehe Abschnitt 7.2), doch nur die Beschränkungen des
maximalen Verschuldungsgrades
S1 := x3 − κx4 ≤ 0
68
(7.1)
7 Ein komplexes Unternehmensmodell
und des minimalen Lagerbestandes
S2 = 50 − x1 ≤ 0
(7.2)
werden aktiv. Somit können alle anderen außer Acht gelassen werden. Beide Beschränkungen sind von der Ordnung p = 1. Denn für die Verschuldungsbeschränkung
gilt:
S11 = x˙3 − κẋ4
(7.3)
= u3 − κ(u4 + (1 − τ )(G − ρr (t)x4 )),
und für den minimalen Lagerbestand egibt sich:
S21 = −ẋ1 = −u1 .
(7.4)
In beiden Fällen tauchen die Steuerungsvariablen schon in der ersten Ableitung
explizit auf.
Für die erweiterte Hamiltonfunktion ergibt sich:
λ4 (1 − τ )
(pα(x3 + x4 )α1 xα2 2 − pu1
x7
− x1 σ − x2 ω) − λ4 (1 − τ ) (x3 (ρk (t) + δ) − x4 (ρr (t) + δ)))
H̃ = u1 λ1 + u2 λ2 + u3 λ3 + u4 λ4 +
− λ5 (u4 − x5 (1 − τ )ρm (t)) + x4 λ6 (1 − τ )ρr (t)
− x7 λ7 ln(1 + i(t)) + µ1 (x3 − κx4 ) + µ2 (50 − x1 ).
Die adjungierten Differentialgleichungen für den zustandsbeschränkten Steuerprozess lauten:
λ4 (1 − τ )σ
− µ2
x7
α2 λ4 (1 − τ )
α1 x 2
=
ω − pαα2 (x3 + x4 )
x7
x2
p
(x3 + x4 )α1 α2
= λ4 (1 − τ ) ρk (t) + δ − αα1
+ µ1
x
x7
(x3 + x4 ) 2
(x3 + x4 )α1 α2
p
− κµ1
x
= (1 − τ ) λ4 (ρr (t) + δ) − λ6 ρr (t) − λ4 αα1
x7
(x3 + x4 ) 2
λ̇1 =
λ̇2
λ̇3
λ̇4
λ̇5 = −λ5 (1 − τ )ρm (t)
λ̇6 = 0
λ̇7 = λ7 ln(1 + i(t)) +
λ4 (1 − τ )
(pF − pu1 − x1 σ − x2 ω) .
x27
69
7 Ein komplexes Unternehmensmodell
Zudem ergeben sich durch partielle Differentation von H̃ nach u folgende Schaltfunktionen:
Σ1 (t) = λ1 −
(1 − τ )λ4 p
x7
Σ2 (t) = λ2
Σ3 (t) = λ3
Σ4 (t) = λ4 − λ5 .
Nach dem Minimumprinzip wird die erweiterte Hamiltonfunktion durch die Steuerung u minimiert, d. h. für die optimalen Steuerungen des komplexen Unternehmensmodell gilt:



, Σi (t) > 0 
 uimin

∗
ui (t) =
i = 1, 2, 3, 4.
(7.5)
uimax
, Σi (t) < 0 ,




unbestimmt , Σi (t) = 0
Ein Schaltpunkt tk wird durch die Bedingung Σi (tk ) = 0 festgelegt.
Die beiden Multiplikatorfunktionen µ1 (t) und µ2 (t) müssen die Vorzeichen-/Komplementaritätsbedingung erfüllen:
µ1 (t) ≥ 0;
µ1 (t) ≡ 0,
f alls S1 (x∗ (t)) < 0
µ2 (t) ≥ 0;
µ2 (t) ≡ 0,
f alls S2 (x∗ (t)) < 0.
Da beide Beschränkungen zum Endzeitpunkt tf aktiv sind, führt die Transversalitätsbedingung für zustandsbeschränkte Probleme auf folgende Endbedingungen
für die adjungierten Variablen:
λ1 (tf ) = −
(1 − τ )p
− γ1
x7
λ2 (tf ) = 0
λ3 (tf ) = γ2
λ4 (tf ) = −1 − κγ2
λ5 (tf ) = −1
λ6 (tf ) = 0
(1 − τ )x1 (tf )p
λ7 (tf ) =
x27 (tf )
mit γ1 , γ2 ∈ R und γ1 , γ2 ≥ 0.
70
(7.6)
7 Ein komplexes Unternehmensmodell
N=5000
LOQO(Euler-Verfahren)
LOQO(Heun-Verfahren)
IPOPT(Euler-Verfahren )
IPOPT(Heun-Verfahren)
konstanter Preis variierender Preis
7.39 sec.
23.64 sec.
25.23 sec.
247.88 sec.
11.88 sec.
37.45 sec.
45.96 sec.
5108.94 sec.
tf = 20
9.75 sec.
39.08 sec.
282.02 sec.
566.57 sec.
Tabelle 7.2: Vergleich der Rechenzeiten für unterschiedliche Parameter bei 5000 Diskretisierungspunkten.
7.4 Numerische Ergebnisse
Bei dem Versuch eine numerische Lösung des vorliegenden Problems zu erstellen,
wurde zunächst die Fortran-Routine NUDOCCCS, die zu direkten numerischen
Lösungsmethoden der optimalen Steuerprozesse zählt, eingesetzt. Leider lieferte diese keine brauchbaren Ergebnisse, denn die Struktur der optimalen Steuerungen war
nicht erkennbar. Auch die Wahl größerer Anzahl der Diskretisierungspunkte sowie
Verfahren höherer Ordnung zur Approximation der Zustände (wie z.B. das RungeKutta-Verfahren) halfen nicht weiter. Schließlich ist es nach Überwindung einiger
Schwierigkeiten gelungen das Problem in diskretisierter Form mit dem Optimierungssolver LOQO zu lösen. So mussten z. B. die Anfanswerte der Zustände schon
bei deren Deklaration angegeben werden. Diese Lösungen wurden auch hinterher
durch das Optimierungspaket IPOPT bestätigt. Dabei wurde erst einmal zur Approximation des Zustandes das Euler-Verfahren verwendet und anschließend auch
das Heun-Verfahren. In der Tabelle (7.2) sind zum Vergleich die Rechenzeiten beider
Verfahren für unterschiedliche Parameter bei 5000 Diskretisierungspunkten angegeben.
Alle erstellten Programme sind auf einer CD am Ende dieser Arbeit beigefügt. Außerdem sind zwei (Approximation der Zustände mit Euler und Heun Verfahren)
ausgewählte Beispiele des AMPL-Codes im Anhang zu finden.
7.4.1 Optimale Steuerung des komplexen Unternehmensmodells
bei variierendem Preis
Als erstes wird die Lösung des komplexen Modells im Falle eines schwankenden
Preises vorgestellt. Der Verlauf der Preisfunktion p2 (t) ist in der Abbildung (7.27)
zu sehen. Die Schaltstruktur der optimalen Steuerungen u∗1 , u∗2 , u∗3 , u∗4 für dieses
Problem ist in der Tabelle (7.3) zusammengefasst. Die Grafen der optimalen Trajektorien, der Adjungierten, der optimalen Steuerungen, sowie die Grafen der Schaltund der Multiplikatorfunktionen sind in den Abbildungen (7.3)-(7.26) zu sehen.
71
7 Ein komplexes Unternehmensmodell
65
Lagerbestand
Beschaeftigung
100
60
55
80
50
45
60
40
35
40
30
25
0
1
2
3
4
5
6
7
8
9
10
0
2
4
6
8
10
Abbildung 7.3: x1 bei variierendem Preis Abbildung 7.6: x2 bei variierendem Preis
180
220
Fremdkapital
Eigenkapital
200
160
180
140
160
120
140
100
120
80
100
60
80
40
60
20
40
0
2
4
6
8
10
0
2
4
6
8
10
Abbildung 7.4: x3 bei variierendem Preis Abbildung 7.7: x4 bei variierendem Preis
400
40
sichere Anlagen
Risikoabsicherung
350
30
300
250
20
200
10
150
100
0
0
1
2
3
4
5
6
7
8
9
10
0
1
2
3
4
5
6
7
8
9
10
Abbildung 7.5: x5 bei variierendem Preis Abbildung 7.8: x6 bei variierendem Preis
72
7 Ein komplexes Unternehmensmodell
1
-0.024
Diskontierung
-0.026
-0.028
0.95
-0.03
-0.032
0.9
-0.034
-0.036
-0.038
0.85
-0.04
-0.042
0.8
-0.044
0
1
2
3
4
5
6
7
8
9
10
0
1
2
3
4
5
6
7
Abbildung 7.9: x7 bei variierendem Preis Abbildung 7.12: λ1 bei
Preis
0.4
8
9
10
variierendem
0.006
0.2
0.005
0
0.004
-0.2
-0.4
0.003
-0.6
0.002
-0.8
-1
0.001
-1.2
0
-1.4
-1.6
-0.001
0
1
2
3
4
5
6
7
Abbildung 7.10: λ2 bei
Preis
8
9
10
0
1
2
3
4
5
6
7
8
9
10
variierendem Abbildung 7.13: λ3 beim variierenden
Preis
-1
-1.05
-1.1
-1.15
-1.2
-1.25
-1.3
-1.35
-1.4
-1.45
-1.5
0
1
2
3
4
5
6
Abbildung 7.11: λ4 bei
Preis
7
8
9
10
0
1
2
3
4
5
6
variierendem Abbildung 7.14: λ5 bei
Preis
73
7
8
9
10
variierendem
7 Ein komplexes Unternehmensmodell
0.5
1000
800
0.25
600
0
400
-0.25
200
-0.5
0
0
1
2
3
4
5
6
7
Abbildung 7.15: λ6 bei
Preis
8
9
10
0
2
3
4
5
6
7
variierendem Abbildung 7.18: λ7 bei
Preis
Lagerveraenderung
100
1
8
9
10
variierendem
Besch.veraenderung
10
8
75
6
50
4
25
2
0
0
-2
-25
-4
-50
-6
-75
-8
-100
-10
0
1
2
3
4
5
6
7
Abbildung 7.16: u1 bei
Preis
8
9
10
0
1
2
3
4
5
6
7
variierendem Abbildung 7.19: u2 bei
Preis
FK-Veraenderug
100
75
50
50
25
25
0
0
-25
-25
-50
-50
-75
-75
-100
9
10
variierendem
Investition
100
75
8
-100
0
1
2
3
4
5
6
Abbildung 7.17: u3 bei
Preis
7
8
9
10
0
1
2
3
4
5
6
variierendem Abbildung 7.20: u4 bei
Preis
74
7
8
9
10
variierendem
7 Ein komplexes Unternehmensmodell
0.0035
0.4
0.2
0.003
0
0.0025
-0.2
0.002
-0.4
0.0015
-0.6
-0.8
0.001
-1
0.0005
-1.2
0
-1.4
-0.0005
-1.6
0
1
2
3
4
5
6
7
Abbildung 7.21: Σ1 bei
Preis
8
9
10
0
1
2
3
4
5
6
7
variierendem Abbildung 7.24: Σ2 bei
Preis
0.006
8
9
10
variierendem
0.018
0.016
0.005
0.014
0.004
0.012
0.01
0.003
0.008
0.002
0.006
0.004
0.001
0.002
0
0
-0.001
-0.002
0
1
2
3
4
5
6
7
Abbildung 7.22: Σ3 bei
Preis
8
9
10
0
1
2
3
4
5
6
7
variierendem Abbildung 7.25: Σ4 bei
Preis
0.018
8
9
10
variierendem
0.014
0.016
0.012
0.014
0.01
0.012
0.008
0.01
0.008
0.006
0.006
0.004
0.004
0.002
0.002
0
0
0
1
2
3
4
5
6
Abbildung 7.23: µ1 bei
Preis
7
8
9
10
0
1
2
3
4
5
6
variierendem Abbildung 7.26: µ2 bei
Preis
75
7
8
9
10
variierendem
7 Ein komplexes Unternehmensmodell
t
u∗1
[0.0000,0.16603] u1min
[0.1660,0.3947 ] u1min
[0.3947,0.4998 ] u1min
[0.4981,2.8529 ]
0
[2.8529,6.1988 ]
0
[6.1988,10.000 ]
0
u∗2
u∗3
u∗4
u2max
u2max
u2max
u2max
u2min
u2max
u3min
u3max
singulär
singulär
singulär
singulär
u4min
u4min
singulär
singulär
singulär
singulär
x1 − 50 ≤ 0 x3 − 0.8x4 ≤ 0
n.a.
n.a.
n.a.
a.
a.
a.
n.a
n.a.
a.
a.
a.
a.
Tabelle 7.3: Schaltstruktur der optimalen Steuerungen bei variierendem Preis
Zunächst wird geprüft, ob die vorliegende Lösung das (erweiterte) Pontryaginsche
Minimumprinzip nicht verletzt. Hierzu werden, wie schon beim modifizierten Problem, die notwendigen Optimalitätsbedingungen auf jedem Zeitintervall ausgewertet.
1. Zeitintervall [0, t1 ]
In diesem Intervall ist weder die Lagerbeschränkung noch die Verschuldungsbeschränkung aktiv. Es gilt nach der Komplementaritätsbedingung µ1 (t) = 0 und
µ2 (t) = 0 für alle t in [0, t1 ], dieses wird auch durch die Grafen der beiden Multiplikatorfunktionen in den Abbildungen 7.23, 7.26 bestätigt.
Alle vier Steuerungen weisen eine Bang-Bang-Struktur auf. Es gilt:
Σ1 (t) > 0
∀ t ∈ [0, t1 ),
⇒ u∗1 = u1min
Σ2 (t) < 0
∀ t ∈ [0, t1 ),
⇒ u∗2 = u2max
Σ3 (t) > 0
∀ t ∈ [0, t1 ),
⇒ u∗3 = u3min
Σ4 (t) > 0
∀ t ∈ [0, t1 ),
⇒ u∗4 = u4min .
2. Zeitintervall [t1 , t2 ]
Im ersten Schaltpunkt t1 = 0.16603 springt die Steuerung u∗3 von u3min auf u3max .
Die Schaltfunktion Σ3 (t) hat in t1 eine isolierte Nullstelle, Σ3 (t1 ) = 0. Die Minimumbedingung wird auch hier eingehalten, denn alle vier Schaltfunktionen weisen
folgenden Verlauf auf:
Σ1 (t) > 0
∀ t ∈ [t1 , t2 ],
Σ2 (t) < 0
∀ t ∈ [t1 , t2 ],
Σ3 (t) < 0
∀ t ∈ (t1 , t2 ),
Σ4 (t) > 0
∀ t ∈ [t1 , t2 ].
76
7 Ein komplexes Unternehmensmodell
0.06
0.058
0.056
0.054
0.052
0.05
0.048
0.046
0.044
0.042
0.04
0
1
2
3
4
5
6
7
8
9
10
Abbildung 7.27: Variierende Preisfunktion p2 (t).
Beide Beschränkungen sind inaktiv. Die Werte der Multiplikatorenfunktionen µ1 (t),
µ2 (t) liegen für alle t in [t1 , t2 ) bei Null.
3. Zeitintervall [t2 , t3 ]
Der Zeitpunkt t2 = 0.3947 ist der Eintrittspunkt der Verschuldungsbeschränkung.
Diese wird in t2 aktiv und bleibt es bis zum Ende der Planungsperiode tf = 10, d. h.
es gilt:
x3 − κx4 = 0,
∀ t ∈ [t2 , tf ].
Die optimale Trajektorie von x3 kann also in Abhängigkeit von x4 angegeben werden.
Die Steuerungen u∗3 , u∗4 nehmen in t2 = 0.3947 einen singulären Verlauf an. Die
notwendige Bedingung, die besagt, dass die Schaltfunktionen auf diesem Zeitintervall
verschwinden müssen, ist erfüllt.
Σ3 (t) = 0
∀ t ∈ [t2 , t3 ],
Σ4 (t) = 0
∀ t ∈ [t2 , t3 ].
Des Weiteren zeigen die Multiplikatorfunktionen folgenden Verlauf:
µ1 (t) ≥ 0
∀ t ∈ [t2 , tf ]
µ2 (t) = 0
∀ t ∈ [t2 , t3 ].
Die Funktion µ1 (t) kann mittels der Schaltfunktionen Σ3 (t) und Σ4 (t) bestimmt
werden, denn es gilt folgendes:
Σ3 (t) = λ3 = 0 ⇒ Σ̇3 (t) = λ̇3 = 0
Σ4 (t) = λ4 − λ5 = 0 ⇒ Σ̇4 (t) = λ̇4 − λ̇5 = 0.
77
7 Ein komplexes Unternehmensmodell
In den beiden Termen ist der Multiplikator µ1 enthalten und durch Auflösen nach
µ1 erhält man:
µ1 (t) =
(1 − τ )
[0.05λ4 + λ6 ρr (t) − λ5 ρm (t)] .
(1 + κ)
Für die optimalen Steuerungen u∗1 , u∗2 gilt auf diesem Stück weiterhin:
u∗1 = u1min
u∗2 = u2max ,
die jeweiligen Schaltfunktionen bleiben im positiven, bzw. negativen Bereich:
Σ1 (t) > 0
∀ t ∈ [t2 , t3 ],
Σ2 (t) < 0
∀ t ∈ [t2 , t3 ].
Im Abschnitt 7.3 wurde schon nachgerechnet, dass es sich bei der Verschuldungsbeschränkung um eine Zustandsbeschränkung erster Ordnung handelt. Nach (3.9) gilt
dann folgendes:
S(x) ≡ 0 ⇒ S 1 (x) ≡ 0 ⇒ ẋ3 − κẋ4 = u3 − κẋ4
⇒ u3 = κẋ4
⇒ u3 = κ(u4 + (1 − τ )(G − ρr (t)x4 ))
(7.7)
1
⇒ u3 = κ(u4 + (1 − τ )(( (p(t)(F − u1 ) − σx1 − ωx2 )
x7
− ρk (t)x3 − δ(x3 + x4 )) − ρr (t)x4 )).
Die Steuerung u∗3 kann auf dem Randstück in Abhängigkeit von u1 , u4 , xi ermittelt
werden.
u∗3 = κ(u4 + (1 − τ )((
1
(p2 (t)(α(x3 + x4 )α1 xα2 2 − u1 ) − σx1 − ωx2 ) − ρr (t)x4 )).
x7
Die oben berechnete Gleichung für die Steuerung u3 gilt auf dem gesamten Randstück
der Verschuldungsbeschränkung. Um u4 zu bestimmen, wird wiederum die Schaltfunktion Σ4 (t) solange differentiert bis die gesuchte Steuerung in der Ableitung auftaucht. In dem vorliegenden Beispiel ist das für k = 2, also q = 1 der Fall.
Σ4 (t) = λ4 − λ5 = 0,
⇒ λ̇4 − λ̇5 = 0,
⇒ λ̈4 − λ̈5 = 0,
78
∂
(λ4 − λ5 ) = 0
∂u
∂
(λ̇4 − λ̇5 ) = 0
∂u
∂ ¨
(λ4 ) 6= 0.
∂u
7 Ein komplexes Unternehmensmodell
Dies sieht man anhand folgender Berechnungen:
λ̈4 − λ̈5 = (1 − τ )[λ̇4 (ρr (t) + δ) + (λ4 − λ6 )ρ̇r (t) − λ̇5 ρm (t) − λ5 ρ̇m ]
i
h
λ̇
p(t)
+
λ
ṗ(t)
+
λ
p(t)ln(1
+
i(t))
4
4
α1 F (1 − τ ) 4
−
(x3 + x4 )
x7
λ4 p(t)
(α1 − 1)(u3 + u4 + (1 − τ )(G − ρr (t)x4 ))
− (1 − τ )
α1 F
x7
(x3 + x4 )2
α2 u2
λ4 p(t)
− κµ̇1
α1 F
− (1 − τ )
x7
(x3 + x4 )x2
Durch Auflösen der obigen Gleichung nach u4 erhält man:
(x3 + x4 )2
[λ̇4 (ρr (t) + δ) + (λ4 − λ6 )ρ̇r (t) − λ̇5 ρm (t) − λ5 ρ̇m ]
α1 (α1 − 1)p(t)λ4 F
"
#
(x3 + x4 )
λ̇4 p(t) + λ4 ṗ(t) + λ4 p(t)ln(1 + i(t))
−
(α1 − 1)p(t)λ4
x7
u4 =
(x3 + x4 ) λ4 α2 u2
(x3 + x4 )2
κµ̇1 − u3
(7.8)
−
(α1 − 1)λ4 x7 x2
α1 (α1 − 1)(1 − τ )p(t)λ4 F
1
+ (1 − τ )( ((p(t)(F − u1 ) − σx1 − ωx2 ) − ρk (t)x3 − δ(x3 + x4 ) − ρr (t)x4 ))
x7
−
Dabei gilt:
i
(1 − τ ) h
0.05λ̇4 + λ6 ρ̇r (t) − λ̇5 ρm (t) − λ5 ρ̇m (t)
(1 + κ)
π
π
ṗ(t) =
cos( t)
400
4
π
π π
ρ̇m (t) =
0.018 cos( + t)
4
2
4
π
π π
ρ̇r (t) =
0.030 cos( + t).
4
2
4
µ̇1 (t) =
4. Zeitintervall [t3 , t4 ]
In t3 = 0.4998 wird die Lagerbeschränkung
S2 = 50 − x1 ≤ 0,
welche von der Ordnung p = 1 ist, aktiv. Diese bleibt bis zum Ende der Planungsperiode tf = 10 in Kraft. Es gilt demnach x1 (t) = 50 für alle t ∈ [t3 , tf ].
Laut Bedingung (3.9) muss dann auch für alle t ∈ [t3 , tf ] folgendes erfüllt sein:
S21 = −ẋ1 = −u1 = 0.
79
7 Ein komplexes Unternehmensmodell
Außerdem gilt offensichtlich
∂S21
= −1 6= 0.
∂u1
Somit wird der optimale Verlauf der Steuerung u∗1 durch die Lagerbeschränkung
festgelegt:
u∗1 = 0 ∈ int U
∀ t ∈ [t3 , tf ].
(7.9)
Der Graf der Steuerung u∗1 (7.16) bestätigt dies, der Zeitpunkt t3 ist gleichzeitig
ein Schaltpunkt von u∗1 . Eine Randsteuerung verhält sich formal wie eine singuläre
Steuerung und die Schaltfunktion Σ1 (t) ist auf [t3 , tf ] überall gleich Null.
Des Weiteren sieht man in der Abbildung (7.26), dass die Multiplikatorfunktion
µ2 (t) die Vorzeichen-/Komplementaritätsbedingung tatsächlich erfüllt. Der Verlauf
von µ2 (t) auf [t3 , tf ] kann durch Differentation der Schaltfunktion Σ1 (t) bestimmt
werden. Man rechnet leicht nach:
i
(1 − τ ) h
λ̇4 p(t) + λ4 ṗ(t) + λ4 p(t)ln(1 + i(t)) = 0
Σ̇1 (t) = λ̇1 −
x7
i
(1 − τ ) h
λ4 (1 − τ )σ
− µ2 −
λ̇4 p(t) + λ4 ṗ(t) + λ4 p(t)ln(1 + i(t)) = 0
Σ̇1 (t) =
x7
x7
(1 − τ ) λ4 [σ − ṗ2 (t) − p2 (t)ln(1 + i(t))] − λ̇4 p2 (t) .
⇒ µ2 (t) =
x7
Für die Steuerung u∗2 gilt weiterhin u∗2 = u2max und die Steuerungen u∗3 , u∗4 zeigen
einen singulären Verlauf auf. Die Schaltfunktionen zeigen, dass die Minimumbedingung erfüllt ist.
Σ1 (t) = 0
∀ t ∈ [t3 , t4 ],
Σ2 (t) < 0
∀ t ∈ [t3 , t4 ),
Σ3 (t) = 0
∀ t ∈ [t3 , t4 ],
Σ3 (t) = 0
∀ t ∈ [t3 , t4 ].
Die Berechnungen, die für die beiden letzten Steuerungen im Zeitintervall [t2 , t3 ]
durchgeführt wurden, behalten ihre Gültigkeit. In den erhaltenen Gleichungen für
u∗3 , u∗4 muss jedoch der neue Wert der ersten Steuerung eingegeben werden.
Man beachte, dass der oben beschriebene Sachverhalt unabhängig von der Wahl der
Parameter immer seine Gültigkeit behält. Sobald die Lagerbeschränkung aktiv wird,
springt u∗1 auf Null.
4. Zeitintervall [t4 , t5 ]
Die Steuerung u∗2 , die bis t4 = 2.8529 konstant bei u2max lag, springt auf u2min . Die
Schaltfunktion von u∗2 hat in t4 eine isolierte Nullstelle, Σ2 (t4 ) = 0 und für t ∈ (t4 , t5 )
80
7 Ein komplexes Unternehmensmodell
gilt Σ2 (t) > 0. Die Schaltfunktionen von u1 , u3 , u4 verschwinden auch auf diesem
Zeitintervall. Der Verlauf der drei Steuerungen kann genau wie in den vorherigen
Intervallen bestimmt werden. Dabei muss in die Gleichung (7.8) von u∗4 der neue
Wert der Steuerung u∗2 eingesetzt werden. Diese Änderung der Steuerung u∗2 hat eine
direkte Auswirkung auf u∗3 und u∗4 . Der ausgerechnete Term für u∗3 hängt zwar nicht
von u∗2 ab, aber dafür von u∗4 . Beide Funktionen u∗3 , u∗4 weisen Unstetigkeitsstellen
in den Schaltpunkten von u∗2 , dies ist in den Grafen (7.17) und (7.20) deutlich zu
sehen.
5. Zeitintervall [t5 , tf ] mit tf = 10
Im letzten Zeitintervall springt u∗2 in t5 = 6.1988 erneut auf u2max . Es gilt:
Σ1 (t) = 0
∀ t ∈ [t4 , tf ],
Σ2 (t) > 0
∀ t ∈ (t5 , tf ) und Σ2 (t5 ) = 0,
Σ3 (t) = 0
∀ t ∈ [t4 , tf ],
Σ3 (t) = 0
∀ t ∈ [t4 , tf ].
Die Berechnung der singulären Steuerung erfolgt analog zum vorletzten Intervall. In
die Gleichung von u∗4 muss diesmal u∗2 = u2max eingesetzt werden.
Die Minimumbedingung sowie Vorzeichen- und Komplementaritätsbedingung werden also von der vorliegenden Lösung erfüllt. Es bleibt nur noch die Transversalitätsbedingung zu überprüfen.
Die Werte der adjungierten Variablen in tf = 10 lauten:
λ1 (tf ) = −0.03753,
λ2 (tf ) = 0,
λ3 (tf ) = 0,
λ4 (tf ) = −1,
λ5 (tf ) = −1,
λ6 (tf ) = 0,
λ7 (tf ) = 2.34.
Somit wird auch die Bedingung (7.6) mit γ1 = γ2 = 0 eingehalten.
Nachdem die notwendigen Optimalitätsbedingungen eingehend untersucht wurden,
müssten die hinreichenden Bedingungen überprüft werden. Doch leider gibt es in diesem Fall kein bekanntes Kriterium, welches zu Rate gezogen werden könnte. Obwohl
das komplexe Unternehmensmodell ausgehend vom Modell von Lesourne und Leban
konstruiert wurde, werden hier im Gegensatz zum Ursprungsmodell die zusätzlichen
Konvexitätsannahmen nicht erfüllt. Das neu gewählte Zielfunktional
x1 (tf )
− x4 (tf ) + x5 (tf ) + (1 − τ )p
x7 (tf )
81
7 Ein komplexes Unternehmensmodell
ist nicht konvex. Denn die Hesse Matrix der letzten Komponenten
!
1
0
−
2
x
1
x7
:=
∇2
.
2x1
1
x7
− x2 x3
7
x1 (tf )
x7 (tf )
lautet:
7
Diese Matrix ist symmetrisch und hat folgende Eigenwerte:
p
p
x1 − x21 + x27
x1 + x21 + x27
,
EW2 =
.
EW1 =
x37
x37
Wegen x1 > 0, x7 > 0 auf [0, tf ] gilt EW1 > 0 und EW2 < 0und nach Satz (4.2.14)
ist die Hesse- Matrix indefinit.
Man muss sich also beim komplexen Unternehmensmodell erst einmal mit den notwendigen Bedingungen zufrieden geben.
Interpretation der Ergebnisse
In der Wirtschaft spielen die individuellen Präferenzen eines Marktakteurs eine große
Rolle. Insbesondere wird das Verhalten der einzelnen Teilnehmer stark von deren Risikobereitschaft beeinflusst. Bei der Behandlung des komplexen Modells in dieser Arbeit wurde stets von den risikoscheuen Eigenkapitalgebern ausgegangen. Damit wird
diesen unterstellt, dass sie den Nutzen eines sicheren Ereignisses (z.B. Bundesanleihe) höher einschätzen als den Nutzen eines unsicheren Ereignisses. Eine Investition in
ein Unternehmen (auch das Eigene) ist in der Regel mit größeren Gefahren behaftet
als eine sichere Geldanlage und muss daher, um attraktiv zu sein, höhere Gewinne
abwerfen. Die erwartete Rendite lässt sich aus der Sicht der Eigenkapitalgeber als
Summe des Geldmartktzinses ρm und der verlangten Risikoversicherung ρr berechnen. Aufgrund der Risikoscheue der Eigenkapitalgeber liegt der Wert ρm + ρr , mit
den hier gewählten Funktionen ρm , ρr , allzeit über dem Fremdkapitalzinssatz ρk . Der
Profit der Unternehmenseigner wird also durch die Aufnahme vom Fremdkapital, das
sie für sich immer noch Gewinn bringend arbeiten lassen können, weiter gesteigert.
Dies spiegelt sich auch in der erhaltenen optimalen Strategie des Unternehmens wider. Denn sie besagt gerade, dass der maximale Verschuldungsgrad beinahe auf der
ganzen Planungsperiode, mit Ausnahme des ersten sehr kurzen Zeitintervalls [0, t2 ],
ausgeschöpft werden soll. Die kurze Einschwingphase der Kapitalbestände kann darauf zurückgeführt werden, dass die gewählten Anfangswerte nicht optimal sind. Es
bedarf erst einer Umschichtung des Kapitals. Die Eigenkapitaländerung u4 nimmt,
bis zum Aktivwerden der Verschuldungsbeschränkung, ihren Minimalwert an. Dies
entspricht gerade den Investitionen in die alternativen Anlagen x5 , die in dieser
Zeit sehr rasch anwachsen. Danach steigt die ersten ca. 2.85 Jahre der Eigenkapitalbestand des Unternehmens. Auch der Fremdkapitalbestand x3 wird in dieser Zeitspanne, nach einer kurzen Abbauphase (u∗3 = u3min < 0) bis t1 = 0.166, permanent
82
7 Ein komplexes Unternehmensmodell
0.2
0.05
"rhokv.dat"
"rhormv.dat"
0.18
0.04
0.16
0.03
0.14
0.02
0.12
0.01
0.1
0
0.08
0.06
-0.01
0
1
2
3
4
5
6
7
8
9
10
0
1
2
3
4
5
6
7
8
9
10
Abbildung 7.28: Zinsfunktionen (links); Inflationsrate (rechts)
erhöht. Die Steuerung u∗3 nimmt nur positive Werte an. Außerdem wird auf [0, t4 ] die
maximal mögliche Beschäftigungsänderung (u2 = u2max ) ausgeschöpft, die Anzahl
der Beschäftigten x2 steigt linear an. Schließlich werden auf [t4 , t5 ] alle Unternehmensbestände (x2 , x3 , x4 ) abgebaut. Ab dem Zeitpunkt t5 = 6.1988 wachsen sowohl
die Beschäftigung als auch die Kapitalbestände erneut monoton an. Dieses Verhalten der drei Steuerungen u2 , u3 , u4 sowie der Trajektorien x2 , x3 , x4 kann eindeutig
auf den Verlauf der Zinssätze ρm + ρr , ρk und der Preisfunktion p2 (t) zurückgeführt
werden. Denn ab dem zweiten bis zum sechsten Jahr fällt der Produktpreis monoton.
Zudem ist in dieser Zeitperiode die erwartete Rendite der Eigenkapitalgeber am niedrigsten. Demnach hängt die Aufschwungs/Abschwungsphase des Unternehmens sehr
eng mit der Entwicklung der Zinssätze zusammen. In der Hochzinsperiode wächst
der Betrieb, es wird vermehrt neues Personal eingestellt. Außerdem wird der Kapitalstock ständig erhöht. Teilweise werden sogar die Bestände an sicheren Anlagen x5
(u∗4 > 0) abgebaut. Demnach wird in diesem Zeitraum in wachsendem Maße produziert, denn die Werte der beiden Produktionsfaktoren (Beschäftigung und Kapital)
und damit auch die Ausbringungsmenge steigen. In der Niedrigzinsphase schrumpft
das Unternehmen, die Anzahl der Beschäftigten sowie der Kapitalbestand sinken.
Es wird zunehmend in alternative Anlagen investiert.
Der oben beschriebene Sachverhalt hat keinen Einfluss auf den Verlauf des Lagerbestandes x1 und der Diskontierungsfunktion x7 . Denn die Differentialgleichungen
der beiden Zustandsvariablen sind von den anderen entkoppelt. Die Diskontierungsfunktion x7 nimmt, mit Ausnahme des Zeitintervalls mit negativer Inflationsrate,
ständig ab. Das hängt damit zusammen, dass die zukünftigen Zahlungen niedriger
als die gegenwärtigen bewertet werden.
Der berechnete optimale Lösungsverlauf des Lagerbestandes x1 zeigt, dass zur Ma83
7 Ein komplexes Unternehmensmodell
ximierung des Gewinns der Unternehmenseigner der anfängliche Bestand von 100
Produktionseinheiten so schnell wie möglich auf den minimalen Wert von 50 PE
reduziert werden muss. Die Lageränderung u∗1 nimmt, bis der minimale Bestand erreicht ist, ihren kleinstmöglichen Wert u1min an. Dies bedeutet aber, dass in der Zeit
der maximal mögliche Abbau des Lagers stattfindet. Danach liegt u∗1 konstant bei 0,
d. h., der Lagerbestand bleibt in dem übrigen Zeitraum, von ungefähr 9.5 Jahren,
auf dem Minimalbestand von 50 PE, der zur Vermeidung des eventuellen Engpasses bei der Nachfrage vorgegebenen wurde. Diese Taktik ist aus ökonomischer Sicht
sehr sinnvoll, denn erstens verursacht die Einlagerung der Ware Kosten und diese
mindern natürlich den Gewinn. Außerdem binden alle deponierten Produktionsgüter
das schon investierte Kapital. Aus diesen Gründen ist ein wirtschaftlich handelnder
Unternehmer stets bestrebt, die Lagerbestände so gering wie möglich zu halten.
Die Änderung der Risikoversicherung x6 hängt nur von der Entwicklung des Eigenkapitals x4 ab, dementsprechend ist diese auf der ganzen Planungsperiode monoton
wachsend.
Der reine Gewinn der Unternehmenseigner am Ende der Planungsperiode tf = 10
beträgt bei Anwendung der eben geschilderten Strategie |591.247| GE.
Die durchgeführte Analyse zeigt, dass das komplexe Unternehmensmodell tatsächlich
sehr realitätsnah ist. Alle erhaltenen Ergebnisse sind wirtschaftlich gesehen gut nachvollziehbar und äußerst rational.
7.4.2 Optimale Steuerung des komplexen Unternehmensmodells
bei konstantem Preis
Nachdem nun die Lösung des komplexen Unternehmensmodells im Falle eines variierenden Produktpreises vorgestellt wurde, wird hier das optimale Verhalten der Unternehmenseigner bei konstantem Preis p1 = 0.05 aufgezeigt. Dabei werden die notwendigen Optimalitätsbedingungen nur beiläufig diskutiert. Der besondere Schwerpunkt dieses Abschnittes wird auf den Vergleich der beiden Lösungen gelegt.
In der Tabelle (7.4) ist die optimale Schaltstruktur der Steuerungen zusammengefasst. Die Abbildungen (7.29) - (7.35) zeigen die Grafen der optimalen Trajektorien.
Die zugehörigen adjungierten Variablen sind in den Abbildungen (7.38) - (7.41),
(7.44) zu finden. Die Verläufe der optimalen Steuerungen u∗1 , u∗2 , u∗3 , u∗4 sind in den
Abbildungen (7.42), (7.45), (7.43), (7.46) veranschaulicht. Schließlich sind in den
Abbildungen (7.47) - (7.52) die Schaltfunktionen der vier Steuerungen sowie die
beiden Multiplikatorfunktionen dargestellt.
84
7 Ein komplexes Unternehmensmodell
100
70
Lagerbestand
Beschaeftigung
95
65
90
60
85
55
80
75
50
70
45
65
40
60
35
55
50
30
0
2
4
6
8
10
0
2
4
6
8
10
Abbildung 7.29: x1 bei konstantem Preis Abbildung 7.32: x2 bei konstantem Preis
130
160
Fremdkapital
Eigenkapital
120
150
110
140
100
130
90
120
80
110
70
100
60
90
50
80
40
70
30
60
0
2
4
6
8
10
0
2
4
6
8
10
Abbildung 7.30: x3 bei konstantem Preis Abbildung 7.33: x4 bei konstantem Preis
450
35
sichere Anlagen
Risikoabsicherung
400
30
350
25
300
20
250
15
200
10
150
5
100
0
0
2
4
6
8
10
0
2
4
6
8
10
Abbildung 7.31: x5 bei konstantem Preis Abbildung 7.34: x6 bei konstantem Preis
85
7 Ein komplexes Unternehmensmodell
1
-0.031
Diskontierung
0.98
-0.032
0.96
0.94
-0.033
0.92
0.9
-0.034
0.88
-0.035
0.86
0.84
-0.036
0.82
0.8
-0.037
0
2
4
6
8
10
0
1
2
3
4
5
6
7
8
9
10
Abbildung 7.35: x7 bei konstantem Preis Abbildung 7.38: λ1 bei konstantem Preis
0.05
0.007
0
0.006
-0.05
0.005
-0.1
0.004
-0.15
0.003
-0.2
0.002
-0.25
0.001
-0.3
0
-0.35
-0.4
-0.001
0
1
2
3
4
5
6
7
8
9
10
0
1
2
3
4
5
6
7
8
9
10
Abbildung 7.36: λ2 bei konstantem Preis Abbildung 7.39: λ3 bei konstantem Preis
-1
-1
-1.05
-1.05
-1.1
-1.1
-1.15
-1.15
-1.2
-1.2
-1.25
-1.25
-1.3
-1.3
-1.35
-1.35
-1.4
-1.4
-1.45
-1.45
-1.5
0
1
2
3
4
5
6
7
8
9
10
0
1
2
3
4
5
6
7
8
9
10
Abbildung 7.37: λ4 bei konstantem Preis Abbildung 7.40: λ5 bei konstantem Preis
86
7 Ein komplexes Unternehmensmodell
1
800
700
0.5
600
500
0
400
300
-0.5
200
100
-1
0
0
1
2
3
4
5
6
7
8
9
10
0
1
2
3
4
5
6
7
8
9
10
Abbildung 7.41: λ6 bei konstantem Preis Abbildung 7.44: λ7 bei konstantem Preis
10
Lagerveraenderung
100
Besch.veraenderung
8
75
6
50
4
25
2
0
0
-25
-2
-4
-50
-6
-75
-8
-100
-10
0
1
2
3
4
5
6
7
8
9
10
0
1
2
3
4
5
6
7
8
9
10
Abbildung 7.42: u1 bei konstantem Preis Abbildung 7.45: u2 bei konstantem Preis
100
20
FK-Veraenderug
Investition
80
0
60
40
-20
20
0
-40
-20
-60
-40
-60
-80
-80
-100
-100
0
1
2
3
4
5
6
7
8
9
10
0
1
2
3
4
5
6
7
8
9
10
Abbildung 7.43: u3 bei konstantem Preis Abbildung 7.46: u4 bei konstantem Preis
87
7 Ein komplexes Unternehmensmodell
0.0035
0.05
0.003
0
-0.05
0.0025
-0.1
0.002
-0.15
0.0015
-0.2
0.001
-0.25
0.0005
-0.3
0
-0.35
-0.0005
-0.4
0
1
2
3
4
5
6
7
8
9
10
0
1
2
3
4
5
6
7
8
9
10
Abbildung 7.47: Σ1 bei konstantem Preis Abbildung 7.50: Σ2 bei konstantem Preis
0.007
0.02
0.018
0.006
0.016
0.005
0.014
0.012
0.004
0.01
0.003
0.008
0.002
0.006
0.004
0.001
0.002
0
0
-0.001
-0.002
0
1
2
3
4
5
6
7
8
9
10
0
1
2
3
4
5
6
7
8
9
10
Abbildung 7.48: Σ3 bei konstantem Preis Abbildung 7.51: Σ4 bei konstantem Preis
0.012
0.018
0.016
0.01
0.014
0.008
0.012
0.01
0.006
0.008
0.004
0.006
0.004
0.002
0.002
0
0
0
1
2
3
4
5
6
7
8
9
0
10
1
2
3
4
5
6
7
8
9
10
Abbildung 7.49: µ1 bei konstantem Preis Abbildung 7.52: µ2 bei konstantem Preis
88
7 Ein komplexes Unternehmensmodell
t
u∗1
[0.00,0.20140] u1min
[0.2014,0.4273 ] u1min
[0.4273,0.4998 ] u1min
[0.4981,3.8550 ]
0
[3.8550,6.4872 ]
0
[6.4872,10.00]
0
u∗2
u∗3
u∗4
u2max
u2max
u2max
u2max
u2min
singulär
u3min
u3max
singulär
singulär
singulär
singulär
u4min
u4min
singulär
singulär
singulär
singulär
x1 − 50 ≤ 0 x3 − κx4 ≤ 0
n.a.
n.a.
n.a.
a.
a.
a.
n.a
n.a.
a.
a.
a.
a.
Tabelle 7.4: Schaltstruktur der optimalen Steuerungen bei konstantem Preis
Der optimale Verlauf der Steuerung u∗1 wird, wie es im letzten Abschnitt erläutert
wurde, durch die Lagerbeschränkung festgelegt und ist von der Wahl der Parameter
unabhängig. Es gilt hier wiederum:
(
u1min ,
∀ t ∈ [0, t3 ]
u∗1 (t) =
0,
∀ t ∈ [t3 , tf ].
Σ1 (t) =
(
> 0,
= 0,
∀ t ∈ [0, t3 ]
∀ t ∈ [t3 , tf ].
(
= 0,
> 0,
∀ t ∈ [0, t3 ]
∀ t ∈ [t3 , tf ].
Für den Multiplikator µ2 gilt:
µ2 (t) =
Der Eintrittspunkt der Lagerbeschränkung (t3 = 0.4998) stimmt ebenfalls überein.
Denn das Lager wird mit maximaler Geschwindigkeit, bis der Minimalbestand erreicht ist, abgebaut und in beiden Fällen wird von den gleichen Anfangswerten ausgegangen.
Die Struktur der beiden letzten Steuerungen, mittels denen der Geldfluss des Unternehmens geregelt wird, bleibt unverändert. Am Anfang nehmen u∗3 , u∗4 nur ihre
Grenzwerte an und mit dem Aktivwerden der Verschuldungsbeschränkung weisen
beide wieder singulären Verlauf auf. Die Schaltfunktionen haben folgende Form:

(

∀ t ∈ [0, t1 )
 > 0,
> 0,
∀ t ∈ [0, t1 )
Σ3 (t) =
< 0,
∀ t ∈ (t1 , t2 ) und Σ4 (t) =

= 0,
∀ t ∈ [t2 , tf ].

= 0,
∀ t ∈ [t2 , tf ]
Aber die Schaltpunkte t1 , t2 (bzw. Eintrittspunkt t2 ) liegen diesmal etwas weiter
hinten.
Da die erwartete Rendite auch hier stets über dem Fremdkapitalzinssatz liegt, wird
89
7 Ein komplexes Unternehmensmodell
im Falle eines konstanten Preises die Verschuldungsbeschränkung früh aktiv (in
t2 = 0.4273) und bleibt es bis zum Ende der Planungsperiode. Die zugehörige Multiplikatorfunktion erfüllt die Vorzeichen- und Komplementaritätsbedingung:
(
= 0,
∀ t ∈ [0, t2 ]
µ1 (t) =
> 0,
∀ t ∈ [t2 , tf ].
Im Gegensatz zu den übrigen Steuerungen tritt bei der Beschäftigungsänderung u∗2
eine wesentliche Änderung auf. Diese hat nicht mehr reine bang-bang Struktur, sondern enthält im Zeitintervall [t5 , tf ] (mit t5 = 6.4872) auch ein singuläres Teilstück.
Die Schaltfunktion Σ2 (t) hat folgende Gestalt:


∀t ∈ [0, t4 )
 < 0,
Σ2 (t) =
> 0,
∀t ∈ (t4 , t5 )


= 0,
∀t ∈ [t5 , tf ],
mit Σ2 (t4 ) = 0. Darüber hinaus wird mit t4 = 3.8550 ca. ein Jahr später auf maximalen Beschäftigungsabbau (u∗2 = u2min ) umgeschaltet, als im Falle der variierenden
Preisfunktion. Dort liegt der Schaltpunkt t4 bei 2.8522. Vor allem aber wird in der
Zeitspanne [t5 , tf ] nicht sofort mit dem maximalen Beschäftigungsaufbau angefangen, die Beschäftigtenanzahl wird fast bis zum achten Jahr weiter reduziert (u∗2 < 0).
Alle Konsequenzen der eingetretenen Veränderungen sowie die möglichen Gründe
hierfür werden noch zum späteren Zeitpunkt detaillierter diskutiert. Erst sollen die
theoretischen Ausführungen beendet werden.
Die Transversalitätsbedingung (7.6) wird auch von der Lösung des komplexen Modells bei konstantem Preis mit γ1 = γ2 = 0 eingehalten. Die Endwerte der adjungierten Variablen lauten hier:
λ1 (tf ) = −0.03125,
λ2 (tf ) = 0,
λ3 (tf ) = 0,
λ4 (tf ) = −1,
λ5 (tf ) = −1,
λ6 (tf ) = 0,
λ7 (tf ) = 1.949.
Zudem zeigen die obigen Ausführungen, dass sowohl die Minimumbedingung als auch
die Vorzeichen- und Komplementaritätsbedingung überall erfüllt werden. Demnach
genügt die vorliegende Lösung den notwendigen Optimalitätsbedingungen.
Die beiden Multiplikatorfunktionen können erneut durch Differentation der entsprechenden Schaltfunktionen gewonnen werden. Beim direkten Vergleich der Funktionen µ1 (t) beider Lösungen (siehe Abbildungen 7.49,7.23) fällt auf, dass deren
Verläufe identisch sind. Dies wird auch durch den theoretisch ausgerechneten Term
bestätigt, denn dieser hängt nicht vom Preis ab.
µ1 (t) =
(1 − τ )
[0.05λ4 + λ6 ρr (t) − λ5 ρm (t)] .
(1 + κ)
90
7 Ein komplexes Unternehmensmodell
Die Funktion µ2 (t) enthält dagegen den Preis p1 (bzw. p2 (t)) als eine Variable. Diese
lautet hier (da ṗ1 = 0):
µ2 (t) =
(1 − τ ) λ4 [σ − p1 ln(1 + i(t))] − λ̇4 p1 .
x7
Auch die Berechnung der singulären Steuerungen erfolgt analog zu den durchgeführten Rechnungen bei variierendem Preis. Diesmal muss jedoch zusätzlich der Verlauf
von u∗2 auf dem letzten Zeitintervall bestimmt werden. Dazu wird die Funktion Σ2 (t)
nach der Zeit t abgeleitet bis die gesuchte Steuerung darin auftaucht. Es gilt hier:
∂
∂
λ̇2 = 0
Σ̇2 (t) =
∂u
∂u
∂
∂
λ̈2 6= 0.
Σ̈2 (t) =
∂u
∂u
Demnach muss auf dem Zeitintervall [t5 , tf ] zur Bestimmung der singulären Steuerungen u∗2 , u∗4 ein (2 × 2) - Gleichungssystem gelöst werden. Auf die Angabe der
ausgerechneten Lösung wird an dieser Stelle jedoch verzichtet. Es wird nur darauf
hingewiesen, dass u∗2 , u∗4 sowohl von dem Verlauf der Zustände xi abhängen als auch
von den adjungierten Variablen λi .
Vergleich der Lösungen für verschiedene Preisfunktionen
In den obigen Ausführungen wurde schon deutlich, dass der wohl markanteste Unterschied der beiden optimalen Strategien in dem Beschäftigungsbereich des Untenehmens liegt. Doch auch in dem Kapitalsektor können erhebliche Abweichungen
festgestellt werden. Die anfängliche Wachstumsphase der beiden Ressorts (x2 , x3 , x4 )
endet im Falle eines variierenden Preises schon nach ca. 2.85 Jahren, bei konstantem
Preis dagegen erst ein Jahr später. Dafür ist aber die anschließende Abschwungsphase im ersten Beispiel etwa um sieben Monate kürzer als im zweiten. Außerdem fällt
bei konstantem Preis der erneute Zuwachs an Kapitalbeständen und Arbeitskräften
am Ende der Planungsperiode geringer aus.
Dieses Verhalten ist erstaunlich, wenn man den Verlauf der Preisfunktion p2 (t)
(Abbildung 7.27) berücksichtigt. Denn die ersten vier Jahre liegt der variierende
Produktpreis über dem konstanten und vom vierten bis zum achten Jahr unter
p1 = 0.05. Somit hätte man erwarten können, dass bei schwankendem Preis die
erste Aufschwungsphase länger andauert und die zweite erst später eintritt. Doch
offensichtlich spielt nicht nur der Preis selbst, sondern auch die zukünftige Tendenz
(p2 (t) ist auf [2, 6] monoton fallend und auf [6, 10] monoton steigend) eine Rolle.
Die Werte der Ableitung ṗ2 (t) sind auch in den berechneten Steuerungen (sieh 7.8)
enthalten und wirken sich somit tatsächlich auf den optimalen Lösungsverlauf aus.
91
7 Ein komplexes Unternehmensmodell
Da aber bei beiden Lösungen verschiedene Wachstumsphasen zu beobachten sind,
wird deutlich, dass diese nicht auf den schwankenden Preis zurückgeführt werden
können, sondern eindringlich mit der Entwicklung der Zinssatze zusammenhängen.
Des Weiteren ist anzumerken, dass auch die beiden Vermögensgrößen x5 , x6 geringfügig abweichende Verläufe annehmen. So hat die Risikoversicherung x6 bei konstantem Produktpreis fast überall die gleiche Steigung. Im Falle einer variierenden
Preisfunktion dagegen schwankt die Höhe des Anstiegs, in Abhängigkeit von der
jeweiligen Wachstumsphase.
Während die alternativen Anlagen x5 bei schwankendem Preis in beiden Wachstumsperioden zugunsten des Unternehmens abgebaut werden, sind sie bei der Wahl
eines konstanten Preises fast überall streng monoton wachsend. Nur zwischen dem
zweiten und dem dritten Jahr bleibt das Guthaben unverändert. Zwar nimmt die
Steuerung u∗4 auf den Zeitintervallen [0.5, 3] und [9, 10] positive Werte an, was einem
Abzug der sicheren Anlagen gleicht, aber offensichtlich wird diese Differenz durch
anfallende Zinserträge gedeckt.
Der Verlauf des Lagerbestandes x1 sowie die Diskontierungsfunktion x7 stimmen
in beiden Lösungen vollkommen überein. Dies ist auch nicht weiter verwunderlich,
denn beide sind von der Preisentwicklung unabhängig. Zudem sind die Differentialgleichungen dieser Zustandsvariablen von den anderen entkoppelt.
Ein direkter Vergleich der Lösungen zeigt also, dass in beiden Fällen das zu steuernde Unternehmen in 10 Jahren drei Phasen durchläuft: Aufschwung - Abschwung
- Aufschwung. Bei der Wahl eines konstanten Preises ist die letzte Phase sehr kurz
und eher gering. Dies macht sich auch in dem betragsmäßigen Zielfunktionswert bemerkbar. Denn dieser liegt mit |522.566| GE etwa 13% unter dem erwirtschafteten
Gewinn bei varriierendem Preis, der |591.247| GE beträgt. Demnach ist es ökonomisch unvorteilhaft den Produktpreis auf dem ganzen Planungszeitraum, insbesondere bei gleichzeitig steigenden Kosten, konstant zu setzen. Dies bestätigt erneut die
altbekannten Wirtschaftsprinzipien und somit die ausgesprochene Realitätsnähe des
komplexen Unternehmensmodells.
7.4.3 Optimale Steuerung des komplexen Unternehmensmodells
bei Verdoppelung der Planungsperiode
Jedes Unternehmen strebt generell eine dauerhafte Existenz an. Aus diesem Grunde
ist es von äußerster Wichtigkeit zu prüfen, ob eine kurzzeitig ausgelegte (optimale) Strategie nicht zu erheblichen Defiziten in der Zukunft führt. Daher wird hier
noch zum Schluss die Lösung des komplexen Modells bei einer Verlängerung der
Planungsperiode im Falle eines variierenden Preises demonstriert.
92
7 Ein komplexes Unternehmensmodell
100
65
Lagerbestand
Beschaeftigung
60
90
55
50
80
45
70
40
35
60
30
25
50
20
40
15
0
5
10
15
20
0
5
10
15
20
Abbildung 7.53: x1 bei Verdoppelung der Abbildung 7.56: x2 bei Verdoppelung der
Planungsperiode
Planungsperiode
220
300
Fremdkapital
Eigenkapital
200
250
180
160
200
140
120
150
100
100
80
60
50
40
20
0
0
5
10
15
20
0
5
10
15
20
Abbildung 7.54: x3 bei Verdoppelung der Abbildung 7.57: x4 bei Verdoppelung der
Planungsperiode
Planungsperiode
1000
80
sichere Anlagen
Risikoabsicherung
900
70
800
60
700
50
600
40
500
30
400
20
300
10
200
100
0
0
5
10
15
20
0
5
10
15
20
Abbildung 7.55: x5 bei Verdoppelung der Abbildung 7.58: x6 bei Verdoppelung der
Planungsperiode
Planungsperiode
93
7 Ein komplexes Unternehmensmodell
1
-0.03
Diskontierung
0.95
-0.035
0.9
-0.04
0.85
-0.045
0.8
-0.05
0.75
-0.055
0.7
-0.06
0.65
-0.065
0
5
10
15
20
0
2
4
6
8
10
12
14
16
18
20
Abbildung 7.59: x7 bei Verdoppelung der Abbildung 7.62: λ1 bei Verdoppelung der
Planungsperiode
Planungsperiode
1
0.009
0.008
0.5
0.007
0
0.006
0.005
-0.5
0.004
-1
0.003
0.002
-1.5
0.001
-2
0
-2.5
-0.001
0
2
4
6
8
10
12
14
16
18
20
0
2
4
6
8
10
12
14
16
18
20
Abbildung 7.60: λ2 bei Verdoppelung der Abbildung 7.63: λ3 bei Verdoppelung der
Planungsperiode
Planungsperiode
-1
-1
-1.2
-1.2
-1.4
-1.4
-1.6
-1.6
-1.8
-1.8
-2
-2
-2.2
-2.2
0
2
4
6
8
10
12
14
16
18
20
0
2
4
6
8
10
12
14
16
18
20
Abbildung 7.61: λ4 bei Verdoppelung der Abbildung 7.64: λ5 bei Verdoppelung der
Planungsperiode
Planungsperiode
94
7 Ein komplexes Unternehmensmodell
1
2500
2000
0.5
1500
0
1000
-0.5
500
-1
0
0
2
4
6
8
10
12
14
16
18
20
0
2
4
6
8
10
12
14
16
18
20
Abbildung 7.65: λ6 bei Verdoppelung der Abbildung 7.68: λ7 bei Verdoppelung der
Planungsperiode
Planungsperiode
10
10
0
8
-10
6
-20
4
-30
2
-40
0
-50
-2
-60
-4
-70
-6
-80
-8
-90
-100
-10
0
2
4
6
8
10
12
14
16
18
20
0
2
4
6
8
10
12
14
16
18
20
Abbildung 7.66: u1 bei Verdoppelung der Abbildung 7.69: u2 bei Verdoppelung der
Planungsperiode
Planungsperiode
100
40
80
20
60
0
40
20
-20
0
-40
-20
-40
-60
-60
-80
-80
-100
-100
0
2
4
6
8
10
12
14
16
18
20
0
2
4
6
8
10
12
14
16
18
20
Abbildung 7.67: u3 bei Verdoppelung der Abbildung 7.70: u4 bei Verdoppelung der
Planungsperiode
Planungsperiode
95
7 Ein komplexes Unternehmensmodell
0.0007
1
0.0006
0.5
0.0005
0
0.0004
-0.5
0.0003
-1
0.0002
-1.5
0.0001
-2
0
-2.5
0
2
4
6
8
10
12
14
16
18
20
0
2
4
6
8
10
12
14
16
18
20
Abbildung 7.71: Σ1 bei Verdoppelung Abbildung 7.74: Σ2 bei Verdoppelung
der Planungsperiode
der Planungsperiode
0.009
0.03
0.008
0.025
0.007
0.006
0.02
0.005
0.004
0.015
0.003
0.01
0.002
0.001
0.005
0
-0.001
0
0
2
4
6
8
10
12
14
16
18
20
0
2
4
6
8
10
12
14
16
18
20
Abbildung 7.72: Σ3 bei Verdoppelung Abbildung 7.75: Σ4 bei Verdoppelung
der Planungsperiode
der Planungsperiode
0.025
0.025
0.02
0.02
0.015
0.015
0.01
0.01
0.005
0.005
0
0
0
2
4
6
8
10
12
14
16
18
20
0
2
4
6
8
10
12
14
16
18
20
Abbildung 7.73: µ1 bei Verdoppelung der Abbildung 7.76: µ2 bei Verdoppelung der
Planungsperiode
Planungsperiode
96
7 Ein komplexes Unternehmensmodell
t
u∗1
[0.0000,0.16603] u1min
[0.1660,0.3947 ] u1min
[0.3947,0.4998 ] u1min
[0.4981,2.8529 ]
0
[2.8529,6.1988 ]
0
[6.1988,10.00 ]
0
[10.000,14.321 ]
0
[14.321,18.790 ]
0
[18.790,18.873 ]
0
[18.873,19.522 ]
0
[19.522,20.00 ]
0
u∗2
u∗3
u∗4
u2max
u2max
u2max
u2max
u2min
u2max
u2min
u2max
u2max
u2min
u2min
u3min
u3max
singulär
singulär
singulär
singulär
singulär
singulär
singulär
singulär
singulär
u4min
u4min
singulär
singulär
singulär
singulär
singulär
singulär
u4min
u4min
u4min
x1 − 50 ≤ 0 x3 − 0.8x4 ≤ 0
n.a.
n.a.
n.a.
a.
a.
a.
a.
a.
a.
a.
a.
n.a
n.a.
a.
a.
a.
a.
a.
a.
a.
a.
n.a.
Tabelle 7.5: Schaltstruktur der optimalen Steuerungen bei variierendem Preis
Diesmal wird auf die Überprüfung der notwendigen Optimalitätsbedingungen ganz
verzichtet. Es sei aber darauf hingewiesen, dass diese auch hier eingehalten werden.
Das primäre Ziel dieses Abschnittes besteht darin herauszufinden, welche Konsequenzen eine Verdoppelung der Planungsperiode nach sich zieht.
In den Abbildungen (7.53) - (7.70) sind die Grafen der optimalen Trajektorien,
der zugehörigen Adjungierten sowie der optimalen Steuerungen dargestellt. Die Abbildungen (7.71) - (7.76) zeigen den Verlauf der Schaltfunktionen und der beiden
Multiplikatorfunktionen. Die Schaltstruktur der optimalen Steuerungen ist in der
Tabelle (7.5) zusammengefasst.
Bei näherem Betrachten der optimalen Lösung in den Abbildungen (7.53) - (7.76)
stellt man erfreulicherweise fest, dass diese auf den ersten 10 Jahren mit den Grafen (7.3) - (7.26) übereinstimmen. Sogar die Schaltpunkte optimaler Steuerungen
für unterschiedlich lange Planungsperioden sind in den ersten zehn Jahren identisch
(siehe Tabellen 7.3, 7.5). Dies bedeutet gerade, dass die für kürzere Periode empfohlene Taktik auch auf lange Sicht erfolgsversprechend ist.
Somit hängt die optimale Strategie der Unternehmenseigner zur Maximierung der
Gewinne nicht von der Dauer des Planungszeitraumes ab.
Die Gründe dafür lassen sich in mehreren (realen) Voraussetzungen dieses Modells
finden. Zunächst ein Mal hängt der Verlauf der Diskontierungsfunktion nur von der
Inflationsrate i(t) ab und ist dadurch zu jedem Zeitpunkt festgelegt. Des Weiteren stellt der Lagerbestand x1 in der Gewinnfunktion G(t) einen Kostenfaktor dar,
deswegen wird dieser mittels der Steuerung u∗1 soweit wie möglich reduziert. Die
Entwicklung der übrigen drei Steuerungen wird von dem Verlauf der Zinsfunktionen
97
7 Ein komplexes Unternehmensmodell
ρm +ρr , ρk bestimmt. Durch Berücksichtigung der konjunkturellen Schwankungen in
den Zinsfunktionen wird die aktuelle Marktlage, an welcher sich die Entwicklung des
Unternehmens letztendlich richtet, bewertet. Dementsprechend wird zu jedem Zeitpunkt eine Entscheidung aufgrund der gegenwärtigen Wirtschaftsbedingungen und
des Markttrends getroffen. Der Letzte wird mittels der Ableitungen der Zinsfunktionen einbezogen, welche sich ebenfalls in den optimalen Steuerungen auswirken.
Dies wird insbesondere anhand der theoretischen Berechnungen ersichtlich.
Die ausschlaggebende Größe dieses Modells ist also die Zinsstruktur, anhand welcher
bestimmt wird, ob das Unternehmen wächst oder schrumpft.
Diese Feststellung wird auch durch den Verlauf der optimalen Trajektorien auf dem
Zeitintervall [10, 20] (bei einer Verdoppelung der Planungsperiode) untermauert.
Auch hier lösen sich die Aufschwungs- und Abschwungsphase nacheinander ab. Dabei kommt die Steuerung u∗4 immer näher an ihre Grenzen, sodass diese in t = 18.79
sogar ihren Minimalwert annimmt, d. h. es werden maximal mögliche Investitionen
in alternative Anlagen getätigt. Damit ist auch der Austrittspunkt (t = 19.522) der
Verschuldungsbeschränkung zu erklären. Da das Unternehmen sich gerade in einer
Abschwungsphase befindet, ist es vom Vorteil alle Betriebsbestände (Beschäftigung,
Kapital) zu reduzieren. In den früheren Abbauperioden wurde die maximale Verschuldungsbeschränkung trotzdem noch ausgeschöpft, denn es bestand die Möglichkeit das Geld für die sicheren Anlagen zu verwenden. Diesmal wird jedoch die Kapazität der Eigenkapitaländerung u∗4 vollkommen ausgenutzt. Demnach wird hier nicht
mehr das maximal zur Verfügung stehende Kapital benötigt.
Die oben genannten Sachverhalte spiegeln sich auch in dem Zielfunktionswert wider.
Dieser ist im Falle einer zwanzigjährigen Planung mit |1174.71| GE fast doppelt so
hoch wie bei einer zehnjährigen Planungsperiode.
98
8 Schlussbemerkung
In dieser Arbeit wurden zunächst, um eine tragende Basis für das Verständnis der
vorgeführten Beispiele zu schaffen, die theoretischen Hintergründe der optimalen
Steuerprozesse näher erläutert. Hierbei wurde insbesondere der interessante Fall,
in welchem durch das Pontrayginsche Minimumprinzip unter zusätzlichen Konvexitätsannahmen auch hinreichende Bedingungen gegeben werden, hervorgehoben.
Denn solche Probleme sind gerade in den wirtschaftlichen Anwendungen öfters vertreten. Anschließend wurden zwei ökonomische Beispiele aus dem Bereich des Unternehmenswachstum vorgestellt. Dabei war die Behandlung des ersten Beispiels,
modifizierten Modell von Lesourne und Leban, für die vorliegende Arbeit aus zwei
unterschiedlichen Gründen vom Interesse. Erstens bildet dieses den Ausgangspunkt
des komplexen Modells und zweitens gehört es zu der Klasse der Probleme, welche
die zusätzlichen Konvexitätsannahmen erfüllen.
Den Kern der vorliegenden Arbeit bildete die Bearbeitung eines komplexen Unternehmensmodells. Dabei handelt es sich um einen wirklich komplexen parameterreichen optimalen Steuerprozess mit vier linearen Steuerungen, sieben Zustandsvariablen und zwei aktiven Zustandsbeschränkungen. Solche Anwendungen sind in der
Literatur eher selten vertreten. Mit diesem Modell konnte ein sehr aufschlussreiches
Beispiel, welches in der Lage ist wirtschaftliche Vorgänge äußerst realitätsnahe zu
repräsentieren, demonstriert werden.
Im Rahmen dieser Arbeit wurde eingehend untersucht, welchen Einfluss eine Änderung der Parameter, mämlich Produktpreis sowie die Dauer der Planungsperiode,
auf den optimalen Lösungsverlauf hat. Doch auch eine Analyse der anderen Parameter wäre mit Sicherheit lehrreich. Z. B. wäre interessant zu sehen inwieweit die
optimale Lösung von der Wahl der Koeffizienten der Produktionsfunktion abhängt,
denn mit höherer Produktionselastizität (α1 , α2 ) steigt die Ausbringungsmenge. Dies
führt zu höheren Gewinnen und könnte eventuell einen raschen Abbau der Unternehmensbestände in den Niedrigzinsphasen verhindern.
Die fundierten Ergebnisse dieser Arbeit zeigen deutlich, dass es in der Behandlung
ökonomischer Modelle mittels optimaler Steuerprozesse sehr viel Potenzial steckt.
99
A Beispieldateien: AMPL-Code
A.1 Komplexes Modell beim variierenden Preis mit
Heun-Verfahren
####################################################################
#
Komplexes Modell für risikoscheue EK-Geber
#
#
HEUN-Verfahren
#
#
beim variierenden Preis
#
####################################################################
####################################################################
# DEKLARATION DER PARAMETER:
#
####################################################################
param t_0
:= 0.0;
param t_f
:= 10.0;
param n
:= 5000;
param h
:= (t_f-t_0)/n;
param u1_min := -100.0;
param u1_max := 100.0;
param u2_min := -10.0;
param u2_max := 10.0;
param u3_min := -100.0;
param u3_max := 100.0;
param u4_min := -100.0;
param u4_max := 100.0;
param tau
:= 0.5;
param alpha
:= 100.0;
param alpha1 := 0.35;
param alpha2 := 0.5;
param sigma
:= 0.01;
param delta
:= 0.322;
param kappa
:= 0.8;
100
A Beispieldateien: AMPL-Code
param kl
:= 8.0;
param pi
:= 3.1415927;
####################################################################
# DEKLARATION DER VARIABLEN:
#
####################################################################
var x_1 {i in 0..n}:=100;
var x_2 {i in 0..n}:=30;
var x_3 {i in 0..n}:=50;
var x_4 {i in 0..n}:=100;
var x_5 {i in 0..n}:=100;
var x_6 {i in 0..n}:=0.0;
var x_7 {i in 0..n}:=1.0;
var u_1 {i in 0..n-1};
var u_2 {i in 0..n-1};
var u_3 {i in 0..n-1};
var u_4 {i in 0..n-1};
param k
{i in 0..n} := (pi/2.0)+(2.0*pi/kl)*i*h;
param w
{i in 0..n} := 2*exp(0.02*i*h);
param zin {i in 0..n} := 0.019+0.029*sin(k[i]);
param rhok {i in 0..n} := 0.110+0.030*sin(k[i]);
param rhom {i in 0..n} := 0.074+0.018*sin(k[i]);
param rhor {i in 0..n-1} := rhok[i]-0.05;
param p
{i in 0..n} := 0.05+0.01*sin(k[i]-(pi/2.0));
var dgl_1 {i in 0..n-1} = u_1[i];
var dgl_2 {i in 0..n-1} = u_2[i];
var dgl_3 {i in 0..n-1} = u_3[i];
var dgl_4 {i in 0..n-1} = u_4[i]+(1-tau)*((1.0/x_7[i])*(p[i]*
(alpha*(x_3[i]+x_4[i])^alpha1*x_2[i]^alpha2-u_1[i])-sigma*x_1[i]w[i]*x_2[i])-rhok[i]*x_3[i]-delta*(x_3[i]+x_4[i])-rhor[i]*x_4[i]);
var dgl_5 {i in 0..n-1} = -1.0*u_4[i]+(1-tau)*rhom[i]*x_5[i];
var dgl_6 {i in 0..n-1} = (1-tau)*rhor[i]*x_4[i];
var dgl_7 {i in 0..n-1} = log(1+zin[i])*(-x_7[i]);
var euler_1 {i in 0..n-1} = x_1[i] + h * (u_1[i]);
var euler_2 {i in 0..n-1} = x_2[i] + h * (u_2[i]);
var euler_3 {i in 0..n-1} = x_3[i] + h * (u_3[i]);
var euler_4 {i in 0..n-1} = x_4[i] + h * (u_4[i]+(1-tau)*((1.0/x_7[i])
*(p[i]*(alpha*(x_3[i]+x_4[i])^alpha1*x_2[i]^alpha2-u_1[i])-sigma*x_1[i]
-w[i]*x_2[i])-rhok[i]*x_3[i]-delta*(x_3[i]+x_4[i])-rhor[i]*x_4[i]));
101
A Beispieldateien: AMPL-Code
var euler_5 {i in 0..n-1}=x_5[i]+h*(-1.0*u_4[i]+(1-tau)*rhom[i]*x_5[i]);
var euler_6 {i in 0..n-1}=x_6[i]+h*((1-tau)*rhor[i]*x_4[i]);
var euler_7 {i in 0..n-1}=x_7[i]+h*(log(1+zin[i])*(-x_7[i]));
####################################################################
# ANGABE DES ZIELFUNKIONALS:
#
####################################################################
minimize Zielfkt: -(x_4[n]+x_5[n]+(1-tau)*p[n]*(x_1[n]/x_7[n]));
####################################################################
# ANGABE DER ANFANGSWERTE:
#
####################################################################
s.t. aw_1 : x_1[0] = 100.0;
s.t. aw_2 : x_2[0] = 30.0;
s.t. aw_3 : x_3[0] = 50.0;
s.t. aw_4 : x_4[0] = 100.0;
s.t. aw_5 : x_5[0] = 100.0;
s.t. aw_6 : x_6[0] = 0.0;
s.t. aw_7 : x_7[0] = 1.0;
####################################################################
# DIE DYNAMIK DES SYSTEMS:
#
####################################################################
s.t.heun_1 {i in 0..n-1}: x_1[i+1]=x_1[i]+0.5*h*(dgl_1[i]+u_1[i]);
s.t.heun_2 {i in 0..n-1}: x_2[i+1]=x_2[i]+0.5*h*(dgl_2[i]+u_2[i]);
s.t.heun_3 {i in 0..n-1}: x_3[i+1]=x_3[i]+0.5*h*(dgl_3[i]+u_3[i]);
s.t.heun_4 {i in 0..n-1}: x_4[i+1]=x_4[i]+0.5*h*(dgl_4[i]+(u_4[i]+
(1-tau)*((1.0/euler_7[i])*(p[i]*(alpha*(euler_3[i]+euler_4[i])^alpha1*
euler_2[i]^alpha2-u_1[i])-sigma*euler_1[i]-w[i]*euler_2[i])rhok[i]*euler_3[i]-delta*(euler_3[i]+euler_4[i])rhor[i]*euler_4[i])));
s.t. heun_5 {i in 0..n-1}: x_5[i+1] = x_5[i] + 0.5*h * (dgl_5[i]+
(-1.0*u_4[i]+(1-tau)*rhom[i]*euler_5[i]));
s.t. heun_6 {i in 0..n-1}: x_6[i+1] = x_6[i] + 0.5*h * (dgl_6[i]+
((1-tau)*rhor[i]*euler_4[i]));
s.t. heun_7 {i in 0..n-1}: x_7[i+1] = x_7[i] + 0.5*h * (dgl_7[i]+
log(1+zin[i])*(-euler_7[i]));
####################################################################
102
A Beispieldateien: AMPL-Code
# ANGABE DER ZUSTANDS- UND STEUERBESCHRAENKUNGEN
#
####################################################################
s.t. beschr_1 {i in 0..n-1} : u1_min <= u_1[i] <= u1_max;
s.t. beschr_2 {i in 0..n-1} : u2_min <= u_2[i] <= u2_max;
s.t. beschr_3 {i in 0..n-1} : u3_min <= u_3[i] <= u3_max;
s.t. beschr_4 {i in 0..n-1} : u4_min <= u_4[i] <= u4_max;
s.t. beschr_5a {i in 0..n-1} : 50.0 - x_1[i] <= 0.0;
s.t. beschr_5b {i in 0..n-1} : x_1[i]<=200;
s.t. beschr_6 {i in 0..n-1} : 0.0 <= x_2[i];
s.t. beschr_7 {i in 0..n-1} : 0.0 <= x_3[i];
s.t. beschr_8 {i in 0..n-1} : 0.0 <= kappa*x_4[i]-x_3[i];
s.t. beschr_9 {i in 0..n-1} : 0.0 <= x_5[i];
####################################################################
# ANGABE DER ANFANGSSCHAETZUNGEN
#
####################################################################
let {i in 0..n-1} u_1[i] := u1_min;
let {i in 0..n-1} u_2[i] := u2_max;
let {i in 0..n-1} u_3[i] := u3_min;
let {i in 0..n-1} u_4[i] := u4_min;
####################################################################
# AUSWAHL DES SOLVERS
#
####################################################################
# option solver loqo;
option solver ipopt;
# option abs_boundtol 1;
#option rel-boundtol 1e-4;
####################################################################
# ANGABE DER OPTIONALEN LOQO-OPTIONS
#
####################################################################
option loqo_options "verbose=2 timing=1 maxit=2000";
option rel_boundtol 1;
option abs_boundtol 1;
####################################################################
# BEFEHL ZUM LOESEN DES PROBLEMS
#
####################################################################
solve;
####################################################################
# AUSGABE IN DIE JEWEILIGEN DATEIEN
#
103
A Beispieldateien: AMPL-Code
####################################################################
printf {i in 0..n} "%12.6f %12.6f\n", i*h, x_1[i]
> ’/u/balzern/LOQO/
Risikoscheu/vx1h.dat’;
printf {i in 0..n} "%12.6f %12.6f\n", i*h, x_2[i]
> ’/u/balzern/LOQO/
Risikoscheu/vx2h.dat’;
printf {i in 0..n} "%12.6f %12.6f\n", i*h, x_3[i]
> ’/u/balzern/LOQO/
Risikoscheu/vx3h.dat’;
printf {i in 0..n} "%12.6f %12.6f\n", i*h, x_4[i]
> ’/u/balzern/LOQO/
Risikoscheu/vx4h.dat’;
printf {i in 0..n} "%12.6f %12.6f\n", i*h, x_5[i]
> ’/u/balzern/LOQO/
Risikoscheu/vx5h.dat’;
printf {i in 0..n} "%12.6f %12.6f\n", i*h, x_6[i]
> ’/u/balzern/LOQO/
Risikoscheu/vx6h.dat’;
printf {i in 0..n} "%12.6f %12.6f\n", i*h, x_7[i]
> ’/u/balzern/LOQO/
Risikoscheu/vx7h.dat’;
printf {i in 0..n-1} "%12.6f %12.6f\n", i*h, heun_1[i] > ’/u/balzern/
LOQO/Risikoscheu/vlambda1h.dat’;
printf {i in 0..n-1} "%12.6f %12.6f\n", i*h, heun_2[i] > ’/u/balzern/
LOQO/Risikoscheu/vlambda2h.dat’;
printf {i in 0..n-1} "%12.6f %12.6f\n", i*h, heun_3[i] > ’/u/balzern/
LOQO/Risikoscheu/vlambda3h.dat’;
printf {i in 0..n-1} "%12.6f %12.6f\n", i*h, heun_4[i] > ’/u/balzern/
LOQO/Risikoscheu/vlambda4h.dat’;
printf {i in 0..n-1} "%12.6f %12.6f\n", i*h, heun_5[i] > ’/u/balzern/
LOQO/Risikoscheu/vlambda5h.dat’;
printf {i in 0..n-1} "%12.6f %12.6f\n", i*h, heun_6[i] > ’/u/balzern/
LOQO/Risikoscheu/vlambda6h.dat’;
printf {i in 0..n-1} "%12.6f %12.6f\n", i*h, heun_7[i] > ’/u/balzern/
LOQO/Risikoscheu/vlambda7h.dat’;
printf {i in 0..n-1} "%12.6f %12.6f\n", i*h, heun_4[i]-heun_5[i] > ’
/u/balzern/LOQO/Risikoscheu/vsigma4h.dat’;
printf {i in 0..n-1} "%12.6f %12.6f\n", i*h, heun_1[i]-(heun_4[i]*tau*
p[i])/x_7[i] > ’/u/balzern/LOQO/Risikoscheu/vsigma1h.dat’;
printf {i in 0..n-1} "%12.6f %12.6f\n", i*h, u_1[i] > ’/u/balzern/LOQO/
Risikoscheu/vu1h.dat’;
printf {i in 0..n-1} "%12.6f %12.6f\n", i*h, u_2[i] > ’/u/balzern/LOQO/
Risikoscheu/vu2h.dat’;
printf {i in 0..n-1} "%12.6f %12.6f\n", i*h, u_3[i] > ’/u/balzern/LOQO/
104
A Beispieldateien: AMPL-Code
Risikoscheu/vu3h.dat’;
printf {i in 0..n-1} "%12.6f %12.6f\n", i*h, u_4[i] > ’/u/balzern/LOQO/
Risikoscheu/vu4h.dat’;
printf {i in 0..n-1} "%12.6f %12.6f\n", i*h, -(1.0/h)*beschr_5a[i]
>
’/u/balzern/LOQO/Risikoscheu/vmju1h.dat’;
printf {i in 0..n-1} "%12.6f %12.6f\n", i*h, (1.0/h)*beschr_5b[i]
>
’/u/balzern/LOQO/Risikoscheu/vmju1bh.dat’;
printf {i in 0..n-1} "%12.6f %12.6f\n", i*h, (1.0/h)*beschr_6[i]
>
’/u/balzern/LOQO/Risikoscheu/vmju2ah.dat’;
printf {i in 0..n-1} "%12.6f %12.6f\n", i*h, (1.0/h)*beschr_7[i]
>
’/u/balzern/LOQO/Risikoscheu/vmju3h.dat’;
printf {i in 0..n-1} "%12.6f %12.6f\n", i*h, -(1.0/h)*beschr_8[i]
>
’/u/balzern/LOQO/Risikoscheu/vmju2h.dat’;
printf {i in 0..n-1} "%12.6f %12.6f\n", i*h, ((1-tau)/(1+kappa))*
(0.05*heun_4[i]+heun_6[i]*rhor[i]-heun_5[i]*rhom[i])
>
’/u/balzern/LOQO/Risikoscheu/vmju1theoh.dat’;
printf {i in 0..n-1} "%12.6f %12.6f\n", i*h,0.8*(u_4[i]+(1-tau)*
((1.0/x_7[i])*(p[i]*(alpha*(x_3[i]+x_4[i])^alpha1*x_2[i]^alpha2u_1[i])-sigma*x_1[i]-w[i]*x_2[i])-rhok[i]*x_3[i]-delta*(x_3[i]+x_4[i])
-rhor[i]*x_4[i]))
> ’/u/balzern/LOQO/Risikoscheu/vu3theoh.dat’;
105
A Beispieldateien: AMPL-Code
A.2 Komplexes Modell beim variierenden Preis mit
Euler-Verfahren
####################################################################
#
Konzernmodell für risikoscheuen EK-Geber
#
#
beim variierenden Preis
#
#
Euler-Verfahren
#
####################################################################
####################################################################
# DEKLARATION DER PARAMETER:
#
####################################################################
param t_0
:= 0.0;
param t_f
:= 10.0;
param n
:= 1000;
param h
:= (t_f-t_0)/n;
param u1_min := -100.0;
param u1_max := 100.0;
param u2_min := -10.0;
param u2_max := 10.0;
param u3_min := -100.0;
param u3_max := 100.0;
param u4_min := -100.0;
param u4_max := 100.0;
param tau
:= 0.5;
param alpha
:= 100.0;
param alpha1 := 0.35;
param alpha2 := 0.5;
param sigma
:= 0.01;
param delta
:= 0.322;
param kappa
:= 0.8;
param pi
:= 3.1415927;
param kl
:= 8.0;
####################################################################
# DEKLARATION DER VARIABLEN:
#
####################################################################
var x_1 {i in 0..n}:=100;
var x_2 {i in 0..n}:=30;
106
A Beispieldateien: AMPL-Code
var x_3 {i in 0..n}:=50;
var x_4 {i in 0..n}:=100;
var x_5 {i in 0..n}:=100;
var x_6 {i in 0..n}:=0.0;
var x_7 {i in 0..n}:=1.0;
var u_1 {i in 0..n-1};
var u_2 {i in 0..n-1};
var u_3 {i in 0..n-1};
var u_4 {i in 0..n-1};
param k
{i in 0..n} := pi/2.0+(2.0*pi/kl)*i*h;
param w
{i in 0..n} := 2*exp(0.02*i*h);
param zin {i in 0..n} := 0.019+0.029*sin(k[i]);
param rhok {i in 0..n} := 0.110+0.030*sin(k[i]);
param rhom {i in 0..n} := 0.074+0.018*sin(k[i]);
param p
{i in 0..n} := 0.05+0.01*sin(k[i]-(pi/2.0));
param rhor {i in 0..n-1} := rhok[i]-0.05;
var x_22 {i in 0..n}:=(1-tau)*(dgl_4[i]);
####################################################################
# ANGABE DES ZIELFUNKIONALS:
#
####################################################################
minimize Zielfkt: -(x_4[n]+x_5[n]+(1-tau)*p[n]*(x_1[n]/x_7[n]));
####################################################################
# ANGABE DER ANFANGSWERTE:
#
####################################################################
s.t. aw_1 : x_1[0] = 100.0;
s.t. aw_2 : x_2[0] = 30.0;
s.t. aw_3 : x_3[0] = 50.0;
s.t. aw_4 : x_4[0] = 100.0;
s.t. aw_5 : x_5[0] = 100.0;
s.t. aw_6 : x_6[0] = 0.0;
s.t. aw_7 : x_7[0] = 1.0;
####################################################################
# DIE DYNAMIK DES SYSTEMS:
#
####################################################################
s.t. dgl_1 {i in 0..n-1}: x_1[i+1] = x_1[i] + h * (u_1[i]);
s.t. dgl_2 {i in 0..n-1}: x_2[i+1] = x_2[i] + h * (u_2[i]);
107
A Beispieldateien: AMPL-Code
s.t. dgl_3 {i in 0..n-1}: x_3[i+1] = x_3[i] + h * (u_3[i]);
s.t. dgl_4 {i in 0..n-1}: x_4[i+1] = x_4[i] + h * (u_4[i]+(1-tau)*
((1.0/x_7[i])*(p[i]*(alpha*(x_3[i]+x_4[i])^alpha1*x_2[i]^alpha2-u_1[i])
-sigma*x_1[i]-w[i]*x_2[i])-rhok[i]*x_3[i]-delta*(x_3[i]+x_4[i])rhor[i]*x_4[i]));
s.t. dgl_5 {i in 0..n-1}: x_5[i+1] = x_5[i] + h * (-1.0*u_4[i]+
(1-tau)*rhom[i]*x_5[i]);
s.t. dgl_6 {i in 0..n-1}: x_6[i+1] = x_6[i] + h * ((1-tau)*rhor[i]
*x_4[i]);
s.t. dgl_7 {i in 0..n-1}: x_7[i+1] = x_7[i] + h * (log(1+zin[i])*
(-x_7[i]));
####################################################################
# ANGABE DER ZUSTANDS- UND STEUERBESCHRAENKUNGEN
#
####################################################################
s.t. beschr_1 {i in 0..n-1} : u1_min <= u_1[i] <= u1_max;
s.t. beschr_2 {i in 0..n-1} : u2_min <= u_2[i] <= u2_max;
s.t. beschr_3 {i in 0..n-1} : u3_min <= u_3[i] <= u3_max;
s.t. beschr_4 {i in 0..n-1} : u4_min <= u_4[i] <= u4_max;
s.t. beschr_5 {i in 0..n-1} : 50.0 - x_1[i] <= 0.0;
s.t. beschr_6 {i in 0..n-1} : 0.0 <= x_2[i];
s.t. beschr_7 {i in 0..n-1} : 0.0 <= x_3[i];
s.t. beschr_8 {i in 0..n-1} : -kappa*x_4[i]+x_3[i]<= 0;
s.t. beschr_9 {i in 0..n-1} : -x_5[i] <= 0.0;
####################################################################
# ANGABE DER ANFANGSSCHAETZUNGEN
#
####################################################################
let {i in 0..n-1} u_1[i] := u1_min;
let {i in 0..n-1} u_2[i] := u2_min;
let {i in 0..n-1} u_3[i] := u3_min;
let {i in 0..n-1} u_4[i] := u4_min;
####################################################################
# AUSWAHL DES SOLVERS
#
####################################################################
# option solver loqo;
option solver ipopt;
option abs_boundtol 1;
#option rel-boundtol 1e-4;
####################################################################
108
A Beispieldateien: AMPL-Code
# ANGABE DER OPTIONALEN LOQO-OPTIONS
#
####################################################################
#
option loqo_options "verbose=2 timing=1 maxit=500";
####################################################################
# BEFEHL ZUM LOESEN DES PROBLEMS
#
####################################################################
solve;
####################################################################
# AUSGABE IN DIE JEWEILIGEN DATEIEN
#
####################################################################
printf {i in 0..n} "%12.6f %12.6f\n", i*h, x_1[i]
> ’/u/balzern/
LOQO/Risikoscheu/vx1e.dat’;
printf {i in 0..n} "%12.6f %12.6f\n", i*h, x_2[i]
> ’/u/balzern/
LOQO/Risikoscheu/vx2e.dat’;
printf {i in 0..n} "%12.6f %12.6f\n", i*h, x_3[i]
> ’/u/balzern/
LOQO/Risikoscheu/vx3e.dat’;
printf {i in 0..n} "%12.6f %12.6f\n", i*h, x_4[i]
> ’/u/balzern/
LOQO/Risikoscheu/vx4e.dat’;
printf {i in 0..n} "%12.6f %12.6f\n", i*h, x_5[i]
> ’/u/balzern/
LOQO/Risikoscheu/vx5e.dat’;
printf {i in 0..n} "%12.6f %12.6f\n", i*h, x_6[i]
> ’/u/balzern/
LOQO/Risikoscheu/vx6e.dat’;
printf {i in 0..n} "%12.6f %12.6f\n", i*h, x_7[i]
> ’/u/balzern/
LOQO/Risikoscheu/vx7e.dat’;
printf {i in 0..n-1} "%12.6f %12.6f\n", i*h, dgl_1[i] > ’/u/balzern/
LOQO/Risikoscheu/vlambda1e.dat’;
printf {i in 0..n-1} "%12.6f %12.6f\n", i*h, dgl_2[i] > ’/u/balzern/
LOQO/Risikoscheu/vlambda2e.dat’;
printf {i in 0..n-1} "%12.6f %12.6f\n", i*h, dgl_3[i] > ’/u/balzern/
LOQO/Risikoscheu/vlambda3e.dat’;
printf {i in 0..n-1} "%12.6f %12.6f\n", i*h, dgl_4[i] > ’/u/balzern/
LOQO/Risikoscheu/vlambda4e.dat’;
printf {i in 0..n-1} "%12.6f %12.6f\n", i*h, dgl_5[i] > ’/u/balzern/
LOQO/Risikoscheu/vlambda5e.dat’;
printf {i in 0..n-1} "%12.6f %12.6f\n", i*h, dgl_6[i] > ’/u/balzern/
LOQO/Risikoscheu/vlambda6e.dat’;
printf {i in 0..n-1} "%12.6f %12.6f\n", i*h, dgl_7[i] > ’/u/balzern/
LOQO/Risikoscheu/vlambda7e.dat’;
109
A Beispieldateien: AMPL-Code
printf {i in 0..n-1} "%12.6f %12.6f\n", i*h, dgl_4[i]-dgl_5[i] > ’
/u/balzern/LOQO/Risikoscheu/vsigma4e.dat’;
printf {i in 0..n-1} "%12.6f %12.6f\n", i*h, dgl_1[i]-(dgl_4[i]*tau
*p[i])/x_7[i] > ’/u/balzern/LOQO/Risikoscheu/vsigma1e.dat’;
printf {i in 0..n-1} "%12.6f %12.6f\n", i*h, u_1[i]
> ’/u/balzern/
LOQO/Risikoscheu/vu1e.dat’;
printf {i in 0..n-1} "%12.6f %12.6f\n", i*h, u_2[i]
> ’/u/balzern
LOQO/Risikoscheu/vu2e.dat’;
printf {i in 0..n-1} "%12.6f %12.6f\n", i*h, u_3[i]
> ’/u/balzern/
LOQO/Risikoscheu/vu3e.dat’;
printf {i in 0..n-1} "%12.6f %12.6f\n", i*h, u_4[i]
> ’/u/balzern/
LOQO/Risikoscheu/vu4e.dat’;
printf {i in 0..n-1} "%12.6f %12.6f\n", i*h, rhok[i]
> ’/u/balzern/
LOQO/Risikoscheu/rhokv.dat’;
printf {i in 0..n-1} "%12.6f %12.6f\n", i*h, rhor[i] +rhom[i] > ’
/u/balzern/LOQO/Risikoscheu/rhormv.dat’;
printf {i in 0..n-1} "%12.6f %12.6f\n", i*h, ((1-tau)/(1+kappa))*
(0.05*dgl_4[i]+dgl_6[i]*rhor[i]-dgl_5[i]*rhom[i])
> ’/u/balzern/LOQO/
Risikoscheu/vmju1theo.dat’;
printf {i in 0..n-1} "%12.6f %12.6f\n", i*h, ((1-tau)*dgl_4[i]*(p[i]
-sigma))/x_7[i]
> ’/u/balzern/LOQO/Risikoscheu/vmju2theo.dat’;
printf {i in 0..n-1} "%12.6f %12.6f\n", i*h, -(1.0/h)*beschr_5[i] > ’
/u/balzern/LOQO/Risikoscheu/vmju1e.dat’;
printf {i in 0..n-1} "%12.6f %12.6f\n", i*h, (1.0/h)*beschr_6[i] > ’
/u/balzern/LOQO/Risikoscheu/vmju1be.dat’;
printf {i in 0..n-1} "%12.6f %12.6f\n", i*h, (1.0/h)*beschr_7[i] > ’
/u/balzern/LOQO/Risikoscheu/vmju3e.dat’;
printf {i in 0..n-1} "%12.6f %12.6f\n", i*h, -(1.0/h)*beschr_8[i] > ’
/u/balzern/LOQO/Risikoscheu/vmju2e.dat’;
printf {i in 0..n-1} "%12.6f %12.6f\n", i*h, (1.0/h)*beschr_9[i] > ’
/u/balzern/LOQO/Risikoscheu/vmju5e.dat’;
printf {i in 0..n-1} "%12.6f %12.6f\n", i*h, 0.8*(u_4[i]+(1-tau)*
((1.0/x_7[i])*(p[i]*(alpha*(x_3[i]+x_4[i])^alpha1*x_2[i]^alpha2u_1[i])-sigma*x_1[i]-w[i]*x_2[i])-rhok[i]*x_3[i]-delta*(x_3[i]+x_4[i])rhor[i]*x_4[i])) > ’/u/balzern/LOQO/Risikoscheu/vu3theo.dat’;
printf {i in 0..n-1} "%12.6f %12.6f\n", i*h, 0.05+0.01*sin(k[i]-(pi/2))
> ’/u/balzern/LOQO/Risikoscheu/preis.dat’;
printf {i in 0..n-1} "%12.6f %12.6f\n", i*h, 2*exp(0.02*i*h) > ’
110
A Beispieldateien: AMPL-Code
/u/balzern/LOQO/Risikoscheu/kosten.dat’;
111
B Eidesstattliche Erklärung
Ich versichere hiermit, dass ich diese Arbeit selbständig verfasst habe und neben
der beiden Optimierungspakete, LOQO von Prof. R. J. Vanderbei und IPOPT von
A. Wächter und L. T. Biegler, keine weiteren als die im Literaturverzeichnis angegebenen Hilfsmittel verwendet habe.
Münster, den 30. Juli 2006
112
C Danksagung
Herrn Prof. Dr. Maurer danke ich für die interessante Themenstellung und stets
wohlwollende und freundliche Betreuung. Des Weiteren gilt mein Dank Herrn Georg
Vossen sowie Herrn K. Theißen für die zahlreichen Hilfestellungen.
113
D Literaturverzeichnis
[1] Ch. Büskens: Optimierungsmethoden und Sensitivitätsanalyse für optimale
Steuerprozesse mit Steuer- und Zustandsbeschränkungen, Dissertation am Institut für numerische und instrumentelle Mathematik der Universität Münster,
1998.
[2] N. A. Derzko, S. P. Sethi, G. L. Thompson: Necessary and sufficient conditions for optimal control of quasulinear partial differential systems, Journal of
Optimization Theory and Applications, S. 89-101, 1984.
[3] G. Feichtinger, R. F. Hartl: Optimale Kontrolle ökonomischer Prozesse, Walter
de Gruyter, Berlin, New-York, 1986.
[4] R. F. Hartl, S. P. Sethi, R. G. Vickson: A Survey of the Maximum Principle
for Optimal Control Problems with State Constraints, SIAM Review, Vol. 37,
S. 181-218, Juni 1995.
[5] J. R. Kim:Optimierungsmethoden und Sensitivitätsanalyse für optimale bangbang Steuerungen mit Anwendungen in der Nichtlinearen Optik, Dissertation
am Institut für numerische und instrumentelle Mathematik der Universität
Münster, 2002.
[6] H. W. Knobloch, F. Kappel: Gewöhnliche Differentialgleichungen, B. G. Teubner Verlagsgesellschaft, Stuttgart, 1974.
[7] B. Koslik: Entwicklung eines komplexen Unternehmensmodells und numerische
Berechnung optimaler Steuerungen mit direkten und indirekten Verfahren, Diplomarbeit, Technische Universität München, Mai 1994.
[8] J. Lesourne, R. Leban: La Substitution Capital-Travail au Cours de la
Croissance de l‘Entreprise, Revue d‘Economie Politique, Vol. 4, S. 540-564,
1978.
[9] D. G. Luenberger: Introduction to Linear and Nonlinear Programming,
Addison-Wesley Publishing Company, Inc., Reading, Massachusetts, 1973.
114
D Literaturverzeichnis
[10] H. Maurer: Optimale Steuerprozesse, Vorlesung der Westfälischen Wilhelms
Universität Münster, WS 02/03.
[11] H. Maurer: On the Minimum Principle for Optimal Control Problems with State
Constraints, Schriftenreihe des Rechenzentrums der Universität Münster, ISSN
o344-o842, Oktober 1979.
[12] H. Maurer: On Optimal Control Problems with Bounded State Variables and
Control Appearing Linearly, SIAM Journal on Control and Optimization, Vol.
15, No. 3, 1976.
[13] H. Maurer: Optimierung, Vorlesung der Westfälischen Wilhelms Universität
Münster, WS 01/02.
[14] L. Perridon, M. Steiner: Finanzwirtschaft der Unternehmung, Verlag Vahlen,
11 Auflage.
[15] R. T. Rockafellar: Convex Analysis, Princeton Univ. Press, Princeton, 1970.
[16] R. J. Vanderbei, D. F. Shanno: An Interior-Point Algorithm for Nonkonvex
Nonlinear Programming, Computational Optimization and Applications, Vol.
13, S. 231-252, 1999.
[17] A. Wächter, L. T. Biegler: On the Implementation of an Interior-Point Filter
Line-Search Algorithm for Large-Scale Nonlinear Programming, Mathematical
Programming 106(1), pp. 25-57, 2006 (As Research Report RC 23149, IBM T.
J. Watson Research Center, Yorktown, USA.
[18] S. Winderl, B. Naumer: On a State Constrained Optimal Control
Problem in Economics with Four Linear Controls, Preprint 00-9,
< http://www.zib.de/dfg-echtzeit/Publikationen >.
115