Konvexe Optimierung am Beispiel

Werbung
Masterarbeit
Konvexe Optimierung am Beispiel
volumenmaximaler
einbeschriebener Rechtecksmengen
vorgelegt von
Marco Daub
an der
Fachbereich Mathematik und Statistik
1. Gutachter Prof. Dr. Stefan Volkwein
2. Gutachter Prof. Dr. Matthias Gerdts
Konstanz, März 2017
Konstanzer Online-Publikations-System (KOPS)
URL: http://nbn-resolving.de/urn:nbn:de:bsz:352-0-420923
Erklärung
Ich versichere hiermit, dass ich die vorliegende Arbeit mit dem Thema:
Konvexe Optimierung am Beispiel volumenmaximaler einbeschriebener
Rechtecksmengen
selbständig verfasst und keine anderen Hilfsmittel als die angegebenen benutzt habe.
Die Stellen, die anderen Werken dem Wortlaut oder dem Sinne nach entnommen
sind, habe ich in jedem einzelnen Falle durch Angaben der Quelle, auch der benutzten
Sekundärliteratur, als Entlehnung kenntlich gemacht.
Die Arbeit wurde bisher keiner anderen Prüfungsbehörde vorgelegt und auch noch
nicht veröentlicht.
Konstanz, den 1. März 2017
Marco Daub
Inhaltsverzeichnis
1. Einleitung
3
2. Topologische Grundlagen
7
2.1.
Euklidische Räume . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7
2.2.
Produkträume . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
12
3. Maÿtheoretischer Volumenbegri
19
3.1.
Borel-Mengen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
19
3.2.
Borel-messbare Funktionen
. . . . . . . . . . . . . . . . . . . . . . .
23
3.3.
Das Lebesgue-Maÿ
. . . . . . . . . . . . . . . . . . . . . . . . . . . .
27
4. Konvexe Theorie
32
4.1.
Konvexe Mengen und Funktionen . . . . . . . . . . . . . . . . . . . .
32
4.2.
Konvexe Optimierungsprobleme . . . . . . . . . . . . . . . . . . . . .
41
5. Das VER-Problem
46
5.1.
Einführung in die Problemstellung
. . . . . . . . . . . . . . . . . . .
46
5.2.
Analytisches Problem
. . . . . . . . . . . . . . . . . . . . . . . . . .
52
6. Das konvexe VER-Problem
63
6.1.
Allgemeine Strukturen . . . . . . . . . . . . . . . . . . . . . . . . . .
63
6.2.
Eindimensionale Strukturen . . . . . . . . . . . . . . . . . . . . . . .
71
7. Numerische Lösung des konvexen VER-Problems
7.1.
Grundlegendes
7.2.
Beispielprobleme
76
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
76
. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
83
8. Fazit
90
A. Anhang
92
Literatur
99
1. Einleitung
1. Einleitung
Bei der Entwicklung eines komplexen Produkts, welches sich aus mehreren Komponenten zusammensetzt, müssen oftmals mehrere Anforderungen erfüllt werden. Ob
eine Anforderung erfüllt ist, hängt dabei von der Zusammenstellung der einzelnen
Komponenten ab. Diese Komponenten werden von verschiedenen Produktionsbereichen bereitgestellt. Anstatt nun ein optimales Design mit spezischen Komponenten
vorzugeben, ist es der Anspruch, jedem Produktionsbereich maximale Variabilität in
der Realisierbarkeit ihrer Komponenten zu gewährleisten. Dies kann als anschauliches
mathematisches Problem formuliert werden: Gesucht ist ein kartesisches Produkt mit
maximalem Volumen, d.h. eine spezielle Menge zulässiger Designs, sodass jedes dieser Designs alle Anforderungen erfüllt. Mit anderen Worten, eine volumenmaximale
einbeschriebene Rechtecksmenge.
Diese Problemstellung wurde unter der Voraussetzung, dass sich das kartesische Produkt, also die Rechtecksmenge, aus Intervallen zusammensetzt, bereits in [9] und
[24] untersucht und Algorithmen zur numerischen Lösung vorgeschlagen. Der in [24]
vorgestellte Algorithmus basiert darauf, eine Lösung durch zufällige Betrachtung zulässiger und nicht zulässiger Designs zu nden und der in [9] vorgestellte auf der
Voraussetzung, dass den Anforderungen lineare Funktionen zugrunde liegen.
In dieser Arbeit werden Rechtecksmengen verwendet, bei denen die Dimensionen
der Mengen, aus welchen sie sich zusammensetzen, beliebig sind. Zudem sind auch
Anforderungen erlaubt, welche durch sogenannte additiv zerlegbare Funktionen beschrieben werden können. Auf der einen Seite steigt dadurch die Komplexität des
mathematischen Problems. Auf der anderen Seite kann die Anwendbarkeit, vor allem gegenüber [9], erheblich erweitert werden. Die Auockerung der Struktur des
kartesischen Produkts ermöglicht nämlich einzelnen Produktionsbereichen, welche
mehrere Komponenten gleichzeitig betrachten, weitere Möglichkeiten ihre einzelnen
Komponenten zu kombinieren. Auÿerdem wird durch die additiv zerlegbaren Funktionen, im Vergleich zu den linearen, eine gröÿere Funktionenklasse zur Beschreibung
der Anforderungen zugelassen.
Da für dieses Vorhaben noch keine Literatur vorhanden ist, ist es das Ziel der Arbeit, zunächst eine saubere mathematische Formulierung des Problems zu schaen,
um dieses anschlieÿend untersuchen und lösen zu können. Dazu sind Grundlagen
der Topologie und Maÿtheorie notwendig, auf deren relevantesten Inhalte hierfür im
Folgenden eingegangen wird. Insbesondere kann gezeigt werden, dass unter etwas
stärkeren Voraussetzungen ein konvexes Optimierungsproblem vorliegt, weshalb der
3
1. Einleitung
Fokus der Arbeit stark auf die konvexe Theorie gerichtet ist. Für diesen Fall wird
dann genau beschrieben, wie das mathematische Problem numerisch gelöst werden
kann. Die Aussagen können dabei nahezu direkt auf das allgemein untersuchte Problem übertragen werden.
Kapitel 1 stellt die Einleitung dar und gibt einen Überblick über die verwendeten
Notationen.
Kapitel 2
stellt Elemente der Topologie vor, welche für den weiteren Verlauf der
Arbeit von Bedeutung sind und legt die dafür verwendeten Notationen fest.
Kapitel 3
behandelt die ebenfalls für die Arbeit entscheidende, maÿtheoretische
Grundlagen. Insbesondere werden messbare Mengen eingeführt, denen dann über
das Lebesgue-Maÿ ein Volumen zugeordnet werden kann.
Kapitel 4 betrachtet zunächst konvexe Mengen und Funktionen und anschlieÿend
Optimierungsprobleme, denen konvexe Funktionen zugrunde liegen.
Kapitel 5
führt das volumenmaximale-einbeschriebene-Rechtecksmengen-Problem
ein und untersucht wichtige Eigenschaften des Problems.
Kapitel 6 betrachtet das VER-Problem für Anforderungen, welche durch konvexe
Funktionen beschrieben werden und zeigt, dass dies ein konvexes Optimierungsproblem darstellt. Auÿerdem wird eine alternative Formulierung für einen Spezialfall
des VER-Problems hergeleitet.
Kapitel 7 stellt vor, wie das konvexe VER-Problem mit einer ein- oder zweidimensionaler Struktur numerisch mit der Software Matlab
R
Kapitel 8 stellt das Fazit dar und gibt einen Ausblick.
4
gelöst werden kann.
1. Einleitung
Notationen
d
dx f (x)
Ableitung
∀
für alle
⇔
Äquivalenz
|·|
Betrag bzw. Betrag bei Multiindexnotation
Beweisende
B(X d )
Borel-σ -Algebra
∩
Durchschnitt
∈
Element von
∈
/
nicht Element von
∃
es existiert
(ai )i∈N
Folge
lim
i→∞
Grenzwert
⇒
Implikation
inf
R
Inmum
[a, b]
abgeschlossenes Intervall
(a, b]
halboenes Intervall
(a, b)
oenes Intervall
×
kartesisches Produkt
\
Komplement
Ac
Komplement von
◦
Komposition
B(x0 , r)
oene Kugel
o, O
Landausymbole
L(γ)
Länge von
λd
Lebesgue-Maÿ
∅
leere Menge
lim inf
limes inferior
lim sup
limes superior
log
Logarithmus zur Basis
∇
Nabla (Gradient)
k·k
Norm
P(A)
Potenzmenge von
Integral
A
γ
e
A
5
1. Einleitung
d
Q
Produkt bzw. mehrfaches kartesisches Produkt
i=1
n
N
µk (A)
Produktmaÿ
k=1
n
N
B(X k )
Produkt-σ -Algebra
k=1
∂Ω
Rand von
h·, ·i
Skalarprodukt
σ(E)
d
P
von
E
Ω
erzeugte
σ-
Algebra
Summe
i=1
sup
Supremum
⊂
Teilmenge von
(
echte Teilmenge von
aT
transponiertes Tupel zu
f −1 (V
)
Urbild von
a
V
∪
∪˙
Vereinigung
Q
rationale Zahlen
R
reelle Zahlen
disjunkte Vereinigung
6
2. Topologische Grundlagen
2. Topologische Grundlagen
In diesem Kapitel werden Elemente der Topologie vorgestellt, welche für den weiteren Verlauf der Arbeit von Bedeutung sind und die dafür verwendeten Notationen
festgelegt.
2.1. Euklidische Räume
Im Folgenden sei
X
eine nichtleere Menge, die mit entsprechenden Verknüpfungen
einen Vektorraum über
R darstellt, siehe [7] für eine Denition. Der Vektorraum wird
der Einfachheit halber ebenfalls mit
Denition 2.1.
X
bezeichnet.
Eine Abbildung
h·, ·i : X × X → R
wird
(i)
(ii)
(iii)
Skalarprodukt auf X genannt, falls gilt
∀x, y, z ∈ X ∀α, β ∈ R : hαx + βy, zi = αhx, zi + βhy, zi,
∀x, y ∈ X : hx, yi = hy, xi,
∀x ∈ X : hx, xi ≥ 0
Das Paar
(X, h·, ·i)
Beispiel 2.2.
und
heiÿt dann
(hx, xi = 0 ⇒ x = 0).
euklidischer Raum.
Der Standardvertreter für einen euklidischen Vektorraum ist
mit Standard-Skalarprodukt. Dabei ist
dessen Elemente
x∈
Rd geordnete
Rd
ein Vektorraum über
d-Tupel
X = Rd
R mit festem d ∈ N,
sind, die auch Vektoren genannt werden.
x = (x1 , . . . , xd ) mit
d
R an manchen Stellen auch als
Diese werden im Folgenden in der Regel als Zeilenvektor, d.h.
xi ∈ R
für
i = 1, . . . , d
notiert. Dennoch wird
x∈
Spaltenvektor aufgefasst, insbesondere bei der Beschreibung von linearen Funktionen. Das Standard-Skalarprodukt im
Rd
hx, yiRd
ist gegeben über
:=
d
X
xi yi
(2.1)
i=1
für
x, y ∈ Rd .
d
Nachfolgend steht der Begri R stets für den euklidischen Raum
(Rd , h·, ·iRd ).
Neben dem Skalarprodukt können auf Vektorräumen auch Normen betrachtet werden.
7
2. Topologische Grundlagen
Normierte Räume
Denition 2.3.
Eine Abbildung
k · k : X → [0, ∞)
wird
(i)
Norm auf X genannt, falls gilt
∀x ∈ X : kxk = 0 ⇔ x = 0,
(ii)
∀α ∈ R, x ∈ X : kαxk = |α|kxk,
(iii)
∀x, y ∈ X : kx + yk ≤ kxk + kyk.
Das Paar
Sei
(X, k · k)
(X, h·, ·i)
heiÿt
normierter Raum.
ein euklidischer Raum, dann ist die Abbildung
k · k : X → [0, ∞), x 7→ kxk :=
eine Norm auf
X,
p
hx, xi
vgl. [7]. Somit ist jeder euklidische Raum auch ein normierter
d
Raum. Im R ist die euklidische Norm oder
2-Norm
eines Vektors
x ∈ Rd
deniert
als
kxk2
v
u d
uX
:= t
|xi |2 ,
i=1
was gerade der induzierten Norm durch das Standard-Skalarprodukt entspricht.
Ein weiteres Beispiel für eine Norm im
Rd
kxk∞ :=
für
ist die
∞-Norm,
die deniert ist als
max |xi |
i=1,...,d
x ∈ Rd .
Nun werden wichtige Eigenschaften von Mengen in normierten Räumen eingeführt.
Denition 2.4.
(i) Eine
Seien
(X, k · k)
ein normierter Raum,
x0 ∈ X
und
oene Kugel um x0 mit Radius r ist deniert als
B(x0 , r) := {x ∈ X | kx − x0 k < r}.
8
r ∈ (0, ∞).
2. Topologische Grundlagen
(ii) Eine Teilmenge
U ⊂X
heiÿt
oen, falls
∀x ∈ U ∃r ∈ (0, ∞) : B(x, r) ⊂ U.
(iii) Eine Teilmenge
U ⊂X
heiÿt
abgeschlossen, falls U c oen ist.
Es gilt, dass in normierten Räumen die beliebige Vereinigung oener Mengen oen
ist, ebenso wie der Durchschnitt endlich vieler oener Mengen. Die Beweise hierzu
nden sich beispielsweise in [22].
Da
Q
dicht in
R
ist, ist auÿerdem nachweisbar, dass jede oene Menge in
R
als
Vereinigung oener Intervalle darstellbar ist, was ebenfalls in [22] begründet ist.
Diese Eigenschaft lässt sich sofort auf oene Mengen im
Rd
erweitern. Hierbei sei
d
bemerkt, dass die Eigenschaft, ob eine Menge im R oen ist oder nicht, nicht von
der gewählten Norm abhängt, weil alle Normen auf dem
Rd
äquivalent sind.
Weitere bedeutsame Mengen in normierten Räumen sind zum Beispiel
kompakte
Mengen, siehe [7] für eine allgemeine Denition. Im Rd ist eine Menge genau dann
kompakt, wenn sie abgeschlossen und beschränkt ist.
Bemerkung 2.5.
Generell lassen sich noch allgemeinere Räume als normierte Räu-
me betrachten, wie zum Beispiel metrische oder topologische Räume, siehe [7] für
weitere Informationen. Viele der hier für normierte Räume eingeführten Denitionen
und Eigenschaften lassen sich direkt auf die soeben genannten Räume übertragen
bzw. verallgemeinern.
Jeder normierte Raum
(X, k · k)
ist mit der Abbildung
d : X × X → [0, ∞), (x, y) 7→ d(x, y) := kx − yk
ein metrischer Raum. Ferner bildet das Mengensystem der oenen Mengen
T
:= {U ⊂ X | U
ist oen in
X}
eine Topologie auf dem normierten Raum. Im euklidischen Raum wird die so denierte Topologie
euklidische Topologie genannt.
Stetige und halbstetige Funktionen
Für Abbildungen zwischen normierten Räumen ist die Stetigkeit, welche beispielsweise in [13] deniert ist, eine bedeutsame Eigenschaft. Zum Nachweis der Stetigkeit
einer Abbildung lässt sich oftmals folgende Äquivalenz verwenden.
9
2. Topologische Grundlagen
Satz 2.6.
Seien
(X, k · k)
(Y, k · k0 )
und
normierte Räume und
f : X → Y
eine
Abbildung. Dann sind die folgenden Aussagen äquivalent:
f
(i)
ist stetig.
f −1 (V ) ⊂ X
(ii)
∀V ⊂ Y , V
oen:
(iii)
∀V ⊂ Y , V
abgeschlossen:
oen.
f −1 (V ) ⊂ X
abgeschlossen.
Beweis. Siehe [13].
Stetige Funktionen haben zum Beispiel die Eigenschaft, dass die Komposition stetiger
Funktionen stetig ist. Für
Y = R sind konstante Funktionen sowie endliche Summen
bzw. Produkte stetiger Funktionen stetig. Auÿerdem nimmt jede stetige Funktion auf
einer kompakten Menge ihr Maximum bzw. Minimum an. Für
f := (f1 , . . . , fm ) : X →
j = 1, . . . , m,
p:
Rm genau dann stetig, wenn jede Komponente
fj : X → R,
Bekannte Vertreter stetiger Funktionen sind beispielsweise Polynome
→ R, d ∈ N.
Um diese denieren zu können, wird zunächst die Multiindex-
Schreibweise eingeführt. Ein Multiindex ist ein Element
weise
ist
stetig ist, vgl. [14].
Beispiel 2.7.
Rd
Y = Rm , m ∈ N,
α = (α1 , . . . , αd ).
Für
x∈
Rd und
x
α
α∈
mit Tupelschreib-
Nd0 sind deniert
n
Y
:=
α ∈ Nd0
xαi i ,
i=1
n
X
|α| :=
αi ,
i=1
wobei
α ∈
00 := 1
Nd0 mit
aα 6= 0
Konvention ist. Für jedes
|α| ≤ r.
r ∈ N0
gibt es endlich viele Multiindizes
Ist zu jedem Multiindex auÿerdem ein
für mindestens ein
α∈
aα ∈ R
gegeben mit
Nd0 , so wird die Abbildung
p : Rd → R, x 7→ p(x) =
X
aα xα
|α|≤r
Polynom vom Grad r genannt.
Jedes Polynom ist als Summe von Produkten stetiger Funktionen stetig. Dem liegt
zugrunde, dass Koordinatenprojektionen stetig sind, worauf in Kapitel 2.2 nochmals
genauer eingegangen wird.
10
2. Topologische Grundlagen
Eine schwächere Eigenschaft von Funktionen als die Stetigkeit ist die Halbstetigkeit.
Denition 2.8.
Seien
(X, k · k)
ein normierter Raum und
f : X → [−∞, ∞]
eine
Funktion. Diese heiÿt
(i) nach
unten halbstetig, wenn für jedes α ∈ R die Menge {x ∈ X | f (x) ≤ α}
abgeschlossen bzw. die Menge
(ii) nach
{x ∈ X | f (x) > α}
oben halbstetig, wenn für jedes α ∈ R die Menge {x ∈ X
abgeschlossen bzw. die Menge
{x ∈ X | f (x) < α}
Es ist sofort ersichtlich, dass eine Funktion
−f
oen ist und
f
| f (x) ≥ α}
oen ist.
genau dann unten halbstetig ist, wenn
nach oben halbstetig ist. Auÿerdem gilt, dass Funktionen
f : X → R genau dann
stetig sind, wenn sie sowohl nach unten als auch nach oben halbstetig sind. Auf einer
kompakten Menge nimmt jede nach unten halbstetige Funktion ihr Minimum und
jede nach oben halbstetige Funktion ihr Maximum an. Diese Aussagen sind alle in
[1] begründet bzw. bewiesen.
Zusätzlich wird dort gezeigt, dass die untere Halbstetigkeit äquivalent ist zur Gültigkeit von
lim inf f (y) ≥ f (x)
y→x
mit
lim inf f (y) := lim
y→x
inf
δ&0
f (y)
für alle
y∈B(x,δ)
x ∈ X.
Entsprechend ist die obere
Halbstetigkeit äquivalent zu
lim sup f (y) ≤ f (x)
y→x
mit
lim sup f (y) := lim
y→x
δ&0
sup
f (y)
für alle
x ∈ X.
y∈B(x,δ)
Beispiel 2.9. Sei (X, k · k) ein normierter Raum. Die charakteristische Funktion
von A ⊂ X ist deniert über
(
χA : X → R, x 7→ χA (x) :=
Diese ist nach unten halbstetig, falls
A
1, x ∈ A,
0, x ∈
/ A.
oen ist und nach oben halbstetig, falls
abgeschlossen ist.
11
A
2. Topologische Grundlagen
Eine weitere Eigenschaft von Funktionen, welche später ebenfalls aufgegrien wird,
ist die Monotonie. Diese wird nun für eine Funktion
Denition 2.10.
Seien
D ⊂ Rd
und
f : D → R mit D ⊂ Rd
f : D → R
deniert.
eine Funktion. Dann heiÿt
f
monoton wachsend, wenn für alle x, y ∈ D mit x ≤ y gerade f (x) ≤ f (y) gilt.
Entsprechend heiÿt f monoton fallend, wenn für alle x, y ∈ D mit x ≤ y gerade
f (x) ≥ f (y)
gilt. Das Ungleichungssystem
x≤y
ist dabei stets komponentenweise zu
verstehen.
2.2. Produkträume
Nun werden kartesische Produkte von Mengen betrachtet.
Kartesische Produkte
Denition 2.11. Das kartesische Produkt A×B der Mengen A und B ist deniert
als die Menge aller geordneten Paare
für deren zweite Komponente
b∈B
(a, b),
für deren erste Komponente
a∈A
und
gilt, d.h.
A × B := {(a, b) | a ∈ A, b ∈ B}.
Das kartesische Produkt besitzt unter anderem die nachfolgend aufgeführten Eigenschaften.
Satz 2.12.
Seien
A, B , C
und
D
Mengen. Für das kartesische Produkt gelten die
Eigenschaften
(i)
(ii)
A × (B ∩ C) = (A × B) ∩ (A × C)
A×B =∅ ⇔ A=∅
oder
bzw.
A × (B ∪ C) = (A × B) ∪ (A × C),
B = ∅,
(iii)
A×B ⊂C ×D ⇔ A⊂C
(iv)
(A × B)c = (Ac × B c ) ∪ (Ac × B) ∪ (A × B c ),
(v)
und
B ⊂ D,
(A ∩ B) × (C ∩ D) = (A × C) ∩ (B × D).
Beweis. Siehe Anhang A.
12
2. Topologische Grundlagen
Bemerkung 2.13.
Das kartesische Produkt ist im Allgemeinen weder kommutativ
noch assoziativ. Für paarweise disjunkte Mengen
A := {a}, B := {b}
und
C := {c}
gilt beispielsweise nämlich
A × B = {a} × {b} = {(a, b)}
6= {(b, a)} = {b} × {a} = B × A,
(A × B) × C = ({a} × {b}) × {b} = {((a, b), c)}
6= {(a, (b, c))} = {a} × ({b} × {c}) = A × (B × C) .
Obwohl das kartesische Produkt generell nicht kommutativ ist, ähneln sich die Mengen
A×B und B×A insofern, dass je ein Element der einen Menge bis auf Umordnung
einem Element der andern entspricht. Die Zuordnung dieser Elemente deniert eine
Bijektion, weshalb
A×B
mit
B × A identiziert werden kann. Analog existiert solch
eine kanonische Bijektion für die Mengen
(A × B) × C
und
A × (B × C).
Bevor auf
eine solche Identizierung genauer eingegangen wird, wird zunächst das kartesische
Produkt auf endlich viele Mengen erweitert.
Denition 2.14.
gen
Das
mehrfache kartesische Produkt A1 × . . . × Ad der Men-
A1 , . . . , Ad , d ∈ N
(a1 , . . . , ad ),
wobei
fest, ist deniert als die Menge aller geordneter
ai ∈ Ai
für
i = 1, . . . , d.
d-Tupel
Also gilt
A1 × . . . × Ad := {(a1 , . . . , ad ) | ai ∈ Ai , i = 1, . . . , d}.
Mithilfe des Produktzeichens kann das mehrfache kartesische Produkt durch
d
Y
Ai := A1 × . . . × Ad .
i=1
notiert werden. Dies ist nicht zu verwechseln mit dem Produkt von Skalaren, für
welches das Produktzeichen Q
in dieser Arbeit ebenfalls verwendet wird.
Die Eigenschaften des kartesischen Produkts zweier Mengen lassen sich direkt auf
das mehrfache kartesische Produkt übertragen.
Allgemeines zu Produkträumen
In der folgenden Denition werden nun normierte Räume betrachtet, die auf dem
mehrfachen kartesischen Produkt der Grundmengen von normierten Räumen beru-
13
2. Topologische Grundlagen
hen. Dabei sei bemerkt, dass der verwendete, hochgestellte Index nicht mit einem
Exponenten zu verwechseln ist.
Denition 2.15.
Seien
n
Q
n∈N
(X k , k · kX k ), k = 1, . . . , n,
und
normierte Räume.
X k das n-fache kartesische Produkt der Grundmengen X k ,
k=1
welches mit komponentenweiser Addition und Skalarmultiplikation einen Vektorraum
Ferner sei
über
R
xk
Xk,
∈
X :=
darstellt. Dieser Vektorraum
X
beinhaltet alle
n-Tupel x = (x1 , . . . , xn )
mit
k = 1, . . . , n.
(i) Wird
X
mit der Norm versehen, die für alle
n
X
kxk :=
x∈X
deniert ist über
kxk kX k ,
(2.2)
k=1
so heiÿt der normierte Raum
(X, k · k)
Produktraum der Räume (X k , k · kX
k
),
k = 1, . . . , n.
Für den Fall, dass
Skalarprodukt
(X k , k · kX k ), k = 1, . . . , n,
h·, ·iX k
sind, ist auf
hx, yiX
X
sogar euklidische Räume mit
über
:=
n
X
hx, yiX k
(2.3)
k=1
für alle
x, y ∈ X
ein Skalarprodukt deniert. Es sei bemerkt, dass hierbei die
von dem Skalarprodukt (2.3) induzierte Norm in der Regel nicht mehr mit der
Norm (2.2) des Produktraums
(ii) Die
(X, k · k)
übereinstimmt.
kanonische Projektion, welche von X auf X k abbildet, ist deniert durch
π k : X → X k , x 7→ xk ,
für
(iii) Die
k ∈ {1, . . . , n}.
kanonische Einbettung von X k nach X ist deniert durch
ιk : X k → X, xk 7→ (x̃1 , . . . , x̃k−1 , xk , x̃k+1 , . . . , x̃n )
für
k ∈ {1, . . . , n}
und feste
x̃k̃ ∈ X k̃
mit
k̃ = 1, . . . , n, k̃ 6= k .
Dass das in (2.3) denierte Skalarprodukt bzw. die in (2.2) denierte Norm auch
tatsächlich ein Skalarprodukt bzw. eine Norm auf
14
X
darstellen, lässt sich unter Ver-
2. Topologische Grundlagen
wendung der entsprechenden Denitionen direkt nachrechnen. Gleiches gilt für den
X.
Nachweis der Vektorraumeigenschaften von
Bemerkung 2.16.
π −1 (U k )
für jedes
X1
=
X k−1
× ... ×
x∈X
U k ∈ Xk
Falls
k
mit x
∈
×
Uk
für
×
k ∈ {1, . . . , n}
X k+1
× ... ×
oen ist, so ist das Urbild
X n ebenfalls oen in
U k existiert eine oene Kugel in
X k um
X.
r, die vollständig in U k enthalten ist. Daher ist auch die oene Kugel in
r
mit Radius
X
−1 (U k ) enthalten. Dies sagt auÿerdem aus, dass
vollständig in π
k ∈ {1, . . . , n}
Denn
xk mit Radius
um
x
π k für
stetig ist. In der Literatur ist es gängig den umgekehrten Weg zu
gehen und die Stetigkeit der kanonischen Projektion zu fordern, um so beispielsweise
eine Topologie auf einem Produkt von topologischen Räumen zu erhalten.
Ebenso ist das Urbild
U ∈X
(ιk )−1 (U ) = {xk ∈ X k | (x1 , . . . , xn ) ∈ U } einer oenen Menge
k ∈ {1, . . . , n}
für
und feste
xk̃ ∈ X k̃
mit
k̃ = 1, . . . , n
und
k̃ 6= k
oen, was
k
die Stetigkeit von ι , impliziert.
(X, k · k)
Auf dem Produktraum
haben Abbildungen, die sich aus Funktionen zu-
sammensetzen, welche jeweils auf einer der Mengen
Xk
deniert sind, spezielle Ei-
genschaften.
Denition 2.17.
n ∈ N
Seien
mit Produktraum
(X, k · k).
k
Funktionen f
k)
(f1k , . . . , fm
=
und
(X k , k · kk ), k = 1, . . . , n,
Eine Funktion
:
Xk
→
Rm ,
f (x) =
normierte Räume
f = (f1 , . . . , fm ) : X → Rm ,
k = 1, . . . , n,
n
X
für welche
existieren mit
f k (xk )
k=1
für alle
x ∈ X,
wird
additiv zerlegbar genannt.
Diese Form der Zerlegung ist bis auf konstante Terme eindeutig.
Satz 2.18.
Eine additiv zerlegbare Funktion
k
wenn die Funktionen f
:
Xk
→
Rm für
Beweis. Da eine Funktion, die nach
ihrer
m
k = 1, . . . , n
ist genau dann stetig,
stetig sind.
abbildet, genau dann stetig ist, wenn jede
Komponenten stetig ist, genügt es die Äquivalenz für die
zu zeigen,
j -te
Komponente
j ∈ {1, . . . , m}.
⇐: Seien
n
P
Rm
f : X → Rm
fjk : X k → R, k = 1, . . . , n,
(fjk ◦ π k )(x)
und
fj
stetig, so gilt für alle
x∈X
bereits
fj (x) =
ist als Komposition und Summe stetiger Funktionen stetig.
k=1
15
2. Topologische Grundlagen
⇒: Sei
fj
stetig. Für feste
x̃k̃ ∈ X k̃
mit
k̃ = 1, . . . , n, k̃ 6= k ,
fjk (xk ) = (fj ◦ ιk )(xk ) −
n
X
gilt
fjk̃ (x̃k̃ )
k̃=1
k̃6=k
für alle
xk ∈ X k .
Da konstante Funktionen
fj
und
ιk
stetig sind und Kompositionen
sowie Summen stetiger Funktionen stetig bleiben, ist auch
fjk , k = 1, . . . , n,
stetig.
Im weiteren Verlauf der Arbeit werden weitere Eigenschaften von additiv zerlegbaren Funktionen eingeführt. Zunächst soll jedoch der
Rd
als Produktraum genauer
untersucht und darin enthaltene Teilmengen betrachtet werden.
Der Produktraum Rd
Beispiel 2.19.
(i) Das
Sei
d-fache
d∈N
fest.
kartesische Produkt der reellen Zahlen ergibt die Menge
d
Y
R = {(x1 , . . . , xd ) | x1 , . . . , xd ∈ R}.
i=1
Da die Elemente von
d
Q
R
und
Rd
identisch sind, gilt
i=1
d
Q
R = Rd .
Als euklidi-
i=1
sche Räume betrachtet stimmen das in (2.1) denierte Standard-Skalarprodukt
auf dem
(ii) Das
Rd
d-fache
i = 1, . . . , d
d
Y
und das in (2.3) denierte Skalarprodukt überein.
kartesische Produkt der Intervalle
[ai , bi ] ⊂ R
mit
ai < b i
für
ergibt die Menge
[ai , bi ] = {(x1 , . . . , xd ) ∈ Rd | ai ≤ xi ≤ bi
für
i = 1, . . . , d} ⊂ Rd .
i=1
Diese wird aufgrund ihrer geometrischen Darstellung auch als
d-dimensionales
Rechteck bzw. Hyperrechteck bezeichnet.
Aufgrund der Nicht-Assoziativität von mehrfachen kartesischen Produkten ist gene-
16
2. Topologische Grundlagen
rell
1
n
Rd × . . . × Rd
. . × R})
= (R
. . × R}) × . . . × (R
| × .{z
| × .{z
dn -mal
d1 -mal
6= |R × .{z
. . × R} = Rd
d-mal
für festes
n∈N
und feste
dk ∈ N, k = 1, . . . , n,
mit
d :=
n
P
dk .
Allerdings existiert
k=1
n
Rd
1
Rd × . . . ×
→ Rd , (x1 , . . . , xn ) 7→
k
P
k
xk = (xk1 , . . . , xkdk ) = xik−1 +1 , . . . , xik ∈ Rd und ik :=
dk̃ für
wie oben erwähnt eine kanonische Bijektion
(x1 , . . . , xd )
mit
k̃=1
k = 1, . . . , n,
welche die Mengen
Rd1 × . . . × Rdn
und
Rd
miteinander identiziert.
Da auÿerdem
n
n
X
X
hxk , y k iRdk =
k
i
X
gilt, sind die euklidischen Vektorräume
d1
1
n-Tupel aus Rd ×. . .×Rd
R ×...×R
dn
= Rd
n
d
X
1
n
Rd ×. . .×Rd
mit einem
xi yi = hx, yiRd
i=1
k=1 ı̃ = ik−1 +1
k=1
ein
xı̃ yı̃ =
und
Rd isomorph. Deshalb kann
d-Tupel aus Rd
gleichgesetzt werden, sowie
in der Betrachtung als euklidische Räume. Diese Identikation
wird im Folgenden für die gesamte Arbeit vorausgesetzt. Insgesamt gilt dann
x =
Entsprechend ist
n
Q
x1 , . . . , x n
Ak ⊆ Rd
= (x1 , . . . , xd ) ∈ Rd .
für Mengen
k
Ak ⊆ R d
,
(2.4)
k = 1, . . . , n.
k=1
Insbesondere als Teilmengen des
Rd
mit
d≤3
lassen sich die Elemente von mehrfa-
chen kartesischen Produkten geometrisch als Punktmenge darstellen. Dazu werden
die Komponenten des
d-Tupels (x1 , . . . , xd )
im kartesischen Koordinatensystem als
Koordinaten eines Punktes aufgefasst.
Beispielsweise lassen sich alle Paare der Menge
A = [1, 3] × [1, 2] ⊂ R2
als Punkte
innerhalb eines Rechtecks visualisieren, wie in Abbildung 2.1 zu erkennen ist. Ebenso
können alle Tripel der Menge
B = {(x1 , x2 ) ∈ R2 | (x1 )2 + (x2 )2 ≤ 1} × [−1, 1] ⊂ R3
als Punkte innerhalb eines Zylinders gedeutet werden, siehe Abbildung 2.2.
17
2. Topologische Grundlagen
Abbildung 2.1: Darstellung der Menge
Abbildung 2.2: Darstellung der Menge
18
B
A
(schwarz umrandet)
(transparent schwarz umrandet)
3. Maÿtheoretischer Volumenbegri
3. Maÿtheoretischer Volumenbegri
Rd
Um das Volumen von Teilmengen des
zu bestimmen, wird oftmals das Lebesgue-
Maÿ verwendet. Zunächst werden dazu messbare Mengen und Funktionen eingeführt
und anschlieÿend der Begri eines Maÿes.
3.1. Borel-Mengen
In diesem Kapitel sei
Vektorraum über
R
X
stets eine nichtleere Menge, die nicht notwendigerweise ein
darstellt.
Allgemeines zu σ-Algebren
Denition 3.1.
(i)
(ii)
(iii)
Sei
A ⊂ P(X).
Dann heiÿt
A
eine
σ -Algebra
über X , falls gilt
∅ ∈ A,
A ∈ A ⇒ Ac := {x ∈ X : x ∈
/ A} ∈ A,
S
Aj ∈ A, j ∈ N ⇒
Aj ∈ A.
j∈N
In diesem Fall wird das Paar
heiÿen
(X, A)
Messraum genannt und die Mengen
A ∈ A
A-messbar.
Aus der Denition einer
σ -Algebra A
\
Aj =
j∈N
kann direkt gefolgert werden, dass auch
X = (∅)c ∈ A,
!c
[
(Aj )c
∈ A,
j∈N
A1 \A2 = A1 ∩ Ac2 ∈ A
für
Aj ∈ A, j ∈ N
gilt.
Für eine abzählbare Menge
X
wird eine
σ -Algebra
oftmals als Potenzmenge von
X
gewählt. Für eine überabzählbare Menge führt dies zu Schwierigkeiten bei der Einführung eines Maÿbegris, weshalb
σ -Algebren
in der Regel durch Erzeugendensysteme
konstruiert werden.
Denition 3.2. Seien E ⊂ P(X) ein Mengensystem und σ(E) die kleinste σ-Algebra,
die
E
umfasst, d.h. für jede
σ -Algebra A über X
19
mit
E ⊂ A gilt auch σ(E) ⊂ A. Dann
3. Maÿtheoretischer Volumenbegri
E
wird
Erzeuger der σ-Algebra σ(E) über X
auch Erzeugendensystem oder kurz
genannt und
Satz 3.3.
σ(E)
die von
Für beliebiges
Durchschnitt aller
E
E
erzeugte
E ⊂ P(X)
umfassenden
ist die von
σ -Algebren
\
{A | A
σ(E) =
σ -Algebra.
ist
E
erzeugte
über
σ -Algebra
X,
über
σ -Algebra
gegeben als der
genauer
X
und
E ⊂ A}.
Beweis. Siehe Anhang A.
Satz 3.4. Seien E1 ein Erzeuger der σ-Algebra A1 und E2 ein Erzeuger der σ-Algebra
A2 .
Falls
E1 ⊂ A2
und
E2 ⊂ A1 ,
dann gilt
A1 = A2 .
Beweis. Siehe Anhang A.
Borel-σ-Algebren
Der Standardvertreter einer
σ -Algebra ist die Borel-σ -Algebra über dem Rd
auf wel-
cher auch das Hauptaugenmerk dieser Arbeit gelegt ist. Dabei sei bemerkt, dass
Borel-σ -Algebren generell auch für beliebige topologische Räume formuliert werden
können.
Denition 3.5.
Teilmengen von
erzeugte
Seien
(X, k · k)
ein normierter Raum und
X . Die Borel-σ -Algebra über X
σ -Algebra,
T
das System der oenen
ist die von den oenen Teilmengen
genauer
B(X) := σ(T ).
Die Elemente von
B(X)
heiÿen
Die Borel-σ -Algebra über dem
Borel-Mengen.
Rd
wird entsprechend mit
B(Rd )
bezeichnet. Zum
besseren Verständnis dieser Borel-σ -Algebra werden nun verschiedene Erzeuger vorgestellt. Dazu wird für
a, b ∈ Rd
mit
a<b
das
d-dimensionale
halboene Rechteck
über
d
n
o
Y
d
(a, b] := x ∈ R | ai < xi ≤ bi , i = 1, . . . , d =
(ai , bi ]
i=1
festgelegt.
20
(3.1)
3. Maÿtheoretischer Volumenbegri
Satz 3.6.
Die Mengensysteme
(i)
T d = {U ⊂ Rd | U
(ii)
C d = {U ⊂ Rd | U
Rd },
ist oen in
ist abgeschlossen in
(iii)
I d = {(a, b] | a, b ∈ Rd , a < b},
(iv)
d = {(a, ∞) | a ∈ Rd }
I∞
sind Erzeuger der Borel-σ -Algebra
B(Rd ),
Rd },
wobei
(a, ∞)
für
a ∈ Rd
analog zu (3.1)
erklärt ist.
Beweis. Siehe Anhang A.
Bemerkung 3.7.
Die Borel-σ -Algebra im
d
klidischen Raums, d.h. B(R )
6=
Rd
enthält nicht jede Teilmenge des eu-
P(Rd ). Allerdings enthält diese so gut wie alle
d
Teilmengen von R , die für die Anwendung benötigt werden. Daher ist es in der Regel ausreichend, ausschlieÿlich Borel-Mengen als Teilmengen des
Rd
zu betrachten.
d
Darüber hinaus kann auf P(R ) kein Maÿ deniert werden, das einem Volumenbegri
gerecht wird, vgl. [18].
Produkt-σ-Algebren
Analog zur Norm der Produkträumen aus Kapitel 2.2 kann eine Borel-σ -Algebra auch
über ein
n-faches
Produkt von Borel-σ -Algebren dargestellt werden. Dazu werden
zunächst die sogenannten Rechtecksmengen eingeführt, welche für diese Arbeit von
zentraler Bedeutung sind.
Denition 3.8.
Teilmengen
Ω
n ∈ N fest und (X k , k · kX k ), k = 1, . . . , n,
n
Q
X :=
X k der Gestalt
Seien
von
normierte Räume.
k=1
Ω=
n
Y
Ωk
mit
Ωk ∈ B(X k )
(3.2)
k=1
werden
Rechtecksmengen genannt.
Denition 3.9.
Seien
n∈N
fest und
(X k , k · kk ), k = 1, . . . , n,
Die vom System aller Rechtecksmengen erzeugte
21
normierte Räume.
σ -Algebra wird Produkt-σ -Algebra
3. Maÿtheoretischer Volumenbegri
der
B(X k ) k∈{1,...,n}
n
O
über dem Produktraum genannt und ist deniert als
(
k
B(X ) := σ
k=1
n
Y
)!
k
k
k
Ω | Ω ∈ B(X ), k = 1, . . . , n
.
k=1
Bemerkung 3.10. In der Literatur ist es üblich Produkt-σ-Algebren allgemein über
sogenannte Zylindermengen zu erzeugen. Eine Zylindermenge ist deniert als UrΩk ∈ B(X k ), k ∈ {1, . . . , n}
bild der Menge
unter der aus (2.4) bekannten Projekti-
k
onsabbildung π und besitzt die Darstellung
(π k )−1 (Ωk ) = X 1 × . . . × X k−1 × Ωk × X k+1 × . . . × X n ,
n
Q
Ωk =
k=1
n
T
n
N
(π k )−1 (Ωk ) ∈
vgl. Bemerkung 2.16. Aus dieser Darstellung folgt
B(X k ).
Mit
k=1
(π k )−1 (Ωk ) und Satz 3.4 kann nun direkt eingesehen werden, dass beide
k=1
Vorgehensweisen zur selben Produkt-σ -Algebra führen.
Im
Rd
kann die Borel-σ -Algebra
Mengensystemen erzeugte
B(Rd )
wahlweise als von den in Satz 3.6 denierten
σ -Algebra oder als Produkt-σ -Algebra, vgl. Denition 3.9,
aufgefasst werden. Dies zeigt der folgende Satz.
Satz 3.11.
Seien
n∈N
dk ∈ N
und
fest für
k = 1, . . . , n
mit
d :=
n
P
dk .
Dann gilt
k=1
n
O
k
B(Rd ) = B(Rd ).
k=1
Beweis. Siehe Anhang A.
Bemerkung 3.12.
n
Q
ecksmenge
Ωk
Aufgrund der Denition der Produkt-σ -Algebra ist jede Recht-
mit
Ωk ∈ Rd
k
nach Satz 3.11 eine Borel-Menge in
Rd .
Umge-
k=1
kehrt ist jedoch nicht jede Borel-Menge in
gende Beispiel zeigt. Seien
Ω := {x ∈
R2
d = 2
| kxk2 ≤ 1}
und
(1, 0) ∈ Ω
bedeutet aber auch, dass
und
eine Rechtecksmenge, wie das fol-
n = 2,
d.h.
d1 = d2 = 1.
ist abgeschlossen und somit gilt
nommen es existiert eine Rechtecksmenge
müsste wegen
Rd
(0, 1) ∈ Ω
(1, 1) ∈ Ω
Ω =
auch
Ω1
×
0, 1 ∈
Ω2 mit
Ω1 und
Die Menge
Ω ∈ B(Rd ).
Ω1 , Ω2
0, 1 ∈
Ange-
∈ B(R),
dann
Ω2 gelten. Dies
sein müsste, was einen Widerspruch darstellt.
22
3. Maÿtheoretischer Volumenbegri
3.2. Borel-messbare Funktionen
Für eine Abbildung
Urbild einer Menge
f :X →Y
ist das Urbild einer
−1 (S)
deniert über f
B⊂Y
:=
σ -Algebra S ⊂ P(Y )
{f −1 (B)
mit dem
| B ∈ S}.
Allgemeines zu messbaren Funktionen
Denition 3.13.
Y
heiÿt
und
(Y, S)
Messräume. Eine Funktion
f : X →
messbar, genauer A-S -messbar, falls Urbilder messbarer Mengen messbar
sind, genauer falls
Gilt
(X, A)
Seien
f −1 (S) ⊂ A.
(X, A) = (Rd , B Rd
(Y, S) = (Rm , B (Rm ),
und
so wird eine
A-S -messbare
Funktion auch Borel-messbar genannt. Da in der Regel bekannt ist, um welche
σ-
Algebren es sich handelt, werden diese im weiteren Verlauf der Arbeit nicht immer
explizit erwähnt.
Bei der Untersuchung der Messbarkeit von Funktionen reicht es aus, sich auf ein
Erzeugendensystem zu beschränken, wie der folgende Satz zeigt.
Satz 3.14.
S = σ(E).
(X, A)
Seien
Dann ist
und
f :X→Y
(Y, S)
Messräume und
E
ein Erzeuger von
S,
also
genau dann messbar, falls
f −1 (E) ⊂ A.
(3.3)
Beweis. Wegen
!
f −1
[
Bj
(
=
)
x ∈ X | f (x) ∈
j∈N
[
Bj
=
j∈N
=
[
[
{x ∈ X | f (x) ∈ Bj }
j∈N
f −1 (Bj ),
j∈N
f
für
−1
(B ) = {x ∈ X | f (x) ∈ B c } = X\{x ∈ X | f (x) ∈ B}
c
= X\f −1 (B) = f −1 (B)
B, Bj ∈ P(Y )
c
und
f −1 (Y ) = X
ist das Mengensystem
S 0 := {B ∈ P(Y ) | f −1 (B) ∈ A}
eine
σ -Algebra. Nach Denition 3.13 ist f
Dies ist äquivalent zu
E ⊂ S 0,
da
S
genau dann messbar, wenn
die kleinste
σ -Algebra
ist wiederum der Fall, falls Bedingung (3.3) erfüllt ist.
23
ist, welche
S = σ(E) ⊂ S 0 .
E
enthält. Dies
3. Maÿtheoretischer Volumenbegri
Hierbei sei bemerkt, dass der Beweis dieses Satzes den Beweis des Satzes 3.11 teilweise
verallgemeinert. Für Abbildungen
f : X → R
lässt sich aus Satz 3.14 direkt die
nachstehende Äquivalenz ableiten.
Korollar 3.15.
Seien
(X, A)
ein Messraum und
f :X →R
eine Funktion. Dann
sind die folgenden Aussagen äquivalent:
(i)
f
ist
A − B(R)-messbar.
(ii) Für alle
α∈R
gilt
{x ∈ X | f (x) > α} ∈ A.
(iii) Für alle
α∈R
gilt
{x ∈ X | f (x) ≥ α} ∈ A.
(iv) Für alle
α∈R
gilt
{x ∈ X | f (x) < α} ∈ A.
(v) Für alle
α∈R
gilt
{x ∈ X | f (x) ≤ α} ∈ A.
Beweis. Es gilt
d
system I∞
{x ∈ X | f (x) > α} = f −1 ((α, ∞)).
= {(α, ∞) | α ∈ R}
Da nach Satz 3.6 das Mengen-
ein Erzeuger der Borel-σ -Algebra
B(R)
ist, folgt mit
Satz 3.14 die Äquivalenz von (i) und (ii). Die Äquivalenz von (ii) - (v) ergibt sich
aus
{x ∈ X | f (x) ≥ α} =
\
1
{x ∈ X | f (x) > α − },
k
k∈N
{x ∈ X | f (x) < α} = {x ∈ X | f (x) ≥ α}c ,
\
1
{x ∈ X | f (x) ≤ α} =
{x ∈ X | f (x) < α + },
k
k∈N
{x ∈ X | f (x) > α} = {x ∈ X | f (x) ≤ α}c .
Mengen der Gestalt
{x ∈ X | f (x) ≤ α} werden im weiteren Verlauf der Arbeit noch
des Öfteren auftauchen.
Denition 3.16.
Sei
f :X→R
eine Funktion. Die Menge
{x ∈ X | f (x) ≤ α} = f −1 ((−∞, α])
wird
α-Subniveaumenge
von
f
genannt.
Bevor einige elementare Eigenschaften von messbaren Funktionen vorgestellt und
bewiesen werden, werden zunächst Beispiele messbarer Funktionen aufgeführt.
24
3. Maÿtheoretischer Volumenbegri
Beispiel 3.17.
(X, k · k) und (Y, k · k0 ) normierte Räume und f : X → Y
(i) Seien
eine stetige Abbildung, dann ist
f
gerade
B(X)-B(Y )-messbar. Nach Denition
der Stetigkeit, vgl. Satz 2.6, sind nämlich Urbilder oener Mengen oen und
oene Mengen sind Erzeuger von Borel-σ -Algebren. Mit Satz 3.14 folgt somit
sofort die Messbarkeit von
f.
Insbesondere sind damit die in Denition 2.15 denierten kanonischen Projektionen und Einbettungen messbar.
(X, A)
(ii) Sei
ein Messraum. Die charakteristische Funktion
Beispiel 2.9, ist messbar, falls
die Mengen
∅, A, A
A∈A
wenn
c
und
X
A ∈ A.
χA ,
deniert wie in
Dies gilt, da die Urbilder von
sein können, welche nur dann in
A
χA
nur
enthalten sind,
gilt.
Eigenschaften messbarer Funktionen
Die folgenden Eigenschaften sind bereits von den stetigen Funktionen bekannt und
lassen sich auf messbare Funktionen erweitern.
Satz 3.18.
und
Seien
g : Y1 → Y2
(X, A), (Y1 , S1 )
messbar, so ist auch
Beweis. Für beliebiges
samt gilt also
Satz 3.19.
Funktion
f
und
B ∈ S2
ist
g ◦ f : X → Y2
g −1 (B) ∈ S1
Seien
(X, A)
ein Messraum und
f : X → Y1
messbar.
und weiter
f −1 (g −1 (B)) ∈ A.
Insge-
f := (f1 , . . . , fm ) : X → Rm .
m
ist genau dann A-B(R )-messbar, wenn die Funktionen
Die
fj : X → R,
sind.
Beweis. Analog zu Abbildung (2.4) sei
j -te
Messräume und seien
(g ◦ f )−1 (B) ∈ A.
j = 1, . . . , m, A-B(R)-messbar
auf die
(Y2 , S2 )
πj : Rm → R, j ∈ {1, . . . , m},
Komponente. Wie in Beispiel 3.17 beschrieben ist
πj
die Projektion
deshalb Borel-
messbar.
⇒ Sei
f
⇐ Seien
gilt
messbar, so ist mit Satz 3.18 auch
πj ◦ f
für
j = 1, . . . , m
messbar.
fj : X → R für j = 1, . . . , m nun A-B(R)-messbar, d.h. für alle Bj ∈ B(R)
(πj ◦ f )−1 (B) ∈ A.
die Borel-σ -Algebra
Da nach Bemerkung 3.10 und Satz 3.11 die Mengen
B(Rm )
πj−1 (B)
erzeugen, folgt mit Satz 3.14 die Messbarkeit von
f.
Aus den Sätzen 3.18 und 3.19 kann hergeleitet werden, dass die Summe von messbaren Funktionen, welche nach
R
abbilden, ebenfalls messbar ist.
25
3. Maÿtheoretischer Volumenbegri
Satz 3.20.
und
(X, A)
Seien
α, β ∈ R.
Beweis. Da
f
ein Messraum,
Dann ist auch
und
g
αf + βg
f, g : X → R A-B(R)-messbare
f ·g
sowie
Funktionen
messbar.
messbar sind, ist mit Satz 3.19 auch die Abbildung
h1 : X → R2 , x 7→ (f (x), g(x))
messbar. Ferner ist die Abbildung
h2 : R2 → R, (x1 , x2 ) 7→ αx1 + βx2
stetig, vgl. Beispiel 2.7 und damit ebenfalls messbar. Daraus ergibt sich mit Satz
3.18 die Messbarkeit von
f ·g
mit
h2 :
Satz 3.21.
R2
h2 ◦ h1 = αf + βg .
→ R, (x1 , x2 ) 7→ x1 x2
Seien
n ∈ N
σ -Algebren B(X k ) für
und
Entsprechend kann die Messbarkeit von
gezeigt werden.
(X k , k · kX k )
k = 1, . . . , n
normierte Räume, die mit den Borel-
Messräume darstellen. Der Produktraum dieser
m
Falls eine Funktion f : X → R
n
P k k
nach Denition 2.17 additiv zerlegbar ist mit f (x) =
f (x ) für x ∈ X und
k=1
f k : X k → Rm , so ist f genau dann B(X)-B(Rm )-messbar, wenn die Funktionen f k
Räume ist
(X, k · k)
mit Borel-σ -Algebra
B(X k )-B(Rm )-messbar
sind,
B(X).
k = 1, . . . , n.
Beweis. Da nach Satz 3.19 eine Funktion, die nach
ist, wenn jede ihrer
j -te
m
Rm abbildet, genau dann messbar
Komponenten messbar ist, genügt es, die Äquivalenz für die
Komponente zu zeigen mit
j ∈ {1, . . . , m}.
k
k
⇐: Seien fj : X → R für k = 1, . . . , n messbar, so gilt für alle x ∈ X gerade
n
P
fj (x) =
(fjk ◦π k )(x) und fj ist als Komposition und Summe messbarer Funktionen
k=1
nach den Sätzen 3.18 und 3.20 messbar.
⇒: Sei
fj
messbar. Mit der kanonischen Einbettung, welche in Denition 2.15
eingeführt wurde und stetig und somit messbar ist, gilt für
x̃k̃ ∈ X k̃
mit
k̃ = 1, . . . , n, k̃ 6= k ,
k ∈ {1, . . . , n}
und feste
nun
(fj ◦ ιk )(xk ) = fjk (xk ) +
n
X
fjk̃ x̃k̃
k̃=1
k̃6=k
für alle
xk ∈ X k .
Somit ist das Urbild von
26
1 , b ∈ R
(b, ∞) ∈ I∞
unter
fjk
darstellbar
3. Maÿtheoretischer Volumenbegri
als
(fjk )−1 ((b, ∞)) = (fj ◦ ιk )−1 b̃, ∞ ,
wobei
b̃ = b +
n
P
fjk̃ (x̃k̃ ) ∈ R.
Aufgrund der Messbarkeit von
fj
und
ιk
ist dann
k̃=1
k̃6=k
(fjk )−1 ((b, ∞)) ∈ B(X k ) und somit auch fjk
wegen Satz 3.14 für
k = 1, . . . , n messbar.
3.3. Das Lebesgue-Maÿ
Ein Maÿ ordnet einer messbaren Menge einen nicht-negativen Wert zu, wie zum
Beispiel das Volumen der Menge.
Allgemeines zu Maÿen
Denition 3.22.
Sei
(X, A)
Maÿ auf A, wenn gilt
(i)
(ii)
ein Messraum. Eine Abbildung
µ : A → [0, ∞]
heiÿt
µ(∅) = 0,
µ
ist
σ -additiv,
d.h. für jede Folge paarweiser disjunkter Mengen
(Ai )i∈N ⊂ A
gilt
µ
[
˙
!
Ai
=
i∈N
Das Tripel
Ein Maÿ
und
µ
(X, A, µ)
auf
A
µ(Ai ).
i∈N
wird dann Maÿraum genannt.
heiÿt
µ(Ai ) < ∞, i ∈ N
In einem Maÿraum
X
σ -endlich,
falls es eine Folge
(Ai )i∈N ⊂ A
mit
S
Ai = X
i∈N
gibt.
(X, A, µ)
werden Mengen
nicht von der leeren Menge unterscheiden, also
Aussagen, die für alle Elemente von
X
A ∈ A,
welche sich bzgl. des Maÿes
µ(A) = 0
gilt, Nullmengen genannt.
bis auf die Elemente einer Nullmenge gelten,
werden fast überall gültig genannt.
Im folgenden Satz sind Eigenschaften des Maÿes aufgeführt, die sich direkt aus der
σ -Additivität
ergeben. Für die Mengen
A, A1 , A2 , . . . ∈ A
27
werden dazu die Schreib-
3. Maÿtheoretischer Volumenbegri
weisen
Ai ↑ A,
A1 ⊃ A2 ⊃ . . .
S
A1 ⊂ A2 ⊂ . . . und A =
Ai ∈ A
i∈N
T
A=
Ai ∈ A gilt, verwendet.
falls
und
gilt und
Ai ↓ A,
falls
i∈N
Satz 3.23.
Seien
(X, A, µ)
(i) Subtraktivität, d.h. für
(ii) Monotonie, d.h. für
(iii)
ein Maÿraum und
A1 ⊂ A2
A1 ⊂ A2
ist
Dann gelten
µ(A1 ) < ∞ ist µ(A2 \A1 ) = µ(A2 )−µ(A1 ),
µ(A1 ) ≤ µ(A2 ),
Ai ↑ A gilt lim µ(Ai ) = µ(A) und für Ai ↓ A mit µ(A1 ) <
σ -Stetigkeit,
d.h. für
∞
lim µ(Ai ) = µ(A).
ebenfalls
und
Ai ∈ A, i ∈ N.
i→∞
i→∞
Beweis. Siehe Anhang A.
Ein Maÿ, das einem
d-dimensionalen
Intervall
d
Q
(a, b] =
(ai , bi ] ⊂ Rd
sein Volumen
i=1
zuordnet, ist das Lebesgue-Maÿ. Der folgende Satz besagt dessen Eindeutigkeit und
Existenz als Volumenmaÿ, weshalb die nachfolgenden Betrachtungen weitestgehend
auf das Lebesgue-Maÿ beschränkt werden.
Satz und Denition 3.24.
Für festes
d∈N
existiert genau ein Maÿ
λd : B(Rd ) → [0, ∞],
sodass für jedes
d-dimensionale
Intervall
(a, b] =
d
Q
(ai , bi ] ⊂ Rd
gerade
i=1
λd ((a, b]) =
d
Y
(bi − ai )
i=1
gilt. Das Maÿ
λd
heiÿt dann das
d-dimensionale
Lebesgue-Maÿ.
Beweis. Siehe [18].
Bemerkung 3.25.
Da
d
Q
(xi − k1 , xi ] ↓ {x}
i=1
(ii) Für alle
d
Q
x ∈ Rd ist die Menge {x} eine Nullmenge.
1 d
d
nach Satz 3.23 λ ({x}) = lim
= 0.
k
(i) Für jeden Punkt
gilt, ist
k→∞
a, b ∈ Rd mit a ≤ b gilt λd ((a, b)) = λd ([a, b)) = λd ((a, b]) = λd ([a, b]) =
(bi − ai ).
i=1
28
3. Maÿtheoretischer Volumenbegri
A ⊂ Rd
(iii) Für jede abzählbare Teilmenge
gilt
µ(A) = 0.
Insbesondere ist auch
λ1 (Q) = 0.
σ -endlich
(iv) Das Lebesgue-Maÿ ist
wegen
d
S Q
Rd =
[−N, N ].
N ∈N i=1
In einem Maÿraum
(X, A, µ)
A-B(R)-messbare
kann nun für
Funktionen
f :X→R
ein Integralbegri eingeführt werden. Das detaillierte Vorgehen ndet sich beispielsweise in [7]. Die Idee dabei ist es,
f
in einen positiven und negativen Anteil zu
f = f+ − f− mit f+ (x) := max{f (x), 0} und f− (x) :=
d
R und durch eine Folge von Stufenfunktionen anzunähern.
m
P
zerlegen, d.h.
für
x∈
Für eine nicht-negative Stufenfunktion
cj χAj
s :=
mit
− min{0, f (x)}
cj ∈ [0, ∞)
und
Aj ∈ A
f (x) ≥ 0
für alle
j=1
ist das Integral bzgl.
µ
über
Z
s dµ :=
m
X
cj µ(Aj ) ∈ [0, ∞]
j=1
deniert. Zu
x ∈
A-B(R)-messbaren
punktweise gegen
f
Funktionen
f
mit
f ≥ 0,
also
Rd , gibt es eine Folge monoton wachsender Stufenfunktionen
bzgl.
µ
f
konvergiert, d.h.
lim sj (x) = f (x)
k→∞
für
x ∈ X.
(sj )j∈N ,
welche
Das Integral von
ist dann über
Z
Z
f dµ :=
lim
j→∞
sj dµ ∈ [0, ∞]
festgelegt. Insgesamt ergibt sich dann für das Integral allgemeiner messbarer Funktionen
Z
Z
f dµ :=
sofern nicht beide Integrale den Wert
Z
f+ dµ −
f− dµ,
∞ annehmen. Dies bedeutet, dass das Integral
nicht immer existieren muss. Eine andere Darstellung des Integrals ist beispielsweise
R
R
f (x) dµ(x) := f dµ. Ist zusätzlich
R
so wird
A f dµ geschrieben.
A∈A
beschränkt,
d
A f (x) dλ (x) verwend
det. Dies ist daher motiviert, dass für beschränkte Funktionen f : R → R mit komFalls
µ = λd
der Integrationsbereich auf
gilt, so wird auch die Schreibweise
R
A f (x) dx
:=
R
paktem Träger aus der Riemann-Integrierbarkeit bereits die Lebesgue-Integrierbarkeit
folgt, siehe [7].
29
3. Maÿtheoretischer Volumenbegri
Beispiel 3.26.
A ∈ A,
Die einfachste Stufenfunktion ist die charakteristische Funktion
χA ,
welche bereits in der Denition der Stufenfunktion selbst verwendet und in
(X, A, µ)
Beispiel 2.9 eingeführt wurde. Im Maÿraum
gilt für ihr Integral
Z
χA dµ = µ(A)
und für
(X, A, µ) = (Rd , B(Rd ), λd )
Z
gilt
χA (x) dx = λd (A).
Analog zu den Produkträumen und der Produkt-σ -Algebra ist es nun das Ziel, aus
den Maÿräumen
(X k , Ak , µk ), k = 1, . . . , n,
einen Produktmaÿraum zu bilden. Zu-
nächst wird dazu festgelegt, welche Eigenschaft ein Produktmaÿ erfüllen muss.
Denition 3.27.
Seien
(X k , Ak , µk )
n
O
µk :
n
O
k = 1, . . . , n
Maÿräume. Ein Maÿ
Ak → [0, ∞]
k=1
k=1
wird
für
Produktmaÿ der µk genannt, falls für alle Ak ∈ Ak , k = 1, . . . , n
n
O
k
1
n
µ (A × . . . × A ) =
0 · ∞ := 0
µk (Ak )
k=1
k=1
gilt, wobei
n
Y
verwendet wird.
Das folgende Resultat ist zunächst für zwei Maÿräume formuliert.
Satz 3.28.
eindeutiges
(X k , Ak , µk ), k = 1, 2, σ -endliche Maÿräume. Dann existiert
2
2
2
N
N
N
µk auf
Ak . Für alle A ∈
Ak gilt auÿerdem
Produktmaÿ
Seien
k=1
2
O
k=1
k=1
Z Z
k
µ (A) =
ein
1
2
1
1
1
2
2
2
χA (x , x ) dµ (x )
dµ2 (x2 )
k=1
Z Z
=
χA (x , x ) dµ (x )
dµ1 (x1 ).
Beweis. Siehe [8].
Dieser Satz kann sofort auf
n Maÿräume erweitert werden, vgl. ebenfalls [8]. Speziell
30
3. Maÿtheoretischer Volumenbegri
für das Lebesgue-Maÿ folgt daraus
n
O
λd =
k=1
für feste
dk ∈ N, k = 1, . . . , n
und
d :=
n
P
dk .
k=1
31
k
λd
(3.4)
4. Konvexe Theorie
4. Konvexe Theorie
In diesem Kapitel werden zunächst konvexe Mengen und Funktionen untersucht.
Anschlieÿend werden Optimierungsprobleme betrachtet, denen konvexe Funktionen
zugrunde liegen.
4.1. Konvexe Mengen und Funktionen
Die nachfolgenden Betrachtungen zur Konvexität sind auf den
Rd
beschränkt.
Konvexe Mengen
Denition 4.1.
Eine Menge
C ⊂ Rd
strecke zweier beliebiger Punkte in
und
θ ∈ [0, 1]
C
wird
konvex genannt, wenn die Verbindungs-
wieder in
C
liegt. D.h. also, falls für
x, y ∈ C
gerade
θx + (1 − θ)y ∈ C
gilt.
Beispiel 4.2.
Ein Beispiel für eine konvexe Menge ist die Lösungsmenge eines linea-
ren Gleichungssystems
sind
x, y ∈ C ,
d.h.
C = {x ∈ Rd | Ax = b},
Ax = b
und
Ay = b,
wobei
A ∈ Rm×d
so gilt für beliebiges
und
θ ∈ [0, 1]
b ∈ Rm .
Denn
nun
A(θx + (1 − θ)y) = θAx + (1 − θ)Ay
= θb + (1 − θ)b
= b.
Deshalb ist auch
θx + (1 − θ)y ∈ C
Auch die leere Menge
∅,
und
C
konvex.
die Menge, welche einen einzelnen Punkt
d
und der gesamte R sind Beispiele konvexer Teilmengen des
x ∈ Rd
enthält
Rd .
Der folgende Satz stellt zwei wichtige Eigenschaften von konvexen Mengen vor.
Satz 4.3.
auch
(i) Seien
m
T
C :=
Cj
Cj ⊂ Rd , j = 1, . . . , m, m ∈ N
eine konvexe Menge.
j=1
32
konvexe Mengen, dann ist
4. Konvexe Theorie
(ii) Seien
n∈N
k
C k ⊂ Rd
und
dk ∈ N
fest für
nichtleer. Die Menge
die Mengen
Ck, k =
k = 1, . . . , n
C :=
n
Q
mit
d :=
n
P
dk .
Ferner seien
k=1
C k ⊂ Rd
ist genau dann konvex, wenn
k=1
1, . . . , n, konvex sind.
Beweis. Siehe Anhang A.
Mit diesem Satz kann gefolgert werden, dass
d-dimensionale
Rechtecke im
Rd ,
be-
kannt aus Beispiel 2.19, konvex sind, da jedes Intervall in den reellen Zahlen oensichtlich konvex ist.
Konvexe Funktionen
Neben konvexen Mengen können auch konvexe Funktionen betrachtet und deren
Eigenschaften untersucht werden.
Denition 4.4.
falls für alle
(i) Sei
x, y ∈ C
C ⊂ Rd
mit
konvex. Eine Funktion
x 6= y
und für alle
f :C→R
θ ∈ (0, 1)
heiÿt
konvex,
gilt, dass
f (θx + (1 − θ)y) ≤ θf (x) + (1 − θ)f (y).
(ii) Gilt in der Ungleichung (4.1) sogar <, so wird
(iii) Falls
−f
konvex ist, so heiÿt
(iv) Analog heiÿt
f
f
θ=0
bzw.
θ=1
streng konvex genannt.
konkav.
strikt konkav, falls −f
Die Ungleichung (4.1) kann gleichermaÿen für
für
f
(4.1)
strikt konvex ist.
θ ∈ [0, 1]
formuliert werden. Da diese
jedoch stets erfüllt ist, werden die beiden Fälle in der Literatur
oftmals weggelassen. Geometrisch bedeutet die Ungleichung (4.1), dass die Verbindungsstrecke zwischen
(x, f (x)) und (y, f (y)) nie unterhalb des Graphen von f
Anknüpfend an Denition 4.4 wird eine Funktion
liegt.
f = (f1 , . . . , fm )T : C → Rm
nau dann als konvex bezeichnet, wenn jede ihrer Komponenten
ge-
fj , j = 1, . . . , m, eine
konvexe Funktion darstellt. Für derartige Funktionen kann die Ungleichung (4.1) als
Ungleichungssystem auch komponentenweise verstanden werden. Entsprechendes gilt
für strikt konvex, konkav und strikt konkav.
Die nachfolgenden Betrachtungen werden zunächst auf Funktionen, die nach
R
ab-
bilden, beschränkt. Jedoch können diese in der Regel sofort auf Funktionen mit
Wertebereich
Rm
erweitert werden.
33
4. Konvexe Theorie
Wichtige Eigenschaften von konvexen Funktionen sind, dass jede Minimalstelle global ist und dass konvexe Funktionen für oenes
C
stetig sind, vgl. [2]. Für
f
strikt
konvex ist eine globale Minimalstelle, sofern sie existiert, sogar eindeutig.
Falls konvexe Funktionen zusätzlich dierenzierbar sind, können Bedingungen erster
und zweiter Ordnung hergeleitet werden.
Bedingungen erster und zweiter Ordnung
Satz 4.5.
dass
f
Seien
C ⊂ Rd
oen und konvex und
genau dann konvex ist, wenn für alle
f :C →R
x, y ∈ C
mit
dierenzierbar. So gilt,
x 6= y
die Ungleichung
f (x) + ∇f (x)T (y − x) ≤ f (y)
(4.2)
erfüllt ist.
Beweis. Siehe Anhang A.
Ist in Satz 4.5 die Funktion
f
strikt konvex, so kann gezeigt werden, dass für Unglei-
chung (4.2) sogar < gilt.
An dieser Stelle soll kurz an die Taylor-Formel am Beispiel einer zweimal dierenzierbaren Funktion
f :C→R
mit oenem und konvexen
C ⊂ Rd
erinnert werden.
In [7] ndet sich eine allgemeine Einführung in die Thematik. Seien
mit
x + h ∈ C,
so gibt es nach dem Satz von Taylor ein
θ ∈ (0, 1),
x ∈ C , h ∈ Rd
sodass
1
f (x + h) = f (x) + ∇f (x)T h + hT ∇2 f (x + θh)h
2
(4.3)
gilt. Die ersten beiden Summanden stellen hier das Taylorpolynom von Ordnung
1
dar.
Die Ungleichung (4.2) besagt deshalb, dass die Funktionswerte, welche das Taylorpolynom erster Ordnung von
kleiner als die von
f
f
um einen beliebigen Punkt
x ∈ C
am selben Punkt sind. Aus lokalen Informationen von
dem Funktionswert und dem Gradienten an einer bestimmten Stelle
sich also globale Informationen. Insbesondere gilt
∇f (x)
annimmt, stets
f (y) ≥ f (x)
x ∈ C,
für alle
f,
d.h.
ergeben
y ∈ C,
falls
der Nullvektor ist. Dies verdeutlicht nochmals, dass jede lokale Minimalstelle
auch eine globale ist.
Satz 4.6.
So ist
f
Seien
C ⊂ Rd
oen und konvex und
f : Rd → R
2
genau dann konvex, wenn ∇ f (x) für alle
34
x∈C
zweimal dierenzierbar.
positiv semidenit ist.
4. Konvexe Theorie
Beweis. Siehe Anhang A.
Analog zum Beweis von Satz 4.6 kann darauf geschlossen werden, dass
2
vex ist, falls ∇ f (x) für alle
x∈C ⊂
jedoch nicht, wie das Beispiel
f
strikt kon-
Rd positiv denit ist. Die Rückrichtung gilt
f : R → R, x 7→ x4
zeigt.
Die Bedingungen erster und zweiter Ordnung lassen sich direkt auf konkave Funktionen übertragen. Stellvertretend dafür sei die Bedingung erwähnt, dass
genau dann konkav ist, wenn
∇2 f (x)
muss wie oben beschrieben stets
C⊂
negativ semidenit für alle
f : Rd → R
x∈C
ist. Dabei
Rd oen und konvex sein.
Neben der Denition von konvexen Funktionen ist auch die Bedingung zweiter Ordnung aus Satz 4.6 zum Nachweis der Konvexität von Funktionen hilfreich.
Beispiel 4.7.
(i) Jede lineare Funktion
f : Rd → Rm
ist konvex. Aus Beispiel 4.2
kann direkt gefolgert werden, dass für lineare Funktionen in Ungleichung (4.1)
Gleichheit gilt.
(ii) Die quadratische Funktion
f : Rd → R,
1 T
x P x + qT + r
2
f (x) =
für alle
x ∈ Rd
mit
P ∈ Rd×d , q ∈ Rd
2
semidenit ist, da ∇ f (x)
(iii) Jede Norm
k·k
auf
Rd
=P
gegeben über
r ∈ R,
und
ist konvex, falls
P
positiv
gilt.
ist konvex. Denn für
θ ∈ (0, 1)
gilt
kθx + (1 − θ)yk ≤ kθxk + k(1 − θ)yk ≤ θkxk + (1 − θ)kyk.
Weitere Eigenschaften von konvexen Funktionen
Im Folgenden werden weitere Eigenschaften von konvexen Funktionen untersucht.
Diese werden hier auf den Denitionsbereich
C = Rd
reduziert.
Satz 4.8. Die α-Subniveaumenge Cα := {x ∈ Rd | f (x) ≤ α}, bekannt aus Denition
3.16, einer konvexen Funktion
Beweis. Da
ist
Cα
f : Rd → R konvex ist, ist f
ist eine Borel-Menge und konvex.
auch stetig und damit Borel-messbar. Somit
nach Korollar 3.15 eine Borel-Menge.
Seien nun
stets
f : Rd → R
x, y ∈ Cα ,
dann gelten
f (θx + (1 − θ)y) ≤ α
f (x) ≤ α
erfüllt, woraus
konvex.
35
und
f (y) ≤ α.
Daher ist für
θx + (1 − θ)y ∈ Cα
θ ∈ (0, 1)
folgt, d.h.
Cα
ist
4. Konvexe Theorie
Umgekehrt werden Funktionen
konvex sind, als
f : Rd → R, deren α-Subniveaumengen für alle α ∈ R
quasikonvex bezeichnet. Oensichtlich ist jede konvexe Funktion
somit quasikonvex, aber nicht jede quasikonvexe Funktion ist konvex, vgl. [4].
Satz 4.9.
Seien
fj : Rd → R, j = 1, . . . , m,
(i) die Funktion
f :=
m
P
fj
konvexe Funktionen. Dann gilt
ist konvex,
j=1
(ii) das punktweise Maximum
Beweis. Für
max
j∈{1,...,m}
fj : Rd → R, j = 1, . . . , m,
fj
ist konvex.
konvex,
m
X
f (θx + (1 − θ)y) =
j=1
m
X
≤
x, y ∈ Rd
und
θ ∈ (0, 1)
gilt
fj (θx + (1 − θ)y)
(θfj (x) + (1 − θ)fj (y))
j=1
= θf (x) + (1 − θ)f (y).
und
max
j∈{1,...,m}
fj (θx + (1 − θ)y) ≤
max (θfj (x) + (1 − θ)f (y))
j∈{1,...,m}
≤ θ
max
j∈{1,...,m}
Also sind
f
Satz 4.10.
und
max
j∈{1,...,m}
Seien
n ∈ N
fj
fj (x) + (1 − θ)
und
dk ∈ N
für
k = 1, . . . , n
fest mit
d :=
Rm
f
dk .
Falls
f (x) =
genau dann konvex, wenn die
abbildet, genau dann konvex ist, wenn jede
Komponenten konvex ist, genügt es die Äquivalenz für die
zu zeigen mit
n
P
k=1
Rm nach Denition 2.17 additiv zerlegbar ist mit
Beweis. Da eine Funktion, die nach
m
fj (y).
konvex.
d
eine Funktion f : R →
n
P
k
f k (xk ) für x ∈ Rd und f k : Rd → Rm , so ist
k=1
k
Funktionen f für k = 1, . . . , n konvex sind.
ihrer
max
j∈{1,...,m}
j -te
Komponente
j ∈ {1, . . . , m}.
k
⇐: Seien fj , k = 1, . . . , n, konvex, so ist wegen Satz 4.9 mit
d
für x ∈ R auch fj konvex.
36
fjk ◦ π k (x) = fjk (xk )
4. Konvexe Theorie
⇒: Seien
ιk
für feste
fj
konvex und
x̃k̃ ∈ R
dk̃
mit
zugeordnet werden. Für
k ∈ {1, . . . , n}
beliebig. Mit der kanonischen Einbettung
k̃ = 1, . . . , n, k̃ 6= k ,
xk , y k ∈ R
dk
und
kann jedem
θ ∈ (0, 1)
k
xk ∈ Rd
ein
x ∈ Rd
ist dann
fjk (θxk + (1 − θ)y k ) = fj (θιk (xk ) + (1 − θ)ιk (y k )) −
n
X
fjk̃ (x̃k̃ )
k̃=1
k̃6=k
k
k
k
k
≤ θfj (ι (x )) + (1 − θ)fj (ι (y )) −
n
X
fjk̃ (x̃k̃ )
k̃=1
k̃6=k
= θfjk (xk ) + (1 − θ)fjk (y k ).
Bemerkung 4.11.
Für quasikonvexe Funktionen gilt der Satz 4.10 nicht. Beispiels-
weise ist für die quasikonvexen Funktionen
(−1)-Subniveaumenge
für alle
x1 , x2 ∈ R,
konvex. Also ist
f
der Funktion
wegen
f,
f k : R → R, xk 7→ (xk )3 , k = 1, 2,
deniert über
f (−1, 0) = f (0, −1) = −1
die
f (x1 , x2 ) := f 1 (x1 ) + f 2 (x2 )
und
f (−0,5, −0,5) > −1
nicht
nicht quasikonvex.
Fortsetzung konvexer Funktionen
Für
C ( Rd
ist es möglich den Denitionsbereich von konvexen Funktionen zu
erweitern.
Denition 4.12.
Sei
C ⊂ Rd
konvex. Falls
f :C →R
eine konvexe Funktion ist,
so heiÿt
(
f˜ : Rd → (−∞, ∞], x 7→
die
x ∈ C,
f (x)
falls
∞
sonst
werteerweiterte Fortsetzung von f .
Der Denitionsbereich der ursprünglichen Funktion
C= x∈
Für alle
Rd
| f˜(x) < ∞
x, y ∈ Rd
f
kann hierbei über die Menge
beschrieben werden.
und alle
θ ∈ (0, 1)
gilt für die werteerweiterte Fortsetzung einer
konvexen Funktion
f˜(θx + (1 − θ)y) ≤ θf˜(x) + (1 − θ)f˜(y).
37
(4.4)
4. Konvexe Theorie
Denn für
x∈
/C
x, y ∈ C
oder
stimmt die Ungleichung (4.4) mit Ungleichung (4.1) überein. Falls
y∈
/C
nimmt die rechte Seite von (4.4) den Wert
∞
an und die Unglei-
chung ist immer erfüllt.
In diesem Sinne kann die Denition 4.4 auf Funktionen
f˜ : Rd → (−∞, ∞]
f˜ konvex genannt, falls die Ungleichung
e := {x ∈ Rd | f˜(x) < ∞} konvex ist
dass C
erwei-
tert werden. So wird
(4.4) erfüllt ist. Dies
impliziert nämlich,
und für alle
und alle
θ ∈ (0, 1)
e
x, y ∈ C
Funktionen f˜
die Ungleichung (4.1) gilt. Insgesamt können solche
also immer als eine werteerweiterte Fortsetzung einer konvexen Funktion aufgefasst
werden. Eine wichtige Eigenschaft, welche die werteerweiterte Fortsetzung von der
ihr zugrunde liegenden konvexen Funktion übernimmt, ist die Globalität jeder Minimalstelle.
Gleichermaÿen können konkave Funktionen fortgesetzt werden, indem Variablen, die
nicht in
alle
C
liegen, der Wert
θ ∈ (0, 1)
−∞
zugeordnet wird. Hierbei ist für alle
x, y ∈ Rd
und
die Ungleichung
f˜(θx + (1 − θ)y) ≥ θf˜(x) + (1 − θ)f˜(y),
(4.5)
erfüllt.
Logarithmisch-konkave und logarithmisch-konvexe Funktionen
Für die konvexe Optimierung sind logarithmisch-konvexe bzw. logarithmisch-konkave
Funktionen oftmals hilfreich. Dazu sei bemerkt, dass während der gesamten Arbeit
unter Logarithmus stets der natürliche Logarithmus zu verstehen ist.
Denition 4.13.
Eine Funktion
f : Rd → (0, ∞)
, auch notiert über
logarithmisch-konkav genannt, falls log f konkav
logarithmisch-konvex genannt, falls log f konvex ist.
wird
ist. Entsprechend wird
Durch Anwenden der Logarithmen-Gesetze, vgl. [7], ergibt sich, dass
dann logarithmisch-konvex ist, wenn
1/f
genau
f : Rd → [0, ∞),
d.h.
erweitert werden. Im Sinne der werteerweiterten Fortsetzung sei
(
f˜ : R → [−∞, ∞), x 7→
d
Falls
f >0
f
logarithmisch konkav ist.
Die logarithmische Konkavität kann auch auf Funktionen
f ≥ 0,
f > 0,
log f (x)
falls
f (x) > 0,
−∞
falls
f (x) = 0.
f˜ die Bedingung (4.5) erfüllt, also f˜ konkav ist, so wird f
38
logarithmisch-konkav
4. Konvexe Theorie
genannt.
Die logarithmische Konkavität kann auch ohne Logarithmus ausgedrückt werden.
Satz 4.14.
Eine Funktion
wenn für alle
x, y ∈
f : Rd → [0, ∞)
Rd und für alle
ist genau dann logarithmisch-konkav,
θ ∈ (0, 1)
gerade
f (θx + (1 − θ)y) ≥ f (x)θ f (y)1−θ
(4.6)
gilt.
Beweis. Sei
f > 0.
Dann sind für
x, y ∈ Rd
und
θ ∈ (0, 1)
die Aussagen
log f (θx + (1 − θ)y) ≥ θ log f (x) + (1 − θ) log f (y),
log f (θx + (1 − θ)y) ≥ log f (x)θ + log f (y)1−θ ,
log f (θx + (1 − θ)y) ≥ log f (x)θ f (y)1−θ ,
f (θx + (1 − θ)y) ≥ f (x)θ f (y)(1−θ)
aufgrund der Logarithmen-Gesetze und der Monotonie der Logarithmusfunktion
äquivalent. O.B.d.A. gelte nun
f (x) = 0
x ∈ Rd .
für
Dann ist sowohl die Unglei-
chung (4.5) wie oben beschrieben als auch die Ungleichung (4.6) wegen
f ≥0
stets
erfüllt.
Beispiel 4.15. Die charakteristische Funktion von A ⊂ Rd ist logarithmisch-konkav,
falls
A
konvex ist. Denn für
und für
x, y ∈ A
gilt
x∈
/A
oder
θx + (1 − θ)y ∈ A,
y∈
/A
ist die Ungleichung (4.6) stets erfüllt
weshalb (4.6) ebenfalls erfüllt ist.
Nun wird auf eine wichtige Eigenschaft von logarithmisch-konvexen Funktionen eingegangen. Dazu wird die Prékopa-Leindler Ungleichung benötigt.
Satz 4.16.
Seien
f, g, h : Rd → [0, ∞)
Borel-messbare Funktionen, welche die Be-
dingung
h(θx + (1 − θ)y) ≥ f (x)θ g(y)1−θ
für alle
x, y ∈ Rd
und alle
θ ∈ (0, 1)
erfüllen. Dann gilt
h(x) dx ≥
Rd
θ Z
Z
Z
(4.7)
f (x) dx
Rd
Rd
39
1−θ
g(x) dx
.
(4.8)
4. Konvexe Theorie
Diese Ungleichung wird auch
Prékopa-Leindler Ungleichung genannt.
Beweis. Siehe [20] und [21].
Korollar 4.17. Seien A ∈ B(Rd ) konvex, f : Rd ×Rm → [0, ∞) logarithmisch-konkav
und
f (·, y)
Borel-messbar für alle
g:R
m
y ∈ Rm .
Dann ist die Funktion
Z
→ [0, ∞], y 7→ g(y) :=
f (x, y) dx
(4.9)
A
ebenfalls eine logarithmisch-konkave Funktion.
Beweis. Seien
y 0 , y 00 ∈ Rm
und
θ ∈ (0, 1).
(
d
f1 : R → [0, ∞), x 7→
(
f2 : Rd → [0, ∞), x 7→
(
f3 : Rd → [0, ∞), x 7→
Da
A
konvex ist und
f
Ferner seien
f (x, y 0 )
falls
0
sonst,
x ∈ A,
f (x, y 00 )
falls
0
sonst,
y ∈ A,
f (x, θy 0 + (1 − θ)y 00 )
falls
0
sonst.
x ∈ A,
logarithmisch-konkav, gilt
f3 (θx0 + (1 − θ)x00 ) ≥ f1 (x0 )θ f2 (x00 )1−θ
für alle
x0 , x00 ∈ Rd .
0
Mit Satz 4.16 folgt schlieÿlich
Z
00
f (x, θy 0 + (1 − θ)y 00 ) dx
g(θy + (1 − θ)y ) =
ZA
=
f3 (x) dx
Rd
θ Z
Z
≥
1−θ
f1 (x) dx
Rd
Z
=
f2 (x) dx
Rd
θ Z
0
f (x, y ) dx
A
0 θ
00
1−θ
f (x, y ) dx
A
= g(y ) g(y 00 )1−θ ,
für alle
y 0 , y 00 ∈ Rm
und alle
θ ∈ (0, 1).
D.h.
40
g
ist logarithmisch-konkav.
4. Konvexe Theorie
4.2. Konvexe Optimierungsprobleme
Bevor genauer auf konvexe Optimierungsprobleme eingegangen wird, werden zunächst noch Grundlagen zu allgemeinen Optimierungsproblemen besprochen.
Grundlegendes
Sei
D ⊂ Rd .
einer
Bei einem Optimierungsproblem ist eine Minimal- bzw. Maximalstelle
Zielfunktion J
das Maximieren von
:D →R
J
für
auf einer
x ∈ F
zulässigen Menge F
dem Minimieren von
−J
für
⊂D
gesucht. Da
x ∈ F
entspricht,
wird in diesem Kapitel stellvertretend nur das Minimierungsproblem betrachtet. In
der Literatur wird dieses generell über
minimiere J(x) u.d.N. x ∈ F
bzw. minimiere J(x)
x∈F
notiert, wobei die Abkürzung u.d.N. für unter der Nebenbedingung steht. Falls
F = D = Rd
gilt, so handelt es sich um eine unrestringierte Optimierungsaufgabe.
Häug kann die zulässige Menge über ein System von Gleichungen und Ungleichungen deniert werden, was in dieser Arbeit stets der Fall sein soll. Die zulässige Menge
F
kann dann über
F
= {x ∈ D | e(x) = ec , f (x) ≤ fc }
beschrieben werden, wobei
und
f = (f1 , . . . , fm
e(x) = ec
)T
e = (e1 , . . . , ep )T : D → Rp , ec ∈ Rp
:D→
Rm ,
fc ∈
Rm mit
sowie das Ungleichungssystem
komponentenweise erfüllt sein. Da auch
p ∈ N, p ≤ d
m ∈ N gelten. Das Gleichungssystem
f (x) ≤ fc
D⊂
mit
müssen dabei für alle
x ∈ F
Rd über ein System von Gleichungen
und Ungleichungen festgelegt werden kann, ist es ohne Weiteres möglich
D = Rd
zu wählen und die Nebenbedingungen entsprechend zu ergänzen. Diese Eigenschaft
wird später noch verwendet. An dieser Stelle sei auÿerdem bemerkt, dass die zulässige
Menge
und
F
gleichermaÿen auch nur mit einer bzw. ohne eine der Bedingungen
f (x) ≤ fc
e(x) = ec
formuliert werden kann.
Im Folgenden wird ein Minimierungsproblem daher immer in der Form
minimiere J(x)
x∈D
u.d.N.
(4.10)
e(x) = ec , f (x) ≤ fc
41
4. Konvexe Theorie
geschrieben. In der nun folgenden Denition wird der Begri einer Lösung eines
Minimierungsproblems eingeführt.
Denition 4.18.
(i) Ein Punkt
problems (4.10), falls ein
x∈F∩
x∗ ∈ F
heiÿt
δ ∈ (0, ∞)
lokale Lösung des Minimierungs-
existiert mit
J(x∗ ) ≤ J(x)
(ii) Ein Punkt
x∗ ∈ F
heiÿt
globale bzw. optimale Lösung des Minimierungspro-
J(x∗ ) ≤ J(x)
blems (4.10), falls
für alle
x ∈ F.
Eine globale Lösung existiert beispielsweise unter der Voraussetzung, dass
und
J
für alle
B(x∗ , δ).
F
kompakt
stetig bzw. nach unten halbstetig ist, vgl. Kapitel 2.1. Ferner ist eine globale
Lösung eindeutig, falls in Denition 4.18 sogar
F
Handelt es sich bei
J(x∗ ) < J(x)
um eine konvexe Menge und bei
J
für alle
x ∈ F
gilt.
um eine konvexe Funktion,
so sind alle lokalen Lösungen von (4.10) auch globale Lösungen, vgl. Kapitel 4.1.
Die zulässige Menge ist für eine konvexe Menge
f
konvexe Funktion
D,
eine lineare Funktion
e
und eine
mit Beispiel 4.2, Satz 4.3 und 4.8 konvex. Dies motiviert die
folgende Denition.
Denition 4.19.
tion und
(4.10)
Seien die Menge
f : D →
Rm ,
D ⊂ Rd
J : D → R
konvex,
e : D → Rp
eine lineare Funk-
konvexe Funktionen. Dann wird das Problem
konvexes Optimierungsproblem bzw. konvexes Minimierungsproblem ge-
nannt. Mit
e(x) = Ex, E ∈ Rp×d
für
x∈D
kann das konvexe Optimierungsproblem
in der Form
minimiere J(x)
x∈D
u.d.N.
(4.11)
Ex = ec , f (x) ≤ fc
dargestellt werden.
Der Vorteil eines konvexen Optimierungsproblems gegenüber dem allgemeinen ist es,
nach lokalen Lösungen suchen zu können, um eine optimale Lösung zu erhalten.
Beispiel 4.20.
xl , xu
∈
Rd mit
Seien
xl
<
f = (f1 , . . . , fm )T : Rd → Rm
eine konvexe Funktion und
xu . Das Problem
minimiere kf (x)k∞
x∈Rd
u.d.N.
(4.12)
−x ≤ xl , x ≤ xu
42
4. Konvexe Theorie
ist ein konvexes Optimierungsproblem. Unter Verwendung von Satz 4.9 bzw. Beispiel
4.7 ist dies sofort ersichtlich.
Selbst wenn die Funktionen
fj , j = 1, . . . , m,
dierenzierbar sind, ist in der Regel
nicht gegeben, dass die Zielfunktion des Beispielproblems (4.12) ebenso dierenzierbar ist. Hier ist es allerdings möglich das Problem (4.12) auf ein äquivalentes,
dierenzierbares Problem zu transformieren, welches
minimiere α
(α,x)∈R×Rd
−x ≤ xl , x ≤ xu , fj (x) ≤ α, j = 1, . . . , m
u.d.N.
lautet, vgl. [12].
Optimalitätskriterien
Für die Bestimmung einer Lösung eines Optimierungsproblems sind Optimalitätskriterien von groÿer Bedeutung. Dazu wird zunächst wieder das allgemeine Optimierungsproblem (4.10) betrachtet. Im Folgenden sei
D = Rd .
Falls
J, f
und
g
ste-
tig dierenzierbar sind, können solche Optimalitätskriterien mithilfe der LagrangeFunktion hergeleitet werden.
Denition 4.21.
Die Funktion
L : Rd × Rp × Rm → R,
p
X
L(x, λ, µ) := J(x) +
λi (ei (x) − ec,i ) +
i=1
für
(x, λ, µ) ∈ Rd × Rp × Rm ,
(4.10) genannt, wobei
µi , i = 1, . . . , m,
wird
m
X
µj (fj (x) − fc,j )
j=1
Lagrange-Funktion des Optimierungsproblems
λi , i = 1, . . . , p
die Komponenten des Vektors
die Komponenten des Vektors
Denition 4.22.
deniert über
µ∈
λ ∈ Rp
und
Rm sind.
Gegeben sei das Optimierungsproblem (4.10) mit stetig dieren-
zierbaren Funktionen
J, e
und
f.
(i) Die Bedingungen
∇x L(x, λ, µ) = 0,
(4.13)
e(x) = ec ,
(4.14)
f (x) ≤ fc ,
(4.15)
µ ≥ 0,
µT (f (x) − fc ) = 0
43
(4.16)
(4.17)
4. Konvexe Theorie
heiÿen
KKT-Bedingungen des Optimierungsproblems (4.10), wobei
∇x L(x, λ, µ) = ∇f (x) +
p
X
λi ∇ei (x) +
i=1
der Gradient der Lagrange-Funktion
(ii) Ein Vektor
L
m
X
µi ∇fj (x)
j=1
bezüglich der Variablen
(x∗ , λ∗ , µ∗ ) ∈ Rd × Rp × Rm ,
x
ist.
welcher die KKT-Bedingungen er-
KKT-Punkt des Optimierungsproblems (4.10). Dabei werden die
∗
p
∗
m auch Lagrange-Multiplikatoren
Komponenten von λ ∈ R und µ ∈ R
füllt, heiÿt
genannt.
Für den Fall, dass es sich um eine unrestringierte Optimierungsaufgabe handelt, so
reduzieren sich die KKT-Bedingungen auf die Bedingung
∇f (x) = 0,
also gerade
die notwendige Optimalitätsbedingung erster Ordnung, vgl. [10]. Unter gewissen Regularitätsbedingungen an die zulässige Menge, d.h. an Funktionen
f
bzw.
g,
kann
gezeigt werden, dass die KKT-Bedingungen auch eine notwendige Optimalitätsbedingung erster Ordnung an das Problem (4.10) stellen, siehe [11].
Für den Fall, dass die Nebenbedingungen durch lineare Funktionen dargestellt werden, sind keine besonderen Regularitätsbedingungen nötig und es gilt der nachstehende Satz.
Satz 4.23.
Sei
x∗ ∈ F
linearen Funktionen
e
eine lokale Lösung des Optimierungsproblems (4.10) mit
und
f.
Dann existieren
λ∗ ∈ Rp , µ∗ ∈ Rm ,
sodass der Vektor
(x∗ , λ∗ , µ∗ ) die KKT-Bedingungen (4.13)-(4.17) erfüllt.
Beweis. Siehe [11].
Hinreichende Optimalitätskriterien des Optimierungsproblems (4.10) sind generell
von zweiter Ordnung, vgl. [11]. Beim konvexen Problem können sogar hinreichende
Optimalitätskriterien erster Ordnung erzielt werden, vgl. Satz 4.25. Zudem gibt es
hierbei eine einprägsame Regularitätsbedingung.
Denition 4.24.
Falls es einen Vektor
x̃ ∈ Rd
mit
E x̃ = ec
so genügt das konvexe Optimierungsproblem (4.11) den
von Slater.
und
f (x̃) < fc
gibt,
Regularitätsbedingungen
Zusammen mit den KKT-Bedingungen stellt die Regularitätsbedingungen von Slater
eine notwendige Optimalitätsbedingung erster Ordnung dar.
44
4. Konvexe Theorie
Satz 4.25.
Seien
x∗ ∈ F
eine optimale Lösung des konvexen Optimierungsproblems
(4.11) und die Slater-Bedingung erfüllt. Dann existieren
λ∗ ∈ Rp , µ∗ ∈ Rm ,
sodass
∗ ∗ ∗
der Vektor (x , λ , µ ) die KKT-Bedingungen (4.13)-(4.17) erfüllt.
Beweis. Siehe [11].
Erfüllt umgekehrt
(x∗ , λ∗ , µ∗ ) ∈ Rd × Rp × Rm
die KKT-Bedingung, so ist
x∗
eine
optimale Lösung von (4.10), was ebenfalls in [11] gezeigt wird. Die Gültigkeit der
KKT-Bedingungen ist somit schon ein hinreichendes Optimalitätskriterium bei einem
konvexen Optimierungsproblem.
Im Folgenden werden für Minimierungsprobleme auch Zielfunktionen der Gestalt
J : Rd → (−∞, ∞]
e := {x ∈ F | J(x) < ∞} gelten die in diesem
D
e = ∅, so wird jedes x ∈ F als optimale
analog. Falls D
zugelassen. Für
Kapitel getroenen Aussagen
Lösung bezeichnet.
45
5. Das VER-Problem
5. Das VER-Problem
In diesem Kapitel wird nun das volumenmaximale-einbeschriebene-RechtecksmengenProblem, kurz
VER-Problem, vorgestellt. Dabei werden wichtige Eigenschaften des
Problems untersucht. Ziel des VER-Problems ist es, eine bezüglich des Volumens maximale Teilmenge einer zulässigen Menge zu nden, die sich als kartesisches Produkt
darstellen lässt.
5.1. Einführung in die Problemstellung
Zu Beginn werden einige grundlegende Begrie geklärt, die helfen, das VER-Problem
greifbar zu machen. Wo es möglich ist, wird sich dabei an die in [9] und [24] eingeführten Notationen gehalten. An entsprechender Stelle werden diese dann erweitert
und ergänzt.
Grundlegendes
Ein Vektor im
x ∈ Rd wird als Design bezeichnet, welches sich aus d ∈ N Designkom-
ponenten zusammensetzt. Die Designkomponenten werden dann mit
x = (x1 , . . . , xd ).
d
R kann über eine Funktion
xi , i = 1, . . . , d,
bezeichnet und es gilt
Jedem Design
x∈
f = (f1 , . . . , fm )T : Rd → Rm
ein
Output f (x) zugeordnet werden, weshalb f auch Outputfunktion heiÿt. Ein Output besteht aus
m
Outputkomponenten
fj (x), j = 1, . . . , m,
mit
m ∈ N.
In der Anwendung sind in der Regel nur nach oben und unten beschränkte Designkomponenten realisierbar. Seien
xlb
i ∈ R
die unteren Grenzen der Designkomponen-
ub ∈ R die oberen Grenzen mit
ten und xi
ub
lb ub
xlb
i ≤ xi ≤ xi bzw. xi ∈ [xi , xi ] für i =
Designs ergibt sich dann über das
d-fache
Ωds :=
ub
xlb
i < xi
1, . . . , d.
für
i = 1, . . . , d.
Damit ist
Die Menge aller realisierbaren
kartesische Produkt
d
Y
ub
d
[xlb
i , xi ] ⊂ R .
(5.1)
i=1
Diese Menge wird auch
Designmenge genannt.
Des Weiteren sind aus technischer Sicht meist nur Designs sinnvoll, deren Outputkomponenten jeweils einen kritischen Wert nicht über- bzw. unterschreiten. Da jede
nach unten beschränkte Outputkomponente durch Multiplikation mit
−1
in eine
nach oben beschränkte Komponente umgewandelt werden kann, ist die Annahme
zulässig, dass für alle
x ∈ Rd
die Ungleichungen
46
fj (x) ≤ fc,j , fc,j ∈ R, j = 1, . . . , m,
5. Das VER-Problem
erfüllt sein müssen. Das
wird
m-Tupel,
welches die Grenzen
fc,j , j = 1, . . . , m,
vereint,
Outputgrenze fc genannt und es gilt fc = (fc,1 , . . . , fc,m )T ∈ Rm .
Insgesamt können diese Bedingungen über das Ungleichungssystem
f (x) ≤ fc
zusammengefasst werden. Dieses muss für alle
(5.2)
x ∈ Rd
komponentenweise gültig sein,
um die Anforderungen an den Output zu erfüllen.
Die Menge aller Designs
x ∈ Rd ,
welche in der Designmenge liegen und das Unglei-
chungssystem (5.2) erfüllen, wird als
zulässige Designmenge Ωfc
bezeichnet und
es gilt
Ωfc
Beispiel 5.1.
f :
R2
:= {x ∈ Ωds | f (x) ≤ fc } ⊂ Ωds .
Sei die Designmenge über
→ R, x 7→ x1 + x2
die zulässige Designmenge
Ωds = [0, 1]2
mit Outputgrenze
Ωfc
fc = 1
und die Outputfunktion über
gegeben. In Abbildung 5.1 ist
hierfür visualisiert.
Abbildung 5.1: Zulässige Designmenge
47
(5.3)
Ω fc
(weiÿ)
5. Das VER-Problem
Bemerkung 5.2.
(i) Die Designmenge
Ωds ist als kartesisches Produkt abgeschlos-
sener Mengen eine Borel-Menge mit Lebesgue-Maÿ
d
Y
d
λ (Ωds ) =
lb
(xub
i − xi ) < ∞.
(5.4)
i=1
(ii) Für die zulässige Menge gilt
Ωfc
m
\
=
{x ∈ Ωds | fj (x) ≤ fc,j }
j=1
m \
=
Ωds ∩ {x ∈ Rd | fj (x) ≤ fc,j }
j=1
= Ωds ∩
m
\
{x ∈ Rd | fj (x) ≤ fc,j }.
(5.5)
j=1
Falls die Outputfunktion
{x ∈
Rd
f : Rd → Rm
| fj (x) ≤ fc,j }, j = 1, . . . , m,
Borel-messbar ist, sind die Mengen
nach Korollar 3.15 Borel-messbar.
Somit ist die zulässige Designmenge als Schnitt von Borel-Mengen ebenfalls
eine Borel-Menge. Das Lebesgue-Maÿ von
Ω fc
ist wegen
Ωfc ⊂ Ωds
endlich und
es gilt
λd (Ωfc ) ≤ λd (Ωds ) < ∞.
Bevor das VER-Problem formuliert werden kann, müssen noch die Dimensionen der
Mengen festgelegt werden, aus denen sich das mehrfache kartesische Produkt zusammensetzt, welches das Problem lösen soll. Dazu ist die folgende Denition hilfreich.
Denition 5.3.
Seien
d, n ∈ N
fest und
s := (d1 , . . . , dn ) ∈ Nn .
Falls
n
P
dk = d
gilt
k=1
bzw. im Sinne der Multiindexschreibweise, welche in Beispiel 2.7 eingeführt wurde,
|s| = d,
so wird das
Für gegebenes
s
n-Tupel s
kann ein
Struktur genannt.
n-faches
k = 1, . . . , n, gebildet werden, für das dann
k=1
k=1
wird daher auch als
n-faches
k
Ωk ∈ B(Rd ),
n
n
Q k
Q
Ωk
Ω ⊂ Rd gilt. Die Menge Ω :=
kartesisches Produkt aus Mengen
kartesisches Produkt mit Struktur
ist die in Kapitel 2.2 beschriebene Identikation von
n
Q
Rd
k
s
bezeichnet. Dabei
und
Rd
zu beachten.
k=1
Insbesondere sei an dieser Stelle auch nochmals an die möglichen Darstellungen eines
48
5. Das VER-Problem
Designs
x ∈ Rd erinnert, welche in Gleichung (2.4) aufgelistet sind. Für das Lebesgue-
Maÿ von
Ω
gilt wegen Gleichung (3.4) gerade
λd (Ω) =
n
Y
k
λd (Ωk ).
k=1
In dieser Arbeit wird zusätzlich
dk−1 ≥ dk
für
k = 2, . . . , n
vorausgesetzt, da die
Indizes der Designkomponenten beliebig umgeordnet werden können.
Für jede Struktur
Struktur
s.
s
ist die Designmenge ein mehrfaches kartesisches Produkt mit
Es sei
k
i
Y
k
Ωds :=
k
ub
d
[xlb
i , xi ] ⊂ R
(5.6)
i = ik−1 +1
für
k = 1, . . . , n
mit
k
P
ik =
dk̃ .
n
Q
Ωds =
Dann gilt
k=1
k̃=1
Analog dazu wird die Outputfunktion
f
Ωkds .
additiv zerlegbar mit Struktur
s
genannt,
k = (f k , . . . , f k ) : Rdk → Rm , k = 1, . . . , n, existieren, sodass
falls Funktionen f
m
1
n
P
k
k
d
f (x ) für alle x ∈ R erfüllt ist, vgl. Denition 2.17. Hierbei sei bemerkt,
f (x) =
k=1
dass es zu einer Outputfunktion in der Regel mehrere Möglichkeiten gibt die Struktur
s
zu wählen. So sind beispielsweise für die Funktion
die Strukturen
s = (1, 1, 1), s = (2, 1)
Falls die Einträge der Struktur
s
und
s=3
alle den Wert
f : R3 → R, x 7→ x1 + x2 + x3
möglich.
1
besitzen, so wird auch von einer
eindimensionalen Struktur gesprochen. Dies ist erfüllt sofern
für
k = 2, . . . , n
Wert
2,
k
sofort d
=1
d1 = 1
gilt, da dann
folgt. Ist der maximale Eintrag der Struktur
s
vom
wobei mindestens ein Eintrag diesen Wert auch annimmt, so handelt es sich
um eine zweidimensionale Struktur. Hierbei ist
d1 = 2
notwendige und hinreichende
Bedingung.
Nun kann das VER-Problem als Optimierungsproblem aufgestellt werden. Gesucht
wird eine bezüglich des Volumens maximale Teilmenge der zulässigen Designmenge,
welche ein kartesisches Produkt mit Struktur
s
Unter Verwendung der zulässigen Designmenge
darstellt.
Ω fc
aus Beispiel 5.1 und
s = (1, 1)
bedeutet dies, dass ein volumenmaximales Rechteck gesucht ist, welches in
Ω fc
ent-
halten ist. Kandidaten möglicher Rechtecke sind in Abbildung 5.2 veranschaulicht.
49
5. Das VER-Problem
Ω fc
Abbildung 5.2: Kandidaten für ein volumenmaximales Rechteck in
(gelb, grün
und rot umrandet)
Abstraktes Problem
Denition 5.4.
Seien die Designmenge
Borel-messbare Outputfunktion
Das
f :
Rd
abstrakte VER-Problem lautet
maximiere
Ωds ⊂ Rd ,
→
Ωk ∈B(Rdk ), k=1,...,n
Rm mit Outputgrenze
λd
n
Q
Ωk
s ∈ Nn
fc ∈
sowie die
Rm gegeben.
k=1
n
Q
u.d.N.
die Struktur
(5.7)
Ωk ⊂ Ωfc ,
k=1
wobei die zulässige Designmenge
Ω fc
wie in (5.3) deniert ist.
Die Zielfunktion des abstrakten VER-Problems wird im Folgenden auch mit
Jeab
bezeichnet und es gilt
Jeab :
n
Y
dk
B(R ) → [0, ∞), (Ω1 , . . . , Ωn ) 7→ λd
k=1
Die Menge
n
Q
Ωk
n
Y
!
Ωk
.
(5.8)
k=1
liegt dabei bekanntermaÿen in
k=1
50
B(Rd )
und ihr Lebesgue-Maÿ ist
5. Das VER-Problem
als Teilmenge von
Ωfc
endlich.
Eine optimale Lösung des abstrakten VER-Problems muss, sofern sie existiert, die
Eigenschaft der folgenden Denition erfüllen.
Denition 5.5.
werden
Die Mengen
k
Ωk,∗ ∈ B(Rd ), k = 1, . . . , n,
mit
n
Q
Ωk,∗ ⊂ Ωfc
k=1
des abstrakten VER-Problems (5.7) genannt, wenn die
optimale Lösung
Ungleichung
d
λ
n
Y
Ω
≥ λ
d
k=1
!
k
Ω
(5.9)
k=1
Jeab (Ω1,∗ , . . . , Ωn,∗ ) ≥ Jeab (Ω1 , . . . , Ωn )
n
Q
Eigenschaft
Ωk ⊂ Ωfc erfüllt ist.
bzw.
der
n
Y
!
k,∗
für alle
k
Ωk ∈ B(Rd ), k = 1, . . . , n,
mit
k=1
Eine optimale Lösung des Problems (5.7) maximiert auch die Komposition
mit
log(0) := −∞,
da der Logarithmus monoton wachsend auf
(0, ∞)
log ◦Jeab
ist. Ferner
kann, wie bereits in Kapitel 4.2 beschrieben, durch Änderung des Vorzeichens der
Zielfunktion jedes Maximierungsproblem in ein Minimierungsproblem überführt werden. Deshalb minimieren
k
Ωk,∗ ∈ B(Rd ), k = 1, . . . , n, die Funktion Jab := − log ◦Jeab .
Unter den Voraussetzungen von Denition 5.4 lautet das abstrakte VER-Problem
dann
minimiere
Ωk ∈B(Rdk ), k=1,...,n
− log
n
Q
Ωk
k=1
n
Q
u.d.N.
λd
Ωk
(5.10)
⊂ Ωfc .
k=1
Die Komposition von
− log
und der Zielfunktion ermöglicht es später ein konvexes
Optimierungsproblem zu erhalten, wie im Laufe der Arbeit ersichtlich wird. Stellvertretend für das abstrakte VER-Problem wird daher nur noch Bezug auf das Optimierungsproblem (5.10) genommen.
Das abstrakte Problem ist aus mathematischer Sicht nicht einfach zu lösen, da Mengen der Form
k
Ωk ∈ B(Rd ), k = 1, . . . , n,
in einem Algorithmus nur schwer zu
handhaben sind. Ziel ist es deshalb, diese Mengen analytisch über Variablen zu beschreiben, welche Ungleichungs- bzw. Gleichungsbedingungen einhalten müssen, um
n
Q
Ω k ⊂ Ω fc
zu gewährleisten. Falls die Outputfunktion
f
additiv zerlegbar mit
k=1
Struktur
s
ist, so ist das abstrakte Problem als ein solches analytisches Problem
51
5. Das VER-Problem
formulierbar, wie im Folgenden gezeigt wird.
5.2. Analytisches Problem
Denition 5.6.
Rd
f:
putfunktion
Seien die Designmenge
→
Ωds ⊂ Rd
Rm mit Outputgrenze
zerlegbar mit Struktur
s ∈ Nn .
Das
fc ∈
sowie die Borel-messbare Out-
Rm gegeben. Ferner sei
f
additiv
analytische VER-Problem lautet dann
minimiere
fck ∈Rm , k=1,...,n
n
Q k
d
− log λ
Ωf k
k=1
n
P
u.d.N.
fck
c
(5.11)
= fc ,
k=1
wobei
Ωkf k := {xk ∈ Ωkds | f k (xk ) ≤ fck }.
c
Ωkf k
Die Mengen
Ωk(·)
:
Rm
c
in Denition 5.6 sind dabei stets als Funktionswert der Funktionen
k
→ B(Rd ), fck 7→ Ωkf k , k = 1, . . . , n,
c
und Bemerkung 5.2 liegen
auch
n
Q
k=1
Mengen
Ωkf k ∈ B(Rd ).
c
Ωkf k
fck ∈ Rm
für
c
zu verstehen. Aufgrund Satz 3.21
in
k
B(Rd ), k = 1, . . . , n.
Somit gilt
Insgesamt konnte dadurch eine analytische Beschreibung der
k
Ωk ∈ B(Rd ), k = 1, . . . , n,
über Vektoren im
Rm
wie gewünscht erreicht
werden, was in Satz 5.8 nochmals deutlicher wird.
Für Zielfunktion des analytischen VER-Problems, welche auch mit
Jan
bezeichnet
wird, gilt deshalb
Jan :
n
Y
m
R
→ (−∞, ∞],
(fc1 , . . . , fcn )
n
Y
d
7→ − log λ
k=1
!!
Ωkf k
c
.
k=1
Eine optimale Lösung des analytischen VER-Problems erfüllt, sofern sie existiert, die
Eigenschaft der folgenden Denition. Diese Denition ist identisch mit der Denition
einer globalen Lösung eines allgemeinen Minimierungsproblems, siehe Denition 4.18.
Analog könnten lokale Lösungen des analytischen Problems formuliert werden.
Denition 5.7.
Die Vektoren
optimale Lösung
fck,∗ ∈ Rm , k = 1, . . . , n,
mit
n
P
fck,∗ = fc
werden
k=1
des analytischen VER-Problems (5.11) genannt, wenn die Un-
gleichung
− log λd
n
Y
!!
Ωkf k,∗
≤ − log λd
n
Y
k=1
52
Ωkf k
c
c
k=1
!!
5. Das VER-Problem
Jan (fc1,∗ , . . . , fcn,∗ ) ≤ Jan (fc1 , . . . , fcn )
n
P
fck = fc erfüllt ist.
Eigenschaft
bzw.
für alle
fck ∈ Rm , k = 1, . . . , n,
mit der
k=1
Der Hauptunterschied zwischen dem abstrakten und dem analytischen VER-Problem
ist, dass das abstrakte Problem allgemeiner formuliert ist und somit für beliebige
Strukturen und beliebige Borel-messbare Funktionen gilt. Beim analytischen VER-
f
Problem sind die Auswahlmöglichkeiten für die Struktur bereits durch
Im schlechtesten Fall ist nur
s=d
n=1
mit
möglich und
festgelegt.
Rm ist die einzige
fc ∈
zulässige Lösung des zugehörigen Problems (5.11).
Unter der Voraussetzung, dass die Funktion
f
mit Struktur
s ∈ Nn
additiv zerlegbar
ist, kann gezeigt werden, dass die zur optimalen Lösung des analytischen Problems
Ωk k,∗ , k = 1, . . . , n,
zugehörigen Mengen
fc
eine optimale Lösung des abstrakten Pro-
blems sind.
Satz 5.8.
fck,∗ ∈ Rm , k = 1, . . . , n,
Wenn die Vektoren
n
P
mit
fck,∗ = fc
eine
k=1
optimale Lösung des analytischen VER-Problems (5.11) sind, dann sind die Mengen
Ωk k,∗ , k = 1, . . . , n,
fc
eine optimale Lösung des abstrakten VER-Problems (5.10).
fck,∗ ∈ Rm , k = 1, . . . , n, eine optimale Lösung des analytischen VERn
P
k
(5.11) mit
fck,∗ = fc . Angenommen es existieren Mengen Ωk ∈ B(Rd ),
Beweis. Sei
Problems
k = 1, . . . , n,
mit
n
Q
k=1
Ω k ⊂ Ω fc
und
k=1
n
Y
− log λd
!!
≤ − log λd
Ωk
n
Y
!!
Ωkf k,∗
.
(5.12)
c
k=1
k=1
Dann gilt für alle
n
Q
n
Q
x ∈
Ωk
gerade
f (x) ≤ fc .
Da
f
additiv zerlegbar ist und
k=1
Ωk ⊂ Ωds
beschränkt ist, existieren
k=1
für alle
xk ∈ Ωk
und
n
P
fck ≤ fc .
fck ∈ Rm , k = 1, . . . , n,
mit
f k (xk ) ≤ fck
Aufgrund der Tatsache, dass durch komponenten-
k=1
weises Vergröÿern einzelner
fck ,
der Wert der Zielfunktion niemals ansteigen kann,
vgl. den folgenden Satz 5.9 über die Monotonie der Zielfunktion, darf
n
P
k=1
angenommen werden. Somit ist Ungleichung (5.12) äquivalent zu
− log λ
d
n
Y
!!
Ωkf k
c
≤ − log λ
k=1
d
n
Y
k=1
53
!!
Ωkf k,∗
c
,
fck = fc
5. Das VER-Problem
fck,∗ ∈ Rm , k = 1, . . . , n,
was einen Widerspruch zur Optimalität der Vektoren
dar-
stellt.
Eigenschaften der Zielfunktion
Um die Eigenschaften des analytischen VER-Problems zu untersuchen, ist es oftmals
fck ∈ Rm , k = 1, . . . , n,
Rmn -Vektor zusammenzufas1
n T
mn .
sen. Analog zu den Betrachtungen in Kapitel 2.2 ist dann fˆc := (f , . . . , f ) ∈ R
hilfreich die Vektoren
in einem
c
c
Diese Darstellung ist auch bei der Berechnung von numerischen Lösungen der VERProbleme von Bedeutung.
Satz 5.9.
Die Zielfunktion
Jan
des analytischen VER-Problems (5.11) ist
(i) monoton fallend,
(ii) nach unten halbstetig.
Beweis.
(i) Für die Monotonie von
fˆc , ĝc ∈
Rmn mit
fˆc ≤ ĝc
gerade
j = 1, . . . , m, k = 1, . . . , n,
Jan
auf dem
Rmn
Jan (fˆc ) ≥ Jan (ĝc )
ist zu zeigen, dass für alle
erfüllt ist. Seien
k ≤ gk ,
fc,j
c,j
dann gelten
k
k
}
} ⊂ {xk ∈ Ωkds | fjk (xk ) ≤ gc,j
{xk ∈ Ωkds | fjk (xk ) ≤ fc,j
und
Ωkf k
c
m
\
=
k
{xk ∈ Ωkds | fjk (xk ) ≤ fc,j
}
j=1
m
\
k
} = Ωkgk .
{xk ∈ Ωkds | fjk (xk ) ≤ gc,j
⊂
c
j=1
Ferner ist mit Satz 2.12 dann
n
Y
Ωkf k
c
k=1
für
k = 1, . . . , n
⊂
n
Y
Ωkgk
(5.13)
c
k=1
und aufgrund Satz 3.23 auch
d
λ
n
Y
!
Ωkf k
c
≤ λ
k=1
d
n
Y
k=1
54
!
Ωkgk
c
.
(5.14)
5. Das VER-Problem
Die Ungleichung (5.14) besagt, dass die Funktion
n
Y
Jean :
R
m
→ [0, ∞),
(fc1 , . . . , fcn )
d
7→ λ
k=1
Jean
(ii) Hierzu wird gezeigt, dass
dass
!
Ωkf k
c
k=1
monoton wachsend ist. Daher ist
log ◦Jean
n
Y
Jan
wegen
Jan = − log ◦Jean
monoton fallend.
nach oben halbstetig ist. Mit [19] folgt dann,
als Komposition einer stetigen, monoton wachsenden Funktion
und einer nach oben halbstetigen Funktion ebenfalls nach oben halbstetig ist.
Damit ist
Sei
Jan = − log ◦Jean
fˆ ∈ Rmn
schlieÿlich nach unten halbstetig.
gegeben. So ist die Ungleichung
!
sup Jean ĝ
lim
δ&0
ˆ
ĝ∈B(f,δ)
nachzuweisen. Als Norm im
Rmn
kann hier die
ˆ δ) = {ĝ ∈ Rmn | kĝ − fˆk∞ < δ}.
B(f,
Rmn mit
δ̂ := (δ, . . . , δ) ∈
≤ Jean fˆ
∞-Norm
gewählt werden, d.h.
Aufgrund der Monotonie von
Jean
gilt für
δ ∈ (0, ∞)
sup Jean ĝ
≤ Jean fˆ + δ̂ .
ˆ
ĝ∈B(f,δ)
Sei
(δi )i∈N
eine monoton fallende Folge mit
δi ∈ (0, ∞), i ∈ N
und
lim δi = 0.
i→∞
So bleibt zu zeigen, dass die Ungleichung
lim Jean fˆ + δ̂i
≤ Jean fˆ
i→∞
erfüllt ist, wobei
δˆi := (δi , . . . , δi ) ∈ Rmn .
Wegen Satz 2.12 und Bemerkung 5.2
gilt
n
Y
Ωkf k
c
n \
m
Y
=
k
{xk ∈ Ωkds | fjk (xk ) ≤ fc,j
}
k=1 j=1
k=1
n \
m
Y
= Ωds ∩
k
(fjk )−1 (−∞, fc,j
] .
(5.15)
k=1 j=1
Zur Übersichtlichkeit werden für den weiteren Beweis die beiden Schreibweisen
Ω :=
n
Q
Ωkf k
c
und
Ωi :=
n
Q
Ωkf k +δk
k=1
führt. Wie in (5.13) ist Ωi ⊃
k=1
c
mit
i
Ωi+1
für
55
δik := (δi , . . . , δi ) ∈ Rm , i ∈ N
i∈N
einge-
und mit den Eigenschaften von
5. Das VER-Problem
Bild und Urbild bzgl. dem Durchschnitt von Familien von Mengen auch

\
Ωi =
i∈N
\
Ωds ∩
n \
m
Y

k
(fjk )−1 (−∞, fc,j
+ δi ] 
k=1 j=1
i∈N
= Ωds ∩
= Ωds ∩
n \
m
Y
!
(fjk )−1
k=1 j=1
n \
m
Y
\
k
(−∞, fc,j
+ δi ]
i∈N
k
(fjk )−1 (−∞, fc,j
] = Ω,
k=1 j=1
d.h.
Ωi ↓ Ω.
Ferner lässt sich mit der Darstellung aus Gleichung (5.15) auch
erkennen, dass
Ω1 ⊂ Ωds
Voraussetzungen an die
ist und damit
σ -Stetigkeit
lim Jean fˆ + δ̂i
Jean
Somit sind die
aus Satz 3.23 erfüllt, weshalb
= lim λd (Ωi ) = λd (Ω) = Jean fˆ
i→∞
gilt und daher
λd (Ω1 ) ≤ λd (Ωds ) < ∞.
i→∞
nach oben halbstetig ist.
Aus dem Beweis von Satz 5.8 wird ersichtlich, dass das analytische VER-Problem
eigentlich auch mit den Ungleichungsbedingungen
chungsbedingungen
n
P
n
P
fck ≤ fc
fck = fc
hätte formuliert werden können. Da die Zielfunktion
k=1
Jan
anstatt mit den Glei-
k=1
monoton fallend ist, wird eine optimale Lösung immer für
n
P
fck = fc
angenom-
k=1
men, falls sie existiert. Um die Existenz einer optimalen Lösung des VER-Problems
nachzuweisen, ist der zweite Teil des Satzes 5.9 entscheidend. Zuvor müssen jedoch
noch Eigenschaften der zulässigen Menge des Problems (5.11) untersucht werden.
Eigenschaften der zulässigen Menge
Satz 5.10.
Die zulässige Menge
Fan = {fˆc ∈ Rmn |
n
P
fck = fc }
des analytischen
k=1
VER-Problems (5.11) ist konvex.
E := (Im , . . . , Im ) ∈
n
P
fck = fc kann geschrieben werden als E fˆc = fc mit
k=1
Rm×mn , wobei Im die m × m-Einheitsmatrix ist. Somit gilt
Beweis. Die Bedingung
Fan = {fˆc ∈ Rmn | E fˆc = fc }
56
5. Das VER-Problem
und nach Beispiel 4.2 ist
Mithilfe der Darstellung
Fan
konvex.
Fan = {fˆc ∈ Rmn | E fˆc = fc }, E := (Im , . . . , Im ) ∈ Rm×mn
kann das analytische VER-Problem (5.11) auch in der kompakten Form
minimiere Jan (fˆc )
fˆc ∈Rmn
(5.16)
E fˆc = fc
u.d.N.
geschrieben werden. Um eine optimale Lösung des analytischen VER-Problem zu nden, ist es vorteilhaft, diejenigen
den Wert
∞
fˆc aus Fan zu entfernen, für welche die Zielfunktion
annimmt.
Satz und Denition 5.11.
)
n
X
k
k
k̃
fc,j ≤ fc,j ≤ fc,j −
fc,j , j = 1, . . . , m, k = 1, . . . , n
¯
¯
(
fˆc ∈ Fan
Fan,c :=
Für das analytische VER-Problem (5.11) ist die Menge
k̃=1,
k̃6=k
mit
k :=
fc,j
¯
inf fjk (xk )
xk ∈Ωkds
funktion nimmt für alle
für
j = 1, . . . , m, k = 1, . . . , n
fˆc ∈ Fan \Fan,c
den Wert
∞
kompakt und die Ziel-
an. Darum wird
eingeschränkte zulässige Menge des Problems (5.11) genannt.
Beweis. Weil die Mengen
R
abbilden, gilt
inf
xk ∈Ωkds
Ωkds
fjk (xk )
Fan,c
fjk
∈R
Die Menge
für
j = 1, . . . , m, k = 1, . . . , n.
von
Rd
k
beschränkt sind und die Funktionen
auch
nach
Fan,c
ist somit beschränkt und abgeschlossen und daher kompakt.
fˆc ∈ Fan
k < f k für ein j ∈ {1, . . . , m} und ein k ∈ {1, . . . , n}, also
fc,j
c,j
¯
k ]) = {xk ∈ Ωk | f k (xk ) ≤ f k } = ∅ für
fˆc ∈ Fan \Fan,c . Dann gilt (fjk )−1 ((−∞, fc,j
j
c,j
ds
m
T
k
k ]) = ∅
selbe j ∈ {1, . . . , m} und k ∈ {1, . . . , n} und ferner Ω k =
(fjk )−1 ((−∞, fc,j
f
Sei
mit
c
für eben dieses
k ∈ {1, . . . , n}.
λd
n
Y
!
Ωkf k
=
c
k=1
bzw.
Jan (fc1 , . . . , fcn ) = ∞.
j=1
Somit ist
n
Y
k
λd
Ωkf k = 0
c
k=1
k ≥ f k für alle j ∈ {1, . . . , m}
fc,j
c,j
¯n
1
Jan (fc , . . . , fc ) < ∞ gilt.
Also muss
k ∈ {1, . . . , n}, erfüllt sein, damit
k
k
Sei jetzt fˆc ∈ Fan mit fc,j ≥ fc,j
¯
für
j = 1, . . . , m
57
und
k = 1, . . . , m.
und alle
Ferner sei
5. Das VER-Problem
k >f
fc,j
c,j −
n
P
k̃
fc,j
k̃=1, ¯
für ein
j ∈ {1, . . . , m}
und ein
k ∈ {1, . . . , n},
dann sind wegen
k̃6=k
k +
fc,j
n
P
k̃ > f
fc,j
c,j
¯
k̃=1,
die Nebenbedingungen des analytischen VER-Problems verletzt
k̃6=k
und
fˆc
kann nicht in
Fan
bzw.
Fan \Fan,c
liegen.
Dieser Satz erlaubt es, den Bereich für die Suche einer optimalen Lösung des VERProblems, also die zulässige Menge
Menge
Fan,c
Fc , einzuschränken. Hierbei sei bemerkt, dass die
sowohl Elemente besitzen kann, für die
Jan
den Wert
∞
annimmt, als
auch leer sein kann.
Schlussendlich kann damit die Existenz einer optimalen Lösung des VER-Problems
gezeigt werden.
Existenz einer optimalen Lösung
Korollar 5.12.
Das analytische VER-Problem (5.11) besitzt mindestens eine opti-
male Lösung.
Beweis. Sei
jedes
Fan,c = ∅,
fˆc ∈ Fan
so gilt für alle
fˆc ∈ Fan = Fan \Fan,c
sofort
Jan (fˆc ) = ∞
und
ist daher optimale Lösung.
Fan,c , Fan \Fan,c 6= ∅, dann gilt für alle fˆc ∈ Fan,c und alle ĝc ∈ Fan \Fan,c gerade
Jan (fˆc ) ≤ Jan (ĝc ) = ∞. Des Weiteren ist die Zielfunktion Jan nach Satz 5.9 nach
Sei
unten halbstetig und nimmt, wie in Kapitel 2.1 beschrieben, auf kompakten Mengen
ihr Minimum an. Insgesamt existiert damit eine optimale Lösung auf
Fan,c .
An dieser Stelle wird nun ein Beispiel betrachtet, in welchem die Eigenschaften des
analytischen VER-Problems zu erkennen sind. Für die Funktion
f
wird hierbei ein
Polynom gewählt, siehe Beispiel 2.7. Polynome sind immer stetig und messbar und
eigenen sich besonders für das analytische VER-Problem, da sie mehrere Strukturen
zulassen, sofern die entsprechenden Koezienten des Polynoms null sind. Ist das Polynom von Grad eins, also eine lineare Funktion, so kann insbesondere jede Struktur
s
mit
|s| = d
realisiert werden.
Beispiel 5.13.
f :
R2
Ωds = [−2, 2] × [−1,5, 1,5], die Outputfunktion
3
(x2 ) mit Outputgrenze fc = −1 und Struktur s = (1, 1)
Für die Designmenge
→ R, x 7→ (x1
)3
+
ist eine optimale Lösung des analytischen VER-Problems (5.11) gesucht.
Die Anzahl der Designkomponenten beträgt in diesem Beispiel
58
d = 2 und die Anzahl
5. Das VER-Problem
der Outputkomponenten
m = 1.
Oensichtlich ist
f
mit der Struktur
zerlegbar. In Abbildung 5.3 ist die zulässige Designmenge
ist zu erkennen, dass
f2
: R → R, x2 7→
Ω fc
1
nicht konvex ist, obwohl f
Ω fc
s
additiv
veranschaulicht. Dabei
: R → R, x1 7→ (x1 )3
und
(x2 )3 quasikonvex sind, was bereits aus Bemerkung 4.11 bekannt
ist.
Für die zulässige Menge
Fan
des Optimierungsproblems gilt
Fan = {(fc1 , fc2 ) ∈ R2 | fc1 + fc2 = −1}
und für die Mengen
Ω1f 1
c
und
Ω2f 2 ,
c
welche in der Zielfunktion
Jan
Ω1fc1
= {x1 ∈ [−2, 2] | (x1 )3 ≤ fc1 },
Ω2fc2
= {x2 ∈ [−1,5, 1,5] | (x2 )3 ≤ fc2 }.
Der Funktionswert der Zielfunktion
Jan
enthalten sind,
ergibt sich damit zu

p
p
3
1 + 2)( 3 f 2 + 1,5)

−
log
(
f

c
c


p


3
2 + 1,5)

f
−
log
4(

c

p
3
Jan (fc1 , fc2 ) =
1 + 2)
−
log
3(
f
c





− log (12)



 ∞
für
e 1,
(fc1 , fc2 ) ∈ D
für
e 2,
(fc1 , fc2 ) ∈ D
für
e 3,
(fc1 , fc2 ) ∈ D
e 4,
(fc1 , fc2 ) ∈ D
für
sonst.
wobei
e 1 := (−8, 8) × (−3,375, 3,375),
D
e 2 := [8, ∞) × (−3,375, 3,375),
D
e 3 := (−8, 8) × [3,375, ∞),
D
e 4 := [8, ∞) × [3,375, ∞).
D
In Abbildung 5.4 ist der Graph von
Jan
visualisiert und in Abbildung 5.5 der Graph
der Funktion
Jan,p : R → (−∞, ∞], fc2 7→ Jan (−1 − fc2 , fc2 ).
Nun wird versucht mithilfe der Optimalitätskriterien aus Kapitel 4.2 mögliche lokale Lösungen des Beispielproblems zu nden. Eine mögliche lokale Lösung mit minimalem Funktionswert der Zielfunktion ist dann eine optimale Lösung. Dazu ist
59
5. Das VER-Problem
zu beachten, dass die Zielfunktion nur auf der Menge
((−3,375, ∞)\{0, 3,375}) ⊂ R2
Dd = ((−8, ∞)\{0, 8}) ×
dierenzierbar ist. Deshalb können mit den Op-
timalitätskriterien nur auf dieser Menge Kandidaten für lokale Lösungen gefunden werden. Anschlieÿend können die Funktionswerte in Umgebungen von Punkten
(fc1 , fc2 ) ∈ Fan ,
in denen
Jan
nicht dierenzierbar ist, mit diesen Kandidaten vergli-
chen werden.
Die KKT-Bedingungen für das Beispielproblem werden nur in
e1
Dd ∩ D
erfüllt. Es
gilt
1
+ λ = 0,
− p 2p
3 3 fc1 3 fc1 + 2
1
+ λ = 0,
− p 2p
3 3 fc2 3 fc2 + 1,5
fc1 + fc2 = −1
für
(fc1 , fc2 , λ) ∈ {(−1,35, 0,35, 0,31), (−0,21, −0,79, 0,68), (−0,09, −1,09, 0,67)},
wo-
bei alle Komponenten der Einträge dieser Menge auf zwei Nachkommastellen gerundet sind. Die sich daraus ergebenden, möglichen Lösungen sind zusammen mit
ihren Zielfunktionswerten sowohl in Abbildung 5.4 als auch in Abbildung 5.5 dargestellt. Zusätzlich werden die zugehörigen Mengen
Ω1f 1 × Ω2f 2
c
c
in Abbildung 5.3 ver-
anschaulicht. Wie oben beschrieben kann insgesamt gezeigt werden, dass der Vektor
(fc1,∗ , fc2,∗ ) = (−1,35, 0,35)
1,∗ 2,∗
mit Jan (fc , fc )
die eindeutige, optimale Lösung des Beispielproblems ist
= −0,07,
ebenfalls auf zwei Nachkommastellen gerundet.
60
5. Das VER-Problem
Ωfc (weiÿ)
Ω1f 1 × Ω2f 2
Abbildung 5.3: Zulässige Designmenge
gehörigen Mengen
Abbildung 5.4: Graph von
Jan
c
und zu den möglichen Lösungen
c
(Blautöne), Graph von
Jan
auf die zulässige Men-
ge eingeschränkt (rot) und mögliche Lösungen zusammen mit ihren
Funktionswerten als Punkte
61
5. Das VER-Problem
Abbildung 5.5: Graph von
Jan,p
und parametrisierte mögliche Lösungen mit ihren
Funktionswerten als Punkte
Bemerkung 5.14.
In Beispiel 5.13 ist erkennbar, dass die Zielfunktion
Jan
des ana-
lytischen VER-Problem in der Regel nicht dierenzierbar ist. Darüber hinaus ist in
diesem Beispiel zu sehen, dass die Aufstellung der Zielfunktion selbst bei handlichen
Outputfunktionen recht komplex werden kann und damit auch die Bestimmung des
Gradienten der Zielfunktion auf
Dd .
62
6. Das konvexe VER-Problem
6. Das konvexe VER-Problem
Nun wird das analytische VER-Problem für konvexe Outputfunktionen betrachtet
und gezeigt, dass dies ein konvexes Optimierungsproblem darstellt. Falls die Struktur
der Outputfunktion eindimensional ist, gibt es eine alternative Formulierung für das
konvexe Problem.
6.1. Allgemeine Strukturen
Satz 6.1.
Sei das analytische VER-Problems (5.11) mit konvexer Outputfunktion
gegeben. Dann ist auch die Zielfunktion
Jan
f
konvex.
Beweis. Der Beweis erfolgt in drei Schritten. Zunächst sei jedoch an Satz 4.10 erinnert, welcher begründet, dass für eine konvexe Outputfunktion
f k , k = 1, . . . , n,
mit
f (x) =
n
P
f k (xk )
für alle
x ∈ Rd
f
auch die Funktionen
konvex sind.
k=1
Schritt 1 : Es wird gezeigt, dass für k ∈ {1, . . . , n} die Funktion χf k , deniert über
(
χf k : R
dk
×R
m
→ {0, 1}, (x
k
, fck )
7→ χf k (x
k
, fck )
:=
f k (x) ≤ fck ,
1
falls
0
sonst,
logarithmisch-konkav ist, wobei das Ungleichungssystem
f k (x) ≤ fck
wie gehabt
komponentenweise zu verstehen ist. Hierzu reicht es nachzuweisen, dass für alle
k
(xk , fck ), (y k , gck ) ∈ Rd × Rm
und alle
θ ∈ (0, 1)
die Ungleichung
χf k (θxk + (1 − θ)y k , θfck + (1 − θ)gck ) ≥ χf k (xk , fck )θ χf k (y k , gck )1−θ
= χf k (xk , fck ) χf (y k , gck )
erfüllt ist. Für
χf k (xk , fck ) = 0 oder χf k (y k , gck ) = 0 ist dies stets der Fall. Seien daher
k
χf k (xk , fck ) = χf k (y k , gck ) = 1, d.h. für (xk , fck ), (y k , gck ) ∈ Rd × Rm
und
f k (y k ) ≤ gck .
Mit der Konvexität von
fk
gilt
f k (xk ) ≤ fck
folgt daraus
f k (θxk + (1 − θ)y k ) ≤ θ f k (xk ) +(1 − θ) f k (y k )
| {z }
| {z }
≤fck
≤gck
≤ θfck + (1 − θ)gck ,
weshalb auch
dass
χf k
χf k (θxk +(1−θ)y k , θfck +(1−θ)gck ) = 1 gilt. Somit wurde nachgewiesen,
logarithmisch-konkav ist.
63
6. Das konvexe VER-Problem
Schritt 2 : Nun wird für k ∈ {1, . . . , n} gezeigt, dass die Abbildung
k
Jek : Rm 7→ [0, ∞), fck 7→ λd Ωkf k
c
logarithmisch-konkav ist. Wegen
Ωkf k = {xk ∈ Ωkds | f k (xk ) ≤ fck }
c
Jek (fck ) =
für
fck ∈ Rm
Z
Ωkds
gilt
χf k xk , fck dxk
mit den Darstellungen aus Kapitel 3.3. Die Menge
Ωkds
ist aufgrund ihrer
dk
Gestalt, vgl. (5.6) und Satz 4.3, konvex und liegt in B(R ). Somit sind insgesamt alle
Voraussetzungen an Korollar 4.17 erfüllt und
Jek
ist folglich logarithmisch-konkav.
Schritt 3 : Im letzten Schritt wird die Konvexität der Zielfunktion Jean
nachgewiesen.
Es sei
Je :
n
Y
Rm → [0, ∞), (fc1 , . . . , fcn ) 7→
Funktionen
und alle
Jek (fck ),
k=1
k=1
wobei im Folgenden wieder
n
Y
fˆc = (fc1 , . . . , fcn )T ∈ Rmn
Jek , k = 1, . . . , n,
geschrieben wird. Da die
logarithmisch konkav sind, gilt für alle
fˆc , ĝc ∈ Rmn
θ ∈ (0, 1)
Je θfˆc + (1 − θ)ĝc
=
≥
n
Y
Jek (θfck + (1 − θ)gck )
k=1
n
Y
Jek (fck )θ Jek (gck )1−θ
k=1
=
n
Y
!θ
Jek (fck )
k=1
n
Y
!1−θ
Jek (gck )
k=1
θ
1−θ
= Je fˆc f ĝc
,
d.h.
Je
ist ebenfalls logarithmisch-konkav. Daraus folgt, dass
64
log ◦Je
konkav und
6. Das konvexe VER-Problem
− log ◦Je konvex
ist. Unter Verwendung von Gleichung (3.4) kann
Jan fˆc
= − log λ
n
Y
d
!!
Ωkf k
c
k=1
n
Y
= − log
k=1
n
Y
= − log
!
λ
dk
Ωkf k
c
!
ek
J
(fck )
k=1
= − log Je fˆc
fˆc ∈ Rmn
für
gezeigt werden, womit die Konvexität von
Jan
nachgewiesen ist.
Da im Falle einer konvexen Outputfunktion neben der zulässigen Menge auch die
Zielfunktion des analytischen VER-Problems konvex ist, ergibt sich ein konvexes
Optimierungsproblem.
Denition 6.2.
f:
Rd
Rm mit Outputgrenze
→
Struktur
Seien die Designmenge
s ∈ Nn .
Das
fc ∈
Ωds ⊂ Rd
sowie die konvexe Outputfunktion
Rm gegeben. Ferner sei
konvexe VER-Problem lautet dann
f
additiv zerlegbar mit
n
Q k
d
Ωf k
− log λ
minimiere
fck ∈Rm , k=1,...,n
k=1
n
P
u.d.N.
c
(6.1)
fck = fc .
k=1
Da das konvexe VER-Problem (6.1) ein Spezialfall des analytischen VER-Problems
(5.11) ist, übertragen sich die weiteren Eigenschaften aus Kapitel 5.2 direkt. Dass
die Zielfunktion im konvexen Fall ebenso nicht stetig sein muss, zeigt das Beispiel
6.4.
Beispiele
Beispiel 6.3.
f:
R3
Für die Designmenge
→ R, x 7→
s = (2, 1)
kxk22
= (x1
)2 +(x
2
Ωds = [−1,5, 1,5]3 ,
)2 +(x
die konvexe Outputfunktion
2
3 ) mit Outputgrenze
fc = 1 und Struktur
ist eine optimale Lösung des konvexen VER-Problems (6.1) gesucht.
Die Anzahl der Designkomponenten beträgt in diesem Beispiel
der Outputkomponenten
1
zerlegbar, wobei f
:
R2
m = 1.
Oensichtlich ist
→ R, (x1 , x2 ) 7→ (x1
65
)2 +(x
f
d = 3 und die Anzahl
mit der Struktur
2
2 ) und
f2
:
R2
s
additiv
→ R, x3 7→ (x3 )2
6. Das konvexe VER-Problem
ist. In Abbildung 6.1 ist die zulässige Designmenge
Für die zulässige Menge
Fan
Ωfc
veranschaulicht.
des Optimierungsproblems gilt
Fan = {(fc1 , fc2 ) ∈ R2 | fc1 + fc2 = 1}
und für die Mengen
Ω1f 1
c
und
Ω2f 2 ,
c
welche in der Zielfunktion
Jan
enthalten sind,
Ω1fc1
= {(x1 , x2 ) ∈ [−1,5, 1,5]2 | (x1 )2 + (x2 )2 ≤ fc1 },
Ω2fc2
= {x2 ∈ [−1,5, 1,5] | (x3 )2 ≤ fc2 }.
Bei diesem Beispielproblem genügt es die Zielfunktion
Jan
auf
(0, 1]2 ⊂ R
zu be-
1 2
2
1 2
trachten, da es keine Vektoren (fc , fc ) ∈ Fan \(0, 1] gibt mit Jan (fc , fc ) < ∞. Für
p
(fc1 , fc2 ) ∈ (0, 1]2 gilt Jan (fc1 , fc2 ) = − log(2πfc1 fc2 ). In Abbildung 6.2 ist der Graph
von
Jan
visualisiert und in Abbildung 6.3 der Graph der Funktion
Jan,p : (0, 1] → (−∞, ∞], fc2 7→ Jan (1 − fc2 , fc2 ).
Ferner ist
Jan
in
(fc1 , fc2 ) ∈ (0, 1]2
dierenzierbar. Deshalb kann mithilfe der Opti-
malitätskriterien aus Kapitel 4.2 versucht werden eine Lösung zu nden. Erfüllt ein
Vektor
(fc1,∗ , fc2,∗ , λ∗ ) ∈ (0, 1]2 × R
−
−
so ist
(fc1,∗ , fc2,∗ ) ∈ (0, 1]2
die KKT-Bedingungen
1
fc1,∗
+ λ∗ = 0,
1
+ λ∗ = 0,
2fc2,∗
fc1,∗ + fc2,∗ = 1
bereits optimale Lösung des konvexen Beispielproblems.
1,∗ 2,∗ ∗
Dies ist gerade für (fc , fc , λ )
= ( 23 , 13 , 2) ∈ (0, 1]2 × R mit Jan (fc1,∗ , fc2,∗ ) = −0,88,
auf zwei Nachkommastellen gerundet, der Fall. Die eindeutige, optimale Lösung ist
zusammen mit ihrem Zielfunktionswert sowohl in Abbildung 5.4 als auch in Abbildung 5.5 dargestellt. Zusätzlich wird die zugehörige Menge
5.3 veranschaulicht.
66
Ω1 1,∗ ×Ω2 2,∗
fc
fc
in Abbildung
6. Das konvexe VER-Problem
Abbildung 6.1: Zulässige Designmenge
Ω fc
(transparent schwarz umrandet) und zur
optimalen Lösung gehörige Menge
Ω1 1,∗ × Ω2 2,∗
fc
fc
(transparent grün
umrandet)
Abbildung 6.2: Graph von
Jan
(Blautöne), Graph von
Jan
auf die zulässige Men-
ge eingeschränkt (rot) und optimale Lösung zusammen mit ihrem
Funktionswert als Punkt (grün)
67
6. Das konvexe VER-Problem
Abbildung 6.3: Graph von
Jan,p
und parametrisierte optimale Lösung mit ihrem
Funktionswert als Punkt
Beispiel 6.4.
putfunktion
Für die Designmenge
f = (f1 , f2
Outputgrenze
fc =
)T
:
R2
Ωds = [−1,5, 2,5] × [−1,5, 1,5], die konvexe Out-
→ R2 , x 7→ ((x1 )2 + (x2 )2 , (x1 − 1)2 + (x2 )2
(1, 1)T und Struktur
s = (1, 1)
mit
ist eine optimale Lösung des kon-
vexen VER-Problems (6.1) gesucht.
Die Anzahl der Designkomponenten beträgt in diesem Beispiel
zahl der Outputkomponenten
1
tiv zerlegbar und es ist f
f 2 = (f12 , f22 )T : R2 → R,
Designmenge
Ω fc
m = 2.
Oensichtlich ist
f
d=2
und die An-
mit der Struktur
s
addi-
= (f11 , f21 )T : R2 → R, x1 7→ ((x1 )2 , (x1 − 1)2 )T und
x2 7→ ((x2 )2 , (x2 )2 )T . In Abbildung 6.4 ist die zulässige
veranschaulicht.
Für die zulässige Menge
Fan
des Optimierungsproblems gilt
Fan = {(fc1 , fc2 ) ∈ R2 × R2 | fc1 + fc2 = (1, 1)T }
und für die Mengen
Ω1f 1
c
und
Ω2f 2 ,
c
welche in der Zielfunktion
Jan
enthalten sind,
Ω1fc1
= {x1 ∈ [−1,5, 2,5] | ((x1 )2 , (x1 − 1)2 )T ≤ fc1 },
Ω2fc2
= {x2 ∈ [−1,5, 1,5] | ((x2 )2 , (x2 )2 )T ≤ fc2 }.
In diesem Beispiel genügt es die Zielfunktion
68
Jan
auf
(0, 1]2 × (0, 1]2 ⊂ R2 × R2
6. Das konvexe VER-Problem
zu betrachten, da es keine Vektoren
Eigenschaft
Jan (fc1 , fc2 ) < ∞.
Für
(fc1 , fc2 ) ∈ Fan \((0, 1]2 × (0, 1]2 )
(fc1 , fc2 ) ∈ (0, 1]2 × (0, 1]2
gibt mit der
gilt
q q
q

1 +
2 −1
1
 − log 2
fc,1
fc,1
fc,2
1 2
q
q q
Jan (fc , fc ) =
 − log 2
1 +
2 −1
2
fc,1
fc,1
fc,2
für
e 1,
(fc1 , fc2 ) ∈ D
für
e 2,
(fc1 , fc2 ) ∈ D
wobei
e 1 := {(f 1 , f 2 ) ∈ (0, 1]2 × (0, 1]2 | f 1 ≤ f 2 },
D
c
c
c,2
c,2
e 2 := {(f 1 , f 2 ) ∈ (0, 1]2 × (0, 1]2 | f 1 > f 2 }.
D
c
c
c,2
c,2
In Abbildung 6.5 ist der Graph der Funktion
Jan,p : (0, 1] → (−∞, ∞], fc2 7→ Jan ((1, 1)T − fc2 , fc2 ).
visualisiert. Die Zielfunktion
Jan
ist insbesondere für
1 = f2
fc,2
c,2
nicht dierenzier-
bar. Bei diesem Beispiel kann gezeigt werden, dass die KKT-Bedingungen im dierenzierbaren Bereich nicht erfüllt werden können. Die eindeutige, optimale Lösung
des Problems beträgt auf zwei Nachkommastellen gerundet
fc2,∗ = (0,21, 0,21)T
zugehörige Menge
fc1,∗ = (0,71, 0,71)T ,
. Diese kann später direkt aus Beispiel 6.9 abgeleitet werden. Die
Ω1 1,∗ × Ω2 2,∗
fc
fc
ist in Abbildung 6.4 veranschaulicht.
69
6. Das konvexe VER-Problem
Abbildung 6.4: Zulässige Designmenge
Menge
Ω1 1,∗ × Ω2 2,∗
fc
Abbildung 6.5: Graph von
fc
Jan,p
Ω fc
(weiÿ) und zur optimalen Lösung gehörige
(grün umrandet)
und parametrisierte optimale Lösung mit ihrem
Funktionswert als Punkt
70
6. Das konvexe VER-Problem
Auch in Beispiel 6.4 ist zu erkennen, dass die Zielfunktion auch bei konvexen Outputfunktionen nicht zwingend dierenzierbar ist. Bei eindimensionalen Strukturen ergibt
sich eine zur optimalen Lösung gehörige Menge stets in Form eines
d-dimensionalen
Hyperrechtecks, vgl. Beispiel 2.19. Deshalb wird an dieser Stelle noch kurz auf eine
äquivalente Formulierung des konvexen VER-Problems (6.1) eingegangen, bei welcher die Zielfunktion dierenzierbar ist.
6.2. Eindimensionale Strukturen
In den folgenden Betrachtungen sei die Outputfunktion
zerlegbar mit eindimensionaler Struktur, d.h.
f
stets konvex und additiv
s = (1, . . . , 1) ∈ Nd
und
n = d. Für die
i
m
Vektoren fc ∈ R , i = 1, . . . , d, kann das Lebesgue-Maÿ der zugehörigen Mengen
Ωif i ⊂ R über li := λ1 (Ωif i ) ∈ [0, ∞) deniert werden. Aufgrund der Konvexität und
c
c
i
somit Stetigkeit der Outputfunktion sind alle Ω i als Schnitt abgeschlossener und
fc
konvexer Mengen, vgl. Gleichung (5.5), abgeschlossen und konvex. Daher können sie
im Fall
λ1 (Ωif i ) = 0
λ1 (Ωif i )
c
c
> 0
als leere Menge
M
als Intervall [xi
−
∅
oder einelementige Menge
li
M
2 , xi
+
li
2 ] mit
xM
i
{xM
i }
und im Fall
∈ R, i = 1, . . . , d,
dargestellt
werden. Für einen positiven Wert des Maÿes muss hierbei
max
l
l
i M
i
xi ∈[xM
i − 2 ,xi + 2 ]
j = 1, . . . , m
für
fji (xi )
li
li
i
M
i
i
M
, fj xi +
≤ fc,j
= max fj xi −
2
2
gewährleistet sein, wobei
max(x, y) := max{x, y}
für
(6.2)
x, y ∈ R.
Insgesamt gibt es deshalb auch für eine optimale Lösung des konvexen VER-Problems
fci,∗
∈
Rm ,
xM,∗
∈R
i
i=
mit
1, . . . , d, welche λd
[xM,∗
−
i
li∗
M,∗
2 , xi
+
li∗
2]
d
Q
i=1
Ωi i,∗
fc
> 0 erfüllt, zugehörige li∗ ∈ (0, ∞) und
= Ωif i,∗ ⊂ Ωids
für
i = 1, . . . , d.
Somit können die entsprechenden Mengen der optimalen Lösung des konvexen VERProblems auch über das nachfolgende Problem gefunden werden.
Denition 6.5.
f:
Rd
→
Struktur
Seien die Designmenge
Rm mit Outputgrenze
s = (1, . . . , 1) ∈
fc ∈
d
N . Das
Ωds ⊂ Rd
sowie die konvexe Outputfunktion
Rm gegeben. Ferner sei
f
additiv zerlegbar mit
eindimensionale konvexe VER-Problem
71
6. Das konvexe VER-Problem
lautet dann
minimiere
li ∈(0,∞), xM
i ∈R, i=1,...,d
− log
i=1
li
li
li
i M
max(f i (xM
i − 2 ), f (xi + 2 )) ≤ fc ,
−xM
i +
xM
i +
Dabei stellt die Funktion
i=1
d
P
u.d.N.
d
Q
li
2
li
2
(6.3)
≤ −xlb
i , i = 1, . . . , d,
≤ xub
i , i = 1, . . . , d.
max(·, ·) : Rm ×Rm → Rm
das komponentenweise Maximum
m dar, vgl. Gleichung (6.2).
zweier Vektoren in R
Wie bei den anderen Problemen kann die Zielfunktion hierbei wieder als Funktion
d
d
J1 : (0, ∞) × R → R,
M
(l1 , . . . , ld , xM
1 , . . . , xd )
d
Y
7→ − log
!
li
i=1
aufgefasst werden.
Eigenschaften des Problems
Nun wird noch kurz auf die Eigenschaften des eindimensionalen konvexen VERProblems eingegangen. Dazu werden Elemente in
mengefasst, vgl. die Darstellung von
Schreibweise
Satz 6.6.
fˆc
(0, ∞)d × Rd
J1
2d-Tupel
zusam-
in Kapitel 5.2. An dieser Stelle wird die
ˆl := (l1 , . . . , ld , xM , . . . , xM ) ∈ (0, ∞)d × Rd ⊂ R2d
1
d
Die Zielfunktion
als
benutzt.
des eindimensionalen konvexen VER-Problems (6.3)
ist
(i) konvex und
(ii) dierenzierbar.
Beweis.
(i) Zu zeigen ist, dass für alle
ˆl, r̂ ∈ (0, ∞)d × Rd
und alle
θ ∈ (0, 1)
die
Ungleichung
J1 θˆl + (1 − θ)r̂
erfüllt ist, wobei
≤ θJ1 ˆl) + (1 − θ)Jd (r̂
ˆl := (l1 , . . . , ld , xM , . . . , xM )
1
d
Die Logarithmusfunktion
log
ist wegen
72
d2
dx2
und
(6.4)
r̂ := (r1 , . . . , rd , y1M , . . . , ydM ).
log(x) = − x12
für alle
x ∈ (0, ∞)
6. Das konvexe VER-Problem
konkav. Daher gilt für alle li , ri
∈ (0, ∞), i = 1, . . . , d
und alle
θ ∈ (0, 1)
gerade
log(θli + (1 − θ)ri )) ≥ θ log(li ) + (1 − θ) log(ri )
und somit auch
d
X
log(θli + (1 − θ)ri )) ≥
i=1
d
Y
log
d
X
(θ log(li ) + (1 − θ) log ri ) ,
i=1
!
(θli + (1 − θ)ri )
≥ θ log
i=1
d
Y
!
+ (1 − θ) log
li
i=1
!
ri
.
i=1
Daraus folgt direkt die Ungleichung (6.4) für alle
alle
d
Y
ˆl, r̂ ∈ (0, ∞)d × Rd
und für
θ ∈ (0, 1).
(ii) Für alle
ˆl ∈ (0, ∞)d × Rd
gilt
M
∇J1 ˆl = ∇Jd l1 , . . . , ld , xM
1 , . . . , xd
T
1
1
∈ R2d .
=
− , . . . , − , 0, . . . , 0
l1
ld
Damit ist
Satz 6.7.
J1
dierenzierbar.
Die zulässige Menge
d
X
li i M li d
d ˆ
F1 = l ∈ (0, ∞) × R max f i xM
, f xi +
≤ fc ,
i −
2
2
i=1
−
xM
i
li
li
M
+ ≤ −xlb
≤ xub
i , xi +
i , i = 1, . . . , d
2
2
des eindimensionalen konvexen VER-Problems (6.3) ist konvex.
Beweis. Es reicht zu zeigen, dass die zugrundeliegenden Funktionen der Nebenbedingungen konvex sind, dann ist
F1
nach Satz 4.8 konvex.
Die Funktionen, welche die Bedingungen
li
lb M li
ub
−xM
i + 2 ≤ −xi ,xi + 2 ≤ xi , i = 1, . . . , d
beschreiben, sind linear und daher konvex.
Für
ˆl = (l1 , . . . , ld , xM , . . . , xM ) ∈ (0, ∞)d × Rd
1
d
und für
sei
xli := xM
i −
r̂ = (r1 , . . . , rd , y1M , . . . , ydM ) ∈ (0, ∞)d × Rd
73
li
2,
entsprechend
xui := xM
i +
yil := yiM −
li
2
ri
2,
6. Das konvexe VER-Problem
yiu := yiM +
ri
2,
i = 1, . . . , d.
Dann gilt für alle
ˆl, r̂ ∈ (0, ∞)d × Rd
und alle
θ ∈ (0, 1)
weiterhin
d
X
max fji θxli + (1 − θ)yil , fji θ(xui + (1 − θ)yiu
i=1
≤
≤
d
X
max θfji xli + (1 − θ)fji yil , θfji xui + (1 − θ)fji yiu
i=1
d X
θ max fji xli , fji xui + (1 − θ) max fji yil , fji yiu
i=1
= θ
d
X
d
X
max fji xli , fji xui + (1 − θ)
max fji yil , fji yiu ,
i=1
j = 1, . . . , m.
i=1
Somit ist gezeigt, dass die zulässige Menge
F1
konvex ist.
Aufgrund dieser Eigenschaften ist das eindimensionale konvexe VER-Problem (6.3)
ebenfalls ein konvexes Optimierungsproblem. Im Unterschied zum konvexen VERProblem (6.1) ist hierbei die Zielfunktion stets dierenzierbar. Allerdings ist die
Funktion
max(·, ·), welche in den Nebenbedingungen des eindimensionalen konvexen
VER-Problems auftritt, nicht dierenzierbar.
Beim konvexen VER-Problem (6.1) mit eindimensionaler Struktur liegen die Variablen der Zielfunktion im
Rmd
und die Anzahl der Nebenbedingungen beträgt
m.
Vergleichsweise dazu sind die Variablen der Zielfunktion des eindimensionalen konvexen VER-Problems (6.3) im
m + 3d.
R2d
und die Anzahl der Nebenbedingungen beträgt
Unter Verwendung eines identischen Optimierungsalgorithmus kann somit
ein geringerer Rechenaufwand bei der Berechnung einer optimalen Lösung mithilfe
des eindimensionalen konvexen VER-Problems erst ab
Bemerkung 6.8.
m>2
erzielt werden.
Dierenzierbarkeit in den Nebenbedingungen beim eindimensio-
nalen konvexen VER-Problem (6.3) könnte erreicht werden, indem anstatt des Terms
max(f i (xM
i −
li
i M
2 ), f (xi
+
li
2 )) alle möglichen Kombinationen der
f i (xM
i ±
li
2 ) mit
i = 1, . . . , d untersucht werden würden. D.h. anstatt m Ungleichungen müssten dann
m · 2d
Ungleichungen erfüllt sein. Da in diesem Fall die Anzahl der Ungleichungen
exponentiell mit
d
wächst, wird dieses Vorgehen im Folgenden nicht weiter verfolgt.
Nachfolgend wird das Beispiel 6.4 erneut aufgegrien und als eindimensionales konvexes VER-Problem dargestellt. Hierbei können die Nebenbedingungen so vereinfacht
werden, dass die zugrundeliegende Funktionen allesamt dierenzierbar sind.
74
6. Das konvexe VER-Problem
Beispiel 6.9.
Für die Designmenge
Outputfunktion
Outputgrenze
Ωds = [−1,5, 2,5] × [−1,5, 1,5]
und die konvexe
f = (f1 , f2 )T : R2 → R2 , x 7→ ((x1 )2 + (x2 )2 , (x1 − 1)2 + (x2 )2
fc =
mit
(1, 1)T ist eine optimale Lösung des eindimensionalen konvexen
VER-Problems (6.3) gesucht.
Die Nebenbedingungen zu diesem Beispielproblem lauten
l1 2
l1 2
+ max
xM
, xM
1 − 2
1 + 2
2
2 l1
l1
M
M
x1 − 2 − 1 , x1 + 2 − 1
+ max
xM
2 −
max
max
für
M
2
2
2d
(l1 , l2 , xM
1 , x2 ) ∈ (0, ∞) × R ⊂ R .
xM
2
−
l2 2
2 ,
l2 2
,
2
l2 2
2 l2 2
xM
+
2
2
M
−x1 + l21
l2
−xM
2 + 2
l1
xM
1 + 2
l2
xM
2 + 2
xM
2 +
≤ 1,
≤ 1,
≤ 1,5,
≤ 1,5,
≤ 2,5,
≤ 1,5
Aus Symmetriegründen muss für ei-
M,∗ M,∗
ne optimale Lösung (x1 , x2 ) = (0,5, 0) gelten. Zusammen mit der Eigenschaft
{x ∈ R2 | f (x) ≤ fc } = Ωfc reduzieren sich die Nebenbedingungen des Optimierungsproblems zu
l1
+ 0,5
2
2
2
l2
+
= 1.
2
Die KKT-Bedingungen
l1∗
+λ
+ 0,5
= 0,
2
l∗
l1∗ + λ 2 = 0,
2
∗
2 ∗ 2
l1
l
+ 0,5 + 2
= 1
2
2
l2∗
sind dann für
(l1∗ , l2∗ , λ∗ ) = (0,69, 1,08, −1,28)
erfüllt, wobei die Einträge auf zwei
Nachkommastellen gerundet wurden. Deshalb ist
(0,69, 1,08, 0,5, 0) ∈ (0, ∞)2 × R2
eine optimale Lösung des Beispielproblems. Damit kann die optimale Lösung des
zugehörigen analytischen Problems aus Beispiel 6.4 zurückgerechnet werden.
75
7. Numerische Lösung des konvexen VER-Problems
7. Numerische Lösung des konvexen VER-Problems
In diesem Kapitel wird vorgestellt, wie das konvexe VER-Problem mit ein- oder zweidimensionaler Struktur numerisch gelöst werden kann. Dafür wird in dieser Arbeit
die Software Matlab
R
verwendet. Im Vordergrund steht hierbei das Gesamtvorge-
hen um eine numerische Lösung zu erhalten. Daher werden einige Aspekte nur grob
behandelt und mathematische Aussagen nicht detailliert begründet.
7.1. Grundlegendes
R
Um Optimierungsprobleme der Form (4.10) zu lösen, gibt es in Matlab
imple-
mentierte Algorithmen. Für den Fall, dass die zugrundeliegenden Funktionen des
Problems (4.10) stetig dierenzierbar sind, eignet sich beispielsweise ein sogenanntes Innere-Punkte-Verfahren, welches über den Befehl fmincon aufgerufen werden
kann und sich durch eine relativ schnelle Berechnung der Lösung auszeichnet. Falls
die entsprechenden Ableitungen nicht existieren, ist ein direktes Suchverfahren hilfreich, was beispielsweise in der Matlab
R -Routine patternsearch
hinterlegt ist und
mehr Zeit für die Lösungsndung benötigt. Im Folgenden werden die beiden erwähnten Verfahren kurz vorgestellt.
Innere-Punkte-Verfahren mit fmincon
Der Innere-Punkte-Algorithmus der Routine
blem (4.10) mit
D=
fmincon versucht das Minimierungspro-
Rd zu lösen, indem es eine Folge approximierter Minimierungs-
probleme löst, die jeweils durch den Parameter
lautet das
σ beschrieben werden. Für σ ∈ (0, ∞)
approximierte Minimierungsproblem
minimiere
(x,s)∈Rd ×(0,∞)m
u.d.N.
Die Variable
s ∈ (0, ∞)m
J(x) − σ
m
P
log(sj )
(7.1)
j=1
e(x) = ec , f (x) + s = fc .
heiÿt Schlupfvariable und der hinzugefügte Term der
Zielfunktion logarithmische Barriere, vgl. [11]. Hiermit wird dafür gesorgt, dass die
Ungleichungsbedingung
f (x) ≤ fc
für
x ∈ Rd
zeichnung innere Punkte motiviert. Kann
strikt eingehalten wird, was die Be-
s ∈ (0, ∞)m garantiert werden, so enthält
das approximierte Problem keine Ungleichungsbedingung mehr. Dadurch vereinfachen sich die KKT-Bedingungen (4.13)-(4.17). Für
σ → 0
wird erwartet, dass die
Lösung des approximierten Problems (7.1) gegen die Lösung von (4.10) konvergiert.
76
7. Numerische Lösung des konvexen VER-Problems
Ausgehend von einem Startwert
(x0 , s0 ) ∈ Rd × (0, ∞)m
Algorithmus zu jeder Iteration ein Newton-Schritt
(∆x, ∆s)
versucht der Matlab
R-
durchzuführen, um das
approximative Problem zu lösen. Dabei werden die entsprechenden Gleichungen der
KKT-Bedingungen des approximierten Minimierungsproblems (7.1) mithilfe linearer
Approximation gelöst. Für konvexe Probleme ist der Newton-Schritt in der Regel
durchführbar. Falls dies nicht der Fall ist, wird ein sogenannter CG-Schritt getestet,
siehe [17] für weitere Informationen. Der Algorithmus bricht insbesondere dann ab,
wenn die Optimalitätskriterien erster Ordnung bis auf eine bestimmte Toleranz erfüllt
sind. Die Grundlagen des von Matlab
R
implementierten Innere-Punkte-Verfahrens
nden sich in [5].
Direktes Suchverfahren mit patternsearch
Der allgemeine Patternsearch-Algorithmus in der Matlab
R -Routine patternsearch
generiert eine Folge von Punkten, welche sich einer Lösung des Minimierungsproblems (4.10) annähert. In jedem Schritt wird auf einer Menge von Punkten, welche in einer Umgebung eines aktuellen Punktes liegen und Netz genannt werden,
nach einem Punkt gesucht, dessen Zielfunktionswert geringer ist als der des aktuellen Punktes. Im Erfolgsfall wird ein solcher Punkt dann zum nächsten aktuellen
Punkt des Algorithmus. Bei diesem Vorgehen werden keine Ableitungsinformationen
der Zielfunktion benötigt, weshalb auch von einer direkten Suchmethode gesprochen
wird.
Sofern keine Nebenbedingungen verletzt werden, besteht das Netz aus
2d
Punkten,
welche entlang der Koordinatenachsen ausgerichtet sind und vom aktuellen Punkt
einen gewissen Abstand
s,
auch Netzgröÿe genannt, haben. Treten lineare Nebenbe-
dingungen auf, so wird das Netz so modiziert, dass nur zulässige Punkte für das
Netz erlaubt werden. Falls auch nichtlineare Nebenbedingungen vorliegen, wird ein
sogenannter erweiterter Lagrangescher Patternsearch-Algorithmus verwendet, der,
wie die
fmincon-Routine,
Barrieren in der Zielfunktion benutzt, siehe [15].
Sobald ein Punkt des Netzes gefunden wurde, welcher einen geringeren Wert der
Zielfunktion aufweist als der aktuelle Punkt, wird dieser zum neuen aktuellen Punkt
und ein neues Netz mit doppelter Netzgröÿe wird erzeugt. Wenn keiner der Zielfunktionsfunktionswerte der Netzpunkte kleiner ist als der des aktuellen Punktes, wird
ein neues Netz um den selben Punkt mit halber Netzgröÿe erzeugt. Der Algorithmus
bricht insbesondere dann ab, wenn
s
einen kritischen Wert unterschreitet.
Der Patternsearch-Algorithmus von Matlab
tion auf Netzpunkten den Wert
∞
R
funktioniert auch, wenn die Zielfunk-
annimmt, indem diese Punkte ignoriert werden.
77
7. Numerische Lösung des konvexen VER-Problems
Ist dies für alle Netzpunkte der Fall, so wird ein neues Netz mit halbem Abstand
erzeugt. Daher ist es wichtig mit einem Punkt zu starten, dessen Zielfunktionswert
kleiner als
∞
ist, worauf im Folgenden näher eingegangen wird.
In [17] sind Details zum Matlab
R
implementierten Algorithmus zu nden und in [3]
theoretische Untersuchungen zu diesem.
An dieser Stelle sei auÿerdem bemerkt, dass es neben den beiden vorgestellten Algorithmen noch viele weitere gibt, um Optimierungsprobleme zu lösen, siehe [11].
Auch in [2] werden Optimierungsalgorithmen vorgestellt, die insbesondere für konvexe, nichtdierenzierbare Probleme geeignet sind.
Startwertbestimmung
Für das konvexe VER-Problem (6.1) ist ein Startwert
n
Q
1 , . . . , fn ) ∈
(fc,0
c,0
Rm
ge-
k=1
sucht mit
1 , . . . , fn ) ∈ F
(fc,0
an
c,0
1 , . . . , f n ) < ∞.
Jan (fc,0
c,0
und
Im Folgenden wird be-
schrieben, wie ein solcher Startwert gefunden werden kann.
Zunächst wird dazu das Optimierungsproblem
minimiere kf (x) − fc k∞
x∈Rd
(7.2)
ub
−xi ≤ −xlb
i , xi ≤ xi , i = 1, . . . , d
u.d.N.
gelöst. Dieses ist wie in Beispiel 4.20 beschrieben ein konvexes Problem, wobei die
Zielfunktion generell nicht dierenzierbar ist. Zur Lösung des Problems kann deshalb
R -Routine patternsearch
die Matlab
verwendet werden. Analog zu Problem (4.12)
könnte dieses Problem auch auf ein Problem transformiert werden, bei welchem die
zugrundeliegende Funktionen dierenzierbar sind, sofern
Falls für eine optimale Lösung
existiert kein
x ∈ Ωds
mit
Lebesgue-Maÿ vom Wert
x∗ ∈ F
f (x) ≤ fc .
0
von (7.2) nun
f
dierenzierbar ist.
kf (x∗ ) − fc k∞ > 0
Deshalb hat die zulässige Designmenge
und somit auch jedes kartesische Produkt
n
Q
k=1
mit
gilt, so
Ωfc
Ωkf k
c
ein
⊂ Ωfc
(fc1 , . . . , fcn ) ∈ Fan .
kf (x∗ )−fc k∞ < 0 gibt es ein s = (s1 , . . . , sm ) ∈ (0, ∞)m mit f (x∗ )+s = fc .
n
Q
1
n
k
Rm mit fc,0,j
= f k (x∗ ) + n1 sj für
Startwert eignet sich dann (fc,0 , . . . , fc,0 ) ∈
Im Falle
Als
j = 1, . . . , m, k = 1, . . . , n,
d.h.
n
P
k=1
k
fc,0
= fc ,
also
1 , . . . , fn ) ∈ F.
(fc,0
c,0
Aufgrund der
k=1
Stetigkeit von
f
und damit der Funktionen
78
f k , existieren rk ∈ (0, ∞), sodass für alle
7. Numerische Lösung des konvexen VER-Problems
xk ∈ B(x∗,k , rk ) ∩ Ωkds
gilt
k , k = 1, . . . , n.
f k (xk ) < fc,0
Daraus folgt, dass
n
Q
Ωkf k
c,0
k=1
1
n
ein positives Lebesque-Maÿ hat und damit Jan (fc,0 , . . . , fc,0 ) < ∞.
∗
Falls kf (x )−fc k∞ = 0 gilt, so muss zunächst geprüft werden, ob Ωfc eine Nullmenge
ist. Wenn dies nicht zutrit, kann der Startwert für die Optimierung wie im Fall
kf (x∗ ) − fc k∞ < 0
gewählt werden mit
s ∈ [0, ∞)m .
Analog kann über eine Lösung
x∗ ∈ F
des Minimierungsproblems (7.2) ein Startwert
M
(l0,1 , . . . , l0,d , xM
0,1 , . . . , x0,d )
(0, ∞)d
× Rd
∈
∗
Problem (6.3) gefunden werden. Gilt für x
für das eindimensionale konvexe VER-
∈F
gerade
kf (x∗ )−fc k∞ < 0, mit −x∗i <
x∗i < xub
i für i = 1, . . . , d, so existiert aufgrund der Stetigkeit von f ein l0 ∈
d
P
l0,i
l0,i
l0,i
l
i ∗
∗
lb
∗
(0, ∞)d mit
max(f i (x∗i − 0,i
2 ), f (xi + 2 )) < fc , −xi + 2 < −xi und xi + 2 <
−xlb
i
und
i=1
xub
i
für
∗
i = 1, . . . , d. Darum kann hier xM
0 =x
und l0 komponentenweise hinreichend
klein gewählt werden. Dann ist für das so gewählte
M
(l0,1 , . . . , l0,d , xM
0,1 , . . . , x0,d ) ∈
(0, ∞)d × Rd
auÿerdem die Regularitätsbedingung von Slater erfüllt.
Für den Fall
kf (x∗ ) − fc k∞ ≥ 0
gelten die Aussagen des vorherigen Absatzes.
Numerische Approximation des Lebesgue-Maÿes
Da eine analytische Beschreibung der Zielfunktion des analytischen VER-Problems
im Allgemeinen sehr komplex ist, vgl. Bemerkung 5.14, wird in diesem Kapitel vorgestellt, wie sie numerisch für zwei- bzw. eindimensionale Strukturen
s
berechnet wer-
den kann. Insbesondere wird dazu beschrieben, wie das Lebesgue-Maÿ einer Menge
Ωkf k = {xk ∈ Ωkds | f k (xk ) ≤ fck } ⊂ R2
c
mit
k ∈ {1, . . . , n}, das gerade dem Flächenin-
halt dieser Menge entspricht, berechnen werden kann. Im Folgenden wird der Index
k
der Einfachheit halber weggelassen, d.h. es wird ein beliebiger Index
k
mit d
=2
betrachtet.
In einem ersten Schritt werden zwei äquidistante Gitter,
gelegt. Seien
und
k ∈ {1, . . . , n}
nG,1 ∈ N
nG,2 ∈ N
G
und
die Anzahl der Gitterpunkte des Gitters
die Anzahl der Gitterpunkte in
x2 -Richtung.
e,
G
G
über
in
x1 -Richtung
Die beiden Gitter sind
deniert über
lb
G = {(xlb
1 + i1 h1 , x2 + i2 h2 ) | i1 ∈ IG,1 , i2 ∈ IG,2 },
lb
e = {(xlb
G
e }
e , i2 ∈ IG,2
1 + i1 h1 , x2 + i2 h2 ) | i1 ∈ IG,1
79
Ωds ⊂ R2
7. Numerische Lösung des konvexen VER-Problems
mit Gitterschrittweiten
IG,1 := { 12 , 32 , . . . , nGd ,1 −
und
lb
xub
xub −xlb
1 −x1
2
und h2 := 2
sowie Gitterindexmengen
nG,1
nG,2
1
1 3
1
e := {0, 1, . . . , nG,1 }
2 }, IG,2 := { 2 , 2 , . . . , nG,2 − 2 }, IG,1
h1 :=
IG,2
e := {0, 1, . . . , nG,2 }.
In Abbildung 7.1 sind die beiden Gitter dargestellt.
Abbildung 7.1: Darstellung des Gitters
G
anhand von Punkten und des Gitter
e
G
anhand von Schnittpunkten der durchgezogenen Linien
Im nächsten Schritt wird die Funktion
gewertet. Sofern ein Punkt
welcher eindeutig über i1
f (xG ) ≤ fc
RxG ,
xG ∈ G
∈ IG,1
und i2
f
an jedem Gitterpunkt des Gitters
mit
lb
G
aus-
lb
(xG,1 , xG,2 ) := (x1 + i1 h1 , x2 + i2 h2 ),
∈ IG,2
bestimmt ist, das Ungleichungssystem
erfüllt, heiÿt dieser gültig. In diesem Fall wird das zugehörige Rechteck
deniert über
RxG := {x ∈ R2 | xG,1 −
h1
h1
h2
h2
< x1 < xG,1 + , xG,2 −
< x2 < xG,2 + }
2
2
2
2
λ2 (RxG ) = h1 h2
RxG
h1
h2
h1
h2
ist oen und wird durch die Gitterpunkte (xG,1 −
2 , xG,2 − 2 ), (xG,1 + 2 , xG,2 − 2 ),
e festgelegt. Erfüllt der
(xG,1 + h21 , xG,2 + h22 ) und (xG,1 − h21 , xG,2 + h22 ) des Gitters G
mit Flächeninhalt
Gitterpunkt
xG ,
xG ∈ G
ebenfalls als gültig erachtet. Das Rechteck
das Ungleichungssystem
als auch das zugehöriges Rechteck
RxG
f (xG ) ≤ fc
nicht, dann wird sowohl
als ungültig erachtet.
Im letzten Schritt lässt sich nun der Flächeninhalt der Menge
zahl der gültigen Gitterpunkte
nG,v ,
Ωf c
über die An-
die Gesamtanzahl aller Gitterpunkte und dem
80
7. Numerische Lösung des konvexen VER-Problems
Flächeninhalt von
Ωds
bestimmen, d.h. genauer
nG,v
ub
lb
(xub − xlb
1 )(x2 − x2 ) + εG ,
nG,1 nG,2 1
λ2 (Ωfc ) =
wobei
εG
(7.3)
der Approximationsfehler ist, der bei dieser diskreten Art der Berechnung
entsteht und sogleich genauer untersucht wird.
In Abbildung 7.2 wird dieses Verfahren der numerischen Berechnung des Flächen-
f (x) ≤ fc
inhalts anhand einer Ellipse, welche über eine Ungleichung der Form
x ∈ Ωds
für
dargestellt werden kann, illustriert.
Abbildung 7.2: Zur numerischen Berechnung des Flächeninhalts mit gültigen Rechtecken (weiÿ), ungültigen Rechtecken (blau), Rechtecken, die zu einem
Fehler in der Flächenberechnung führen (rot umrandet)
Der Rand der Menge
Ω fc ,
welcher mit
∂Ωfc
bezeichnet wird, trennt die gültigen von
den ungültigen Punkten, wobei alle Punkte auf dem Rand gültig sind. Ein Rechteck
RxG
kann also nur dann einen Beitrag zum Approximationsfehler
∂Ωfc ∩ RxG 6= ∅
gilt, d.h.
absolute Anteil von
Sei
RxG
RxG ∩∂Ωfc = ∂Ωfc
RxG
eine Nullmenge mit
{xG } ∈ Ωfc
also
RxG ∩ ∂Ωfc ( ∂Ωfc
für
L(∂Ωfc ),
∆εG
bezeichnet.
xG ∈ G. Der Approximationsfehler wird maximal, wenn
Ω fc
Objekt mit Länge
leisten, wenn
sowohl gültige als auch ungültige Punkte enthält. Der
am Gesamtfehler wird von nun an mit
für ein
εG
x G ∈ G.
wobei
L
ist, d.h.
εG = ∆εG = h1 h2 .
Sei im Folgenden
Der Rand ist daher stets ein eindimensionales
einer Kurve ihre Länge zuordnet. Der absolute
Anteil der Länge des Randes, der auf
RxG
81
fällt, sei nun
∆L(∂Ωfc ).
Gesucht ist
7. Numerische Lösung des konvexen VER-Problems
dann das maximal mögliche Verhältnis
∆εG
∆L(∂Ωfc ) . Durch Ausloten der verschiedenen
Möglichkeiten, wie ein Teil des Randes einer konvexen Menge in
RxG
liegen kann,
ergibt sich, dass
∆εG
≤
∆L(∂Ωfc )
1
2
h1 h2
= 2 max{h1 , h2 }
min{h1 , h2 }
gilt. Dies ist gerade der Fall wenn
Abbildung 7.3 zu sehen in
RxG
Ω fc
selbst ein eindimensionales Objekt ist und wie
liegt, sodass
xG
und damit
RxG
gültig sind.
Abbildung 7.3: Beispiel für das Auftreten des maximalen Verhältnisses
2h1
Mithilfe
für
∆εG
∆L(∂Ωfc )
=
h2 < h1
∆εG
∆L(∂Ωfc ) L(∂Ωfc ) kann
εG
nach oben abgeschätzt werden. Es gilt, dass die
Länge des Randes einer konvexen Menge stets kleiner als die Länge des Randes
einer Menge ist, welche diese einschlieÿt. Dies kann damit begründet werden, dass
eine nächste-Punkte-Projektion von einer einschlieÿenden auf eine konvexe Menge
kontrahierend ist. Mit
Ωfc ⊂ Ωds
folgt daher
lb
ub
lb
εG ≤ 4 max{h1 , h2 } (xub
1 − x1 ) + (x2 − x2 ) .
Mit
h := max{h1 , h2 }
ergibt sich dann insgesamt
um einen Fehler erster Ordnung in
εG = O(h),
d.h. es handelt sich
h.
Das approximierte Lebesgue-Maÿ einer Menge
Ωkf k ⊂ R
c
mit
k ∈ {1, . . . , n}
lässt
sich im Eindimensionalen auf eine ähnliche, aber unkompliziertere Weise bestimmen.
Hierbei ist der Fehler ebenfalls erster Ordnung in der Gitterschrittweite
h.
Insgesamt können damit nun Rückschlüsse auf den Gesamtfehler bei der Berechnung
des Volumens eines
n-fachen kartesischen Produkts
n
Q
k=1
für
k = 1, . . . , n,
Ωkfc
mit
gezogen werden. Wird das Volumen über
Ωkfc ⊂ Rd
n
Q
k=1
mit
h
k
k
und
λd (Ωkfc )
dk ≤ 2
bestimmt
als gröÿte auftretende Gitterschrittweite für die numerische Berechnung von
82
7. Numerische Lösung des konvexen VER-Problems
k
λd (Ωkfc ), k = 1, . . . , n,
so ist auch der Gesamtfehler von erster Ordnung in
Analoge Betrachtungen können auch für ein
n-faches
h.
kartesisches Produkt
n
Q
k=1
mit
Ωkfc ⊂ Rd
k
konvex und
d1 > 2
Ωkfc
gemacht werden. Es sei bemerkt, dass auch im
nicht konvexen Fall die Approximation des Lebesgue-Maÿes auf diese Weise erfolgen
kann. Allerdings gilt dann die Abschätzung für den Fehler
εG
nicht mehr.
7.2. Beispielprobleme
Nun stehen alle Hilfsmittel bereit, um das konvexe analytische VER-Problem (6.1)
für eine ein- bzw. zweidimensionale Struktur numerisch lösen zu können. Als Beispiel
wird zunächst das Problem aus Beispiel 6.3 aufgegrien und die numerische Lösung
mit der tatsächlichen, optimalen Lösung verglichen. Anschlieÿend wird ein Praxisbeispiel mit einer realistischen Outputfunktion und realistischen Outputgrenzen betrachtet. Zur numerischen Lösung wird ein Rechner verwendet, dessen Eigenschaften
in Anhang A aufgeführt sind. Für die Lösungsndung wird hierbei auÿerdem die
Gitterschrittweite in allen Dimensionen konstant gewählt.
Numerische Lösung zu Beispiel 6.3
Ωfc ⊂ [−1, 1]3
Da für die zulässige Designmenge in Beispiel 6.3 gerade
Ωds =
Beispiel 7.1.
Für die Designmenge
Ωds = [−1, 1]3 ,
f : R3 → R, x 7→ kxk22 = (x1 )2 + (x2 )2 + (x3 )2
tur
gilt, wird hier
[−1, 1]3 als Designmenge gewählt.
s = (2, 1)
die konvexe Outputfunktion
mit Outputgrenze
fc = 1
und Struk-
ist eine optimale Lösung des konvexen VER-Problems (6.1) gesucht.
Mit den Methoden aus Kapitel 7.1 kann die Lösung des Problems numerisch bestimmt werden. Dazu wird die Matlab
R -Routine patternsearch
unter Standard-
einstellungen verwendet und die Approximation des Lebesgue-Maÿes je einmal mit
der Gitterschrittweite
h = 0,1, h = 0,01
und
h = 0,001
durchgeführt. Als Startwert
für die Optimierung ergibt sich mit der in Kapitel 7.1 beschriebenen Vorgehensweise
fc,0 = (0,5, 0,5).
Die zur numerisch berechneten Lösung gehörigen Mengen sind für
die drei Varianten der Gitterschrittweite in Abbildung 7.4 dargestellt.
Abbildung 7.5 stellt die Dierenz zwischen der zweiten Komponente der numerisch
berechneten Lösung und der zweiten Komponente der tatsächlichen Lösung, d.h.
fc∗,2
aus Beispiel 6.3, dar. Die Dierenz in der ersten Komponente ist identisch mit dieser,
da für jedes Element
fˆc ∈ R2
der zulässigen Menge
83
fc1 + fc2 = 1
gelten muss.
7. Numerische Lösung des konvexen VER-Problems
Abbildung 7.4: Zur numerisch berechneten, optimalen Lösung des Beispielproblems
gehörige Mengen (weiÿ) für
h = 0,001
(unten)
84
h = 0,1
(oben),
h = 0,01
(Mitte) und
7. Numerische Lösung des konvexen VER-Problems
Abbildung 7.5: Dierenz zwischen der zweiten Komponente der numerisch berechneten Lösung und der zweiten Komponente der tatsächlichen Lösung
auf der
z -Achse
für die verschiedenen Gitterschrittweiten auf einer
logarithmischen Skala der
h-Achse
In Abbildung 7.5 ist zu erkennen, dass sich die numerisch berechnete Lösung für eine
kleinere Gitterschrittweite der tatsächlichen Lösung annähert. Um auch die Anwendbarkeit der verschiedenen Gitterschrittweiten vergleichen zu können, werden die zur
Berechnung benötigten CPU-Zeiten in Tabelle 7.1 angegeben. Auÿerdem sind dort
die zugehörigen Funktionswerte dargestellt. Die Werte sind dabei auf zwei Nachkommastellen gerundet.
Jan (fˆ)
CPU-Zeit in s
0,1
-0,95
0,03
0,01
-0,89
0,11
0,001
-0,89
12,50
h
Tabelle 7.1: Funktionswerte der Zielfunktion und die CPU-Zeiten der Simulation für
verschiedene Gitterschrittweiten
85
7. Numerische Lösung des konvexen VER-Problems
Genau wie die numerische Lösung sich der exakten optimalen Lösung für kleiner
werdendes
h
annähert, so nähert sich auch der Zielfunktionswert dem der exakten
optimalen Lösung, d.h.
−0,88 , siehe Tabelle 7.1. Die Genauigkeit in der numerischen
Approximation korreliert jedoch mit der Simulationszeit. Je kleiner die Gitterschrittweite für die Approximation des Lebesgue-Maÿes ist, desto gröÿer ist die CPU-Zeit
der Simulation.
Praxisbeispiel
Jetzt wird ein Praxisbeispiel mit zwölf Designkomponenten, neun Anforderungen
und einer linearen Outputfunktion betrachtet. Dabei ist die Designmenge
[−1, 1]12 transformiert, d.h. es gilt
Beispiel 7.2.
Für die Designmenge
→
R9 ,

0,00
0,00








F =








0,01
0,01
f:
R12
xlb
i
x 7→ F x
= −1
ub
und xi
Ωds = [−1, 1]12 ,
−0,03 −0,08
0,72
1,58
0,00
...
−0,01
0,03
...
−0,03 −0,05
0,00
0,62
0,91
0,00
−0,62 −0,91
0,09
0,00
0,02
−0,03 . . .
0,00
...
−0,04 −0,04 −0,10 . . .
−0,02 −0,02 −0,08
0,00
i = 1, . . . , d.
die lineare Outputfunktion
0,00
0,01
0,00
für
auf
mit
−0,01 −0,01 −0,72 −1,58
0,00
=1
Ωds
0,00
0,04
0, 02
0,08
0,28
0,40
...
0,04
0,10
...
−0,28 −0,40 . . .
−0,03 −1,47 −0,91 −2,48 −2,11 . . .
. . . −0,02 −0,05 −0,04 −0,16 −0,24 −0,16

. . . −0,29 −0,46 −0,65 −2,22 −3,03

2,83 

. . . 0,29
0,46
0,65
2,22
3,03 −2,83 


. . . 0,00 −0,01 0,02
0,07
0,07 −0,12 

9×12
. . . −0,03 −0,09 −0,11 −0,24 0,02
0,01 
∈R

. . . 0,03
0,09
0,11
0,24 −0,02 −0,01 

. . . 0,00 −0,02 −0,02 −0, 06 0,00
0,00 


. . . 0,00
0,02
0,02
0,06
0,00
0,00 
. . . 0,04
0,15
0,26
0,45
0,02
0,01
und Outputgrenze
fc = (−0,03, 1,52, 3,48, 0,15, −0,24, 0,74, −0,17, 0,67, 2,56)T
ist ei-
ne optimale Lösung des konvexen VER-Problems (6.1) sowohl für eine eindimensionale Struktur als auch für eine zweidimensionale Struktur, deren Einträge alle den
86
7. Numerische Lösung des konvexen VER-Problems
Wert zwei haben, gesucht.
Wie im vorherigen Beispiel wird die Lösung des VER-Problems mit zweidimensionaler Struktur numerisch mit der Matlab
R -Routine patternsearch
unter Standard-
einstellungen berechnet. Der Startwert wird dazu wie in 7.1 beschrieben bestimmt
und als Gitterschrittweite für die Approximation des Lebesgue-Maÿes wird
h = 0.01
gewählt. Die Lösung, die sich daraus ergibt, ist in Abbildung 7.6 in Form ihrer zugehörigen Mengen dargestellt.
Um die Lösung des Problems mit eindimensionaler Struktur zu erhalten, wird das
eindimensionale konvexe VER-Problem (6.3) gelöst. Da die Outpufunktion linear ist,
sind die Funktionen, welche den Nebenbedingungen zugrunde liegen, dierenzierbar.
Numerisch kann das Problem deshalb mit der Matlab
R -Routine fmincon
gelöst wer-
den, wobei der Startwert wieder wie in Kapitel 7.1 beschrieben gewählt wird und für
R -Routine fmincon
die Matlab
Standardeinstellungen verwendet werden. Die zur op-
timalen Lösung gehörigen Mengen mit eindimensionaler Struktur sind in Abbildung
7.6 zusammen mit den zur optimalen Lösung gehörigen Mengen des Problems mit
zweidimensionaler Struktur dargestellt.
In Tabelle 7.2 sind zusätzlich die Funktionswerte der Zielfunktionen sowie die CPUZeiten der Simulation für die hier verwendeten Berechnungsmethoden angegeben.
Darüber hinaus werden entsprechende Eigenschaften weiterer Berechnungsmethoden
aufgeführt. Alle ermittelte Werte sind dabei auf zwei Nachkommastellen gerundet.
R -Routine
Struktur
Matlab
eindimensional
eindimensional
eindimensional
zweidimensional
zweidimensional
fmincon
patternsearch
patternsearch
patternsearch
patternsearch
J1 (ˆl)
CPU-Zeit in s
-
10.47
0,56
0,1
13,11
5,75
0,01
12,98
27,89
0,1
1,85
8,41
0,01
1.69
1340,39
h
Jan (fˆ)
bzw.
Tabelle 7.2: Funktionswerte der Zielfunktionen und die CPU-Zeiten der Simulation
für verschiedene Berechnungsmethoden
Nun können die Berechnungsmethoden untereinander verglichen werden. Zunächst
ist dabei der Fokus auf den Vergleich der beiden verwendeten Strukturen untereinander gerichtet, später auf den Vergleich der verschiedenen Berechnungsmethoden
innerhalb einer Struktur.
87
7. Numerische Lösung des konvexen VER-Problems
Abbildung 7.6: Zur numerisch berechneten, optimalen Lösung des Beispielproblems
gehörige Mengen für die zweidimensionale Struktur (weiÿ) und für
die eindimensionale Struktur (schwarz umrandet)
In Tabelle 7.2 ist zu erkennen, dass der Zielfunktionswert der numerisch berechneten,
optimalen Lösung für eine zweidimensionialen Struktur deutlich kleiner ist als der
für eine eindimensionale Struktur. Dies bedeutet, dass die Verwendung einer höherdimensionalen Struktur ein gröÿeres Volumen ermöglicht. Dies ist auch in Abbildung
88
7. Numerische Lösung des konvexen VER-Problems
7.6 gut zu sehen. Auÿerdem stellt sich hier heraus, dass das kartesische Produkt
der zur optimalen Lösung gehörigen Mengen für eine eindimensionale Struktur nicht
unbedingt eine Teilmenge des kartesischen Produkts der zur optimalen Lösung gehörigen Mengen für eine zweidimensionale Struktur sein muss.
Wie bereits in Beispiel 7.1 steigt auch hier die CPU-Zeit bei einer Verfeinerung der
R -Routine patternsearch
Gitterschrittweite unter Verwendung der Matlab
stark an.
Dieser Eekt ist bei einer zweidimensionalen Struktur gegenüber einer eindimensionalen Struktur nochmals verstärkt. Dies beruht darauf, dass die Anzahl der Funktionsauswertungen, welche bei der numerischen Approximation des Lebesgue-Maÿes
im
R2
gegenüber der numerischen Approximation im
R
anfallen, quadriert werden
müssen.
R -Routine fmincon
Auch im Vergleich zur Matlab
dung der Routine
ist die CPU-Zeit bei der Verwen-
patternsearch generell gröÿer. Einerseits ist dies darin begründet,
dass eine Suche mit Gradienteninformationen gegenüber einer direkten Suche schneller ist. Andererseits sind die Optimierungsvariablen des zugrundeliegenden, konvexen
VER-Problems (6.1) für eine eindimensionale Struktur im
Rmd ,
wobei
md = 108.
Dies bedeutet, dass die Dimension der Optimierungsvariablen des konvexen VERProblems (6.1) ebenfalls groÿ gegenüber der Dimension der Optimierungsvariablen
des eindimensionalen konvexen VER-Problems (6.3) mit
2d = 24
ist.
Durch die Approximation des Lebesgue-Maÿes ist auÿerdem die Zielfunktion des
konvexen analytischen VER-Problems (6.1) eine Stufenfunktion, weshalb es nicht
immer möglich ist, die tatsächliche Lösung des Problems bestmöglich zu approximieren. Damit kann erklärt werden, warum der Zielfunktionswert bei der Verwendung der Matlab
von
R -Routine patternsearch
fmincon.
89
gröÿer ist als der bei der Verwendung
8. Fazit
8. Fazit
Das Ziel der Arbeit war es zunächst das Problem eine volumenmaximale Rechtecksmenge zu nden, welche in eine über mehrere Anforderungen denierte Menge
einbeschrieben ist in einem mathematischen Kontext zu beschreiben. Hierzu wurde
in Kapitel 5 das sogenannte volumenmaximale-einbeschriebene-RechtecksmengenProblem, oder kurz VER-Problem, als abstraktes Optimierungsproblem formuliert.
Diese Formulierung basiert unter anderem auf den Produktraumeigenschaften des
euklidischen Raums
Rd
und den darin enthaltenen Borel-Mengen, denen ein Volu-
men zugeordnet werden kann. Die entsprechenden Grundlagen dafür wurden in den
Kapiteln 2 und 3 untersucht.
Um das VER-Problem mit gängigen Optimierungsalgorithmen lösen zu können, wurde eine analytische Version des VER-Problems eingeführt. Diese gilt für Anforderungen, welche durch additiv zerlegbare und messbare Funktionen festgelegt sind.
Es konnte gezeigt werden, dass die Zielfunktion des analytischen VER-Problems
unterhalb-stetig ist und somit das Problem eine optimale Lösung besitzt. Allerdings
traten in einem Beispiel auch lokale, nicht globale Lösungen auf. Deshalb ist nicht
garantiert, dass ein Optimierungsalgorithmus die zu einem VER-Problem gehörige,
gröÿtmögliche Rechtecksmenge ndet.
Unter der stärkeren Voraussetzung, dass die Funktionen, welche die Anforderung beschrieben, sowohl additiv zerlegbar als auch konvex sind, konnte in Kapitel 6 nachgewiesen werden, dass das VER-Problem ein konvexes Optimierungsproblem ist. Somit
ist jede lokale Lösung des konvexen VER-Problems auch eine globale. Die Nachweise dazu beruhen auf den in Kapitel 4 gemachten, theoretischen Betrachtungen
über konvexe Mengen und Funktionen und insbesondere auch logarithmisch-konkave
Funktionen.
Des Weiteren konnte für das konvexe VER-Problem eine alternative Formulierung
der Problemstellung gefunden werden, sofern die zugehörige Rechtecksmenge sich
aus eindimensionalen Mengen zusammensetzt. Für eine groÿe Anzahl von Anforderungen kann die Dimension der Optimierungsvariablen so deutlich verringert werden,
woraus ein geringerer Rechenaufwand bei der Problemlösung resultiert.
An die mathematische Formulierung anknüpfend wurde in Kapitel 7 eine Möglichkeit
R
vorgestellt, wie das konvexe VER-Problem numerisch mit der Software Matlab
löst werden kann. Dazu wurden in
R
Matlab
ge-
implementierte Algorithmen zur Lösung
von Optimierungsproblemen betrachtet und Methoden eingeführt, mithilfe derer ein
Startwert für die Optimierung bestimmt und das Volumen einer konvexen Menge
90
8. Fazit
numerisch berechnet werden kann.
Durch mehrere Beispielprobleme wurden Anwendungsbereiche der VER-Probleme,
wie sie in dieser Arbeit betrachtet werden, gezeigt. Die numerische Berechnung des
konvexen VER-Problems ist insbesondere für wenige Anforderungen und eine niedrige Dimension des euklidischen Raums
Rd
relativ schnell und genau. Für eine grö-
ÿere Anzahl an Anforderungen bzw. höhere Dimensionen des euklidischen Raums
Rd
dauern die numerischen Berechnungen länger und eine gute Approximation einer
optimalen Lösung ist nicht immer garantiert.
Eine Untersuchung weiterer Optimierungsalgorithmen könnte mögliche Verbesserungen in der Güte der Approximation einer optimalen Lösung liefern. Falls damit nicht
zusätzlich eine Verkürzung der Berechnungszeit erreicht wird, könnte eine solche
über die Reduzierung der Anforderungen erzielt werden. Hierfür müsste es gelingen
eine additiv zerlegbare Funktion zu nden, welche alle Anforderungen gemeinsam
und möglichst genau beschreibt. Ebenso könnten Anforderungen, welche nicht durch
additiv zerlegbare Funktionen beschrieben werden, durch additiv zerlegbare Funktionen angenähert werden. Eine intelligente Bestimmung derartiger Funktionen könnte
daher die Praxisanwendung dieser Arbeit erweitern und soll Gegenstand zukünftiger
Forschung sein.
91
A. Anhang
A. Anhang
Beweise
Beweis zu Satz 2.12
Satz A.1.
Seien
A, B , C
D
und
Mengen. Für das kartesische Produkt gelten die
Eigenschaften
(i)
(ii)
A × (B ∩ C) = (A × B) ∩ (A × C)
A×B =∅ ⇔ A=∅
oder
bzw.
A × (B ∪ C) = (A × B) ∪ (A × C),
B = ∅,
(iii)
A×B ⊂C ×D ⇔ A⊂C
(iv)
(A × B)c = (Ac × B c ) ∪ (Ac × B) ∪ (A × B c ),
(v)
und
B ⊂ D,
(A ∩ B) × (C ∩ D) = (A × C) ∩ (B × D).
Beweis.
(i) Siehe [16] für einen Beweis.
(ii) Siehe [16] für einen Beweis.
(iii) ⇐ : 1. Fall: Für
Fall: Seien
A⊆C
A=∅
A und B
und
B⊆D
oder
B =∅
nichtleer und
ist auch
gilt stets
A × B ⊆ C × D,
vgl. (ii). 2.
(a, b) ∈ A × B , d.h. a ∈ A und b ∈ B . Wegen
a∈C
und
b ∈ D,
also gilt
(a, b) ∈ C × D.
⇒: Siehe [16] für einen Beweis.
(iv) ⊂: Sei
gilt (a
(a, b) ∈ (A × B)c ,
(a, b) ∈
/ (A × B),
d.h.
a∈
/A
oder
b∈
/ B.
Somit
∈
/ A und b ∈
/ B ) oder (a ∈
/ A und b ∈ B ) oder (a ∈ A und b ∈
/ B ), woraus
(a, b) ∈ Ac × B c
insgesamt
(v) Falls
also
oder
(a, b) ∈
A, B , C
(Ac
oder
(a, b) ∈ Ac × B
×
Bc)
∪
(Ac
oder
(a, b) ∈ A × B c
× B) ∪ (A ×
folgt. Deshalb gilt
B c ). ⊃: Analog.
D die leere Menge ist, so ist die Gleichung stets erfüllt. Seien
diese also im Folgenden nichtleer.
⊂: Sei
ist
(a, c) ∈ (A ∩ B) × (C ∩ D), d.h. a ∈ A, a ∈ B , c ∈ C
(a, c) ∈ (A × C)
und
(a, c) ∈ (B × D),
folgt. ⊃: Analog.
92
woraus
und
c ∈ D. Somit
(a, c) ∈ (A × C) ∩ (B × D)
A. Anhang
Beweis zu Satz 3.3
Satz A.2.
E ⊂ P(X)
Für beliebiges
E
Durchschnitt aller
P(X)
Beweis. Da
σ -Algebren
umfassenden
σ(E) =
\
{A | A
σ -Algebra
ist
σ -Algebra
eine
ist die von
ist mit
σ -Algebren über X nichtleer.
T
Sei S :=
{A | A ist σ -Algebra über X
E
erzeugte
X,
über
über
X
gegeben als der
genauer
und
E ⊂ P(X),
σ -Algebra
E ⊂ A}.
ist das System aller
E
umfas-
senden
S
σ -Algebra
eine
dass
A
n∈N
A
A ∈ {A | A
σ -Algebra
ist
Aj ∈ A
wieder eine
σ -Algebren,
also
∅ ∈ S.
σ -Algebra
Für
A∈S
und somit
gilt
X
E ⊂ A}
und aufgrund der Tatsache,
∈A
c
und deshalb A
∈ S . Analog gilt für Aj ∈ S ,
und
A ∈ {A | A ist σ -Algebra über X und E ⊂ A}
S
S
ist,
Aj ∈ A und darum
Aj ∈ S .
für alle
σ -Algebra
j∈N
und da
j∈N
Auÿerdem folgt für jede beliebige
was die Behauptung ergibt, d.h.
A∈A
über
c
eine σ -Algebra ist, auch A
auch
E ⊂ A}. Es wird nun gezeigt, dass auch
darstellt. Die leere Menge ist Element jeder
auch Element des Durchschnitts von
für alle
und
σ -Algebra A mit E ⊂ A bereits S ⊂ A und E ⊂ S ,
σ(E) = S .
Beweis zu Satz 3.4
Satz A.3.
A2 .
Falls
Sei
E1 ⊂ A2
Beweis. A1
A1
E1
⊃ A2 :
ein Erzeuger der
und
⊂ A2 :
E2 ⊂ A1 ,
Sei
σ -Algebra A1
dann gilt
E1 ⊂ A2 ,
dann ist
und
E2
ein Erzeuger der
σ -Algebra
A1 = A2 .
A1 ⊂ A2 .
Analog.
Beweis zu Satz 3.6
Satz A.4.
Die Mengensysteme
(i)
T d = {U ⊂ Rd | U
(ii)
C d = {U ⊂ Rd | U
ist oen in
Rd },
ist abgeschlossen in
(iii)
I d = {(a, b] | a, b ∈ Rd , a < b},
(iv)
d = {(a, ∞) | a ∈ Rd }
I∞
sind Erzeuger der Borel-σ -Algebra
B(Rd ),
erklärt ist.
93
Rd },
wobei
(a, ∞)
für
a ∈ Rd
analog zu (3.1)
A. Anhang
(i) Nach Denition der Borel-σ -Algebra gilt bereits
Beweis.
σ(T d ) = B(Rd ).
(ii) Da jede abgeschlossene Teilmenge das Komplement einer oenen Teilmenge des
Rd
σ(C d ) = σ(T d ) = B(Rd ).
ist, folgt
I d ⊂ σ(T d ) und T d ⊂ σ(I d ) zu zeigen.
d
T Q
(a, b] =
(ai , bi + k1 ) resultiert (a, b] ∈ σ(T d )
(iii) Wegen Satz 3.4 reicht es
I
d
⊂ σ(T d ):
a, b ∈ Rd
T
d
mit
Aus
a<b
⊂ σ(I d ):
Sei
k∈N i=1
d
und deshalb I
U ⊂ Rd
für alle
⊂ σ(T d ).
oen. Wie in Kapitel 2.1 bemerkt, lässt sich
U
als
(a, b) ⊂ U , vgl. (3.1), mit
S
(a, b) =
(a, c], woraus (a, b) ∈
abzählbare Vereinigung oener Mengen der Form
a, b ∈
Qd und
a < b
darstellen. Ferner ist
c∈Qd
c<b
σ(I d )
und somit auch
U ∈ σ(I d )
und
T d ⊂ σ(I d )
folgt.
d ⊂ σ(Cd ) und I d ⊂ σ(I d ) zu zeigen.
I∞
∞
d
S Q
(ai , k] für alle a ∈ Rd und deshalb auch
(a, ∞) =
(iv) Wegen Satz 3.4 reicht es auch hier
d
⊂ σ(I d ):
I∞
Es gilt
k∈N i=1
d ⊂ σ(I d ).
I∞
I
d
d ):
⊂ σ(I∞
a, b ∈
Rd mit
Aus
a<b
(a, b] = (a, ∞)\(b, ∞)
d
und darum I
⊂
(a, b] ∈ σ(I d )
resultiert
für alle
d ).
σ(I∞
Beweis zu Satz 3.11
Satz A.5.
Seien
n∈N
und
dk ∈ N
fest für
k = 1, . . . , n
mit
d :=
n
P
dk .
Dann gilt
k=1
n
O
k
B(Rd ) = B(Rd ).
k=1
Beweis.
⊃: Jedes
d-dimensionale halboene Rechteck (a, b] in Rd
mit
a, b ∈ Rd
im Sinne von
k
k k
(3.1) kann als kartesisches Produkt d -dimensionaler halboenener Rechtecke (a , b ],
n
Q
k
k = 1, . . . , n, dargestellt werden, d.h. (a, b] =
(ak , bk ], wobei ak , bk ∈ Rd . Daher
gilt
(a, b] ∈
n
N
k=1
k
B(Rd ) und da
B(Rd ) die kleinste
k=1
Rechtecke enthält, auch
B(Rd ) ⊂
n
N
k
B(Rd ).
k=1
94
σ -Algebra
ist, die alle halboenen
A. Anhang
⊂: Sei
Ak
deniert als
n
o
k
1
k−1
k+1
n
Ak = Ak ∈ Rd | Rd × . . . × Rd
× Ak × R d
× . . . × Rd ∈ B(Rd )
für
k = 1, . . . , n.
Mit Satz 2.12 verallgemeinert auf mehrfache kartesische Produkte
gilt
1
k−1
1
k−1
Rd × . . . × Rd
k+1
× ∅ × Rd
n
× . . . × Rd = ∅,
k+1
n
Rd × . . . × Rd
× (Ak )c × Rd
× . . . × Rd
1
k−1
k+1
n c
= Rd × . . . × Rd
× Ak × R d
× . . . × Rd
für alle
k
Ak ∈ R d
und

R
d1
× ... × R
dk−1
×

[
k+1
Akj  × Rd
n
× . . . × Rd
j∈N
[
=
1
k−1
Rd × . . . × Rd
× Akj × Rd
k+1
n
× . . . × Rd
j∈N
für alle
k
Akj ∈ Rd
k
auch A eine
,
j ∈ N.
Weil
B(Rd )
1
k−1
{Rd × . . . × Rd
k = 1, . . . , n
n
Y
Ak =
k=1
für
σ -Algebra
ist, kann gefolgert werden, dass
σ -Algebra ist. Aufgrund Bemerkung 2.16 enthält die σ -Algebra Ak
dk
oenen Mengen, weshalb B(R )
für
eine
⊂
× Ak × Rd
alle
Ak und somit
k+1
× . . . × Rd | Ak ∈ B(Rd )} ⊂ B(Rd )
n
k
k−1
× Ak × R d
gilt. Weiterhin ist
n
\
1
Rd × . . . × Rd
k+1
n
× . . . × Rd ∈ B(Rd )
k=1
k
Ak ∈ B(Rd ), k = 1, . . . , n,
n
N
woraus direkt
k
B(Rd ) ⊂ B(Rd )
folgt.
k=1
Beweis zu Satz 3.23
Satz A.6.
Seien
(X, A, µ)
(i) Subtraktivität, d.h. für
(ii) Monotonie, d.h. für
ein Maÿraum und
A1 ⊂ A2
A1 ⊂ A2
und
ist
Ai ∈ A, i ∈ N.
Dann gelten
µ(A1 ) < ∞ ist µ(A2 \A1 ) = µ(A2 )−µ(A1 ),
µ(A1 ) ≤ µ(A2 ),
95
A. Anhang
(iii)
Ai ↑ A gilt lim µ(Ai ) = µ(A) und für Ai ↓ A mit µ(A1 ) <
σ -Stetigkeit,
d.h. für
∞
lim µ(Ai ) = µ(A).
ebenfalls
i→∞
A1 ⊂ A2 ,
Beweis. Sei
i→∞
A1 ∪˙ (A2 \A1 ) = A2
dann gilt
und aus der Additivität und
Nichtnegativität des Maÿes folgt
µ(A2 ) = µ(A1 ) + µ(A2 \A1 ) ≥ µ(A1 ),
womit die ersten beiden Teile des Satzes bereits gezeigt sind.
Sei
Ai ↑ A.
Dann sind die Mengen
disjunkt und es gilt
i
S
Ai =
Ãj
und
Ã1 := A1 , Ãj = Aj \Aj−1 , j ≥ 2
S
Ãj . Ferner ist
A=
j=1
j∈N
X
µ(A) =
µ(Ãi ) = lim
i→∞
i∈N
Sei nun
i∈N
Ai ↓ A
gerade
mit
µ(A1 ) < ∞.
Ãi ↑ A1 \A.
paarweise
i
X
µ(Ãj ) = lim µ(Ãi ).
i→∞
j=1
Dann gilt für die Folge
(Ãi )i∈N
mit
Ãi = A1 \Ai ,
Mit den obigen Erkenntnissen und der Subtraktivität folgt
µ(A1 ) − µ(A) = µ(A1 \ A) = lim µ(A1 \ Ai ) = µ(A1 ) − lim µ(Ai )
i→∞
i→∞
und somit die Behauptung.
Beweis zu Satz 4.3
Satz A.7.
(i) Seien
m
T
C :=
auch
Cj
Cj ⊂ Rd , j = 1, . . . , m, m ∈ N
konvexe Mengen, dann ist
eine konvexe Menge.
j=1
(ii) Seien
n∈N
k
C k ⊂ Rd
Ck, k =
(i) Seien
gilt dann
dk ∈ N
fest für
nichtleer. Die Menge
die Mengen
Beweis.
und
x, y ∈ Cj
x, y ∈ C
für
k = 1, . . . , n
z=
(z 1 , . . . , z n ), da
C :=
n
Q
mit
d :=
n
P
dk .
Ferner seien
k=1
C k ⊂ Rd
ist genau dann konvex, wenn
k=1
1, . . . , n, konvex sind.
für
j = 1, . . . , m
θx + (1 − θ)y ∈ Cj
(ii) ⇒: Seien
k = 1, . . . , n
mit
und
C
und
θ ∈ [0, 1].
und somit auch sofort
Für alle
j ∈ {1, . . . , m}
θx + (1 − θ)y ∈ C .
x = (x1 , . . . , xn ) und y = (y 1 , . . . , y n ), d.h. xk , y k ∈ C k
θ ∈ [0, 1].
Dann ist auch
z := θx + (1 − θ)y ∈ C
k
konvex ist, was bedeutet, dass z
96
=
θxk + (1 − θ)y k
mit
∈ Ck
A. Anhang
gilt.
⇐: Seien
für
xk , y k ∈ C k
θ ∈ [0, 1]
k
gerade z
für
:=
k = 1, . . . , n
und deshalb auch
θxk + (1 − θ)y k
∈
Ck,
x, y ∈ C .
Dann gilt
k = 1, . . . , n und darum z ∈ C .
Beweis zu Satz 4.5
Satz A.8.
dass
f
Seien
C ⊂ Rd
oen und konvex und
genau dann konvex ist, wenn für alle
f :C →R
x, y ∈ C
mit
dierenzierbar. So gilt,
x 6= y
die Ungleichung
f (x) + ∇f (x)T (y − x) ≤ f (y)
erfüllt ist.
Beweis. ⇒: Wegen
mit
x 6= y
und alle
f (θy + (1 − θ)x) ≤ θf (y) + (1 − θ)f (x)
θ ∈ (0, 1)
für alle
x, y ∈ C ⊂ Rd
gilt auch
f (θy + (1 − θ)x) − f (x)
≤ f (y) − f (x).
θ
Grenzwertbildung
θ&0
liefert
lim
θ&0
f (θy+(1−θ)x)−f (x)
θ
= ∇f (x)T (y − x),
woraus
∇f (x)T (y − x) ≤ f (y) − f (x)
resultiert.
⇐: Für alle
x, y ∈ C ⊂ Rd
und alle
θ ∈ (0, 1)
gilt
f (θy + (1 − θ)x) + θ ∇f (θy + (1 − θ)x)T (x − y) ≤ f (x),
(A.1)
f (θy + (1 − θ)x) + (1 − θ) ∇f (θy + (1 − θ)x)T (y − x) ≤ f (y).
(A.2)
Multiplikation von (A.1) mit
(1 − θ)
und (A.2) mit
θ
und anschlieÿende Addition
ergibt
f (θy + (1 − θ)x) ≤ θf (y) + (1 − θ)f (x).
97
A. Anhang
Beweis zu Satz 4.6
Satz A.9.
So ist
f
Seien
C ⊂ Rd
oen und konvex und
f : Rd → R
2
genau dann konvex, wenn ∇ f (x) für alle
Beweis. ⇒: Sei
f
oen ist, gibt es ein
gilt dann für alle
konvex. Ferner seien
θ0 ∈ R
θ ∈ (0, θ0 ]
mit
x∈C
x ∈ C ⊂ Rd
x + θh ∈ C
für alle
zweimal dierenzierbar.
positiv semidenit ist.
und
h ∈ Rd
θ ∈ (0, θ0 ].
gegeben. Weil
C
Aufgrund Satz 4.5
gerade
f (x + θh) − f (x) − θ∇f (x)T h ≥ 0.
Mit der qualitativen Taylor-Formel
1
f (x + h) = f (x) + ∇f (x)T h + hT ∇2 f (x)h + o(khk2 ),
2
welche aus dem Satz von Taylor folgt, vgl. (4.3), gilt
θ2 T 2
h ∇ f (x)h + o(kθhk2 ) ≥ 0
2
für
θ & 0.
Dabei steht
o
für die Landau-Notation. Divison durch
2
bildung liefert dann, dass ∇ f (x) positiv semidenit für alle
2
⇐: Sei die Hessematrix ∇ f (x) für alle
x ∈ C ⊂
θ2
x∈C
und Grenzwertsein muss.
Rd positiv semidenit. Aus
Gleichung (4.3) und Satz 4.5 resultiert nun sofort die Konvexität von
f.
Sonstiges
Betriebssystem
Windows 10 Home 64-Bit, Version 1607
Prozessor
Intel(R) Core(TM) i7-6500 CPU @ 2.50 GHz
RAM
8 GB
Matlab
9.0.0.307022 (R2016a)
Tabelle A.1: Computer- und Softwareinformationen zu den numerischen Simulationen
98
Literatur
Literatur
[1] C. Aliprantis und K. Border.
Innite Dimensional Analysis.
Springer-Verlag
Berlin Heidelberg, 1994.
[2] W. Alt. Numerische Verfahren der konvexen, nichtglatten Optimierung. B. G.
Teubner Verlag, Wiesbaden, 2004.
[3] C. Audet und J. Dennis Jr. Analysis of Generalized Pattern Searches. B. SIAM
Journal on Optimization, 13(3),889903, 2003.
[4] S. Boyd und L. Vandenberghe.
Convex Optimization.
Cambridge University
Press, 2004.
[5] R. Byrd, M. Hribar und J. Nocedal. An Interior Point Algorithm for Large Scale
Nonlinear Programming. SIAM Journal on Optimization, 9(4), 877-900, 1999.
[6] M. Brokate und G. Kersting. Maÿ und Integral. Springer Basel AG, 2011.
[7] R. Denk und R. Racke. Kompendium der Analysis, Band 1. Vieweg+Teubner
Verlag, Wiesbaden, 2011.
[8] R. Denk und R. Racke. Kompendium der Analysis, Band 2. Springer Spektrum,
Wiesbaden, 2012.
[9] S. Erschen, F. Duddeck und M. Zimmermann.
Robust Design using classical
optimization. PAMM Proc. Appl. Math. Mech., 15, 565 566, 2015.
[10] C. Geiger und C. Kanzow. Numerische Verfahren zur Lösung unrestringierter
Optimierungsaufgaben. Springer-Verlag Berlin Heidelberg, 1999.
[11] C. Geiger und C. Kanzow. Theorie und Numerik restringierter Optimierungs-
aufgaben. Springer-Verlag Berlin Heidelberg, 2002.
[12] M. Gerdts. Nichtdierenzierbare Optimierung. Vorlesungsskript,
unibw.de/lrt1/gerdts/lehre/nichtdiff_optimierung.pdf,
[13] G. Hörmann. Grundbegrie der Topologie. Vorlesungsskript,
univie.ac.at/~gue/lehre/13gbtop/GBTopSS13.pdf,
[14] W. Kaballo.
Einführung in die Analysis II.
Heidelberg-Berlin, 1997.
99
https://www.
2007.
http://www.mat.
2013.
Spektrum Akademischer Verlag,
Literatur
[15] T. Kolda, r. Lewis und V. Torczon. A generating set direct search augmented
Lagrangian algorithm for optimization with a combination of general and linear
constraints. Technical Report SAND 2006-5315, Sandia National Laboratories,
2006.
[16] I. Lehmann und W. Schulz. Mengen - Relationen - Funktionen. Springer Spektrum, Wiesbaden, 2016.
TM
[17] MathWorks. Optimization Toolbox
User's Guide.
com/help/pdf_doc/optim/optim_tb.pdf,
https://de.mathworks.
2016.
[18] D. Meintrup und S. Schäer. Stochastik - Theorie und Anwendungen. SpringerVerlag Berlin Heidelberg, 2005.
[19] J. Moore. Mathematical Methods for Economic Theory 1. Springer-Verlag Berlin
Heidelberg, 1999.
[20] A. Prékopa. On logarithmic concave measures and functions. Acta Scientiarum
Mathematicarum, 34, 335-343, 1973.
[21] A. Prékopa.
Logarithmic Concave Measures and Related Topics.
Stochastic
Programming, Academic Press, 63-82, 1980.
[22] B. von Querenburg. Mengentheoretische Topologie. Springer-Verlag Berlin Heidelberg, 1973.
[23] S. Volkwein. Numerische Verfahren der restringierten Optimierung. Vorlesungs-
http://www.math.uni-konstanz.de/numerik/personen/volkwein/
teaching/2014WS-Opt2-Script.pdf, 2014.
skript,
[24] M. Zimmermann und J. Hoessle. Computing solution spaces for robust design.
Int. J. Numer. Meth. Engng, 94, 290307, 2013.
100
Herunterladen