Masterarbeit Konvexe Optimierung am Beispiel volumenmaximaler einbeschriebener Rechtecksmengen vorgelegt von Marco Daub an der Fachbereich Mathematik und Statistik 1. Gutachter Prof. Dr. Stefan Volkwein 2. Gutachter Prof. Dr. Matthias Gerdts Konstanz, März 2017 Konstanzer Online-Publikations-System (KOPS) URL: http://nbn-resolving.de/urn:nbn:de:bsz:352-0-420923 Erklärung Ich versichere hiermit, dass ich die vorliegende Arbeit mit dem Thema: Konvexe Optimierung am Beispiel volumenmaximaler einbeschriebener Rechtecksmengen selbständig verfasst und keine anderen Hilfsmittel als die angegebenen benutzt habe. Die Stellen, die anderen Werken dem Wortlaut oder dem Sinne nach entnommen sind, habe ich in jedem einzelnen Falle durch Angaben der Quelle, auch der benutzten Sekundärliteratur, als Entlehnung kenntlich gemacht. Die Arbeit wurde bisher keiner anderen Prüfungsbehörde vorgelegt und auch noch nicht veröentlicht. Konstanz, den 1. März 2017 Marco Daub Inhaltsverzeichnis 1. Einleitung 3 2. Topologische Grundlagen 7 2.1. Euklidische Räume . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 2.2. Produkträume . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 3. Maÿtheoretischer Volumenbegri 19 3.1. Borel-Mengen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 3.2. Borel-messbare Funktionen . . . . . . . . . . . . . . . . . . . . . . . 23 3.3. Das Lebesgue-Maÿ . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 4. Konvexe Theorie 32 4.1. Konvexe Mengen und Funktionen . . . . . . . . . . . . . . . . . . . . 32 4.2. Konvexe Optimierungsprobleme . . . . . . . . . . . . . . . . . . . . . 41 5. Das VER-Problem 46 5.1. Einführung in die Problemstellung . . . . . . . . . . . . . . . . . . . 46 5.2. Analytisches Problem . . . . . . . . . . . . . . . . . . . . . . . . . . 52 6. Das konvexe VER-Problem 63 6.1. Allgemeine Strukturen . . . . . . . . . . . . . . . . . . . . . . . . . . 63 6.2. Eindimensionale Strukturen . . . . . . . . . . . . . . . . . . . . . . . 71 7. Numerische Lösung des konvexen VER-Problems 7.1. Grundlegendes 7.2. Beispielprobleme 76 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83 8. Fazit 90 A. Anhang 92 Literatur 99 1. Einleitung 1. Einleitung Bei der Entwicklung eines komplexen Produkts, welches sich aus mehreren Komponenten zusammensetzt, müssen oftmals mehrere Anforderungen erfüllt werden. Ob eine Anforderung erfüllt ist, hängt dabei von der Zusammenstellung der einzelnen Komponenten ab. Diese Komponenten werden von verschiedenen Produktionsbereichen bereitgestellt. Anstatt nun ein optimales Design mit spezischen Komponenten vorzugeben, ist es der Anspruch, jedem Produktionsbereich maximale Variabilität in der Realisierbarkeit ihrer Komponenten zu gewährleisten. Dies kann als anschauliches mathematisches Problem formuliert werden: Gesucht ist ein kartesisches Produkt mit maximalem Volumen, d.h. eine spezielle Menge zulässiger Designs, sodass jedes dieser Designs alle Anforderungen erfüllt. Mit anderen Worten, eine volumenmaximale einbeschriebene Rechtecksmenge. Diese Problemstellung wurde unter der Voraussetzung, dass sich das kartesische Produkt, also die Rechtecksmenge, aus Intervallen zusammensetzt, bereits in [9] und [24] untersucht und Algorithmen zur numerischen Lösung vorgeschlagen. Der in [24] vorgestellte Algorithmus basiert darauf, eine Lösung durch zufällige Betrachtung zulässiger und nicht zulässiger Designs zu nden und der in [9] vorgestellte auf der Voraussetzung, dass den Anforderungen lineare Funktionen zugrunde liegen. In dieser Arbeit werden Rechtecksmengen verwendet, bei denen die Dimensionen der Mengen, aus welchen sie sich zusammensetzen, beliebig sind. Zudem sind auch Anforderungen erlaubt, welche durch sogenannte additiv zerlegbare Funktionen beschrieben werden können. Auf der einen Seite steigt dadurch die Komplexität des mathematischen Problems. Auf der anderen Seite kann die Anwendbarkeit, vor allem gegenüber [9], erheblich erweitert werden. Die Auockerung der Struktur des kartesischen Produkts ermöglicht nämlich einzelnen Produktionsbereichen, welche mehrere Komponenten gleichzeitig betrachten, weitere Möglichkeiten ihre einzelnen Komponenten zu kombinieren. Auÿerdem wird durch die additiv zerlegbaren Funktionen, im Vergleich zu den linearen, eine gröÿere Funktionenklasse zur Beschreibung der Anforderungen zugelassen. Da für dieses Vorhaben noch keine Literatur vorhanden ist, ist es das Ziel der Arbeit, zunächst eine saubere mathematische Formulierung des Problems zu schaen, um dieses anschlieÿend untersuchen und lösen zu können. Dazu sind Grundlagen der Topologie und Maÿtheorie notwendig, auf deren relevantesten Inhalte hierfür im Folgenden eingegangen wird. Insbesondere kann gezeigt werden, dass unter etwas stärkeren Voraussetzungen ein konvexes Optimierungsproblem vorliegt, weshalb der 3 1. Einleitung Fokus der Arbeit stark auf die konvexe Theorie gerichtet ist. Für diesen Fall wird dann genau beschrieben, wie das mathematische Problem numerisch gelöst werden kann. Die Aussagen können dabei nahezu direkt auf das allgemein untersuchte Problem übertragen werden. Kapitel 1 stellt die Einleitung dar und gibt einen Überblick über die verwendeten Notationen. Kapitel 2 stellt Elemente der Topologie vor, welche für den weiteren Verlauf der Arbeit von Bedeutung sind und legt die dafür verwendeten Notationen fest. Kapitel 3 behandelt die ebenfalls für die Arbeit entscheidende, maÿtheoretische Grundlagen. Insbesondere werden messbare Mengen eingeführt, denen dann über das Lebesgue-Maÿ ein Volumen zugeordnet werden kann. Kapitel 4 betrachtet zunächst konvexe Mengen und Funktionen und anschlieÿend Optimierungsprobleme, denen konvexe Funktionen zugrunde liegen. Kapitel 5 führt das volumenmaximale-einbeschriebene-Rechtecksmengen-Problem ein und untersucht wichtige Eigenschaften des Problems. Kapitel 6 betrachtet das VER-Problem für Anforderungen, welche durch konvexe Funktionen beschrieben werden und zeigt, dass dies ein konvexes Optimierungsproblem darstellt. Auÿerdem wird eine alternative Formulierung für einen Spezialfall des VER-Problems hergeleitet. Kapitel 7 stellt vor, wie das konvexe VER-Problem mit einer ein- oder zweidimensionaler Struktur numerisch mit der Software Matlab R Kapitel 8 stellt das Fazit dar und gibt einen Ausblick. 4 gelöst werden kann. 1. Einleitung Notationen d dx f (x) Ableitung ∀ für alle ⇔ Äquivalenz |·| Betrag bzw. Betrag bei Multiindexnotation Beweisende B(X d ) Borel-σ -Algebra ∩ Durchschnitt ∈ Element von ∈ / nicht Element von ∃ es existiert (ai )i∈N Folge lim i→∞ Grenzwert ⇒ Implikation inf R Inmum [a, b] abgeschlossenes Intervall (a, b] halboenes Intervall (a, b) oenes Intervall × kartesisches Produkt \ Komplement Ac Komplement von ◦ Komposition B(x0 , r) oene Kugel o, O Landausymbole L(γ) Länge von λd Lebesgue-Maÿ ∅ leere Menge lim inf limes inferior lim sup limes superior log Logarithmus zur Basis ∇ Nabla (Gradient) k·k Norm P(A) Potenzmenge von Integral A γ e A 5 1. Einleitung d Q Produkt bzw. mehrfaches kartesisches Produkt i=1 n N µk (A) Produktmaÿ k=1 n N B(X k ) Produkt-σ -Algebra k=1 ∂Ω Rand von h·, ·i Skalarprodukt σ(E) d P von E Ω erzeugte σ- Algebra Summe i=1 sup Supremum ⊂ Teilmenge von ( echte Teilmenge von aT transponiertes Tupel zu f −1 (V ) Urbild von a V ∪ ∪˙ Vereinigung Q rationale Zahlen R reelle Zahlen disjunkte Vereinigung 6 2. Topologische Grundlagen 2. Topologische Grundlagen In diesem Kapitel werden Elemente der Topologie vorgestellt, welche für den weiteren Verlauf der Arbeit von Bedeutung sind und die dafür verwendeten Notationen festgelegt. 2.1. Euklidische Räume Im Folgenden sei X eine nichtleere Menge, die mit entsprechenden Verknüpfungen einen Vektorraum über R darstellt, siehe [7] für eine Denition. Der Vektorraum wird der Einfachheit halber ebenfalls mit Denition 2.1. X bezeichnet. Eine Abbildung h·, ·i : X × X → R wird (i) (ii) (iii) Skalarprodukt auf X genannt, falls gilt ∀x, y, z ∈ X ∀α, β ∈ R : hαx + βy, zi = αhx, zi + βhy, zi, ∀x, y ∈ X : hx, yi = hy, xi, ∀x ∈ X : hx, xi ≥ 0 Das Paar (X, h·, ·i) Beispiel 2.2. und heiÿt dann (hx, xi = 0 ⇒ x = 0). euklidischer Raum. Der Standardvertreter für einen euklidischen Vektorraum ist mit Standard-Skalarprodukt. Dabei ist dessen Elemente x∈ Rd geordnete Rd ein Vektorraum über d-Tupel X = Rd R mit festem d ∈ N, sind, die auch Vektoren genannt werden. x = (x1 , . . . , xd ) mit d R an manchen Stellen auch als Diese werden im Folgenden in der Regel als Zeilenvektor, d.h. xi ∈ R für i = 1, . . . , d notiert. Dennoch wird x∈ Spaltenvektor aufgefasst, insbesondere bei der Beschreibung von linearen Funktionen. Das Standard-Skalarprodukt im Rd hx, yiRd ist gegeben über := d X xi yi (2.1) i=1 für x, y ∈ Rd . d Nachfolgend steht der Begri R stets für den euklidischen Raum (Rd , h·, ·iRd ). Neben dem Skalarprodukt können auf Vektorräumen auch Normen betrachtet werden. 7 2. Topologische Grundlagen Normierte Räume Denition 2.3. Eine Abbildung k · k : X → [0, ∞) wird (i) Norm auf X genannt, falls gilt ∀x ∈ X : kxk = 0 ⇔ x = 0, (ii) ∀α ∈ R, x ∈ X : kαxk = |α|kxk, (iii) ∀x, y ∈ X : kx + yk ≤ kxk + kyk. Das Paar Sei (X, k · k) (X, h·, ·i) heiÿt normierter Raum. ein euklidischer Raum, dann ist die Abbildung k · k : X → [0, ∞), x 7→ kxk := eine Norm auf X, p hx, xi vgl. [7]. Somit ist jeder euklidische Raum auch ein normierter d Raum. Im R ist die euklidische Norm oder 2-Norm eines Vektors x ∈ Rd deniert als kxk2 v u d uX := t |xi |2 , i=1 was gerade der induzierten Norm durch das Standard-Skalarprodukt entspricht. Ein weiteres Beispiel für eine Norm im Rd kxk∞ := für ist die ∞-Norm, die deniert ist als max |xi | i=1,...,d x ∈ Rd . Nun werden wichtige Eigenschaften von Mengen in normierten Räumen eingeführt. Denition 2.4. (i) Eine Seien (X, k · k) ein normierter Raum, x0 ∈ X und oene Kugel um x0 mit Radius r ist deniert als B(x0 , r) := {x ∈ X | kx − x0 k < r}. 8 r ∈ (0, ∞). 2. Topologische Grundlagen (ii) Eine Teilmenge U ⊂X heiÿt oen, falls ∀x ∈ U ∃r ∈ (0, ∞) : B(x, r) ⊂ U. (iii) Eine Teilmenge U ⊂X heiÿt abgeschlossen, falls U c oen ist. Es gilt, dass in normierten Räumen die beliebige Vereinigung oener Mengen oen ist, ebenso wie der Durchschnitt endlich vieler oener Mengen. Die Beweise hierzu nden sich beispielsweise in [22]. Da Q dicht in R ist, ist auÿerdem nachweisbar, dass jede oene Menge in R als Vereinigung oener Intervalle darstellbar ist, was ebenfalls in [22] begründet ist. Diese Eigenschaft lässt sich sofort auf oene Mengen im Rd erweitern. Hierbei sei d bemerkt, dass die Eigenschaft, ob eine Menge im R oen ist oder nicht, nicht von der gewählten Norm abhängt, weil alle Normen auf dem Rd äquivalent sind. Weitere bedeutsame Mengen in normierten Räumen sind zum Beispiel kompakte Mengen, siehe [7] für eine allgemeine Denition. Im Rd ist eine Menge genau dann kompakt, wenn sie abgeschlossen und beschränkt ist. Bemerkung 2.5. Generell lassen sich noch allgemeinere Räume als normierte Räu- me betrachten, wie zum Beispiel metrische oder topologische Räume, siehe [7] für weitere Informationen. Viele der hier für normierte Räume eingeführten Denitionen und Eigenschaften lassen sich direkt auf die soeben genannten Räume übertragen bzw. verallgemeinern. Jeder normierte Raum (X, k · k) ist mit der Abbildung d : X × X → [0, ∞), (x, y) 7→ d(x, y) := kx − yk ein metrischer Raum. Ferner bildet das Mengensystem der oenen Mengen T := {U ⊂ X | U ist oen in X} eine Topologie auf dem normierten Raum. Im euklidischen Raum wird die so denierte Topologie euklidische Topologie genannt. Stetige und halbstetige Funktionen Für Abbildungen zwischen normierten Räumen ist die Stetigkeit, welche beispielsweise in [13] deniert ist, eine bedeutsame Eigenschaft. Zum Nachweis der Stetigkeit einer Abbildung lässt sich oftmals folgende Äquivalenz verwenden. 9 2. Topologische Grundlagen Satz 2.6. Seien (X, k · k) (Y, k · k0 ) und normierte Räume und f : X → Y eine Abbildung. Dann sind die folgenden Aussagen äquivalent: f (i) ist stetig. f −1 (V ) ⊂ X (ii) ∀V ⊂ Y , V oen: (iii) ∀V ⊂ Y , V abgeschlossen: oen. f −1 (V ) ⊂ X abgeschlossen. Beweis. Siehe [13]. Stetige Funktionen haben zum Beispiel die Eigenschaft, dass die Komposition stetiger Funktionen stetig ist. Für Y = R sind konstante Funktionen sowie endliche Summen bzw. Produkte stetiger Funktionen stetig. Auÿerdem nimmt jede stetige Funktion auf einer kompakten Menge ihr Maximum bzw. Minimum an. Für f := (f1 , . . . , fm ) : X → j = 1, . . . , m, p: Rm genau dann stetig, wenn jede Komponente fj : X → R, Bekannte Vertreter stetiger Funktionen sind beispielsweise Polynome → R, d ∈ N. Um diese denieren zu können, wird zunächst die Multiindex- Schreibweise eingeführt. Ein Multiindex ist ein Element weise ist stetig ist, vgl. [14]. Beispiel 2.7. Rd Y = Rm , m ∈ N, α = (α1 , . . . , αd ). Für x∈ Rd und x α α∈ mit Tupelschreib- Nd0 sind deniert n Y := α ∈ Nd0 xαi i , i=1 n X |α| := αi , i=1 wobei α ∈ 00 := 1 Nd0 mit aα 6= 0 Konvention ist. Für jedes |α| ≤ r. r ∈ N0 gibt es endlich viele Multiindizes Ist zu jedem Multiindex auÿerdem ein für mindestens ein α∈ aα ∈ R gegeben mit Nd0 , so wird die Abbildung p : Rd → R, x 7→ p(x) = X aα xα |α|≤r Polynom vom Grad r genannt. Jedes Polynom ist als Summe von Produkten stetiger Funktionen stetig. Dem liegt zugrunde, dass Koordinatenprojektionen stetig sind, worauf in Kapitel 2.2 nochmals genauer eingegangen wird. 10 2. Topologische Grundlagen Eine schwächere Eigenschaft von Funktionen als die Stetigkeit ist die Halbstetigkeit. Denition 2.8. Seien (X, k · k) ein normierter Raum und f : X → [−∞, ∞] eine Funktion. Diese heiÿt (i) nach unten halbstetig, wenn für jedes α ∈ R die Menge {x ∈ X | f (x) ≤ α} abgeschlossen bzw. die Menge (ii) nach {x ∈ X | f (x) > α} oben halbstetig, wenn für jedes α ∈ R die Menge {x ∈ X abgeschlossen bzw. die Menge {x ∈ X | f (x) < α} Es ist sofort ersichtlich, dass eine Funktion −f oen ist und f | f (x) ≥ α} oen ist. genau dann unten halbstetig ist, wenn nach oben halbstetig ist. Auÿerdem gilt, dass Funktionen f : X → R genau dann stetig sind, wenn sie sowohl nach unten als auch nach oben halbstetig sind. Auf einer kompakten Menge nimmt jede nach unten halbstetige Funktion ihr Minimum und jede nach oben halbstetige Funktion ihr Maximum an. Diese Aussagen sind alle in [1] begründet bzw. bewiesen. Zusätzlich wird dort gezeigt, dass die untere Halbstetigkeit äquivalent ist zur Gültigkeit von lim inf f (y) ≥ f (x) y→x mit lim inf f (y) := lim y→x inf δ&0 f (y) für alle y∈B(x,δ) x ∈ X. Entsprechend ist die obere Halbstetigkeit äquivalent zu lim sup f (y) ≤ f (x) y→x mit lim sup f (y) := lim y→x δ&0 sup f (y) für alle x ∈ X. y∈B(x,δ) Beispiel 2.9. Sei (X, k · k) ein normierter Raum. Die charakteristische Funktion von A ⊂ X ist deniert über ( χA : X → R, x 7→ χA (x) := Diese ist nach unten halbstetig, falls A 1, x ∈ A, 0, x ∈ / A. oen ist und nach oben halbstetig, falls abgeschlossen ist. 11 A 2. Topologische Grundlagen Eine weitere Eigenschaft von Funktionen, welche später ebenfalls aufgegrien wird, ist die Monotonie. Diese wird nun für eine Funktion Denition 2.10. Seien D ⊂ Rd und f : D → R mit D ⊂ Rd f : D → R deniert. eine Funktion. Dann heiÿt f monoton wachsend, wenn für alle x, y ∈ D mit x ≤ y gerade f (x) ≤ f (y) gilt. Entsprechend heiÿt f monoton fallend, wenn für alle x, y ∈ D mit x ≤ y gerade f (x) ≥ f (y) gilt. Das Ungleichungssystem x≤y ist dabei stets komponentenweise zu verstehen. 2.2. Produkträume Nun werden kartesische Produkte von Mengen betrachtet. Kartesische Produkte Denition 2.11. Das kartesische Produkt A×B der Mengen A und B ist deniert als die Menge aller geordneten Paare für deren zweite Komponente b∈B (a, b), für deren erste Komponente a∈A und gilt, d.h. A × B := {(a, b) | a ∈ A, b ∈ B}. Das kartesische Produkt besitzt unter anderem die nachfolgend aufgeführten Eigenschaften. Satz 2.12. Seien A, B , C und D Mengen. Für das kartesische Produkt gelten die Eigenschaften (i) (ii) A × (B ∩ C) = (A × B) ∩ (A × C) A×B =∅ ⇔ A=∅ oder bzw. A × (B ∪ C) = (A × B) ∪ (A × C), B = ∅, (iii) A×B ⊂C ×D ⇔ A⊂C (iv) (A × B)c = (Ac × B c ) ∪ (Ac × B) ∪ (A × B c ), (v) und B ⊂ D, (A ∩ B) × (C ∩ D) = (A × C) ∩ (B × D). Beweis. Siehe Anhang A. 12 2. Topologische Grundlagen Bemerkung 2.13. Das kartesische Produkt ist im Allgemeinen weder kommutativ noch assoziativ. Für paarweise disjunkte Mengen A := {a}, B := {b} und C := {c} gilt beispielsweise nämlich A × B = {a} × {b} = {(a, b)} 6= {(b, a)} = {b} × {a} = B × A, (A × B) × C = ({a} × {b}) × {b} = {((a, b), c)} 6= {(a, (b, c))} = {a} × ({b} × {c}) = A × (B × C) . Obwohl das kartesische Produkt generell nicht kommutativ ist, ähneln sich die Mengen A×B und B×A insofern, dass je ein Element der einen Menge bis auf Umordnung einem Element der andern entspricht. Die Zuordnung dieser Elemente deniert eine Bijektion, weshalb A×B mit B × A identiziert werden kann. Analog existiert solch eine kanonische Bijektion für die Mengen (A × B) × C und A × (B × C). Bevor auf eine solche Identizierung genauer eingegangen wird, wird zunächst das kartesische Produkt auf endlich viele Mengen erweitert. Denition 2.14. gen Das mehrfache kartesische Produkt A1 × . . . × Ad der Men- A1 , . . . , Ad , d ∈ N (a1 , . . . , ad ), wobei fest, ist deniert als die Menge aller geordneter ai ∈ Ai für i = 1, . . . , d. d-Tupel Also gilt A1 × . . . × Ad := {(a1 , . . . , ad ) | ai ∈ Ai , i = 1, . . . , d}. Mithilfe des Produktzeichens kann das mehrfache kartesische Produkt durch d Y Ai := A1 × . . . × Ad . i=1 notiert werden. Dies ist nicht zu verwechseln mit dem Produkt von Skalaren, für welches das Produktzeichen Q in dieser Arbeit ebenfalls verwendet wird. Die Eigenschaften des kartesischen Produkts zweier Mengen lassen sich direkt auf das mehrfache kartesische Produkt übertragen. Allgemeines zu Produkträumen In der folgenden Denition werden nun normierte Räume betrachtet, die auf dem mehrfachen kartesischen Produkt der Grundmengen von normierten Räumen beru- 13 2. Topologische Grundlagen hen. Dabei sei bemerkt, dass der verwendete, hochgestellte Index nicht mit einem Exponenten zu verwechseln ist. Denition 2.15. Seien n Q n∈N (X k , k · kX k ), k = 1, . . . , n, und normierte Räume. X k das n-fache kartesische Produkt der Grundmengen X k , k=1 welches mit komponentenweiser Addition und Skalarmultiplikation einen Vektorraum Ferner sei über R xk Xk, ∈ X := darstellt. Dieser Vektorraum X beinhaltet alle n-Tupel x = (x1 , . . . , xn ) mit k = 1, . . . , n. (i) Wird X mit der Norm versehen, die für alle n X kxk := x∈X deniert ist über kxk kX k , (2.2) k=1 so heiÿt der normierte Raum (X, k · k) Produktraum der Räume (X k , k · kX k ), k = 1, . . . , n. Für den Fall, dass Skalarprodukt (X k , k · kX k ), k = 1, . . . , n, h·, ·iX k sind, ist auf hx, yiX X sogar euklidische Räume mit über := n X hx, yiX k (2.3) k=1 für alle x, y ∈ X ein Skalarprodukt deniert. Es sei bemerkt, dass hierbei die von dem Skalarprodukt (2.3) induzierte Norm in der Regel nicht mehr mit der Norm (2.2) des Produktraums (ii) Die (X, k · k) übereinstimmt. kanonische Projektion, welche von X auf X k abbildet, ist deniert durch π k : X → X k , x 7→ xk , für (iii) Die k ∈ {1, . . . , n}. kanonische Einbettung von X k nach X ist deniert durch ιk : X k → X, xk 7→ (x̃1 , . . . , x̃k−1 , xk , x̃k+1 , . . . , x̃n ) für k ∈ {1, . . . , n} und feste x̃k̃ ∈ X k̃ mit k̃ = 1, . . . , n, k̃ 6= k . Dass das in (2.3) denierte Skalarprodukt bzw. die in (2.2) denierte Norm auch tatsächlich ein Skalarprodukt bzw. eine Norm auf 14 X darstellen, lässt sich unter Ver- 2. Topologische Grundlagen wendung der entsprechenden Denitionen direkt nachrechnen. Gleiches gilt für den X. Nachweis der Vektorraumeigenschaften von Bemerkung 2.16. π −1 (U k ) für jedes X1 = X k−1 × ... × x∈X U k ∈ Xk Falls k mit x ∈ × Uk für × k ∈ {1, . . . , n} X k+1 × ... × oen ist, so ist das Urbild X n ebenfalls oen in U k existiert eine oene Kugel in X k um X. r, die vollständig in U k enthalten ist. Daher ist auch die oene Kugel in r mit Radius X −1 (U k ) enthalten. Dies sagt auÿerdem aus, dass vollständig in π k ∈ {1, . . . , n} Denn xk mit Radius um x π k für stetig ist. In der Literatur ist es gängig den umgekehrten Weg zu gehen und die Stetigkeit der kanonischen Projektion zu fordern, um so beispielsweise eine Topologie auf einem Produkt von topologischen Räumen zu erhalten. Ebenso ist das Urbild U ∈X (ιk )−1 (U ) = {xk ∈ X k | (x1 , . . . , xn ) ∈ U } einer oenen Menge k ∈ {1, . . . , n} für und feste xk̃ ∈ X k̃ mit k̃ = 1, . . . , n und k̃ 6= k oen, was k die Stetigkeit von ι , impliziert. (X, k · k) Auf dem Produktraum haben Abbildungen, die sich aus Funktionen zu- sammensetzen, welche jeweils auf einer der Mengen Xk deniert sind, spezielle Ei- genschaften. Denition 2.17. n ∈ N Seien mit Produktraum (X, k · k). k Funktionen f k) (f1k , . . . , fm = und (X k , k · kk ), k = 1, . . . , n, Eine Funktion : Xk → Rm , f (x) = normierte Räume f = (f1 , . . . , fm ) : X → Rm , k = 1, . . . , n, n X für welche existieren mit f k (xk ) k=1 für alle x ∈ X, wird additiv zerlegbar genannt. Diese Form der Zerlegung ist bis auf konstante Terme eindeutig. Satz 2.18. Eine additiv zerlegbare Funktion k wenn die Funktionen f : Xk → Rm für Beweis. Da eine Funktion, die nach ihrer m k = 1, . . . , n ist genau dann stetig, stetig sind. abbildet, genau dann stetig ist, wenn jede Komponenten stetig ist, genügt es die Äquivalenz für die zu zeigen, j -te Komponente j ∈ {1, . . . , m}. ⇐: Seien n P Rm f : X → Rm fjk : X k → R, k = 1, . . . , n, (fjk ◦ π k )(x) und fj stetig, so gilt für alle x∈X bereits fj (x) = ist als Komposition und Summe stetiger Funktionen stetig. k=1 15 2. Topologische Grundlagen ⇒: Sei fj stetig. Für feste x̃k̃ ∈ X k̃ mit k̃ = 1, . . . , n, k̃ 6= k , fjk (xk ) = (fj ◦ ιk )(xk ) − n X gilt fjk̃ (x̃k̃ ) k̃=1 k̃6=k für alle xk ∈ X k . Da konstante Funktionen fj und ιk stetig sind und Kompositionen sowie Summen stetiger Funktionen stetig bleiben, ist auch fjk , k = 1, . . . , n, stetig. Im weiteren Verlauf der Arbeit werden weitere Eigenschaften von additiv zerlegbaren Funktionen eingeführt. Zunächst soll jedoch der Rd als Produktraum genauer untersucht und darin enthaltene Teilmengen betrachtet werden. Der Produktraum Rd Beispiel 2.19. (i) Das Sei d-fache d∈N fest. kartesische Produkt der reellen Zahlen ergibt die Menge d Y R = {(x1 , . . . , xd ) | x1 , . . . , xd ∈ R}. i=1 Da die Elemente von d Q R und Rd identisch sind, gilt i=1 d Q R = Rd . Als euklidi- i=1 sche Räume betrachtet stimmen das in (2.1) denierte Standard-Skalarprodukt auf dem (ii) Das Rd d-fache i = 1, . . . , d d Y und das in (2.3) denierte Skalarprodukt überein. kartesische Produkt der Intervalle [ai , bi ] ⊂ R mit ai < b i für ergibt die Menge [ai , bi ] = {(x1 , . . . , xd ) ∈ Rd | ai ≤ xi ≤ bi für i = 1, . . . , d} ⊂ Rd . i=1 Diese wird aufgrund ihrer geometrischen Darstellung auch als d-dimensionales Rechteck bzw. Hyperrechteck bezeichnet. Aufgrund der Nicht-Assoziativität von mehrfachen kartesischen Produkten ist gene- 16 2. Topologische Grundlagen rell 1 n Rd × . . . × Rd . . × R}) = (R . . × R}) × . . . × (R | × .{z | × .{z dn -mal d1 -mal 6= |R × .{z . . × R} = Rd d-mal für festes n∈N und feste dk ∈ N, k = 1, . . . , n, mit d := n P dk . Allerdings existiert k=1 n Rd 1 Rd × . . . × → Rd , (x1 , . . . , xn ) 7→ k P k xk = (xk1 , . . . , xkdk ) = xik−1 +1 , . . . , xik ∈ Rd und ik := dk̃ für wie oben erwähnt eine kanonische Bijektion (x1 , . . . , xd ) mit k̃=1 k = 1, . . . , n, welche die Mengen Rd1 × . . . × Rdn und Rd miteinander identiziert. Da auÿerdem n n X X hxk , y k iRdk = k i X gilt, sind die euklidischen Vektorräume d1 1 n-Tupel aus Rd ×. . .×Rd R ×...×R dn = Rd n d X 1 n Rd ×. . .×Rd mit einem xi yi = hx, yiRd i=1 k=1 ı̃ = ik−1 +1 k=1 ein xı̃ yı̃ = und Rd isomorph. Deshalb kann d-Tupel aus Rd gleichgesetzt werden, sowie in der Betrachtung als euklidische Räume. Diese Identikation wird im Folgenden für die gesamte Arbeit vorausgesetzt. Insgesamt gilt dann x = Entsprechend ist n Q x1 , . . . , x n Ak ⊆ Rd = (x1 , . . . , xd ) ∈ Rd . für Mengen k Ak ⊆ R d , (2.4) k = 1, . . . , n. k=1 Insbesondere als Teilmengen des Rd mit d≤3 lassen sich die Elemente von mehrfa- chen kartesischen Produkten geometrisch als Punktmenge darstellen. Dazu werden die Komponenten des d-Tupels (x1 , . . . , xd ) im kartesischen Koordinatensystem als Koordinaten eines Punktes aufgefasst. Beispielsweise lassen sich alle Paare der Menge A = [1, 3] × [1, 2] ⊂ R2 als Punkte innerhalb eines Rechtecks visualisieren, wie in Abbildung 2.1 zu erkennen ist. Ebenso können alle Tripel der Menge B = {(x1 , x2 ) ∈ R2 | (x1 )2 + (x2 )2 ≤ 1} × [−1, 1] ⊂ R3 als Punkte innerhalb eines Zylinders gedeutet werden, siehe Abbildung 2.2. 17 2. Topologische Grundlagen Abbildung 2.1: Darstellung der Menge Abbildung 2.2: Darstellung der Menge 18 B A (schwarz umrandet) (transparent schwarz umrandet) 3. Maÿtheoretischer Volumenbegri 3. Maÿtheoretischer Volumenbegri Rd Um das Volumen von Teilmengen des zu bestimmen, wird oftmals das Lebesgue- Maÿ verwendet. Zunächst werden dazu messbare Mengen und Funktionen eingeführt und anschlieÿend der Begri eines Maÿes. 3.1. Borel-Mengen In diesem Kapitel sei Vektorraum über R X stets eine nichtleere Menge, die nicht notwendigerweise ein darstellt. Allgemeines zu σ-Algebren Denition 3.1. (i) (ii) (iii) Sei A ⊂ P(X). Dann heiÿt A eine σ -Algebra über X , falls gilt ∅ ∈ A, A ∈ A ⇒ Ac := {x ∈ X : x ∈ / A} ∈ A, S Aj ∈ A, j ∈ N ⇒ Aj ∈ A. j∈N In diesem Fall wird das Paar heiÿen (X, A) Messraum genannt und die Mengen A ∈ A A-messbar. Aus der Denition einer σ -Algebra A \ Aj = j∈N kann direkt gefolgert werden, dass auch X = (∅)c ∈ A, !c [ (Aj )c ∈ A, j∈N A1 \A2 = A1 ∩ Ac2 ∈ A für Aj ∈ A, j ∈ N gilt. Für eine abzählbare Menge X wird eine σ -Algebra oftmals als Potenzmenge von X gewählt. Für eine überabzählbare Menge führt dies zu Schwierigkeiten bei der Einführung eines Maÿbegris, weshalb σ -Algebren in der Regel durch Erzeugendensysteme konstruiert werden. Denition 3.2. Seien E ⊂ P(X) ein Mengensystem und σ(E) die kleinste σ-Algebra, die E umfasst, d.h. für jede σ -Algebra A über X 19 mit E ⊂ A gilt auch σ(E) ⊂ A. Dann 3. Maÿtheoretischer Volumenbegri E wird Erzeuger der σ-Algebra σ(E) über X auch Erzeugendensystem oder kurz genannt und Satz 3.3. σ(E) die von Für beliebiges Durchschnitt aller E E erzeugte E ⊂ P(X) umfassenden ist die von σ -Algebren \ {A | A σ(E) = σ -Algebra. ist E erzeugte über σ -Algebra X, über σ -Algebra gegeben als der genauer X und E ⊂ A}. Beweis. Siehe Anhang A. Satz 3.4. Seien E1 ein Erzeuger der σ-Algebra A1 und E2 ein Erzeuger der σ-Algebra A2 . Falls E1 ⊂ A2 und E2 ⊂ A1 , dann gilt A1 = A2 . Beweis. Siehe Anhang A. Borel-σ-Algebren Der Standardvertreter einer σ -Algebra ist die Borel-σ -Algebra über dem Rd auf wel- cher auch das Hauptaugenmerk dieser Arbeit gelegt ist. Dabei sei bemerkt, dass Borel-σ -Algebren generell auch für beliebige topologische Räume formuliert werden können. Denition 3.5. Teilmengen von erzeugte Seien (X, k · k) ein normierter Raum und X . Die Borel-σ -Algebra über X σ -Algebra, T das System der oenen ist die von den oenen Teilmengen genauer B(X) := σ(T ). Die Elemente von B(X) heiÿen Die Borel-σ -Algebra über dem Borel-Mengen. Rd wird entsprechend mit B(Rd ) bezeichnet. Zum besseren Verständnis dieser Borel-σ -Algebra werden nun verschiedene Erzeuger vorgestellt. Dazu wird für a, b ∈ Rd mit a<b das d-dimensionale halboene Rechteck über d n o Y d (a, b] := x ∈ R | ai < xi ≤ bi , i = 1, . . . , d = (ai , bi ] i=1 festgelegt. 20 (3.1) 3. Maÿtheoretischer Volumenbegri Satz 3.6. Die Mengensysteme (i) T d = {U ⊂ Rd | U (ii) C d = {U ⊂ Rd | U Rd }, ist oen in ist abgeschlossen in (iii) I d = {(a, b] | a, b ∈ Rd , a < b}, (iv) d = {(a, ∞) | a ∈ Rd } I∞ sind Erzeuger der Borel-σ -Algebra B(Rd ), Rd }, wobei (a, ∞) für a ∈ Rd analog zu (3.1) erklärt ist. Beweis. Siehe Anhang A. Bemerkung 3.7. Die Borel-σ -Algebra im d klidischen Raums, d.h. B(R ) 6= Rd enthält nicht jede Teilmenge des eu- P(Rd ). Allerdings enthält diese so gut wie alle d Teilmengen von R , die für die Anwendung benötigt werden. Daher ist es in der Regel ausreichend, ausschlieÿlich Borel-Mengen als Teilmengen des Rd zu betrachten. d Darüber hinaus kann auf P(R ) kein Maÿ deniert werden, das einem Volumenbegri gerecht wird, vgl. [18]. Produkt-σ-Algebren Analog zur Norm der Produkträumen aus Kapitel 2.2 kann eine Borel-σ -Algebra auch über ein n-faches Produkt von Borel-σ -Algebren dargestellt werden. Dazu werden zunächst die sogenannten Rechtecksmengen eingeführt, welche für diese Arbeit von zentraler Bedeutung sind. Denition 3.8. Teilmengen Ω n ∈ N fest und (X k , k · kX k ), k = 1, . . . , n, n Q X := X k der Gestalt Seien von normierte Räume. k=1 Ω= n Y Ωk mit Ωk ∈ B(X k ) (3.2) k=1 werden Rechtecksmengen genannt. Denition 3.9. Seien n∈N fest und (X k , k · kk ), k = 1, . . . , n, Die vom System aller Rechtecksmengen erzeugte 21 normierte Räume. σ -Algebra wird Produkt-σ -Algebra 3. Maÿtheoretischer Volumenbegri der B(X k ) k∈{1,...,n} n O über dem Produktraum genannt und ist deniert als ( k B(X ) := σ k=1 n Y )! k k k Ω | Ω ∈ B(X ), k = 1, . . . , n . k=1 Bemerkung 3.10. In der Literatur ist es üblich Produkt-σ-Algebren allgemein über sogenannte Zylindermengen zu erzeugen. Eine Zylindermenge ist deniert als UrΩk ∈ B(X k ), k ∈ {1, . . . , n} bild der Menge unter der aus (2.4) bekannten Projekti- k onsabbildung π und besitzt die Darstellung (π k )−1 (Ωk ) = X 1 × . . . × X k−1 × Ωk × X k+1 × . . . × X n , n Q Ωk = k=1 n T n N (π k )−1 (Ωk ) ∈ vgl. Bemerkung 2.16. Aus dieser Darstellung folgt B(X k ). Mit k=1 (π k )−1 (Ωk ) und Satz 3.4 kann nun direkt eingesehen werden, dass beide k=1 Vorgehensweisen zur selben Produkt-σ -Algebra führen. Im Rd kann die Borel-σ -Algebra Mengensystemen erzeugte B(Rd ) wahlweise als von den in Satz 3.6 denierten σ -Algebra oder als Produkt-σ -Algebra, vgl. Denition 3.9, aufgefasst werden. Dies zeigt der folgende Satz. Satz 3.11. Seien n∈N dk ∈ N und fest für k = 1, . . . , n mit d := n P dk . Dann gilt k=1 n O k B(Rd ) = B(Rd ). k=1 Beweis. Siehe Anhang A. Bemerkung 3.12. n Q ecksmenge Ωk Aufgrund der Denition der Produkt-σ -Algebra ist jede Recht- mit Ωk ∈ Rd k nach Satz 3.11 eine Borel-Menge in Rd . Umge- k=1 kehrt ist jedoch nicht jede Borel-Menge in gende Beispiel zeigt. Seien Ω := {x ∈ R2 d = 2 | kxk2 ≤ 1} und (1, 0) ∈ Ω bedeutet aber auch, dass und eine Rechtecksmenge, wie das fol- n = 2, d.h. d1 = d2 = 1. ist abgeschlossen und somit gilt nommen es existiert eine Rechtecksmenge müsste wegen Rd (0, 1) ∈ Ω (1, 1) ∈ Ω Ω = auch Ω1 × 0, 1 ∈ Ω2 mit Ω1 und Die Menge Ω ∈ B(Rd ). Ω1 , Ω2 0, 1 ∈ Ange- ∈ B(R), dann Ω2 gelten. Dies sein müsste, was einen Widerspruch darstellt. 22 3. Maÿtheoretischer Volumenbegri 3.2. Borel-messbare Funktionen Für eine Abbildung Urbild einer Menge f :X →Y ist das Urbild einer −1 (S) deniert über f B⊂Y := σ -Algebra S ⊂ P(Y ) {f −1 (B) mit dem | B ∈ S}. Allgemeines zu messbaren Funktionen Denition 3.13. Y heiÿt und (Y, S) Messräume. Eine Funktion f : X → messbar, genauer A-S -messbar, falls Urbilder messbarer Mengen messbar sind, genauer falls Gilt (X, A) Seien f −1 (S) ⊂ A. (X, A) = (Rd , B Rd (Y, S) = (Rm , B (Rm ), und so wird eine A-S -messbare Funktion auch Borel-messbar genannt. Da in der Regel bekannt ist, um welche σ- Algebren es sich handelt, werden diese im weiteren Verlauf der Arbeit nicht immer explizit erwähnt. Bei der Untersuchung der Messbarkeit von Funktionen reicht es aus, sich auf ein Erzeugendensystem zu beschränken, wie der folgende Satz zeigt. Satz 3.14. S = σ(E). (X, A) Seien Dann ist und f :X→Y (Y, S) Messräume und E ein Erzeuger von S, also genau dann messbar, falls f −1 (E) ⊂ A. (3.3) Beweis. Wegen ! f −1 [ Bj ( = ) x ∈ X | f (x) ∈ j∈N [ Bj = j∈N = [ [ {x ∈ X | f (x) ∈ Bj } j∈N f −1 (Bj ), j∈N f für −1 (B ) = {x ∈ X | f (x) ∈ B c } = X\{x ∈ X | f (x) ∈ B} c = X\f −1 (B) = f −1 (B) B, Bj ∈ P(Y ) c und f −1 (Y ) = X ist das Mengensystem S 0 := {B ∈ P(Y ) | f −1 (B) ∈ A} eine σ -Algebra. Nach Denition 3.13 ist f Dies ist äquivalent zu E ⊂ S 0, da S genau dann messbar, wenn die kleinste σ -Algebra ist wiederum der Fall, falls Bedingung (3.3) erfüllt ist. 23 ist, welche S = σ(E) ⊂ S 0 . E enthält. Dies 3. Maÿtheoretischer Volumenbegri Hierbei sei bemerkt, dass der Beweis dieses Satzes den Beweis des Satzes 3.11 teilweise verallgemeinert. Für Abbildungen f : X → R lässt sich aus Satz 3.14 direkt die nachstehende Äquivalenz ableiten. Korollar 3.15. Seien (X, A) ein Messraum und f :X →R eine Funktion. Dann sind die folgenden Aussagen äquivalent: (i) f ist A − B(R)-messbar. (ii) Für alle α∈R gilt {x ∈ X | f (x) > α} ∈ A. (iii) Für alle α∈R gilt {x ∈ X | f (x) ≥ α} ∈ A. (iv) Für alle α∈R gilt {x ∈ X | f (x) < α} ∈ A. (v) Für alle α∈R gilt {x ∈ X | f (x) ≤ α} ∈ A. Beweis. Es gilt d system I∞ {x ∈ X | f (x) > α} = f −1 ((α, ∞)). = {(α, ∞) | α ∈ R} Da nach Satz 3.6 das Mengen- ein Erzeuger der Borel-σ -Algebra B(R) ist, folgt mit Satz 3.14 die Äquivalenz von (i) und (ii). Die Äquivalenz von (ii) - (v) ergibt sich aus {x ∈ X | f (x) ≥ α} = \ 1 {x ∈ X | f (x) > α − }, k k∈N {x ∈ X | f (x) < α} = {x ∈ X | f (x) ≥ α}c , \ 1 {x ∈ X | f (x) ≤ α} = {x ∈ X | f (x) < α + }, k k∈N {x ∈ X | f (x) > α} = {x ∈ X | f (x) ≤ α}c . Mengen der Gestalt {x ∈ X | f (x) ≤ α} werden im weiteren Verlauf der Arbeit noch des Öfteren auftauchen. Denition 3.16. Sei f :X→R eine Funktion. Die Menge {x ∈ X | f (x) ≤ α} = f −1 ((−∞, α]) wird α-Subniveaumenge von f genannt. Bevor einige elementare Eigenschaften von messbaren Funktionen vorgestellt und bewiesen werden, werden zunächst Beispiele messbarer Funktionen aufgeführt. 24 3. Maÿtheoretischer Volumenbegri Beispiel 3.17. (X, k · k) und (Y, k · k0 ) normierte Räume und f : X → Y (i) Seien eine stetige Abbildung, dann ist f gerade B(X)-B(Y )-messbar. Nach Denition der Stetigkeit, vgl. Satz 2.6, sind nämlich Urbilder oener Mengen oen und oene Mengen sind Erzeuger von Borel-σ -Algebren. Mit Satz 3.14 folgt somit sofort die Messbarkeit von f. Insbesondere sind damit die in Denition 2.15 denierten kanonischen Projektionen und Einbettungen messbar. (X, A) (ii) Sei ein Messraum. Die charakteristische Funktion Beispiel 2.9, ist messbar, falls die Mengen ∅, A, A A∈A wenn c und X A ∈ A. χA , deniert wie in Dies gilt, da die Urbilder von sein können, welche nur dann in A χA nur enthalten sind, gilt. Eigenschaften messbarer Funktionen Die folgenden Eigenschaften sind bereits von den stetigen Funktionen bekannt und lassen sich auf messbare Funktionen erweitern. Satz 3.18. und Seien g : Y1 → Y2 (X, A), (Y1 , S1 ) messbar, so ist auch Beweis. Für beliebiges samt gilt also Satz 3.19. Funktion f und B ∈ S2 ist g ◦ f : X → Y2 g −1 (B) ∈ S1 Seien (X, A) ein Messraum und f : X → Y1 messbar. und weiter f −1 (g −1 (B)) ∈ A. Insge- f := (f1 , . . . , fm ) : X → Rm . m ist genau dann A-B(R )-messbar, wenn die Funktionen Die fj : X → R, sind. Beweis. Analog zu Abbildung (2.4) sei j -te Messräume und seien (g ◦ f )−1 (B) ∈ A. j = 1, . . . , m, A-B(R)-messbar auf die (Y2 , S2 ) πj : Rm → R, j ∈ {1, . . . , m}, Komponente. Wie in Beispiel 3.17 beschrieben ist πj die Projektion deshalb Borel- messbar. ⇒ Sei f ⇐ Seien gilt messbar, so ist mit Satz 3.18 auch πj ◦ f für j = 1, . . . , m messbar. fj : X → R für j = 1, . . . , m nun A-B(R)-messbar, d.h. für alle Bj ∈ B(R) (πj ◦ f )−1 (B) ∈ A. die Borel-σ -Algebra Da nach Bemerkung 3.10 und Satz 3.11 die Mengen B(Rm ) πj−1 (B) erzeugen, folgt mit Satz 3.14 die Messbarkeit von f. Aus den Sätzen 3.18 und 3.19 kann hergeleitet werden, dass die Summe von messbaren Funktionen, welche nach R abbilden, ebenfalls messbar ist. 25 3. Maÿtheoretischer Volumenbegri Satz 3.20. und (X, A) Seien α, β ∈ R. Beweis. Da f ein Messraum, Dann ist auch und g αf + βg f, g : X → R A-B(R)-messbare f ·g sowie Funktionen messbar. messbar sind, ist mit Satz 3.19 auch die Abbildung h1 : X → R2 , x 7→ (f (x), g(x)) messbar. Ferner ist die Abbildung h2 : R2 → R, (x1 , x2 ) 7→ αx1 + βx2 stetig, vgl. Beispiel 2.7 und damit ebenfalls messbar. Daraus ergibt sich mit Satz 3.18 die Messbarkeit von f ·g mit h2 : Satz 3.21. R2 h2 ◦ h1 = αf + βg . → R, (x1 , x2 ) 7→ x1 x2 Seien n ∈ N σ -Algebren B(X k ) für und Entsprechend kann die Messbarkeit von gezeigt werden. (X k , k · kX k ) k = 1, . . . , n normierte Räume, die mit den Borel- Messräume darstellen. Der Produktraum dieser m Falls eine Funktion f : X → R n P k k nach Denition 2.17 additiv zerlegbar ist mit f (x) = f (x ) für x ∈ X und k=1 f k : X k → Rm , so ist f genau dann B(X)-B(Rm )-messbar, wenn die Funktionen f k Räume ist (X, k · k) mit Borel-σ -Algebra B(X k )-B(Rm )-messbar sind, B(X). k = 1, . . . , n. Beweis. Da nach Satz 3.19 eine Funktion, die nach ist, wenn jede ihrer j -te m Rm abbildet, genau dann messbar Komponenten messbar ist, genügt es, die Äquivalenz für die Komponente zu zeigen mit j ∈ {1, . . . , m}. k k ⇐: Seien fj : X → R für k = 1, . . . , n messbar, so gilt für alle x ∈ X gerade n P fj (x) = (fjk ◦π k )(x) und fj ist als Komposition und Summe messbarer Funktionen k=1 nach den Sätzen 3.18 und 3.20 messbar. ⇒: Sei fj messbar. Mit der kanonischen Einbettung, welche in Denition 2.15 eingeführt wurde und stetig und somit messbar ist, gilt für x̃k̃ ∈ X k̃ mit k̃ = 1, . . . , n, k̃ 6= k , k ∈ {1, . . . , n} und feste nun (fj ◦ ιk )(xk ) = fjk (xk ) + n X fjk̃ x̃k̃ k̃=1 k̃6=k für alle xk ∈ X k . Somit ist das Urbild von 26 1 , b ∈ R (b, ∞) ∈ I∞ unter fjk darstellbar 3. Maÿtheoretischer Volumenbegri als (fjk )−1 ((b, ∞)) = (fj ◦ ιk )−1 b̃, ∞ , wobei b̃ = b + n P fjk̃ (x̃k̃ ) ∈ R. Aufgrund der Messbarkeit von fj und ιk ist dann k̃=1 k̃6=k (fjk )−1 ((b, ∞)) ∈ B(X k ) und somit auch fjk wegen Satz 3.14 für k = 1, . . . , n messbar. 3.3. Das Lebesgue-Maÿ Ein Maÿ ordnet einer messbaren Menge einen nicht-negativen Wert zu, wie zum Beispiel das Volumen der Menge. Allgemeines zu Maÿen Denition 3.22. Sei (X, A) Maÿ auf A, wenn gilt (i) (ii) ein Messraum. Eine Abbildung µ : A → [0, ∞] heiÿt µ(∅) = 0, µ ist σ -additiv, d.h. für jede Folge paarweiser disjunkter Mengen (Ai )i∈N ⊂ A gilt µ [ ˙ ! Ai = i∈N Das Tripel Ein Maÿ und µ (X, A, µ) auf A µ(Ai ). i∈N wird dann Maÿraum genannt. heiÿt µ(Ai ) < ∞, i ∈ N In einem Maÿraum X σ -endlich, falls es eine Folge (Ai )i∈N ⊂ A mit S Ai = X i∈N gibt. (X, A, µ) werden Mengen nicht von der leeren Menge unterscheiden, also Aussagen, die für alle Elemente von X A ∈ A, welche sich bzgl. des Maÿes µ(A) = 0 gilt, Nullmengen genannt. bis auf die Elemente einer Nullmenge gelten, werden fast überall gültig genannt. Im folgenden Satz sind Eigenschaften des Maÿes aufgeführt, die sich direkt aus der σ -Additivität ergeben. Für die Mengen A, A1 , A2 , . . . ∈ A 27 werden dazu die Schreib- 3. Maÿtheoretischer Volumenbegri weisen Ai ↑ A, A1 ⊃ A2 ⊃ . . . S A1 ⊂ A2 ⊂ . . . und A = Ai ∈ A i∈N T A= Ai ∈ A gilt, verwendet. falls und gilt und Ai ↓ A, falls i∈N Satz 3.23. Seien (X, A, µ) (i) Subtraktivität, d.h. für (ii) Monotonie, d.h. für (iii) ein Maÿraum und A1 ⊂ A2 A1 ⊂ A2 ist Dann gelten µ(A1 ) < ∞ ist µ(A2 \A1 ) = µ(A2 )−µ(A1 ), µ(A1 ) ≤ µ(A2 ), Ai ↑ A gilt lim µ(Ai ) = µ(A) und für Ai ↓ A mit µ(A1 ) < σ -Stetigkeit, d.h. für ∞ lim µ(Ai ) = µ(A). ebenfalls und Ai ∈ A, i ∈ N. i→∞ i→∞ Beweis. Siehe Anhang A. Ein Maÿ, das einem d-dimensionalen Intervall d Q (a, b] = (ai , bi ] ⊂ Rd sein Volumen i=1 zuordnet, ist das Lebesgue-Maÿ. Der folgende Satz besagt dessen Eindeutigkeit und Existenz als Volumenmaÿ, weshalb die nachfolgenden Betrachtungen weitestgehend auf das Lebesgue-Maÿ beschränkt werden. Satz und Denition 3.24. Für festes d∈N existiert genau ein Maÿ λd : B(Rd ) → [0, ∞], sodass für jedes d-dimensionale Intervall (a, b] = d Q (ai , bi ] ⊂ Rd gerade i=1 λd ((a, b]) = d Y (bi − ai ) i=1 gilt. Das Maÿ λd heiÿt dann das d-dimensionale Lebesgue-Maÿ. Beweis. Siehe [18]. Bemerkung 3.25. Da d Q (xi − k1 , xi ] ↓ {x} i=1 (ii) Für alle d Q x ∈ Rd ist die Menge {x} eine Nullmenge. 1 d d nach Satz 3.23 λ ({x}) = lim = 0. k (i) Für jeden Punkt gilt, ist k→∞ a, b ∈ Rd mit a ≤ b gilt λd ((a, b)) = λd ([a, b)) = λd ((a, b]) = λd ([a, b]) = (bi − ai ). i=1 28 3. Maÿtheoretischer Volumenbegri A ⊂ Rd (iii) Für jede abzählbare Teilmenge gilt µ(A) = 0. Insbesondere ist auch λ1 (Q) = 0. σ -endlich (iv) Das Lebesgue-Maÿ ist wegen d S Q Rd = [−N, N ]. N ∈N i=1 In einem Maÿraum (X, A, µ) A-B(R)-messbare kann nun für Funktionen f :X→R ein Integralbegri eingeführt werden. Das detaillierte Vorgehen ndet sich beispielsweise in [7]. Die Idee dabei ist es, f in einen positiven und negativen Anteil zu f = f+ − f− mit f+ (x) := max{f (x), 0} und f− (x) := d R und durch eine Folge von Stufenfunktionen anzunähern. m P zerlegen, d.h. für x∈ Für eine nicht-negative Stufenfunktion cj χAj s := mit − min{0, f (x)} cj ∈ [0, ∞) und Aj ∈ A f (x) ≥ 0 für alle j=1 ist das Integral bzgl. µ über Z s dµ := m X cj µ(Aj ) ∈ [0, ∞] j=1 deniert. Zu x ∈ A-B(R)-messbaren punktweise gegen f Funktionen f mit f ≥ 0, also Rd , gibt es eine Folge monoton wachsender Stufenfunktionen bzgl. µ f konvergiert, d.h. lim sj (x) = f (x) k→∞ für x ∈ X. (sj )j∈N , welche Das Integral von ist dann über Z Z f dµ := lim j→∞ sj dµ ∈ [0, ∞] festgelegt. Insgesamt ergibt sich dann für das Integral allgemeiner messbarer Funktionen Z Z f dµ := sofern nicht beide Integrale den Wert Z f+ dµ − f− dµ, ∞ annehmen. Dies bedeutet, dass das Integral nicht immer existieren muss. Eine andere Darstellung des Integrals ist beispielsweise R R f (x) dµ(x) := f dµ. Ist zusätzlich R so wird A f dµ geschrieben. A∈A beschränkt, d A f (x) dλ (x) verwend det. Dies ist daher motiviert, dass für beschränkte Funktionen f : R → R mit komFalls µ = λd der Integrationsbereich auf gilt, so wird auch die Schreibweise R A f (x) dx := R paktem Träger aus der Riemann-Integrierbarkeit bereits die Lebesgue-Integrierbarkeit folgt, siehe [7]. 29 3. Maÿtheoretischer Volumenbegri Beispiel 3.26. A ∈ A, Die einfachste Stufenfunktion ist die charakteristische Funktion χA , welche bereits in der Denition der Stufenfunktion selbst verwendet und in (X, A, µ) Beispiel 2.9 eingeführt wurde. Im Maÿraum gilt für ihr Integral Z χA dµ = µ(A) und für (X, A, µ) = (Rd , B(Rd ), λd ) Z gilt χA (x) dx = λd (A). Analog zu den Produkträumen und der Produkt-σ -Algebra ist es nun das Ziel, aus den Maÿräumen (X k , Ak , µk ), k = 1, . . . , n, einen Produktmaÿraum zu bilden. Zu- nächst wird dazu festgelegt, welche Eigenschaft ein Produktmaÿ erfüllen muss. Denition 3.27. Seien (X k , Ak , µk ) n O µk : n O k = 1, . . . , n Maÿräume. Ein Maÿ Ak → [0, ∞] k=1 k=1 wird für Produktmaÿ der µk genannt, falls für alle Ak ∈ Ak , k = 1, . . . , n n O k 1 n µ (A × . . . × A ) = 0 · ∞ := 0 µk (Ak ) k=1 k=1 gilt, wobei n Y verwendet wird. Das folgende Resultat ist zunächst für zwei Maÿräume formuliert. Satz 3.28. eindeutiges (X k , Ak , µk ), k = 1, 2, σ -endliche Maÿräume. Dann existiert 2 2 2 N N N µk auf Ak . Für alle A ∈ Ak gilt auÿerdem Produktmaÿ Seien k=1 2 O k=1 k=1 Z Z k µ (A) = ein 1 2 1 1 1 2 2 2 χA (x , x ) dµ (x ) dµ2 (x2 ) k=1 Z Z = χA (x , x ) dµ (x ) dµ1 (x1 ). Beweis. Siehe [8]. Dieser Satz kann sofort auf n Maÿräume erweitert werden, vgl. ebenfalls [8]. Speziell 30 3. Maÿtheoretischer Volumenbegri für das Lebesgue-Maÿ folgt daraus n O λd = k=1 für feste dk ∈ N, k = 1, . . . , n und d := n P dk . k=1 31 k λd (3.4) 4. Konvexe Theorie 4. Konvexe Theorie In diesem Kapitel werden zunächst konvexe Mengen und Funktionen untersucht. Anschlieÿend werden Optimierungsprobleme betrachtet, denen konvexe Funktionen zugrunde liegen. 4.1. Konvexe Mengen und Funktionen Die nachfolgenden Betrachtungen zur Konvexität sind auf den Rd beschränkt. Konvexe Mengen Denition 4.1. Eine Menge C ⊂ Rd strecke zweier beliebiger Punkte in und θ ∈ [0, 1] C wird konvex genannt, wenn die Verbindungs- wieder in C liegt. D.h. also, falls für x, y ∈ C gerade θx + (1 − θ)y ∈ C gilt. Beispiel 4.2. Ein Beispiel für eine konvexe Menge ist die Lösungsmenge eines linea- ren Gleichungssystems sind x, y ∈ C , d.h. C = {x ∈ Rd | Ax = b}, Ax = b und Ay = b, wobei A ∈ Rm×d so gilt für beliebiges und θ ∈ [0, 1] b ∈ Rm . Denn nun A(θx + (1 − θ)y) = θAx + (1 − θ)Ay = θb + (1 − θ)b = b. Deshalb ist auch θx + (1 − θ)y ∈ C Auch die leere Menge ∅, und C konvex. die Menge, welche einen einzelnen Punkt d und der gesamte R sind Beispiele konvexer Teilmengen des x ∈ Rd enthält Rd . Der folgende Satz stellt zwei wichtige Eigenschaften von konvexen Mengen vor. Satz 4.3. auch (i) Seien m T C := Cj Cj ⊂ Rd , j = 1, . . . , m, m ∈ N eine konvexe Menge. j=1 32 konvexe Mengen, dann ist 4. Konvexe Theorie (ii) Seien n∈N k C k ⊂ Rd und dk ∈ N fest für nichtleer. Die Menge die Mengen Ck, k = k = 1, . . . , n C := n Q mit d := n P dk . Ferner seien k=1 C k ⊂ Rd ist genau dann konvex, wenn k=1 1, . . . , n, konvex sind. Beweis. Siehe Anhang A. Mit diesem Satz kann gefolgert werden, dass d-dimensionale Rechtecke im Rd , be- kannt aus Beispiel 2.19, konvex sind, da jedes Intervall in den reellen Zahlen oensichtlich konvex ist. Konvexe Funktionen Neben konvexen Mengen können auch konvexe Funktionen betrachtet und deren Eigenschaften untersucht werden. Denition 4.4. falls für alle (i) Sei x, y ∈ C C ⊂ Rd mit konvex. Eine Funktion x 6= y und für alle f :C→R θ ∈ (0, 1) heiÿt konvex, gilt, dass f (θx + (1 − θ)y) ≤ θf (x) + (1 − θ)f (y). (ii) Gilt in der Ungleichung (4.1) sogar <, so wird (iii) Falls −f konvex ist, so heiÿt (iv) Analog heiÿt f f θ=0 bzw. θ=1 streng konvex genannt. konkav. strikt konkav, falls −f Die Ungleichung (4.1) kann gleichermaÿen für für f (4.1) strikt konvex ist. θ ∈ [0, 1] formuliert werden. Da diese jedoch stets erfüllt ist, werden die beiden Fälle in der Literatur oftmals weggelassen. Geometrisch bedeutet die Ungleichung (4.1), dass die Verbindungsstrecke zwischen (x, f (x)) und (y, f (y)) nie unterhalb des Graphen von f Anknüpfend an Denition 4.4 wird eine Funktion liegt. f = (f1 , . . . , fm )T : C → Rm nau dann als konvex bezeichnet, wenn jede ihrer Komponenten ge- fj , j = 1, . . . , m, eine konvexe Funktion darstellt. Für derartige Funktionen kann die Ungleichung (4.1) als Ungleichungssystem auch komponentenweise verstanden werden. Entsprechendes gilt für strikt konvex, konkav und strikt konkav. Die nachfolgenden Betrachtungen werden zunächst auf Funktionen, die nach R ab- bilden, beschränkt. Jedoch können diese in der Regel sofort auf Funktionen mit Wertebereich Rm erweitert werden. 33 4. Konvexe Theorie Wichtige Eigenschaften von konvexen Funktionen sind, dass jede Minimalstelle global ist und dass konvexe Funktionen für oenes C stetig sind, vgl. [2]. Für f strikt konvex ist eine globale Minimalstelle, sofern sie existiert, sogar eindeutig. Falls konvexe Funktionen zusätzlich dierenzierbar sind, können Bedingungen erster und zweiter Ordnung hergeleitet werden. Bedingungen erster und zweiter Ordnung Satz 4.5. dass f Seien C ⊂ Rd oen und konvex und genau dann konvex ist, wenn für alle f :C →R x, y ∈ C mit dierenzierbar. So gilt, x 6= y die Ungleichung f (x) + ∇f (x)T (y − x) ≤ f (y) (4.2) erfüllt ist. Beweis. Siehe Anhang A. Ist in Satz 4.5 die Funktion f strikt konvex, so kann gezeigt werden, dass für Unglei- chung (4.2) sogar < gilt. An dieser Stelle soll kurz an die Taylor-Formel am Beispiel einer zweimal dierenzierbaren Funktion f :C→R mit oenem und konvexen C ⊂ Rd erinnert werden. In [7] ndet sich eine allgemeine Einführung in die Thematik. Seien mit x + h ∈ C, so gibt es nach dem Satz von Taylor ein θ ∈ (0, 1), x ∈ C , h ∈ Rd sodass 1 f (x + h) = f (x) + ∇f (x)T h + hT ∇2 f (x + θh)h 2 (4.3) gilt. Die ersten beiden Summanden stellen hier das Taylorpolynom von Ordnung 1 dar. Die Ungleichung (4.2) besagt deshalb, dass die Funktionswerte, welche das Taylorpolynom erster Ordnung von kleiner als die von f f um einen beliebigen Punkt x ∈ C am selben Punkt sind. Aus lokalen Informationen von dem Funktionswert und dem Gradienten an einer bestimmten Stelle sich also globale Informationen. Insbesondere gilt ∇f (x) annimmt, stets f (y) ≥ f (x) x ∈ C, für alle f, d.h. ergeben y ∈ C, falls der Nullvektor ist. Dies verdeutlicht nochmals, dass jede lokale Minimalstelle auch eine globale ist. Satz 4.6. So ist f Seien C ⊂ Rd oen und konvex und f : Rd → R 2 genau dann konvex, wenn ∇ f (x) für alle 34 x∈C zweimal dierenzierbar. positiv semidenit ist. 4. Konvexe Theorie Beweis. Siehe Anhang A. Analog zum Beweis von Satz 4.6 kann darauf geschlossen werden, dass 2 vex ist, falls ∇ f (x) für alle x∈C ⊂ jedoch nicht, wie das Beispiel f strikt kon- Rd positiv denit ist. Die Rückrichtung gilt f : R → R, x 7→ x4 zeigt. Die Bedingungen erster und zweiter Ordnung lassen sich direkt auf konkave Funktionen übertragen. Stellvertretend dafür sei die Bedingung erwähnt, dass genau dann konkav ist, wenn ∇2 f (x) muss wie oben beschrieben stets C⊂ negativ semidenit für alle f : Rd → R x∈C ist. Dabei Rd oen und konvex sein. Neben der Denition von konvexen Funktionen ist auch die Bedingung zweiter Ordnung aus Satz 4.6 zum Nachweis der Konvexität von Funktionen hilfreich. Beispiel 4.7. (i) Jede lineare Funktion f : Rd → Rm ist konvex. Aus Beispiel 4.2 kann direkt gefolgert werden, dass für lineare Funktionen in Ungleichung (4.1) Gleichheit gilt. (ii) Die quadratische Funktion f : Rd → R, 1 T x P x + qT + r 2 f (x) = für alle x ∈ Rd mit P ∈ Rd×d , q ∈ Rd 2 semidenit ist, da ∇ f (x) (iii) Jede Norm k·k auf Rd =P gegeben über r ∈ R, und ist konvex, falls P positiv gilt. ist konvex. Denn für θ ∈ (0, 1) gilt kθx + (1 − θ)yk ≤ kθxk + k(1 − θ)yk ≤ θkxk + (1 − θ)kyk. Weitere Eigenschaften von konvexen Funktionen Im Folgenden werden weitere Eigenschaften von konvexen Funktionen untersucht. Diese werden hier auf den Denitionsbereich C = Rd reduziert. Satz 4.8. Die α-Subniveaumenge Cα := {x ∈ Rd | f (x) ≤ α}, bekannt aus Denition 3.16, einer konvexen Funktion Beweis. Da ist Cα f : Rd → R konvex ist, ist f ist eine Borel-Menge und konvex. auch stetig und damit Borel-messbar. Somit nach Korollar 3.15 eine Borel-Menge. Seien nun stets f : Rd → R x, y ∈ Cα , dann gelten f (θx + (1 − θ)y) ≤ α f (x) ≤ α erfüllt, woraus konvex. 35 und f (y) ≤ α. Daher ist für θx + (1 − θ)y ∈ Cα θ ∈ (0, 1) folgt, d.h. Cα ist 4. Konvexe Theorie Umgekehrt werden Funktionen konvex sind, als f : Rd → R, deren α-Subniveaumengen für alle α ∈ R quasikonvex bezeichnet. Oensichtlich ist jede konvexe Funktion somit quasikonvex, aber nicht jede quasikonvexe Funktion ist konvex, vgl. [4]. Satz 4.9. Seien fj : Rd → R, j = 1, . . . , m, (i) die Funktion f := m P fj konvexe Funktionen. Dann gilt ist konvex, j=1 (ii) das punktweise Maximum Beweis. Für max j∈{1,...,m} fj : Rd → R, j = 1, . . . , m, fj ist konvex. konvex, m X f (θx + (1 − θ)y) = j=1 m X ≤ x, y ∈ Rd und θ ∈ (0, 1) gilt fj (θx + (1 − θ)y) (θfj (x) + (1 − θ)fj (y)) j=1 = θf (x) + (1 − θ)f (y). und max j∈{1,...,m} fj (θx + (1 − θ)y) ≤ max (θfj (x) + (1 − θ)f (y)) j∈{1,...,m} ≤ θ max j∈{1,...,m} Also sind f Satz 4.10. und max j∈{1,...,m} Seien n ∈ N fj fj (x) + (1 − θ) und dk ∈ N für k = 1, . . . , n fest mit d := Rm f dk . Falls f (x) = genau dann konvex, wenn die abbildet, genau dann konvex ist, wenn jede Komponenten konvex ist, genügt es die Äquivalenz für die zu zeigen mit n P k=1 Rm nach Denition 2.17 additiv zerlegbar ist mit Beweis. Da eine Funktion, die nach m fj (y). konvex. d eine Funktion f : R → n P k f k (xk ) für x ∈ Rd und f k : Rd → Rm , so ist k=1 k Funktionen f für k = 1, . . . , n konvex sind. ihrer max j∈{1,...,m} j -te Komponente j ∈ {1, . . . , m}. k ⇐: Seien fj , k = 1, . . . , n, konvex, so ist wegen Satz 4.9 mit d für x ∈ R auch fj konvex. 36 fjk ◦ π k (x) = fjk (xk ) 4. Konvexe Theorie ⇒: Seien ιk für feste fj konvex und x̃k̃ ∈ R dk̃ mit zugeordnet werden. Für k ∈ {1, . . . , n} beliebig. Mit der kanonischen Einbettung k̃ = 1, . . . , n, k̃ 6= k , xk , y k ∈ R dk und kann jedem θ ∈ (0, 1) k xk ∈ Rd ein x ∈ Rd ist dann fjk (θxk + (1 − θ)y k ) = fj (θιk (xk ) + (1 − θ)ιk (y k )) − n X fjk̃ (x̃k̃ ) k̃=1 k̃6=k k k k k ≤ θfj (ι (x )) + (1 − θ)fj (ι (y )) − n X fjk̃ (x̃k̃ ) k̃=1 k̃6=k = θfjk (xk ) + (1 − θ)fjk (y k ). Bemerkung 4.11. Für quasikonvexe Funktionen gilt der Satz 4.10 nicht. Beispiels- weise ist für die quasikonvexen Funktionen (−1)-Subniveaumenge für alle x1 , x2 ∈ R, konvex. Also ist f der Funktion wegen f, f k : R → R, xk 7→ (xk )3 , k = 1, 2, deniert über f (−1, 0) = f (0, −1) = −1 die f (x1 , x2 ) := f 1 (x1 ) + f 2 (x2 ) und f (−0,5, −0,5) > −1 nicht nicht quasikonvex. Fortsetzung konvexer Funktionen Für C ( Rd ist es möglich den Denitionsbereich von konvexen Funktionen zu erweitern. Denition 4.12. Sei C ⊂ Rd konvex. Falls f :C →R eine konvexe Funktion ist, so heiÿt ( f˜ : Rd → (−∞, ∞], x 7→ die x ∈ C, f (x) falls ∞ sonst werteerweiterte Fortsetzung von f . Der Denitionsbereich der ursprünglichen Funktion C= x∈ Für alle Rd | f˜(x) < ∞ x, y ∈ Rd f kann hierbei über die Menge beschrieben werden. und alle θ ∈ (0, 1) gilt für die werteerweiterte Fortsetzung einer konvexen Funktion f˜(θx + (1 − θ)y) ≤ θf˜(x) + (1 − θ)f˜(y). 37 (4.4) 4. Konvexe Theorie Denn für x∈ /C x, y ∈ C oder stimmt die Ungleichung (4.4) mit Ungleichung (4.1) überein. Falls y∈ /C nimmt die rechte Seite von (4.4) den Wert ∞ an und die Unglei- chung ist immer erfüllt. In diesem Sinne kann die Denition 4.4 auf Funktionen f˜ : Rd → (−∞, ∞] f˜ konvex genannt, falls die Ungleichung e := {x ∈ Rd | f˜(x) < ∞} konvex ist dass C erwei- tert werden. So wird (4.4) erfüllt ist. Dies impliziert nämlich, und für alle und alle θ ∈ (0, 1) e x, y ∈ C Funktionen f˜ die Ungleichung (4.1) gilt. Insgesamt können solche also immer als eine werteerweiterte Fortsetzung einer konvexen Funktion aufgefasst werden. Eine wichtige Eigenschaft, welche die werteerweiterte Fortsetzung von der ihr zugrunde liegenden konvexen Funktion übernimmt, ist die Globalität jeder Minimalstelle. Gleichermaÿen können konkave Funktionen fortgesetzt werden, indem Variablen, die nicht in alle C liegen, der Wert θ ∈ (0, 1) −∞ zugeordnet wird. Hierbei ist für alle x, y ∈ Rd und die Ungleichung f˜(θx + (1 − θ)y) ≥ θf˜(x) + (1 − θ)f˜(y), (4.5) erfüllt. Logarithmisch-konkave und logarithmisch-konvexe Funktionen Für die konvexe Optimierung sind logarithmisch-konvexe bzw. logarithmisch-konkave Funktionen oftmals hilfreich. Dazu sei bemerkt, dass während der gesamten Arbeit unter Logarithmus stets der natürliche Logarithmus zu verstehen ist. Denition 4.13. Eine Funktion f : Rd → (0, ∞) , auch notiert über logarithmisch-konkav genannt, falls log f konkav logarithmisch-konvex genannt, falls log f konvex ist. wird ist. Entsprechend wird Durch Anwenden der Logarithmen-Gesetze, vgl. [7], ergibt sich, dass dann logarithmisch-konvex ist, wenn 1/f genau f : Rd → [0, ∞), d.h. erweitert werden. Im Sinne der werteerweiterten Fortsetzung sei ( f˜ : R → [−∞, ∞), x 7→ d Falls f >0 f logarithmisch konkav ist. Die logarithmische Konkavität kann auch auf Funktionen f ≥ 0, f > 0, log f (x) falls f (x) > 0, −∞ falls f (x) = 0. f˜ die Bedingung (4.5) erfüllt, also f˜ konkav ist, so wird f 38 logarithmisch-konkav 4. Konvexe Theorie genannt. Die logarithmische Konkavität kann auch ohne Logarithmus ausgedrückt werden. Satz 4.14. Eine Funktion wenn für alle x, y ∈ f : Rd → [0, ∞) Rd und für alle ist genau dann logarithmisch-konkav, θ ∈ (0, 1) gerade f (θx + (1 − θ)y) ≥ f (x)θ f (y)1−θ (4.6) gilt. Beweis. Sei f > 0. Dann sind für x, y ∈ Rd und θ ∈ (0, 1) die Aussagen log f (θx + (1 − θ)y) ≥ θ log f (x) + (1 − θ) log f (y), log f (θx + (1 − θ)y) ≥ log f (x)θ + log f (y)1−θ , log f (θx + (1 − θ)y) ≥ log f (x)θ f (y)1−θ , f (θx + (1 − θ)y) ≥ f (x)θ f (y)(1−θ) aufgrund der Logarithmen-Gesetze und der Monotonie der Logarithmusfunktion äquivalent. O.B.d.A. gelte nun f (x) = 0 x ∈ Rd . für Dann ist sowohl die Unglei- chung (4.5) wie oben beschrieben als auch die Ungleichung (4.6) wegen f ≥0 stets erfüllt. Beispiel 4.15. Die charakteristische Funktion von A ⊂ Rd ist logarithmisch-konkav, falls A konvex ist. Denn für und für x, y ∈ A gilt x∈ /A oder θx + (1 − θ)y ∈ A, y∈ /A ist die Ungleichung (4.6) stets erfüllt weshalb (4.6) ebenfalls erfüllt ist. Nun wird auf eine wichtige Eigenschaft von logarithmisch-konvexen Funktionen eingegangen. Dazu wird die Prékopa-Leindler Ungleichung benötigt. Satz 4.16. Seien f, g, h : Rd → [0, ∞) Borel-messbare Funktionen, welche die Be- dingung h(θx + (1 − θ)y) ≥ f (x)θ g(y)1−θ für alle x, y ∈ Rd und alle θ ∈ (0, 1) erfüllen. Dann gilt h(x) dx ≥ Rd θ Z Z Z (4.7) f (x) dx Rd Rd 39 1−θ g(x) dx . (4.8) 4. Konvexe Theorie Diese Ungleichung wird auch Prékopa-Leindler Ungleichung genannt. Beweis. Siehe [20] und [21]. Korollar 4.17. Seien A ∈ B(Rd ) konvex, f : Rd ×Rm → [0, ∞) logarithmisch-konkav und f (·, y) Borel-messbar für alle g:R m y ∈ Rm . Dann ist die Funktion Z → [0, ∞], y 7→ g(y) := f (x, y) dx (4.9) A ebenfalls eine logarithmisch-konkave Funktion. Beweis. Seien y 0 , y 00 ∈ Rm und θ ∈ (0, 1). ( d f1 : R → [0, ∞), x 7→ ( f2 : Rd → [0, ∞), x 7→ ( f3 : Rd → [0, ∞), x 7→ Da A konvex ist und f Ferner seien f (x, y 0 ) falls 0 sonst, x ∈ A, f (x, y 00 ) falls 0 sonst, y ∈ A, f (x, θy 0 + (1 − θ)y 00 ) falls 0 sonst. x ∈ A, logarithmisch-konkav, gilt f3 (θx0 + (1 − θ)x00 ) ≥ f1 (x0 )θ f2 (x00 )1−θ für alle x0 , x00 ∈ Rd . 0 Mit Satz 4.16 folgt schlieÿlich Z 00 f (x, θy 0 + (1 − θ)y 00 ) dx g(θy + (1 − θ)y ) = ZA = f3 (x) dx Rd θ Z Z ≥ 1−θ f1 (x) dx Rd Z = f2 (x) dx Rd θ Z 0 f (x, y ) dx A 0 θ 00 1−θ f (x, y ) dx A = g(y ) g(y 00 )1−θ , für alle y 0 , y 00 ∈ Rm und alle θ ∈ (0, 1). D.h. 40 g ist logarithmisch-konkav. 4. Konvexe Theorie 4.2. Konvexe Optimierungsprobleme Bevor genauer auf konvexe Optimierungsprobleme eingegangen wird, werden zunächst noch Grundlagen zu allgemeinen Optimierungsproblemen besprochen. Grundlegendes Sei D ⊂ Rd . einer Bei einem Optimierungsproblem ist eine Minimal- bzw. Maximalstelle Zielfunktion J das Maximieren von :D →R J für auf einer x ∈ F zulässigen Menge F dem Minimieren von −J für ⊂D gesucht. Da x ∈ F entspricht, wird in diesem Kapitel stellvertretend nur das Minimierungsproblem betrachtet. In der Literatur wird dieses generell über minimiere J(x) u.d.N. x ∈ F bzw. minimiere J(x) x∈F notiert, wobei die Abkürzung u.d.N. für unter der Nebenbedingung steht. Falls F = D = Rd gilt, so handelt es sich um eine unrestringierte Optimierungsaufgabe. Häug kann die zulässige Menge über ein System von Gleichungen und Ungleichungen deniert werden, was in dieser Arbeit stets der Fall sein soll. Die zulässige Menge F kann dann über F = {x ∈ D | e(x) = ec , f (x) ≤ fc } beschrieben werden, wobei und f = (f1 , . . . , fm e(x) = ec )T e = (e1 , . . . , ep )T : D → Rp , ec ∈ Rp :D→ Rm , fc ∈ Rm mit sowie das Ungleichungssystem komponentenweise erfüllt sein. Da auch p ∈ N, p ≤ d m ∈ N gelten. Das Gleichungssystem f (x) ≤ fc D⊂ mit müssen dabei für alle x ∈ F Rd über ein System von Gleichungen und Ungleichungen festgelegt werden kann, ist es ohne Weiteres möglich D = Rd zu wählen und die Nebenbedingungen entsprechend zu ergänzen. Diese Eigenschaft wird später noch verwendet. An dieser Stelle sei auÿerdem bemerkt, dass die zulässige Menge und F gleichermaÿen auch nur mit einer bzw. ohne eine der Bedingungen f (x) ≤ fc e(x) = ec formuliert werden kann. Im Folgenden wird ein Minimierungsproblem daher immer in der Form minimiere J(x) x∈D u.d.N. (4.10) e(x) = ec , f (x) ≤ fc 41 4. Konvexe Theorie geschrieben. In der nun folgenden Denition wird der Begri einer Lösung eines Minimierungsproblems eingeführt. Denition 4.18. (i) Ein Punkt problems (4.10), falls ein x∈F∩ x∗ ∈ F heiÿt δ ∈ (0, ∞) lokale Lösung des Minimierungs- existiert mit J(x∗ ) ≤ J(x) (ii) Ein Punkt x∗ ∈ F heiÿt globale bzw. optimale Lösung des Minimierungspro- J(x∗ ) ≤ J(x) blems (4.10), falls für alle x ∈ F. Eine globale Lösung existiert beispielsweise unter der Voraussetzung, dass und J für alle B(x∗ , δ). F kompakt stetig bzw. nach unten halbstetig ist, vgl. Kapitel 2.1. Ferner ist eine globale Lösung eindeutig, falls in Denition 4.18 sogar F Handelt es sich bei J(x∗ ) < J(x) um eine konvexe Menge und bei J für alle x ∈ F gilt. um eine konvexe Funktion, so sind alle lokalen Lösungen von (4.10) auch globale Lösungen, vgl. Kapitel 4.1. Die zulässige Menge ist für eine konvexe Menge f konvexe Funktion D, eine lineare Funktion e und eine mit Beispiel 4.2, Satz 4.3 und 4.8 konvex. Dies motiviert die folgende Denition. Denition 4.19. tion und (4.10) Seien die Menge f : D → Rm , D ⊂ Rd J : D → R konvex, e : D → Rp eine lineare Funk- konvexe Funktionen. Dann wird das Problem konvexes Optimierungsproblem bzw. konvexes Minimierungsproblem ge- nannt. Mit e(x) = Ex, E ∈ Rp×d für x∈D kann das konvexe Optimierungsproblem in der Form minimiere J(x) x∈D u.d.N. (4.11) Ex = ec , f (x) ≤ fc dargestellt werden. Der Vorteil eines konvexen Optimierungsproblems gegenüber dem allgemeinen ist es, nach lokalen Lösungen suchen zu können, um eine optimale Lösung zu erhalten. Beispiel 4.20. xl , xu ∈ Rd mit Seien xl < f = (f1 , . . . , fm )T : Rd → Rm eine konvexe Funktion und xu . Das Problem minimiere kf (x)k∞ x∈Rd u.d.N. (4.12) −x ≤ xl , x ≤ xu 42 4. Konvexe Theorie ist ein konvexes Optimierungsproblem. Unter Verwendung von Satz 4.9 bzw. Beispiel 4.7 ist dies sofort ersichtlich. Selbst wenn die Funktionen fj , j = 1, . . . , m, dierenzierbar sind, ist in der Regel nicht gegeben, dass die Zielfunktion des Beispielproblems (4.12) ebenso dierenzierbar ist. Hier ist es allerdings möglich das Problem (4.12) auf ein äquivalentes, dierenzierbares Problem zu transformieren, welches minimiere α (α,x)∈R×Rd −x ≤ xl , x ≤ xu , fj (x) ≤ α, j = 1, . . . , m u.d.N. lautet, vgl. [12]. Optimalitätskriterien Für die Bestimmung einer Lösung eines Optimierungsproblems sind Optimalitätskriterien von groÿer Bedeutung. Dazu wird zunächst wieder das allgemeine Optimierungsproblem (4.10) betrachtet. Im Folgenden sei D = Rd . Falls J, f und g ste- tig dierenzierbar sind, können solche Optimalitätskriterien mithilfe der LagrangeFunktion hergeleitet werden. Denition 4.21. Die Funktion L : Rd × Rp × Rm → R, p X L(x, λ, µ) := J(x) + λi (ei (x) − ec,i ) + i=1 für (x, λ, µ) ∈ Rd × Rp × Rm , (4.10) genannt, wobei µi , i = 1, . . . , m, wird m X µj (fj (x) − fc,j ) j=1 Lagrange-Funktion des Optimierungsproblems λi , i = 1, . . . , p die Komponenten des Vektors die Komponenten des Vektors Denition 4.22. deniert über µ∈ λ ∈ Rp und Rm sind. Gegeben sei das Optimierungsproblem (4.10) mit stetig dieren- zierbaren Funktionen J, e und f. (i) Die Bedingungen ∇x L(x, λ, µ) = 0, (4.13) e(x) = ec , (4.14) f (x) ≤ fc , (4.15) µ ≥ 0, µT (f (x) − fc ) = 0 43 (4.16) (4.17) 4. Konvexe Theorie heiÿen KKT-Bedingungen des Optimierungsproblems (4.10), wobei ∇x L(x, λ, µ) = ∇f (x) + p X λi ∇ei (x) + i=1 der Gradient der Lagrange-Funktion (ii) Ein Vektor L m X µi ∇fj (x) j=1 bezüglich der Variablen (x∗ , λ∗ , µ∗ ) ∈ Rd × Rp × Rm , x ist. welcher die KKT-Bedingungen er- KKT-Punkt des Optimierungsproblems (4.10). Dabei werden die ∗ p ∗ m auch Lagrange-Multiplikatoren Komponenten von λ ∈ R und µ ∈ R füllt, heiÿt genannt. Für den Fall, dass es sich um eine unrestringierte Optimierungsaufgabe handelt, so reduzieren sich die KKT-Bedingungen auf die Bedingung ∇f (x) = 0, also gerade die notwendige Optimalitätsbedingung erster Ordnung, vgl. [10]. Unter gewissen Regularitätsbedingungen an die zulässige Menge, d.h. an Funktionen f bzw. g, kann gezeigt werden, dass die KKT-Bedingungen auch eine notwendige Optimalitätsbedingung erster Ordnung an das Problem (4.10) stellen, siehe [11]. Für den Fall, dass die Nebenbedingungen durch lineare Funktionen dargestellt werden, sind keine besonderen Regularitätsbedingungen nötig und es gilt der nachstehende Satz. Satz 4.23. Sei x∗ ∈ F linearen Funktionen e eine lokale Lösung des Optimierungsproblems (4.10) mit und f. Dann existieren λ∗ ∈ Rp , µ∗ ∈ Rm , sodass der Vektor (x∗ , λ∗ , µ∗ ) die KKT-Bedingungen (4.13)-(4.17) erfüllt. Beweis. Siehe [11]. Hinreichende Optimalitätskriterien des Optimierungsproblems (4.10) sind generell von zweiter Ordnung, vgl. [11]. Beim konvexen Problem können sogar hinreichende Optimalitätskriterien erster Ordnung erzielt werden, vgl. Satz 4.25. Zudem gibt es hierbei eine einprägsame Regularitätsbedingung. Denition 4.24. Falls es einen Vektor x̃ ∈ Rd mit E x̃ = ec so genügt das konvexe Optimierungsproblem (4.11) den von Slater. und f (x̃) < fc gibt, Regularitätsbedingungen Zusammen mit den KKT-Bedingungen stellt die Regularitätsbedingungen von Slater eine notwendige Optimalitätsbedingung erster Ordnung dar. 44 4. Konvexe Theorie Satz 4.25. Seien x∗ ∈ F eine optimale Lösung des konvexen Optimierungsproblems (4.11) und die Slater-Bedingung erfüllt. Dann existieren λ∗ ∈ Rp , µ∗ ∈ Rm , sodass ∗ ∗ ∗ der Vektor (x , λ , µ ) die KKT-Bedingungen (4.13)-(4.17) erfüllt. Beweis. Siehe [11]. Erfüllt umgekehrt (x∗ , λ∗ , µ∗ ) ∈ Rd × Rp × Rm die KKT-Bedingung, so ist x∗ eine optimale Lösung von (4.10), was ebenfalls in [11] gezeigt wird. Die Gültigkeit der KKT-Bedingungen ist somit schon ein hinreichendes Optimalitätskriterium bei einem konvexen Optimierungsproblem. Im Folgenden werden für Minimierungsprobleme auch Zielfunktionen der Gestalt J : Rd → (−∞, ∞] e := {x ∈ F | J(x) < ∞} gelten die in diesem D e = ∅, so wird jedes x ∈ F als optimale analog. Falls D zugelassen. Für Kapitel getroenen Aussagen Lösung bezeichnet. 45 5. Das VER-Problem 5. Das VER-Problem In diesem Kapitel wird nun das volumenmaximale-einbeschriebene-RechtecksmengenProblem, kurz VER-Problem, vorgestellt. Dabei werden wichtige Eigenschaften des Problems untersucht. Ziel des VER-Problems ist es, eine bezüglich des Volumens maximale Teilmenge einer zulässigen Menge zu nden, die sich als kartesisches Produkt darstellen lässt. 5.1. Einführung in die Problemstellung Zu Beginn werden einige grundlegende Begrie geklärt, die helfen, das VER-Problem greifbar zu machen. Wo es möglich ist, wird sich dabei an die in [9] und [24] eingeführten Notationen gehalten. An entsprechender Stelle werden diese dann erweitert und ergänzt. Grundlegendes Ein Vektor im x ∈ Rd wird als Design bezeichnet, welches sich aus d ∈ N Designkom- ponenten zusammensetzt. Die Designkomponenten werden dann mit x = (x1 , . . . , xd ). d R kann über eine Funktion xi , i = 1, . . . , d, bezeichnet und es gilt Jedem Design x∈ f = (f1 , . . . , fm )T : Rd → Rm ein Output f (x) zugeordnet werden, weshalb f auch Outputfunktion heiÿt. Ein Output besteht aus m Outputkomponenten fj (x), j = 1, . . . , m, mit m ∈ N. In der Anwendung sind in der Regel nur nach oben und unten beschränkte Designkomponenten realisierbar. Seien xlb i ∈ R die unteren Grenzen der Designkomponen- ub ∈ R die oberen Grenzen mit ten und xi ub lb ub xlb i ≤ xi ≤ xi bzw. xi ∈ [xi , xi ] für i = Designs ergibt sich dann über das d-fache Ωds := ub xlb i < xi 1, . . . , d. für i = 1, . . . , d. Damit ist Die Menge aller realisierbaren kartesische Produkt d Y ub d [xlb i , xi ] ⊂ R . (5.1) i=1 Diese Menge wird auch Designmenge genannt. Des Weiteren sind aus technischer Sicht meist nur Designs sinnvoll, deren Outputkomponenten jeweils einen kritischen Wert nicht über- bzw. unterschreiten. Da jede nach unten beschränkte Outputkomponente durch Multiplikation mit −1 in eine nach oben beschränkte Komponente umgewandelt werden kann, ist die Annahme zulässig, dass für alle x ∈ Rd die Ungleichungen 46 fj (x) ≤ fc,j , fc,j ∈ R, j = 1, . . . , m, 5. Das VER-Problem erfüllt sein müssen. Das wird m-Tupel, welches die Grenzen fc,j , j = 1, . . . , m, vereint, Outputgrenze fc genannt und es gilt fc = (fc,1 , . . . , fc,m )T ∈ Rm . Insgesamt können diese Bedingungen über das Ungleichungssystem f (x) ≤ fc zusammengefasst werden. Dieses muss für alle (5.2) x ∈ Rd komponentenweise gültig sein, um die Anforderungen an den Output zu erfüllen. Die Menge aller Designs x ∈ Rd , welche in der Designmenge liegen und das Unglei- chungssystem (5.2) erfüllen, wird als zulässige Designmenge Ωfc bezeichnet und es gilt Ωfc Beispiel 5.1. f : R2 := {x ∈ Ωds | f (x) ≤ fc } ⊂ Ωds . Sei die Designmenge über → R, x 7→ x1 + x2 die zulässige Designmenge Ωds = [0, 1]2 mit Outputgrenze Ωfc fc = 1 und die Outputfunktion über gegeben. In Abbildung 5.1 ist hierfür visualisiert. Abbildung 5.1: Zulässige Designmenge 47 (5.3) Ω fc (weiÿ) 5. Das VER-Problem Bemerkung 5.2. (i) Die Designmenge Ωds ist als kartesisches Produkt abgeschlos- sener Mengen eine Borel-Menge mit Lebesgue-Maÿ d Y d λ (Ωds ) = lb (xub i − xi ) < ∞. (5.4) i=1 (ii) Für die zulässige Menge gilt Ωfc m \ = {x ∈ Ωds | fj (x) ≤ fc,j } j=1 m \ = Ωds ∩ {x ∈ Rd | fj (x) ≤ fc,j } j=1 = Ωds ∩ m \ {x ∈ Rd | fj (x) ≤ fc,j }. (5.5) j=1 Falls die Outputfunktion {x ∈ Rd f : Rd → Rm | fj (x) ≤ fc,j }, j = 1, . . . , m, Borel-messbar ist, sind die Mengen nach Korollar 3.15 Borel-messbar. Somit ist die zulässige Designmenge als Schnitt von Borel-Mengen ebenfalls eine Borel-Menge. Das Lebesgue-Maÿ von Ω fc ist wegen Ωfc ⊂ Ωds endlich und es gilt λd (Ωfc ) ≤ λd (Ωds ) < ∞. Bevor das VER-Problem formuliert werden kann, müssen noch die Dimensionen der Mengen festgelegt werden, aus denen sich das mehrfache kartesische Produkt zusammensetzt, welches das Problem lösen soll. Dazu ist die folgende Denition hilfreich. Denition 5.3. Seien d, n ∈ N fest und s := (d1 , . . . , dn ) ∈ Nn . Falls n P dk = d gilt k=1 bzw. im Sinne der Multiindexschreibweise, welche in Beispiel 2.7 eingeführt wurde, |s| = d, so wird das Für gegebenes s n-Tupel s kann ein Struktur genannt. n-faches k = 1, . . . , n, gebildet werden, für das dann k=1 k=1 wird daher auch als n-faches k Ωk ∈ B(Rd ), n n Q k Q Ωk Ω ⊂ Rd gilt. Die Menge Ω := kartesisches Produkt aus Mengen kartesisches Produkt mit Struktur ist die in Kapitel 2.2 beschriebene Identikation von n Q Rd k s bezeichnet. Dabei und Rd zu beachten. k=1 Insbesondere sei an dieser Stelle auch nochmals an die möglichen Darstellungen eines 48 5. Das VER-Problem Designs x ∈ Rd erinnert, welche in Gleichung (2.4) aufgelistet sind. Für das Lebesgue- Maÿ von Ω gilt wegen Gleichung (3.4) gerade λd (Ω) = n Y k λd (Ωk ). k=1 In dieser Arbeit wird zusätzlich dk−1 ≥ dk für k = 2, . . . , n vorausgesetzt, da die Indizes der Designkomponenten beliebig umgeordnet werden können. Für jede Struktur Struktur s. s ist die Designmenge ein mehrfaches kartesisches Produkt mit Es sei k i Y k Ωds := k ub d [xlb i , xi ] ⊂ R (5.6) i = ik−1 +1 für k = 1, . . . , n mit k P ik = dk̃ . n Q Ωds = Dann gilt k=1 k̃=1 Analog dazu wird die Outputfunktion f Ωkds . additiv zerlegbar mit Struktur s genannt, k = (f k , . . . , f k ) : Rdk → Rm , k = 1, . . . , n, existieren, sodass falls Funktionen f m 1 n P k k d f (x ) für alle x ∈ R erfüllt ist, vgl. Denition 2.17. Hierbei sei bemerkt, f (x) = k=1 dass es zu einer Outputfunktion in der Regel mehrere Möglichkeiten gibt die Struktur s zu wählen. So sind beispielsweise für die Funktion die Strukturen s = (1, 1, 1), s = (2, 1) Falls die Einträge der Struktur s und s=3 alle den Wert f : R3 → R, x 7→ x1 + x2 + x3 möglich. 1 besitzen, so wird auch von einer eindimensionalen Struktur gesprochen. Dies ist erfüllt sofern für k = 2, . . . , n Wert 2, k sofort d =1 d1 = 1 gilt, da dann folgt. Ist der maximale Eintrag der Struktur s vom wobei mindestens ein Eintrag diesen Wert auch annimmt, so handelt es sich um eine zweidimensionale Struktur. Hierbei ist d1 = 2 notwendige und hinreichende Bedingung. Nun kann das VER-Problem als Optimierungsproblem aufgestellt werden. Gesucht wird eine bezüglich des Volumens maximale Teilmenge der zulässigen Designmenge, welche ein kartesisches Produkt mit Struktur s Unter Verwendung der zulässigen Designmenge darstellt. Ω fc aus Beispiel 5.1 und s = (1, 1) bedeutet dies, dass ein volumenmaximales Rechteck gesucht ist, welches in Ω fc ent- halten ist. Kandidaten möglicher Rechtecke sind in Abbildung 5.2 veranschaulicht. 49 5. Das VER-Problem Ω fc Abbildung 5.2: Kandidaten für ein volumenmaximales Rechteck in (gelb, grün und rot umrandet) Abstraktes Problem Denition 5.4. Seien die Designmenge Borel-messbare Outputfunktion Das f : Rd abstrakte VER-Problem lautet maximiere Ωds ⊂ Rd , → Ωk ∈B(Rdk ), k=1,...,n Rm mit Outputgrenze λd n Q Ωk s ∈ Nn fc ∈ sowie die Rm gegeben. k=1 n Q u.d.N. die Struktur (5.7) Ωk ⊂ Ωfc , k=1 wobei die zulässige Designmenge Ω fc wie in (5.3) deniert ist. Die Zielfunktion des abstrakten VER-Problems wird im Folgenden auch mit Jeab bezeichnet und es gilt Jeab : n Y dk B(R ) → [0, ∞), (Ω1 , . . . , Ωn ) 7→ λd k=1 Die Menge n Q Ωk n Y ! Ωk . (5.8) k=1 liegt dabei bekanntermaÿen in k=1 50 B(Rd ) und ihr Lebesgue-Maÿ ist 5. Das VER-Problem als Teilmenge von Ωfc endlich. Eine optimale Lösung des abstrakten VER-Problems muss, sofern sie existiert, die Eigenschaft der folgenden Denition erfüllen. Denition 5.5. werden Die Mengen k Ωk,∗ ∈ B(Rd ), k = 1, . . . , n, mit n Q Ωk,∗ ⊂ Ωfc k=1 des abstrakten VER-Problems (5.7) genannt, wenn die optimale Lösung Ungleichung d λ n Y Ω ≥ λ d k=1 ! k Ω (5.9) k=1 Jeab (Ω1,∗ , . . . , Ωn,∗ ) ≥ Jeab (Ω1 , . . . , Ωn ) n Q Eigenschaft Ωk ⊂ Ωfc erfüllt ist. bzw. der n Y ! k,∗ für alle k Ωk ∈ B(Rd ), k = 1, . . . , n, mit k=1 Eine optimale Lösung des Problems (5.7) maximiert auch die Komposition mit log(0) := −∞, da der Logarithmus monoton wachsend auf (0, ∞) log ◦Jeab ist. Ferner kann, wie bereits in Kapitel 4.2 beschrieben, durch Änderung des Vorzeichens der Zielfunktion jedes Maximierungsproblem in ein Minimierungsproblem überführt werden. Deshalb minimieren k Ωk,∗ ∈ B(Rd ), k = 1, . . . , n, die Funktion Jab := − log ◦Jeab . Unter den Voraussetzungen von Denition 5.4 lautet das abstrakte VER-Problem dann minimiere Ωk ∈B(Rdk ), k=1,...,n − log n Q Ωk k=1 n Q u.d.N. λd Ωk (5.10) ⊂ Ωfc . k=1 Die Komposition von − log und der Zielfunktion ermöglicht es später ein konvexes Optimierungsproblem zu erhalten, wie im Laufe der Arbeit ersichtlich wird. Stellvertretend für das abstrakte VER-Problem wird daher nur noch Bezug auf das Optimierungsproblem (5.10) genommen. Das abstrakte Problem ist aus mathematischer Sicht nicht einfach zu lösen, da Mengen der Form k Ωk ∈ B(Rd ), k = 1, . . . , n, in einem Algorithmus nur schwer zu handhaben sind. Ziel ist es deshalb, diese Mengen analytisch über Variablen zu beschreiben, welche Ungleichungs- bzw. Gleichungsbedingungen einhalten müssen, um n Q Ω k ⊂ Ω fc zu gewährleisten. Falls die Outputfunktion f additiv zerlegbar mit k=1 Struktur s ist, so ist das abstrakte Problem als ein solches analytisches Problem 51 5. Das VER-Problem formulierbar, wie im Folgenden gezeigt wird. 5.2. Analytisches Problem Denition 5.6. Rd f: putfunktion Seien die Designmenge → Ωds ⊂ Rd Rm mit Outputgrenze zerlegbar mit Struktur s ∈ Nn . Das fc ∈ sowie die Borel-messbare Out- Rm gegeben. Ferner sei f additiv analytische VER-Problem lautet dann minimiere fck ∈Rm , k=1,...,n n Q k d − log λ Ωf k k=1 n P u.d.N. fck c (5.11) = fc , k=1 wobei Ωkf k := {xk ∈ Ωkds | f k (xk ) ≤ fck }. c Ωkf k Die Mengen Ωk(·) : Rm c in Denition 5.6 sind dabei stets als Funktionswert der Funktionen k → B(Rd ), fck 7→ Ωkf k , k = 1, . . . , n, c und Bemerkung 5.2 liegen auch n Q k=1 Mengen Ωkf k ∈ B(Rd ). c Ωkf k fck ∈ Rm für c zu verstehen. Aufgrund Satz 3.21 in k B(Rd ), k = 1, . . . , n. Somit gilt Insgesamt konnte dadurch eine analytische Beschreibung der k Ωk ∈ B(Rd ), k = 1, . . . , n, über Vektoren im Rm wie gewünscht erreicht werden, was in Satz 5.8 nochmals deutlicher wird. Für Zielfunktion des analytischen VER-Problems, welche auch mit Jan bezeichnet wird, gilt deshalb Jan : n Y m R → (−∞, ∞], (fc1 , . . . , fcn ) n Y d 7→ − log λ k=1 !! Ωkf k c . k=1 Eine optimale Lösung des analytischen VER-Problems erfüllt, sofern sie existiert, die Eigenschaft der folgenden Denition. Diese Denition ist identisch mit der Denition einer globalen Lösung eines allgemeinen Minimierungsproblems, siehe Denition 4.18. Analog könnten lokale Lösungen des analytischen Problems formuliert werden. Denition 5.7. Die Vektoren optimale Lösung fck,∗ ∈ Rm , k = 1, . . . , n, mit n P fck,∗ = fc werden k=1 des analytischen VER-Problems (5.11) genannt, wenn die Un- gleichung − log λd n Y !! Ωkf k,∗ ≤ − log λd n Y k=1 52 Ωkf k c c k=1 !! 5. Das VER-Problem Jan (fc1,∗ , . . . , fcn,∗ ) ≤ Jan (fc1 , . . . , fcn ) n P fck = fc erfüllt ist. Eigenschaft bzw. für alle fck ∈ Rm , k = 1, . . . , n, mit der k=1 Der Hauptunterschied zwischen dem abstrakten und dem analytischen VER-Problem ist, dass das abstrakte Problem allgemeiner formuliert ist und somit für beliebige Strukturen und beliebige Borel-messbare Funktionen gilt. Beim analytischen VER- f Problem sind die Auswahlmöglichkeiten für die Struktur bereits durch Im schlechtesten Fall ist nur s=d n=1 mit möglich und festgelegt. Rm ist die einzige fc ∈ zulässige Lösung des zugehörigen Problems (5.11). Unter der Voraussetzung, dass die Funktion f mit Struktur s ∈ Nn additiv zerlegbar ist, kann gezeigt werden, dass die zur optimalen Lösung des analytischen Problems Ωk k,∗ , k = 1, . . . , n, zugehörigen Mengen fc eine optimale Lösung des abstrakten Pro- blems sind. Satz 5.8. fck,∗ ∈ Rm , k = 1, . . . , n, Wenn die Vektoren n P mit fck,∗ = fc eine k=1 optimale Lösung des analytischen VER-Problems (5.11) sind, dann sind die Mengen Ωk k,∗ , k = 1, . . . , n, fc eine optimale Lösung des abstrakten VER-Problems (5.10). fck,∗ ∈ Rm , k = 1, . . . , n, eine optimale Lösung des analytischen VERn P k (5.11) mit fck,∗ = fc . Angenommen es existieren Mengen Ωk ∈ B(Rd ), Beweis. Sei Problems k = 1, . . . , n, mit n Q k=1 Ω k ⊂ Ω fc und k=1 n Y − log λd !! ≤ − log λd Ωk n Y !! Ωkf k,∗ . (5.12) c k=1 k=1 Dann gilt für alle n Q n Q x ∈ Ωk gerade f (x) ≤ fc . Da f additiv zerlegbar ist und k=1 Ωk ⊂ Ωds beschränkt ist, existieren k=1 für alle xk ∈ Ωk und n P fck ≤ fc . fck ∈ Rm , k = 1, . . . , n, mit f k (xk ) ≤ fck Aufgrund der Tatsache, dass durch komponenten- k=1 weises Vergröÿern einzelner fck , der Wert der Zielfunktion niemals ansteigen kann, vgl. den folgenden Satz 5.9 über die Monotonie der Zielfunktion, darf n P k=1 angenommen werden. Somit ist Ungleichung (5.12) äquivalent zu − log λ d n Y !! Ωkf k c ≤ − log λ k=1 d n Y k=1 53 !! Ωkf k,∗ c , fck = fc 5. Das VER-Problem fck,∗ ∈ Rm , k = 1, . . . , n, was einen Widerspruch zur Optimalität der Vektoren dar- stellt. Eigenschaften der Zielfunktion Um die Eigenschaften des analytischen VER-Problems zu untersuchen, ist es oftmals fck ∈ Rm , k = 1, . . . , n, Rmn -Vektor zusammenzufas1 n T mn . sen. Analog zu den Betrachtungen in Kapitel 2.2 ist dann fˆc := (f , . . . , f ) ∈ R hilfreich die Vektoren in einem c c Diese Darstellung ist auch bei der Berechnung von numerischen Lösungen der VERProbleme von Bedeutung. Satz 5.9. Die Zielfunktion Jan des analytischen VER-Problems (5.11) ist (i) monoton fallend, (ii) nach unten halbstetig. Beweis. (i) Für die Monotonie von fˆc , ĝc ∈ Rmn mit fˆc ≤ ĝc gerade j = 1, . . . , m, k = 1, . . . , n, Jan auf dem Rmn Jan (fˆc ) ≥ Jan (ĝc ) ist zu zeigen, dass für alle erfüllt ist. Seien k ≤ gk , fc,j c,j dann gelten k k } } ⊂ {xk ∈ Ωkds | fjk (xk ) ≤ gc,j {xk ∈ Ωkds | fjk (xk ) ≤ fc,j und Ωkf k c m \ = k {xk ∈ Ωkds | fjk (xk ) ≤ fc,j } j=1 m \ k } = Ωkgk . {xk ∈ Ωkds | fjk (xk ) ≤ gc,j ⊂ c j=1 Ferner ist mit Satz 2.12 dann n Y Ωkf k c k=1 für k = 1, . . . , n ⊂ n Y Ωkgk (5.13) c k=1 und aufgrund Satz 3.23 auch d λ n Y ! Ωkf k c ≤ λ k=1 d n Y k=1 54 ! Ωkgk c . (5.14) 5. Das VER-Problem Die Ungleichung (5.14) besagt, dass die Funktion n Y Jean : R m → [0, ∞), (fc1 , . . . , fcn ) d 7→ λ k=1 Jean (ii) Hierzu wird gezeigt, dass dass ! Ωkf k c k=1 monoton wachsend ist. Daher ist log ◦Jean n Y Jan wegen Jan = − log ◦Jean monoton fallend. nach oben halbstetig ist. Mit [19] folgt dann, als Komposition einer stetigen, monoton wachsenden Funktion und einer nach oben halbstetigen Funktion ebenfalls nach oben halbstetig ist. Damit ist Sei Jan = − log ◦Jean fˆ ∈ Rmn schlieÿlich nach unten halbstetig. gegeben. So ist die Ungleichung ! sup Jean ĝ lim δ&0 ˆ ĝ∈B(f,δ) nachzuweisen. Als Norm im Rmn kann hier die ˆ δ) = {ĝ ∈ Rmn | kĝ − fˆk∞ < δ}. B(f, Rmn mit δ̂ := (δ, . . . , δ) ∈ ≤ Jean fˆ ∞-Norm gewählt werden, d.h. Aufgrund der Monotonie von Jean gilt für δ ∈ (0, ∞) sup Jean ĝ ≤ Jean fˆ + δ̂ . ˆ ĝ∈B(f,δ) Sei (δi )i∈N eine monoton fallende Folge mit δi ∈ (0, ∞), i ∈ N und lim δi = 0. i→∞ So bleibt zu zeigen, dass die Ungleichung lim Jean fˆ + δ̂i ≤ Jean fˆ i→∞ erfüllt ist, wobei δˆi := (δi , . . . , δi ) ∈ Rmn . Wegen Satz 2.12 und Bemerkung 5.2 gilt n Y Ωkf k c n \ m Y = k {xk ∈ Ωkds | fjk (xk ) ≤ fc,j } k=1 j=1 k=1 n \ m Y = Ωds ∩ k (fjk )−1 (−∞, fc,j ] . (5.15) k=1 j=1 Zur Übersichtlichkeit werden für den weiteren Beweis die beiden Schreibweisen Ω := n Q Ωkf k c und Ωi := n Q Ωkf k +δk k=1 führt. Wie in (5.13) ist Ωi ⊃ k=1 c mit i Ωi+1 für 55 δik := (δi , . . . , δi ) ∈ Rm , i ∈ N i∈N einge- und mit den Eigenschaften von 5. Das VER-Problem Bild und Urbild bzgl. dem Durchschnitt von Familien von Mengen auch \ Ωi = i∈N \ Ωds ∩ n \ m Y k (fjk )−1 (−∞, fc,j + δi ] k=1 j=1 i∈N = Ωds ∩ = Ωds ∩ n \ m Y ! (fjk )−1 k=1 j=1 n \ m Y \ k (−∞, fc,j + δi ] i∈N k (fjk )−1 (−∞, fc,j ] = Ω, k=1 j=1 d.h. Ωi ↓ Ω. Ferner lässt sich mit der Darstellung aus Gleichung (5.15) auch erkennen, dass Ω1 ⊂ Ωds Voraussetzungen an die ist und damit σ -Stetigkeit lim Jean fˆ + δ̂i Jean Somit sind die aus Satz 3.23 erfüllt, weshalb = lim λd (Ωi ) = λd (Ω) = Jean fˆ i→∞ gilt und daher λd (Ω1 ) ≤ λd (Ωds ) < ∞. i→∞ nach oben halbstetig ist. Aus dem Beweis von Satz 5.8 wird ersichtlich, dass das analytische VER-Problem eigentlich auch mit den Ungleichungsbedingungen chungsbedingungen n P n P fck ≤ fc fck = fc hätte formuliert werden können. Da die Zielfunktion k=1 Jan anstatt mit den Glei- k=1 monoton fallend ist, wird eine optimale Lösung immer für n P fck = fc angenom- k=1 men, falls sie existiert. Um die Existenz einer optimalen Lösung des VER-Problems nachzuweisen, ist der zweite Teil des Satzes 5.9 entscheidend. Zuvor müssen jedoch noch Eigenschaften der zulässigen Menge des Problems (5.11) untersucht werden. Eigenschaften der zulässigen Menge Satz 5.10. Die zulässige Menge Fan = {fˆc ∈ Rmn | n P fck = fc } des analytischen k=1 VER-Problems (5.11) ist konvex. E := (Im , . . . , Im ) ∈ n P fck = fc kann geschrieben werden als E fˆc = fc mit k=1 Rm×mn , wobei Im die m × m-Einheitsmatrix ist. Somit gilt Beweis. Die Bedingung Fan = {fˆc ∈ Rmn | E fˆc = fc } 56 5. Das VER-Problem und nach Beispiel 4.2 ist Mithilfe der Darstellung Fan konvex. Fan = {fˆc ∈ Rmn | E fˆc = fc }, E := (Im , . . . , Im ) ∈ Rm×mn kann das analytische VER-Problem (5.11) auch in der kompakten Form minimiere Jan (fˆc ) fˆc ∈Rmn (5.16) E fˆc = fc u.d.N. geschrieben werden. Um eine optimale Lösung des analytischen VER-Problem zu nden, ist es vorteilhaft, diejenigen den Wert ∞ fˆc aus Fan zu entfernen, für welche die Zielfunktion annimmt. Satz und Denition 5.11. ) n X k k k̃ fc,j ≤ fc,j ≤ fc,j − fc,j , j = 1, . . . , m, k = 1, . . . , n ¯ ¯ ( fˆc ∈ Fan Fan,c := Für das analytische VER-Problem (5.11) ist die Menge k̃=1, k̃6=k mit k := fc,j ¯ inf fjk (xk ) xk ∈Ωkds funktion nimmt für alle für j = 1, . . . , m, k = 1, . . . , n fˆc ∈ Fan \Fan,c den Wert ∞ kompakt und die Ziel- an. Darum wird eingeschränkte zulässige Menge des Problems (5.11) genannt. Beweis. Weil die Mengen R abbilden, gilt inf xk ∈Ωkds Ωkds fjk (xk ) Fan,c fjk ∈R Die Menge für j = 1, . . . , m, k = 1, . . . , n. von Rd k beschränkt sind und die Funktionen auch nach Fan,c ist somit beschränkt und abgeschlossen und daher kompakt. fˆc ∈ Fan k < f k für ein j ∈ {1, . . . , m} und ein k ∈ {1, . . . , n}, also fc,j c,j ¯ k ]) = {xk ∈ Ωk | f k (xk ) ≤ f k } = ∅ für fˆc ∈ Fan \Fan,c . Dann gilt (fjk )−1 ((−∞, fc,j j c,j ds m T k k ]) = ∅ selbe j ∈ {1, . . . , m} und k ∈ {1, . . . , n} und ferner Ω k = (fjk )−1 ((−∞, fc,j f Sei mit c für eben dieses k ∈ {1, . . . , n}. λd n Y ! Ωkf k = c k=1 bzw. Jan (fc1 , . . . , fcn ) = ∞. j=1 Somit ist n Y k λd Ωkf k = 0 c k=1 k ≥ f k für alle j ∈ {1, . . . , m} fc,j c,j ¯n 1 Jan (fc , . . . , fc ) < ∞ gilt. Also muss k ∈ {1, . . . , n}, erfüllt sein, damit k k Sei jetzt fˆc ∈ Fan mit fc,j ≥ fc,j ¯ für j = 1, . . . , m 57 und k = 1, . . . , m. und alle Ferner sei 5. Das VER-Problem k >f fc,j c,j − n P k̃ fc,j k̃=1, ¯ für ein j ∈ {1, . . . , m} und ein k ∈ {1, . . . , n}, dann sind wegen k̃6=k k + fc,j n P k̃ > f fc,j c,j ¯ k̃=1, die Nebenbedingungen des analytischen VER-Problems verletzt k̃6=k und fˆc kann nicht in Fan bzw. Fan \Fan,c liegen. Dieser Satz erlaubt es, den Bereich für die Suche einer optimalen Lösung des VERProblems, also die zulässige Menge Menge Fan,c Fc , einzuschränken. Hierbei sei bemerkt, dass die sowohl Elemente besitzen kann, für die Jan den Wert ∞ annimmt, als auch leer sein kann. Schlussendlich kann damit die Existenz einer optimalen Lösung des VER-Problems gezeigt werden. Existenz einer optimalen Lösung Korollar 5.12. Das analytische VER-Problem (5.11) besitzt mindestens eine opti- male Lösung. Beweis. Sei jedes Fan,c = ∅, fˆc ∈ Fan so gilt für alle fˆc ∈ Fan = Fan \Fan,c sofort Jan (fˆc ) = ∞ und ist daher optimale Lösung. Fan,c , Fan \Fan,c 6= ∅, dann gilt für alle fˆc ∈ Fan,c und alle ĝc ∈ Fan \Fan,c gerade Jan (fˆc ) ≤ Jan (ĝc ) = ∞. Des Weiteren ist die Zielfunktion Jan nach Satz 5.9 nach Sei unten halbstetig und nimmt, wie in Kapitel 2.1 beschrieben, auf kompakten Mengen ihr Minimum an. Insgesamt existiert damit eine optimale Lösung auf Fan,c . An dieser Stelle wird nun ein Beispiel betrachtet, in welchem die Eigenschaften des analytischen VER-Problems zu erkennen sind. Für die Funktion f wird hierbei ein Polynom gewählt, siehe Beispiel 2.7. Polynome sind immer stetig und messbar und eigenen sich besonders für das analytische VER-Problem, da sie mehrere Strukturen zulassen, sofern die entsprechenden Koezienten des Polynoms null sind. Ist das Polynom von Grad eins, also eine lineare Funktion, so kann insbesondere jede Struktur s mit |s| = d realisiert werden. Beispiel 5.13. f : R2 Ωds = [−2, 2] × [−1,5, 1,5], die Outputfunktion 3 (x2 ) mit Outputgrenze fc = −1 und Struktur s = (1, 1) Für die Designmenge → R, x 7→ (x1 )3 + ist eine optimale Lösung des analytischen VER-Problems (5.11) gesucht. Die Anzahl der Designkomponenten beträgt in diesem Beispiel 58 d = 2 und die Anzahl 5. Das VER-Problem der Outputkomponenten m = 1. Oensichtlich ist f mit der Struktur zerlegbar. In Abbildung 5.3 ist die zulässige Designmenge ist zu erkennen, dass f2 : R → R, x2 7→ Ω fc 1 nicht konvex ist, obwohl f Ω fc s additiv veranschaulicht. Dabei : R → R, x1 7→ (x1 )3 und (x2 )3 quasikonvex sind, was bereits aus Bemerkung 4.11 bekannt ist. Für die zulässige Menge Fan des Optimierungsproblems gilt Fan = {(fc1 , fc2 ) ∈ R2 | fc1 + fc2 = −1} und für die Mengen Ω1f 1 c und Ω2f 2 , c welche in der Zielfunktion Jan Ω1fc1 = {x1 ∈ [−2, 2] | (x1 )3 ≤ fc1 }, Ω2fc2 = {x2 ∈ [−1,5, 1,5] | (x2 )3 ≤ fc2 }. Der Funktionswert der Zielfunktion Jan enthalten sind, ergibt sich damit zu p p 3 1 + 2)( 3 f 2 + 1,5) − log ( f c c p 3 2 + 1,5) f − log 4( c p 3 Jan (fc1 , fc2 ) = 1 + 2) − log 3( f c − log (12) ∞ für e 1, (fc1 , fc2 ) ∈ D für e 2, (fc1 , fc2 ) ∈ D für e 3, (fc1 , fc2 ) ∈ D e 4, (fc1 , fc2 ) ∈ D für sonst. wobei e 1 := (−8, 8) × (−3,375, 3,375), D e 2 := [8, ∞) × (−3,375, 3,375), D e 3 := (−8, 8) × [3,375, ∞), D e 4 := [8, ∞) × [3,375, ∞). D In Abbildung 5.4 ist der Graph von Jan visualisiert und in Abbildung 5.5 der Graph der Funktion Jan,p : R → (−∞, ∞], fc2 7→ Jan (−1 − fc2 , fc2 ). Nun wird versucht mithilfe der Optimalitätskriterien aus Kapitel 4.2 mögliche lokale Lösungen des Beispielproblems zu nden. Eine mögliche lokale Lösung mit minimalem Funktionswert der Zielfunktion ist dann eine optimale Lösung. Dazu ist 59 5. Das VER-Problem zu beachten, dass die Zielfunktion nur auf der Menge ((−3,375, ∞)\{0, 3,375}) ⊂ R2 Dd = ((−8, ∞)\{0, 8}) × dierenzierbar ist. Deshalb können mit den Op- timalitätskriterien nur auf dieser Menge Kandidaten für lokale Lösungen gefunden werden. Anschlieÿend können die Funktionswerte in Umgebungen von Punkten (fc1 , fc2 ) ∈ Fan , in denen Jan nicht dierenzierbar ist, mit diesen Kandidaten vergli- chen werden. Die KKT-Bedingungen für das Beispielproblem werden nur in e1 Dd ∩ D erfüllt. Es gilt 1 + λ = 0, − p 2p 3 3 fc1 3 fc1 + 2 1 + λ = 0, − p 2p 3 3 fc2 3 fc2 + 1,5 fc1 + fc2 = −1 für (fc1 , fc2 , λ) ∈ {(−1,35, 0,35, 0,31), (−0,21, −0,79, 0,68), (−0,09, −1,09, 0,67)}, wo- bei alle Komponenten der Einträge dieser Menge auf zwei Nachkommastellen gerundet sind. Die sich daraus ergebenden, möglichen Lösungen sind zusammen mit ihren Zielfunktionswerten sowohl in Abbildung 5.4 als auch in Abbildung 5.5 dargestellt. Zusätzlich werden die zugehörigen Mengen Ω1f 1 × Ω2f 2 c c in Abbildung 5.3 ver- anschaulicht. Wie oben beschrieben kann insgesamt gezeigt werden, dass der Vektor (fc1,∗ , fc2,∗ ) = (−1,35, 0,35) 1,∗ 2,∗ mit Jan (fc , fc ) die eindeutige, optimale Lösung des Beispielproblems ist = −0,07, ebenfalls auf zwei Nachkommastellen gerundet. 60 5. Das VER-Problem Ωfc (weiÿ) Ω1f 1 × Ω2f 2 Abbildung 5.3: Zulässige Designmenge gehörigen Mengen Abbildung 5.4: Graph von Jan c und zu den möglichen Lösungen c (Blautöne), Graph von Jan auf die zulässige Men- ge eingeschränkt (rot) und mögliche Lösungen zusammen mit ihren Funktionswerten als Punkte 61 5. Das VER-Problem Abbildung 5.5: Graph von Jan,p und parametrisierte mögliche Lösungen mit ihren Funktionswerten als Punkte Bemerkung 5.14. In Beispiel 5.13 ist erkennbar, dass die Zielfunktion Jan des ana- lytischen VER-Problem in der Regel nicht dierenzierbar ist. Darüber hinaus ist in diesem Beispiel zu sehen, dass die Aufstellung der Zielfunktion selbst bei handlichen Outputfunktionen recht komplex werden kann und damit auch die Bestimmung des Gradienten der Zielfunktion auf Dd . 62 6. Das konvexe VER-Problem 6. Das konvexe VER-Problem Nun wird das analytische VER-Problem für konvexe Outputfunktionen betrachtet und gezeigt, dass dies ein konvexes Optimierungsproblem darstellt. Falls die Struktur der Outputfunktion eindimensional ist, gibt es eine alternative Formulierung für das konvexe Problem. 6.1. Allgemeine Strukturen Satz 6.1. Sei das analytische VER-Problems (5.11) mit konvexer Outputfunktion gegeben. Dann ist auch die Zielfunktion Jan f konvex. Beweis. Der Beweis erfolgt in drei Schritten. Zunächst sei jedoch an Satz 4.10 erinnert, welcher begründet, dass für eine konvexe Outputfunktion f k , k = 1, . . . , n, mit f (x) = n P f k (xk ) für alle x ∈ Rd f auch die Funktionen konvex sind. k=1 Schritt 1 : Es wird gezeigt, dass für k ∈ {1, . . . , n} die Funktion χf k , deniert über ( χf k : R dk ×R m → {0, 1}, (x k , fck ) 7→ χf k (x k , fck ) := f k (x) ≤ fck , 1 falls 0 sonst, logarithmisch-konkav ist, wobei das Ungleichungssystem f k (x) ≤ fck wie gehabt komponentenweise zu verstehen ist. Hierzu reicht es nachzuweisen, dass für alle k (xk , fck ), (y k , gck ) ∈ Rd × Rm und alle θ ∈ (0, 1) die Ungleichung χf k (θxk + (1 − θ)y k , θfck + (1 − θ)gck ) ≥ χf k (xk , fck )θ χf k (y k , gck )1−θ = χf k (xk , fck ) χf (y k , gck ) erfüllt ist. Für χf k (xk , fck ) = 0 oder χf k (y k , gck ) = 0 ist dies stets der Fall. Seien daher k χf k (xk , fck ) = χf k (y k , gck ) = 1, d.h. für (xk , fck ), (y k , gck ) ∈ Rd × Rm und f k (y k ) ≤ gck . Mit der Konvexität von fk gilt f k (xk ) ≤ fck folgt daraus f k (θxk + (1 − θ)y k ) ≤ θ f k (xk ) +(1 − θ) f k (y k ) | {z } | {z } ≤fck ≤gck ≤ θfck + (1 − θ)gck , weshalb auch dass χf k χf k (θxk +(1−θ)y k , θfck +(1−θ)gck ) = 1 gilt. Somit wurde nachgewiesen, logarithmisch-konkav ist. 63 6. Das konvexe VER-Problem Schritt 2 : Nun wird für k ∈ {1, . . . , n} gezeigt, dass die Abbildung k Jek : Rm 7→ [0, ∞), fck 7→ λd Ωkf k c logarithmisch-konkav ist. Wegen Ωkf k = {xk ∈ Ωkds | f k (xk ) ≤ fck } c Jek (fck ) = für fck ∈ Rm Z Ωkds gilt χf k xk , fck dxk mit den Darstellungen aus Kapitel 3.3. Die Menge Ωkds ist aufgrund ihrer dk Gestalt, vgl. (5.6) und Satz 4.3, konvex und liegt in B(R ). Somit sind insgesamt alle Voraussetzungen an Korollar 4.17 erfüllt und Jek ist folglich logarithmisch-konkav. Schritt 3 : Im letzten Schritt wird die Konvexität der Zielfunktion Jean nachgewiesen. Es sei Je : n Y Rm → [0, ∞), (fc1 , . . . , fcn ) 7→ Funktionen und alle Jek (fck ), k=1 k=1 wobei im Folgenden wieder n Y fˆc = (fc1 , . . . , fcn )T ∈ Rmn Jek , k = 1, . . . , n, geschrieben wird. Da die logarithmisch konkav sind, gilt für alle fˆc , ĝc ∈ Rmn θ ∈ (0, 1) Je θfˆc + (1 − θ)ĝc = ≥ n Y Jek (θfck + (1 − θ)gck ) k=1 n Y Jek (fck )θ Jek (gck )1−θ k=1 = n Y !θ Jek (fck ) k=1 n Y !1−θ Jek (gck ) k=1 θ 1−θ = Je fˆc f ĝc , d.h. Je ist ebenfalls logarithmisch-konkav. Daraus folgt, dass 64 log ◦Je konkav und 6. Das konvexe VER-Problem − log ◦Je konvex ist. Unter Verwendung von Gleichung (3.4) kann Jan fˆc = − log λ n Y d !! Ωkf k c k=1 n Y = − log k=1 n Y = − log ! λ dk Ωkf k c ! ek J (fck ) k=1 = − log Je fˆc fˆc ∈ Rmn für gezeigt werden, womit die Konvexität von Jan nachgewiesen ist. Da im Falle einer konvexen Outputfunktion neben der zulässigen Menge auch die Zielfunktion des analytischen VER-Problems konvex ist, ergibt sich ein konvexes Optimierungsproblem. Denition 6.2. f: Rd Rm mit Outputgrenze → Struktur Seien die Designmenge s ∈ Nn . Das fc ∈ Ωds ⊂ Rd sowie die konvexe Outputfunktion Rm gegeben. Ferner sei konvexe VER-Problem lautet dann f additiv zerlegbar mit n Q k d Ωf k − log λ minimiere fck ∈Rm , k=1,...,n k=1 n P u.d.N. c (6.1) fck = fc . k=1 Da das konvexe VER-Problem (6.1) ein Spezialfall des analytischen VER-Problems (5.11) ist, übertragen sich die weiteren Eigenschaften aus Kapitel 5.2 direkt. Dass die Zielfunktion im konvexen Fall ebenso nicht stetig sein muss, zeigt das Beispiel 6.4. Beispiele Beispiel 6.3. f: R3 Für die Designmenge → R, x 7→ s = (2, 1) kxk22 = (x1 )2 +(x 2 Ωds = [−1,5, 1,5]3 , )2 +(x die konvexe Outputfunktion 2 3 ) mit Outputgrenze fc = 1 und Struktur ist eine optimale Lösung des konvexen VER-Problems (6.1) gesucht. Die Anzahl der Designkomponenten beträgt in diesem Beispiel der Outputkomponenten 1 zerlegbar, wobei f : R2 m = 1. Oensichtlich ist → R, (x1 , x2 ) 7→ (x1 65 )2 +(x f d = 3 und die Anzahl mit der Struktur 2 2 ) und f2 : R2 s additiv → R, x3 7→ (x3 )2 6. Das konvexe VER-Problem ist. In Abbildung 6.1 ist die zulässige Designmenge Für die zulässige Menge Fan Ωfc veranschaulicht. des Optimierungsproblems gilt Fan = {(fc1 , fc2 ) ∈ R2 | fc1 + fc2 = 1} und für die Mengen Ω1f 1 c und Ω2f 2 , c welche in der Zielfunktion Jan enthalten sind, Ω1fc1 = {(x1 , x2 ) ∈ [−1,5, 1,5]2 | (x1 )2 + (x2 )2 ≤ fc1 }, Ω2fc2 = {x2 ∈ [−1,5, 1,5] | (x3 )2 ≤ fc2 }. Bei diesem Beispielproblem genügt es die Zielfunktion Jan auf (0, 1]2 ⊂ R zu be- 1 2 2 1 2 trachten, da es keine Vektoren (fc , fc ) ∈ Fan \(0, 1] gibt mit Jan (fc , fc ) < ∞. Für p (fc1 , fc2 ) ∈ (0, 1]2 gilt Jan (fc1 , fc2 ) = − log(2πfc1 fc2 ). In Abbildung 6.2 ist der Graph von Jan visualisiert und in Abbildung 6.3 der Graph der Funktion Jan,p : (0, 1] → (−∞, ∞], fc2 7→ Jan (1 − fc2 , fc2 ). Ferner ist Jan in (fc1 , fc2 ) ∈ (0, 1]2 dierenzierbar. Deshalb kann mithilfe der Opti- malitätskriterien aus Kapitel 4.2 versucht werden eine Lösung zu nden. Erfüllt ein Vektor (fc1,∗ , fc2,∗ , λ∗ ) ∈ (0, 1]2 × R − − so ist (fc1,∗ , fc2,∗ ) ∈ (0, 1]2 die KKT-Bedingungen 1 fc1,∗ + λ∗ = 0, 1 + λ∗ = 0, 2fc2,∗ fc1,∗ + fc2,∗ = 1 bereits optimale Lösung des konvexen Beispielproblems. 1,∗ 2,∗ ∗ Dies ist gerade für (fc , fc , λ ) = ( 23 , 13 , 2) ∈ (0, 1]2 × R mit Jan (fc1,∗ , fc2,∗ ) = −0,88, auf zwei Nachkommastellen gerundet, der Fall. Die eindeutige, optimale Lösung ist zusammen mit ihrem Zielfunktionswert sowohl in Abbildung 5.4 als auch in Abbildung 5.5 dargestellt. Zusätzlich wird die zugehörige Menge 5.3 veranschaulicht. 66 Ω1 1,∗ ×Ω2 2,∗ fc fc in Abbildung 6. Das konvexe VER-Problem Abbildung 6.1: Zulässige Designmenge Ω fc (transparent schwarz umrandet) und zur optimalen Lösung gehörige Menge Ω1 1,∗ × Ω2 2,∗ fc fc (transparent grün umrandet) Abbildung 6.2: Graph von Jan (Blautöne), Graph von Jan auf die zulässige Men- ge eingeschränkt (rot) und optimale Lösung zusammen mit ihrem Funktionswert als Punkt (grün) 67 6. Das konvexe VER-Problem Abbildung 6.3: Graph von Jan,p und parametrisierte optimale Lösung mit ihrem Funktionswert als Punkt Beispiel 6.4. putfunktion Für die Designmenge f = (f1 , f2 Outputgrenze fc = )T : R2 Ωds = [−1,5, 2,5] × [−1,5, 1,5], die konvexe Out- → R2 , x 7→ ((x1 )2 + (x2 )2 , (x1 − 1)2 + (x2 )2 (1, 1)T und Struktur s = (1, 1) mit ist eine optimale Lösung des kon- vexen VER-Problems (6.1) gesucht. Die Anzahl der Designkomponenten beträgt in diesem Beispiel zahl der Outputkomponenten 1 tiv zerlegbar und es ist f f 2 = (f12 , f22 )T : R2 → R, Designmenge Ω fc m = 2. Oensichtlich ist f d=2 und die An- mit der Struktur s addi- = (f11 , f21 )T : R2 → R, x1 7→ ((x1 )2 , (x1 − 1)2 )T und x2 7→ ((x2 )2 , (x2 )2 )T . In Abbildung 6.4 ist die zulässige veranschaulicht. Für die zulässige Menge Fan des Optimierungsproblems gilt Fan = {(fc1 , fc2 ) ∈ R2 × R2 | fc1 + fc2 = (1, 1)T } und für die Mengen Ω1f 1 c und Ω2f 2 , c welche in der Zielfunktion Jan enthalten sind, Ω1fc1 = {x1 ∈ [−1,5, 2,5] | ((x1 )2 , (x1 − 1)2 )T ≤ fc1 }, Ω2fc2 = {x2 ∈ [−1,5, 1,5] | ((x2 )2 , (x2 )2 )T ≤ fc2 }. In diesem Beispiel genügt es die Zielfunktion 68 Jan auf (0, 1]2 × (0, 1]2 ⊂ R2 × R2 6. Das konvexe VER-Problem zu betrachten, da es keine Vektoren Eigenschaft Jan (fc1 , fc2 ) < ∞. Für (fc1 , fc2 ) ∈ Fan \((0, 1]2 × (0, 1]2 ) (fc1 , fc2 ) ∈ (0, 1]2 × (0, 1]2 gibt mit der gilt q q q 1 + 2 −1 1 − log 2 fc,1 fc,1 fc,2 1 2 q q q Jan (fc , fc ) = − log 2 1 + 2 −1 2 fc,1 fc,1 fc,2 für e 1, (fc1 , fc2 ) ∈ D für e 2, (fc1 , fc2 ) ∈ D wobei e 1 := {(f 1 , f 2 ) ∈ (0, 1]2 × (0, 1]2 | f 1 ≤ f 2 }, D c c c,2 c,2 e 2 := {(f 1 , f 2 ) ∈ (0, 1]2 × (0, 1]2 | f 1 > f 2 }. D c c c,2 c,2 In Abbildung 6.5 ist der Graph der Funktion Jan,p : (0, 1] → (−∞, ∞], fc2 7→ Jan ((1, 1)T − fc2 , fc2 ). visualisiert. Die Zielfunktion Jan ist insbesondere für 1 = f2 fc,2 c,2 nicht dierenzier- bar. Bei diesem Beispiel kann gezeigt werden, dass die KKT-Bedingungen im dierenzierbaren Bereich nicht erfüllt werden können. Die eindeutige, optimale Lösung des Problems beträgt auf zwei Nachkommastellen gerundet fc2,∗ = (0,21, 0,21)T zugehörige Menge fc1,∗ = (0,71, 0,71)T , . Diese kann später direkt aus Beispiel 6.9 abgeleitet werden. Die Ω1 1,∗ × Ω2 2,∗ fc fc ist in Abbildung 6.4 veranschaulicht. 69 6. Das konvexe VER-Problem Abbildung 6.4: Zulässige Designmenge Menge Ω1 1,∗ × Ω2 2,∗ fc Abbildung 6.5: Graph von fc Jan,p Ω fc (weiÿ) und zur optimalen Lösung gehörige (grün umrandet) und parametrisierte optimale Lösung mit ihrem Funktionswert als Punkt 70 6. Das konvexe VER-Problem Auch in Beispiel 6.4 ist zu erkennen, dass die Zielfunktion auch bei konvexen Outputfunktionen nicht zwingend dierenzierbar ist. Bei eindimensionalen Strukturen ergibt sich eine zur optimalen Lösung gehörige Menge stets in Form eines d-dimensionalen Hyperrechtecks, vgl. Beispiel 2.19. Deshalb wird an dieser Stelle noch kurz auf eine äquivalente Formulierung des konvexen VER-Problems (6.1) eingegangen, bei welcher die Zielfunktion dierenzierbar ist. 6.2. Eindimensionale Strukturen In den folgenden Betrachtungen sei die Outputfunktion zerlegbar mit eindimensionaler Struktur, d.h. f stets konvex und additiv s = (1, . . . , 1) ∈ Nd und n = d. Für die i m Vektoren fc ∈ R , i = 1, . . . , d, kann das Lebesgue-Maÿ der zugehörigen Mengen Ωif i ⊂ R über li := λ1 (Ωif i ) ∈ [0, ∞) deniert werden. Aufgrund der Konvexität und c c i somit Stetigkeit der Outputfunktion sind alle Ω i als Schnitt abgeschlossener und fc konvexer Mengen, vgl. Gleichung (5.5), abgeschlossen und konvex. Daher können sie im Fall λ1 (Ωif i ) = 0 λ1 (Ωif i ) c c > 0 als leere Menge M als Intervall [xi − ∅ oder einelementige Menge li M 2 , xi + li 2 ] mit xM i {xM i } und im Fall ∈ R, i = 1, . . . , d, dargestellt werden. Für einen positiven Wert des Maÿes muss hierbei max l l i M i xi ∈[xM i − 2 ,xi + 2 ] j = 1, . . . , m für fji (xi ) li li i M i i M , fj xi + ≤ fc,j = max fj xi − 2 2 gewährleistet sein, wobei max(x, y) := max{x, y} für (6.2) x, y ∈ R. Insgesamt gibt es deshalb auch für eine optimale Lösung des konvexen VER-Problems fci,∗ ∈ Rm , xM,∗ ∈R i i= mit 1, . . . , d, welche λd [xM,∗ − i li∗ M,∗ 2 , xi + li∗ 2] d Q i=1 Ωi i,∗ fc > 0 erfüllt, zugehörige li∗ ∈ (0, ∞) und = Ωif i,∗ ⊂ Ωids für i = 1, . . . , d. Somit können die entsprechenden Mengen der optimalen Lösung des konvexen VERProblems auch über das nachfolgende Problem gefunden werden. Denition 6.5. f: Rd → Struktur Seien die Designmenge Rm mit Outputgrenze s = (1, . . . , 1) ∈ fc ∈ d N . Das Ωds ⊂ Rd sowie die konvexe Outputfunktion Rm gegeben. Ferner sei f additiv zerlegbar mit eindimensionale konvexe VER-Problem 71 6. Das konvexe VER-Problem lautet dann minimiere li ∈(0,∞), xM i ∈R, i=1,...,d − log i=1 li li li i M max(f i (xM i − 2 ), f (xi + 2 )) ≤ fc , −xM i + xM i + Dabei stellt die Funktion i=1 d P u.d.N. d Q li 2 li 2 (6.3) ≤ −xlb i , i = 1, . . . , d, ≤ xub i , i = 1, . . . , d. max(·, ·) : Rm ×Rm → Rm das komponentenweise Maximum m dar, vgl. Gleichung (6.2). zweier Vektoren in R Wie bei den anderen Problemen kann die Zielfunktion hierbei wieder als Funktion d d J1 : (0, ∞) × R → R, M (l1 , . . . , ld , xM 1 , . . . , xd ) d Y 7→ − log ! li i=1 aufgefasst werden. Eigenschaften des Problems Nun wird noch kurz auf die Eigenschaften des eindimensionalen konvexen VERProblems eingegangen. Dazu werden Elemente in mengefasst, vgl. die Darstellung von Schreibweise Satz 6.6. fˆc (0, ∞)d × Rd J1 2d-Tupel zusam- in Kapitel 5.2. An dieser Stelle wird die ˆl := (l1 , . . . , ld , xM , . . . , xM ) ∈ (0, ∞)d × Rd ⊂ R2d 1 d Die Zielfunktion als benutzt. des eindimensionalen konvexen VER-Problems (6.3) ist (i) konvex und (ii) dierenzierbar. Beweis. (i) Zu zeigen ist, dass für alle ˆl, r̂ ∈ (0, ∞)d × Rd und alle θ ∈ (0, 1) die Ungleichung J1 θˆl + (1 − θ)r̂ erfüllt ist, wobei ≤ θJ1 ˆl) + (1 − θ)Jd (r̂ ˆl := (l1 , . . . , ld , xM , . . . , xM ) 1 d Die Logarithmusfunktion log ist wegen 72 d2 dx2 und (6.4) r̂ := (r1 , . . . , rd , y1M , . . . , ydM ). log(x) = − x12 für alle x ∈ (0, ∞) 6. Das konvexe VER-Problem konkav. Daher gilt für alle li , ri ∈ (0, ∞), i = 1, . . . , d und alle θ ∈ (0, 1) gerade log(θli + (1 − θ)ri )) ≥ θ log(li ) + (1 − θ) log(ri ) und somit auch d X log(θli + (1 − θ)ri )) ≥ i=1 d Y log d X (θ log(li ) + (1 − θ) log ri ) , i=1 ! (θli + (1 − θ)ri ) ≥ θ log i=1 d Y ! + (1 − θ) log li i=1 ! ri . i=1 Daraus folgt direkt die Ungleichung (6.4) für alle alle d Y ˆl, r̂ ∈ (0, ∞)d × Rd und für θ ∈ (0, 1). (ii) Für alle ˆl ∈ (0, ∞)d × Rd gilt M ∇J1 ˆl = ∇Jd l1 , . . . , ld , xM 1 , . . . , xd T 1 1 ∈ R2d . = − , . . . , − , 0, . . . , 0 l1 ld Damit ist Satz 6.7. J1 dierenzierbar. Die zulässige Menge d X li i M li d d ˆ F1 = l ∈ (0, ∞) × R max f i xM , f xi + ≤ fc , i − 2 2 i=1 − xM i li li M + ≤ −xlb ≤ xub i , xi + i , i = 1, . . . , d 2 2 des eindimensionalen konvexen VER-Problems (6.3) ist konvex. Beweis. Es reicht zu zeigen, dass die zugrundeliegenden Funktionen der Nebenbedingungen konvex sind, dann ist F1 nach Satz 4.8 konvex. Die Funktionen, welche die Bedingungen li lb M li ub −xM i + 2 ≤ −xi ,xi + 2 ≤ xi , i = 1, . . . , d beschreiben, sind linear und daher konvex. Für ˆl = (l1 , . . . , ld , xM , . . . , xM ) ∈ (0, ∞)d × Rd 1 d und für sei xli := xM i − r̂ = (r1 , . . . , rd , y1M , . . . , ydM ) ∈ (0, ∞)d × Rd 73 li 2, entsprechend xui := xM i + yil := yiM − li 2 ri 2, 6. Das konvexe VER-Problem yiu := yiM + ri 2, i = 1, . . . , d. Dann gilt für alle ˆl, r̂ ∈ (0, ∞)d × Rd und alle θ ∈ (0, 1) weiterhin d X max fji θxli + (1 − θ)yil , fji θ(xui + (1 − θ)yiu i=1 ≤ ≤ d X max θfji xli + (1 − θ)fji yil , θfji xui + (1 − θ)fji yiu i=1 d X θ max fji xli , fji xui + (1 − θ) max fji yil , fji yiu i=1 = θ d X d X max fji xli , fji xui + (1 − θ) max fji yil , fji yiu , i=1 j = 1, . . . , m. i=1 Somit ist gezeigt, dass die zulässige Menge F1 konvex ist. Aufgrund dieser Eigenschaften ist das eindimensionale konvexe VER-Problem (6.3) ebenfalls ein konvexes Optimierungsproblem. Im Unterschied zum konvexen VERProblem (6.1) ist hierbei die Zielfunktion stets dierenzierbar. Allerdings ist die Funktion max(·, ·), welche in den Nebenbedingungen des eindimensionalen konvexen VER-Problems auftritt, nicht dierenzierbar. Beim konvexen VER-Problem (6.1) mit eindimensionaler Struktur liegen die Variablen der Zielfunktion im Rmd und die Anzahl der Nebenbedingungen beträgt m. Vergleichsweise dazu sind die Variablen der Zielfunktion des eindimensionalen konvexen VER-Problems (6.3) im m + 3d. R2d und die Anzahl der Nebenbedingungen beträgt Unter Verwendung eines identischen Optimierungsalgorithmus kann somit ein geringerer Rechenaufwand bei der Berechnung einer optimalen Lösung mithilfe des eindimensionalen konvexen VER-Problems erst ab Bemerkung 6.8. m>2 erzielt werden. Dierenzierbarkeit in den Nebenbedingungen beim eindimensio- nalen konvexen VER-Problem (6.3) könnte erreicht werden, indem anstatt des Terms max(f i (xM i − li i M 2 ), f (xi + li 2 )) alle möglichen Kombinationen der f i (xM i ± li 2 ) mit i = 1, . . . , d untersucht werden würden. D.h. anstatt m Ungleichungen müssten dann m · 2d Ungleichungen erfüllt sein. Da in diesem Fall die Anzahl der Ungleichungen exponentiell mit d wächst, wird dieses Vorgehen im Folgenden nicht weiter verfolgt. Nachfolgend wird das Beispiel 6.4 erneut aufgegrien und als eindimensionales konvexes VER-Problem dargestellt. Hierbei können die Nebenbedingungen so vereinfacht werden, dass die zugrundeliegende Funktionen allesamt dierenzierbar sind. 74 6. Das konvexe VER-Problem Beispiel 6.9. Für die Designmenge Outputfunktion Outputgrenze Ωds = [−1,5, 2,5] × [−1,5, 1,5] und die konvexe f = (f1 , f2 )T : R2 → R2 , x 7→ ((x1 )2 + (x2 )2 , (x1 − 1)2 + (x2 )2 fc = mit (1, 1)T ist eine optimale Lösung des eindimensionalen konvexen VER-Problems (6.3) gesucht. Die Nebenbedingungen zu diesem Beispielproblem lauten l1 2 l1 2 + max xM , xM 1 − 2 1 + 2 2 2 l1 l1 M M x1 − 2 − 1 , x1 + 2 − 1 + max xM 2 − max max für M 2 2 2d (l1 , l2 , xM 1 , x2 ) ∈ (0, ∞) × R ⊂ R . xM 2 − l2 2 2 , l2 2 , 2 l2 2 2 l2 2 xM + 2 2 M −x1 + l21 l2 −xM 2 + 2 l1 xM 1 + 2 l2 xM 2 + 2 xM 2 + ≤ 1, ≤ 1, ≤ 1,5, ≤ 1,5, ≤ 2,5, ≤ 1,5 Aus Symmetriegründen muss für ei- M,∗ M,∗ ne optimale Lösung (x1 , x2 ) = (0,5, 0) gelten. Zusammen mit der Eigenschaft {x ∈ R2 | f (x) ≤ fc } = Ωfc reduzieren sich die Nebenbedingungen des Optimierungsproblems zu l1 + 0,5 2 2 2 l2 + = 1. 2 Die KKT-Bedingungen l1∗ +λ + 0,5 = 0, 2 l∗ l1∗ + λ 2 = 0, 2 ∗ 2 ∗ 2 l1 l + 0,5 + 2 = 1 2 2 l2∗ sind dann für (l1∗ , l2∗ , λ∗ ) = (0,69, 1,08, −1,28) erfüllt, wobei die Einträge auf zwei Nachkommastellen gerundet wurden. Deshalb ist (0,69, 1,08, 0,5, 0) ∈ (0, ∞)2 × R2 eine optimale Lösung des Beispielproblems. Damit kann die optimale Lösung des zugehörigen analytischen Problems aus Beispiel 6.4 zurückgerechnet werden. 75 7. Numerische Lösung des konvexen VER-Problems 7. Numerische Lösung des konvexen VER-Problems In diesem Kapitel wird vorgestellt, wie das konvexe VER-Problem mit ein- oder zweidimensionaler Struktur numerisch gelöst werden kann. Dafür wird in dieser Arbeit die Software Matlab R verwendet. Im Vordergrund steht hierbei das Gesamtvorge- hen um eine numerische Lösung zu erhalten. Daher werden einige Aspekte nur grob behandelt und mathematische Aussagen nicht detailliert begründet. 7.1. Grundlegendes R Um Optimierungsprobleme der Form (4.10) zu lösen, gibt es in Matlab imple- mentierte Algorithmen. Für den Fall, dass die zugrundeliegenden Funktionen des Problems (4.10) stetig dierenzierbar sind, eignet sich beispielsweise ein sogenanntes Innere-Punkte-Verfahren, welches über den Befehl fmincon aufgerufen werden kann und sich durch eine relativ schnelle Berechnung der Lösung auszeichnet. Falls die entsprechenden Ableitungen nicht existieren, ist ein direktes Suchverfahren hilfreich, was beispielsweise in der Matlab R -Routine patternsearch hinterlegt ist und mehr Zeit für die Lösungsndung benötigt. Im Folgenden werden die beiden erwähnten Verfahren kurz vorgestellt. Innere-Punkte-Verfahren mit fmincon Der Innere-Punkte-Algorithmus der Routine blem (4.10) mit D= fmincon versucht das Minimierungspro- Rd zu lösen, indem es eine Folge approximierter Minimierungs- probleme löst, die jeweils durch den Parameter lautet das σ beschrieben werden. Für σ ∈ (0, ∞) approximierte Minimierungsproblem minimiere (x,s)∈Rd ×(0,∞)m u.d.N. Die Variable s ∈ (0, ∞)m J(x) − σ m P log(sj ) (7.1) j=1 e(x) = ec , f (x) + s = fc . heiÿt Schlupfvariable und der hinzugefügte Term der Zielfunktion logarithmische Barriere, vgl. [11]. Hiermit wird dafür gesorgt, dass die Ungleichungsbedingung f (x) ≤ fc für x ∈ Rd zeichnung innere Punkte motiviert. Kann strikt eingehalten wird, was die Be- s ∈ (0, ∞)m garantiert werden, so enthält das approximierte Problem keine Ungleichungsbedingung mehr. Dadurch vereinfachen sich die KKT-Bedingungen (4.13)-(4.17). Für σ → 0 wird erwartet, dass die Lösung des approximierten Problems (7.1) gegen die Lösung von (4.10) konvergiert. 76 7. Numerische Lösung des konvexen VER-Problems Ausgehend von einem Startwert (x0 , s0 ) ∈ Rd × (0, ∞)m Algorithmus zu jeder Iteration ein Newton-Schritt (∆x, ∆s) versucht der Matlab R- durchzuführen, um das approximative Problem zu lösen. Dabei werden die entsprechenden Gleichungen der KKT-Bedingungen des approximierten Minimierungsproblems (7.1) mithilfe linearer Approximation gelöst. Für konvexe Probleme ist der Newton-Schritt in der Regel durchführbar. Falls dies nicht der Fall ist, wird ein sogenannter CG-Schritt getestet, siehe [17] für weitere Informationen. Der Algorithmus bricht insbesondere dann ab, wenn die Optimalitätskriterien erster Ordnung bis auf eine bestimmte Toleranz erfüllt sind. Die Grundlagen des von Matlab R implementierten Innere-Punkte-Verfahrens nden sich in [5]. Direktes Suchverfahren mit patternsearch Der allgemeine Patternsearch-Algorithmus in der Matlab R -Routine patternsearch generiert eine Folge von Punkten, welche sich einer Lösung des Minimierungsproblems (4.10) annähert. In jedem Schritt wird auf einer Menge von Punkten, welche in einer Umgebung eines aktuellen Punktes liegen und Netz genannt werden, nach einem Punkt gesucht, dessen Zielfunktionswert geringer ist als der des aktuellen Punktes. Im Erfolgsfall wird ein solcher Punkt dann zum nächsten aktuellen Punkt des Algorithmus. Bei diesem Vorgehen werden keine Ableitungsinformationen der Zielfunktion benötigt, weshalb auch von einer direkten Suchmethode gesprochen wird. Sofern keine Nebenbedingungen verletzt werden, besteht das Netz aus 2d Punkten, welche entlang der Koordinatenachsen ausgerichtet sind und vom aktuellen Punkt einen gewissen Abstand s, auch Netzgröÿe genannt, haben. Treten lineare Nebenbe- dingungen auf, so wird das Netz so modiziert, dass nur zulässige Punkte für das Netz erlaubt werden. Falls auch nichtlineare Nebenbedingungen vorliegen, wird ein sogenannter erweiterter Lagrangescher Patternsearch-Algorithmus verwendet, der, wie die fmincon-Routine, Barrieren in der Zielfunktion benutzt, siehe [15]. Sobald ein Punkt des Netzes gefunden wurde, welcher einen geringeren Wert der Zielfunktion aufweist als der aktuelle Punkt, wird dieser zum neuen aktuellen Punkt und ein neues Netz mit doppelter Netzgröÿe wird erzeugt. Wenn keiner der Zielfunktionsfunktionswerte der Netzpunkte kleiner ist als der des aktuellen Punktes, wird ein neues Netz um den selben Punkt mit halber Netzgröÿe erzeugt. Der Algorithmus bricht insbesondere dann ab, wenn s einen kritischen Wert unterschreitet. Der Patternsearch-Algorithmus von Matlab tion auf Netzpunkten den Wert ∞ R funktioniert auch, wenn die Zielfunk- annimmt, indem diese Punkte ignoriert werden. 77 7. Numerische Lösung des konvexen VER-Problems Ist dies für alle Netzpunkte der Fall, so wird ein neues Netz mit halbem Abstand erzeugt. Daher ist es wichtig mit einem Punkt zu starten, dessen Zielfunktionswert kleiner als ∞ ist, worauf im Folgenden näher eingegangen wird. In [17] sind Details zum Matlab R implementierten Algorithmus zu nden und in [3] theoretische Untersuchungen zu diesem. An dieser Stelle sei auÿerdem bemerkt, dass es neben den beiden vorgestellten Algorithmen noch viele weitere gibt, um Optimierungsprobleme zu lösen, siehe [11]. Auch in [2] werden Optimierungsalgorithmen vorgestellt, die insbesondere für konvexe, nichtdierenzierbare Probleme geeignet sind. Startwertbestimmung Für das konvexe VER-Problem (6.1) ist ein Startwert n Q 1 , . . . , fn ) ∈ (fc,0 c,0 Rm ge- k=1 sucht mit 1 , . . . , fn ) ∈ F (fc,0 an c,0 1 , . . . , f n ) < ∞. Jan (fc,0 c,0 und Im Folgenden wird be- schrieben, wie ein solcher Startwert gefunden werden kann. Zunächst wird dazu das Optimierungsproblem minimiere kf (x) − fc k∞ x∈Rd (7.2) ub −xi ≤ −xlb i , xi ≤ xi , i = 1, . . . , d u.d.N. gelöst. Dieses ist wie in Beispiel 4.20 beschrieben ein konvexes Problem, wobei die Zielfunktion generell nicht dierenzierbar ist. Zur Lösung des Problems kann deshalb R -Routine patternsearch die Matlab verwendet werden. Analog zu Problem (4.12) könnte dieses Problem auch auf ein Problem transformiert werden, bei welchem die zugrundeliegende Funktionen dierenzierbar sind, sofern Falls für eine optimale Lösung existiert kein x ∈ Ωds mit Lebesgue-Maÿ vom Wert x∗ ∈ F f (x) ≤ fc . 0 von (7.2) nun f dierenzierbar ist. kf (x∗ ) − fc k∞ > 0 Deshalb hat die zulässige Designmenge und somit auch jedes kartesische Produkt n Q k=1 mit gilt, so Ωfc Ωkf k c ein ⊂ Ωfc (fc1 , . . . , fcn ) ∈ Fan . kf (x∗ )−fc k∞ < 0 gibt es ein s = (s1 , . . . , sm ) ∈ (0, ∞)m mit f (x∗ )+s = fc . n Q 1 n k Rm mit fc,0,j = f k (x∗ ) + n1 sj für Startwert eignet sich dann (fc,0 , . . . , fc,0 ) ∈ Im Falle Als j = 1, . . . , m, k = 1, . . . , n, d.h. n P k=1 k fc,0 = fc , also 1 , . . . , fn ) ∈ F. (fc,0 c,0 Aufgrund der k=1 Stetigkeit von f und damit der Funktionen 78 f k , existieren rk ∈ (0, ∞), sodass für alle 7. Numerische Lösung des konvexen VER-Problems xk ∈ B(x∗,k , rk ) ∩ Ωkds gilt k , k = 1, . . . , n. f k (xk ) < fc,0 Daraus folgt, dass n Q Ωkf k c,0 k=1 1 n ein positives Lebesque-Maÿ hat und damit Jan (fc,0 , . . . , fc,0 ) < ∞. ∗ Falls kf (x )−fc k∞ = 0 gilt, so muss zunächst geprüft werden, ob Ωfc eine Nullmenge ist. Wenn dies nicht zutrit, kann der Startwert für die Optimierung wie im Fall kf (x∗ ) − fc k∞ < 0 gewählt werden mit s ∈ [0, ∞)m . Analog kann über eine Lösung x∗ ∈ F des Minimierungsproblems (7.2) ein Startwert M (l0,1 , . . . , l0,d , xM 0,1 , . . . , x0,d ) (0, ∞)d × Rd ∈ ∗ Problem (6.3) gefunden werden. Gilt für x für das eindimensionale konvexe VER- ∈F gerade kf (x∗ )−fc k∞ < 0, mit −x∗i < x∗i < xub i für i = 1, . . . , d, so existiert aufgrund der Stetigkeit von f ein l0 ∈ d P l0,i l0,i l0,i l i ∗ ∗ lb ∗ (0, ∞)d mit max(f i (x∗i − 0,i 2 ), f (xi + 2 )) < fc , −xi + 2 < −xi und xi + 2 < −xlb i und i=1 xub i für ∗ i = 1, . . . , d. Darum kann hier xM 0 =x und l0 komponentenweise hinreichend klein gewählt werden. Dann ist für das so gewählte M (l0,1 , . . . , l0,d , xM 0,1 , . . . , x0,d ) ∈ (0, ∞)d × Rd auÿerdem die Regularitätsbedingung von Slater erfüllt. Für den Fall kf (x∗ ) − fc k∞ ≥ 0 gelten die Aussagen des vorherigen Absatzes. Numerische Approximation des Lebesgue-Maÿes Da eine analytische Beschreibung der Zielfunktion des analytischen VER-Problems im Allgemeinen sehr komplex ist, vgl. Bemerkung 5.14, wird in diesem Kapitel vorgestellt, wie sie numerisch für zwei- bzw. eindimensionale Strukturen s berechnet wer- den kann. Insbesondere wird dazu beschrieben, wie das Lebesgue-Maÿ einer Menge Ωkf k = {xk ∈ Ωkds | f k (xk ) ≤ fck } ⊂ R2 c mit k ∈ {1, . . . , n}, das gerade dem Flächenin- halt dieser Menge entspricht, berechnen werden kann. Im Folgenden wird der Index k der Einfachheit halber weggelassen, d.h. es wird ein beliebiger Index k mit d =2 betrachtet. In einem ersten Schritt werden zwei äquidistante Gitter, gelegt. Seien und k ∈ {1, . . . , n} nG,1 ∈ N nG,2 ∈ N G und die Anzahl der Gitterpunkte des Gitters die Anzahl der Gitterpunkte in x2 -Richtung. e, G G über in x1 -Richtung Die beiden Gitter sind deniert über lb G = {(xlb 1 + i1 h1 , x2 + i2 h2 ) | i1 ∈ IG,1 , i2 ∈ IG,2 }, lb e = {(xlb G e } e , i2 ∈ IG,2 1 + i1 h1 , x2 + i2 h2 ) | i1 ∈ IG,1 79 Ωds ⊂ R2 7. Numerische Lösung des konvexen VER-Problems mit Gitterschrittweiten IG,1 := { 12 , 32 , . . . , nGd ,1 − und lb xub xub −xlb 1 −x1 2 und h2 := 2 sowie Gitterindexmengen nG,1 nG,2 1 1 3 1 e := {0, 1, . . . , nG,1 } 2 }, IG,2 := { 2 , 2 , . . . , nG,2 − 2 }, IG,1 h1 := IG,2 e := {0, 1, . . . , nG,2 }. In Abbildung 7.1 sind die beiden Gitter dargestellt. Abbildung 7.1: Darstellung des Gitters G anhand von Punkten und des Gitter e G anhand von Schnittpunkten der durchgezogenen Linien Im nächsten Schritt wird die Funktion gewertet. Sofern ein Punkt welcher eindeutig über i1 f (xG ) ≤ fc RxG , xG ∈ G ∈ IG,1 und i2 f an jedem Gitterpunkt des Gitters mit lb G aus- lb (xG,1 , xG,2 ) := (x1 + i1 h1 , x2 + i2 h2 ), ∈ IG,2 bestimmt ist, das Ungleichungssystem erfüllt, heiÿt dieser gültig. In diesem Fall wird das zugehörige Rechteck deniert über RxG := {x ∈ R2 | xG,1 − h1 h1 h2 h2 < x1 < xG,1 + , xG,2 − < x2 < xG,2 + } 2 2 2 2 λ2 (RxG ) = h1 h2 RxG h1 h2 h1 h2 ist oen und wird durch die Gitterpunkte (xG,1 − 2 , xG,2 − 2 ), (xG,1 + 2 , xG,2 − 2 ), e festgelegt. Erfüllt der (xG,1 + h21 , xG,2 + h22 ) und (xG,1 − h21 , xG,2 + h22 ) des Gitters G mit Flächeninhalt Gitterpunkt xG , xG ∈ G ebenfalls als gültig erachtet. Das Rechteck das Ungleichungssystem als auch das zugehöriges Rechteck RxG f (xG ) ≤ fc nicht, dann wird sowohl als ungültig erachtet. Im letzten Schritt lässt sich nun der Flächeninhalt der Menge zahl der gültigen Gitterpunkte nG,v , Ωf c über die An- die Gesamtanzahl aller Gitterpunkte und dem 80 7. Numerische Lösung des konvexen VER-Problems Flächeninhalt von Ωds bestimmen, d.h. genauer nG,v ub lb (xub − xlb 1 )(x2 − x2 ) + εG , nG,1 nG,2 1 λ2 (Ωfc ) = wobei εG (7.3) der Approximationsfehler ist, der bei dieser diskreten Art der Berechnung entsteht und sogleich genauer untersucht wird. In Abbildung 7.2 wird dieses Verfahren der numerischen Berechnung des Flächen- f (x) ≤ fc inhalts anhand einer Ellipse, welche über eine Ungleichung der Form x ∈ Ωds für dargestellt werden kann, illustriert. Abbildung 7.2: Zur numerischen Berechnung des Flächeninhalts mit gültigen Rechtecken (weiÿ), ungültigen Rechtecken (blau), Rechtecken, die zu einem Fehler in der Flächenberechnung führen (rot umrandet) Der Rand der Menge Ω fc , welcher mit ∂Ωfc bezeichnet wird, trennt die gültigen von den ungültigen Punkten, wobei alle Punkte auf dem Rand gültig sind. Ein Rechteck RxG kann also nur dann einen Beitrag zum Approximationsfehler ∂Ωfc ∩ RxG 6= ∅ gilt, d.h. absolute Anteil von Sei RxG RxG ∩∂Ωfc = ∂Ωfc RxG eine Nullmenge mit {xG } ∈ Ωfc also RxG ∩ ∂Ωfc ( ∂Ωfc für L(∂Ωfc ), ∆εG bezeichnet. xG ∈ G. Der Approximationsfehler wird maximal, wenn Ω fc Objekt mit Länge leisten, wenn sowohl gültige als auch ungültige Punkte enthält. Der am Gesamtfehler wird von nun an mit für ein εG x G ∈ G. wobei L ist, d.h. εG = ∆εG = h1 h2 . Sei im Folgenden Der Rand ist daher stets ein eindimensionales einer Kurve ihre Länge zuordnet. Der absolute Anteil der Länge des Randes, der auf RxG 81 fällt, sei nun ∆L(∂Ωfc ). Gesucht ist 7. Numerische Lösung des konvexen VER-Problems dann das maximal mögliche Verhältnis ∆εG ∆L(∂Ωfc ) . Durch Ausloten der verschiedenen Möglichkeiten, wie ein Teil des Randes einer konvexen Menge in RxG liegen kann, ergibt sich, dass ∆εG ≤ ∆L(∂Ωfc ) 1 2 h1 h2 = 2 max{h1 , h2 } min{h1 , h2 } gilt. Dies ist gerade der Fall wenn Abbildung 7.3 zu sehen in RxG Ω fc selbst ein eindimensionales Objekt ist und wie liegt, sodass xG und damit RxG gültig sind. Abbildung 7.3: Beispiel für das Auftreten des maximalen Verhältnisses 2h1 Mithilfe für ∆εG ∆L(∂Ωfc ) = h2 < h1 ∆εG ∆L(∂Ωfc ) L(∂Ωfc ) kann εG nach oben abgeschätzt werden. Es gilt, dass die Länge des Randes einer konvexen Menge stets kleiner als die Länge des Randes einer Menge ist, welche diese einschlieÿt. Dies kann damit begründet werden, dass eine nächste-Punkte-Projektion von einer einschlieÿenden auf eine konvexe Menge kontrahierend ist. Mit Ωfc ⊂ Ωds folgt daher lb ub lb εG ≤ 4 max{h1 , h2 } (xub 1 − x1 ) + (x2 − x2 ) . Mit h := max{h1 , h2 } ergibt sich dann insgesamt um einen Fehler erster Ordnung in εG = O(h), d.h. es handelt sich h. Das approximierte Lebesgue-Maÿ einer Menge Ωkf k ⊂ R c mit k ∈ {1, . . . , n} lässt sich im Eindimensionalen auf eine ähnliche, aber unkompliziertere Weise bestimmen. Hierbei ist der Fehler ebenfalls erster Ordnung in der Gitterschrittweite h. Insgesamt können damit nun Rückschlüsse auf den Gesamtfehler bei der Berechnung des Volumens eines n-fachen kartesischen Produkts n Q k=1 für k = 1, . . . , n, Ωkfc mit gezogen werden. Wird das Volumen über Ωkfc ⊂ Rd n Q k=1 mit h k k und λd (Ωkfc ) dk ≤ 2 bestimmt als gröÿte auftretende Gitterschrittweite für die numerische Berechnung von 82 7. Numerische Lösung des konvexen VER-Problems k λd (Ωkfc ), k = 1, . . . , n, so ist auch der Gesamtfehler von erster Ordnung in Analoge Betrachtungen können auch für ein n-faches h. kartesisches Produkt n Q k=1 mit Ωkfc ⊂ Rd k konvex und d1 > 2 Ωkfc gemacht werden. Es sei bemerkt, dass auch im nicht konvexen Fall die Approximation des Lebesgue-Maÿes auf diese Weise erfolgen kann. Allerdings gilt dann die Abschätzung für den Fehler εG nicht mehr. 7.2. Beispielprobleme Nun stehen alle Hilfsmittel bereit, um das konvexe analytische VER-Problem (6.1) für eine ein- bzw. zweidimensionale Struktur numerisch lösen zu können. Als Beispiel wird zunächst das Problem aus Beispiel 6.3 aufgegrien und die numerische Lösung mit der tatsächlichen, optimalen Lösung verglichen. Anschlieÿend wird ein Praxisbeispiel mit einer realistischen Outputfunktion und realistischen Outputgrenzen betrachtet. Zur numerischen Lösung wird ein Rechner verwendet, dessen Eigenschaften in Anhang A aufgeführt sind. Für die Lösungsndung wird hierbei auÿerdem die Gitterschrittweite in allen Dimensionen konstant gewählt. Numerische Lösung zu Beispiel 6.3 Ωfc ⊂ [−1, 1]3 Da für die zulässige Designmenge in Beispiel 6.3 gerade Ωds = Beispiel 7.1. Für die Designmenge Ωds = [−1, 1]3 , f : R3 → R, x 7→ kxk22 = (x1 )2 + (x2 )2 + (x3 )2 tur gilt, wird hier [−1, 1]3 als Designmenge gewählt. s = (2, 1) die konvexe Outputfunktion mit Outputgrenze fc = 1 und Struk- ist eine optimale Lösung des konvexen VER-Problems (6.1) gesucht. Mit den Methoden aus Kapitel 7.1 kann die Lösung des Problems numerisch bestimmt werden. Dazu wird die Matlab R -Routine patternsearch unter Standard- einstellungen verwendet und die Approximation des Lebesgue-Maÿes je einmal mit der Gitterschrittweite h = 0,1, h = 0,01 und h = 0,001 durchgeführt. Als Startwert für die Optimierung ergibt sich mit der in Kapitel 7.1 beschriebenen Vorgehensweise fc,0 = (0,5, 0,5). Die zur numerisch berechneten Lösung gehörigen Mengen sind für die drei Varianten der Gitterschrittweite in Abbildung 7.4 dargestellt. Abbildung 7.5 stellt die Dierenz zwischen der zweiten Komponente der numerisch berechneten Lösung und der zweiten Komponente der tatsächlichen Lösung, d.h. fc∗,2 aus Beispiel 6.3, dar. Die Dierenz in der ersten Komponente ist identisch mit dieser, da für jedes Element fˆc ∈ R2 der zulässigen Menge 83 fc1 + fc2 = 1 gelten muss. 7. Numerische Lösung des konvexen VER-Problems Abbildung 7.4: Zur numerisch berechneten, optimalen Lösung des Beispielproblems gehörige Mengen (weiÿ) für h = 0,001 (unten) 84 h = 0,1 (oben), h = 0,01 (Mitte) und 7. Numerische Lösung des konvexen VER-Problems Abbildung 7.5: Dierenz zwischen der zweiten Komponente der numerisch berechneten Lösung und der zweiten Komponente der tatsächlichen Lösung auf der z -Achse für die verschiedenen Gitterschrittweiten auf einer logarithmischen Skala der h-Achse In Abbildung 7.5 ist zu erkennen, dass sich die numerisch berechnete Lösung für eine kleinere Gitterschrittweite der tatsächlichen Lösung annähert. Um auch die Anwendbarkeit der verschiedenen Gitterschrittweiten vergleichen zu können, werden die zur Berechnung benötigten CPU-Zeiten in Tabelle 7.1 angegeben. Auÿerdem sind dort die zugehörigen Funktionswerte dargestellt. Die Werte sind dabei auf zwei Nachkommastellen gerundet. Jan (fˆ) CPU-Zeit in s 0,1 -0,95 0,03 0,01 -0,89 0,11 0,001 -0,89 12,50 h Tabelle 7.1: Funktionswerte der Zielfunktion und die CPU-Zeiten der Simulation für verschiedene Gitterschrittweiten 85 7. Numerische Lösung des konvexen VER-Problems Genau wie die numerische Lösung sich der exakten optimalen Lösung für kleiner werdendes h annähert, so nähert sich auch der Zielfunktionswert dem der exakten optimalen Lösung, d.h. −0,88 , siehe Tabelle 7.1. Die Genauigkeit in der numerischen Approximation korreliert jedoch mit der Simulationszeit. Je kleiner die Gitterschrittweite für die Approximation des Lebesgue-Maÿes ist, desto gröÿer ist die CPU-Zeit der Simulation. Praxisbeispiel Jetzt wird ein Praxisbeispiel mit zwölf Designkomponenten, neun Anforderungen und einer linearen Outputfunktion betrachtet. Dabei ist die Designmenge [−1, 1]12 transformiert, d.h. es gilt Beispiel 7.2. Für die Designmenge → R9 , 0,00 0,00 F = 0,01 0,01 f: R12 xlb i x 7→ F x = −1 ub und xi Ωds = [−1, 1]12 , −0,03 −0,08 0,72 1,58 0,00 ... −0,01 0,03 ... −0,03 −0,05 0,00 0,62 0,91 0,00 −0,62 −0,91 0,09 0,00 0,02 −0,03 . . . 0,00 ... −0,04 −0,04 −0,10 . . . −0,02 −0,02 −0,08 0,00 i = 1, . . . , d. die lineare Outputfunktion 0,00 0,01 0,00 für auf mit −0,01 −0,01 −0,72 −1,58 0,00 =1 Ωds 0,00 0,04 0, 02 0,08 0,28 0,40 ... 0,04 0,10 ... −0,28 −0,40 . . . −0,03 −1,47 −0,91 −2,48 −2,11 . . . . . . −0,02 −0,05 −0,04 −0,16 −0,24 −0,16 . . . −0,29 −0,46 −0,65 −2,22 −3,03 2,83 . . . 0,29 0,46 0,65 2,22 3,03 −2,83 . . . 0,00 −0,01 0,02 0,07 0,07 −0,12 9×12 . . . −0,03 −0,09 −0,11 −0,24 0,02 0,01 ∈R . . . 0,03 0,09 0,11 0,24 −0,02 −0,01 . . . 0,00 −0,02 −0,02 −0, 06 0,00 0,00 . . . 0,00 0,02 0,02 0,06 0,00 0,00 . . . 0,04 0,15 0,26 0,45 0,02 0,01 und Outputgrenze fc = (−0,03, 1,52, 3,48, 0,15, −0,24, 0,74, −0,17, 0,67, 2,56)T ist ei- ne optimale Lösung des konvexen VER-Problems (6.1) sowohl für eine eindimensionale Struktur als auch für eine zweidimensionale Struktur, deren Einträge alle den 86 7. Numerische Lösung des konvexen VER-Problems Wert zwei haben, gesucht. Wie im vorherigen Beispiel wird die Lösung des VER-Problems mit zweidimensionaler Struktur numerisch mit der Matlab R -Routine patternsearch unter Standard- einstellungen berechnet. Der Startwert wird dazu wie in 7.1 beschrieben bestimmt und als Gitterschrittweite für die Approximation des Lebesgue-Maÿes wird h = 0.01 gewählt. Die Lösung, die sich daraus ergibt, ist in Abbildung 7.6 in Form ihrer zugehörigen Mengen dargestellt. Um die Lösung des Problems mit eindimensionaler Struktur zu erhalten, wird das eindimensionale konvexe VER-Problem (6.3) gelöst. Da die Outpufunktion linear ist, sind die Funktionen, welche den Nebenbedingungen zugrunde liegen, dierenzierbar. Numerisch kann das Problem deshalb mit der Matlab R -Routine fmincon gelöst wer- den, wobei der Startwert wieder wie in Kapitel 7.1 beschrieben gewählt wird und für R -Routine fmincon die Matlab Standardeinstellungen verwendet werden. Die zur op- timalen Lösung gehörigen Mengen mit eindimensionaler Struktur sind in Abbildung 7.6 zusammen mit den zur optimalen Lösung gehörigen Mengen des Problems mit zweidimensionaler Struktur dargestellt. In Tabelle 7.2 sind zusätzlich die Funktionswerte der Zielfunktionen sowie die CPUZeiten der Simulation für die hier verwendeten Berechnungsmethoden angegeben. Darüber hinaus werden entsprechende Eigenschaften weiterer Berechnungsmethoden aufgeführt. Alle ermittelte Werte sind dabei auf zwei Nachkommastellen gerundet. R -Routine Struktur Matlab eindimensional eindimensional eindimensional zweidimensional zweidimensional fmincon patternsearch patternsearch patternsearch patternsearch J1 (ˆl) CPU-Zeit in s - 10.47 0,56 0,1 13,11 5,75 0,01 12,98 27,89 0,1 1,85 8,41 0,01 1.69 1340,39 h Jan (fˆ) bzw. Tabelle 7.2: Funktionswerte der Zielfunktionen und die CPU-Zeiten der Simulation für verschiedene Berechnungsmethoden Nun können die Berechnungsmethoden untereinander verglichen werden. Zunächst ist dabei der Fokus auf den Vergleich der beiden verwendeten Strukturen untereinander gerichtet, später auf den Vergleich der verschiedenen Berechnungsmethoden innerhalb einer Struktur. 87 7. Numerische Lösung des konvexen VER-Problems Abbildung 7.6: Zur numerisch berechneten, optimalen Lösung des Beispielproblems gehörige Mengen für die zweidimensionale Struktur (weiÿ) und für die eindimensionale Struktur (schwarz umrandet) In Tabelle 7.2 ist zu erkennen, dass der Zielfunktionswert der numerisch berechneten, optimalen Lösung für eine zweidimensionialen Struktur deutlich kleiner ist als der für eine eindimensionale Struktur. Dies bedeutet, dass die Verwendung einer höherdimensionalen Struktur ein gröÿeres Volumen ermöglicht. Dies ist auch in Abbildung 88 7. Numerische Lösung des konvexen VER-Problems 7.6 gut zu sehen. Auÿerdem stellt sich hier heraus, dass das kartesische Produkt der zur optimalen Lösung gehörigen Mengen für eine eindimensionale Struktur nicht unbedingt eine Teilmenge des kartesischen Produkts der zur optimalen Lösung gehörigen Mengen für eine zweidimensionale Struktur sein muss. Wie bereits in Beispiel 7.1 steigt auch hier die CPU-Zeit bei einer Verfeinerung der R -Routine patternsearch Gitterschrittweite unter Verwendung der Matlab stark an. Dieser Eekt ist bei einer zweidimensionalen Struktur gegenüber einer eindimensionalen Struktur nochmals verstärkt. Dies beruht darauf, dass die Anzahl der Funktionsauswertungen, welche bei der numerischen Approximation des Lebesgue-Maÿes im R2 gegenüber der numerischen Approximation im R anfallen, quadriert werden müssen. R -Routine fmincon Auch im Vergleich zur Matlab dung der Routine ist die CPU-Zeit bei der Verwen- patternsearch generell gröÿer. Einerseits ist dies darin begründet, dass eine Suche mit Gradienteninformationen gegenüber einer direkten Suche schneller ist. Andererseits sind die Optimierungsvariablen des zugrundeliegenden, konvexen VER-Problems (6.1) für eine eindimensionale Struktur im Rmd , wobei md = 108. Dies bedeutet, dass die Dimension der Optimierungsvariablen des konvexen VERProblems (6.1) ebenfalls groÿ gegenüber der Dimension der Optimierungsvariablen des eindimensionalen konvexen VER-Problems (6.3) mit 2d = 24 ist. Durch die Approximation des Lebesgue-Maÿes ist auÿerdem die Zielfunktion des konvexen analytischen VER-Problems (6.1) eine Stufenfunktion, weshalb es nicht immer möglich ist, die tatsächliche Lösung des Problems bestmöglich zu approximieren. Damit kann erklärt werden, warum der Zielfunktionswert bei der Verwendung der Matlab von R -Routine patternsearch fmincon. 89 gröÿer ist als der bei der Verwendung 8. Fazit 8. Fazit Das Ziel der Arbeit war es zunächst das Problem eine volumenmaximale Rechtecksmenge zu nden, welche in eine über mehrere Anforderungen denierte Menge einbeschrieben ist in einem mathematischen Kontext zu beschreiben. Hierzu wurde in Kapitel 5 das sogenannte volumenmaximale-einbeschriebene-RechtecksmengenProblem, oder kurz VER-Problem, als abstraktes Optimierungsproblem formuliert. Diese Formulierung basiert unter anderem auf den Produktraumeigenschaften des euklidischen Raums Rd und den darin enthaltenen Borel-Mengen, denen ein Volu- men zugeordnet werden kann. Die entsprechenden Grundlagen dafür wurden in den Kapiteln 2 und 3 untersucht. Um das VER-Problem mit gängigen Optimierungsalgorithmen lösen zu können, wurde eine analytische Version des VER-Problems eingeführt. Diese gilt für Anforderungen, welche durch additiv zerlegbare und messbare Funktionen festgelegt sind. Es konnte gezeigt werden, dass die Zielfunktion des analytischen VER-Problems unterhalb-stetig ist und somit das Problem eine optimale Lösung besitzt. Allerdings traten in einem Beispiel auch lokale, nicht globale Lösungen auf. Deshalb ist nicht garantiert, dass ein Optimierungsalgorithmus die zu einem VER-Problem gehörige, gröÿtmögliche Rechtecksmenge ndet. Unter der stärkeren Voraussetzung, dass die Funktionen, welche die Anforderung beschrieben, sowohl additiv zerlegbar als auch konvex sind, konnte in Kapitel 6 nachgewiesen werden, dass das VER-Problem ein konvexes Optimierungsproblem ist. Somit ist jede lokale Lösung des konvexen VER-Problems auch eine globale. Die Nachweise dazu beruhen auf den in Kapitel 4 gemachten, theoretischen Betrachtungen über konvexe Mengen und Funktionen und insbesondere auch logarithmisch-konkave Funktionen. Des Weiteren konnte für das konvexe VER-Problem eine alternative Formulierung der Problemstellung gefunden werden, sofern die zugehörige Rechtecksmenge sich aus eindimensionalen Mengen zusammensetzt. Für eine groÿe Anzahl von Anforderungen kann die Dimension der Optimierungsvariablen so deutlich verringert werden, woraus ein geringerer Rechenaufwand bei der Problemlösung resultiert. An die mathematische Formulierung anknüpfend wurde in Kapitel 7 eine Möglichkeit R vorgestellt, wie das konvexe VER-Problem numerisch mit der Software Matlab löst werden kann. Dazu wurden in R Matlab ge- implementierte Algorithmen zur Lösung von Optimierungsproblemen betrachtet und Methoden eingeführt, mithilfe derer ein Startwert für die Optimierung bestimmt und das Volumen einer konvexen Menge 90 8. Fazit numerisch berechnet werden kann. Durch mehrere Beispielprobleme wurden Anwendungsbereiche der VER-Probleme, wie sie in dieser Arbeit betrachtet werden, gezeigt. Die numerische Berechnung des konvexen VER-Problems ist insbesondere für wenige Anforderungen und eine niedrige Dimension des euklidischen Raums Rd relativ schnell und genau. Für eine grö- ÿere Anzahl an Anforderungen bzw. höhere Dimensionen des euklidischen Raums Rd dauern die numerischen Berechnungen länger und eine gute Approximation einer optimalen Lösung ist nicht immer garantiert. Eine Untersuchung weiterer Optimierungsalgorithmen könnte mögliche Verbesserungen in der Güte der Approximation einer optimalen Lösung liefern. Falls damit nicht zusätzlich eine Verkürzung der Berechnungszeit erreicht wird, könnte eine solche über die Reduzierung der Anforderungen erzielt werden. Hierfür müsste es gelingen eine additiv zerlegbare Funktion zu nden, welche alle Anforderungen gemeinsam und möglichst genau beschreibt. Ebenso könnten Anforderungen, welche nicht durch additiv zerlegbare Funktionen beschrieben werden, durch additiv zerlegbare Funktionen angenähert werden. Eine intelligente Bestimmung derartiger Funktionen könnte daher die Praxisanwendung dieser Arbeit erweitern und soll Gegenstand zukünftiger Forschung sein. 91 A. Anhang A. Anhang Beweise Beweis zu Satz 2.12 Satz A.1. Seien A, B , C D und Mengen. Für das kartesische Produkt gelten die Eigenschaften (i) (ii) A × (B ∩ C) = (A × B) ∩ (A × C) A×B =∅ ⇔ A=∅ oder bzw. A × (B ∪ C) = (A × B) ∪ (A × C), B = ∅, (iii) A×B ⊂C ×D ⇔ A⊂C (iv) (A × B)c = (Ac × B c ) ∪ (Ac × B) ∪ (A × B c ), (v) und B ⊂ D, (A ∩ B) × (C ∩ D) = (A × C) ∩ (B × D). Beweis. (i) Siehe [16] für einen Beweis. (ii) Siehe [16] für einen Beweis. (iii) ⇐ : 1. Fall: Für Fall: Seien A⊆C A=∅ A und B und B⊆D oder B =∅ nichtleer und ist auch gilt stets A × B ⊆ C × D, vgl. (ii). 2. (a, b) ∈ A × B , d.h. a ∈ A und b ∈ B . Wegen a∈C und b ∈ D, also gilt (a, b) ∈ C × D. ⇒: Siehe [16] für einen Beweis. (iv) ⊂: Sei gilt (a (a, b) ∈ (A × B)c , (a, b) ∈ / (A × B), d.h. a∈ /A oder b∈ / B. Somit ∈ / A und b ∈ / B ) oder (a ∈ / A und b ∈ B ) oder (a ∈ A und b ∈ / B ), woraus (a, b) ∈ Ac × B c insgesamt (v) Falls also oder (a, b) ∈ A, B , C (Ac oder (a, b) ∈ Ac × B × Bc) ∪ (Ac oder (a, b) ∈ A × B c × B) ∪ (A × folgt. Deshalb gilt B c ). ⊃: Analog. D die leere Menge ist, so ist die Gleichung stets erfüllt. Seien diese also im Folgenden nichtleer. ⊂: Sei ist (a, c) ∈ (A ∩ B) × (C ∩ D), d.h. a ∈ A, a ∈ B , c ∈ C (a, c) ∈ (A × C) und (a, c) ∈ (B × D), folgt. ⊃: Analog. 92 woraus und c ∈ D. Somit (a, c) ∈ (A × C) ∩ (B × D) A. Anhang Beweis zu Satz 3.3 Satz A.2. E ⊂ P(X) Für beliebiges E Durchschnitt aller P(X) Beweis. Da σ -Algebren umfassenden σ(E) = \ {A | A σ -Algebra ist σ -Algebra eine ist die von ist mit σ -Algebren über X nichtleer. T Sei S := {A | A ist σ -Algebra über X E erzeugte X, über über X gegeben als der genauer und E ⊂ P(X), σ -Algebra E ⊂ A}. ist das System aller E umfas- senden S σ -Algebra eine dass A n∈N A A ∈ {A | A σ -Algebra ist Aj ∈ A wieder eine σ -Algebren, also ∅ ∈ S. σ -Algebra Für A∈S und somit gilt X E ⊂ A} und aufgrund der Tatsache, ∈A c und deshalb A ∈ S . Analog gilt für Aj ∈ S , und A ∈ {A | A ist σ -Algebra über X und E ⊂ A} S S ist, Aj ∈ A und darum Aj ∈ S . für alle σ -Algebra j∈N und da j∈N Auÿerdem folgt für jede beliebige was die Behauptung ergibt, d.h. A∈A über c eine σ -Algebra ist, auch A auch E ⊂ A}. Es wird nun gezeigt, dass auch darstellt. Die leere Menge ist Element jeder auch Element des Durchschnitts von für alle und σ -Algebra A mit E ⊂ A bereits S ⊂ A und E ⊂ S , σ(E) = S . Beweis zu Satz 3.4 Satz A.3. A2 . Falls Sei E1 ⊂ A2 Beweis. A1 A1 E1 ⊃ A2 : ein Erzeuger der und ⊂ A2 : E2 ⊂ A1 , Sei σ -Algebra A1 dann gilt E1 ⊂ A2 , dann ist und E2 ein Erzeuger der σ -Algebra A1 = A2 . A1 ⊂ A2 . Analog. Beweis zu Satz 3.6 Satz A.4. Die Mengensysteme (i) T d = {U ⊂ Rd | U (ii) C d = {U ⊂ Rd | U ist oen in Rd }, ist abgeschlossen in (iii) I d = {(a, b] | a, b ∈ Rd , a < b}, (iv) d = {(a, ∞) | a ∈ Rd } I∞ sind Erzeuger der Borel-σ -Algebra B(Rd ), erklärt ist. 93 Rd }, wobei (a, ∞) für a ∈ Rd analog zu (3.1) A. Anhang (i) Nach Denition der Borel-σ -Algebra gilt bereits Beweis. σ(T d ) = B(Rd ). (ii) Da jede abgeschlossene Teilmenge das Komplement einer oenen Teilmenge des Rd σ(C d ) = σ(T d ) = B(Rd ). ist, folgt I d ⊂ σ(T d ) und T d ⊂ σ(I d ) zu zeigen. d T Q (a, b] = (ai , bi + k1 ) resultiert (a, b] ∈ σ(T d ) (iii) Wegen Satz 3.4 reicht es I d ⊂ σ(T d ): a, b ∈ Rd T d mit Aus a<b ⊂ σ(I d ): Sei k∈N i=1 d und deshalb I U ⊂ Rd für alle ⊂ σ(T d ). oen. Wie in Kapitel 2.1 bemerkt, lässt sich U als (a, b) ⊂ U , vgl. (3.1), mit S (a, b) = (a, c], woraus (a, b) ∈ abzählbare Vereinigung oener Mengen der Form a, b ∈ Qd und a < b darstellen. Ferner ist c∈Qd c<b σ(I d ) und somit auch U ∈ σ(I d ) und T d ⊂ σ(I d ) folgt. d ⊂ σ(Cd ) und I d ⊂ σ(I d ) zu zeigen. I∞ ∞ d S Q (ai , k] für alle a ∈ Rd und deshalb auch (a, ∞) = (iv) Wegen Satz 3.4 reicht es auch hier d ⊂ σ(I d ): I∞ Es gilt k∈N i=1 d ⊂ σ(I d ). I∞ I d d ): ⊂ σ(I∞ a, b ∈ Rd mit Aus a<b (a, b] = (a, ∞)\(b, ∞) d und darum I ⊂ (a, b] ∈ σ(I d ) resultiert für alle d ). σ(I∞ Beweis zu Satz 3.11 Satz A.5. Seien n∈N und dk ∈ N fest für k = 1, . . . , n mit d := n P dk . Dann gilt k=1 n O k B(Rd ) = B(Rd ). k=1 Beweis. ⊃: Jedes d-dimensionale halboene Rechteck (a, b] in Rd mit a, b ∈ Rd im Sinne von k k k (3.1) kann als kartesisches Produkt d -dimensionaler halboenener Rechtecke (a , b ], n Q k k = 1, . . . , n, dargestellt werden, d.h. (a, b] = (ak , bk ], wobei ak , bk ∈ Rd . Daher gilt (a, b] ∈ n N k=1 k B(Rd ) und da B(Rd ) die kleinste k=1 Rechtecke enthält, auch B(Rd ) ⊂ n N k B(Rd ). k=1 94 σ -Algebra ist, die alle halboenen A. Anhang ⊂: Sei Ak deniert als n o k 1 k−1 k+1 n Ak = Ak ∈ Rd | Rd × . . . × Rd × Ak × R d × . . . × Rd ∈ B(Rd ) für k = 1, . . . , n. Mit Satz 2.12 verallgemeinert auf mehrfache kartesische Produkte gilt 1 k−1 1 k−1 Rd × . . . × Rd k+1 × ∅ × Rd n × . . . × Rd = ∅, k+1 n Rd × . . . × Rd × (Ak )c × Rd × . . . × Rd 1 k−1 k+1 n c = Rd × . . . × Rd × Ak × R d × . . . × Rd für alle k Ak ∈ R d und R d1 × ... × R dk−1 × [ k+1 Akj × Rd n × . . . × Rd j∈N [ = 1 k−1 Rd × . . . × Rd × Akj × Rd k+1 n × . . . × Rd j∈N für alle k Akj ∈ Rd k auch A eine , j ∈ N. Weil B(Rd ) 1 k−1 {Rd × . . . × Rd k = 1, . . . , n n Y Ak = k=1 für σ -Algebra ist, kann gefolgert werden, dass σ -Algebra ist. Aufgrund Bemerkung 2.16 enthält die σ -Algebra Ak dk oenen Mengen, weshalb B(R ) für eine ⊂ × Ak × Rd alle Ak und somit k+1 × . . . × Rd | Ak ∈ B(Rd )} ⊂ B(Rd ) n k k−1 × Ak × R d gilt. Weiterhin ist n \ 1 Rd × . . . × Rd k+1 n × . . . × Rd ∈ B(Rd ) k=1 k Ak ∈ B(Rd ), k = 1, . . . , n, n N woraus direkt k B(Rd ) ⊂ B(Rd ) folgt. k=1 Beweis zu Satz 3.23 Satz A.6. Seien (X, A, µ) (i) Subtraktivität, d.h. für (ii) Monotonie, d.h. für ein Maÿraum und A1 ⊂ A2 A1 ⊂ A2 und ist Ai ∈ A, i ∈ N. Dann gelten µ(A1 ) < ∞ ist µ(A2 \A1 ) = µ(A2 )−µ(A1 ), µ(A1 ) ≤ µ(A2 ), 95 A. Anhang (iii) Ai ↑ A gilt lim µ(Ai ) = µ(A) und für Ai ↓ A mit µ(A1 ) < σ -Stetigkeit, d.h. für ∞ lim µ(Ai ) = µ(A). ebenfalls i→∞ A1 ⊂ A2 , Beweis. Sei i→∞ A1 ∪˙ (A2 \A1 ) = A2 dann gilt und aus der Additivität und Nichtnegativität des Maÿes folgt µ(A2 ) = µ(A1 ) + µ(A2 \A1 ) ≥ µ(A1 ), womit die ersten beiden Teile des Satzes bereits gezeigt sind. Sei Ai ↑ A. Dann sind die Mengen disjunkt und es gilt i S Ai = Ãj und Ã1 := A1 , Ãj = Aj \Aj−1 , j ≥ 2 S Ãj . Ferner ist A= j=1 j∈N X µ(A) = µ(Ãi ) = lim i→∞ i∈N Sei nun i∈N Ai ↓ A gerade mit µ(A1 ) < ∞. Ãi ↑ A1 \A. paarweise i X µ(Ãj ) = lim µ(Ãi ). i→∞ j=1 Dann gilt für die Folge (Ãi )i∈N mit Ãi = A1 \Ai , Mit den obigen Erkenntnissen und der Subtraktivität folgt µ(A1 ) − µ(A) = µ(A1 \ A) = lim µ(A1 \ Ai ) = µ(A1 ) − lim µ(Ai ) i→∞ i→∞ und somit die Behauptung. Beweis zu Satz 4.3 Satz A.7. (i) Seien m T C := auch Cj Cj ⊂ Rd , j = 1, . . . , m, m ∈ N konvexe Mengen, dann ist eine konvexe Menge. j=1 (ii) Seien n∈N k C k ⊂ Rd Ck, k = (i) Seien gilt dann dk ∈ N fest für nichtleer. Die Menge die Mengen Beweis. und x, y ∈ Cj x, y ∈ C für k = 1, . . . , n z= (z 1 , . . . , z n ), da C := n Q mit d := n P dk . Ferner seien k=1 C k ⊂ Rd ist genau dann konvex, wenn k=1 1, . . . , n, konvex sind. für j = 1, . . . , m θx + (1 − θ)y ∈ Cj (ii) ⇒: Seien k = 1, . . . , n mit und C und θ ∈ [0, 1]. und somit auch sofort Für alle j ∈ {1, . . . , m} θx + (1 − θ)y ∈ C . x = (x1 , . . . , xn ) und y = (y 1 , . . . , y n ), d.h. xk , y k ∈ C k θ ∈ [0, 1]. Dann ist auch z := θx + (1 − θ)y ∈ C k konvex ist, was bedeutet, dass z 96 = θxk + (1 − θ)y k mit ∈ Ck A. Anhang gilt. ⇐: Seien für xk , y k ∈ C k θ ∈ [0, 1] k gerade z für := k = 1, . . . , n und deshalb auch θxk + (1 − θ)y k ∈ Ck, x, y ∈ C . Dann gilt k = 1, . . . , n und darum z ∈ C . Beweis zu Satz 4.5 Satz A.8. dass f Seien C ⊂ Rd oen und konvex und genau dann konvex ist, wenn für alle f :C →R x, y ∈ C mit dierenzierbar. So gilt, x 6= y die Ungleichung f (x) + ∇f (x)T (y − x) ≤ f (y) erfüllt ist. Beweis. ⇒: Wegen mit x 6= y und alle f (θy + (1 − θ)x) ≤ θf (y) + (1 − θ)f (x) θ ∈ (0, 1) für alle x, y ∈ C ⊂ Rd gilt auch f (θy + (1 − θ)x) − f (x) ≤ f (y) − f (x). θ Grenzwertbildung θ&0 liefert lim θ&0 f (θy+(1−θ)x)−f (x) θ = ∇f (x)T (y − x), woraus ∇f (x)T (y − x) ≤ f (y) − f (x) resultiert. ⇐: Für alle x, y ∈ C ⊂ Rd und alle θ ∈ (0, 1) gilt f (θy + (1 − θ)x) + θ ∇f (θy + (1 − θ)x)T (x − y) ≤ f (x), (A.1) f (θy + (1 − θ)x) + (1 − θ) ∇f (θy + (1 − θ)x)T (y − x) ≤ f (y). (A.2) Multiplikation von (A.1) mit (1 − θ) und (A.2) mit θ und anschlieÿende Addition ergibt f (θy + (1 − θ)x) ≤ θf (y) + (1 − θ)f (x). 97 A. Anhang Beweis zu Satz 4.6 Satz A.9. So ist f Seien C ⊂ Rd oen und konvex und f : Rd → R 2 genau dann konvex, wenn ∇ f (x) für alle Beweis. ⇒: Sei f oen ist, gibt es ein gilt dann für alle konvex. Ferner seien θ0 ∈ R θ ∈ (0, θ0 ] mit x∈C x ∈ C ⊂ Rd x + θh ∈ C für alle zweimal dierenzierbar. positiv semidenit ist. und h ∈ Rd θ ∈ (0, θ0 ]. gegeben. Weil C Aufgrund Satz 4.5 gerade f (x + θh) − f (x) − θ∇f (x)T h ≥ 0. Mit der qualitativen Taylor-Formel 1 f (x + h) = f (x) + ∇f (x)T h + hT ∇2 f (x)h + o(khk2 ), 2 welche aus dem Satz von Taylor folgt, vgl. (4.3), gilt θ2 T 2 h ∇ f (x)h + o(kθhk2 ) ≥ 0 2 für θ & 0. Dabei steht o für die Landau-Notation. Divison durch 2 bildung liefert dann, dass ∇ f (x) positiv semidenit für alle 2 ⇐: Sei die Hessematrix ∇ f (x) für alle x ∈ C ⊂ θ2 x∈C und Grenzwertsein muss. Rd positiv semidenit. Aus Gleichung (4.3) und Satz 4.5 resultiert nun sofort die Konvexität von f. Sonstiges Betriebssystem Windows 10 Home 64-Bit, Version 1607 Prozessor Intel(R) Core(TM) i7-6500 CPU @ 2.50 GHz RAM 8 GB Matlab 9.0.0.307022 (R2016a) Tabelle A.1: Computer- und Softwareinformationen zu den numerischen Simulationen 98 Literatur Literatur [1] C. Aliprantis und K. Border. Innite Dimensional Analysis. Springer-Verlag Berlin Heidelberg, 1994. [2] W. Alt. Numerische Verfahren der konvexen, nichtglatten Optimierung. B. G. Teubner Verlag, Wiesbaden, 2004. [3] C. Audet und J. Dennis Jr. Analysis of Generalized Pattern Searches. B. SIAM Journal on Optimization, 13(3),889903, 2003. [4] S. Boyd und L. Vandenberghe. Convex Optimization. Cambridge University Press, 2004. [5] R. Byrd, M. Hribar und J. Nocedal. An Interior Point Algorithm for Large Scale Nonlinear Programming. SIAM Journal on Optimization, 9(4), 877-900, 1999. [6] M. Brokate und G. Kersting. Maÿ und Integral. Springer Basel AG, 2011. [7] R. Denk und R. Racke. Kompendium der Analysis, Band 1. Vieweg+Teubner Verlag, Wiesbaden, 2011. [8] R. Denk und R. Racke. Kompendium der Analysis, Band 2. Springer Spektrum, Wiesbaden, 2012. [9] S. Erschen, F. Duddeck und M. Zimmermann. Robust Design using classical optimization. PAMM Proc. Appl. Math. Mech., 15, 565 566, 2015. [10] C. Geiger und C. Kanzow. Numerische Verfahren zur Lösung unrestringierter Optimierungsaufgaben. Springer-Verlag Berlin Heidelberg, 1999. [11] C. Geiger und C. Kanzow. Theorie und Numerik restringierter Optimierungs- aufgaben. Springer-Verlag Berlin Heidelberg, 2002. [12] M. Gerdts. Nichtdierenzierbare Optimierung. Vorlesungsskript, unibw.de/lrt1/gerdts/lehre/nichtdiff_optimierung.pdf, [13] G. Hörmann. Grundbegrie der Topologie. Vorlesungsskript, univie.ac.at/~gue/lehre/13gbtop/GBTopSS13.pdf, [14] W. Kaballo. Einführung in die Analysis II. Heidelberg-Berlin, 1997. 99 https://www. 2007. http://www.mat. 2013. Spektrum Akademischer Verlag, Literatur [15] T. Kolda, r. Lewis und V. Torczon. A generating set direct search augmented Lagrangian algorithm for optimization with a combination of general and linear constraints. Technical Report SAND 2006-5315, Sandia National Laboratories, 2006. [16] I. Lehmann und W. Schulz. Mengen - Relationen - Funktionen. Springer Spektrum, Wiesbaden, 2016. TM [17] MathWorks. Optimization Toolbox User's Guide. com/help/pdf_doc/optim/optim_tb.pdf, https://de.mathworks. 2016. [18] D. Meintrup und S. Schäer. Stochastik - Theorie und Anwendungen. SpringerVerlag Berlin Heidelberg, 2005. [19] J. Moore. Mathematical Methods for Economic Theory 1. Springer-Verlag Berlin Heidelberg, 1999. [20] A. Prékopa. On logarithmic concave measures and functions. Acta Scientiarum Mathematicarum, 34, 335-343, 1973. [21] A. Prékopa. Logarithmic Concave Measures and Related Topics. Stochastic Programming, Academic Press, 63-82, 1980. [22] B. von Querenburg. Mengentheoretische Topologie. Springer-Verlag Berlin Heidelberg, 1973. [23] S. Volkwein. Numerische Verfahren der restringierten Optimierung. Vorlesungs- http://www.math.uni-konstanz.de/numerik/personen/volkwein/ teaching/2014WS-Opt2-Script.pdf, 2014. skript, [24] M. Zimmermann und J. Hoessle. Computing solution spaces for robust design. Int. J. Numer. Meth. Engng, 94, 290307, 2013. 100