Analysis II Vorlesung Reiner Lauterbach L(γ) = R1 kγ 0 (t)kV dt 0 Universität Hamburg, 2015 ii Inhaltsverzeichnis Einleitung iv 7 Anwendungen des Riemann-Integrals 7.1 Uneigentliche Integrale . . . . . . . . . . . . . . . . . . . . . . . . 7.2 Taylorpolynome und Taylorreihen . . . . . . . . . . . . . . . . . . 8 Differentialrechnung 8.1 Der Raum Rn als Banachraum . . . . . . . . . . . . 8.2 Kurven im Raum . . . . . . . . . . . . . . . . . . . . 8.2.1 Elementare Eigenschaften . . . . . . . . . . . 8.2.2 Integration Banachraum-wertiger Abbildungen 8.2.3 Kurvenlänge . . . . . . . . . . . . . . . . . . . 8.2.4 Transformationen . . . . . . . . . . . . . . . . 8.3 Ableitungen . . . . . . . . . . . . . . . . . . . . . . . 8.3.1 Definition der Ableitung . . . . . . . . . . . . 8.3.2 Hilberträume und Gradienten . . . . . . . . . 8.4 Mittelwertsatz und Anwendungen . . . . . . . . . . . 8.5 Höhere Ableitungen . . . . . . . . . . . . . . . . . . . 8.6 Taylorpolynome und Taylorreihen . . . . . . . . . . . 8.7 Differenzierbare Abbildungen . . . . . . . . . . . . . 8.8 Multilineare Abbildungen . . . . . . . . . . . . . . . 9 Anwendungen der Differentialrechnung 9.1 Der Fixpunktsatz von Banach . . . . . 9.2 Der Satz über implizite Funktionen . . 9.3 Extrema mit Nebenbedingungen . . . . 9.4 Parameterabhängige Integrale . . . . . 10 Banachalgebren 10.1 Algebren . . . . . . . . . . . . 10.2 Potenzreihen . . . . . . . . . . 10.3 Der Satz von Stone-Weierstraß 10.4 Fourierreihen . . . . . . . . . . . . . iii . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1 8 . . . . . . . . . . . . . . 13 14 24 24 29 34 39 41 41 51 57 59 63 70 75 . . . . 77 77 81 91 96 . . . . 103 103 105 111 117 iv 11 Differentialgleichungen 11.1 Motivation . . . . . . . . . . 11.2 Matrixexponentialfunktion . 11.3 Ein allgemeiner Existenzsatz 11.4 Randwertprobleme . . . . . 11.4.1 Klassifizierung . . . . INHALTSVERZEICHNIS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125 125 130 136 140 140 Index 142 Literaturverzeichnis 144 Einleitung Die Vorlesung Analysis II baut auf die Analysis I und auch auf die Lineare Algebra I auf. In der Vorlesung werden wir über weite Strecken den Werken von Otto Forster, Analysis II [8], von Rolf Walter, Einführung in die Analysis 2 [18], bzw. von Jürgen Pöschel, Etwas mehr Analysis [15], folgen. Letztgenanntes ist Teil einer neuen und modernen darstellung der Analysis [14, 15, 16], die vielleicht insgesamt der Vorlesung Analysis I–II am Nächsten kommt. Darüber hinaus gibt es eine ganze Reihe hervorragender Bücher zum Thema Analysis, ich möchte nur wenige nennen: [2, 3, 7, 10, 13] von denen jeweils auch Ideen und Inhalte in die Gestaltung dieser Vorlesung einfließen. Nicht direkt als Begleitlektüre, jedoch als Nachschlagewerke für später bzw. als weiterführende Bücher zur Analysis möchte ich erwähnen, jedoch explizit nicht dazu ermuntern jetzt schon einen Blick hineinzuwerfen: [6, 9, 11]. Wobei wir beim Satz über implizite Funktionen und in der Darstellung des Beweises auch Ideen aus dem zehnten Kapitel des Werkes von Jean Dieudonné, Grundzüge der Analysis, Bd1, [6] verwenden werden. Beim Beweis des Satzes von Stone-Weierstraß folgen wir der Darstellung von Walter Rudin [17]. Wir wollen uns in diesem Semester zunächst einigen Schlussfolgerungen aus dem Integralbegriff widmen, dabei auch die Taylorreihen behandeln. Den größten Teil der Vorlesung nimmt die Differentialrechnung in mehreren Veränderlichen ein. Am Ende des Semesters wollen wir uns noch mit Differentialgleichungen, einigen Anwendungen und deren Lösungstheorie befassen. Ausführliches gibt es dann dazu in einer Vorlesung, die sich speziell den Differentialgleichungen widmet. v vi INHALTSVERZEICHNIS Kapitel 7 Anwendungen des Riemann-Integrals In diesem Abschnitt wollen wir den am Ende des letzten Semesters eingeführten Integralbegriff dazu nutzen die Analysis einer Variablen zu vertiefen. Wir werden einerseits uneigentliche Integrale definieren und behandeln und andererseits werden wir für allgemeine Funktionen Reihenentwicklungen herleiten und Abschätzungen für das Restglied entwickeln. Inhalt 7.1 7.1 Uneigentliche Integrale . . . . . . . . . . . . . . . . . . 1 7.2 Taylorpolynome und Taylorreihen . . . . . . . . . . . 8 Uneigentliche Integrale Bisher hatten wir beschränkte Funktionen auf einem kompakten Intervall integriert. Wir wollen nun diese beiden Voraussetzungen der Beschränktheit und der Kompaktheit abschwächen. Die technische Realisierung dieser Abschwächung beruht auf der Forderung, dass gewisse Grenzwerte existieren. Der wesentliche Inhalt dieses Abschnittes sind die folgenden Definitionen. 1 2 KAPITEL 7. ANWENDUNGEN DES RIEMANN-INTEGRALS Definition 7.1.1 (Uneigentliches Integral – beschränktes Intervall) 1. Ist [a, b] ⊂ R kompakt, es sei f ∈ F ([c, b], R) für jedes c > a. Ist f ∈ R([c, b], R) für jedes c > a und existiert der Grenzwert Zb lim f (x) dx, c&a c so sagen wir, f ist auf [a, b] uneigentlich integrierbar und setzen Zb Zb f (x) dx = lim f (x) dx. c&a a c 2. Ist [a, b] ⊂ R kompakt, es sei f ∈ F ([a, c], R) für jedes c < b. Ist f ∈ R([a, c], R) für jedes c < b und existiert der Grenzwert Zc lim f (x) dx, c%b a so sagen wir auch, f ist auf [a, b] uneigentlich integrierbar, und setzen Zc Zb f (x) dx. f (x) dx = lim c%b a a 3. Ist [a, b] ⊂ R kompakt, sei f ∈ F ([c, d], R) für jedes Paar c, d ∈ R mit a < c < d < b. Ist f ∈ R([c, d], R) für jedes solche Paar c, d mit a < c < d < b und existiert der Grenzwert Zd lim f (x) dx c&a,d%b c so sagen wir wiederum, f ist auf [a, b] uneigentlich integrierbar und setzen Zb Zd f (x) dx = lim f (x) dx. c&a,d%b a c 7.1. UNEIGENTLICHE INTEGRALE 3 Definition 7.1.2 (Uneigentliches Integral – unbeschränktes Intervall) 1. Ist f ∈ R([a, b], R) für jedes −∞ < a < b und existiert Zb lim f (x) dx , a→−∞ a so nennen wir f im uneigentlichen Sinne auf (−∞, b] Riemann-integrierbar und setzen Zb Zb f (x) dx = lim f (x) dx. a→−∞ −∞ a 2. Entsprechend sei f ∈ R([a, b], R) für jedes b < ∞ und existiert Zb f (x) dx , lim b→∞ a so nennen wir f im uneigentlichen Sinne auf [a, ∞) Riemann-integrierbar und setzen Z∞ Zb f (x) dx = lim f (x) dx. b→∞ a a Ganz entsprechend lassen sich die beiden letzten Fälle miteinander und mit dem jeweilig anderen Fall aus den beiden Fällen der Definition 7.1.1 kombinieren und wir vereinbaren die jeweiligen Definitionen und sprechen vom uneigentlichen Integral. Beispiel 7.1.3 (Uneigentlich integrierbare Funktionen) 1. Wir betrachten für α ∈ R die Funktion f (x) = xα für x ∈ (0, 1]. 4 KAPITEL 7. ANWENDUNGEN DES RIEMANN-INTEGRALS Für jedes c > 0 ist f ∈ F ([c, 1], R) und für α 6= −1 ist Z1 c Damit ist Z1 1 1 α+1 x dx = x . α+1 c α xα dx = 1 (1 − cα+1 ). α+1 c Der Grenzwert lim cα+1 c→0 existiert, falls 1 + α > 0, d. h. α > −1. 2. Wir betrachten für α ∈ R die Funktion f (x) = xα für x ∈ [1, ∞). Für jedes c > 1 ist f ∈ F ([1, c], R) und für α 6= −1 ist Zc 1 Damit ist Zc c 1 α+1 x dx = x . α+1 1 α xα dx = 1 (cα+1 − 1). α+1 1 Der Grenzwert lim cα+1 c→∞ existiert, falls 1 + α < 0, d. h. α < −1. Aufgabe 7.1.4 (Der Fall α = −1) Man kläre die Existenz des uneigentlichen Integrales in den beiden Fällen des Beispiels 7.1.3 für α = −1. Gibt es einen Wert von α ∈ R, so dass das uneigentliche Integral Z∞ xα dx 0 existiert? Begründen Sie Ihre Antwort! 7.1. UNEIGENTLICHE INTEGRALE Beispiel 7.1.5 (e−x ) Das uneigentliche Integral Z∞ 5 e−x dx 0 existiert, denn für c > 0 gilt Zc c e−x dx = −e−x 0 = 1 − e−c 0 und lim e−c = 0 c→∞ existiert. Definition 7.1.6 (Γ-Funktion) Wir definieren die sogenannte Γ-Funktion oder Gamma-Funktion für x > 0 durch das folgende uneigentliche Integral. Z∞ Γ(x) = tx−1 e−t dt. 0 Satz 7.1.7 (Funktionalgleichung der Γ-Funktion) 1. Für x > 0 existiert das uneigentliche Integral in der Definition von Γ(x). 2. Für n ∈ N gilt Γ(n + 1) = n!. 3. Für alle x > 0 gilt die Funktionalgleichung Γ(x + 1) = xΓ(x). Beweis. Wir beginnen mit einer natürlichen Zahl n ∈ N und erhalten Z∞ Γ(n + 1) = tn e−t dt. 0 Dieses Integral ist nun nur bei ∞ uneigentlich und wir müssen die Existenz und 6 KAPITEL 7. ANWENDUNGEN DES RIEMANN-INTEGRALS den Wert des Grenzwertes Zc lim c→∞ tn e−t dt 0 untersuchen. Partielle Integration, vollständige Induktion und Beispiel 7.1.5 liefern Zc n −t t e dt = −tn e−t |c0 Zc +n 0 tn−1 e−t dt 0 = −tn e−t |c0 − ntn−1 e−t |c0 + n(n − 1) Zc tn−2 e−t dt 0 .. . . = .. = − n−1 X n! tn−j e−t |c0 + n! (n − j)! j=0 Zc e−t dt. 0 Als Grenzwert ergibt sich dann Zc lim c→∞ tn e−t dt = n!. 0 Damit ist die zweite Aussage gezeigt. Wir kommen zur ersten Aussage. Da x > 0 und damit x − 1 > −1 ist, existiert für c > 0 das Integral Zc tx−1 e−t dt 0 zumindest im uneigentliche Sinne. Wir betrachten eine Folge {cn }n∈N mit limn→∞ cn = ∞ und erhalten für 1 ≤ cn < cm und x < k ∈ N Zcm 0≤ t x−1 −t cn e Zcm dt ≤ tk−1 e−t dt. cn Dann existiert zu ε > 0 ein N ∈ N mit n, m > N impliziert Zcm cn tx−1 e−t dt ≤ ε, 7.1. UNEIGENTLICHE INTEGRALE 7 da das entsprechende uneigentliche Integral für k ∈ N nach dem ersten Schritt existiert. Wir kommen zum dritten Punkt. Sei x > 0 fest. Für Γ(x + 1) ergibt sich Zc Γ(x + 1) = lim c→∞ tx e−t dt 0 = lim [−tx e−t ]c0 + lim Zc c→∞ c→∞ xtx−1 e−t dt 0 = x −c lim (−c e ) + xΓ(x). c→∞ Satz 7.1.8 (Integralkriterium) Es sei f : [1, ∞) → R eine nichtnegative monoton fallende Funktion. Dann existiert das uneigentliche Integral Z∞ f (x) dx 1 genau dann wenn die Reihe ∞ X f (k) k=0 konvergiert. Beweis. Wegen der Monotonie ist f auf jedem Intervall [n, n+1] integrierbar vgl. Satz 6.3.2. Wir nehmen zunächst an, dass das uneigentliche Intergral existiert, und betrachten die Teilsummenfolge (beachte für x ∈ [k, k +1] gilt f (k) ≥ f (x) ≥ f (k + 1)): Zn Z∞ n X f (k) ≤ f (1) + f (x) dx ≤ f (1) + f (x) dx. k=1 1 1 Also konvergiert die Reihe. Für die Umkehrung betrachten wir eine Folge {cn }n∈N . Dann ist für 1 ≤ cn < cm Zcm dcm e f (x) dx ≤ cn X f (k). k=bcn c Dies wird wegen der Konvergenz der Reihe für n, m hinreichend groß, kleiner als jede vorgegebene Schranke. 8 KAPITEL 7. ANWENDUNGEN DES RIEMANN-INTEGRALS 7.2 Taylorpolynome und Taylorreihen Wir haben bereits einige Funktionen kennengelernt, die eine natürliche Darstellung als Reihe besaßen. Wir erinnern an die Exponentialfunktion, die trigonometrischen Funktionen und insbesondere auch an die Darstellung des Arcustangens durch eine Reihe, was uns die wunderschöne Darstellung von π4 am Ende der Vorlesung Analysis I möglich machte. Reihendarstellungen von Funktionen sind sehr alt, bereits Euler stellte viele Funktionen als Reihen dar. Oft wurden Manipulationen mit Funktionen durch Bearbeitung der Reihen durchgeführt. Speziell für Funktionen auf C sind Reihendarstellungen sehr natürlich, wir werden uns noch ausführlich damit beschäftigen. Wir beginnen mit einem wichtigen Darstellungssatz. Satz 7.2.1 (Satz von Taylor1 ) Es sei [a, b] ⊂ R ein kompaktes Intervall und f eine auf [a, b] definierte, (n + 1).-mal stetig differenzierbare Funktion. Dann gilt für alle x ∈ [a, b] die Darstellung f (x) = f (a) + f 00 (a) f (n) (a) f 0 (a) (x − a) + (x − a)2 + · · · + (x − a)n + Rn+1 (x), 1! 2! n! mit 1 Rn+1 (x) = n! Zx (x − t)n f (n+1) (t) dt. a Beweis. Beweis durch vollständige Induktion. Der Induktionsanfang ist die Formel Zx f (x) = f (a) + f 0 (t) dt, a die wir ja schon gut kennen. Wir nehmen also an, dass die obige Darstellungsformel für n gezeigt sei, dass f (n+2) stetig differenzierbar sei. Das Restglied hat die oben angegebene Gestalt 1 Rn+1 (x) = n! Zx (x − t)n f (n+1) (t) dt. a 1 Brook Taylor (18.8.1685–29.12.1731) stammte aus reicher Familie und studierte in Cambridge. Ab 1712 war er Mitglied der Royal Society. In seinem Hauptwerk untersuchte er die schwingende Saite und stellte zum ersten Mal die nach ihm benannten Reihen vor. 7.2. TAYLORPOLYNOME UND TAYLORREIHEN 9 Durch partielle Integration formen wir dies um: Zx Rn+1 (x) = 1 (x − t)n f (n+1) (t) dt n! a x 1 (x − t)n+1 f (n+1) (t)a + = − (n + 1)! Zx 1 (x − t)n+1 f n+2 (t) dt (n + 1)! a 1 = f (n+1) (a)(x − a)n+1 + Rn+2 (x). (n + 1)! Definition 7.2.2 (Taylorpolynom) Für (n + 1)-mal stetig differenzierbares f heißt f (a) + f (n) (a) f 0 (a) (x − a) + · · · + (x − a)n 1! n! das Taylorpolynom n-ten Grades von f im Entwicklungspunkt a. Korollar 7.2.3 (Charakterisierung von Polynomen) Ist f : [a, b] → R (n + 1)-mal stetig differenzierbar und ist f (n+1) (x) = 0 für alle x ∈ [a, b], so ist f ein Polynom vom Grad höchstens n. Beweis. Folgt sofort aus der obigen Darstellung mit Rn+1 (x) = 0 für alle x. Andere Darstellungen des Restgliedes kann man nun mit dem Mittelwertsatz der Integralrechnung leicht angeben. Satz 7.2.4 (Lagrange2 – Form des Restgliedes) Es seien [a, b], f wie im Satz 7.2.1. Dann gibt es ein ξ ∈ [a, b] mit Rn+1 (x) = 2 f (n+1) (ξ) (x − a)n+1 . (n + 1)! Joseph Louis Lagrange (25.1.1736–10.4.1813) war Mathematiker, Physiker und Astronom. Er arbeitete zunächst über Variationsprobleme. Auf Einladung von Friedrich II verbrachte er 20 Jahre in Berlin und verfasste hier unter anderem sein Werk Mécanique analytique. Neben seinen Beiträgen zur Analysis (nach ihm sind die eben eingeführte Restgliedformel und der sogenannte Multiplikator, den wir auch noch kennenlernen werden, benannt) stammen auch algebraische Erkenntnisse von ihm. 10 KAPITEL 7. ANWENDUNGEN DES RIEMANN-INTEGRALS Beweis. Der Mittelwertsatz der Integralrechnung ergibt die Existenz von ξ ∈ [a, x] mit 1 Rn+1 (x) = n! Zx (x − t)n f (n+1) (t) dx = f (n+1) (ξ) a Zx 1 (x − t)n dt. n! a Dies ergibt −f (n+1) (ξ) x 1 1 (x − t)n+1 a = f (n+1) (ξ) (x − a)n+1 . (n + 1)! (n + 1)! Korollar 7.2.5 (Andere Form des Restgliedes) Sei [a, b] → R n-mal stetig differenzierbar und c ∈ [a, b]. Dann hat f für x ∈ [a, b] eine Darstellung f (x) = n X f (k) (c) k=0 k! (x − c)k + η(x)(x − c)n , mit lim η(x) = 0. x→c Beweis. Das Lagrange-Restglied wird durch n−1 (k) X f (c) f (n) (ξ) n (x − c) = f (x) − (x − c)k n! k! k=0 = f (n) (c) f (n) (c) − f (n) (ξ) (x − c)n − (x − c)n n! n! Setze f (n) (ξ) − f (n) (c) , n! wobei die Abhängigkeit von x durch die Abhängigkeit von ξ entsteht, welches wiederum von c abhängt. Da ξ zwischen c und x liegt konvergiert mit x → c auch ξ → c. Dann impliziert die Stetigkeit der n-ten Ableitung f (n) , dass η(x) = lim η(x) = 0 x→c ist. 7.2. TAYLORPOLYNOME UND TAYLORREIHEN 11 Definition 7.2.6 (Taylorreihe) Ist f auf [c, d] stetig und auf (c, d) unendlich oft stetig differenzierbar, ist a ∈ (c, d), so nennt man ∞ X f (k) (a) T(f,a) (x) = k=0 k! (x − a)k die Taylorreihe von f im Punkt a. Es stellt sich die Frage, ob diese Reihe konvergiert, für welche x ∈ [c, d] die Reihe konvergiert und inwieweit Tf,a (x) = f (x) gilt. Die Antworten auf diese Fragen sind unterschiedlich schwierig. Satz 7.2.7 (Konvergenz der Taylorreihe) 1. Die Taylorreihe konvergiert genau dann gegen f (x), wenn lim Rn (x) = 0. n→∞ 2. Es gibt Funktionen, so dass T(f,a) (x) eine konvergente Reihe ist, jedoch nicht gegen f (x) konvergiert. Beweis. (1) Folgt direkt aus der Darstellung. (2) Wir betrachten die Funktion 0 1 f (x) = e− x 2 für für x≤0 . x>0 1 Da limx→0 e− x2 = 0 ist, ist f im Nullpunkt stetig. In allen Punkten ist f als Zusammensetzung stetiger Funktionen stetig, ja sogar differenzierbar. Im Anschluss an Satz 7.2.7 stellt sich allgemein die Frage, wann komplexe Reihen der Form ∞ X aj (z − z0 )j j=0 eine auf C (oder auf einer entsprechend angepassten Teilmenge K ⊂ C) (komplex-)differenzierbare Funktion darstellen. Wir werden dies in allgemeinerem Kontext im Kapitel 10 über Banachalgebren untersuchen. 12 KAPITEL 7. ANWENDUNGEN DES RIEMANN-INTEGRALS Kapitel 8 Differentialrechnung Zu Beginn wollen wir den Raum Rn metrisieren und normieren. Dies führt zum Begriff des Banachraumes. Wir werden die Differentialrechnung in diesem Kontext einführen, vgl. Pöschel [15], Walter [18], Dieudonné [6]. Es zeigt sich, dass diese Struktur uns erlaubt, Beweise ohne Referenz auf Darstellungen der zu untersuchenden Abbildungen bezüglich fester Basen durchzuführen. Dieses Kapitel ist Grundlage der Theorie partieller Differentialgleichungen, ebenso die Grundlage der Differentialgeometrie und der komplexen Analysis. Insofern ist dies ein zentrales Thema der Analysis. Viele unserer Betrachtungen übertragen sich auf die Differentialrechnung im Cn und auf komplexe Banachräume, aus Zeitgründen betrachten wir hier nur die Räume Rn und reelle Banachräume. Inhalt Rn als Banachraum 8.1 Der Raum . . . . . . . . . . . . . 14 8.2 Kurven im Raum . . . . . . . . . . . . . . . . . . . . . 24 8.3 8.2.1 Elementare Eigenschaften . . . . . . . . . . . . . . . . 24 8.2.2 Integration Banachraum-wertiger Abbildungen . . . . 29 8.2.3 Kurvenlänge . . . . . . . . . . . . . . . . . . . . . . . 34 8.2.4 Transformationen . . . . . . . . . . . . . . . . . . . . . 39 Ableitungen . . . . . . . . . . . . . . . . . . . . . . . . . 41 8.3.1 Definition der Ableitung . . . . . . . . . . . . . . . . . 41 8.3.2 Hilberträume und Gradienten . . . . . . . . . . . . . . 51 8.4 Mittelwertsatz und Anwendungen . . . . . . . . . . . 57 8.5 Höhere Ableitungen . . . . . . . . . . . . . . . . . . . . 59 8.6 Taylorpolynome und Taylorreihen . . . . . . . . . . . 63 8.7 Differenzierbare Abbildungen . . . . . . . . . . . . . . 70 8.8 Multilineare Abbildungen . . . . . . . . . . . . . . . . 75 13 14 8.1 KAPITEL 8. DIFFERENTIALRECHNUNG Der Raum Rn als Banachraum Definition 8.1.1 (Rn ) Die Menge aller geordneten n-Tupel reeller Zahlen x 1 x2 x = .. xj ∈ R . xn wird als Rn bezeichnet, ganz entsprechend definieren wir Cn und Kn schreiben wir, wenn wir beide Fälle gleichzeitig oder alternativ meinen. Die Räume Kn sind Ihnen aus der Linearen Algebra vertraut. Es sind dies endlich dimensionale Vektorräume. Als solche besitzen sie eine Basis, die Standardeinheitsvektoren wollen wir mit e1 , . . . , en bezeichnen. Der Vektor x entspricht dann der Summe n X x= xi e i . i=1 Wir werden später oft eine Schreibweise benötigen, die wir schon heute festlegen wollen: Ist x ∈ Kn , so steht x̂i für den Vektor x1 .. . x x̂i ∈ Kn−1 : x̂i = i−1 . xi+1 . .. xn Die Abbildung x 7→ x̂i ist eine lineare Abbildung, sogar ein Projektor auf den Unterraum, der von den Basisvektoren e1 , . . . , ei−1 , ei+1 , . . . en aufgespannt wird. Aus der Sicht der Analysis ist neben der Struktur des linearen Raumes eine metrische Struktur von Bedeutung. Auf den Räumen Kn kann man auf verschiedene Weise Metriken definieren, einige Möglichkeiten dafür zeigt die folgende Definition. Definition 8.1.2 (Metrik in Kn ) Sind x, y ∈ Kn , so setzen wir für p ∈ [1, ∞) v u n uX p dp (x, y) = t |xi − yi |p i=1 8.1. DER RAUM und RN ALS BANACHRAUM 15 n o d∞ (x, y) = max |xi − yi | i = 1, . . . , n . Lemma 8.1.3 (Metriken in Kn ) Für p ∈ [1, ∞] ist dp : Kn × Kn → R+ eine Metrik. Beweis. Wir beweisen dies nur für die beiden wichtigsten Fälle p = 2, p = ∞ vollständig. Für die anderen Fälle verweisen wir auf die Literatur, z. B. Alt [1]. Wir müssen die Eigenschaften einer Metrik (M1), (M2) und (M3) nachweisen. Wir beginnen mit (M1). Offenkundig ist dp (x, y) ≥ 0 für alle p ∈ [0, ∞] und dp (x, x) = 0 ist ebenso offensichtlich. Falls dp (x, y) = 0, so ist für alle i = 1, . . . , n auch |xi − yi | = 0 und deshalb x = y. Um (M2) zu zeigen beachten wir, dass alle Terme symmetrisch in x, y sind und daher gilt dp (x, y) = dp (y, x). Schließlich müssen wir noch die Dreiecksungleichung beweisen. Für p = ∞ ist dies einfach, seien x, y, z ∈ Kn gegeben, so findet man o n d∞ (x, z) = max |xi − zi | i = 1, . . . , n n o ≤ max |xi − yi | + |yi − zi | i = 1 . . . , n o o n n ≤ max |xi − yi | i = 1 . . . , n + max |yi − zi | i = 1 . . . , n = d∞ (x, y) + d∞ (y, z) Den Fall p = 2 wollen wir nach den folgenden Überlegungen noch ausführen. In R oder C wird die Metrik durch den Betrag induziert. Hier, im höherdimensionalen Raum, gibt es eine verwandte Struktur. Definition 8.1.4 (Norm) Sei V ein linearer Raum über K. Eine Abbildung von k · kV : V → R+ heißt Norm, wenn sie folgende Eigenschaften besitzt: (N1) kxkV = 0 ⇐⇒ x = 0; (N2) kλxkV = |λ| kxkV für λ ∈ K, x ∈ V ; (N3) kx + ykV ≤ kxkV + kykV für alle x, y ∈ V (Dreiecksungleichung). Das Paar (V, k · kV ) nennen wir normierten Raum über K. 16 KAPITEL 8. DIFFERENTIALRECHNUNG Auch dieser Begriff ist Ihnen aus der Vorlesung Lineare Algebra bekannt. Die Dreiecksungleichung wird oft in der Form ∀x, y ∈ V : |kxkV − kyk|V ≤ kx − ykV (8.1) benötigt, diese kennen Sie sicher auch bereits. Beispiel 8.1.5 (Normen) 1. Auf Rn finden wir für p ≥ 1 v u n uX p kxkp = t |xi |p i=1 bzw. n o kxk∞ = max |xi | i = 1, . . . , n . Damit erhalten wir normierte Räume (Rn , k · kp ) für p ∈ [1, ∞]. 2. Auf dem Vektorraum C([a, b]; R) definiert man eine Norm durch n o kf k∞ = max |f (x)| x ∈ [a, b] . Der Paar (C([a, b]; R), k · k∞ ) ist ein normierter Raum. 3. Auf R([a, b], R) aus Satz 6.2.20 finden wir mit k[f ]kR([a,b],R) = Zb [|f |](x)dx. a eine Norm. Der Raum (R([a, b], R), k · kR([a,b],R) ) ist ein normierter Raum. Natürlich müssen wir in jedem Fall (N1–3) überprüfen. Wir machen dies in den Übungen. Satz 8.1.6 (Metrik und Norm) Ist V ein linearer Raum, k · k eine Norm auf V , so wird durch d(x, y) = kx − yk eine Metrik auf V × V definiert. 8.1. DER RAUM RN ALS BANACHRAUM 17 Beweis. Natürlich ist d ≥ 0 und d(x, y) = 0 genau dann, wenn x = y. Wegen (N2) ist k − xk = kxk und damit d(x, y) = d(y, x). Die letzte Eigenschaft einer Metrik schließt man leicht mittels d(x, z) = kx − zk = kx − y + y − zk ≤ kx − yk + ky − zk = d(x, y) + d(y, z). Damit können wir von stetigen Abbildungen zwischen normierten Räumen sprechen. Speziell wollen wir uns für die Stetigkeit linearer Abbildungen interessieren. Satz 8.1.7 (Stetigkeit linearer Abbildungen) Es seien (Vj , k · kVj ) für j = 1, 2 normierte Räume, L : V1 → V2 sei linear. Dann ist L : (V1 , dV1 ) → (V2 , dV2 ) stetig, genau dann wenn n o sup kLxkV2 kxkV1 = 1 < ∞. Die Menge L(V1 , V2 ) der stetigen linearen Abbildungen (V1 , k · kV1 ) → (V2 , k · kV2 ) bildet in natürlicher Weise einen linearen Raum, mit n o kLkL(V1 ,V2 ) = sup kLxkV2 kxkV1 = 1 wird dieser zum normierten linearen Raum. Beweis. Ist L : V1 → V2 bezüglich der angegebenen Metriken stetig, so ist L insbesondere bei x = 0 stetig. Dann gibt es zu ε > 0 ein δ > 0, so dass kxkV1 < δ impliziert, dass kLxkV2 < ε. (Beachte (d(x, 0) = kxk.) Dann ist für x mit kxkV1 = 1 2δ x ∈ BδV1 (0), der δ-Kugel in V1 bzgl. dV1 um 0 ∈ V1 . Also ist δ kL( x)kV2 < ε 2 und damit 2ε < ∞. δ Zur Gegenrichtung bemerken wir, dass die Voraussetzung die Stetigkeit bei x = 0 impliziert. Daraus folgt aber leicht die Stetigkeit in jedem Punkt x0 ∈ V1 . Dass die stetigen linearen Abbildungen einen linearen Raum bilden ist sofort klar. Wir müssen noch (N 1) − (N 3) nachprüfen. Dabei ist die einzige wirklich ernsthafte Fragestellung, ob (N3) gilt. Sind L1 , L2 zwei stetige lineare Abbildungen, so gilt für kxkV1 = 1 kL(x)kV2 < k(L1 + L2 )xkV2 ≤ kL1 (x)kV2 + kL2 (x)kV2 wegen der Linearität und der Dreiecksungleichung in V2 . Nehmen wir nun das Supremum über alle x von der V1 -Norm 1, so erhalten wir kL1 + L2 kL(V1 ;V2 ) ≤ kL1 kL(V1 ;V2 ) + kL2 kL(V1 ;V2 ) . 18 KAPITEL 8. DIFFERENTIALRECHNUNG In der linearen Algebra wird auch der Zusammenhang zwischen inneren Produkten und gewissen Normen hergestellt. Definition 8.1.8 (Skalarprodukt) Auf einem linearen Raum V über R nennen wir eine Abbildung V × V → R : (x, y) 7→ hx, yiV mit den Eigenschaften (SP1) hx, xiV ≥ 0 und hx, xiV = 0 genau dann, wenn x = 0; (SP2) hx + y, ziV = hx, ziV + hy, ziV ; (SP3) hx, yiV = hy, xiV ; (SP4) hλx, yiV = λhx, yiV ein Skalarprodukt oder auch ein inneres Produkt auf V . Im Fall K = C hat man eine ähnliche Struktur, indem man (SP3) durch hx, yiV = hy, xiV ersetzt. Beispiel 8.1.9 (Normen und Skalarprodukte) 1. Auf den Räumen Rn findet man die Abbildung * n + n X X (x, y) 7→ hx, yiRn = xi e i , y i ei i=1 i=1 Rn = n X xi y i . i=1 Die Eigenschaften eines Skalarproduktes Pn weist man leicht nach. Entsprechend definiert man hz, wiCn = i=1 zi wi . 2. Es sei [a, b] ⊂ R kompakt. Auf dem Raum C([a, b]; R) findet man ein Skalarprodukt durch Zb (f, g) 7→ f (x)g(x) dx. a Auf einem Raum mit Skalarprodukt erhält man auf einfache Weise eine Norm. Satz 8.1.10 (Cauchy-Schwarzsche-Ungleichung) Ist h·, ·iV ein Skalarprodukt auf einem linearen Raum V über p kxk = hx, xiV R, so ist 8.1. DER RAUM RN ALS BANACHRAUM 19 eine Norm auf V und es gilt die Cauchy-Schwarzsche Ungleichung (CSU) |hx, yiV | ≤ kxkkyk. Beweis. Wir müssen die Eigenschaften (N1–3) nachprüfen. (N1) folgt sofort aus (SP1). Für (N2) setzen wir p p kλxk = hλx, λxiV = λ2 hx, xiV = |λ|kxk. Es bleibt die sogenannte Dreiecksungleichung (N3). Wir betrachten für λ ∈ R kx + λyk2 = hx + λy, x + λyiV = kxk2 + 2λhx, yi + λ2 kyk2 . Ist y 6= 0, so ist dies eine quadratische Funktion in λ mit positivem Koeffizienten bei λ2 . Die Funktion besitzt ein eindeutiges Minimum bei λ=− hx, yiV . kyk2 Es gilt dann 2 hx, yiV hx, yiV hx, yiV y = x− y, x − y . 0 ≤ x − kyk2 kyk2 kyk2 V Durch Auswerten dieses Ausdrucks ergibt sich 0 ≤ kxk2 − 2 hx, yi2V hx, yi2V hx, yi2V 2 + = kxk − . kyk2 kyk2 kyk2 Damit hat man hx, yi2V ≤ kxk2 kyk2 oder durch Wurzelziehen |hx, yiV | ≤ kxkkyk. Damit haben wir die Cauchy-Schwarzsche1 Ungleichung. Um (N3) zu beweisen betrachten wir nun kx + yk2 = hx + y, x + yiV = kxk2 + 2hx, yiV + kyk2 ≤ kxk2 + 2kxkkyk + kyk2 = (kxk + kyk)2 . Damit ist (Wurzelziehen!) kx + yk ≤ kxk + kyk. Also ist k · k eine Norm auf V . 1 Hermann Amandus Schwarz (25.1.1843–30.11.1921) studierte zunächst Chemie und wechselte unter dem Einfluss von Karl Weierstraß zur Mathematik. Nach Promotion (1864), Habilitation (1867) wurde er schließlich Professor für Mathematik an der ETH Zürich, schließlich wurde er 1892 Nachfolger von Weierstraß an der Berliner Universität. Seine Hauptarbeitsgebiete waren konforme Abbildungen, Minimalflächen und Arbeiten zur Potentialtheorie, Funktionentheorie (Schwarz’sches Spiegelungsprinzip) und Variationsrechnung. 20 KAPITEL 8. DIFFERENTIALRECHNUNG Eine wichtige Abschätzung für die verschiedenen Normen auf dem das folgende Lemma. Rn gibt uns Lemma 8.1.11 (Vergleich zweier Normen) Für x ∈ Kn gilt √ kxk∞ ≤ kxk2 ≤ nkxk∞ . Beweis. kxk∞ = max{|xi | | i = 1, . . . , n} p = max{ |xi |2 | i = 1, . . . , n} v u n uX ≤t |xi |2 i=1 p n max{|xi |2 | i = 1, . . . , n} √ = nkxk∞ . ≤ Korollar 8.1.12 (2-Norm, Vollständigkeit) k · k2 ist eine Norm auf Kn und d2 eine Metrik auf Metrik wird Kn zum vollständigen metrischen Raum. Kn × Kn. Mit dieser Beweis. Alle Eigenschaften bis auf die Vollständigkeit sind geklärt. Angenommen {xm }m∈N ist eine Cauchy-Folge bezüglich d2 , so bedeutet dies, dass zu jedem ε > 0 ein N ∈ N existiert, so dass für j, k > N gilt kxj − xk k2 ≤ ε. Dann gilt für jede Koordinate i = 1, . . . , n , dass die Folge {xi,m }m∈N eine CauchyFolge ist, denn für j, k > N gilt nach Lemma 8.1.11, dass |xi,j − xi,k | ≤ ε, und damit konvergiert diese Folge gegen einen Wert xi,0 . Damit konvergiert die Folge xm gegen x0 , also in Kurzform x1,0 limm→∞ x1,m x2,0 limm→∞ x2,m x0 = .. = . .. . . xn.0 limm→∞ xn,m Es ist (mit Lemma 8.1.11) leicht nachzuprüfen, dass die Konvergenz im Sinne der Metrik d2 vorliegt. 8.1. DER RAUM RN ALS BANACHRAUM 21 Wir wollen im Folgenden den metrischen Raum (Rn , d2 ) betrachten, sollte eine andere Metrik gemeint sein, wollen wir das explizit angeben. Die folgenden Überlegungen zeigen, dass ein Wechsel der Norm im Regelfall keine Veränderung der Begriffe bringt, wir formulieren dies explizit für die Kompaktheit. Definition 8.1.13 (Äquivalenz von Normen) Zwei Normen k · ka , k · kb auf einem linearen Raum V heißen äquivalent, wenn es Zahlen 0 < m < M gibt, so dass für alle x ∈ V gilt mkxka ≤ kxkb ≤ M kxka . Lemma 8.1.14 (Äquivalenz von Normen) 1. Äquivalenz von Normen ist eine Äquivalenzrelation. 2. Je zwei Normen auf dem Kn sind äquivalent. Beweis. Die erste Aussage ist (fast) trivial, die zweite beweisen wir in den Übungen. Definition 8.1.15 (Banachraum) Sei K = R oder K = C. 1. Ist (V, k · kV ) ein normierter linearer Raum, der bezüglich der Metrik dV (x, y) = kx − ykV vollständig ist, so nennen wir (V, k · kV ) einen K-Banachraum2. 2. Ist (V, k · kV ) ein Banachraum und gibt es ein Skalarprodukt h·, ·iV auf V mit kvk2V = hv, viV für alle v ∈ V , so nennen wir den Raum (V, h·, ·iV ) einen Hilbertraum3 . 3 Stefan Banach (30.3.1892–31.8.1945), polnischer Mathematiker. Er war der Begründer der Theorie linearer, normierter Räume und ihren linearen Abbildungen. Seine Arbeiten sind die Grundlage der modernen Funktionalanalysis. Er und seine Schüler zeigten viele Anwendungen der Funktionalanalysis auf. 3 David Hilbert (23.1.1862–14.2.1943) war einer der bedeutendsten deutschen Mathematiker und einer der bedeutendsten Mathematiker seiner Zeit. Er befasste sich mit vielen Aspekten der Mathematik und stellte diese auf neue Grundlagen. Er hat mit einem Vortrag im Jahr 1900 in Paris, wo er 10 Probleme (aus einer späteren Liste von 23 Problemen) vorstellte, von denen er glaubte, dass sie die Mathematik des zwanzigsten Jahrhunderts prägen würden und auch über seine Schüler großen Einfluss auf die Entwicklung der Mathematik ausgeübt. 22 KAPITEL 8. DIFFERENTIALRECHNUNG Beispiel 8.1.16 (Beispiele von Banachräumen) 1. (Rn , k · k), wobei k · k eine beliebige Norm auf Banachraum. 2. Entsprechend ist (Cn , k · k) ein Rn ist, ist ein R- C-Banachraum. 3. Sei K ein kompakter metrischer Raum, dann ist C(K; K) mit n o kf kC(K;K) = max |f (x)| x ∈ K ein K-Banachraum. 4. Sei K ein kompakter metrischer Raum, dann ist C(K; Kn ) mit der Norm n o kF kC(K;Kn ) = max kF (x)k2 x ∈ K ein K-Banachraum. 5. Wir haben gesehen, dass (L(V1 ; V2 ), k · kL(V1 ;V2 ) ) für normierte Räume (V, j, k · kVj ) j = 1, 2 ein normierter Raum ist. Ist (V2 , k · kV2 ) ein Banachraum, so ist auch (L(V1 ; V2 ), k · kL(V1 ;V2 ) ) ein Banachraum. Wir haben in der Analysis I (Definition 4.1.11) den Begriff der Kompaktheit in metrischen Räumen kennen gelernt und auch kompakte Mengen in R mit dem Satz von Heine-Borel (Satz 4.1.14) charakterisiert, wobei im Beweis der Satz von Bolzano-Weierstraß (Satz 2.5.12) eine große Rolle spielte. Wir beweisen nun eine Version des Satzes von Bolzano-Weierstraß für den Rn und auch eine entsprechende Charakterisierung kompakter Mengen. Definition 8.1.17 (Beschränktheit) 1. Eine Menge A in einem normierten linearen Raum (V, k · k) heißt beschränkt, wenn es ein K > 0 gibt, so dass für alle a ∈ A gilt kak ≤ K. 2. Eine Folge {x N heißt n m }m∈ o beschränkt, wenn die zugrunde liegende Menge X = xm m ∈ N beschränkt ist. Bemerkung 8.1.18 (Beschränktheit im Rn ) 1. Eine Menge A ⊂ Kn ist genau dann beschränkt, wenn es eine Kugel BK (0) bezüglich der Metrik d2 gibt mit A ⊂ BK (0). 2. Der Begriff der Beschränktheit im Norm ab. Kn hängt nicht von der Wahl der 8.1. DER RAUM RN ALS BANACHRAUM 23 Bemerkung 8.1.19 (Kompaktheit und Einheitskugel) Die abgeschlossene Einheitskugel ist in einem nicht-endlich dimensionalen Banachraum beschränkt, aber nicht kompakt. Insofern gelten die nachfolgenden Aussage nicht für unendlich dimensionale Banachräume. Satz 8.1.20 (Bolzano-Weierstraß) Eine beschränkte Folge in Kn besitzt eine konvergente Teilfolge. Beweis. Diesen Beweis erhält man direkt aus dem Beweis von Satz 2.5.12. Satz 8.1.21 (Heine-Borel) Eine Menge in Kn ist genau dann kompakt, wenn sie beschränkt und abgeschlossen ist. Beweis. Der Beweis von Satz 4.1.14 kann wörtlich übertragen werden. Bemerkung 8.1.22 (Kompaktheit, Beschränktheit, Norm) Der Begriff der Kompaktheit im Kn hängt nicht von der Norm ab, denn 1. die offenen Mengen bezüglich verschiedener Normen sind die gleichen, 2. wie bereits bemerkt hängt der Begriff der Beschränktheit nicht von der Wahl der Norm ab. Ein weiterer wichtiger Begriff ist der Begriff des Zusammenhangs. Wir wollen diesen nun definieren und dann ein paar einfache Konsequenzen herleiten. Definition 8.1.23 (Zusammenhang) Es sei (X, dX ) ein metrischer Raum. Eine Menge U ⊂ X heißt zusammenhängend, wenn es keine nichtleeren und offenen Mengen V, W ⊂ X gibt, so dass V ∩U 6= ∅ = 6 W ∩U , (V ∩U )∩(W ∩U ) = ∅ und (U ∩V )∪(U ∩W ) = U ist. Satz 8.1.24 (Zwischenwertsatz) Ist (X, dX ) ein metrischer Raum und U ⊂ X zusammenhängend, f : U → R stetig, x, y ∈ U . Dann gibt es zu jedem w ∈ [f (x), f (y)] bzw. w ∈ [f (y), f (x)] ein u ∈ U mit f (u) = w. 24 KAPITEL 8. DIFFERENTIALRECHNUNG Beweis. Sei w wie angegeben, setze n V = z∈U und o f (z) > w n o W = z ∈ U f (z) < w . V, W sind beide im metrischen Raum (U, dX ) offen (Satz 4.2.6), V, W sind disjunkt und beide sind nichtleer (x ∈ V und y ∈ W oder umgekehrt). Gibt es kein u mit f (u) = w, so ist U = (U ∩ V ) ∪ (U ∩ W ) im Widerspruch zur Voraussetzung, dass U zusammenhängend ist. Aufgabe 8.1.25 (Riemann Integral und Nullstelle) Es sei [a, b] = I ⊂ R ein kompaktes Intervall, ferner sei V = C(I; R), k·kV wie oben, so dass (V, k · kV ) ein R-Banachraum ist. Ω ⊂ V sei zusammenhängend Rb Rb und es seien f, g ∈ Ω mit f (x) dx g(x) dx < 0, dann gibt es ein h ∈ Ω a a und ein x0 ∈ I mit h(x0 ) = 0. 8.2 Kurven im Raum In diesem Abschnitt interessieren wir uns für Abbildungen meiner R → V , wobei ein Banachraum ist. 8.2.1 R → Rn oder allge- Elementare Eigenschaften Definition 8.2.1.1 (Kurve) Es sei (V, k · kV ) ein normierter linearer Raum über R. Es sei I = [a, b] ein kompaktes Intervall in R und γ : I → V stetig. Dann heißt das Paar (I, γ) eine Kurve in V . Für die Menge der Kurven auf einem gegebenem Intervall schreiben wir C(I; V ). Ist V endlich dimensional, so kann man eine Kurve als Vektor von Funktionen γ1 (x) γ(x) = ... γn (x) auffassen. In diesem Fall ist die Definition der Differenzierbarkeit besonders einfach. 8.2. KURVEN IM RAUM 25 Definition 8.2.1.2 (Kurve, differenzierbar) Es sei I wie in der vorherigen Definition. 1. Eine Kurve γ : I → Rn heißt differenzierbar im Punkt t0 ∈ (a, b), wenn alle Funktionen γ1 , . . . , γn im Punkt t0 differenzierbar sind. 2. Die Kurve heißt stetig differenzierbar, wenn alle Funktionen γ1 , . . . , γn stetig differenzierbar sind, d. h. für i = 1, . . . , n ist γi ∈ C(I; R) und γi0 : (a, b) → R ist stetig auf (a, b) und stetig fortsetzbar auf I = [a, b]. Beispiel 8.2.1.3 (Geraden und andere Kurven) 1. Das einfachste Beispiel ist das einer Geraden in Rn . Dazu sei ein Punkt a ∈ Rn gegeben und ein Vektor v ∈ Rn . Dann ist g(t) = a + t · v : R → Rn eine stetig differenzierbare Kurve, die geometrisch eine Gerade darstellt. 2. Sei r > 0 und k(t) = r cos(t) r sin(t) eine stetig differenzierbare Kurve. Sie hat folgende Eigenschaften: k(2π) = k(0) und kk(t)k = r für alle r ∈ R+ . Damit definiert diese Kurve eine Kreislinie im R2 mit Radius r um den Ursprung. 3. Nun definieren wir eine Schraubenlinie im R3 durch r cos(t) s : R → R3 : t 7→ r sin(t) . rt Die Projektion auf die ersten beiden Komponenten x1 3 2 p : R → R : x 7→ x2 bildet die Linie auf einen Kreis mit Radius r ab, die Abbildung s ist injektiv, die Abbildung p ◦ s ist nicht injektiv. 26 KAPITEL 8. DIFFERENTIALRECHNUNG 4. Es sei V = C([a, b]; R) und (V, k · k∞ ) der Banachraum der stetigen Funktionen auf [a, b]. Wir betrachten die Kurve γ : [a, b] → V : t 7→ γ(t) ∈ C([a, b]; R), wobei wir setzen γ(t)(x) = etx . Man überzeuge sich, dass die Abbildung t → γ(t) stetig ist. Definition 8.2.1.4 (Tangentialvektor einer glatten Kurve) Es sei γ : I → Rn eine stetig differenzierbare Kurve. Dann heißt der Vektor γ10 (t) v(t) = ... γn0 (t) der Tangentialvektor an γ im Punkt γ(t). Bemerkung 8.2.1.5 (Tangentialvektor und Differenzenquotient) Wie in der Differentialrechnung auf R kann man den Tangentialvektor als Grenzwert eines Differenzenquotienten auffassen. Formal sieht er genauso aus wie in der Analysis I für Funktionen R → R: 1 (f (t + h) − f (t)) . h→0 h v(t) = lim Wir sehen an dieser Betrachtung, dass diese Definition auch in allgemeineren Situationen verwendet werden kann. Definition 8.2.1.6 (Differenzierbare Kurve im Banachraum) Es sei (V, k · kV ) ein reeller Banachraum, I ⊂ R ein offenes Intervall und γ : I → V eine Kurve, t0 ∈ I. Gibt es eine lineare Abbildung v : R → V mit 1 lim kγ(t0 + h) − γ(t0 ) − v(h)kV = 0, h→0 h so nennen wir die Kurve im Punkt t0 differenzierbar. 8.2. KURVEN IM RAUM 27 Bemerkung 8.2.1.7 (Lineare Abbildungen) Man beachte, dass man jeden C-Banachraum durch Vergessen der komplexen Struktur auch als R-Vektorraum auffassen kann. Der Raum der linearen Abbildungen n o L(R; V ) = v : R → V v ist linear ist dann als linearer Raum isomorph zu V . Damit wird L(R; V ) in natürlicher Weise zum Banachraum. Man beachte, dass jede lineare Abbildung v : R → V stetig ist. Damit trägt L(R; V ) auch die Struktur eines Banachraumes aus Beispiel 8.1.16 (v). Beide Sichtweisen führen auf isomorphe Banachräume. Wir identifizieren die lineare Abbildung v ∈ L(R; V ) mit dem Element v = v(1). Definition 8.2.1.8 (Stetig differenzierbare Kurve im Banachraum) Es sei γ : I → V eine Kurve, wobei I ⊂ R ein abgeschlossenes Intervall [a, b] und (V, k · kV ) ein Banachraum. γ heißt stetig differenzierbar, wenn γ in jedem Punkt t ∈ (a, b) differenzierbar ist und die Abbildung I → L(R; V ) : t 7→ γ 0 (t) stetig auf (a, b) und stetig fortsetzbar auf [a, b] ist. Wir schreiben für die Menge der stetig differenzierbaren Kurven auf I C 1 (I; V ). Lemma 8.2.1.9 (Eindeutigkeit der Ableitung) Ist γ im Punkt t0 differenzierbar, so ist die Ableitung eindeutig bestimmt. Beweis. Angenommen v1 , v2 seien zwei Ableitungen, so gilt 1 lim kγ(t0 + h) − γ(t0 ) − hvi kV = 0. h→0 h Dann ist 1 lim kγ(t0 + h) − γ(t0 ) − hv1 − γ(t0 + h) + γ(t0 ) + hv2 kV = 0. h→0 h Also ist 1 lim khv1 − hv2 kV = lim kv1 − v2 kV = kv1 − v2 kV = 0. h→0 h h→0 28 KAPITEL 8. DIFFERENTIALRECHNUNG Abbildung 8.1: Approximation des Tangentialvektors durch Differentialquotienten Satz 8.2.1.10 (Kettenregel) Es seien I ein Intervall, (V, k · kV ) ein Banachraum γ ∈ C 1 (I, V ) eine Kurve und ϕ : [c, d] → [a, b] stetig und auf (c, d) differenzierbar, so ist γ ◦ ϕ ∈ C 1 ([c, d]; V ) und (γ ◦ ϕ)0 (s0 )(h) = γ 0 (ϕ(s0 ))ϕ0 (s0 )(h). Beweis. Der Beweis folgt im Grunde dem Beweis von Satz 5.1.8, wir geben trotzdem eine kurze Form des Beweises. Wir betrachten wir den Grenzwert für h → 0 von 1 γ ◦ ϕ(s0 + h) − γ ◦ ϕ(s0 ) − γ 0 (t0 )ϕ0 (s0 )h R(s0 , h) = V |h| und zeigen, dass dieser Null ist, dann ist die lineare Abbildung R → V : h 7→ γ 0 (t0 )ϕ0 (s0 )h mit t0 = ϕ(s0 ) die Ableitung von γ ◦ ϕ(s0 ). Wir führen folgende Schreibweisen ein: 1 γ ◦ ϕ(s0 + h) − γ ◦ ϕ(s0 ) − γ 0 (t0 ) (ϕ(s0 + h) − ϕ(s0 )) kV R1 (s0 , h) = |h| und R2 (s0 , h) = 1 γ 0 (t0 ) (ϕ(s0 + h) − ϕ(s0 )) − γ 0 (t0 )ϕ0 (s0 )hkV . |h| Die Dreiecksungleichung ergibt R(s0 , h) ≤ R1 (s0 , h) + R2 (s0 , h). Für den Grenzwert erhalten wir für R2 wegen der Differenzierbarkeit von ϕ: kγ 0 (t0 )kV |ϕ(s0 + h) − ϕ(s0 ) − ϕ0 (s0 )h| = 0 h→0 |h| 0 ≤ lim R2 (s0 , h) ≤ lim h→0 8.2. KURVEN IM RAUM 29 und für R1 mit k = ϕ(s0 + h) − ϕ(s0 ) folgt: |k| 1 kγ(t0 + k) − γ(t0 ) − γ 0 (t0 )kkV = 0, h→0 |h| |k| 0 ≤ lim R1 (s0 , h) = lim h→0 mit der Definition der Ableitung, denn der erste Quotient ist beschränkt, mit h → 0 gilt auch k → 0. Also gilt limh→0 R(s0 , h) = 0. Dies war zu zeigen. 8.2.2 Integration Banachraum-wertiger Abbildungen Entsprechend dem Riemann-Integral für reellwertige Funktionen definieren wir ein Integral für Abbildungen von R in einen Banachraum V . Da die meisten Schritte formal denen aus der eindimensionalen Theorie entsprechen werden wir uns kurz fassen, wichtig ist eine Aussage, die dem Hauptsatz der Differential- und Integralrechnung entspricht. Auf dem Weg dorthin haben wir im eindimensionalen Fall auch den Mittelwertsatz der Differentialrechnung Korollar 5.3.7, der im neuen Kontext etwas schwerer zu beweisen ist als der eindimensionale Fall. Die Ableitung γ 0 : I → V einer stetig differenzierbaren Kurve ist durch die oben genannte Identifizierung also wieder eine Kurve. Insofern können wir die Frage stellen, ob es zu einer stetigen Abbildung γ : I → V eine Stammfunktion, also ob es eine stetig differenzierbare Kurve gibt, deren Ableitung gerade γ ist. Es sei I = [a, b] ein Intervall in R und γ ∈ C(I; V ) eine stetige Kurve in V . Wir wollen dafür ein Integral definieren. Definition 8.2.2.1 (Riemannsumme für Kurven) Es sei I = [a, b] ein Intervall, (V, k · kV ) ein Banachraum und γ ∈ C(I; V ). Wir betrachten eine Zerlegung Z = {ζ0 < · · · < ζn } des Intervalls I und setzen für ein ξj ∈ (ζj , ζj+1 ) für j ∈ {0, . . . , n − 1} R(γ, Z, ξ) = n−1 X (ζj+1 − ζj )γ(ξj ) j=0 und nennen dies eine Riemann-Summe von γ zur Zerlegung Z und der Auswahl ξ = (ξ0 , . . . , ξn−1 )T ∈ V n . Definition 8.2.2.2 (Integral einer Kurve) Existiert der Grenzwert lim R(γ, Z, ξ) ∆(Z)→0 für jede Auswahl von Punkten ξj ∈ (ζj , ζj+1 ) j = 0, . . . , |Z|, so nennen wir 30 KAPITEL 8. DIFFERENTIALRECHNUNG die Kurve γ : I → V integrierbar und schreiben Zb γ(t) dt = lim R(γ, Zξ). ∆(Z)→0 a Dann gilt der Satz, dass jede Kurve integrierbar ist. Satz 8.2.2.3 (Integrierbarkeit von Kurven) Jede Kurve γ ∈ C(I; V ) auf einem Intervall I = [a, b] mit Werten in einem Banachraum V ist integrierbar. Beweis. Zu zeigen ist, dass zu jedem ε > 0 ein δ > 0 existiert, so dass ∆(Z1 ), ∆(Z2 ) < δ impliziert, dass kR(γ, Z1 ) − R(γ, Z2 )kV < ε ist, unabhängig von der Wahl der ξj ∈ (ζj , ζj+1 , j = 0, . . . , n − 1. Sei also ε > 0 gegeben. Da γ : I → V stetig ist, ist die Kurve auch gleichmäßig stetig (Satz 4.3.9), d. h. es gibt eine Zahl δ > 0, so dass |t1 − t2 | < δ impliziert, dass kγ(t1 ) − ε ist. Mit dieser Wahl von δ > 0, wählen wir Zerlegungen Z1,2 , so γ(t2 )kV < 2(b−a) dass ∆(Zj ) < δ, für j = 1, 2. Seien Z1 = {a = η0 < · · · < ηn = b} und Z2 = {a = µ0 < · · · < µm = b}. Wir wählen eine Auswahl σ durchσj ∈ (ηj , ηj+1 ), j = 0, . . . , n − 1 und eine Auswahl τ durchτk ∈ (µk , µk+1 ), k = 0, . . . , m − 1. Wir schreiben R1 = R(γ, Z1 , σ) = n−1 X (ηj+1 − ηj )γ(σj ) j=0 und R2 = R(γ, Z2 , τ ) = m−1 X (µk+1 − µk )γ(τk ). k=0 Sei Z = {a = ζ0 < · · · < zN } eine gemeinsame Verfeinerung von Z1 und Z2 und sei ξ eine Auswahl mit ξ` ∈ (ζ` , ζ`+1 ) für ` = 0, . . . , N − 1. Dann ist ∆(Z) < δ. Ferner seien j(`) das eindeutig bestimmte j, so dass (ζ` , ζ`+1 ) ⊂ (ηj , ηj+1 ) und 8.2. KURVEN IM RAUM 31 k(`) das eindeutig bestimmte k, so dass (ζ` , ζ`+1 ) ⊂ (µk , µk+1 ) kR1 − R2 kV ≤ kR1 − R(γ, Z)k + kR(γ, Z) − R2 kV ≤ ≤ N −1 X (ζ`+1 − ζ` )kγ(ξ` ) − γ(σj(`) )kV + `=0 N −1 X (ζ`+1 − ζ` )kγ(ξ` ) − γ(τk(`) )kV `=0 (ζ`+1 − ζ` ) `=0 = N −1 X ε (b − a) N −1 X ε + 2(b − a) N −1 X (ζ`+1 − ζ` ) `=0 ε 2(b − a) (ζ`+1 − ζ` ) `=0 = ε. Sei {Zk }k∈N eine Folge von Zerlegungen von [a, b] mit limk→∞ ∆(Zk ) = 0, so bilden die zugehörigen Riemann-Summen eine Cauchyfolge und der Grenzwert existiert, da (V, k · k) vollständig ist. Unsere Rechnung zeigt, dass der Grenzwert unabhängig von der gewählten Folge ist. Entsprechend der Konstruktion des Riemann-Integrales findet man einfache Konsequenzen, die wir nun als Lemma formulieren wollen, die sich aber zum großen Teil direkt aus der Definition beweisen lassen. Lemma 8.2.2.4 (Einfache Eigenschaften des Integrals von Kurven) 1. Für jedes a < t < b das Integral einer Kurve γ über [a, b] gleich der Summe der Integrale über [a, t] und [t, b] ist, also Zb Zt γ(s)ds = a Zb γ(s)ds + γ(s)ds. t a 2. Es gilt b Z Zb n o γ(s) ds ≤ kγ(s)kV ds ≤ sup kγ(s)kV s ∈ [a, b] (b − a). a V a Beweis. Die erste Eigenschaft ist offensichtlich, wir kommen gleich zur zweiten Eigenschaft. Sei ε > 0 gegeben und δ > 0 so gewählt, dass für Zerlegungen Z mit ∆(Z) < δ und jede Auswahl ξ jede Riemann-Summe von γ zu einer Zerlegung gilt b Z γ(s) ds − R(γ, Z, ξ) < ε. a V 32 KAPITEL 8. DIFFERENTIALRECHNUNG Dann betrachten wir b b Z Z γ(s) ds ≤ γ(s) ds − R(γ, Z) + kR(γ, Zk V a V a ≤ε+ V n−1 X (ζj+1 − ζj )kγ(ξj )kV j=0 n o ≤ ε + sup kγ(s)kV s ∈ [a, b] (b − a). Die mittlere Zeile liefert (nach Übergang zum Grenzwert, der existiert, weil s 7→ kγ(s)kV stetig und damit integrierbar ist) die erste Abschätzung, die untere Zeile die zweite Abschätzung. Damit ist das Lemma gezeigt. Definition 8.2.2.5 (Stammfunktion einer Kurve) Eine Kurve β : [a, b] → V heißt Stammfunktion der Kurve γ : [a, b] → V , falls β ∈ C 1 ([a, b]; V ) ist und β 0 (t) = γ(t) für alle a < t < b. Satz 8.2.2.6 (Existenz einer Stammfunktion) Die Funktion Zt β(t) = γ(s)ds a ist eine Stammfunktionen von γ. Beweis. Wir betrachten den Differenzenquotienten t+h Z 1 1 (β(t + h) − β(t) − γ(t)h) = γ(s) ds − γ(t)h . h h t Dies folgt sofort aus der ersten Aussage von Lemma 8.2.2.4. Sei ε > 0 gegeben, δ > 0 so gewählt, dass |t − t0 | < δ impliziert kγ(t) − γ(t0 )kV < ε. Ist nun |h| < δ, dann ist die rechte Seite (für h > 0) durch t+h t+h Z Z Zt+h 1 1 1 εh γ(s) ds − γ(t)h = (γ(s) − γ(t))ds ≤ kγ(s) − γ(t)kV ds < =ε h h h h t abzuschätzen. V t V t 8.2. KURVEN IM RAUM 33 Satz 8.2.2.7 (Konstanzbedingung) 1. Es sei (V, k · kV ) ein Banachraum, I = [a, b] ein abgeschlossenes Intervall und γ ∈ C 1 (I, V ) eine Kurve mit γ 0 (t) = 0 für alle t ∈ (a, b). Dann ist γ(a) = γ(b). 2. Sind βj ∈ C 1 (I; V ) für j = 1, 2 zwei Stammfunktionen von γ ∈ C(I; V ), dann unterscheiden sich β1 und β2 um eine Konstante in V . Beweis. 1. Sei oBdA a = 0, b = 1 und γ(0) = 0 (durch Verschieben und einer Skalierung ist dies immer zu erreichen, z. B. γ̃(t) = γ(a + t(b − a)) − γ(a)). Sei ε > 0 gegeben. Wir betrachten die Menge n o K = r ∈ [0, 1] ∀s∈[0,r] : kγ(s)kV ≤ εs . Dann ist 0 ∈nK, also istK 6= ∅.oIst K 6= [0, 1], so ist die Menge [0, 1]\K 6= ∅. / K . Ist kγ(x)kV > εx, so gibt es wegen der Sei x = inf z ∈ [0, 1] z ∈ Stetigkeit von kγ(x)kV ein x0 < x mit kγ(x0 )kV > εx > εx0 . Also ist x ∈ K und x < 1. Dann ist γ 0 (x) = 0. Also ist 1 lim kγ(x + h) − γ(x)k = 0 h→0 h und es gibt ein h0 > 0 mit 0 < h < h0 impliziert 1 kγ(x + h) − γ(x)k < ε. h Dann ist aber für 0 < h < h0 kγ(x + h)kV < kγ(x)kV + εh ≤ εx + εh = ε(x + h). n o Also ist x 6= inf z ∈ [0, 1] z ∈ / K . Damit ist K = [0, 1] und γ(0) = γ(1). 2. Sind βj j = 1, 2 Stammfunktionen, so gilt βj0 = γ und (β1 − β2 )0 (t) = 0 für alle t ∈ (a, b). Dann ist (β1 − β2 ) konstant und damit unterscheiden sich beide Funktionen um eine Konstante. Damit folgt der Hauptsatz der Differential- und Integralrechnung in der nachfolgenden Version. Satz 8.2.2.8 (Hauptsatz für differenzierbare Banachraum-wertige Abbildungen) Sei I ⊂ R ein Intervall und t, t0 ∈ I. 34 KAPITEL 8. DIFFERENTIALRECHNUNG 1. Für γ ∈ C(I; V ) und für eine Stammfunktion β ∈ C 1 (I; V ) von γ gilt Zt β(t) − β(t0 ) = γ(s) ds. t0 2. Insbesondere ist für γ ∈ C 1 (I; V ) Zt γ(t) − γ(t0 ) = γ 0 (s) ds. t0 Korollar 8.2.1 (Wachstumsschranken für C 1 -Abbildungen) Ist γ ∈ C 1 (I; V ), dann ist für t, t0 ∈ I kγ(t)−γ(t0 )kV ≤ Zt0 n o kγ 0 (s)kV ds ≤ sup kγ 0 (s)kV s ∈ [t, t0 ] oder [t0 , t] |t−t0 |. t Beweis. Dies folgt sofort aus dem Hauptsatz (Satz 8.2.2.8) und dem Satz von den einfachen Eigenschaften des Integrales (Satz 8.2.2.4). 8.2.3 Kurvenlänge Es sei I = [a, b] ein Intervall in R und Z eine Zerlegung des Intervalls. Wir wollen diese nutzen um eine Approximation einer Kurve zu definieren. Definition 8.2.3.1 (Polygonzug) Es sei (V, k · kV ) ein Banachraum und γ : [a, b] → V eine Kurve und Z = {ζ0 < · · · < ζm } eine Zerlegung des Intervalls. Wir definieren x − ζi γ(ζi ) + (γ(ζi+1 ) − γ(ζi )), für x ∈ (ζi , ζi+1 ) pZ (x) = ζi+1 − ζi γ(x), für x ∈ Z. pZ heißt der Polygonzug zur Zerlegung Z. Die Länge eines Polygonzuges ist die addierte Länge der einzelnen Geradenstücke. Definition 8.2.3.2 (Länge eines Polygonzuges) 8.2. KURVEN IM RAUM 35 Abbildung 8.2: Approximation einer Kurve durch einen Polygonzug Die Länge des Polygonzuges p ist gegeben durch L(pZ ) = m−1 X kγ(ζj+1 ) − γ(ζj )kV . j=0 Definition 8.2.3.3 (rektifizierbar, Länge einer Kurve) Gegeben sei eine Kurve γ : [a, b] → V , wobei (V, k · kV ) ein Banachraum sei. Ist n o L(γ) = sup L(pZ ) Z ist Zerlegung von [a, b] < ∞, so nennt man die Kurve rektifizierbar. L(γ) heißt dann die Länge der Kurve. Bemerkung 8.2.3.4 (Länge eines Polygonzuges als Integral) Man beachte, dass der Polygonzug einer Kurve zu einer gegebenen Zerlegung auf den Zerlegungsintervallen differenzierbar ist und die Ableitung durch den Differenzenquotienten zu den Zerlegungspunkten gegeben ist. Betrachtet man also Zb k(pZ )0 (x)kdx a als Integral einer Treppenfunktion, so erhält man genau die Länge L(pZ ). Betrachtet man eine Verfeinerung Z0 der Zerlegung Z so gilt offensichtlich L(pZ0 ) ≥ L(pZ ), d. h. auch die Integrale der Treppenfunktionen werden durch Verfeinerung der 36 KAPITEL 8. DIFFERENTIALRECHNUNG Zerlegungen monoton steigend. Daher ist die Kurve genau dann rektifizierbar, wenn es für die Integrale dieser Treppenfunktionen eine ober Schranke gibt. Da dies der Fall ist, wenn es eine obere Schranke für die möglichen Differenzenquotienten gibt, ist zu erwarten, dass stetig differenzierbare Kurven rektifizierbar sind. Definition 8.2.3.5 (Lipschitz stetig) Die Kurve γ : I → V , V Banachraum heißt Lipschitz stetig, falls es eine Konstante M > 0 gibt, so dass für alle t1 , t2 ∈ I gilt kγ(t2 ) − γ(t1 )kV ≤ M |t1 − t2 |. Lemma 8.2.3.6 (Lipschitzstetigkeit differenzierbarer Kurven) Ist γ : [a, b] → V eine differenzierbare Kurve mit kγ 0 (t)kV ≤ M für alle t ∈ (a, b), dann ist für alle t, t0 ∈ [a, b] kγ(t) − γ(t0 )kV ≤ M |t − t0 |. Beweis. Folgt sofort aus dem Korollar über Wachstumsschranken differenzierbarer Abbildungen (Korollar 8.2.1). Bevor wir zum zentralen Satz bezüglich der Rektifizierbarkeit von Kurven kommen, führen wir noch einen Begriff ein und zeigen eine wichtige Aussage, die uns beim Beweis der zentralen Aussage helfen wird. Bemerkung 8.2.3.7 (Rektifizierbarkeit von Teilkurven) Die Rektifizierbarkeit einer Kurve γ ∈ C([a, b]; V ) impliziert für jedes t ∈ [a, b] die Rektifizierbarkeit der Kurve γt = γ|[a,t] . Definition 8.2.3.8 (Wegelängenfunktion) Zu einer rektifizierbaren Kurve und zu t ∈ [a, b] schreiben wir Lt (γ) = L(γ|[a,t] ) für die Länge der Einschränkung der Kurve γ auf das Teilintervall [0, t]. Wir bezeichnen Lt (γ) als die Wegelängenfunktion. Aufgabe 8.2.3.9 (Stetigkeit der Wegelängenfunktion) Zeigen Sie: Die Wegelängenfunktion einer rektifizierbaren Kurve ist stetig. 8.2. KURVEN IM RAUM 37 Lemma 8.2.3.10 (Differenzierbarkeit der Wegelängenfunktion für glatte Kurven) Ist γ ∈ C 1 (I; V ), so ist die Abbildung t 7→ Lt (γ) differenzierbar, die Ableitung an der Stelle t ergibt sich zu kγ 0 (t)kV . Beweis. Wir beginnen mit einer einfachen Beobachtung – für a ≤ t1 < t2 ≤ b gilt Zt2 t1 t2 (8.2) kγ(t2 ) − γ(t1 )kV ≤ L (γ) − L (γ) ≤ kγ 0 (s)kV ds t1 – und wollen diese beweisen. Wir approximieren γ|[t1 ,t2 ] durch einen Polygonzug pZ (t1 , t2 ) der γ(t1 ) mit γ(t2 ) verbindet. Dann ist offensichtlich kγ(t2 ) − γ(t1 )kV ≤ L(pZ (t1 , t2 )) ≤ Lt2 (γ) − Lt1 (γ). Für jeden Abschnitt eines Polygonzuges der Form x − ζi γ(ζi ) + (γ(ζi+1 ) − γ(ζi )) ζi+1 − ζi gilt, dass die Länge nach oben durch das Integral ζi+1 Z kγ 0 (s)kV ds ζi abzuschätzen ist, durch Aneinanderfügen mehrerer solcher Abschnitte ergibt sich, dass die obige Abschätzung (8.2) gilt. Wir müssen den Quotienten 1 t+h (L (γ) − Lt (γ) h für h → 0 untersuchen. Wir haben Zt+h γ(t + h) − γ(t) = γ 0 (s) ds. t Damit erhalten wir für den genannten Quotienten eine Abschätzung nach oben und unten: Zt+h 1 1 t+h 1 t kγ(t + h) − γ(t)kV ≤ |L (γ) − L (γ)| ≤ kγ 0 (s)kV ds. |h| h |h| t Durch Grenzübergang und der Differenzierbarkeit der Funktionen deren Differenzenquotienten auf der linken und rechten Seite stehen, ergibt sich, dass der Quotient in der Mitte gegen kγ 0 (t)kV konvergiert und damit ist kγ 0 (t)kV k die Ableitung der Wegelängenfunktion im Punkt t. 38 KAPITEL 8. DIFFERENTIALRECHNUNG Satz 8.2.3.11 (Kriterium für Rektifizierbarkeit) Sei (V, h·, ·iV ) ein Banachraum. 1. Ist γ : I → V Lipschitz stetig, so ist die Kurve rektifizierbar. 2. Ist γ : [a, b] → V stetig differenzierbar, so ist die Kurve γ rektifizierbar und Zb L(γ) = kγ 0 (x)kV dx. a Beweis. Im ersten Fall sei Z eine beliebige Zerlegung von [a, b], dann ist L(pZ ) = m−1 X kγ(ζj+1 ) − γ(ζj )kV ≤ j=0 m−1 X M |ζj+1 − ζj | = M (b − a). j=0 Also ist das Supremum über alle Zerlegungen höchstens M (b − a). Die zweite Aussage beweisen wir wie folgt. Da γ stetig differenzierbar ist, ist die Abbildung [a, b] → V : t 7→ γ 0 (t) stetig, das Bild γ 0 ([a, b]) ist kompakt, daher beschränkt, und es existiert eine Zahl M > 0 mit kγ 0 (t)kV < M, t ∈ [a, b]. Dann ist γ Lipschitz stetig mit Konstante M und damit rektifizierbar. Es bleibt noch zu zeigen, dass die Länge der Kurve durch das angegebene Integral gegeben ist. Da die Ableitung der Wegelängenfunktion durch kγ 0 (t)kV gegeben ist, folgt die Darstellung der Funktion unmittelbar. Bemerkung 8.2.3.12 (Kurvenlänge und Norm) Die Länge einer Kurve hängt von der Wahl der Norm ab, die Rektifizierbarkeit nicht, in dem Sinne, dass für zwei äquivalente Normen k · k1 , k · k2 eine Kurve γ genau dann bzgl. k · k1 rektifizierbar ist, wenn sie bzgl. k · k2 rektifizierbar ist. Als Anwendung betrachten wir die Länge des Kreisbogens. Satz 8.2.3.13 (Kreisbogen) Es sei r > 0 γ : [0, 2π] → R : t 7→ 2 r cos(t) r sin(t) der Kreisbogen mit Radius r im (R2 , k · k2 ). Dann ist L(γ) = 2πr. 8.2. KURVEN IM RAUM 39 Beweis. Es ist γ stetig differenzierbar, also ist γ rektifizierbar und es gilt Z2π L(γ) = Z2π q kγ 0 (s)k2 ds = r (cos2 (t) + sin2 (t)) dt = 2πr. 0 0 Es stellt sich die Frage, ob diese Länge ein Charakteristikum der Punktmenge im Raum V ist oder von der gewählten Kurve abhängt. Dieser Frage gehen wir im nächsten Abschnitt nach. Davor noch zwei Begriffe. Definition 8.2.3.14 (Spur) Wir unterscheiden die Kurve γ und ihr Bild, d. h. die Punktmenge n o γ(t) t ∈ [a, b] in V , letzteres bezeichnen wir als die Spur der Kurve. 8.2.4 Transformationen Wir wollen das Verhalten einer Kurve bzw. des Tangentialvektors unter sogenannten Parametertransformationen untersuchen. Wir betrachten dabei folgende grundlegende Situation: Es sei γ : [a, b] → V eine Kurve, ϕ : [c, d] → [a, b] eine stetige, bijektive Abbildung. Dann ist natürlich γ ◦ ϕ : [c, d] → V eine Kurve. Definition 8.2.4.1 (Parametertransformation) Wir sagen die Kurve γ ◦ϕ geht durch die Parametertransformation ϕ aus der Kurve γ hervor. Sind die Abbildungen ϕ und ϕ−1 beide stetig differenzierbar, so sprechen wir von einer C 1 -Parametertransformation. Lemma 8.2.4.2 (Parametertransformation) Ist ϕ eine C 1 -Parametertransformation, so ist ϕ0 (t) 6= 0 für alle t ∈ [c, d]. Beweis. Es gilt ϕ ◦ ϕ−1 = 1l auf [a, b], wobei 1l für die Abbildung 1l(x) = x steht. Dann ist nach der Kettenregel 1 = (ϕ ◦ ϕ−1 )0 (t) = ϕ0 (ϕ−1 (t))(ϕ−1 )0 (t). Also ist sowohl ϕ0 wie auch (ϕ−1 )0 nirgends Null. Daher hat ϕ0 ein konstantes Vorzeichen auf [c, d]. 40 KAPITEL 8. DIFFERENTIALRECHNUNG Definition 8.2.4.3 (Parametertransformation und Orientierung) Die C 1 -Parametertransformation heißt orientierungserhaltend, wenn ϕ0 > 0 ist, im anderen Fall nennt man sie orientierungsumkehrend. Wir betrachten zunächst das Verhalten der Tangentialvektoren unter Parametertransformationen. Ist γ : [a, b] → V eine Kurve, ϕ eine C 1 -Parametertransformation, ϕ : [c, d] → [a, b] bijektiv, so ist (γ ◦ ϕ)0 (t) = γ 0 (ϕ)ϕ0 (t). Daran sieht man, dass die Richtung der Tangentialvektoren unter C 1 -Parametertransformationen erhalten bleibt. Satz 8.2.4.4 (Invarianz der Länge) Ist γ eine stetig differenzierbare Kurve, ϕ eine C 1 -Parametertransformation, so ist L(γ) = L(γ ◦ ϕ). Beweis. Dies folgt sofort aus der Substitutionsregel: Zd L(γ ◦ ϕ) = k(γ ◦ ϕ)0 (s)kV ds c Zd = kγ 0 (ϕ(s))ϕ0 (s)kV ds c Zd = kγ 0 (ϕ(s))kV |ϕ0 (s)| ds c Zd =± kγ 0 (ϕ(s))kV ϕ0 (s) ds c ϕ(d) Z =± kγ 0 (t)kV dt ϕ(c) Zb = kγ 0 (t)kV dt a Definition 8.2.4.5 (Äquivalenz von Kurven) Wir nennen zwei Kurven γ1,2 ∈ C(I1,2 ; V ) äquivalent, wenn es eine Parame- 8.3. ABLEITUNGEN 41 tertransformation φ : I1 → I2 gibt mit γ1 = γ2 ◦ φ. Lemma 8.2.4.6 (Äquivalenzrelation und Kurven) Äquivalenz von Kurven ist eine Äquivalenzrelation auf der Menge der Paare (I, γ). Definition 8.2.4.7 (Weg) Eine Äquivalenzklasse von Kurven bezüglich der eben definierten Relation heißt Weg. Diese Begriffsbildung rechtfertigt den Begriff der Wegelängenfunktion. 8.3 Ableitungen 8.3.1 Definition der Ableitung Wir wollen in diesem Abschnitt den Begriff der Ableitung einer auf einer offenen Teilmenge eines Banachraumes definierten, K-wertigen Funktion einführen und gleichzeitig den Begriff der partiellen Ableitung für Funktionen, die auf Teilmengen eines Banachraumes V definiert sind. Dies ist etwas komplizierter als der Begriff der Ableitung für Funktionen einer einzigen reellen oder komplexen Variablen. Funktionen f : V → R treten bei der Beschreibung von Vorgängen in der Natur, Technik und Wissenschaft in mannigfacher Weise auf. Dabei ist man oft an Extremalstellen interessiert, die man wie bisher mit Ableitungen charakterisiert. Daher ist der nun zu definierende Begriff zentral für die Anwendungen der Mathematik in anderen Fächern. Wir wollen wegen dieser Wichtigkeit einige Beispiele von solchen Funktionen aus verschiedenen Bereichen angeben. Beispiel 8.3.1.1 (Extremalprobleme in mehreren Veränderlichen) 1. (Meteorologie) Eine Abbildung T : R3 → R, die jedem Punkt der Atmosphäre die Temperatur an diesem Punkt zuordnet. Gleiches gilt für Druck p, Luftfeuchtigkeit etc. Weitere Fragen könnten Isotherme sein, wie sehen diese aus? 2. (Geographie) Die Abbildung, die jedem Punkt auf der Landkarte (R2 ) die Höhe über NN zuordnet. 3. (Chemische Industrie) Die Abbildung T : R3 → R, die jedem Punkt in einem mit einem reagierenden Gemisch gefüllten Tank die Temperatur zuordnet. Die Kenntnis dieser Funktion ist für die Sicherheit chemischer Anlagen von extrem hoher Wichtigkeit, obwohl man diese Funktion im 42 KAPITEL 8. DIFFERENTIALRECHNUNG Regelfall nicht messen kann. Typischerweise misst man Temperaturen nur am Rand des Tanks oder an wenigen ausgewählten Punkten. 4. (Physik) Die Dichte eines Stoffes als Funktion vom Ort ist z. B. für das Trägheitsmoment wichtig. 5. (Biologie) Permeabilität einer Grenzschicht in Abhängigkeit vom Ort auf der Grenzschicht. 6. (Medizin) Gewebedichte in Abhängigkeit vom Ort im menschlichen Körper. Z. B. spielt dies bei der Bekämpfung von Tumoren mit Hyperthermie eine große Rolle. Dies spielt auch bei bildgebenden Verfahren in der Medizin eine Rolle. 7. (Wirtschaft) Inflationsrate als Funktion von Leitzinsen, Exporten, Importpreisen, Geldmenge. 8. (Flugzeugbau) Auftrieb in Abhängigkeit von Fluggeschwindigkeit, Luftdruck und Lufttemperatur (die ihrerseits von Ort und Zeit abhängig ist). 9. (Fahrzeugentwicklung) Luftwiderstand eines Fahrzeugs als Funktion der Fahrzeugform, in diesem Fall ist die Funktion in natürlicher Weise auf einem nicht endlich dimensionalen Banachraum, dem Raum der Formen, definiert. Der Begriff der Stetigkeit für solche Funktionen ist uns bekannt, da wir ja diesen Begriff im Kontext metrischer Räume kennengelernt haben und wie oben dargestellt der Banachraum V auch ein metrischer Raum ist. Definition 8.3.1.2 (Differenzierbarkeit) Es sei (V, k · kV ) ein K-Banachraum U ⊂ V eine offene Menge, f : U → K sei eine Abbildung, x0 ∈ U . f heißt differenzierbar im Punkt x0 , wenn es eine stetige, lineare Abbildung ` : V → K gibt, so dass gilt 1 (f (x0 + h) − f (x0 ) − `(h)) = 0. khkV →0 khkV lim Die Bedingung besagt, dass für eine beliebige Folge von Vektoren {hm }m∈N mit hm ∈ V mit limm→∞ hm = 0 gilt lim m→∞ 1 khm kV (f (x0 + hm ) − f (x0 ) − `(hm )) = 0. (8.3) Folgen und deren Grenzwerte sind uns in beliebigen metrischen Räumen bekannt, damit auch der Limes h → 0, der, wie gerade erläutert, über solche Folgen definiert wird. Man beachte dabei natürlich, dass es (wegen der Offenheit von U ) 8.3. ABLEITUNGEN 43 für x0 ∈ U und limm→∞ hm = 0 ein N ∈ x0 + hk ∈ U ist. N gibt, so dass für k > N der Vektor Bemerkung 8.3.1.3 (Approximation durch lineare Abbildungen) Oft wird die Bedingung auch so formuliert, vgl. Satz 5.1.9: f ist im Punkt x0 differenzierbar, wenn es eine stetige lineare Abbildung ` : V → K gibt, so dass für die Funktion R(h) = f (x0 + h) − f (x0 ) − `(h) gilt lim h→0 1 R(h) = 0. khkV Diese Bedingung ist (offensichtlich) äquivalent zu der in der Definition angegebenen Bedingung. Definition 8.3.1.4 (Dualraum) Ist (V, k · kV ) ein K-Banachraum, so bezeichnen wir mit V 0 den Dualraum von V , wobei n o V 0 = ` : V → K ` ist stetig und linear . Lemma 8.3.1.5 (Eigenschaften des Dualraumes) Der Dualraum ist ein normierter linearer Raum, dessen Norm durch n o k`kV 0 = sup |`(x) kxkV = 1 . definiert ist. Mit dieser Norm gilt für jedes x ∈ V |`(x)| ≤ k`kV 0 kxkV . V 0 wird mit dieser Norm zum K-Banachraum. Beweis. Vgl. Beispiel 8.1.16 (5). Satz 8.3.1.6 (Eindeutigkeit der Ableitung) Gibt es eine lineare Abbildung `, die der Bedingung (8.3) genügt, so ist sie eindeutig. 44 KAPITEL 8. DIFFERENTIALRECHNUNG Beweis. Angenommen wir hätten zwei solche Abbildungen `1 , `2 . Dann ist 0 = lim m→∞ 1 khm kV (f (x0 + hm ) − f (x0 ) − `2 (hm )) − lim 1 m→∞ = lim m→∞ 1 khm kV khm kV (f (x0 + hm ) − f (x0 ) − `1 (hm )) (`1 (hm ) − `2 (hm )). Angenommen `1 6= `2 . Dann gibt es ein h ∈ V , khkV = 1 mit `1 (h) 6= `2 (h). Dann ist aber für t > 0, t ∈ R 1 1 0 = lim (`1 (th) − `2 (th)) = lim (t(`1 (h) − `2 (h))) = `1 (h) − `2 (h) 6= 0. t→0 t t→0 t Dieser Widerspruch impliziert die Eindeutigkeit der linearen Abbildung. Definition 8.3.1.7 (Differential) Existiert eine lineare Abbildung, die der Bedingung (8.3) genügt, so heißt diese Abbildung die Linearisierung oder auch das Differential von f an der Stelle x0 . Wir schreiben dafür Df (x0 ) (oder auch df (x0 )). Bemerkung 8.3.1.8 (Ableitung und Basiswechsel) 1. Man beachte, dass Df (x0 ) eine lineare Abbildung ist, die Punkte x ∈ V auf Werte in R abbildet. Dafür schreiben wir Df (x0 )(x) = w ∈ R. 2. Die Linearisierung einer Abbildung an einer Stelle hängt nicht von der Wahl der Basis in unserem Vektorraum ab. Allerdings hängt die Darstellung als Matrix bezüglich der Basis (für endlich dimensionales f ) sehr wohl davon ab. Lemma 8.3.1.9 (Ableitung in Koordinaten) Gegeben sei eine im Punkt x0 ∈ U , U ⊂ Rn offen, differenzierbare Funktion f , B = {ei | i = 1, . . . , n} sei die übliche Basis. Die 1 × n-Matrix (Df (x0 )(e1 ) Df (x0 )(e2 ) . . . Df (x0 )(en )) stellt die Ableitung von f im Punkt x0 bezüglich B dar. 8.3. ABLEITUNGEN 45 Beweis. Es besteht der übliche Zusammenhang ! n X Df (x0 )(x) = Df (x0 ) xi e i i=1 = n X xi Df (x0 )(ei ) i=1 = (Df (x0 )(e ) Df (x0 )(e ) . . . Df (x0 )(e )) 1 2 n x1 x2 .. . . xn Bemerkung 8.3.1.10 (Affin lineare Abbildungen und Approximation) Es ist naheliegend die affin lineare Abbildung A : x 7→ f (x0 ) + Df (x0 )(x − x0 ) zu betrachten. Die Differenz R(x−x0 ) = Ax−f (x) verschwindet mit x → x0 sogar noch nach Division durch kx − x0 kV , in diesem Sinne approximiert die Abbildung A die Funktion f . Beispiel 8.3.1.11 (Differenzierbare Abbildungen) 1. Lineare Abbildungen f : Rn → R sind in jedem Punkt x0 ∈ differenzierbar, es gilt Df (x0 ) = f , denn Rn f (x0 + h) − f (x0 ) − f (h) = 0. 2. Ist (V, k·k) ein Banachraum, so sind stetige lineare Abbildungen V → K differenzierbar. 3. Ist (V, h·, ·iV ) ein Hilbertraum und A : V → V eine stetige lineare Abbildung, so ist f (x) = hx, AxiV in jedem Punkt differenzierbar, die Linearisierung ist Df (x0 )(h) = hh, Ax0 iV + hx0 , AhiV . Zur Begründung betrachten wir hx + h, A(x + h)iV = hx, AxiV + hh, AxiV + hx, AhiV + hh, AhiV . 46 KAPITEL 8. DIFFERENTIALRECHNUNG In diesem Fall ist |R(h)| = |hh, AhiV | ≤ khkV kAhkV und |R(h)| ≤ kAhkV → 0 khkV mit h → 0. Ist A zusätzlich symmetrisch bzgl. h·, iV , d. h. hAx, yiV = hx, AyiV (für endlich dimensionale Räume und der Darstellung bzgl. Standard-Basis und dem üblichen Skalarprodukt bedeutet dies A = AT ), so ist Df (x0 )(h) = 2hAx0 , hiV . Eine wichtige Eigenschaft differenzierbarer Funktionen ist bereits aus der eindimensionalen Analysis bekannt. Wir beginnen mit einem Hilfssatz. Satz 8.3.1.12 (Stetigkeit differenzierbarer skalarer Abbildungen) Ist (V, k · kV ) ein K-Banachraum und U ⊂ V offen, f : U → K eine im Punkt x0 differenzierbare Funktion, so ist f im Punkt x0 stetig. Beweis. Sei ε > 0 gegeben. Für h ∈ V gilt f (x0 + h) + f (x0 ) = Df (x0 )(h) + R(h). Wegen limh→0 |R(h)| khkV = 0 gibt es ein δ1 > 0, so dass khkV < δ1 impliziert |R(h)| ε < . khkV 2 Dann ist ε |R(h)| < khkV . 2 Da Df (x) eine stetige lineare Abbildung ist, gibt es ein δ2 > 0, so dass ε khkV < δ2 impliziert |Df (x0 )(h)| < . 2 Dann ist aber ε |f (x0 + h) − f (x0 )| ≤ |Df (x0 )(h)| + |R(h)| ≤ 2 = ε, 2 solange nur khkV ≤ min{δ1 , δ2 }. Wir stellen nun die Frage, wie man eine Funktion auf Differenzierbarkeit testet und wie man im Fall der Differenzierbarkeit die Linearisierung oder auch die Ableitung berechnet. 8.3. ABLEITUNGEN 47 Definition 8.3.1.13 (Richtungsableitung) Es (V, k · kV ) ein K-Banachraum und U ⊂ V sei offen, f : U → K sei eine Abbildung. Es sei x0 ∈ U und a ∈ V . Wir betrachten die Abbildung fx0 ,a : K → K : w 7→ f (x0 + wa). Ist diese Funktion im Punkt w = 0 differenzierbar, so sagen wir, dass die Richtungsableitung von f im Punkt x0 in Richtung a existiert und den Wert fx0 0 ,a (0) hat. Wir bezeichnen diese mit ∂a f (x0 ). Ist V = Kn , so werden die Richtungsableitungen in Richtung der Vektoren der Standardbasis als partielle Ableitungen bezeichnet, als Symbol schreiben wir ∂ f (x0 ) = ∂ei f (x0 ) , ∂xi dafür schreiben wir auch kurz ∂i f (x0 ). Existieren die partiellen Ableitungen von f , so sagen wir, f ist partiell differenzierbar. Sind alle partiellen Ableitungen stetig, so sprechen wir von einer stetig partiell differenzierbaren Funktion. Aus unserer bisherigen Diskussion folgt der Satz: Satz 8.3.1.14 (Differenzierbarkeit und Darstellung der Ableitung) Ist U ⊂ Kn offen, f : U → K in x0 differenzierbar, so ist f im Punkt x0 partiell differenzierbar und es existieren alle Richtungsableitungen und die Linearisierung von f hat die Darstellung n X ∂ f (x0 )hi . Df (x0 )(h) = ∂x i i=1 Damit hat man eine Strategie, die Ableitung einer Funktion f : Kn → K zu bestimmen: Man bestimme alle partiellen Ableitungen im Punkt x0 und verifiziere dann, ob die durch die damit gebildete 1 × n-Matrix definierte lineare Abbildung die Bedingung an die Ableitung erfüllt. Zunächst jedoch ein Beispiel an dem man erkennt, dass diese Strategie nicht immer erfolgreich ist. Beispiel 8.3.1.15 (Partielle Differenzierbarkeit und Differenzierbarkeit) 48 KAPITEL 8. DIFFERENTIALRECHNUNG Es sei f : R2 → R definiert durch x1 0 0, falls = x2 0 f (x1 , x2 ) = 2 x x 2 2 1 2 , sonst. x1 + x2 a1 Ist 0 6= a = ∈ R2 , so ist mit f0,a (t) = f (ta) a2 f (ta) − f (0) = f (ta) = t a21 a2 = tf (a) a21 + a22 und 1 lim (f (ta) − f (0) − f (a)t) = 0. t→0 t Also ist die Richtungsableitung in Richtung a durch f (a) gegeben. Da auf den Koordinatenachsen die Funktion verschwindet, sind die beiden partiellen Ableitungen 0. Als einzige lineare Abbildung kommt damit die Nullabbildung als Ableitung in Frage. Damit ist, will man die Differenzierbarkeit von f in 0 nachprüfen, zu untersuchen 1 x21 x2 x21 x2 = lim . x→0 kxk3 x→0 kxk kxk2 lim Wählen wir nun eine Folge von Vektoren {xm }m∈N mit xm = alle m ∈ N und xm → 0 für m → ∞. Dann ergibt sich xm xm für 1 x3 6= 0. (f (xm , xm ) − f (0) − 0) = lim √ m xm →0 2 2|x |3 kxm k m Damit ist f nicht differenzierbar. Eine Veranschaulichung der Funktion f zeigt die Abbildung 8.3. Einer der zentralen Sätze der Theorie besagt nun, dass im Fall stetig partiell differenzierbarer Funktionen die oben genannte Strategie erfolgreich ist. Satz 8.3.1.16 (Stetige Partielle Differenzierbarkeit und Differenzierbarkeit) Ist U ⊂ Rn offen und f : U → R im Punkt eine Abbildung, so dass auf einer Umgebung W von x0 alle partiellen Ableitungen von f existieren und f im Punkt x0 stetig partiell differenzierbar ist, so ist f im Punkt x0 differenzierbar. 8.3. ABLEITUNGEN 49 Abbildung 8.3: Eine partiell differenzierbare, nicht differenzierbare Funktion Beweis. Sei h ∈ Rn , so dass x0 + h ∈ V ist und γ(t) sei der Polygonzug, der aus Parallelen zu den Koordinatenachsen aufgebaut ist, d. h. " n # i−1 i i−1 i−1 X X X X X γ : 0, |hi | → Rn : ( |hj |, |hj |) 3 t 7→ x0 + hj ej +sgn(hi )(t− |hj |)ei . i=1 j=1 j=1 j=1 j=1 Setze für j ≥ 1: xj = xj−1 + hj ej . Dies sind genau die Eckpunkte des Polygonzuges. Das Prinzip der vorgestellten Konstruktion wird vielleicht aus der Abbildung 8.4 deutlich. Dann ist f (x0 + h) − f (x0 ) = n X (f (xj ) − f (xj−1 )) . j=1 Längs des Geradenstücks zwischen je zwei solchen Punkten betrachten wir für i = 0, . . . , n − 1 die Funktion aus Definition 8.3.1.13 fxi ,ei+1 : R → R. Es gilt f (xi ) = fxi ,ei+1 (0) und f (xi+1 ) = fxi ,ei+1 (hi+1 ). Dann ist (Mittelwertsatz) für i = 0, . . . , n − 1 f (xi+1 ) − f (xi ) = fx0 i ,ei+1 (ξi )hi+1 = ∂ei+1 f (xi + ξi ei+1 )hi+1 . 50 KAPITEL 8. DIFFERENTIALRECHNUNG e3 x 3 = x 0+h h 3e 3 h x2 h 2e 2 1 x0 h1e x1 e2 e1 Abbildung 8.4: Der verbindende Polygonzug und die wesentlichen Punkte. Nun schreiben wir f (x0 + h) − f (x0 ) = n−1 X ∂ei+1 f (xi + ξi ei+1 )hi+1 . i=0 Dann ist f (x0 +h)−f (x0 ) = n−1 X (∂ei+1 f (xi + ξi e i+1 n−1 X ) − ∂ei+1 f (x0 ) hi+1 + ∂ei+1 f (x0 )hi+1 . i=0 i=0 Wir bezeichnen mit R(h) = n−1 X (∂ei+1 f (xi + ξi ei+1 ) − ∂ei+1 f (x0 ) hi+1 . i=0 Nun gilt wegen der Stetigkeit der partiellen Ableitungen und der Tatsache, dass hi für h → 0 beschränkt ist, dass khk2 lim h→0 R(h) = 0. kh||2 8.3. ABLEITUNGEN 51 Satz 8.3.1.17 (Ableitung und Richtungsableitung) Sei (V, k · kV ) ein Banachraum, U ⊂ V offen, f : U → R im Punkt x0 ∈ U differenzierbar. Dann existiert für alle a ∈ V die Richtungsableitung ∂a f (x0 ) und es gilt ∂a f (x0 ) = Df (x0 )(a). Beweis. Folgt sofort aus der Definition. 8.3.2 Hilberträume und Gradienten Satz 8.3.2.1 (Parallelogrammgleichung) Eine Norm k · kV auf einem Banachraum V wird genau dann von einem Skalarprodukt induziert, wenn die Norm der sogenannten Parallelogrammgleichung kx + yk2V + kx − yk2V = 2kxk2V + 2kyk2V genügt. Beweis. Gegeben sei ein Skalarprodukt mit zugehöriger Norm auf V . Dann ist kx + yk2V + kx − yk2V = hx + y, x + yiV + hx − y, x − yiV = 2hx, xiV + 2hy, yiV = 2kxk2V + 2kyk2V . Für die Umkehrung setzen wir (in einem komplexen Banachraum) hx, yiV = 1 4 kx + yk2V + kx − yk2V + i kx + iyk2V + kx − iyk2V . Dann kann man alle Eigenschaften eines Skalarproduktes nachprüfen. Satz 8.3.2.2 (Orthogonales Komplement) Es sei (V, h·, ·iV ) ein Hilbertraum und U ⊂ V ein abgeschlossener, linearer Unterraum von V , d. h. U ist ein linearer Unterraum und Ū = U . Dann gibt es einen abgeschlossenen, linearen Unterraum W ⊂ V mit U ⊕W =V und für alle u ∈ U und alle w ∈ W gilt hu, wiV = 0 oder auch in Kurzform W = U ⊥ . 52 KAPITEL 8. DIFFERENTIALRECHNUNG Beweis. Sei U ein abgeschlossener Unterraum und n o U ⊥ = x ∈ V hu, xiV = 0 für alle u ∈ U . Dann ist U⊥ = o \n x ∈ V hu, xiV = 0 . u∈U n o Jede der Mengen x ∈ V hu, xiV = 0 ist abgeschlossen, der Schnitt also abgeschlossen. Jede dieser Mengen ist offenkundig ein Unterraum, daher gilt dies auch für den Schnitt. Wir wollen noch zeigen, dass U ⊥ ein Komplementärraum zu U ist. Offenkundig ist U ∩ U ⊥ = {0}, denn für ū ∈ U ∩ U ⊥ ist hū, ūiV = 0 und daher ū = 0. Wir müssen noch zeigen, dass U + U ⊥ = V ist. Ist x0 ∈ V , betrachte d = inf kx0 − ykV . y∈U Dazu gibt es ein y0 ∈ U mit kx0 − y0 kV = d. Um die Existenz zu zeigen, betrachten mir eine minimierende Folge {yn } ⊂ U mit lim kx0 − yn kV = d. n→∞ Diese Folge ist eine Cauchyfolge, denn betrachten wir die Parallelogrammgleichung mit x = x0 − y n , y = x0 − ym und erhalten 2 1 + kym − yn k2V = 2 kx0 − yn k2V + kx0 − ym k2V . 4 x0 − (yn + ym ) 2 V Mit n, m → ∞ konvergiert die rechte Seite gegen 4d2 , also auch die linke Seite. Da 12 (yn + ym ) ∈ U ist der erste Ausdruck größer oder gleich 4d2 und der zweite Ausdruck konvergiert gegen 0. Also ist {yn }n∈N eine Cauchyfolge und der Grenzwert existiert wegen der Vollständigkeit von V . Gäbe es zwei Elemente y0 , y1 in U mit minimalem Abstand zu x0 , so hätte die quadratische Abbildung f : R → R : t 7→ kx0 − y0 + t(y1 − y0 )k2V zwei Minima bei t = 0, t = 1 und wäre damit konstant, also y1 − y0 = 0. Nun ist klar, dass x0 = y0 + (x0 − y0 ). Wir müssen also noch zeigen, dass x0 − y0 ∈ U ⊥ liegt. Sei u ∈ U , dann ist q(t) = hx0 − y0 + tu, x0 − y0 + tuiV ≥ 0, 8.3. ABLEITUNGEN 53 quadratisch in t und hat bei t = 0 ein einziges Minimum. Also ist q 0 (0) = 0, d. h. 0 = q 0 (0) = hx0 − y0 , uiV + hu, x0 − y0 iV . Also ist Rehx0 − y0 , uiV = 0. Im reellen Fall sind wir damit fertig, im komplexen Fall betrachte man noch q(it) ∈ R und auf gleiche Weise folgt d q(it)|t=0 dt = 0 und Imhx0 − y0 , uiV = 0. Definition 8.3.2.3 (Komplementärraum) Der Raum W aus dem vorigen Satz wird als Komplementärraum (zu U ) bezeichnet. Aufgabe 8.3.2.4 (Komplementärraum) Zeigen Sie W ⊥ = U oder auch (U ⊥ )⊥ = U . Lemma 8.3.2.5 (Riesz4 ) Es sei (V, h·, ·iV ) ein Hilbertraum. Zu einer stetigen linearen Abbildung ` : V → R gibt es einen eindeutig bestimmten Vektor y ∈ V , so dass für alle x ∈ V gilt: `(x) = hy, xiV . Beweis. Ist ` = 0, so ist nichts zu zeigen. Ist ` 6= 0, so ist U = ker ` ein abgeschlossener linearer Unterraum. Die Tatsache, dass der Kern ein Unterraum ist, folgt aus Sätzen der Linearen Algebra, die, dass der Kern abgeschlossen ist, folgt, weil dieser das Urbild einer abgeschlossenen Menge unter einer stetigen Abbildung ist (Satz 4.2.6). Dann ist V = U ⊕ U ⊥ . Da die Kodimension von U gleich 1 ist, ist dim U ⊥ = 1. (Beachte: Aus der Linearen Algebra ist bekannt, dass das Urbild isomorph zur direkten Summe aus Kern und Bild ist.) Daher gibt es einen Vektor 0 6= ȳ ∈ U ⊥ , der diesen Raum erzeugt. Für diesen Vektor und für alle z ∈ ker(`) gilt hȳ, ziV = 0. 4 Frigyes Riesz (22.1.1880–28.2.1956) ungarischer Mathematiker und älterer Bruder von Marcel Riesz (einem ebenfalls bekannten Mathematiker). Er wurde in Budapest geboren, studierte dort und auch in Zürich und Göttingen Mathematik. Im Jahr 1902 promovierte er in Budapest, ging auf einen Lehrstuhl nach Kolozsvar, dies ist ein Ort, der damals in Ungarn und heute in Rumänien liegt. Als Kolozsvar rumänisch wurde, wurde die Universität in das südungarische Szeged verlegt, wo Riesz das bekannte Janos-Bolyai Institut gründete. Nach 1945 war er wieder an der Universität Budapest. Er publizierte in ungarisch, deutsch und französisch und gilt als einer der Begründer der Funktionalanalysis. 54 KAPITEL 8. DIFFERENTIALRECHNUNG Da hȳ, ȳiV 6= 0 ist, ist die Gleichung hcȳ, ȳi = `(ȳ) lösbar. Setze y = cȳ. Jedes x ∈ V hat eine Darstellung x = u + w mit u ∈ ker(`), w = αȳ. Also erhalten wir für x ∈ V hy, xiV = hy, u + αȳiV = αhy, ȳiV = α`(ȳ) = `(u + αȳ) = `(x). Definition 8.3.2.6 (Gradient) Sei (V, h·, ·iV ) ein Hilbertraum. Ist U ⊂ V offen und f : U → x0 ∈ U differenzierbar, so heißt der Vektor y ∈ V mit R im Punkt Df (x0 )(x) = hy, xiV der Gradient von f im Punkt x0 . Wir schreiben dafür auch ∇f (x0 ). Lemma 8.3.2.7 (Gradient, Darstellung) Ist (V, k · kV ) = (Rn , k · k2 ), so gilt ∂f ∂x1 (x0 ) ∂f (x0 ) ∇f (x0 ) = ∂x2 .. . ∂f (x0 ) ∂xn . Beweis. Folgt sofort aus unserer Definition des Skalarproduktes. Bemerkung 8.3.2.8 (Gradient und Ableitung) Man beachte, dass es verschiedene Skalarprodukte gibt und die Darstellung des Gradienten vom Skalarprodukt abhängt. Nur die Linearisierung ist durch f und den Punkt festgelegt, die Ableitung in Koordinaten hängt von der Wahl der Basis und der Gradient vom gewählten Skalarprodukt ab. Obwohl die Ableitung die natürliche Konstruktion ist, wird oft in praktischen Rechnungen der Gradient herangezogen. Wir formulieren die wichtigen Aussagen in beiden Varianten. Der Gradient hat mehrere Anwendungen, die wir gleich betrachten wollen. Wir erinnern an die Definition von Extrema (Definition 5.3.1) aus der Analysis I. 8.3. ABLEITUNGEN 55 Satz 8.3.2.9 (Extremalstellen) Es sei (V, k · kV ) ein Banachraum. Ist U ⊂ V offen und f : U → R differenzierbar, so verschwindet Df (x0 ) an jeder Extremalstelle x0 . Beweis. Wir betrachten oBdA Maxima. Sei x0 ein lokales Maximum der Funktion f . Dann hat für jedes a ∈ V die Funktion fx0 ,a : R → R ein lokales Maximum im Punkt 0, daher verschwindet die Ableitung. Damit ist für alle a ∈ V die Richtungsableitung ∂a f (x0 ) = 0 und damit ist die Ableitung 0. Definition 8.3.2.10 (Niveaumenge) Sei U ⊂ V offen, f : U → R differenzierbar und w ∈ Niveaumenge von f zum Niveau w als R. Wir definieren die Nf (w) = f −1 (w). Bemerkung 8.3.2.11 (Niveaumengen) Die Bestimmung und Charakterisierung von Niveaumengen ist eine wichtige Aufgabe, die Untersuchung dieses Problems hat viele Entwicklungen in der Mathematik angestoßen. Wir wollen zunächst zeigen, dass (im Hilbertraum) der Gradient senkrecht auf der Niveaumenge steht. Da aber die Niveaumenge kein linearer Unterraum ist, wollen wir eine etwas andere Formulierung wählen, um diesen Sachverhalt auszudrücken. Wir werden später sehen, wie man diesen Sachverhalt sachgemäß formuliert. Satz 8.3.2.12 (Niveaumengen und Tangentialvektoren) Sei U ⊂ V offen, f : U → R differenzierbar, w ∈ R und Nf (w) die Niveaumenge. Ist γ : R → U eine differenzierbare Kurve mit γ(t) ∈ Nf (w) für alle t ∈ (−ε, ε) für eine Zahl ε > 0. Sei γ 0 (0) = v der Tangentialvektor an γ im Punkt 0, so gilt Df (γ(0))(γ 0 (0)) = 0. Ist (V, k · kV ) ein Hilbertraum, so gilt h∇f (γ(0)), viV = 0. Beweis. Wir betrachten die Funktion g : R → differenzierbar und auf (−ε, ε) konstant. Also ist R : t 7→ f (γ(t)). Diese ist 0 = g 0 (0) = Df (γ(0))γ 0 (0) = h∇f (γ(0)), vi. 56 KAPITEL 8. DIFFERENTIALRECHNUNG Die zuletzt genutzte Formel ist eine verallgemeinerte Kettenregel, die wir noch begründen wollen. Satz 8.3.2.13 (Kettenregel) Es sei (V, k · kV ) ein Banachraum. Ist U ⊂ V offen, γ : I → U eine stetig differenzierbare Kurve und f : U → R im Punkt x0 = γ(t0 ) differenzierbar, so ist f ◦ γ im Punkt t0 differenzierbar und es gilt (f ◦ γ)0 (t0 ) = Df (x0 )(γ 0 (t0 )). Beweis. Aufgrund der Differenzierbarkeit von f, γ haben wir Darstellungen f (x0 + h) = f (x0 ) + `(h) + R(h) γ(t0 + h) = γ(t0 ) + hv + R̃(h). |R̃(h)| |R(h)| → 0 mit h → 0 und → 0 mit h → 0. Dann ist mit v = γ 0 (t0 ) |h| khkV und ` = Df (x0 ) mit 1 |f ◦ γ(t0 + h) − f ◦ γ(t0 ) − h`(v)| = |h| 1 = f (γ(t0 ) + hv + R̃(h)) − f (γ(t0 )) − `(hv) |h| 1 = f (γ(t0 )) + `(hv + R̃(h)) + R(hv + R̃(h)) − f (γ(t0 )) − `(hv) |h| 1 1 ≤ |`(R̃(h))| + |R(hv + R̃(h))| |h| ! |h| R̃(h) R(hv + R̃(h)) khv + R̃(h)k V = ` . + |h| khv + R̃(h)kV |h| Da ` stetig ist folgt aus kR(h)k2 → 0 auch die Konvergenz |h| ! R̃(h) lim ` = 0. h→0 |h| Der zweite Faktor im zweiten Term ist beschränkt, der erste konvergiert gegen 0, damit konvergiert der Ausdruck 1 |f ◦ γ(t0 + h) − f ◦ γ(t0 ) − h`(v)| |h| mit h → 0 gegen 0 also ist `(v) die Ableitung von f ◦ γ in t0 . 8.4. MITTELWERTSATZ UND ANWENDUNGEN 8.4 57 Mittelwertsatz und Anwendungen Aus der Analysis I erinnern wir uns an den Mittelwertsatz der Differentialrechnung Satz 5.3.7, der besagt, dass die Differenz zweier Funktionswerte eine Darstellung als Produkt aus der Differenz der Argumente und der Ableitung an einer Zwischenstelle hat, also f (b) − f (a) = f 0 (ξ)(b − a) mit ξ ∈ (a, b). Die Verallgemeinerung dieses Satzes für höherdimensionale Räume sieht ähnlich aus, ist aber im Detail etwas anders. Satz 8.4.1 (Mittelwertsatz) Es sei U ⊂ V offen und x, y ∈ U seien Punkte, so dass die Verbindungsstrecke, d. h. die Menge o n S(x, y) = x + t(y − x) t ∈ [0, 1] in U enthalten ist. Ferner sei f : U → ein ξ ∈ S(x, y) mit R differenzierbar. Dann gilt: Es gibt f (y) − f (x) = Df (ξ)(y − x). Beweis. Wir betrachten die Funktion g(t) = f (x + t(y − x)). Diese Funktion g : [0, 1] → R ist stetig, auf (0, 1) differenzierbar und g(0) = f (x), g(1) = f (y). Daher gibt es ein ζ ∈ (0, 1) mit g 0 (ζ) = f (y) − f (x). Die Ableitung errechnet sich zu g 0 (ξ) = Df (x + ξ(y − x))(y − x). Aus dem eben bewiesenen Satz folgt sofort die Abschätzung n o |f (y) − f (x)| ≤ sup kDf (z)kV 0 z ∈ S(x, y) ky − xkV . Daraus kann man nun sofort eine Schranke für f herleiten, falls U eine beschränkte, offene Menge ist und die Norm kDf (x)kV 0 auf U beschränkt ist. 58 KAPITEL 8. DIFFERENTIALRECHNUNG Definition 8.4.2 (Gebiete) Es sei (V, k · kV ) ein Banachraum. 1. Eine zusammenhängende, offene Teilmenge von V heißt Gebiet. Ein Gebiet U heißt beschränkt, wenn es ein R > 0 gibt mit U ⊂ BR (0). 2. Ist U ⊂ V eine Menge, so dass für je zwei Punkte x, y ∈ U S(x, y) ⊂ U gilt, so nennt man U konvex. 3. U ⊂ V heißt wegezusammenhängend, wenn es zu je zwei Punkten x, y ∈ U eine Kurve γ : [a, b] → U gibt mit γ(a) = x, γ(b) = y. Aufgabe 8.4.3 (Wegezusammenhängende Gebiete) 1. Konvexe Gebiete sind wegezusammenhängend. 2. Wegezusammenhängende Mengen sind zusammenhängend. 3. Die Umkehrung beider Aussagen gilt nicht. Bemerkung 8.4.4 (Gebiete und Zusammenhang) Es ist oft wesentlich leichter zu beweisen, dass eine Menge wegezusammenhängend ist, als dass sie zusammenhängend ist. Satz 8.4.5 (Beschränktheit) Ist U ⊂ V ein beschränktes, konvexes Gebiet und f : U → R stetig differenzierbar mit beschränkter Ableitung, so ist f auf U beschränkt, genauer gilt: Ist R > 0 mit U ⊂ BR (0), kDf (x)kV ≤ M für alle x ∈ U , so ist für x0 ∈ U |f (x)| ≤ |f (x0 )| + 2M R. Beweis. Es gilt für ein geeignetes z ∈ S(x, x0 ) f (x) − f (x0 ) = Df (z)(x − x0 ). Damit ist mit kx − x0 kV < 2R und kDf (z)kV < M |f (x)| ≤ |f (x0 )| + M kx − x0 kV ≤ |f (x0 )| + 2M R. 8.5. HÖHERE ABLEITUNGEN 59 Satz 8.4.6 (Integration längs Kurven) U ⊂ V sei wegezusammenhängend, ferner gebe es zu je zwei Punkten x, y ∈ U eine C 1 Kurve γ : [a, b] → U mit γ(a) = x, γ(b) = y. Dann ist Zb f (y) − f (x) = Df (γ(t))(γ 0 (t)) dt. a Im Hilbertraum schreibt man auch Zb h∇f (γ(t)), γ 0 (t)i dt. a Definition 8.4.7 (Linienintegral) Das Integral Zb Df (γ(t))γ 0 (t) dt a heißt das Linienintegral des Differentials von f längs der Kurve γ. Beweis. Der Satz ist eine direkte Anwendung der Kettenregel. 8.5 Höhere Ableitungen, der Satz von Schwarz und multilineare Abbildungen Hat man eine Funktion f : U → R, deren Richtungsableitung für a ∈ V existiert, dann ist ∂a f : U → R wiederum eine reellwertige Funktion und man kann fragen, ob diese Funktion Richtungsableitungen besitzt. Insbesondere können wir für x0 ∈ U und b ∈ V nach der Existenz von ∂b (∂a f (x0 )) fragen. Man kann diesen Prozess iterieren und auch für eine endliche Anzahl von Vektoren a1 , a2 , . . . , ar die Existenz der iterierten Richtungsableitung ∂ar . . . ∂a1 f (x0 ) und eventuell deren Eigenschaften untersuchen. Wir beginnen mit einer einfachen Aussage. 60 KAPITEL 8. DIFFERENTIALRECHNUNG Satz 8.5.1 (Schwarz) Es sei (V, k · kV ) ein Banachraum. U ⊂ V offen, f : U → R sei stetig. Es seien a, b ∈ V . Existieren für alle x ∈ U die Richtungsableitungen ∂a f (x), ∂b f (x), ∂a ∂b f (x), ∂b ∂a f (x) und sind die Abbildungen x 7→ ∂a f (x), x 7→ ∂b f (x), x 7→ ∂b ∂a f (x), x 7→ ∂a ∂b f (x) stetig, so gilt für alle x ∈ U die Gleichheit ∂b ∂a f (x) = ∂a ∂b f (x). Bemerkung 8.5.2 (Partielle Ableitungen höherer Ordnung) 1. Im Rn haben wir die den Standardeinheitsvektoren zugeordneten Richtungsableitungen als partielle Ableitungen bezeichnet. Insofern besagt unser Satz in diesem Kontext, dass die Stetigkeit der ersten partiellen Ableitungen und die Existenz und Stetigkeit der zweiten partiellen Ableitungen impliziert, dass die Reihenfolge keine Rolle spielt. 2. Im Rn kann man tatsächlich etwas mehr beweisen, nämlich: Aus der 2 Stetigkeit der partiellen Ableitungen ∂i f , ∂j f und ∂x∂ ∂fx im Punkt x0 i j 2 0) und die im Satz befolgt die Existenz der partiellen Ableitung ∂∂xf (x j ∂x i hauptete Gleichheit. Einen Beweis dieser Bemerkung findet man z. B. bei Königsberger [12]. Beweis. Wir betrachten für festes a, b ∈ V, x0 ∈ U und festes h, k ∈ folgenden Ausdruck R den A(h, k) = f (x0 + ha + kb) − f (x0 + kb) − f (x0 + ha) + f (x0 ). Mit g(h, k) = f (x0 + ha + kb) − f (x0 + kb) hat A die Gestalt A(h, k) = g(h, k) − g(h, 0). Für festes h ist g(h, ·) eine differenzierbare Funktion der Veränderlichen k und daher gilt: Es gibt ein k̂(h) mit A(h, k) = ∂k g(h, k̂(h))k. Damit ist A(h, k) = ∂b f (x0 + ha + k̂(h)b) − ∂b f (x0 + k̂(h)b) k. 8.5. HÖHERE ABLEITUNGEN 61 Betrachten wir nun die rechte Seite für fixiertes k̂(h) als Funktion von h in der ersten Komponente, so gibt es ein ĥ mit A(h, k) = ∂a ∂b f (x0 + ĥa + k̂(h)b)kh. Natürlich erhält man auf gleiche Weise (indem man einfach a und b und entsprechend h und k vertauscht A(h, k) = ∂b ∂a f (x0 + ĥ(k)a + k̂b)kh. Also ist ∂a ∂b f (x0 + ĥa + k̂(h)b) = ∂b ∂a f (x0 + ĥa + k̂(h)b). Mit den Grenzwerten h → 0, k → 0 folgt das Resultat. Korollar 8.5.3 (Höhere partielle Ableitungen und Permutationen) Ist eine Funktion f : Rn → R k-mal stetig partiell differenzierbar, dann gilt für jede Permutation π ∈ S(n) ∂eik . . . ∂ei1 f (x0 ) = ∂eiπ(k) . . . ∂eiπ(1) f (x0 ). Beweis. Folgt sofort aus dem Satz von Schwarz. Höheren Ableitungen kann man multilineare Abbildungen zuordnen, wir wollen dies am Beispiel zweiter Ableitungen beschreiben, da diese eine besondere Rolle spielen werden, auf den allgemeinen Fall kommen wir noch zurück. Definition 8.5.4 (Bilineare Abbildung) Eine Abbildung B : V ×V → K mit D(B) = V ×V und B(x, y) ist für jeweils festes x bzw. festes y linear in der anderen Komponente, heißt bilinear. Entsprechend heißt eine Abbildung m : V · · × V} → R k-linear, wenn m in | × ·{z k−mal jeder Komponente bei festgehaltenen anderen Einträgen linear ist. Eine Abbildung heißt multilinear, falls sie k-linear für ein k ∈ N ist. Mit Mk (V ; K) bezeichnen wir die Menge der k-linearen stetigen Abbildungen, also n o Mk (V ; R) = m : V × · · · × V → K m ist k-linear und stetig . Wir wollen zweiten Ableitungen eine bilineare stetige Abbildung zuordnen, da aber df : V → V 0 ist, ist an dieser Stelle noch nicht klar, was eine zweite Ableitung sein könnte. Dies wird später im Detail untersucht werden, hier wollen wir eine spezielle Situation betrachten. Wir beginnen mit einem Banachraum 62 KAPITEL 8. DIFFERENTIALRECHNUNG (V, k · kV ) einer offenen Teilmenge U ⊂ V . Wir betrachten für v ∈ V die Richtungsableitung als Abbildung V → R : x 7→ ∂v f (x). Wir fassen dies als reellwertige Funktion auf V auf. Wir setzen voraus, dass diese Funktion differenzierbar ist. Dann können wir für x0 ∈ U und u ∈ V wieder die Richtungsableitung ∂u ∂v f (x0 ) bilden. Sind f und ∂v f in x0 differenzierbar, so ist die Abbildung (u, v) 7→ ∂u ∂v f (x0 ) bilinear. Wir wollen nun im endlichdimensionalen Fall, (V, k · kV ) = (Rn , k · k2 ), eine Darstellung dieser bilinearen Abbildung bezüglich der Standardbasis angeben. Es ergibt sich n X ∂v f (x) = ∂ei f (x)vi . i=1 Davon die Richtungsableitung in Richtung u ergibt sich zu ∂u ∂v f (x) = n X ∂u ∂ei f (x)vi . i=1 Dies ergibt ∂u ∂v f (x) = n X n X (uj ∂ej ∂ei f (x)) vi . i=1 j=1 Da ∂ej ∂ei f (x) = ∂ei ∂ej f (x) ist, kann man dies schreiben als n X n X ∂ei ∂ej f (x)uj vi i=1 j=1 oder auch als hu, Avi mit A= ∂ 2 f (x0 ) ... ∂x21 .. . ∂ 2 f (x0 ) ... ∂xn ∂x1 ∂ 2 f (x0 ) ∂x1 ∂xn .. . ∂ 2 f (x0 ) . ∂x2n 8.6. TAYLORPOLYNOME UND TAYLORREIHEN 63 Definition 8.5.5 (Hesse-Matrix) Die Matrix A heißt Hesse-Matrix5 von f , wir schreiben dafür auch Hess(f )(x0 ). Die Hesse-Matrix ist nach dem Satz von Schwarz, wenn alle partiellen und alle zweiten partiellen Ableitungen stetig sind, symmetrisch. Im allgemeinen Banachraum gibt es natürlich unter den entsprechenden Voraussetzungen eine stetige bilineare Abbildung, die die Rolle der Hesse-Matrix übernimmt, auch darauf werden wir nochmals zurückkommen. 8.6 Taylorpolynome und Taylorreihen Für differenzierbare Funktionen R → R hatten wir eine Approximation durch Polynome untersucht und sind dabei auf das Taylorpolynom bzw. auf die Taylorreihe gestoßen. Eine ähnliche Konstruktion gibt es auch für Funktionen f : V → R. Wir sprechen zunächst über Polynome in mehreren Veränderlichen, dann über das Taylorpolynom einer hinreichend oft differenzierbaren Funktion. Wir beginnen mit der Definition eines Polynoms. Definition 8.6.1 (Polynom) 1. Eine Funktion f : der Form Kn f (x) = → K heißt Polynom, falls f k1 X k2 X ··· i1 =0 i2 =0 kn X eine Darstellung ai1 i2 ...in xi11 xi22 · · · xinn in =0 hat. Der Grad des Polynoms ist gegeben durch n o grad(f ) = max i1 + i2 + · · · + in ai1 i2 ...in 6= 0 . 2. Sei (V, k · kV ) ein K-Banachraum. Eine Abbildung v 7→ r X mk (v, v, ·, v), k=0 wobei r ∈ N und mk ∈ MK (V ; K) ist, nennen wir ein Polynom. 5 Ludwig Otto Hesse (22.4.1811–4.8.1874) stammt aus Königsberg, dem heutigen Kaliningrad, und war Professor in Halle, Heidelberg und München. Seine wichtigsten mathematischen Arbeiten betreffen Algebra, Analysis und analytische Geometrie. 64 KAPITEL 8. DIFFERENTIALRECHNUNG Beispiel 8.6.2 (Polynom dritten Grades auf R2 ) Ein Polynom dritten Grades R2 → R hat die allgemeine Gestalt für x = (x1 , x2 )T f (x) = a30 x31 +a21 x21 x2 +a12 x1 x22 +a03 x32 +a20 x21 +a11 x1 x2 +a02 x22 +a10 x1 +a01 x2 +a0 . Aufgabe 8.6.3 (Gleichwertigkeit der beiden Definitionen) Zeigen Sie, dass die beiden Begriffe für Abbildungen Kn → K zusammenfallen. Wir wollen nun für Polynome auf Kn eine etwas einfachere Notation einführen, die jedoch auch etwas weniger anschaulich ist. Definition 8.6.4 (Multiindex) Ein Element α ∈ Zn mit αi ≥ Q 0 für alle i heißt Multiindex. Für einen Multiindex α definieren wir α! = ni=1 αi ! und für x ∈ Kn setzen wir α x = n Y xαi i . i=1 Wir definieren die Länge eines Multiindex α durch |α| = n X αi . i=1 Damit nimmt die allgemeine Gestalt eines Polynomes vom Grad k auf V = die Form X P (x) = aα x α Kn |α|≤k an. Definition 8.6.5 (α-te partielle Ableitung) Ist α ein Multiindex, so setzen wir dα f (x0 ) = ∂xα1 1 ∂ |α| f (x0 ). . . . ∂xαnn Definition 8.6.6 (Räume k-fach stetig differenzierbarer Funktionen) Sei U ⊂ Rn ein Gebiet. Wir definieren n o k C (U ; R) = f ∈ C(U ; R) f ist k-mal stetig partiell differenzierbar . 8.6. TAYLORPOLYNOME UND TAYLORREIHEN 65 Satz 8.6.7 (Vorbereitung Taylor) Es sei U ⊂ Rn offen, f ∈ C k (U ; R) und x0 ∈ U , ξ ∈ Rn mit S(x0 , x0 + ξ) ∈ U . Wir setzen für t ∈ [0, 1] g(t) = f (x0 + tξ). Dann ist g : [0, 1] → R stetig und auf (0, 1) k-mal stetig differenzierbar und es gilt für j = 1, . . . , k g (j) (t) = X j! dα f (x0 + tξ)ξ α . α! |α|=j Beweis. Wir beweisen durch Induktion über j. Im Fall j = 1 erhalten wir genau die Richtungableitung in Richtung ξ. n X X d g (t) = fx0 ,ξ (t) = Df (x0 + tξ)ξ = ∂ei f (x0 + tξ)ξi = dα f (x0 + tξ)ξ α . dt i=1 0 |α|=1 Damit ist der erste Schritt getan. Der Induktionsschritt beruht auf der Einsicht, dass d (j) g (t) dt d X j! α = d f (x0 + tξ)ξ α dt α! |α|=j n X X j! = ∂ei dα f (x0 + tξ)ξ α ξi α! i=1 |α|=j X = τβ dβ f (x0 + tξ)ξ β , g (j+1) (t) = |β|=j+1 wobei wir noch τβ bestimmen müssen. Nun, ein Koeffizient von dα f (x0 + ξ)ξ α trägt zu τβ bei, wenn α und β bis auf eine Komponente übereinstimmen. Die Summe aller dieser Koeffizienten liefert genau τβ . Wir setzen β 0 = (β1 − 1, β2 − 66 KAPITEL 8. DIFFERENTIALRECHNUNG 1, . . . , βn − 1). τβ = n X Q r=1 = = n X r=1 n X r=1 = j! ! i6=r βi !(βr − 1) n X (β 0 )! i6=r βi j!βr β! βr r=1 = |β| j! Q j! β! j! β! j! β! (j + 1)! = . β! = (j + 1) Damit können wir nun aus der Taylorformel im Falle n = 1 direkt eine Taylorformel für f : U → R, U ⊂ Rn herleiten. Satz 8.6.8 (Restglied) Sei U ⊂ Rn offen, f ∈ C m+1 (U ; R) und x0 ∈ U , ξ ∈ Rn , so dass S(x0 , x0 + ξ) ⊂ U . Dann ist gibt es ein θ ∈ (0, 1), so dass gilt f (x0 + ξ) = f (x0 ) + m X X X 1 ∂ |α| α f (x )ξ + 0 α! ∂xα j=1 |α|=j Beweis. Wir setzen |α|=m+1 ∂ |α| f (x0 + θξ)ξ α . ∂xα g : [0, 1] → R : t 7→ fx,ξ (t). g : [0, 1] → R ist (m + 1)-mal stetig differenzierbar, daher gilt die Taylorformel aus Satz 7.2.1. Dies gibt uns für ein θ ∈ (0, 1) eine Darstellung von g(1) in der Form m X 1 (j) 1 g(1) = g(0) + g (0)1j + g (m+1) (θ)1m+1 . j! (m + 1)! j=1 Einsetzen der Darstellungen aus Satz 8.6.7 ergibt den folgenden Ausdruck m X X 1 ∂ |α| α f (x0 + ξ) = f (x0 ) + f (x )ξ + 0 α! ∂xα j=1 |α|=m+1 Dies ist der gewünschte Ausdruck. 1 ∂ |α| f (x0 + θξ)ξ α . α! ∂xα 8.6. TAYLORPOLYNOME UND TAYLORREIHEN 67 Definition 8.6.9 (Taylorpolynom) Das Polynom m X X 1 ∂ |α| f (x0 ) + f (x0 )ξ α α α! ∂x j=1 |α|=j heißt Taylorpolynom von f vom Grad höchstens m im Punkt x0 . Korollar 8.6.10 (Charakterisierung Taylorpolynom) Sei U ⊂ Rn offen und x0 ∈ U , δ > 0, so dass Bδ (x0 ) ⊂ U. Für f ∈ C m+1 (U ; R) und dem Taylorpolynom Pf,x0 ,m+1 (ξ) von f vom Grad höchstens m + 1 im Entwicklungspunkt x0 und kξk2 < δ gilt dann f (x0 + ξ) = Pf,x0 ,m+1 (ξ) + o(kξkm+1 ) für ξ → 0. 2 Beweis. Wir wissen f (x0 + ξ) = Pf,x0 ,m+1 (ξ) − X |α|=m+1 X 1 ∂ |α| α f (x )ξ + 0 α! ∂xα |α|=m+1 1 ∂ |α| f (x0 + θξ)ξ α α! ∂xα = Pf,x0 ,m+1 (ξ) + R(ξ), wobei aufgrund der Stetigkeit der m + 1-ten Ableitungen gilt |α| ∂ |α| ∂ lim f (x0 + θξ) − α f (x0 ) = 0. ∂x ξ →0 ∂xα Da |α| |ξ α | ≤ kξk2 gilt für |α| = m + 1 |ξ α | kξkm+1 2 ≤ = 1, kξk2m+1 kξkm+1 2 und damit ist R(ξ) lim m+1 = 0. ξ →0 kξk2 Dies war zu zeigen. Bemerkung 8.6.11 (Bestapproximierende) Das Taylorpolynom für Funktionen auf R stellt unter allen Polynomen gleichen Grades jenes dar, welches die Funktion f nahe dem Entwicklungspunkt am besten approximiert. Wir erinnern: Das Differential ist unter den linearen Abbildungen, das Taylorpolynom zweiten Grades unter allen quadratischen 68 KAPITEL 8. DIFFERENTIALRECHNUNG Abbildungen und das Taylorpolynom m-ten Grades eben unter allen Polynomen m-ten Grades die beste Approximation. Diese Überlegung überträgt sich auf Funktionen und approximierende Polynome m-ten Grades auf dem Rn . Ist eine Funktion unendlich oft differenzierbar, so kann man für jeden Grad ein Taylorpolynom angeben. Insgesamt hat man die folgende Definition. Definition 8.6.12 (Taylorreihe) Seien U ⊂ Rn offen, f : U → R beliebig oft stetig partiell differenzierbar (d. h. f ∈ C m (U ; R) für alle m ∈ N). Die Taylorreihe von f im Punkt x0 ist ∞ X X 1 ∂ |α| T(f,x0 ) (ξ) = f (x0 )ξ α . α α! ∂x k=0 |α|=k Wir wollen die oben angegebene Abschätzung nutzen um hinreichende Bedingungen für lokale Extrema anzugeben. Wir wissen, dass das Verschwinden der Ableitung notwendig ist. Das Taylorpolynom zweiten Grades hat die Form: Pf,x0 ,2 (ξ) = f (x0 ) + ∂e1 f (x0 )ξ1 + · · · + ∂en f (x0 )ξn 1 ∂2 1 ∂2 2 f (x0 )ξ1 + · · · + f (x0 )ξn2 + 2 2 2 ∂x1 2 ∂xn ∂2 ∂2 ∂2 + f (x0 )ξ1 ξ2 + f (x0 )ξ1 ξ3 + · · · + f (x0 )ξn−1 ξn ∂x1 ∂x2 ∂x1 ∂x3 ∂xn−1 ∂xn 1 = f (x0 ) + h∇f (x0 ), ξi + hξ, Hess(f )(x0 )ξi2 . 2 Definition 8.6.13 (Positiv definit) Eine symmetrische Matrix heißt 1. positiv (negativ) definit, wenn für alle x ∈ Rn , x 6= 0 gilt hx, Axi > 0 (hx, Axi < 0). 2. positiv (negativ) semidefinit , wenn für alle x ∈ Rn , x 6= 0 gilt hx, Axi ≥ 0 (hx, Axi ≤ 0). 3. indefinit, falls es x, y ∈ Rn gibt mit hx, Axi < 0 < hy, Ayi. Unter Verwendung der Hesse-Matrix gelingt es uns Extremalstellen zu charakterisieren. 8.6. TAYLORPOLYNOME UND TAYLORREIHEN 69 Satz 8.6.14 (Hinreichende Bedingung) Sei U ⊂ Rn offen, f : U → R zweimal stetig partiell differenzierbar, sei x0 ∈ U mit ∇f (x0 ) = 0. Dann gilt: 1. Ist Hess(f )(x0 ) positiv (negativ) definit, so liegt ein lokales Minimum (Maximum) vor. 2. Ist Hess(f )(x0 ) indefinit, so ist Hess(f )(x0 ) keine lokale Extremwertstelle. 3. Ist x0 lokale Extremwertstelle, so ist Hess(f )(x0 ) im Falle eines Minimums positiv semidefinit, im Falle eines Maximums negativ semidefinit. Beweis. Aus dem Korollar 8.6.10 ergibt sich eine Darstellung der Funktion f mittels des quadratischen Taylorpolynoms in Form von 1 f (x0 + h) = f (x0 ) + h∇f (x0 ), hi + hh, Hess(f )(x0 )hi + R2 (h) , 2 wobei R2 (h) =0 h→0 khk2 2 lim ist. Daher finden wir zu ε > 0 ein δ > 0, so dass khk2 ≤ δ impliziert |R2 (h)| < εkhk22 . (8.4) Wir beweisen nun die einzelnen Aussagen, dabei ist der Beweis des zweiten Falles in der ersten Aussage identisch mit dem des ersten Falles und wir beschränken uns auf diesen. (1) Wir setzen A = Hess(f )(x0 ) und betrachten die Funktion ψ : Rn → R : h 7→ hh, Ahi. Da A positiv definit ist, hat ψ ein Minimumm bei h = 0 mit dem Wert 0. Wir wollen untersuchen wie schnell ψ(h) gegen Null konvergiert. Aus Beispiel 8.3.1.11, zweiter Teil, wissen wir, dass ψ differenzierbar ist, als solches ist ψ stetig (Satz 8.3.1.12). Die Menge o n S n−1 = x ∈ Rn kxk2 = 1 ist abgeschlossen (da das Komplement offenkundig offen ist) und beschränkt (nach Definition), also kompakt. Damit ist ψ(S n−1 ) nach Satz 4.3.5 kompakt in R. Da 0 ∈ / ψ(S n−1 ) ist, gibt es ein h0 ∈ S n−1 mit 0 < ψ(h0 ) ≤ ψ(h) für alle h ∈ S n−1 . 70 KAPITEL 8. DIFFERENTIALRECHNUNG (Setze µ = inf ψ(S n−1 ), da ψ(S n−1 ) kompakt ist, ist µ ∈ ψ(S n−1 ) und damit gibt es ein h0 mit ψ(h0 ) = µ.) Dann ist für 0 6= khk2 < δ 2 1 1 h = ψ(h) 0<µ≤ψ khk2 khk2 also µkhk22 ≤ ψ(h). Ist ε < µ so folgt für 0 6= khk2 < δ f (x0 + h) = ≥ = > f (x0 ) + ψ(h) + R2 (h) f (x0 ) + µkhk22 − εkhk22 f (x0 ) + (µ − ε)khk22 f (x0 ). Damit hat f bei x0 ein isoliertes lokales Minimum. (2) Ist A indefinit, so gibt es h1 , h2 ∈ S n−1 mit ψ(h1 ) < 0 < ψ(h2 ). Wir betrachten nun die Funktion fx0 ,h1 (t) bzw. fx0 ,h2 (t) für t nahe 0. Sei ε < min{|ψ(h1 )|, ψ(h2 )} und δ > 0 das in Gleichung (8.4) definierte δ = δ(ε). Dann ist für |t| < δ, und h ∈ S n−1 fx0 ,h (t) = f (x0 ) + t2 ψ(h) + R(th) und damit f (x0 ) + t2 ψ(h) − εt2 < fx0 ,h (t) < f (x0 ) + t2 ψ(h) + εt2 . Damit ist für t 6= 0 und h = h1 die Funktion fx0 ,h1 (t) < 0 und für h = h2 die Funktion fx0 ,h2 (t) > 0. Also hat f im Punkt x0 kein lokales Extremum. (3) Folgt sofort aus (2). 8.7 Differenzierbare Abbildungen Wir beginnen nun Abbildungen von Rn → Rm oder allgemeiner von V → W , wobei V, W Banachräume sind, zu betrachten. Im Fall eines endlich dimensionalen 8.7. DIFFERENZIERBARE ABBILDUNGEN 71 Bildraumes wird die Abbildung als Vektor von Abbildungen angesehen, d. h. sei U ⊂ V offen f1 (x) f2 (x) f : U → Rm : x 7→ , .. . fm (x) wobei für i = 1, . . . , m die Funktion fi : U → R abbildet. Wir führen den Begriff der Differenzierbarkeit sofort im allgemeinen Kontext ein. Definition 8.7.1 (Differenzierbarkeit) Es seien (V, k·kV ), (W, k·kW ) Banachräume, ferner sei U ⊂ V offen, f : U → W eine Abbildung. Die Abbildung f heißt im Punkt x0 ∈ U differenzierbar, wenn es eine stetige lineare Abbildung L : V → W gibt, so dass 1 (f (x0 + h) − f (x0 ) − L(h)) = 0. khkV →0 khkV lim L wird als Differential Df (x0 ) von f im Punkt x0 bezeichnet. Wiederum hat man die Eindeutigkeit von L. Satz 8.7.2 (Eindeutigkeit der Ableitung) Gibt es eine lineare Abbildung wie in der Definition 8.7.1 angegeben, so ist diese eindeutig. Beweis. Der Beweis ist eine wörtliche Wiederholung des Beweises von Satz 8.3.1.6. Satz 8.7.3 (Charakterisierung der Differenzierbarkeit) Sei U ⊂ V offen, f : U → Rm ist im Punkt x0 genau dann differenzierbar, wenn jede Funktion fi : U → R im Punkt x0 differenzierbar ist. Das Differential erhält man als Vektor der Differentiale `i der Funktionen fi . Beweis. Angenommen f ist im Punkt x0 differenzierbar, so ist 1 (f (x0 + h) − f (x) − L(h)) = 0. khkV →0 khkV lim Dann gilt aber für jede Komponente fi , i = 1, . . . , m 1 (fi (x0 + h) − fi (x0 ) − (Lh)i ) = 0. khkV →0 khkV lim Setzen wir `i (h) = (Lh)i , so zeigt diese Gleichung, dass `i das Differential von fi ist. 72 KAPITEL 8. DIFFERENTIALRECHNUNG Andererseits, hat man Differentiale `i von fi im Punkt x0 , so hat man auch, `1 .. dass L = . die obige Gleichung erfüllt und sich als Differential von von f `m ergibt. Satz 8.7.4 (Stetigkeit differenzierbarer Abbildungen) Ist die Abbildung f : U → V im Punkt x0 differenzierbar, so ist sie im Punkt x0 stetig. Beweis. Der Beweis ist eine wörtliche Wiederholung des Beweises von Satz 8.3.1.12. Definition 8.7.5 (Jacobimatrix) Wählt man eine Basis in den Räumen Rn , Rm aus, so wird dadurch dem Differential eine Matrix zugeordnet. Bestehen diese Basen jeweils aus den Standardeinheitsvektoren, so ist zugehörige Matrix gegeben durch die ersten partiellen Ableitungen der Komponentenfunktionen ∂e1 f1 (x0 ) . . . ∂en f1 (x0 ) .. .. .. . . . ∂e1 fm (x0 ) . . . ∂en fm (x0 ) und wird als Jacobimatrix6 bezeichnet. Wir schreiben dafür f 0 (x0 ). Wir schauen nun nochmals auf ein weiteres Konzept aus der Linearen Algebra, den Begriff der Norm einer linearen Abbildung (oder auch einer Matrix). Dies nimmt das Beispiel 8.1.16 (5) wieder auf und verallgemeinert das Konzept der Norm im Dualraum V 0 , das wir inzwischen häufig benutzt haben. Definition 8.7.6 (Norm für lineare Abbildungen) Es seien (V, k · kV ), (W, k · kW ) Banachräume. Die Menge n o L : V → W L ist stetig und linear 6 Carl Gustav Jacob Jacobi(10.12.1804–18.2.1851) war ein sehr erfolgreicher deutscher Mathematiker, der als erster jüdischer Mathematiker eine Professorenstelle an einer deutschen Universität erhielt. In seiner Kindheit wurde er von einem Onkel unterrichtet, danach besuchte er das Gymnasium in Potsdam, wurde sehr schnell in die letzte Klasse versetzt, bis er auch formal die Universität besuchen konnte. Er studierte in Berlin Mathematik, wurde 1827 Professor in Königsberg, dem heutigen Kaliningrad, und entwickelte wichtige Beiträge zur Analysis, zur Zahlentheorie und zu sogenannten elliptischen Funktionen. 8.7. DIFFERENZIERBARE ABBILDUNGEN 73 werde mit L(V ; W ) bezeichnet. Wir definieren für L ∈ L(V ; W ) die Norm n o kLkL(V ;W ) = sup kLxkW kxkV ≤ 1 . Wir nennen L auch Operator und k · kL(V ;W ) Operatornorm. Aufgabe 8.7.7 (Norm für stetigen linearen Abbildungen) k · kL(V ;W ) ist eine Norm auf dem Raum aller stetigen linearen Abbildungen V → W , damit gilt kLvkW ≤ kLkL(V ;W ) kvkV . Satz 8.7.8 (Banachraum von Operatoren) (L(V ; W ), k · kL(V ;W ) ) ist ein Banachraum. Beweis. Wir folgen dem Beweis, dass (V 0 , k · kV 0 ) ein Banachraum ist. Offensichtlich ist L(V ; W ) ein linearer Raum. Die Vollständigkeit wird wie im Fall der Vollständigkeit von V 0 gezeigt. Damit können wir die Ableitung Df einer Abbildung f : U → W mit U ⊂ V offen, (V, k · kV ), (W, k · kW ) Banachräume als Abbildung Df : U → L(V ; W ) auffassen. Definition 8.7.9 (Stetig differenzierbar, höhere Ableitungen) Sind (V, k · kV ), (W, k · kW ) Banachräume, U ⊂ V offen und f : V → W sei differenzierbar. Ist Df : U → L(V ; W ) stetig, so nennen wir f stetig differenzierbar. Ist Df : U → L(V ; W ) differenzierbar, so sprechen wir von einer zweimal differenzierbaren Abbildung. Die zweite Ableitung D2 f (x0 ) ist nun ein Element in L(V ; L(V ; W )), D2 f : U → L(V ; L(V ; W )). Dies kann nun iteriert werden und wir können von k-fach differenzierbaren Abbildungen sprechen, beachte Dk f : U → L(U ; Lk−1 (V ; W )), wobei wir iterativ definieren L1 (V ; W ) = L(V ; W ), für k ≥ 2 : Lk (V ; W ) = L(V ; Lk−1 (V ; W )). Es wird eine wichtige Aufgabe sein, die Räume Lk (V ; W ) richtig zu interpretieren. Wir haben folgende wichtige Rechenregeln. 74 KAPITEL 8. DIFFERENTIALRECHNUNG Satz 8.7.10 (Kettenregel) Es seien (V, k · kV ), (W, k · kW ), (Z, k · kZ ) Banachräume, U ⊂ V , Y ⊂ W seien offene Teilmengen, f : U → V sei im Punkt x0 ∈ U differenzierbar, f (x0 ) = y0 ∈ Y und g : Y → Z sei in y0 differenzierbar. Dann gibt es ein δ > 0, so dass g ◦ f auf Bδ (x0 ) definiert ist und g ◦ f ist im Punkt x0 differenzierbar und es gilt für h ∈ V D(g ◦ f )(x0 )h = Dg(y0 )Df (x0 )h. Beweis. Der Beweis folgt dem von Satz 8.3.2.13 praktisch wörtlich. Satz 8.7.11 (Allgemeiner Mittelwertsatz) Es seien (V, k · kV ), (W, k · k) Banachräume und U ⊂ Rn offen, f : U → W stetig differenzierbar, es seien x, y ∈ U , so dass S(x, y) ⊂ U . Dann gilt mit n o M = sup kDf (x + t(y − x))kL(V ;W ) t ∈ [0, 1] kf (y) − f (x)kW ≤ M kx − ykV . Beweis von Satz 8.7.11. Wir betrachten für ξ = y − x die Hilfsfunktion G(t) = f (x0 + tξ) : [0, 1] → W. G : R → W ist differenzierbar, die Ableitung ist (Begründung wie zuvor) G0 (t)h = Df (x0 + tξ)hξ. Nun ist nach Lemma 8.2.3.6 für ein τ ∈ (0, 1) n o kG(1) − G(0)kW ≤ sup kG0 (τ )kW τ ∈ [0, 1] , wegen der Kompaktheit von [0, 1] und der Stetigkeit von kG0 kW gibt es ein τ0 ∈ [0, 1] mit kG(1) − G(0)kW ≤ kG0 (τ0 )kW . Also haben wir kf (x0 + ξ) − f (x0 )kW ≤ kDf (x + τ ξ)kL(V ;W ) kξkV . Daraus folgt die Aussage. 8.8. MULTILINEARE ABBILDUNGEN 75 Korollar 8.7.12 (Konstante Abbildung) Sind (V, k · kV ) und (W, k · kW ) Banachräume, U ⊂ V offen und zusammenhängend, ferner sei f : U → W differenzierbar, Df (v) = 0 für alle v ∈ U , dann ist f konstant auf U . 8.8 Multilineare Abbildungen In diesem Abschnitt wollen wir die iterierten linearen Abbildungen, d. h. die Elemente in Lk (V ; W ) mit multilinearen Abbildungen identifizieren. Definition 8.8.1 (Multilineare Abbildungen) Es seien (Vj , k · kVj ), (W, k · kW ), j = 1, . . . , k Banachräume, wir setzen V = V1 × · · · × Vk . Man beachte, dass V auf natürliche Weise zum Banachraum wird. Eine Abbildung M:V →W heißt k-linear von V nach W , wenn M in jeder Komponente linear ist. Eine Abbildung heißt multilinear, wenn es ein k ∈ N gibt, so dass die Abbildung k-linear ist. M k (V ; W ) bezeichnen wir die Menge der stetigen, k-linearen Abbildungen. Satz 8.8.2 (Stetigkeit) Eine k-lineare Abbildung Mk : V k → W ist genau dann stetig, wenn es eine positive reelle Konstante K gibt mit kMk (v1 , . . . , vk )kW ≤ Kkv1 kV · · · · · kvk kV . Beweis. Wir wissen aus den Übungen, dass für lineare Abbildungen Stetigkeit bei 0 und Stetigkeit äquivalent sind. Diese Aussage überträgt sich sofort auf multilineare Abbildungen. Aus der angegebenen Bedingung folgt aber die Stetigkeit in 0 sofort. Aus der Stetigkeit in 0 folgt auch die Existenz dieser Konstanten. Wir werden dies in den Übungen nochmals nachprüfen. Nun sei (V, k · kV ) ein Banachraum. Der zentrale Satz dieses Abschnitts identifiziert die Elemente aus Lk (V ; W ) mit k-linearen Abbildungen. Dazu noch eine Vorüberlegung: E : V × L(V ; W ) : (v, L) 7→ Lv 76 KAPITEL 8. DIFFERENTIALRECHNUNG ist linear in jeder Komponente und stetig, denn wir haben gesehen, dass kEvkW ≤ kLkL(V ;W ) kvkV . Ist nun A : V → L(V ; W ) stetig und linear, v ∈ V , so ist A(v) ∈ L(V ; W ) und wir können die stetige und lineare Abbildung ṽ 7→ A(v)(ṽ) betrachten. Damit haben wir eine Abbildung B(v, ṽ) = A(v)(ṽ). Nun ist B bilinear und wegen k B(v, ṽ)kW = k A(v)(ṽ)kW ≤ k A(v)kL(V ;W ) kṽkV ≤ k A kL(V ;L(V ;W )) kvkV kṽkV stetig, also haben wir eine Abbildung L2 (V ; W ) → M 2 (V ; W ). Da für festes v ∈ V und eine gegebene bilineare Abbildung M2 ∈ M 2 (V ; W ) gilt L(V ; W ) 3 M2 (v, ·) : V → W und damit v 7→ M2 (v, ·) eine Abbildung in L(V ; L(V ; W )) ist, die durch obige Konstruktion auf M2 abgebildet wird. Also sind M 2 (V ; W ) und L2 (V ; W ) kanonisch isomorph. Durch Induktion beweist man den folgenden Satz. Satz 8.8.3 (Isomorphie) Die Räume Lk (V ; W ) und M k (V ; W ) sind kanonisch isomorph (als Banachräume). Kapitel 9 Anwendungen der Differentialrechnung In diesem Kapitel widmen wir uns einigen wichtigen Anwendungen der höherdimensionalen Analysis, speziell dem wichtigen Satz über implizite Funktionen und dessen Anwendungen. Den Einstieg bildet der sogenannte Banachsche Fixpunktsatz. Am Ende des Kapitels werden wir Extrema mit Nebenbedingungen und parameterabhängige Integrale besprechen. Inhalt 9.1 9.1 Der Fixpunktsatz von Banach . . . . . . . . . . . . . . 77 9.2 Der Satz über implizite Funktionen . . . . . . . . . . 81 9.3 Extrema mit Nebenbedingungen . . . . . . . . . . . . 91 9.4 Parameterabhängige Integrale . . . . . . . . . . . . . . 96 Der Fixpunktsatz von Banach In diesem kurzen Abschnitt wollen wir nur einen Satz beweisen, der allerdings so bedeutend ist, dass wir ihm einen ganzen Abschnitt widmen wollen. Dieser Satz wird oft als Fixpunktsatz von Banach zitiert. Satz 9.1.1 (Banach) Sei (X, d) ein vollständiger metrischer Raum, T : X → X eine Abbildung, die überall definiert sei, so dass es ein 0 ≤ θ < 1 gibt, so dass für je zwei Punkte x, y ∈ X gilt d(T x, T y) ≤ θd(x, y). 77 78 KAPITEL 9. ANWENDUNGEN DER DIFFERENTIALRECHNUNG Dann gibt es genau einen Punkt x0 ∈ X mit der Eigenschaft T x0 = x0 . Definition 9.1.2 (Fixpunkt) 1. Ein Punkt mit der Eigenschaft T x0 = x0 heißt Fixpunkt der Abbildung T. 2. Eine Abbildung mit der im Satz angegebenen Eigenschaft d(T x, T y) ≤ θd(x, y) wird als Kontraktion bezeichnet, die Zahl 0 ≤ θ < 1 als Kontraktionszahl. Abbildung 9.1: Stefan Banach (30.3.1892–31.8.1945) Beweis. Wir beweisen den Fixpunktsatz von Banach in drei Schritten, zunächst zeigen wir die Eindeutigkeit des Fixpunktes, dann identifizieren wir den verdächti” gen“ Punkt, danach zeigen wir, dass dieser Punkt tatsächlich ein Fixpunkt ist. (1) Eindeutigkeit Angenommen wir hätten zwei Fixpunkte x0 , y0 der Abbildung T . Dann haben wir d(x0 , y0 ) = d(T x0 , T y0 ) ≤ θd(x0 , y0 ). Daraus folgt nun, da θ < 1 ist, dass d(x0 , y0 ) = 0 ist, und mit (M1), dass x0 = y0 ist. 9.1. DER FIXPUNKTSATZ VON BANACH 79 (2) Konstruktion Wir wählen einen Punkt x1 ∈ X und betrachten die Folge {x1 , x2 = T x1 , x3 = T x2 = T 2 x1 , x4 = T x3 , . . . }, die rekursiv für i ∈ N durch xi+1 = T xi definiert wird. Eine triviale Induktion zeigt, xi+1 = T i x1 für i ∈ N und d(T i x, T i y) ≤ θi d(x, y). Wir beweisen nun, dass die Folge {xi }i∈N eine Cauchyfolge ist, d. h. zu jedem ε > 0 gibt es ein N ∈ N mit n, m > N impliziert d(xn , xm ) < ε. Sei ε > 0 gegeben, wähle N , so dass (1 − θ)ε . θN −2 < d(x1 , x2 ) Dann gilt für m ≥ n > N aufgrund der Dreiecksungleichung und der oben erwähnten Induktion d(xn , xm ) ≤ d(xn , xn+1 ) + d(xn+1 , xn+2 ) + · · · + d(xm−1 , xm ) = d(T n−1 x1 , T n−1 (T x1 )) + · · · + d(T m−2 x1 , T m−2 (T x1 )). Damit ist d(xn , xm ) ≤ m−n X d(T n−2+j x1 , T n−2+j x2 ) j=1 ≤ m−n X θn−2+j d(x1 , x2 ) j=1 ≤ θ n−2 d(x1 , x2 ) m−n X θj j=1 ≤ θn−2 d(x1 , x2 ) ∞ X θj j=0 n−2 θ d(x1 , x2 ) 1−θ θN −2 ≤ d(x1 , x2 ) 1−θ (1 − θ)ε d(x1 , x2 ) < d(x1 , x2 ) 1 − θ = ε. = Da X vollständig ist, ist die Cauchyfolge {T j−1 x1 }j∈N = {xj }j∈N konvergent. Wir setzen x0 = lim xj . j→∞ 80 KAPITEL 9. ANWENDUNGEN DER DIFFERENTIALRECHNUNG (3) Fixpunkteigenschaft Wir müssen jetzt noch zeigen, dass x0 ein Fixpunkt der Abbildung T ist. Aufgrund unserer Überlegung in Beispiel 4.2.5 ist T stetig. Wir betrachten d(T x0 , x0 ) = d(T ( lim T j−1 x1 ), x0 ) = d( lim T (T j−1 x1 ), x0 ) j→∞ j→∞ j = d( lim T x1 , x0 ) = d(x0 , x0 ) = 0. j→∞ Also ist T x0 = x0 und der Satz ist damit gezeigt. Wir wollen nun einen vergleichbaren Satz beweisen, wenn die Abbildung stetig von einem weiteren Parameter abhängt. Speziell soll gezeigt werden, dass dann der Fixpunkt stetig von dem weiteren Parameter abhängig ist. Satz 9.1.3 (Stetige Abhängigkeit des Fixpunktes) Es seien (X, dX ), (Y, dY ) metrische Räume, X sei vollständig, T :X ×Y →X sei stetig und für jedes feste y ∈ Y eine Kontraktion mit Kontraktionszahl 0 ≤ θy < 1. Wir setzen voraus, dass es eine Zahl θ < 1 gibt, so dass für alle y ∈ Y gilt 0 ≤ θy ≤ θ < 1, d. h. die Kontraktionszahlen sind gleichmäßig von 1 wegbeschränkt. Dann hängt der nach Satz 9.1.1 existierende Fixpunkt xy stetig von y ab. Beweis. Sei ε > 0 gegeben, y0 ∈ Y und x0 sei der Fixpunkt der Abbildung T (·, y0 ). Sei δ > 0, so dass dY (y, y0 ) < δ, dX (x, x0 ) < δ impliziert dX (T (x, y), T (x0 , y0 )) < ε(1 − θ). Sei y ∈ Y , so dass d(y, y0 ) < δ und xy sei der Fixpunkt der Abbildung T (·, y) : X → X. Dann ist d(x0 , xy ) = d(T (x0 , y0 ), T (xy , y)) ≤ d(T (x0 , y0 ), T (x0 , y)) + d(T (x0 , y), T (xy , y)) ≤ ε(1 − θ) + θy d(x0 , xy ) ≤ ε(1 − θ) + θd(x0 , xy ). Damit folgt (1 − θ)d(x0 , xy ) ≤ ε(1 − θ). Insbesondere gilt d(x0 , xy ) < ε. 9.2. DER SATZ ÜBER IMPLIZITE FUNKTIONEN 9.2 81 Der Satz über implizite Funktionen In diesem Abschnitt beweisen wir einen der zentralen Sätze der Theorie und wir wollen diesen Satz anhand einiger Anwendungen motivieren. Beispiel 9.2.1 (Abhängigkeit von Parametern) (1) Wir wollen die Entwicklung eines Kapitals mit konstanter Ansparrate A und konstantem Zinssatz p > 0 betrachten, wobei wir von einer kontinuierlichen Verzinsung ausgehen. Es sei K0 ein Grundkapital und K(T, p, A) das Kapital zum Zeitpunkt T > 0. Es errechnet sich durch folgende Formel A A pT − . K(T, p, A) = e K0 + p p Betrachtet man den Fall p = 0, so muss man den Satz von l’Hospital (Satz 5.6.2) heranziehen. Im Kapitel 11 werden wir die Begründung für diese Formel kennenlernen. Wählen wir p = 0.03, A = 30 und K0 = 1000, so ergibt sich mit log(10.5) T = p ein Endkapital von 20000. Die Abhängigkeit von p, A wird durch Abbildung 9.2 klar. Wir stellen uns nun die Frage, ob wir bei bei veränderten Zinssatz, die Ansparrate so verändern können, dass bei gleicher Endzeit das gleiche Kapital erzielt wird. Andere Varianten der Frage lassen sich leicht formulieren. (2) Eine Rakete der Masse m(t) und Anfangsmasse m0 steige senkrecht auf, die Schubkraft sei F = cβ mit β als Massendurchsatz der Triebwerke und c der äquivalenten Ausströmgeschwindigkeit. Dann berechnet sich die Höhe der Rakete zum Zeitpunkt t > 0 zu m m(t) 1 , h(c, β, m0 , t) = − g0 t2 + ct + c log 2 β m0 wobei m(t) = m0 − βt und g0 die Erdbeschleunigung bezeichne. Wir fassen h = h(c, β, m0 , t) als Funktion von vier Variablen auf und stellen die Frage, ob bei verändertem m00 > 0, c0 , β 0 (ein) Wert(e) t0 existier(t)en, so dass die gleiche Höhe erreicht wird, also dass die Beziehung h(c0 , β 0 , m00 , t0 ) = h(c, β, m0 , t) gilt. Ist t der Zeitpunkt zu dem die Rakete die Scheitelhöhe erreicht, so ist ∂h = 0 und es ist einsichtig, dass z. B. eine Erhöhung von m0 dazu führt, ∂t dass diese Höhe nicht erreicht wird. Ist man zum Zeitpunkt t nicht an der Scheitelhöhe (d. h. ∂h 6= 0), so führt eine geringfügigen Änderung der ande∂t ren Parameter dazu, dass die gegebene Höhe etwas früher oder etwas später erreicht wird. 82 KAPITEL 9. ANWENDUNGEN DER DIFFERENTIALRECHNUNG (3) Wir betrachten die Funktion f : R × R → R : (x, y) 7→ x2 + y 2 . Für √ x0 = y0 = 22 gilt f (x, y) = 1. Lokales Auflösen ist nach beiden Variablen möglich, für x1 = 0, y1 = 1 ist lokales Auflösen nach x nicht möglich. K K(p,A,T) p (p,A) A Abbildung 9.2: Kapital zum Zeitpunkt T > 0 in Abhängigkeit vom Zinssatz p und der Sparrate A Die angegebenen Beispiele deuten darauf hin, dass es interessant sein kann, Gleichungen der Form f (x, y) = c zu lösen, so dass man zu jedem x in der Nähe einer bekannten Lösung ein entsprechendes y = y(x) finden kann, das diese Gleichung löst. Man sagt die Lösungsfunktion y = y(x) sei durch die Gleichung f (x, y) = c implizit gegeben. Wichtig ist dabei, dass wir in der Nähe einer uns bereits bekannten Lösung arbeiten. Da für allgemeine Gleichungen eine solche Auflösung y = y(x) oft nicht explizit angegeben werden kann, wollen wir zumindest die Existenz einer solchen Funktion beweisen und eventuell sogar ihre Ableitung bzw. das Taylorpolynom eines gewissen Grades einer solchen Funktion bestimmen. Es stellt sich heraus, dass diese Informationen für viele Anwendungen ausreichend sind, d. h. eine genaue analytische Darstellung von y = y(x) nicht notwendig ist. Der Satz, der die Existenz solcher implizit gegebenen Funktionen garantiert, wird, naheliegenderweise, als Satz über implizite Funktionen (engl. implicit function theorem) bezeichnet. Leider verdeckt die technisch präzise Formulierung etwas den eher elementaren Inhalt des Satzes. Wir wollen zwei Sätze angeben, die jeweils einen Teil des Satzes über implizite Funktionen darstellen: die Existenz einer solchen Funktion und deren Stetigkeit, die Differenzierbarkeit und die Berechnung der Ableitung. 9.2. DER SATZ ÜBER IMPLIZITE FUNKTIONEN 83 Die Grundfrage bei der Anwendung des Satzes über implizite Funktionen betrifft immer die folgende Situation: Wir haben eine Funktion f :V →Z und eine Stelle x0 ∈ V mit f (x0 ) = a, wie sieht für eine kleine Zahl δ > 0 die Menge n o L = x ∈ V kx − x0kV < δ, f (x) = a aus? Wäre f linear, V, Z endlich dimensional, so wüssten wir die Antwort aus der linearen Algebra: Diese Menge wäre der Schnitt eines affinen Unterraums mit der δ-Kugel um x0 , wobei die Dimension des Unterraumes von den Dimensionen n von V , m von Z und dem Rang von f abhängt. Noch ein Wort zur Notation: Für eine stetig differenzierbare Abbildung f : U × V → Z, U offen in X, V offen in Y ist für festes y0 ∈ V die Abbildung hy0 : U → Z : x 7→ f (x, y0 ) differenzierbar. Wir setzen Dx f (x0 , y0 ) = Dhy0 (x0 ) und bezeichnen dies als Differential bezüglich der ersten Variablen. Entsprechend lassen sich Differentiale bezüglich der zweiten und eventuell weiterer Variablen bilden. In der Literatur ist es oft gebräuchlich dafür auch D1 f (x0 , . . . ) bzw. Dj f (x0 , . . . ) zu schreiben, um auf die Ableitung bezüglich der ersten bzw. jten Variablen hinzuweisen. Solange wir die Variablen unterschiedlich bezeichnen, sind die Schreibweisen äquivalent. Wir nennen dies auch partielle Ableitung bzgl. der entsprechenden Variablen. Satz 9.2.2 (Satz über implizite Funktionen, Teil 1: Existenz) Es seien (X, k · kX ), (Y, k · kY ), (Z, k · kZ ) Banachräume, U ⊂ X, V ⊂ Y und f : U × V → Z sei stetig differenzierbar. Es sei für x0 ∈ U , y0 ∈ V f (x0 , y0 ) = a und die Ableitung Dx f (x0 , y0 ) : X → Z sei invertierbar und Dx f (0, 0)−1 sei stetig. Dann gibt es Umgebungen Ω ⊂ U von x0 und Γ ⊂ V von y0 und eine Abbildung g : Γ → Ω mit der Eigenschaft: 1. f (g(y), y) = a für alle y ∈ Γ. 2. Ist (x, y) ∈ Γ × Ω mit f (x, y) = a, so ist x = g(y). Ferner gilt: g ist stetig. 84 KAPITEL 9. ANWENDUNGEN DER DIFFERENTIALRECHNUNG Bemerkung 9.2.3 (Stetigkeit der inversen Abbildung) Die Forderung, dass Dx f (0, 0)−1 stetig ist, ist an sich überflüssig, endlich dimensional ist dies offensichtlich, im Banachräumen folgt dies aus dem sogenannten Satz von der offenen Abbildung, der als einer der wichtigen Sätze von Banach gilt. Dieser wird typischerweise in der Vorlesung Funktionalanalysis bewiesen und ist uns deshalb an dieser Stelle noch nicht bekannt. Beweis. (0) Vorbemerkung. Wir betrachten die Linearisierung Dx f (x, y) für (x, y) in der Nähe von (x0 , y0 ). Diese Abbildung (x, y) 7→ Dx f (x, y) ist stetig, denn laut Voraussetzung sind alle partiellen Ableitungen stetig. (1) Konstruktion der Abbildung. Laut Voraussetzung ist die lineare Abbildung Dx f (x0 , y0 ) invertierbar. OBdA setzen wir voraus, dass (x0 , y0 ) = (0, 0) und a = 0 ist (dies kann erreicht werden durch eine Verschiebung des Problems um den entsprechenden Vektor). Setze dazu f˜(x, y) = f (x0 + x, y0 + y) − f (x0 , y0 ). Dann ist f˜(0, 0) = 0. Definiere T(x, y) = x − (Dx f (0, 0))−1 f (x, y). Diese Abbildung ist auf U × V stetig, da Dx f (0, 0)−1 stetig ist und gleiches für f gilt. (2) Konstruktion einer Menge, die in sich abgebildet wird. Zeige: Es gibt δ > 0, δ1 > 0, so dass für alle y ∈ V mit kykY < δ1 die Abbildung die δ-Kugel um 0 in U in sich abbildet, d. h. T (·, y) : Bδ (0) → Bδ (0). Beweis dieser Behauptung: T (·, y) ist für fest gewähltes y ∈ V differenzierbar und Dx T (0, 0) = 1l − (Dx f (0, 0))−1 Dx f (0, 0) = 0. Daher existiert nach unserer Vorbemerkung ein δ > 0, so dass sowohl in X Bδ (0) ⊂ U wie in Y Bδ (0) ⊂ V gilt und für kxkX < δ, kykY < δ kDx T (x, y)kL(X) < 1 2 gilt. Dann ist für solche kxkX < δ, kykY < δ kT (x, y)kX ≤ kT (x, y) − T (0, y)kX + kT (0, y) − T (0, 0)kX . 9.2. DER SATZ ÜBER IMPLIZITE FUNKTIONEN 85 n o Den ersten Term können wir durch δ sup kDx T (ξ, y)kL(X) ξ ∈ S(0, x) ≤ 2δ abschätzen (unter Verwendung des Allgemeinen Mittelwertsatzes 8.7.11). Der zweite Teil folgt aus der Stetigkeit von T auf {0} × Bδ (0). Daher existiert ein 0 < δ1 ≤ δ, so dass kykY ≤ δ1 impliziert kT (0, y) − T (0, 0)kX < 2δ . Dann ist insgesamt kT (x, y)kX ≤ δ, falls kxkX < δ und kykY < δ1 . Daher bildet T : Bδ (0) × Bδ1 (0) → Bδ (0) ab (nach Satz 4.2.6 Teil 3). (3) Nachweis der Kontraktionseigenschaft. T ist für alle y ∈ Bδ1 (0) eine Kontraktion auf Bδ (0). Sind x1 , x2 ∈ Bδ (0), so ist für kykY < δ1 1 kT (x1 , y) − T (x2 , y)kX ≤ kx1 − x2 kX , 2 denn die Ableitung genügt der Bedingung kDx T (·, y)kL(X;Y ) ≤ 21 und die Abschätzung folgt wieder aus Satz 8.7.11. Die Kontraktionsrate 12 ist unabhängig von y ∈ Bδ1 (0) und damit existiert nach dem Banachschen Fixpunktsatz 9.1.1 ein eindeutiger Fixpunkt von T (xy , y) = xy und nach Satz 9.1.3 ist die Abbildung y 7→ xy stetig. Wir setzen g : Bδ1 (0) → Bδ (0) : g(y) = xy und erhalten T (g(y), y) = g(y). Nach der Eindeutigkeitsaussage im Banachschen Fixpunktsatz gibt es keine weiteren Fixpunkte. (4) Auflösungseigenschaft. Wir wollen noch sehen, dass f (g(y), y) = 0. Da g(y) = T (g(y), y) = g(y) − (Dx f (0, 0))−1 f (g(y), y) folgt (Dx f (0, 0))−1 f (g(y), y) = 0 und damit f (g(y), y) = 0. (5) Ausschluss weiterer Lösungen. Ist f (x, y) = 0, so ist T (x, y) = x − (Dx f (0, 0))−1 0 und damit ist x Fixpunkt von T (·, y), also x = g(y). 86 KAPITEL 9. ANWENDUNGEN DER DIFFERENTIALRECHNUNG Satz 9.2.4 (Satz über implizite Funktionen, Teil 2: Differenzierbarkeit) Es seien U ⊂ X, V ⊂ Y offen und f : U × V → Z stetig differenzierbar. Es sei für x0 ∈ U , y0 ∈ V f (x0 , y0 ) = 0 und die Ableitung Dx f (x0 , y0 ) : X → Z sei invertierbar mit stetiger Inverse. Gibt es Umgebungen Ω ⊂ U von x0 und Γ ⊂ V von y0 und eine stetige Abbildung g : Γ → Ω mit der Eigenschaft f (g(y), y) = 0 für alle y ∈ Ω, so ist g differenzierbar im Punkt y0 . Beweis. Wiederum ist es keine Beschränkung der Allgemeinheit anzunehmen, dass der Punkt (x0 , y0 ) = (0, 0) ist. Auf X × Y schreiben wir q k(x, y)kX×Y = kxk2X + kyk2Y für die übliche Norm. Wir prüfen die Differenzierbarkeit von g nach, indem wir g in der Form g(y) = −(Dx f (0, 0))−1 Dy f (0, 0)y + ψ(y) schreiben und zeigen, dass 1 ψ(y) = 0 y→0 kykY lim ist. Damit haben wir dann die Linearisierung im Nullpunkt bestimmt. Wir beginnen mit einer Darstellung von f in der Form f (x, y) = Dx f (0, 0)x + Dy f (0, 0)y + R(x, y) (9.1) kR(x, y)kZ = 0. (x,y)→0 k(x, y)kX×Y (9.2) mit lim Für y ∈ Ω gilt nun 0 = f (g(y), y) = Dx f (0, 0)g(y) + Dy f (0, 0)y + R(g(y), y). Damit erhalten wir eine Darstellung von g in der Form g(y) = −Dx f (0, 0)−1 (Dy f (0, 0)y + R(g(y), y)) . 9.2. DER SATZ ÜBER IMPLIZITE FUNKTIONEN 87 Mit der oben angegebenen Linearisierung hat nun ψ(y) die Gestalt ψ(y) = −Dx f (0, 0)−1 R(g(y), y). Will man dies nun abschätzen, so reicht es nicht aus, dass g(0) = 0 ist und g stetig ist, sondern man benötigt noch, dass 1 g(y) kykY für y → 0 beschränkt ist. Dazu zeigen wir, dass g einer Abschätzung der Form kg(y)kX ≤ KkykY (9.3) genügt mit einer geeigneten Konstanten K > 0. Dafür ist der Ausgangspunkt die oben angegebene Formel für g. Wir beginnen mit einer Abschätzung für R. Wegen (9.2) gibt es ein δ > 0, so dass kxkX , kykY < δ impliziert 1 kR(x, y)kZ ≤ k(Dx f (0, 0)−1 k−1 L(Z;X) , k(x, y)kX×Y 2 also 1 kR(x, y)kZ ≤ kDx f (0, 0)−1 k−1 L(Z;X) k(x, y)kX×Y 2 1 ≤ kDx f (0, 0)−1 k−1 L(Z;X) (kxkX + kykY ). 2 (9.4) (9.5) Die Stetigkeit von g impliziert, dass ein 0 < δ1 < δ existiert mit kg(y)kX < δ für kykY < δ1 . Dann ist für kykY < δ1 1 kR(g(y), y)kZ ≤ kDx f (0, 0)−1 k−1 L(Z;X) (kg(y)kX + kykY ). 2 Nun bekommen wir aus der obigen Gleichung (9.1), dass 0 = f (g(y), y) = Dx f (0, 0)g(y) + Dy f (0, 0)y + R(g(y), y), also g(y) = −(Dx f (0, 0))−1 Dy f (0, 0)y − (Dx f (0, 0))−1 R(g(y), y). Damit erhalten wir aus (9.4) 1 kg(y)kX ≤ k(Dx f (0, 0))−1 Dy f (0, 0)kL(Y ;Z) kykY + (kg(y)kY + kykY ). 2 88 KAPITEL 9. ANWENDUNGEN DER DIFFERENTIALRECHNUNG Durch Umschreiben erhalten wir kg(y)kX ≤ (2k(Dx f (0, 0))−1 Dy f (0, 0)kL(Y ;X) + 1)kykY . Damit ist die Zwischenbehauptung (9.3) gezeigt. Nun ist ψ aufgrund der obigen Gleichung gegeben durch ψ(y) = −(Dx f (0, 0))−1 R(g(y), y). Damit lässt sich der Quotient abschätzen durch 1 1 kψ(y)kX ≤ kDx f (0, 0))−1 kL(Z;X) kR(g(y), y)kZ kykY kykY p kg(y)k2X + kyk2Y kR(g(y), y)kZ −1 ≤ kDx f (0, 0) kL(Z;X) p . kykY kg(y)k2X + kyk2Y √ −1 kg(y)k2 +kyk2 X Y Da kDx f (0, 0)) kL(Z;X) eine Konstante ist, beschränkt ist und kykY der verbleibende Teil gegen 0 konvergiert, erhalten wir die behauptete Konvergenzaussage und die Differenzierbarkeit von g. Das Differential von g ist aufgrund der gleichen Rechnung gegeben durch Dg(0) = −Dx f (0, 0))−1 Dy f (0, 0). Lemma 9.2.5 (Differenzierbarkeit der Inversen) Es sei U ⊂ X ein Gebiet in einem Banachraum (X, k·kX ) und A : U → L(X) sei eine k-fach stetig differenzierbare Abbildung, für ein x0 ∈ U sei A(x0 ) stetig invertierbar. Dann gibt es ein δ > 0, so dass die Abbildung A−1 : Bδ (x0 ) → L(X) : x 7→ A(x)−1 eine C k -Abbildung ist. Beweis. Wir zeigen in den Übungen, dass für ein hinreichend kleines δ > 0 A(x)−1 für x ∈ Bδ (x0 ) durch eine absolut konvergierende Reihe dargestellt werden kann. Setzt man dort eine C k -Funktion ein, so ergibt sich eine C k -Funktion. Korollar 9.2.6 (Satz über implizite Funktionen, Teil 3: Glattheit) Unter den Voraussetzungen der Sätze 9.2.2, 9.2.4 und unter der Annahme f ∈ C k (U × V ; Z) ist die Funktion g auch k-fach stetig differenzierbar. 9.2. DER SATZ ÜBER IMPLIZITE FUNKTIONEN 89 Beweis. Der Beweis erfolgt durch vollständige Induktion. Angenommen wir hätten den Satz für k − 1 gezeigt. Dann ist wegen f (g(y), y) = 0 auch 0 = Dy f (g(y), y) = D1 f (g(y), y)Dy g(y) + D2 f (g(y), y). Damit ist Dy g(y) = − (D1 f (g(y), y))−1 D2 f (g(y), y). Also ist die rechte Seite C k−1 , dies ist aufgrund der angegebenen Gleichung die erste Ableitung von g, also ist g ∈ C k (Bδ (x0 ); L(X)). Fragt man sich, wann differenzierbare Funktionen invertierbar sind, erlaubt einem die eben hergeleitete Beziehung eine einfache notwendige Bedingung zu finden. Existiert f −1 und ist dies differenzierbar, so gilt f −1 (f (x)) = x und die Differentiation dieser Formel liefert sofort D(f −1 )(f (x))Df (x) = 1l, also D(f −1 )(f (x)) ist invertierbar und D(f −1 )(f (x)) = (Df (x))−1 . Dass die Invertierbarkeit des Differentials auch hinreichend für die Umkehrbarkeit der Funktion ist, folgt aus dem nachfolgenden Satz. Satz 9.2.7 (Umkehrsatz) Es seien (X, k · kX ), (Y, k · kY ) ein Banachräume. Ferner sei U ⊂ X offen, f : U → Y differenzierbar. Ist Df (x0 ) stetig invertierbar, so gibt es eine Umgebung U1 ⊂ U von x0 und V ⊂ Y von f (x0 ), so dass f : U1 → V eine differenzierbare Bijektion ist mit f −1 : V → U1 differenzierbar und es gilt D(f −1 )(f (x)) = (Df (x))−1 . Beweis. Für x ∈ U und y ∈ Y setzen wir F(x, y) = y − f (x). Dann ist F(x0 , f (x0 )) = 0 und Dx F(x, y) = −Df (x). 90 KAPITEL 9. ANWENDUNGEN DER DIFFERENTIALRECHNUNG Daher ist Dx F(x, y) im Punkt (x0 , f (x0 )) stetig invertierbar, also gibt es Umgebungen Γ von f (x0 ) = y0 und Ω von x0 und eine Abbildung g : Γ → Ω mit F (g(y), y) = 0 oder x = g(y). Nach der Vorbemerkung oder der im Satz über implizite Funktionen angegebenen Formel gilt Dg(y0 ) = (Df (x0 ))−1 . Definition 9.2.8 Sind U ⊂ Rn , V ⊂ Rm offen und Ψ : U → V eine differenzierbare Bijektion, so dass Ψ, Ψ−1 stetig differenzierbar sind, dann heißt Ψ Diffeomorphismus. Beispiel 9.2.9 (Polarkoordinaten) Wir betrachten die Abbildung Φ : [0, ∞) × R → R : (r, ϕ) 7→ 2 r cos ϕ r sin ϕ . Für r > 0 gilt 0 Φ (r, ϕ) = cos ϕ −r sin ϕ sin ϕ r cos ϕ . Die Determinante dieser Jacobimatrix ist cos ϕ −r sin ϕ det = r(cos2 ϕ + sin2 ϕ) = r > 0. sin ϕ r cos ϕ Demzufolge ist der Umkehrsatz anwendbar, auf jeder Menge der Form R+ × (a − π, a + π) ist Φa = Φ : R+ × (a − π, a + π) → R2 ein Diffeomorphismus mit Bild cos a 2 R \ t sin a t ≥ 0 . Die Umkehrabbildung von Φa ist Φ−1 a (x) = ( q x21 + x22 , ϕ), x2 , sin ϕ = p 2 und ϕ ∈ (a−π, a+π). Für a = 0 + x1 + x22 nennt man die Paare (r, ϕ) die Polarkoordinaten des Punktes x ∈ R2 . wobei cos ϕ = p x1 x21 x22 Typisch für den Satz über implizite Funktionen ist eine lokale Aussage, man beschreibt die Lösungsmenge einer Gleichung in der Nähe einer gegebenen Lösung, 9.3. EXTREMA MIT NEBENBEDINGUNGEN 91 insofern ist der folgende Satz als Prototyp einer anderen Entwicklung zu sehen. Es ist die einfachste Version eines solchen Satzes, formuliert wurden Sätze mit dieser Zielrichtung in der siebziger Jahren des 20 Jahrhunderts. Wir benötigen dazu noch einen Begriff. Definition 9.2.10 (Zusammenhangskomponente) Es sei (X, d) ein metrischer Raum A ⊂ X eine nichtleere Teilmenge, x ∈ A sei gegeben. Die Zusammenhangskomponente Cx (A) von A des Punktes x ist gegeben als [ Cx (A) = T. T ⊂A:T ist zusammenhängend Satz 9.2.11 (Satz über implizite Funktionen: globale Version) Es sei (X, k · kX ) ein Banachraum, U ⊂ X ein Gebiet, h : U → R sei im Punkt x0 ∈ U differenzierbar, h(x0 ) = 0 und Dh(x0 ) 6= 0. Dann zerlegt die Menge h−1 (0), die den Punkt x0 enthält, das Gebiet U in mindestens zwei Komponenten, d. h. sei C = h−1 (0), so besitzt U \ C mindestens zwei Komponenten. Beweis. C = h−1 (0) 6= U ist abgeschlossen in U (d. h. bzgl. des metrischen Raumes (U, d), wobei d die zur Norm in X gehörende Metrik ist). U \ C 6= ∅ ist daher offen. Damit ist gleichwertig (Aufgabe 2 auf Blatt 20), dass U \ C zusammenhängend und U \ C wegezusammenhängend ist. Angenommen der Satz ist falsch. Dann ist U \ C wegezusammenhängend. Es gibt Punkte x1,2 ∈ U \ C mit h(x1 ) > 0 > h(x2 ). Dann gibt es einen Weg γ : [0, 1] → U \ C mit γ(0) = x1 , γ(1) = x2 . Wegen der Stetigkeit von h ◦ γ und der Tatsache, dass h ◦ γ(0) > 0 > h ◦ γ(1) ist, gibt es ein τ ∈ (0, 1) mit h ◦ γ(τ ) = 0. Dann ist h(γ(τ ) = 0 und γ(τ ) ∈ C. Dies liefert einen Widerspruch, der den Satz beweist. 9.3 Extrema mit Nebenbedingungen In diesem Abschnitt wollen wir die Maxima und Minima von Funktionen bestimmen, allerdings nicht auf einer offenen Menge, sondern auf einer durch Gleichungen definierten Teilmenge. Zur Motivation wieder ein paar Beispiele. 92 KAPITEL 9. ANWENDUNGEN DER DIFFERENTIALRECHNUNG Beispiel 9.3.1 (Nebenbedingungen) 1. Zunächst beginnen wir mit dem Paradebeispiel der Wanderung im Gebirge. Wir beschreiben den Wanderweg als Bild einer Kurve auf der Landkarte und suchen nach dem Punkt der höchsten (geringsten) Höhe über NN längs des Weges. x1 2. Wir betrachten die Menge der Zahlenpaare xi > 0 als x2 Kantenlängen von Rechtecken. Suchen wir nun unter denen gleicher Fläche h(x) = x1 x2 = c das maximaler Kantenlänge L = 2(x1 + x2 ), so lösen wir das Problem: Maximiere L unter der Nebenbedingung h = c. 3. Ein Zug fahre von A nach B, wobei der Abstand der beiden Stationen d > 0 sei. Als Steuermöglichkeit kann der Zugführer die Beschleunigungen −a, 0, a für eine Zahl a > 0 wählen, wobei er die Zeitintervalle der Beschleunigung auswählt, d. h. er bestimmt eine Treppenfunktion ϕ, die nur die Werte a, 0, −a annimmt, so dass mit v 0 (t) = ϕ(t) gilt Z∞ v(t) dt = d, 0 (dies ist die Bedingung, dass die zurückgelegte Strecke d ist). In der ökologischen Variante will er nun unter der angegebenen Bedingung mit minimalen Energieverbrauch, in der ökonomischen Variante in möglichst kurzer Zeit ankommen. Dabei ist die Energie (proportional zu) Z∞ E= ϕ+ (t) dt . 0 4. Wir wollen nun eine rein mathematische Bedingung angeben. Angenommen γ(t) sei eine Kurve im R2 , die h = c parametrisiert. Wir suchen eine Extremalstelle x0 einer differenzierbaren Funktion unter der Nebenbedingung h(x) = c. Also ist mit γ(t0 ) = x0 (f ◦ γ)0 (t0 ) = 0 oder h∇f (γ(t0 )), γ 0 (t0 )i = 0. 9.3. EXTREMA MIT NEBENBEDINGUNGEN 93 Da h(γ(t)) = 0 ist, folgt auch h∇h(γ(t0 )), γ 0 (t0 )i = 0 und damit sind ∇f (x0 ) und ∇h(x0 ) linear abhängig. Dieses Beispiel wird Grundlage der weiteren Überlegungen. Satz 9.3.2 (Lagrange-Multiplikator) Es sei (X, k · kX ) ein Banachraum, ferner sei U ⊂ X offen, h : U → R sei eine stetig differenzierbare Abbildung, es sei c ∈ R mit Dh(x) 6= 0 für alle x mit h(x) = c. f : U → R sei stetig differenzierbar. Sei x0 ∈ U mit h(x0 ) = c, so dass ein δ > 0 existiert mit kx − x0 kX < δ und h(x) = c implizieren f (x) ≤ f (x0 ) (d. h. f hat in x0 ein lokales Maximum unter der Nebenbedingung h(x) = c). Dann gibt es ein λ ∈ R mit Df (x0 ) = λDh(x0 ). Definition 9.3.3 (Lagrange-Multiplikator) Die Zahl λ aus dem Satz 9.3.2 heißt Lagrange-Multiplikator. Beweis. Sei x0 wie im Satz 9.3.2 angegeben. Da h(x0 ) = c ist, ist laut Voraussetzung Dh(x0 ) 6= 0. Dann kann man schreiben X = ker Dh(x0 ) ⊕ [y0 ] = K ⊕ Y. K, Y sind mit geeigneten Normen Banachräume, wir schreiben für k ∈ K, y ∈ Y H(k, y) = h(x0 + y + k). Dann ist für H(0, 0) = c und D2 H(0, 0) = Dh(x0 )|Y : Y → R (Ableitung bezüglich der zweiten Variablen) ein Isomorphismus, insbesondere gibt es aufgrund des Satzes über implizite Funktionen, Satz 9.2.2, Umgebungen Γ 3 k, Ω 3 y und g : Γ → Ω mit H(k, g(k)) = c. Betrachte nun F (k, g(k)) = f (x0 + k + g(k)). k 7→ F (k, g(k)) ist auf einer Umgebung von 0 ∈ K definiert und hat bei 0 ein lokales Extremum. Also ist Dk F (0) = 0. Dies impliziert Df (x0 )|K = 0. Betrachten wir nun fx0 0 ,y0 (0) = Df (x0 )(y0 ) ∈ R. 94 KAPITEL 9. ANWENDUNGEN DER DIFFERENTIALRECHNUNG Da Dh(x0 )(y0 ) 6= 0 gibt es eine reelle Zahl λ mit λDh(x0 )(y0 ) = Df (x0 )(y0 ). Für beliebiges x ∈ X ist nun x = k + ty0 . Dann ist Df (x0 )(x) = Df (x0 )(k + ty0 ) = tDf (x0 )(y0 ) = tλDh(x0 )(y0 ) = λDh(x0 )(x). Ganz entsprechend kann man mehrere Nebenbedingungen behandeln. Man erhält dann die nachfolgende Aussage. Satz 9.3.4 (Lokale Extrema und Nebenbedingungen) Es sei (X, k · kX ) ein Banachraum, U ⊂ X offen, h : U → Rk eine stetig differenzierbare Abbildung mit o n Dhi (x) i = 1, . . . , k ist linear unabhängig ∀x mit h(x) = c. Ferner sei f : U → R stetig differenzierbar. Sei x0 ∈ U mit h(x0 ) = c, so dass ein δ > 0 existiert mit kx − x0 kX < δ und h(x) = c implizieren f (x) ≤ f (x0 ) (d. h. f hat in x0 ein lokales Maximum unter der Nebenbedingung h(x) = c). Dann gibt es λi ∈ R, i = 1, . . . , k mit Df (x0 ) = k X λi Dhi (x0 ). i=1 Definition 9.3.5 (Lagrange-Multiplikatoren) Die Zahlen λ1 , . . . , λk heißen Lagrange-Multiplikatoren. Korollar 9.3.6 (Lagrange-Multiplikatoren und Gradienten) Es sei (V, h·, ·iV ) ein Hilbertraum bzw. V = (Rn , h·, ·i2 ). Dann gilt unter den Voraussetzungen des Satzes 9.3.4 ∇f (x0 ) = k X i=1 λi ∇hi (x0 ) . 9.3. EXTREMA MIT NEBENBEDINGUNGEN 95 Bemerkung 9.3.7 (Extremalwerte und Lagrange-Multiplikatoren) Die Bestimmung der Extremwerte von f unter der Nebenbedingung h = c beinhaltet die Bestimmung der Lagrange-Multiplikatoren. Beweis. Sei x0 so eine Extremalstelle mit h = c. Dann sind die linearen Abbildungen Dhi (x0 ) linear unabhängig. Sei K = ker Dh(x0 ) und Y ein Komplementärraum. Beide Räume sind Banachräume und wie zuvor wird K × Y zum Banachraum mit Norm q k(k, y)kK×Y = kkk2K + kyk2Y . K × Y ist isomorph (als Banachraum) zu X. Dann ist Dh(x0 )|Y : Y → Isomorphismus (von Banachräumen). Setze Rk ein H(k, y) = h(x0 + k + y). Dann ist H(0, 0) = c und D2 H(0, 0) : Y → Rk ein Isomorphismus. Daher gibt es Umgebungen 0 3 Γ ⊂ K und 0 3 Ω ⊂ Y und g : Γ → Ω mit H(k, g(k)) = c. Setze für X 3 x = x0 + k + y F (k, y) = f (x0 + k + y). Dann ist für k nahe Null F (k, g(k)) ≤ F (0, 0) und Dk F (0, 0) = 0. Dy F (0, 0) : Y → Rk ist eine lineare Abbildung. Da D2 H(0, 0) : Y → Rk ein Isomorphismus ist, gibt es m X λ1 , . . . , λ m ∈ R : λi Dhi (x0 )|Y = Df (x0 )|Y . i=1 Wie oben ergibt sich Df (x0 ) = m X i=1 λi Dhi (x0 ). 96 KAPITEL 9. ANWENDUNGEN DER DIFFERENTIALRECHNUNG h1 = c 1 h=c h2 = c 2 x0 Abbildung 9.3: Wir betrachten ein Problem mit zwei Nebenbedingungen h1 (x) = c1 , h2 (x2 ) = c2 mit den entsprechenden Gradienten. In gelb sieht man die Niveaufläche einer Funktion f (x) = f (x0 ). Liegen die Niveauflächen zu höheren Niveaus hinter“ dieser, so liegt im Punkt x0 ein lokales Minimum mit Neben” bedingung h = c vor. Der Gradient von f ergibt sich als Linearkombination der Gradienten der hi . 9.4 Parameterabhängige Integrale Mit diesem Abschnitt schließen wir das Kapitel 9 ab. Wir wollen Integrale der Form Zb F (y) = f (x, y) dx a untersuchen, die ihrerseits wieder Funktionen F (y) definieren. Die naheliegende Frage ist, inwieweit sich Stetigkeit bzw. Differenzierbarkeit von f auf F übertragen. Satz 9.4.1 (Stetigkeit des Integrals) Es sei [a, b] ⊂ R ein kompaktes Intervall positiver Länge, U ⊂ Rm offen und f : [a, b] × U → R stetig. Dann ist die Funktion F : U → R : y 7→ Zb f (x, y)dx a stetig. 9.4. PARAMETERABHÄNGIGE INTEGRALE 97 Beweis. Sei y fest, dann gibt es ein δ > 0, so dass [a, b] × Bδ (y) ⊂ [a, b] × U . Die Menge K = [a, b] × Bδ (y) ist kompakt und f ist gleichmäßig stetig auf K (Satz 4.3.9). Daher gibt es zu ε > 0 ein δ1 > 0, so dass k(x, y) − (x0 , y0 )k2 < δ1 impliziert, dass ε . |f (x, y) − f (x0 , y0 )| < b−a Dann ist für ky − y0 k2 < δ1 b Z Zb 0 0 |F (y) − F (y )| = f (x, y) dx − f (x, y ) dx a a b Z 0 = f (x, y) − f (x, y ) dx a Zb ≤ |f (x, y) − f (x, y0 )| dx a Zb ≤ ε ε dx = (b − a) = ε. b−a b−a a Ganz entsprechend behandeln wir die Frage der Differenzierbarkeit. Satz 9.4.2 (Differenzierbarkeit des Integrals) Es sei [a, b], [c, d] ⊂ R kompakte Intervall positiver Länge, f : [a, b] × [c, d] → R stetig und auf (c, d) stetig partiell nach y differenzierbar. Dann ist F (y) : [c, d] → R : y 7→ Zb f (x, y)dx a stetig auf (c, d) differenzierbar 0 Zb F (y) = ∂ f (x, y) dx. ∂y a Beweis. Wir betrachten für y ∈ (c, d), h > 0, so dass y + h ∈ (c, d), Rb F (y + h) − F (y) = h f (x, y + h) dx − a Rb a h f (x, y) dx Zb = a f (x, y + h) − f (x, y) dx. h 98 KAPITEL 9. ANWENDUNGEN DER DIFFERENTIALRECHNUNG Die Funktion f (x, y + h) − f (x, y) h ϕ(x, h) = ∂ f (x, y) ∂y für h>0 für h=0 ist auf [a, b] × [0, H] für ein H > 0 stetig, also gleichmäßig stetig. Damit folgt für die Differenz der Integrale Zb Zb F (y + h) − F (y) f (x, y + h) − f (x, y) ∂f (x, y) ∂f (x, y) dx. − dx ≤ − h ∂y h ∂y a a Wie im vorigen Beweis nutzen wir die gleichmäßige Stetigkeit des Integranden um dieses Integral abzuschätzen. Beispiel 9.4.3 Wir berechnen das Integral Za x2 cos(x) dx. 0 Die wohl geradlinigste Methode wäre eine zweimalige partielle Integration, jedoch kann man dieses Integral auch sehr einfach mittels der parameterabhängigen Integration behandeln. Wir schreiben f (x, y) = cos(xy) und Za F (y) = cos(xy) dx, 0 für 1 2 ≤ y ≤ 2. Nach unserem Satz gilt 00 Za F (y) = x2 cos(xy) dx. 0 Damit ist 00 Za F (1) = 0 x2 cos(x) dx. 9.4. PARAMETERABHÄNGIGE INTEGRALE 99 Das Integral für F lässt sich allerdings auswerten F (y) = Damit ist sin(ay) . y 2 sin(ay) 2a cos(ay) a2 sin(ay) F (y) = . − − y3 y2 y 00 Also hat man Za x2 cos(x) dx = F 00 (1) = (2 − a2 ) sin(a) − 2a cos(a). 0 Wir schließen diese Kapitel ab mit der Beobachtung, dass für eine stetige Funktion von zwei (oder auch mehreren) Variablen f (x, y) auf [a, b] × [c, d] die Funktion Zb F (y) = f (x, y) dx a selbst wieder integrierbar ist. Gleiches gilt für die Funktion Zd G(x) = f (x, y) dy. c Die naheliegende Frage ist nun, ob Zd Zb F (y) dy = c G(x) dx a gilt. Definition 9.4.4 (Doppelintegral) Das Integral Zd F (y) dy c heißt Doppelintegral Zd Zb f (x, y) dx dy c a 100 KAPITEL 9. ANWENDUNGEN DER DIFFERENTIALRECHNUNG der Funktion f . Offensichtlich kann man durch Auswahl der Integrationsreihenfolge verschiedene Doppelintegrale oder Mehrfachintegrale definieren. Satz 9.4.5 (Vertauschbarkeit) Für eine stetige Funktion f : [a, b] × [c, d] → R gilt Zb Zd Zd Zb f (x, y) dx dy = f (x, y) dy dx. c a a c Beweis. Wir definieren eine Funktion Zb Zy ϕ(y) = f (x, t) dt dx. a c Es ist ϕ(c) = 0 und ϕ0 (y) = Zb ∂ ∂y a Zy f (x, t) dt dx. c Dies ist wegen des Hauptsatzes der Differential und Integralrechnung gerade Zb 0 ϕ (y) = f (x, y) dx. a Damit folgt nun Zd Zb Zd Zb Zd f (x, y) dx dy = ϕ0 (y) dy = ϕ(d) = f (x, y) dy dx. c a c a Aufgabe 9.4.6 (Anwendung) Berechnen Sie das Integral Z1 0 x5 − x3 dx. log(x) c 9.4. PARAMETERABHÄNGIGE INTEGRALE 101 Korollar 9.4.7 (Allgemeine Vertauschbarkeit) Es seien [ai , bi ] für i = 1, . . . , n kompakte Intervalle, f : [a1 , b1 ] × · · · × [an , bn ] → R stetig. Dann gilt für jedes Permutation σ ∈ Sn b Zn Zb1 Zb2 . . . f (x1 , x2 , . . . , xn ) dxn . . . dx2 dx1 = a1 an a2 bσ(1) Z = bσ(2) aσ(1) Z aσ(2) bσ(n) Z ... aσ(n) f (x1 , x2 , . . . , xn ) dxσ(n) . . . dxσ(2) dxσ(1) . 102 KAPITEL 9. ANWENDUNGEN DER DIFFERENTIALRECHNUNG Kapitel 10 Banachalgebren In diesem Kapitel befassen wir uns zunächst mit Banachalgebren und mit Potenzreihen in Banachalgebren. Wir charakterisieren Konvergenzradien und führen auf wichtige Entwicklungen in verschiedenen Kontexten hin. Danach beweisen wir den berühmten Satz von Stone-Weierstraß und erhalten den bekannten Approximationssatz von Weierstraß als Konsequenz. Der Vorteil dieses Vorgehens liegt darin, dass die Voraussetzungen des Satzes von Stone-Weierstraß in einer Reihe von weiteren wichtigen Anwendungen leicht nachgeprüft werden können und damit auf einfache Weise ein sehr wichtiger und leicht anwendbarer Satz entsteht. Inhalt 10.1 Algebren . . . . . . . . . . . . . . . . . . . . . . . . . . . 103 10.2 Potenzreihen . . . . . . . . . . . . . . . . . . . . . . . . 105 10.3 Der Satz von Stone-Weierstraß . . . . . . . . . . . . . 111 10.4 Fourierreihen . . . . . . . . . . . . . . . . . . . . . . . . 117 10.1 Algebren Gemeinsam für die reellen Zahlen, die komplexen Zahlen und die n × n-Matrizen ist: eine additive Struktur, eine multiplikative Struktur mit jeweiligen Assoziativgesetzen, mit einem Distributivgesetz und die Existenz einer Norm. Da wir in Zukunft nicht immer schreiben wollen, dass ein Satz entweder für R, C oder für die Menge der n × n-Matrizen gelten soll, wollen wir einen gemeinsamen Begriff einführen, der aber ein weit darüberhinausgehendes eigenes Leben entfalten wird. Wir schreiben K für den zugrundeliegenden Körper und meinen damit immer K = R oder K = C. 103 104 KAPITEL 10. BANACHALGEBREN Definition 10.1.1 (Algebra) Eine Algebra A ist ein Vektorraum über K mit einer Multiplikation, so dass das Assoziativgesetz gilt und für λ, µ ∈ K und x, x1 ,x2 , y, y1 , y2 ∈ A gilt (A1) (λx1 + µx2 )y = λ(x1 y) + µ(x2 y), (A2) x(λy1 + µy2 ) = λ(xy1 ) = µ(xy2 ). Definition 10.1.2 (Banachalgebra) Ist A eine Algebra und k · kA eine Norm auf A mit kxykA ≤ kxkA kykA so sprechen wir von einer normierten Algebra, ist A mit dieser Norm vollständig, so bezeichnen wir A als Banachalgebra. Beispiel 10.1.3 (Beispiele von Banachalgebren) 1. Beispiele für Banachalgebren sind (R, | · |), (C, | · |) und (L(Rn , Rn ), k · kL(Rn ;Rn ) ). 2. Ein weiteres wichtiges Beispiel einer Banachalgebra ist die Menge n o C(X; R) = f : K → R f ist stetig , wobei X ein kompakter metrischer Raum ist. Die Norm ist dabei n o kf kC(X;R) = max |f (x)| x ∈ K . Offensichtlich gilt kf gkC(X;R) ≤ kf k[C(X;R) kgk[C(X;R) . 3. Die Quaternionen Q bilden ein wichtiges Beispiel für eine Algebra. Entsprechend der Erweiterung von R auf C durch Einführen von i, mit i2 = 1 führen wir drei solche Wurzeln von −1 ein: i, j, k und schreiben ein Element der Quaternionen als q = a + b i +c j +d k (10.1) und fassen dies als reellen Vektorraum-Isomorphismus Q mit dem R4 auf. Wir führen die Vertauschungsrelationen k = i j = − j i und davon 10.2. POTENZREIHEN 105 abgeleitet k j = − i usw. ein. Wie in C definiert man zu q das konjugierte Element q̄ = a − b i −c j −d k. Dann gilt q q̄ = a2 + b2 + c2 + d2 = |q|2 = k(a, b, c, d)T k22 . Die Quaternionen bilden einen Schiefkörper, d. h. einen nichtkommutativen Körper, der mehrere isomorphe Bilder von C enthält. Mittels der Quaternionen können andere wichtige mathematische Objekte dargestellt werden: n o S3 = q ∈ Q |q| = 1 bildet bezüglich der Multiplikation eine Gruppe, diese ist isomorph zu SU(2) und eine doppelte Überlagerung von SO(3). Dabei beachten wir, dass S3 auf R4 wirkt, indem wir R4 mit der obigen Gleichung (10.1) mit Q identifizieren und die Wirkung von S3 durch q ∗ ∈ S3 auf q ∈ Q schreiben als q ∗ (q) = q ∗ q q̄ ∗ . Man rechnet leicht nach, dass q ∗ (1) = 1, (klar, da 1 mit allen anderen Quaternionen vertauscht, d. h. 1 ∈ C(S3 )) und wir schreiben R4 = span[1] ⊕ span[i, j, k]. Die Aktion von S3 bildet den dreidimensionalen Raum span[i, j, k] in sich ab, die Aktion ist orthogonal und hat als Kern [−1]. Damit ist SO(3) ≡ S3 /h−1i. Diese Identifikation nennen wir doppelte Überlagerung (d. h. eine stetige Abbildung S3 → SO(3), die surjektiv ist, und so dass jede Bild genau zwei Urbilder hat) und diese ist in der Robotik für die numerische Berechnung von Bewegungen von Roboterarmen essentiell. Auch in der Quantenmechanik spielen die eben angestellten Überlegungen eine wichtige Rolle. Eine sehr schöne Darstellung der modernen Theorie der Quaternionen und ihre Anwendungen in verschiedenen Bereichen der Mathematik findet man in Conway &Smith [5]. 10.2 Potenzreihen Wir kommen nun zur Definition Exponentialfunktion für Matrizen, bevor wir dies in aller Allgemeinheit angehen, wollen wir ein Beispiel betrachten. Beispiel 10.2.1 106 KAPITEL 10. BANACHALGEBREN Wir betrachten die Matrix A= 0 −1 1 0 und berechnen die formale Reihe ∞ X tn n=0 n! An . Dazu beachten wir, dass A2 = −1l und A3 = −A, A4 = 1l ist, also können wir schreiben Aj = Aj mod 4 . Einsetzen der Reihe ergibt ∞ ∞ 2n X X t2n+1 n t n (−1) − (−1) ∞ X (2n)! (2n + 1)! tn n n=0 n=0 A = X ∞ ∞ X n! t2n+1 t2n n=0 (−1)n (−1)n (2n + 1)! (2n)! n=0 n=0 cos(t) − sin(t) = . sin(t) cos(t) Definition 10.2.2 (Potenzreihe) Es sei A eine Banachalgebra über K und an ∈ A für n ∈ N0 . Für x, x0 ∈ A wird ∞ X an (x − x0 )n n=0 als Potenzreihe zum Entwicklungspunkt x0 ∈ A bezeichnet. Lemma 10.2.3 (Konvergenzkreis) P n Ist r > 0 in R, so dass ∞ n=0 kan kA r < ∞, dann konvergiert für kxkA < r (oder allgemeiner für kx − x0 kA < r) die Reihe ∞ X n=0 an x n oder auch ∞ X n=0 an (x − x0 )n 10.2. POTENZREIHEN 107 und es gilt ∞ ∞ ∞ X X X n n an x ≤ kan kA kxkA ≤ kan kA rn . n=0 n=0 A n=0 Beweis. Wir betrachten die Partialsumme S(n) = n X an xn . k=0 Dann ist für n > m n n X X j kS(n) − S(m)k = aj x ≤ kaj xj kA ≤ j=m+1 n X A j=m+1 n X kaj kA kxkjA ≤ j=m+1 kaj kA rj . j=m+1 P∞ Aus der Konvergenz der Reihe n=0 |an |rn folgt, dass die Teilsummenfolge dieser Folge eine Cauchyfolge bildet und daher zu ε > 0 ein N ∈ N existiert mit n > m > N impliziert n X kaj kA rj < ε. j=m+1 Daher ist auch unsere Folge {S(n)}n∈N eine Cauchyfolge, aufgrund der Vollständigkeit von A ist diese Folge dann konvergent. Definition 10.2.4 (Konvergenzradius) Es sei ( ) ∞ X ρ = sup r ≥ 0 kaj kA rj konvergiert. . j=0 Die Zahl ρ nennt man Konvergenzradius der Potenzreihe. Korollar 10.2.5 Für jedes 0 < r < ρ und jedes x0 ∈ A ist die Potenzreihe auf Br (x0 ) ⊂ A absolut und gleichmäßig konvergent, wobei absolute Konvergenz die gleiche Bedeutung wie in Definition 3.2.1 hat, nur dass der Betrag durch die Norm ersetzt wird. Beweis. Folgt sofort aus dem Lemma. Wir wollen jetzt noch kurz angeben, wie der Konvergenzradius berechnet wird. 108 KAPITEL 10. BANACHALGEBREN Satz 10.2.6 (Cauchy-Hadamard1 , Euler) Für den Konvergenzradius einer Potenzreihe gilt −1 p n ρ = lim sup kan k|A , n→∞ wobei die Inverse von 0 als ∞ und die Inverse von ∞ mit 0 angegeben werde. Eine alternative Charakterisierung ergibt sich kan k|A , n→∞ kan+1 k|A ρ = lim falls dieser Grenzwert existiert. p Beweis. Sei ρ−1 = lim supn→∞ n kan kA und kxkA < r < ρ. Für δ > 0 sei N1 ∈ N so gewählt, dass p sup n kan kA < ρ−1 (1 + δ). n≥N1 Dann ist für n > N1 ∞ ∞ ∞ X X X r n ρn n n an x ≤ kan kA r ≤ kan kA n ρ j=n j=n j=n A n ∞ n r n X X p r n n kan kA ρ ≤ (1 + δ) . ≤ ρ ρ j=n Für hinreichend kleines δ > 0 ist (1 + δ) ρr < 1 und damit der Rest eine geometrische Reihe, also kann zu ε > 0 ein N > N1 gefunden werden, so dass der ∞ X n r (1 + δ) < ε. ρ j=N n Der Beweis für die entsprechende Behauptung für die andere Darstellung des Konvergenzradius wird entsprechend auf die Quotientenregel zurückgeführt. Definition 10.2.7 (Exponentialfunktion ex ) Es sei A eine Banachalgebra, dann definieren wir für x ∈ A die Exponenti- 1 Jacques Hadamard (8.12.1865–17.10.1963) beschäftigte sich vielen mathematischen Themen, vor allem aber die Funktionentheorie, wo er sich speziell mit Potenzreihen befasste. 10.2. POTENZREIHEN 109 alfunktion ex durch die Potenzreihe ∞ X 1 n e = x . n! n=0 x Lemma 10.2.8 (Konvergenzradius der Exponentialfunktion) Der Konvergenzradius dieser Reihe ist ρ = ∞, d. h. die Reihe konvergiert für alle x ∈ A. √ Beweis. Da limn→∞ n n! = ∞ folgt die Behauptung sofort. Der Beweis von Satz 3.5.5 zeigt sofort den folgenden Satz. Satz 10.2.9 (Funktionalgleichung) Ist A eine Banachalgebra, so gilt für kommutierende x, y ∈ A, d. h. für x, y ∈ A mit xy = yx die Funktionalgleichung ex+y = ex ey . Dieser Satz impliziert sofort für Matrizen bzw. lineare Abbildungen A ∈ L(Rn ; Rn ) oder auch A ∈ L(X), X Banachraum e(t+s)A = etA esA . Daraus folgt nun der folgende zentrale Satz, der in der Theorie der linearen Differentialgleichungen sehr wichtig werden wird. Bevor wir diesen angeben, jedoch noch zwei Lemmata. Lemma 10.2.10 (Produktregel und Kurven in Banachalgebren) Es sei A eine endlich-dimensionale Banachalgebra, γ1,2 : R → A : t 7→ x1,2 (t) differenzierbare Kurven, dann ist d γ1 (t)γ2 (t)h = γ10 (t)hγ2 (t) + γ1 (t)γ20 (t)h. dt Beweis. Es funktioniert der übliche Beweis, vgl. Satz 5.1.7. γ1 (t + h)γ2 (t + h) − γ1 (t)γ2 (t) = γ1 (t + h)γ2 (t + h) − γ1 (t)γ2 (t + h) + γ1 (t)γ2 (t + h) − γ1 (t)γ2 (t) = (γ1 (t + h) − γ1 (t))γ2 (t + h) + γ1 (t)(γ2 (t + h) − γ2 (t)). Dividiert man nun durch h und betrachtet den Grenzwert h → 0, so ergibt sich die Behauptung (unter Benutzung der Stetigkeit von γ2 ). 110 KAPITEL 10. BANACHALGEBREN Lemma 10.2.11 (Konsequenzen der Funktionalgleichung) −1 Es gilt xex = ex x und für invertierbares y ∈ A folgt yex y−1 = eyxy . Ferner gilt e−x = (ex )−1 . Beweis. Es gilt wegen der Stetigkeit der Multiplikation mit x und der gleichmäßigen Konvergenz der Reihe auf jeder Kugel Br (0) ! ∞ ∞ ∞ X X X 1 1 1 xn = xn+1 = xn x. xex = x n! n! n! n=0 n=0 n=0 Das gleiche Argument zeigt für alle Partialsummen ! n n X X 1 j 1 −1 y x y = (yxy−1 )n . j! j! j=0 j=0 Die Konvergenz ergibt das gewünschte Resultat. Zu guter Letzt folgt ex e−x = e0 = 1l. Satz 10.2.12 (Lineares Anfangswertproblem) Es sei (X, k · kX ) ein Banachraum, A ∈ L(X). Dann ist für x0 ∈ X die Kurve x(t) = etA x0 differenzierbar und es gilt ẋ = Ax. Ferner gilt für jede differenzierbare Kurve γ : R → X : γ(0) = x0 und γ 0 (t) = Aγ(t) die Gleichheit γ(t) = x(t). Beweis. Zunächst zeigen wir, dass t 7→ etA x0 differenzierbar ist. Dazu ist 1 1 (t+h)A e x0 − etA x0 = (ehA − 1l)etA x0 . h h Nun ist ke hA − 1lkL(X) = k ∞ X hn n=1 n! n A kL(X) ≤ ∞ X |h|n n=1 n! kAknL(X) ≤ |h|M 10.3. DER SATZ VON STONE-WEIERSTRASS 111 mit einer Konstanten M > 0. Genauer ist hA e − 1l − hA = ∞ X hn n=2 und n! An ∞ X 1 hA hn−1 (e − 1l) − A ≤ kAknL(X) h n! L(X) n=2 und dies konvergiert mit h gegen 0. Daher existiert der Grenzwert 1 (t+h)A e x0 − etA x0 = AetA x0 . h→0 h lim Damit haben wir die Existenz einer Lösung des erwähnten Anfangswertproblems nachgewiesen. Der Eindeutigkeitsteil kopiert den Beweis von Korollar 5.3.10. Angenommen γ(t) ist eine Kurve mit γ(0) = x0 und γ̇(t) = Aγ(t), so gilt d −tA e γ(t) = −Ae−tA γ(t) + e−tA Aγ(t) = −Ae−tA γ(t) + Ae−tA γ(t) = 0. dt Also ist e−tA γ(t) konstant und diese Konstante ist γ(0) = x0 . Also folgt e−tA γ(t) = x0 oder γ(t) = etA x0 . 10.3 Der Satz von Stone-Weierstraß In diese Abschnitt wollen wir uns mit dem klassischen Approximationssatz von Weierstraß befassen. Für den Beweis folgen wir zunächst einem Weg zum moderneren Satz von Stone-Weierstraß, aus dem wir dann den Satz von Weierstraß herleiten werden. Beim Beweis des Satzes von Stone-Weierstraß folgen wir der Darstellung von Brosowsi & Deutsch [4]. Wir beginnen mit einer wichtigen Definition. 112 KAPITEL 10. BANACHALGEBREN Definition 10.3.1 (Trennungseigenschaft) Sei (X, d) ein metrischer Raum, F ⊂ C(X; R) sei eine Familie von Funktionen. Wir sagen die Familie F separiert Punkte, wenn zu je zwei Punkten x1 , x2 ∈ X eine Funktion f = fx1 ,x2 ∈ F existiert mit f (x1 ) 6= f (x2 ). Satz 10.3.2 (Stone2 -Weierstraß) Sei (X, d) ein kompakter, metrischer Raum und A ⊂ C(X; R) eine Unteralgebra die folgenden Bedingungen genüge SW1 1 ∈ A, SW2 A separiert Punkte in X. Dann ist A = C(X; R). Wir werden den Beweis mittels mehrerer Lemmata führen. Lemma 10.3.3 (Trennungssatz) Es sei (X, d) ein kompakter, metrischer Raum, A eine Unteralgebra von C(X; R), die Punkte trennt, 1 ∈ A. Dann gibt es zu jedem Punkt x0 ∈ X und jeder Umgebung x0 ∈ U ⊂ X eine Umgebung x0 ∈ V ⊂ U , so dass zu jedem ε > 0 eine Funktion f ∈ C(X; R) existiert mit 1. 0 ≤ f (x) ≤ 1, 2. für alle x ∈ V ist 0 < f (x) < ε, 3. für alle x ∈ X \ U ist 1 − ε < f (x) < 1. Beweis. 1. Seien x0 ∈ X und U ⊂ X, wie im Satz gefordert, gegeben. Zu x̄ ∈ X \ U existiert wegen der Trennungseigenschaft von A eine Funktion gx̄ ∈ A mit gx̄ (x0 ) 6= gx̄ (x̄). Setze fx̄ = gx̄ − gx̄ (x0 ). Dann gilt fx̄ (x0 ) = 0 und fx̄ (x̄) 6= 0. 2. Setze hx̄ = 2 1 (fx̄ )2 . kfx̄ k2C(X;R) (10.2) Es gilt 0 ≤ hx̄ ≤ 1, hx̄ (x0 ) = 0 und hx̄ (x̄) > 0. Marshall Harvey Stone (8.4.1903–9.1.1989) war ein amerikanischer Mathematiker, der aus Chicago stammte. Seine wesentlichen Beiträge zur Mathematik waren auf den Gebieten der Analysis, der Funktionalanalysis und Booleschen Algebra. Er lehrte in Harvard, an der University of Chicago und an der University of Massachusetts. 10.3. DER SATZ VON STONE-WEIERSTRASS 113 3. Setze für x̄ ∈ X \ U n o Ux̄ = x ∈ X hx̄ (x) > 0 . Dann folgt, dass [ X \U ⊂ Ux̄ . x̄∈X\U Da X \ U kompakt ist, gibt es x̄1 , . . . , x̄s ∈ X \ U mit X \U ⊂ s [ Ux̄j . j=1 P Wir setzen für x ∈ X p̃(x) = 1s sj=1 hx̄j (x). Für p̃ finden wir 0 ≤ p̃ ≤ 1, p̃(x0 ) = 0 und p̃(x̄) > 0 für alle x̄ ∈ X \ U . 4. Da X \ U kompakt ist, gibt es ein 1 > δ > 0, so dass p̃ ≥ δ auf X \ U . Wir setzen δ V = x ∈ X p̃(x) < . 2 Damit ist V ⊂ U . 5. Nach dem archimedischen Prinzip gibt es ein k0 ∈ N mit k0 > 1δ . Dann ist die Menge 1 M = k∈Nk> δ nichtleer und eine Teilmenge von N, wegen der Wohlordnungseigenschaft von N gibt es ein kleinstes Element k0 ∈ M . Dann ist k0 − 1 ≤ 1 < k0 . δ Damit folgt k0 ≤ 1+δ < k0 . δ Wir schließen 1 ≤ k0 δ < 2. 6. Nun betrachten wir für n ∈ N die Funktionen n qn (x) = (1 − p̃n (x))k0 . Es gilt für alle n ∈ N qn ∈ A, 0 ≤ qn ≤ 1 und qn (x0 ) = 1. 114 KAPITEL 10. BANACHALGEBREN 7. Nun gilt für x ∈ V δ <1 2 und mit der Bernoullischen Ungleichung Satz 2.3.5 erhalten wir n δ n qn (x) ≥ 1 − (k0 p̃(x)) ≥ 1 − k0 → 1( für n → ∞) 2 k0 p̃(x) ≤ k0 gleichmäßig auf V . 8. Betrachten wir nun ein x ∈ X \ U , so erhalten wir k0 p̃(x) ≥ k0 δ > 1. Eine erneute Anwendung der Bernoullischen Ungleichung Satz 2.3.5 liefert 1 1 n (1 − p̃n (x)k0 )(1 + k0 n p̃n (x)) n (k0 p̃(x)) 1 1 n n n (1 − p̃n (x)k0 )(1 + p̃n )k0 = (1 − p̃2n (x))k0 ≤ n n (k0 p̃(x)) (k0 p̃(x)) 1 →0 ≤ (k0 δ)n qn (x) = k0n p̃n (x) n (1 − p̃n (x))k0 k0 n p̃n (x) ≤ für n → ∞ gleichmäßig auf X \ U . Damit haben wir 0 ≤ qn ≤ 1, qn < ε auf X \ U für n hinreichend groß, qn > 1 − ε auf V für n hinreichend groß. 9. Setzen wir nun f = 1 − qn , so folgt das Ergebnis. Lemma 10.3.4 (Trennung abgeschlossener Mengen) Es sei (X, d), A wie im letzten Satz und A, B ⊂ X seien abgeschlossen und disjunkt. Dann gibt es zu jedem ε > 0 ein p ∈ A mit 1. 0 ≤ p(x) ≤ 1 für alle x ∈ X, 2. 0 ≤ p(x) < ε für alle x ∈ A und 3. 1 − ε < p(x) ≤ 1 für alle x ∈ B. Beweis. Setze U = X \ B. Dies ist offen und enthält A. Für jedes x0 ∈ A betrachten wir die nach Lemma 10.3.3 existierenden Umgebung Vx0 . Nun bilden die Mengen {Vx0 }x0 ∈A eine offene Überdeckung von A. Da A als abgeschlossene Teilmenge der kompakten Menge X kompakt ist, kann man eine endliche Teilmenge J ⊂ A auswählen, so dass [ A⊂ V x0 . x0 ∈J 10.3. DER SATZ VON STONE-WEIERSTRASS 115 Sei m = #(J) die Anzahl der Elemente in J. Sei ε > 0 gegeben. Dann existieren für x0 ∈ J Funktionen px0 ∈ A mit px0 (x) < mε für x ∈ Vx0 und px0 (x) > 1 − mε für x ∈ X \ U = B. Dann hat die Funktion f (x) = Y px0 (x) x0 ∈J die folgenden Eigenschaften 1. f (x) < ε m < ε für x ∈ A und 2. f (x) > (1− mε )m > 1−ε (unter Ausnutzung der Bernoullischen Ungleichung Satz 2.3.5) für x ∈ B. Beweis des Satzes von Stone-Weierstraß. Sei f ∈ C(X; R) und ε > 0 gegeben. OBdA ist f ≥ 0, ansonsten betrachten wir f +kf kC(X;R) (beachte kf kC(X;R) ∈ A). Weiterhin nehmen wir an ε < 31 . Wähle n ∈ N minimal mit (n − 1)ε ≥ kf kC(X;R) . Wir definieren Mengen Aj , Bj für j = 0, . . . , n durch 1 1 Aj = x ∈ X f (x) ≤ (j − )ε , Bj = x ∈ X f (x) ≥ (j + )ε . 3 3 Dann gilt Aj ∩ Bj = ∅ und ∅ = A0 ⊂ A1 ⊂ · · · ⊂ An = X und B0 ⊃ B1 ⊃ · · · ⊃ Bn = ∅. Dann gibt es nach Lemma 10.3.4 zu dem Paar Aj , Bj ein Element pj ∈ A mit 0 ≤ pj (x) ≤ 1 für alle x ∈ X und pj (x) < nε für x ∈ Aj und pj (x) > 1 − nε für x ∈ Bj . Dann ist die Funktion A 3 g(x) = ε n X pj (x) j=0 ein Element von A. Jedes x ∈ X ist für ein j ≥ 1 in Aj \ Aj−1 . Damit ergibt sich 4 1 (j − )ε < f (x) ≤ (j − )ε 3 3 (10.3) und ε n für i ≥ j. Für i ≤ j − 2 ist ein solches x in Bi . Wir erhalten pi (x) < 1 ≥ pi (x) > 1 − ε . n (10.4) (10.5) 116 KAPITEL 10. BANACHALGEBREN Aus Gleichung (10.4) folgt dann g(x) = ε j−1 X ps (x) + ε s=0 n X ps (x) s=j ≤ jε + ε(n − j + 1) ε n ≤ jε + ε2 1 < (j + )ε. 3 Mit Gleichung (10.5) folgern wir für j ≥ 2 g(x) ≥ ε j−2 X pj (x) s=0 ≥ (j − 1)ε(1 − ε/n) > (j − 1)ε − ((j − 1)/n)ε2 > (j − 1)ε − ε2 4 > (j − )ε. 3 Für j = 1 gilt trivialerweise g(x) > (j − 43 )ε und damit hat man 1 4 |f (x) − g(x)| ≤ (j + )ε − (j − )ε < 2ε. 3 3 Eine Konsequenz ist der folgende Satz von Weierstraß. Satz 10.3.5 (Weierstraß) Es sei [a, b] ⊂ R kompakt, dann gibt es zu jeder stetigen Funktion f ∈ C([a, b], R) und jedem ε > 0 ein Polynom p mit |f (x) − p(x)| < ε für alle x ∈ [a, b]. Beweis. Sei A die von den Polynomen erzeugte Algebra. Dann ist 1 ∈ A, A separiert Punkte und daher ist Ā = C([a, b], R). Das bedeutet zu jedem ε > 0 und jedem f ∈ C([a, b], R) gibt es ein Polynom p mit d(f, p) < ε. Dies beweist genau die im Satz formulierte Behauptung. 10.4. FOURIERREIHEN 117 Definition 10.3.6 (Selbstadjungierte Algebren) Es sei (X, d) ein kompakter metrischer Raum, A eine Algebra in dem Raum der komplexwertigen stetigen Funktionen C(X; C). A heißt selbstadjungiert, falls f ∈ A impliziert, dass f¯ ∈ A. Satz 10.3.7 (Stone-Weierstraß im Komplexen) Sei K eine kompakte Menge in einem metrischen Raum, A ⊂ C(K; C) eine separierende, selbst-adjungierte Algebra mit 1K ∈ A. Dann ist A dicht in C(K; C). Beweis. Wir betrachten die Menge AR der reellwertigen Funktionen in A. Ist f ∈ A, f = u + iv, so ist f¯ = u − iv ∈ A. Sind x1,2 zwei Punkte in K, so gibt es ein f ∈ A mit f (x1 ) 6= f (x2 ). Also ist g(x) = f (x) − f (x1 ) ∈ A mit g(x1 ) = 0 und g(x2 ) 6= 0. Dann ist h(x) = g(x)g(x) ∈ AR mit h(x1 ) = 0 < h(x2 ). Damit ist AR separierend und 1 ∈ AR . Dann ist AR dicht in C(K; R). Ebenso ist iAR dicht in C(X; iR). Dann ist aber A dicht in C(K; C). 10.4 Fourierreihen In diesem Abschnitt wollen wir uns mit einigen Aspekten der Fourieranalysis beschäftigen. Eine Zielsetzung könnte sein, Töne in die Grundschwingungen zu zerlegen. Allgemeiner wollen wir periodische Funktionen als Reihen von bestimmten einfachen periodischen Funktionen schreiben. Fourieranalysis tritt überall dort auf, wo Schwingungen und Wellen auftreten, aber auch an ganz anderen Stellen, sie erlaubt auch Lösungen für die Wärmeleitungsgleichung und andere partielle Differentialgleichungen aufzuschreiben. Wir erinnern uns an den Begriff der periodischen Funktion (Definition 4.3.14). Im Folgenden interessieren wir uns für 2π-periodische Funktionen und bezeichen mit n o C2π (R; R) = f : R → R ist stetig und 2π-periodisch . Definition 10.4.1 (Trigonometrisches Polynom) Wir betrachten Funktionen f : K → C der Form f (x) = n X k=−n ck eikx , 118 KAPITEL 10. BANACHALGEBREN wobei x ∈ R, ck ∈ C. Dann heißt f ein trigonometrisches Polynom. Offensichtlich sind Summen und Produkte trigonometrischer Polynome wieder trigonometrische Polynome. Man kann mittels eikx = cos(kx)+i sin(kx) die Funktion f in der reellen Form n a0 X + f (x) = (ak cos(kx) + bk sin(kx)) 2 k=1 darstellen, wobei wir haben a0 = 2c0 , ak = ck + c−k , bk = i(ck − c−k ). Für n ∈ gilt N ist einx die Ableitung der 2π-periodischen Funktion 1 2π Zπ e inx dx = 1 0 einx in und damit für n = 0 für n = ±1, ±2, . . . −π Für ein trigonometrisches Polynom n X f (x) = ck eikx k=−n erhält man nach Multiplikation mit e−imx und Integration die Beziehung Zπ 1 cm = f (x)e−imx dx. 2π −π Ein trigonometrisches Polynom ist genau dann reell, wenn c−n = cn . Eine trigonometrische Reihe ist eine Reihe der Form ∞ X cn einx . n=−∞ Für integrierbare Funktionen f : [−π, π] → C (d. h. Real- und Imaginärteil sind Riemann integrierbar) bezeichnen wir mit Zπ 1 cn = f (x)e−inx dx 2π −π den Fourierkoeffizienten von f und mit F(f ) = ∞ X cn einx n=−∞ die Fourierreihe von f . Wieder wird sich die Frage stellen, inwieweit die Fourierreihe einer Funktion diese darstellt. Wir beginnen unseren Weg dies zu untersuchen mit folgender Beobachtung. 10.4. FOURIERREIHEN 119 Satz 10.4.2 (Approximation durch trigonometrische Polynome) Ist f : [−π, π] → C stetig und periodisch mit Periode 2π, so gibt es zu ε > 0 ein trigonometrisches Polynom T (x) mit |f (x) − T (x)| < ε für alle x ∈ R. n o Beweis. Es gibt eine Abbildung p : R → S 1 = z ∈ C |z| = 1 durch x 7→ eix . Wir identifizieren auf diese Weise π mit −π, d. h. p(π) = p(−π) und eine stetige periodische Funktion f wird durch f˜(p(x)) = f (x) mit einer stetigen Funktion f˜ : S 1 → C identifiziert. Wir betrachten die Algebra C(S 1 ; C). Darin sei A die Algebra, die mittels der genannten Identifikation aus der Menge der trigonometrischen Polynome entsteht. Wir nennen dies wieder die Algebra der trigonometrischen Polynome. Dann gilt 1. 1 ∈ A. 2. A ist separierend. 3. A ist selbst-adjungiert. Dann folgt die Behauptung sofort aus dem Satz 10.3.7 von Stone-Weierstraß im Komplexen. Als Korollar erhalten wir sofort den Identitätssatz für Fourierreihen. Korollar 10.4.3 (Identitätssatz für Fourierreihen) Sind f, g ∈ C2π (R; C) mit gleichen Fourierreihen F(f ) = F(g), so gilt f = g. Beweis. Sei h = f − g. Wir betrachten für m ∈ Z das Integral Zπ −π h(x)eimx dx = Zπ −π f (x)eimx dx − Zπ g(x)eimx dx = 0. −π Daraus folgt, für jedes trigonometrische Polynom T gilt Zπ h(x)T (x) dx = 0. −π 120 KAPITEL 10. BANACHALGEBREN Nun finden wir eine Folge von trigonometrischen Polynomen {Tn }n∈N , die auf gleichmäßig gegen h konvergiert. Dann gilt Zπ R Zπ 2 |h(x)| dx = −π h(x)h(x) dx −π Zπ h(x) lim Tn (x) dx = n→∞ −π Zπ = h(x) lim Tn (x) dx n→∞ −π Zπ = lim n→∞ −π h(x)Tn (x) dx = 0. Damit ist |h|2 identisch Null und damit h, also f = g. Korollar 10.4.4 (Darstellungssatz für Fourierreihen) Ist f ∈ C2π (R; C) mit gleichmäßig konvergenter Fourierreihe vergiert die Fourierreihe F(f ) gegen f . Beweis. Sei F(f ) = ∞ X F(f ), so kon- cn einx n=−∞ die Fourierreihe von f . Da diese nach Voraussetzung gleichmäßig konvergiert, stellt diese eine stetige 2π-periodische Funktion g dar, die die gleiche Fourierreihe wie f hat, d. h. F(f ) = F(g). Also ist f = g. Beispiel 10.4.5 (Sägezahnfunktion) Wir betrachten f : [−π, π] → R : x 7→ |x| und setzen diese auf R stetig und periodisch fort. Wir schreiben nun die Fourierkoeffizienten in der reellen Form. f ist eine gerade Funktion, daher verschwinden alle Integrale der Form Zπ f (x) sin(nx) dx −π 10.4. FOURIERREIHEN 121 und alle Koeffizienten bk sind 0. Die Koeffizienten ak berechnen sich wie folgt 1 ak = π Zπ 2 |x| cos(kx) dx = π −π Zπ x cos(kx) dx. 0 Damit ergibt sich a0 = π und ak = − 2 1 (1 − (−1)k ). 2 πk Die Fourierreihe ergibt sich zu F(f ) = π2 − π4 ∞ X cos(2k + 1)x k=0 (2k + 1)2 ! . Diese Reihe ist gleichmäßig konvergent und konvergiert also gegen |x|. Für x = 0 ergibt sich ∞ X 1 π2 = . (2k + 1)2 8 k=1 Wir hatten in Aufgabe 6.6.8 die Funktion Dn definiert. Definition 10.4.6 (Dirichlet-Kern) Die Funktion n 1 X ikx Dn (x) = e 2π k=−n heißt Dirichlet-Kern n-ten Grades. Man erhält aus der Darstellung für die Teilsummenfolge für geometrische Reihen die Darstellung 1 sin n + 12 für x ∈ / 2π Z 2π sin x2 Dn (x) = . 1 (2n + 1) für x ∈ 2π Z 2π Definition 10.4.7 (Stückweise stetig) Es sei [a, b] ein Intervall, f : [a, b] → R heißt stückweise stetig wenn es eine Zerlegung Z von [a, b] gibt, so dass f stetig auf [a, b]\Z ist und in den inneren Zerlegungspunkten die linken und rechten Grenzwerte von f existieren. An den Randpunkten verlangen wir die Existenz der einseitigen Grenzwerte. 122 KAPITEL 10. BANACHALGEBREN Satz 10.4.8 (Riemann-Lebesgue) Ist eine Funktion f : [a, b] → R stückweise stetig, so gilt Zb lim f (x) sin(kx) dx = 0. k→∞ a Beweis. Wir hatten die Aussage für stetig differenzierbares f gezeigt. Ist f stetig auf [a, b], so gibt es (Satz von Weierstraß 10.3.5) eine Folge von Polynomen pn , die gleichmäßig gegen f konvergiert. Insbesondere gibt es ein Polynom p, so dass ε . Zu p gibt es ein K ∈ R mit k > K für alle x ∈ [a, b] gilt |f (x) − p(x)| < 2(b−a) impliziert (Satz von Riemann 6.6.7) Zb ε p(x) sin(kx) dx < . 2 a Dann ist b b b Z Z Z f (x) sin(kx) dx ≤ (f (x) − p(x)) sin(kx) dx + p(x) sin(kx) dx a a Zb ≤ a |f (x) − p(x)| |sin(kx)| dx + ε 2 a ≤ ε. Im allgemeinen Fall der stückweise stetigen Funktion benutzen wir diesen Beweisschritt auf jedem Intervall [ζi , ζi+1 ]. Lemma 10.4.9 (Dirichlet) 1. Dn ist gerade. 2. Für alle n ∈ N0 ist Zπ Dn (x) dx = 1. −π 3. Ist f auf [−π, π] stückweise stetig, auf Intervallen (0, ε0 ), (−ε0 , 0) differenzierbar und existieren die Grenzwerte f+ = lim f (x) und f− = x→0,x>0 lim f (x), x→0,x<0 10.4. FOURIERREIHEN 123 so gilt Zπ lim n→∞ −π f (x)Dn (x) dx = f+ + f− . 2 Beweis. Die ersten beiden Aussagen sind offensichtlich. Wir kommen zur dritten Aussage. Aus Zπ Dn (x) dx = 1 −π und der Geradheit von Dn ergibt sich Zπ f + Dn (x) dx = f+ . 2 0 Damit ist Zπ f+ f (x)Dn (x) dx − = 2 0 Zπ (f (x) − f+ )Dn (x) dx. 0 Wir haben eine Darstellung von Dn in der oben genannten Übungsaufgabe hergeleitet: ! n n 1 X ikx 1 sin((n + 12 )x) 1 1 X cos(kx) = Dn (x) = e = + . 2π k=−n π 2 k=1 π 2 sin( 21 x) Setzen wir dies in das obige Integral ein, so erhalten wir einen Ausdruck der Form 1 π Zπ 0 f (x) − f+ 1 sin((n + )x) dx = 1 2 2 sin( 2 x) Zπ 0 f (x) − f+ x 1 sin((n + )x) dx. 1 x 2 2π sin( 2 x) Auf dieses Integral wenden wir das Riemannsche Lemma an, dazu benötigen wir zwei Überlegungen. Die Funktion f (x) − f+ x x 2π sin( 12 x) ist beschränkt, dazu betrachten wir den Punkt x = 0, dort haben wir einen Grenzwert der Form 00 , die Anwendung des Satzes von l’Hospital 5.6.2 ergibt die Beschränktheit. Die Funktion ist offensichtlich auf [0, π] stückweise stetig und damit folgt mit dem Satz von Riemann-Lebesgue die Behauptung. 124 KAPITEL 10. BANACHALGEBREN Satz 10.4.10 (Fourierreihe) Es sei f : R → R 2π-periodisch und auf jedem Kompaktum stückweise stetig. Es sei x ∈ [−π, π] und f besitze in x ∈ [−π, π] eine linksseitige und eine rechtsseitige Ableitung. Dann gilt: 1. Ist f in x stetig, so konvergiert die Fourierreihe von f gegen f (x). 2. Ist f in x unstetig, so konvergiert die Reihe gegen das arithmetische Mittel der linksseitigen und rechtsseitigen Grenzwerte von f . Beweis. Die n-te Partialsumme Fn (f ) der Fourierreihe F(f ) von f hat die Darstellung Zπ n X 1 Fn(f )(x) = π f (y) eik(x−y) dy. k=−n −π Dies ist gerade Zπ Zπ f (y)Dn (x − y) dy = −π f (x + w)Dn (w) dw. −π Nun wenden wir das Lemma von Dirichlet an und erhalten das Resultat. Kapitel 11 Differentialgleichungen In diesem Abschnitt wollen wir Differentialgleichungen, speziell einige einfache Aspekte diskutieren. Einen genaueren Einblick gewährt eine Vorlesung über gewöhnliche Differentialgleichungen, die nach dem Analysis Kurs angeboten werden wird. Differentialgleichungen spielen bei der Anwendung der Mathematik in anderen Wissenschaften eine dominante Rolle, auch die Begründer der Analysis, wie Newton, die Bernoullis, Euler und viele andere beschäftigten sich mit Differentialgleichungen. Zur Motivation möchte ich einige Fragen aufwerfen, die gestellt werden und deren Antwort mittels Differentialgleichungen gefunden werden kann. Danach wollen wir die notwendigen Techniken zum Auffinden der Antwort bereitstellen. Inhalt 11.1 Motivation . . . . . . . . . . . . . . . . . . . . . . . . . 125 11.2 Matrixexponentialfunktion . . . . . . . . . . . . . . . . 130 11.3 Ein allgemeiner Existenzsatz . . . . . . . . . . . . . . . 136 11.4 Randwertprobleme . . . . . . . . . . . . . . . . . . . . 140 11.4.1 Klassifizierung . . . . . . . . . . . . . . . . . . . . . . 140 11.1 Motivation Differentialgleichungen sind Gleichungen für uns a-priori unbekannter Funktionen, wobei wir eine Relation zwischen dieser Funktion und ihren Ableitungen kennen. Ziel ist es die Funktion zu bestimmen. Dies ist keine formale Definition und wir werden den Begriff der Differentialgleichung auch nicht formal definieren. Durch Umgang werden wir Klassen von solchen Gleichungen kennenlernen und gleichzeitig werden wir eine Fülle von Anwendungen sehen, die in der Sprache der Differentialgleichungen formuliert werden. 125 126 KAPITEL 11. DIFFERENTIALGLEICHUNGEN Bevor wir die Diskussion formalisieren ein Problem der Politik: In Deutschland spielt die Diskussion um die Entwicklung der Konjunktur immer wieder eine wichtige Rolle. Eine Frage, die immer wieder in der Diskussion auftaucht, ist die, ob man Abschwächungen der Konjunktur durch Steuersenkungen verhindern kann. Dabei wird der Effekt, je nach politischer Couleur, unterschiedlich bewertet: Typische Argumente sind (oder könnten sein): 1. Steuersenkung vermindert die Staatseinnahmen, dies führt zu höheren Kreditaufnahmen, erhöht damit den Zinssatz und dieses behindert die wirtschaftliche Entwicklung. 2. Eine Steuersenkung stärkt die private Kaufkraft, vermehrt die Wirtschaftstätigkeit, dies vermehrt die Steuereinnahmen und befördert dadurch insgesamt die Konjunktur. Welches der beiden Argumente ist wahr? Wie entscheidet man eine solche Frage? Das folgende Diagramm zeigt, wie eine Steuersenkung sich (vielleicht) auf einige wirtschaftliche Parameter auswirken könnte und dass die Antwort auf diese Frage zwangsläufig zu einem hochkomplexen mathematischen Modell führt, dessen Analyse unsere momentanen Fähigkeiten beträchtlich übersteigt. Steuersenkung private Kredite Staatsverschuldung Steueraufkommen private kraft Zinssatz öffentlicher Kreditbedarf staatliche Investitionen Inflation Kauf- Wirtschaftswachstum Abbildung 11.1: Darstellung von einigen Abhängigkeiten in einem ökonomischen Modell, grüne Kästchen lassen in diesem Bereich eine Verbesserung, rote Kästchen eine Verschlechterung zu erwarten, bei grauen ist eine direkte Entscheidung nur durch genauere Rechnung möglich. 11.1. MOTIVATION 127 Außer Acht bleiben dabei Kenngrößen wie Kindergeld, Lebenserwartung, Rentenversicherung, Sozialversicherungen, Außenhandel, Außenwert der Währung, Bildungsausgaben, Auslandsreisen. Man kann versuchen, diese Beziehungen durch Differentialgleichungen zu erfassen und dann jenseits von Partikularinteressen richtige Antworten zu finden. Da dies im Moment vielleicht doch zu ambitioniert erscheint, erstmal einige einfachere Beispiele: Wachstumpsrozesse: radioaktiver Zerfall, Populationsdynamik, Räuber-Beute-Modelle, Bewegungsgleichungen von Himmelskörpern, Bestimmung der Flugbahnen von Raumsonden etc. Beginnen wir mit einem einfachen Wachstumsmodell, auf einer unendlichen Wiese vermehrt sich eine Population von Hasen, die Zunahme ist proportional zur gegenwärtigen Population, die ich mit h(t) bezeichnen möchte. Der Proportionalitätsfaktor sei mit α bezeichnet und wir machen die unrealistische Annahme, dass h(t) ∈ R und t → h(t) differenzierbar sei. t steht dabei für die Zeit, wir wollen Ableitung nach der Zeit mit einem Punkt bezeichnen, also ḣ = h0 (t). Dann ist die Änderung unserer Population ḣ und dies ist nach unserer Annahme proportional zu h, also ḣ = αh. Nehmen wir noch an, zum Zeitpunkt t = 0 gäbe es h0 Hasen, so lautet aufgrund von Satz 5.3.10 die Entwicklung der Hasenpopulation h(t) = h0 eαt . Das Wachstum zeichnet sich durch eine konstante Verdoppelungsrate aus und ist unbegrenzt. Um diese unrealistische Aussage zu korrigieren, gehen wir nun von einer begrenzten Wiese mit einer maximalen Kapazität von K ∈ R Hasen aus. Das Wachstum sei für Populationen weit von dieser Grenze entfernt immer noch proportional zu h, die maximale Aufnahmefähigkeit wird dann durch einen Term der Form K − h modelliert und wir erhalten die Gleichung ḣ = αh(K − h) = αhK − αh2 . Nun ist etwas schwieriger Lösungen zu finden. Wir lernen an dieser Gleichung die erste elementare Lösungsmethode für Differentialgleichungen kennen. Mit β = αK und S = α (Stressfaktor) erhalten wir dh = βh − Sh2 . dt (11.1) dh 1 = 1. dt βh − Sh2 (11.2) Ist βh − Sh2 6= 0 erhält man 128 KAPITEL 11. DIFFERENTIALGLEICHUNGEN Integration dieser Gleichung von 0 bis t liefert Zt dh(s) ds = dt βh(s) − Sh(s)2 0 Zt ds = t. (11.3) 0 Ist βh − Sh2 6= 0, so ist auch h0 6= 0 und die linke Seite ergibt mit der Substitutionsregel Zh dz . βz − Sz 2 h0 Dies wird mittels einer Partialbruchzerlegung integriert. Es ergibt sich (wir führen diese Rechnung einmal sehr ausführlich durch) mit K = β/S 1 β Zh 1 1 + z K −z 1 dz = β log |h| |h − K| − log |h0 | |h0 − K| . h0 Da die Größe der Population jeweils nicht negativ ist, kann man h > 0, h0 > 0 annehmen. Daher hat man h|h0 − K| log = β(t − t0 ). (11.4) |h − K|h0 Einsetzen und Auflösen nach h bringt uns die endgültige Gestalt der Lösung h(h0 − K) = eβt . (h − K)h0 (11.5) Hier beachtet man noch, dass die Annahme, dass h(s) 6= K für alle s ∈ [0, t] dazu führt, dass h − K und h0 − K gleiches Vorzeichen haben. Daraus erhält man h(t) = eβt h0 (h(t) − K). h0 − K Bezeichnet man den hier aufgetretenen Bruch mit B so ergibt sich h(1 − B) = −BK und damit h= BK . (B − 1) Einsetzen ergibt h(t) = K eβt h0 . eβt h0 − h0 + K 11.1. MOTIVATION 129 Multiplikation mit e−β(t) führt auf h(t) = Kh0 . h0 − e−βt (h0 − K) (11.6) Wie erwartet liefert das Einsetzen von t = 0 den Wert h0 . Um das Verhalten von h für t → ∞ zu studieren, muss man sich nur anschauen, was der Nenner macht. Er konvergiert gegen h0 und insgesamt ergibt sich der Wert K. Wir wollen noch die Frage stellen, woher kommen die Lösungen für t < t0 , sozusagen fragen wir nach der Vergangenheit. Ist h0 ∈ (0, K), so existiert die Lösung für alle Zeiten t ∈ R und konvergiert für t → −∞ gegen 0. Ist jedoch h0 > K, so würde formal die Grenzwertbetrachtung t → −∞ den gleichen Wert ergeben, dies jedoch erscheint absurd. Man überlegt sich, dass der Nenner für ein t < t0 eine Nullstelle t1 (h0 ) hat und demzufolge die Lösung nur auf dem Intervall (t1 , ∞) existiert. Die hier behandelte Gleichung wird oft logistische Gleichung genannt. Sie geht auf den belgischen Mathematiker Verhulst1 zurück. Eine wichtige Veränderung bringt die Einführung von Füchsen, deren Anzahl mit f (t) bezeichnet werde. Die Veränderung der Zahl der Füchse ist proportional zur Zahl der Hasen und wirkt sich wiederum auf die Zahl der Hasen aus. Als Gleichung erhält man dann unter der Annahme, dass die Anzahl der gefressenen Hasen proportional zur Begegnungshäufigkeit von Hasen und Füchsen ist (Mit Proportionalitätsfaktor F > 0). ḣ = βh − Sh2 − F hf f˙ = β 0 f h − mf, wobei m die Sterberate der Füchse ist. Dieses System von zwei Differentialgleichungen ist nach Lotka2 und Volterra3 als Lotka-Volterra-System bezeichnet. Hier kann man durch einfaches Argumentieren die langfristige Verhalten nicht vorhersagen: Eine Vermehrung der Hasen vermehrt die Füchse und dies verringert den Hasenbestand, hier ist eine genaue Rechnung gefragt. Ein Unterschied zum Steuerproblem ist der zeitliche Horizont, während wir bei Hasen und Füchsen das langfristige Verhalten (Gleichgewicht, periodischen Populationsentwicklung oder Aussterben) verstehen wollen, was typische Aussagen eines analytischen Zugangs sind, wollen wir bei der Steuer die sofortige Auswirkung kennenlernen, die Gültigkeit der Modelle ist zeitlich sehr begrenzt und hängt von so vielen Rahmenbe1 Pierre-Francois Verhulst (28.10.1804–15.2.1849) war Professor an der Freien Universität in Brüssel und später an der königlichen Militärschule. Seine Arbeiten zum Bevölkerungswachstum machten ihn zum Begründer der Bevölkerungsstatistik. 2 Alfred James Lotka (2.3.1880–5.12.1949) wurde in Lwow geboren, ging in Frankreich zur Schule und studierte in Birmingham in England. Später arbeitete er bei der Metropolitan Live Insurance in USA. Im Jahr 1926 publizierte er die Arbeit, in der die nach ihm benannten Gleichungen vorgestellt wurden. 3 Vito Volterra (3.51860–11.10.1940) 130 KAPITEL 11. DIFFERENTIALGLEICHUNGEN dingungen ab, dass nur eine Analyse mit Rechnern uns einem Hinweis auf die richtige Politik geben kann. Die Gleichgewichtsbedingung für unser obiges Lotka-Volterra-System h= m β0 und f = Fβ − FmS . Typische Fragen sind z. B., ob diese Ruhelage stabil ist in dem β0 Sinn, dass bei einer leichten Störung aus dem Gleichgewicht die von Lösungen vorhergesagten Populationen in der Nähe der Gleichgewichtspopulationen befinden. Eine genauere Analyse kommt später. 11.2 Lineare Differentialgleichungen und die Matrixexponentialfunktion Wir haben in der Definition 10.2.7 gesehen, wie wir etA für Elemente aus Banachalgebren definieren und im Lemma 10.2.8 gesehen, dass dies für jedes Element tatsächlich definiert ist. Insofern können wir dies auch für reelle und komplexe n × n-Matrizen oder auch für Elemente A ∈ L(Rn ) oder L(Cn ) definieren. Wir kommen zur konkreten Berechnung der Exponentialfunktion für Matrizen. Wir beschränken uns dabei auf den komplexen Fall, weil dieser etwas einfacher ist, weisen aber darauf hin, welche zusätzlichen Probleme der reelle Fall mit sich bringt. Lemma 11.2.1 (Matrixexponentialfunktion für Diagonalmatrizen) Ist D eine reelle oder komplexe Diagonalmatrix, d. h. sind alle dij = 0 falls i 6= j, so ist λ1 0 . . . . . . 0 0 λ2 0 . . . 0 .. . 0 D= 0 0 0 . . . 0 ... 0 0 . . . . . . 0 λn wir schreiben dafür D = diag (λ1 , . . . , λn ). Dann ist etD = diag (etλ1 , . . . , etλn ). Beweis. Folgt sofort aus den Regeln der Matrixmultiplikation. Für die allgemeine lineare Gleichung machen wir einen Ausflug in die Lineare Algebra. Sei A : Rn → Rn eine lineare Abbildung mit zugehöriger Matrix A 11.2. MATRIXEXPONENTIALFUNKTION 131 (diese wird durch die Wahl einer Basis bestimmt). Wir gehen immer von der kanonischen Basis aus und identifizieren auf diese Weise die lineare Abbildung mit der Matrix. Eine Zahl λ ∈ C heißt Eigenwert von A, wenn es einen Vektor u ∈ Cn gibt mit Au = λu. Dieser Vektor u wird Eigenvektor von A genannt. Natürlich müssen wir auch bei reellen Matrizen komplexe Eigenwerte und Eigenvektoren zulassen. Deshalb arbeiten wir im komplexen Raum Cn . Die Eigenwerte sind Lösungen der charakteristischen Gleichung det(A − λ1l) = 0. (11.7) Wegen des Fundamentalsatzes der Algebra gibt es (mit Vielfachheiten gerechnet) genau n Wurzeln dieser Gleichung. Jede Wurzel von (11.7) ist auch Eigenwert, jedoch gibt es im allgemeinen weniger als n Eigenvektoren. Sei λ ein Eigenwert, so ist Kλ = ker(A − λ1l) ein A-invarianter Unterraum, d. h. AKλ ⊂ Kλ , der Eigenraum von A zum Eigenwert λ, der enthalten ist im verallgemeinerten Eigenraum, welchen wir durch Eλ = {u ∈ Cn | ∃k ∈ N mit (A − λ1l)k u = 0} definieren. Auch der verallgemeinerte Eigenraum Eλ zum Eigenwert λ ist invariant unter der Abbildung A (nachrechnen!). Eine weitere Zerlegung in invariante Unterräume ist möglich. Dazu betrachtet man den minimalen Wert k0 , so dass ker(A − λ1l)k0 = Eλ ist. So eine Zahl existiert immer, denn ker(A − λ1l)k ⊃ ker(A − λ)k−1 . Aufgrund der endlichen Dimension, muss diese Folge stationär werden. In Eλ existiert eine Basis B, welches die Vereinigung von m Mengen H1 , . . . , Hm ist, wobei jedes Hk die Form Hk = {uk,1 , . . . , uk,rk } hat mit (A − λ1l)uk,i+1 = uk,i , i = 1, . . . , rk , (A − λ1l)uk,1 = 0. Die Einschränkung von A auf Eλ hat in der Basis B dann die Gestalt B1 0 . . . . . . 0 0 B2 0 . . . 0 .. . . . . . . .. , . . . . . 0 ... 0 0 0 . . . . . . 0 Bm (11.8) 132 KAPITEL 11. DIFFERENTIALGLEICHUNGEN wobei jeder dieser rk × rk λk 1 0 0 λk 1 . . ... ... . Bk = . ... .. .. . 0 ... ... Blocks Bk die einfache Form ... ... 0 .. . 0 0 . . . . . . .. . oder Bk = diag (λk , . . . , λk ) ... ... 0 .. . λ 1 . . . 0 λk (11.9) hat. Damit haben wir die komplexe Jordansche Normalform einer Matrix erhalten. In der reellen Jordanschen Normalform hat man auch eine Darstellung in Blöcken wie in (11.8), jedoch sehen die i. a. Blocks anders aus. Ist λ reell so bleibt die Form (11.9) erhalten. Für komplexe Eigenwerte λ = eiα , ergibt sich statt (11.9) die Form cos α − sin α 1 0 ... ... ... 0 sin α cos α 0 1 0 ... ... 0 0 0 cos α − sin α 1 0 . . . 0 0 0 sin α cos α 0 1 ... 0 .. .. .. ... ... ... ... ... . (11.10) . . . Bk = . . . . .. .. .. .. 1 0 . . . .. .. .. 0 1 0 ... ... ... . . . 0 cos α − sin α 0 ... ... ... . . . 0 sin α cos α A kann durch eine Ähnlichkeitstransformation in die Jordansche Normalform gebracht werden. Sei J die Jordansche Normalform von A und C die Transformationsmatrix, also J = CAC −1 . Wir haben bereits in Lemma 10.2.11 gesehen, wie sich die Exponentialfunktion unter Konjugation verhält. Wir betrachten nun das lineare Anfangwertproblem (lineares AWP) u̇ = Au u(0) = u0 . Wir können nun die Lösung u(t, u0 ) des linearen AWP gewinnen, indem wir A in die Jordansche Normalform überführen, für diese dann die Gleichung lösen und zurücktransformieren. Wir erhalten mit v0 = Cu0 und v(t, v0 ) = Cu(t, u0 ) das lineare AWP für v in der Form v̇ = C u̇ = CAu = CAC −1 v = Jv v(0) = v0 . 11.2. MATRIXEXPONENTIALFUNKTION 133 Nun ergibt sich aufgrund des allgemeinen Satzes über die eindeutige Lösbarkeit linearer AWPe und dem Lemma 10.2.11 −1 v(t) = etJ v0 = etCAC v0 = CetA C −1 v0 = CetA u0 . Damit ist u(t) = C −1 v(t) = C −1 etJ Cu0 . Zur allgemeinen Lösung linearer Anfangswertprobleme müssen wir noch etJ ausrechnen. Wir gehen von der Gestalt (11.8) aus. Natürlich gilt für eine Matrix J in Blockdiagonalgestalt J = diag(B1 , . . . , Bm ), dass die Matrixexponentialfunktion auch Blockdiagonalgestalt annimmt, also etJ = diag(etB1 , . . . , etBm ). Ist B ein Block der Länge 1, also B = (λ), so ist natürlich etB = eλt . Ist B ein Block der Länge r > 1 und der zugehörige Eigenwert λ reell, so ergibt sich die Exponentialreihe aus folgenden Betrachtungen. Definition 11.2.2 (nilpotent) Eine Matrix N heißt nilpotent, wenn es ein r ∈ N gibt mit N r = 0. Lemma 11.2.3 (Jordanblöcke als Summen D + N ) Ein Block der Gestalt (11.9) ist die Summe einer Diagonalmatrix D und einer nilpotenten Matrix N . Beweis. Natürlich ist D = diag(λ, . . . , λ). Übrig bleibt die r × r Matrix 0 1 0 ... ... 0 ... 0 0 1 0 0 . . . . . . . . . . . . . . .. . . N = . (11.11) oder N = 0. .. .. .. .. . . . 0 .. .. . . 0 1 0 ... ... ... 0 0 Eine einfache Rechnung zeigt für den ersten Fall, dass N r = 0 ist. Damit ist N nilpotent. 134 KAPITEL 11. DIFFERENTIALGLEICHUNGEN Bemerkung 11.2.4 (D + N allgemein) Genauer gilt, dass jede Matrix A Summe einer diagonalisierbaren und einer nilpotenten Matrix ist. Unser Beweis zeigt dies zumindest für reelle Matrizen mit ausschließlich reellen Eigenwerten. Lemma 11.2.5 (Matrixexponentialfunktion von Jordanblöcken) Die Matrixexponentialfunktion etB eines Jordan Blocks (mit nichttrivialem nilpotenten Anteil) der Länge r zum Eigenwert λ hat die Gestalt tr−1 1 t t2 /2 t3 /6 . . . (r−1)! .. ... ... 0 1 t . .. . . . . . 3 . . . . . . . t /6 etB = eλt .. (11.12) .. .. .. .. 2 . . . t /2 . . .. .. 1 t 0 ... ... ... 0 1 Beweis. Es gilt DN = N D und daher mit dem Satz 10.2.9 etB = et(D+N ) = etD etN . Nun ergibt etD = eλt 1l (und damit hat man den Fall mit N = 0 geklärt) und da N nilpotent ist, hat man etN = 1l + tN + tr−1 t2 2 N + ··· + N r−1 . 2 (r − 1)! Einsetzen von N ergibt die behauptete Formel. Bisher haben wir Differentialgleichungen betrachtet, deren rechte Seiten nicht von t abhängig sind. Solche Gleichungen werden als autonom bezeichnet. Der einfachste Fall einer nichtautonomen Gleichung ist ein AWP der folgenden Struktur u̇ = Au + f (t) u(t0 ) = u0 . Wir werden dies später nochmal etwas allgemeiner formulieren. Bemerkung 11.2.6 (autonom versus nicht autonom) Ein wesentlicher Unterschied zwischen autonomen und nichtautonomen Gleichungen besteht darin, dass bei einer autonomen Gleichung eine beliebige Verschiebung um t0 eine Lösung der Gleichung in eine andere Lösung überführt, d. h. ist u(t) eine Lösung einer autonomen Gleichung, so ist für jedes t0 > 0 die Funktion u(t + t0 ) wieder eine Lösung (nachprüfen!!) und damit macht es keinen Unterschied, ob wir Anfangswertprobleme mit t0 = 0 11.2. MATRIXEXPONENTIALFUNKTION 135 oder mit einem beliebigen Anfangszeitpunkt lösen. Bei nichtautonomen Gleichung hat man keine solche Verschiebungsinvarianz, daher ist es wichtig, den Anfangszeitpunkt zu dokumentieren. Definition 11.2.7 (Notation für Lösungen von AWP) Es sei (X, k · kX ) ein Banachraum, A ∈ L(X) sei eine stetige lineare Abbildung, f : R → X sei stetig. Mit u(t, t0 , u0 ) bezeichnen wir eine Lösung des Anfangswertproblems u̇ = Au + f (t) u(t0 ) = u0 . Satz 11.2.8 (Variation der Konstanten) Ist f auf dem Intervall [a, b] stetig, so hat für t0 ∈ [a, b] und t ∈ [a, b] das nichtautonome Anfangswertproblem (oder auch inhomogene lineare Anfangswertproblem) u̇ = Au + f (t) u(t0 ) = u0 genau eine Lösung u(t, t0 , u0 ), welche durch (t−t0 )A u(t, t0 , u0 ) = e Zt u0 + e(t−s)A f (s) ds t0 gegeben ist. Die Lösung ist eindeutig. Beweis. Wir prüfen zunächst nach, dass es sich um eine Lösung handelt, also betrachten wir Zt d (t−t0 )A e u0 + e(t−s)A f (s) ds . u̇(t, t0 , u0 ) = dt t0 Dies ergibt (beachte die Ableitung nach der oberen Grenze eines Integrales ergibt den Integranden an dieser Stelle) unter Verwendung der Differentiationsregeln für parameterabhängige Integrale Ae (t−t0 )A 0 Zt u0 + e f (t) + A t0 e(t−s)A f (s) ds. 136 KAPITEL 11. DIFFERENTIALGLEICHUNGEN Man beachte, dass bei Differentiation nach dem Parameter die Integralgrenze unabhängig von der Variablen war, nach der differenziert wurde. Um diese kleine Lücke zu schließen schreiben wir Zt Zt d tA d e(t−s)A f (s) ds = e−sA f (s) ds . e dt dt t0 t0 Nun kann man einfach nach der Produktregel differenzieren. Damit ist die angegebene Funktion eine Lösung des inhomogenen linearen Anfangswertproblems. Wir kommen zur Eindeutigkeit: Sind u1 , u2 zwei Lösungen, so betrachten wir die Differenz und erhalten u̇1 − u̇2 = Au1 − Au2 = A(u1 − u2 ) und u1 (t0 , t0 , u0 ) = u2 (t0 , t0 , u0 ) = u0 . Damit folgt aber aus Satz 10.2.12 u1 (t, t0 , u0 ) = u2 (t, t0 , u0 ). Bemerkung 11.2.9 (Lösungsraum) Betrachtet man nur die Differentialgleichung auf dem Raum (Rn , k · k), so kann man das Lösungsverhalten charakterisieren: Die homogene Gleichung u̇ = Au hat einen n-dimensionalen linearen Raum von Lösungen in C(R; Rn ), diese erhält man aus einer Basis {uk }1≤k≤n mittels etA uk , während das nichthomogene Problem durch Auffinden einer speziellen U(t) einen nPn Lösung tA dimensionalen affinen Raum der Form U(t) + k=1 λk e uk . Man kann ganz ähnliche Sätze auch noch beweisen, wenn A von der Zeit abhängt, darauf wollen wir aber jetzt nicht eingehen. 11.3 Ein allgemeiner Existenzsatz Es sei (X, k·kX ) ein Banachraum. Wir betrachten eine Abbildung v : R ×X → X und damit die Differentialgleichung u̇ = v(t, u). Definition 11.3.1 (Vektorfeld) Es sei U ⊂ X offen und v : R × U → X eine stetige Abbildung. Wir nennen v ein Vektorfeld. Ist v stetig differenzierbar, so sprechen wir von einem C 1 Vektorfeld, entsprechend bei höherer Differenzierbarkeit. 11.3. EIN ALLGEMEINER EXISTENZSATZ 137 Die Aufgabe eine Schar von differenzierbaren Kurven zu finden, die an jedem Punkt γκ (t) die Eigenschaft hat, dass γκ0 (t) = v(γκ (t)) ist eine typische Aufgabenstellung, für die wir nun eine Lösung anstreben. Gibt es solche Kurven und sind diese in bestimmten Sinne eindeutig? Eine typische Anwendung ist folgende Situation: Man hat U ⊂ Rn offen und eine stetig differenzierbare Abbildung f : U → R und das Vektorfeld v(x) = ∇f (x). Die Lösung dieses Problems gibt uns Kurven, die jeweils dem steilsten Anstieg folgen, aber die Frage ist, gibt es solche Kurven? Diese Frage wollen wir noch etwas allgemeiner angehen. Wir betrachten nun Funktionen f : (a, b) × U → X und suchen Abbildungen γ : (a, b) → X : γ 0 (t) = f (t, γ). Definition 11.3.2 (Gewöhnliche Differentialgleichung erster Ordnung) Wir verstehen unter einer gewöhnlichen Differentialgleichung erster Ordnung, das Problem eine Kurvenschar zu finden, so dass für jede Kurve γ aus der Schar gilt γ 0 (t) = f (t, γ(t)). Hängt f explizit von der Zeit ab, so nennen wir dies eine nichtautonome Differentialgleichung, im anderen Fall eine autonome Differentialgleichung. Das Problem in einem der beide eine Lösungskurve zu finden, welche zum Zeitpunkt t0 den Wert x0 annimmt heißt nichtautonomes bzw. autonomes Anfangswertproblem. Bemerkung 11.3.3 (Notation) Es ist üblich Differentialgleichungen etwas anders aufzuschreiben, man schreibt normalerweise ẏ = f (t, y). Dann steht die Variable y einerseits für eine Variable in X und andererseits für eine Kurve t 7→ y(t). Wir beweisen nun, dass unter gewissen Voraussetzungen ein nichtautonomes Anfangswertproblem eine eindeutig bestimmte Lösung besitzt. Natürlich folgt das dann auch für das autonome Anfangswertproblem (unter entsprechenden Voraussetzungen). Im Folgenden sei (X, k · kX ) ein Banachraum. 138 KAPITEL 11. DIFFERENTIALGLEICHUNGEN Satz 11.3.4 (Lokaler Existenzsatz) Sei U ⊂ X offen, f : R × U → X stetig und bezüglich der zweiten Variablen lokal Lipschitz stetig. Dann gibt es zu jedem u0 ∈ U, t0 ∈ R eine Zahl δ > 0 und eine auf dem Intervall I = [t0 − δ, t0 + δ] definierte stetige Funktion u : I → U mit folgenden Eigenschaften: • u ist auf (t0 − δ, t0 + δ) stetig differenzierbar; • u(t0 ) = u0 • u löst die Differentialgleichung u̇ = f (t, u). Gibt es ein Intervall I, welches t0 enthält, und eine Funktion ũ : I → U mit den Eigenschaften ũ(t0 ) = u0 und ũ löst die Differentialgleichung u̇ = f (t, u), so gilt u = w̃ auf Iδ ∩ I. Beweis. Sei W eine Umgebung von (t0 , u0 ) in R × U , so dass auf W die Funktion f bezüglich der zweiten Variablen die Lipschitz Konstante MW hat, und kf (t, u)kX ≤ NW ∀(t, u) ∈ W . Sei n o ∆ = inf k(t, x) − (t0 , u0 )kR×X (t, x) ∈ (R × X) \ W . Ist (R × X) \ W leer, so sei ∆ eine beliebige positive Zahl. Wähle λ ∈ (0, 1). Setze M = max{1, MW }, N = max{1, NW } und ∆ 3λ 1 min{ , }. 3 N M Mit C(Iδ ; Ū ) bezeichnen wir die Menge der auf Iδ definierten stetigen Funktionen mit Werten in Ū . Mit der Metrik o n d(u, v) = max ku(t) − v(t)k t ∈ Iδ δ= wird C(Iδ ; Ū ) zum vollständigen metrischen Raum. Man prüfe alle Eigenschaften nach! Für u ∈ C(Iδ ; Ū ) definieren wir eine neue Funktion T u ∈ C(Iδ ; Ū ) durch Z t (T u)(t) = u0 + f (s, u(s))ds. (11.13) t0 Wir zeigen 1.) T ist eine starke Kontraktion auf C(Iδ ; Ū ). 2.) Der Fixpunkt u ist eine Funktion mit den gewünschten Eigenschaften. 11.3. EIN ALLGEMEINER EXISTENZSATZ 139 Zu 1.) Zunächst prüfen wir, ob für v ∈ C(Iδ ; Ū ) auch T v wieder in diesem Raum liegt. Die Stetigkeit von T v ist nahezu offensichtlich, denn für t1 , t2 ∈ Iδ und t1 < t2 ist t Z 2 Zt2 kT v(t2 ) − T v(t1 )kX ≤ f (s, v(s))ds ≤ kf (s, v(s))kds ≤ NW (t2 − t1 ). t1 X t1 Um einzusehen, dass T v(t) ∈ Ū liegt, zeigen wir, dass sogar (t, T v(t)) ∈ W gilt. Offensichtlich ist (t0 , T n v(t0 )) = (t0 , u0 ) ∈ U . Wegen der Stetigkeit von T v o folgt, dass die Menge IW = t ∈ Iδ (t, T v(t)) ∈ W offen in Iδ ist. Ist IW 6= Iδ , so gibt es ein t̃ ∈ Iδ \ IW . O.B.d.A. ist t̃ > t0 . Sei t1 = inf t̃ > t0 , t̃ ∈ Iδ \ IW . Dann ist aber (t1 , T v(t1 )) ∈ W . Dazu schätzen wir für ein solches t die Differenz k(t1 , T v(t1 )) − (t0 , u0 )kR×X ab: t Z k(t1 , T v(t1 )) − (t0 , u0 )kR×X ≤ f (s, v(s))ds + δ t0 X Zt ≤ kf (s, v(s))kX ds + δ t0 ≤ δNU + δ ≤ δ(1 + N ) < ∆. Damit ist (t1 , T v(t1 )) ∈ W und t − 1 ∈ IW . Die Menge IW ist damit offen und abgeschlossen in Iδ . Da t0 ∈ IW liegt, gilt IW = Iδ . Insbesondere ist für jedes u ∈ C(Iδ ; Ū ) und jedes t ∈ Iδ (t, T u(t)) ∈ W und ku0 − T u(t)kX ≤ ∆. Wir kommen zur Kontraktionseigenschaft. Seien v, n o w ∈ C(Iδ ; U1 ), wobei U1 ⊂ U abgeschlossen mit U1 = u ∈ Ū ku − u0 kX ≤ ∆ . Dann ist d(T v, T w) = max{|T v(t) − T w(t)| | t ∈ Iδ } Z t ≤ (f (s, v(s)) − f (s, w(s))) ds t0 X Zt ≤ kf (s, v(s)) − f (s, w(s))kX ds (11.14) t0 ≤ δMU d(v, w) < λd(v, w). Aus dem Banachschen Fixpunktsatz 9.1.1 folgt nun die Existenz von genau einem Fixpunkt von T . 140 KAPITEL 11. DIFFERENTIALGLEICHUNGEN Zu 2.) Ist T u = u, so gilt für t ∈ Iδ Zt f (s, u(s)) ds. u(t) = u0 + (11.15) t0 Damit ist klar, dass u im Inneren des Intervalls stetig differenzierbar ist. Die Ableitung u̇(t) ist nach dem HDI gleich f (t, u(t)). 11.4 Randwertprobleme In diesem Abschnitt betrachten wir Randwertprobleme für gewöhnliche Differentialgleichungen, das sind Aufgabenstellungen, bei denen ein Intervall in R vorgegeben ist, auf dem Intervall eine Relation zwischen einer unbekannten Funktion und ihren Ableitungen gegeben ist und Angaben über die Werte am Rand des Intervalles eine eindeutige Lösbarkeit erzwingen sollen. Eine typische Aufgabenstellung ist das Problem der Kettenlinie, für uns ist ein Seil der Länge L gegeben und wir hängen dies an zwei Endpunkten auf. Ziel ist es die Form des durchhängenden Seiles zu bestimmen. 11.4.1 Klassifizierung Wir beginnen mit einem Intervall I = [a, b] und Funktionen p ∈ C([a, b]; R) ∩ C 1 ((a, b); R) mit p(x) > 0 für alle a < x < b, q ∈ C([a, b]; R), g ∈ C([a, b]; R). Damit schreiben wir eine Differentialgleichung in der Form (p(x)u0 (x))0 + q(x)u(x) = g(x). (11.16) Solche Gleichungen bestimmen im Allgemeinen die gesuchte Funktion nicht eindeutig. Im Spezialfall p = 1, q = 0 und g = 0 ergibt sich u00 (x) = 0, jede Funktion der Form u(x) = ax + b löst die Gleichung. Um Eindeutigkeit einer möglichen Lösung zu erreichen, gibt man noch Randwerte vor: In der allgemeinsten Form betrachten wir nichttriviale lineare Abbildungen R1,2 : R2 → R und betrachten die Bedingungen u(a) u(b) R1 + R2 = 0. u0 (a) u0 (b) Wir nennen eine solche Aufgabe Sturmsches Randwertproblem nach Ch. Sturm4 . % 4 Ch. Sturm (1803–1855) 11.4. RANDWERTPROBLEME 141 Index C 1 -Parametertransformation, 39 C k (U R), 65 Γ-Funktion, 5 k-linear, 61, 75 Äquivalenz Normen, 21 Überlagerung doppelte, 105 Ableitung partielle, 47, 83 affin lineare, 45 Algebra, 104 Argebra normiert, 104 Banachalgebra, 104 Banachraum, 21 Basis, 14 beschränkt, 58 bilinear, 61 Cauchy-Schwarzsche Ungleichung, 19 Doppelintegral, 99 Dualraum, 43 Eigenraum, 131 verallgemeinerter, 131 Eigenvektor, 131 Entwicklungspunkt, 106 Fixpunkt, 78 Folge beschränkt, 22 Fourierkoeffizienten, 118 Fourierreihe, 118 Funktionalgleichung, 5 Gamma-Funktion, 5 Gebiet, 58 konvex, 58 wegezusammenhängend, 58 Gradient, 54 Hauptsatz, 33 Hesse-Matrix, 63 Hilbertraum, 21 Diagonalmatrix, 130 indefinit, 68 Diffeomorphismus, 90 Integral Differential, 44, 71 uneigentliches, 3 Differential bezüglich der ersten Variablen, 83 Jacobimatrix, 72 Differentialgleichung autonome, 134 Komplementärraum, 53 nichtautonom, 134, 137 Konstanzbedingung, 33 differenzierbar, 42 Kontraktion, 78 Abbildung, 71 Kontraktionszahl, 78 Differenzierbare Abbildungen Konvergenzradius, 107 Wachstumsschranken, 34 Kurve, 24 Dirichlet-Kern, 121 differenzierbar, 25 142 INDEX integrierbar, 30 rektifizierbar, 35 stetig differenzierbar, 25 stetig differenzierbar, 27 Kurven äquivalente, 40 Länge, 35 Lagrange-Multiplikator, 93 linear abhängig, 93 Linearisierung, 44 Linienintegral, 59 Lipschitz stetig, 36 Losungsraum, 136 Mehrfachintegrale, 100 Menge beschränkt, 22 zusammenhängend, 23 Metrik, 15, 16 Multiindex, 64 Länge, 64 multilinear, 61 negativ definit, 68 negativ semidefinit, 68 Niveaumenge, 55 Norm, 15, 19 Äquivalenz, 21 einer linearen Abbildung, 73 Operator, 73 Operatornorm, 73 orientierungserhaltend, 40 orientierungsumkehrend, 40 Parallelogrammgleichung, 51 Parametertransformation, 39 partiell differenzierbar, 47 Polarkoordinaten, 90 Polygonzug, 34 Länge, 35 Polynom, 63 trigonometrisches, 118 143 positiv definit, 68 positiv semidefinit, 68 Potenzreihe, 106 Produkt inneres, 18 Projektion, 25 Punkte separiert, 112 Reihe trigonometrische, 118 Richtungsableitung, 47 Riemann integrierbar uneigentlich, 3 Riemann-Summe, 29 Robotik, 105 Räume metrisch, 42 Schraubenlinie, 25 separiert, 112 Skalarprodukt, 18, 51 Spur, 39 Stammfunktion, 32, 34 stetig stückweise, 121 Sturmsches Randwertproblem, 140 Tangentialvektor, 26 Taylorpolynom, 9, 67 Taylorreihe, 11 uneigentlich integrierbar, 2 Vektorfeld, 136 Verbindungsstrecke, 57 Weg, 41 Wegelängenfunktion, 36 Zusammenhangskomponente, 91 144 INDEX Literaturverzeichnis [1] H. W. Alt. Lineare Funktionalanalysis. Springer Verlag, Berlin, 1999. [2] M. Barner & F. Flohr. Analysis I. de Gruyter, 1974. [3] C. Blatter. Analysis I. Springer Verlag, 1980. [4] B. Brosowski & F. Deutsch. An Elementary Proof of the StoneWeierstrass Theorem. Proceedings of the Am. Math. Soc., 81(1), 89-92, 1981. [5] J. H. Conway & D. A. Smith. On Quaternions and Octonions, their geometry, arithmetic and symmetry. A K Peters, 2003. [6] J. Dieudonné. Grundzüge der modernen Analysis. VEB Deutscher Verlag d. Wissenschaften, Berlin, 1972. [7] K. Endl & W. Luh. Analysis I. AULA-Verlag, Wiesbaden, 1989. [8] O. Forster. Analysis 2. Vieweg, Braunschweig, 5. Auflage, 1999. [9] A. Friedman. Foundations of Modern Analysis. Holt Rinehart and Winston, 1972. [10] H. Heuser. Lehrbuch der Analysis, Teil 1. B. G. Teubner, Stuttgart, 15. Auflage, 2003. [11] E. Hewitt & K. Stromberg. Real and abstract analysis. Springer Verlag, Berlin, 1969. [12] K. Königsberger. Analysis II, Springer Lehrbuch. Springer Lehrbuch. Springer Verlag, Berlin Heidelberg New York, 2000. [13] K. Königsberger. Analysis I, Springer Lehrbuch 8. Springer Verlag, Berlin Heidelberg New York, 4. Auflage, 2004. [14] J. Pöschel. Etwas Analysis. Springer Spektrum, Wiesbaden, 2014. [15] J. Pöschel. Etwas mehr Analysis. Springer Spektrum, Wiesbaden, 2014. 145 146 LITERATURVERZEICHNIS [16] J. Pöschel. Noch mehr Analysis. Springer Spektrum, Wiesbaden, 2015. [17] W. Rudin. Functional Analysis. Mc Graw Hill, Inc, New York, 1973. [18] R. Walter. Einführung in die Analysis 2. de Gruyter, 2007.