1 Das Integral Stets seien a < b reelle Zahlen. Definition 1 a) Eine Zerlegung Z von [a, b] ist eine endliche Folge Z = (x0 = a, x1 , x2 , . . . , xn = b) mit xi < xi+1 für alle i zwischen 0 und n − 1. Die xi ’s heißen die Teilungspunkte der Zerlegung. b) Eine Zerlegung Z 0 = (x00 , x01 , x2 , . . . , x0n0 ) heisst feiner als Z = (x0 , x1 , x2 , . . . , xn ), falls für jedes i ein j existiert mit xi = x0j . Man schreibt dafür Z ≤ Z 0 . c) Sind Z 0 = (x00 , x01 , x2 , . . . , x0n0 ) und Z = (x0 , x1 , x2 , . . . , xn ) zwei Zerlegungen, so ist Z ∪ Z 0 = (z0 , z1 , . . . , zm ) die eindeutig bestimmte Zerlegung mit {z0 , z1 , . . . zm } = {x0 , x1 , . . . xn } ∪ {x00 , x01 , . . . x0n0 }. Bemerkung 1 Immer gilt Z ≤ Z ∪ Z 0 . Beispiel 1 Für jede natürliche Zahl n ≥ 1 hat man die äquidistante Zerlegung mit den n + 1 Teilungspunkten xi = a + i b−a n für i = 0, 1, . . . , n. Definition 2 Sei f : [a, b] → R eine beschränkte Abbildung und Z = (x0 , x1 , . . . , xn ) eine Zerlegung. Für i = 1, 2, . . . , n sei mi (f ) das Infimum und Mi (f ) das Supremum der Menge f ([xi−1 , xi ]). Dann definiert man die Unter- bzw. die Obersumme von f zur Zerlegung Z als UZ (f ) = n X mi (f )(xi − xi−1 ) bzw. OZ (f ) = i=1 n X Mi (f )(xi − xi−1 ). i=1 Bemerkung 2 Ist stets f (x) ≥ 0, so ist die Untersumme eine untere, die Obersumme eine obere Approximation an den noch zu definierenden Inhalt der Fläche zwischen dem Graphen von f und der x-Achse. Es gelten folgende einfache, aber wichtige Rechenregeln und Definitionen: Lemma 1 Sei wieder f : [a, b] → R eine beschränkte Abbildung und Z eine Zerlegung. Dann gilt: a) UZ (f ) ≤ OZ (f ). b) Aus Z ≤ Z 0 folgt UZ (f ) ≤ UZ 0 (f ) und OZ 0 (f ) ≤ OZ (f ). Rb c) Das Supremum U a f der UZ (f ) über alle Zerlegungen existiert und es heißt das Unterintegral von f auf dem Intervall [a, b]. Rb d) Das Infimum O a f der OZ (f ) über alle Zerlegungen existiert und es heißt das Oberintegral von f auf dem Intervall [a, b]. Rb Rb e) Man hat stets U a f ≤ O a f . 1 Definition 3 Eine Funktion f : [a, b] → R heißt (Riemann-) integrierbar, wenn f beschränkt ist und Ober-und Unterintegral übereinstimmen. Man nennt diese Rb Zahl dann das bestimmte Integral von f über [a, b] und schreibt dafür a f . Für die Menge der integrierbaren Funktionen auf [a, b] schreibt man R([a, b]) Satz 1 Sei f : [a, b] → R eine Abbildung. Genau dann ist f integrierbar, wenn f beschränkt ist und für jedes > 0 eine Zerlegung Z existiert mit OZ (f ) − UZ (f ) < . Satz 2 Sei f : [a, b] → R eine Abbildung. Falls f monoton ist oder stetig, so ist f integrierbar. Beispiele 1 a) Die Funktion f : [0, 1] → R mit f (x) = 1 für rationale und f (x) = 0 für irrationale Zahlen ist nicht integrierbar, weil jede Obersumme 1 und jede Untersumme 0 ist. b) Für jedes x in [a, b] ist die Funktion ex : [a, b] → R mit ex (x) = 1 und ex (y) = 0 für y 6= x integrierbar mit Integral 0. c) Für a = b lassen wir auch die Zerlegung (x0 = a, x1 = b) zu. Dann ist jede Funktion auf [a, a] integrierbar mit Integral 0. Lemma 2 Sei f : [a, b] → R eine Abbildung. Sei a ≤ c ≤ b. Sei f1 : [a, c] → R definiert durch f1 (x) = f (x) und sei f2 : [c, b] → R analog definiert. Dann gilt f ∈ R([a, b]) genau dann, wenn f1 ∈ R([a, c]) und f2 ∈ R([c, b]) gelten. In Rb Rc Rb diesem Fall ist a f = a f1 + c f2 . Definiert man also in naheliegender Weise stückweise monotone oder stückweise stetige Funktionen, so sind diese integrierbar. Definition 4 Sei f : [a, b] → R eine Abbildung. Wir definieren f + : [a, b] → R durch f + (x) = f (x) für f (x) ≥ 0 und f + (x) = 0 sonst. Ferner sei f − : [a, b] → R gegeben durch f − (x) = −f (x) für f (x) ≤ 0 und f + (x) = 0 sonst. Satz 3 Seien f, g in R([a, b]). Dann gilt: Rb Rb Rb a) f + g ist integrierbar mit a (f + g) = a f + a g. Rb Rb b) Für jeden Skalar λ ist λf integrierbar mit a (λf ) = λ a f . c) f + , f − und | f |= f + + f − sind integrierbar. Rb Rb d) Aus f ≤ g ( d.h. f x ≤ gx für alle x aus [a, b] ) folgt a f ≤ a g. Rb Rb e) | a f |≤ a | f |≤k f k (b − a) mit k f k= sup | f | ([a, b]). f ) fg ist integrierbar. 2 Bemerkung 3 Die ersten beiden Teile des Satzes besagen gerade, dass R([a, b]) ein Unterraum des Vektorraumes aller reellwertigen Abbildungen auf [a, b] ist Rb und a eine lineare Abbildung ist. Es gibt noch einen allgemeineren Integralbegriff als den Riemannschen, nämlich den Lebesgueschen. Dieser liefert einen viel größeren Raum L([a, b]) von integrierbaren Funktionen und ein allgemeineres Integral, das für Riemann-integrierbare Funktionen mit dem RiemannIntegral übereinstimmt. Der Übergang von den rationalen Zahlen zu den reellen Zahlen entspricht dabei dem Übergang von den Riemann-integrierbaren zu den Lebesgue-integrierbaren Funktionen. Das wird in Analysis 3 erklärt. Satz 4 ( Verallgemeinerter MWS der Integralrechnung ) Sei f : [a, b] → R stetig, p : [a, b] → R integrierbar mit p ≥ 0. Dann existiert ein ξ aus [a, b] mit Rb Rb (f p) = f (ξ) a p. Speziell für die Funktion p(x) = 1 für alle x folgt also der a MWS: Es gibt ein ξ mit Z b f = f (ξ)(b − a). a Satz 5 Sei (fn ) eine Folge in R([a, b]), die gleichmäßig gegen f konvergiert. Dann ist auch f integrierbar und es gilt Z b Z f = lim( a 2 b fn ). a Der Hauptsatz der Differential- und Integralrechnung Definition 5 Für integrierbares f : [a, b] → R definieren wir Ra b f =− Rb a f. Satz R x 6 Sei f : [a, b] → R integrierbar. Definiere F : [a, b] → R durch F (x) = f (t)dt. Dann gilt: a a) Für alle x, y aus [a, b] ist | F (x) − F (y) |≤k f k| x − y |. Insbesondere ist F Lipschitz-stetig. b) Falls f in x0 aus [a, b] stetig ist, so ist F in x0 differenzierbar mit F 0 (x0 = f (x0 . Definition 6 Sei I ein Intervall und f : I → R eine Abbildung. Eine Funktion F : I → R heißt Stammfunktion von f , falls F 0 = f . Bemerkung 4 Im allgemeinen hat f keine Stammfunktion. Ist F eine Stammfunktion von f , so auch F + c für jede konstante Funktion c. Sind F und G Stammfunktionen von f , so ist F − G eineR konstante Funktion. Es gibt also nicht die Stammfunktion. Man schreibt oft f und meint damit eine Stammfunktion von f . 3 Satz 7 ( Hauptsatz der Differential-und Integralrechnung ) Sei I ein Intervall und f : I → R stetig. Dann gilt: Rx a) Für jedes a ∈ I ist F (x) := a f (t)dt eine Stammfunktion von f . Rb b) Für jede Stammfunktion G von f und alle a < b mit a, b ∈ I gilt a f (t)dt = G(b) − G(a) = [G]ba . Bemerkung 5 a) Nicht jede Ableitung ist beschränkt oder sogar integrier−1 bar. Ein Beispiel R 0ist f (x) = xsin(x ) für x 6= 0 und f 0 = 0. Also ist eine ’Formel’ wie (f ) = f im allgemeinen Unsinn, weil die linke Seite überhaupt nicht definiert ist. Aber selbst für integrierbares f 0 ist die Formel mit Vorsicht zu genießen, weil die linke Seite nur bis auf Addition einer Konstanten festliegt. R b) Eine Formel wie ( f )0 = f ist im allgemeinen ebenfalls Unsinn, z.B. für die integrierbaren Funktionen ex . Diese Formel ist sinnvoll für stetiges f . Mit ihrer Hilfe erhält man aus der Produktregel und der Kettenregel die beiden folgenden Sätze, die bei der Integration eine zentrale Rolle spielen. Satz 8 ( Partielle Integration ) Seien f und g stetig differenzierbar auf [a, b]. R R Rb Rb Dann gilt (f 0 g) = (f g) − (f g 0 ) bzw. a (f 0 g) = [(f g)]ba − a (f g 0 ) Satz 9 ( Substitutionsregel ) Sei I ein Intervall und f : I → R stetig. Ferner sei g : [a, b] → R stetig differenzierbar mit g([a, b]) ⊆ I. Dann gilt: Z b Z g(b) 0 f (g(t))g (t)dt = f (u)du. a g(a) Das Problem mit diesen beiden Integrationsmethoden - aber auch die Herausforderung an die mathematische Intuition - ist, dass es unendlich viele Arten gibt, eine gegebene Funktion h als Produkt (f 0 g) zu schreiben oder als Produkt (h ◦ g)g 0 . In der Literatur finden sich viele Tipps, was bei bestimmten Typen von Funktionen zu tun ist. Aber selbst harmlos aussehende Funktionen lassen sich nicht in geschlossener Form durch elementare Funktionen integrieren. Außerdem ist die Darstellung einer Funktion als Integral oft aus theoretischen und numerischen Gründen anderen Darstellungen vorzuziehen. In der Vorlesung gab es zur Illustration nur ein paar nicht-triviale Beispiele und Anwendungen: Das Wallissche Produkt, die Stirlingsche Formel und die Formel für den Flächeninhalt des Kreises. All das kann man im Forster gut nachlesen. 3 Approximation durch Polynome Stets sei I ein Intervall, f : I → R eine stetige Abbildung eventuell mit gewissen zusätzlichen Eigenschaften. Gesucht ist ein Polynom bzw. eine polynomiale Abbildung P , die f möglichst gut annähert. Dabei sind viele verschiedene Begriffe der ’Annäherung’ zu unterscheiden: 4 • ( Interpolation ) P soll an endlich vielen vorgegebenen Stellen mit f übereinstimmen. • ( Taylor-Polynom und Taylor-Reihe ) P und f sollen in einem Punkt gleiche Ableitungen haben bis zu einer gewissen Ordnung. • ( Gleichmäßige Approximation ) Das Supremum der Differenzen der Funktionswerte von f und P soll klein sein. • ( Approximation im Mittel ) Das Integral von | f − P |2 soll klein sein. Wir werden uns in diesem Kapitel mit den ersten drei Begriffen auseinandersetzen und beginnen mit dem einfachsten. Satz 10 Seien x0 , x1 , . . . , xn paarweise verschiedene Elemente aus I und seien y0 , y1 , . . . , yn beliebige reelle Zahlen. Dann gibt es genau ein Polynom vom Grad höchstens n mit reellen Koeffizienten, derart dass P (xi ) = yi für alle i gilt. Insbesondere gibt es zu jeder Funktion f : I → R genau ein Polynom vom Grad höchstens n mit f (xi ) = P (xi ) für i = 0, 1, . . . , n. Im folgenden benötigen wir einige grundlegende Sätze aus der Analysis I, an die wir nun erinnern. Dabei sei stets I ein Intervall mit mindestens 2 Punkten. Stets sei f : I → R stetig und es sei hn : I → R eine gleichmäßig gegen h konvergente Folge von Funktionen. Dann gilt: • Das Bild J := f (I) ist ein Intervall. • f ist injektiv genau dann, wenn f strikt monoton ist. In diesem Fall ist die induzierte Abbildung g : I → J mit g(x) = f (x) invertierbar mit stetiger Umkehrabbildung. Ist g sogar auf I differenzierbar, so ist g −1 genau dann differenzierbar auf J, wenn g 0 (x) 6= 0 für alle x ∈ I. Es ist 1 dann (g −1 )0 (x) = g0 (g−1 (x)) für alle x. • Sind alle hn stetig, so auch h. • Sind alle hn integrierbar, so auch h. Ferner gilt R R h = lim hn . • Sind alle hn differenzierbar und konvergiert die Folge der Ableitungen h0n gegen eine Funktion g, so ist h differenzierebar und g ist die Ableitung. • Die wichtigste Anwendung finden die letzten drei Sätze bei PotenzreiP∞ hen. Sei P (x) = a (x − a)n eine Potenzreihe mit Konvergenzran n=0 P∞ n−1 dius R > 0. Setzt man dann Q(x) = und R(x) = n=0 an n(x − a) P∞ an n+1 (x − a) , so haben Q(x) und R(x) ebenfalls Konvergenzradin=0 n+1 us R und es gilt P 0 (x) = Q(x) und R0 (x) = P (x) für alle x im Inneren des Konvergenzkreises. Kurz: Potenzreihen darf man gliedweise differenzieren und integrieren . 5 Definition 7 Sei f : I → R eine n + 1-mal stetig differenzierbare Funktion. Sei a ein Punkt aus I. Dann heisst Ta,n f (x) = n X f i (a) i=0 i! (x − a)i das Taylorpolynom zu f vom Grad n an der Stelle a. Die Differenz Ra,n f (x) = f (x) − Ta,n f (x) heisst n-tes Restglied. Ist f beliebig oft auf I differenzierbar, so heisst ∞ X f i (a) Ta, f (x) = (x − a)i i! i=0 Taylorreihe von f in a. Bemerkungen 1 di mit dx i f. • Die ite Ableitung von f bezeichnen wir mit f (i) oder • Das Taylorpolynom ist das eindeutig bestimmte Polynom P vom Grad n dessen Ableitungen an der Stelle a bis zur Ordnung n mit denen von f übereinstimmen. • Taylorpolynom und Taylorreihe hängen nur von einer -Umgebung von a ab. Die Reihe konvergiert genau dann im Punkt x gegen die Ausgangsfunktion f , wenn das Restglied an dieser Stelle gegen 0 konvergiert. P∞ • Ist P = i=0 ai (x − a)i eine Potenzreihe mit Konvergenzradius R > 0, so ist P auch die Taylorreihe zu der durch P im Inneren des Konvergenzkreises gegebenen Funktion . Somit kennen wir die Taylorreihen an der Stelle 0 von exp, sin, cos. • Man kann für f (x) = ln(1 − x) direkt induktiv die Taylorreihe in 0 ausrechnen, aber man benutzt besser die geometrische Reihe und gliedweise Integration. Der gleiche Trick funktioniert auch noch in anderen Fällen, etwa für arctan(x) in 0. Satz 11 Sei f : I → R n + 1-mal stetig differenzierbar und a aus I. Dann gilt: Rx 1 a) Ra,n f (x) = n! (x − t)n f (n+1) (t)dt. ( Integralform des Restglieds ) a 1 b) Ra,n f (x) = (n+1)! (x − a)n+1 f (n+1) (ξ) für ein ξ zwischen a und x. ( Lagrangesche Form des Restglieds ) c) Es ist Ra,n f (x) = η(x)(x − a)n für eine Funktion η mit η(x) → 0 für x → a. Dieser Satz liefert ein gutes hinreichendes Kriterium für Extremstellen, das unsere früheren Ergebnisse verallgemeinert und in den Übungen besprochen wird. Auf dem Konvergenzkreis einer Potenzreihe kann Divergenz oder Konvergenz vorliegen. Wie wir nun sehen, erhält man im zweiten Fall interessante Grenzwerte aus Stetigkeitsaussagen. 6 Lemma 3 ( Abelsche partielle Summation ) Seien c0 , c1 , . . . , cn und d0 , d1 , . . . , dn Pm komplexe Zahlen. Setze Cm = i=0 ci für m = 0, 1, . . . n und C−1 = 0. Dann gilt: n−1 n X X Ci (di − di+1 ) + Cn dn . ci di = i=0 i=0 P Satz 12 ( Grenzwertsatz von Abel ) Sei P (x) = an (x − a)n eine komplexe Potenzreihe mit Konvergenzradius 0 < R < ∞. In einem Punkt b auf dem Rand des Konvergenkreises sei die Reihe konvergent gegen c. Dann konvergiert die Reihe gleichmäßig auf jeder Teilmenge D des Konvergenzkreises, auf der | b − x | /(R− | x − a |) beschränkt bleibt. Insbesondere ist P auf D ∪ {b} definiert und stetig. Es gilt P (b) = c. • Für D ist immer die Strecke zwischen a und b zugelassen. Beispiele 2 • ln(2) = 1 − • π 4 =1− 1 3 1 2 + + 1 5 1 3 − − ... 1 7 + . . .. Binomialreihe Lemma 4 Seien f, g auf dem Intervall I n-mal differenzierbar. Dann gilt n X n (i) (n−i) (f g)(n) = f g . i i=0 Proposition 1 a) Die Funktion f : R → R mit f (x) = 0 für x ≤ 0 und f (x) = exp(− x1 ) für x > 0 ist beliebig oft differenzierbar und alle Ableitungen verschwinden im Nullpunkt ( ’f ist platt in 0’ ). b) Zu beliebigen reellen Zahlen a < a0 < b0 < b gibt es eine beliebig oft differenzierbare Funktion h : R → R mit 0 ≤ h(x) ≤ 1 für alle x, h(x) = 1 für x aus [a0 , b0 ] sowie h(x) = 0 für x außerhalb von [a, b] ( h heißt ’Hutfunktion’ ). P Satz 13 ( E.Borel ) Jede reelle Potenzreihe an xn ist die Taylorreihe einer beliebig oft differenzierbaren Funktion f : R → R. Bemerkung 6 Für eine auf einem Intervall I mit a ∈ I beliebig oft differenzierbare Funktion f existiert immer die Taylor-Reihe T um a, aber folgende Fälle treten auf: • T hat Konvergenzradius 0. • T hat Konvergenzradius R > 0, aber die Potenzreihe zu T stimmt nicht mit der Ausgangsfunktion überein. • T hat Konvergenzradius R > 0 und im Inneren des Konvergenzkreises stimmen f und die Potenzreihe zu T überein. Eventuell ist aber der Konvergenzbereich viel kleiner als I. 7 Definitionen 1 Sei (X, d) ein metrischer Raum und Y eine Teilmenge. a) Eine offene Überdeckung von Y ist eine Familie (Ui )i∈I von offenen Mengen Ui , derart dass Y ⊆ ∪i∈I Ui gilt. b) Eine solche offene Überdeckung besitzt eine endliche Teilüberdeckung, falls es eine endliche Teilmenge J von I gibt, so dass Y ⊆ ∪j∈J Uj gilt. c) Y heißt kompakt, wenn jede offene Überdeckung von Y eine endliche Teilüberdeckung besitzt. d) Y heißt folgenkompakt, wenn jede Folge (yn ) aus Y eine konvergente Teilfolge besitzt mit Grenzwert in Y . Lemma 5 ( Lebesgue ) Sei Y folgenkompakt in einem metrischen Raum und sei (Ui )i∈I eine offene Überdeckung von Y . Dann gibt es ein > 0, so dass für jedes y ∈ Y ein Index iy existiert mit U (y) ⊆ Uiy . Satz 14 Eine Teilmenge eines metrischen Raumes ist genau dann kompakt, wenn sie folgenkompakt ist. Definition 8 Sei K ein kompakter metrischer Raum und C 0 (K, R) die Menge der stetigen Funktionen f : K → R versehen mit der Supremumsnorm kf k = sup | f (x) |. Eine Teilmenge D von C 0 (K, R) trennt die Punkte, wenn es zu x 6= y aus K stets eine Funktion f aus D gibt mit f (x) 6= f (y). Definition 9 Eine Teilmenge D von C 0 (K, R) heißt Unteralgebra, falls sie abgeschlossen ist unter Addition und Multiplikation und die Eins 1 enthält. Beispiel 2 Für K = [a, b] ist die Menge der Polynome eine Unteralgebra, die die Punkte trennt. Satz 15 ( Stone-Weierstrass ) Sei K ein kompakter metrischer Raum und D eine Unteralgebra von C 0 (K, R), die die Punkte trennt. Dann gibt es zu jedem f ∈ C 0 (K, R) und jedem > 0 ein g ∈ D mit kf − gk < . Folgerung 1 ( Klassischer Satz von Weierstrass ) Jede stetige Funktion f : [a, b] → R ist gleichmäßiger Grenzwert einer Folge von Polynomen. 4 Grundlagen aus der mengentheoretischen Topologie Definition 10 Sei V ein R-Vektorraum. a) Ein Skalarprodukt auf V ist eine positiv definite, symmetrische, bilineare Abbildung [ , ] : V × V → R. Für alle Vektoren x, y, z und alle Skalare a, b gilt also [x, x] ≥ 0 und [x, x] = 0 nur für x = 0, [x, y] = [y, x] und [ax + by, z] = a[x, z] + b[y, z]. Ein Vektorraum mit einem Skalarprodukt heißt Euklidischer Raum. Zwei Vektoren x, y heissen orthogonal, wenn [x, y] = 0. 8 b) Eine Norm auf V ist eine Abbildung k k: V → R mit k x k ≥ 0 mit Gleichheit genau für x = 0, k ax k=| a |k x k und mit k x + y k≤k x k + k y k für alle Vektoren x, y und alle Skalare a. Das Paar V, k k) heißt normierter Raum. Lemma 6 Sei V ein Euklidischer Raum. Dann gilt: a) ( Cauchy-Schwarzsche Ungleichung ) Für alle x, y gilt [x, y]2 ≤ [x, x][y, y]. Gleichheit gilt genau dann, wenn x und y linear abhängig sind. p b) Durch k x k:= [x, x] wird eine Norm auf V induziert. Pn Beispiele sind V = Rn mit dem Skalarprodukt [x, y] = i=1 xi yi und V = Rb C 0 ([a, b], R mit dem Skalarprodukt [f, g] = a f g. Die zugehörige Norm wird mit k f k2 bezeichnet. Definition 11 Ein metrischer Raum (X, d) ist eine Menge X versehen mit einer Abbildung d : X×X → R, so dass d(x, y) ≥ 0 mit Gleichheit genau für x = y, d(x, y) = d(y, x) und d(x, y) ≤ d(x, z) + d(z, y) für alle x, y, z gelten. d(x, y) heißt dann der Abstand von x und y bezüglich der Metrik d. Die Ungleichung heißt Dreiecksungleichung. Jeder normierte Raum wird durch d(x, y) =k x − y k zu einem metrischen Raum und jede Teilmenge eines metrischen Raumes wird durch die Einschränkung der Metrik zu einem metrischen Raum. Definition 12 Sei (X, d) ein metrischer Raum. • Für > 0 und x aus X ist die −Umgebung U (x) definiert als die Menge aller Punkte x0 aus X mit d(x, x0 ) < . • Eine Teilmenge U von X heißt offen in X, wenn es zu jedem u aus U ein ( von u abhängiges ) > 0 gibt, derart dass U (u) in U liegt. • Eine Teilmenge A heißt abgeschlossen in X, wenn ihr Komplement offen ist. • Eine offene Umgebung eines Punktes x ist eine offene Teilmenge von X, die x enthält. • Eine Folge (xn ) in X heißt konvergent mit Grenzwert x, falls ein Punkt x in X existiert, so dass (d(xn , x)) eine Nullfolge ist. Die Folge heißt Cauchy-Folge, falls zu jedem > 0 ein n0 existiert mit d(xn , xm ) < für alle n, m ≥ n0 . • X heißt vollständig, wenn jede Cauchy-Folge in X konvergiert. • Eine Teilmenge B heißt beschränkt, wenn es einen Punkt x aus X und eine Konstante C gibt mit d(b, x) < C für alle b aus B gibt. 9 Jede Folge hat höchstens einen Grenzwert, und jede konvergente Folge ist eine Cauchy-Folge. Die Eigenschaften ’offen’ und ’abgeschlossen’ hängen von der umgebenden Menge ab, die Eigenschaft ’kompakt’ nicht. Lemma 7 Sei X ein metrischer Raum mit einer Teilmenge A. Genau dann ist A abgeschlossen in X, wenn A die Grenzerte aller konvergenten Folgen (an ) mit Folgegliedern aus A enthält. Satz 16 Sei X ein metrischer Raum und K eine Teilmenge. Dann gilt: a) Ist K kompakt, so ist K abgeschlossen in X und beschränkt. b) Ist A eine Teilmenge der kompakten Menge K, die in K abgeschlossen ist, so ist A kompakt. Definition 13 Zwei Normen k k und k k0 auf dem gleichen Vektorraum V heißen äquivalent, wenn es Konstanten C, D gibt mit k x k≤ C k x k0 und k x k0 ≤ D k x k für alle x. Äquivalente Normen induzieren die gleichen offenen Mengen, die gleichen konvergenten Folgen etc. , obwohl die -Umgebungen sehr verschieden aussehen können. Definition 14 Ein normierter Raum, der bezüglich der induzierten Metrik vollständig ist, heißt Banachraum. Satz 17 Sei V ein endlichdimensionaler normierter Raum. Dann gilt: a) Je zwei Normen auf V sind äquivalent. b) V ist ein Banachraum. c) Eine Teilmenge von V ist kompakt genau dann, wenn sie abgeschlossen und beschränkt ist. C 0 ([a, b], R) ist bezüglich der Supremumsnorm k k∞ vollständig, aber nicht bezüglich k k2 . Die abgeschlossene Einheitskugel ist in beiden Normen nicht kompakt. Definition 15 Sei f : X → Y eine Abbildung zwischen metrischen Räumen. a) f heißt stetig im Punkt x, falls zu jedem > 0 ein δ > 0 existiert, so dass d(f x, f x0 ) < gilt für alle x0 mit d(x, x0 ) < δ. b) f heißt stetig auf X, falls f in jedem Punkt stetig ist. c) f heißt gleichmäßig stetigstetig , falls zu jedem > 0 ein δ > 0 existiert, so dass d(f x, f x0 ) < gilt für alle x, x0 mit d(x, x0 ) < δ. Satz 18 Sei f : X → Y eine Abbildung zwischen metrischen Räumen. Dann gilt: 10 a) f ist stetig in x genau dann, wenn für jede gegen x konvergente Folge (xn ) die Folge der Bilder (f xn ) gegen f x konvergiert. b) f ist stetig auf X genau dann, wenn das Urbild jeder in Y offenen Menge offen ist in X. c) Die analoge Aussage gilt für abgeschlossene Mengen. Trivialerweise ist die Komposition stetiger Abbildungen stetig. Satz 19 Sei f : X → Y stetig und X kompakt. Dann gilt: a) f ist gleichmäßig stetig. b) Das Bild von X ist kompakt. Insbesondere nimmt für Y = R die Funktion f ihr Minimum und ihr Maximum an. Definition 16 Sei f : V → W eine lineare Abbildung zwischen normierten Räumen. Setze dann k f k gleich dem Supremum über alle k f x k, wobei x alle Vektoren der Norm 1 durchläuft. Falls dies eine relle Zahl ist, heißt f beschränkt. Lemma 8 Für eine lineare Abbildung f : V → W zwischen normierten Räumen sind gleichwertig: a) f ist gleichmäßig stetig. b) f ist stetig in 0. c) Es gibt eine Konstante C mit k f x k≤ C k x k für alle x. d) f ist beschränkt. Es gilt dann k f x k≤k f kk x k für alle x. Nimmt man V = W = C 0 ([0, 1], R) so ist die Identität nicht beschränkt, wenn man auf zuerst die Integralnorm und dann die Supremumsnorm nimmt. Satz 20 Seien f : V → W und g : W → U lineare Abbildungen zwischen endlichdimensionalen normierten Räumen. Dann gilt: a) f ist beschränkt. Man erhält durch f 7→k f k eine Norm auf dem Vektorraum Hom(V, W ), die sogenannte Operatornorm. b) k gf k≤k g kk f k . Satz 21 ( Banachscher Fixpunktsatz ) Sei f : X → X eine Selbstabbildung eines vollständigen metrischen Raumes X. Es gebe eine Konstante K < 1 mit d(f x, f x0 ) ≤ Kd(x, x0 ) für alle x, x0 aus X. Dann hat f genau einen Fixpunkt x0 in X. Dabei gilt folgender Zusatz: Wählt man x beliebig und definiert rekursiv x1 = x sowie xn+1 = f xn , so konvergiert (xn ) gegen x0 und es gilt d(x0 , xn ) ≤ Kn 1−K d(x0 , x1 ). 11 5 Die Ableitung Definition 17 Seien V, W normierte Vektorräume endlicher Dimension. Sei U eine offene Teilmenge von V und sei x ∈ U . Eine Abbildung f : U → W heißt differenzierbar an der Stelle x mit Ableitung f 0 (x) = Df (x) = A, falls eine lineare Abbildung A : V → W existiert mit f (x + h) = f (x) + A(h) + ρ(h) für alle h ∈ V , so dass x + h zu U gehört. Schreibt man dabei ρ(h) = ρ̃(h) k h k, so muß für h → 0 auch ρ̃(h) → 0 gelten, d.h. zu jedem > 0 existiert ein δ > 0 mit k ρ̃(h) k< für alle h 6= 0 mit x + h ∈ U und k h k< δ. Ist f in jedem Punkt aus U differenzierbar, so heißt f differenzierbar auf U . Bemerkungen 2 • Wegen der Offenheit von U gibt es ein ζ > 0, so dass für alle h mit k h k< ζ stets x+h ∈ U gilt. Für alle solche h sind also ρ(h) und ρ̃(h) definiert, wobei man ρ̃(0) = 0 vereinbart. Die Differenzierbarkeit in x hängt nur ab von einer ( beliebig kleinen ) offenen Umgebung von x. • A und damit auch ρ liegen bei dieser Definition eindeutig fest. Ferner folgt die Stetigkeit in x aus der Differenzierbarkeit. • Äquivalente Normen liefern den gleichen Differenzierbarkeitsbegriff und die gleiche Ableitung. Im endlichdimensionalen Fall ist also alles eindeutig. • Eine sogenannte affine Abbildung f : V → W ( d.h. es ist f (x) = Ax + b für eine fest gewählte lineare Abbildung A und einen festen Vektor b ) ist in jedem Punkt x differenzierbar mit f 0 (x) = A. • Ist f auf U differenzierbar, so hat man die Abbildung f 0 : U → Hom(V, W ). • Die Summe von zwei in x differenzierbaren Funktionen ist differenzierbar und es gilt f 0 x + g 0 x = (f + g)0 x. Für skalare Vielfache gilt die analoge Aussage. Satz 22 ( Kettenregel ) Seien X, Y, Z normierte Räume, X 0 offen in X und Y 0 offen in Y . Ferner seien f : X 0 → Y 0 und g : Y 0 → Z Abbildungen. Ist dann f differenzierbar in x und g in f x, so ist g ◦ f differenzierbar in x und es gilt (g ◦ f )0 (x) = g 0 (f x)f 0 (x), wobei rechts die Komposition zweier linearer Abbildungen steht. Um mit den Ableitungen rechnen zu können, führen wir nun Koordinaten ein und wir identifizieren eine lineare Abbildung von Rn nach Rm mit einer m × n-Matrix. Mit pj : Rm → R bezeichnen wir die Projektion auf die j-te Komponente und mit fj = pj ◦f die j-te Komponentenfunktion einer Abbildung f : U → Rm . 12 Definition 18 Sei U eine offene Teilmenge von Rn , f : U → R, u ∈ U und v ∈ Rn beliebig. Wegen der Offenheit von U existiert ein > 0 mit u + tv ∈ U für alle |t| < und es ist g = gv :] − , [→ U mit g(t) = u + tv) differenzierbar in 0 mit Ableitung v. Falls f ◦ gv in 0 differenzierbar ist, so heisst f an der Stelle u differenzierbar in Richtung v und wir schreiben Dv f (u) für diese Richtungsableitung von f in Richtung v im Punkt u. Speziell für v = ei schreibt man kürzer Di statt Dei und wir nennen dies die i.te partielle Ableitung ∂f von f an der Stelle u. Man schreibt dafür auch ∂x (u). i m Falls für f : U → R alle partiellen Ableitungen aller Komponentenfunktionen an der Stelle u existieren, so definiert man die Jacobi-Matrix Jf (u) als die m × n-Matrix mit Dj fi (u) in der i-ten Zeile und j-ten Spalte. Satz 23 Sei f : U → Rm eine auf einer offenen Teilmenge U des Rn definierte Abbildung. Dann gilt: a) f ist genau dann differenzierbar in x, wenn alle Komponentenfunktionen fj in x differenzierbar sind. Dabei ist f 0 (x) die Matrix, deren i-te Zeile gerade aus der 1 × n-Matrix fi0 (x) besteht. b) Ist f in u differenzierbar, so existieren dort alle partiellen Ableitungen und es gilt f 0 (u) = Jf (u). c) Genau dann existieren alle partiellen Ableitungen Di fj aller fj auf U und sind dort stetig, wenn f auf U differenzierbar ist und die Abbildung f 0 : U → Hom(Rn , Rm ) = Rm×n stetig ist. Bemerkungen 3 • Jedes Di fj ist wieder eine Abbildung von U nach R und kann erneut partiell abgeleitet werden. • Die Existenz aller partieller Ableitungen reicht nicht aus für die Existenz der ( totalen ) Ableitung. Definition 19 Sei f : U → Rm wie im Satz. f heißt k-mal stetig differenzierbar auf U , falls für alle Indizes i1 , i2 , . . . , ir mit r ≤ k und alle j die partielle Ableitung Dik Dik−1 . . . Di1 fj existiert und stetig ist. Man schreibt C k (U, Rm ) für die Menge dieser Funktionen. Satz 24 ( Satz von Schwarz ) Für jede C 2 -Funktion f : U → R gilt Di Dj f = Dj Di f für alle i und j. Der Satz bleibt nicht gültig ohne die Stetigkeit der partiellen Ableitungen. 6 Lokale Eigenschaften Stets sei f : U → R eine Abbildung von einer offenen Teilmenge des Rn nach R. Mit AT bezeichnen wir die transponierte Matrix zu A. A heißt symmetrisch, falls A = AT . 13 Definition 20 a) f hat ein lokales Maximum bzw. isoliertes Maximum in u ∈ U , falls auf einer -Umgebung von u gilt f x ≤ f u bzw. f x < f u. Analoges definiert man für Minima. Ein Extremum ist ein Minimum oder Maximum. b) Ist f differenzierbar auf U so ist der Gradient von f das Vektorfeld gradf : U → Rn definiert durch gradf (u) = f 0 (u)T . u heisst stationärer Punkt von f , wenn gradf (u) = 0. Ein stationärer Punkt, an dem f kein lokales Extremum hat, heisst Sattelpunkt. Der Gradient zeigt die Richtung der stärksten Änderung von f an. Satz 25 Sei f differenzierbar auf U . Hat f ein lokales Extremum in u, so ist u ein stationärer Punkt. T Beispiel 3 Sei A eine symmetrische Matrix und f x = xxTAx auf der Menge x U aller Vektoren 6= 0 definiert. Dann ist f U das Bild der Menge der Einheitsvektoren. Also hat f ein lokales Maximum und somit einen stationären Punkt u. Nach Quotientenregel ist dies ein Eigenvektor zum ( maximalen ) Eigenwert uT Au von A. Induktiv folgt leicht, dass A diagonalisierbar ist und eine Orthonormalbasis aus Eigenvektoren besitzt. Pn Definition 21 a) Für h ∈ Rn ist Dh der Differentialoperator i=1 hi Di . Dann ist Dh f (u) die Richtungsableitung von f in Richtung h an der Stelle u. b) Für f aus C 2 ist die Hesse-Matrix Hf (u) zu f an der Stelle u definiert als die symmetrische (!) Matrix mit Di Dj f (u) in der iten Zeile und jten Spalte. Satz 26 ( Taylor-Formel ) Sei f k + 1-mal stetig differenzierbar auf U . Sei u aus U und > 0 so gewählt, dass U (u) ganz in U liegt. Dann gilt für alle h mit k h k< die Taylor-Formel f (u + h) = k X 1 1 (Dh )i f (u) + (Dhk+1 )f (u + th) i! (k + 1)! i=0 für ein t zwischen 0 und 1. Dabei geht der letzte Term für h → 0 von höherer Ordnung als k gegen 0. Speziell für k = 2 gilt 1 f (u + h) = f (u) + [gradf (u), h] + [h, Hf (u)h] + ρ(h) 2 mit ρ khk2 → 0 für h → 0. Definition 22 Eine symmetrische Matrix A heisst positiv definit bzw. positiv semi-definit, wenn xT Ax > 0 bzw. ≥ 0 für alle x 6= 0 gilt. Analog definiert man negativ definit bzw. negativ semi-definit. A heisst indefinit, wenn sowohl xT Ax > 0 als auch y T Ay < 0 für geeignete x, y auftritt. 14 Bemerkung 7 Eine Diagonalmatrix D ist positiv definit bzw. positiv semidefinit bzw. indefinit genau dann, wenn alle Diagonaleinträge dii > 0 bzw. ≥ 0 bzw. einer > 0 und ein anderer < 0 ist. Satz 27 Sei A eine symmetrische Matrix. Dann kann man mit dem GaussAlgorithmus eine invertierbare Matrix S konstruieren, derart dass SAS T = D eine Diagonalmatrix ist. Dabei ist A positiv definit bzw semi-definit bzw. indefinit genau dann, wenn das entsprechende für D gilt. Satz 28 Sei A eine symmetrische Matrix. Dann sind gleichwertig: a) A ist positiv definit. b) Für alle i = 1, 2, . . . n ist der sogenannte Hauptminor det(Ai ) > 0. Dabei ist Ai die i × i-Untermatrix von A in der linken oberen Ecke. c) Man kann in endlich vielen Schritten eine untere Dreiecksmatrix L mit lauter Einsen auf der Diagonalen konstruieren , so dass LALT = D eine Diagonalmatrix mit dii > 0 für alle i ist. d) Alle Eigenwerte von A sind > 0. Bemerkung 8 Eine symmetrische Matrix A ist genau dann positiv definit, wenn eine Konstante C > 0 existiert mit xT Ax ≥ CxT x für alle Vektoren x. Satz 29 Sei f dreimal stetig differenzierbar und u ein stationärer Punkt. Dann gilt: a) Ist Hf (u) positiv definit, so hat f in u ein ( isoliertes ) lokales Minimum. b) Hat f in u ein lokales Minimum, so ist Hf (u) positiv semi-definit. c) Die analoge Aussage gilt für lokale Maxima. d) Ist Hf (u) indefinit, so ist u ein Sattelpunkt. 7 Der Satz von der inversen Funktion In diesem Abschnitt arbeiten wir der Einfachheit halber stets mit der MaximumsNorm und der Zeilensummennorm als zugehöriger Operatornorm und schreiben kurz k x k statt k x k∞ . Ferner bezeichnen wir mit Kr (u) die Menge aller x mit k x − u k≤ r und nennen dies die abgeschlossene Kugel um u mit Radius r. Satz 30 ( Mittelwertsatz ) Sei f : U → Rm eine C 1 -Funktion definiert auf einer offenen Teilmenge U des Rn . Für u ∈ U sei r > 0 so gewählt, dass Kr (u) in U liegt. Sei M das Maximum aller k f 0 (x) k mit x ∈ Kr (u). Dann gilt k f x − f x0 k≤ M k x − x0 k für alle x, x0 aus Kr (u). 15 Definition 23 Ein Diffeomorphismus f ist eine bijektive Abbildung f : U → V zwischen nicht-leeren offenen Teilmengen des Rn bzw. Rm , so dass f und die Umkehrabbildung f −1 überall differenzierbar sind. Ist f eine C k -Abbildung mit k ≥ 1, so heisst f ein C k -Diffeomorphismus. Bemerkung 9 Ist f ein Diffeomorphismus, so folgt aus der Kettenregel, dass n = m und (f −1 )0 (y) = (f 0 (f −1 (y)))−1 für alle y gilt. Insbesondere ist dann mit f auch f −1 eine C 1 -Abbildung. Jede affine Abbildung x 7→ Ax + b mit invertierbarer Matrix A ist ein C ∞ Diffeomorphismus von Rn nach Rn . Satz 31 ( Satz von der inversen Funktion ) Sei f : U → Rn eine C 1 -Funktion definiert auf einer offenen Teilmenge U des Rn . Für ein u ∈ U sei f 0 (u) invertierbar. Dann gibt es offene Umgebungen U1 von u und V1 von f u, so dass die Abbildung f1 : U1 → V1 definiert durch f1 x = f x ein C 1 -Diffeomorphismus ist. Lokal in einer ganzen offenen Umgebung vom Punkt u ist also f invertierbar, falls die Ableitung f 0 (u) nur in dem Punkt invertierbar ist. Der Satz verallgemeinert sich leicht auf C k -Funktionen mit beliebigem k ≥ 1. 8 Implizite Funktionen und Untermannigfaltigkeiten x0 Für n > m schreiben wir einen Vektor x in R als Spalte mit x0 ∈ Rn−m x00 und x00 ∈ Rm sowie eine m × n-Matrix A als eine Zeile A0 A00 bestehend aus einer m × (n − m)-Matrix A0 und einer m × m-Matrix A00 . n n m Satz 32 (Satz von der impliziten 0 Funktion ). Sei U offen in R , f : U → R u eine C 1 -Funktion, u = in U und b = f u. Ferner gelte für f 0 (x) = 00 u (Jf (x))0 (Jf (x))00 , dass Jf (u)00 invertierbar ist. Dann gibt es Jf (x) = offene Umgebungen U 0 von u0 und U 00 von u00 sowie eine C 1 -Abbildung g : U 0 → U 00 , so dass der Graph Γ(g) von g der Durchschnitt von f −1 (b) mit der U 0 × U 00 ist. g ist i.a. nicht explizit bekannt, aber für die Ableitung gilt x0 0 0 0 00 −1 0 0 0 g (h(x )) = −((Jf (hx )) ) (Jf (hx )) . Dabei ist hx = gx0 Satz 33 ( Extrema mit Nebenbedingungen ) Sei U offen in Rn und seien h : U → R sowie f : U → Rm stetig differenzierbare Abbildungen. Setze M = f −1 (0) und es sei der Rang von f 0 (u) für alle u ∈ M gleich m. Ist dann x ∈ U eine Extremstelle von h unter der Nebenbedingung f (u) = 0 ( d.h. es ist x ∈ M und es gibt eine in U enthaltene -Umgebung V von x, so dass für alle u ∈ M ∩ V gilt Pmh(u) ≤ h(x) bzw. h(u) ≥ h(x) ), so gibt es Skalare λ1 , . . . , λm mit h0 (x) = i=1 λi fi0 (x). Die eindeutig bestimmten Skalare heißen Lagrangesche Multiplikatoren. 16 Wie das Verschwinden des Gradienten ist dies nur ein notwendiges Kriterium für eine Extremstelle. Die Existenz muß gesondert nachgewiesen werden. Im folgenden fassen wir für m < n den Rm als Unterraum von Rn auf, der aus allen Spalten besteht, deren letzte n − m Komponenten verschwinden. Definition 24 Eine nicht-leere Teilmenge M des Rn heißt m-dimensionale C k -Untermannigfaltigkeit, falls es für jeden Punkt p ∈ M eine offene Umgebung U und eine offene Menge V gibt, sowie einen C k -Diffeomorphismus h : U → V mit h(M ∩ U ) = V ∩ Rm . Dabei sei k ≥ 1. Ein Vektor v ∈ Rn ist dann ein Tangentenvektor an M in p, wenn es für eine -Umgebung I von 0 in R eine differenzierbare Abbildung α : I → Rn gibt mit α(t) ∈ M für alle t, α(0) = p und α0 (0) = v. Die Menge Tp M aller solcher Tangentenvektoren heißt Tangentialraum an M im Punkt p. Lokal um p liegt also nach dem ’krummlinigen’ Koordinatenwechsel h die Menge M so in Rn wie Rm und ein Tangentialvektor ist die Tangente an eine Kurve durch p. Wir betrachten von jetzt an der Einfachheit halber nur noch den Fall k = 1. Eine Ebene im Raum kann man bekanntlich entweder durch eine Gleichung oder durch eine Parameterdarstellung angeben. Eine analoge Aussage gilt für Untermannigfaltigkeiten. Satz 34 Sei m < n und M eine nicht-leere Teilmenge von Rn . Dann sind äquivalent: a) M ist eine m-dimensionale C 1 -Untermannigfaltigkeit des Rn . b) Zu jedem p ∈ M gibt es eine offene Umgebung U und eine C 1 -Abbildung f : U → Rn−m mit Rangf 0 (p) = n − m, so dass M ∩ U = f −1 (0). ( ’Lokal wird M durch n − m Gleichungen beschrieben. ’) c) Zu jedem p ∈ M gibt es eine offene Umgebung U , eine offene Nullumgebung P in Rm , eine C 1 -Abbildung φ : P → Rn mit φ(0) = p und Rangφ0 (0) = m, so dass φ einen Homöomorphismus zwischen P und M ∩ U liefert. ( ’Lokal wird M durch m freie Parameter beschrieben ’ ). Sind die Voraussetzungen erfüllt, so gilt Tp M = Kern f 0 (p) = Bild φ0 (0). Insbesondere ist der Tangentialraum ein Unterraum und seine Dimension ist m. Definition 25 Sei f : U → Rn−m eine C 1 -Abbildung mit einer nicht-leeren offenen Menge U des Rn als Definitionsbereich. Ein Element b im Bild f (U ) heisst regulärer Wert, wenn Rangf 0 (x) = n − m für alle x ∈ U mit f x = b gilt. Folgerung 2 Ist f : U → Rn−m eine C 1 -Abbildung und b ein regulärer Wert, so ist M = f −1 (b) eine m-dimensionale Untermannigfaltigkeit Pn Für f : Rn → R mit f (x) = i=1 x2i beispielsweise ist 1 ein regulärer Wert und man erhält die n−1-dimensionale Sphäre M als Untermannigfaltigkeit. Der Tangentialraum Tx M besteht aus allen Vektoren, die auf x senkrecht stehen. 17 9 Einführung in gewöhnliche Differentialgleichungen Definition 26 Sei D ein Intervall in R, das sog. Zeitintervall, und U eine offene Teilmenge des Rn , der sog. Phasenraum. Weiter sei (t0 , u0 ) ∈ D × U . a) Ein stetiges Vektorfeld ist eine stetige Abbildung v : D × U → Rn . b) Sei D0 ein offenes Teilintervall, das t0 enthält. Eine lokale Lösung des zu v und (t0 , u0 ) gehörenden Anfangswertproblems - abgekürzt AWP - oder auch der zu v gehörenden DGL mit Anfangsbedingung ist eine C 1 -Abbildung φ : D0 → U , so dass φ(t0 ) = u0 und φ0 (t) = v(t, φ(t)) für alle t aus D0 gilt. Die Lösung heißt maximal, falls φ nicht auf ein größeres Intervall D00 mit D0 ⊂ D00 ⊆ D fortgesetzt werden kann, und global für D0 = D. c) Das Vektorfeld v erfüllt auf der offenen Menge D0 × U 0 ⊆ D × U eine Lipschitz-Bedingung, wenn es eine sog. Lipschitz-Konstante L gibt, so dass für alle t ∈ D0 und u, u0 ∈ U 0 gilt ||v(t, u) − v(t, u0 )|| ≤ L||u − u0 ||. Das Vektorfeld erfüllt lokale L-Bedingungen, wenn jeder Punkt von D × U in einer derartigen offenen Menge liegt, und es erfüllt eine globale LBedingung, wenn v auf D × U eine L-Bedingung erfüllt. Ein Vektorfeld heftet also jedem Punkt aus U einen von der Zeit t abhängigen Vektor an, und eine lokale Lösung mit Anfangsbedingung φ(t0 ) = u0 ist eine Kurve, die zur Zeit t0 durch den Punkt u0 läuft und deren Tangente zur Zeit t gerade v(t, φ(t)) ist. 2 Beispiel 4 Stets sei D = U = R. Dann erfüllt v(t, u) = u 3 in keiner Umgebung von (0, 0) eine Lipschitz-Bedingung und v(t, u) = exp(u) zwar lokale, aber keine globale. Lemma 9 a) Ist v : D × U → Rn bezüglich der Variablen u stetig differenzierbar, so erfüllt v lokale L-Bedingungen. b) Ist B : D → Mn×n (R) stetig, so erfüllt v : D × Rn → Rn definiert durch v(t, u) = B(t)u lokale L-Bedingungen. Lemma 10 ( Gronwalls Lemma ) Sei h : [a, b] → R stetig und L ≥ 0. Rx a) Ist C > 0 eine Konstante mit 0 ≤ h(x) ≤ C +L a h(t)dt für alle x ∈ [a, b], so ist h(x) ≤ Cexp(L(x − a)) für alle x ∈ [a, b]. Rx b) Aus 0 ≤ h(x) ≤ L a h(t)dt für alle x ∈ [a, b] folgt h = 0. 18 Bemerkung 10 Die Ableitung einer Kurve ist komponentenweise definiert. Rb Analog definiert man das Integral a φ über eine stetige Kurv als den Vektor, dessen i-te Komponente das Integral der i-ten Komponentenfunktion φRi ist. Bei R Verwendung der Maximumsnorm ist dann die Abschätzung || φ|| ≤ ||φ|| offensichtlich. Das AWP φ0 (t) = v(t, φ(t)) und φ(t0 = u0 wird damit nach dem Hauptsatz der Differential- und Integralrechnung äquivalent zur Integralgleichung Z t φ(t) = u0 + v(s, φ(s))ds t0 . Diese Uminterpretation ist von entscheidender Bedeutung. Satz 35 ( Eindeutigkeit lokaler Lösungen ) Sei v ein Vektorfeld, das lokale Lipschitz-Bedingungen erfüllt, und sei (t0 , u0 ) ∈ D × U . Dann stimmen zwei lokale Lösungen φi : Di0 → U , i = 1, 2, des zugehörigen AWP auf D10 ∩ D20 überein. Falls das AWP also überhaupt eine lokale Lösung hat, so gibt es genau eine maximale Lösung. Bevor wir zur allgemeinen Theorie der Existenz von Lösungen kommen, behandeln wir zwei wichtige Klassen von Beispielen, die manchmal durch elementare Funktionen lösbar sind. Satz 36 ( Lineare DGL in einer Variablen ) Sei D ein Intervall und seien a, b stetige Funktionen von D nach R. Sei U = R. Die zum Vektorfeld v(t, u) = a(t)u + b(t) gehörige DGL φ0 (t) = a(t)φ(t) + b(t) heißt lineare DGL, und zwar homogene für b = 0 und inhomogene für b 6= 0. Sei (t0 , u0 ) ∈ D × U . Die zugehörigen AWP besitzen in beiden Fällen eindeutige globale Lösungen, nämlich: Rt a) Mit A(t) = t0 a(s)ds ist φ(t) = u0 exp(A(t)) die Lösung des homogenen AWP. b) Sei ψ(t) = exp(A(t))u(t). Genau dann ist ψ eine Lösung des inhomogenen Rt AWP’s, wenn u(t) = u0 + t0 exp(−A(s))b(s)ds. Man wird selbst für die lineare DGL nur in Glücksfällen die Lösungen durch elementare Funktionen ausdrücken können, weil beispielsweise der inhomogene Fall mit a = 0 das Finden einer Stammfunktion der stetigen Funktion b erfordert. Bei den Differentialgleichungen mit getrennten Variablen sind D und U zwei offene Intervalle und f : D → R sowie g : U → R stetige Abbildungen. Wir betrachten das Vektorfeld v(t, u) = f (t)g(u) und wollen das AWP für (t0 , u0 ) lösen. Dabei sind zwei Fälle zu unterscheiden: 1.Fall g(u0 ) = 0. Dann ist die konstante Funktion φ = u0 eine Lösung des AWP. Falls v aber nicht lokalen L-Bedingungen genügt, kann es noch andere 19 2 Lösungen geben. Sei etwa f = 1 und g(u) = 3u 3 . Dann ist φ(t) = t3 nichttriviale Lösung des AWP für (0, 0). 2.Fall g(u0 ) 6= 0. Wegen der Stetigkeit verschwindet dann g auf einer offenen Umgebung nicht. Sei J das größte offene Teilintervall von U ( warum existiert dies ? ), R uauf1 dem g nicht den Wert 0 annimmt. Definiere G : J → R durch G(u) = u0 g(v) dv. 1 0 Wegen G = g ist G nach Sätzen aus Analysis I strikt monoton, G(J) ein offenes Intervall und die Umkehrabbildung H : G(J) → J ist differenzierbar. Rt Definiere weiter F : D → R durch F (t) = t0 f (s)ds. Dann ist F (t0 ) = 0 = G(u0 ). Wegen der Stetigkeit von F wird eine ganze Umgebung von t0 unter F nach G(J) abgebildet und es sei I das größte offene t0 enthaltende Teilintervall von D mit dieser Eigenschaft. Satz 37 ( DGL mit getrennten Variablen ) Mit obigen Voraussetzungen und Bezeichnungen ist φ(t) = H(F (t)) eine Lösung φ : I → J des AWP. Ist ψ : D0 → J eine andere lokale Lösung, so ist D0 ⊆ I und ψ ist die Einschränkung von φ. Implizit ist also die Lösung durch F = G ◦ φ gegeben. Beispiel 5 Wir wollen als Beispiel die logistische DGL φ0 t = kφ(t)(K − φ(t)) mit φ(0) = u0 untersuchen. Dabei ist k > 0 der Wachstumsfaktor und K > 0 das Supremum der Anzahl φ(t) der zur Zeit t vorhandenen ’Lebewesen’. Wir nehmen an, dass 0 < u0 < K gilt. Es ist g(u) = u(K − u) und J =]0, K[ das größte 1 u0 enthaltende Intervall, auf dem g nirgends verschwindet. Nun gilt v(K−v) = 1 1 1 K (v + R K−v ), wie man mit Hilfe sog. Partialbruchzerlegung findet. Also folgt u u0 1 1 u G(u) = u0 g(v) dv = K (ln( K−u ) − C) mit C = ln( K−u ). Offenbar ist G(J) = 0 Rt R und daher D = R = I. Weiter ist F (t) = 0 kds = kt. Aus G(φ(t)) = F (t), φ(t) φ(t) = Kkt+C und durch Exponieren K−φ(t) = exp(Kkt+C). erhält man ln( K−φ(t) K Der Kehrwert liefert φ(t) = 1 + exp(−kKt − C) also schließlich φ(t) = K 1 1 =K . 1 + exp(−kKt − C) 1 + exp(−kKt)( uK0 − 1) Lemma 11 Sei K ein kompakter und T ein vollständiger metrischer Raum. Dann ist die Menge C 0 (K, T ) versehen mit der Metrik d(f, g) = sup{d(f x, gx)|x ∈ K} ein vollständiger metrischer Raum. Wir kommen nun zum Hauptsatz über die Existenz lokaler Lösungen von DGL’s und deren stetige Abhängigkeit von den Anfangswerten. Zur präzisen Formulierung fixieren wir einige Notationen. Seien zunächst D ein offenes Intervall, U eine offene Teilmenge des Rn , v : D × U → Rn ein stetiges Vektorfeld und (t0 , u0 ) ∈ D × U . Sei weiter D0 ⊆ D 20 ein offenes Intervall, das t0 enthält und U 0 ⊆ U eine offene Umgebung von u0 , derart dass die Menge K = D0 × U 0 kompakt ist und in D × U liegt. Ist nun β : K → U eine stetige Abbildung, so sei P β : K → Rn definiert durch Z t v(s, β(s, u)ds. (P β)(t, u) = u + t0 P heißt Picard-Lindelöf-Operator. Lemma 12 ( Schlüssel-Lemma ) Wir behalten obige Notationen und Voraussetzungen bei. Zusätzlich gebe es eine Konstante L mit ||v(t, u) − v(t, u0 )|| ≤ L||u − u0 || für alle t ∈ D und u, u0 ∈ U sowie einen vollständigen metrischen Raum U 00 mit U 0 ⊆ U 00 ⊆ U , so dass (P β)(K) für jedes stetige β : K → U 00 wieder in U 00 liegt. dann gilt: a) P bildet M = C 0 (K, U 00 ) in sich ab und P ist stetig. b) Definiert man rekursiv α0 (t, u) = u und αn+1 = P αn , so konvergiert die Folge (αn ) in M gegen einen Fixpunkt α von P . c) α induziert eine stetige Abbildung von D0 × U 0 nach U , so dass für jedes u ∈ U 0 die Kurve αu (t) = α(t, u) eine lokale Lösung der DGL ist mit Anfangsbedingung αu (t0 ) = u.( Diese lokalen Lösungen existieren also alle auf dem gleichen Zeitintervall und sie hängen stetig von den Anfangsbedingungen ab. ) Satz 38 ( Satz von Picard-Lindelöf ) Sei v : D × U → Rn ein stetiges Vektorfeld, das lokalen L-Bedingungen genügt. Dann gibt es zu jedem Punkt t0 ∈ D und u0 ∈ U offene Umgebungen D0 ⊆ D und U 0 ⊆ U und eine stetige Abbildung α : D0 × U 0 → U , so dass für jedes u ∈ U 0 die Kurve αu : D0 → U mit αu (t) = α(t, u) die eindeutige lokale Lösung der DGL mit Anfangswert u ist. Man kann darüber hinaus zeigen, dass α im letzten Satz stetig differenzierbar nach u ist, wenn v es ist. Einen Beweis findet man in dem schönen Buch von Lang ’Undergraduate Analysis’ auf Seite 558 oder im Lehrbuch ’Gewöhnliche Differentialgleichungen’ von Arnold ab Seite 273. Definition 27 Sei D ein Zeitintervall und seien B : D → Mn×n (R) sowie b : D → Rn stetige Abbildungen. Die zum Vektorfeld v : D × Rn → Rn mit v(t, u) = B(t)u gehörende DGL φ0 (t) = B(t)φ(t) + b(t) heisst lineare DGL. Für b = 0 heißt die Gleichung homogen, sonst inhomogen. Es sei H die Menge der Lösungen der homogenen DGL. Satz 39 ( Lineare DGL ) Mit den Notationen und Annahmen der voranstehenden Definition gilt: a) Zu jedem (t0 , u0 ) hat das AWP genau eine globale Lösung. b) H ist ein Unterraum von C 1 (D, Rn ) und für jedes t induziert die Abbildung φ 7→ φ(t) einen Isomorphismus zwischen H und Rn . 21 c) Für eine Basis (φ1 , φ2 , . . . , φn ) von H - ein sogenanntes Fundamentalsystem - ist für jedes s die sog. Fundamentalmatrix F (s) mit φj (s) in der j.ten Spalte für 1 ≤ j ≤ n invertierbar. Eine spezielle Lösung des inhomogenen AWP ist dann wie im R t eindimensionalen Fall gegeben durch ψ(t) = F (t)u(t) mit u(t) = u0 + t0 ((F (s)−1 )b(s)ds. Besonders einfach wird die Situation, wenn B(t) = A eine konstante Funktion ist. P∞ i Definition 28 Für A ∈ Mn×n (R) ist exp(A) = i=0 Ai! . Diese Reihe konvergiert, weil Mn×n (R) ein Banachraum ist. Satz 40 Für alle A, B ∈ Mn×n (R) gilt: a) Aus AB = BA folgt exp(A+B) = exp(A)exp(B) und Bexp(A) = exp(A)B. Insbesondere ist En = exp(0) = exp(A)exp(−A) = exp(−A)exp(A) und jedes exp(A) ist invertierbar. b) Die Abbildung φ : R → Mn×n (R) definiert durch φ(t) = exp(tA) ist differenzierbar mit φ0 (t) = Aexp(tA) = Aφ(t). c) Für jedes invertierbare S ist S −1 exp(A)S = exp(S −1 AS). d) exp(AT ) = exp(A)T . e) Ist A eine Blockdiagonalmatrix mit zwei Blöcken A1 und A2 , so ist exp(A) Blockdiagonalmatrix mit Blöcken exp(A1 ) und exp(A2 ). Das verallgemeinert sich auf mehrere Blöcke. Insbesondere ist das Exponential einer Diagonalmatrix eine Diagonalmatrix mit den Exponentialen der Eigenwerte als Einträge. f ) Die Abbildungen φi (t) = exp(tA)ei , i = 1, 2, . . . n bilden ein Fundamentalsystem der homogenen linearen DGL ψ 0 (t) = Aψ(t). Für Matrizen in Jordanscher Normalform kann man also explizit ein Fundamentalsystem angeben. Zu diesem Zweck wurde die Jordansche Normalform entwickelt. Es ist dabei vorteilhaft über den komplexen Zahlen zu arbeiten. Die erforderlichen Anpassungen sind alle einfach und man kann sie gut in dem im Internet frei zugänglichen Buch von Bröcker ’Analysis 3’ auf den Seiten 39 − 63 nachlesen. Dort wird auch gezeigt, wie man mit einem Trick die entwickelte Theorie übertragen kann auf explizite Differentialgleichungen höheren Grades. Schließlich wird dort der zweidimensionale Fall und insbesondere der harmonische Oszillator ausführlich behandelt. Die Beweise beruhen neben der von uns dargestellten allgemeinen analytischen Theorie auf linearer Algebra. 22