Analysis Skriptum zur Vorlesung im Wintersemester 2012 Version 2.2 vom 28.1.2013 Bernhard Lamel KAPITEL 1 Stetigkeit und Vollständigkeit 1. Wiederholung: Stetigkeit von (reellen) Funktionen Sei X ⊂ R eine Menge, und f : X → R eine Funktion. Wir sagen, dass f stetig am Punkt x0 ∈ X ist, wenn für jede Folge (xj )j∈N mit xj ∈ X für alle j ∈ N, welche xj → x0 (j → ∞) erfüllt, f (xj ) → f (x0 ) (j → ∞) gilt. Es gibt natürlich noch viele andere Charakterisierungen von Stetigkeit: Lemma 1. f : R ⊃ X → R ist stetig am Punkt x0 ∈ X genau dann, wenn für jedes ε > 0 ein δ = δ(ε) > 0 existiert sodass |f (x) − f (x0 )| < ε, wenn x ∈ X und |x − x0 | < δ. Beweis. Sei die Bedingung des Lemmas erfüllt, und (xj )j∈N eine beliebige Folge in X mit xj → x0 (j → ∞). Wir wollen zeigen, dass limj→∞ f (xj ) = f (x0 ) ist. Sei also ε > 0 beliebig; nach der Bedingung des Lemmas können wir also ein δ > 0 wählen, sodass |f (x) − f (x0 )| < ε, wenn x ∈ X und |x − x0 | < δ. Da limj→∞ xj = x0 , gibt es ein N = N (δ) sodass für alle j ≥ N |xj − x0 | < δ gilt. Konsequenterweise ist also |f (xj ) − f (x0 )| < ε für j ≥ N . Das bedeutet aber, dass limj→∞ f (xj ) = f (x0 ) gilt. Wenn nun andererseits die Bedingung des Lemmas nicht erfüllt ist, so gibt es ein ε0 > 0 sodass für jedes δ > 0 ein xδ ∈ X existiert mit |xδ − x0 | < δ, aber |f (x) − f (x0 )| ≥ ε. Insbesondere können wir also für jedes j ∈ N ein xj ∈ X finden, sodass |xj − x0 | < 1/j, aber |f (xj ) − f (x0 )| ≥ ε0 . Damit ist limj xj = x0 , aber f (xj ) kann nicht gegen f (x0 ) konvergieren; also ist f nicht stetig im Punkt x0 . Eine Umgebung von x0 ∈ R ist eine Menge U ⊂ R, welche für genügend kleine ε > 0 die Menge Bε (x0 ) = {x : |x − x0 | < ε} (den ε-“Ball” um x0 ) enthält; eine Menge U ⊂ X ⊂ R ist eine (relative) Umgebung von x0 ∈ X (in X) wenn es ein ε > 0 gibt, sodass Bε (x0 ) ∩ X ⊂ U Wir können dann auch wie folgt formulieren: Übungsaufgabe 1. a) Eine Funktion f : R ⊃ X → R ist stetig am Punkt x0 ∈ X genau dann, wenn es für jede Umgebung V von f (x0 ) eine relative Umgebung U von x0 in X mit f (U ) ⊂ V gibt. b) Eine Funktion f : R ⊃ X → R ist stetig am Punkt x0 ∈ X genau dann, wenn für jede Umgebung V von f (x0 ) die Menge f −1 (V ) eine relative Umgebung von x0 in X ist. Bemerkung 1. Wir werden später zwischen dem Stetigkeitsbegriff, den wir hier als Ausgangspunkt gewählt haben, und der Charakterisierung in Lemma 1 unterscheiden müssen; wenn wir dies tun müssen, so werden wir die naheliegende Bezeichnung “Folgenstetigkeit” dafür verwenden. Eine Funktion f : R ⊃ X → R ist stetig auf X, wenn sie in jedem Punkt x0 ∈ X stetig ist. Auch hier können wir eine weitere Charakterisierung geben: Wir sagen, eine Menge U ⊂ X ist offen, wenn sie mit jedem Punkt x0 eine Umgebung dieses Punktes enthält, oder anders ausgedrückt, wenn sie Umgebung jedes ihrer Punkte ist. F ⊂ X ist abgeschlossen, wenn F c ⊂ X offen ist. Übungsaufgabe 2. f : R ⊃ X → R ist stetig auf X genau dann, wenn für jede offene Menge U ⊂ R f −1 (U ) offen in X ist. Kannst Du eine Charakterisierung der Stetigkeit mit Hilfe von abgeschlossenen Mengen geben? Übungsaufgabe 3. Zeige, dass X ⊂ R genau dann abgeschlossen ist, wenn der Grenzwert jeder konvergenten Folge von Punkten in X selber zu X gehört. Wir halten folgende Tatsach über offene Teilmengen von R fest: 3 Lemma 2. Sei U ⊂ R offen. Dann existiert eine abzählbare (oder endliche) Menge von offenen, paarweise disjunkten Intervallen Ij = (aj , bj ), j ∈ J mit [ U= Ij . j∈J Beweis. Für x ∈ U definieren wir a(x) = inf{a ∈ R : (a, x] ⊂ U }, b(x) = sup{b ∈ R : [x, b) ⊂ U }, wobei wir a(x) = −∞ bzw. b(x) = +∞ setzen, wenn die Menge nicht nach unten bzw. oben beschränkt ist. Wir überprüfen dann, dass die Zerlegung [ U= (a(x), b(x)) x∈U eine Partition von U ist. Indem wir aus jeder Äquivalenzklasse der so induzierten Äquivalenzrelation auf U einen rationalen Repräsentanten xj , j ∈ J, wählen (dies ist möglich, da jedes offene Intervall auch rationale Zahlen enthält), sehen wir, dass höchstens abzählbar viele Äquivalenzklassen auftreten. Die gesuchte Zerlegung ist nun durch [ U= (a(xj ), b(xj )) j∈J gegeben. 2. Wiederholung: Vollständigkeit 2.1. Die Supremumseigenschaft. Das Supremum sup X einer nach oben beschränkten nichtleeren Menge ∅ 6= X ⊂ R ist die kleinste obere Schranke von X. Das heisst: x ≤ sup X für alle x ∈ X, und wenn A ∈ R eine Zahl mit x ≤ A für alle x ∈ X ist, so ist sup X ≤ A. Eine äquivalente Formulierung ist, dass es keine reelle Zahl B mit x ≤ B < sup X für alle x ∈ X gibt, oder positiv formuliert: Für alle ε > 0 gibt es ein x ∈ X mit sup X − ε ≤ x ≤ sup X. Die Existenz des Supremums einer nach oben beschränkten Teilmenge ist eine definierende Eigenschaft des Körpers der reellen Zahlen. Übungsaufgabe 4. Zeige, dass es äquivalent ist, die Existenz des Infimums inf X jeder nach unten beschränkten Teilmenge X ⊂ R zu fordern, und gib eine ε–Charakterisierung des Infimums. 2.2. Vollständigkeit und Folgen. Die Supremumseigenschaft zeigt, dass monotone Folgen einen Grenzwert haben: Lemma 3. Sei (xj )j∈N eine monotone, nach oben beschränkte Folge von reellen Zahlen, i.e. x1 ≤ x2 ≤ · · · ≤ xj ≤ xj+1 ≤ · · · ≤ A für ein A ∈ R. Dann konvergiert (xj )j∈N , genauer gesagt, lim xj = sup{xj : j ∈ N}. j→∞ Übungsaufgabe 5. Beweise Lemma 3 und zeige, dass eine analoge Aussage für monoton fallende, nach unten beschränkte Folgen gilt. Wir erinnern daran, dass ein Häufungswert einer Folge (xj )j∈N ein Punkt mit der Eigenschaft ist, dass jede Umgebung dieses Punktes unendlich viele der xj enthält. Besonders wichtig sind der grösste und der kleinste Häufungswert einer Folge, der lim supj→∞ xj und lim inf j→∞ xj . Wir sagen, dass lim supj→∞ xj = x0 wenn es für alle ε > 0 und n ∈ N ein j ∈ N mit n ≤ j gibt, sodass |xj −x0 | < ε, und die Menge {j : xj > x0 +ε} endlich ist. Die Existenz des lim sup ist wiederum ein Ausdruck der Vollständigkeit: Lemma 4. Sei (xj )j∈N eine beschränkte Folge. Dann gibt es den lim supj xj , genauer gesagt, lim sup xj = lim (sup{xj : j ≥ k}) . j→∞ k→∞ 4 Beweis. Zunächst bemerken wir, dass die Existenz des Grenzwerts limk→∞ (sup{xj : j ≥ k}) aus Lemma 3 folgt, da hier der Grenzwert einer beschränkten monotonen Folge gebildet wird. Sei nun ε > 0 und n ∈ N. Dann gibt es ein N ∈ N sodass für alle k ≥ N |sup{xj : j ≥ k} − x0 | ≤ ε/2 ist. Insbesondere ist die Menge {j : xj > x0 +ε} ⊂ {1, . . . , N } und damit endlich. Sei nun k ≥ N . Wir können ein j ≥ k wählen mit sup{xj : j ≥ k} − ε ≤ xj ≤ sup{xj : j ≥ k}. Damit ist |xj − x0 | ≤ |xj − sup{xj : j ≥ k}| + | sup{xj : j ≥ k} − x0 | ≤ ε. Eine andere Folgerung aus der Vollständigkeit, die wir in allgemeineren Situationen als definierende Eigenschaft wählen werden, ist die Cauchy-Eigenschaft. Wir sagen, eine Folge (xj )j∈N ist eine Cauchyfolge, wenn für jedes ε > 0 ein N ∈ N existiert, sodass |xj − xk | ≤ ε, wenn j, k ≥ N . Übungsaufgabe 6. Zeige, dass (xj ) genau dann eine Cauchfolge ist, wenn für jedes ε > 0 ein N ∈ N existiert, sodass |xj − xN | ≤ ε, wenn j ≥ N . Lemma 5. Sei (xj )j∈N eine Cauchfolge. Dann konvergiert xj , genauer gesagt, limj→∞ xj = lim supj→∞ xj . Beweis. Sei ε > 0. Dann gibt es ein N ∈ N mit |xj − xk | < ε/2 für j, k ≥ N . Auf der anderen Seite gibt es ein k mit k ≥ N und | lim supj→∞ xj − xk | < ε/2. Damit ist für j ≥ N |xj − lim sup xj | ≤ |xj − xk | + |xk − lim sup xj | < ε. j→∞ j→∞ P∞ Pk Übungsaufgabe 7. Seien aj ≥ 0 mit j=1 aj < ∞, i.e. die Folge der Partialsummen Sk = j=1 aj sei konvergent. Weiters sei eine Folge bj mit |bj | ≤ aj gegeben. Dann konvergiert auch die Summe der Pk P∞ Partialsummen j=1 bj , i.e. j=1 bj existiert. Definition 1. Wir sagen, eine Menge X ⊂ R ist (folgen)kompakt, wenn jede Folge (xj ) von Punkten in X eine gegen einen Punkt in X konvergente Teilfolge besitzt. Lemma 6. X ⊂ R ist kompakt genau dann, wenn eine der folgenden Eigenschaften erfüllt ist: Heine-Borel Eigenschaft: X ist beschränkt und abgeschlossen. Überdeckungskompaktheit: Jede Überdeckung von X durch offene Mengen S∞ Uα , α ∈ A enthält eine endliche Teilüberdeckung, das heisst, es existieren α1 , . . . , αN mit X = j=1 Uαj . Beweis. Nehmen wir an, X ist kompakt. Dann ist die Heine-Borel Eigenschaft erfüllt: Wenn X nicht beschränkt ist, so gibt es eine Folge xj von Punkten in X mit |xj | > j; diese kann keine konvergente Teilfolge beinhalten. Auf der anderen Seite folgt aus der Definition der Kompaktheit, dass jeder Punkt x, welcher ein Grenzwert einer Folge in X ist, zu X gehören muss (jede Teilfolge einer konvergenten Folge ist ja selber konvergent mit demselben Grenzwert). Damit ist X auch abgeschlossen. Sei nun X beschränkt und abgeschlossen. Wenn (xj )j∈N eine Folge von Punkten in X ist, so gibt es den lim supj→∞ xj := x0 . Nach Definition des lim sup gibt es eine Teilfolge von (xj ), welche gegen x0 konvergiert. Da X abgeschlossen ist, ist x0 ∈ X, also ist X kompakt. Sei nun wiederum X kompakt, und Uα (α ∈ A) eine offene Überdeckung von X; wir können annehmen, dass A = N abzählbar ist (warum?). Falls (UnS )n∈N keine endliche offene Teilüberdeckung enthält, so können wir eine Folge von Punkten xj in X mit xj ∈ / k≤j Uαk . Da X kompakt ist, konvergiert eine Teilfolge von xj gegen x0 ∈ X. Dann existiert ein k0 mit x0 ∈ Uk0 . Damit ist xj ∈ Uk0 für j genügend gross, was für j ≥ k0 ein Widerspruch zur Definition der xj ist; also muss Un eine endliche Teilüberdeckung besitzen. Falls jede offene Überdeckung X eine endliche Teilüberdeckung enthält, so ist X beschränkt und abgeschlossen: Dazu betrachten wir die Überdeckung von X durch die offenen Mengen Uj := X ∩ (−j, j), um die Beschränktheit von X festzustellen. Wenn x ∈ / X, so können wir X durch die Mengen Un = X ∩ ([x − 1/n, x + 1/n]c ) überdecken. Da endlich viele dieser Mengen ausreichen, um X zu überdecken, gibt es ein n ∈ N mit (x − 1/n, x + 1/n) ⊂ X c , also ist X c offen (es enthält eine Umgebung jedes seiner Punkte) und damit X abgeschlossen. 5 2.3. Vollständigkeit und Werte stetiger Funktionen. Eine weitere wichtige Folgerung aus der Vollständigkeit ist der Zwischenwertsatz: Satz 1. Sei f : R ⊃ [a, b] → R stetig, mit f (a) ≤ y ≤ f (b). Dann gibt es ein c ∈ [a, b] mit f (c) = y. Beweis. Sei X = {x ∈ [a, b] : f (x) < y}. Dann ist c := sup X ∈ [a, b]. Wir behaupten, dass f (c) = y ist. Dies ist trivial zu überprüfen, wenn c = b; ist c = a, so gibt es eine Folge aj mit aj → a für j → ∞, und da f (aj ) → f (a), folgt f (a) ≥ y, also f (a) = y. Nehmen wir also im folgenden an, dass a < c < b ist. Dann betrachten wir zunächst die Folge cj = c−1/j (für j ≥ k für ein k ∈ N ist cj ∈ [a, b]), und sehen, dass f (c) = lim f (cj ) ≤ y. j→∞ Auf der anderen Seite können wir eine Folge dj mit c < dj < c + 1/j betrachten, welche f (dj ) ≥ y erfüllt. Damit sehen wir, dass f (c) = lim f (dj ) ≥ y j→∞ ist. Also folgt y = f (c) wie gewünscht. Übungsaufgabe 8. Zeige, dass ein Polynom ungeraden Grades p(x) = ax2k+1 + . . . , a 6= 0, als Funktion p : R → R aufgefasst, surjektiv ist. Übungsaufgabe 9. Sei f : R ⊃ [a, b] → [a, b] stetig. Dann hat f einen Fixpunkt in [a, b], das heisst, es gibt ein x ∈ [a, b] mit f (x) = x. Auf einer kompakten Menge werden das Maximum und das Minimum der Werte angenommen: Satz 2. Sei f : R ⊃ X → R stetig auf der kompakten Menge X. Dann existieren minx∈X f (x) und maxx∈X f (x). Beweis. Wir zeigen zunächst, dass f (X) beschränkt ist. Angenommen, das ist nicht der Fall: Dann gibt es eine Folge yj = f (xj ) von Punkten in f (X) mit |yj | > j. Da X kompakt ist, können wir nun eine Teilfolge der xj wählen, welche gegen x0 ∈ X konvergiert. Da f stetig auf X ist, erhalten wir einen Widerspruch. Nun existiert also supx∈X f (x), und für jedes n ∈ N können wir ein xn ∈ X wählen sodass f (xn ) > supx∈X f (x) − 1/n. Wir wählen nun eine Teilfolge xnk welche gegen x0 ∈ X konvergiert. Dann ist 1 = sup f (x). sup f (x) ≥ f (x0 ) = lim f (xnk ) ≥ lim sup f (x) − k→∞ k→∞ x∈X n x∈X x∈X 3. Stetigkeit im Allgemeinen: Topologische Räume Stetigkeit von Funktionen wird zweckmässigerweise mit Hilfe einer Topologie auf einem Raum behandelt. Eine Topologie T auf einer Menge X ist eine Familie T von Teilmengen von X, welche abgeschlossen unter beliebigen Vereinigungen und endlichen Durchschnitten ist, und ∅, X ∈ T erfüllt; die Elemente von T werden als offene Mengen bezeichnet. Um die Eigenschaften nochmal genauer zu formulieren: ist Uα , α ∈ A, eine Familie offener Teilmengen von X, so ist ∪α Uα offen, und mit zwei offenen Mengen U1 , U2 ist auch U1 ∩ U2 . Ein topologischer Raum ist eine Menge mit einer Topologie. Topologien sind sehr allgemeine Objekte; das heisst, dass man mit ihrer Hilfe grundlegende Eigenschaften stetiger Funktionen für sehr grosse Klassen von Objekten beschreiben kann. Diese Macht kommt mit einem Preis: Man muss in Kauf nehmen, dass wichtige Eigenschaften (die für gewisse Objekte klarerweise erfüllt sind) hier erst definiert werden müssen. Auch ist es oft umständlich, spezifische Eigenschaften in diesem allgemeinen Kontext zu definieren und zu untersuchen. Wir werden deswegen relativ rasch zu weniger allgemeinen Räumen übergehen. Beispiel 1. i) T = {X, ∅} ist eine Topologie auf jedem Raum X, die triviale Topologie. ii) T = 2X , die Potenzmenge von X, ist auch eine Topologie auf X für jede Menge X, die diskrete Topologie. iii) Ist Y ⊂ X, so erhält Y eine Topologie (die Teilraumtopologie) indem man TY = {V ∩ Y : V ∈ T} setzt. iv) Die “gewöhnliche” Topologie auf R ist jene, die wir schon vorher erklärt haben: Eine Menge U ⊂ R ist offen, wenn für jedes x ∈ U ein ε = ε(x) existiert, sodass (x − ε, x + ε) ⊂ U . 6 Die Elemente von T werden die offenen Mengen in X genannt. Eine Menge C ⊂ X ist abgeschlossen, wenn C c offen ist. Die abgeschlossenen Mengen erfüllen die nach den Gesetzen von de Morgan “dualen” Eigenschaften zu offenen Mengen, d.h. wenn Fα , α ∈ A, eine Familie abgeschlossener Mengen ist, so ist auch ∩α Fα abgeschlossen, und sind F1 , F2 abgeschlossen, so ist auch F1 ∪ F2 abgeschlossen. Für eine beliebige Teilmenge Y ⊂ X gibt es eine grösste offene Menge Y o , das Innere von Y , welche in Y enthalten ist, und eine kleinste abgeschlossene Menge Y , den Abschluss von Y , welche Y enthält; diese sind als die Vereinigung aller in Y enthaltenen offenen Mengen bzw. den Durchschnitt aller Y enthaltenden Mengen definiert. Übungsaufgabe 10. Eine Menge D ⊂ X ist dicht in X, wenn für jede offene Menge U gilt, dass D ∩ U 6= ∅. Zeige, dass D dicht in X ist genau dann, wenn D = X. Bemerkung 2. Wir werden konsequent den topologischen Raum (X, T) mit der Menge X identifizieren, und die Topologie nur explizit erwähnen, wenn wir mit zwei verschiedenen Topologien auf ein und derselben Menge arbeiten. Definition 2. Seien X, Y topologische Räume. Eine Abbildung f : X → Y ist stetig wenn für jede offene Menge V ⊂ Y das Urbild f −1 (V ) ⊂ X offen ist. Eine bijektive stetige Abbildung, deren Umkehrabbildung auch stetig ist, nennt man einen Homöomorphismus. Übungsaufgabe 11. Seien X, Y, Z topologische Räume, f : X → Y und g : Y → Z stetig. Dann ist g ◦ f : X → Z stetig. Übungsaufgabe 12. Die Abbildungen R2 → R, welche durch (x, y) 7→ x + y und (x, y) 7→ xy gegeben sind, sind stetig. Die Abbildung R+ → R+ welche durch x 7→ x−1 gegeben ist, ist stetig. Oft ist es bequemer, mit Umgebungen von Punkten zu hantieren. Eine Umgebung von x ∈ X ist eine Menge U ⊂ X für welche eine offene Menge V mit x ∈ V ⊂ U existiert. Wenn wir die Menge der Umgebungen von x ∈ X mit U(x) bezeichnen, so ist U(x) abgeschlossen unter beliebigen Vereinigungen und endlichen Durchschnitten, und X ∈ U(x) für jedes x ∈ X. Eine Umgebungsbasis B(x) ist eine Teilmenge von U(x) mit der Eigenschaft, dass für jedes V ∈ U(x) ein W ∈ B(x) existiert sodass W ⊂ V . Mit anderen Worten, wenn eine Umgebungsbasis B(x) gegeben ist, so ist U(x) = {V : V ⊃ W ∈ B(x)}. Solche Systeme von Umgebungen kann man auch verwenden, um eine Topologie zu definieren: Übungsaufgabe 13. Für jedes x ∈ X sei eine Menge U(x) von Teilmengen von X gegeben, mit x ∈ U für alle U ∈ U(x), und welche abgeschlossen unter beliebigen Vereinigungen und endlichen Durchschnitten ist, und X ∈ U(x) sowie W ∈ U(x) für W ⊃ U ∈ U(x) erfüllt. Dann gibt es eine (und nur eine) Topologie auf X für die U(x) die Menge der Umgebungen des Punktes x für alle x ∈ X ist. (Hinweis: Man muss definieren, dass eine Menge offen ist, wenn sie eine Umgebung jedes ihrer Punkte ist). Beispiel 2. Seien X, Y topologische Räume. Die Produkttopologie auf X × Y definiert man über Umgebungen, indem man die Umgebungen von (x, y) als Übermengen von Mengen der Form Ux × Vy definiert, wo Ux eine Umgebung von x in X und Vy eine Umgebung von y in Y ist. Mit Hilfe von Umgebungen können wir das Innere und den Abschluss einer Menge definieren: Für eine beliebige Teilmeinge Y ⊂ X ist x ∈ Y ◦ genau dann, wenn es eine Umgebung U ⊂ U(x) gibt, welche noch ganz in Y enthalten ist; das Komplement des Abschlusses Ȳ c ist gegeben durch Punkte, welche eine Umgebung besitzen, die Y nicht trifft. Dazwischen liegen jene Punkte, für die jede Umgebung sowohl Y als auch Y c trifft, also Punkte x ∈ X mit U ∩ Y 6= ∅ und U ∩ Y c 6= ∅ für alle U ∈ U(x). Solche Punkte sind der Rand von Y , welcher gerne mit ∂Y bezeichnet wird. Übungsaufgabe 14. Zeige, dass ∂Y = Ȳ \ Y ◦ . Der Begriff der Umgebung erlaubt es uns, Stetigkeit an einer Stelle zu definieren: Definition 3. Die Abbildung f : X → Y ist stetig am Punkt x ∈ X wenn für jede Umgebung V von f (x) eine Umgebung U von x existiert sodass f (U ) ⊂ V . Übungsaufgabe 15. Zeige, dass f : X → Y stetig ist genau dann, wenn f stetig am Punkt x ∈ X für alle x ∈ X ist. Wir hatten eine weitere Variante von Stetigkeit in Abschnitt 1 kennengelernt, die Folgenstetigkeit. Konvergenz von Folgen ist in topologischen Räumen wie erwartet definiert: Eine Folge (xj )j∈N in X konvergiert 7 gegen x0 wenn für jede Umgebung U von x0 ein N ∈ N existiert, sodass xj ∈ U für alle j ≥ N gilt. Eine Abbildung f : X → Y ist folgenstetig am Punkt x, wenn für jede Folge xj mit limj→∞ xj = x limj→∞ f (xj ) = f (x) gilt. Übungsaufgabe 16. Zeige, dass jede Abbildung, welche im Punkt x stetig ist, auch folgenstetig im Punkt x ist. Übungsaufgabe 17. Wir versehen N mit der diskreten Topologie und erklären eine Topologie auf dem Raum N ∪ {∞} indem wir die Umgebungen von ∞ als Komplemente endlicher Mengen in N festlegen. Dann konvergiert die Folge xj von Punkten im topologischen Raum X genau dann gegen x ∈ X, wenn die Funktion f : N ∪ {∞} → X, f (j) = xj , f (∞) = x stetig ist. Grenzwerte sind in allgemeinen topologischen Räumen nicht eindeutig. Eine Bedingung, welche die Eindeutigkeit garantiert, ist die folgende: Definition 4. Ein topologischer Raum X ist ein Hausdorffraum, wenn für je zwei verschiedene Punkte x, y ∈ X Umgebungen von x und y existieren, welche sich nicht schneiden. Übungsaufgabe 18. Eine Menge X mit der trivialen Topologie ist Hausdorff genau dann, wenn X nur einen Punkt besitzt. Jede Menge X ist ein Hausdorffraum in der diskreten Topologie. R mit der üblichen Topologie ist ein Hausdorffraum. Definition 5. Ein topologischer Raum X erfüllt das erste Abzählbarkeitsaxiom, wenn jeder Punkt eine abzählbare Umgebungsbasis besitzt. Lemma 7. Wenn X das erste Abzählbarkeitsaxiom erfüllt, so ist jede folgenstetige Abbildung f : X → Y stetig. Beweis. Angenommen, f ist nicht stetig; dann gibt es einen Punkt y = f (x) ∈ Y und eine Umgebung U von f (x) sodass f −1 (U ) keine Umgebung von x ist. Sei B(x) = {V1 , V2 , . . . } eine abzählbare Umgebungsbasis von x mit V1 ⊃ V2 ⊃ . . . (warum gibt es soetwas?). Da f −1 (U ) keine Umgebung von x ist, gibt es für jedes j einen Punkt xj ∈ Vj \ U . Dann konvergiert xj gegen x, aber f (xj ) ∈ / U , somit kann f (xj ) nicht gegen x konvergieren. Für allgemeine topologische Räume wird die Kompaktheit durch die Überdeckungskompaktheit definiert: Definition 6. Ein topologischer Raum X ist kompakt, wenn jede Überdeckung von X durch offene Mengen eine endliche Teilüberdeckung enthält. Eine Teilmenge Y ⊂ X heisst kompakt, wenn sie kompakt in der Teilraumtopologie ist. Übungsaufgabe 19. Zeige, dass Y ⊂ X genau dann kompakt ist, wenn jede Überdeckung Uα , α ∈ A von Y durch offene Mengen in X eine endliche Teilüberdeckung enthält. Um kompakte Mengen durch Folgen zu charakterisieren, benötigen wir eine stärkere Bedingung als das erste Abzählbarkeitsaxiom. Eine Menge B = {Uα : α ∈ A} offener Mengen in X heisst eine Basis der Topologie von X, wenn jede offene Menge in X als Vereinigung von Mengen in B geschrieben werden kann. Definition 7. X erfüllt das zweite Abzählbarkeitsaxiom, wenn X eine abzählbare Basis seiner Topologie besitzt. Übungsaufgabe 20. Zeige, dass ein Raum, welcher das zweite Abzählbarkeitsaxiom erfüllt, auch das erste Abzählbarkeitsaxiom erfüllt. Übungsaufgabe 21. X heisst separabel, wenn X eine abzählbare dichte Teilmenge besitzt. Zeige, dass ein Raum welcher das zweite Abzählbarkeitsaxiom erfüllt, separabel ist. Gilt die Umkehrung? Übungsaufgabe 22. X ist ein Lindelöfraum, wenn jede offene Überdeckung eine abzählbare Teilüberdeckung enthält. Zeige, dass jeder Raum, welcher das zweite Abzählbarkeitsaxiom erfüllt, ein Lindelöfraum ist. Lemma 8. Sei X ein topologischer Raum, welcher das zweite Abzählbarkeitsaxiom erfüllt. Dann ist Y ⊂ X genau dann kompakt, wenn für jede Folge xj mit xj ∈ Y eine Teilfolge xjk existiert, welche gegen ein y0 ∈ Y konvergiert. 8 Beweis. Angenommen, es gibt eine Folge xj in Y , welche keine konvergente Teilfolge enthält. Dann kann sich diese Folge an keinem Punkt von Y häufen, das heisst, es gibt für jedes y ∈ Y eine offene Menge Uy , welche nur endlich viele Punkte aus {xj } enthält (hier verwenden wir eigentlich nur das erste Abzählbarkeitsaxiom). Da Uy eine endliche Teilüberdeckung hat, ist die Wertemenge von xj endlich, was ein Widerspruch ist. Erfülle nun Y die Bedingung im Lemma, und sei Uα , α ∈ A eine offene Überdeckung von Y . Da X das zweite Abzählbarkeitsaxiom erfüllt, können wir annehmen, dass A = N abzählbar ist. Angenommen, die Überdeckung Uj hat keine endliche Teilüberdeckung. Dann wählen wir eine Folge xj mit der Eigenschaft, Sj dass xj ∈ Y \ i=1 Ui . Sei y0 ein Grenzwert einer Teilfolge dieser Folge xj . Dann gibt es eine offene Menge UN mit y0 ∈ UN ; nach der Konstruktion von xj ist aber xj ∈ / UN für j ≥ N , ein Widerspruch. 4. Vollständigkeit im Allgemeinen: Metrische Räume Um den Begriff der Vollständigkeit allgemeiner zu fassen, ist es von Vorteil nicht von allgemeinen topologischen Räumen auszugehen. Der Grund liegt darin, dass der Begriff der Cauchyfolge vorraussetzt, dass die “Nähe” von Punkten an verschiedenen Stellen vergleichbar ist. Dies verlangt eine zusätzliche Struktur, und metrische Räume eignen sich hervorragend dafür, den Vollständigkeitsbegriff zu erläutern. Definition 8. Ein metrischer Raum ist eine Menge X zusammen mit einer Abbildung (der Metrik) d : X × X → [0, ∞), welche die folgenden Eigenschaften erfüllt: i) d(x, y) = d(y, x); ii) d(x, y) = 0 genau dann, wenn x = y; iii) d(x, z) ≤ d(x, y) + d(y, z) (die Dreiecksungleichung). Bemerkung 3. Wie schon zuvor beim topologischen Raum, werden wir nicht (X, d) für einen metrischen Raum schreiben, sondern einfach X, wenn die Metrik klar ist. Eine Metrik induziert eine Topologie auf X, indem wir als Basis dieser Topologie die offenen Bälle Bε (x) = {y ∈ X : d(x, y) < ε} festsetzen. Beispiel 3. Wir können auf jeder Menge X die diskrete Metrik definieren: d(x, x) = 0, d(x, y) = 1, wenn y 6= x. Zeige, dass die diskrete Metrik die diskrete Topologie induziert. Übungsaufgabe 23. Sei X ein metrischer Raum mit Metrik d. Zeige: (1) Eine Folge xj konvergiert gegen x ∈ X genau dann, wenn d(xj , x) → 0 (j → ∞). (2) Die Topologie auf X erfüllt das erste Abzählbarkeitsaxiom. (3) X ist separabel genau dann, wenn X das zweite Abzählbarkeitsaxiom erfüllt. (4) d : X 2 → [0, ∞) ist eine stetige Abbildung (X 2 wird hier mit der Produkttopologie versehen). (5) Sei f : [0, ∞) → [0, ∞) eine strikt monoton wachsende, stetige, konkave Funktion (d.h. f ((1 − t)x + ty) ≥ (1 − t)f (x) + tf (y)) mit f (0) = 0. Dann ist df (x, y) = f (d(x, y)) auch eine Metrik auf X, und die Topologien, welche durch d und df induziert werden, sind gleich. Ein topologischer Raum heisst metrisierbar, wenn eine Metrik existiert, welche die gegebene Topologie induziert. Wegen des vorangehenden Beispiels ist so eine Metrik alles andere als eindeutig, im allgemeinen definieren viele verschiedene Metriken dieselbe Topologie. Stetige Abbildungen zwischen metrischen Räumen können durch die bekannte ε − δ-Definition charakterisiert werden: Lemma 9. Seien (X, d), (Y, e) metrische Räume. Eine Abbildung f : X → Y ist stetig am Punkt x0 ∈ X genau dann, wenn für jedes ε > 0 ein δ > 0 existiert sodass e(f (x), f (x0 )) < ε für alle x ∈ X mit d(x, x0 ) < δ ist. Beweis. Sei zunächst die ε − δ-Bedingung erfüllt. Wir müssen zeigen, dass jede offene Umgebung von f (x0 ) ein Bild einer offenen Umgebung von x0 enthält. Wenn V ⊂ Y eine offene Umgebung von f (x0 ) ist, so gibt es einen Ball Bε (f (x0 )) = {y ∈ Y : e(f (x0 ), y) < ε} ⊂ V . Nach Vorraussetzung gibt es ein δ > 0 sodass e(f (x0 ), f (x)) < ε, wenn d(x0 , x) < δ; das heisst aber, dass f (Bδ (x0 )) ⊂ V , und Bδ (x0 ) = {x ∈ X : d(x0 , x) < δ} ist definitionsgemäss eine offene Umgebung von x0 . Für die Umkehrung sei ε > 0. Da Bε (f (x0 )) offen ist, gibt es eine offene Umgebung U von x0 mit f (U ) ⊂ Bε (f (x0 )), und da U eine offene Umgebung von x0 ist, ein δ > 0 mit Bδ (x0 ) ⊂ U . Also ist f (Bδ (x0 )) ⊂ Bε (f (x0 )). 9 Definition 9. Ein metrischer Raum X ist beschränkt, wenn das Bild von d beschränkt ist, also d(x, y) < R für ein R > 0 und alle x, y ∈ X ist. X ist total beschränkt wenn für jedes r > 0 eine endliche Menge {x1 , . . . , xn } ⊂ X existiert sodass n [ X⊂ Br (xj ). j=1 Lemma 10. Ein total beschränkter Raum erfüllt das zweite Abzählbarkeitsaxiom. Beweis. Wir müssen zeigen, dass die Topologie, welche durch die Metrik induziert wird, eine abzählbare Basis besitzt. Für jedes N ∈ N können wir eine endliche Menge En ⊂ X wählen, sodass [ B1/n (x) X⊂ x∈En ist. Wir behaupten, dass die Menge B = B1/n (x) : x ∈ En , n ∈ N eine Basis der Topologie von X ist. Sei x ∈ X beliebig, und U eine offene Umgebung von x. Es genügt zu zeigen, dass es ein n ∈ N gibt und ein y ∈ En gibt, welches x ∈ B1/n (y) ⊂ U erfüllt. Wir können annehmen, dass U = Bε (x) für ein ε > 0 ist. Sei n gross genug, dass 2/n < ε und y ∈ En sodass x ∈ B1/n (y). Dann können wir für alle z ∈ B1/n (y) wie folgt abschätzen: d(x, z) ≤ d(x, y) + d(y, z) ≤ 1 1 + < ε, n n und damit B1/n (y) ⊂ U . Insbesondere ist nach Lemma 8 für einen metrischen Raum die Folgenkompaktheit mit der Kompaktheit im Sinne von Definition 6 äquivalent. Wir werden nun Kompaktheit für metrische Räume im Sinn des Satzes von Heine-Borel charakterisieren. Dazu benötigen wir eine Bedingung, die uns die Existenz von Grenzwerten garantiert (wir erinnern an den Beweis von Lemma 6, wo wir die Existenz des lim sup verwendeten). Hier tritt die Vollständigkeit wieder auf. Definition 10. Eine Folge xn in X ist eine Cauchyfolge, wenn für jedes ε > 0 ein N = N (ε) ∈ N existiert, sodass d(xn , xm ) < ε für alle n, m ≥ N ist. Übungsaufgabe 24. Zeige, dass eine konvergente Folge eine Cauchyfolge ist. Definition 11. Ein metrischer Raum X ist vollständig, wenn jede Cauchyfolge in X konvergiert. Lemma 11. Ein metrischer Raum X ist kompakt genau dann, wenn er total beschränkt und vollständig ist. Beweis. Sei zunächst X kompakt. Dann ist X auch total beschränkt, und damit nach Lemma 10 folgenkompakt. Sei xj eine Cauchyfolge in X. Dann gibt es eine Teilfolge xjk , welche gegen x ∈ X konvergiert. Wir behaupten, dass dann auch limj→∞ xj = x. Sei also ε > 0 beliebig. Dann gibt es ein N ∈ N sodass d(xm , xn ) < ε für m, n ≥ N ist, und ein K ∈ N sodass d(xjk , x) < ε für k ≥ K. Ist nun n ≥ max(N, jK ), so ist d(xn , x) ≤ d(xn , xjK ) + d(xjK , x) ≤ 2ε; also ist (xn ) konvergent und damit X vollständig. Sei nun X total beschränkt und vollständig. Damit ist wiederum Folgenkompaktheit äquivalent zur Kompaktheit, und es genügt zu zeigen, dass jede Folge in X eine konvergente Teilfolge besitzt. Sei also xn eine Folge in X. Wir behaupten, dass es eine Teilfolge xnk gibt, welche Cauchy ist. Für jedes 1/k gibt es endlich viele Bälle B1/k (y), y ∈ Ek welche X überdecken. Wir extrahieren nun induktiv eine Folge aus xj wie folgt. In einem der Bälle B1 (y), y ∈ E1 , gibt liegen xj für unendlich viele j. Wir definieren nun j1 durch alle diese j. Dann extrahieren wir aus der Teilfolge xj1 eine Teilfolge xj2 , welche alle in einem Ball vom Radius 1/2 liegt, und so weiter. Wir behaupten, dass die Diagonalfolge xjj eine Cauchyfolge ist. Sei ε > 0 beliebig, und j ∈ N large enough so that j ≤ 2ε. Wenn k, `geqj ist, so ist xkk , x`` ∈ B1/j (xjj ). Damit ist d(xkk , x`` ) ≤ ε, also ist xmm eine Cauchyfolge. 10 Wir können in einem metrischen Raum natürlich auch den Begriff der gleichmässsigen Stetigkeit definieren: Definition 12. Seiein (X, d) und (Y, e) metrische Räume. Eine Abbildung f : X → Y ist gleichmässsig stetig, wenn für jedes ε > 0 ein δ > 0 existiert, sodass e(f (x), f (y)) < ε wenn d(x, y) < δ. Satz 3. Sei f : X → Y eine stetige Abbildung. Wenn X kompakt ist, so ist f gleichmässig stetig. Beweis. Sei ε > 0 beliebig. Da f stetig ist, gibt es für jedes x ∈ X ein δ(x) sodass e(f (x), f (y)) < ε wenn d(x, y) < 2δ(x). Die Bälle Bδ(x) (x) überdecken X, also existieren endlich viele xj sodass schon Bδ(xj ) (xj ) ganz X überdecken. Wenn wir nun δ = minj δ(xj ) > 0 wählen, so gilt für beliebige x, y ∈ X, dass aus x ∈ Bδ(xj ) (xj ) auch y ∈ B2δ(xj ) (xj ), da d(y, xj ) ≤ d(y, x) + d(x, xj ) ≤ δ + δ(xj ) ≤ 2δ(xj ). Damit ist e(f (x), f (y)) ≤ e(f (x), f (xj )) + e(f (xj ), f (y)) ≤ 2ε, und damit f gleichmässig stetig. In einem vollständigen metrischen Raum gilt der wichtige Banach’sche Fixpunktsatz. Definition 13. Sei X ein metrischer Raum. Eine Abbildung f : X → X ist eine Kontraktion, wenn es ein q < 1 gibt, sodass d(f (x), f (y)) < qd(x, y) für alle x, y ∈ X ist. Bemerkung 4. Insbesondere ist jede Kontraktion (sogar gleichmässig) stetig. Satz 4. Sei X ein vollständiger metrischer Raum, und f : X → X eine Kontraktion. Dann besitzt f einen Fixpunkt: Es gibt ein x ∈ X mit f (x) = x. Beweis. Sei x0 ∈ X beliebig. Wir definieren eine Folge xj durch xj+1 = f (xj ). Wenn xj konvergiert, limj xj = x, so folgt aus der Stetigkeit von f dass x = f (x). Wir zeigen nun, dass xj eine Cauchyfolge ist: d(xm , xn ) ≤ n−m+1 X d(xm+j−1 , xm+j ) j=1 = n−m+1 X d(f (xm+j−2 ), f (xm+j−1 )) j=1 ≤ n−m+1 X qd(xm+j−2 , xm+j−1 ) j=1 ... ≤ q m + q m+1 + · · · + q n d(x1 , x0 ) qm d(x1 , x0 ). ≤ 1−q Da q < 1 ist, strebt der letzte Teil dieser Ungleichungskette gegen 0, wenn m → ∞; also ist xj eine Cauchyfolge. 11 KAPITEL 2 Differentialrechnung 1. Der Begriff der Differenzierbarkeit Definition 14. Sei f : (a, b) → R eine reelle Funktion, x ∈ (a, b). Wir sagen, f ist differenzierbar im Punkt x, wenn der Grenzwert der Differenzenquotienten f (x + h) − f (x) =: f 0 (x) h existiert. Der Grenzwert f 0 (x) wird als die Ableitung von f im Punkt x bezeichnet. Ist f in jedem Punkt von (a, b) differenzierbar, so sagen wir, f ist auf (a, b) differenzierbar. Den Raum der differenzierbaren Funktionen auf (a, b) bezeichnen wir mit D ((a, b)); für f ∈ D ((a, b)) ist die Ableitung f 0 : (a, b) → R eine auf (a, b) definierte Funktion. lim h→0 Beispiel 4. Die Potenzfunkztionen x 7→ xn , n ∈ N sind in jedem Punkt x ∈ R differenzierbar, d.h. f (x) = xn ∈ D (R): n 1 X j n−j j (x + h)n − xn x h = nxn−1 , = lim lim h→0 h h→0 n h j=1 also f 0 (x) = nxn−1 . Übungsaufgabe 25. Zeige, dass die Funktionen x 7→ x−n für n ∈ N differenzierbar auf R \ {0} sind, und berechne ihre Ableitungen. Eine einfache Umformulierung von Definition 14 ist die folgende: f : (a, b) → R ist differenzierbar in x ∈ (a, b) genau dann, wenn es eine Zahl λ ∈ R sodass die durch (1) R(h) = f (x + h) − f (x) − λh, für h ∈ (−δ, δ) für ein δ > 0 definierte Funktion R die Eigenschaft hat, dass R(h) = 0; h→0 h die Zahl λ ist eindeutig bestimmt, und λ = f 0 (x). Insbesondere ist limh→0 f (x + h) − f (x) = 0, also f stetig im Punkt x. Diese wichtige Folgerung aus der Differenzierbarkeit formulieren wir auch: lim Lemma 12. Sei f : (a, b) → R differenzierbar im Punkt x ∈ (a, b). Dann ist f stetig im Punkt x. Insbesondere ist D ((a, b)) ⊂ C ((a, b)). Bemerkung 5. Wir bemerken noch einmal explizit, dass Differenzierbarkeit wesentlich stärker als Stetigkeit ist. Eine Funktion f ist stetig im Punkt x ∈ (a, b), wenn limh→0 f (x+h)−f (x) = 0 ist. Wenn f differenzierbar im Punkt x ist, so gilt sogar dass es ein C > 0 gibt sodass |f (x + h) − f (x)| < C|h| für kleine h ist: Da lim R(h) h = 0 in (1) ist, sehen wir, dass es ein δ > 0 gibt mit R(h) h < 1. Dann ist |f (x + h) − f (x)| ≤ (|λ| + 1)|h| für |h| < δ. Ein explizites Beispiel einer Funktionen, welche stetig im Punkt 0 aber nicht differenzierbar im Punkt 0 √ ist, ist x 7→ x. √ Übungsaufgabe 26. Zeige die letzte Behauptung: x 7→ x ist nicht differenzierbar im Punkt 0. 13 Eine graphische Interpretation der Ableitung kann man wie folgt erhalten: Der Differenzenquotient f (x + h) − f (x) h ist der Anstieg der Geraden, welche die Punkte (x, f (x)) und (x + h, f (x + h)) im Graphen von f verbindet. Die Gerade durch (x, f (x)) mit Anstieg f 0 (x) ist also die Tangente an den Graphen von f im Punkt (x, f (x)). Übungsaufgabe 27. Zeige, dass die Betragsfunktion x 7→ |x| auf R \ {0} differenzierbar ist und berechne ihre Ableitung. Ist sie im Punkt 0 differenzierbar? Oft ist es interessant, Ableitungen auch in Randpunkten von Intervallen zu betrachten; die dort gebildeten Grenzwerte sind natürlich einseitig zu bilden. Wir können auch ein wenig allgemeiner definieren: Definition 15. Sei f : X → R eine reelle Funktion, x ∈ X. Wir sagen, f ist differenzierbar im Punkt x, wenn der Grenzwert der Differenzenquotienten lim h→0 x+h∈X f (x + h) − f (x) =: f 0 (x) h existiert. Der Grenzwert f 0 (x) wird als die Ableitung von f im Punkt x bezeichnet. Ist f in jedem Punkt von X differenzierbar, so sagen wir, f ist auf X differenzierbar. Den Raum der differenzierbaren Funktionen auf X bezeichnen wir mit D (X); für f ∈ D (X) ist die Ableitung f 0 : X → R eine auf X definierte Funktion. Diese Definition ist sehr allgemein; wir werden sie später nur in Spezialfällen (für kompakte Intervalle X) genauer ausleuchten. Zuvor wollen wir einige Rechenregeln erkunden. Lemma 13. Seien f, g im Punkt x ∈ X differenzierbar, und λ ∈ R. Dann sind auch die Funktionen λf + g, f g, sowie f /g (letztere allerdings nur, falls g(x) 6= 0) im Punkt x differenzierbar, und für die Ableitungen gilt: (λf + g)0 (x) = λf 0 (x) + g 0 (x) Summenregel (f g)0 (x) = f 0 (x)g(x) + f (x)g 0 (x) 0 f 0 (x)g(x) − f (x)g 0 (x) f (x) = g g(x)2 Produktregel Quotientenregel Beweis. Die erste Behauptung des Lemmas wird als Übungsaufgabe dem Leser überlassen. Für die Produktregel rechnen wir wie folgt: f (x + h)g(x + h) − f (x + h)g(x) + f (x + h)g(x) − f (x)g(x) f (x + h)g(x + h) − f (x)g(x) = h h g(x + h) − g(x) f (x + h) − f (x) = f (x + h) + g(x) h h und lassen nun h → 0; nach Lemma 12 ist f stetig im Punkt x, und damit ist, nachdem die Limiten der einzelnen Terme auf der rechten Seite der Gleichung alle existieren, auch f g im Punkt x differenzierbar, und (f g)0 (x) = f 0 (x)g(x) + f (x)g 0 (x) wie behauptet. Für die Quotientenregel ist es nun genug, zu zeigen dass für g(x) 6= 0 der Bruch 1/g im Punkt x differenzierbar ist, und (1/g)0 (x) = −g 0 (x)/g(x)2 gilt. Wir berechnen nun 1 1 − 1 g(x) − g(x + h) g(x + h) g(x) = h g(x + h)g(x) h und sehen, dass nach Vorraussetzung der Grenzwert (wir verwenden wieder Lemma 12) für h → 0 der Terme auf der rechten Seite der Gleichung existieren, und somit (1/g) differenzierbar im Punkt x mit der behaupteten Ableitung ist. Bemerkung 6. Die Menge D (X) ist also ein Ring, genauer gesagt, eine Algebra über R. Insbesondere folgt aus der Differenzierbarkeit der Funktion x auf R, dass D (R) alle Polynomfunktionen enthält. 14 Übungsaufgabe 28. Die Ableitungen der Polynomfunktionen haben wir im Prinzip schon in Beispiel 4 berechnet. Zeige nochmals, diesmal unter Verwendung der Produktregel und mit Hilfe von Induktion, dass die Ableitung von f (x) = xn durch f 0 (x) = nxn−1 für n ∈ N gegeben ist. Die letzte wichtige Rechenregel ist die Kettenregel. Lemma 14. Seien f, g gegeben, sodass die Zusammensetzung g ◦ f in einer Umgebung von x Sinn macht. Ist nun f an der Stelle x differenzierbar, und g an der Stelle f (x) differenzierbar, so ist g ◦ f an der Stelle x differenzierbar und es gilt (g ◦ f )0 (x) = g 0 (f (x))f 0 (x). Beweis. Die Kettenregel folgt, indem man g(f (x + h)) − g(f (x)) f (x + h) − f (x) g(f (x + h)) − g(f (x)) = h f (x + h) − f (x) h schreibt und den Grenzwert h → 0 bildet. Dabei muss natürlich das Problem, dass der Nenner des ersten Bruchs durchaus 0 sein kann, berücksichtigt werden. Es ist deswegen von Vorteil, entweder die Umformulierung in (1) zu verwenden, oder aber eine Fallunterscheidung zu machen; wir wollen dies als Übungsaufgabe rechnen. 2. Der Mittelwertsatz und Folgerungen Seien x, y ∈ [a, b], und f eine Funktion auf [a, b]. Der Wert f (x) − f (y) x−y ist kann als mittlere Änderungsrate von f zwischen x und y aufgefasst werden. Wenn nun y = x + h ist und wir den Grenzwert für y → x (oder h → 0) dieses Differenzenquotienten betrachten, so macht es Sinn, die Ableitung f 0 (x) als momentane Änderung von f im Punkt x aufzufassen. Der Mittelwertsatz erlaubt es uns, diesen Zusammenhang zu präzisieren. Satz 5 (Mittelwertsatz). Sei f ∈ C ([a, b]) ∩ D ((a, b)). Dann gibt es ein ξ ∈ (a, b) mit f 0 (ξ) = f (b) − f (a) . b−a Beweis. Sei g(x) = (b − a)f (x) + (a − x)f (b) + (x − b)f (a). Dann ist g(a) = g(b) = 0, und nach Lemma 13, wieder stetig auf [a, b] und differenzierbar auf (a, b). Wir behaupten, dass es einen Punkt ξ ∈ (a, b) gibt, für welchen g 0 (ξ) = 0 ist; für diesen Punkt ξ ist also 0 = (b − a)f 0 (ξ) + f (a) − f (b) wie verlangt. Wenn g(x) konstant auf [a, b] ist, so gibt es nichts zu zeigen. Ist g(x) nicht konstant auf [a, b], so nehmen wir ohne Beschränkung der Allgemeinheit an, dass maxx∈[a,b] g(x) > 0. Sei ξ ein Punkt mit g(ξ) = maxx∈[a,b] g(x). Dann ist auf der einen Seite, da g im Punkt ξ differenzierbar ist, g 0 (ξ) = lim h&0 und andererseits g(ξ + h) − g(ξ) ≤ 0, h g(ξ + h) − g(ξ) ≥ 0, h%0 h g 0 (ξ) = lim also g 0 (ξ) = 0 wie behauptet. Die im Beweis dieses Satzes gemachte Beobachtung (wenn g ein Maximum an der Stelle ξ hat, so ist g 0 (ξ) = 0) wollen wir festhalten: Lemma 15. Sei g eine stetige Funktion auf X. Wenn g ein (lokales) Maximum an der Stelle ξ hat, und an der Stelle ξ differenzierbar ist, so ist g 0 (ξ) = 0. 15 Die Umkehrung dieses Satzes stimmt nicht, wie das Beispiel der Funktion x 7→ x3 zeigt. Korollar 1. Sei f ∈ C ([a, b]) ∩ D ((a, b)), und f 0 (x) ≥ 0 (bzw. f 0 (x) > 0) für x ∈ (a, b). Dann ist f (strikt) monoton wachsend auf [a, b]. Beweis. Für beliebige x, y ∈ [a, b], x < y, gilt nach Theorem 5, dass f (y) − f (x) = f 0 (ξ)(y − x) ≥ 0 bzw. > 0 nach Vorraussetzung, also ist f (strikt) monoton. Nicht immer führt die Verwendung des Mittelwertsatzes zu optimalen Aussagen: Korollar 2. Sei f ∈ C ([a, b]) ∩ D ((a, b)), f 0 ∈ C ((a, b)), und f 0 (x) > 0 für x ∈ [a, b]. Wir schreiben c = f (a), d = f (b). Dann gibt es eine Funktion g ∈ C ([a, b]) ∩ D ((c, d)) welche f (g(y)) = y für y ∈ [c, d] und g(f (x)) = x für x ∈ [a, b] erfüllt. Die Ableitung von g ist gegeben durch 1 g 0 (y) = 0 . f (g(y)) Beweis. Da f strikt monoton wachsend und stetig ist, gilt dass die inverse Funktion g definiert, stetig, und wiederum strikt monoton wachsend ist. Sei y ∈ (c, d), dann ist h = f (g(y + h)) − f (g(y)) = f 0 (ξh )(g(y + h) − g(y)) und damit 1 g(y + h) − g(y) = 0 ; h f (ξh ) wenn wir h → 0 gehen lassen, folgt ξh → g(y), und damit (da f 0 stetig ist), dass g differenzierbar an der Stelle y ist, mit der behaupteten Formel für die Ableitung. Übungsaufgabe 29. Tatsächlich genügt es, anzunehmen, dass f an der Stelle x differenzierbar ist, dann gilt, dass f −1 an der Stelle f (x) differenzierbar ist, und (f −1 )0 (f (x)) = 1/(f 0 (x)). Zeige diese Behauptung direkt aus der Definition der Differenzierbarkeit und interpretiere die Aussage graphisch; genauer: Sei f : [a, b] → [c, d] strikt monoton und stetig. Wenn f an der Stelle x differenzierbar ist, dann ist f −1 an der Stelle f (x) differenzierbar. Lemma 16. Sei f ∈ C ([a, b]) ∩ D ((a, b)). Angenommen f 0 (x) lässt sich stetig nach [a, b) (bzw. (a, b]) fortsetzen. Dann ist f auch in a (bzw. b) differenzierbar, und f 0 ist stetig auf [a, b) (bzw. (a, b]). Beweis. Wir betrachten den Fall des linken Endpunkts; analoge Argumente geben das entsprechende Resultat im rechten Endpunkt des Intervalls. Mit Hilfe des Mittelwertsatzes erhalten wir für jedes h ein ξh ∈ (a, a + h) mit f (a + h) − f (a) = f 0 (ξh )h. Also ist f (a + h) − f (a) = lim f 0 (ξh ); h&0 h der Grenzwert auf der rechten Seite existiert aber nach Vorraussetzung, da ξh → a für h & 0. lim h&0 Ableitungen von differenzierbaren Funktionen sind speziell (d.h. nicht jede Funktion tritt als Ableitung auf); eine interessante Eigenschaft ist die Zwischenwerteigenschaft, welche Ableitungen erfüllen. Korollar 3. Sei f ∈ D ((a, b)), c, d ∈ (a, b), f 0 (c) < y < f 0 (d). Dann gibt es ein ξ ∈ (c, d) mit f (ξ) = y. 0 Beweis. Sei g(x) = f (x) − yx. Da g stetig ist, nimmt es zwischen c und d sein Minimum auf [c, d] an, sagen wir, an der Stelle ξ. Nachdem g 0 (c) < 0 und g 0 (d) > 0 ist, muss dieser Punkt ξ ∈ (c, d) erfüllen. Nach Lemma 15 folgt g 0 (ξ) = 0, also f 0 (ξ) = y. Um Nullstellen von Funktionen zu finden, verwendet man oft Newtons Methode: Korollar 4. Sei f ∈ C ([−a, a]) ∩ D ((−a, a)) mit stetiger Ableitung f 0 ∈ C ((−a, a)), f 0 (0) 6= 0, und f (0) = 0. Dann gibt es ein ε > 0 sodass für jedes x0 ∈ [−ε, ε] die durch xj+1 = xj − f (xj ) f 0 (xj ) definierte Folge xj gegen die Nullstelle 0 von f konvergiert. 16 Beweis. Wir wählen ε so klein, dass für beliebige ξ, η ∈ [−ε, ε] 0 1 − f (ξ) < 1/2. f 0 (η) 1 Wir definieren g(x) = x − ff0(x) (x) und behaupten, dass |g(x)| ≤ 2 |x| ist. Tatsächlich ist (da f (0) = 0) nach dem Mittelwertsatz für ein ξ zwischen 0 und x die Gleichung f (x) = xf 0 (ξ) erfüllt und damit xf 0 (ξ) f 0 (ξ) 1 f (x) |g(x)| = x − 0 = x− 0 = |x| 1 − 0 < |x|. f (x) f (x) f (x) 2 Damit ist |xn | ≤ (1/2)n |x0 |, also konvergiert xn → 0(n → ∞). Übungsaufgabe 30. Zeige, dass man die Nullstelle 0 durch eine beliebige Zahl c ∈ [a, b] ersetzen kann; formuliere das entsprechende Ergebnis selber. Übungsaufgabe 31. Analysiere den Beweis–kann man die Methode auch durch g(x) = x − Cf (x) für ein geeignetes C ∈ R ersetzen? (Newton’s Methode hat Vorteile, wenn f sogar 2-mal differenzierbar ist. Dazu aber später mehr.) Übungsaufgabe 32. Seien f, g ∈ D ((a, b)) ∩ C ([a, b]). Dann gibt es ein ξ ∈ (a, b) mit f 0 (ξ)(g(b) − g(a)) − g 0 (ξ)(f (b) − f (a)) = 0. 3. Grenzwertsätze Wir werden nun vor allem auf kompakten Intervallen [a, b] arbeiten. Definition 16. Für jedes k ∈ N sagen wir, die Funktion f ist k-mal differenzierbar, wenn sie (k − 1)-mal differenzierbar und die (k − 1)-te Ableitung f (k−1) erneut differenzierbar ist; die Ableitung von f (k−1) ist die k-te Ableitung von f und wird mit f (k) bezeichnet. Der Raum der k-mal differenzierbaren Funktionen wird mit Dk (X) bezeichnet. Ist die k-te Ableitung zusätzlich stetig auf X, so sagen wir, f ist k-mal stetig differenzierbar und schreiben f ∈ C k (X). Der Raum der stetigen Funktionen auf X wird auch mit C 0 (X) = C (X) bezeichnet. Eine Funktion f , die k-mal differenzierbar für jedes k ∈ N ist, wird als glatt bezeichnet, und man schreibt f ∈ C ∞ (X). Übungsaufgabe 33. Zeige, dass Dk (X) und C k (X) Algebren über R sind, sowie die verallgemeinerte Produktregel: Wenn f, g ∈ Dk (X), so ist die k-te Ableitung von f g gegeben durch k X j (j) (k−j) (k) f g . (f g) = k j=0 Für endliches k wird der Raum C k ([a, b]) wird mit Hilfe der Festsetzung X kf kk = max |f (j) (x)| j≤k x∈[a,b] zu einem normierten Raum. Die durch diese Norm induzierte Metrik d(f, g) = kf − gkk erzeugt die Topologie der gleichmässigen Konvergenz in den ersten k Ableitungen (bzw. für k = 0 die Topologie der gleichmässigen Konvergenz). Wir zeigen, dass C k ([a, b]) vollständig ist, d.h. C k ([a, b]) ist ein Banachraum: C Lemma 17. Der Raum C k ([a, b]) ist für jedes k ≥ 0, k ∈ N ein Banachraum. Die Abbildung D : C k ([a, b]) → ([a, b]) welche durch (Df )(x) = f 0 (x) definiert ist, ist stetig. k−1 Beweis. Sei zunächst k = 0. Eine Folge stetiger Funktionen fn ∈ C ([a, b]) ist eine Cauchyfolge, wenn für jedes ε > 0 ein N ∈ N existiert, sodass für alle m, n ≥ N |fm (x) − fn (x)| < ε, x ∈ [a, b] gilt. Damit ist für jedes fixe x ∈ [a, b] die Folge fn (x) eine Cauchyfolge, und besitzt damit einen Grenzwert, den wir mit f (x) bezeichnen. Wir behaupten, dass f eine stetige Funktion ist. Sei also ξ ∈ [a, b] fix, und ε > 0. Wir wählen N sodass |fm (x) − fn (x)| ≤ ε, m, n ≥ N, 17 x ∈ [a, b] gilt. Lassen wir nun n → ∞, sehen wir, dass |fm (x) − f (x)| für jedes m ≥ N und x ∈ [a, b] gilt; insbesondere gilt, dass fn → f für n → ∞, wenn wir nur zeigen können, dass f ∈ C (X). Wir wählen δ > 0 sodass |fN (ξ) − fN (x)| < ε wenn |ξ − x| < δ. Es folgt, dass |f (ξ) − f (x)| ≤ |f (ξ) − fN (ξ)| + |fN (ξ) − fN (x)| + |fN (x) − f (x)| < 3ε wenn |ξ − x| < δ. Also ist f stetig im Punkt ξ, und nachdem ξ beliebig war, auf ganz [a, b]. Es genügt nun zu zeigen, dass wenn fn eine Folge differenzierbarer Funktionen ist, welche gleichmässig auf [a, b] gegen eine stetige Funktion f konvergieren, und die Folge der Ableitungen fn0 gleichmässig gegen eine stetige Funktion g konvergieren, auch f differenzierbar ist und f 0 = g gilt. Sei also x ∈ [a, b] beliebig. Wir müssen den Grenzwert f (x + h) − f (x) h für h → 0 berechnen und zeigen, dass dieser g(x) ist; mit anderen Worten, wir wollen zeigen, dass für ein geeignetes c > 0 die Funktion f (x + h) − f (x) h ∈ [−c, c] \ {0} A(h) = h g(x) h=0 stetig ist. Nach dem ersten Teil des Beweises ist es genug, zu zeigen, dass A(h) der gleichmässige Grenzwert der stetigen Abbildungen fn (x + h) − fn (x) h ∈ [−c, c] \ {0} An (h) = h f 0 (x) h=0 n ist. Falls An gleichmässig konvergiert, limn→∞ An = A; es reicht also, wiederum weil wir schon wissen, dass C ([−c, c]) vollständig ist, zu zeigen, dass An eine Cauchyfolge ist. Sei also ε > 0 beliebig. Für jedes h und für jedes n existiert ein ξn,h mit |x − ξn,h | < |h| sodass 0 (t) − fn0 (t)| < ε An (h) = fn0 (ξn,h ). Da die fn0 gleichmässig gegen g konvergieren, gibt es ein N ∈ N mit |fm für alle t ∈ [a, b] und alle n, m ≥ N . Wir behaupten nun zunächst, dass es ein δ > 0 gibt, sodass für alle 0 0 (t)| < 3ε gilt. Da g gleichmässig (s) − fm m ≥ N und alle s, t ∈ [a, b] mit |s − t| < δ die Ungleichung |fm stetig auf dem kompakten Intervall [a, b] ist, können wir ein δ wählen, sodass |g(s) − g(t)| < ε für |s − t| < δ, s, t ∈ [a, b], und wie folgt abschätzen: 0 0 0 0 |fm (s) − fm (t)| ≤ |fm (s) − g(s)| + |g(s) − g(t)| + |g(t) − fm (t)| < 3ε. Ist also |h| ≤ 2δ , so gilt 0 0 0 0 |An (h) − Am (h)| = |fm (ξm,h ) − fn0 (ξn,h )| ≤ |fm (ξm,h ) − fm (ξn,h )| + |fm (ξn,h ) − fn0 (ξn,h )| < 4ε, da |ξm,h − ξn,h | < 2|h| ≤ δ ist. Auf der anderen Seite ist die Folge von Funktionen An , betrachtet auf dem Intervall [−c, −δ] bzw. [c, δ], klarerweise gleichmässig konvergent (mit Grenzwert A); wir können also ein Ñ wählen, sodass auch |An (h) − Am (h)| < 4ε, wenn h ∈ [−c, −δ] ∪ [c, δ] und n, m ≥ Ñ . Zusammengenommen ist dann für n, m ≥ max(N, Ñ ) und für jedes h ∈ [−c, c] |An (h) − Am (h)| < 4ε, also An eine Cauchyfolge wie behauptet. Übungsaufgabe 34. Ist die Konvergenz der abgeleiteten Funktionen eine notwendige Vorraussetzung für die Differenzierbarkeit der Grenzfunktion? D.h. gibt es ein Beispiel einer Funktionenfolge fn , für welche fn0 nicht gleichmässig konvergiert, und f = limn fn tatsächlich nicht differenzierbar ist? 18 4. Implizite Funktionen √ Oft haben wir Funktionen als die Lösung von Gleichungen gegeben; die Wurzelfunktion x ist zum Beispiel als die Lösung y(x) der Gleichung y 2 = x gegeben. Der Satz über implizite Funktionen erlaubt es uns, Gleichungen von der Form F (x, y) = 0 “nach y” aufzulösen, d.h. eine Funktion y(x) zu finden, für die F (x, y(x)) = 0 gilt. Geometrisch interpretiert man das, indem man in der Nullstellenmenge von F den Graphen einer Funktion von x sucht. Nicht immer erwartet man, dass Lösungen impliziter Gleichungen wieder differenzierbar sind. Übungsaufgabe 35. Zeige, dass die Gleichung y 2 = x2 eine Lösung besitzt, welche an der Stelle 0 nicht differenzierbar ist. Um allgemeine Aussagen über die Lösungen impliziter Gleichungen machen zu können, müssen wir demnach Anforderungen an F stellen. Die Vorrausetzungen, welche wir hier verwenden wollen, um y(x) zu finden, sind an die “partiellen” Ableitungen der Funktion F gestellt. Sei F (x, y) also eine Funktion von 2 reellen Variablen x, y, definiert auf dem Rechteck R = [a, b] × [c, d]. Wir sagen, F ist auf R partiell nach x bzw. y differenzierbar, wenn der Grenzwert F (x + h, y) − F (x, h) ∂F F (x, y + k) − F (x, h) ∂F (x, y) = Fx (x, y) = lim bzw. (x, y) = Fy (x, y) = lim h→0 k→0 ∂x h ∂y k für jedes (x, y) ∈ R existiert. Die Funktion Fx (bzw. Fy ) ist die partiellen Ableitung von F nach x (bzw. y). Satz 6. Sei F (x, y) auf einem Rechteck R = [−a, a] × [−b, b] definiert und stetig sowie F (0, 0) = 0. Weiters existiere die partielle Ableitung Fy (x, y) auf R und es sei Fy stetig auf R sowie Fy (0, 0) 6= 0. Dann gibt es ein ε > 0 und eine stetige Funktion y(x) auf (−ε, ε) sodass F (x, y(x)) = 0 ist. Ist darüberhinaus auch Fx auf R stetig, so ist y differenzierbar, und es gilt Fx (x, y(x)) y 0 (x) = − . Fy (x, y(x)) Beweis. Wir können oBdA annehmen, dass Fy (0, 0) > 0 ist. Da Fy stetig ist, ist auf einem möglicherweise kleineren Rechteck Fy (x, y) > 0; wir ersetzen unser gegebenes Rechteck gegebenenfalls durch ein solches und nehmen an, dass Fy > 0 auf R gilt. Für jedes x ∈ [−a, a] ist die Funktion y 7→ F (x, y) dann strikt monoton steigend auf [−b, b]. Insbesondere gilt F (0, −b) < 0 und F (0, b) > 0; indem wir die Stetigkeit von F verwenden und uns falls notwendig wiederum auf ein kleineres Rechteck einschränken, können wir annehmen, dass F (x, −b) < 0 und F (x, b) > 0 für x ∈ [−a, a] gilt. Wir definieren nun für fixes x ∈ [−a, a] den Wert y(x) als die eindeutige Lösung der Gleichung F (x, y) = 0 welche nach Korollar 2 existiert, und zeigen, dass y stetig ist. Dazu genügt es zu zeigen, dass y(x) stetig am Punkt 0 ist; die anderen Punkte können durch die Anwendung desselben Arguments erhalten werden. Angenommen also, y(x) ist nicht stetig im Punkt 0. Da nach Vorraussetzung y(0) = 0 ist, gibt es deswegen ein δ > 0 sodass |y(xj )| > δ für eine Folge xj mit xj → 0 für j → ∞. Die Folge (xj , y(xj )) ist dann eine Folge im kompakten Rechteck R; durch Übergang zu einer konvergenten Teilfolge können wir also annehmen, dass (0, y0 ) = limj→∞ (xj , y(xj )) ist, und |y0 | > δ > 0. Da F stetig ist, ist F (0, y0 ) = 0; nach Vorraussetzung ist aber y = 0 die eindeutige Lösung von F (0, y) = 0, was einen Widerspruch darstellt. Um die Differenzierbarkeit von y zu zeigen, bemerken wir zunächst, dass F (x, y(x)) − F (x + h, y(x + h)) = 0, lim h→0 h da f (x, y(x)) = f (x + h, y(x + h)) = 0, gilt. Die Differenz können wir mit Hilfe des Mittelwertsatzes als F (x, y(x)) − F (x + h, y(x + h)) = (F (x, y(x)) − F (x + h, y(x))) + (F (x + h, y(x)) − F (x + h, y(x + h))) = −Fx (ξh , y(x))h + Fy (x + h, ηh )(y(x) − y(x + h)), wo |x − ξh | < |h| und |ηh − y(x)| < |y(x) − y(x + h)| ist. Damit gilt, dass lim h→0 y(x) − y(x + h) Fx (ξh , y(x)) Fx (x, y(x)) = lim = , h→0 Fy (x + h, ηh ) h Fy (x, y(x)) da der Grenzwert auf der rechten Seite existiert; also ist y differenzierbar an der Stelle x mit der behaupteten Formel für die Ableitung. 19 Übungsaufgabe 36. Im Beweis des Satzes haben wir Korollar 2 angewendet. Zeige, dass man eine lokale Form dieses Korollars auch aus dem Satz über implizite Funktionen folgern kann: Wenn f (x) eine Funktion ist, welche differenzierbar in einer Umgebung von 0 ist, und f 0 (0) > 0, dann gibt es ein ε > 0 und ein g, welches auf [f (−ε), f (ε)] definiert ist und f ◦ g = g ◦ f = id erfüllt. Übungsaufgabe 37. Die Funktionen xr , wo r eine rationale Zahl ist, sind an allen Stellen x 6= 0 differenzierbar. Finde auch eine Formel für die Ableitung. REMINDER: vielleicht auch den Fixpunktsatz- Beweis?? 5. Taylor’s Satz und Folgerungen Differenzierbarkeit bedeutet, dass f (x + h) gut durch die affine Funktion f (x) + hf 0 (x) approximiert wird, in dem Sinn, dass R(x, h) = f (x + h) − f (x) − f 0 (x)h die Eigenschaft hat, dass R(x, h) = 0. h Die genaue Geschwindigkeit, mit der R(x, h) gegen 0 geht, ist damit nicht bestimmt. Oft wünscht man sich, dass der Restterm R(x, h) die Eigenschaft hat, dass sogar h−2 R(x, h) für h → 0 beschränkt bleibt. Dies ist nicht immer der Fall, wie das Beispiel von xα für α < 2 (um x = 0) zeigt. Diese Funktion ist allerdings auch nur 1-mal stetig differenzierbar; die zweite Ableitung ist in keiner Umgebung von 0 beschränkt und bei 0 nicht definiert. Höhere Differenzierbarkeit erlaubt es uns, die lineare Approximation zu verbessern. Nach dem Mittelwertsatz ist (da R(x, 0) = 0) lim h→0 R(x, h) = hRh (x, k) für ein k mit |k| < |h|. Nun ist Rh (x, h) = f 0 (x + h) − f 0 (x), also Rh (x, 0) = 0 und Rh2 (x, h) = f 00 (x + h). Eine weitere Anwendung des Mittelwertsatzes zeigt, dass R(x, h) = hkf 00 (x + `) für ein ` mit |`| < |k|, was zeigt, dass h−2 R(x, h) beschränkt ist (für h → 0). Wir formulieren eine Variante dieser letzten Beobachtung als Lemma 18. Sei R(h) ∈ C k ([a, b]) ∩ Dk+1 ((a, b)), a < 0 < b, und R(0) = R0 (0) = . . . R(k) (0) = 0. Dann gibt es für jedes h ∈ [a, b] ein ξh mit |ξh | < |h| sodass R(h) = hk+1 R(k+1) (ξ). (k + 1)! Beweis. Wir definieren f (t) = R(t) + R0 (t)(h − t) + R00 (t) (h − t)2 (h − t)k + · · · + R(k) (t) , 2! k! g(t) = (t − h)k+1 . Nach Übungsaufgabe 32 gibt es ein ξ mit |ξ| < |h| sodass 0 = f 0 (ξ)(g(h) − g(0)) − g 0 (ξ)(f (h) − f (0)) (h − ξ)k (−(−h)k+1 ) − (k + 1)(ξ − h)k R(h), k! was nach einer einfachen Umformung die Behauptung ergibt. = R(k+1) (ξ) Wir können nun unsere erste Form der Taylorentwicklung formulieren: Satz 7. Sei f ∈ C k ([a, b]) ∩ Dk+1 ((a, b)), a < x < b. Dann gibt es für jedes h mit x + h ∈ (a, b) ein ξ ∈ (x, x + h) sodass f (x + h) = f (x) + f 0 (x)h + f 00 (x) 2 f (k) (x) k f (k+1) (ξ) k+1 h + ··· + h + h . 2! k! (k + 1)! 20 Beweis. Wir betrachten die Differenz f 00 (x) 2 f (k) (x) k h + ··· + h − f (x + h). 2! k! Diese erfüllt die Vorraussetzungen von Lemma 18, und R(k+1) (h) = f (k+1) (x + h); das ergibt die angegebene Form des Rests. R(h) = f (x) + f 0 (x)h + Für die erste Anwendung wiederholen wir die Definition eines lokalen Extremums: Definition 17. Sei f eine Funktion, welche in einer Umgebung von x definiert ist. Dann hat f ein lokales Maximum (Minimum) an der Stelle x wenn für genügend kleine h f (x + h) ≤ f (x) (bzw. f (x + h) ≥ f (x)) ist. Das Maximum ist strikt, wenn diese Ungleichungen für h 6= 0 strikte Ungleichungen sind. Korollar 5. Sei f in einer Umgebung von x zweimal stetig differenzierbar, f 0 (x) = 0. Dann hat f ein lokales Minimum an der Stelle x, wenn f 00 (x) > 0, und ein lokales Maximum, wenn f 00 (x) < 0. Bemerkung 7. Wie das Beispiel von x3 bzw. x4 zeigt, kann falls f 00 (0) = 0 ist keine weitere Aussage ohne weitere Vorraussetzungen möglich. Beweis. Für kleine h > 0 ist f 00 (ξ) 2 h f (x + h) = f (x) + 2 ( > f (x), f 00 (ξ) > 0 < f (x), f 00 (ξ) < 0, wobei ξ ∈ (x, x + h). Wenn h genügend klein gewählt ist, hat f 00 (ξ) dasselbe Vorzeichen wie f 00 (x). Übungsaufgabe 38. Zeige die folgende Verallgemeinerung von Korollar 5: Sei f in einer Umgebung von x k-mal stetig differenzierbar, f 0 (x) = · · · = f k−1 (x) = 0, und f (k) (x) 6= 0. Dann ist x kein lokales Extremum, wenn k ungerade ist; wenn k gerade ist, so hat f ein lokales Minimum an der Stelle x, wenn f (k) (x) > 0, und ein lokales Maximum, wenn f (k) (x) < 0. Unser nächstes Korollar zeigt, dass die Konvergenz in der Newton-Methode besser als in Korollar 4 angegeben ist. Korollar 6. Sei f in einer Umgebung von 0 zweimal stetig differenzierbar, f (0) = 0, und f 0 (0) 6= 0. Dann gibt es eine Umgebung von 0 und eine Konstante M > 0 sodass die durch f (x) g(x) = x − 0 f (x) definierte Funktion |g(x)| < M |x|2 erfüllt. Beweis. Wir wenden Theorem 7 am Punkt x an und sehen, dass f 00 (ξ) 2 0 = f (0) = f (x) + f 0 (x)(−x) + x . 2 Also ist f (x) f 00 (ξ) 2 |g(x)| = x − 0 = |x| ≤ M |x|2 f (x) 2f 0 (x) wenn x (und damit auch ξ) nahe genügend an 0 sind. Übungsaufgabe 39. Im Beweis des vorangehenden Satzes ist nicht besonders klar geworden, wie klein nun die Umgebung zu wählen ist, in der eine quadratische Ungleichung gilt. Versuche eine genauere Beschreibung einer solchen Umgebung zu geben. Definition 18. Sei I ein (geschlossenes oder offenes) Intervall. Eine Funktion ϕ : I → R ist konvex (bzw. konkav) auf I, wenn für alle a, b ∈ I mit a < b und alle λ, µ ∈ [0, 1] mit λ + µ = 1 f (λa + µb) ≤ λf (a) + µf (b) bzw. ≥ λf (a) + µf (b) ist. ϕ ist strikt konvex bzw. strikt konkav, wenn die Ungleichung für λµ 6= 0 strikt ist. Korollar 7. Sei ϕ : I → R zweimal stetig differenzierbar. Dann ist ϕ strikt konvex auf I, wenn ϕ00 auf I positiv ist, und strikt konkav, wenn ϕ00 auf I negativ ist. 21 Beweis. Seien a, b ∈ I fix, a < b. Wir betrachten die Funktion f (t) : [0, 1] → R, welche durch f (t) = ϕ((1 − t)a + tb) − (1 − t)ϕ(a) − tϕ(b) definiert ist. Dann ist f (0) = f (1) = 0. Wenn f nun an einer Stelle von (0, 1) nichtnegativ ist, so muss es in (a, b) eine Stelle eines lokalen Maximums geben. Es ist f 0 (t) = ϕ0 ((1 − t)a + tb)(b − a) − ϕ(a) − ϕ(b), und f 00 (t) = ϕ00 ((1 − t)a + tb)(b − a)2 > 0. Also kann f nach Korollar 5 nur lokale Minima haben, und f ist auf (0, 1) positiv. Der Fall einer konkaven Funktion wird ganz analog behandelt. Wenn eine Funktion ϕ : [a, b] → R strikt konvex (konkav) ist, so gibt es genau einen Punkt x ∈ [a, b], wo ϕ ein lokales (und in diesem Fall auch globales) Minimum (Maximum) hat; das hat zwar mit Taylor’s Formel nicht viel zu tun, ist aber ein wichtiges Kriterium, weswegen wir es an dieser Stelle notieren: Lemma 19. Sei die Funktion ϕ : [a, b] → R strikt konvex und stetig. Dann gibt es genau einen Punkt x ∈ [a, b] wo ϕ sein Minimum auf [a, b] annimmt. Beweis. Die Existenz des Minimums wird wegen der Stetigkeit von ϕ garantiert. Angenommen, x0 6= x1 sind zwei Punkte wo ϕ(x0 ) = ϕ(x1 ) = minx∈[a,b] ϕ(x). Dann ist für λ, µ ∈ [0, 1] mit λ + µ = 1 wegen der strikten Konvexität von ϕ ϕ(λx0 + µx1 ) < λϕ(x0 ) + µϕ(x1 ) = min ϕ(x), x∈[a,b] was einen Widerspruch darstellt. Bemerkung 8. Wir bemerken, dass die Eindeutigkeitsaussage auch erhalten bleibt, wenn man die Existenz eines Minimums vorraussetzt (ohne dabei Stetigkeit zu verlangen). 22 KAPITEL 3 Das Riemannintegral 1. Die Definition des Riemannintegrals Sei [a, b] ein kompaktes Intervall. Eine Unterteilung U von [a, b] ist ein geordnetes n+1-tupel von Punkten U = (x0 , x1 , . . . , xn ), wo a = x0 < x1 < · · · < xn−1 < xn = a, ein Vektor von Zwischenpunkten ξ für U ist ein geordnetes n-tupel xj ≤ ξj+1 ≤ xj+1 . ξ = (ξ1 , . . . , ξn ), Wird definieren δ(U ) = minj xj −xj−1 als die Feinheit von U . Die Riemansumme einer Funktion f : [a, b] → R (bezüglich U und ξ) ist definiert durch R(f, U, ξ) = n X f (ξj )(xj − xj−1 ). j=1 Definition 19. Die beschränkte Funktion f : [a, b] → R ist integrierbar (im Sinn von Riemann) wenn für jede Folge von Unterteilungen U j und jede Folge von Zwischenpunkten ξ j für U j mit δ(U j ) → 0 (j → ∞) die Folge der Riemannsummen R(f, U j , ξ j ) konvergiert. Der (gemeinsame) Grenzwert dieser Folgen wird dann als das Riemannintegral von f über [a, b] bezeichnet und als Z b j j lim R(f, U , ξ ) = f (x) dx j→∞ a geschrieben; die Menge der im Sinne von Riemann integrierbaren Funktionen wird mit R([a, b]) bezeichnet. Die Definition des Riemannintegrals mit Hilfe von Folgenlimiten hat den Vorteil, dass wir einfache Eigenschaften desselben mit Hilfe der Sätze über das Verhalten von Folgenlimiten nachweisen können; sie hat den Nachteil, dass wir noch nicht viele Beispiele von Riemann-integrierbaren Funktionen angeben können. Zunächst wollen wir die Abgeschlossenheit unter einfachen algebraischen Operationen sowie das Monotonieverhalten des Integrals besprechen. Lemma 20. Seien f, g ∈ R([a, b]). Dann ist für jedes λ ∈ R auch f + λg ∈ R([a, b]), und es gilt Z b Z b Z b (f (x) + λg(x)) dx = f (x) dx + λ g(x) dx. a a a Ist für jedes x ∈ [a, b] die Ungleichung f (x) ≤ g(x) erfüllt, so gilt Z b Z b f (x) dx ≤ g(x) dx. a a Ist a ≤ c ≤ b und f ∈ R([a, b]), so sind die Einschränkungen von f auf [a, c] und auf [c, b] über die jeweiligen Intervalle Riemann-integrierbar, und es gilt Z b Z c Z b f (x) dx. f (x) dx = f (x) dx + a c a Übungsaufgabe 40. Beweise Lemma 20. Übungsaufgabe 41. Zeige, dass jede Riemann-integrierbare Funktion f beschränkt ist. 23 Es ist bequem, für a < b Z a Z f (x) dx = − b f (x) dx a b zu definieren. In Wirklichkeit kommt es beim Riemannintegral nur auf die Feinheit der betreffenden Unterteilungen an, wie die nächsten Lemmata zeigen. Zunächst zeigen wir eine Art Cauchykriterium für die RiemannIntegrierbarkeit. Lemma 21. Sei f beschränkt auf [a, b]. Dann ist f Riemann-integrierbar auf [a, b] genau dann, wenn für jedes ε > 0 ein δ > 0 existiert, sodass für beliebige Unterteilungen U 1 , U 2 mit δ(U 1 ) < δ, δ(U 2 ) < δ und beliebige Vektoren von Zwischenpunkten ξ für U 1 und η für U 2 die Ungleichung |R(f, U 1 , ξ) − R(f, U 2 , η)| < ε erfüllt ist. Beweis. Ist die Bedingung des Lemmas erfüllt, so ist für jede Folge von Zerlegungen U k und Vektoren von Zwischenpunkten ξ k für U k die Folge R(f, U k , ξ k ) eine Cauchyfolge, also konvergent, und damit f Riemann integrierbar. Wenn die Bedingung des Lemmas nicht erfüllt ist, so gibt es ein ε0 > 0 sodass für jedes k in N eine Unterteilung U k und ein Vektor von Zwischenpunkten ξ k sowie eine Unterteilung V k und ein Vektor von Zwischenpunkten η k existiert, welche 1 1 , δ(V k ) ≤ , |R(f, U k , ξ k ) − R(f, V k , η k )| ≥ ε0 k k erfüllen. Die Mischung dieser Zerlegungsfolgen und Zwischenpunkten, d.h. die Folge Wk von Zerlegungen welche durch W2k = Uk und W2k+1 = Vk und die Folge von Zwischenpunkten ζk welche durch ζ2k = ξk und ζ2k+1 = ηk gegeben ist erfüllt dann δ(Wk ) → 0, ist aber offensichtlich keine Cauchyfolge, konvergiert alo nicht; damit ist f also nicht Riemann-integrierbar. δ(U k ) ≤ Lemma 22. Sei f beschränkt auf [a, b]. Dann ist f Riemann-integrierbar auf [a, b] genau dann, wenn es ein I ∈ R gibt, sodass für jedes ε > 0 ein δ > 0 existiert, welches die Eigenschaft hat, dass für jede Unterteilung U mit δ(U ) < δ und jeden Vektor von Zwischenpunkten ξ für U die Ungleichung |R(f, U, ξ) − I| < ε erfüllt ist. In diesem Fall ist Z I= b f (x) dx. a Beweis. Wenn die Bedingung des Lemmas erfüllt ist, ist es einfach zu zeigen, dass f Riemann-integrierbar Rb ist. Ist auf der anderen Seite f Riemann integrierbar, so sei I = a f (x) dx, und ε > 0 beliebig. Wir wählen δ mit Hilfe von Lemma 21. Sei nun U k eine Folge von Unterteilungen und ξ k eine Folge von Zwischenvektoren mit δ(Uk ) → 0 für k → ∞, dann konvergiert nach Vorraussetzung R(f, U k , ξ k ) → I für k → ∞. Wir wählen ein N sodass |R(f, U N , ξ N ) − I| < ε und δ(U N ) < δ. Dann ist für jede andere Zerlegung U und jeden Vektor von Zwischenpunkten ξ mit δ(U ) < δ |R(f, U, ξ) − I| ≤ R(f, U, ξ) − R(f, U N , ξ N ) + R(f, U N , ξ N ) − I < 2ε. Wir haben noch immer keine Beispiele Riemann-integrierbarer Funktionen; dies wollen wir nun beheben. Wir erinnern zunächst daran, dass die charakteristische Funktion einer Menge E ⊂ R durch ( 0 x∈ /E χE (x) = 1 x∈E definiert ist. 24 Definition 20. Wir sagen, eine Funktion t ist eine Treppenfunktion, wenn t eine Linearkombination endlich vieler charakteristischer Funktionen von nach rechts halboffenen Intervallen ist; d.h. wenn es endlich viele λj ∈ R und aj < bj ∈ R, j = 1, . . . , N , gibt sodass t(x) = N X λj χ[aj ,bj ) j=1 ist. Der Raum aller Treppenfunktionen bildet einen Vektorraum über R, den wir mit T (R) bezeichnen. Die Einschränkungen von Funktionen in T (R) auf ein Intervall [a, b] (oder eine beliebige Teilmenge E von R) wird mit T ([a, b]) (bzw. T (E)) bezeichnet. Lemma 23. Jedes t ∈ T ([a, b]) ist Riemann-integrierbar. Wenn t(x) = N X λj χ[aj ,bj ) j=1 mit a ≤ aj < bj ≤ b für alle j = 1, . . . , N ist, so ist Z b N X t(x) dx = λj (bj − aj ). a j=1 Beweis. Es genügt nach den Linearitätsaussagen von Lemma 20, den Fall N = 1 zu betrachten, also t(x) = λχ[a1 ,b1 ) . Sei U eine Unterteilung von [a, b] und ξ ein Zwischenvektor für U , dann ist n−1 X |R(t, U, ξ) − λ(a1 − b1 )| = χ[a1 ,b1 ) (ξj )(xj+1 − xj ) − λ(a1 − b1 ) j=1 X = λ(xj − xj−1 ) − λ(a1 − b1 ) a≤ξj <b ≤ 2δ(U ). Nach Lemma 22 ist also t(x) Riemann-integrierbar, mit dem gewünschten Integral. 1.1. Das Darboux-Integral. Ein anderer Zugang zum Integralbegriff ist mit Hilfe von Ober- und Untersummen; hier wird nicht notwendigerweise mit Funktionswerten gewichtet: Definition 21. Sei U eine Zerlegung von [a, b], und f eine beschränkte Funktion auf [a, b]. Dann sind ! n n X X R+ (f, U ) = sup f (ξ) (xj − xj−1 ), R− (f, U ) = inf f (ξ) (xj − xj−1 ) j=1 ξ∈[xj−1 ,xj ] j=1 ξ∈[xj−1 ,xj ] die Riemannsche Ober- und Untersumme von f auf [a, b]. Wir bezeichnen mit D+ (f ) = inf R+ (f, U ), D− (f ) = inf R− (f, U ) U U das obere und untere Darbouxintegral von f . Lemma 24. Sei f beschränkt auf [a, b]. Dann gilt D− (f ) ≤ D+ (f ), und D− (f ) = D+ (f ) genau dann, wenn für jedes ε > 0 eine Unterteilung U existiert mit R+ (f, U ) − R− (f, U ) < ε. Beweis. Für jede Unterteilung U gilt offensichtlich R− (f, U ) ≤ R+ (f, U ). Seien nun U 1 und U 2 beliebige Unterteilungen. Wir sagen, eine Unterteilung Ũ ist eine Verfeinerung von U , wenn sie alle Unterteilungspunkte von U enthält. Es ist R− (f, U ) ≤ R− (f, Ũ ), R+ (f, Ũ ) ≤ R+ (f, U ) für jede solche Verfeinerung Ũ . Wir wählen Ũ als gemeinsame Verfeinerung von U 1 und U 2 und erhalten so R− (f, U 1 ) ≤ R− (f, Ũ ) ≤ R+ (f, Ũ ) ≤ R+ (f, U 2 ). 25 Nachdem U 1 und U 2 beliebig waren, können wir links zum Supremum und rechts zum Infimum übergehen und erhalten D− (f ) ≤ D+ (f ). Ist D− (f ) = D+ (f ) = I, so gibt es für jedes ε > 0 eine Unterteilung U 1 mit I − R− (f, U 1 ) < ε und eine Unterteilung U 2 welche R+ (f, U ) − I < ε erfüllt. Damit ist für jede gemeinsame Verfeinerung Ũ von U 1 und U2 R+ (f, Ũ ) − R− (f, Ũ ) ≤ R+ (f, U 1 ) − R− (f, U 2 ) < 2ε. Die andere Richtung ist trivial. Unser nächstes Lemma erlaubt es uns, eine Verbindung zwischen Darboux- und Riemannintegralen herzustellen. Lemma 25. Sei f beschränkt auf [a, b] und U eine Unterteilung von [a, b] mit R+ (f, U ) − R− (f, U ) < ε. Dann gibt es ein δ > 0 sodass für jede Unterteilung V von [a, b] mit δ(V ) < δ, dann gilt |R(f, V, ξ) − R− (f, U )| < 2ε und |R(f, V, ξ) − R+ (f, U )| < 2ε. Beweis. Sei U = (x0 , x1 , . . . , xn ) und V = (y0 , y1 , . . . , ym ) Unterteilungen wie im Lemma. Wir zerlegen X X R(f, V, ξ) − R− (f, U ) = f (ξj )(yj+1 − yj ) − inf f (η)(xk+1 − xk ) j = n−1 X k X k=0 xk ≤η≤xk+1 f (ξj )(yj+1 − yj ) − ξj ∈[xk ,xk+1 ) inf xk ≤η≤xk+1 f (η)(xk+1 − xk ) , wobei wir im Summanden für k = n − 1 statt [xn−1 , xn ) das abgeschlossene Intervall [xn−1 , xn ] verwenden wollen. Nach Anwendung der Dreiecksungleichung sehen wir also, dass wir X f (ξ )(y − y ) − inf f (η)(x − x ) j j+1 j k+1 k xk ≤η≤xk+1 ξj ∈[xk ,xk+1 ) abschätzen müssen. Wir bezeichnen mit yJ das kleinste yj 6= xk , welches in der ersten Summe vorkommt, und mit yK 6= xk+1 das grösste; es ist dann notwendigerweise |yJ − xk | ≤ δ(V ) und |yK − xk+1 | ≤ δ(V ). Wir können also mit M > supx∈[a,b] |f (x)| wie folgt abschätzen: K X f (ξ )(y − y ) − inf f (η)(x − x ) j j+1 j k+1 k j=J K−1 X ≤ 2M δ(V ) + f (ξJ )(yJ+1 − xk ) + f (ξK )(xk+1 − yK ) + f (ξj )(yj+1 − yj ) − inf f (η)(xk+1 − xk ) j=J+1 ≤ 2M δ(V ) + (sup f (η) − inf f (η))(xk+1 − xk ). Summieren wir diese Abschätzung nun über k, so erhalten wir |R(f, V, ξ) − R− (f, U )| ≤ 2nM δ(V ) + R+ (f, U ) − R− (f, U ). Damit gilt die Aussage des Lemmas für die Untersumme, wenn wir δ > 0 so klein wählen, dass δ2nM < ε. Die Aussage des Lemmas für die Obersumme wird ganz analog bewiesen. Der Zusammenhang zwischen den Darbouxintegralen und der Riemann-Integrierbarkeit wird im folgenden Satz zusammengefasst. Satz 8. Sei f beschränkt auf [a, b]. Dann ist f integrierbar im Sinne von Riemann genau dann, wenn D+ (f ) = D− (f ), und in diesem Fall ist Z b D+ (f ) = D− (f ) = f (x) dx. a 26 Beweis. Sei zunächst D+ (f ) = D− (f ), und ε > 0 beliebig. Nach Lemma 24 gibt es eine Unterteilung U mit R+ (f, U ) − R− (f, U ) < ε. Wir wählen nun δ > 0 wie in Lemma 25 und erhalten für beliebige Unterteilungen V, W mit δ(V ) < δ und δ(W ) < δ und Zwischenvektoren ξ zu V sowie η zu W , dass |R(f, V, ξ) − R(f, W, η)| ≤ |R(f, V, ξ) − R+ (f, U )| + R+ (f, U ) − R− (f, U ) + |R− (f, U ) − R(f, W, η)| < 5ε. Nach Lemma 21 ist f also Riemann-integrierbar. Sei nun ε > 0 wiederum beliebig, und δ > 0 so wie oben gewählt, aber auch mit der Eigenschaft, dass für jede Unterteilung mit δ(V ) < δ Z b f (x) dx < ε R(f, V, ξ) − a gilt. Dann ist Z b Z b f (x) dx < 4ε. f (x) dx ≤ |D+ (f ) − R− (f, U )| + |R− (f, U ) − R(f, V, ξ)| + R(f, V, ξ) − D+ (f ) − a a Nachdem ε > 0 beliebig war, gilt also Gleichheit. Die Gegenrichtung ist eine einfache Folgerung aus der Charakterisierung in Lemma 24 und der Cauchyfolgencharakterisierung der Riemann-Integrierbarkeit in Lemma 21. Zusammensetzungen von Funktionen werden im folgenden Lemma behandelt. Lemma 26. Sei f ∈ R([a, b]), und g eine Funktion, für die g ◦ f definiert ist. Wenn es eine Konstante C > 0 gibt, sodass |g(f (x)) − g(f (y))| ≤ C|f (x) − f (y)| ist, so ist auch g ◦ f ∈ R([a, b]). Beweis. Wenn |g(f (x)) − g(f (y))| ≤ C|f (x) − f (y)| ist, so gilt für beliebige Mengen E, dass sup g ◦ f (x) − inf g ◦ f (y) ≤ C sup f (x) − inf f (y) . y∈E x∈E x∈E y∈E Damit ist also für jede Unterteilung U auch R+ (g ◦ f, U ) − R− (g ◦ f, U ) ≤ C(R+ (f, U ) − R− (f, U )), und eine Anwendung der Charakterisierung in Theorem 8 gemeinsam mit Lemma 24 ergibt die Behauptung. 2. Konvergenzsatz und Folgerungen Sei fn eine Folge von Funktionen auf [a, b]. Wir erinnern daran, dass fn gleichmässig auf [a, b] gegen f konvergiert, wenn es für jedes ε > 0 ein N ∈ N gibt, sodass |fn (x) − f (x)| < ε für alle n ≥ N ist. Das Riemann-Integral ist “stabil” unter gleichmässiger Konvergenz: Satz 9. Sei fn eine Folge Riemann-integrierbarer Funktionen auf [a, b], welche gleichmässig gegen f konvergiert. Dann ist auch f Riemann-integrierbar, und es gilt Z b Z b f (x) dx = lim fn (x) dx. a n→∞ a Wenn man die Aussage von Theorem 9 als Z b Z lim fn (x) dx = lim a n→∞ n→∞ b fn (x) dx a schreibt, und sich in Erinnerung ruft, dass das Riemann-Integral als ein Grenzwert definiert ist, so wird klar, dass Theorem 9 eine Aussage über das Vertauschen von Grenzwertprozessen ist. Diese Vertauschbarkeit ist niemals selbstverständlich, und bedarf in jedem Fall eines Beweises. 27 Beweis. Um zu zeigen, dass f Riemann-integrierbar ist, bedienen wir uns zunächst Lemma 21. Sei also ε > 0. Wir wählen ein N ∈ N mit |fn (x) − f (x)| < ε für n ≥ N . Da fN Riemann-integrierbar ist, gibt es ein δ > 0 sodass |R(fN , U 1 , ξ 1 ) − R(fN , U 2 , ξ 2 )| < ε, wenn U 1 und U 2 Unterteilungen von [a, b] mit δ(U j ) < δ sind. Dann ist |R(f, U 1 , ξ 1 ) − R(f, U 2 , ξ 2 )| ≤ |R(f, U 1 , ξ 1 ) − R(fN , U 1 , ξ 1 )| + |R(fN , U 1 , ξ 1 ) − R(fN , U 2 , ξ 2 )| + |R(fN , U 2 , ξ 2 ) − R(f, U 2 , ξ 2 )| ≤ (b − a)ε + ε + (b − a)ε, und damit also f Riemann-integrierbar. Um die Aussage über den Wert des Integrals zu beweisen, sei wieder ε > 0, und N ∈ N so gewählt, dass |fn (x) − f (x)| < ε für n ≥ N . Wir wählen für jedes n eine Unterteilung U n mit Zwischenvektor ξ n für welche Z b Z b n n n n f dx < ε fn dx < ε und R(f, U , ξ ) − R(fn , U , ξ ) − a a ist. Dann gilt Z Z Z b b b n n fn (x) dx − f (x) dx ≤ fn dx − R(fn , U , ξ ) + |R(fn , U n , ξ n ) − R(f, U n , ξ n )| a a a Z b + R(f, U n , ξ n ) − f dx a ≤ ε + (b − a)ε + ε = (2 + (b − a))ε also gilt auch die Aussage über die Vertauschung der Grenzwerte. Korollar 8. Sei f eine stetige Funktion auf [a, b]. Dann ist f über [a, b] Riemann-integrierbar. Beweis. Da f stetig auf [a, b] ist, ist f nach Theorem 3 auch gleichmässig stetig. Für jedes n ∈ N gibt es also ein k = k(n) ∈ N sodass |f (x) − f (y)| < Wir definieren die Treppenfunktion j tn (x) = f a + (b − a) , n 1 1 , wenn |x − y| < . n k j (b − a) (b − a) ≤ x − a < (j + 1) . n n Dann ist |tn (x) − f (x)| < 1/n, also konvergiert tn gleichmässig auf [a, b] gegen f . Da tn nach Lemma 23 Riemann-integrierbar ist, folgt aus Theorem 9, dass auch f Riemann-integrierbar ist. Korollar 9. Sei f : [a, b] × [c, d] → R stetig. Dann ist die Funktion Z b g : [c, d] → R, y 7→ f (x, y) dx a stetig auf [c, d]. Beweis. Sei y0 ∈ [c, d] beliebig. Dann konvergiert für jede Folge yn mit yn → y0 für n → ∞ die Folge von Funktionen fn (x) = f (x, yn ) gleichmässig gegen f0 (x) = f (x, y0 ). Also ist nach Theorem 9 Z b Z b lim g(yn ) = lim fn (x) dx = f0 (x) dx = g(y0 ) n→∞ n→∞ a a und damit g im Punkt y0 stetig. 28 Korollar 10. Sei f : [a, b] × [c, d] → R, und für jedes fixe x ∈ [a, b] sei die Funktion y 7→ f (x, y) differenzierbar auf [a, b]. Die Ableitung fy (x, y), die dann wiederum auf [a, b] × [c, d] definiert ist, sei auch stetig. Dann ist die Funktion Z b g : [c, d] → R, y 7→ f (x, y) dx a differenzierbar auf [c, d], und es gilt g 0 (y) = Z b fy (x, y) dx. a Beweis. Sei y ∈ [c, d] fix, und hj eine beliebige Folge mit hj → 0 für j → ∞ und y + hj ∈ [c, d] für alle j. Dann ist die Folge der Differenzenquotienten für g, Z b Z b f (x, y + hn ) − f (x, y) g(y + hn ) − g(y) fn (x, y) dx = dx = hn (y) = hn hn a a durch Funktionen fn gegeben, die auf [a, b] gleichmässig gegen fy (x, y) konvergieren; dies wollen wir nun nachweisen. Nach dem Mittelwertsatz der Differentialrechnung können wir fn (x, y) = fy (x, ξn ) mit einem ξn welches |y − ξn | ≤ |hn | erfüllt. Nun ist fy nach Vorraussetzung stetig auf dem kompakten Intervall, also gleichmässig stetig; zu gegebenem ε > 0 können wir demnach ein δ > 0 wählen sodass |fy (x, y) − fy (x0 , y 0 )| < ε wenn |x − x0 | < δ und |y − y 0 | < δ. Ist nun N ∈ N so gross gewählt, dass |hn | < δ für n ≥ N , so ist also |fy (x, y) − fn (x, y)| = |fy (x, y) − fy (x, ξn )| < ε. Satz 10. Sei f stetig auf [a, b]. Dann gibt es ein ξ ∈ [a, b] mit Z b 1 f (ξ) = f (x) dx. b−a a Beweis. Da [a, b] kompakt ist, gibt es x0 , x1 ∈ [a, b] mit f (x0 ) ≤ f (x) ≤ f (x1 ) für x ∈ [a, b]. Dann ist Z b (b − a)f (x0 ) ≤ f (x) dx ≤ (b − a)f (x1 ), a und da f stetig ist, gibt es ein ξ mit Z (b − a)f (ξ) = b f (x) dx. a 3. Das Lebesgue-Kriterium Die Charakterisierung der Riemann-Integrierbarkeit in Theorem 8 sagt aus, dass die Punkte an denen f nicht stetig ist, d.h. jene Punkte x0 für welche ein ε0 > 0 existiert sodass für jede Umgebung U die Ungleichung supx∈U f (x) − inf x∈U f (x) > ε0 erfüllt ist, nicht “allzu viele” sein können. Diese Beobachtung wird im Kriterium von Lebesgue explizit gemacht. Zunächst benötigen wir den Begriff der Oszillation einer Funktion. Definition 22. Sei f : R ⊃ X → R eine Funktion, und E ⊂ X eine Menge. Dann bezeichnen wir mit ω(f, E) = supx∈E f (x) − inf y∈E f (y) = supx,y∈E |f (x) − f (y)| die Oszillation von f auf E. Für einen Punkt x ∈ X ist ω(f, x) = inf ω(f, X ∩ U ), x∈U wo das Infimum über Umgebungen U von x geht, die Oszillation von f im Punkt x. Lemma 27. f : R ⊃ X → R ist stetig im Punkt x ∈ X genau dann, wenn ω(f, x) = 0. Übungsaufgabe 42. Beweise Lemma 27. 29 Die Definition von “nicht allzu viele” ist etwas umständlicher. Eine Teilmenge N ⊂ R ist eine Nullmenge, wenn es für jedes ε > 0 eine abzählbare Familie Ik = (ak , bk ), k ∈ N, von offenen Intervallen mit X [ (bk − ak ) < ε und N ⊂ Ik k∈N k∈N gibt. Übungsaufgabe 43. Zeige, dass abzählbare Mengen Nullmengen sind. Definition 23. Wir sagen, eine Eigenschaft P (x) ist fast überall erfüllt, wenn die Menge der Punkte, wo sie nicht erfüllt ist, eine Nullmenge ist. Satz 11. Sei f : [a, b] → R. Dann ist f integrierbar im Sinn von Riemann genau dann, wenn f beschränkt auf [a, b] und fast überall stetig ist. Bevor wir uns dem Beweis von Theorem 11 widmen können, benötigen wir einige Vorbereitungen. Lemma 28. Sei Nk , k ∈ N, eine abzählbare Familie von Nullmengen. Dann ist N = ∪k∈N Nk eine Nullmenge. Beweis. Sei ε > 0 beliebig. Für jedes k gibt es dann eine abzählbare Familie von Intervallen Ijk = (akj , bkj ) mit [ X ε Ijk ⊃ Nk , (bkj − akj ) ≤ k . 2 j∈N Dann ist Ijk , j∈N j, k ∈ N, wieder eine abzählbare Familie von Intervallen, welche [ [ X X ε Ijk ⊃ Nk = N, (bkj − akj ) ≤ =ε 2k j,k∈N k∈N j,k∈N k∈N erfüllt. Lemma 29. Sei f : R ⊃ X → R eine Funktion, und ε > 0. Dann ist die Menge {x ∈ X : ω(f, x) ≥ ε} abgeschlossen. Beweis. Wenn y im Abschluss von E = {x ∈ X : ω(f, x) ≥ ε} liegt, so gibt es für jede Umgebung U von y einen Punkt x ∈ U ∩ E. Damit ist ω(f, y) = inf ω(f, V ∩ X) ≥ ω(f, U ∩ X) ≥ inf ω(f, W ∩ X) = ω(f, x) ≥ ε, y∈V x∈W also y ∈ E, und E erweist sich als abgeschlossen. Beweis von Theorem 11. Sei zunächst f Riemann-integrierbar. Dann ist f beschränkt nach Übungsaufgabe 41. Wenn wir mit S die Menge der Unstetigkeitsstellen von f bezeichnen, so ist nach Lemma 27 [ 1 S= x ∈ [a, b] : ω(f, x) ≥ , k k∈N und nach Lemma 28 genügt es zu zeigen, dass jede der Mengen Sα = {x ∈ [a, b] : ω(f, x) ≥ α} eine Nullmenge ist. Sei also ε > 0 beliebig. Dann existiert eine Unterteilung U = (x0 , . . . , xn ) von [a, b] sodass R+ (f, U ) − R− (f, U ) < ε. Seien Jk jene Intervalle Jk = [xjk , xjk +1 ] für welche Jk ∩ Sα 6= ∅. Dann ist X X α (xjk +1 − xjk ) ≤ ω(f, [xjk +1 − xjk ])(xjk +1 − xjk ) ≤ R+ (f, U ) − R− (f, U ) < ε. k Wir definieren Dann gilt k Ik = xjk − , xjk +1 + = (ak , bk ). 2n 2n [ X 1 Sα ⊂ Ik , und (bk − ak ) ≤ ε 1 + , α k k 30 und nachdem ε > 0 beliebig war, erweist sich Sα als Nullmenge. Sei nun andererseits S (wie oben definiert) eine Nullmenge, und ε > 0 beliebig. Dann ist Sε eine Nullmenge, welche überdies eine abgeschlossene Teilmenge von [a, b] und damit kompakt ist. Überdecken wir also Sε mit Intervallen Ik = (ak , bk ), so genügen schon endlich viele dieser Intervalle, von denen wir überdies annehmen können, dass sie sich nicht überschneiden; nachdem Sε eine Nullmende ist, können wir demenstprechend eine solche endliche Überdeckung mit X (bk − ak ) < ε k wählen. Das Komplement K von ∪Ik ist eine abgeschlossene Teilmenge von [a, b], also kompakt. Nachdem jeder Punkt x ∈ K eine Umgebung besitzt, für welche die Oszillation von f auf dieser Umgebung kleiner als ε ist, können wir eine Unterteilung U = (x0 , . . . , xn ) von [a, b] finden, welche die ak und bk an aneinanderfolgenden Stellen enthält und wo für jedes xj welches kein ak ist ω(f, [xj , xj+1 ]) < ε gilt. Damit ist n−1 X R+ (f, U ) − R− (f, U ) = ω(f, [xj , xj+1 ])(xj+1 − xj ) ≤ ε2 sup |f (x)| + (b − a)ε. x∈[a,b] j=0 Nachdem ε > 0 beliebig war, folgt die Riemann-Integrierbarkeit von f nun aus Theorem 8. 4. Hauptsätze und Folgerungen Satz 12. Sei f stetig auf [a, b]. Dann ist die Funktion Z F : [a, b] → R, F (x) = x f (t) dt a auf [a, b] differenzierbar, mit F 0 = f . Beweis. Sei x ∈ [a, b] fix. Für jedes h gibt es nach Theorem 10 ein ξh mit |x − ξh | < h sodass Z 1 x+h f (t) dt f (ξh ) = h x gilt. Somit ist F (x + h) − F (x) = lim f (ξh ) = f (x). lim h→0 h→0 h Satz 13. Sei F : [a, b] → R stetig, und differenzierbar auf (a, b), mit F 0 = f . Wenn f Riemannintegrierbar ist, so gilt Z b f (x) dx = F (b) − F (a). a Beweis. Wir wählen die Unterteilungen U n = (x0 , x1 , . . . , xn ) von [a, b] welche durch xj = a + j(b−a) n gegeben ist. Nach dem Mittelwertsatz der Differentialrechnung gibt es ξjn mit xj ≤ ξjn ≤ xj+1 welche F (xj+1 ) − F (xj ) = f (ξj )(xj+1 − xj ) erfüllen. Es folgt Z b f (x) dx = lim R(f, U n , ξ n ) a n→∞ = lim n→∞ = lim n→∞ n−1 X f (ξjn )(xj+1 − xj ) j=0 n−1 X (F (xj+1 ) − F (xj )) j=0 = F (b) − F (a). 31 Die Hauptsätze zeigen uns, in welchem Sinn die Integration und die Differentiation inverse Operationen sind: Will man eine stetige Funktion f integrieren (oder, gleichwertig, die Fläche unter dem Graphen einer stetigen Funktion bestimmen), so verwendet man eine Stammfunktion F , d.h. eine Funktion F mit der Eigenschaft, dass ihre Ableitung F 0 mit der gegebenen Funktion f übereinstimmt. Stammfunktionen sind immer nur bis auf Konstanten bestimmt; man bezeichnet eine Stammfunktion F auch gerne als unbestimmtes Integral von f und schreibt Z F (x) = f (x) dx; wie schon gesagt, ist diese Schreibweise nicht exakt, da mit F (x) auch F (x) + C für jedes C ∈ R auf der linken Seite dieser Gleichung stehen kann. Weiters gibt uns Theorem 12 eine “grosse” Klasse von Funktionen (d.h. stetige), welche Stammfunktion besitzen. Die Rechenregeln der Differentialrechnung haben ihre Entsprechung in Regeln für die unbestimmte Integration: Lemma 30. Wenn f, g Stammfunktionen besitzen, und λ ∈ R beliebig ist, dann besitzt auch die Funktion λf + g eine Stammfunktion, welche durch Z Z Z λf (x) + g(x) dx = λ f (x) dx + g(x) dx gegeben ist. Wenn f eine Stammfunktion F besitzt, und F g 0 eine Stammfunktion besitzt, so besitzt auch f g eine Stammfunktion, welche durch Z Z f (x)g(x) dx = F (x)g(x) − F (x)g 0 (x) dx gegeben ist (partielle Integration). Besitzt f (y) eine Stammfunktion F (y), und ist ϕ(x) differenzierbar, so besitzt auch f 0 (ϕ(x))ϕ0 (x) eine Stammfunktion, welche durch Z f 0 (ϕ(x))ϕ0 (x) dx = F (ϕ(x)) gegeben ist (Substitutionsregel). Mit Hilfe der Regeln in Lemma 30 kann man viele “elementare” Funktionen integrieren. Da wir an dieser Stelle noch nicht auf die noch einzuführenden elementaren transzendenten Funktionen vorgreifen wollen, wird eine genauere Behandlung von Techniken der Integration erst später erfolgen. Wir bemerken hier, dass Lemma 30 mit Absicht etwas “unscharf” formuliert ist; sein Inhalt ist auch keine analytische Aussage über das Integral, sondern formale Rechenregeln, welche aus den algebraischen Regeln für die Ableitung folgen. Es macht deswegen keinen Sinn, sich im Rahmen dieses Lemmas die Fragen wo und wie sehr die entsprechenden Funktionen differenzierbar sind zu stellen. Übungsaufgabe 44. Beweise die Aussagen von Lemma 30. Anders ist dies, wenn wir die entsprechenden Aussagen für bestimmte (d.h. Riemann) Integrale beweisen wollen. Die Summenformel haben wir schon bewiesen; wie sieht es mit den entsprechenden Aussagen für die partielle Integration und die Substitutionsregel aus? Lemma 31. Seien F und g auf [a, b] stetig differenzierbar, mit F 0 = f . Dann gilt Z b Z f (x)g(x) dx = F (b)g(b) − F (a)g(a) − a b F (x)g 0 (x) dx. a Beweis. Da F (x)g(x) stetig differenzierbar ist, gibt es nach dem Mittelwertsatz für beliebige x, y ∈ [a, b] ein ξ(x, y) mit x < ξ < y sodass F (y)g(y) − F (x)g(x) = (f (ξ)g(ξ) + F (ξ)g 0 (ξ))(y − x). Für eine beliebige 32 Unterteilung U = (x0 , . . . , xn ) können wir demnach mit ξj = ξ(xj−1 , xj ) F (b)g(b) − F (a)g(a) = = n X j=1 n X F (xj )g(xj ) − F (xj−1 )g(xj−1 ) (f (ξj )g(ξj ) + F (ξj )g 0 (ξj ))(xj − xj−1 ) j=1 = R(f g + F g 0 , U, ξ) schreiben. Da die beteiligten Funktionen alle stetig, also Riemann-integrierbar sind, folgt die Behauptung wenn wir δ(U ) → 0 streben lassen. Lemma 32. Sei ϕ : [a, b] → [ϕ(a), ϕ(b)] = [c, d] eine strikt monoton wachsende (bzw. monoton fallende) stetig differenzierbare Funktion. Dann gilt Z b Z d f (ϕ(x))ϕ0 (x) dx f (y) dy = a c für jede Riemann-integrierbare Funktion f auf [c, d]. Beweis. Nach Theorem 11 ist f (ϕ(x))ϕ0 (x) Riemann-integrierbar. Sei nun V = (y0 , . . . , yn ) eine Unterteilung von [c, d], und yj = ϕ(xj ). Dann ist ϕ−1 (V ) = (x0 , . . . , xn ) eine Unterteilung von [a, b]; wir wählen für jedes j ein ξj mit xj−1 ≤ ξj ≤ xj mit ϕ(xj+1 ) − ϕ(xj ) = ϕ0 (ξj ), und schreiben ϕ(ξ) = (ϕ(ξ1 ), . . . ϕ(ξn )) für diesen Zwischenvektor gilt R(f, U, ϕ(ξ)) = R((f ◦ ϕ)ϕ0 , ϕ−1 (U ), ξ); wegen der gleichmässigen Stetigkeit von ϕ auf [a, b] gilt δ(ϕ(U )) → 0 wenn δ(U ) → 0, und der Übergang zum Grenzwert liefert die Behauptung. Eine weitere wichtige Folgerung aus den Hauptsätzen ist folgende wichtige Eigenschaft von differenzierbaren Funktionen an Nullstellen. Korollar 11. Sei f : [−ε, ε] → R stetig differenzierbar, mit f (0) = 0. Dann gibt es eine stetige Funktion g : [−ε, ε] → R sodass f (x) = xg(x). Beweis. Wir betrachten die Funktion ϕ(t) = f (tx). Dann ist f (x) = ϕ(1), ϕ(0) = 0, und Z 1 Z 1 0 f (x) = f (x) − f (0) = ϕ(1) − ϕ(0) = ϕ (t) dt = x f 0 (tx) dt. 0 Die Funktion 0 1 Z f 0 (tx) dt g(x) = 0 ist stetig nach Korollar 9. 33 KAPITEL 4 Reell-analytische Funktionen 1. Formale Potenzreihen Eine formale Potenzreihe f (x) im Entwicklungspunkt x0 ∈ R ist ein Ausdruck der Form f (x) = ∞ X fj (x − x0 )j , j=0 wo die fj komplexe Zahlen (die Koeffizienten der Reihe) sind. Obwohl wir uns dieser bequemen Schreibweise bedienen wollen, betonen wir an dieser Stelle gleich, dass die Bezeichnung f (x) in keiner Weise bedeutet, dass wir die Reihe auf der rechten Seite der Gleichung oben an irgendeiner Stelle x ∈ R auswerten können, und wir keinerlei Recht haben, den Ausdruck als Funktion zu deuten; in diesem Sinn ist f (x) einfach eine bequeme Schreibweise für die Koeffizientenfolge (fj )j∈N . Eine einzige Ausnahme zu dieser Regel ist die Auswertung an der Entwicklungsstelle x0 , welche einfach den konstanten Term (d.h. den Term der Ordnung 0) der Potenzreihe reproduziert, f (x0 ) = f0 . Formale Potenzreihen f (x) und g(x), gegeben durch f (x) = ∞ X fj (x − x0 )j , g(x) = ∞ X gj (x − x0 )j , j=0 j=0 werden addiert und mit Skalaren λ ∈ R multipliziert, indem man diese Operationen auf die Koeffizienten anwendet, d.h. wir definieren ∞ X (f (x) + λg(x)) = (fj + λgj )(x − x0 )j . j=0 Die Multiplikation wird definiert, indem man Terme der richtigen Ordnung zusammenfasst, d.h. X X f (x)g(x) = fj g` (x − x0 )k . k∈N j+`=k Mit diesen Operationen wird der Raum der formalen Potenzreihen, welcher mit C[[x − x0 ]] bezeichnet wird, zu einer Algebra mit Einselement f (x) = 1 (die formale Potenzreihe mit konstantem Glied 1) über R. Übungsaufgabe 45. Zeige die letzte Behauptung! Unsere formalen Potenzreihen haben zwar komplexe Koeffizienten, aber die Variable wird als “reelle Veränderliche” aufgefasst werden (im Moment ist sie nur ein Buchstabe!). In diesem Sinn können und werden wir eine formale Potenzreihe f ∈ C[[x]] in ihren Real- und Imaginärteil durch X X f (x) = Re f (x) + i Im f (x) = (Re fj )xj + i (Im fj )xj , j j wo nun Re f, Im f ∈ R[[x]], zerlegen. Will man zwei formale Potenzreihen g(y) ∈ C[[y−y0 ]] und f (x) ∈ C[[x−x0 ]] zu einer formalen Potenzreihe g(f (x)) ∈ C[[x − x0 ]] zusammensetzen, so muss man im Allgemeinen verlangen, dass der konstante Term f (x0 ) = y0 ist, und setzt in diesem Fall X g(f (x)) = gk (f (x) − y0 )k . k 35 Übungsaufgabe 46. Warum ist diese Definition erlaubt? Gibt es andere Fälle, in denen die Zusammensetzung erlaubt ist? Wir werden im folgenden oft mit dem Entwicklungspunkt x0 = 0 arbeiten; dies ist keine besondere Einschränkung, da ja für f (x) ∈ C[[x]] die Zusammensetzung f (x − x0 ) ∈ C[[x − x0 ]] definiert ist, und die so definierte Abbildung f (x) 7→ f (x − x0 ) ein Algebraisomorphismus ist. Die Einheiten der Algebra C[[x]], also die bezüglich der Multiplikation invertierbaren Elemente, sind leicht zu bestimmen: Lemma 33. Die formale Potenzreihe f (x) ∈ C[[x]] ist eine Einheit genau dann, wenn f (0) 6= 0. Damit gibt es ein eindeutig bestimmtes maximales Ideal m ⊂ C[[x]], welches durch m = {f (x) : f (0) = 0} gegeben ist. Beweis. Die Notwendigkeit der Bedingung ist offensichtlich: Wenn es eine Potenzreihe g mit f (x)g(x) = 1 gibt, so ist f (0)g(0) = 1, also f (0) 6= 0. Sei nun f (0) 6= 0; ohne Beschränkung der Allgemeinheit können wir annehmen, dass f (0) = 1 ist. Wir können also f (x) = 1 − h(x) mit h(0) = 0 schreiben. Es ist uns schon bekannt (oder leicht zu sehen), dass die Potenzreihe X y j = G(y) ∈ C[[y]] j∈N die Eigenschaft hat, dass (1 − y)G(y) = 1 ist. Wir ersetzen nun y durch h(x) und sehen, dass f (x)G(h(x)) = (1 − h(x))G(h(x)) = 1 ist. Die letzte Aussage des Lemmas folgt, da ein echtes Ideal keine Einheiten enthalten kann, und die Menge der Elemente, welche nicht Einheiten sind, durch die Bedingung f (0) = 0 charakterisiert wird, welche diese Menge als Ideal erkennbar macht. Formale Ableitungen und Stammfunktionen sind einfach zu definieren; für eine formale Potenzreihe f (x) ist die Ableitung definiert durch ∞ X f 0 (x) = jfj xj−1 . j=0 0 Offensichtlich ist f (x) = 0 genau dann, wenn f (x) = r ∈ R eine konstante Potenzreihe ist. Eine formale Stammfunktion F (x) zu f (x) ist durch Z ∞ X fj j+1 x F (x) = f (x) dx = j +1 j=0 gegeben; diese spezielle Wahl zeichnet sich durch F (0) = 0 aus. Wir führen nun einige wichtige formale Potenzreihen ein; diese kennen wir zwar auch als Funktionen, hier gehen wir aber zunächst rein formal vor. Übungsaufgabe 47. Rechenregeln für Ableitungen (Produktregel, Quotientenregel, Kettenregel) und unbestimmte Integration gelten auch im formalen Sinn. Lemma 34. Sei λ ∈ C. Dann gibt es für jedes y0 ∈ R genau eine formale Potenzreihe y(x) ∈ C[[x]], welche die Differentialgleichung y 0 (x) = λy(x) mit der Anfangsbedingung y(0) = y0 erfüllt. Diese Potenzreihe wird als Exponentialreihe bezeichnet und ist durch y(x) = y0 eλx = y0 ∞ X (λx)j j=0 j! gegeben. Sie erfüllt die Funktionalgleichung e(λ+µ)x = eλx eµx , λ, µ ∈ C. P Beweis. Der unbestimmte Ansatz y(x) = y0 + j>1 yj xj führt durch Koeffizientenvergleich zu der Familie von Gleichungen jyj = yj−1 , j ≥ 1, welche eindeutig durch yj = y0 j! gelöst wird. 36 Die Funktionalgleichung überprüfen wir, indem wir beachten, dass sich die Ableitung der rechten Seite f (x) = eλx eµx als f 0 (x) = λeλx eµx + µeλx eµx = (λ + µ)f (x) berechnet. Damit erfüllt f (x) die Differentialgleichung, welche nach dem ersten Teil durch e(λ+µ)x eindeutig gelöst wird. Übungsaufgabe 48. Löse die Differentialgleichungen y 00 (x) = y(x) und y 00 (x) = −y(x) in C[[x]]. Beispiel 5. Der Real- und Imaginärteil der Reihe eix werden als cos(x) und sin(x) bezeichnet: Re eix = cos(x) + i sin(x). Diese Reihen sind also durch cos(x) = X (−1)k (2k)! k x2k , sin(x) = X (−1)k x2k+1 (2k + 1)! k gegeben. Lemma 35. Die formale Stammfunktion zu f (x) = (1 + x)−1 ∈ C[[x]], welche durch ∞ X (−1)j+1 ln(1 + x) = j=1 j xj gegeben ist, wird als die Logarithmusreihe bezeichnet, und erfüllt eln(1+x) = 1 + x und ln(ex ) = x. Beweis. Da X 1 = (−1)j xj , 1+x j≥0 erhalten wir mit formaler Integration Z X (−1)j+1 1 dx = xj . 1+x j j≥0 ln(1+x) Die Zusammensetzung f (x) = e ist wegen ln(1 + 0) = 0 wohldefiniert und erfüllt f (0) = 1, und ln(1+x) (x) wir erhalten unter Verwendung der Differentialgleichung der Exponentialreihe und f 0 (x) = e 1+x = f1+x . Diese Differentialgleichung besitzt für die Anfangsbedingung f (0) = 1 die eindeutige Lösung f (x) = 1 + x. Auf der anderen Seite ist die Zusammensetzung g(x) = ln(ex ) wegen e0 = 1 definiert (eigentlich steht hier ln(1 + (ex − 1))), erfüllt g(0) = 0 und wir können wiederum g 0 (x) = e1x ex = 1 berechnen, also g(x) = x wie behauptet. 2. Konvergente Potenzreihen Eine formale Potenzreihe f (x) ∈ C[[x − x0 ]] ist konvergent, wenn es ein x1 6= x0 gibt sodass die Reihe X f (x1 ) = fj (x1 − x0 )j j konvergiert. In diesem Fall definieren wir den Konvergenzradius von f als X R(f ) = sup |x1 − x0 | : fj (x1 − x0 ) konvergiert , j und R(f ) = 0 wenn es kein x1 6= x0 gibt sodass f (x1 ) konvergiert. Die Menge der konvergenten Potenzreihen wird mit C{x − x0 } bezeichnet. Lemma 36. Sei f ∈ C[[x − x0 ]], und K ⊂ (x0 − R(f ), x0 + R(f )) =: D(f ) kompakt. Dann konvergieren die Partialsummen k X Txk0 f = fj (x − x0 )j j=0 absolut und gleichmässig auf K. Die auf D(f ) als Grenzwert dieser Partialsummen definierte Funktion, welche wir wiederum mit f bezeichnen, ist stetig. 37 Beweis. Wir können R(f ) > 0 annehmen. Da K kompakt ist, gibt es ein x1 ∈ D(f ) und ein q < 1 mit q|x1 − x0 | > maxx∈K |x − x0 |. Weiters ist, da ja f (x1 ) konvergiert, die Folge fj (x1 − x0 )j eine Nullfolge, also insbesondere beschränkt; wir wählen ein M > 0 mit |fj (x1 − x0 )j | ≤ M für alle j ∈ N. Dann ist für beliebige x∈K k k X X q `+1 . |fj (x − x0 )j | ≤ M qj ≤ 1−q j=`+1 j=`+1 Also konvergieren die Partialsummen gleichmässig und absolut auf K. Die Stetigkeit der Grenzfunktion folgt aus Lemma 17. Wir können nun sehen, dass C{x} ⊂ C[[x]] eine Teilalgebra ist: Lemma 37. Seien f, g ∈ C[[x]]. Dann gilt R(f + λg) ≥ min(R(f ), R(g)), R(f g) ≥ min(R(f ), R(g)). Ist f (0) = 0, und R(f ), R(g) > 0, so ist auch R(g ◦ f ) > 0. Übungsaufgabe 49. Beweise Lemma 37. Die Berechnung des Konvergenzradius kann zum Beispiel mit Hilfe des Wurzel- oder des Quotientenkriteriums erfolgen: Lemma 38 (Hadamardkriterium). Sei f (x) ∈ C[[x]]. Dann ist 1 , R(f ) = lim supj→∞ |fj |1/j wo wir 1/∞ = 0 und 1/0 = ∞ vereinbaren. Beweis. Wir schreiben zunächst S = 1 lim supj→∞ |fj |1/j 6= 0, ∞. Ist nun |x| < S, so schreiben wir |x| = qS mit einem q < 1. Da S lim supj→∞ |fj |1/j = 1, ist für beliebiges ε > 0 die Ungleichung S j |fj | ≤ (1 + ε)j für fast alle j erfüllt. Wir wählen ε so klein, dass q 0 = q(1 + ε) < 1 ist. Damit ist für fast alle j die Ungleichung |fj ||x|j = |fj |q j S j ≤ (q 0 )j erfüllt; damit ist die Reihe f (x) für diese x konvergent. Ist auf der anderen Seite 1 |x| > S, also |x| = Sq mit einem q > 1, so ist für unendlich viele j die Ungleichung |fj |1/j > Sq erfüllt, also j |fj ||x| > 1 für diese j; damit kann die Reihe f (x) für diese x nicht konvergieren, da ihre Glieder nicht gegen 0 gehen. Es folgt R(f ) = S. Die Fälle S = 0 und S = ∞ werden ganz ähnlich behandelt. Lemma 39. Sei f (x) ∈ C[[x]] mit |fj | > 0 für fast alle j. Dann ist R(f ) = lim j→∞ Beweis. Sei S = limj→∞ alle j ∈ N. Nun ist |fj | |fj+1 | ; |fj | . |fj+1 | wir nehemen ohne Beschränkung der Allgemeinheit an, dass fj 6= 0 für |x| |fj+1 ||x|j+1 = ; j→∞ |fj ||x|j S also können wir das übliche Quotientenkriterium für |x| < S anwenden, um auf die Konvergenz zu schliessen, und ehalten für |x| > S Divergenz. lim Übungsaufgabe 50. Berechne die Konvergenzradien von ex und ln(1 + x). Manchmal ist es bequemer, mit Wachstumsbedingungen an die Koeffizienten einer konvergenten Reihe zu arbeiten. P Lemma 40. Sei f ∈ C[[x]], f = j fj xj , und für s ≥ 0 definiere Ms (f ) = sup |fj |sj . j Dann ist R(f ) = sup{s ≥ 0 : Ms (f ) < ∞}. 38 Aus dem Hadamardkriterium und der Tatsache, dass limn→∞ n1/n = 1 ist, können wir folgende Beobachtung herleiten: Lemma 41. Ist f ∈ C[[x]] und F eine formale Stammfunktion von f , so ist R(f 0 ) = R(F ) = R(f ). Insbesondere ist f ∈ C ∞ (D(f )). Die letzte Behauptung folgt dabei direkt aus Lemma 36 und Lemma 17, da die Partialsummen (als Polynome) glatt sind. Das Verhalten einer Potenzreihe in den Randpunkten des Konvergenzintervalls D(f ) kann ganz unterschiedlich ausfallen. So ist die Reihe X 1 = xj 1−x j weder im linken noch im rechten Randpunkt konvergent; die Logarithmusreihe X (−1)j+1 xj ln(1 + x) = j j konvergiert für x = 1 nach dem Leibnizkriterium (aber nicht absolut) und divergiert für x = −1 als harmonische Reihe; die Reihe X xj j2 j konvergiert in beiden Randpunkten absolut. Eine befriedigende Antwort auf die sich hier aufdrängenden Fragen kann erst im Rahmen der komplexen Analysis gegeben werden. Wir wollen nun versuchen, (konvergente) Potenzreihen bezüglich der Zusammensetzung zu invertieren; wir arbeiten der Einfachkeit halber wieder in C[[x]]. Seien f, g ∈ C[[x]] mit f (0) = g(0) = 0 gegeben, welche f (g(x)) = x erfüllen. Wir sehen direkt, dass f 0 (0)g 0 (0) = 1 ist. Mit Hilfe einer nichtverschwindenden Ableitung können wir die Existenz einer inversen Potenzreihe nachweisen. Wir beweisen zunächst ein einfaches Lemma, welches uns später zum Nachweis der Konvergenz der inversen Potenzreihe dienen wird. Lemma 42. Sei N > 1. Dann gibt es eine Konstante E mit X (1 + `)N < E. (1 + j)N (1 + k)N j+k=` Beweis. Es ist X j+k=` X (1 + `)N (1 + `)N ≤ 2 (1 + j)N (1 + k)N (1 + j)N (1 + (` − j))N j≤`/2 ≤2 X j≤`/2 ≤ 2N +1 (1 + `)N (1 + `/2)N (1 + j)N ∞ X j=0 1 =: E. (1 + j)N Lemma 43. Sei N > 1. Dann gibt es eine Konstante E, sodass die sodass für jedes m ∈ N der Koeffizienten dm von tm in !` X X k ck t = dj tj j k die Ungleichung dm ≤ (M E)` sm (1 + m)N k s erfüllt, wenn für k ≤ m die Ungleichung ck < M (1+k) N erfüllt ist. 39 Beweis. Wir beweisen die Gültigkeit der Ungleichung mit Induktion über `; für ` = 1 ist sie trivialerweise erfüllt. Wissen wir nun, dass für !`−1 X X j k ej t = ck t j k die Abschätzung (M E)`−1 sj , (1 + j)N erfüllt ist, so folgt für den Koeffizienten dm , dass X dm = ep cq ej ≤ j ≤ m, p+q=m ≤ X (M E)`−1 sp M sq (1 + p)N (1 + q)N p+q=m ≤ (1 + m)N M (M E)`−1 sm X (1 + m)N (1 + p)N (1 + q)N p+q=m ≤ (M E)` sm . (1 + m)N 0 Satz 14. Sei f (x) ∈ C[[x − x0 ]] mit f (x0 ) = y0 und f (x0 ) 6= 0 gegeben. Dann gibt es ein eindeutig bestimmtes g(y) ∈ C[[y − y0 ]], welches f (g(y)) = y erfüllt; es gilt dann auch g(f (x)) = x. Ist f ∈ C{x − x0 }, so ist auch g ∈ C{y − y0 }. Beweis. Zunächst bemerken wir, dass wir ohne Beschränkung der Allgemeinheit annehmen können, dass x0 = y0 = 0: Ist f wie in den Vorraussetzungen, so betrachten wir ϕ(x) = f (x + x0 ) − y0 ∈ C[[x]]; ϕ(x) erfüllt ϕ(0) = 0 und ϕ0 (0) = f 0 (x0 ) 6= 0. Kennen wir den Satz für x0 = 0, so wissen wir, dass es ein ψ ∈ C[[x]] mit ϕ(ψ(x)) = x gibt. Wir setzen g(y) = ψ(y − y0 ) + x0 , dann ist f (g(y)) = f (ψ(y − y0 ) + x0 ) = ϕ(ψ(y − y0 )) + y0 =P y − y0 + y0 = y. Wir setzen g = j gj xj an. Die Gleichung f (g(x)) = x übersetzt sich in g0 = 0, f1 g1 = 1, und für j > 1 f1 gj + Pj (fk , gk : k < j) = 0, wo Pj ein Polynom ist, genauer gesagt, der Koeffizient von tj in dem Ausdruck !k j j−k X X fk g` t` . k=2 `=1 Wir sehen also, dass wir die gj induktiv eindeutig bestimmen können, was die Existenz einer formalen Potenzreihe mit der gewünschten Eigenschaft zeigt. Weiters erfüllt das konstruierte g die Vorraussetzungen des Satzes, es gibt also ein h(x) mit g(h(x)) = x; dieses erweist sich aber wegen f (x) = f (g(h(x))) = h(x) als das gegebene f . Für den Konvergenzbeweis wollen wir ohne Beschränkung der Allgemeinheit annehmen, dass f 0 (0) = 1 ist: falls f 0 (0) = λ, so erfüllt die Funktion ϕ = λ−1 f , dass ϕ0 (0) = 1. Wenn wir das Ergebnis für solche Funktionen bewiesen haben, erhalten wir ein ψ mit ϕ(ψ(x)) = x. Setzen wir nun g(x) = ψ(λ−1 x), so ist f (g(x)) = λϕ(ψ(λ−1 x)) = x. Sei im folgenden N > 1 fix. Da f konvergent ist, können wir K, C > 0 mit |fj | ≤ CK j bestimmen. Die Koeffizienten gj sind nun induktiv durch gj = −Pj (fk , gk ) gegeben. Wir behaupten, dass es L, M > 0 gibt, sodass |gj | ≤ M Lj . (1 + j)N 40 Indem wir L genügend gross wählen, können wir M beliebig klein machen, sodass die Abschätzung für j = 1 erfüllt ist. Angenommen, dies ist für j < m der Fall. Dann ist |gm | ≤ m X k=2 CK k m X Lm Lm (M E)k Lm k ≤ , C(KM E) ≤ (1 + m)N (1 + m)N (1 + m)N k=2 wenn wir L genügend gross wählen, sodass ∞ X (KM E)k = k=2 (KM E)2 1 < 1 − KM E C ist. 3. Reell-analytische Funktionen Sei U ⊂ R offen. Eine Funktion ϕ : R ⊃ U → C heisst reell-analytisch auf U , wenn es für jedes x0 ∈ U eine Potenzreihe f (x) ∈ C{x−x0 } gibt, welche R(f ) > 0 erfüllt und in einer Umgebung von x0 die Funktion f darstellt, also f (x) = ϕ(x) für alle x in einer Umgebung von x0 . Die Menge der reell-analytischen Funktionen auf U wird mit C ω (U ) bezeichnet. Übungsaufgabe 51. Welche algebraische Struktur besitzt C ω (U )? Nach Lemma 36 sind reell-analytische Funktionen insbesondere glatt. Eine glatte Funktion, welche reellanalytisch ist, muss P an jeder Stelle ihres Funktionsbereichs durch ihre Taylorreihe an dieser Stelle gegeben sein: Wenn ϕ(x) = j fj (x − x0 )j ist, so erhalten wir durch Differenzieren, dass j!fj = ϕ(j) (x0 ) für alle j ist. Allgemein schreiben wir Tx0 ϕ = X ϕ(j) j j! (x − x0 )j ∈ C[[x − x0 ]] für die (formale) Taylorreihe von einer glatten Funktion ϕ, welche in einer Umgebung von x0 definiert ist. Nicht alle glatten Funktionen sind reell-analytisch, und auch die Konvergenz der Taylorreihe einer glatten Funktion ist keine Garantie dafür, dass diese Funktion reell-analytisch ist (also die Funktionswerte in einer Umgebung eines Punktes x0 auch tatsächlich dem Grenzwert der Taylorreihe in diesem Punkt entsprechen). Während wir also reell-analytische Funktionen mit ihren Taylorreihen identifizieren dürfen, ist dies für glatte Funktionen im Allgemeinen falsch: 1 Übungsaufgabe 52. Zeige, dass die Funktione ϕ(x) = e− x2 glatt auf R ist, und ϕ(j) (0) = 0 für alle j gilt. Eine grosse Klasse von Funktionen, welche reell-analytisch sind, ist durch konvergente Potenzreihen gegeben. Lemma 44. Sei f (x) ∈ C{x−x0 } eine konvergente Potenzreihe. Dann ist f (x) reell-analytisch auf D(f ). Für die Ableitungen gelten die Cauchy-Abschätzungen: für jedes S < R(f ) gibt es ein M > 0 sodass für jedes x mit |x − x0 | < S |f (k) (x)| ≤ M k! (S − |x − x0 |)k+1 gilt. 41 Beweis. Wir nehmen ohne Beschränkung der Allgemeinheit an, dass f ∈ C{x}, und schreiben R = R(f ). Für ein beliebiges x0 mit |x0 | < R versuchen wir f (x) in eine Potenzreihe um x0 zu entwickeln: X f (x) = fj xj j = X = X fj (x − x0 + x0 )j j fj j = k k=0 X k = j X j ! x0j−k (x k − x0 ) ∞ k X j (x − x0 ) k! fj xj−k 0 k k! j=k X f (k) (x0 ) k (x − x0 )k . k! Nun müssen wir offensichtlich in irgend einer Form die Vertauschung der Summation rechtfertigen, was dann auch zeigt, dass die Potenzreihe um x0 am Ende der Rechnung wiederum konvergiert. Dazu beachten wir, dass nach Lemma 38 für ein beliebiges S < R die Folge |fj |S j beschränkt ist, sagen wir durch M . Damit ist mit |x0 | = qS X j |f (k) (x0 )| = k! fj x0j−k k j X j ≤ k! |fj |(qS)j−k k j M X (j(j − 1) . . . (j − k + 1))q j−k Sk j ≤ M k! S k (1 − q)k+1 M Sk! . = (S − |x0 |)k+1 = Die obige Doppelsumme X k ∞ X (x − x0 )k j j−k k! fj x0 k k! j=k erweist sich mit Hilfe der Abschätzung ab der zweiten Zeile dieser Ungleichung als absolut konvergent; man kann nämlich die Summation von beliebig vielen Absolutbeträgen ihrer Glieder für |x − x0 | < S − |x0 | durch X X M S|x − x0 |k C ≤ |f (k) (x0 )||x − x0 |k ≤ x−x0 (S − |x0 |)k+1 1− k k S−x0 mit einer von x unabhängigen Konstanten C abschätzen. Der Rest der Abschätzung liefert die behauptete Cauchy-Ungleichung. Übungsaufgabe 53. Gib ein Beispiel einer reell-analytischen Funktion auf R, welche nicht durch eine Potenzreihe mit Konvergenzradius R = ∞ gegeben ist (hier ist es gut, sich Gedanken darüber zu machen, welche reell-analytischen Funktionen Einheiten sind)! Satz 15. Eine Funktion f ∈ C ∞ (U ) ist reell-analytisch auf U genau dann, wenn es für jede kompakte Teilmenge K ⊂ U Konstanten C, r > 0 gibt, für die sup |f (k) (x)| ≤ k!Crk , x∈K 42 k∈N gilt. Beweis. Um zu sehen, dass die Bedingung hinreichend ist, zeigen wir, dass jede glatte Funktion auf U welche sie erfüllt in einer Umgebung jedes Punktes x0 ∈ U Grenzwert ihrer Taylorreihe ist. Nach Theorem 7 können wir mit k X f (j) (x0 ) (x − x0 )j Txk0 f (x) = j! j=1 die Abweichung von f von seiner Taylorreihe als f (x) − Txk0 f (x) = f (k+1) (ξ) (x − x0 )(k+1) (k + 1)! mit einem ξ mit |ξ − x0 | < |x − x0 | schreiben. Wir wählen ein c > 0 mit [x0 − c, x0 + c] ⊂ U und erhalten C, r > 0, für die dann (k+1) (ξ)| f (x) − Txk f (x) = |f |x − x0 |k+1 ≤ Crk+1 |x − x0 |k+1 → 0 0 (k + 1)! für k → ∞ ist, solange |x − x0 | ≤ min{c, 1/2r}. Die Notwendigkeit folgt aus einem Kompaktheitsargument und der Abschätzung aus Lemma 44. Gleichungen zwischen reell-analytischen Funktionen auf offenen Intervallen kann man überprüfen, indem man die entsprechenden Gleichungen für die Potenzreihendarstellungen an einem beliebigen Punkt überprüft. Lemma 45. Wenn f, g ∈ C ω ((a, b)) die Eigenschaft haben, dass f (x) = g(x) auf einer nichtleeren offenen Teilmenge U ⊂ (a, b) ist, dann ist f (x) = g(x) für alle x ∈ (a, b). Äquivalent dazu ist, dass für ein x0 ∈ (a, b) die Ableitungen von f und g an der Stelle x0 übereinstimmen, also f (k) (x0 ) = g (k) (x0 ), k∈N gilt. Beweis. Wir wählen ein beliebiges x0 ∈ U ; für dieses gilt, nachdem wir beide Funktionen in ihre Taylorreihe entwickeln können und diese gegen die jeweilige Funktion konvergieren, dass die Gleichheit f (x) = g(x) in einer Umgebung von x0 genau dann gilt, wenn f (k) (x0 ) = g (k) (x0 ) ist. Wir betrachten nun c = inf{y ∈ (a, b) : f (x) = g(x) für alle x ∈ [y, x0 ]} und müssen zeigen, dass c = a ist. Dazu zeigen wir, dass für jedes y0 mit x0 > y0 > a und f (x) = g(x) für x ∈ [y0 , x] ein ε > 0 existiert, sodass f (x) = g(x) auch für x ∈ (y0 − ε, y0 ] gilt. Daraus folgt c = a. An der Stelle y0 können wir f und g in ihre Taylorreihen entwickeln. Nachdem f und g rechts von y0 übereinstimmen, ist f (k) (y0 ) = g (k) (y0 ) für alle k ∈ N. Damit stimmen die durch ihre Taylorreihen dargestellten Funktion f und g auf einer ε-Umgebung von y0 überein. Dasselbe Argument zeigt, dass d = sup{y ∈ (a, b) : f (x) = g(x) für alle x ∈ [x0 , y]} notwendigerweise d = b erfüllt, und damit ist f (x) = g(x) für alle x ∈ (a, b). Reell-analytische Funktionen sind unter der Bildung von inversen Funktionen abgeschlossen: Satz 16. Sei f ∈ C ω (a, b), f : (a, b) → (c, d), mit f 0 (x) 6= 0 für x ∈ (a, b). Dann gibt es eine reellanalytische Funktion g : (c, d) → (a, b) mit f (g(x)) = x für x ∈ (c, d) und g(f (x)) = x für x ∈ (a, b). Beweis. Da f 0 (x) auf (a, b) nicht verschwindet, ist f strikt monoton steigend oder fallend; wir können ohne Beschränkung der Allgemeinheit das erstere annehmen. Damit gibt es eine (stetig differenzierbare) inverse Funktion g(x) auf (c, d), welche sich aber nach Theorem 14 in jedem Punkt x0 ∈ (c, d) in eine konvergente Potenzreihe entwickeln lässt, also reell-analytisch ist. 43 Beispiel 6. Die Exponentialfunktion exp : R → R+ ist die Lösung der Differentialgleichung y 0 = y, y(0) = 1, und wir haben gesehen, dass sie durch die auf ganz R konvergente Potenzreihe ex gegeben ist; sie ist also nach Lemma 44 eine reell-analytische Funktion auf R, welche darüberhinaus die Funktionalgleichung ea+b = ea eb erfüllt. Ihre inverse Funktion wird als der Logarithmus ln x bezeichnet, und ist eine reell-analytische Funktion auf R+ . Um ln x in eine Potenzreihe zu entwickeln, ist es allerdings einfacher, die Ableitung von ln x implizit zu berechnen, also die Gleichung eln x = x d ln x = 1, also zu differenzieren. Dies liefert eln x dx 1 d ln x = . dx x Die rechte Seite dieser Gleichung lässt sich mit Hilfe der geometrischen Reihe sehr leicht in eine Potenzreihe entwickeln, und Integration liefert dann die gewünschte Reihe für ln x. Die Funktionalgleichung des Logarithmus, ln ab = ln a + ln b, folgt aus der Funktionalgleichung der Exponentialfunktion wegen ab = eln a eln b = eln a+ln b . Beispiel 7. Nachdem wir nun die Logarithmusfunktion eingeführt haben, definieren wir für α ∈ R die Potenzfunktionen xα : R+ → R+ , : xα := eα ln x . Die Funktionalgleichung der Exponentialfunktion zieht die wichtige Gleichung xα+β = xα xβ , x ∈ R+ , α, β ∈ R nach sich. Übungsaufgabe 54. Berechne die Ableitung(en) der Potenzfunktion xα , und zeige (Entwicklung um den Punkt 1), dass ∞ X α j x , (1 + x)α = j j=0 wobei α α(α − 1) . . . (α − j + 1) = j! j die verallgemeinerten Binomialkoeffizienten sind. 4. Trigonometrische Funktionen Wir haben bereits die Reihen cos(x) und sin(x) eingeführt, X (−1)k X (−1)k cos(x) = x2k , sin(x) = x2k+1 . (2k)! (2k + 1)! k k Diese Potenzreihen haben unendlichen Konvergenzradius, stellen also reell-analytische Funktionen auf R dar. Weiters gilt cos2 (x) + sin2 (x) = (cos(x) + i sin(x))(cos(x) − i sin(x)) = eix e−ix = e0 = 1, und wir wissen damit dass cos, sin : R → [−1, 1], weiters ist cos(0) = 1, sin(0) = 0. Es ist auch einfach zu sehen, dass sin0 (x) = cos(x) und cos0 (x) = − sin(x) gilt. Wir bemerken auch, dass cos gerade ist (d.h. cos(−x) = cos(x)) und sin ungerade (d.h. sin(−x) = − sin(x). Lemma 46. Es gibt eine kleinste reelle positive Nullstelle ξ von cos; wir definieren π = 2ξ. Beweis. Angenommen, cos(x) > 0 für alle positiven x; dann ist wegen cos00 (x) = − cos(x) die Funktion cos strikt konkav auf R+ . Das ist ein Widerspruch zur Beschränktheit von cos(x). Um die weiteren Nullstellen der trigonometrischen Funktionen zu finden, benötigen wir die Additionstheoreme. 44 Lemma 47. Für x, y ∈ R gilt cos(x + y) = cos(x) cos(y) − sin(x) sin(y), sin(x + y) = sin(x) cos(y) + cos(x) sin(y); insbesondere gelten die Halbwinkelformeln 1 + cos(2x) cos(x)2 = , 2 Beweis. Es ist cos(x + y) + i sin(x + y) = ei (x + y) 1 − cos(2x) . 2 sin(x)2 = = eix eiy = (cos(x) + i sin(x))(cos(y) + i sin(y)) = cos(x) cos(y) − sin(x) sin(y) + i(sin(x) cos(y) + cos(x) sin(y)); die Formel folgt also aus Vergleich von Real- und Imaginärteilen. Damit ist sin π = sin(π/2 + π/2) = 2 cos(π/2) sin(π/2) = 0 und auch sin(2π) = 0; an diesen Stellen ist notwendigerweise cos(π) = −1 und cos(2π) = 1 (wir verwenden hier, dass sin2 (x) + cos2 (x) = 1 und die Monotonieeigenschaften, die wegen cos0 (x) = − sin(x) gelten). Wir können nun auch die Periodizität der trigonometrischen Funktionen nachweisen: cos(x + 2π) = cos(x) cos(2π) + sin(x) sin(2π) = cos(x), sin(x + 2π) = sin(x) cos(2π) + cos(x) sin(2π) = sin(x), sin(x + π/2) = sin(x) cos(π/2) + cos(x) sin(π/2) = cos(x), cos(x + π/2) = cos(x) cos(π/2) − sin(x) sin(π/2) = − sin(x). Insgesamt ergibt sich damit folgendes Bild für die Nullstellen: Lemma 48. Die Nullstellen von cos(x) sind durch π x = + nπ, n ∈ Z 2 gegeben, und jene von sin(x) durch x = nπ, n ∈ Z. An diesen Punkten gilt π cos (nπ) = (−1)n , sin + nπ = (−1)n . 2 Übungsaufgabe 55. Zeige, dass die in Lemma 48 angegebenen Nullstellen tatsächlich alle sind. Der Tangens und der Cotangens, tan(x) = sin(x) , cos(x) cot(x) = cos(x) , sin(x) sind dementsprechend reell-analytische Funktionen auf R \ {π/2 + nπ : n ∈ Z} beziehungsweise R \ {nπ : n ∈ Z}. Die inversen Funktionen von sin und cos können jeweils für die Einschränkung auf Intervalle zwischen zwei Nullstellen dieser Funktionen definiert werden; dies gibt die verschiedenen “Zweige” dieser Funktionen. Standardmässig setzt man arcsin : [−1, 1] → [−π/2, π/2], arccos : [−1, 1] → [0, π], welche nach Theorem 16 reell-analytisch auf (−1, 1) sind. Andere Wahlen des arcsin bzw. des arccos unterscheiden sich von den Hauptzweigen um ein Vielfaches von 2π. Ähnlich verfährt man mit der Umkehrfunktion des Tangens; wegen limx→−π/2 tan(x) = −∞, limx→π/2 tan(x) = +∞ ist tan : (−π/2, π/2) → R, weiters ist tan0 (x) = (cos(x))−2 6= 0 für x; nach Theorem 16 gibt es also die Umkehrfunktion arctan : R → (−π/2, π/2), welche reell-analytisch auf R ist. 45 Die Ableitungen der Umkehrfunktionen berechnet man mit Hilfe von impliziter Differentiation und unter Verwendung der trigonometrischen Formeln. So ist sin(arcsin(x)) = x, also nach Ableitung cos(arcsin(x)) arcsin0 (x) = 1. Nun ist aber cos2 (arcsin(x)) + x2 = 1, und damit (da cos auf (−π/2, π/2) positiv ist) cos(arcsin(x)) = √ 1 − x2 , also 1 . arcsin0 (x) = √ 1 − x2 −1 Übungsaufgabe 56. Zeige, dass arccos0 (x) = √1−x . 2 Die Reihenentwicklung von arcsin erhält man nun aus der Entwicklung von ∞ X 1 −1/2 (1 − x2 )− 2 = (−1)j x2j j j=0 durch Integration. Eine ähnliche Strategie kann man für die Reihe des Arcustangens verwenden: Aus tan(arctan(x)) = x folgt arctan0 (x) = cos2 (arctan(x)), also arctan0 (x) = (1 + x2 )−1 . Die Reihenentwicklung ergibt sich damit als X (−1)j x2j+1 . arctan(x) = 2j + 1 j≥0 Wenn wir nun in diese Entwicklung x = 1 einsetzen, erhalten wir π 1 1 = 1 − + − .... 4 3 5 Natürlich dürfen wir in die rechte Seite der Gleichung nicht einfach x = 1 einsetzen, da wir uns an keinem inneren Punkt des Konvergenzintervalls der Reihe befinden. Wir können aber wie folgt argumentieren, um zu sehen dass X (−1)j X (−1)j lim x2j+1 = : x→1+ 2j + 1 2j + 1 j≥0 j≥0 Sei ε > 0, dann existiert ein gerades N mit X j (−1) 1 2j+1 x ≤ <ε 2j + 1 4N + 1 j≥N für alle x ∈ [1/2, 1]. Damit ergibt sich X j X (−1)j X (−1)j 2j+1 X (−1)j (−1) 2j+1 x − x − ≤ 2ε + 2j + 1 2j + 1 2j + 1 j 2j + 1 j j≤N j≤N Der letzte Summand kann nun für x ∈ [r0 , 1] auch kleiner als ε gemacht werden, und wir erhalten die behauptete Aussage. Um die trigonometrischen Funktionen ihrer üblichen geometrischen Interpretation zuzuführen, ist es von Vorteil, das Konzept eines Wegs einzuführen. Ein Weg in R2 = C ist eine stetige Abbildung γ : [a, b] → R2 , wobei wir sagen, dass γ(t) = (x(t), y(t)) differenzierbar ist, wenn x und y differenzierbar sind, und wir schreiben γ 0 (t) = (x0 (t), y 0 (t)). Wir nennen γ 0 (t) den Tangentialvektor an die Kurve γ im Punkt γ(t) und sagen, dass γ regulär ist, wenn γ 0 (t) 6= 0 für alle t ∈ [a, b] gilt. Die Funktion γ(t) = eit ist ein Weg in R, wobei wir t zunächst auf ein Intervall der Länge 2π einschränken wollen. Wegen γ 0 (t) = ieit ist |γ(t)| = |γ 0 (t)| = 1; mit anderen Worten, γ(t) durchläuft den Einheitskreis mit gleichförmiger Geschwindigkeit 1. Der Punkt γ(t) = (cos(t), sin(t)) ist damit der Punkt auf dem Einheitskreis, der Bogenlänge t von (1, 0) auf der Kreislinie entfernt liegt. Damit erkennt man cos(t) als die Länge der Ankathete und sin(t) als die Länge der Gegenkathete eines Winkels t in einem rechtwinkligen Dreieck, dessen Hypothenuse Länge 1 besitzt. Der tan(t) wird erhalten, 46 indem man das Dreieck so streckt, dass die Länge der Ankathete 1 wird, und bezeichnet dann die Länge der Gegenkathete. Die Länge der Hypothenuse im so enststandenen Dreieck ist der Sekans von t, sec(t) = cos(t)−1 . Eine andere Interpretation ist, dass tan(t) die Länge der Strecke von (1, 0) zum Schnittpunkt der Geraden, welche mit der x-Achse den Winkel t einschliesst, mit der Geraden x = 1 darstellt (für t ∈ (−π/2, π/2)). Ähnliche Interpretationen besitzen der Cotangens cos(t) , cot(t) = sin(t) wobei hier die Gegenkathete auf Länge 1 gebracht wird; der Cosecans csc(t) = sin(t)−1 entspricht nun der Geraden y = 1. Der Tangens und der Cotangens können mit Hilfe der Exponentialfunktion in folgender Form geschrieben werden: 1 e2it − 1 e2it + 1 eit + e−it 1 eit − e−it = = i , cot(t) = i . tan(t) = i eit + e−it i e2it + 1 eit − e−it e2it − 1 Auch Tangens und Cotangens erfüllen Additionstheoreme. Diese kann man aus der elementaren Identität a−1 + b−1 (a − 1)(b + 1) + (b − 1)(a + 1) ab − 1 = = a+1a−1b+1 ab + 1 (a + 1)(b + 1) + (a − 1)(b − 1) 1 + a+1 b−1 b+1 ableiten, indem man a = e2it und b = e2is setzt, und so tan(s) + tan(t) tan(s + t) = 1 − tan(s) tan(t) erhält. √ Beispiel 8. Wir berechnen eine Stammfunktion von 1 − x2 auf dem Intervall (−1, 1). Mit Hilfe der Substitution x = sin(t) sehen wir, dass Z p Z 1 − x2 dx = cos(t)2 dt Z 1 + cos(2t) dt = 2 . t sin(2t) = + 2 4 p 1 = arcsin(x) + x 1 − x2 2 Die Wahl eines Zweiges des arcsin (also die Addition einer Vielfachen von π) ändert nur den Wert der Stammfunktion an einer Stelle; wir haben hier die Stammfunktion, welche an der Stelle 0 verschwindet, angegeben. 47 KAPITEL 5 Elementare Fourierreihen 1. Definition, Motivation und Beispiele Wir haben schon eine Methode kennengelernt, eine Funktion durch “elementare” Funktionen zu approximieren. Dabei haben wir, um eine Funktion ϕ durch Polynome zu approximieren, ein formales Objekt, die Taylorreihe von ϕ betrachtet. Für reell-analytische Funktionen ist die Übereinstimmung von dieser Potenzreihe und der durch sie dargestellten Funktion gegeben, und wir können uns in Rechnungen auf die Manipulation eines algebraischen Objekts beschränken. Leider sind Ableitungen einerseits schwer zu berechnen, und andererseits ist es notwendig, dass Funktionen glatt sind um ihre Taylorreihe zu berechnen; damit die Taylorreihe dann auch tatsächlich die Funktion darstellt, ist auch noch ein kontrolliertes Wachstum der Ableitungen dieser Funktion notwendig. Dies macht es oft erstrebenswert, Funktionen auch auf andere Weise darzustellen. Eine formale Fourierreihe ist ein Ausdruck der Form ∞ ∞ X a0 X bj cos(jx), aj cos(jx) + + 2 j=1 j=1 wo aj , bj ∈ C. Eine Fourierreihen stellt, so sie konvergiert, eine Funktion dar, welche ϕ(x + 2π) = ϕ(x) erfüllt–wir sagen, ϕ ist periodisch mit Periode 2π oder einfach, ϕ ist 2π-periodisch. Für eine 2π-periodische Funktion genügt es, die Werte f (x) für a ≤ x < a + 2π zu kennen; genauer gesagt, kommt f von einer Funktion auf dem Quotientenraum R/ ∼, wo x ∼ y durch y − x ∈ 2πZ definiert wird. Dieser Raum ist der eindimensionale Torus–im folgenden wollen wir uns einfach auf Funktionen f beschränken, die auf [−π, π] definiert sind, und Werte f (x) für x ∈ / [−π, π] dadurch definiert werden, dass f (x) = f (x + 2kπ) wo x + 2kπ ∈ [−π, π]. Oft ist es vorteilhaft, unter Verwendung von eix = cos(x) + i sin(x) die komplexe Darstellung der Fourierreihe X cj eijx j∈Z zu verwenden. Dabei ist 2c0 = a0 , und cj = 1 (aj − ibj ), 2 j > 0, cj = 1 (a−j + ib−j ), 2 j < 0. Eine formale Fourierreihe ist reell, wenn aj , bj ∈ R oder äquivalent cj = c−j . Wir erinnern an einen Satz über die Konvergenz von Funktionenreihen, den wir schon oft verwendet haben, und nun auch allgemein formulieren wollen: Satz 17. Sei X ein topologischer Raum, und fj stetige Funktionen auf X, welche kfj k∞ = sup |fj (x)| ≤ εj x∈X erfüllen. Wenn P j εj < ∞, dann ist f (x) = X j eine stetige Funktion auf X. 49 fj (x) Beweis. Da die Folge der Partialsummen gn (x) = n X fj (x) j=1 für fixes x ∈ X eine Cauchyfolge ist, gibt es die Grenzfunktion f (x) = limn→∞ gn (x)–mehr noch: für jedes fixe ε > 0 können wir ein N wählen, sodass für n ≥ N sogar für jedes x ∈ X die Ungleichung |f (x) − gn (x)| ≤ kf − gn k∞ < ε erfüllt ist. Sei nun x0 ∈ X und ε > 0 beliebig. Wir müssen zeigen, dass es eine Umgebung U von X gibt, sodass |f (y) − f (x0 )| < ε für alle y ∈ U gilt. Sei N so gewählt, dass kf − gN k < ε/3 ist. Da gN stetig ist (als Summe endlich vieler stetiger Funktionen), gibt es eine Umgebung U von x0 mit |gN (y) − gN (x0 )| < ε/3. Insgesamt können wir also |f (y) − f (x0 )| ≤ |f (y) − gN (y)| + |gN (y) − gN (x0 )| + |gN (x0 ) − f (x0 )| ≤ kf − gN k∞ + ε/3 + kf − gN k∞ < ε/3 + ε/3 + ε/3 = ε gilt. Wir erinnern auch an die entsprechende Aussage für differenzierbare Funktionen, welche aus Lemma 17 folgt: Satz 18. Seien fj ∈ C k ([a, b]) gegeben, und sei (`) (`) fj = max |fj (x)| ≤ εj , ∞ Wenn P j εj konvergiert, so ist P j ` ≤ k. x∈[a,b] fj ∈ C k ([a, b]). Wir können nun ein Kriterium angeben, um die gleichmässige Konvergenz von einer formalen Fourierreihe gegen eine stetige Grenzfunktion zu garantieren. P Satz 19. Sei j εj konvergent. Wenn die Koeffizienten der Fourierreihe X a0 X + aj cos(jx) + bj sin(jx) 2 j j die Ungleichungen |aj | ≤ εj , |bj | ≤ εj erfüllt, so konvergieren die Partialsummen der Fourierreihe X X SN (x) = a0 + aj cos(jx) + bj sin(jx) j≤N j≤N gleichmässig gegen eine 2π-periodische stetige Funktion f (x). P Allgemeiner ist, falls sogar j j k εj konvergiert, f ∈ C k (R). Der Beweis erfolgt durch Überprüfen der Vorraussetzungen von Theorem 18 unter Beachtung der Tatsache, dass man sich auf das kompakte Intervall [−π, π] einschränken kann. Bemerkung 9. Äquivalent zur Vorraussetzung in Theorem 19 ist, dass die Koeffizienten der komplexen Darstellung der Fourierreihe die Abschätzung |cj | ≤ εj erfüllen. Die Partialsummen sind in dieser Form durch N X SN (x) = cj eijx j=−N gegeben. Wir fragen uns nun, wie man die Koeffizienten der stetigen Grenzfunktion einer (gleichmässig) konvergenten Fourierreihe aus der Grenzfunktion berechnen kann. Der Schlüssel dazu liegt in den folgenden Identitäten: 50 Lemma 49. Es gelten die Orthogonalitätsrelationen ( Z π 0 eimx e−inx dx = 2π −π m 6= n , m = n. beziehungsweise ( 0 cos(mx) cos(nx) dx = sin(mx) sin(nx) dx = π −π −π Z π Z und Z π m 6= n m = n 6= 0, π cos(mx) sin(nx) dx = 0. −π Beweis. Wir beginnen mit der Aussage für die komplexe Exponentialfunktion. Es ist eimx e−inx = eijx , ijx wo j = m − n ist. Falls j 6= 0, besitzt diese Funktion die Stammfunktion e j , und wir erhalten π Z π 1 1 ijπ eijx imx −inx e e dx = = e − e−ijπ = (−1)j − (−1)j = 0. j −π j j −π Wir verwenden nun diese Aussage, um die reellen Orthogonalitätsrelationen herzuleiten. Wir haben Z Z π 1 π imx (e + e−imx )(einx + e−inx ) dx cos(mx) cos(nx) dx = 4 −π −π Z 1 π imx (e + e−imx )(einx + e−inx ) dx = 4 −π Z 1 π i(m+n)x = (e + ei(n−m)x + ei(m−n)x + e−i(m+n)x ) dx 4 −π m 6= n, 0 = π m = n 6= 0, 2π m = n = 0. Für die Aussage für die Sinusfunktion rechnet man ganz analog, unter Verwendung von 2i sin(x) = eix − e−ix . Wir können nun für eine gleichmässig konvergente Fourierreihe X cj eijx = f (x) j wie folgt rechnen: Z π f (x)e−inx dx = −π Z π −π XZ j X cj eijx e−inx dx j π cj eijx e−inx dx −π = cj 2π. Ähnlich sehen wir, dass wir aj und bj wie folgt berechnen können: Z Z 1 π 1 π aj = f (x) cos(jx) dx, bj = f (x) cos(jx) dx. π −π π −π Definition 24. Sei f ∈ R([−π, π]), dann definieren wir die Fourierkoeffizienten Z π 1 cn (f ) = f (x)e−inx dx, 2π −π 51 beziehungsweise Z Z 1 π 1 π f (x) cos(nx) dx, bn (f ) = f (x) sin(nx) dx. π −π π −π Bevor wir einige Beispiele berechnen, bemerken wir folgende Vereinfachung: an (f ) = Lemma 50. Wenn f ∈ R([−π, π]) gerade ist (d.h. f (x) = f (−x)), so ist bj (f ) = 0 und Z 2 π aj (f ) = f (x) cos(nx) dx π 0 für alle j; wenn f ungerade ist (d.h. f (−x) = −f (x)), so ist aj (f ) = 0 für alle j und Z 2 π bj (f ) = f (x) sin(nx) dx. π 0 Beispiel 9. Wir berechnen die Fourierreihe der Dreiecksfunktion |x|. Da x 7→ |x| gerade ist, müssen wir nur an berechnen; a0 = π folgt einfach, und für j > 0 haben wir Z π πaj (|x|) = |x| cos(nx) dx −π Z π x cos(nx) dx 2 0 Z π x sin(nx) sin(nx) − =2 n n 0 cos(nπ) 1 =2 + 2 n2 n (−1)n + 1 . =2 n2 Also ergibt sich die Fourierreihe als π 4 cos(3x) cos(5x) − + + ... , cos(x) + 2 π 9 25 und diese konvergiert gleichmässig gegen |x| auf [−π, π]. Eine Auswertung für x = 0 liefert X 1 π2 = . (2j + 1)2 8 j Beispiel 10. Nun wollen wir die Fourierreihe der Rechteckfunktion sgn x berechnen. Diese ist ungerade, und wir erhalten Z 2 cos(nπ) 1 2(1 + (−1)n+1 ) 2 π bj (sgn x) = sin(nx) dx = − + = . π 0 π n n πn Die Fourierreihe ist damit 4 sin(3x) sin(5x) sin(x) + + + ... π 3 5 Hier können wir die Konvergenz noch nicht garantieren. Falls die Summe konvergiert, so erhalten wir für x = π/2 1 1 π 1 − + − ··· = . 3 5 4 Beispiel 11. Für die Sägezahnfunktion x (welche ungerade ist) erhalten wir Z 2 π bj (x) = x sin(nx) dx π 0 π Z π 2 x cos(nx) cos(nx) = − + dx π n n 0 0 = 2(−1)n+1 . n 52 Damit ergibt sich die Fourierreihe als sin(2x) sin(3x) 2 sin(x) − + − ... . 2 3 2. Das Riemann-Lebesgue Lemma Das nächste Lemma, das sogenannte Riemann-Lebesgue Lemma, zeigt uns, dass die Fourierkoeffizienten einer integrierbaren Funktion eine Nullfolge bilden. Lemma 51. Sei f ∈ R([−π, π]). Dann gilt lim an (f ) = lim bn = 0. n→∞ n→∞ Beweis. Wir zeigen die Behauptung für an . Zunächst zeigen wir, dass die Behauptung für beliebige Treppenfunktionen t(x) gilt; dazu genügt es zu zeigen, dass die Behauptung für eine charakteristische Funktion eines Intervalls [a, b] ⊂ [−π, π] gilt: Z sin(nb) sin(na) b ≤ 2, cos(nx) dx = − π an χ[a,b] = a n n n also ist an eine Nullfolge. Sei nun ε > 0 beliebig. Dann gibt es eine Treppenfunktion t mit Z 1 π |t(x) − f (x)| dx ≤ ε, π −π und wir können wie folgt abschätzen: Z π 1 |an (f )| = f (x) cos(nx) dx π −π Z π 1 ≤ |f (x) − t(x)|| cos(nx)| dx + |an (t)| π −π ≤ ε + |an (t)|. Da an (t) → 0 für n → ∞, gibt es ein N ∈ N sodass |an (t)| < ε für n ≥ N . Für diese n ist also |an (f )| < 2ε; und damit ist an (f ) eine Nullfolge. Für stetige Funktionen wollen wir einen etwas anderen Beweis geben, der eine Abschätzung liefert, wie schnell die Fourierkoeffizienten gegen 0 gehen. Wenn f stetig auf [−π, π] ist, so ist mit Hilfe einer Koordinatenwechsels Z π f (x)e−inx dx 2πcn (f ) = −π Z π(1+1/n) = f (x − π/n)e−in(x−π/n) dx −π(1+1/n) Z π f (x − π/n)e−inx dx, =− −π wobei wir unsere Verabredung über die Periodizität verwendet haben, sowie die Formel eiπ = −1. Damit ergibt sich Z π Z π 1 f (x)e−inx dx − f (x − π/n)e−inx dx |cn (f )| = 4π −π −π 1 ≤ sup |f (x) − f (x − π/n)| . 2 x∈[−π,π] Der letzte Ausdruck geht für n → ∞ gegen 0, da f stetig auf dem kompakten Intervall [−π, π], also gleichmässig stetig ist. 53 Der letzte Ausdruck in der Ungleichungskette gibt uns auch einen Anhaltspunkt, um das RiemannLebesgue Lemma zu quantifizieren, also die Geschwindigkeit der Konvergenz der Koeffizienten zu bestimmen. Dazu definieren wir, dass eine stetige 2π-periodische Funktion f Hölder-stetig von der Ordnung α ist, wenn |f (x) − f (y)| ≤ C|x − y|α für alle x, y ∈ [−π, π] ist. Die Menge der Hölder-stetigen Funktionen wird mit C α ([−π, π]) bezeichnet; sie wird mit der Festsetzung |f (x) − f (y)| kf kα = kf k∞ + sup |x − y|α x6=y zu einem normierten Vektorraum (welcher sogar ein Banachraum ist). Allgemeiner definieren wir den Raum C k,α ([−π, π]) als den Raum der Funktionen f ∈ C k ([−π, π]) mit f (k) ∈ C α ([−π, π]), und wird mit kf kk,α = k X (`) f ∞ j=1 + f (k) α zu einem Banachraum. Wir weisen die Vollständigkeit von C α ([−π, π]) nach. Sei also fn eine Cauchyfolge in C α ([−π, π]). Dann ist fn eine Cauchyfolge in C([−π, π]), und damit gibt es eine stetige Funktion f , die der gleichmässige Grenzwert der fn ist. Für diese erhalten wir für x 6= y |f (x) − f (y)| |fn (x) − fn (y)| = lim ≤ lim sup kfn kα , α n→∞ |x − y| |x − y|α n→∞ also f ∈ C α ([−π, π]). Nun müssen wir noch nachweisen, dass f auch der Grenzwert der fn in der C α ([−π, π])Norm ist: |f (x) − fn (x) − f (y) + fn (y)| |fm (x) − fn (x) − fm (y) + fn (y)| = lim ≤ lim sup kfm − fn kα . α m→∞ |x − y| |x − y|α m→∞ Also ist kf − fn kα ≤ kf − fn k∞ + lim supm→∞ kfm − fn kα , und der letzte Ausdruck geht gegen 0 für n gegen ∞, was zeigt, dass limn→∞ fn = f in C α ([−π, π]). Dieselbe Rechnung wie oben zeigt für f ∈ C α ([−π, π]), dass Z π Z π 1 −inx −inx |cn (f )| = f (x)e dx − f (x − π/n)e dx 4π −π −π 1 sup |f (x) − f (x − π/n)| ≤ 2 x∈[−π,π] ≤ C|n|−α . Die Konstante C hängt hier nur von kf kα ab. Eine Ungleichung für die an (f ) bzw. bn (f ) folgt nun, da 2cn = an + ibn , 2c−n = an − ibn , also |an (f )| ≤ 2(|cn (f )| + |c−n (f )|) ≤ 2c|n|−α . Im Falle einer Funktion f ∈ C k,α können wir zunächst k-mal partiell integrieren und erhalten cn (f ) = cn (f (k) ) ; nk insgesamt haben wir damit folgendes gezeigt: Lemma 52. Es gibt Konstanten C, K > 0, sodass für f ∈ C k,α ([−π, π]) die Ungleichungen |cn (f )| ≤ |an (f )| ≤ C |n|k+α , kf kk,α K nk+α , kf kk,α |bn (f )| ≤ erfüllt sind. 54 n ∈ Z, K nk+α , kf kk,α n ∈ N, 3. Die Bessel-Ungleichung Eine andere Methode, das Grössenwachstum von Fourierkoeffizienten zu kontrollieren, ist mit Hilfe von Integralen; der Ausgangspunkt ist die Ungleichung von Bessel. Wir erinnern an unsere Notation für die N -te Partialsumme einer Fourierreihe: N X SN f (x) = cj (f )eijx . j=−N Wir berechnen 2 |f (x) − SN f (x)| = (f (x) − SN f (x)) (f (x) − SN f (x)) = |f (x)|2 − f (x)SN f (x) − f (x)SN f (x) + |SN f (x)|2 . Wenn wir diese Gleichung integrieren, erhalten wir 1 2π Z N X π |SN f (x)|2 dx = −π |cj (f )|2 j=−N und 1 2π Z π f (x) −π N X cj (f )e−ijx = N X |cj (f )|2 . j=−N j=−N Zusammengenommen erhalten wir 1 0≤ 2π Z π π Z 1 |f (x) − SN f (x)| dx = 2π −π 2 |f (x)|2 dx − −π N X |cj (f )|2 j=−N Auch daraus folgt die Konvergenz der cj gegen 0! Wir fassen die Bessel-Ungleichung zusammen: Satz 20. Sei f ∈ R([a, b]). Dann gilt die folgende Gleichung: 1 2π Z π 1 |f (x) − SN f (x)| dx = 2π −π 2 π Z |f (x)|2 dx − −π N X |cj (f )|2 ; j=−N insbesondere ist ∞ X |cj (f )|2 ≤ j=−∞ π 1 2π Z 1 2π Z |f (x)|2 dx. −π Die Gleichheit ∞ X |cj (f )|2 ≤ j=−∞ π |f (x)|2 dx −π gilt genau dann, wenn die Partialsummen SN f im quadratischen Mittel gegen f konvergieren, also Z π lim |f (x) − SN f (x)|2 dx = 0 N →∞ −π ist. Insbesondere gilt also Gleichheit, wenn f der gleichmässige Grenzwert der SN f ist, z.Bsp. wenn f selber der gleichmässige Grenzwert einer (seiner) Fourierreihe ist, also unter den Vorraussetzungen von Theorem 19. Noch können wir diese Konvergenz einer Fourierreihe gegen die Funktion, welche sie erzeugt, nicht beweisen– sie gilt auch im allgemeinen nicht. Wir wollen uns nun auf einen Spezialfall konzentrieren. 55 4. Konvergenz von Fourierreihen Wir betrachten zunächst die Partialsummen einer Fourierreihe etwas genauer. Es ist SN f (x) = N X cj (f )eijx j=−N = N X 1 2π j=−N 1 = 2π Z 1 = 2π Z 1 = 2π Z Z π f (t)e−ij(t−x) dt −π π −π f (t) eij(x−t) dt j=−N π −π N X N X f (x + t) eijt dt j=−N π f (x + t)DN (t) dt −π Die Funktion DN (t) heisst Dirichletkern und hat eine einfachere Darstellung wie folgt: DN (t) = N X eijt j=−N = e−iN t 2N X eijt j=0 1 − ei(2N +1)t 1 − eit −iN t e − ei(N +1)t = 1 − eit it e− 2 e−iN t − ei(N +1)t = − it 1 − eit e 2 = e−iN t 1 = 1 e−i(N + 2 )t − ei(N + 2 )t 1 1 e−i 2 t − ei 2 t sin(N + 21 t) = . sin( 12 t) Es gilt Z π DN (t) = 2π −π , und damit erhalten wir folgende Darstellung der Abweichung einer Funktion von einer Partialsumme ihrer Fourierreihe: Z π 1 (f (x) − f (x + t))DN (t) dt. f (x) − SN f (x) = 2π −π Wir sehen also, dass die Konvergenz einer Fourierreihe einer Funktion gegen diese Funktion an einem gegebenen Punkt x damit in Verbindung gesetzt werden kann, wie die Funktion f (x) − f (x + t) sich am Punkt t = 0 verhält. Genauer wollen wir das für Funktionen formulieren, welche eine Hölder-Bedingung erfüllen: Satz 21. Sei f ∈ C α ([−π, π]). Dann konvergieren die Partialsummen der Fourierreihe von f gleichmässig gegen f auf [−π, π]. 56 KAPITEL 6 Mehrdimensionale Differentialrechnung 1. Lineare Algebra Wir arbeiten in endlichVektorräumen über R, das heisst, in Vektorräumen welche isomorph zu Rm = {(x1 , . . . , xm ) : xj ∈ R} mit der üblichen komponentenweisen Addition und skalaren Multiplikation (x1 , . . . , xm ) + (y1 , . . . ym ) = (x1 + y1 , . . . , xm + ym ), λ(x1 , . . . , xm ) = (λx1 , . . . , λxm ) sind. Wir werden im folgenden diese Zeilenvektoren mit Spaltenvektoren nach Belieben identifizieren (eine Begründung dafür kommt noch). Die Vektoren ei = (0, . . . , |{z} 1 , . . . , 0), i = 1, . . . , m, jth spot m bilden eine Basis des R , die Standardbasis. Wenn wir verschiedene Vektorräume Rm und Rn betrachten, werden wir dieselbe Notation für die Standardbasen in beiden Räumen verwenden (die Verwirrung, die dadurch entsteht, ist der Überladung der Notation vorzuziehen). Der Rm besitzt ein inneres Produkt, das Standardprodukt, definiert durch X hx, yi = xj yj , j und die damit verbundene euklidische Norm 2 kxk = hx, xi. Eine Bemerkung ist, dass jede andere Norm mit der euklidischen Norm vergleichbar ist: Lemma 53. Sei k·k1 eine Norm auf Rm . Dann gibt es eine Konstante C > 0 mit 1 kxk1 ≤ kxk ≤ C kxk1 . C Beweis. Sei kei k1 = λi > 0. Dann ist nach der Cauchy-Schwarzschen Ungleichung m sX sX X X kxk1 = xj ej ≤ |xj |λj ≤ x2j λ2j ≤ L kxk . j=1 j j j 1 Insbesondere ist die Identität als Abbildung von Rm versehen mit der Topologie von k·k1 nach Rm versehen mit der Topologie von k·k stetig. Damit ist die Einheitssphäre S1 = {x : kxk1 = 1} kompakt in Rm mit der Topologie von k·k. Damit ist K = min kxk > 0 x∈S1 und x kxk 1 ≥ K, x ∈ Rm also K kxk1 ≤ kxk. Wenn wir nun C = max L, K −1 wählen, ist die Behauptung des Lemmas erfüllt. 57 Insbesondere ist die durch eine beliebige Norm definierte Topologie auf Rm eindeutig bestimmt und stimmt mit der Produkttopologie überein. Eine Abbildung A : Rm → Rn heisst linear, wenn sie mit den linearen Operationen vertauscht, also A(x + λy) = A(x) + λA(y) für alle x, y ∈ Rm und λ ∈ R gilt. Der Raum der linearen Abbildungen von Rm nach Rn wird mit der Festsetzung (A + λB)(x) = A(x) + λB(x) selber zu einem endlichdimensionalen R-Vektorraum L(Rm , Rn ). Er wird mit dem Raum der n × m-Matrizen (n Zeilen, m Spalten) mit reellen Einträgen identifiziert, also mit Rmn . Dabei entspricht die lineare Abbildung A der Matrix mit Einträgen Ai,j = hei , Aej i, oder in Worten: der Eintrag in der i-ten Zeile und j-ten Spalte der Matrix zu A ist die i-te Koordinate des Bilds des j-ten Basisvektors unter A. Jede lineare Abbildung ist offensichtlich stetig. 2. Differenzierbarkeit Sei f : Rm ⊃ Ω → Rn eine auf der offenen Menge Ω definiert. Wir sagen, f ist differenzierbar an der Stelle x ∈ Ω, wenn es eine lineare Abbildung A ∈ L(Rm , Rn ) gibt, sodass für R(h) = f (x + h) − f (x) − Ah R(h) =0 khk gilt. Die lineare Abbildung A ist, falls sie existiert, durch diese Bedingung eindeutig bestimmt und wird die Ableitung von f an der Stelle x genannt; wir schreiben dafür f 0 (x) ∈ L(Rm , Rn ). Wenn f an jeder Stelle von Ω differenzierbar ist, so sagen wir, f ist auf Ω differenzierbar; die Menge der auf Ω differenzierbaren Funktionen wird mit D (Ω) bezeichnet; es ist einfach zu sehen, dass D (Ω) ⊂ C(Ω). Die Ableitung ist dann selber eine Funktion f 0 : Rm → L(Rm , Rn ) = Rmn ; ist sie wiederum auf Ω differenzierbar, so sagen wir, f ist zweimal differenzierbar auf Ω, und bezeichnen die Ableitung mit f 00 ; induktiv definieren wir, dass f k−1 k-mal differenzierbar ist, wenn f k − 1-mal differenzierbar ist und f (k−1) : Ω → Rm n wiederum auf Ω differenzierbar ist. Ist die k-te Ableitung von f stetig auf Ω, so sagen wir, f ist k-mal stetig differenzierbar auf Ω; die Menge der k-mal stetig differenzierbaren Funktionen auf Ω wird mit C k (Ω) bezeichnet. Ist K ⊂ Rm kompakt, so definieren wir C k (K) als die Menge aller Funktionen f auf K für welche es eine offene Menge U ⊃ K und eine Funktion f˜ ∈ C k (U ) gibt, welche f˜|K = f erfüllt. Die Mengen C k (Ω) und C k (K) sind Vektorräume; dies folgt aus folgendem Lemma, welches man wie im eindimensionalen beweist. lim h→0 Lemma 54. Sind f , g im Punkt x differenzierbar, und λ ∈ R so ist auch f +λg im Punkt x differenzierbar, und d(f + λg)(x) = f 0 (x) + λg 0 (x). Weiters haben wir die Kettenregel: Lemma 55. Seien f : Rm ⊃ U → V ⊂ Rn , und g : V → R` . Wenn f im Punkt x ∈ U differenzierbar ist, und g im Punt f (x), so ist g ◦ f im Punkt x differenzierbar, und (g ◦ f )0 (x) = g 0 (f (x)) ◦ f 0 (x). Beweis. Es gilt g(f (x + h)) − g(f (x)) = dg(f (x))(f (x + h) − f (x)) + R1 (f (x + h) − f (x)) = dg(f (x))(df (x)h) + dg(f (x))(R2 (h)) + R1 (f 0 (x)h + R2 (h)) = dg(f (x)) ◦ f 0 (x)(h) + R3 (h). −1 Das Restglied R3 erfüllt khk R3 (h) → 0 für h → 0. Die Einträge der Matrix (Ai,j ), welche zu f 0 (x) gehört, können wie folgt bestimmt werden: Ai,j = hei , Aej i = lim h→0 fi (x + hej ) − fi (x) ∂fi =: (x) = fi,xj (x). h ∂xj 58 Wenn die partiellen Ableitungen einer Funktion f : Rm ⊃ U → R auf U existieren, so stellen sie wiederum Funktionen auf U dar, und so können iterierte partielle Ableitungen definiert werden. Diese sind, unter sinnvollen Vorraussetzungen, von der Reihenfolge der Ableitung unabhängig. Lemma 56. Sei U : R2 offen, und für f : U → R seien ∂2f ∂y∂x ∂2f , ∂x∂y definiert und stetig auf U . Dann gilt ∂2f ∂2f (x, y) = (x, y). ∂x∂y ∂y∂x Beweis. Sei D(h, k) = f (x + h, y + k) − f (x, y). Dann ist f (x + h, y + k) − f (x + h, y) − f (x, y + k) + f (x, y) hk fy (x + h, η) − fy (x, η) = k = fx,y (ξ, η) D(h, k) = ˜ η̃). Die Funktion nach dem Mittelwertsatz, und mit einem symmetrischen Argument auch D(h, k) = fy,x (ξ, D(h, k) ist damit stetig am Punkt 0, und durch Grenzübergang h, k → 0 erhalten wir die Behauptung. Die Existenz partieller Ableitungen genügt nicht, um auf Differenzierbarkeit zu schliessen: Beispiel 12. Die Funktion ( f (x, y) = xy x2 +y 2 0 (x, y) 6= 0 (x, y) = (0, 0) besitzt partielle Ableitungen fx (0, 0) = 0, fy (0, 0) = 0, ist aber nicht stetig im Punkt (0, 0). Satz 22. Sei f : Rm ⊃ Ω → R so, dass die partiellen Ableitungen fxj : Ω → R definiert und stetig auf Ω sind. Dann ist f ∈ C 1 (Ω), und es gilt m X f 0 (x)(h) = fxk (x)hk . k=1 Beweis. Sei x ∈ Ω beliebig. Dann ist f (x + h) − f (x) = f (x1 + h1 , . . . , xm + hm ) − f (x1 , . . . , xm ) = = = m X k=1 m X k=1 m X f (x1 + h1 , . . . , xk + hk , xk+1 , . . . , xm ) − f (x1 + h1 , . . . , xk−1 + hk−1 , xk , . . . xm ) fxk (x1 + h1 , . . . , ξk , xk+1 , . . . , xm )hk fxk (ζk )hk k=1 mit aus Theorem 5 bestimmten Zwischenpunkten ξk , welche |ξk − xk | < hk , k = 1, . . . , m erfüllen; wir schreiben in der letzten Zeile ζk = (x1 + h + 1, . . . , xk−1 + hk−1 , ξk , xk+1 , . . . xn ). Damit erhalten wir m m X X fxk (x)hk ≤ |fxk (x) − fxk (ζk )| |hk |. f (x + h) − f (x) − k=1 k=1 59 Nachdem die fxk stetig sind, gilt damit für das Restglied m |R(h)| X |hk | ≤ |fxk (x) − fxk (ζk )| khk khk k=1 ≤ ≤ max |fxk (x) − fxk (ζk )| X |hk | k=1,...,m k khk max |fxk (x) − fxk (ζk )| → 0 k=1,...,m (h → 0). Also ist f differenzierbar an der Stelle x, die Ableitung f 0 (x) ist durch die behauptete Formel gegeben, und damit nach Vorraussetzung stetig. Eine Version des Mittelwertsatzes gilt auch in mehreren Dimensionen: Satz 23. Sei f : Ω → R eine differenzierbare Funktion, x, y ∈ Ω mit der Eigenschaft, dass die Verbindungsstrecke [x, y] = {ty + (1 − t)x : t ∈ [0, 1]} noch ganz in Ω liegt. Dann gibt es ein ξ ∈ (x, y) = {ty + (1 − t)x : t ∈ (0, 1)} mit der Eigenschaft, dass f (y) − f (x) = f 0 (ξ)(y − x) gilt. Beweis. Wir wenden Theorem 5 auf die Funktion ϕ(t) = f (ty + (1 − t)x) an. Es ist ϕ0 (t) = f 0 (ty + (1 − t)x)(y − x). Damit gibt es ein s ∈ (0, 1) sodass ξ = sy + (1 − s)x f (y) − f (x) = ϕ(1) − ϕ(0) = ϕ0 (s) = f 0 (ξ)(y − x) erfüllt. 3. Taylorentwicklung Um die Taylor’sche Formel im mehrdimensionalen anzuwenden, ist es notwendig, Multiindexnotation einzuführen. Für α = (α1 , . . . αm ) ∈ Nm definieren wir |α| = α1 + · · · + αm , α! = α1 ! . . . αm ! ∂ α1 ∂ αm ∂ |α| f αm 1 = . . . f, xα = xα 1 . . . xm . α α ∂x ∂x1 1 ∂xm αm Das Taylorpolynom k-ter Ordnung von f an der Stelle x0 ist durch X ∂ |α| f (x0 )(x − x0 )α Txk0 f (x) = ∂xα |α|≤k gegeben; in Bezug auf die Ableitungen von f kann man auch Txk0 f (x) = k X 1 (j) f (x0 )(h, . . . , h). | {z } j! j=1 k-mal Nachdem ( α! ∂ |α| xβ = ∂xα x=0 0 α = β, α 6= β, gilt, ist für f ∈ C k (Ω) und x0 ∈ Ω die Funktion R(x) = f (x) − Txk0 f (x) selber wieder in C k (Ω) und erfüllt R(x0 ) = R0 (x0 ) = · · · = R(k) (x0 ) = 0. Aus Theorem 7 folgt nun folgender Satz: 60 Satz 24. Sei f ∈ C k (Ω), sowie f ∈ D (k + 1)Ω. Wenn x, y ∈ Ω mit [x, y] ⊂ Ω gegeben sind, so gibt es ein ξ ∈ (x, y) mit f (k+1) (ξ) (h, . . . , h). f (y) − Txk f (y) = (k + 1)! | {z } k+1-mal Die erste Ableitung f 0 (x) ist eine lineare Funktion, welche durch die Matrix (fx1 (x), . . . , fxm (x)) ∈ L(Rm , R) dargestellt wird. Schreiben wir f 0 (x)(h) = hv(x), hi, wo v(x) der entsprechende Spaltenvektor ist, so wird fx1 (x) v(x) = ... fxm (x) der Gradient von f an der Stelle x genannt und mit v(x) = ∇f (x) bezeichnet. Die zweite Ableitung ist eine quadratische Form, gegeben durch 2 2 ∂ f f . . . ∂x∂1 ∂x (x) k1 ∂x1 ∂x1 (x) m . . . (2) . . ; .. .. .. f (x)(h, k) = (h1 , . . . hm ) . ∂2f ∂2f k m ∂xm ∂x1 (x) . . . ∂xm ∂xm (x) die Matrix Hf (x) = ∂2f ∂x1 ∂x1 (x) .. . ... .. . ∂2f ∂xm ∂x1 (x) ... ∂2f ∂x1 ∂xm (x) .. . , 2 ∂ f (x) ∂xm ∂xm welche nach Lemma 56 symmetrisch ist, wird als Hesse’sche Matrix (von f im Punkt x) bezeichnet. Wir können also m X ∂2f f (2) (x)(h, k) = ht Hf (x)k = (x)hp kq ∂xp ∂xq p,q=1 schreiben, und haben folgende kompakte Formel für die Taylorentwicklung bis zum Grad 2: 1 f (x + h) − f (x) = h∇f (x), hi + ht (Hf (x))h + R(h). 2 3 wo R die Ungleichung |R(h)| ≤ khk erfüllt (wenn f zumindest C 3 ist). Eine m × m-Matrix A ist positiv semidefinit, wenn ht Ah ≥ 0 für alle h ∈ Rm ist, und positiv definit, wenn ht Ah > 0 für alle h ∈ Rm ist; ähnlich definiert man negativ definit bzw. semidefinit. Wir erhalten damit folgende hinreichende Bedingung zur Existenz eines lokalen Maximums/Minimums. Satz 25. Sei f ∈ C 2 (Ω), und x0 ∈ Ω erfülle f 0 (x0 ) = 0. Dann besitzt f an der Stelle x0 ein lokales Maximum, wenn Hf (x0 ) negativ semidefinit ist, und ein lokales Minimum, wenn Hf (x0 ) positiv semidefinit ist. Das Extremum ist strikt, wenn Hf (x0 ) sogar definit ist. Ähnlich wie im eindimensionalen muss man beachten, dass die Bedingung tatsächlich nur hinreichend ist. Beispiel 13. Die Funktion f (x, y, z) = x2 +y 2 +z 2 erfüllt Hf (x, y, z) = 2I für alle x, y, z. Da f 0 (x, y, z)(h1 , h2 , h3 ) = 2xh1 +2yh2 +2zh3 ist f 0 (0) = 0; f hat ein striktes lokales Minimum an der Stelle 0. Für g(x, y, z) = x2 +y 2 +z 4 ist 2 0 0 Hg(x, y, z) = 0 2 0 , 0 0 2z also Hg(0) nur positiv semidefinit; g besitzt aber trotzdem ein striktes Minimum an der Stelle 0. 61 Allgemeiner gilt, dass die k-te Ableitung f (k) einer k-mal stetig differenzierbaren Funktion durch eine k-lineare symmetrische Form gegeben ist, welche mit Hilfe der partiellen Ableitungen als X fx`1 (x)...x`m h1`1 . . . hk`k , hj ∈ Rm , j = 1, . . . , k f (k) (x)(h1 , . . . , hk ) = 1≤`j ≤m 1≤j≤k gegeben ist. Damit ist f (k) (x)(h, . . . , h) = X k! fxα (x)hα . α! |α|=k 4. Richtungsableitungen Die Funktion f : Rm → R besitzt eine Richtungsableitung am Punkt x in Richtung v ∈ Rm , wo kvk = 1 ist, wenn die Funktion t 7→ f (x + tv) am Punkt 0 differenzierbar ist. Der Wert ∂f f (x + tv) − f (x) = (x) lim t→0 t ∂v wird die Richtungsableitung von f in Richtung v am Punkt x genannt. Wenn f differenzierbar an der Stelle x ist, so besitzt f offensichtlich alle Richtungsableitungen, und diese lassen sich mit Hilfe von ∂f (x) = f 0 (x)(v) = h∇f (x), vi ∂v berechnen. Die Existenz von Richtungsableitungen lässt allerdings nicht auf Differenzierbarkeit schliessen; so hat die Funktion ! p (x, y) f (x, y) = x2 + y 2 ψ p x2 + y 2 sämtliche Richtungsableitungen am Punkt 0, da f (tv) = ψ(v); lim t→0 t aber eine entsprechend unstetige Wahl von ψ gibt ein nicht differenzierbares f . Die Cauchy-Schwarz Ungleichung besagt, dass ∂f (x) ≤ k∇f (x)k kvk = k∇f (x)k . ∂v Weiters ist ∂f (x) < k∇f (x)k ∂v wenn v nicht in Richtung von ∇f (x) ist. In diesem Sinn bezeichnet man den Gradienten von f als die “Richtung des stärksten Anstiegs” von f . 5. Implizite Funktionen p q Wir schreiben (x, y) ∈ R × R = R m für Koordinaten in Rm , i.e. x = (x1 , . . . , xp ), y = (y1 , . . . yq ). Für eine Funktion f : Ω → Rq , welche f (x0 , y0 ) = 0 erfüllt, wollen wir die Gleichung f (x, y) = 0 nach y auflösen, also eine Umgebung U von x0 bestimmen und eine Funktion y : U → Rq sodass f (x, y(x)) = 0 auf U ist. Die hinreichende Bedingung, welche wir angeben wollen, ist eine an die Ableitung f 0 (x0 , y0 ), welche wir wie folgt zerlegen: f 0 (x0 , y0 )(h, k) = fx (x0 , y0 )h + fy (x0 , y0 )k. Wir können nun den Satz über implizite Funktionen formulieren: 62 Satz 26. Sei f ∈ C 1 (Ω), und an der Stelle (x0 , y0 ) seien die Bedingungen det fy (x0 , y0 ) 6= 0 f (x0 , y0 ) = 0, erfüllt. Dann gibt es eine Umgebung U von x0 und eine Funktion y ∈ C 1 (U ) mit f (x, y(x)) = 0, und es gilt y 0 (x) = −fy (x, y)−1 fx (x, y). Beweis. Wir zeigen zunächst die Existenz einer stetigen Lösungsfunktion. Dazu wollen wir ohne Beschränkung der Allgemeinheit annehmen, dass x0 = y0 = 0, fy (0, 0) = I ist. Wir betrachten die Abbildung A : ϕ 7→ (x 7→ ϕ(x) − f (x, ϕ(x))) auf einem geeigneten Raum von Funktionen ϕ. Wir wählen dazu zunächst Umgebungen U von 0 in Rp und V von 0 in Rq sodass 1 k(I − fy (x, y))kk ≤ kkk 2 für k ∈ Rq ist. Dann ist Z 1 y − f (x, y) = (I − fy (x, ty))ty dt 0 und nach Anwendung der Dreiecksungleichung 1 Z ky − f (x, y)k ≤ 0 1 kyk t kyk dt = . 2 4 Damit ist, solange U klein genug gewählt wird, und V zum Beispiel ein kleiner Ball ist, die Abbildung A auf dem Raum stetiger Funktionen auf der kompakten Menge Ū mit Werten in V definiert, d.h. auf der Menge Bε (0) = {ϕ ∈ C(Ū )q : kϕk∞ ≤ ε}, wobei kϕk∞ = max kϕ(x)k , x∈U da für beliebiges x ∈ U 1 1 kϕ(x)k ≤ kϕk∞ 4 4 ist. Also ist die Abbildung A : Bε (0) → Bε (0) eine Kontraktion und besitzt nach Theorem 4 einen Fixpunkt y(x) (Bε (0) ist als abgeschlossene Teilmenge eines vollständigen metrischen Raums wieder ein vollständiger metrischer Raum). Diese Funktion y(x) erfüllt A(y)(x) = y(x) − f (x, y(x)) = y(x) für alle x ∈ Ū , also f (x, y(x)) = 0. Wir zeigen nun unter der Annahme, dass f ∈ C 1 (U × V ), dass y an einer beliebigen Stelle x0 differenzierbar ist. Wir können wieder annehmen, dass x0 = 0, und y(0) = 0. Dann ist für kleines h ∈ Rp die Verbindungslinie von (0, 0) nach (h, y(h)) ganz in U × V liegt. Dann ist kA(ϕ)(x)k = kϕ(x) − f (x, ϕ(x))k ≤ 0 = f (h, y(h)) − f (0, 0) = fx (ξ)h + fy (ξ)y(h) mit einem ξ ∈ ((0, 0), (h, y(h))). Also ist R(h) = y(h) + fy (0, 0)−1 fx (0, 0)h = (fy (0, 0)−1 fx (0, 0) − fy (ξ)−1 fx (ξ))h = B(ξ)h. Da B(0) = 0 ist gibt es für jedes ε > 0 ein δ > 0 sodass für jedes h mit khk < δ die Ungleichung kB(ξ)hk ≤ ε khk ist. Für diese h ist also kR(h)k < ε, khk also ist y differenzierbar und die Ableitung durch die Formel y 0 (x) = −fy (x, y(x))fx (x, y(x)) gegeben, was auch zeigt, dass y 0 stetig ist. 63 6. Lagrange Multiplikatoren Sei ϕ : W → Rd eine differenzierbare Funktion. Wir sind daran interessiert, folgendes Extremwertproblem zu lösen: Finde z ∈ W , für welche ϕ(z) unter der Nebenbedingung f (z) = 0 ein Extremum hat. Angenommen, die Matrix fz hat konstanten Rang d auf W , dann können wir nach Umnumerierung der Koordinaten W = U × V mit U ⊂ Rm−d , V ⊂ Rd schreiben, und mit entsprechenden Koordinaten (x, y) = z annehmen, dass fy invertierbar auf W ist. Wir haben dann folgendes Problem: Sei ϕ : U × V → R eine differenzierbare Funktion. Finde (x, y) ∈ U × V , für welche ϕ(x, y) unter der Nebenbedingung f (x, y) = 0 ein Extremum hat. Wenn, wie angenommen, fy (x, y) invertierbar ist, so können wir in einer Umgebung von (x0 , y0 ) ∈ U × V eine Umgebung W von x0 und eine differenzierbare Funktion y(x) finden, sodass die Lösungen f (x, y) = 0 mit x ∈ W und y nahe bei y0 von der Form y = y(x) sind. Damit übersetzt sich die Lösung des Extremwertproblems in das Finden der Extremwerte von ϕ(x, y(x)) übersetzen. Damit muss an der Stelle eines Extremums ϕx (x, y(x)) + ϕy (x, y(x))y 0 (x) = ϕx (x, y(x)) + ϕy (x, y(x))(−fy (x, y(x)))−1 fx (x, y(x)) = 0 sein. Mit anderen Worten: An der Stelle eines Extremums erfüllt (ϕx , ϕy ) die Gleichung I (ϕx , ϕy ) = 0; −fy−1 fx die Matrix ist von Rang d, und (ϕx , ϕy ) ist in ihrem (Links-)Nullraum. Man überprüft auch, dass die Vektoren (fj,x , fj,y ) für j = 1, . . . , d in ihrem Nullraum sind, und sie sind P nach Vorraussetzung linear unabhängig. Damit muss es also Konstanten λ1 , . . . , λd geben, welche ϕ0 = j λj fj0 erfüllen. Wir betrachten an Stelle von ϕ nun die Funktion Φ(z, Λ) = ϕ(z) − d X λk fk (z) = ϕ(z) − f (z) · Λ, k=1 welche auf W ×Rd definiert ist, und wir Λ = (λ1 , . . . , λd ) geschrieben haben. Dann ist Φ0 (z, Λ) durch folgende Matrix gegeben: Φ0 = (ϕz − fz Λ, f ). 0 Also ist Φ (z, Λ) = 0, wenn f (z) = 0 ist und es Konstanten Λ = (λ1 , . . . , λd gibt, welche X ϕ0 = λj fj0 j erfüllen. An einer Stelle, wo ϕ ein Extremum mit Nebendingung f = 0 hat, gilt also, dass die zugeordnete Funktion Φ eine Nullstelle ihrer Ableitung hat, also Φ0 = 0 ist. Beispiel 14. Wir finden das Extremum von ϕ(x, y) = xy unter der Nebenbedingung x + y = 1. Elementar berechnen wir das, indem wir die Funktion ψ(x) = x(1 − x) betrachten und sehen, dass ψ ein Maximum an der Stelle x = 1/2 annimmt. Ohne diese Parametrisierung zu verwenden, können wir die Funktion Φ(x, y, λ) = xy + λ(x + y − 1) betrachten. Dann müssen wir die Nullstellen von Φ0 bestimmen, also die Gleichungen y + λ = 0, x + λ = 0, x+y =1 lösen. Dieses lineare Gleichungssystem hat die Lösungen x = y = 1/2, λ = −1/2. Wir formulieren nochmals: Satz 27. Wenn die Funktion ϕ : U → R ein Extremum an der Stelle z0 unter der Nebenbedingung f (z) = 0 hat, wo f : U → Rd von vollen Rang auf U ist (d.h. die Matrix f 0 (z) hat Rang d für alle z ∈ U ), dann gibt es ein Λ0 ∈ Rd , sodass die Funktion Φ(z, Λ) = ϕ(z) + Λ · f (z) 0 Φ (z0 , Λ0 ) = 0 erfüllt. 64